Beschreibung
Data Science mit Python - Einführung in Python
Zielgruppe: Nur für Unternehmen und Institutionen.Python ist eine der weitverbreitetsten Programmiersprachen, welche im Data Science Bereich etabliert ist. Neben R ist sie derzeit die meist benutzte Data Science Programmiersprache.
Sie erhalten einen Einstieg, um mit Python anhand vom pandas Paket Daten zu analysieren, mit seaborn plots zu erzeugen, eigene Funktionen zu schreiben Machine Learning Algorithmen umsetzen zu können.
Kommende Starttermine
Wählen Sie aus 14 verfügbaren Startterminen
Inhalte / Module
- Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Arbeiten mit Jupyter Lab
- Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile/Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren
- Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die mit einem data.frame berechnen werden kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Analysen mit grouphy gruppieren
- Fehlende Werte ergänzen
- Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
- Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Erstellen von Scatterplot, Linienplot, Barplot, Boxplot mit seaborn
- Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
- Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
- Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Optional: Weitere Machine Learning Algorithmen in Python
- Erklärung von Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)
Zielgruppe / Voraussetzungen
Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen.
Für Privatpersonen ist dieser Kurs leider nicht geeignet.
Bitte beachten Sie: Bildungsgutscheine der Agentur für Arbeit werden für diesen Kurs NICHT anerkannt.
Abschlussqualifikation / Zertifikat
Infos anfordern
Bewertungen von Teilnehmern
Bewertungsdurchschnitt: 4,8
auf Basis von 26 Bewertungen
Bewertung schreiben
Bewertungen werden gemäß unserer Bewertungsrichtlinien veröffentlicht.
Anonym
20 Feb 2025
Anonym
25 Sep 2024
Sehr guter Einblick mit vielen Tipps, um das Gelernte in der Praxis umzusetzen und auf ähnliche Modelle zu übertragen
Anonym
25 Sep 2024
super Technisches Setup und optimale Organisation
Anzeige
Hohe Qualität.
Viel Inhalt abgedeckt.
Genau richtig dimensioniert -> nicht zu lange pro Tag, nicht zu viele oder zu wenige Tage