Beschreibung
Data Science mit Python - Einführung in Python
Python ist eine der weitverbreitetsten Programmiersprachen, welche im Data Science Bereich etabliert ist. Neben R ist sie derzeit die meist benutzte Data Science Programmiersprache.Sie erhalten einen Einstieg, um mit Python anhand vom pandas Paket Daten zu analysieren, mit seaborn plots zu erzeugen, eigene Funktionen zu schreiben Machine Learning Algorithmen umsetzen zu können.
Kommende Starttermine
Wählen Sie aus 7 verfügbaren Startterminen
Inhalte / Module
- Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Arbeiten mit Jupyter Lab
- Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile/Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren
- Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die mit einem data.frame berechnen werden kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Analysen mit grouphy gruppieren
- Fehlende Werte ergänzen
- Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
- Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Erstellen von Scatterplot, Linienplot, Barplot, Boxplot mit seaborn
- Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
- Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
- Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Optional: Weitere Machine Learning Algorithmen in Python
- Erklärung von Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)
Zielgruppe / Voraussetzungen
Abschlussqualifikation / Zertifikat
Infos anfordern
GFU Cyrus AG
Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...
Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.
Anzeige