Apache Spark Grundlagen
Apache Spark ist ein Framework zur verteilten Verarbeitung großer Datenmengen. In diesem Seminar lernen Sie die Funktionsweise sowie die zugrundeliegenden Konzepte von Spark kennen und bekommen einen Überblick über die wichtigsten Spark-Komponenten und die Architektur einer Spark-Applikation. In praktischen Übungen wenden Sie das Erlernte an und schreiben Ihre ersten eigenen Spark-Jobs in Python. Unter anderem verwenden Sie dabei Spark Core (das grundlegende Framework für die parallele Verarbeitung in Spark) und analysieren Daten mit Spark SQL. Weiterhin lernen Sie die wichtigsten Konfigurationen für die Ausführung von Spark Jobs auf einem lokalen System oder in einem Hadoop / YARN Cluster kennen. Des Weiteren erhalten Sie eine kurze Einführung in die Bibliotheken für Streaming (Spark Streaming), Machine Learning (MLlib) und Graph-Verarbeitung (GraphX).
Möchten Sie mehr über diese Weiterbildung erfahren?
Kommende Starttermine
Wählen Sie aus 2 verfügbaren Startterminen
Kursinhalte
- Einführung in Spark
- Spark Core
- Spark-Architektur
- Spark SQL
- Administration
- Spark Streaming
- MLlib
- GraphX
Zielgruppe
Anwendungsentwickler, Data Engineers, Data Scientists, Systemintegratoren, IT-Architekten, IT-Consultants
Voraussetzungen
Teilnahme an den Seminaren "Python Programmierung" (P-PYTH-01) und "Hadoop Grundlagen" (HADOOP-01) oder gleichwertige Kenntnisse
Abschlussqualifikation/Zertifikat
Teilnahmezertifikat
Kosten
Preis: 1590,00 EUR netto inkl. Verpflegung
Informationsanfrage – kostenlos & unverbindlich
ORDIX ist ein etabliertes IT-Dienstleistungs- und Schulungsunternehmen und steht für Offenheit, Unabhängigkeit und Verlässlichkeit. Die Mitarbeiter zeichnen sich durch weitreichende Erfahrung und ausgeprägte Fachkompetenz in der Informationstechnologie aus. Die hervorragende pädagogische Kompetenz der Trainer ermöglicht es ihnen, dieses Wissen in...
Erfahren Sie mehr über ORDIX AG und weitere Kurse des Anbieters.
Anzeige