Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis
Inhouse
StandorteNürnberg
Dauer3 Tage
SpracheDeutsch
Preis ab 1.898,05 € inkl. MwSt.
Beschreibung
In diesem 3-tägigen Kurs „Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis“ lernen Sie, die Architektur von Spark zu verstehen und verteilte Daten effizient zu verarbeiten. Sie lernen den Umgang mit RDDs, DataFrames und Datasets, grundlegende Transformationen und Aktionen sowie die Erstellung und Ausführung einfacher Spark-Anwendungen. Außerdem erwerben Sie erste Kenntnisse in Fehlerbehandlung und Logging, um Spark-Anwendungen zuverlässig zu betreiben.
Zur Schulung Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis
Inhalte
Einführung in Big Data und Spark
- Motivation und typische Big-Data-Anwendungsfälle
- Überblick über Spark-Komponenten und Ökosystem
Spark-Architektur, Cluster-Setup und Deployment
- Treiber, Executor, Tasks und Jobs
- Lokaler Betrieb vs. Clusterbetrieb
RDDs, DataFrames, Datasets
- Erstellung und Transformationen von RDDs
- Unterschiede und Einsatzmöglichkeiten von DataFrames und Datasets
Transformationen und Aktionen
- Typische Transformationen (map, filter, join, groupBy)
- Aktionen und deren Ausführung (collect, count, show)
Spark SQL-Grundlagen
- Einfache SQL-Abfragen auf DataFrames
- Erstellung und Nutzung von Views
Fehlerbehandlung und Logging
- Typische Fehlerquellen in Spark-Anwendungen
- Logging und Monitoring einfacher Jobs
Praktische Übungen mit realen Daten
- Aufbau einfacher Spark-Anwendungen
Weitere Infos
Haben Sie Fragen zu diesem Kurs? Füllen Sie das folgende Formular aus und wir melden uns bei Ihnen.
Kostenlose Beratung
Sichere Anfrage
Geprüfter Anbieter
Über den Anbieter

New Elements GmbH / IT-Schulungen.com
Ein zertifizierter Anbieter für qualitativ hochwertige Kurse und Schulungen.
Mehr über New Elements GmbH / IT-Schulungen.com