Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis

Inhouse
StandorteNürnberg
Dauer3 Tage
SpracheDeutsch
Preis ab 1.898,05 € inkl. MwSt.

Beschreibung

In diesem 3-tägigen Kurs „Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis“ lernen Sie, die Architektur von Spark zu verstehen und verteilte Daten effizient zu verarbeiten. Sie lernen den Umgang mit RDDs, DataFrames und Datasets, grundlegende Transformationen und Aktionen sowie die Erstellung und Ausführung einfacher Spark-Anwendungen. Außerdem erwerben Sie erste Kenntnisse in Fehlerbehandlung und Logging, um Spark-Anwendungen zuverlässig zu betreiben.

Zur Schulung Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis

Inhalte

Einführung in Big Data und Spark

  • Motivation und typische Big-Data-Anwendungsfälle
  • Überblick über Spark-Komponenten und Ökosystem

Spark-Architektur, Cluster-Setup und Deployment

  • Treiber, Executor, Tasks und Jobs
  • Lokaler Betrieb vs. Clusterbetrieb

RDDs, DataFrames, Datasets

  • Erstellung und Transformationen von RDDs
  • Unterschiede und Einsatzmöglichkeiten von DataFrames und Datasets

Transformationen und Aktionen

  • Typische Transformationen (map, filter, join, groupBy)
  • Aktionen und deren Ausführung (collect, count, show)

Spark SQL-Grundlagen

  • Einfache SQL-Abfragen auf DataFrames
  • Erstellung und Nutzung von Views

Fehlerbehandlung und Logging

  • Typische Fehlerquellen in Spark-Anwendungen
  • Logging und Monitoring einfacher Jobs

Praktische Übungen mit realen Daten

  • Aufbau einfacher Spark-Anwendungen

Weitere Infos

Haben Sie Fragen zu diesem Kurs? Füllen Sie das folgende Formular aus und wir melden uns bei Ihnen.

Kostenlose Beratung
Sichere Anfrage
Geprüfter Anbieter

Über den Anbieter

New Elements GmbH / IT-Schulungen.com

Ein zertifizierter Anbieter für qualitativ hochwertige Kurse und Schulungen.

Mehr über New Elements GmbH / IT-Schulungen.com