Seminar Hadoop mit Python

Seminar / Training Hadoop mit Python

Einführung

Verstehen der Hadoop-Architektur und der Schlüsselkonzepte

Das Hadoop Distributed File System (HDFS) verstehen

  • Überblick über HDFS und seinen architektonischen Aufbau
  • Mit HDFS interagieren
  • Ausführen grundlegender Dateioperationen auf HDFS
  • Überblick über die HDFS-Befehlsreferenz
  • Überblick über Snakebite
  • Installieren von Snakebite
  • Verwenden der Snakebite-Client-Bibliothek
  • Verwenden des CLI-Clients

Erlernen des MapReduce-Programmiermodells mit Python

  • Überblick über das MapReduce-Programmiermodell
  • Verstehen des Datenflusses im MapReduce-Framework
    • Map
    • Shuffle und Sortieren
    • Reduzieren
  • Verwendung des Hadoop Streaming Utility
    • Verstehen, wie das Hadoop Streaming Utility funktioniert
    • Demo: Implementieren der WordCount-Anwendung auf Python
  • Verwenden der mrjob-Bibliothek
    • Überblick über mrjob
    • Installieren von mrjob
    • Demo: Implementieren des WordCount-Algorithmus mit mrjob
    • Verstehen, wie ein mit der mrjob-Bibliothek geschriebener MapReduce-Job funktioniert
    • Ausführen einer MapReduce-Anwendung mit mrjob
    • Praktische Anwendung: Berechnung von Spitzengehältern mit mrjob

Pig mit Python lernen

  • Überblick über Pig
  • Demo: Implementieren des WordCount-Algorithmus in Pig
  • Konfigurieren und Ausführen von Pig-Skripten und Pig-Anweisungen
    • Verwenden der Pig-Ausführungsmodi
    • Verwenden des interaktiven Pig-Modus
    • Verwenden des Pig-Batch-Modus
  • Verstehen der grundlegenden Konzepte der lateinischen Sprache von Pig
    • Anweisungen verwenden
    • Daten laden
    • Daten umwandeln
    • Daten abspeichern
  • Erweitern der Pig-Funktionalität mit Python UDFs
    • Registrieren einer Python UDF-Datei
    • Demo: Eine einfache Python UDF
    • Demo: String-Manipulation mit Python UDF
    • Hands-on: Berechnen der 10 neuesten Filme mit Python UDF

Verwendung von Spark und PySpark

  • Überblick über Spark
  • Demo: Implementieren des WordCount-Algorithmus in PySpark
  • Überblick über PySpark
    • Verwenden einer interaktiven Shell
    • Implementieren von in sich geschlossenen Anwendungen
  • Arbeiten mit belastbaren verteilten Datensätzen (RDDs)
    • Erstellen von RDDs aus einer Python-Sammlung
    • Erstellen von RDDs aus Dateien
    • Implementieren von RDD-Transformationen
    • Implementieren von RDD-Aktionen
  • Praktische Anwendung: Implementieren eines Textsuchprogramms für Filmtitel mit PySpark

Workflow mit Python verwalten

  • Überblick über Apache Oozie und Luigi
  • Installieren von Luigi
  • Verstehen der Luigi-Workflow-Konzepte
    • Aufgaben
    • Ziele
    • Parameter
  • Demo: Untersuchen eines Workflows, der den WordCount-Algorithmus implementiert
  • Arbeiten mit Hadoop-Workflows, die MapReduce- und Pig-Jobs steuern
    • Verwendung der Konfigurationsdateien von Luigi
    • Arbeiten mit MapReduce in Luigi
    • Arbeiten mit Pig in Luigi

Zusammenfassung und Fazit

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminar und Anbieter vergleichen

Öffentliche Schulung

Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.

Mehr dazu...

Inhausschulung

Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.

Mehr dazu...

Webinar

Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.

Mehr dazu...

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminardetails

   
Dauer: 4 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr
Preis:

Öffentlich und Webinar: CHF 1.996 zzgl. MwSt.
Inhaus: CHF 5.400 zzgl. MwSt.

Teilnehmeranzahl: min. 2 - max. 8
Voraussetzungen: Erfahrung mit Python-Programmierung; Grundlegende Vertrautheit mit Hadoop
Standorte: Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich
Methoden: Vortrag, Demonstrationen, praktische Übungen am System
Seminararten: Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht
Durchführungsgarantie: ja, ab 2 Teilnehmern
Sprache: Deutsch - bei Firmenseminaren ist auch Englisch möglich
Seminarunterlage: Dokumentation auf Datenträger oder als Download
Teilnahmezertifikat: ja, selbstverständlich
Verpflegung: Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch)
Support: 3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang: an den meisten Standorten verfügbar
 

Weitere Informationen unter +41 (800) 225127

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Inhaus / Firmenseminar 4 Tage
Sankt Gallen 4 Tage
Basel 4 Tage
Winterthur 4 Tage
Zürich 4 Tage
Stream live 4 Tage
Stream gespeichert 4 Tage
Luzern 4 Tage
Bern 4 Tage
Luzern 4 Tage
Bern 4 Tage
Inhaus / Firmenseminar 4 Tage
Sankt Gallen 4 Tage
Basel 4 Tage
Winterthur 4 Tage
Zürich 4 Tage
Stream live 4 Tage
Stream gespeichert 4 Tage
Stream gespeichert 4 Tage
Luzern 4 Tage
Bern 4 Tage
Inhaus / Firmenseminar 4 Tage
Sankt Gallen 4 Tage
Basel 4 Tage
Winterthur 4 Tage
Zürich 4 Tage
Stream live 4 Tage
Stream live 4 Tage
Stream gespeichert 4 Tage
Luzern 4 Tage
Bern 4 Tage
Inhaus / Firmenseminar 4 Tage
Sankt Gallen 4 Tage
Basel 4 Tage
Winterthur 4 Tage
Zürich 4 Tage
Zürich 4 Tage
Stream live 4 Tage
Stream gespeichert 4 Tage
Bern 4 Tage
Nach oben
Seminare als Stream SRI zertifiziert
© 2025 www.seminar-experts.ch All rights reserved.  | Webdesign | Kontakt | Impressum | Mobile Version | Nach oben