Seminar / Training Hadoop mit Python
Einführung
Verstehen der Hadoop-Architektur und der Schlüsselkonzepte
Das Hadoop Distributed File System (HDFS) verstehen
- Überblick über HDFS und seinen architektonischen Aufbau
- Mit HDFS interagieren
- Ausführen grundlegender Dateioperationen auf HDFS
- Überblick über die HDFS-Befehlsreferenz
- Überblick über Snakebite
- Installieren von Snakebite
- Verwenden der Snakebite-Client-Bibliothek
- Verwenden des CLI-Clients
Erlernen des MapReduce-Programmiermodells mit Python
- Überblick über das MapReduce-Programmiermodell
- Verstehen des Datenflusses im MapReduce-Framework
- Map
- Shuffle und Sortieren
- Reduzieren
- Verwendung des Hadoop Streaming Utility
- Verstehen, wie das Hadoop Streaming Utility funktioniert
- Demo: Implementieren der WordCount-Anwendung auf Python
- Verwenden der mrjob-Bibliothek
- Überblick über mrjob
- Installieren von mrjob
- Demo: Implementieren des WordCount-Algorithmus mit mrjob
- Verstehen, wie ein mit der mrjob-Bibliothek geschriebener MapReduce-Job funktioniert
- Ausführen einer MapReduce-Anwendung mit mrjob
- Praktische Anwendung: Berechnung von Spitzengehältern mit mrjob
Pig mit Python lernen
- Überblick über Pig
- Demo: Implementieren des WordCount-Algorithmus in Pig
- Konfigurieren und Ausführen von Pig-Skripten und Pig-Anweisungen
- Verwenden der Pig-Ausführungsmodi
- Verwenden des interaktiven Pig-Modus
- Verwenden des Pig-Batch-Modus
- Verstehen der grundlegenden Konzepte der lateinischen Sprache von Pig
- Anweisungen verwenden
- Daten laden
- Daten umwandeln
- Daten abspeichern
- Erweitern der Pig-Funktionalität mit Python UDFs
- Registrieren einer Python UDF-Datei
- Demo: Eine einfache Python UDF
- Demo: String-Manipulation mit Python UDF
- Hands-on: Berechnen der 10 neuesten Filme mit Python UDF
Verwendung von Spark und PySpark
- Überblick über Spark
- Demo: Implementieren des WordCount-Algorithmus in PySpark
- Überblick über PySpark
- Verwenden einer interaktiven Shell
- Implementieren von in sich geschlossenen Anwendungen
- Arbeiten mit belastbaren verteilten Datensätzen (RDDs)
- Erstellen von RDDs aus einer Python-Sammlung
- Erstellen von RDDs aus Dateien
- Implementieren von RDD-Transformationen
- Implementieren von RDD-Aktionen
- Praktische Anwendung: Implementieren eines Textsuchprogramms für Filmtitel mit PySpark
Workflow mit Python verwalten
- Überblick über Apache Oozie und Luigi
- Installieren von Luigi
- Verstehen der Luigi-Workflow-Konzepte
- Aufgaben
- Ziele
- Parameter
- Demo: Untersuchen eines Workflows, der den WordCount-Algorithmus implementiert
- Arbeiten mit Hadoop-Workflows, die MapReduce- und Pig-Jobs steuern
- Verwendung der Konfigurationsdateien von Luigi
- Arbeiten mit MapReduce in Luigi
- Arbeiten mit Pig in Luigi
Zusammenfassung und Fazit
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-
Michael Adler
Telefon: + 41 (800) 225127
E-Mail: michael.adler@seminar-experts.ch -
Stefano Conti
Telefon: + 41 (800) 225127
E-Mail: stefano.conti@seminar-experts.ch
Seminardetails
Dauer: | 4 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr |
Preis: |
Öffentlich und Webinar: CHF 1.996 zzgl. MwSt. |
Teilnehmeranzahl: | min. 2 - max. 8 |
Voraussetzungen: | Erfahrung mit Python-Programmierung; Grundlegende Vertrautheit mit Hadoop |
Standorte: | Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich |
Methoden: | Vortrag, Demonstrationen, praktische Übungen am System |
Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
Durchführungsgarantie: | ja, ab 2 Teilnehmern |
Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
Teilnahmezertifikat: | ja, selbstverständlich |
Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
Support: | 3 Anrufe im Seminarpreis enthalten |
Barrierefreier Zugang: | an den meisten Standorten verfügbar |
Weitere Informationen unter +41 (800) 225127 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
Seminar | Startdatum | Enddatum | Ort | Dauer | |
---|---|---|---|---|---|
Hadoop mit Python | Inhaus / Firmenseminar | 4 Tage | |||
Hadoop mit Python | Sankt Gallen | 4 Tage | |||
Hadoop mit Python | Basel | 4 Tage | |||
Hadoop mit Python | Winterthur | 4 Tage | |||
Hadoop mit Python | Zürich | 4 Tage | |||
Hadoop mit Python | Stream live | 4 Tage | |||
Hadoop mit Python | Stream gespeichert | 4 Tage | |||
Hadoop mit Python | Luzern | 4 Tage | |||
Hadoop mit Python | Bern | 4 Tage | |||
Hadoop mit Python | Luzern | 4 Tage | |||
Hadoop mit Python | Bern | 4 Tage | |||
Hadoop mit Python | Inhaus / Firmenseminar | 4 Tage | |||
Hadoop mit Python | Sankt Gallen | 4 Tage | |||
Hadoop mit Python | Basel | 4 Tage | |||
Hadoop mit Python | Winterthur | 4 Tage | |||
Hadoop mit Python | Zürich | 4 Tage | |||
Hadoop mit Python | Stream live | 4 Tage | |||
Hadoop mit Python | Stream gespeichert | 4 Tage | |||
Hadoop mit Python | Stream gespeichert | 4 Tage | |||
Hadoop mit Python | Luzern | 4 Tage | |||
Hadoop mit Python | Bern | 4 Tage | |||
Hadoop mit Python | Inhaus / Firmenseminar | 4 Tage | |||
Hadoop mit Python | Sankt Gallen | 4 Tage | |||
Hadoop mit Python | Basel | 4 Tage | |||
Hadoop mit Python | Winterthur | 4 Tage | |||
Hadoop mit Python | Zürich | 4 Tage | |||
Hadoop mit Python | Stream live | 4 Tage | |||
Hadoop mit Python | Stream live | 4 Tage | |||
Hadoop mit Python | Stream gespeichert | 4 Tage | |||
Hadoop mit Python | Luzern | 4 Tage | |||
Hadoop mit Python | Bern | 4 Tage | |||
Hadoop mit Python | Inhaus / Firmenseminar | 4 Tage | |||
Hadoop mit Python | Sankt Gallen | 4 Tage | |||
Hadoop mit Python | Basel | 4 Tage | |||
Hadoop mit Python | Winterthur | 4 Tage | |||
Hadoop mit Python | Zürich | 4 Tage | |||
Hadoop mit Python | Zürich | 4 Tage | |||
Hadoop mit Python | Stream live | 4 Tage | |||
Hadoop mit Python | Stream gespeichert | 4 Tage | |||
Hadoop mit Python | Bern | 4 Tage |