Seminar / Training Cloudera Data Analyst
- Einführung
- Hadoop Grundlagen
- Einführung in Pig
- Einfache Datenanalyse mit Pig
- Komplexe Daten mit Pig verarbeiten
- Multi-Dataset Operationen mit Pig
- Pig erweitern
- Pig Fehlerbereinigung und Optimierung
- Einführung in Hive
- Relationale Daten mit Hive analysieren
- Hive Datenmanagement
- Textverarbeitung mit Hive
- Hive Optimierung
- Einführung in Impala
- Analyse von Daten mit Impala
- Auswahl des richtigen Werkzeugs
Geschulte Softwareversion
Wir schulen die jeweils letzte, verfügbare Version der Software in unseren Seminaren.
Details und Inhalte dieses Seminars (bitte hier klicken)
Einheit 1 - Einführung
Einheit 2 - Hadoop Grundlagen
- Gründe für Hadoop
- Hadoop Übersicht
- HDFS
- MapReduce
- Das Hadoop Ökosystem
- Data Ingest mit den Hadoop Werkzeugen
Einheit 3 – Einführung in Pig
- Was ist Pig?
- Pigs Funktionen
- Anwendungsszenarien für Pig
- Interaktionen mit Pig
Einheit 4 – Einfache Datenanalyse mit Pig
- Pig Latin Syntax
- Daten laden
- Einfache Datentypen
- Felddefinitionen
- Data Output
- Betrachten des Schemas
- Filtern und sortieren der Daten
- Häufig genutzte Funktionen
- Pig und ETL Verarbeitung
Einheit 5 – Komplexe Daten mit Pig verarbeiten
- Storage Formate
- Komplexe und verschachtelte Datentypen
- Gruppieren
- Funktionen für komplexe Daten
- Aufzählen gruppierter Daten
Einheit 6 - Multi-Dataset Operationen mit Pig
- Techniken für die Kombination von Data Sets
- Verknüpfen von Daten in Pig
- Set Operations
- Teilen von Data Sets
Einheit 7 – Pig erweitern
- Die Flexibilität durch Parameter erhöhen
- Makros und Importe
- UDFs
- Contributed Functions
- Verwenden anderer Sprachen mit die Analyse mit Pig
- Pig mit Streaming und UDFs erweitern
Einheit 8 - Pig Fehlerbereinigung und Optimierung
- Troubleshooting Pig
- Logging
- Hadoops Web UI
- Debugging
- Geschwindigkeitsübersicht
- Ausführungspläne
- Beschleunigen der Pig Aufträge
Einheit 9 – Einführung in Hive
- Was ist Hive?
- Hive Schema und Datenspeicherung
- Vergleich von Hive mit traditionellen Datenbanken
- Hive verglichen mit Pig
- Hive Anwendungsfälle
- Interaktion mit Hive
Einheit 10 – Relationale Daten mit Hive analysieren
- Hive Datenbanken und Tabellen
- HiveQL Syntax
- Datentypen
- Verbinden von Datensets
- Wichtige Funktionen
- Starten von Hive Abfragen mit Shell, Scripts und Hue
Einheit 11 - Hive Datenmanagement
- Hive Datenformate
- Anlegen und Anpassen von Datenbanken und Tabellen
- Laden von Daten in Hive
- Selbstverwaltete Tabellen
- Abfragen mit Views vereinfachen
- Speichern von Abfrageergebnissen
- Zugriffsrechte steuern
- Datenmanagement mit Hive
Einheit 12 – Textverarbeitung mit Hive
- Übersicht
- String Funktionen
- Regular Expressions in Hive
- Sentiment Analysis und N-Grams
Einheit 13 - Hive Optimierung
- Abfragen beschleunigen
- Jobausführung kontrollieren Plan
- Partitioning
- Bucketing
- Indexing Data Extending Hive
- SerDes
- Datentransformationen mit Custom Scripts
- Benutzerdefinierte Funktionen
- Parameterübergabe bei Abfragen
Einheit 14 – Einführung in Impala
- Was ist Impala?
- Unterschiede zwischen Impala, Hive und Pig
- Wie sich Impala von relationalen Datenbanken unterscheidet
- Grenzen von Impala
- Impala Shell
Einheit 15 - Analyse von Daten mit Impala
- Syntax
- Datentypen
- Filtern, Sortieren und begrenzen des Ergebnisse
- Verknüpfen und Sortieren des Ergebnis
- Beschleunigen von Impala
Einheit 16 – Auswahl des richtigen Werkzeugs
- Vergleich von MapReduce, Pig, Hive, Impala, und relationalen Datenbanken
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
Seminardetails
Dauer: | 4 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr |
Preis: |
Öffentlich und Webinar: CHF 1.996 zzgl. MwSt. |
Teilnehmeranzahl: | min. 2 - max. 8 |
Voraussetzungen: | Linux Kenntnisse |
Standorte: | Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich |
Methoden: | Vortrag, Demonstrationen, praktische Übungen am System |
Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
Durchführungsgarantie: | ja, ab 2 Teilnehmern |
Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
Teilnahmezertifikat: | ja, selbstverständlich |
Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
Support: | 3 Anrufe im Seminarpreis enthalten |
Barrierefreier Zugang: | an den meisten Standorten verfügbar |
Weitere Informationen unter +41 (800) 225127 |
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-
Michael Adler
Telefon: + 41 (800) 225127
E-Mail: michael.adler@seminar-experts.ch -
Stefano Conti
Telefon: + 41 (800) 225127
E-Mail: stefano.conti@seminar-experts.ch