Plan du cours
Introduction
- Vue d'ensemble de Spark et Hadoop caractéristiques et architecture
- Comprendre le big data
- Python bases de la programmation
Pour commencer
- Configurer Python, Spark et Hadoop
- Comprendre les structures de données dans Python
- Comprendre l'API PySpark
- Comprendre HDFS et MapReduce
Intégrer Spark et Hadoop à Python
- Implémenter Spark RDD dans Python
- Traiter les données à l'aide de MapReduce
- Créer des ensembles de données distribués dans HDFS
Spark et Spark MLlib Machine Learning avec Spark MLlib
Traiter Big Data avec Spark Streaming
Travailler avec des systèmes de recommandation
Travailler avec Kafka, Sqoop, Kafka et Flume
Apache Mahout avec Spark et Hadoop
Résolution des problèmes
Résumé et prochaines étapes
Pré requis
- Expérience avec Spark et Hadoop
- Python expérience en programmation
Audience
- Scientifiques des données
- Développeurs
Nos clients témoignent (3)
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
J'ai aimé qu'il arrive à poser les bases du sujet et à aborder des exercices assez avancés. Il a également fourni des méthodes simples pour écrire et tester le code.
Ionut Goga - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique