Plan du cours
Introduction
- Vue d'ensemble des caractéristiques et de l'architecture de Spark et Hadoop
- Comprendre le big data
- Python bases de la programmation
Pour commencer
- Configurer Python, Spark et Hadoop
- Comprendre les structures de données dans Python
- Comprendre l'API PySpark
- Comprendre HDFS et MapReduce
Intégrer Spark et Hadoop avec Python
- Implémentation de Spark RDD dans Python (en anglais)
- Traitement des données à l'aide de MapReduce
- Créer des ensembles de données distribués dans HDFS
Machine Learning avec Spark MLlib
Traiter les Big Data avec Spark Streaming
Travailler avec des systèmes de recommandation
Travailler avec Kafka, Sqoop, Kafka et Flume
Apache Mahout avec Spark et Hadoop
Dépannage
Résumé et prochaines étapes
Pré requis
- Expérience avec Spark et Hadoop
- Python expérience en programmation
Audience
- Data scientists
- Développeurs
Nos Clients témoignent (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
The live examples