Plan du cours

Introduction

  • Vue d'ensemble des caractéristiques et de l'architecture de Spark et Hadoop
  • Comprendre le big data
  • Python bases de la programmation

Pour commencer

  • Configurer Python, Spark et Hadoop
  • Comprendre les structures de données dans Python
  • Comprendre l'API PySpark
  • Comprendre HDFS et MapReduce

Intégrer Spark et Hadoop avec Python

  • Implémentation de Spark RDD dans Python (en anglais)
  • Traitement des données à l'aide de MapReduce
  • Créer des ensembles de données distribués dans HDFS

Machine Learning avec Spark MLlib

Traiter les Big Data avec Spark Streaming

Travailler avec des systèmes de recommandation

Travailler avec Kafka, Sqoop, Kafka et Flume

Apache Mahout avec Spark et Hadoop

Dépannage

Résumé et prochaines étapes

Pré requis

  • Expérience avec Spark et Hadoop
  • Python expérience en programmation

Audience

  • Data scientists
  • Développeurs
 21 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (3)

Cours Similaires

Catégories Similaires