Plan du cours

Introduction aux Google Colab et Apache Spark

  • Aperçu de Google Colab
  • Introduction à Apache Spark
  • Configuration de Spark dans Google Colab

Traitement des données avec Apache Spark

  • Travail avec RDDs et DataFrames
  • Chargement et traitement de grands ensembles de données
  • Utilisation de Spark SQL pour interroger des données structurées

Analyse avancée avec Spark

  • Apprentissage automatique avec Spark MLlib
  • Réalisation d'analyses de données en temps réel
  • Calcul distribué avec Spark

Visualisation et Collaboration dans Google Colab

  • Intégration de Colab avec des bibliothèques de visualisation populaires
  • Travaux collaboratifs avec les notebooks Colab
  • Partage et exportation des résultats

Optimisation des workflows Big Data

  • Paramétrage de Spark pour la performance
  • Optimisation de l'utilisation de la mémoire et du stockage
  • Échelonnement des workflows pour les grands ensembles de données

Big Data dans le Cloud

  • Intégration de Google Colab avec des outils basés sur le cloud
  • Utilisation du stockage en nuage pour les grands volumes de données
  • Travail avec Spark dans des environnements distribués en nuage

Études de cas et meilleures pratiques

  • Revue d'applications réelles de grands volumes de données
  • Études de cas utilisant Apache Spark et Colab
  • Meilleures pratiques pour l'analyse des grands ensembles de données

Résumé et prochaines étapes

Pré requis

  • Connaissance de base des concepts en science des données
  • Familiarité avec Apache Spark
  • Compétences en programmation Python

Public cible

  • Scientifiques des données
  • Ingénieurs de données
  • Chercheurs travaillant avec de grandes masses de données
 14 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires