Plan du cours

Introduction à Apache Spark

  • Le rôle de Spark dans le traitement des big data
  • L'architecture de Spark et ses composants

Mise en place Apache Spark

  • Exigences matérielles et logicielles
  • Procédures d'installation en mode autonome et en mode cluster
  • Meilleures pratiques de configuration pour les administrateurs système

Administration des clusters Spark

  • Outils et techniques de gestion des clusters
  • Surveillance des applications Spark et des ressources du cluster
  • Configurations de sécurité et gestion des utilisateurs

Optimisation des performances

  • Allocation des ressources et planification
  • Optimisation des performances de Spark
  • Identifier et résoudre les goulots d'étranglement courants

Dépannage et résolution de problèmes

  • Défis courants de l'administration de Spark
  • Outils de diagnostic et techniques de dépannage
  • Approche étape par étape pour résoudre les problèmes courants
  • Meilleures pratiques pour maintenir un environnement Spark sain

Sujets relatifs à l'administration avancée

  • Intégration avec d'autres outils big data
  • Assurer la haute disponibilité et la reprise après sinistre
  • Mise à jour et mise à l'échelle des clusters Spark

Résumé et prochaines étapes

Pré requis

  • Connaissance de base de la configuration et de la gestion des réseaux
  • Familiarité avec le système d'exploitation Linux et l'interface de ligne de commande
  • Intérêt pour l'apprentissage des systèmes informatiques distribués et de la gestion des données massives (big data)

Public

  • Administrateurs système
 35 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (8)

Cours Similaires

Big Data Analytics in Health

21 heures

Catégories Similaires