Plan du cours
Introduction à Apache Spark
- Le rôle de Spark dans le traitement des big data
- L'architecture de Spark et ses composants
Mise en place Apache Spark
- Exigences matérielles et logicielles
- Procédures d'installation en mode autonome et en mode cluster
- Meilleures pratiques de configuration pour les administrateurs système
Administration des clusters Spark
- Outils et techniques de gestion des clusters
- Surveillance des applications Spark et des ressources du cluster
- Configurations de sécurité et gestion des utilisateurs
Optimisation des performances
- Allocation des ressources et planification
- Optimisation des performances de Spark
- Identifier et résoudre les goulots d'étranglement courants
Dépannage et résolution de problèmes
- Défis courants de l'administration de Spark
- Outils de diagnostic et techniques de dépannage
- Approche étape par étape pour résoudre les problèmes courants
- Meilleures pratiques pour maintenir un environnement Spark sain
Sujets relatifs à l'administration avancée
- Intégration avec d'autres outils big data
- Assurer la haute disponibilité et la reprise après sinistre
- Mise à jour et mise à l'échelle des clusters Spark
Résumé et prochaines étapes
Pré requis
- Connaissance de base de la configuration et de la gestion des réseaux
- Familiarité avec le système d'exploitation Linux et l'interface de ligne de commande
- Intérêt pour l'apprentissage des systèmes informatiques distribués et de la gestion des données massives (big data)
Public
- Administrateurs système
Nos Clients témoignent (8)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Beaucoup d'exemples pratiques, différentes façons d'aborder le même problème, et parfois des astuces pas si évidentes pour améliorer la solution actuelle.
Rafał - Nordea
Formation - Apache Spark MLlib
Traduction automatique
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Formation - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Sufficient hands on, trainer is knowledgable
Chris Tan
Formation - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Formation - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Formation - Apache Spark in the Cloud
very interactive...
Richard Langford
Formation - SMACK Stack for Data Science
Engagement et volonté de clarifier les sujets secondaires.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Formation - Apache Spark Fundamentals
Traduction automatique