Plan du cours

Big Data Vue d'ensemble :

  • Qu'est-ce que Big Data ?
  • Pourquoi Big Data gagne en popularité
  • Big Data Études de cas
  • Big Data Caractéristiques
  • Solutions pour travailler sur Big Data.

Hadoop et ses composants :

  • Qu'est-ce que Hadoop et quels sont ses composants.
  • Hadoop Architecture et caractéristiques des données qu'elle peut traiter.
  • Bref aperçu de l'histoire de Hadoop, des entreprises qui l'utilisent et des raisons pour lesquelles elles ont commencé à l'utiliser.
  • [Le cadre de travail et ses composants - expliqués en détail.
  • Qu'est-ce que HDFS et les lectures et écritures dans Hadoop le système de fichiers distribués.
  • Comment configurer un cluster Hadoop dans différents modes - cluster autonome/pseudo/multi-nœuds.

(Ceci inclut la mise en place d'un cluster Hadoop dans VirtualBox/KVM/VMware, les configurations réseau qui doivent être soigneusement examinées, l'exécution des Daemons Hadoop et le test du cluster).

  • Qu'est-ce que le cadre Map Reduce et comment fonctionne-t-il ?
  • Exécution des tâches Map Reduce sur le cluster Hadoop.
  • Comprendre la réplication, la mise en miroir et la connaissance du rack dans le contexte des clusters Hadoop.

Planification d'un cluster Hadoop :

  • Comment planifier votre cluster Hadoop.
  • Comprendre le matériel et les logiciels pour planifier votre cluster Hadoop.
  • Comprendre les charges de travail et planifier le cluster pour éviter les pannes et obtenir des performances optimales.

Qu'est-ce que MapR et pourquoi MapR ?

  • Vue d'ensemble de MapR et de son architecture.
  • Compréhension et fonctionnement du système de contrôle MapR, des volumes MapR, des snapshots et des miroirs.
  • Planification d'un cluster dans le contexte de MapR.
  • Comparaison de MapR avec d'autres distributions et Apache Hadoop.
  • Installation de MapR et déploiement du cluster.

Configuration et administration du cluster :

  • Gestion des services, des nœuds, des snapshots, des volumes miroirs et des clusters distants.
  • Comprendre et gérer les nœuds.
  • Compréhension des composants Hadoop, installation des composants Hadoop avec les services MapR.
  • [Gestion des données sur le cluster, y compris via NFS Gestion des services et des nœuds.
  • Gérer les données en utilisant les volumes, gérer les utilisateurs et les groupes, gérer et assigner des rôles aux nœuds, mettre en service et mettre hors service les nœuds, administrer le cluster et surveiller les performances, configurer/analyser et surveiller les métriques pour surveiller les performances, configurer et administrer la sécurité de MapR.
  • Comprendre et travailler avec le stockage natif M7 pour les tables MapR.
  • Configuration et réglage du cluster pour des performances optimales.

Mise à niveau du cluster et intégration avec d'autres configurations :

  • Mise à jour de la version logicielle de MapR et types de mise à jour.
  • Configuration du cluster MapR pour accéder au cluster HDFS.
  • Configuration du cluster MapR sur Amazon Elastic Mapreduce.

Tous les sujets ci-dessus incluent des démonstrations et des sessions de pratique pour que les apprenants aient une expérience pratique de la technologie.

Pré requis

  • Connaissance de base de Linux FS
  • Java de base
  • Connaissance d'Apache Hadoop (recommandé)
  28 heures
 

Nombre de participants


Début

Fin


Dates are subject to availability and take place between 09:30 and 16:30.

Prix par participant

Nos Clients témoignent (1)

Cours Similaires

Catégories Similaires