Plan du cours

Introduction

  • Pourquoi et comment les équipes de projet adoptent-elles Hadoop ?
  • Comment tout a commencé
  • Le rôle du chef de projet dans les projets Hadoop

Comprendre l'architecture de Hadoop et les concepts clés

  • HDFS
  • MapReduce
  • Autres éléments de l'écosystème Hadoop

Qu'est-ce qui constitue Big Data ?

Différentes approches du stockage Big Data

HDFS (Hadoop Distributed File System) comme fondation

Comment Big Data est traité

  • La puissance du traitement distribué

Traitement des données avec MapReduce

  • Comment les données sont analysées étape par étape

Le rôle du clustering dans le traitement distribué à grande échelle

  • Vue d'ensemble de l'architecture
  • Approches de clustering

Mise en cluster de vos données et processus avec YARN

Le rôle du stockage non relationnel Database dans le stockage Big Data

Travailler avec le Database non relationnel de Hadoop : HBase

Aperçu de l'architecture de l'entreposage de données

Gérer votre Data Warehouse avec Hive

Exécuter Hadoop à partir de scripts Shell

Travailler avec Hadoop Streaming

Autres outils et utilitaires Hadoop

Démarrer un projet Hadoop

  • Démystifier la complexité

Migrer un projet existant vers Hadoop

  • Considérations relatives à l'infrastructure
  • Dépasser les ressources allouées

Les acteurs du projet Hadoop et leurs boîtes à outils

  • Développeurs, scientifiques des données, analystes commerciaux et gestionnaires de projet

L'utilisation de Hadoop comme base pour de nouvelles technologies et approches

Remarques finales

Pré requis

  • Une compréhension générale de la programmation
  • Une compréhension des bases de données
  • Connaissances de base en Linux
  14 heures
 

Nombre de participants


Début

Fin


Dates are subject to availability and take place between 09:30 and 16:30.
Les formations ouvertes requièrent plus de 3 participants.

Nos Clients témoignent (3)

Cours Similaires

Catégories Similaires