Plan du cours

  1. Les fondamentaux du big data
    • Big Data et son rôle dans le monde de l'entreprise
    • Les phases de développement d'une stratégie Big Data au sein d'une entreprise
    • Expliquer le raisonnement qui sous-tend une approche holistique du Big Data.
    • Composants nécessaires à une plateforme Big Data
    • Solution de stockage des big data
    • Limites des technologies traditionnelles
    • Aperçu des types de bases de données
    • Les quatre dimensions de la Big Data
  2. L'impact du big data sur les entreprises
    • L'importance de Big Data Business
    • Défis liés à l'extraction de données utiles
    • Intégration des Big data aux données traditionnelles
  3. Technologies de stockage des big data
    • Vue d'ensemble des technologies big data
      • Modèles de stockage des données
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Choisir la bonne technologie big data
  4. Traiter les big data
    • Connexion et extraction des données de la base de données
    • Transformer et préparer les données pour le traitement
    • Utilisation de Hadoop MapReduce pour le traitement des données distribuées
    • Surveillance et exécution des tâches MapReduce Hadoop.
    • Les éléments constitutifs du système de fichiers distribués Hadoop
    • Mapreduce et Yarn
    • Traiter les données en continu avec Spark
  5. Outils et technologies d'analyse des big data
    • Programming Hadoop avec le langage Pig Latin
    • Interroger les big data avec Hive
    • Extraction de données avec Mahout
    • Outils de visualisation et de reporting
  6. Le big data dans l'entreprise
    • Gérer et établir Big Data les besoins
    • Business l'importance de Big Data
    • Sélectionner les outils de big data adaptés au problème

Concepts d'entreposage de données

  • Qu'est-ce qu'un entrepôt de données ?
  • Différence entre OLTP et Data Ware Housing
  • Acquisition des données
  • Extraction des données
  • Transformation des données.
  • Chargement des données
  • Marques de données
  • Data Mart dépendant ou indépendant
  • Conception de la base de données

Concepts de test ETL :

  • Introduction.
  • Cycle de vie du développement logiciel.
  • Méthodologies de test.
  • Processus de déroulement des tests ETL.
  • Responsabilités du test ETL au stade des données.

Principes fondamentaux du Big Data

  • Big Data et son rôle dans le monde de l'entreprise
  • Les phases de développement d'une stratégie Big Data au sein d'une entreprise.
  • Expliquer le raisonnement sous-jacent à une approche holistique du Big Data.
  • Composants nécessaires à une plateforme Big Data
  • Solution de stockage des big data
  • Limites des technologies traditionnelles
  • Aperçu des types de bases de données

NoSQL Databases

Hadoop

Map Reduce

Apache Spark

Pré requis

Les délégués doivent avoir une connaissance et une certaine expérience des outils de stockage et être conscients de la nécessité de traiter de grands ensembles de données.

 14 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (4)

Cours Similaires

Unified Batch and Stream Processing with Apache Beam

14 heures

Catégories Similaires