Plan du cours

Introduction à Data Analysis et au Big Data

    Qu'est-ce qui rend Big Data « grand » ? Vélocité, Volume, Variété, Véracité (VVVV)
Limites du traitement traditionnel des données
  • Traitement distribué
  • Analyses statistiques
  • Types d'analyse Machine Learning
  • Data Visualization
  • Big Data Rôles et responsabilités
  • Administrateurs Développeurs Analystes de données

      Languages Utilisé pour l'analyse des données

    R Language Pourquoi R pour l'analyse des données ? Manipulation des données, calcul et affichage graphique

      Python Pourquoi Python pour l'analyse des données ?
    Manipulation, traitement, nettoyage et traitement des données
  • Approches de Data Analysis
  • Analyse statistique Analyse de séries chronologiques Prévision avec des modèles de corrélation et de régression Inférentiel Statistics (estimation) Descriptif Statistics dans des ensembles de Big Data (par exemple, calcul de la moyenne)
  • Machine Learning Apprentissage supervisé ou non supervisé

      Classification et regroupement
    Estimation du coût de méthodes spécifiques
  • Filtration
  • Traitement du langage naturel Traitement du texte
  • Comprendre le sens du texte
  • Génération de texte automatique
  • Analyse des sentiments / analyse du sujet
  • Computer Vision Acquérir, traiter, analyser et comprendre des images
  • Reconstruire, interpréter et comprendre des scènes 3D
  • Utiliser les données d'images pour prendre des décisions
  • Big Data Infrastructures
  • Stockage de données Bases de données relationnelles (SQL) MonSQL Postgres Oracle
  • Bases de données non relationnelles (NoSQL) Cassandra
  • MongoDB
  • Neo4js
  • Comprendre les nuances des bases de données hiérarchiques

      Bases de données orientées objet
    Bases de données orientées documents
  • Bases de données orientées graphiques
  • Autre
  • Traitement distribué Hadoop HDFS en tant que système de fichiers distribué
  • MapReduce pour le traitement distribué
  • Spark Cadre informatique de cluster en mémoire tout-en-un pour le traitement de données à grande échelle
  • Diffusion structurée
  • Étincelle SQL
  • Machine Learning bibliothèques : MLlib
  • Traitement graphique avec GraphX
  • Scalability Cloud public AWS, Google, Aliyun, etc.Cloud privé OpenStack, Cloud Foundry, etc.
  • Évolutivité automatique
  • Choisir la bonne solution au problème
  • L'avenir de Big Data
  • Sommaire et conclusion
  • Pré requis

    • Une compréhension générale des mathématiques.
    • Une compréhension générale de la programmation.
    • Une compréhension générale des bases de données.

    Audience

    • Développeurs / programmeurs
    • Consultants en informatique
     35 heures

    Nombre de participants



    Prix par participant

    Nos Clients témoignent (2)

    Cours Similaires

    QGIS for Geographic Information System

    21 heures

    Catégories Similaires