Plan du cours

Rapide vue d'ensemble

  • Les sources de données
  • Attention aux données
  • Systèmes de recommandation
  • Cible Marketing

Types de données

  • Structuré vs non structuré
  • Statique ou diffusé en continu
  • Données comportementales, comportementales et démographiques
  • Analyse basée sur les données ou basée sur l'utilisateur
  • validité des données
  • Volume, vitesse et variété des données

Des modèles

  • Modèles de construction
  • Modèles statistiques
  • Apprentissage automatique

Classification des données

  • Regroupement
  • kGroups, k-means, les voisins les plus proches
  • Colonies de fourmis, oiseaux affluant

Modèles prédictifs

  • Arbres de décision
  • Machine à vecteurs de support
  • Classification naïve de Bayes
  • Les réseaux de neurones
  • Modèle de Markov
  • Régression
  • Méthodes d'ensemble

Retour sur investissement

  • Rapport bénéfice/coût
  • Coût du logiciel
  • Coût de développement
  • Des bénéfices potentiels

Modèles de construction

  • Préparation des données (MapReduce)
  • Nettoyage des données
  • Choisir des méthodes
  • Modèle en développement
  • Modèle de test
  • Évaluation du modèle
  • Déploiement et intégration de modèles

Présentation des logiciels Open Source et commerciaux

  • Sélection du package R-project
  • Python bibliothèques
  • Hadoop et Mahout
  • Projets Apache sélectionnés liés à Big Data et Analytics
  • Solution commerciale sélectionnée
  • Intégration avec les logiciels et sources de données existants

Pré requis

Compréhension des méthodes traditionnelles de gestion et d'analyse des données telles que SQL, les entrepôts de données, la veille économique, OLAP, etc... Compréhension des statistiques de base et des probabilités (moyenne, variance, probabilité, probabilité conditionnelle, etc....)

  21 heures
 

Nombre de participants


Début

Fin


Dates are subject to availability and take place between 09:30 and 16:30.
Les formations ouvertes requièrent plus de 3 participants.

Nos Clients témoignent (2)

Cours Similaires

Unified Batch and Stream Processing with Apache Beam

  14 heures

Catégories Similaires