Plan du cours

    Prétraitement des données Data Cleaning Intégration et transformation des données Réduction des données Discrétisation et génération de hiérarchie de concepts
Inférence statistique Distributions de probabilité, variables aléatoires, théorème central limite
  • Échantillonnage
  • Intervalles de confiance
  • Inférence statistique
  • Tests d'hypothèses
  • Spécification de régression linéaire multivariée
  • Sélection de sous-ensemble
  • Estimation
  • Validation
  • Prédiction
  • Méthodes de classification Régression logistique
  • Analyse discriminante linéaire
  • K-voisins les plus proches
  • Bayes naïf
  • Comparaison des méthodes de classification
  • Neural Networks Adaptation des réseaux de neurones
  • Problèmes de formation des réseaux de neurones
  • Arbres de décision Arbres de régression
  • Arbres de classification
  • Arbres et modèles linéaires
  • Ensachage, Random Forests, Ensachage Boosting
  • Random Forests
  • Booster
  • Machines vectorielles de support et classificateur de marge maximale de disque flexible
  • Prise en charge des classificateurs vectoriels
  • Machines vectorielles de support
  • 2 classes et plus de SVM
  • Relation avec la régression logistique
  • Analyse des composantes principales
  • Clustering K-signifie clustering
  • Regroupement des K-médoïdes
  • Classification hiérarchique
  • Clustering basé sur la densité
  • Évaluation du modèle et biais de sélection, variance et complexité du modèle
  • Erreur de prédiction dans l'échantillon
  • L'approche bayésienne
  • Validation croisée
  • Bootstrap méthodes
  •   28 heures
     

    Nombre de participants


    Début

    Fin


    Dates are subject to availability and take place between 09:30 and 16:30.
    Les formations ouvertes requièrent plus de 3 participants.

    Nos Clients témoignent (1)

    Cours Similaires

    Catégories Similaires