Prenez contact avec nous

Plan du cours

Introduction

Cette section offre une vue d’ensemble des situations où il est pertinent d’utiliser l’« apprentissage automatique », des éléments à prendre en considération, ainsi que de leur signification, incluant les avantages et les inconvénients. Types de données (structurées/non structurées/statiques/diffusées), validité et volume des données, analyses pilotées par les données vs pilotées par l’utilisateur, modèles statistiques vs modèles d’apprentissage automatique / défis de l’apprentissage non supervisé, compromis biais-variance, itération/évaluation, approches de validation croisée, supervisé/non supervisé/récompensif.

SUJETS PRINCIPAUX

1. Compréhension de Naïve Bayes

  • Concepts de base des méthodes bayésiennes
  • Probabilité
  • Probabilité conjointe
  • Probabilité conditionnelle avec le théorème de Bayes
  • L’algorithme Naïve Bayes
  • La classification Naïve Bayes
  • L’estimateur de Laplace
  • Utilisation de caractéristiques numériques avec Naïve Bayes

2. Compréhension des arbres de décision

  • Diviser pour régner
  • L’algorithme d’arbre de décision C5.0
  • Choix de la meilleure division
  • Élagage de l’arbre de décision

3. Compréhension des réseaux de neurones

  • Des neurones biologiques aux neurones artificiels
  • Fonctions d’activation
  • Topologie du réseau
  • Nombre de couches
  • Sens de propagation de l’information
  • Nombre de nœuds par couche
  • Formation des réseaux de neurones par rétropropagation
  • Apprentissage profond

4. Compréhension des machines à vecteurs de support

  • Classification par hyperplans
  • Trouver la marge maximale
  • Cas des données linéairement séparables
  • Cas des données non linéairement séparables
  • Utilisation de noyaux pour les espaces non linéaires

5. Compréhension du clustering

  • Le clustering comme tâche d’apprentissage automatique
  • L’algorithme k-moyennes pour le clustering
  • Utilisation de la distance pour assigner et mettre à jour les clusters
  • Choix du nombre approprié de clusters

6. Mesure des performances pour la classification

  • Travail avec les données de prédiction de classification
  • Examen approfondi des matrices de confusion
  • Utilisation des matrices de confusion pour mesurer la performance
  • Au-delà de la précision – autres mesures de performance
  • La statistique Kappa
  • Sensibilité et spécificité
  • Précision et rappel
  • La mesure F
  • Visualisation des compromis de performance
  • Courbes ROC
  • Estimation des performances futures
  • Méthode de séparation (holdout)
  • Validation croisée
  • Échantillonnage Bootstrap

7. Réglage des modèles standards pour améliorer la performance

  • Utilisation de caret pour le réglage automatisé des paramètres
  • Création d’un modèle simple réglé
  • Personnalisation du processus de réglage
  • Amélioration de la performance des modèles par apprentissage méta
  • Compréhension des ensembles
  • Bagging
  • Boosting
  • Forêts aléatoires
  • Formation des forêts aléatoires
  • Évaluation de la performance des forêts aléatoires

SUJETS SECONDAIRES

8. Compréhension de la classification par les plus proches voisins

  • L’algorithme kNN
  • Calcul de la distance
  • Choix d’un k approprié
  • Préparation des données pour l’utilisation avec kNN
  • Pourquoi l’algorithme kNN est-il paresseux ?

9. Compréhension des règles de classification

  • Séparer et régner
  • L’algorithme One Rule
  • L’algorithme RIPPER
  • Règles issues des arbres de décision

10. Compréhension de la régression

  • Régression linéaire simple
  • Estimation des moindres carrés ordinaires
  • Corrélations
  • Régression linéaire multiple

11. Compréhension des arbres de régression et des arbres de modèles

  • Ajout de la régression aux arbres

12. Compréhension des règles d’association

  • L’algorithme Apriori pour l’apprentissage des règles d’association
  • Mesure de l’intérêt des règles – support et confiance
  • Construction d’un ensemble de règles avec le principe d’Apriori

Compléments

  • Spark/PySpark/MLlib et bandits multi-bras

Pré requis

Connaissances en Python

 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (7)

Cours à venir

Catégories Similaires