Plan du cours

Introduction à l'apprentissage automatique

  • Types d'apprentissage automatique – supervisé vs non supervisé
  • Du apprentissage statistique à l'apprentissage automatique
  • Le workflow de fouille de données : compréhension commerciale, préparation des données, modélisation, déploiement
  • Choix du bon algorithme pour la tâche
  • Surapprentissage et compromis biais-variance

Aperçu de Python et des bibliothèques d'IA

  • Pourquoi utiliser des langages de programmation pour l'apprentissage automatique
  • Choix entre R et Python
  • Cours intensif sur Python et les cahiers Jupyter
  • Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn

Test et évaluation des algorithmes d'apprentissage automatique

  • Généralisation, surapprentissage et validation du modèle
  • Stratégies d'évaluation : holdout, cross-validation, bootstrapping
  • Métriques pour la régression : ME, MSE, RMSE, MAPE
  • Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
  • Visualisation des performances du modèle : courbe de profit, courbe ROC, courbe lift
  • Sélection de modèle et recherche sur grille pour l'ajustement

Préparation des données

  • Importation et stockage des données en Python
  • Analyse exploratoire et statistiques descriptives
  • Gestion des valeurs manquantes et des outliers
  • Standardisation, normalisation et transformation
  • Recodage des données qualitatives et manipulation des données avec pandas

Algorithmes de classification

  • Classification binaire vs multiclasse
  • Régression logistique et fonctions discriminantes
  • Bayes naïf, k-plus proches voisins
  • Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
  • Machines à vecteurs de support et noyaux
  • Techniques d'apprentissage ensembliste

Régression et prédiction numérique

  • Moindres carrés et sélection de variables
  • Méthodes de régularisation : L1, L2
  • Régression polynomiale et modèles non linéaires
  • Arbres de régression et splines

Réseaux neuronaux

  • Introduction aux réseaux neuronaux et à l'apprentissage profond
  • Fonctions d'activation, couches et retropropagation
  • Perceptrons multicouches (MLP)
  • Utilisation de TensorFlow ou PyTorch pour la modélisation de réseaux neuronaux basiques
  • Réseaux neuronaux pour la classification et la régression

Prévision des ventes et analyse prédictive

  • Séries temporelles vs prévision basée sur la régression
  • Gestion des données saisonnières et tendancielles
  • Construction d'un modèle de prévision des ventes utilisant des techniques d'apprentissage automatique
  • Évaluation de la précision de la prévision et incertitude
  • Interprétation commerciale et communication des résultats

Apprentissage non supervisé

  • Techniques de clustering : k-means, k-medoids, clustering hiérarchique, SOMs
  • Réduction de dimensionnalité : PCA, analyse factorielle, SVD
  • Échelle multidimensionnelle

Analyse textuelle

  • Prétraitement et tokenisation du texte
  • Sac de mots, stemming et lemmatisation
  • Analyse de sentiment et fréquence des mots
  • Visualisation des données textuelles avec des nuages de mots

Systèmes de recommandation

  • Filtrage collaboratif basé sur les utilisateurs et les articles
  • Conception et évaluation des moteurs de recommandation

Fouille de motifs d'association

  • Ensembles d'éléments fréquents et algorithme Apriori
  • Analyse de panier et ratio lift

Détection des anomalies

  • Analyse des valeurs extrêmes
  • Méthodes basées sur la distance et la densité
  • Détection d'anomalies en données de grande dimension

Étude de cas en apprentissage automatique

  • Compréhension du problème commercial
  • Prétraitement des données et ingénierie des caractéristiques
  • Sélection de modèle et ajustement des paramètres
  • Évaluation et présentation des résultats
  • Déploiement

Résumé et étapes suivantes

Pré requis

  • Connaissances de base des concepts d'apprentissage automatique tels que l'apprentissage supervisé et non supervisé
  • Familiarité avec la programmation Python (variables, boucles, fonctions)
  • Une certaine expérience de la gestion des données à l'aide de bibliothèques comme pandas ou NumPy est utile mais pas obligatoire
  • Aucune expérience préalable en modélisation avancée ou en réseaux de neurones n'est attendue

Audience

  • Scientifiques des données
  • Analystes d'affaires
  • Ingénieurs logiciels et professionnels techniques travaillant avec des données
 28 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires