Plan du cours

Machine Learning Introduction

  • Types de apprentissage automatique – supervisé vs non supervisé
  • D'apprentissage statistique à l'apprentissage automatique
  • Le workflow d'exploration de données : compréhension des affaires, préparation des données, modélisation, déploiement
  • Choisir le bon algorithme pour la tâche
  • Surchauffe et le compromis biais-variance

Python et Aperçu des bibliothèques ML

  • Pourquoi utiliser des langages de programmation pour l'IA
  • Choisir entre R et Python
  • Cours express en Python et Jupyter Notebooks
  • Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn

Test et Évaluation des Algorithmes d'IA

  • Généralisation, surchauffe et validation du modèle
  • Stratégies d'évaluation : holdout, validation croisée, bootstrap
  • Métriques pour la régression : ME, MSE, RMSE, MAPE
  • Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
  • Visualisation des performances du modèle : courbe de profit, courbe ROC, courbe lift
  • Sélection et recherche en grille pour l'ajustement du modèle

Préparation des Données

  • Importation et stockage des données dans Python
  • Analyse exploratoire et statistiques sommaires
  • Gestion des valeurs manquantes et des outliers
  • Standardisation, normalisation et transformation
  • Réencodage des données qualitatives et manipulation de données avec pandas

Algorithmes de Classification

  • Classification binaire vs multiclasse
  • Régression logistique et fonctions discriminantes
  • Naïve Bayes, k-plus proches voisins
  • Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
  • Machines à vecteurs de support et noyaux
  • Téchniques d'apprentissage en ensemble

Régression et Prédiction Numérique

  • Moindres carrés et sélection des variables
  • Méthodes de régularisation : L1, L2
  • Régression polynomiale et modèles non linéaires
  • Arbres de régression et splines

Neural Networks

  • Introduction aux réseaux de neurones et à l'apprentissage profond
  • Fonctions d'activation, couches et rétropropagation
  • Réseaux de perceptron multicouches (MLP)
  • Utilisation de TensorFlow ou PyTorch pour la modélisation de base des réseaux de neurones
  • Réseaux de neurones pour la classification et la régression

Ventes Forecasting et Predictive Analytics

  • Prévision basée sur les séries temporelles vs régression
  • Gestion des données saisonnières et basées sur les tendances
  • Construction d'un modèle de prévision des ventes en utilisant les techniques d'IA
  • Évaluation de l'exactitude et de l'incertitude des prévisions
  • Interprétation et communication des résultats Business

Unsupervised Learning

  • Téchniques de regroupement : k-means, k-medoids, classification hiérarchique, SOMs
  • Réduction de la dimensionnalité : PCA, analyse factorielle, SVD
  • Échelonnement multidimensionnel

Mining Textuel

  • Prétraitement et tokenisation du texte
  • Bag-of-words, racinisation et lemmatisation
  • Analyse de sentiment et fréquence des mots
  • Visualisation des données textuelles avec des nuages de mots

Systèmes de Recommandation

  • Filtrage collaboratif basé sur l'utilisateur vs l'objet
  • Conception et évaluation des moteurs de recommandations

Mining de Motifs Associatifs

  • Ensembles d'éléments fréquents et algorithme Apriori
  • Analyse du panier de marché et ratio lift

Détection des Valeurs Anormales

  • Analyse des valeurs extrêmes
  • Méthodes basées sur la distance et la densité
  • Détection des valeurs anormales dans les données de haute dimensionnalité

Machine Learning Étude de Cas

  • Compréhension du problème d'affaires
  • Préparation des données et ingénierie des caractéristiques
  • Sélection et ajustement des paramètres du modèle
  • Évaluation et présentation des résultats
  • Déploiement

Résumé et Étapes Suivantes

Pré requis

  • Connaissance de base des concepts d'apprentissage automatique tels que l'apprentissage supervisé et non supervisé
  • Familiarité avec la programmation Python (variables, boucles, fonctions)
  • Une certaine expérience dans la gestion des données à l'aide de bibliothèques comme pandas ou NumPy est un atout mais n'est pas obligatoire
  • Aucune expérience préalable en modélisation avancée ou réseaux neuronaux n'est attendue

Public cible

  • Scientifiques des données
  • Analystes Business
  • Ingénieurs logiciel et professionnels techniques travaillant avec les données
 28 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires