Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Machine Learning Introduction
- Types de machine learning – supervisé vs non supervisé
- Du apprentissage statistique à l'apprentissage automatique
- Le workflow de la fouille de données : compréhension des affaires, préparation des données, modélisation, déploiement
- Choisir le bon algorithme pour la tâche
- Surchauffe et l'équilibre biais-variance
Python et Aperçu des bibliothèques ML
- Pourquoi utiliser des langages de programmation pour le ML
- Choisir entre R et Python
- Cours express en Python et Jupyter Notebooks
- Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn
Test et Évaluation des Algorithmes de ML
- Généralisation, surajustement et validation du modèle
- Stratégies d'évaluation : holdout, validation croisée, bootstrap
- Métriques pour la régression : ME, MSE, RMSE, MAPE
- Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
- Visualisation des performances du modèle : courbe de profit, ROC curve, lift curve
- Sélection et recherche en grille du modèle pour l'ajustement
Préparation des Données
- Importation et stockage des données dans Python
- Analyse exploratoire et statistiques sommaires
- Gestion des valeurs manquantes et des outliers
- Standardisation, normalisation et transformation
- Réencodage des données qualitatives et data wrangling avec pandas
Algorithmes de Classification
- Classification binaire vs multiclasse
- Régression logistique et fonctions discriminantes
- Naïve Bayes, k-plus proches voisins
- Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
- Machines à vecteurs de support et noyaux
- Téchniques d'apprentissage ensembliste
Régression et Prédiction Numérique
- Moindres carrés et sélection des variables
- Méthodes de régularisation : L1, L2
- Régression polynomiale et modèles non linéaires
- Arbres de régression et splines
Unsupervised Learning
- Techniques de regroupement : k-means, k-medoids, classification hiérarchique, SOMs
- Réduction de la dimensionnalité : PCA, analyse factorielle, SVD
- Mise à l'échelle multidimensionnelle
Text Mining
- Prétraitement et tokenisation du texte
- Bag-of-words, racinisation et lemmatisation
- Analyse de sentiment et fréquence des mots
- Visualisation des données textuelles avec nuages de mots
Systèmes de Recommandation
- Filtrage collaboratif basé sur l'utilisateur vs basé sur les objets
- Conception et évaluation des moteurs de recommandations
Mining de Modèles d'Association
- Ensembles fréquents et algorithme Apriori
- Analyse du panier de marché et ratio lift
Détection des Valeurs Anormales
- Analyse des valeurs extrêmes
- Méthodes basées sur la distance et la densité
- Détection des outliers dans les données à haute dimensionnalité
Machine Learning Cas Pratique
- Compréhension du problème d'affaires
- Préparation des données et ingénierie de caractéristiques
- Sélection et ajustement des paramètres du modèle
- Évaluation et présentation des résultats
- Déploiement
Résumé et Étapes Suivantes
Pré requis
- Compréhension de base des statistiques et de l'algèbre linéaire
- Familiarité avec les concepts d'analyse de données ou deelligence d'affaires
- Certaines connaissances en programmation (idéalement Python ou R) sont recommandées
- Intérêt pour l'apprentissage des techniques d'apprentissage automatique appliquées aux projets axés sur les données
Public cible
- Analystes et scientifiques des données
- Statisticiens et professionnels de la recherche
- Développeurs et professionnels IT explorant les outils d'apprentissage automatique
- Toute personne impliquée dans les projets de science des données ou d'analyse prédictive
21 Heures