Plan du cours
Introduction à l'apprentissage automatique
- Types d'apprentissage automatique – supervisé vs non supervisé
- Du apprentissage statistique à l'apprentissage automatique
- Le workflow de fouille de données : compréhension commerciale, préparation des données, modélisation, déploiement
- Choix du bon algorithme pour la tâche
- Surapprentissage et compromis biais-variance
Aperçu de Python et des bibliothèques d'IA
- Pourquoi utiliser des langages de programmation pour l'apprentissage automatique
- Choix entre R et Python
- Cours intensif sur Python et les cahiers Jupyter
- Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn
Test et évaluation des algorithmes d'apprentissage automatique
- Généralisation, surapprentissage et validation du modèle
- Stratégies d'évaluation : holdout, cross-validation, bootstrapping
- Métriques pour la régression : ME, MSE, RMSE, MAPE
- Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
- Visualisation des performances du modèle : courbe de profit, courbe ROC, courbe lift
- Sélection de modèle et recherche sur grille pour l'ajustement
Préparation des données
- Importation et stockage des données en Python
- Analyse exploratoire et statistiques descriptives
- Gestion des valeurs manquantes et des outliers
- Standardisation, normalisation et transformation
- Recodage des données qualitatives et manipulation des données avec pandas
Algorithmes de classification
- Classification binaire vs multiclasse
- Régression logistique et fonctions discriminantes
- Bayes naïf, k-plus proches voisins
- Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
- Machines à vecteurs de support et noyaux
- Techniques d'apprentissage ensembliste
Régression et prédiction numérique
- Moindres carrés et sélection de variables
- Méthodes de régularisation : L1, L2
- Régression polynomiale et modèles non linéaires
- Arbres de régression et splines
Réseaux neuronaux
- Introduction aux réseaux neuronaux et à l'apprentissage profond
- Fonctions d'activation, couches et retropropagation
- Perceptrons multicouches (MLP)
- Utilisation de TensorFlow ou PyTorch pour la modélisation de réseaux neuronaux basiques
- Réseaux neuronaux pour la classification et la régression
Prévision des ventes et analyse prédictive
- Séries temporelles vs prévision basée sur la régression
- Gestion des données saisonnières et tendancielles
- Construction d'un modèle de prévision des ventes utilisant des techniques d'apprentissage automatique
- Évaluation de la précision de la prévision et incertitude
- Interprétation commerciale et communication des résultats
Apprentissage non supervisé
- Techniques de clustering : k-means, k-medoids, clustering hiérarchique, SOMs
- Réduction de dimensionnalité : PCA, analyse factorielle, SVD
- Échelle multidimensionnelle
Analyse textuelle
- Prétraitement et tokenisation du texte
- Sac de mots, stemming et lemmatisation
- Analyse de sentiment et fréquence des mots
- Visualisation des données textuelles avec des nuages de mots
Systèmes de recommandation
- Filtrage collaboratif basé sur les utilisateurs et les articles
- Conception et évaluation des moteurs de recommandation
Fouille de motifs d'association
- Ensembles d'éléments fréquents et algorithme Apriori
- Analyse de panier et ratio lift
Détection des anomalies
- Analyse des valeurs extrêmes
- Méthodes basées sur la distance et la densité
- Détection d'anomalies en données de grande dimension
Étude de cas en apprentissage automatique
- Compréhension du problème commercial
- Prétraitement des données et ingénierie des caractéristiques
- Sélection de modèle et ajustement des paramètres
- Évaluation et présentation des résultats
- Déploiement
Résumé et étapes suivantes
Pré requis
- Connaissances de base des concepts d'apprentissage automatique tels que l'apprentissage supervisé et non supervisé
- Familiarité avec la programmation Python (variables, boucles, fonctions)
- Une certaine expérience de la gestion des données à l'aide de bibliothèques comme pandas ou NumPy est utile mais pas obligatoire
- Aucune expérience préalable en modélisation avancée ou en réseaux de neurones n'est attendue
Audience
- Scientifiques des données
- Analystes d'affaires
- Ingénieurs logiciels et professionnels techniques travaillant avec des données
Nos clients témoignent (2)
l'écosystème ML comprend non seulement MLFlow mais aussi Optuna, hyperops, docker et docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Formation - MLflow
Traduction automatique
J'ai apprécié de participer à la formation Kubeflow, qui s'est déroulée en ligne. Cette formation m'a permis de consolider mes connaissances sur les services AWS, K8s et tous les outils DevOps associés à Kubeflow, qui sont les bases nécessaires pour aborder correctement le sujet. Je tiens à remercier Malawski Marcin pour sa patience et son professionnalisme dans la formation et ses conseils sur les meilleures pratiques. Malawskiaborde le sujet sous différents angles, avec divers outils de déploiement Ansible, EKS kubectl, Terraform. Maintenant, je suis définitivement convaincu que je m'oriente vers le bon domaine d'application.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Formation - Kubeflow
Traduction automatique