Plan du cours
- Introduction à l'apprentissage automatique Types d'apprentissage automatique - apprentissage supervisé ou non supervisé De l'apprentissage statistique à l'apprentissage automatique Le flux de travail d'exploration de données : compréhension commerciale Compréhension des données Préparation des données Modélisation Évaluation Déploiement Algorithmes d'apprentissage automatique Choix de l'algorithme approprié au problème Surajustement et compromis biais-variance dans ML ML bibliothèques et langages de programmation Pourquoi utiliser un langage de programmation Choisir entre R et Python Cours intensif Python Ressources Python Bibliothèques Python pour l'apprentissage automatique Carnets Jupyter et codage interactif Test des algorithmes ML Généralisation et surajustement Éviter le surajustement Méthode de rétention Validation croisée Bootstrapping Évaluation des prédictions numériques Mesures de précision : ME, MSE, RMSE, MAPE Stabilité des paramètres et des prédictions Évaluation des algorithmes de classification Précision et ses problèmes La matrice de confusion Problème de classes déséquilibrées Visualisation des performances du modèle Courbe de profit Courbe ROC Courbe de levage Sélection de modèle Réglage du modèle – stratégies de recherche de grille Exemples en Python Préparation des données Importation et stockage des données Comprendre les données – explorations de base Manipulations de données avec la bibliothèque pandas Transformations de données – Data wrangling Analyse exploratoire Observations manquantes – détection et solutions Valeurs aberrantes – détection et stratégies Standardisation, normalisation, binarisation Recodage de données qualitatives Exemples en Python Classification Classification binaire vs multiclasse Classification via des fonctions mathématiques Linéaire fonctions discriminantes Fonctions discriminantes quadratiques Régression logistique et approche probabiliste k-voisins les plus proches Arbres de décision Bayes naïfs CART Bagging Random Forests Boosting Xgboost Support Vector Machines et noyaux Classificateur de marge maximale Support Vector Machine Apprentissage d'ensemble Exemples en Python Régression et prédiction numérique Estimation des moindres carrés Variables techniques de sélection Régularisation et stabilité - L1, L2 Non-linéarités et moindres carrés généralisés Régression polynomiale Splines de régression Arbres de régression Exemples en Python Apprentissage non supervisé Clustering Clustering basé sur les centroïdes – k-moyennes, k-médoïdes, PAM, CLARA Clustering hiérarchique – Diana, Agnes Model- clustering basé sur EM - Cartes auto-organisées Évaluation et évaluation des clusters Réduction de la dimensionnalité Analyse en composantes principales et analyse factorielle Décomposition des valeurs singulières Mise à l'échelle multidimensionnelle Exemples en Python Exploration de texte Prétraitement des données Le modèle du sac de mots Stemming et lemmisation Analyse des fréquences de mots Analyse des sentiments Création de nuages de mots Exemples dans Python Moteurs de recommandations et filtrage collaboratif Données de recommandation Filtrage collaboratif basé sur l'utilisateur Filtrage collaboratif basé sur les éléments Exemples dans Python Exploration de modèles d'association Algorithme d'ensembles d'éléments fréquents Analyse du panier de marché Exemples dans Python Analyse des valeurs aberrantes Analyse des valeurs extrêmes Détection des valeurs aberrantes basée sur la distance Méthodes basées sur la densité High- Détection des valeurs aberrantes dimensionnelles Exemples dans l'étude de cas Python Machine Learning Compréhension des problèmes commerciaux Prétraitement des données Sélection et réglage de l'algorithme Évaluation des résultats Déploiement
Pré requis
Connaissance et prise de conscience des Machine Learning fondamentaux
Nos Clients témoignent (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Formation - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Formation - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback