Plan du cours
Introduction à l'apprentissage automatique
- Types d'apprentissage automatique – supervisé vs non supervisé
- Du apprentissage statistique à l'apprentissage automatique
- Le workflow de fouille de données : compréhension commerciale, préparation des données, modélisation, déploiement
- Choix du bon algorithme pour la tâche
- Surapprentissage et compromis biais-variance
Aperçu de Python et des bibliothèques d'IA
- Pourquoi utiliser des langages de programmation pour l'apprentissage automatique
- Choix entre R et Python
- Cours intensif sur Python et les cahiers Jupyter
- Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn
Test et évaluation des algorithmes d'apprentissage automatique
- Généralisation, surapprentissage et validation du modèle
- Stratégies d'évaluation : holdout, cross-validation, bootstrapping
- Métriques pour la régression : ME, MSE, RMSE, MAPE
- Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
- Visualisation des performances du modèle : courbe de profit, courbe ROC, courbe lift
- Sélection de modèle et recherche sur grille pour l'ajustement
Préparation des données
- Importation et stockage des données en Python
- Analyse exploratoire et statistiques descriptives
- Gestion des valeurs manquantes et des outliers
- Standardisation, normalisation et transformation
- Recodage des données qualitatives et manipulation des données avec pandas
Algorithmes de classification
- Classification binaire vs multiclasse
- Régression logistique et fonctions discriminantes
- Bayes naïf, k-plus proches voisins
- Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
- Machines à vecteurs de support et noyaux
- Techniques d'apprentissage ensembliste
Régression et prédiction numérique
- Moindres carrés et sélection de variables
- Méthodes de régularisation : L1, L2
- Régression polynomiale et modèles non linéaires
- Arbres de régression et splines
Réseaux neuronaux
- Introduction aux réseaux neuronaux et à l'apprentissage profond
- Fonctions d'activation, couches et retropropagation
- Perceptrons multicouches (MLP)
- Utilisation de TensorFlow ou PyTorch pour la modélisation de réseaux neuronaux basiques
- Réseaux neuronaux pour la classification et la régression
Prévision des ventes et analyse prédictive
- Séries temporelles vs prévision basée sur la régression
- Gestion des données saisonnières et tendancielles
- Construction d'un modèle de prévision des ventes utilisant des techniques d'apprentissage automatique
- Évaluation de la précision de la prévision et incertitude
- Interprétation commerciale et communication des résultats
Apprentissage non supervisé
- Techniques de clustering : k-means, k-medoids, clustering hiérarchique, SOMs
- Réduction de dimensionnalité : PCA, analyse factorielle, SVD
- Échelle multidimensionnelle
Analyse textuelle
- Prétraitement et tokenisation du texte
- Sac de mots, stemming et lemmatisation
- Analyse de sentiment et fréquence des mots
- Visualisation des données textuelles avec des nuages de mots
Systèmes de recommandation
- Filtrage collaboratif basé sur les utilisateurs et les articles
- Conception et évaluation des moteurs de recommandation
Fouille de motifs d'association
- Ensembles d'éléments fréquents et algorithme Apriori
- Analyse de panier et ratio lift
Détection des anomalies
- Analyse des valeurs extrêmes
- Méthodes basées sur la distance et la densité
- Détection d'anomalies en données de grande dimension
Étude de cas en apprentissage automatique
- Compréhension du problème commercial
- Prétraitement des données et ingénierie des caractéristiques
- Sélection de modèle et ajustement des paramètres
- Évaluation et présentation des résultats
- Déploiement
Résumé et étapes suivantes
Pré requis
- Connaissances de base des concepts d'apprentissage automatique tels que l'apprentissage supervisé et non supervisé
- Familiarité avec la programmation Python (variables, boucles, fonctions)
- Une certaine expérience de la gestion des données à l'aide de bibliothèques comme pandas ou NumPy est utile mais pas obligatoire
- Aucune expérience préalable en modélisation avancée ou en réseaux de neurones n'est attendue
Audience
- Scientifiques des données
- Analystes d'affaires
- Ingénieurs logiciels et professionnels techniques travaillant avec des données
Nos clients témoignent (3)
J'ai vraiment aimé la fin où nous avons pris le temps de jouer avec CHAT GPT. La salle n'était pas très bien organisée pour cela - au lieu d'une grande table, quelques petites tables auraient été préférables afin que nous puissions travailler en petits groupes et brainstormer.
Nola - Laramie County Community College
Formation - Artificial Intelligence (AI) Overview
Traduction automatique
Travailler à partir des principes fondamentaux de manière concentrée, puis passer à l'application d'études de cas le même jour
Maggie Webb - Department of Jobs, Regions, and Precincts
Formation - Artificial Neural Networks, Machine Learning, Deep Thinking
Traduction automatique
Qu'il utilisait des données réelles d'entreprise. Le formateur avait une très bonne approche en faisant participer et concourir les stagiaires
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Formation - Applied AI from Scratch in Python
Traduction automatique