Prenez contact avec nous

Plan du cours

Module 1 : Python de Base pour les Workflows ML

• Lancement du cours et configuration de l'environnement
Alignez les objectifs et configurez un espace de travail Python ML reproductible

• Essentiels du langage Python (accéléré)
Revue de la syntaxe, des structures de contrôle, des fonctions et des modèles couramment utilisés dans les bases de code ML

• Structures de données pour le ML
Listes, dictionnaires, ensembles et tuples pour les caractéristiques, les labels et les métadonnées

• Compréhensions et outils fonctionnels
Expressions de transformations à l'aide de compréhensions et de fonctions d'ordre supérieur

• Python orienté objet pour les développeurs ML
Classes, méthodes, composition et décisions de conception pratiques

• dataclasses et modélisation légère
Conteneurs typés pour la configuration, les exemples et les résultats

• Décorateurs et gestionnaires de contexte
Timing, caching, logging et modèles d'exécution sécurisés

• Travail avec des fichiers et des chemins
Gestion robuste des jeux de données et formats de sérialisation

• Exceptions et programmation défensive
Écriture de scripts ML qui échouent de manière sûre et transparente

• Modules, packages et structure de projet
Organisation de bases de code ML réutilisables

• Typage et qualité du code
Indications de type, documentation et structure compatible avec les linters

Module 2 : Python Numérique, SciPy et Gestion des Données

• Fondements de NumPy pour le calcul vectoriel
Opérations efficaces sur les tableaux et codage conscient des performances

• Indexation, tronçonnage, diffusion et formes
Manipulation sécurisée des tenseurs et raisonnement sur les formes

• Algèbre linéaire essentielle avec NumPy et SciPy
Opérations stables de matrice et décompositions utilisées en ML

• Plongée approfondie dans SciPy
Statistiques, optimisation, ajustement de courbes et matrices creuses

• Pandas pour les données tabulaires ML
Nettoyage, jointure, agrégation et préparation de jeux de données

• Plongée approfondie dans scikit-learn
Interface d'estimateur, pipelines et workflows reproductibles

• Essentiels de la visualisation
Tracés diagnostiques pour l'exploration des données et le comportement des modèles

Module 3 : Modèles de Programmation pour la Construction d'Applications ML

• Du notebook à un projet maintenable
Réorganisation du code exploratoire en packages structurés

• Gestion de la configuration
Paramètres externes et validation de démarrage

• Logging, avertissements et observabilité
Logging structuré pour des systèmes ML debuggable

• Composants réutilisables avec OOP et composition
Conception de transformateurs et de prédicteurs extensibles

• Modèles de conception pratiques
Pipeline, Factory ou Registry, Strategy et Adapter patterns

• Validation des données et vérification des schémas
Prévention des problèmes de données silencieux

• Performance et profiling
Identification des goulets d'étranglement et application de techniques d'optimisation

• Entrées/sorties de modèle et interfaces d'inférence
Persistance sûre et interfaces de prédiction propres

• Mini construction de bout en bout
Pipeline ML de production avec configuration et logging

Module 4 : Apprentissage Statistique pour les Données Tabulaires, Textuelles et d'Image

• Fondements de l'évaluation
Divisions d'entraînement et de validation, validation croisée honnête et métriques alignées sur l'entreprise

• Apprentissage tabulaire avancé
GLMs régularisés, ensembles d'arbres et prétraitement sans fuite

• Calibration et incertitude
Échelonnage de Platt, régression isotonique, bootstrap et prédiction conforme

• Méthodes NLP classiques
Compromis de tokenisation, TF-IDF, modèles linéaires et Naive Bayes

• Modélisation de sujets
Fondements de LDA et limitations pratiques

• Vision informatique classique
HOG, PCA et pipelines basés sur les caractéristiques

• Analyse des erreurs
Détection de biais, bruit de label et corrélations spéculatives

• Laboratoires pratiques
Pipeline tabulaire sans fuite
Comparaison et interprétation de base de texte
Baseline classique de vision avec analyse de défaillance structurée

Module 5 : Réseaux Neuronaux pour les Données Tabulaires, Textuelles et d'Image

• Maîtrise de la boucle d'entraînement
Boucles PyTorch propres avec AMP, clipping et reproductibilité

• Optimisation et régularisation
Initialisation, normalisation, optimiseurs et planificateurs

• Précision mixte et mise à l'échelle
Accumulation de gradient et stratégies de checkpointing

• Réseaux neuronaux tabulaires
Embeddings catégoriels, croisements de caractéristiques et études d'ablation

• Réseaux neuronaux textuels
Embeddings, CNNs, BiLSTM ou GRU et gestion des séquences

• Réseaux neuronaux de vision
Fondamentaux des CNN et architectures de style ResNet

• Laboratoires pratiques
Cadre d'entraînement réutilisable
Comparaison de NN tabulaire vs boosting
CNN avec augmentation et expériences de planification

Module 6 : Architectures Neuronales Avancées

• Stratégies de transfert d'apprentissage
Modèles de congélation et décongélation, taux d'apprentissage discriminatifs

• Architectures de transformers pour le texte
Internes de l'auto-attention et approches de fine-tuning

• Backbones de vision et prédiction dense
ResNet, EfficientNet, Transformers de vision et concepts de U-Net

• Architectures tabulaires avancées
TabTransformer, FT-Transformer et réseaux profonds et croisés

• Considérations sur les séries temporelles
Divisions temporelles et détection de décalage de covariates

• Techniques PEFT et d'efficacité
Compromis de LoRA, distillation et quantification

• Laboratoires pratiques
Fine-tuning de transformer de texte pré-entraîné
Fine-tuning de modèle de vision pré-entraîné
Comparaison de TabTransformer vs GBDT

Module 7 : Systèmes d'IA Génératifs

• Fondements de l'incitation
Incitation structurée et génération contrôlée

• Fondements des LLM
Tokenisation, ajustement d'instructions et atténuation des hallucinations

• Génération Augmentée par la Récupération
Fragmentation, embeddings, recherche hybride et métriques d'évaluation

• Stratégies de fine-tuning
LoRA et QLoRA avec contrôles de qualité des données

• Modèles de diffusion
Intuition de diffusion latente et adaptation pratique

• Données tabulaires synthétiques
CTGAN et considérations de confidentialité

• Laboratoires pratiques
Mini-application de production de RAG
Validation de sortie structurée avec application de schéma Expérimentation de diffusion optionnelle

Module 8 : Agents d'IA et MCP

• Conception de la boucle d'agent
Observe, planifie, agit, réfléchit et persiste

• Architectures d'agents
ReAct, plan-and-execute et coordination multi-agent

• Gestion de la mémoire
Approches épisodiques, sémantiques et de scratchpad

• Intégration d'outils et sécurité
Contrats d'outils, sandboxing et défenses contre l'injection de prompts

• Cadres d'évaluation
Traces reproductibles, suites de tâches et tests de régression

• MCP et interopérabilité basée sur les protocoles
Conception de serveurs MCP avec exposition d'outils sécurisée

• Laboratoires pratiques
Construire un agent à partir de zéro
Exposer des outils via un serveur de style MCP
Créer un harnais d'évaluation avec des contraintes de sécurité

Pré requis

Les participants doivent avoir une connaissance opérationnelle de la programmation Python.

Ce programme est destiné aux professionnels techniques intermédiaires à avancés.

 56 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires