Plan du cours

Introduction à l'Apprentissage par Renforcement

  • Aperçu de l'apprentissage par renforcement et ses applications
  • Différences entre apprentissage supervisé, non supervisé et par renforcement
  • Concepts clés : agent, environnement, récompenses et politique

Processus de Décision de Markov (MDPs)

  • Comprendre les états, actions, récompenses et transitions d'état
  • Fonctions de valeur et l'équation de Bellman
  • Programmation dynamique pour résoudre les MDPs

Algorithmes fondamentaux RL

  • Méthodes en tableau : Q-Learning et SARSA
  • Méthodes basées sur la politique : algorithme REINFORCE
  • Cadres Actor-Critic et leurs applications

Apprentissage profond par renforcement

  • Introduction aux Réseaux Q-Déep (DQN)
  • Reproduction de l'expérience et réseaux cibles
  • Gradients de politique et méthodes avancées d'apprentissage profond par renforcement

Cadres et outils RL

  • Introduction à OpenAI Gym et autres environnements RL
  • Utilisation de PyTorch ou TensorFlow pour le développement de modèles RL
  • Formation, test et benchmarking des agents RL

Défis en RL

  • Équilibrer l'exploration et l'exploitation lors de la formation
  • Gestion des récompenses rares et problèmes d'affectation du crédit
  • Défis d'évolutivité et computationnels en RL

Activités pratiques

  • Implémentation des algorithmes Q-Learning et SARSA à partir de zéro
  • Formation d'un agent basé sur DQN pour jouer un jeu simple dans OpenAI Gym
  • Réglage précis des modèles RL pour une meilleure performance dans les environnements personnalisés

Récapitulation et Étapes suivantes

Pré requis

  • Compréhension approfondie des principes et algorithmes d'apprentissage automatique
  • Maîtrise du programmation en Python
  • Familiarité avec les réseaux neuronaux et les cadres de l'apprentissage profond

Public cible

  • Ingénieurs en apprentissage automatique
  • Spécialistes de l'IA
 14 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires