Plan du cours

Introduction à Reinforcement Learning

  • Qu'est-ce que l'apprentissage par renforcement ?
  • Concepts clés : agent, environnement, états, actions et récompenses
  • Défis de l'apprentissage par renforcement

Exploration et exploitation

  • Équilibrer l'exploration et l'exploitation dans les modèles d'apprentissage par renforcement
  • Stratégies d'exploration : epsilon-greedy, softmax, etc.

Apprentissage Q et réseaux Q profonds (DQN)

  • Introduction à l'apprentissage Q
  • Implémentation des DQN à l'aide de TensorFlow (en anglais)
  • Optimisation de l'apprentissage Q avec le rejeu d'expérience et les réseaux cibles

Méthodes basées sur les politiques

  • Algorithmes de gradient de politique
  • Algorithme REINFORCE et sa mise en œuvre
  • Méthodes de critique d'acteur

Travailler avec OpenAI Gym

  • Mise en place d'environnements dans OpenAI Gym
  • Simuler des agents dans des environnements dynamiques
  • Évaluer la performance des agents

Techniques avancées Reinforcement Learning

  • Apprentissage par renforcement multi-agents
  • Gradient de politique déterministe profond (DDPG)
  • Optimisation de la politique proximale (PPO)

Déploiement de modèles Reinforcement Learning

  • Applications de l'apprentissage par renforcement dans le monde réel
  • Intégration des modèles RL dans les environnements de production

Résumé et prochaines étapes

Pré requis

  • Expérience de la programmation Python
  • Compréhension de base des concepts d'apprentissage profond et d'apprentissage automatique
  • Connaissance des algorithmes et des concepts mathématiques utilisés dans l'apprentissage par renforcement.

Audience

  • Scientifiques des données
  • Praticiens de l'apprentissage automatique
  • Chercheurs en IA
 28 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (4)

Cours à venir

Catégories Similaires