Plan du cours

Introduction

Reinforcement Learning Bases

Techniques de base Reinforcement Learning

Introduction à la toile de jute

Convergence des valeurs et itération des politiques

Façonnage des récompenses

Exploration

Généralisation

MDP partiellement observables

Possibilités

Logistique

TD Lambda

Dégradés politiques

Apprentissage Q profond

Sujets en théorie des jeux

Résumé et prochaines étapes

Pré requis

  • Maîtrise de Python
  • Une compréhension du calcul universitaire et de l'algèbre linéaire
  • Compréhension de base des probabilités et Statistics
  • Expérience de la création de modèles d'apprentissage automatique en Python et Numpy

Audience

  • Développeurs
  • Data Scientists
  21 heures
 

Nombre de participants


Début

Fin


Dates are subject to availability and take place between 09:30 and 16:30.
Les formations ouvertes requièrent plus de 3 participants.

Cours Similaires

Catégories Similaires