Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera dans les plus brefs délais.
Merci pour votre réservation ! Un membre de notre équipe vous contactera dans les plus brefs délais.
Plan du cours
Introduction
Reinforcement Learning Bases
Techniques de base Reinforcement Learning
Introduction à la toile de jute
Convergence des valeurs et itération des politiques
Façonnage des récompenses
Exploration
Généralisation
MDP partiellement observables
Possibilités
Logistique
TD Lambda
Dégradés politiques
Apprentissage Q profond
Sujets en théorie des jeux
Résumé et prochaines étapes
Pré requis
- Maîtrise de Python
- Une compréhension du calcul universitaire et de l'algèbre linéaire
- Compréhension de base des probabilités et Statistics
- Expérience de la création de modèles d'apprentissage automatique en Python et Numpy
Audience
- Développeurs
- Data Scientists
21 heures