Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction
Reinforcement Learning Bases
Techniques de base Reinforcement Learning
Introduction à la toile de jute
Convergence des valeurs et itération des politiques
Façonnage des récompenses
Exploration
Généralisation
MDP partiellement observables
Possibilités
Logistique
TD Lambda
Dégradés politiques
Apprentissage Q profond
Sujets en théorie des jeux
Résumé et prochaines étapes
Pré requis
- Maîtrise de Python
- Une compréhension du calcul universitaire et de l'algèbre linéaire
- Compréhension de base des probabilités et Statistics
- Expérience de la création de modèles d'apprentissage automatique en Python et Numpy
Audience
- Développeurs
- Data Scientists
21 Heures
Nos clients témoignent (2)
Organisation, conformément à l'ordre du jour proposé, les connaissances approfondies du formateur dans ce sujet
Ali Kattan - TWPI
Formation - Natural Language Processing with TensorFlow
Traduction automatique
Very updated approach or CPI (tensor flow, era, learn) to do machine learning.
Paul Lee
Formation - TensorFlow for Image Recognition
Traduction automatique