Plan du cours
Introduction à Reinforcement Learning
- Qu'est-ce que l'apprentissage par renforcement ?
- Concepts clés : agent, environnement, états, actions et récompenses
- Défis de l'apprentissage par renforcement
Exploration et exploitation
- Équilibrer l'exploration et l'exploitation dans les modèles d'apprentissage par renforcement
- Stratégies d'exploration : epsilon-greedy, softmax, etc.
Apprentissage Q et réseaux Q profonds (DQN)
- Introduction à l'apprentissage Q
- Implémentation des DQN à l'aide de TensorFlow (en anglais)
- Optimisation de l'apprentissage Q avec le rejeu d'expérience et les réseaux cibles
Méthodes basées sur les politiques
- Algorithmes de gradient de politique
- Algorithme REINFORCE et sa mise en œuvre
- Méthodes de critique d'acteur
Travailler avec OpenAI Gym
- Mise en place d'environnements dans OpenAI Gym
- Simuler des agents dans des environnements dynamiques
- Évaluer la performance des agents
Techniques avancées Reinforcement Learning
- Apprentissage par renforcement multi-agents
- Gradient de politique déterministe profond (DDPG)
- Optimisation de la politique proximale (PPO)
Déploiement de modèles Reinforcement Learning
- Applications de l'apprentissage par renforcement dans le monde réel
- Intégration des modèles RL dans les environnements de production
Résumé et prochaines étapes
Pré requis
- Expérience de la programmation Python
- Compréhension de base des concepts d'apprentissage profond et d'apprentissage automatique
- Connaissance des algorithmes et des concepts mathématiques utilisés dans l'apprentissage par renforcement.
Audience
- Scientifiques des données
- Praticiens de l'apprentissage automatique
- Chercheurs en IA
Nos clients témoignent (4)
très sympathique et serviable
Aktar Hossain - Unit4
Formation - Building Microservices with Microsoft Azure Service Fabric (ASF)
Traduction automatique
L'installation manuelle de serverless. De plus, je n'avais aucune idée que la console web sls sortait, ce qui est bien.
Rafal Kucharski - The Software House sp. z o.o.
Formation - Serverless Framework for Developers
Traduction automatique
Tout est bon, rien à améliorer
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Formation - AWS Lambda for Developers
Traduction automatique
Applications IoT
Palaniswamy Suresh Kumar - Makers' Academy
Formation - Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
Traduction automatique