Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à l'IA multimodale
- Qu'est-ce que l'IA multimodale ?
- Principaux défis et applications
- Aperçu des principaux modèles multimodaux
Traitement du texte et compréhension du langage naturel
- Exploiter les LLM pour les agents d'IA basés sur le texte
- Comprendre l'ingénierie des messages pour les tâches multimodales
- Affiner les modèles de texte pour des applications spécifiques à un domaine
Reconnaissance et génération d'images
- Traitement d'images avec l'IA : classification, légendes et détection d'objets
- Génération d'images avec des modèles de diffusion (Stable Diffusion, DALLE)
- Intégration de données d'images avec des modèles textuels
Traitement de la parole et de l'audio
- Reconnaissance de la parole avec Whisper ASR
- Techniques de synthèse de la parole à partir du texte (TTS)
- Amélioration de l'interaction avec l'utilisateur grâce à l'IA basée sur la voix
Intégration d'entrées multimodales
- Construction de pipelines d'IA pour le traitement de plusieurs types d'entrées
- Techniques de fusion pour combiner le texte, l'image et les données vocales
- Applications réelles d'agents d'IA multimodaux
Déploiement d'agents multimodaux AI Agents
- Construire des solutions d'IA multimodale pilotées par API
- Optimisation des modèles pour la performance et l'évolutivité
- Meilleures pratiques pour le déploiement de l'IA multimodale en production
Considérations éthiques et tendances futures
- Biais et équité dans l'IA multimodale
- Préoccupations en matière de protection de la vie privée liées aux données multimodales
- Développements futurs de l'IA multimodale
Résumé et prochaines étapes
Pré requis
- Compréhension des principes de l'apprentissage automatique
- Expérience de la programmation Python.
- Familiarité avec les cadres d'apprentissage profond (par exemple, TensorFlow, PyTorch)
Public
- Développeurs d'IA
- Chercheurs
- Ingénieurs multimédia
21 Heures
Nos clients témoignent (1)
Formateur répondant aux questions au fur et à mesure.
Adrian
Formation - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Traduction automatique