Plan du cours

Introduction à la Génération Augmentée par la Récupération (RAG)

  • Qu'est-ce que la RAG et pourquoi est-elle importante pour l'IA d'entreprise
  • Composants d'un système RAG : récupérateur, générateur, entrepôt de documents
  • Comparaison avec les LLMs autonomes et la recherche vectorielle

Mise en place d'une pipeline RAG

  • Installation et configuration de Haystack ou des frameworks similaires
  • Ingestion et prétraitement des documents
  • Connexion des récupérateurs aux bases de données vectorielles (par exemple, FAISS, Pinecone)

Ajustement fin du récupérateur

  • Formation de récupérateurs denses à l'aide de données spécifiques au domaine
  • Utilisation des transformateurs de phrases et de l'apprentissage contrastif
  • Évaluation de la qualité du récupérateur avec une précision top-k

Ajustement fin du générateur

  • Sélection des modèles de base (par exemple, BART, T5, FLAN-T5)
  • Ajustement par instruction versus ajustement supervisé
  • Méthodes LoRA et PEFT pour les mises à jour efficaces

Évaluation et optimisation

  • Métriques d'évaluation des performances de la RAG (par exemple, BLEU, EM, F1)
  • Lateness, qualité de la récupération et réduction des hallucinations
  • Suivi des expériences et amélioration itérative

Déploiement et intégration en environnement réel

  • Déploiement de RAG dans les moteurs de recherche internes et les chatbots
  • Considérations sur la sécurité, l'accès aux données et la gouvernance
  • Intégration avec des API, tableaux de bord ou portails de connaissances

Cas pratiques et meilleures pratiques

  • Cas d'usage en entreprise dans les domaines de la finance, de la santé et du droit
  • Gestion de l'écart de domaine et des mises à jour de la base de connaissances
  • Directions futures pour les systèmes LLM augmentés par la récupération

Résumé et étapes suivantes

Pré requis

  • Une compréhension des concepts de traitement du langage naturel (NLP)
  • Une expérience avec les modèles de langage basés sur les transformateurs
  • Une familiarité avec Python et les flux de travail de base en apprentissage automatique

Public cible

  • Ingénieurs NLP
  • Équipes de gestion des connaissances
 14 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires