Plan du cours

Introduction à la Réglage Fin de Modèles DeepSeek LLM

  • Aperçu des modèles DeepSeek, par exemple DeepSeek-R1 et DeepSeek-V3
  • Comprendre la nécessité du réglage fin des LLM (Modèles de Langue Géants)
  • Comparaison entre le réglage fin et l'ingénierie des prompts

Préparation du Jeu de Données pour le Réglage Fin

  • Curation de jeux de données spécifiques à un domaine
  • Techniques de prétraitement et de nettoyage des données
  • Tokenization et mise en forme du jeu de données pour le LLM DeepSeek

Configuration de l'Environnement pour le Réglage Fin

  • Configuration de l'accélération GPU et TPU
  • Mise en place des Transformers Hugging Face avec les LLM DeepSeek
  • Compréhension des hyperparamètres pour le réglage fin

Réglage Fin du Modèle DeepSeek LLM

  • Implémentation du réglage supervisé
  • Utilisation de LoRA (Adaptation à Rang Faible) et PEFT (Réglage Fin avec Efficacité Paramétrique)
  • Exécution du réglage fin distribué pour des jeux de données à grande échelle

Évaluation et Optimisation des Modèles Réglés Fin

  • Évaluation des performances du modèle avec des métriques d'évaluation
  • Gestion de la surapprentissage et de l'apprentissage insuffisant
  • Optimisation de la vitesse d'inférence et de l'efficacité du modèle

Déploiement des Modèles DeepSeek Réglés Fin

  • Emballage des modèles pour le déploiement via API
  • Intégration des modèles réglés fin dans les applications
  • Échelonnement des déploiements avec le cloud et le calcul edge

Cas d'Usage Réels et Applications

  • Modèles LLM réglés fin pour la finance, la santé et le support client
  • Études de cas des applications industrielles
  • Considérations éthiques sur les modèles d'IA spécifiques à un domaine

Résumé et Prochaines Étapes

Pré requis

  • Expérience avec les frameworks de machine learning et d'apprentissage profond
  • Familiarité avec les transformateurs et les grands modèles de langage (LLMs)
  • Compréhension des techniques de prétraitement des données et de l'entraînement du modèle

Public cible

  • Rechercheurs en IA explorant le fine-tuning des LLM
  • Ingénieurs en machine learning développant des modèles d'IA personnalisés
  • Développeurs avancés mettant en œuvre des solutions pilotées par l'IA
 21 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires