Formation Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts est un cours pratique sur le service fiable et à grande échelle des modèles Tencent Hunyuan.

Cette formation animée en direct (en ligne ou sur site) s'adresse aux ingénieurs et architectes de niveau intermédiaire souhaitant utiliser Tencent Hunyuan pour déployer des modèles de grande taille et des modèles MoE avec une latence réduite, une meilleure utilisation du GPU et un contrôle des coûts opérationnels.

À la fin de cette formation, les participants seront capables de :

expliquer les principaux défis de production liés au service des modèles Tencent Hunyuan.
appliquer des techniques d'optimisation d'inférence pratiques telles que TensorRT, l'ajustement du cache KV, la quantification et le regroupement par lots.
concevoir une approche de déploiement évolutif avec mise à l'échelle automatique, surveillance et planification des capacités.
améliorer les compromis entre latence et coût pour des charges de travail réelles en production.

Format du cours permettant d'évaluer les participants

Conférence interactive et discussion.
De nombreux exercices et mises en pratique.
Implémentation pratique dans un environnement de laboratoire en direct.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin de l'organiser.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Cours à venir

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

2026-06-18 09:30

14 heures

Paris, Opera Bourse

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

2026-07-02 09:30

14 heures

Lyon, Gare Lyon Part-Dieu

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

2026-07-16 09:30

14 heures

Lille, Gare Flandres

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

2026-07-30 09:30

14 heures

Toulouse, centre ville

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

2026-08-13 09:30

14 heures

Marseille, Quartier du Prado

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

2026-08-27 09:30

14 heures

Montpellier, Garosud

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Formation Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Plan du cours

Pré requis

Cours à venir

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Plan du cours

Pré requis

Cours à venir

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en production : Inférence à faible latence et optimisation des coûts

Cours Similaires

Avancé LangGraph : Optimisation, Débogage et Surveillance de Graphes complexes

Création d'agents de codage avec Devstral : du design des agents à l'outillage

Open-Source Model Ops: Self-Hosting, Fine-Tuning and Governance with Devstral & Mistral Models

Applications de LangGraph dans les Finances

Fondations de LangGraph : Promptage et Chaînage basés sur les Graphes

LangGraph dans la Santé : Orchestration des Flux de Travail pour les Environnements Régulés

LangGraph pour les Applications Juridiques

Construire des Flux de Travail Dynamiques avec LangGraph et des Agents LLM

LangGraph pour l'Automatisation du Marketing

Le Chat Enterprise: ChatOps Privé, Intégrations & Contrôles d'Administration

Architectures Efficaces en Coûts pour les LLM : Mistral à l'Échelle (Performance / Ingénierie des Coûts)

Productisation d'Assistants Conversationnels avec les Connecteurs et Intégrations Mistral

Déploiements d'Entreprise avec Mistral Medium 3

Mistral pour l'IA responsable : Confidentialité, résidence des données et contrôles d'entreprise

Applications Multimodales avec les Modèles Mistral (Vision, OCR et Compréhension Documentaire)

Catégories Similaires

Large Language Models (LLMs)

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites