Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à CANN et aux processeurs Ascend AI
- Qu'est-ce que CANN? Rôle dans la pile de calcul AI de Huawei
- Aperçu de l'architecture des processeurs Ascend (310, 910, etc.)
- Aperçu des frameworks et outils de chaîne d'outils pour l'IA supportés
Conversion et compilation du modèle
- Utilisation de l'outil ATC pour la conversion de modèles (TensorFlow, PyTorch, ONNX)
- Création et validation des fichiers de modèles OM
- Gestion des opérateurs non pris en charge et des problèmes courants de conversion
Déploiement avec MindSpore et d'autres frameworks
- Déploiement de modèles avec MindSpore Lite
- Intégration des modèles OM avec les API Python ou les SDKs C++
- Travail avec Ascend Model Manager
Optimisation et profilage des performances
- Compréhension de l'optimisation du noyau AI, de la mémoire et de la pavage
- Profilage de l'exécution du modèle avec les outils CANN
- Meilleures pratiques pour améliorer la vitesse d'inférence et l'utilisation des ressources
Gestion des erreurs et débogage
- Erreurs de déploiement courantes et leurs résolutions
- Lecture des journaux et utilisation de l'outil de diagnostic d’erreurs
- Test unitaire et validation fonctionnelle des modèles déployés
Scénarios de déploiement aux bords et dans le cloud
- Déploiement sur Ascend 310 pour les applications aux bords
- Intégration avec des API basées sur le cloud et des microservices
- Études de cas en vision par ordinateur et NLP
Résumé et étapes suivantes
Pré requis
- Expérience avec des cadres de deep learning basés sur Python tels que TensorFlow ou PyTorch
- Compréhension des architectures de réseaux neuronaux et des workflows de formation du modèle
- Familiarité de base avec l'interface en ligne de commande Linux et le scriptage
Public cible
- Ingénieurs IA travaillant sur la mise en production des modèles
- Praticiens du machine learning visant l'accélération matérielle
- Développeurs de deep learning construisant des solutions d'inférence
14 Heures