Les cours de formation GPU (unité de traitement graphique) en direct, en ligne ou sur site, animés par un instructeur, démontrent, par le biais de discussions interactives et de pratiques pratiques, les principes fondamentaux du GPU et la manière de programmer les GPU. La formation GPU est disponible en tant que "formation en direct en ligne" ou "formation en direct sur site". La formation en direct en ligne (alias « formation en direct à distance ») est effectuée au moyen d'un ordinateur de bureau interactif à distance . La formation en direct sur site peut être effectuée localement dans les locaux du client en Lyon ou dans les centres de formation d'entreprise NobleProg en Lyon. NobleProg - Votre fournisseur de formation local
Lyon, Gare Lyon Part-Dieu
NobleProg Lyon, 10 Place Charles Béraudier, Lyon, france, 69000
Situé à 200 mètres de la gare TGV, la Tour Suisse est l'immeuble de bureaux le plus emblématique de ce secteur de Lyon. Le centre d'affaires vous propose un lieu de qualité pour vos formations, séminaires et réunions.
Gares TGV
Gare TGV Part-Dieu à 100 mètres, sortie porte du Rhône
Aéroport
Lyon Saint Exupéry (Satolas) à 30 minutes
Rhône Express depuis l’aéroport Saint Exupéry
Huawei Ascend est une famille de processeurs IA conçus pour l'inférence et la formation à haute performance.
Cette formation en direct (en ligne ou sur site) animée par un formateur s'adresse aux ingénieurs AI intermédiaires et aux scientifiques des données qui souhaitent développer et optimiser des modèles de réseau neuronal en utilisant la plateforme Ascend de Huawei et l'outil CANN.
À la fin de cette formation, les participants seront capables de :
Configurer l'environnement de développement CANN.
Développer des applications IA à l'aide de MindSpore et des workflows CloudMatrix.
Optimiser les performances sur les NPUs Ascend en utilisant des opérateurs personnalisés et le tiling.
Déployer des modèles dans des environnements edge ou cloud.
Format de la formation
Cours interactif et discussion.
Utilisation pratique de Huawei Ascend et de l'outil CANN dans des applications d'exemple.
Exercices guidés axés sur la construction, la formation et le déploiement du modèle.
Options de personnalisation de la formation
Pour demander une formation personnalisée basée sur votre infrastructure ou vos jeux de données, veuillez nous contacter pour organiser cela.
Huawei’s AI stack — from the low-level CANN SDK to the high-level MindSpore framework — offers a tightly integrated AI development and deployment environment optimized for Ascend hardware.
This instructor-led, live training (online or onsite) is aimed at beginner-level to intermediate-level technical professionals who wish to understand how the CANN and MindSpore components work together to support AI lifecycle management and infrastructure decisions.
By the end of this training, participants will be able to:
Understand the layered architecture of Huawei’s AI compute stack.
Identify how CANN supports model optimization and hardware-level deployment.
Evaluate the MindSpore framework and toolchain in relation to industry alternatives.
Position Huawei's AI stack within enterprise or cloud/on-prem environments.
Format of the Course
Interactive lecture and discussion.
Live system demos and case-based walkthroughs.
Optional guided labs on model flow from MindSpore to CANN.
Course Customization Options
To request a customized training for this course, please contact us to arrange.
Cette formation en Lyon (en ligne ou sur site) est destinée aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenACC pour programmer des dispositifs hétérogènes et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant le SDK OpenACC, un périphérique supportant OpenACC et du Visual Studio code.
Créer un programme OpenACC de base qui effectue une addition vectorielle sur l'appareil et récupère les résultats de la mémoire de l'appareil.
Utilisez les directives et clauses OpenACC pour annoter le code et spécifier les régions parallèles, le mouvement des données et les options d'optimisation.
Utiliser l'API OpenACC pour demander des informations sur les périphériques, définir leur numéro, gérer les erreurs et synchroniser les événements.
Utiliser les bibliothèques OpenACC et les fonctions d'interopérabilité pour intégrer OpenACC à d'autres modèles de programmation, tels que CUDA, OpenMP et MPI.
Utiliser les outils OpenACC pour profiler et déboguer les programmes OpenACC et identifier les goulets d'étranglement et les opportunités en matière de performances.
Optimiser les programmes OpenACC en utilisant des techniques telles que la localité des données, la fusion des boucles, la fusion des noyaux et l'auto-tuning.
The CANN SDK (Compute Architecture for Neural Networks) provides powerful deployment and optimization tools for real-time AI applications in computer vision and NLP, especially on Huawei Ascend hardware.
This instructor-led, live training (online or onsite) is aimed at intermediate-level AI practitioners who wish to build, deploy, and optimize vision and language models using the CANN SDK for production use cases.
By the end of this training, participants will be able to:
Deploy and optimize CV and NLP models using CANN and AscendCL.
Use CANN tools to convert models and integrate them into live pipelines.
Optimize inference performance for tasks like detection, classification, and sentiment analysis.
Build real-time CV/NLP pipelines for edge or cloud-based deployment scenarios.
Format of the Course
Interactive lecture and demonstration.
Hands-on lab with model deployment and performance profiling.
Live pipeline design using real CV and NLP use cases.
Course Customization Options
To request a customized training for this course, please contact us to arrange.
Cette formation en direct avec instructeur en Lyon (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent apprendre les bases de la programmation GPU et les principaux cadres et outils pour le développement d'applications GPU.
A l'issue de cette formation, les participants seront capables de : Comprendre la différence entre le CPU et l'informatique GPU ainsi que les avantages et les défis de la programmation GPU.
Choisir le cadre et l'outil appropriés pour leur application GPU.
Créer un programme GPU de base qui effectue une addition vectorielle en utilisant un ou plusieurs cadres et outils.
Utiliser les API, langages et bibliothèques respectifs pour demander des informations sur le périphérique, allouer et désallouer la mémoire du périphérique, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser les espaces mémoire respectifs, tels que global, local, constant et privé, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution respectifs, tels que les éléments de travail, les groupes de travail, les threads, les blocs et les grilles, pour contrôler le parallélisme.
Déboguer et tester les programmes GPU à l'aide d'outils tels que CodeXL, CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes GPU à l'aide de techniques telles que le coalescing, la mise en cache, le prefetching et le profilage.
CANN TIK (Tensor Instruction Kernel) and Apache TVM enable advanced optimization and customization of AI model operators for Huawei Ascend hardware.
This instructor-led, live training (online or onsite) is aimed at advanced-level system developers who wish to build, deploy, and tune custom operators for AI models using CANN’s TIK programming model and TVM compiler integration.
By the end of this training, participants will be able to:
Write and test custom AI operators using the TIK DSL for Ascend processors.
Integrate custom ops into the CANN runtime and execution graph.
Use TVM for operator scheduling, auto-tuning, and benchmarking.
Debug and optimize instruction-level performance for custom computation patterns.
Format of the Course
Interactive lecture and demonstration.
Hands-on coding of operators using TIK and TVM pipelines.
Testing and tuning on Ascend hardware or simulators.
Course Customization Options
To request a customized training for this course, please contact us to arrange.
Cette formation en direct avec instructeur en Lyon (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser différents frameworks pour la programmation GPU et comparer leurs caractéristiques, leurs performances et leur compatibilité.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant OpenCL SDK, CUDA Toolkit, ROCm Platform, un appareil prenant en charge OpenCL, CUDA ou ROCm, et Visual Studio Code.
Créer un programme GPU de base qui effectue une addition vectorielle en utilisant OpenCL, CUDA et ROCm, et comparer la syntaxe, la structure et l'exécution de chaque cadre.
Utiliser les API respectives pour demander des informations sur les périphériques, allouer et désallouer la mémoire des périphériques, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser les langages respectifs pour écrire des noyaux qui s'exécutent sur l'appareil et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques respectives pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire respectifs, tels que global, local, constant et privé, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution respectifs pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes GPU à l'aide d'outils tels que CodeXL, CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes GPU à l'aide de techniques telles que le coalescing, la mise en cache, le prefetching et le profilage.
CloudMatrix est la plateforme unifiée de développement et déploiement IA de Huawei conçue pour prendre en charge des pipelines d'inférence évolutifs et de production.
Cette formation en direct (en ligne ou sur site) animée par un instructeur s'adresse aux professionnels de l'IA débutants à intermédiaires qui souhaitent déployer et surveiller des modèles IA en utilisant la plateforme CloudMatrix avec une intégration CANN et MindSpore.
À la fin de cette formation, les participants seront capables de :
Utiliser CloudMatrix pour l'emballage, le déploiement et le service des modèles.
Convertir et optimiser des modèles pour les puces Ascend.
Mettre en place des pipelines pour des tâches d'inférence en temps réel et par lots.
Surveiller les déploiements et ajuster les performances dans un environnement de production.
Format du cours permettant d'évaluer les participants
Cours interactif et discussion.
Utilisation pratique de CloudMatrix avec des scénarios de déploiement réels.
Exercices guidés axés sur la conversion, l'optimisation et l'échelle.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours basée sur votre infrastructure IA ou environnement cloud, veuillez nous contacter pour en faire la demande.
Huawei's Ascend CANN toolkit enables powerful AI inference on edge devices such as the Ascend 310. CANN provides essential tools for compiling, optimizing, and deploying models where compute and memory are constrained.
This instructor-led, live training (online or onsite) is aimed at intermediate-level AI developers and integrators who wish to deploy and optimize models on Ascend edge devices using the CANN toolchain.
By the end of this training, participants will be able to:
Prepare and convert AI models for Ascend 310 using CANN tools.
Build lightweight inference pipelines using MindSpore Lite and AscendCL.
Optimize model performance for limited compute and memory environments.
Deploy and monitor AI applications in real-world edge use cases.
Format of the Course
Interactive lecture and demonstration.
Hands-on lab work with edge-specific models and scenarios.
Live deployment examples on virtual or physical edge hardware.
Course Customization Options
To request a customized training for this course, please contact us to arrange.
Cette formation en Lyon (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent installer et utiliser ROCm sur Windows pour programmer les AMD GPUs et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant la plate-forme ROCm, un code AMD GPU et Visual Studio sur Windows.
Créer un programme ROCm de base qui effectue une addition vectorielle sur le GPU et récupère les résultats de la mémoire GPU.
Utiliser l'API ROCm pour demander des informations sur le périphérique, allouer et désallouer la mémoire du périphérique, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser le langage HIP pour écrire des noyaux qui s'exécutent sur la mémoire GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques HIP pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire ROCm et HIP, tels que les espaces globaux, partagés, constants et locaux, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution ROCm et HIP pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes ROCm et HIP à l'aide d'outils tels que ROCm Debugger et ROCm Profiler.
Optimiser les programmes ROCm et HIP en utilisant des techniques telles que le coalescing, le caching, le prefetching et le profiling.
Cette formation en Lyon (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser ROCm et HIP pour programmer les AMD GPUs et exploiter leur parallélisme.
A la fin de cette formation, les participants seront capables de :
Mettre en place un environnement de développement comprenant la plate-forme ROCm, un code AMD GPU et Visual Studio.
Créer un programme ROCm de base qui effectue une addition vectorielle sur le GPU et récupère les résultats de la mémoire GPU.
Utiliser l'API ROCm pour demander des informations sur le périphérique, allouer et désallouer la mémoire du périphérique, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser le langage HIP pour écrire des noyaux qui s'exécutent sur la mémoire GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques HIP pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire ROCm et HIP, tels que les espaces globaux, partagés, constants et locaux, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution ROCm et HIP pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes ROCm et HIP à l'aide d'outils tels que ROCm Debugger et ROCm Profiler.
Optimiser les programmes ROCm et HIP en utilisant des techniques telles que le coalescing, le caching, le prefetching et le profiling.
CANN (Compute Architecture for Neural Networks) is Huawei’s AI computing toolkit used to compile, optimize, and deploy AI models on Ascend AI processors.
This instructor-led, live training (online or onsite) is aimed at beginner-level AI developers who wish to understand how CANN fits into the model lifecycle from training to deployment, and how it works with frameworks like MindSpore, TensorFlow, and PyTorch.
By the end of this training, participants will be able to:
Understand the purpose and architecture of the CANN toolkit.
Set up a development environment with CANN and MindSpore.
Convert and deploy a simple AI model to Ascend hardware.
Gain foundational knowledge for future CANN optimization or integration projects.
Format of the Course
Interactive lecture and discussion.
Hands-on labs with simple model deployment.
Step-by-step walkthrough of the CANN toolchain and integration points.
Course Customization Options
To request a customized training for this course, please contact us to arrange.
Ascend, Biren et Cambricon sont des plateformes de matériel IA leaders en Chine, chacune offrant des outils uniques d'accélération et de profilage pour les charges de travail AI à l'échelle de production.
Cette formation en direct dirigée par un formateur (en ligne ou sur site) s'adresse aux ingénieurs高级AI基础设施和性能工程师,他们希望在多个中国AI芯片平台上优化模型推理和训练工作流。
CANN SDK (Compute Architecture for Neural Networks) is Huawei’s AI compute foundation that allows developers to fine-tune and optimize the performance of deployed neural networks on Ascend AI processors.
This instructor-led, live training (online or onsite) is aimed at advanced-level AI developers and system engineers who wish to optimize inference performance using CANN’s advanced toolset, including the Graph Engine, TIK, and custom operator development.
By the end of this training, participants will be able to:
Understand CANN's runtime architecture and performance lifecycle.
Use profiling tools and Graph Engine for performance analysis and optimization.
Create and optimize custom operators using TIK and TVM.
Resolve memory bottlenecks and improve model throughput.
Format of the Course
Interactive lecture and discussion.
Hands-on labs with real-time profiling and operator tuning.
Optimization exercises using edge-case deployment examples.
Course Customization Options
To request a customized training for this course, please contact us to arrange.
Les architectures chinoises GPU telles que Huawei Ascend, Biren et Cambricon MLUs offrent des alternatives à CUDA adaptées aux marchés locaux de l'IA et du calcul haute performance.
Cette formation en direct (en ligne ou sur site) dispensée par un formateur est destinée aux programmeurs avancés GPU et aux spécialistes d'infrastructure qui souhaitent migrer et optimiser des applications CUDA existantes pour leur déploiement sur des plateformes matérielles chinoises.
À la fin de cette formation, les participants seront capables de :
Évaluer la compatibilité des charges de travail CUDA existantes avec les alternatives à base de puces chinoises.
Migrer des bases de code CUDA vers Huawei CANN, Biren SDK et environnements Cambricon BANGPy.
Comparer les performances et identifier les points d'optimisation sur différents plateformes.
Aborder les défis pratiques du support inter-architecture et du déploiement.
Format de la formation
Cours interactif et discussion.
Laboratoires pratiques de traduction de code et de comparaison des performances.
Exercices guidés axés sur les stratégies d'adaptation multi-GPU.
Options de personnalisation du cours
Pour demander une formation personnalisée basée sur votre plateforme ou projet CUDA, veuillez nous contacter pour organiser cela.
Cette formation en direct avec instructeur en Lyon (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser CUDA pour programmer les NVIDIA GPU et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant CUDA Toolkit, un NVIDIA GPU et un code Visual Studio.
Créer un programme CUDA de base qui effectue une addition vectorielle sur le GPU et récupère les résultats dans la mémoire du GPU.
Utiliser l'API CUDA pour demander des informations sur les périphériques, allouer et désallouer la mémoire des périphériques, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser le langage CUDA C/C++ pour écrire des noyaux qui s'exécutent sur la mémoire GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques CUDA pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire CUDA, tels que les espaces globaux, partagés, constants et locaux, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser le modèle d'exécution CUDA pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes CUDA à l'aide d'outils tels que CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes CUDA à l'aide de techniques telles que le coalescing, la mise en cache, le prefetching et le profilage.
CANN (Compute Architecture for Neural Networks) is Huawei’s AI compute stack for deploying and optimizing AI models on Ascend AI processors.
This instructor-led, live training (online or onsite) is aimed at intermediate-level AI developers and engineers who wish to deploy trained AI models efficiently to Huawei Ascend hardware using the CANN toolkit and tools such as MindSpore, TensorFlow, or PyTorch.
By the end of this training, participants will be able to:
Understand the CANN architecture and its role in the AI deployment pipeline.
Convert and adapt models from popular frameworks to Ascend-compatible formats.
Use tools like ATC, OM model conversion, and MindSpore for edge and cloud inference.
Diagnose deployment issues and optimize performance on Ascend hardware.
Format of the Course
Interactive lecture and demonstration.
Hands-on lab work using CANN tools and Ascend simulators or devices.
Practical deployment scenarios based on real-world AI models.
Course Customization Options
To request a customized training for this course, please contact us to arrange.
Les accélérateurs Biren AI sont des GPU de haute performance conçus pour les charges de travail en IA et HPC, avec un support pour l'entraînement et l'inférence à grande échelle.
Cette formation en direct (en ligne ou sur site) animée par un formateur est destinée aux développeurs intermédiaires à avancés qui souhaitent programmer et optimiser des applications en utilisant la pile GPU propriétaire de Biren, avec des comparaisons pratiques avec les environnements basés sur CUDA.
À la fin de cette formation, les participants seront capables de :
Comprendre l'architecture et la hiérarchie mémoire Biren GPU.
Mettre en place l'environnement de développement et utiliser le modèle de programmation Biren.
Traduire et optimiser des codes au style CUDA pour les plateformes Biren.
Appliquer des techniques d'ajustement de performance et de débogage.
Format du cours permettant d'évaluer les participants
Cours interactif et discussion.
Utilisation pratique de la SDK Biren dans des charges de travail GPU d'exemple.
Exercices guidés axés sur le portage et l'ajustement de performance.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours basée sur votre pile d'applications ou vos besoins d'intégration, veuillez nous contacter pour en faire la demande.
Les Cambricon MLUs (Machine Learning Unités) sont des puces AI spécialisées optimisées pour l'inférence et la formation dans les scénarios de périphérie et de centre de données.
Cette formation en direct (en ligne ou sur site), animée par un formateur, s'adresse aux développeurs intermédiaires souhaitant construire et déployer des modèles AI à l'aide du cadre BANGPy et du SDK Neuware sur le matériel Cambricon MLU.
À la fin de cette formation, les participants seront capables de :
Configurer et configurer les environnements de développement BANGPy et Neuware.
Développer et optimiser des modèles basés sur Python et C++ pour Cambricon MLUs.
Déployer des modèles vers des appareils de périphérie et de centre de données exécutant le runtime Neuware.
Intégrer les flux de travail ML avec des fonctionnalités d'accélération spécifiques à MLU.
Format du cours permettant d'évaluer les participants
Cours interactifs et discussions.
Utilisation pratique de BANGPy et Neuware pour le développement et le déploiement.
Exercices guidés axés sur l'optimisation, l'intégration et les tests.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours basée sur votre modèle d'appareil Cambricon ou votre cas d'utilisation, veuillez nous contacter pour organiser cela.
Introduction à Cambricon et à l'architecture MLU
Aperçu de la gamme de puces AI de Cambricon
Architecture MLU et pipeline d'instructions
Types de modèles pris en charge et cas d'utilisation
Installation du chaînon de développement
Installation de BANGPy et du SDK Neuware
Configuration de l'environnement pour Python et C++
Compatibilité des modèles et prétraitement
Développement de modèles avec BANGPy
Gestion de la structure et de la forme du tenseur
Construction du graphe de calcul
Soutien aux opérations personnalisées dans BANGPy
Déploiement avec le runtime Neuware
Conversion et chargement des modèles
Contrôle d'exécution et d'inférence
Pratiques de déploiement pour périphérie et centre de données
Optimisation des performances
Mappage mémoire et réglage par couche
Suivi d'exécution et profilage
Bouchons courants et corrections
Intégration de MLU dans les applications
Utilisation des API Neuware pour l'intégration d'applications
Soutien au streaming et aux modèles multiples
Scénarios d'inférence hybride CPU-MLU
Projet de bout en bout et Use Case
Laboratoire : déploiement d'un modèle vision ou NLP
Inférence périphérique avec intégration BANGPy
Test de précision et de débit
Récapitulatif et prochaines étapes
Compréhension des structures de modèles d'apprentissage automatique
Expérience avec Python et/ou C++
Familiarité avec les concepts de déploiement et d'accélération des modèles
Audience
Développeurs AI embarqués
Ingénieurs ML déployant sur périphérie ou centre de données
Développeurs travaillant avec l'infrastructure AI chinoise
Cette formation en direct avec instructeur à Lyon (en ligne ou sur site) s'adresse aux administrateurs système débutants et aux professionnels de l'informatique qui souhaitent installer, configurer, gérer et dépanner les environnements CUDA.
A l'issue de cette formation, les participants seront capables de :
Comprendre l'architecture, les composants et les capacités de CUDA.
Installer et configurer les environnements CUDA.
Gérer et optimiser les ressources CUDA.
Déboguer et résoudre les problèmes CUDA les plus courants.
Cette formation en direct dans Lyon (en ligne ou sur site) est destinée aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenCL pour programmer des dispositifs hétérogènes et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Mettre en place un environnement de développement comprenant le SDK OpenCL, un appareil supportant le OpenCL et le code Visual Studio.
Créer un programme OpenCL de base qui effectue une addition vectorielle sur l'appareil et récupère les résultats de la mémoire de l'appareil.
Utiliser l'API OpenCL pour demander des informations sur le périphérique, créer des contextes, des files d'attente de commandes, des tampons, des noyaux et des événements.
Utiliser le langage C OpenCL pour écrire des noyaux qui s'exécutent sur le périphérique et manipulent des données.
Utiliser les fonctions intégrées, les extensions et les bibliothèques OpenCL pour effectuer des tâches et des opérations courantes.
Utiliser les modèles de mémoire de l'hôte et de l'appareil pour optimiser les transferts de données et les accès à la mémoire.
Utiliser le modèle d'exécution OpenCL pour contrôler les éléments de travail, les groupes de travail et les plages ND.
Déboguer et tester les programmes OpenCL à l'aide d'outils tels que CodeXL, Intel VTune et NVIDIA Nsight.
Optimiser les programmes OpenCL en utilisant des techniques telles que la vectorisation, le déroulement des boucles, la mémoire locale et le profilage.
Cette formation dispensée par un instructeur en direct à Lyon (en ligne ou sur site) s'adresse aux développeurs de niveau intermédiaire qui souhaitent utiliser CUDA pour créer des applications Python qui s'exécutent en parallèle sur les NVIDIA GPU.
A l'issue de cette formation, les participants seront capables de :
Utiliser le compilateur Numba pour accélérer les applications Python s'exécutant sur les GPU NVIDIA GPU.
Créer, compiler et lancer des kernels CUDA personnalisés.
Gérer la mémoire des GPU GPU.
Convertir une application basée sur le CPU en une application accélérée par les GPU GPU.
Cette formation en direct, dirigée par un instructeur, couvre la programmation de GPUs pour le calcul parallèle, l'utilisation de diverses plateformes, le travail avec la plateforme CUDA et ses fonctionnalités, et l'exécution de diverses techniques d'optimisation à l'aide de CUDA. Les applications comprennent l'apprentissage profond, l'analyse, le traitement d'images et les applications d'ingénierie.
En savoir plus...
Dernière Mise À Jour:
Nos clients témoignent (2)
Très interactif avec des exemples variés, avec une bonne progression de la complexité entre le début et la fin de la formation.
Jenny - Andheo
Formation - GPU Programming with CUDA and Python
Traduction automatique
L'énergie et l'humour des formateurs.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Graphics Processing Unit (GPU) formation à Lyon, Weekend GPU (Graphics Processing Unit) cours à Lyon, Soir GPU formation à Lyon, Graphics Processing Unit formateur en ligne à Lyon, Graphics Processing Unit formation à Lyon, GPU cours du soir à Lyon, GPU formation Intra à Lyon, GPU (Graphics Processing Unit) formation Intra Entreprise à Lyon, Graphics Processing Unit (GPU) formation Inter à Lyon, GPU formation Inter Entreprise à Lyon, Graphics Processing Unit professeur à Lyon,GPU cours à Lyon, Weekend GPU (Graphics Processing Unit) formation à Lyon, Graphics Processing Unit (GPU) sur place à Lyon, Soir GPU cours à Lyon, GPU (Graphics Processing Unit) cours privé à Lyon, Graphics Processing Unit préparation à Lyon, Graphics Processing Unit formateur à Lyon, GPU stage de préparation à Lyon, Graphics Processing Unit (GPU) coaching à Lyon, Graphics Processing Unit (GPU) cours particuliers à Lyon, GPU entraînement à Lyon, GPU coach à Lyon, GPU préparation aux examens à Lyon, GPU instructeur à Lyon