Formation Programmation GPU - OpenCL vs CUDA vs ROCm

La programmation GPU est une technique qui exploite la puissance de traitement parallèle des GPUs pour accélérer les applications nécessitant un calcul haute performance, telles que l'intelligence artificielle, le jeu vidéo, la création graphique et le calcul scientifique. Il existe plusieurs frameworks permettant la programmation GPU, chacun avec ses avantages et inconvénients. OpenCL est une norme ouverte qui peut être utilisée pour programmer des CPU, des GPU et d'autres appareils de différents fabricants, tandis que CUDA est spécifique aux GPUs NVIDIA. ROCm est une plateforme qui prend en charge la programmation GPU sur les cartes AMD, et offre également une compatibilité avec CUDA et OpenCL.

Cette formation dirigée par un instructeur (en ligne ou sur site) s'adresse aux développeurs débutants à intermédiaires qui souhaitent utiliser différents frameworks pour la programmation GPU et comparer leurs fonctionnalités, performances et compatibilités.

À la fin de cette formation, les participants seront capables de :

Configurer un environnement de développement comprenant le SDK OpenCL, le CUDA Toolkit, la plateforme ROCm, un appareil qui supporte OpenCL, CUDA ou ROCm, et Visual Studio Code.
Créer un programme GPU de base qui effectue une addition vectorielle en utilisant OpenCL, CUDA et ROCm, et comparer la syntaxe, la structure et l'exécution de chaque framework.
Utiliser les API respectives pour interroger les informations sur l'appareil, allouer et libérer la mémoire de l'appareil, copier des données entre l'hôte et l'appareil, lancer des noyaux (kernels) et synchroniser les threads.
Utiliser les langages respectifs pour écrire des noyaux qui s'exécutent sur l'appareil et manipulent les données.
Utiliser les fonctions, variables et bibliothèques intégrées respectives pour effectuer des tâches et opérations courantes.
Utiliser les espaces mémoire respectifs, tels que global, local, constant et privé, pour optimiser les transferts de données et les accès en mémoire.
Utiliser les modèles d'exécution respectifs pour contrôler les threads, blocs et grilles qui définissent le parallélisme.
Déboguer et tester des programmes GPU en utilisant des outils tels que CodeXL, CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes GPU en utilisant des techniques telles que la coalescence, le cache, le prefetching et le profiling.

Format de la formation

Conférence interactive et discussion.
De nombreux exercices et pratiques.
Mise en œuvre pratique dans un environnement de laboratoire en direct.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.

Strasbourg, Kibitzenau Station

4950 EUR (En ligne)

5750 EUR (Salle de Classe)

Formation Programmation GPU - OpenCL vs CUDA vs ROCm

Plan du cours

Pré requis

Cours à venir

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation Programmation GPU - OpenCL vs CUDA vs ROCm

Plan du cours

Pré requis

Cours à venir

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Programmation GPU - OpenCL vs CUDA vs ROCm

Cours Similaires

Développement d'applications IA avec Huawei Ascend et CANN

Déploiement de modèles AI avec CANN et processeurs Ascend AI

GPU Programming sur les Accélérateurs AI Biren

Cambricon MLU Development with BANGPy and Neuware

Introduction à CANN pour les développeurs de frameworks IA

CANN pour Edge AI Déploiement

Comprendre la pile de calcul AI de Huawei : De CANN à MindSpore

Optimisation des performances des réseaux de neurones avec le SDK CANN

CANN SDK pour Computer Vision et les pipelines de traitement du langage naturel (NLP)

Construction d'opérateurs AI personnalisés avec CANN TIK et TVM

Migrer les applications CUDA vers les architectures GPU chinoises

Performance Optimization on Ascend, Biren, and Cambricon

Catégories Similaires

GPU

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites