Formation AMD GPU Programming

ROCm est une plateforme open source pour la programmation GPU qui prend en charge les processeurs AMD GPU et offre également une compatibilité avec CUDA et OpenCL. ROCm expose le programmeur aux détails du matériel et lui donne un contrôle total sur le processus de parallélisation. Cependant, cela nécessite également une bonne compréhension de l'architecture du périphérique, du modèle de mémoire, du modèle d'exécution et des techniques d'optimisation.

HIP est une API d'exécution C++ et un langage de noyau qui vous permet d'écrire un code portable qui peut fonctionner sur les processeurs AMD et NVIDIA GPU. HIP fournit une couche d'abstraction fine sur les API GPU natives, telles que ROCm et CUDA, et vous permet d'exploiter les bibliothèques et outils GPU existants.

Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser ROCm et HIP pour programmer les AMD GPU et exploiter leur parallélisme.

A l'issue de cette formation, les participants seront capables de :

Mettre en place un environnement de développement comprenant la plate-forme ROCm, un code AMD GPU et Visual Studio.
Créer un programme ROCm de base qui effectue une addition vectorielle sur le GPU et récupère les résultats dans la mémoire du GPU.
Utiliser l'API ROCm pour demander des informations sur le périphérique, allouer et désallouer la mémoire du périphérique, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser le langage HIP pour écrire des noyaux qui s'exécutent sur la mémoire GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques HIP pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire ROCm et HIP, tels que les espaces globaux, partagés, constants et locaux, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution ROCm et HIP pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes ROCm et HIP à l'aide d'outils tels que ROCm Debugger et ROCm Profiler.
Optimiser les programmes ROCm et HIP en utilisant des techniques telles que le coalescing, le caching, le prefetching et le profiling.

Format du cours permettant d'évaluer les participants

Exposé et discussion interactifs.
Beaucoup d'exercices et de pratique.
Mise en œuvre pratique dans un environnement live-lab.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Cours à venir

AMD GPU Programming

2025-09-08 09:30

28 Heures

Bordeaux, Mériadeck

4950 EUR (En ligne)

5750 EUR (Salle de Classe)

AMD GPU Programming

2025-09-22 09:30

28 Heures

Grenoble, Centre Ville Proche Gare

4950 EUR (En ligne)

15150 EUR (Salle de Classe)

AMD GPU Programming

2025-10-06 09:30

28 Heures

Poitiers

4950 EUR (En ligne)

5750 EUR (Salle de Classe)

AMD GPU Programming

2025-10-20 09:30

28 Heures

Strasbourg, gare de Kibitzenau

4950 EUR (En ligne)

5750 EUR (Salle de Classe)

Formation AMD GPU Programming

Plan du cours

Pré requis

Cours à venir

AMD GPU Programming

AMD GPU Programming

AMD GPU Programming

AMD GPU Programming

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation AMD GPU Programming

Plan du cours

Pré requis

Cours à venir

AMD GPU Programming

AMD GPU Programming

AMD GPU Programming

AMD GPU Programming

Cours Similaires

Developing AI Applications with Huawei Ascend and CANN

Deploying AI Models with CANN and Ascend AI Processors

GPU Programming on Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Introduction to CANN for AI Framework Developers

CANN for Edge AI Deployment

Understanding Huawei’s AI Compute Stack: From CANN to MindSpore

Optimizing Neural Network Performance with CANN SDK

CANN SDK for Computer Vision and NLP Pipelines

Building Custom AI Operators with CANN TIK and TVM

Migrating CUDA Applications to Chinese GPU Architectures

Performance Optimization on Ascend, Biren, and Cambricon

Catégories Similaires

GPU

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites