
Présentation
AMD CDNA™ est l'architecture de calcul dédiée sur laquelle sont basés les GPU et les APU AMD Instinct™. Elle intègre un packaging avancé qui unifie les technologies de chiplet AMD et une mémoire à haute bande passante (HBM), ainsi qu'une architecture Infinity Fabric à haut débit. Elle offre également la technologie avancée Matrix Core, qui prend en charge un ensemble complet de formats de données IA et HPC. Elle est donc conçue pour réduire les frais de transfert des données et améliorer l'efficacité énergétique.
Tableau comparatif des générations :
|
CDNA |
CDNA 2 |
CDNA 3 |
CDNA 4 |
Technologie de processus |
FinFET 7 nm |
FinFET 6 nm |
FinFET 5 nm + 6 nm |
FinFET 3 nm + 6 nm |
Transistors |
25,6 milliards |
Jusqu'à 58 milliards |
Jusqu'à 146 milliards |
Jusqu'à 185 milliards |
UC | Cœurs matriciels |
120 | 440 |
Jusqu'à 220 | 880 |
Jusqu'à 304 | 1216 |
256 | 1024 |
Type de mémoire |
32 Go HBM2 |
Jusqu'à 128 Go HBM2E |
Jusqu'à 256 Go HBM3 | HBM3E |
288 Go HBM3E |
Bande passante mémoire (Pic) |
1,2 To/s |
Jusqu'à 3,2 To/s |
Jusqu'à 6 To/s |
8 To/s |
AMD Infinity Cache™ |
N/A |
N/A |
256 Mo |
256 Mo |
Cohérence GPU |
N/A |
Cache |
Cache et HBM |
Cache et HBM |
Types de données pris en charge |
INT4, INT8, BF16, FP16, FP32, FP64 |
INT4, INT8, BF16, FP16, FP32, FP64 |
INT8, FP8, BF16, FP16, TF32, FP32, FP64 (prise en charge de la parcimonie) |
INT4, FP4, FP6, INT8, FP8, BF16, FP16, TF32*, FP32, FP64 (prise en charge de la parcimonie) |
Produits |
AMD Instinct™ Série MI100 |
AMD Instinct™ Série MI200 |
AMD Instinct™ Série MI300 |
AMD Instinct™ Série MI350 |
* Prise en charge de TF32 par émulation software.

Avantages
Technologies Matrix Core
AMD CDNA 4 offre des technologies Matrix Core améliorées qui doublent le débit de calcul pour les types de données matriciels basse précision par rapport à l'architecture de génération précédente. AMD CDNA 4 améliore le parallélisme au niveau des instructions, étend le partage des ressources LDS en multipliant par deux la bande passante, et prend en charge un large éventail de précisions qui incluent désormais FP4 et FP6, ainsi que les données de matrice parcimonieuses.
Accélération améliorée de l'IA
AMD CDNA 4 offre de nouvelles fonctionnalités d'accélération améliorée de l'IA pour les LLM, notamment de meilleures performances GEMM avec un temps de latence réduit, une plus grande efficacité énergétique avec les offres base précision, ainsi qu'une flexibilité accrue pour les projets d'IA de précision mixte nécessitant de trouver le juste équilibre entre la précision du modèle, la vitesse et l'efficacité énergétique.


Mémoire HBM, cache et cohérence
Les GPU AMD Instinct Série MI300 offrent une capacité de mémoire HBM3e de pointe de 256 Go prenant en charge de plus grandes tailles de modèles avec toute la bande passante nécessaire, ainsi qu'une mémoire partagée et AMD Infinity Cache™ (cache de dernier niveau partagé). Ils éliminent ainsi la copie des données et réduisent le temps de latence.

Structure unifiée
L'architecture AMD Infinity nouvelle génération, associée à la technologie AMD Infinity Fabric™, permet une unification cohérente et à haut débit de la technologie de chiplet GPU d'AMD avec une mémoire HBM3E empilée sur des appareils uniques, ainsi que sur les plateformes hébergeant plusieurs appareils. Elle offre également des E/S améliorées avec une compatibilité PCIe® 5.
Présentation d'AMD CDNA™ 4
AMD CDNA™ 4 est l'architecture de calcul dédiée sur laquelle sont basés les GPU AMD Instinct™ Série MI350. Elle offre des technologies de packaging avancées associées à des chiplets et conçues pour réduire les frais de déplacement des données et améliorer l'efficacité énergétique.

GPU AMD Instinct Série MI350



AMD CDNA 3
AMD CDNA 3 est l'architecture de calcul dédiée sur laquelle sont basés les GPU AMD Instinct™ Série MI300. Elle offre des technologies de packaging avancées associées à des chiplets et conçues pour réduire les frais de déplacement des données et améliorer l'efficacité énergétique.
APU AMD Instinct MI300A

GPU AMD Instinct MI325X



AMD CDNA 2
L'architecture AMD CDNA 2 est conçue pour accélérer les charges de travail de calcul scientifique et les applications d'apprentissage automatique les plus exigeantes. Elle sert de base aux GPU AMD Instinct Série MI200.
AMD CDNA
AMD CDNA est une architecture dédiée pour le calcul basé sur GPU, conçue pour marquer les débuts du calcul de classe exascale. Elle sert de base aux GPU AMD Instinct Série MI100.


Accélérateurs AMD Instinct
Découvrez comment les GPU AMD Instinct établissent de nouvelles normes en matière d'IA générative, d'entraînement et de HPC.

Software AMD ROCm™
L'architecture AMD CDNA est prise en charge par AMD ROCm™, une pile software ouverte qui inclut un large éventail de modèles de programmation, d'outils, de compilateurs, de bibliothèques et d'exécutions pour les GPU AMD Instinct dédiés au développement de solutions d'IA et de HPC.