Présentation

AMD CDNA™ est l'architecture de calcul dédiée sur laquelle sont basés les GPU et les APU AMD Instinct™. Elle intègre un packaging avancé qui unifie les technologies de chiplet AMD et une mémoire à haute bande passante (HBM), ainsi qu'une architecture Infinity Fabric à haut débit. Elle offre également la technologie avancée Matrix Core, qui prend en charge un ensemble complet de formats de données IA et HPC. Elle est donc conçue pour réduire les frais de transfert des données et améliorer l'efficacité énergétique.

Tableau comparatif des générations :

 

CDNA

CDNA 2

CDNA 3

CDNA 4

Technologie de processus

FinFET 7 nm

FinFET 6 nm

FinFET 5 nm + 6 nm

FinFET 3 nm + 6 nm

Transistors

25,6 milliards

Jusqu'à 58 milliards

Jusqu'à 146 milliards

Jusqu'à 185 milliards

UC | Cœurs matriciels

120 | 440

Jusqu'à 220 | 880

Jusqu'à 304 | 1216

256 | 1024

Type de mémoire

32 Go

HBM2

Jusqu'à 128 Go

HBM2E

Jusqu'à 256 Go

HBM3 | HBM3E

288 Go

HBM3E

Bande passante mémoire (Pic)

1,2 To/s

 Jusqu'à 3,2 To/s

Jusqu'à 6 To/s

8 To/s

AMD Infinity Cache™

N/A

N/A

256 Mo

256 Mo

Cohérence GPU

N/A

Cache

Cache et HBM

Cache et HBM

Types de données pris en charge

INT4, INT8, BF16, FP16, FP32, FP64

INT4, INT8, BF16, FP16, FP32, FP64

INT8, FP8, BF16, FP16, TF32, FP32, FP64 (prise en charge de la parcimonie)

INT4, FP4, FP6, INT8, FP8, BF16, FP16, TF32*, FP32, FP64 (prise en charge de la parcimonie)

Produits

AMD Instinct™ Série MI100

AMD Instinct™ Série MI200

AMD Instinct™ Série MI300

AMD Instinct™ Série MI350

* Prise en charge de TF32 par émulation software.

Avantages

Technologies Matrix Core

AMD CDNA 4 offre des technologies Matrix Core améliorées qui doublent le débit de calcul pour les types de données matriciels basse précision par rapport à l'architecture de génération précédente. AMD CDNA 4 améliore le parallélisme au niveau des instructions, étend le partage des ressources LDS en multipliant par deux la bande passante, et prend en charge un large éventail de précisions qui incluent désormais FP4 et FP6, ainsi que les données de matrice parcimonieuses.

Accélération améliorée de l'IA

AMD CDNA 4 offre de nouvelles fonctionnalités d'accélération améliorée de l'IA pour les LLM, notamment de meilleures performances GEMM avec un temps de latence réduit, une plus grande efficacité énergétique avec les offres base précision, ainsi qu'une flexibilité accrue pour les projets d'IA de précision mixte nécessitant de trouver le juste équilibre entre la précision du modèle, la vitesse et l'efficacité énergétique.  

AI technology concept
Ajouter texte alternatif

Mémoire HBM, cache et cohérence

Les GPU AMD Instinct Série MI300 offrent une capacité de mémoire HBM3e de pointe de 256 Go prenant en charge de plus grandes tailles de modèles avec toute la bande passante nécessaire, ainsi qu'une mémoire partagée et AMD Infinity Cache™ (cache de dernier niveau partagé). Ils éliminent ainsi la copie des données et réduisent le temps de latence.

Structure unifiée

L'architecture AMD Infinity nouvelle génération, associée à la technologie AMD Infinity Fabric™, permet une unification cohérente et à haut débit de la technologie de chiplet GPU d'AMD avec une mémoire HBM3E empilée sur des appareils uniques, ainsi que sur les plateformes hébergeant plusieurs appareils. Elle offre également des E/S améliorées avec une compatibilité PCIe® 5.

Présentation d'AMD CDNA™ 4

AMD CDNA™ 4 est l'architecture de calcul dédiée sur laquelle sont basés les GPU AMD Instinct™ Série MI350. Elle offre des technologies de packaging avancées associées à des chiplets et conçues pour réduire les frais de déplacement des données et améliorer l'efficacité énergétique.

AMD Instinct MI350 Series

GPU AMD Instinct Série MI350

AMD CDNA 3

AMD CDNA 3 est l'architecture de calcul dédiée sur laquelle sont basés les GPU AMD Instinct™ Série MI300. Elle offre des technologies de packaging avancées associées à des chiplets et conçues pour réduire les frais de déplacement des données et améliorer l'efficacité énergétique.

APU AMD Instinct MI300A

GPU AMD Instinct MI325X

Ajouter texte alternatif

AMD CDNA 2

L'architecture AMD CDNA 2 est conçue pour accélérer les charges de travail de calcul scientifique et les applications d'apprentissage automatique les plus exigeantes. Elle sert de base aux GPU AMD Instinct Série MI200.

AMD CDNA

AMD CDNA est une architecture dédiée pour le calcul basé sur GPU, conçue pour marquer les débuts du calcul de classe exascale. Elle sert de base aux GPU AMD Instinct Série MI100.

Ajouter texte alternatif

Accélérateurs AMD Instinct

Découvrez comment les GPU AMD Instinct établissent de nouvelles normes en matière d'IA générative, d'entraînement et de HPC.

Software AMD ROCm™

L'architecture AMD CDNA est prise en charge par AMD ROCm™, une pile software ouverte qui inclut un large éventail de modèles de programmation, d'outils, de compilateurs, de bibliothèques et d'exécutions pour les GPU AMD Instinct dédiés au développement de solutions d'IA et de HPC.