
Übersicht
Die AMD CDNA™ Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ GPUs und APUs dient. Sie verfügt über ein fortschrittliches Gehäuse, das AMD Chiplet-Technologien und High-Bandwidth-Memory (HBM), eine Infinity Architecture Fabric mit hohem Durchsatz, vereint, und bietet fortschrittliche Matrix Core Technologie, die eine umfassende Reihe von KI- und HPC-Datenformaten unterstützt. So wird der Overhead für Datenbewegungen reduziert und die Energieeffizienz erhöht.
Vergleich der Generationen im Tabellenformat:
|
CDNA |
CDNA 2 |
CDNA 3 |
CDNA 4 |
Prozesstechnologie |
7 nm FinFET |
6 nm FinFET |
5 nm + 6 nm FinFET |
3 nm + 6 nm FinFET |
Transistoren |
25,6 Milliarden |
Bis zu 58 Milliarden |
Bis zu 146 Milliarden |
Bis zu 185 Milliarden |
CUs | Matrixkerne |
120 | 440 |
Bis zu 220 | 880 |
Bis zu 304 | 1216 |
256 | 1024 |
Speichertyp |
32 GB HBM2 |
Bis zu 128 GB HBM2E |
Bis zu 256 GB HBM3 | HBM3E |
288 GB HBM3E |
Speicherbandbreite (Spitze) |
1,2 TB/s |
Bis zu 3,2 TB/s |
Bis zu 6 TB/s |
8 TB/s |
AMD Infinity Cache™ |
k. A. |
k. A. |
256 MB |
256 MB |
GPU-Kohärenz |
k. A. |
Cache |
Cache und HBM |
Cache und HBM |
Unterstützung für Datentypen |
INT4, INT8, BF16, FP16, FP32, FP64 |
INT4, INT8, BF16, FP16, FP32, FP64 |
INT8, FP8, BF16, FP16, TF32, FP32, FP64 (Unterstützung von Sparsity) |
INT4, FP4, FP6, INT8, FP8, BF16, FP16, TF32*, FP32, FP64 (Unterstützung von Sparsity) |
Produkte |
AMD Instinct™ MI100-Serie |
AMD Instinct™ MI200-Serie |
AMD Instinct™ MI300-Serie |
AMD Instinct™ MI350-Serie |
* TF32 wird von der Softwareemulation unterstützt.

Vorteile
Matrix-Core-Technologien
AMD CDNA 4 bietet erweiterte Matrix Core Technologien, die den Rechendurchsatz für Matrix-Datentypen mit geringer Präzision im Vergleich zur Architektur der vorherigen Generation verdoppeln. AMD CDNA 4 bietet verbesserte Parallelität auf Anweisungsebene, erweitert gemeinsam genutzte LDS-Ressourcen mit doppelter Bandbreite und unterstützt eine breite Palette von Genauigkeiten, die jetzt FP4 und FP6 sowie Sparse-Matrix-Daten (d. h. Sparsity) umfassen.
Verbesserte KI-Beschleunigung
AMD CDNA 4 bietet neue verbesserte KI-Beschleunigungsfunktionen für LLMs, darunter verbesserte GEMM-Performance mit reduzierter Latenz, Energieeffizienz mit Angeboten mit geringerer Genauigkeit und mehr Flexibilität für KI-Projekte mit gemischter Genauigkeit, die auf der Abstimmung zwischen Modellgenauigkeit, Geschwindigkeit oder Energieeffizienz basieren.


HBM Speicher, Cache und Kohärenz
AMD Instinct MI350-Serie GPUs bieten eine branchenführende HBM3E-Speicherkapazität von 256 GB zur Unterstützung größerer Modelle mit der erforderlichen Bandbreite sowie einen gemeinsam genutzten Speicher und AMD Infinity Cache™ (gemeinsam genutzter Last-Level-Cache), wodurch Datenkopien entfallen und die Latenz verbessert wird.

Vereinheitlichtes Fabric
Die AMD Infinity Architektur der nächsten Generation zusammen mit der AMD Infinity Fabric™ Technologie ermöglicht eine kohärente, durchsatzstarke Vereinheitlichung der AMD GPU Chiplet-Technologie mit gestapeltem HBM3E-Speicher in einzelnen Geräten und über Plattformen mit mehreren Geräten hinweg. Sie bietet auch erweiterten E/A mit PCIe® 5 Kompatibilität.
Wir stellen vor: AMD CDNA™ 4
AMD CDNA™ 4 ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI350-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.

AMD Instinct MI350-Serie GPUs



AMD CDNA 3
Die AMD CDNA 3 Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI300-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.
AMD Instinct MI300A APU

AMD Instinct MI325X GPU



AMD CDNA 2
Die AMD CDNA 2 Architektur ist für die anspruchsvollsten wissenschaftlichen Computing-Auslastungen und Anwendungen für maschinelles Lernen konzipiert. Sie basiert auf den AMD Instinct MI200-Serie GPUs.
AMD CDNA
Die AMD CDNA Architektur ist eine dedizierte Architektur für GPU-basiertes Computing, die entwickelt wurde, um die Ära des Exascale-Computings einzuläuten. Sie basiert auf den AMD Instinct MI100-Serie GPUs.


AMD Instinct Beschleuniger
Erfahren Sie, wie AMD Instinct GPUs neue Standards für generative KI, Training und HPC setzen.

AMD ROCm™ Software
Die AMD CDNA Architektur wird durch die AMD ROCm™ Software unterstützt, einen offenen Software-Stack, der zahlreiche Programmiermodelle, Tools, Compiler, Bibliotheken und Laufzeiten für die Entwicklung von KI- und HPC-Lösungen für AMD Instinct GPUs beinhaltet.