Übersicht

Die AMD CDNA™ Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ GPUs und APUs dient. Sie verfügt über ein fortschrittliches Gehäuse, das AMD Chiplet-Technologien und High-Bandwidth-Memory (HBM), eine Infinity Architecture Fabric mit hohem Durchsatz, vereint, und bietet fortschrittliche Matrix Core Technologie, die eine umfassende Reihe von KI- und HPC-Datenformaten unterstützt. So wird der Overhead für Datenbewegungen reduziert und die Energieeffizienz erhöht.

Vergleich der Generationen im Tabellenformat:

 

CDNA

CDNA 2

CDNA 3

CDNA 4

Prozesstechnologie

7 nm FinFET

6 nm FinFET

5 nm + 6 nm FinFET

3 nm + 6 nm FinFET

Transistoren

25,6 Milliarden

Bis zu 58 Milliarden

Bis zu 146 Milliarden

Bis zu 185 Milliarden

CUs | Matrixkerne

120 | 440

Bis zu 220 | 880

Bis zu 304 | 1216

256 | 1024

Speichertyp

32 GB

HBM2

Bis zu 128 GB

HBM2E

Bis zu 256 GB

HBM3 | HBM3E

288 GB

HBM3E

Speicherbandbreite (Spitze)

1,2 TB/s

 Bis zu 3,2 TB/s

Bis zu 6 TB/s

8 TB/s

AMD Infinity Cache™

k. A.

k. A.

256 MB

256 MB

GPU-Kohärenz

k. A.

Cache

Cache und HBM

Cache und HBM

Unterstützung für Datentypen

INT4, INT8, BF16, FP16, FP32, FP64

INT4, INT8, BF16, FP16, FP32, FP64

INT8, FP8, BF16, FP16, TF32, FP32, FP64 (Unterstützung von Sparsity)

INT4, FP4, FP6, INT8, FP8, BF16, FP16, TF32*, FP32, FP64 (Unterstützung von Sparsity)

Produkte

AMD Instinct™ MI100-Serie

AMD Instinct™ MI200-Serie

AMD Instinct™ MI300-Serie

AMD Instinct™ MI350-Serie

* TF32 wird von der Softwareemulation unterstützt.

Vorteile

Matrix-Core-Technologien

AMD CDNA 4 bietet erweiterte Matrix Core Technologien, die den Rechendurchsatz für Matrix-Datentypen mit geringer Präzision im Vergleich zur Architektur der vorherigen Generation verdoppeln. AMD CDNA 4 bietet verbesserte Parallelität auf Anweisungsebene, erweitert gemeinsam genutzte LDS-Ressourcen mit doppelter Bandbreite und unterstützt eine breite Palette von Genauigkeiten, die jetzt FP4 und FP6 sowie Sparse-Matrix-Daten (d. h. Sparsity) umfassen.

Verbesserte KI-Beschleunigung

AMD CDNA 4 bietet neue verbesserte KI-Beschleunigungsfunktionen für LLMs, darunter verbesserte GEMM-Performance mit reduzierter Latenz, Energieeffizienz mit Angeboten mit geringerer Genauigkeit und mehr Flexibilität für KI-Projekte mit gemischter Genauigkeit, die auf der Abstimmung zwischen Modellgenauigkeit, Geschwindigkeit oder Energieeffizienz basieren.  

AI technology concept
Alternativtext hinzufügen

HBM Speicher, Cache und Kohärenz

AMD Instinct MI350-Serie GPUs bieten eine branchenführende HBM3E-Speicherkapazität von 256 GB zur Unterstützung größerer Modelle mit der erforderlichen Bandbreite sowie einen gemeinsam genutzten Speicher und AMD Infinity Cache™ (gemeinsam genutzter Last-Level-Cache), wodurch Datenkopien entfallen und die Latenz verbessert wird.

Vereinheitlichtes Fabric

Die AMD Infinity Architektur der nächsten Generation zusammen mit der AMD Infinity Fabric™ Technologie ermöglicht eine kohärente, durchsatzstarke Vereinheitlichung der AMD GPU Chiplet-Technologie mit gestapeltem HBM3E-Speicher in einzelnen Geräten und über Plattformen mit mehreren Geräten hinweg. Sie bietet auch erweiterten E/A mit PCIe® 5 Kompatibilität.

Wir stellen vor: AMD CDNA™ 4

AMD CDNA™ 4 ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI350-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.

AMD Instinct MI350 Series

AMD Instinct MI350-Serie GPUs

AMD CDNA 3

Die AMD CDNA 3 Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI300-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.

AMD Instinct MI300A APU

AMD Instinct MI325X GPU

Alternativtext hinzufügen

AMD CDNA 2

Die AMD CDNA 2 Architektur ist für die anspruchsvollsten wissenschaftlichen Computing-Auslastungen und Anwendungen für maschinelles Lernen konzipiert. Sie basiert auf den AMD Instinct MI200-Serie GPUs.

AMD CDNA

Die AMD CDNA Architektur ist eine dedizierte Architektur für GPU-basiertes Computing, die entwickelt wurde, um die Ära des Exascale-Computings einzuläuten. Sie basiert auf den AMD Instinct MI100-Serie GPUs.

Alternativtext hinzufügen

AMD Instinct Beschleuniger

Erfahren Sie, wie AMD Instinct GPUs neue Standards für generative KI, Training und HPC setzen.

AMD ROCm™ Software

Die AMD CDNA Architektur wird durch die AMD ROCm™ Software unterstützt, einen offenen Software-Stack, der zahlreiche Programmiermodelle, Tools, Compiler, Bibliotheken und Laufzeiten für die Entwicklung von KI- und HPC-Lösungen für AMD Instinct GPUs beinhaltet.