Übersicht

Die AMD CDNA™ Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ GPUs und APUs dient. Sie verfügt über ein fortschrittliches Gehäuse, das AMD Chiplet-Technologien und High-Bandwidth-Memory (HBM), eine Infinity Architecture Fabric mit hohem Durchsatz, vereint, und bietet fortschrittliche Matrix Core Technologie, die eine umfassende Reihe von KI- und HPC-Datenformaten unterstützt. So wird der Overhead für Datenbewegungen reduziert und die Energieeffizienz erhöht.

Vergleich der Generationen im Tabellenformat:

  CDNA CDNA 2 CDNA 3 CDNA 4
Prozesstechnologie 7 nm FinFET 6 nm FinFET 5 nm + 6 nm FinFET 3 nm + 6 nm FinFET
Transistoren 25,6 Milliarden Bis zu 58 Milliarden Bis zu 146 Milliarden Bis zu 185 Milliarden
CUs | Matrixkerne 120 | 440 Bis zu 220 | 880 Bis zu 304 | 1216 256 | 1024
Speichertyp 32 GB HBM2 Bis zu 128 GB HBM2E Bis zu 256 GB HBM3 | HBM3E 288 GB HBM3E
Speicherbandbreite (Spitze) 1,2 TB/s  Bis zu 3,2 TB/s Bis zu 6 TB/s 8 TB/s
AMD Infinity Cache™ k. A. k. A. 256 MB 256 MB
GPU-Kohärenz k. A. Cache Cache und HBM Cache und HBM
Unterstützung für Datentypen INT4, INT8, BF16, FP16, FP32, FP64 INT4, INT8, BF16, FP16, FP32, FP64 Matrix: INT8, FP8, BF16, FP16, TF32, FP32, FP64
Vektor: FP16, FP32, FP64
Sparsity: INT8, FP8, BF16, FP16
Matrix: MXFP4, MXFP6, INT8, MXFP8, OCP FP8, BF16, FP16, TF32*, FP32, FP64
Vektor: FP16, FP32, FP64
Sparsity: OCP-FP8, INT8, FP16, BF16
Produkte AMD Instinct™ MI100-Serie AMD Instinct™ MI200-Serie AMD Instinct™ MI300-Serie AMD Instinct™ MI350-Serie

* TF32 wird von der Softwareemulation unterstützt.

Vorteile

Matrix-Core-Technologien

AMD CDNA 4 bietet erweiterte Matrix Core Technologien, die den Rechendurchsatz für Matrix-Datentypen mit geringer Präzision im Vergleich zur Architektur der vorherigen Generation verdoppeln. AMD CDNA 4 bietet verbesserte Parallelität auf Anweisungsebene, erweitert gemeinsam genutzte LDS-Ressourcen mit doppelter Bandbreite und unterstützt eine breite Palette von Genauigkeiten, die jetzt MXFP4 und MXFP6 sowie Unterstützung von Sparse-Matrix-Daten (d. h. Sparsity) für OCP-FP8, INT8, FP16 und BF16 umfassen.

Verbesserte KI-Beschleunigung

AMD CDNA 4 bietet neue verbesserte KI-Beschleunigungsfunktionen für LLMs, darunter verbesserte GEMM-Performance mit reduzierter Latenz, Energieeffizienz mit Angeboten mit geringerer Genauigkeit und mehr Flexibilität für KI-Projekte mit gemischter Genauigkeit, die auf der Abstimmung zwischen Modellgenauigkeit, Geschwindigkeit oder Energieeffizienz basieren.  

AI technology concept
Alternativtext hinzufügen

HBM Speicher, Cache und Kohärenz

AMD Instinct MI350-Serie GPUs bieten eine branchenführende HBM3E-Speicherkapazität von 256 GB zur Unterstützung größerer Modelle mit der erforderlichen Bandbreite sowie einen gemeinsam genutzten Speicher und AMD Infinity Cache™ (gemeinsam genutzter Last-Level-Cache), wodurch Datenkopien entfallen und die Latenz verbessert wird.

Vereinheitlichtes Fabric

Die AMD Infinity Architektur der nächsten Generation zusammen mit der AMD Infinity Fabric™ Technologie ermöglicht eine kohärente, durchsatzstarke Vereinheitlichung der AMD GPU Chiplet-Technologie mit gestapeltem HBM3E-Speicher in einzelnen Geräten und über Plattformen mit mehreren Geräten hinweg. Sie bietet auch erweiterten E/A mit PCIe® 5 Kompatibilität.

Wir stellen vor: AMD CDNA™ 4

AMD CDNA™ 4 ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI350-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.

AMD Instinct MI350 Series

AMD Instinct MI350-Serie GPUs

AMD CDNA 3

Die AMD CDNA 3 Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI300-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.

AMD Instinct MI300A APU

AMD Instinct MI325X GPU

Alternativtext hinzufügen

AMD CDNA 2

Die AMD CDNA 2 Architektur ist für die anspruchsvollsten wissenschaftlichen Computing-Auslastungen und Anwendungen für maschinelles Lernen konzipiert. Sie basiert auf den AMD Instinct MI200-Serie GPUs.

AMD CDNA

Die AMD CDNA Architektur ist eine dedizierte Architektur für GPU-basiertes Computing, die entwickelt wurde, um die Ära des Exascale-Computings einzuläuten. Sie basiert auf den AMD Instinct MI100-Serie GPUs.

Alternativtext hinzufügen

AMD Instinct Beschleuniger

Erfahren Sie, wie AMD Instinct GPUs neue Standards für generative KI, Training und HPC setzen.

AMD ROCm™ Software

Die AMD CDNA Architektur wird durch die AMD ROCm™ Software unterstützt, einen offenen Software-Stack, der zahlreiche Programmiermodelle, Tools, Compiler, Bibliotheken und Laufzeiten für die Entwicklung von KI- und HPC-Lösungen für AMD Instinct GPUs beinhaltet.