AMD CDNA™ Architektur

Übersicht

Die AMD CDNA™ Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ GPUs und APUs dient. Sie verfügt über ein fortschrittliches Gehäuse, das AMD Chiplet-Technologien und High-Bandwidth-Memory (HBM), eine Infinity Architecture Fabric mit hohem Durchsatz, vereint, und bietet fortschrittliche Matrix Core Technologie, die eine umfassende Reihe von KI- und HPC-Datenformaten unterstützt. So wird der Overhead für Datenbewegungen reduziert und die Energieeffizienz erhöht.

Vergleich der Generationen im Tabellenformat:

	CDNA	CDNA 2	CDNA 3	CDNA 4
Prozesstechnologie	7 nm FinFET	6 nm FinFET	5 nm + 6 nm FinFET	3 nm + 6 nm FinFET
Transistoren	25,6 Milliarden	Bis zu 58 Milliarden	Bis zu 146 Milliarden	Bis zu 185 Milliarden
CUs \| Matrixkerne	120 \| 440	Bis zu 220 \| 880	Bis zu 304 \| 1216	256 \| 1024
Speichertyp	32 GB HBM2	Bis zu 128 GB HBM2E	Bis zu 256 GB HBM3 \| HBM3E	288 GB HBM3E
Speicherbandbreite (Spitze)	1,2 TB/s	Bis zu 3,2 TB/s	Bis zu 6 TB/s	8 TB/s
AMD Infinity Cache™	k. A.	k. A.	256 MB	256 MB
GPU-Kohärenz	k. A.	Cache	Cache und HBM	Cache und HBM
Unterstützung für Datentypen	INT4, INT8, BF16, FP16, FP32, FP64	INT4, INT8, BF16, FP16, FP32, FP64	Matrix: INT8, FP8, BF16, FP16, TF32, FP32, FP64 Vektor: FP16, FP32, FP64 Sparsity: INT8, FP8, BF16, FP16	Matrix: MXFP4, MXFP6, INT8, MXFP8, OCP FP8, BF16, FP16, TF32, FP32, FP64 Vektor:* FP16, FP32, FP64 Sparsity: OCP-FP8, INT8, FP16, BF16
Produkte	AMD Instinct™ MI100-Serie	AMD Instinct™ MI200-Serie	AMD Instinct™ MI300-Serie	AMD Instinct™ MI350-Serie

* TF32 wird von der Softwareemulation unterstützt.

Vorteile

Matrix-Core-Technologien

AMD CDNA 4 bietet erweiterte Matrix Core Technologien, die den Rechendurchsatz für Matrix-Datentypen mit geringer Präzision im Vergleich zur Architektur der vorherigen Generation verdoppeln. AMD CDNA 4 bietet verbesserte Parallelität auf Anweisungsebene, erweitert gemeinsam genutzte LDS-Ressourcen mit doppelter Bandbreite und unterstützt eine breite Palette von Genauigkeiten, die jetzt MXFP4 und MXFP6 sowie Unterstützung von Sparse-Matrix-Daten (d. h. Sparsity) für OCP-FP8, INT8, FP16 und BF16 umfassen.

Verbesserte KI-Beschleunigung

AMD CDNA 4 bietet neue verbesserte KI-Beschleunigungsfunktionen für LLMs, darunter verbesserte GEMM-Performance mit reduzierter Latenz, Energieeffizienz mit Angeboten mit geringerer Genauigkeit und mehr Flexibilität für KI-Projekte mit gemischter Genauigkeit, die auf der Abstimmung zwischen Modellgenauigkeit, Geschwindigkeit oder Energieeffizienz basieren.

HBM Speicher, Cache und Kohärenz

AMD Instinct MI350-Serie GPUs bieten eine branchenführende HBM3E-Speicherkapazität von 256 GB zur Unterstützung größerer Modelle mit der erforderlichen Bandbreite sowie einen gemeinsam genutzten Speicher und AMD Infinity Cache™ (gemeinsam genutzter Last-Level-Cache), wodurch Datenkopien entfallen und die Latenz verbessert wird.

Vereinheitlichtes Fabric

Die AMD Infinity Architektur der nächsten Generation zusammen mit der AMD Infinity Fabric™ Technologie ermöglicht eine kohärente, durchsatzstarke Vereinheitlichung der AMD GPU Chiplet-Technologie mit gestapeltem HBM3E-Speicher in einzelnen Geräten und über Plattformen mit mehreren Geräten hinweg. Sie bietet auch erweiterten E/A mit PCIe® 5 Kompatibilität.

Wir stellen vor: AMD CDNA™ 4

AMD CDNA™ 4 ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI350-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.

Whitepaper lesen

AMD Instinct MI350-Serie GPUs

curved transparent to black top gradient divider

AMD CDNA 3

Die AMD CDNA 3 Architektur ist die dedizierte Computing-Architektur, die als Grundlage der AMD Instinct™ MI300-Serie GPUs dient. Sie beinhaltet ein fortschrittliches Paket mit Chiplet-Technologien – entwickelt, um den Overhead bei der Datenübertragung zu verringern und die Energieeffizienz zu verbessern.

Whitepaper lesen

AMD Instinct MI300A APU

AMD Instinct MI325X GPU

AMD CDNA 2

Die AMD CDNA 2 Architektur ist für die anspruchsvollsten wissenschaftlichen Computing-Auslastungen und Anwendungen für maschinelles Lernen konzipiert. Sie basiert auf den AMD Instinct MI200-Serie GPUs.

Whitepaper lesen

AMD CDNA

Die AMD CDNA Architektur ist eine dedizierte Architektur für GPU-basiertes Computing, die entwickelt wurde, um die Ära des Exascale-Computings einzuläuten. Sie basiert auf den AMD Instinct MI100-Serie GPUs.

Whitepaper lesen

AMD Instinct Beschleuniger

Erfahren Sie, wie AMD Instinct GPUs neue Standards für generative KI, Training und HPC setzen.

Instinct entdecken

AMD ROCm™ Software

Die AMD CDNA Architektur wird durch die AMD ROCm™ Software unterstützt, einen offenen Software-Stack, der zahlreiche Programmiermodelle, Tools, Compiler, Bibliotheken und Laufzeiten für die Entwicklung von KI- und HPC-Lösungen für AMD Instinct GPUs beinhaltet.

Über ROCm

ROCm Entwickler-Hub

Rechenzentrum

Business-Systeme

Personal Computing und Gaming

Embedded

Ressourcen

GPU-Beschleuniger

Adaptive Beschleuniger

DPU-Beschleuniger

Ethernet-Adapter

Workstations

Desktops

Notebooks

Ressourcen

FPGAs und adaptive SoCs

Systemmodule (SOMs)

Technologien

Ressourcen für Entwickler

Probeplatinen und Bausätze

Prozessor-Tools

Grafik-Tools und -Apps

Tools für FPGAs und adaptive SoCs

Urheberrechte und Apps

Tools und Apps für GPU-Beschleuniger

Ethernet-Adapter-Tools

Übersicht

Für Rechenzentren und die Cloud

Für Edge und Endpunkte

Für Entwickler

Branchen

Branchen

Branchen

Branchen

Industrias

Einsatzbereiche

Gaming

Systeme

Technologien

Ressourcen

EPYC Prozessoren

Radeon GPUs und AMD Chipsätze

FPGAs und adaptive SoCs

Alveo-Beschleuniger & Kria-SOMs

Ryzen Prozessoren

Ethernet-Adapter

Übersicht

Prozessoren

Beschleuniger

Embedded Produkte

Grafikprodukte

Übersicht

Ressourcen nach Produkt

Ressourcen nach Typ

Über unsere Partner

Weltweiter AMD Support

Prozessoren und Grafikprodukte

Beschleuniger

FPGAs und adaptive SoCs

Gaming und Personal Computing

Adaptive und Embedded Computing

Get AMD Fan Gear

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

AMD CDNA™ Architektur

Übersicht

Vorteile

Matrix-Core-Technologien

Verbesserte KI-Beschleunigung

HBM Speicher, Cache und Kohärenz

Vereinheitlichtes Fabric

Wir stellen vor: AMD CDNA™ 4

AMD Instinct MI350-Serie GPUs

Speicherkapazität und -bandbreite

Matrix-Core-Technologien

GPU- und Speichervereinheitlichung

Infinity Architektur

Beschleunigter Computing-Mikrochip (XCD)

AMD CDNA 3