-
GPU-Architektur
-
CDNA4
-
Lithografie
-
TSMC 3nm | 6nm FinFET
-
Stream-Prozessoren
-
16,384
-
Matrix-Kerne
-
1024
-
Recheneinheiten
-
256
-
Max. Speichertakt
-
2200 MHz
-
Max. Matrix-Performance bei Vier-Bit-Genauigkeit und Mikroskalierung
(MXFP4)
-
9.2 PFLOPs
-
Max. Matrix-Performance bei Sechs-Bit-Genauigkeit und Mikroskalierung
(MXFP6)
-
9.2 PFLOPs
-
Max. Matrix-Performance bei Acht-Bit-Genauigkeit und Mikroskalierung
(MXFP8)
-
4.6 PFLOPs
-
Maximale Open-Compute-Projekt Matrix-Performance bei Acht-Bit-Genauigkeit
(OCP FP8) (E5M2, E4M3)
-
4.6 PFLOPs
-
Max. Open-Compute-Projekt Matrix-Performance bei bei Acht-Bit-Genauigkeit
(OCP FP8) mit strukturierter Sparsity
-
9.2 PFLOPs
-
Max. Matrix-Performance
bei halber Genauigkeit (FP16)
-
2.3 PFLOPs
-
Max. Matrix-Performance bei halber Genauigkeit (FP16) mit strukturierter Sparsity
-
4.6 PFLOPs
-
Max. Performance halbe Genauigkeit (FP16)
-
144.2 TFLOPs
-
Max. Performance einfache Genauigkeit Matrix (FP32)
-
144.2 TFLOPs
-
Max. Performance einfache Genauigkeit (FP32)
-
144.2 TFLOPs
-
Max. Performance doppelte Genauigkeit Matrix (FP64)
-
72.1 TFLOPs
-
Max. Performance doppelte Genauigkeit (FP64)
-
72.1 TFLOPs
-
Max. Matrix-Performance bei INT8
-
4.6 POPs
-
Max. Matrix-Performance bei INT8 mit strukturierter Sparsity
-
9.2 POPs
-
Max. Matrix-Performance bei bfloat16
-
2.3 PFLOPs
-
Max. Matrix-Performance bei bfloat16 mit strukturierter Sparsity
-
4.6 PFLOPs
-
Transistoranzahl
-
185 Billion