-
Arquitectura de GPU
-
CDNA4
-
Litografía
-
TSMC 3nm | 6nm FinFET
-
Procesadores stream
-
16,384
-
Núcleos de la matriz
-
1024
-
Unidades de procesamiento
-
256
-
Reloj de motor máximo
-
2200 MHz
-
Rendimiento máximo de la matriz de precisión de cuatro bits
con microescalado (MXFP4)
-
9.2 PFLOPs
-
Rendimiento máximo de la matriz de precisión de seis bits
con microescalado (MXFP6)
-
9.2 PFLOPs
-
Rendimiento máximo de la matriz de precisión de ocho bits
con microescalado (MXFP8)
-
4.6 PFLOPs
-
Rendimiento máximo de la matriz de precisión de ocho bits
de Open Compute Project (OCP FP8) (E5M2, E4M3)
-
4.6 PFLOPs
-
Rendimiento máximo de la matriz de precisión de ocho bits
de Open Compute Project (OCP FP8) con sparsity estructurada
-
9.2 PFLOPs
-
Rendimiento máximo de la matriz
de precisión media (FP16)
-
2.3 PFLOPs
-
Rendimiento máximo de la matriz de precisión media (FP16)
con sparsity estructurada
-
4.6 PFLOPs
-
Rendimiento de precisión media máxima (FP16)
-
144.2 TFLOPs
-
Rendimiento de la matriz de precisión simple máxima (FP32)
-
144.2 TFLOPs
-
Rendimiento de precisión simple máxima (FP32)
-
144.2 TFLOPs
-
Rendimiento de la matriz de precisión doble máxima (FP64)
-
72.1 TFLOPs
-
Rendimiento de precisión doble máxima (FP64)
-
72.1 TFLOPs
-
Rendimiento máximo de la matriz INT8
-
4.6 POPs
-
Rendimiento máximo de la matriz INT8 con sparsity estructurada
-
9.2 POPs
-
Rendimiento máximo de la matriz bfloat16
-
2.3 PFLOPs
-
Rendimiento máximo de la matriz bfloat16 con sparsity estructurada
-
4.6 PFLOPs
-
Número de transistores
-
185 Billion