-
Arquitetura da GPU
-
CDNA4
-
Litografia
-
TSMC 3nm | 6nm FinFET
-
Processadores de streaming
-
16,384
-
Núcleos de matriz
-
1024
-
Unidades de computação
-
256
-
Pico do clock do mecanismo
-
2200 MHz
-
Desempenho de matriz
máximo para microdimensionamento de precisão de quatro bits (MXFP4)
-
9.2 PFLOPs
-
Desempenho de matriz
máximo para microdimensionamento de precisão de seis bits (MXFP6)
-
9.2 PFLOPs
-
Desempenho de matriz
máximo para microdimensionamento de precisão de oito bits (MXFP8)
-
4.6 PFLOPs
-
Desempenho de matriz máximo (E5M2, E4M3)
para projetos de computação de oito bits (OCP FP8)
-
4.6 PFLOPs
-
Desempenho de matriz máximo
para projetos de computação de oito bits (OCP FP8) com esparsidade estruturada
-
9.2 PFLOPs
-
Desempenho de matriz de precisão de meio pico (FP16)
-
2.3 PFLOPs
-
Desempenho de matriz de precisão de meio pico (FP16) com esparsidade estruturada
-
4.6 PFLOPs
-
Desempenho da precisão de meio pico (FP16)
-
144.2 TFLOPs
-
Desempenho da matriz da precisão de pico único (FP32)
-
144.2 TFLOPs
-
Desempenho da precisão de pico único (FP32)
-
144.2 TFLOPs
-
Desempenho da matriz da precisão de pico duplo (FP64)
-
72.1 TFLOPs
-
Desempenho da precisão de pico duplo (FP64)
-
72.1 TFLOPs
-
Desempenho de matriz de pico INT8
-
4.6 POPs
-
Desempenho de matriz de pico INT8 com esparsidade estruturada
-
9.2 POPs
-
Desempenho de matriz de pico bfloat16
-
2.3 PFLOPs
-
Desempenho de matriz de pico bfloat16 com esparsidade estruturada
-
4.6 PFLOPs
-
Contagem de transistor
-
185 Billion