
Descripción general
AMD CDNA™ es la arquitectura de procesamiento dedicada que subyace a las GPU y APU AMD Instinct™. Cuenta con un embalaje avanzado que unifica las tecnologías de chiplet AMD y HBM (High Bandwidth Memory, memoria de alto ancho de banda), una estructura de arquitectura Infinity de alto rendimiento, y ofrece tecnología avanzada Matrix Core que admite un conjunto completo de formatos de datos de IA y HPC, diseñado para reducir el movimiento excesivo de datos y mejorar el ahorro de energía.
Tabla de comparación entre generaciones:
|
CDNA |
CDNA 2 |
CDNA 3 |
CDNA 4 |
Tecnología de procesos |
FinFET de 7 nm |
FinFET de 6 nm |
FinFET de 5 nm + 6 nm |
FinFET de 3 nm + 6 nm |
Transistores |
25 600 millones |
Hasta 58 000 millones |
Hasta 146 000 millones |
Hasta 185 000 millones |
CU | Núcleos de matriz |
120 | 440 |
Hasta 220 | 880 |
Hasta 304 | 1216 |
256 | 1024 |
Tipo de memoria |
32 GB HBM2 |
Hasta 128 GB HBM2E |
Hasta 256 GB HBM3 | HBM3E |
288 GB HBM3E |
Ancho de banda de memoria (máximo) |
1,2 TB/s |
Hasta 3,2 TB/s |
Hasta 6 TB/s |
8 TB/s |
AMD Infinity Cache™ |
N/D |
N/D |
256 MB |
256 MB |
Coherencia de la GPU |
N/D |
Caché |
Caché y HBM |
Caché y HBM |
Compatibilidad con tipos de datos |
INT4, INT8, BF16, FP16, FP32 y FP64 |
INT4, INT8, BF16, FP16, FP32 y FP64 |
INT8, FP8, BF16, FP16, TF32, FP32, FP64 (compatibilidad con sparsity) |
INT4, FP4, FP6, INT8, FP8, BF16, FP16, TF32*, FP32, FP64 (compatibilidad con sparsity) |
Productos |
AMD Instinct™ Serie MI100 |
AMD Instinct™ Serie MI200 |
AMD Instinct™ Serie MI300 |
AMD Instinct™ Serie MI350 |
* TF32 es compatible con la emulación de software.

Beneficios
Tecnologías Matrix Core
AMD CDNA 4 ofrece tecnologías Matrix Core mejoradas que duplican el rendimiento computacional para tipos de datos Matriz de baja precisión en comparación con la arquitectura de la generación anterior. AMD CDNA 4 ofrece un paralelismo mejorado a nivel de instrucción, amplía los recursos LDS compartidos con el doble de ancho de banda e incluye compatibilidad con una amplia gama de precisiones que ahora incluyen FP4 y FP6, junto con compatibilidad con datos de matriz escasos (es decir, sparsity).
Aceleración de IA mejorada
AMD CDNA 4 trae nuevas funciones mejoradas de aceleración de IA para LLM, que incluyen un rendimiento GEMM mejorado con latencia reducida, ahorro de energía con ofertas de menor precisión y más flexibilidad para proyectos de IA de precisión mixta basados en el equilibrio de prioridades entre precisión, velocidad o ahorro de energía.


Memoria HBM, caché y coherencia
Las GPU AMD Instinct Serie MI350 ofrecen una capacidad de memoria HBM3E de 256 GB para admitir modelos de mayor tamaño con todo el ancho de banda necesario, además de memoria compartida y AMD Infinity Cache™ (caché compartida de último nivel), lo que elimina la copia de datos y mejora la latencia.

Fabric unificado
La AMD Infinity Architecture de última generación, junto con la tecnología AMD Infinity Fabric™, permite una unificación coherente y de alto rendimiento de la tecnología de chiplet de GPU de AMD con memoria HBM3E apilada en dispositivos únicos y en plataformas de varios dispositivos. También ofrece E/S mejorada con compatibilidad con PCIe® 5.
Presentamos AMD CDNA™ 4
AMD CDNA™ 4 es la arquitectura de procesamiento dedicada que subyace a las GPU AMD Instinct™ Serie MI350. Cuenta con un empaque avanzado con tecnologías de chiplet, diseñado para reducir el movimiento excesivo de datos y mejorar el ahorro de energía.

GPU AMD Instinct Serie MI350



AMD CDNA 3
AMD CDNA 3 es la arquitectura de procesamiento dedicada que subyace a las GPU AMD Instinct™ Serie MI300. Cuenta con un empaque avanzado con tecnologías de chiplet, diseñado para reducir el movimiento excesivo de datos y mejorar el ahorro de energía.
APU AMD Instinct MI300A

GPU AMD Instinct MI325X



AMD CDNA 2
La arquitectura AMD CDNA 2 está diseñada para acelerar las cargas de trabajo informáticas científicas y las aplicaciones de aprendizaje automático más exigentes que existen. Subyace a las GPU AMD Instinct Serie MI200.
AMD CDNA
La arquitectura de AMD CDNA es una arquitectura dedicada para el procesamiento basado en GPU que fue diseñada para ser pionera en la informática de clase de exaescala. Subyace a las GPU AMD Instinct Serie MI100.


Aceleradores AMD Instinct
Descubre cómo las GPU AMD Instinct establecen nuevos estándares para la IA generativa, el entrenamiento y la HPC.

Software AMD ROCm™
La arquitectura de AMD CDNA es compatible con el software AMD ROCm™, una pila de software abierto que incluye un amplio conjunto de modelos de programación, herramientas, compiladores, bibliotecas y tiempos de ejecución para el desarrollo de soluciones de IA y HPC dirigidas a las GPU AMD Instinct.