概述

AMD CDNA 架构是 AMD Instinct GPU 和 APU 的专用计算架构。它采用先进的封装技术,整合了 AMD 小芯片技术、高带宽内存 (HBM) 和高吞吐量 Infinity 架构,并提供支持全面 AI 和 HPC 数据格式的先进“矩阵核心”技术,旨在降低数据传输开销并提高能效。

代际对比表

 

CDNA

CDNA 2

CDNA 3

CDNA 4

工艺技术

7nm FinFET

6nm FinFET

5nm + 6nm FinFET

3nm + 6nm FinFET

晶体管数

256 亿

最高可达 580 亿

最高可达 1460 亿

最高可达 1850 亿

计算单元数 | 矩阵核心数

120 | 440

最高可达 220 | 880

最高可达 304 | 1216

256 | 1024

内存类型

32GB

HBM2

最高可达 128GB

HBM2E

最高可达 256GB

HBM3 | HBM3E

288 GB

HBM3E

内存带宽(峰值)

1.2 TB/s

最高可达 3.2 TB/s

最高可达 6 TB/s

8 TB/s

AMD Infinity Cache

N/A

N/A

256 MB

256 MB

GPU 一致性

N/A

高速缓存

高速缓存和 HBM

高速缓存和 HBM

支持的数据类型

INT4、INT8、BF16、FP16、FP32、FP64

INT4、INT8、BF16、FP16、FP32、FP64

INT8、FP8、BF16、FP16、TF32、FP32、FP64(支持稀疏性)

INT4、FP4、FP6、INT8、FP8、BF16、FP16、TF32*、FP32、FP64(支持稀疏性)

产品

AMD Instinct MI100 系列

AMD Instinct MI200 系列

AMD Instinct MI300 系列

AMD Instinct MI350 系列

*对 TF32 的支持由软件模拟实现。

优势

矩阵核心技术

AMD CDNA 4 提供增强的矩阵核心技术,与上一代架构相比,低精度矩阵数据类型的计算吞吐量提高了一倍。AMD CDNA 4 带来了改进,实现了指令级的并行性,扩展了共享 LDS 资源,带宽翻倍,并支持包括 FP4 和 FP6 在内的广泛精度范围,并且支持稀疏矩阵数据(即稀疏性)。

增强型 AI 加速

AMD CDNA 4 针对 LLM 带来了新的增强型 AI 加速功能,包括提高 GEMM 性能并降低延迟、提高较低精度产品的能效,以及在模型精度、速度或能效之间平衡优先级的基础上,为混合精度 AI 项目提供更高的灵活性。

AI technology concept
Add Alt Text

HBM 内存、高速缓存和一致性

AMD Instinct MI350 系列 GPU 提供业界领先的 256GB HBM3E 内存容量,可支持更大的模型和所需的所有带宽,还支持共享内存和 AMD Infinity Cache(共享最后一级高速缓存) - 无需数据复制并改善延迟。

统一结构

新一代 AMD Infinity 架构与 AMD Infinity Fabric 技术相结合,实现了 AMD GPU 小芯片技术与堆叠 HBM3E 显存在一致性、高吞吐量上的统一,适用于单设备以及多设备平台。此外,它还增强了 I/O 功能,兼容 PCIe® 5。

AMD CDNA 4 闪耀登场

AMD CDNA 4 是 AMD Instinct MI350 系列 GPU 的专用计算架构。它采用先进的芯片制造和封装技术,旨在降低数据传输开销并提高能效。

AMD Instinct MI350 Series

基于 AMD CDNA 4 的 GPU 产品

AMD CDNA 3

AMD CDNA 3 架构是 AMD Instinct MI300 系列 GPU 的专用计算架构。它采用先进的小芯片技术封装,旨在降低数据传输开销并提高能效。

Add Alt Text

AMD CDNA 2

AMD CDNA 2 架构旨在加速最繁重的科学计算工作负载和机器学习应用。它是 AMD Instinct MI200 系列 GPU 的基础。

AMD CDNA

AMD CDNA 架构是专为基于 GPU 的计算而设计的架构,旨在开启百亿亿次级别的计算时代。它是 AMD Instinct MI100 系列 GPU 的基础。

Add Alt Text

AMD Instinct 加速器

了解 AMD Instinct GPU 如何为生成式 AI、训练和 HPC 树立新标杆。

AMD ROCm 软件

AMD CDNA 架构由 AMD ROCm 软件支持,该软件是一个开放软件堆栈,包含针对 AMD Instinct GPU 的 AI 和 HPC 解决方案开发的丰富的编程模型、工具、编译器、代码库和运行期库。