概述

AMD CDNA™ 架構是作為 AMD Instinct™ 顯示卡和 APU 基礎的專用運算架構。它採用先進封裝,統合 AMD 小晶片技術與高頻寬記憶體 (HBM),造就出高輸送量的 Infinity Architecture 網狀架構,並提供先進的矩陣核心技術,支援一系列完整的 AI 與 HPC 資料格式,這樣的矩陣核心能夠降低資料移動的資源負擔並提升能效。

各世代的比較表:

 

CDNA

CDNA 2

CDNA 3

CDNA 4

製程技術

7nm FinFET

6nm FinFET

5nm + 6nm FinFET

3nm + 6nm FinFET

電晶體數量

256 億

高達 580 億

高達 1460 億

高達 1850 億

CU | 矩陣核心數

120 | 440

高達 220 | 880

高達 304 | 1216

256 | 1024

記憶體類型

32 GB

HBM2

高達 128 GB

HBM2E

高達 256 GB

HBM3 | HBM3E

288 GB

HBM3E

記憶體頻寬(峰值)

1.2 TB/s

 高達 3.2 TB/s

高達 6 TB/s

8 TB/s

AMD Infinity Cache™

不適用

不適用

256 MB

256 MB

顯示卡一致性

不適用

快取

快取和 HBM

快取和 HBM

支援資料類型

INT4、INT8、BF16、FP16、FP32、FP64

INT4、INT8、BF16、FP16、FP32、FP64

INT8、FP8、BF16、FP16、TF32、FP32、FP64(稀疏性支援)

INT4、FP4、FP6、INT8、FP8、BF16、FP16、TF32*、FP32、FP64(稀疏性支援)

產品

AMD Instinct™ MI100 系列

AMD Instinct™ MI200 系列

AMD Instinct™ MI300 系列

AMD Instinct™ MI350 系列

*TF32 透過軟體模擬提供支援。

優勢

矩陣核心技術

AMD CDNA 4 提供增強型矩陣核心技術,相較於前一代架構,可讓低精度矩陣資料類型的運算輸送量增加一倍。AMD CDNA 4 提供改善的指令層級平行處理,以兩倍頻寬擴大共用 LDS 資源,將原本就很豐富的精度支援延伸到 FP4 和 FP6 這兩種,當然也包括稀疏矩陣資料(即稀疏性)。

增強的 AI 加速

AMD CDNA 4 為 LLM 提供全新的增強型 AI 加速功能,包括透過縮短延遲改善 GEMM 效能,藉由支援較低精度提供高能效表現的選項,以及透過權衡模型準確性、速度及能效之間的優先劣後,讓混合精度的 AI 專案更有彈性。  

AI technology concept
新增替代文字

HBM 記憶體、快取和一致性

AMD Instinct MI350 系列顯示卡提供領先業界的 256 GB HBM3E 記憶體容量,具備更大的模型支援所需的所有頻寬,以及共用記憶體與 AMD Infinity Cache™(共用末級快取記憶體),因此可以消除資料複製的需求並降低延遲。

一體化網狀架構

新一代 AMD Infinity Architecture 搭配 AMD Infinity Fabric™ 技術,可在單一裝置與跨多裝置平台上,為 AMD 顯示卡小晶片技術,以及堆疊式 HBM3E 記憶體,實現具備一致性且高輸送量的一體化成果。它還提供具有 PCIe® 5 相容性的增強型 I/O。

隆重介紹 AMD CDNA™ 4

AMD CDNA™ 4 是作為 AMD Instinct™ MI350 系列顯示卡基礎的專用運算架構。採用先進的封裝與小晶片技術,旨在減少資料移動開銷並提升能效。

AMD Instinct MI350 Series

AMD Instinct MI350 系列顯示卡

AMD CDNA 3

AMD CDNA 3 架構是作為 AMD Instinct™ MI300 系列顯示卡基礎的專用運算架構。採用先進的封裝與小晶片技術,旨在減少資料移動開銷並提升能效。

AMD Instinct MI300A APU

AMD Instinct MI325X 顯示卡

新增替代文字

AMD CDNA 2

AMD CDNA 2 架構的設計旨在加速最繁重的科學運算工作負載和機器學習應用程式,也是 AMD Instinct MI200 系列顯示卡的基礎。

AMD CDNA

AMD CDNA 架構是顯示卡型運算的專用架構,設計旨在開創百億億次級運算的時代,也是 AMD Instinct MI100 系列顯示卡的基礎。

新增替代文字

AMD Instinct 加速器

探索 AMD Instinct 顯示卡如何為生成式 AI、訓練與 HPC 樹立新標準。

AMD ROCm™ 軟體

AMD CDNA 架構受到 AMD ROCm™ 軟體的支援,它是一種開放式軟體堆疊,包含各種程式設計模型、工具、編譯器、程式庫及執行階段,是針對 AMD Instinct 顯示卡開發 AI 和 HPC 解決方案的理想選擇。