概述
AMD CDNA™ 架構是作為 AMD Instinct™ 顯示卡和 APU 基礎的專用運算架構。它採用先進封裝,統合 AMD 小晶片技術與高頻寬記憶體 (HBM),造就出高輸送量的 Infinity Architecture 網狀架構,並提供先進的矩陣核心技術,支援一系列完整的 AI 與 HPC 資料格式,這樣的矩陣核心能夠降低資料移動的資源負擔並提升能效。
各世代的比較表:
| CDNA | CDNA 2 | CDNA 3 | CDNA 4 | |
| 製程技術 | 7nm FinFET | 6nm FinFET | 5nm + 6nm FinFET | 3nm + 6nm FinFET |
| 電晶體數量 | 256 億 | 高達 580 億 | 高達 1460 億 | 高達 1850 億 |
| CU | 矩陣核心數 | 120 | 440 | 高達 220 | 880 | 高達 304 | 1216 | 256 | 1024 |
| 記憶體類型 | 32 GB HBM2 | 最高 128 GB HBM2E | 最高 256 GB HBM3 | HBM3E | 288 GB HBM3E |
| 記憶體頻寬(峰值) | 1.2 TB/s | 高達 3.2 TB/s | 高達 6 TB/s | 8 TB/s |
| AMD Infinity Cache™ | 不適用 | 不適用 | 256 MB | 256 MB |
| 顯示卡一致性 | 不適用 | 快取 | 快取和 HBM | 快取和 HBM |
| 支援資料類型 | INT4、INT8、BF16、FP16、FP32、FP64 | INT4、INT8、BF16、FP16、FP32、FP64 | 矩陣:INT8、FP8、BF16、FP16、TF32、FP32、FP64 向量:FP16、FP32、FP64 稀疏性:INT8、FP8、BF16、FP16 |
矩陣:MXFP4、MXFP6、INT8、MXFP8、OCP-FP8、BF16、FP16、TF32*、FP32、FP64 向量:FP16、FP32、FP64 稀疏性:OCP-FP8、INT8、FP16、BF16 |
| 產品 | AMD Instinct™ MI100 系列 | AMD Instinct™ MI200 系列 | AMD Instinct™ MI300 系列 | AMD Instinct™ MI350 系列 |
*TF32 透過軟體模擬提供支援。
優勢
矩陣核心技術
AMD CDNA 4 提供增強型矩陣核心技術,相較於前一代架構,可讓低精度矩陣資料類型的運算輸送量增加一倍。AMD CDNA 4 提供改善的指令層級平行處理,以兩倍頻寬擴大共用 LDS 資源,將原本就很豐富的精度支援延伸到 MXFP4 和 MXFP6 這兩種,當然也包括對 OCP-FP8、INT8、FP16 和 BF16 的稀疏矩陣資料(即稀疏性)支援。
增強的 AI 加速
AMD CDNA 4 為 LLM 提供全新的增強型 AI 加速功能,包括透過縮短延遲改善 GEMM 效能,藉由支援較低精度提供高能效表現的選項,以及透過權衡模型準確性、速度及能效之間的優先劣後,讓混合精度的 AI 專案更有彈性。
HBM 記憶體、快取和一致性
AMD Instinct MI350 系列顯示卡提供領先業界的 256 GB HBM3E 記憶體容量,具備更大的模型支援所需的所有頻寬,以及共用記憶體與 AMD Infinity Cache™(共用末級快取記憶體),因此可以消除資料複製的需求並降低延遲。
一體化網狀架構
新一代 AMD Infinity Architecture 搭配 AMD Infinity Fabric™ 技術,可在單一裝置與跨多裝置平台上,為 AMD 顯示卡小晶片技術,以及堆疊式 HBM3E 記憶體,實現具備一致性且高輸送量的一體化成果。它還提供具有 PCIe® 5 相容性的增強型 I/O。
隆重介紹 AMD CDNA™ 4
AMD CDNA™ 4 是作為 AMD Instinct™ MI350 系列顯示卡基礎的專用運算架構。採用先進的封裝與小晶片技術,旨在減少資料移動開銷並提升能效。
AMD Instinct MI350 系列顯示卡
AMD CDNA 3
AMD CDNA 3 架構是作為 AMD Instinct™ MI300 系列顯示卡基礎的專用運算架構。採用先進的封裝與小晶片技術,旨在減少資料移動開銷並提升能效。
AMD Instinct MI300A APU
AMD Instinct MI325X 顯示卡
AMD CDNA 2
AMD CDNA 2 架構的設計旨在加速最繁重的科學運算工作負載和機器學習應用程式,也是 AMD Instinct MI200 系列顯示卡的基礎。
AMD CDNA
AMD CDNA 架構是顯示卡型運算的專用架構,設計旨在開創百億億次級運算的時代,也是 AMD Instinct MI100 系列顯示卡的基礎。
AMD Instinct 加速器
探索 AMD Instinct 顯示卡如何為生成式 AI、訓練與 HPC 樹立新標準。
AMD ROCm™ 軟體
AMD CDNA 架構受到 AMD ROCm™ 軟體的支援,它是一種開放式軟體堆疊,包含各種程式設計模型、工具、編譯器、程式庫及執行階段,是針對 AMD Instinct 顯示卡開發 AI 和 HPC 解決方案的理想選擇。