

AMD CDNA 3
AMD CDNA™ 3 是作為 AMD Instinct™ MI300 系列加速器基礎的專用運算架構,採用先進的封裝與小晶片技術,旨在減少資料移動開銷並提升能效。
AMD Instinct MI300A 加速處理單元

AMD Instinct MI325X 加速器


矩陣核心技術
AMD CDNA 3 包含矩陣核心技術,可透過改善的指令層級平行處理提供增強的運算輸送量,包括支援各種精度(INT8、FP8、BF16、FP16、TF32、FP32 和 FP64),以及稀疏矩陣資料(即稀疏性)。
HBM 記憶體、快取和一致性
AMD Instinct MI300 系列加速器提供領先業界的 HBM3e 容量與記憶體頻寬1,2,以及共享記憶體與 AMD Infinity Cache™(共用末級快取記憶體),從而避免資料複製並改善延遲。


整合光纖
新一代 AMD Infinity Architecture 搭配 AMD Infinity Fabric™ 技術,可在單一裝置與跨多裝置平台上,為 AMD 顯示卡和處理器小晶片技術實現與堆疊式 HBM3 記憶體一致的一貫高輸送量。它還提供具有 PCIe® 5 相容性的增強型 I/O。

AMD CDNA 2
AMD CDNA 2 架構的設計旨在加速最繁重的科學運算工作負載和機器學習應用程式,也是 AMD Instinct MI200 系列加速器的基礎。

AMD CDNA
AMD CDNA 架構是顯示卡型運算的專用架構,設計旨在開創百億億次級運算的時代,也是 AMD Instinct MI100 系列加速器的基礎。

AMD Instinct 加速器
探索 AMD Instinct 加速器如何大幅提升 AI 與 HPC 效能。

AMD ROCm™ 軟體
AMD CDNA 架構受到 AMD ROCm™ 的支援,AMD ROCm 是一種開放式軟體堆疊,包含各種程式設計模型、工具、編譯器、程式庫及執行階段,是針對 AMD Instinct 加速器開發 AI 和 HPC 解決方案的理想選擇。
尾註
©2023 Advanced Micro Devices, Inc. 保留所有權利。AMD、AMD 箭頭標誌、AMD Instinct、AMD CDNA、Infinity Fabric、ROCm 和前述內容的組合為 Advanced Micro Devices, Inc. 的商標。PCIe 為 PCI-SIG Corporation 的註冊商標。其他名稱僅供參考,可能屬於各自所有者的商標。
- AMD 效能實驗室截至 2023 年 11 月 7 日為止對採用 AMD CDNA™ 3 5nm FinFet 製程技術的 AMD Instinct™ MI300A APU 加速器 760W (128 GB HBM3) 進行的計算,計算結果為 128 GB HBM3 記憶體容量和 5.325 TFLOPS 峰值理論記憶體頻寬效能。MI300A 記憶體匯流排介面為 8,192(1,024 位元 x 8 個裸晶),記憶體資料速率為 5.2 Gbps,峰值記憶體頻寬為 5.325 TB/s(8,192 位元記憶體匯流排介面 * 5.2 Gbps 記憶體資料速率/8)。NVidia Hopper H200 (141GB) SXM 顯示卡加速器的最高已公佈結果為 141GB HBM3e 記憶體容量和 4.8 TB/s 顯示卡記憶體頻寬效能:https://nvdam.widen.net/s/nb5zzzsjdf/hpc-datasheet-sc23-h200-datasheet-3002446。NVidia Hopper H100 (80GB) SXM 顯示卡加速器的最高已公佈結果為 80GB HBM3 記憶體容量和 3.35 TB/s 顯示卡記憶體頻寬效能。https://resources.nvidia.com/en-us-tensor-core/nvidia-tensor-core-gpu-datasheet 伺服器製造商可能會改變配置,進而產生不同的結果。MI300-12
- MI325-001A - AMD 效能實驗室於 2024 年 9 月 26 日根據目前的規格和/或評估進行的計算。AMD Instinct™ MI325X OAM 加速器將擁有 256GB HBM3E 記憶體容量和 6 TB/s 顯示卡峰值理論記憶體頻寬效能。實際結果視生產晶片而異。
NVidia Hopper H200 (141GB) SXM 顯示卡加速器的最高已公佈結果為 141GB HBM3E 記憶體容量和 4.8 TB/s 顯示卡記憶體頻寬效能。 https://nvdam.widen.net/s/nb5zzzsjdf/hpc-datasheet-sc23-h200-datasheet-3002446
NVidia Blackwell HGX B100 (192GB) 700W 顯示卡加速器的最高已公佈結果為 192GB HBM3E 記憶體容量和 8 TB/s 顯示卡記憶體頻寬效能。
NVidia Blackwell HGX B200 (192GB) 顯示卡加速器的最高已公佈結果為 192GB HBM3E 記憶體容量和 8 TB/s 顯示卡記憶體頻寬效能。
Nvidia Blackwell 規格:https://resources.nvidia.com/en-us-blackwell-architecture?_gl=1*1r4pme7*_gcl_aw*R0NMLjE3MTM5NjQ3NTAuQ2p3S0NBancyNkt4QmhCREVpd0F1NktYdDlweXY1dlUtaHNKNmhPdHM4UVdPSlM3dFdQaE40WkI4THZB
©2023 Advanced Micro Devices, Inc. 保留所有權利。AMD、AMD 箭頭標誌、AMD Instinct、AMD CDNA、Infinity Fabric、ROCm 和前述內容的組合為 Advanced Micro Devices, Inc. 的商標。PCIe 為 PCI-SIG Corporation 的註冊商標。其他名稱僅供參考,可能屬於各自所有者的商標。
- AMD 效能實驗室截至 2023 年 11 月 7 日為止對採用 AMD CDNA™ 3 5nm FinFet 製程技術的 AMD Instinct™ MI300A APU 加速器 760W (128 GB HBM3) 進行的計算,計算結果為 128 GB HBM3 記憶體容量和 5.325 TFLOPS 峰值理論記憶體頻寬效能。MI300A 記憶體匯流排介面為 8,192(1,024 位元 x 8 個裸晶),記憶體資料速率為 5.2 Gbps,峰值記憶體頻寬為 5.325 TB/s(8,192 位元記憶體匯流排介面 * 5.2 Gbps 記憶體資料速率/8)。NVidia Hopper H200 (141GB) SXM 顯示卡加速器的最高已公佈結果為 141GB HBM3e 記憶體容量和 4.8 TB/s 顯示卡記憶體頻寬效能:https://nvdam.widen.net/s/nb5zzzsjdf/hpc-datasheet-sc23-h200-datasheet-3002446。NVidia Hopper H100 (80GB) SXM 顯示卡加速器的最高已公佈結果為 80GB HBM3 記憶體容量和 3.35 TB/s 顯示卡記憶體頻寬效能。https://resources.nvidia.com/en-us-tensor-core/nvidia-tensor-core-gpu-datasheet 伺服器製造商可能會改變配置,進而產生不同的結果。MI300-12
- MI325-001A - AMD 效能實驗室於 2024 年 9 月 26 日根據目前的規格和/或評估進行的計算。AMD Instinct™ MI325X OAM 加速器將擁有 256GB HBM3E 記憶體容量和 6 TB/s 顯示卡峰值理論記憶體頻寬效能。實際結果視生產晶片而異。 NVidia Hopper H200 (141GB) SXM 顯示卡加速器的最高已公佈結果為 141GB HBM3E 記憶體容量和 4.8 TB/s 顯示卡記憶體頻寬效能。 https://nvdam.widen.net/s/nb5zzzsjdf/hpc-datasheet-sc23-h200-datasheet-3002446
NVidia Blackwell HGX B100 (192GB) 700W 顯示卡加速器的最高已公佈結果為 192GB HBM3E 記憶體容量和 8 TB/s 顯示卡記憶體頻寬效能。
NVidia Blackwell HGX B200 (192GB) 顯示卡加速器的最高已公佈結果為 192GB HBM3E 記憶體容量和 8 TB/s 顯示卡記憶體頻寬效能。
Nvidia Blackwell 規格:https://resources.nvidia.com/en-us-blackwell-architecture?_gl=1*1r4pme7*_gcl_aw*R0NMLjE3MTM5NjQ3NTAuQ2p3S0NBancyNkt4QmhCREVpd0F1NktYdDlweXY1dlUtaHNKNmhPdHM4UVdPSlM3dFdQaE40WkI4THZB