支援 AI 與 HPC 運算的未來

AI 與高效能運算 (HPC) 繼續改革產業,提供自動化並改善決策,實現新的產品與服務。在每一個領域、每一個產業,新的機會帶來的是生產力的提升、商業成果和更明亮的未來。

然而,對於運算力永無止境的需求,卻也更加提高其硬體需求。當越來越多企業為了支援數百萬使用者所需的生成式 AI 與機器學習,而建置大型系統,效率與空間上的考量即逐漸受到重視:客戶該如何配置這些需要許多元件、許多系統並且耗電可觀的解決方案呢?

如果客戶希望在業務中發揮 AI 與 HPC 的效益,AMD Instinct™ 加速器就能提供幫助,帶來出色的效能,卻不大幅提高伺服器體積或耗電;這一切就來自於其革新的架構與產品創新。AMD 很高興能夠宣布 AMD Instinct MI300X 加速器上市:這是一款顯示卡產品,無論客戶為什麼產業提供服務,皆能帶來執行要求最嚴苛的 AI 與 HPC 工作負載所需之運算力。

加速 AI 與 HPC 進入百億億次級時代

AMD Instinct 加速器是以 AMD CDNA™ 架構為基礎,為現代企業重新定義電腦運算。這款為百億億次級時代全新設計的處理器,比 AMD Radeon™ Instinct 產品等前一代以 GCN 為基礎的產品效能大幅提升。而現在新一代的 AMD Instinct 產品效能,以更大幅度繼續躍進。

AMD Instinct™ MI300 系列加速器設計使用第三代 AMD CDNA 架構,於今年稍早隨 AMD Instinct™ MI300A APU 加速器推出時同步發表,是全球首款專為 AI 與 HPC 工作負載所設計的 APU。AMD Instinct MI300A 加速器在單一個 APU 上,結合了處理器、顯示卡與高頻寬記憶體 (HBM3),在各種能受益於加速硬體的最尖端工作負載提供高通用性的效能,是一款提供突破性密度與效率的強大加速器。

如今,隨著 AI 的可能應用範圍與需求皆繼續成長,AMD Instinct MI300X 顯示卡加速器也加入市面上現有 AMD 產品的行列,提供客戶所追求的效能水準。AMD Instinct MI300X 加速器放棄處理器核心,改為專門提供純粹的顯示卡力量,能在一個節點封裝最多八個顯示卡。結果呢?出色的效能與 HBM3 記憶體容量,由領先業界的記憶體頻寬提供支援,將長久以來的 HPC 工作負載與近年生成式 AI 運算爆炸性的需求增長,加速提升至新境界。2

AMD Instinct MI300X 加速器提供 192GB 的 HBM3 記憶體,其密度最高達競爭產品的 2.4 倍,並具備最多 5.3 TB/s 的峰值記憶體頻寬,提供頻寬最高達市面上競爭產品的 1.6 倍。

大規模效能

當 AI 工作負載規模擴大,其硬體也需隨之擴充。當企業為滿足需求而擴大規模,空間就變得珍貴,成為客戶必須克服的瓶頸。

有鑑於此,AMD Instinct MI300X 加速器提供的解決方案採用業界標準的開放平台計畫 (Open Compute Project, OCP) 平台設計:通用基板 (Universal Baseboard, UBB)。此設計可直接套用,讓客戶將八個顯示卡結合於單一個效能導向的節點,搭配完整連接的點對點環狀設計,於單一平台提供總計 1.5 TB 的 HBM3 記憶體,無論於任何 AI 或 HPC 工作負載部署皆屬高效能密度的解決方案。

AMD ROCm™:充滿 AI 可能性的開放軟體平台

AMD ROCm™ 為業界唯一的顯示卡運算開放式軟體平台,讓客戶不再受限於任何單一廠商所提供的有限選擇。有了開放且可攜的軟體平台,客戶就獲得架構彈性,並能自由運用其硬體。

透過 AMD MI300X 加速器等創新產品,AMD 幫助促進 AI 領域更多的可能性。趁現在,進一步瞭解 AMD Instinct 加速器及其開放生態系統、為伺服器使用者所提供越來越多樣的強力產品以及透過專屬且自適應架構所量身打造的解決方案。立即解放 AI 與高效能運算的可能性。

請立即聯絡您的 AMD代表以瞭解更多,或造訪 AMD Instinct Hub 瞭解更多。

尾註
  1. MI100-04:AMD 效能實驗室於 2020 年 9 月 18 日前對 1,502 MHz 峰值提升引擎時脈下的 AMD Instinct™ MI100 加速器進行的計算,計算結果為 184.57 TFLOPS 的峰值理論半精度 (FP16) 和 46.14 TFLOPS 的峰值理論單精度 (FP32) 矩陣浮點效能。對 1,725 MHz 峰值提升引擎時脈下的 Radeon Instinct™ MI50 顯示卡進行的計算結果為 26.5 TFLOPS 峰值理論半精度 (FP16) 和 13.25 TFLOPS 峰值理論單精度 (FP32) 矩陣浮點效能。伺服器製造商可能會改變配置,進而產生不同的結果。
  2. MI300-05A:AMD 效能實驗室於 2023 年 5 月 17 日對採用 AMD CDNA™ 3 5nm FinFet 工藝技術的 AMD Instinct™ MI300X OAM 加速器 750W (192 GB HBM3) 進行的計算,計算結果為 192 GB HBM3 記憶體容量和 5.218 TFLOPS 持續峰值記憶體頻寬效能。MI300X 記憶體匯流排介面為 8,192,記憶體資料速率為 5.6 Gbps,持續峰直記憶體頻寬為 5.218 TB/s(8,192 位元記憶體匯流排介面 * 5.6 Gbps 記憶體資料速率/8)* 0.91 已傳遞調整。 NVidia Hopper H100 (80GB) SXM 顯示卡加速器的最高已公佈結果為 80GB HBM3 記憶體容量和 3.35 TB/s 顯示卡記憶體頻寬效能。