提供高效能運算的加速器

進化、適應和學習

隨著 EPYC™ 伺服器處理器和 Radeon Instinct™ GPU 加速器的問世,機器智慧和 HPC 的異質運算新紀元已到來。

AMD EPYC™Radeon Instinct™

HPC 和深度學習展開橫向擴展運算新紀元

如要真正加快深度學習的腳步並解決資料中心的各種需求,需要結合高效能運算和最佳化 GPU 加速,運用分散在許多核心的許多浮點運算來處理大量資料。現今大型系統的設計人員也需要能夠設計具靈活彈性和開放性的有效率系統,以因應現今繁重工作量的挑戰來進行系統組態配置。

AMD 為設計人員提供這些能力,讓他們能進一步提升可達成的運算密度標準,在開放而有彈性的環境中最佳化伺服器設計,提供更高效能、降低延遲並改善效率。隨著搭載 EPYC 處理器的伺服器及 Radeon Instinct GPU 加速器的問世,加上我們的 ROCm 開放軟體平台,AMD 走入 HPC 和深度學習的異質運算新紀元。

Radeon Instinct™ MI25 伺服器加速器

AMD 推出基於開放標準的 Radeon Instinct 系列產品,改變了遊戲規則。Radeon Instinct 加速器,結合我們對異質運算採取的開放生態系統方式,提高可達成效能的標準、效率和靈活彈性,來設計系統性能,以因應現今資料中心繁重工作量的挑戰。

全新 Radeon Instinct MI25 加速器以 AMD 新一代「Vega」架構為基礎,並搭載其功能強大的平行運算引擎,是全球終極的訓練加速器,適用於大規模的深度學習應用,可處理 HPC 的繁重工作量,提供 24.6 TFLOPS 的 FP16 和 12.3 TFLOPS 的 FP32 尖峰單精度浮點效能。1 結合此開放 ROCm 軟體平台的強大效能和世界最先進的 GPU 記憶體架構、16GB HBM2,以及最高 484 GB/s 記憶體頻寬,為您提供符合現今運​算工作負載的終極解決方案。

Radeon Instinct MI25 特點:

  • 內建 AMD 的下一代「Vega」架構和世界最先進的 GPU 記憶體架構​
  • 為 HPC 和深度學習提供優異的 FP16 和 FP32 效能
  • ROCm 開放軟體平台,適合 HPC 等級機架規模
  • Large BAR 支援 mGPU 點對點運算
  • MxGPU SR-IOV 硬體虛擬化技術,用於最佳化資料中心使用率

當結合搭載新型 AMD EPYC™ 處理器的伺服器和 Radeon Instinct MI25 加速器時,可提供優異的運算密度和每節點效能​

進一步瞭解


 

ROCm 開放軟體平台

ROCm 開放軟體平台為 HPC 等級異質運算和世界級資料中心系統設計提供開放原始碼基礎。ROCm 平台針對 Linux® 驅動程式、編譯器、工具和資料庫提供最佳化的效能。ROCm 的軟體設計哲學提供程式設計選擇,極簡和模組化軟體開發方式,以進一步最佳化 GPU 加速器運算。

結合此方式和 AMD 的安全硬體’虛擬化 MxGPU 技術,系統設計人員現在可以改變設計系統的方式,以提高效率,並促進最佳化資料中心使用率和處理能力。

ROCm 基礎元素:

HSA Foundation logo ​ ROCm Platform logo
  • 開放無週邊 Linux® 64 位元驅動程式和針對超級規模和 HPC 等級運算最佳化豐富的系統執行時期堆疊
  • 多 GPU 運算使用驅動程式中的直接 RDMA 對等同步支援,來支援透過 RDMA 的伺服器節點來回通訊
  • 簡化程式設計模型,在需要時為開發人員提供控制力
  • HCC 真正單一來源 C++ 異質編譯器可處理整個系統的需求,而不只是單一裝置
  • HIP CUDA 轉換工具為使用 GPU 運算 API 提供平台選擇

ROCm 開放軟體平台透過最佳化開放 Linux 驅動程式和不受語言影響的豐富式 ROCr 系統執行時期,為大規模機器智慧和 HPC 資料中心部署提供穩固基礎,並大幅使用異質系統架構 (HSA) 執行時期 API。此方式為執行程式設計語言 (例如 HCC C++、Khronos Group’s OpenCL™、Continuum’s Anaconda Python 和 HIP CUDA 轉換工具) 提供豐富基礎。2

AMD 將持續為 HPC 和深度學習部署,針對我們的 Radeon™ GPU 加速器秉持開放方式,來擴充對 NUMA 類別加速所需關鍵的支援。ROCm 平台現在支援我們的全新 Radeon Instinct GPU 加速器系列產品,並仍將支援我們的多個其他 AMD FirePro™ S 系列、Radeon™ RX 系列和 Radeon™ Pro Duo 顯示卡。請造訪 ROCm 網站,以檢視支援的 GPU 顯示卡完整清單。

進一步瞭解


 

OpenCL™、OpenMP 與 OpenACC 支援

OpenCL

AMD 持續支援我們所提供最新產品的這些標準3。我們相信大部分 HPC 社群成員均企盼開放標準成為執行專案與模擬可以依循的方式,AMD 致力於支持這個目標且正與社群密切合作朝開放標準的目標努力。

 AMD FirePro™ S 系列加速器

AMD FirePro™ S9300 x2

​以 AMD FirePro™ S9300 x2 伺服器 GPU 這個全世界速度最快的單精度運算 GPU 加速器加快資料分析或地震波處理等最複雜高效能運算工作的速度。4,5多種您隨時可取用的工具和檔案庫,包含 ROCm 工具,均位於我們的程式開發人員網頁,網址為 http://www.gpuopen.com/.

我們其中一個客戶 CGG 於近日做了一項測試。身為尖端科技地址科學領導者的 CGG 最近以多個不同的 GPU 加速器執行專有的波動方程式模型標竿試驗,其中包含新的 AMD FirePro™ S9300 x2 GPU。隨著波動方程式複雜度的不斷升高,效能優勢亦越來越傾向於 AMD FirePro™ S9300 x2 GPU,其速度最多比其他測試的顯示卡快 2 倍。6

Wave Table  

圖表由 CGG 提供

AMD FirePro™ S9100、S9150 與 S9170 加速器

需要優質雙精度效能的組織可以選擇 AMD FirePro™ S9100 系列的加速器。AMD FirePro™ S9150 搭載於榮登 2014 年 Green500 排名 #1 的超級電腦,其雙精度效能輕輕鬆鬆就比同級競爭對手 Tesla K40 高 50% 以上。7

觀看 Dr. David Rohr 和 Professor Lindenstruth 的訪談影片,聽他們討論 Green500 排名第 1 的超級電腦 L-CSC 叢集。

 

 

DGEMM 或雙精度一般矩陣乘法用於度量雙精度、真實矩陣乘法的浮點執行速率。許多真實世界的應用程式使用雙精度矩陣作業。其中包含運算液態動力學、有限元素分析和結構模型與分子動力學。

導入 AMD OpenCL BLAS 後,我們的 AMD FirePro™ S9150 GPU 可以做到 2 TFLOPS 的穩定 DGEMM 效能,Tesla K40 只能做到 1.3 TFLOPS DGEMM。

AMD FirePro™ S9170 GPU 非常適合需要強大陣隊乘法能力的組織,他們可以運用此加速器所擁有的 32GB GDDR5 記憶體。分別擁有 24GB 和 12GB 記憶體的 Nvidia K80 和 K40 無法運算大於其內建記憶體的陣列。

 AMD FirePro™ S 系列規格

適用於高效能運算的 AMD FirePro™ 伺服器 GPU 解決方案

從運算流體動力的學術研究,到進展到地震處理和貯存槽模擬的石油和天然氣業,AMD FirePro™ S 系列伺服器 GPU 都提供了可以實際滿足您的需求的完整產品。AMD FirePro 伺服器有先進的單精度和雙精度運算效能,是適用於需要 GPU 的大量平行處理能力的任何複雜運算專案的解決方案。4​

​S9100​S9150S9170​​​​S9300 X2​​
AMD FirePro™ S9300 x2
​​GCN 串流處理器​2560​2816​2816​8192​
單精度 (GFLOPS)​4220​5070​5240​​13900​​​
雙精度 (GFLOPS)​2110​2530​2620​​870​
​主機板內建的記憶體​12GB GDDR5​16GB GDDR5​32GB GDDR5​​8GB HBM
​ECC​是 (外部)​是 (外部)是 (外部)​​​否​
記憶體頻寬 (GB/S)​320​320​320​​1024​
介面​PCIe 3.0,雙插槽​PCIe 3.0,雙插槽PCIe 3.0,雙插槽​PCIe 3.0,雙插槽​
最大功率​225W​235W​275W​300W​
散熱被動式散熱器被動式散熱器​被動式散熱器​​​被動式散熱器
建議用於

雙精度工作流程,例如:

學術和政府團體

石油和天然氣 – 貯存槽模擬

雙精度工作流程,例如:

學術和政府團體

石油和天然氣 – 貯存槽模擬

雙精度工作流程,例如:

學術和政府團體

石油和天然氣 – 貯存槽模擬​

​單精度工作量,例如:

分子動力學

地理科學

深度神經網路/機器學習

 購買地點

AMD FirePro™ 加速器可自許多 OEM 和 SI 廠商購得, 包含 Dell、HPE 和 SuperMicro 等。

Dell ​ ​ ​ ​​ ​HPE
 ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​ SuperMicro ​ ​ ​ ​​ 
​​

如需更多搭載 AMD FirePro™ GPU 的 Dell 伺服器相關資訊,請造訪 www.amd.com/dell-server

如需搭載 AMD FirePro™ GPU 的 HPE 伺服器相關資訊,請造訪 www.amd.com/hpe

  

  

  

  

  

註解