AMD FirePro™ 加速器提供高效能運算

​全球第一個具有 1 TB/s 記憶體頻寬的 GPU 加速器

以 AMD FirePro™ S9300 x2 伺服器 GPU 這個全世界速度最快的單精度運算 GPU 加速器加快資料分析或地震波處理等最複雜高效能運算工作的速度。6,7

進一步瞭解

AMD FirePro™ 加速器是極為引人注目的高效能運算解決方案,擁有令人印象深刻的密度和卓越的每瓦特效能。每年都有越來越多配備 GPU 加速器的超級電腦配備出現在 Green500™ 名單中,因為研究機構、政府機關和其他科學與工程公司體認到擁有 GPU 加速器對於處理複雜資料集的好處。

AMD 不斷將尖端技術引進高效能運算社群,持續在這個產業掀起波瀾。配備 AMD FirePro™ S9150 的 L-CSC 超級電腦在 2014 年榮登 Green500 名單的第一名,這份名單含括全世界最符合能源效益的超級。AMD 的 FirePro™ S9170 在 2015 年上市,此 GPU 配備 32GB 的 GDDR5 記憶體,是現今容量最大的主機板內建 GPU 記憶體,而在 2016 年新上市的 AMD FirePro™ S9300 x2 採用尖端 HBM 記憶體技術,是業界第一個提供 1Tb/s 記憶體頻寬的加速器。所有這些新產品與功能均能進一步增進在資料中心擁有加速器的使用體驗,使得越來越多組織在意識到這些解決方案的效能潛力和好處後亦加以採用。

GPUOpen 與 Radeon 開放運算平台 Platform (ROCm)

HSA Foundation logo ​ ROCm Platform logo

ROCm 平台為 GPU 運算研究帶來新的機會。ROCm 由三個核心元素所組成:

  • 全新的 Linux® 驅動程式和針對高效能運算和超級規模等級運算最佳化的執行時期堆疊、
  • 最適用於整個系統而非單一裝置的異質 C 和 C++ 編譯器
  • 容許 CUDA 程式碼轉換、運用 GPU 運算 API 時能夠認可平台選擇需求的 HIP 工具

AMD 運用對於 HSA 標準以及更重要的 HSA 1.0 Runtime 的知識,成功地為加速器擴充了支援 NUMA 類別加速的關鍵功能。因此,Radeon Open Compute Kernel (ROCK) 驅動程式是由許多以我們致力於研發的 APU 異質系統架構為基礎的元件所組成,包含全新的 AMD GPU 驅動程式、Kernel Fusion Driver (KFD)、HSA+ Runtime 和以 LLVM 為基礎的編譯堆疊來建構重要的語言支援。ROCm 平台現在支援 FirePro™ S9300 x2、S9170、S9150 和 W9100 顯示卡,以及 Radeon™ RX 系列、R9 Nano 和 Pro Duo 顯示卡。​

進一步瞭解

 

OpenCL™、OpenMP 與 OpenACC 支援

OpenCL

AMD 持續支援我們所提供最新產品的這些標準1。我們相信大部分 HPC 社群成員均企盼開放標準成為執行專案與模擬可以依循的方式,AMD 致力於支持這個目標且正與社群密切合作朝開放標準的目標努力。

 AMD FirePro™ S 系列加速器

AMD FirePro™ S9300 x2

​以 AMD FirePro™ S9300 x2 伺服器 GPU 這個全世界速度最快的單精度運算 GPU 加速器加快資料分析或地震波處理等最複雜高效能運算工作的速度。2,3多種您隨時可取用的工具和檔案庫,包含 ROCm 工具,均位於我們的程式開發人員網頁,網址為 www.gpuopen.com.

我們其中一個客戶 CGG 於近日做了一項測試。身為尖端科技地址科學領導者的 CGG 最近以多個不同的 GPU 加速器執行專有的波動方程式模型標竿試驗,其中包含新的 AMD FirePro™ S9300 x2 GPU。隨著波動方程式複雜度的不斷升高,效能優勢亦越來越傾向於 AMD FirePro™ S9300 x2 GPU,其速度最多比其他測試的顯示卡快 2 倍。4

Wave Table  

圖表由 CGG 提供

AMD FirePro™ S9100、S9150 與 S9170 加速器

需要優質雙精度效能的組織可以選擇 AMD FirePro™ S9100 系列的加速器。AMD FirePro™ S9150 搭載於榮登 2014 年 Green500 排名 #1 的超級電腦,其雙精度效能輕輕鬆鬆就比同級競爭對手 Tesla K40 高 50% 以上。5

觀看 Dr. David Rohr 和 Professor Lindenstruth 的訪談影片,聽他們討論 Green500 排名第 1 的超級電腦 L-CSC 叢集。

 

 

DGEMM 或雙精度一般矩陣乘法用於度量雙精度、真實矩陣乘法的浮點執行速率。許多真實世界的應用程式使用雙精度矩陣作業。其中包含運算液態動力學、有限元素分析和結構模型與分子動力學。

導入 AMD OpenCL BLAS 後,我們的 AMD FirePro™ S9150 GPU 可以做到 2 TFLOPS 的穩定 DGEMM 效能,Tesla K40 只能做到 1.3 TFLOPS DGEMM。

AMD FirePro™ S9170 GPU 非常適合需要強大陣隊乘法能力的組織,他們可以運用此加速器所擁有的 32GB GDDR5 記憶體。分別擁有 24GB 和 12GB 記憶體的 Nvidia K80 和 K40 無法運算大於其內建記憶體的陣列。

 AMD FirePro™ S 系列規格

適用於高效能運算的 AMD FirePro™ 伺服器 GPU 解決方案

從運算流體動力的學術研究,到進展到地震處理和貯存槽模擬的石油和天然氣業,AMD FirePro™ S 系列伺服器 GPU 都提供了可以實際滿足您的需求的完整產品。AMD FirePro 伺服器有先進的單精度和雙精度運算效能,是適用於需要 GPU 的大量平行處理能力的任何複雜運算專案的解決方案。2​

​S9100​S9150S9170​​​​S9300 X2​​
AMD FirePro™ S9300 x2
​​GCN 串流處理器​2560​2816​2816​8192​
單精度 (GFLOPS)​4220​5070​5240​​13900​​​
雙精度 (GFLOPS)​2110​2530​2620​​870​
​主機板內建的記憶體​12GB GDDR5​16GB GDDR5​32GB GDDR5​​8GB HBM
​ECC​是 (外部)​是 (外部)是 (外部)​​​否​
記憶體頻寬 (GB/S)​320​320​320​​1024​
介面​PCIe 3.0,雙插槽​PCIe 3.0,雙插槽PCIe 3.0,雙插槽​PCIe 3.0,雙插槽​
最大功率​225W​235W​275W​300W​
散熱被動式散熱器被動式散熱器​被動式散熱器​​​被動式散熱器
建議用於

雙精度工作流程,例如:

學術和政府團體

石油和天然氣 – 貯存槽模擬

雙精度工作流程,例如:

學術和政府團體

石油和天然氣 – 貯存槽模擬

雙精度工作流程,例如:

學術和政府團體

石油和天然氣 – 貯存槽模擬​

​單精度工作量,例如:

分子動力學

地理科學

深度神經網路/機器學習

 購買地點

AMD FirePro™ 加速器可自許多 OEM 和 SI 廠商購得, 包含 Dell、HPE 和 SuperMicro 等。

Dell ​ ​ ​ ​​ ​HPE
 ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​ SuperMicro ​ ​ ​ ​​ 
​​

如需更多搭載 AMD FirePro™ GPU 的 Dell 伺服器相關資訊,請造訪 www.amd.com/dell-server

如需搭載 AMD FirePro™ GPU 的 HPE 伺服器相關資訊,請造訪 www.amd.com/hpe

  

  

  

  

  

註解