AMD FirePro™ S9300 x2 伺服器 GPU

AMD FirePro™ S9300 Server GPU
 
 
 

​​​全球第一個具有 1 TB/s 記憶體頻寬的 GPU 加速器

使用最快的單精度運算 GPU 加速器,亦即 AMD FirePro™ S9300 x2 伺服器 GPU 來加快最複雜 HPC 工作負載的資料分析或語意處理作業。2,4

 
 
 

 概觀

​全新的 AMD FirePro™ S9300 x2 伺服器 GPU 是全球第一個配備高頻寬記憶體 (HBM) 的專業 GPU 加速器,也是第一個與所有 AMD GPUOpen 專業運算工具和檔案庫相容的加速器。HBM 使 AMD FirePro S9300 x2 伺服器 GPU 能夠擁有競爭品牌 NVIDIA Tesla M40 3.5 倍的記憶體頻寬,以及 NVIDIA Tesla K80 2.1 倍的記憶體頻寬。3​

以第三代 AMD Graphics Core Next (GCN) 架構為基礎的 AMD FirePro S9300 x2 伺服器提供高達 13.9 TFLOPS 的單精度浮點效能 — 遠高於現今市面上的任何單精度運作 GPU 加速器​4相較於 Intel 的旗艦產品 Xeon E5 CPU,FirePro™ S9300 x2 GPU 的原始效能優勢更是驚人 — 多 15X 的記憶體頻寬以及超過 12 倍的尖峰單精度效能。6

再好的加速器缺少了優異的開發人員生態系統也不完整。AMD 的 GPUOpen 專業運算軟體堆疊讓 AMD FirePro S9300 x2 伺服器 GPU 能夠運用 AMD 第一個專為運算打造的開放原始碼 source Linux® 驅動程式,以及支援使用 OpenCL™ 以及 C++ 進行加速的能力。對於 CUDA 程式碼使用者的另一個好處是能夠輕鬆地將其大部分的程式碼移植至 C++,給予公司在不同廠商之間選擇的自由。

 優點

  • AMD FirePro™ S9300 x2 伺服器 GPU 任何 GPU 加速器中最頂尖的單精度浮點效能。4
  • AMD FirePro™ S9300 x2 伺服器 GPU 是全球第一也是唯一配備高頻寬 (HBM) 記憶體的專業 GPU。1
  • AMD FirePro™ S9300 x2 伺服器 GPU 支援 AMD 的 GPUOpen 軟體堆疊,讓城市開發人員能夠以 C++ 或 OpenCL™ 撰寫程式碼和進行編譯。

 特點

Radeon 開放運算平台 Platform (ROCm)

由針對運算最佳化的開放原始碼 Linux® 驅動程式組成,GPU 加速功能使用新的編譯程式處理以 C++ 程式語言撰寫的程式碼,以及如異質運算介面移植 (HIP) 工具來移植將以 CUDA 撰寫的程式碼移植至 C++。

ROCm 適合各種規模;支援多 GPU 點對點運算,包括透過 RDMA 通訊。

ROCm 具備豐富系統執行階段,提供大規模應用、編譯器和語言執行平台開發所需的重要功能。

HSA Foundation 

適用於 AMD Radeon™ 和 FirePro™ GPU 的 HSA 相容執行階段和驅動程式​

GPUOpen 專業運算

由針對運算最佳化的開放原始碼 Linux 驅​動程式組成,GPU 加速功能使用新的編譯程式處理以 C++ 程式語言撰寫的程式碼,以及如異質運算介面移植 (HIP) 工具來移植將以 CUDA 撰寫的程式碼移植至 C++。

異質運算介面移植 (HIP) 工具

使用此免費、開放原始碼的工具輕鬆地將您的程式碼轉換成 C++,同時保有與 CUDA 編譯程式的相容性。此 HIP 工具讓程式設計人員能夠迅速地將大部分的 CUDA 程式碼移植至 C++。今天就開始使用 AMD FirePro S9300 x2 GPU 這個 AMD 開放原始碼友善的加速器。

OpenCL™ 1.2 支援

協助專業人員運用現代 GPU 和多核心 CPU 的平行運算力,來加速在主要 CAD/CAM/CAE 和支援 OpenCL 的媒體及娛樂應用程式中的繁重運算工作。AMD FirePro S9300 x2 伺服器 GPU 支援 OpenCL™ 1.2,讓開發人員運用新功能,使 GPU 可更靈活地執行該做的工作。

13.9 TFLOPS 的尖峰單精度效能

針對高效能優於精確度需求的模擬、影像增強、訊號處理、影像轉碼和數位轉譯應用,可協助加速完成單精度浮點運算。AMD FirePro™ S9300 x2 提供 13.9 TFLOPS 的尖峰單精度運算效能,且能配置一個配備 8 GPU、尖峰單精度運算效能超過 111 TFLOPS 的 2P 伺服器。在一個標準 42U 機架配備 10 台 4U 伺服器的架構中,其潛在單精度運算效能超過 1 PFLOP!

870 GFLOPS 的尖峰雙精度效能

針對數值精確度至關重要的運算流體動力學、結構力學、油層模擬和空氣動力學等應用,協助加速完成雙精度浮點運算。

半精度 (FP16) 支援

不需 32-位元數學作業精確度的程式設計師現在可使用 16-位元作業,透過提高記憶體頻寬的使用效率達成高效能並降低耗用的記憶體。

8GB HBM 記憶體

HBM 為一新型的記憶體設計,能耗低且通訊通道極寬。HBM 使用垂直堆疊的記憶體晶片,以稱為「矽晶穿孔」或 TSV 的微型電路相接,直接置於中介曾上,縮短資訊在記憶體與處理器之間的傳輸距離。

AMD PowerTune

AMD PowerTune 技術是智慧型電源管理系統,可監視 GPU 活動與用電量。AMD PowerTune 可最佳化 GPU,當 GPU 工作量不需要全力運作時,會降低耗電量,並提供最佳時脈速度,以確保在處理繁重工作時提供最高效能,同時還能兼顧 GPU 的電源預算。5

 規格

散熱/功率/尺寸外型

  • 最大功率:300W
  • 匯流排介面:PCIe® 第 3 代 x16
  • 尺寸外型:雙槽、全長、全高
  • 散熱:被動

記憶​體

  • 大小/類型:8GB HBM
  • 頻寬:1TB/s (2x 512GB/s)

API 和作業系統支援

  • OpenCL™ 1.2
  • HC (異質運算)
  • C++ AMP
  • Linux® 64-位元

啟用的 AMD 技術

  • AMD PowerTune 技術5

系統需求

  • PCI Express® 為基礎的伺服器且擁有一個可用的 x16 通道插槽。AMD 建議使用 PCI Express® v3.0 以獲得最佳效能
  • 以兩個 PCIe 8-pin (針) 輔助電源接頭供應電源
  • 通過 GPU 的對流量最少 25CFM,進氣口溫度最高 45C
  • 建議使用最少 16GB DDR3/DDR4 系統記憶體

保固與支援​​

  • 3 年有限產品維修/更換保固
  • 可透過免付費專線與電子郵件聯絡專屬工作站支援團隊7
  • 預先零件更換選擇

 資源

GPUOpen 專業運算

GPUOpen 專業運算係針對賦予各類程式設計人員加快實現願景的能力所設計,並且透過最佳化開放程式碼驅動程式/執行時期和標準基礎語言、程式庫和應用程式幫助程式設計人員解決所面臨最大挑戰,亦即直覺式與高效能 GPU 運算。

瞭解更多資訊

 客戶聚焦:CGG

 

​CGG 是尖端地理科學的領導者。CGG 透過聚焦於創新和為客戶所面臨能源挑戰提供最佳永續解決方案達成其領導地位。他們為客戶提供獨特、且專為取得高精度資料和地球表面影像所打造的技術、服務和設備。CGG 亦提供用來分析資料並深度了解儲油氣層地表探勘、產量和最佳化的高科技軟體和服務。

CGG 最近使用數個不同的 GPU 加速器進行一項專有的波動方程式建立模型標竿,包含新的 AMD FirePro™ S9300 x2 GPU。隨著波動方程式複雜度的增加,AMD FirePro™ S9300 x2 的效能亦逐漸成為優勢,其速度一度達任何其他受測卡片的 2 倍之多。​8

 

圖表由 CGG 提供 

「我們非常滿意 AMD FirePro™ 運算叢集的表現」CGG IT 架構長 Jean-Yves Blanc 說。「AMD FirePro S9300 x2 的 1TB/s 記憶體頻寬也令我們非常驚艷,這主機板的效能超過 CGG 波動方程式模型程式碼所使用任何其他伺服器 GPU 主機板的兩倍。」

CGG 的 Marc Tchiboukdjian 近期在 Rice University 針對 GPUWrapper 這個可移植異質運算 API 做了一場簡報。按下以下連結觀看 Marc 的簡報。

立即觀賞

 

CGG 在 2011 年首次在機架上安裝配備油浸式散熱系統的運算系統。這段時間以來,CGG 從導入此解決方案學到許多寶貴的經驗,包含:實際節省的成本 (CapEx, OpEx)、設備故障率、散熱效果以及操作問題。透過以下影片連結進一步了解 CGG 震測處理資料中心的油浸​式散熱系統。

立即觀賞

 驅動程式

  

註解