AMD FirePro™ S9300 x2サーバーGPU

AMD FirePro™ S9300 Server GPU

​世界​初、メモリー帯域幅1TB/sのGPUアクセラレーター

世界最速の単精度演算を提供するGPUアクセラレーターであるAMD FirePro™ S9300 x2 サーバーGPUは、データ分析や地震探査処理の非常に複雑なHPCワークロードを高速化します。2,4

 概要

新しいAMD FirePro™ S9300 x2 サーバーGPUは、高帯域幅メモリー(HBM)を備えた世界初のプロフェッショナルGPUアクセラレーターであり、AMDのGPUOpen Professional Computeの全ツールとライブラリーとの互換性を実現しました。HBMを採用することによって、メモリー帯域幅がNVIDIAのTesla M40 の3.5倍、NVIDIAのTesla K80の2.1倍と競合GPUを大きく引き離しています。3

また、第3世代のAMDグラフィックス・コア・ネクスト(GCN)アーキテクチャーを搭載し、現在市販されているGPUアクセラレーターとしては最高4である、13.9 TFLOPSのピーク時単精度浮動小数点性能を実現しています。Intelの旗艦モデルXeon E5 CPUと比較すると、AMD FirePro™ S9300 x2 サーバー GPUは、メモリー帯域幅が15倍以上、単精度性能が12倍以上6と、その性能の優位性は一層明らかです。

優れたアクセラレーターは、優れたデベロッパーのエコシステムで完成します。AMDのGPUOpen Professional Computeソフトウェア・スタックを備えたAMD FirePro S9300 x2サーバーGPUは、演算専用のAMD初のオープンソースLinux®ドライバー、OpenCL™、C++を使用した高速化のサポートを活かすことができます。CUDAでコードを使用している場合は、ほとんどのコードをC++に簡単にポートできるので、ベンダーを自由に選べるというメリットがあります。

 メリット

  • ​AMD FirePro™ S9300 x2 サーバーGPUは、現在市販されているGPUアクセラレーターとして最高の単精度浮動小数点性能を提供。4
  • AMD FirePro™ S9300 x2 サーバーGPUは、世界初かつ唯一の高帯域幅メモリー(HBM)を備えたプロフェッショナルGPU。1
  • AMD FirePro™ S9300 x2 サーバーGPUは、AMDのGPUOpenソフトウェア・スタックをサポートし、デベロッパーはC++やOpenCL™のコーディングやコンパイルが可能。

 機能

​Radeon Open Compute Platform (ROCm)

演算、C++のプログラミング言語のコードを処理する新しいコンパイラーを使うGPUアクセルレーションのサポート、そしてCUDAのコードをC++に移す、ポータビリティーのためのヘトロジニアス・コンピュート・インターフェイス(HIP)ツール等のその他開発ツールに最適化されたオープンソースLinux®ドライバーで構成されています。

ROCmは規模のために作られています。 RDMAでの通信などのマルチGPUのP2P(ピアツーピア)演算をサポートしています。

ROCmは豊富なシステム・ランタイムがあります。大規模なアプリケーション、コンパイラー、言語ランタイムの開発に必要な主要機能を備えています。

HSA Foundation 

AMD Radeon™およびFirePro™ GPU向けHSA準拠のランタイムとドライバー

​GPUOpen Professional Compute

演算用に最適化されたオープンソースのLinuxドライバーを搭載し、C++プログラム言語のコードを処理する新しいコンパイラーのサポート、ヘテロジニアス・コンピュート・インターフェース(HIP)ツールなどの他のデベロッパー・ツールを利用して、CUDA用のコードをC++にポートすることができます。

ポータビリティーのためのヘテロジニアス・コンピュート・インターフェース(HIP)ツール

この無料のオープンソース・ツールを使えば、CUDAコンパイラーとの互換性を保ちながら、簡単にコードをC++言語にコンバートできます。HIPツールを使用すれば、デベロッパーは大部分のCUDAコードをすぐにC++に移すことができます。オープンソースに最適なアクセラレーター、AMD FirePro™ S9300 x2 サーバーGPUで、今すぐ初めてみませんか。

OpenCL™ 1.2サポート

最新GPUの並列演算処理やマルチコアCPUの能力を引き出し、OpenCLをサポートする最先端のCAD/CAM/CAやメディア/エンターテインメントアプリケーションの高速化を実現します。OpenCL™ 1.2に対応するAMD FirePro™ S9300 x2 サーバーGPUを使用することにより、デベロッパーは新機能のメリットを活かし、GPU本来の力をフルに発揮させることができます。

13.9TFLOPSのピーク時の単精度性能

精度より高い性能が求められるシミュレーション、ビデオエンハンス、信号処理、動画トランスコーディング、デジタル・レンダリングなどの各種アプリケーションで用いられる単精度浮動小数点演算に要する時間を短縮します。AMD FirePro™ S9300 x2 サーバーGPUは、13.9 TFLOPSのピーク時の単精度演算性能を提供するため、GPU 8台搭載の2Pサーバー1基で、111 TFLOPS以上のピーク時の単精度演算性能を実現できます。4Uサーバーを10台搭載できるスタンダード42Uラックならば、1 PFLOP以上のピーク時の単精度演算性能も可能です!

870 GFLOPSのピーク時の倍精度性能

数値精度が必要不可欠な数値流体力学(CFD)、構造力学、油層シミュレーション、空気力学などの各種アプリケーションで用いられる倍精度演算に要する時間を短縮します。

半精度(FP16)サポート

32bitの数値操作の精度を必要としないデベロッパーには、16bitの操作のサポートも用意されており、より効率的なメモリー帯域幅の使用や、よりコンパクトなメモリー・フットプリントで高い性能を実現できます。

8GBの高帯域幅メモリー(HBM)

HBMは、低電力消費、超ワイド通信レーンを備えた新型のメモリーです。HBMのメモリーチップは垂直にスタックしており、シリコン貫通電極(TSV)と呼ばれる微細なワイヤーで相互接続され、インターポーザー上に直接設置されています。これより、メモリーとプロセッサー間の情報の伝達距離が短縮されます。

AMD PowerTune

AMD PowerTuneテクノロジーは、GPU使用率と消費電力の両方を監視する高性能な電力管理システムです。AMD PowerTuneは、GPUを最適化し、GPUのワークロードが最大出力を要求しない場合には低消費電力とし、高負荷のワークロードでも、最適なクロック速度でGPUの電力量で最高の性能を提供します。5

 仕様

冷却/電力消費/形状

  • 最大電力消費:300W
  • バスインターフェイス:PCIe® Gen 3 x16
  • 形状:デュアルスロット、フルレングス、フルハイト
  • 冷却:受動

メモリー

  • サイズ/種類:8GB HBM
  • 帯域幅:1TB/s (2x 512 GB/s)

APIおよびOS対応

  • OpenCL™ 1.2
  • HC(ヘテロジニアス・コンピューティング)
  • C++ AMP
  • Linux® 64-bit

有効なAMDテクノロジー

  • AMD PowerTuneテクノロジー5

システム要件

  • PCI® Express x16ベースのサーバーにおいて使用可能な1つのレーンスロット。AMDは最適性能にPCI Express® v3.0を推奨
  • PCIe 8pinのAUX電源コネクター2つを備えた電源
  • GPUへの25 CFM以上の空気流冷却(最大吸気口温度45℃)
  • 16GBDDR3/ DDR4以上のシステムメモリー推奨

保証とサポート

  • 3年間の限定付き製品修理・交換保証
  • 専属ワークステーション技術サポートチームへの直通のフリーダイヤルとメール アクセス7
  • 上位のパーツ交換オプション

 資料

GPUOpen Professional Compute

GPUOpen Professional Computeは、あらゆるデベロッパーが最適化されたオープンソース・ドライバー/ランタイムおよび標準に基づく言語、ライブラリーならびにアプリケーションを用いて直感的かつ高性能なGPU演算を活用し、それぞれのビジョンの実現の加速およびそれぞれの最大の課題の解決を推進します。

詳細はこちら

 カスタマー・スポットライト:CGG

 

最先端の地球科学をリードするCGGは、革新技術を重視し、クライアントが抱えるエネルギーの課題に対して持続可能なソリューションを提供しています。高精度の地中データと画像を収集するためのテクノロジー、サービス、機器を提供するとともに、石油・ガス貯留層探査、生産、最適化を目的として、地中のデータ分析、調査・近いに使用する最先端ソフトウェアとサービスを実現しています。

CGGが最近実施した独自開発の波動方程式モデリングのベンチマークテストは、AMD FirePro™ S9300 x2 GPUを含む複数のGPUアクセラレーターを対象に行われました。このテストにおいては、波動方程式が複雑になるほど、AMD FirePro™ S9300 x2 GPUの性能の高さが際立ち、最終的には他のカードに比べて2倍の処理速度を示しました。8

 

CGG提供によるチャート 

「私たちは AMD FirePro™の演算クラスターに非常に満足しています」とCGGの主任ITアーキテクトのJean-Yves Blanc氏は語っています。「また、AMD FirePro S9300 x2の1TB/sのメモリー帯域幅には驚きました。このボードはCGGの波動方程式コードでは、他のサーバーGPUの2倍以上の性能を発揮しました。」

CGGの Marc Tchiboukdjian氏は最近、ヘテロジニアス演算向けのポータブルAPIであるGPUWrapperについてのプレゼンテーションをライス大学で行っています。そのTchiboukdjian氏のプレゼンテーションは下記リンクからご覧になれます。

視聴はこちら

 

2011年6月、CGGは初の液浸冷却コンピューターシステムを設置し、費用節減効果(設備投資コスト、運用コスト)、機器故障率、冷却性能、運用に関する問題など、さまざまな情報や知識を収集しています。CGGの地震探査処理センターの液浸冷却システムに関する映像は、下記リンクでご覧ください。

視聴はこちら

 ドライバー

  

脚注