exascale supercomputer - Frontier

エクサスケール時代を推進

研究の限界を打開することを目的として、AMDは米国エネルギー省(DOE)、オークリッジ国立研究所(ORNL)、およびCray Inc.と協力して、新しいエクサスケール級のスーパーコンピューター構築に取り組む計画を発表しました。

Radeon Instinct and Epyc

高性能演算のためのソリューション

EPYC™サーバー・プロセッサーとRadeon Instinct™ GPUアクセラレーターにより、マシン・インテリジェンスとHPCに向けたヘテロジニアス演算の新時代が到来します。

HPCおよびディープ・ラーニング向けスケールアウト演算の新時代を実現

ディープ・ラーニングのペースを真に加速し、データセンターの幅広いニーズに対処するには、高性能演算とGPUアクセラレーションを組み合わせ、多数のコアに分散可能な浮動小数点演算を含む膨大な量のデータを処理するために最適化する必要があります。 また、今日の大規模システム設計者には、要求の厳しいワークロードの課題に対応するため、柔軟性と開放性を備えた効率的なシステムが必要です。

AMDは、オープンで柔軟性の高い環境において、高性能、低レイテンシー、優れた効率によりサーバー設計を最適化することで、演算密度の水準を高めます。 Radeon Instinct GPUアクセラレーターを搭載した新しいEPYCプロセッサー・ベース・サーバーを導入し、AMDのROCm(RadeonオープンeCosystem演算プラットフォーム)と組み合わせることで、AMDはHPCおよびディープ・ラーニングに向けたヘテロジニアス演算の新時代をリードします。

AMD + HPE + Notre Dame case study

ノートルダム大学

ノートルダム大学のCRC(Center for Research Computing)はAMD EPYC™プロセッサーを活用して、HPCの密度を高め、より高速に結果を取得しています。

EPYC OSU

オレゴン州立大学

オレゴン州立大学には、ライフサイエンスと環境科学におけるゲノム対応かつデータ駆動型研究のために、高いコアとスレッドを搭載したプロセッサーが必要です。

Radeon™ Instinct™

世界最速の倍精度PCIe®アクセラレーターでディスカバリーを解き放とう¹

Radeon Instinct™ MI60演算カードは、ディープ・ラーニング、高性能演算(HPC)、クラウド演算、およびレンダリング・システムで高レベルの性能を発揮するように設計されています。 この新しいアクセラレーターには、最適化されたディープ・ラーニング運用、最先端の倍精度性能1、1TB/秒のメモリー帯域幅速度を実現する超高速HBM2メモリーが組み込まれています。 フルチップECCとRAS機能により、大規模なシステム展開で信頼性の高い成果を正確かつ迅速に実現できます。

このバランスの取れた超スケーラブルなソリューションを、Radeon Instinctに最適化されたドライバー、コンパイラー、ライブラリー、性能ツールが含まれたROCmオープン・エコシステムと組み合わせれば、次世代演算とマシン・インテリジェンスに対応できるソリューションが誕生します。

ROCm logo

ROCm – GPU演算向けのオープン・ソフトウェア・エコシステム。

ROCmオープン・ソフトウェア・プラットフォームでは、HPCクラスのヘテロジニアス演算と世界最高級のデータセンター・システム設計に向けたオープンソースの基盤が提供されます。 ROCmのソフトウェア設計理念は、プログラミングの選択肢、ミニマリズム、モジュラー型のソフトウェア開発アプローチを提供して、より最適化されたGPUアクセラレーター演算を可能にすることにあります。 さらに、AMDハードウェア仮想化MxGPUテクノロジーにより、より高い効率性を実現し、データセンターの使用率を最適化することができます。

ROCmの基本要素:

  • ハイパースケールおよびHPCクラスの演算向けに最適化されたオープンなヘッドレスLinux® 64-bitドライバーと十分なシステム・ランタイム・スタック
  • ドライバーに直接RDMAピア同期をサポートして、RDMA経由のサーバー/ノード間の双方向通信をサポートするマルチGPU演算を実現
  • 必要に応じて開発者が管理できるシンプルなプログラミング・モデル
  • HCCの真のシングルソースC++ヘテロジニアス・コンパイラーにより、単一デバイスだけでなくシステム全体を処理
  • プラットフォームの選択を可能とするHIP CUDA変換ツール

AMDはオープンなアプローチを引き続き採用し、Radeon™ GPUアクセラレーターがHPCとディープ・ラーニング展開に対応できるように、NUMAクラスの高速化に必要な重要機能のサポートを拡張してきます。

OpenCL logo

OpenMP、HIP、OpenCL™、Pythonプログラミングのサポート

AMDは、AMDの製品において、こうした規格を引き続きサポートします2。 AMDでは、HPCを活用するユーザーのほとんどがプロジェクトやシミュレーションを実行する手段としてオープン規格を希望していると考え、その実現に取り組むとともに、オープン規格を推進するべくHPCに関連するパートナーと幅広く連携しています。

脚注
  1. 2018年10月22日に行われた演算によると、Radeon Instinct MI60 GPUのピーク理論倍精度浮動小数点 (FP64) は7.4 TFLOPSでした。 AMD TFLOPSの演算は以下の式を使用して行われました。FLOPSの演算は、最高のDPM状態からエンジン・クロックを取り出し、GPUごとにxx Cuで乗算することによって実行されます。次に、各CUに存在するxxストリーム・プロセッサーでその数を乗算します。次に、その数にFP64の1クロックあたり1/2 FLOPSを乗算します。  MI60のTFLOP演算は次で確認することができます:https://www.amd.com/ja/products/professional-graphics/instinct-mi60。第三者が報告した結果によると、NVidia Tesla V100(16GBカード)GPUアクセラレーターのピーク倍精度 (FP64) 浮動小数点は7 TFLOPSでした。  結果は次で確認することができます:https://images.nvidia.com/content/technologies/volta/pdf/437317-Volta-V100-DS-NV-US-WEB.pdf AMDは、外部/第三者の結果/データを独自にテストまたは検証しておらず、その中のエラーまたは省略について一切責任を負いません。  RIV-3
  2. カードによっては、一覧に記載の規格すべてに対応していない場合があります。 サポートの詳細については、各カードの製品仕様をご参照ください。

OpenCLは、Khronos Group, Inc.の許可を得て使用されるApple Inc.の商標です。