AMD FirePro™ S9300 双 GPU 服务器显卡

AMD FirePro™ S9300 Server GPU
 
 
 

​世界上首款显存带宽达 1TB/s 的 GPU 加速器

AMD FirePro™ S9300 双 GPU 服务器显卡使用全球最快的单精度计算 GPU 加速器,能够轻松加速数据分析或震波图分析中复杂的高性能计算 (HPC) 工作负载。2,4

 
 
 

 概述

​全新的 AMD FirePro™ S9300 双 GPU 服务器显卡是世界上首款将搭载高带宽显存 (HBM) 的专业 GPU 加速器,同时也是首款兼容全部 AMD GPUOpen Professional Compute(专业计算)工具和代码库的加速器。HBM 使得 AMD FirePro S9300 双 GPU 服务器显卡一举就超越竞争对手:显存带宽分别是 NVIDIA Tesla M40 的 3.5 倍,Tesla K80 的 2.1 倍3

AMD FirePro S9300 双 GPU 服务器显卡基于第三代 AMD 次世代图形核心 (GCN) 架构,拥有高达 13.9 TFLOPS 的峰值单精度浮点性能,让当前单精度计算市场上的其他 GPU 加速器都望尘莫及4。与 Intel 的旗舰处理器 Xeon E5 CPU 相比,FirePro™ S9300 双 GPU 显卡的原始性能优势更加明显——显存带宽和峰值单精度性能分别高出 15 倍和 12 倍6

伟大的加速器若没有开发者生态系统就算不上完善。AMD FirePro S9300 双 GPU 服务器显卡配备 AMD 的 GPUOpen Professional Compute 软件栈,使用专为计算构建的 AMD 首款开源 Linux® 驱动程序,并且支持 OpenCL™ 和 C++ 加速。对于拥有 CUDA 代码的开发者,另一大优势是能够轻松将大多数代码移植到 C++,从而使公司能够自由选择供应商。

 优势

  • ​AMD FirePro™ S9300 双 GPU 服务器显卡拥有最高的 GPU 加速器单精度浮点运算性能4
  • AMD FirePro™ S9300 双 GPU 服务器显卡是全球首款、也是唯一一款配备高带宽显存 (HBM) 的专业显卡1
  • AMD FirePro™ S9300 双 GPU 服务器显卡支持 AMD 的 GPUOpen 软件栈,使开发者能够以 C++ 或 OpenCL™ 语言进行编码和编译。

 特性

​Radeon 开放计算平台 (ROCm)

ROCm 包含为计算优化的开源 Linux® 驱动程序,使用全新的编译器来处理 C++ 编程语言,并以此来支持 GPU 加速。它还提供其他开发工具,例如异构计算移植接口 (HIP) 工具,可以将编写的 CUDA 代码转换成 C++。

ROCm 为扩大 GPU 支持范围而构建;它支持多 GPU 对等计算,包括通过 RDMA 的通信。

ROCm 拥有丰富的系统运行时,并具备大型应用程序、编译器和语言运行时开发所需的关键特性。

HSA Foundation 

符合 HSA 标准的 AMD Radeon™ 和 FirePro™ GPU 运行时和驱动程序​

异构计算移植接口 (HIP) 工具

使用这款免费的开源工具可轻松将代码转换为 C++ 语言代码,并保持与 CUDA 编译器的兼容性。HIP 工具可让开发人员将其大多数 CUDA 代码瞬间移植到 C++ 语言环境。立即购买 AMD FirePro S9300 双 GPU 服务器显卡,获得源自 AMD 、对开源友好的加速器。

支持 OpenCL™ 1.2

专业人士可以运用当今 GPU 和多核 CPU 的并行计算能力,在支持 OpenCL 的主要 CAD/CAM/CAE 和媒体娱乐应用程序中为计算密集型任务加速。AMD FirePro S9300 双 GPU 服务器显卡支持 OpenCL™ 1.2,开发者可以利用新特性为显卡提供更大的自由空间,来执行它们的既定任务。

13.9 TFLOPS 峰值单精度

助力加速处理单精度浮点计算任务,多用于仿真、视频增强、信号处理、视频转码和数字化渲染应用程序。AMD FirePro™ S9300 双 GPU 服务器显卡拥有 13.9 TFLOPS 的峰值单精度计算性能,您可以为 2P 服务器配置 8 个 GPU,以获得超过 111 TFLOPS 的峰值单精度计算性能。在标准的 42U 机架中安装 10个 4U 服务器,可获得超过 1 PFLOP 的单精度计算性能!

870 GFLOPS 的峰值双精度

助力加速处理双精度浮点计算任务,多用于计算流体力学、结构力学、油藏模拟和空气动力学等计算精度任务关键型的应用程序。

支持半精度 (FP16)

对于不需要 32 位数学运算精确度的开发者,现在通过 16 位运算即可获得高性能,同时更高效使用显存带宽和降低显存占用量。

8GB HBM 显存

HBM 是一种全新的显存设计,拥有低功耗和超宽的通信通道。它使用由微小导线(称为“硅通孔”(TSV))互连、直接置于中介层上垂直堆叠的显存芯片,缩短了信息在显存和处理器之间的传输距离。

AMD 跃频 (PowerTune) 技术

AMD 跃频 (PowerTune) 技术是一种智能电源管理系统,可同时监控 GPU 活动和能耗。它能够对 GPU 进行优化,当 GPU 工作负载不多时,降低功耗并提供上理想的时钟速度,确保 GPU 在处理高密集型工作负载时实现最佳性能。5

 规格

散热/功率/板型​

  • 最大功率:300W
  • 总线接口:PCIe® Gen 3 x16
  • 板型:双插槽、全长、全高
  • 散热:被动式

显存

  • 大小/类型:8GB HBM
  • 带宽:1TB/s (2x 512GB/s)

支持的 API 和操作系统

  • OpenCL™ 1.2
  • HC(异步计算)
  • C++ AMP
  • Linux® 64 位

支持的 AMD 技术

  • AMD跃频 (PowerTune) 技术5

系统要求

  • 基于 PCI Express® 的服务器,含一个可用的 x16 通道插槽。AMD 建议 PCI Express® v3.0 以获得上佳性能
  • 带有两个 PCIe 8 针辅助电源接口的电源装置
  • GPU 散热风量至少 25CFM,最高入口温度为 45C
  • 建议至少 16GB DDR3/DDR4 系统内存

保修与支持

  • 三年有限产品维修/更换保证
  • 可通过直拨免费电话和电子邮件联系技术支持团队7
  • 部件高级更换选项

 资源

GPUOpen Professional Compute

GPUOpen Professional Compute 通过优化的开源驱动程序/运行时以及基于标准的语言、代码库和应用程序,助力各种类型的开发者加速实现他们的理念,帮助解决他们在直观和高性能 GPU 计算方面的最大挑战。

了解详情

 客户案例:CGG

 

CGG 公司是尖端地球科学方面的领导者。CGG专注于创新,致力于为客户提供理想的可持续解决方案,助力应对能源挑战,并依托于此取得业界领先地位。他们为客户提供一系列独特的技术、服务和设备,帮助客户采集地球地下的高精确数据和影像。CGG 还提供领先的软件和服务来分析数据和深入了解地下情况,以进行油气藏的勘探、生产和优化。

CGG 最近在多个不同的 GPU 加速器(包括全新的 AMD FirePro™ S9300 双 GPU 服务器显卡)上进行了专属的波动方程建模基准测试。随着波动方程复杂度的增加,AMD FirePro™ S9300 双 GPU 服务器显卡的性能优势也突显出来,其速度比测试的任何其他显卡都要快 2 倍8

 

图表 CGG 由提供 

CGG 首席 IT 架构师 Jean-Yves Blanc 表示:“我们很高兴能采用 AMD FirePro™ 计算集群。另外,我们也为 AMD FirePro™ S9300 双 GPU 服务器显卡的 1TB/s 显存带宽所折服,在处理 CGG 的波动方程建模代码时,该显卡的性能是任何其他服务器显卡的 2 倍。”

CGG 的 Marc Tchiboukdjian 最近在莱斯大学做了一个关于异构计算可移植 API——GPUWrapper 的演讲。请点击下面的链接,观看 Marc 的演讲。

立即观看

 

2011 年 6 月 CGG 安装了其首个油浸式冷却计算系统。经过一段时间后,CGG 通过实施该解决方案学到了很多经验,其中包括:实际节省成本(资本支出和运营支出)、设备故障率、散热性能和操作问题。通过下面的视频链接,详细了解 CGG 震波图分析数据中心的油浸式冷却系统。

立即观看

 驱动程序

  

尾注