成就今日
启迪未来

 AMD FirePro™ 加速器 轻松实现高性能计算

​​显存带宽高达 1Tb/s 的 GPU 加速器

在进行数据分析或震波图分析时,利用超快的单精度计算 GPU 加速器 AMD FirePro™ S9300 x2 服务器 GPU 加快尤为复杂的 HPC 工作负载的处理速度。6,7

了解更多
AMD FirePro™ S9150 Server GPU

AMD FirePro™ 加速器是为 HPC 打造的卓越解决方案,具有出色的密度和优异的每瓦特效能。随着研究机构、政府部门及其他科技工程公司认识到 GPU 加速在处理复杂数据集方面的优势,每年出现在 Green500™ 排行榜上的配备 GPU 显卡加速器的超级计算机越来越多。

AMD 为 HPC 领域带来尖端科技,在业内不断引起轰动。2014 年,搭载 AMD FirePro™ S9150 的 L-CSC 超级计算机在 Green500(全世界能效超高的超级计算机排行榜)上位列第一。2015 年,AMD 推出了带 32GB GDDR5 显存的 GPU——FirePro™ S9170,这是目前 GPU 显存的板载显卡,并在 2016 年新推出了加速器 AMD FirePro™ S9300 x2,该显卡提供 1Tb/s 显存带宽,采用尖端的 HBM 显存技术。所有这些产品与功能可提升在数据中心使用加速器的体验,由于认识到这些解决方案的性能潜力和优势,采用该技术的机构日趋增多。

GPUOpen 与 Radeon 开放式计算平台 (ROCm)

HSA Foundation logo ​ ROCm Platform logo

ROCm 平台为 GPU 计算研究带来了新机会。ROCm 由三个核心基本元素组成:

  • 针对 HPC 及超大规模类计算优化的全新 Linux® 驱动程序和运行时堆栈,
  • 能够妥善处理整个系统而不是单个设备的异构性 C 和 C++ 编译器
  • 允许进行 CUDA 代码转换的 HIP 工具,满足了采用 GPU 计算 API 时的平台选择需求

利用我们的 HSA 标准及更重要的 HSA 1.0 Runtime 知识,AMD 得以成功地将支持扩展到采用 NUMA 类加速关键功能的加速器。因此,Radeon Open Compute Kernel (ROCK) 驱动程序由多个基于我们开发的针对 APU 的异构系统架构组件组成,其中包括全新的 AMD GPU 驱动程序、Kernel Fusion Driver (KFD)、HSA+ Runtime 及为建立关键语言支持而开发的基于 LLVM 的编译堆栈。ROCm 平台现在支持 FirePro™ S9300 x2、S9170、S9150、W9100 显卡以及 Radeon™ RX 系列、R9 Nano 和 Pro Duo 显卡。​

OpenCL™、OpenMP 及 OpenACC 支持

OpenCL  

AMD 的最新产品继续支持这些标准1。我们相信,高性能计算业界中大多数人都希望开放标准成为他们运行项目和仿真测试的实际手段;对于这一目标,AMD 给予了坚定的支持,目前正在广泛地与业界中的合作伙伴合作,推动开放标准向前发展。

 AMD FirePro™ S 系列加速器

AMD FirePro™ S9300 x2 

​AMD FirePro™ S9300 x2 加速器显存带宽高达 1Tb/s 的 GPU 加速器在进行数据分析或震波图分析时,利用超快的单精度计算 GPU 加速器 AMD FirePro™ S9300 x2 服务器 GPU 加快尤为复杂的 HPC 工作负载的处理速度。2,3利用我们的开发人员页面 www.gpuopen.com 中提供的供您随意使用的众多工具及库。

我们的一家客户 CGG 近期所做的测试。CGG 是尖端地球科学领域的领导者,该公司近期在多台不同的 GPU 加速器上(包括全新 AMD FirePro™ S9300 x2 GPU)进行了专有性波动方程建模基准测试。随着波动方程复杂程度的增加,AMD FirePro™ S9300 x2 GPU 的性能优势也随之增加,其速度无与伦比。4

Wave Table 

上图由 CGG 提供

AMD FirePro™ S9100、S9150 和 S9170 加速器

需要出色双精度性能的用户可以考虑采用 AMD FirePro™ S9100 系列加速器。AMD FirePro™ S9150 为 2014 Green500 排行榜上名列前茅的超级计算机所采用,性能出类拔萃。5

请观看 David Rohr 博士和 Lindenstruth 教授谈论在 2014 Green500 排行榜中名列前茅的超级计算机 L-CSC 群集的采访视频。

 

​DGEMM 又称双精度一般矩阵相乘,它测量双精度真实矩阵相乘的浮点执行速率。利用双精度矩阵运算的真实应用程序有很多。这其中包括计算流体动力学、有限元分析与结构建模及分子动力学。

由于 AMD FirePro™ S9150 GPU 实施了 AMD OpenCL BLAS,我们获得了 2 TFLOPS 的 DGEMM 性能。

AMD FirePro™ S9170 GPU 为需要大型矩阵相乘功能的用户提供了完美选择,使他们可以利用此显卡 32GB 超大 GDDR5 显存,轻松判断地

 AMD FirePro™ S 系列的规格

AMD FirePro™ 服务器 GPU 解决方案构筑高性能计算系统

无论是计算流体动力学领域学术研究,还是寻求地震处理和油藏模拟的石油及天然气行业,AMD FirePro™ S 系列服务器 GPU 都可提供完整的产品组合,以满足您的任何需求。AMD FirePro 服务器 GPU 采用尖端单精度和双精度计算性能,可以满足要求大规模 GPU 并行处理能力的任何计算复杂项目的需求。2

​S9100​S9150S9170​​​S9300 X2​
​​AMD FirePro™ S9300 x2​​
​GCN 流处理器​2560​2816​2816​​8192
​单精度 (GFLOPS)​4220​50705240​13900​
​双精度 (GFLOPS)​2110​2530​2620​​​870
​板载显存​12GB GDDR5​16GB GDDR5​32​GB GDDR58GB HBM​
​ECC有(外部)​有(外部)​​有(外部)​​没有
​显存带宽 (GB/S)​320​320​​320​​1024
​接口PCIe 3.0,双插槽​PCIe 3.0,双插槽​PCIe 3.0,双插槽​PCIe 3.0,双插槽
最大功率​225W​235W​2​75W​​300W
​散热被动式散热​被动式散热​被动式散热​被动式散热
推荐应用的领域

​双精度工作流程,如:

科研和政府机构的计算机群集

油气行业的油藏模拟

双精度工作流程,如:

科研和政府机构的计算机群集

油气行业的油藏模拟

双精度工作流程,如:

科研和政府机构的计算机群集

油气行业的油藏模拟​

​单精度工作负载,如:

分子动力学

地理科学

深度神经网络/机器学习

 销售点

许多 OEM 和系统集成商都可以提供 AMD FirePro™ 加速器,其中包括 Dell、HPE 和 SuperMicro 等。

Dell ​ ​ ​ ​​ ​HPE
 ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​ SuperMicro ​ ​ ​ ​​ 
​​

有关配备 AMD FirePro™ GPU 的 Dell 服务器的更多信息,请访问 www.amd.com/dell-server

有关配备 AMD FirePro™ GPU 的 HPE 服务器的更多信息,请访问 www.amd.com/hpe

  

  

  

  

  

尾注