高性能计算的加速器

​​不断演进,灵活应变,自我学习

AMD EPYC™ 服务器处理器和 Radeon Instinct™ GPU 加速器开创机器智能和高性能计算 (HPC) 的异构计算新纪元。

AMD EPYC™ Radeon Instinct™

开创高性能计算和深度学习扩展计算的新纪元

要真正加快深度学习的步伐并解决数据中心的广泛需求,需要结合高性能计算和经过优化的 GPU 加速,通过分发给各核心的大量浮点运算来处理海量数据。如今大型系统设计人员也需要能够设计兼具灵活性和开放性的高效系统,并能够轻松进行系统配置以应对当今繁重的工作负荷。

AMD 为设计人员带来众多功能,使他们能在开放而灵活的环境中轻松实现服务器的优化设计,大幅提升性能、能效并降低延迟,从而把可实现的计算密度提升到更高水平。随着搭载全新 EPYC 处理器的服务器及 Radeon Instinct GPU 加速器的问世,加上我们的 ROCm 开放式软件平台,AMD 正在开创高性能计算和深度学习的异构计算新纪元。

Radeon Instinct™ MI25 服务器加速器

AMD 推出基于开放式标准的 Radeon Instinct 系列产品,开启数据中心的高性能计算和机器智能的新纪元,彻底改变行业格局。Radeon Instinct 加速器结合我们打造的开放式异构计算生态体系,能够大幅提升可达到的性能、能效水平和灵活性,构建卓越的系统,轻松应对当今以数据为核心的繁重工作负载。

全新 Radeon Instinct MI25 加速器基于 AMD 新一代“Radeon Vega”架构,搭载强大的并行运算引擎。它是享誉全球的训练加速器,适用于大规模的深度学习应用,可轻松处理高性能计算工作负载,提供高达 24.6 TFLOPS 的 FP16 和 12.3 TFLOPS 的 FP32 峰值浮点性能。1 超强性能结合开放式 ROCm 软件平台以及先进的 GPU 显存架构、16GB 的 HBM2,以及高达 484 GB/s 的显存带宽,堪称当今计算工作负载的超级解决方案。

Radeon Instinct MI25 主要特性:

  • 基于 AMD 的新一代“Radeon Vega”架构和先进的 GPU 显存架构
  • 为高性能计算和深度学习提供卓越的 FP16 和 FP32 性能
  • ROCm 开放式软件平台,适合高性能计算级的机架规模
  • 大型基址寄存器 (BAR) 支持 mGPU 点对点传输
  • MxGPU SR-IOV 硬件虚拟化技术,用于实现更优的数据中心使用率

配备新型 AMD EPYC™ 处理器的服务器搭配 Radeon Instinct MI25 加速器,可实现卓越的计算密度和每节点性能。

开放式 ROCm 软件平台为全球级数据中心系统设计奠定基础,可为 Linux® 驱动程序、编译器、工具和数据库带来性能优化;搭配 AMD 的安全硬件虚拟化 MxGPU 技术,可让我们的客户改变设计系统的方式以实现更高效率,推动实现数据中心使用率和性能的优化。

了解更多


 

ROCm 开放式软件平台

ROCm 开源软件平台为高性能计算 (HPC) 级别的异构计算和世界级数据中心系统设计的开源根基。ROCm 平台提供性能优化的 Linux® 驱动、编译器、工具和代码库。ROCm 软件设计理念包括编程选择自由、极简和模块化软件开发方式,能够进一步优化 GPU 加速器运算。
 
此方法结合 AMD 的安全硬件虚拟化 MxGPU 技术,使系统设计师得以轻松改变设计系统的方式,从而实现更高的效率、不断优化数据中心的利用率和处理能力。

ROCm 基础特性:

HSA Foundation logo ​ ROCm Platform logo
  • 开放式 Linux® 64 位驱动程序和丰富的系统运行栈,为超大规模和高性能计算级的运算而优化。
  • 多 GPU 计算使用驱动程序中的直接 RDMA 对等同步支持,来支持通过 RDMA 的服务器节点来回通讯。
  • 简化编程设计模型,在需要时也可让开发人员掌控。
  • HCC 真正的单一源 C++ 异步编译器可进行整个系统寻址,而不仅限于单一设备。
  • HIP CUDA 转换工具为GPU 计算 API 的使用提供平台选择。

ROCm 开放式软件平台通过优化开放式 Linux 驱动程序和不受语言影响的丰富 ROCr 系统运行库,为大规模机器智能和高性能计算数据中心部署提供稳固的基础,并大量使用异构系统架构 (HSA) 运行库 API。这可为执行编程语言 (例如 HCC C++、Khronos Group’s OpenCL™、Continuum’s Anaconda Python 和 HIP CUDA 转换工具) 提供深厚基础。2

AMD 将持续倡导开放路线,加大对 NUMA 类加速所需关键功能的支持,进而优化对我们的 Radeon™ GPU 加速器,鼎力支持高性能计算和深度学习部署。ROCm 平台现在支持我们的全新 Radeon Instinct GPU 加速器系列产品,并仍将支持我们的其他 AMD FirePro™ S 系列、Radeon™ RX 系列和 Radeon™ Pro Duo 显卡。请访问 ROCm 网站,以查看所支持显卡的完整清单。


OpenCL™、OpenMP 及 OpenACC 支持

OpenCL  

AMD 的最新产品继续支持这些标准3。我们相信,高性能计算业界中大多数人都希望开放标准成为他们运行项目和仿真测试的实际手段;对于这一目标,AMD 给予了坚定的支持,目前正在广泛地与业界中的合作伙伴合作,推动开放标准向前发展。

 AMD FirePro™ S 系列加速器

AMD FirePro™ S9300 x2 

​AMD FirePro™ S9300 x2 加速器显存带宽高达 1Tb/s 的 GPU 加速器在进行数据分析或震波图分析时,利用超快的单精度计算 GPU 加速器 AMD FirePro™ S9300 x2 服务器 GPU 加快尤为复杂的 HPC 工作负载的处理速度。4, 5利用我们的开发人员页面 http://www.gpuopen.com/?sessionGUID=19a21a7b-29e9-525c-9876-67ad3aeb2e79&webSyncID=79e9a94d-12cd-1236-3665-5eacc850c9cd&sessionGUID=e8485a29-c782-b424-5038-bdc37a33c4e8 中提供的供您随意使用的众多工具及库。

我们的一家客户 CGG 近期所做的测试。CGG 是尖端地球科学领域的领导者,该公司近期在多台不同的 GPU 加速器上(包括全新 AMD FirePro™ S9300 x2 GPU)进行了专有性波动方程建模基准测试。随着波动方程复杂程度的增加,AMD FirePro™ S9300 x2 GPU 的性能优势也随之增加,其速度无与伦比。6

Wave Table 

上图由 CGG 提供

AMD FirePro™ S9100、S9150 和 S9170 加速器

需要出色双精度性能的用户可以考虑采用 AMD FirePro™ S9100 系列加速器。AMD FirePro™ S9150 为 2014 Green500 排行榜上名列前茅的超级计算机所采用,性能出类拔萃。7

请观看 David Rohr 博士和 Lindenstruth 教授谈论在 2014 Green500 排行榜中名列前茅的超级计算机 L-CSC 群集的采访视频。

 

​DGEMM 又称双精度一般矩阵相乘,它测量双精度真实矩阵相乘的浮点执行速率。利用双精度矩阵运算的真实应用程序有很多。这其中包括计算流体动力学、有限元分析与结构建模及分子动力学。

由于 AMD FirePro™ S9150 GPU 实施了 AMD OpenCL BLAS,我们获得了 2 TFLOPS 的 DGEMM 性能。

AMD FirePro™ S9170 GPU 为需要大型矩阵相乘功能的用户提供了完美选择,使他们可以利用此显卡 32GB 超大 GDDR5 显存,轻松判断地

 AMD FirePro™ S 系列的规格

AMD FirePro™ 服务器 GPU 解决方案构筑高性能计算系统

无论是计算流体动力学领域学术研究,还是寻求地震处理和油藏模拟的石油及天然气行业,AMD FirePro™ S 系列服务器 GPU 都可提供完整的产品组合,以满足您的任何需求。AMD FirePro 服务器 GPU 采用尖端单精度和双精度计算性能,可以满足要求大规模 GPU 并行处理能力的任何计算复杂项目的需求。4

​S9100​S9150S9170​​​S9300 X2​
​​AMD FirePro™ S9300 x2​​
​GCN 流处理器​2560​2816​2816​​8192
​单精度 (GFLOPS)​4220​50705240​13900​
​双精度 (GFLOPS)​2110​2530​2620​​​870
​板载显存​12GB GDDR5​16GB GDDR5​32​GB GDDR58GB HBM​
​ECC有(外部)​有(外部)​​有(外部)​​没有
​显存带宽 (GB/S)​320​320​​320​​1024
​接口PCIe 3.0,双插槽​PCIe 3.0,双插槽​PCIe 3.0,双插槽​PCIe 3.0,双插槽
最大功率​225W​235W​2​75W​​300W
​散热被动式散热​被动式散热​被动式散热​被动式散热
推荐应用的领域

​双精度工作流程,如:

科研和政府机构的计算机群集

油气行业的油藏模拟

双精度工作流程,如:

科研和政府机构的计算机群集

油气行业的油藏模拟

双精度工作流程,如:

科研和政府机构的计算机群集

油气行业的油藏模拟​

​单精度工作负载,如:

分子动力学

地理科学

深度神经网络/机器学习

 销售点

许多 OEM 和系统集成商都可以提供 AMD FirePro™ 加速器,其中包括 Dell、HPE 和 SuperMicro 等。

Dell ​ ​ ​ ​​ ​HPE
 ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​ SuperMicro ​ ​ ​ ​​ 
​​

有关配备 AMD FirePro™ GPU 的 Dell 服务器的更多信息,请访问 www.amd.com/dell-server

有关配备 AMD FirePro™ GPU 的 HPE 服务器的更多信息,请访问 www.amd.com/hpe

 

 

 

 

 

尾注