Radeon Instinct™ MI25 Accelerator

面向机器智能和深度学习的卓越训练加速器

基于先进的 “VEGA” 图形架构,旨在轻松处理大型数据集和各种计算工作负载

64 个 nCU 运算单元,轻松加速超高的工作负载

高达 12.3 TFLOPS 的峰值 FP32 运算性能,轻松加速计算密集型机器智能

高达 24.6 TFLOPS 的峰值 FP16运算性能,轻松满足深度训练应用的需求

尖端显存技术:16GB HBM2 显存支持 ECC2高带宽缓存控制器 (HBCC)

被动式散热、全高、双槽设计,板载热设计功耗 (TDP) 300W – 适用于大多数标准服务器

面向虚拟计算工作负载的 MxGPU – 轻松提升数据中心的利用率和容量

先进的远程可管理性能,支持大型系统的简化 GPU 监控

ROCm logo

ROCm - 开放式 GPU 计算技术的新纪元

支持基于 GPU 的高性能计算 (HPC) 和超大规模计算的平台。

超级解决方案轻松满足您的计算需求

machine intelligence digital brain abstract image

机器智能和深度学习神经网络训练

  • 高性能 FP16 和 FP32 运算
  • 开放式软件 ROCm 平台支持高性能计算 (HPC) 级的机架规模
  • 经优化的 MIOpen 深度学习框架库
  • 大型基址寄存器 (BAR) 支持 mGPU 点对点传输
  • AMD EPYC™ 服务器处理搭配 Radeon Instinct™ 加速器,轻松带来卓越的计算密度和每节点性能
HPC

HPC 异构计算

  • 卓越的计算密度和每节点性能
  • 开放式软件 ROCm 平台支持高性能计算 (HPC) 级的机架规模
  • 开源 Linux 驱动程序、HCC 编译器、工具和程序库,轻松支持硬件底层控制
  • 开放的行业标准支持多个架构和行业标准的互连技术

Instinct™ MI25

GPU 规格
GPU Architecture
Vega
光刻
14nm FinFET
流处理器
4096
计算单元
64
峰值半精度 (FP16) 性能
24.6 TFLOPs
峰值单精度 (FP32) 性能
12.29 TFLOPs
峰值双精度 (FP64) 性能
768 GFLOPs
显存
显存大小
16 GB
显存类型
HBM2
显存带宽
484 GB/s
支持显存 ECC
板卡类型
外形规格
PCIe 插接卡
总线类型
PCIe 3.0 x16
热设计功耗(TDP)
300W
散热
被动
板宽
双插槽
板长
10.5" (267 mm)
板高
全高
外部电源连接器
2x PCIe 8-pin
其他特性
支持的技术
OpenCL 2.0
High Bandwidth Cache (HBC) Controller
流处理器个数
HPC and Machine Intelligence
支持的软件 API
DirectX
12.0 (feature level 12_1)
OpenGL
4.6
OpenCL
2.0
Vulkan
产品基本信息
产品家族
Radeon Instinct™
产品系列
Radeon Instinct™ MI Series
平台
Server
发布日期
June 2017