Radeon Instinct™ MI8 Accelerator

面向机器学习和深度学习推理应用的可扩展加速器。

基于 “Fiji” 图形架构,轻松满足机器学习和深度学习应用的需求

多达 64 个运算单元,轻松加速超高的工作负载

峰值 FP32 和 FP16 运算性能高达 8.2 TFLOPS,轻松加速计算密集型机器智能

峰值 FP16/FP32 性能高达 47 GFLOPS 每瓦。为机器智能和深度学习推理应用提供超高的每瓦性能

尖端显存技术:4GB HBM 显存

被动式散热设计,板载热设计功耗 (TDP) 175W – 适用于大多数标准服务器

面向虚拟计算工作负载的 MxGPU  – 轻松提升数据中心的利用率和容量

ROCm 软件平台提供开源的超大规模计算和高性能计算 (HPC) 级解决方案

ROCm logo

ROCm - 开放式 GPU 计算技术的新纪元

支持基于 GPU 的高性能计算 (HPC) 和超大规模计算的平台。

超级解决方案轻松满足您的计算需求

machine intelligence digital brain abstract image

深度学习推理

  • ROCm 软件平台提供开源的超大规模计算平台
  • 开源 Linux 驱动程序、HCC 编译器、工具和程序库,轻松支持深入硬件底层的全面控制
  • 经优化的 MIOpen 深度学习框架库
  • 大型基址寄存器 (BAR) 支持 mGPU 点对点传输
  • MxGPU SR-IOV 硬件虚拟化,大幅优化系统使用率
  • 开放的行业标准支持多个架构和行业标准的互连技术
HPC

HPC 异构计算

  • ROCm 软件平台提供开源 HPC 级平台
  • 开源 Linux 驱动程序、HCC 编译器、工具和程序库,轻松支持深入硬件底层的全面控制
  • MxGPU SR-IOV 硬件虚拟化,轻松优化系统使用率
  • 开放的行业标准支持多个架构和行业标准的互连技术

Instinct™ MI8

GPU 规格
GPU Architecture
Graphics Core Next (GCN) 3rd Gen
光刻
28nm
流处理器
4096
峰值半精度 (FP16) 性能
8.19 TFLOPs
峰值单精度 (FP32) 性能
8.19 TFLOPs
峰值双精度 (FP64) 性能
512 GFLOPs
显存
显存大小
4 GB
显存类型
High Bandwidth Memory (HBM)
显存带宽
512 GB/s
支持显存 ECC
可选
板卡类型
外形规格
PCIe 插接卡
总线类型
PCIe 3.0 x16
热设计功耗(TDP)
175W
散热
被动
板宽
双插槽
板长
6.0" (152 mm)
板高
全高
外部电源连接器
1x PCIe 8-pin
其他特性
支持的技术
OpenCL 2.0
支持的软件 API
DirectX
12.0 (feature level 12_0)
OpenGL
4.6
OpenCL
2.0
Vulkan
产品基本信息
产品家族
Radeon Instinct™
产品系列
Radeon Instinct™ MI Series
平台
服务器
发布日期
June 2017