Radeon Vega 7nm

Vega 7nm 技术

Radeon MI60 versus MI25

提高每瓦特的性能

相对于上一代产品,业界首款 7nm GPU 设计显著提高每瓦特的性能1

autonomous driving car

优化的深度学习运算

适用于训练和推理

优化的深度学习运算具有综合的 FP16、FP32 和 INT8 功能,为客户提供增强的计算能力,以满足当今高效处理大数据的严苛系统要求,以训练深度学习中用到的和运行推理所需的复杂神经网络。

Ten Tech aerodynamics test

全球领先的双精度 PCIe® 加速器

面向 HPC 工作负载

AMD Radeon Instinct MI60 计算 GPU 具有超高速的双精度性能和高达 7.4 TFLOPS FP64 的性能,使全球的科学家和研究人员能够更高效地处理生命科学、能源、金融、汽车和航空航天、学术、政府、国防等多个行业的 HPC 并行代码。

Radeon Instinct MI50

AMD Infinity Fabric™ Link

先进的 GPU 间通信

高速直连 GPU 集群中的每个 GPU 有两个 Infinity Fabric Link,提供高达 200 GB/s 的 GPU 间传输带宽。       

新技术驱动新的计算时代

支持 PCIe® Gen 4

超高速 HBM2 显存

1TB/s 显存带宽

全芯片 ECC 和企业级 RAS

先进的系统 GPU 监控

MxGPU 虚拟化计算

支持大型基址寄存器

ROCm 开放式生态系统

Radeon Instinct MI60

Radeon Instinct MI60 加速器

深入探索全球领先的双精度 PCIe® 加速器1

Radeon Instinct MI50 加速器

深入探索深度学习

尾注
  1. AMD Performance Labs 于 2018 年 10 月 16 日前对“Vega20”架构的 Radeon Instinct MI50 和 MI60 加速器进行测量。  结果仅是估算值,可能存在差异。 性能可能不同,具体取决于是否使用最新的驱动程序。 电脑/系统制造商可能会采用不同的配置,从而得到不同的结果。 对 Radeon Instinct MI60 计算的结果为:29.5 TFLOPS 峰值半精度 (FP16)、14.75 TFLOPS 峰值单精度 (FP32) 和 7.3 TFLOPS 峰值双精度 (FP64) 浮点性能。 对 Radeon Instinct MI50 计算的结果为:24.96 TFLOPS 峰值半精度 (FP16)、12.48 TFLOPS 峰值单精度 (FP32) 和 6.24 TFLOPS 峰值双精度 (FP64) 浮点性能。 对于 Radeon Instinct MI50 | MI60 GPU,AMD TFLOPS 计算使用以下等式进行:从最高 DPM 状态获取核心时钟并乘以每个 GPU 的 xx 个 CU 来计算 FLOPS。然后,将该数字乘以存在于每个 CU 中的 xx 个流处理器。然后,对于 FP32,该数字乘以每个时钟 2 FLOPS。 如要计算 FP16 的 TFLOPS,会使用每时钟 4 FLOPS。  FP64 TFLOPS 速率是按 1/2 速率进行计算。 对 Radeon Instinct MI25 计算的结果为:24.6 TFLOPS 峰值半精度 (FP16)、12.3 TFLOPS 峰值单精度 (FP32) 和 768 GFLOPS 峰值双精度 (FP64) 浮点性能。 对于 Radeon Instinct MI25 GPU,AMD TFLOPS 计算使用以下等式进行:从最高 DPM 状态获取核心时钟并乘以每个 GPU 的 xx 个 CU 来计算 FLOPS。然后,将该数字乘以存在于每个 CU 中的 xx 个流处理器。然后,对于 FP32,该数字乘以每个时钟 2 FLOPS。 如要计算 FP16 的 TFLOPS,会使用每时钟 4 FLOPS。  FP64 TFLOPS 速率的计算按 1/16 速率得出。 行业支持文档/网页:http://www.tsmc.com/english/dedicatedFoundry/technology/7nm.htm https://www.globalfoundries.com/sites/default/files/product-briefs/product-brief-7lp-7nm-finfet-technology.pdf AMD 对外部/第三方的结果/数据未进行独立测试或验证,我们对其中的任何错误或遗漏概不负责。