非凡计算性能实现卓越的 AI 和工作负载加速

主要特点
- 处理系统
- 可编程逻辑
- AI 引擎和 DSP 引擎
- 新一代 I/O
- 视频解码器单元
- 可编程片上网络

处理系统
Versal 自适应 SoC 中提供了三种类型的标量处理器,可支持各种应用需求。应用处理单元非常适合操作系统支持的复杂应用,实时处理单元非常适合需要低延迟、确定性以及实时控制的应用。独立平台管理控制器负责管理系统启动、安全性与调试。

可编程逻辑
可编程逻辑助力开发自定义计算块以应对不断变化的算法。Versal 自适应 SoC 中采用全新架构设计的逻辑使每个 CLB 的密度提高 4 倍,从而减少了成本高昂的全局布线。结合各种内存以及可编程 I/O,可编程逻辑助力用户为各种应用打造性能强大的加速器。

AI 引擎和 DSP 引擎
AI 引擎为基于矢量的算法提供高达 5 倍的计算密度。AI 引擎针对实时 DSP 和 AI/ML 计算进行了优化,可提供确定性的性能。
增强的 DSP 引擎支持多种新的运算和数据类型,包括单精度和半精度浮点以及复杂的 18x18 运算。

新一代 I/O
Versal Prime 系列有机结合 PCIe® Gen5/Gen4 合规性、高性能 GPIO、400G 高速加密 (HSC) 引擎*以及支持各种以太网配置的多速率以太网 MAC,可充分提高连接性和灵活性。此外,Versal Prime 系列器件还具有重新架构的低延迟 32.75Gb/s 收发器,而且某些器件还支持 58Gb/s 和 112Gb/s* 的 PAM4 收发器。
* 只有 VM2152 器件支持 400G HSC 引擎和 112Gb/s PAM4 收发器

视频解码器单元
功耗优化型硬视频解码器单元 (VDU) 包括多个视频解码器引擎 (VDE),支持 H.264 和 H.265,每个引擎可支持单个 4Kp60 数据流到多达 32 个 720p15 数据流。VDU 适合许多图像处理应用,在这些应用中,多路视频输入一个中心,在该中心进行解码和执行先进的 ML 算法。

可编程片上网络
可编程片上网络 (NoC) 在 Versal 自适应 SoC 架构中的不同计算引擎与集成 IP 块之间提供优化的多兆位互连,从而简化了时序收敛并节省了逻辑资源。NoC 编译器不仅提供优化的编程体验,同时还允许用户管理延迟和 QoS,可确保关键数据路径的优先级。
应用和行业

5G 无线与波束成形
波束成形带来巨大的信号处理需求,这些需求需要实时处理。自适应引擎处理状态控制和数据格式化时,AI 引擎和 DSP 引擎会同时处理定点和浮点信号处理工作负载,以实现高性能并行处理。
数据中心计算
随着卷积神经网络的不断发展,通过 Versal AI Core 系列器件可以解决不断增长的计算密度要求,Versal AI Core 系列器件的 AI 引擎经过优化,可有效提供计算密度,既节省成本又节省能源。


面向智慧城市的视频处理
Versal AI Core 系列器件助力实现在智慧城市边缘部署大量全新视频处理应用,包括由 AI 引擎驱动的实时车牌识别、面部识别或对象分类、用于视频转码的视频解码器单元和用于视频缩放、压缩与自定义的自适应引擎。
医疗图像处理
Versal AI Core 系列可加速并行波束成形和实时图像处理,以创建更高质量的图像和基于机器的图像分析,从而使内科医生和放射科医生能够更快、更准确地进行诊断。


雷达处理
将功能强大的、基于矢量的 DSP 引擎与较小尺寸的 AI 引擎相结合,可实现先进的雷达应用,例如有源电子扫描阵列。AI Core 系列器件在单个封装中提供每秒兆位的天线带宽。
无线测试设备
实时 DSP 被广泛用于无线通信测试设备中。Versal AI Engine 架构非常适合用于处理所有类型的协议实现,包括从数字前端到波束成形和基带的 5G。

产品规格
处理子系统特性
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
应用处理单元 | 双核 Arm® Cortex®-A72、48 KB/32 KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC | |||||
实时处理单元 | 双核 Arm Cortex-R5F、32 KB/32 KB L1 高速缓存以及支持 ECC 的 256 KB TCM | |||||
内存 | 支持 ECC 的 256 KB 片上内存 | |||||
连接 | 以太网 (x2)、USB 2.0 (x1)、UART (x2)、SPI (x2)、I2C (x2)、CAN-FD (x2) |
AI 引擎和 DSP 引擎的特性
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
AI 引擎 | 198 | 304 | 300 | 400 | 0 | 0 |
AI 引擎-ML | 0 | 0 | 0 | 0 | 152 | 304 |
DSP 引擎 | 1032 | 1312 | 1600 | 1968 | 984 | 1312 |
可编程逻辑特性
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
系统逻辑单元 (K) | 815 | 981 | 1586 | 1968 | 820 | 1139 |
LUT | 372352 | 448512 | 725000 | 899840 | 375000 | 520704 |
基础平台特性
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
NoC 主端口/NoC 从端口 | 21 | 21 |
28 | 28 | 21 | 21 |
DDR 内存控制器 | 3 | 3 |
4 | 4 | 3 | 3 |
支持 DMA (CPM) 的 PCIe® | 1 x Gen4x16 |
1 x Gen4x16 |
1 x Gen4x16 |
1 x Gen4x16 |
2 x Gen5x8 |
2 x Gen5x8 |
PCI Express® | 4 x Gen4x8 | 4 x Gen4x8 | 4 x Gen4x8 | 4 x Gen4x8 | 4 x Gen5x4 | 4 x Gen5x4 |
100G 多速率以太网 MAC | 3 | 4 | 4 | 4 | 2 | 2 |
视频解码器引擎 (VDE) | - | - | - | - | 2 | 4 |
GTY 收发器 | 32 | 44 | 44 | 44 | 0 | 0 |
GTYP 收发器 | 0 | 0 | 0 | 0 | 321 | 321 |
1.16 GTYP 收发器专门用于 CPM5,主要针对 PCI Express 的使用情况。
面向所有开发者
AMD 提供优秀的软件开发环境以供开发者利用自适应 SoC 和 FPGA 开展设计工作,其中包括各种工具(编译器、仿真器等)、IP 和解决方案。
该环境不但可以帮助开发者缩短开发时间,还可以助力实现更出色的性能功耗比。这些工具可帮助AI 科学家、应用与算法工程师、嵌入式软件以及传统硬件等各类开发者使用 AMD 自适应计算解决方案。

立即体验
利用该套件提供的经过验证的硬件、软件支持、工具、设计示例和文档,快速启动您的设计周期,并实现快速上市。

通过 Versal AI Core 系列 VCK190 评估套件启动开发
立即通过支持 VC1902 器件的 VCK190 评估套件启动 Versal AI Core 系列的功能评估。凭借针对信号处理和 ML 推理进行优化的片上 AI 引擎,该平台非常适合开发计算密集的延迟敏感型 DSP 及 ML 应用。利用该套件提供的经过验证的硬件、软件支持、工具、设计示例和文档,快速启动您的设计周期,并实现快速上市。
资源

随时掌握最新动态
加入 Versal 自适应 SoC 通知列表,及时接收最新动态与资讯。