AMD 扩展锐龙 AI 嵌入式处理器产品组合,凭借可扩展、高能效 AI 计算技术为工业及 AI 边缘解决方案赋能助力

Mar 09, 2026

AMD Ryzen AI Embedded processor chip centered on teal futuristic digital grid background with glowing data lines.

新闻要点:

  • 全新处理器在保持紧凑尺寸的同时,CPU 核心数提升高达一倍,AI 吞吐量大幅提高,可助力打造新一代工业和机器人解决方案。
  • 从工业自动化、移动机器人到医疗成像,嵌入式系统开发者现在可以借助久经考验的开源软件栈 AMD ROCm 为边缘应用加速 AI 部署。

工厂自动化、移动机器人中的物理 AI 以及其他 AI 驱动的边缘应用正在快速发展,市场亟需强大的计算平台:这些平台需要在全天候运行的环境中,实现实时 AI 处理、稳定的性能表现以及长期可靠性。

为了满足这些需求,AMD 扩展其 AMD 锐龙 AI 嵌入式 P100 系列处理器产品组合。全新处理器具备高达 2 倍的 CPU 核心数、高达 8 倍的图形处理单元 (GPU) 计算能力,系统万亿次运算能力大约提升 36%。

面向高要求应用的可扩展 AI 算力

这些处理器在单个芯片上集成了 8 到 12 个“Zen 5”核心,可凭借高达 80 TOPS 的系统算力实现物理 AI 加速,凭借 AMD RDNA 3.5 显卡实现实时可视化,并依托基于 AMD XDNA 2 架构的神经处理单元 (NPU) 实现低延迟、高能效的 AI 推理。

从智能工厂的工业 PC 到自主机器人和医疗成像设备,这些新型 x86 嵌入式处理器针对新一代工业及更广泛的边缘 AI 应用场景进行了全面优化。具体应用场景包括:

  • 面向工业 PC 的智能机器视觉:全新处理器能够将可编程逻辑控制器 (PLC)、机器视觉和人机界面 (HMI) 整合到一台工业 PC 中,同时提供实时检测和流程优化所需的出色 CPU 性能。集成的 GPU 和 NPU 不仅可以加速多摄像头视觉和多种 HMI 仪表板,还能利用 DeepSORT、RAFT-Stereo、CenterPoint、GDR-Net、PaDiM 和 Llama 3.2-Vision 等模型实现低延迟的异常检测。
  • 面向自主运行系统的物理 AI 技术:对于移动机器人,这些处理器利用 CPU 管理导航、运动控制和路径规划,而 GPU 则处理多摄像头数据流,支持空间感知、视觉 SLAM 以及视觉-语言-动作 (VLA) 模型等高级 AI 工作负载。CPU 和 GPU 之间的统一内存架构可有效降低延迟,从而带来更出色的响应能力。NPU 则负责低功耗的“全天候”推理,利用 YOLOv12 和 MobileSAM 等模型实现对象检测和场景理解。
  • 3D 医疗成像与临床智能:这些处理器可在边缘端利用 U-Net、nnU-Net 和 MONAI 等模型,为超声波、内窥镜检查、组织分类和肿瘤检测等 3D 医疗成像业务赋能助力。它们还能通过 MedSigLIP 加速“图像转报告”工作流程,并借助 Med-PaLM 2 支持临床推理和问答。医疗领域的原始设备制造商 (OEM) 可以将成像、AI 分析和报告功能整合在一个可扩展、长生命周期的 x86 嵌入式平台上。

与上一代 AMD 锐龙嵌入式 8000 系列相比,P100 系列预计可实现高达 39% 的多线程性能提升,以及高达 2.1 倍的系统总算力 (TOPS) 提升2。全新处理器带来了卓越的 AI 性能功耗比,并支持几乎两倍于 P100 系列现有型号的虚拟机数量,以及更大规模的大语言模型(如 Llama3.2-Vision 11B),可承载更复杂的 AI 和混合工作负载。

ROCm 软件支持与虚拟化参考堆栈

依托对 AMD ROCm 开源软件生态系统的全面支持,为嵌入式应用引入了久经考验的开源 AI 软件栈。开发者可以运行标准 AI 框架,同时使用开源编译器、运行时和库;开发者可立即使用适用于嵌入式场景的现成模型,而无需重写代码。在编程层面,ROCm 软件采用开源的可移植异构计算接口 (Heterogeneous-computing Interface for Portability, HIP),将 GPU 编程与硬件解耦,消除了软件栈与硬件绑定所带来的厂商锁定。

依托紧密集成的 CPU、GPU 和 NPU 架构,可实现高效的工作负载划分,并在混合工作负载场景中保持可预测的低延迟;通过支持使用熟悉的框架和软件栈,有助于简化和加速各种应用场景中的开发与部署流程。得益于这种高度集成的设计,无需额外的外部组件即可实现先进的计算和图形处理能力,让 OEM 和系统集成商能够更轻松地设计可扩展的平台。

AMD “Zen 5” CPU 核心具备充足的隔离能力和性能余量,可以在单一平台上整合多项关键工作负载,并带来稳定的多任务处理体验。此外,AMD 还推出一整套垂直集成的虚拟化参考堆栈,旨在满足不同重要性的工业应用的多元需求。该参考堆栈基于 Xen 虚拟机管理器构建,可以在隔离的域中运行 Linux®、Windows®、Ubuntu® 和 RTOS 环境,从而保障安全性、实时性能和灵活性。在此基础上,我们最终打造出一种可扩展的开放架构,简化新一代嵌入式系统的设计流程并加速开发进程。

获得行业广泛支持

Advantech、congatec 和 Kontron 目前已推出基于 AMD 锐龙 AI 嵌入式 P100 处理器的量产产品。

  • “Advantech 很自豪地宣布推出基于可扩展 AMD 锐龙 AI 嵌入式 P100 处理器系列打造的一整套产品。产品涵盖模块计算机、单板计算机以及边缘 AI 和智能系统,通过利用经过优化的集成式 AI 架构,实现高效多任务处理,推动新一代边缘 AI 技术发展。”
    Advantech 嵌入式物联网部门副总裁 Aaron Su
  • “随着 AMD 锐龙 AI 嵌入式 P100 系列处理器的推出,congatec 得以借助高度通用的平台,扩展其面向嵌入式计算和边缘应用的模块计算机 (Computer-on-Module) 产品组合。该系列处理器提供 4 核至 12 核 CPU 与高度可扩展的 GPU 性能,客户因此能够根据具体应用需求,灵活而精准地配置性能、功耗与成本。从工业自动化到 AI 加速系统,随着边缘工作负载日益多样化,这种出色的灵活性变得至关重要。”
    congatec 产品线经理 Florian Drittenthaler
  • “对于边缘端工业应用和 AI 驱动型应用而言,AMD 锐龙 AI 嵌入式平台带来了重大变革。我们的 K4131-Px mITX 主板基于 P100 处理器,将配备 4 核至 12 核 APU,为客户带来一系列体积小巧紧凑但兼具出色计算性能与 AI 加速能力的解决方案。”
    Kontron 高级销售和业务开发经理 Thomas Stanik
Table chart of Ryzen AI Embedded P100 Series processors showing CPU cores, GPU, NPU TOPS, I/O, TDP, temps, and models P121–P132a across Industrial and Automotive grades.

配备 8 到 12 个核心的 AMD 锐龙 AI 嵌入式 P100 系列全新处理器目前已进入送样阶段,预计将于 2026 年 7 月正式量产出货。配备 4 到 6 个核心的 P100 系列全新处理器目前已进入送样阶段,预计将于 2026 年第二季度投入量产。

Share:

Article By


Related Blogs