智能体 AI 让 CPU 重新成为 AI 数据中心关注焦点
Mar 14, 2026
要点速览:
- CPU 一直是 AI 发展过程中的重要一环,但随着智能体 AI 兴起,对逻辑处理和 GPU 管理的需求增加,CPU 的重要性提升到全新高度。
- 随着智能体 AI 快速普及,推理变成了多步骤工作流程,从而催生新的 CPU 算力需求。
- 在现代 AI 集群中,CPU 承担着保障加速器高效运转的核心系统工作,包括:任务调度、数据预处理、内存与 I/O 管理以及控制流程调度。
- AMD EPYC(霄龙)服务器 CPU 可帮助客户构建均衡、开放的 AI 基础设施,而且可与 AMD Instinct GPU、AMD Pensando 网络技术以及 AMD ROCm 软件栈无缝协同运行。
在去年 6 月的 AMD Advancing AI 活动上,AMD 董事长兼首席执行 Lisa Su 博士将智能体 AI 描述为一种全新应用形态:这些系统始终处于活动状态,不断访问数据、应用和服务,自主做出决策并完成复杂任务。
这些系统依赖高性能 GPU 实时生成洞察分析,但配套的基础设施同样重要。随着智能体 AI 日益活跃,需要依靠高性能 CPU 来协调工作流程、处理和传输数据,并管理围绕模型执行的大量操作。
虽然 GPU 擅长 AI 训练和许多推理任务所需的高吞吐量并行处理,但现代 AI 部署需要均衡的系统。CPU、GPU、网络和软件各司其职,共同确保在大规模部署场景中实现出色性能。
在这些部署环境中,CPU 负责编排工作负载、管理内存和数据传输,并支持企业应用在生产环境中与 AI 模型并行运行。这使得 CPU 的性能和能效变得比以往更加重要,成为决定现代 AI 基础设施整体性能的关键所在。
根据近期发布的数据,基于第五代 AMD EPYC(霄龙)CPU 的系统在单核性能上表现出众。1 在衡量性能功耗比的 SPECpower 测试2 中,AMD EPYC(霄龙)CPU 系统预计可实现性能功耗比大幅提升。
同样重要的是,x86 CPU 架构可为客户提供庞大成熟的软件生态系统优势,绝大多数企业工作负载均已在本地和云环境中原生运行;这意味着,无需重构、重新编译和维护多个代码库。
CPU 与 GPU 如何协同工作
在 AI 数据中心中,CPU 与 GPU 的关系就像是主教练与精锐队员之间的关系。
身为“主教练”的 CPU 负责制定策略、应对外部变化、把控时间节奏,并确保所有任务朝着正确的方向推进。GPU 则如同场上的队员,每一个 GPU 都专注于尽可能高效地完成某一项任务。
服务器 CPU 专为处理复杂任务、编排调度系统中的 GPU 资源而设计。它们从内存加载数据、为 GPU 做好预处理、精准协调数据准时送达,同时处理 GPU 运行所需的各类指令与数据。GPU 具有大量更小的核心,擅长高速处理更简单的重复性任务。
训练与推理场景之间的角色调整
在训练场景,GPU 能够充分发挥高吞吐量计算优势。神经网络高度依赖涉及大量数据网格的运算,而 AI 训练需要多块 GPU 反复处理海量数据,以便系统不断学习。
在训练过程中,CPU 负责管理并将数据馈送给 GPU,以确保 GPU 高效运行。CPU 还负责操作系统运行、内存管理和任务调度。工作内容虽多,但并不会给 CPU 造成压力。
随着大部分 AI 工作转向推理,CPU 的角色将从“组织调度者”转变为“注重结果的管理者”。GPU 仍负责执行大部分繁重的神经网络数学运算。但 CPU 需承担繁重的思考工作:收集数据、转发信息、解释结果并下达最终行动指令。在推理场景中,CPU 承担的职责更加繁重,需要同时承担控制、协调和复杂决策等工作。
正因如此,CPU 架构至关重要。
AMD 是小芯片设计的先驱。这种模块化设计使 AMD 能够灵活调整算力、I/O、内存带宽和功耗,为从核心企业应用和虚拟化到 GPU 编排和多步骤智能体 AI 工作流程的各类应用场景提供精准合理的算力资源。
智能体 AI 离不开 CPU
智能体 AI 是指能够自主规划、决策和采取行动而极少依赖人工干预的人工智能系统,而这类系统的兴起,对 CPU 的能力提出了更高要求。在 AI 智能体场景中,CPU 需要耗费更多的时间和逻辑算力来思考结果,而不是像传统推理那样仅仅返回响应。CPU 往往会在研判后调整指令,将任务重新下发给 GPU 进行多轮迭代运算,直至输出最终结果。
除了其他职责外,智能体 AI 系统中的 CPU 还需要管理工具调用、API 请求和内存查询。在理想情况下,CPU 在做这一切的同时还能让 GPU 保持忙碌。智能体 AI 的兴起促使 CPU 周期增加,因为 CPU 需要在智能体、企业应用和数据湖之间移动数据。
作为“主教练”的 CPU 不再只是负责最后时刻的收尾工作,而是要不断发力以达成目标。CPU 做出的每一项决策,直接决定 GPU 利用率、整体吞吐量,同时也深刻影响 AI 服务商最关注的总体拥有成本。
AMD EPYC(霄龙)服务器 CPU 重磅登场
智能体 AI 在持续扩展 AI 的能力边界,也印证了每一位数据中心架构师早已知晓的一个事实:为充分提升 AI 成效,需要依靠均衡的系统。GPU 将继续负责计算任务,但 CPU 在任务编排、效率优化和数据中心整合等方面的作用将愈发关键,确保在不增加数据中心占用空间或功耗的情况下为部署更多 AI 系统腾出空间。
AI 性能日渐由系统层面综合实力决定,而 AMD 具备得天独厚的优势,可以从 CPU、GPU、网络和开放软件栈等层面实现全方位优化,充分提升集群级性能功耗比。AMD EPYC(霄龙)CPU 与 AMD Instinct GPU 紧密集成,依托 AMD ROCm 软件栈打通整个系统,实现高效的 GPU 管理。
AMD 并未止步,而是在此基础上持续迭代升级。AMD 推出代号为“Venice”的新一代 EPYC(霄龙)CPU,旨在为即将到来的“Helios”机架级 AI 架构添能助力。“Venice”凭借在性能、密度与能效方面的显著优势,有望延续 AMD 在 AI 与通用工作负载领域的领先地位。
AI 正全面拉动算力需求增长,推动全球服务器迎来新一轮更新换代周期。凭借 AMD EPYC(霄龙)处理器,AMD 为客户提供坚实的 CPU 基础,助力客户规模化拓展未来业务,同时高效统筹调度所有高性能 GPU 资源。
单击此处了解 AMD 如何赋能智能体计算机。
附注
- 9xx5-210:SPECrate®2017_int_base 性能评估基于截至 2025 年 6 月 1 日的已发布结果及预估结果。配置:双路 AMD EPYC(霄龙)9755(SPECrate®2017_int_base 分数为 2840,总计 256 个核心,https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250407-47519.html)和双路 AMD EPYC(霄龙)9575F(SPECrate®2017_int_base 分数为 1700,总计 128 个核心,https://www.spec.org/cpu2017/results/res2025q1/cpu2017-20250310-46819.html)。
- 9xx5-217:基于截至 2025 年 5 月 29 日发布的 SPECpower_ssj® 2008 overall ssj_ops/watt 分数,双路 AMD EPYC(霄龙)9755 系统(128 核)实现出色能效提升;双路 AMD EPYC(霄龙)9965 系统(192 核)实现更高能效提升。
配置:
双路 EPYC(霄龙)9755:29,950 overall ssj_ops/watt:https://www.spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20240924-01460.html。
双路 EPYC(霄龙)9965:44,168 overall ssj_ops/watt:https://www.spec.org/power_ssj2008/results/res2025q2/power_ssj2008-20250407-01522.html。
SPEC® 和 SPECpower_ssj® 2008 是 Standard Performance Evaluation Corporation 的注册商标。请访问 www.spec.org 获取更多信息。结果基于 SPECpower_ssj2008 加权平均值(100%–10% 负载)。
结果可能会因 BIOS 与操作系统设置及版本、软件版本、工作负载配置等因素而有所不同。
- 9xx5-210:SPECrate®2017_int_base 性能评估基于截至 2025 年 6 月 1 日的已发布结果及预估结果。配置:双路 AMD EPYC(霄龙)9755(SPECrate®2017_int_base 分数为 2840,总计 256 个核心,https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250407-47519.html)和双路 AMD EPYC(霄龙)9575F(SPECrate®2017_int_base 分数为 1700,总计 128 个核心,https://www.spec.org/cpu2017/results/res2025q1/cpu2017-20250310-46819.html)。
- 9xx5-217:基于截至 2025 年 5 月 29 日发布的 SPECpower_ssj® 2008 overall ssj_ops/watt 分数,双路 AMD EPYC(霄龙)9755 系统(128 核)实现出色能效提升;双路 AMD EPYC(霄龙)9965 系统(192 核)实现更高能效提升。
配置:
双路 EPYC(霄龙)9755:29,950 overall ssj_ops/watt:https://www.spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20240924-01460.html。
双路 EPYC(霄龙)9965:44,168 overall ssj_ops/watt:https://www.spec.org/power_ssj2008/results/res2025q2/power_ssj2008-20250407-01522.html。
SPEC® 和 SPECpower_ssj® 2008 是 Standard Performance Evaluation Corporation 的注册商标。请访问 www.spec.org 获取更多信息。结果基于 SPECpower_ssj2008 加权平均值(100%–10% 负载)。
结果可能会因 BIOS 与操作系统设置及版本、软件版本、工作负载配置等因素而有所不同。