什么是 DPU?
Feb 26, 2026
数据处理单元 (DPU) 是一种专用处理器,旨在从 CPU 分载网络、存储和安全任务。它能够加速现代数据中心中的数据传输和基础设施服务,从而提升效率和可扩展性,这对运行现代 AI 工作负载至关重要。
在本篇博文中,我们将深入探讨 DPU,了解它们在现代数据中心中扮演的角色,以及它们如何与其他关键数据中心组件协同工作。
DPU 简介
DPU 是专为处理高带宽、延迟敏感型数据传输相关任务而设计的处理器。DPU 常应用于数据中心及其他计算密集型领域,能通过从 CPU 接管高负载任务(如管理网络流量、加密数据、收集性能指标以及分载存储任务)来提升性能,从而帮助 CPU 更高效地运行。
DPU 还为企业提供了灵活性,使其无需更换硬件即可适应新的网络需求。这一点至关重要,特别是在人工智能、云计算和高性能计算场景中,这些领域对 AI 工作负载的需求正在快速增长,并推动带宽需求不断增加。
DPU 在变革现代数据中心的网络处理方式方面发挥着重要作用。通过从 CPU 分载关键的网络、安全和基础设施管理任务,DPU 使数据中心能够更加敏捷高效地运行。
为什么 DPU 对现代数据中心至关重要?
随着带宽需求逐步增长、工作负载日益复杂,DPU 在优化网络流量、提升吞吐量以及增强安全性方面发挥着关键作用。
无论是在数据中心部署,还是集成到先进的网络交换机中,DPU 对于构建高性能、可扩展且安全的数据中心网络都至关重要。
在数据中心中,CPU、GPU、DPU 和 AI NIC 如何协同工作?
在数据中心中,CPU、GPU、DPU 和 AI NIC 协同工作,从而确保在各个端点之间实现高效快速、安全可靠的数据传输。
CPU 负责管理工作负载、协调服务,并运行系统操作系统和应用,对数据中心至关重要。DPU 可承担 CPU 的部分任务,例如网络、存储和安全任务,从而帮助降低 CPU 开销并提高数据中心的整体效率。GPU 作为 AI 加速器,专注于处理 AI/机器学习工作负载,例如训练和推理。AI NIC 能够加速低延迟、高带宽的 GPU 通信,同时管理网络拥塞、增强可靠性,并为大规模 AI 数据中心优化网络性能。
让我们来研究一下,当用户使用云计算服务时,这一过程是怎样的。整个过程以用户请求触达云服务端点为起点。DPU 负责检查数据包,并将其从用户的计算机安全地路由到相应的服务。随后,CPU 负责处理应用逻辑并协调响应,同时 AI NIC 为 GPU 工作负载加速网络中的高速数据传输。最后,GPU 分析流量模式以检测异常并优化后续路由路径。
DPU 在数据中心内是如何部署的?
在现代数据中心中,DPU 通常集成在前端网络组件中,用于处理和加速进出基础设施的数据流量。其主要作用是分载并加速网络、存储和安全功能,从而充分提高整体系统吞吐量。
在某些场景下,DPU 的部署范围更广,通常位于服务器内部或主机层。DPU 也可部署在架顶式 (ToR) 智能交换机内部,并与传统的网络 ASIC 芯片结合使用。在这些部署中,DPU 将优先从 CPU 分载虚拟化、存储和安全任务,从而降低功耗并提升可扩展性。
更多详情,请点击此处了解 AMD 如何与超大规模云服务商及合作伙伴携手部署 DPU。
常见问题解答
DPU 与传统 NIC 有何区别?
NIC 负责处理基本的网络连接,而 DPU 则通过提供可编程计算功能来分载网络、存储和安全任务,从而降低 CPU 开销。
DPU、SmartNIC 和 AI NIC 之间有何区别?
SmartNIC 仅提供有限的分载能力,而 DPU 则具备完全可编程性并且可提供基础设施服务。AI NIC 针对 AI 工作负载进行了优化,而 DPU 则面向通用数据中心工作负载。
基于以太网的 AI 集群是否需要 DPU?
需要;DPU 可为以太网 AI 集群加速东西向流量、实施安全防护并优化存储,从而提升整体性能。