全新第五代 AMD EPYC(霄龙)服务器 CPU
AMD EPYC(霄龙)9005 服务器 CPU 专为加速数据中心、云计算和 AI 工作负载而设计,助力企业将计算性能提升到全新水平。
面向 AI 的卓越 CPU1
AMD EPYC(霄龙)9005 服务器 CPU 性能卓越,全方位满足 AI 处理需求。
智能体 AI 时代
智能体 AI 超越了创建文本、图像和代码的范畴,进入到完成实际工作的阶段。它可以将一个目标分解为多个步骤,决定下一步做什么,使用软件工具,检索信息,完成任务,并监控进度。借助 AMD EPYC(霄龙)9005 服务器 CPU,您可以凭借出色的核心密度、卓越的能效和成本效益,以及对企业级 x86 软件生态系统的原生兼容性,来支持各种智能体 AI 工作负载。
卓越的 AI 推理性能
基于 AMD EPYC(霄龙)9005 CPU 的纯 CPU 型服务器能够高效处理大量 AI 工作负载,如具有 130 亿个及以下参数的语言模型、图像和欺诈分析或推荐系统。与上一代产品相比,运行两个第五代 AMD EPYC(霄龙)9965 CPU 的服务器可实现高达 2 倍的推理吞吐量提升。2
充分助力 GPU 加速
AMD EPYC(霄龙)9005 系列中的有些型号经过专门优化,在搭载 GPU 的系统中用作主机 CPU 时可帮助提高特定 AI 工作负载的性能,从而提高每台 GPU 服务器的投资回报率。例如,在涵盖 8 个模型与 4 个用例的几何平均推理性能测试中,搭载高频 AMD EPYC(霄龙)9575F CPU 且配备 8 个 GPU 的服务器,相比同规格 8 GPU 服务器,首个 token 生成速度提升最高可达 13%,且整体推理吞吐量提升 6.6%。3,4,5
经过优化的企业级性能
AMD EPYC(霄龙)9005 服务器 CPU 在提供出色性能的同时,在实现卓越能效和优化总体拥有成本 (TCO) 方面也体现出极大价值,可解决企业迫在眉睫的关键需求。
业界卓越的整数性能
基于 AMD EPYC(霄龙)9005 CPU 的服务器借助全新“Zen 5”核心在主要性能指标上表现出色,其中整数性能是参考基准的 2.3 倍。6
专为云计算而生
AMD EPYC(霄龙)9005 服务器 CPU 兼具卓越密度和性能,非常适合云计算工作负载。旗舰级 AMD EPYC(霄龙)9965 处理器拥有 192 个核心,能够支持更多的虚拟 CPU (vCPU) (1 个 vCPU 对应 1 个核心)。
卓越能效和 TCO 优势
如今,数据中心对能源的需求远超以往。AMD EPYC(霄龙)9005 服务器 CPU 沿袭了 AMD EPYC(霄龙)处理器的传统优势,带来出色的能效和总体拥有成本 (TCO)。
非凡性能、密度和能效
AMD EPYC(霄龙)9005 系列服务器 CPU 最多可配备 192 个“Zen 5”或“Zen 5c”核心,具有出色的内存带宽和性能。创新的 AMD 小芯片架构成就高性能、高能效解决方案,并且根据不同计算需求进行全面优化。
“Zen 5”
“Zen 5c”
型号规格
资源
附注
- 9xx-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。
- 9xx5-040A:XGBoost(每小时运行次数)吞吐量测试结果基于截至 2024 年 9 月 5 日的 AMD 内部测试。XGBoost 配置:v2.2.1,Higgs 数据集,32 核心实例,FP32 双路 AMD EPYC(霄龙)9965(总计 384 个核心),12 个 32 核心实例,1.5TB 24x64GB DDR5-6400(速率 6000 MT/s),1.0 Gbps NetXtreme BCM5720 千兆以太网 PCIe,3.5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®,Ubuntu® 22.04.4 LTS,6.8.0-45-generic(tuned-adm profile throughput-performance、ulimit -l 198078840、ulimit -n 1024、ulimit -s 8192),BIOS RVOT1000C(SMT=off、Determinism=Power、Turbo Boost=Enabled),NPS=1;双路 AMD EPYC(霄龙)9755(总计 256 个核心),1.5TB 24x64GB DDR5-6400(速率 6000 MT/s),1DPC,1.0 Gbps NetXtreme BCM5720 千兆以太网 PCIe,3.5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®,Ubuntu 22.04.4 LTS,6.8.0-40-generic(tuned-adm profile throughput-performance、ulimit -l 198094956、ulimit -n 1024、ulimit -s 8192),BIOS RVOT0090F(SMT=off、Determinism=Power、Turbo Boost=Enabled),NPS=1;双路 AMD EPYC(霄龙)9654(总计 192 个核心),1.5TB 24x64GB DDR5-4800,1DPC,2 个 1.92 TB Samsung MZQL21T9HCJR-00A07 NVMe®,Ubuntu 22.04.4 LTS,6.8.0-40-generic(tuned-adm profile throughput-performance、ulimit -l 198120988、ulimit -n 1024、ulimit -s 8192),BIOS TTI100BA(SMT=off、Determinism=Power),NPS=1。结果如下:CPU、第 1 次运行吞吐量、第 2 次运行吞吐量、第 3 次运行吞吐量、吞吐量中值、相对于基准的提升幅度、代际提升幅度 双路 Turin(192 核,NPS1)、1565.217、1537.367、1553.957、1553.957、3、2.41 双路 Turin(128 核,NPS1)、1103.448、1138.34、1111.969、1111.969、2.147、1.725 双路 Genoa(96 核,NPS1)、662.577、644.776、640.95、644.776、1.245、1 参照基准(64 核)、517.986、421.053、553.846、517.986、1、不适用 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-258:GPU 推理吞吐量测试结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以每秒处理的 token 数为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1;参照系统:搭载其他厂商处理器(共 128 个核心)的生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.2、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1 结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、1.053 NIM、gpt-oss-120b、1.133 NIM、qwen2_5-coder-32b-instruct、1.034 VLLM、Vllm_Deepseek_V3(R1)、1.036 VLLM、Vllm_Llama4_scout、1.049 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.073 NIM(多实例)、llama3.1-8b-instruct、1.144 NIM(多实例)、qwen2_5-coder-32b-instruct、1.014 整体几何平均值 1.066 最佳性能结果 1.144 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-259:GPU 推理延迟(输出首个 token 所需的时间)结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以秒为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1 ,结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、0.996 NIM、gpt-oss-120b、1.22 NIM、qwen2_5-coder-32b-instruct、1.062 VLLM、Vllm_Deepseek_V3(R1)、1.059 VLLM、Vllm_Llama4_scout、1.246 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.164 NIM(多实例)、llama3.1-8b-instruct、1.355 NIM(多实例)、qwen2_5-coder-32b-instruct、1.012 整体几何平均值 1.133 最佳性能结果 1.355 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-260:GPU 推理 token 延迟(平均每个输出 Token 所需的时间)结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以秒为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1,结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、1.053 NIM、gpt-oss-120b、1.128 NIM、qwen2_5-coder-32b-instruct、1.019 VLLM、Vllm_Deepseek_V3(R1)、1.025 VLLM、Vllm_Llama4_scout、1.025 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.062 NIM(多实例)、llama3.1-8b-instruct、1.102 NIM(多实例)、qwen2_5-coder-32b-instruct、1.033 整体几何平均值 1.055 最佳性能结果 1.128 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同
- 9xx5-002F:SPECrate®2017_int_base 性能评估基于截至 2025 年 12 月 11 日 www.spec.org 网站上发布的分数。
双路 AMD EPYC(霄龙)9654,96 核,360W,8452 美元,1830,5.083,0.217,https://www.spec.org/cpu2017/results/res2025q3/cpu2017-20250727-49206.html
双路 AMD EPYC(霄龙)9754,128 核,360W,10631 美元,1950,5.417,0.183,https://www.spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html
双路 AMD EPYC(霄龙)9755,128 核,500W,10931 美元,2850,5.70,0.261,https://www.spec.org/cpu2017/results/res2025q4/cpu2017-20250928-49776.html
双路 AMD EPYC(霄龙)9965,192 核,500W,11988 美元,3230,6.460,0.269,https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.html
SPEC®、SPEC CPU® 和 SPECrate® 是 Standard Performance Evaluation Corporation 的注册商标。请访问 www.spec.org 获取更多信息。采用截至 2025 年 12 月 11 日的 AMD CPU 价格。
- 9xx-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。
- 9xx5-040A:XGBoost(每小时运行次数)吞吐量测试结果基于截至 2024 年 9 月 5 日的 AMD 内部测试。XGBoost 配置:v2.2.1,Higgs 数据集,32 核心实例,FP32 双路 AMD EPYC(霄龙)9965(总计 384 个核心),12 个 32 核心实例,1.5TB 24x64GB DDR5-6400(速率 6000 MT/s),1.0 Gbps NetXtreme BCM5720 千兆以太网 PCIe,3.5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®,Ubuntu® 22.04.4 LTS,6.8.0-45-generic(tuned-adm profile throughput-performance、ulimit -l 198078840、ulimit -n 1024、ulimit -s 8192),BIOS RVOT1000C(SMT=off、Determinism=Power、Turbo Boost=Enabled),NPS=1;双路 AMD EPYC(霄龙)9755(总计 256 个核心),1.5TB 24x64GB DDR5-6400(速率 6000 MT/s),1DPC,1.0 Gbps NetXtreme BCM5720 千兆以太网 PCIe,3.5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®,Ubuntu 22.04.4 LTS,6.8.0-40-generic(tuned-adm profile throughput-performance、ulimit -l 198094956、ulimit -n 1024、ulimit -s 8192),BIOS RVOT0090F(SMT=off、Determinism=Power、Turbo Boost=Enabled),NPS=1;双路 AMD EPYC(霄龙)9654(总计 192 个核心),1.5TB 24x64GB DDR5-4800,1DPC,2 个 1.92 TB Samsung MZQL21T9HCJR-00A07 NVMe®,Ubuntu 22.04.4 LTS,6.8.0-40-generic(tuned-adm profile throughput-performance、ulimit -l 198120988、ulimit -n 1024、ulimit -s 8192),BIOS TTI100BA(SMT=off、Determinism=Power),NPS=1。结果如下:CPU、第 1 次运行吞吐量、第 2 次运行吞吐量、第 3 次运行吞吐量、吞吐量中值、相对于基准的提升幅度、代际提升幅度 双路 Turin(192 核,NPS1)、1565.217、1537.367、1553.957、1553.957、3、2.41 双路 Turin(128 核,NPS1)、1103.448、1138.34、1111.969、1111.969、2.147、1.725 双路 Genoa(96 核,NPS1)、662.577、644.776、640.95、644.776、1.245、1 参照基准(64 核)、517.986、421.053、553.846、517.986、1、不适用 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-258:GPU 推理吞吐量测试结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以每秒处理的 token 数为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1;参照系统:搭载其他厂商处理器(共 128 个核心)的生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.2、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1 结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、1.053 NIM、gpt-oss-120b、1.133 NIM、qwen2_5-coder-32b-instruct、1.034 VLLM、Vllm_Deepseek_V3(R1)、1.036 VLLM、Vllm_Llama4_scout、1.049 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.073 NIM(多实例)、llama3.1-8b-instruct、1.144 NIM(多实例)、qwen2_5-coder-32b-instruct、1.014 整体几何平均值 1.066 最佳性能结果 1.144 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-259:GPU 推理延迟(输出首个 token 所需的时间)结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以秒为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1 ,结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、0.996 NIM、gpt-oss-120b、1.22 NIM、qwen2_5-coder-32b-instruct、1.062 VLLM、Vllm_Deepseek_V3(R1)、1.059 VLLM、Vllm_Llama4_scout、1.246 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.164 NIM(多实例)、llama3.1-8b-instruct、1.355 NIM(多实例)、qwen2_5-coder-32b-instruct、1.012 整体几何平均值 1.133 最佳性能结果 1.355 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-260:GPU 推理 token 延迟(平均每个输出 Token 所需的时间)结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以秒为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1,结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、1.053 NIM、gpt-oss-120b、1.128 NIM、qwen2_5-coder-32b-instruct、1.019 VLLM、Vllm_Deepseek_V3(R1)、1.025 VLLM、Vllm_Llama4_scout、1.025 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.062 NIM(多实例)、llama3.1-8b-instruct、1.102 NIM(多实例)、qwen2_5-coder-32b-instruct、1.033 整体几何平均值 1.055 最佳性能结果 1.128 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同
- 9xx5-002F:SPECrate®2017_int_base 性能评估基于截至 2025 年 12 月 11 日 www.spec.org 网站上发布的分数。
双路 AMD EPYC(霄龙)9654,96 核,360W,8452 美元,1830,5.083,0.217,https://www.spec.org/cpu2017/results/res2025q3/cpu2017-20250727-49206.html
双路 AMD EPYC(霄龙)9754,128 核,360W,10631 美元,1950,5.417,0.183,https://www.spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html
双路 AMD EPYC(霄龙)9755,128 核,500W,10931 美元,2850,5.70,0.261,https://www.spec.org/cpu2017/results/res2025q4/cpu2017-20250928-49776.html
双路 AMD EPYC(霄龙)9965,192 核,500W,11988 美元,3230,6.460,0.269,https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.html
SPEC®、SPEC CPU® 和 SPECrate® 是 Standard Performance Evaluation Corporation 的注册商标。请访问 www.spec.org 获取更多信息。采用截至 2025 年 12 月 11 日的 AMD CPU 价格。