AI를 위한 선도적인 CPU1
AMD EPYC™ 9005 서버 CPU는 종합적인 AI 성능을 제공합니다.
서버당 성능 극대화
AMD EPYC™ 9005 CPU는 최대 88% 적은 랙2으로 레거시 하드웨어의 정수 성능을 구현할 수 있으므로 물리적 설치 공간, 전력 소비 및 필요한 소프트웨어 라이선스 수를 획기적으로 줄여 신규 또는 확장된 AI 워크로드를 위한 공간을 확보할 수 있습니다.
앞서가는 AI 추론 성능
130억 개 이하의 파라미터를 가진 언어 모델, 이미지 및 사기 분석 또는 추천 시스템 등 많은 AI 워크로드가 AMD EPYC™ 9005 CPU를 탑재한 CPU 전용 서버에서 효율적으로 실행됩니다. 2개의 5세대 AMD EPYC 9965 CPU를 실행하는 서버는 이전 세대 제품에 비해 최대 2배의 추론 처리율을 제공합니다.3
GPU 가속 극대화
AMD EPYC™ 9005 제품군에는 일부 AI 워크로드의 성능을 높이고 각 GPU 서버의 ROI를 개선할 수 있도록 GPU 지원 시스템용 호스트 CPU로 최적화된 옵션이 포함되어 있습니다. 예를 들어 모델 8개와 사용 사례 4개에서 시행한 기하평균 추론 성능 테스트 결과, GPU 8개를 장착한 고주파 AMD EPYC 9575F CPU 기반 서버는 인텔 제온 6960P CPU로 구동되는 동급 8개의 GPU 서버 대비 첫 토큰까지 시간이 최대 13% 더 빨랐고 전체 추론 처리량이 6.6% 더 높았습니다.4,5,6
엔터프라이즈 성능 최적화
AMD EPYC 9005 서버 CPU는 뛰어난 성능을 제공하는 동시에 앞서가는 에너지 효율성 및 소유 비용(TCO) 가치를 실현하여 주요 비즈니스 필수 요건을 지원합니다.
업계를 선도하는 정수 성능
AMD EPYC 9005 CPU 기반 서버는 새로운 'Zen 5' 코어를 활용하여 주요 경쟁 제품에 비해 2.3배의 정수 성능을 비롯한 강력한 메인스트림 성능 지표를 제공합니다.7
클라우드를 위한 설계
AMD EPYC™ 9005 서버 CPU는 클라우드 워크로드를 위한 밀도와 성능을 제공합니다. 192코어의 최상급 AMD EPYC 9965 프로세서는 가용한 최상의 최신 인텔® 제온 6E "Sierra Forest" 144코어 프로세서(vCPU당 1코어)에 비해 33% 더 많은 가상 CPU(vCPU)를 지원합니다.
앞서가는 효율성 및 TCO
데이터 센터는 그 어느 때보다 많은 에너지를 필요로 합니다. AMD EPYC™ 9005 서버 CPU는 이전 세대의 AMD EPYC에서 볼 수 있는 에너지 효율성과 TCO 이점을 지속적으로 제공합니다.
앞서가는 성능, 밀도, 효율성
AMD EPYC 9005 시리즈 서버 CPU에는 뛰어난 메모리 대역폭 및 용량을 갖춘 최대 192개의 "Zen 5" 또는 "Zen 5c" 코어가 포함됩니다. 혁신적인 AMD 칩렛 아키텍처는 서로 다른 컴퓨팅 요구에 최적화된 고성능의 에너지 효율적 솔루션을 가능하게 합니다.
“Zen 5”
“Zen 5c”
모델 사양
리소스
각주
- 9xx-151: 2025년 4월 1일 기준 여러 VM 인스턴스를 실행하는 AMD 내부 테스트에 기초한 TPCxAI @SF30 다중 인스턴스 32C 인스턴스 크기 처리율 결과. 종합적인 엔드 투 엔드 AI 처리율 테스트는 TPCx-AI 벤치마크에서 파생되었으며, 엔드 투 엔드 AI 처리율 테스트 결과가 TPCx-AI 스펙을 준수하지 않기 때문에 게시된 TPCx-AI 결과와 비교할 수 없습니다. 2P AMD EPYC 9965(6067.53 총 AIUCpm, 총 코어 384개, 500W TDP, AMD 참조 시스템, 1.5TB 24x64GB DDR5-6400, 40GbE Mellanox CX-7(MT2910), 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe 2개, Ubuntu® 24.04 LTS 커널 6.13, SMT=ON, Determinism=power, Mitigations=on) 2P AMD EPYC 9755(4073.42 총 AIUCpm, 총 코어 256개, 500W TDP, AMD 참조 시스템, 1.5TB 24x64GB DDR5-6400, 40GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe 2개, Ubuntu 24.04 LTS 커널 6.13, SMT=ON, Determinism=power, Mitigations=on) 2P Intel Xeon 6980P (3550.50 총 AIUCpm, 총 코어 256개, 500W TDP, 프로덕션 시스템, 1.5TB 24x64GB DDR5-6400, 1GbE Broadcom NetXtreme BCM5719 기가비트 이더넷 PCIe 3.84TB SAMSUNG MZWLO3T8HCLS-00A07 NVMe 4개, Ubuntu 24.04 LTS 커널 6.13, SMT=ON, Performance Bias, Mitigations=on) 결과는 시스템 구성, 소프트웨어 버전, BIOS 설정 등을 포함하되 이에 국한되지 않는 요인에 따라 달라질 수 있습니다. TPC, TPC Benchmark 및 TPC-H는 Transaction Processing Performance Council의 상표입니다.
- 9xx5TCO-018: 이 시나리오에는 많은 가정 및 추정이 포함되어 있으며, AMD 내부 연구 및 최대 근사치에 기반하며, 정보 제공 목적의 예시로만 간주하여야 하고 실제 테스트에 대한 의사 결정의 기준으로 사용되어서는 안 됩니다. AMD 서버 및 온실가스 배출 TCO(총 소유 비용) 견적 툴 버전 1.53는 2025년 12월 3일 현재 391,000개 유닛의 SPECrate2017_int_base 성능 TOTAL_PERFORMANCE를 제공하는 데 필요한 선별된 AMD EPYC™ 및 인텔® 제온® CPU 기반 서버 솔루션을 비교합니다. 이 분석은 SPECrate2017_int_base 점수가 3230인 2P AMD 192 코어 EPYC_9965 기반 서버(https://spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.pdf)를 비교합니다.
SPECrate2017_int_base 점수가 2510인 2P 인텔 제온 128코어 Xeon_6980P 기반 서버(https://spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47099.pdf)와 SPECrate2017_int_base 점수가 391인 기존 2P 인텔 제온 28코어 Platinum_8280 기반 서버(https://spec.org/cpu2017/results/res2020q3/cpu2017-20200915-23984.pdf)를 비교합니다.
환경 영향 추정치는 2025년 세계 국가별 전력 계수 데이터(참조 사이트: https://www.carbondi.com/#electricity-factors/)를 활용해 산정되었으며 2024년 9월 4일 기준의 미국 EPA 온실가스 등가 계산기(https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator)가 사용되었습니다.
자세한 사항은 https://www.amd.com/en/legal/claims/epyc.html#q=9xx5TCO-018을 참조하세요.
- 9xx5-040A: XGBoost(시간당 실행 횟수) 처리율 결과는 2024년 9월 5일 기준 AMD 내부 테스트에 기초합니다. XGBoost 구성: v2.2.1, Higgs 데이터 세트, 32코어 인스턴스, FP32 2P AMD EPYC 9965(총 384코어), 32코어 인스턴스 12개, 1.5TB 24x64GB DDR5-6400(6000MT/s), 1.0Gbps NetXtreme BCM5720 기가비트 이더넷 PCIe, 3.5TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 6.8.0-45-generic(tuned-adm profile throughput-performance, ulimit -l 198078840, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C(SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=1 2P AMD EPYC 9755(총 256코어), 1.5TB 24x64GB DDR5-6400(6000MT/s), 1DPC, 1.0Gbps NetXtreme BCM5720 기가비트 이더넷 PCIe, 3.5TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic(tuned-adm profile throughput-performance, ulimit -l 198094956, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F(SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=1 2P AMD EPYC 9654(총 192코어), 1.5TB 24x64GB DDR5-4800, 1DPC, 2 x 1.92 TB Samsung MZQL21T9HCJR-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic(tuned-adm profile throughput-performance, ulimit -l 198120988, ulimit -n 1024, ulimit -s 8192), BIOS TTI100BA(SMT=off, Determinism=Power), NPS=1 vs 2P 제온 Platinum 8592+(총 128코어), AMX On, 1TB 16x64GB DDR5-5600, 1DPC, 1.0Gbps NetXtreme BCM5719 기가비트 이더넷 PCIe, 3.84 TB KIOXIA KCMYXRUG3T84 NVMe®, Ubuntu 22.04.4 LTS, 6.5.0-35 generic(tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V(SMT=off, Determinism=Power, Turbo Boost = Enabled) 결과: CPU 실행 1 실행 2 실행 3 중앙값 상대 처리율 세대별 2P Turin 192C, NPS1 1565.217 1537.367 1553.957 1553.957 3 2.41 2P Turin 128C, NPS1 1103.448 1138.34 1111.969 1111.969 2.147 1.725 2P Genoa 96C, NPS1 662.577 644.776 640.95 644.776 1.245 1 2P EMR 64C 517.986 421.053 553.846 517.986 1 NA 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정 등의 요인에 따라 달라질 수 있습니다.
- 9xx5-258: GPU 추론 처리량 결과는 2025년 10월 24일 기준 AMD 내부 테스트에 기초합니다. 워크로드 구성: vLLM 버전, NIM 버전, 입/출력 토큰: 128/128, 1024/128, 128/1024, 1024/1024 구성에서 초당 토큰 수 기준 결과 NVIDIA B200 GPU 8개를 탑재한 2P AMD EPYC 9575F(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.5, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NVIDIA B200 GPU 8개를 탑재한 NPS1 2P 인텔 제온 6960P(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.2, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NPS1 결과: 프레임워크 및 모델별 NIM llama3.3-70b-instruct 1.053 NIM gpt-oss-120b 1.133 NIM qwen2_5-coder-32b-instruct 1.034 VLLM Vllm_Deepseek_V3(R1) 1.036 VLLM Vllm_Llama4_scout 1.049 VLLM Vllm_Qwen2.5-VL-72B-Instruct 1.073 NIM Multi-instance llama3.1-8b-instruct 1.144 NIM Multi-instance qwen2_5-coder-32b-instruct 1.014 전반적인 Geomean 1.066 최고 결과 1.144 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정에 따라 달라질 수 있습니다.
- 9xx5-259: 2025년 10월 24일 기준 AMD 내부 테스트를 기반으로 한 GPU 추론 지연 시간(첫 토큰까지 시간) 워크로드 구성: vLLM 버전, NIM 버전, 입/출력 토큰: 128/128, 1024/128, 128/1024, 1024/1024 구성에서 초당 기준 결과 NVIDIA B200 GPU 8개를 탑재한 2P AMD EPYC 9575F(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.5, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NVIDIA B200 GPU 8개를 탑재한 NPS1 2P 인텔 제온 6960P(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.2, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NPS1 결과: 프레임워크 및 모델별 NIM llama3.3-70b-instruct 0.996 NIM gpt-oss-120b 1.22 NIM qwen2_5-coder-32b-instruct 1.062 VLLM Vllm_Deepseek_V3(R1) 1.059 VLLM Vllm_Llama4_scout 1.246 VLLM Vllm_Qwen2.5-VL-72B-Instruct 1.164 NIM Multi-instance llama3.1-8b-instruct 1.355 NIM Multi-instance qwen2_5-coder-32b-instruct 1.012 전반적인 Geomean 1.133 최고 결과 1.355 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정에 따라 달라질 수 있습니다.
- 9xx5-260: 2025년 10월 24일 기준 AMD 내부 테스트를 기반으로 한 GPU 추론 토큰 지연 시간(출력 토큰당 시간) 워크로드 구성: vLLM 버전, NIM 버전, 입/출력 토큰: 128/128, 1024/128, 128/1024, 1024/1024 구성에서 초당 기준 결과 NVIDIA B200 GPU 8개를 탑재한 2P AMD EPYC 9575F(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NVIDIA B200 GPU 8개를 탑재한 NPS1 2P 인텔 제온 6960P(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.2, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NPS1 결과: 프레임워크 및 모델별 NIM llama3.3-70b-instruct 1.053 NIM gpt-oss-120b 1.128 NIM qwen2_5-coder-32b-instruct 1.019 VLLM Vllm_Deepseek_V3(R1) 1.025 VLLM Vllm_Llama4_scout 1.025 VLLM Vllm_Qwen2.5-VL-72B-Instruct 1.062 NIM Multi-instance llama3.1-8b-instruct 1.102 NIM Multi-instance qwen2_5-coder-32b-instruct 1.033 전반적인 Geomean 1.055 최고 결과 1.128 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정에 따라 달라질 수 있습니다.
- 9xx5-002F: SPECrate®2017_int_base 비교 수치는 2025년 12월 11일 기준, www.spec.org의 게시 점수에 기반한 것입니다.
2P AMD EPYC 9654, 96C, 360W, $8452 USD, 1830, 5.083, 0.217, https://www.spec.org/cpu2017/results/res2025q3/cpu2017-20250727-49206.html
2P AMD EPYC 9754, 128C, 360W, $10631 USD, 1950, 5.417, 0.183, https://www.spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html
2P AMD EPYC 9755, 128C, 500W, $10931 USD, 2850, 5.70, 0.261, https://www.spec.org/cpu2017/results/res2025q4/cpu2017-20250928-49776.html
2P AMD EPYC 9965, 192C, 500W, $11988 USD, 3230, 6.460, 0.269, https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.html
2P 인텔 제온 6780E, 144C, 330W, $8513 USD, 1420, 4.303, 0.167, https://www.spec.org/cpu2017/results/res2025q4/cpu2017-20251020-50067.html
2P 인텔 제온 6980P, 128C, 500W, $12460 USD, 2510, 5.020, 0.201, https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47099.html
2P 인텔 제온 Platinum 8592+, 64C, 350W, $11600 USD, 1130, 3.229, 0.097, https://www.spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html
SPEC®, SPEC CPU® 및 SPECrate®는 Standard Performance Evaluation Corporation의 등록 상표입니다. 자세한 사항은 www.spec.org를 참조하세요. 2025년 12월 11일 기준 AMD CPU 가격. 2025년 12월 11일 기준 인텔 CPU W 및 가격(https://ark.intel.com/).
- 9xx-151: 2025년 4월 1일 기준 여러 VM 인스턴스를 실행하는 AMD 내부 테스트에 기초한 TPCxAI @SF30 다중 인스턴스 32C 인스턴스 크기 처리율 결과. 종합적인 엔드 투 엔드 AI 처리율 테스트는 TPCx-AI 벤치마크에서 파생되었으며, 엔드 투 엔드 AI 처리율 테스트 결과가 TPCx-AI 스펙을 준수하지 않기 때문에 게시된 TPCx-AI 결과와 비교할 수 없습니다. 2P AMD EPYC 9965(6067.53 총 AIUCpm, 총 코어 384개, 500W TDP, AMD 참조 시스템, 1.5TB 24x64GB DDR5-6400, 40GbE Mellanox CX-7(MT2910), 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe 2개, Ubuntu® 24.04 LTS 커널 6.13, SMT=ON, Determinism=power, Mitigations=on) 2P AMD EPYC 9755(4073.42 총 AIUCpm, 총 코어 256개, 500W TDP, AMD 참조 시스템, 1.5TB 24x64GB DDR5-6400, 40GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe 2개, Ubuntu 24.04 LTS 커널 6.13, SMT=ON, Determinism=power, Mitigations=on) 2P Intel Xeon 6980P (3550.50 총 AIUCpm, 총 코어 256개, 500W TDP, 프로덕션 시스템, 1.5TB 24x64GB DDR5-6400, 1GbE Broadcom NetXtreme BCM5719 기가비트 이더넷 PCIe 3.84TB SAMSUNG MZWLO3T8HCLS-00A07 NVMe 4개, Ubuntu 24.04 LTS 커널 6.13, SMT=ON, Performance Bias, Mitigations=on) 결과는 시스템 구성, 소프트웨어 버전, BIOS 설정 등을 포함하되 이에 국한되지 않는 요인에 따라 달라질 수 있습니다. TPC, TPC Benchmark 및 TPC-H는 Transaction Processing Performance Council의 상표입니다.
- 9xx5TCO-018: 이 시나리오에는 많은 가정 및 추정이 포함되어 있으며, AMD 내부 연구 및 최대 근사치에 기반하며, 정보 제공 목적의 예시로만 간주하여야 하고 실제 테스트에 대한 의사 결정의 기준으로 사용되어서는 안 됩니다. AMD 서버 및 온실가스 배출 TCO(총 소유 비용) 견적 툴 버전 1.53는 2025년 12월 3일 현재 391,000개 유닛의 SPECrate2017_int_base 성능 TOTAL_PERFORMANCE를 제공하는 데 필요한 선별된 AMD EPYC™ 및 인텔® 제온® CPU 기반 서버 솔루션을 비교합니다. 이 분석은 SPECrate2017_int_base 점수가 3230인 2P AMD 192 코어 EPYC_9965 기반 서버(https://spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.pdf)를 비교합니다.
SPECrate2017_int_base 점수가 2510인 2P 인텔 제온 128코어 Xeon_6980P 기반 서버(https://spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47099.pdf)와 SPECrate2017_int_base 점수가 391인 기존 2P 인텔 제온 28코어 Platinum_8280 기반 서버(https://spec.org/cpu2017/results/res2020q3/cpu2017-20200915-23984.pdf)를 비교합니다.
환경 영향 추정치는 2025년 세계 국가별 전력 계수 데이터(참조 사이트: https://www.carbondi.com/#electricity-factors/)를 활용해 산정되었으며 2024년 9월 4일 기준의 미국 EPA 온실가스 등가 계산기(https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator)가 사용되었습니다.
자세한 사항은 https://www.amd.com/en/legal/claims/epyc.html#q=9xx5TCO-018을 참조하세요. - 9xx5-040A: XGBoost(시간당 실행 횟수) 처리율 결과는 2024년 9월 5일 기준 AMD 내부 테스트에 기초합니다. XGBoost 구성: v2.2.1, Higgs 데이터 세트, 32코어 인스턴스, FP32 2P AMD EPYC 9965(총 384코어), 32코어 인스턴스 12개, 1.5TB 24x64GB DDR5-6400(6000MT/s), 1.0Gbps NetXtreme BCM5720 기가비트 이더넷 PCIe, 3.5TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 6.8.0-45-generic(tuned-adm profile throughput-performance, ulimit -l 198078840, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C(SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=1 2P AMD EPYC 9755(총 256코어), 1.5TB 24x64GB DDR5-6400(6000MT/s), 1DPC, 1.0Gbps NetXtreme BCM5720 기가비트 이더넷 PCIe, 3.5TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic(tuned-adm profile throughput-performance, ulimit -l 198094956, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F(SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=1 2P AMD EPYC 9654(총 192코어), 1.5TB 24x64GB DDR5-4800, 1DPC, 2 x 1.92 TB Samsung MZQL21T9HCJR-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic(tuned-adm profile throughput-performance, ulimit -l 198120988, ulimit -n 1024, ulimit -s 8192), BIOS TTI100BA(SMT=off, Determinism=Power), NPS=1 vs 2P 제온 Platinum 8592+(총 128코어), AMX On, 1TB 16x64GB DDR5-5600, 1DPC, 1.0Gbps NetXtreme BCM5719 기가비트 이더넷 PCIe, 3.84 TB KIOXIA KCMYXRUG3T84 NVMe®, Ubuntu 22.04.4 LTS, 6.5.0-35 generic(tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V(SMT=off, Determinism=Power, Turbo Boost = Enabled) 결과: CPU 실행 1 실행 2 실행 3 중앙값 상대 처리율 세대별 2P Turin 192C, NPS1 1565.217 1537.367 1553.957 1553.957 3 2.41 2P Turin 128C, NPS1 1103.448 1138.34 1111.969 1111.969 2.147 1.725 2P Genoa 96C, NPS1 662.577 644.776 640.95 644.776 1.245 1 2P EMR 64C 517.986 421.053 553.846 517.986 1 NA 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정 등의 요인에 따라 달라질 수 있습니다.
- 9xx5-258: GPU 추론 처리량 결과는 2025년 10월 24일 기준 AMD 내부 테스트에 기초합니다. 워크로드 구성: vLLM 버전, NIM 버전, 입/출력 토큰: 128/128, 1024/128, 128/1024, 1024/1024 구성에서 초당 토큰 수 기준 결과 NVIDIA B200 GPU 8개를 탑재한 2P AMD EPYC 9575F(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.5, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NVIDIA B200 GPU 8개를 탑재한 NPS1 2P 인텔 제온 6960P(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.2, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NPS1 결과: 프레임워크 및 모델별 NIM llama3.3-70b-instruct 1.053 NIM gpt-oss-120b 1.133 NIM qwen2_5-coder-32b-instruct 1.034 VLLM Vllm_Deepseek_V3(R1) 1.036 VLLM Vllm_Llama4_scout 1.049 VLLM Vllm_Qwen2.5-VL-72B-Instruct 1.073 NIM Multi-instance llama3.1-8b-instruct 1.144 NIM Multi-instance qwen2_5-coder-32b-instruct 1.014 전반적인 Geomean 1.066 최고 결과 1.144 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정에 따라 달라질 수 있습니다.
- 9xx5-259: 2025년 10월 24일 기준 AMD 내부 테스트를 기반으로 한 GPU 추론 지연 시간(첫 토큰까지 시간) 워크로드 구성: vLLM 버전, NIM 버전, 입/출력 토큰: 128/128, 1024/128, 128/1024, 1024/1024 구성에서 초당 기준 결과 NVIDIA B200 GPU 8개를 탑재한 2P AMD EPYC 9575F(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.5, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NVIDIA B200 GPU 8개를 탑재한 NPS1 2P 인텔 제온 6960P(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.2, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NPS1 결과: 프레임워크 및 모델별 NIM llama3.3-70b-instruct 0.996 NIM gpt-oss-120b 1.22 NIM qwen2_5-coder-32b-instruct 1.062 VLLM Vllm_Deepseek_V3(R1) 1.059 VLLM Vllm_Llama4_scout 1.246 VLLM Vllm_Qwen2.5-VL-72B-Instruct 1.164 NIM Multi-instance llama3.1-8b-instruct 1.355 NIM Multi-instance qwen2_5-coder-32b-instruct 1.012 전반적인 Geomean 1.133 최고 결과 1.355 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정에 따라 달라질 수 있습니다.
- 9xx5-260: 2025년 10월 24일 기준 AMD 내부 테스트를 기반으로 한 GPU 추론 토큰 지연 시간(출력 토큰당 시간) 워크로드 구성: vLLM 버전, NIM 버전, 입/출력 토큰: 128/128, 1024/128, 128/1024, 1024/1024 구성에서 초당 기준 결과 NVIDIA B200 GPU 8개를 탑재한 2P AMD EPYC 9575F(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NVIDIA B200 GPU 8개를 탑재한 NPS1 2P 인텔 제온 6960P(총 128코어) 프로덕션 시스템, 24x64GB DDR5-6400, SAMSUNG MZWLO3T8HCLS-00A07 3.84TB NVMe, Ubuntu 24.04 6.8.0-85-generic, BIOS 1.2, SMT OFF, Mitigations OFF, Power Determinism, CUDA 13.0, NPS1 결과: 프레임워크 및 모델별 NIM llama3.3-70b-instruct 1.053 NIM gpt-oss-120b 1.128 NIM qwen2_5-coder-32b-instruct 1.019 VLLM Vllm_Deepseek_V3(R1) 1.025 VLLM Vllm_Llama4_scout 1.025 VLLM Vllm_Qwen2.5-VL-72B-Instruct 1.062 NIM Multi-instance llama3.1-8b-instruct 1.102 NIM Multi-instance qwen2_5-coder-32b-instruct 1.033 전반적인 Geomean 1.055 최고 결과 1.128 결과는 시스템 구성, 소프트웨어 버전 및 BIOS 설정에 따라 달라질 수 있습니다.
- 9xx5-002F: SPECrate®2017_int_base 비교 수치는 2025년 12월 11일 기준, www.spec.org의 게시 점수에 기반한 것입니다.
2P AMD EPYC 9654, 96C, 360W, $8452 USD, 1830, 5.083, 0.217, https://www.spec.org/cpu2017/results/res2025q3/cpu2017-20250727-49206.html
2P AMD EPYC 9754, 128C, 360W, $10631 USD, 1950, 5.417, 0.183, https://www.spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html
2P AMD EPYC 9755, 128C, 500W, $10931 USD, 2850, 5.70, 0.261, https://www.spec.org/cpu2017/results/res2025q4/cpu2017-20250928-49776.html
2P AMD EPYC 9965, 192C, 500W, $11988 USD, 3230, 6.460, 0.269, https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.html
2P 인텔 제온 6780E, 144C, 330W, $8513 USD, 1420, 4.303, 0.167, https://www.spec.org/cpu2017/results/res2025q4/cpu2017-20251020-50067.html
2P 인텔 제온 6980P, 128C, 500W, $12460 USD, 2510, 5.020, 0.201, https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47099.html
2P 인텔 제온 Platinum 8592+, 64C, 350W, $11600 USD, 1130, 3.229, 0.097, https://www.spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html
SPEC®, SPEC CPU® 및 SPECrate®는 Standard Performance Evaluation Corporation의 등록 상표입니다. 자세한 사항은 www.spec.org를 참조하세요. 2025년 12월 11일 기준 AMD CPU 가격. 2025년 12월 11일 기준 인텔 CPU W 및 가격(https://ark.intel.com/).