Quelle est la prochaine étape ?

Vous vous demandez peut-être comment AMD peut continuer d'améliorer les processeurs AMD EPYC™ alors qu'ils détiennent déjà plus de 400 records du monde1. Comment faire pour surpasser certains des processeurs pour serveurs les plus puissants jamais créés1 ? Tout simplement avec l'architecture « Zen 5 » et les avantages qu'elle offre aux clients.

Présentation des processeurs AMD EPYC™ de 5e génération

Conçus pour le monde de l'IA et des charges de travail stratégiques, les processeurs AMD EPYC™ de 5e génération offrent la nouvelle génération de CPU pour serveurs dans une gamme qui a déjà établi des centaines de records mondiaux en matière de performances et d'efficacité avancées1. Soutenus par cet impressionnant historique, les processeurs AMD EPYC™ série 9005 offrent des performances exceptionnelles grâce à leur architecture « Zen 5 ».

Offrant jusqu'à 192 cœurs, 384 threads et des fréquences de boost max de 5 GHz, ces nouveaux processeurs prennent en charge pratiquement tous les besoins imaginables d'une entreprise2. Ils offrent plus de cœurs que les produits EPYC des générations précédentes et des fréquences encore plus élevées, mais prennent également en charge une DRAM plus rapide, proposant ainsi des capacités améliorées pour les charges de travail sensibles à la mémoire.

Facilement accessibles et déployables, les serveurs utilisant la 5e génération de processeurs AMD EPYC offrent des performances, une densité et une efficacité de pointe. Ils prennent en charge les déploiements dans tous les domaines, des initiatives d'optimisation de l'IA d'entreprise aux applications commerciales stratégiques, en passant par la capacité à alimenter des infrastructures cloud à grande échelle.

Il s'agit d'une gamme unifiée grâce à la compatibilité logicielle x86 familière, qui permet aux clients de déployer ce dont ils ont besoin, où ils en ont besoin, avec une ISA commune qui prend en charge les activités métier quotidiennes sans nécessiter de modifications majeures des software x86.

Les systèmes basés sur les processeurs AMD EPYC 9005 prennent en charge diverses initiatives, de la consolidation et de la modernisation des centres de données aux exigences de plus en plus élevées des applications d'entreprise. Tout cela est possible grâce à l'architecture « Zen 5 » hautement efficace, une plateforme attrayante conçue spécialement pour répondre aux besoins d'IA croissants des entreprises, mais également pour aider ces dernières à améliorer leur efficacité énergétique et à réduire la multiplication des centres de données.

Il s'agit d'un CPU pour serveur ultra-performant, aussi bien au niveau des performances que de l'efficacité et des résultats. 

Nº de modèle

Cœurs

Nombre max. de threads

Cache L3 (Mo)

TDP par défaut (W)

Canaux DDR/Capacité de mémoire maximale du système (2DPC)

Fréq. DDR5 max. (MHz) (1DPC)

PCIe® Gen 5 (voies)

Densité de socket

9 965

192

384

384

500

12/9 To

6 000

160

2

9 845

160

320

320

400

12/9 To

6 000

160

2

9 825

144

288

384

400

12/9 To

6 000

160

2

9 755

128

256

512

500

12/9 To

6 000

160

2

9 745

128

256

256

400

12/9 To

6 000

160

2

9 655

96

192

384

400

12/9 To

6 000

160

2

9 645

96

192

256

320

12/9 To

6 000

160

2

9655P

96

192

384

320

12/9 To

6 000

128

1

9 565

72

144

384

400

12/9 To

6 000

160

2

9575F

64

128

256

400

12/9 To

6 000

160

2

9 555

64

128

256

360

12/9 To

6 000

160

2

9555P

64

128

256

320

12/9 To

6 000

128

1

9 535

64

128

256

300

12/9 To

6 000

160

2

9475F

48

96

256

360

12/9 To

6 000

160

2

9 455

48

96

256

300

12/9 To

6 000

160

2

9455P

48

96

192

300

12/9 To

6 000

128

1

9 365

36

72

192

300

12/9 To

6000

160

2

9375F

32

64

256

320

12/9 To

6 000

160

2

9 355

32

64

256

280

12/9 To

6 000

160

2

9355P

32

64

256

280

12/9 To

6 000

128

1

9 335

32

64

192

210

12/9 To

6 000

160

2

9275F

24

48

256

320

12/9 To

6 000

160

2

9 255

24

48

128

200

12/9 To

6 000

160

2

9175F

16

32

256

320

12/9 To

6 000

160

2

9 135

16

32

128

200

12/9 To

6 000

160

2

9 125

8

16

256

165

12/9 To

6 000

160

2

9 015

8

16

64

155

12/9 To

6 000

160

2

 

Performances : Donner une image claire aux clients

Comme l'IA joue un rôle de plus en plus important dans les entreprises, les clients doivent savoir qu'ils peuvent compter sur leur infrastructure de serveurs pour assurer, en plus de traiter leurs charges de travail existantes.

Par rapport à la génération précédente, les nouveaux processeurs AMD EPYC, comme l'AMD EPYC™ 9575F, offrent des gains de performances à deux chiffres au niveau des instructions par cycle d'horloge (IPC). En outre, le dernier cœur « Zen 5 » des processeurs AMD EPYC de 5e génération est conçu pour fournir des gains significatifs pour les charges de travail d'apprentissage automatique, de calcul hautes performances et d'entreprise3.

Par rapport aux produits concurrents, ces nouveaux processeurs aident les entreprises à obtenir des résultats incroyables, par exemple des performances de débit d'IA de bout en bout révolutionnaires dans de nombreux cas d'utilisation. Par exemple, sur le benchmark TPCx-AI, les serveurs 2P équipés de processeurs AMD EPYC™ 9965 192 cœurs offrent jusqu'à 3,8 fois plus de cas de test d'IA en plus par minute environ par rapport aux serveurs 2P équipés de processeurs Intel Xeon Platinum 8592+ à 64 cœurs lors des tests AMD4.

Lors de l'hébergement d'accélérateurs de GPU, deux CPU AMD EPYC 9575F permettent d'obtenir jusqu'à 20 % de requêtes d'inférence en plus et un temps d'entraînement 15 % plus rapide par rapport à deux CPU Intel® Xeon® 8592+ exécutant Llama3.15,6.

Si les performances sont remarquables, l'efficacité n'en est pas négligée pour autant : les processeurs AMD EPYC série 9005 offrent en effet des solutions économes en énergie pour les serveurs. En fait, les serveurs 2P équipés de CPU AMD EPYC 9965 offrent des performances de calculs d'entiers estimées 1,8 fois plus élevées par watt de CPU que ceux équipés de CPU Intel® Xeon® 8592+7.

Une nouvelle génération de processeurs AMD EPYC de pointe est là pour révolutionner les processus de travail. À l'ère de l'IA, vos clients ne peuvent pas se permettre de prendre du retard. Pour en savoir plus, contactez votre représentant AMD ou rendez-vous sur le site AMD.com.

Ressources supplémentaires

AMD Arena


Améliorez vos connaissances sur les produits AMD avec des formations sur AMD Ryzen™ PRO, AMD EPYC™, AMD Instinct™ et plus encore.

Notes de bas de page
  1. Pour obtenir la liste complète des records mondiaux de performances détenus par les processeurs AMD EPYC, rendez-vous sur amd.com/worldrecords.

  2. Le boost maximal pour les processeurs AMD EPYC est la fréquence maximale pouvant être atteinte par un seul cœur sur le processeur dans les conditions normales de fonctionnement des systèmes serveurs. EPYC-018

  3. 9xx5-001 : basé sur les tests internes d'AMD en date du 10/09/2024, amélioration des performances de la moyenne géométrique (IPC) à fréquence fixe.

  4. - Charges de travail de serveur cloud et d'entreprise avec les CPU de 5e génération : gain d'IPC générationnel de 1,170x (moyenne géométrique) en utilisant un ensemble sélectionné de 36 charges de travail. Il s'agit de la moyenne géométrique des scores estimés pour le total et tous les sous-ensembles de SPECrate®2017_int_base (moyenne géométrique), des scores estimés pour le total et tous les sous-ensembles SPECrate®2017_fp_base (moyenne géométrique), des scores pour les ops/s max. sur plusieurs instances Java côté serveur, des charges de travail de serveur cloud représentatives (moyenne géométrique) et des charges de travail des serveurs d'entreprise représentatives (moyenne géométrique). 

    Configuration « Genoa » (tous avec NPS1) : EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD en 12+1), FF 3 GHz, 12x DDR5-4800 (2Rx4 64 Go), xGMI 32 Gbit/s ;

    Configuration « Turin » (tous avec NPS1) : EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD en 12+1), FF 3 GHz, 12x DDR5-6000 (2Rx4 64 Go), xGMI 32 Gbit/s 

    Avec utilisation du déterminisme de performances et du gouverneur de performances sur un système d'exploitation Ubuntu® 22.04 avec un noyau 6.8.0-40-generic pour toutes les charges de travail.

    - Charges de travail de serveur ML/HPC EPYC de 5e génération : gain d'IPC générationnel de 1,369x (moyenne géométrique) à l'aide d'un ensemble de 24 charges de travail sélectionnées. Il s'agit de la moyenne géométrique des charges de travail de serveur ML représentatives (moyenne géométrique) et des charges de travail de serveur HPC représentatives (moyenne géométrique).

    Configuration « Genoa » (tous avec NPS1) : EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD en 12+1), FF 3 GHz, 12x DDR5-4800 (2Rx4 64 Go), xGMI 32 Gbit/s ;

    Configuration « Turin » (tous avec NPS1) :   EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD en 12+1), FF 3 GHz, 12x DDR5-6000 (2Rx4 64 Go), xGMI 32 Gbit/s 

    Avec utilisation du déterminisme de performances et du gouverneur de performances sur un système d'exploitation Ubuntu® 22.04 avec un noyau 6.8.0-40-generic pour toutes les charges de travail, sauf LAMMPS, HPCG, NAMD, OpenFOAM et Gromacs qui utilisaient 24.04 avec un noyau 6.8.0-40-generic.

    SPEC® et SPECrate® sont des marques déposées de la Standard Performance Evaluation Corporation. Pour en savoir plus, consultez le site spec.org.

  5. 9xx5-012 : résultats de débit de taille d'instance 32 cœurs multi-instances TPCxAI à SF30 basés sur les tests internes d'AMD en date du 05/09/2024 exécutant plusieurs instances de machine virtuelle. Le test de débit de l'IA global de bout en bout est dérivé du benchmark TPCx-AI et n'est donc pas comparable aux résultats publiés de TPCx-AI, car les résultats du test de débit de l'IA de bout en bout ne sont pas conformes à la spécification TPCx-AI.
  6. 2P AMD EPYC 9965 (384 cœurs au total), 12 instances 32 cœurs, NPS1, 1,5 To 24x64 Go de DDR5-6400 (à 6 000 MT/s), 1 DPC, PCIe NetXtreme BCM5719 Gigabit Ethernet 1 Gbit/s, NVMe® Samsung MZWLO3T8HCLS-00A07 3,5 To, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (performance de débit du profil tuned-adm, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT=désactivé, déterminisme=puissance, Turbo Boost=activé)

    2P AMD EPYC 9755 (256 cœurs au total), 8 instances 32 cœurs, NPS1, 1,5 To 24x64 Go de DDR5-6400 (à 6 000 MT/s), 1 DPC, PCIe NetXtreme BCM5720 Gigabit Ethernet 1 Gbit/s, NVMe® Samsung MZWLO3T8HCLS-00A07 3,5 To, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (performance de débit du profil tuned-adm, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT=désactivé, déterminisme=puissance, Turbo Boost=activé)

    2P AMD EPYC 9654 (192 cœurs au total), 6 instances 32 cœurs, NPS1, 1,5 To 24x64 Go de DDR5-4800, 1 DPC, NVMe Samsung MZQL21T9HCJR-00A07 2 x 1,92 To, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT=désactivé, déterminisme=puissance)

    Par rapport à 2P Xeon Platinum 8592+ (128 cœurs au total), 4 instances 32 cœurs, AMX activé, 1 To 16x64 Go de DDR5-5600, 1 DPC, PCIe NetXtreme BCM5719 Gigabit Ethernet 1 Gbit/s, NVMe KIOXIA KCMYXRUG3T84 3,84 To, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (performance de débit du profil tuned-adm, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT=désactivé, déterminisme=puissance, Turbo Boost=activé)

    Les résultats :

    Médiane relative générationnelle des CPU

    Turin 192 cœurs, 12 instances 6067.531 3.775 2.278

    Turin 128 cœurs, 8 instances 4091.85 2.546 1.536

    Genoa 96 cœurs, 6 instances 2663.14 1.657 1

    EMR 64 cœurs, 4 instances 1607.417 1 NA

    Les résultats varient selon plusieurs facteurs, tels que les configurations système, les versions logicielles et les paramètres du BIOS. TPC, TPC Benchmark et TPC-C sont des marques commerciales de Transaction Processing Performance Council.

  7. 9xx5-014 : résultats du débit d'inférences Llama3.1-70B basés sur les tests internes d'AMD en date du 01/09/2024.
  8. Configurations Llama3.1-70B : TensorRT-LLM 0.9.0, nvidia/cuda 12.5.0-devel-ubuntu22.04, FP8, configurations de jeton d'entrée/de sortie (cas d'utilisation) : [BS=1 024 E/S=128/128, BS=1 024 E/S=128/2 048, BS=96 E/S=2 048/128, BS=64 E/S=2 048/2 048]. Résultats en jetons/seconde.

    2P AMD EPYC 9575F (128 cœurs au total) avec 8x NVIDIA H100 80 Go HBM3, 1,5 To 24x64 Go de DDR5-6000, NVMe® Micron_9300_MTFDHAL3T8T8TDP 3 To 1 Gbit/s, BIOS T20240805173113 (déterminisme=puissance, SR-IOV=activé), Ubuntu 22.04.3 LTS, noyau=5.15.0-117-generic (atténuations=désactivées, cpupower-frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),

    2P Intel Xeon Platinum 8592+ (128 cœurs au total) avec 8x NVIDIA H100 80 Go HBM3, 1 To 16x64 Go de DDR5-5600, NVMe® Dell Ent PM1735a MU 3,2 To, Ubuntu 22.04.3 LTS, noyau 5.15.0-118-generic, (processor.max_cstate=1, intel_idle.max_cstate=0 atténuations=désactivé, cpupower frequency-set -g performance), BIOS 2.1, (performances maximales, SR-IOV=activé),

    Taille du lot de jetons d'entrée/de sortie EMR Turin relative

    128/128 1 024 814,678 1 101,966 1,353

    128/2 048 1 024 2 120,664 2 331,776 1,1

    2 048/128 96 114,954 146,187 1,272

    2 048/2 048 64 333,325 354,208 1,063

    Pour une multiplication moyenne du débit de 1,197.

    Les résultats varient selon plusieurs facteurs, tels que les configurations système, les versions logicielles et les paramètres du BIOS.

  9. 9xx5-015 : résultats des tests d'entraînement Llama3.1-8B (BF16, longueur de séquence max. 1 024) basés sur les tests internes d'AMD en date du 05/09/2024.
  10. Configurations Llama3.1-8B : longueur de séquence max. 1 024, BF16, docker : huggingface/transformers-pytorch-gpu:latest

    2P AMD EPYC 9575F (128 cœurs au total) avec 8x NVIDIA H100 80 Go HBM3, 1,5 To 24x64 Go de DDR5-6000, NVMe® Micron_9300_MTFDHAL3T8T8TDP 3 To 1 Gbit/s, BIOS T20240805173113 (déterminisme=puissance, SR-IOV=activé), Ubuntu 22.04.3 LTS, noyau=5.15.0-117-generic (atténuations=désactivées, cpupower-frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),

    Pour 31,79 échantillons d'entraînement/seconde

    2P Intel Xeon Platinum 8592+ (128 cœurs au total) avec 8x NVIDIA H100 80 Go HBM3, 1 To 16x64 Go de DDR5-5600, NVMe® Dell Ent PPM1735a MU 3,2 To, Ubuntu 22.04.3 LTS, noyau 5.15.0-118-generic, (processor.max_cstate=1, intel_idle.max_cstate=0 atténuations=désactivées, cpupower frequency-set -g performance), BIOS 2.1, (performances maximales, SR-IOV=activé),

    Pour 27,74 échantillons d'entraînement/seconde

    Pour une augmentation moyenne du débit de 1,146. 

    Les résultats varient selon plusieurs facteurs, tels que les configurations système, les versions logicielles et les paramètres du BIOS.

  11. 9xx5-002a : comparaison de SPECrate®2017_int_base sur la base des mesures estimées de la plateforme de référence AMD et des scores publiés par www.spec.org le 05/09/2024.

Comparaison entre 2P AMD EPYC 9965 (SPECrate®2017_int_base estimé de 2 870, 384 cœurs au total, TDP 500 W) 1,5 To 24x64 Go 2Rx4 PC5-6400B-R fonctionnant à 6 000 MT/s, NVMe 3,84 To, Ubuntu® 24.04 LTS noyau 6.8.30-41-generic, AOCC v5.0.0, SPECrate®2017_int_base/watt de CPU estimé de 5,740

2P Intel Xeon Platinum 8592+ (SPECrate®2017_int_base de 1 130, 128 cœurs au total, TDP 350 W),SPECrate®2017_int_base/watt de CPU de 3,229, http://spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html

Comparaison entre EPYC 9965 et 8592+

- performances estimées 2,540 fois supérieures

- performances/watt de CPU estimées 1,778 fois supérieures

Publié : 2P AMD EPYC 9754 (SPECrate®2017_int_base de 1 950, 256 cœurs au total, TDP 360 W), SPECrate®2017_int_base/watt de CPU 5,417 http://spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html)

Comparaison entre EPYC 9754 et 8592+

- performances 1,725 fois supérieures

- performances/watt de CPU 1,678 fois supérieures

Générationnel (comparaison entre EPYC 9965 et EPYC 9754)

- performances 1,472 fois supérieures

- performances/watt de CPU 1,060 fois supérieures

SPEC®, SPEC CPU® et SPECrate® sont des marques déposées de la Standard Performance Evaluation Corporation. Rendez-vous sur www.spec.org pour plus d'informations. TDP du CPU Intel sur https://ark.intel.com/.