EPYC 9005 para AI Inference

Cartera de productos líderes para abordar las cargas de trabajo de inferencia de IA empresarial

La inferencia de IA utiliza un modelo de IA entrenado para hacer predicciones sobre nuevos datos. AMD ofrece una gama de soluciones para la inferencia de IA según el tamaño del modelo y los requisitos de la aplicación. Los procesadores AMD EPYC™ se destacan por ofrecer una solución para modelos de IA pequeños a medianos y cargas de trabajo donde la proximidad a los datos es importante. Para aplicaciones de procesamiento por lotes o fuera de línea donde la latencia no es crítica, los procesadores AMD EPYC ofrecen una solución de inferencia rentable.

Estas son solo algunas de las cargas de trabajo de la IA que funcionan bien en los procesadores AMD EPYC. Para profundizar en cada tipo de carga de trabajo, lee este artículo con los detalles.

Obtén información sobre las 5 principales cargas de trabajo de inferencia de CPU

Baja tolerancia de latencia
Tolerancia de latencia moderada
Alta tolerancia de latencia

Baja tolerancia de latencia

Tipo de sistema	Ejemplos	Justificación
Sistemas de recomendación	Filtrado basado en contenido Filtrado colaborativo Clasificación y similitud	Generalmente, usa modelos más pequeños Compatibilidad de datos escasos y diversos Cierta tolerancia de precisión
Aprendizaje automático	Árboles de decisión Regresión lineal Compatibilidad de máquinas de vectores	Utiliza operaciones secuenciales Variedad de cálculos matemáticos

Tolerancia de latencia moderada

Tipo de sistema	Ejemplos	Justificación
Procesamiento de lenguaje natural	Clasificación de texto Análisis de opiniones Texto a voz y voz a texto	Requisitos de rendimiento establecidos para la tasa de comprensión humana Modelos y conjuntos de datos más pequeños
Aplicaciones mixtas habilitadas para la IA	Analítica de base de datos Simulación y modelado Interactividad en tiempo real	Manejo secuencial de datos Cambio de contexto rápido dentro del flujo de trabajo

Alta tolerancia de latencia

Tipo de sistema	Ejemplos	Justificación
IA generativa	Generación de documentos Creación de texto a imagen Creación de imagen a video	Flujos de trabajo de creación por lotes, a menudo repetitivos Utilizado para tareas tradicionalmente humanas que requieren mucho tiempo y recursos
Grandes modelos de lenguaje	Chatbots Resúmenes Traducción	Indicaciones más cortas Conjuntos de datos más cortos

Aplicaciones e industrias

Los modelos de IA integrados dentro de la visión artificial, el procesamiento de lenguaje natural y los sistemas de recomendación afectaron significativamente a las empresas de varios sectores de la industria. Estos modelos ayudan a las compañías a reconocer objetos, clasificar anomalías, comprender palabras escritas y habladas y hacer recomendaciones. Mediante la aceleración del desarrollo de estos modelos, las empresas pueden obtener los beneficios, independientemente de la industria a la que pertenecen.

Industria automotriz

Los modelos de visión artificial ayudan a impulsar automóviles autodirigidos y también ayudan a reconocer los carteles, los peatones y otros vehículos que se deben evitar. Los modelos de procesamiento del lenguaje natural pueden ayudar a reconocer los comandos hablados de la telemática en el auto.

Servicios financieros

La detección de anomalías alimentadas por IA ayuda a detener el fraude con tarjeta de crédito, mientras que los modelos de visión artificial están atentos a documentos sospechosos, incluidos los cheques de clientes.

Venta minorista

Automatiza las cajas registradoras mediante el reconocimiento de productos o incluso crea experiencias de compra autónomas donde los modelos vinculan a los clientes con los artículos que eligen y colocan en sus bolsos. Utiliza motores de recomendación de productos para ofrecer alternativas, ya sea en línea o en la tienda.

Fabricación

Utiliza modelos de visión artificial para monitorear la calidad de los productos fabricados, desde alimentos hasta placas de circuitos impresos. Introduce los datos de telemetría en los motores de recomendación para sugerir un mantenimiento proactivo: ¿Están a punto de fallar las unidades de disco? ¿El motor utiliza demasiado aceite?

Top view of cardiologist doctor medical healthcare desk

Medicina

Detecta anomalías, incluidas fracturas y tumores con modelos de visión artificial. Utiliza los mismos modelos en investigación para evaluar el crecimiento y la proliferación celular in vitro.

Automatización de servicios

Cuando el equipo de TI se reúnen con los clientes, el procesamiento del lenguaje natural puede ayudar a tomar medidas en función de las solicitudes, y los motores de recomendación pueden ayudar a orientar a los clientes hacia soluciones satisfactorias y alternativas de productos.

La opción ideal para cargas de trabajo de inferencia de IA empresarial

Ya sea que se implementen como CPU solamente o se utilicen como host para las GPU que ejecutan modelos más grandes, los procesadores AMD EPYC™ Serie 9005 están diseñados con las tecnologías de estándares abiertos más recientes para acelerar las cargas de trabajo de AI Inference empresarial.

Hardware
Software
Seguridad

Diseñado para inferencia de IA

Hasta 192 núcleos AMD “Zen 5”: con ruta de datos completa de 512 bits de ancho para compatibilidad con instrucciones AVX-512 ofrecen un gran paralelismo en cargas de trabajo de AI Inference, lo que reduce la necesidad de aceleración de GPU.

Diseñado para la IA simultánea y cargas de trabajo tradicionales: Los procesadores AMD EPYC de 5.ª generación proporcionan el rendimiento de enteros más alto para las cargas de trabajo tradicionales¹. Los procesadores AMD EPYC ofrecen una inferencia eficiente en una variedad de cargas de trabajo de la IA y tamaños de modelos.

Procesamiento rápido y E/S: Aumento generacional del 37 % para cargas de trabajo de IA en las instrucciones por ciclo de reloj (IPC)². Memoria DDR5 y E/S PCIe® de 5.ª generación para un rápido procesamiento de datos.

Descubre cuándo usar CPU para inferencia

Obtén información sobre las 5 principales cargas de trabajo de inferencia de CPU

Optimizaciones de software AMD para inferencia de IA

Compatibilidad del marco: AMD es compatible con los marcos de IA más populares, incluidos TensorFlow, PyTorch y ONNX Runtime, que abarcan diversos casos de uso, como la clasificación de imágenes y los motores de recomendación.

Código abierto y compatibilidad: Las optimizaciones están integradas en marcos populares que ofrecen una amplia compatibilidad y una facilidad ascendente de código abierto. Además, AMD está trabajando con Hugging Face para permitir que sus modelos de código abierto con ZenDNN.

Complementos ZenDNN: Estos complementos aceleran las cargas de trabajo de inferencia de IA mediante la optimización de operadores, el aprovechamiento de los micronúcleos y la implementación de subprocesos múltiples eficientes en núcleos AMD EPYC.

Observa lo fácil que es usar ZenDNN

Zoom de imagen

La seguridad de los datos es aún más importante en la era de la IA

A medida que el uso de digitalización, computación en la nube, IA y otras tecnologías emergentes impulsan el crecimiento de los datos, la necesidad de medidas de seguridad avanzadas se vuelve aún más apremiante. Esta mayor necesidad de seguridad se ve amplificada por el mayor énfasis global en las regulaciones de privacidad y las graves sanciones por infracciones, lo que destaca el valor incomparable de los datos en medio del aumento de los riesgos de seguridad.

AMD Infinity Guard es tecnología que viene integrada en el chip y ofrece las capacidades avanzadas necesarias para defenderse ante ataques internos y externos, y a mantener los datos seguros³.

Obtén más información

Modelos de carga de trabajo de IA

Los servidores y las instancias en la nube basados en procesadores AMD EPYC™ 9005 permiten soluciones rápidas y eficientes basadas en la IA cerca de tus clientes y datos.

Servidores 2P que ejecutan Llama3.1-8B BF16⁴ (tokens relativos/segundo)

AMD EPYC™ 9965 de 5.ª generación

1,8 veces

AMD EPYC™ 9654 de 4.ª generación

1,3 veces

Xeon® Platinum® 8592+ de 5.ª generación

1,0 veces

Servidores 2P que ejecutan FAISS⁵ (solicitudes/hora)

AMD EPYC™ 9965 de 5.ª generación

3,8 veces

AMD EPYC™ 9654 de 4.ª generación

2,0 veces

Xeon® Platinum® 8592+ de 5.ª generación

1,0 veces

Servidores 2P que ejecutan TPCx-AI a SF30⁵ (rendimiento/min)

AMD EPYC™ 9965 de 5.ª generación

3,8 veces

AMD EPYC™ 9654 de 4.ª generación

2,3 veces

Xeon® Platinum® 8592+ de 5.ª generación

1,0 veces

Servidores 2P que ejecutan XGBoost a SF30⁷ (ejecuciones/hora)

AMD EPYC™ 9965 de 5.ª generación

3.0x

AMD EPYC™ 9654 de 4.ª generación

2,0 veces

Xeon® Platinum® 8592+ de 5.ª generación

1,0 veces

Recursos

Informes sobre IA empresarial de AMD EPYC

Encuentra documentación sobre AMD y sus socios que describe la IA y la innovación en el aprendizaje automático

Visita la Biblioteca

Procesadores AMD EPYC Serie 9005

Los procesadores AMD EPYC™ 9005 permiten una AI Inference rápida y eficiente cerca de los datos empresariales, lo que impulsa el rendimiento transformador del negocio.

Obtener más información

Podcasts

Escucha a los tecnólogos líderes de AMD y la industria que analizan los temas de tendencia más recientes sobre servidores, computación en la nube, IA, HPC y más.

Visita el archivo

Notas al pie

9xx5-002D: comparación de SPECrate® 2017_int_base basada en los puntajes publicados en www.spec.org al 10/10/24. 2P AMD EPYC 9965 (3000 SPECrate® 2017_int_base, 384 núcleos totales, 500 W TDP, $14 813 CPU $), 6,060 SPECrate® 2017_int_base/CPU W, 0,205 SPECrate® 2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2024q4/cpu2017-20240923-44837.html) 2P AMD EPYC 9755 (2720 SPECrate® 2017_int_base, 256 núcleos totales, 500 W TDP, $12 984 CPU $), 5,440 SPECrate® 2017_int_base/CPU W, 0,209 SPECrate® 2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2024q4/cpu2017-20240923-44824.html) 2P AMD EPYC 9754 (1950 SPECrate® 2017_int_base, 256 núcleos totales, 360 W TDP, $11 900 CPU $), 5,417 SPECrate® 2017_int_base/CPU W, 0,164 SPECrate® 2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html) 2P AMD EPYC 9654 (1810 SPECrate® 2017_int_base, 192 núcleos totales, 360 W TDP, $11 805 CPU $), 5,028 SPECrate® 2017_int_base/CPU W, 0,153 SPECrate® 2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2024q1/cpu2017-20240129-40896.html) 2P Intel Xeon Platinum 8592+ (1130 SPECrate® 2017_int_base, 128 núcleos totales, 350 W TDP, $11 600 CPU $) 3,229 SPECrate® 2017_int_base/CPU W, 0,097 SPECrate® 2017_int_base/CPU $, http://spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html) 2P Intel Xeon 6780E (1410 SPECrate® 2017_int_base, 288 núcleos totales, 330 W TDP, $11 350 CPU $) 4,273 SPECrate® 2017_int_base/CPU W, 0,124 SPECrate® 2017_int_base/CPU $, https://spec.org/cpu2017/results/res2024q3/cpu2017-20240811-44406.html) SPEC®, SPEC CPU®, y SPECrate® con marcas comerciales registradas de Standard Performance Evaluation Corporation. Consulta www.spec.org para obtener más información. TDP de CPU Intel en https://ark.intel.com/.
9xx5-001: basado en pruebas internas de AMD realizadas al 10/9/2024, mejora de rendimiento de media geométrica (IPC) a frecuencia fija. - Aumento de 1,369 veces (media geométrica) de la IPC de cargas de trabajo de servidor de ML/HPC generacional de EPYC de 5.ª generación con el uso de un conjunto selecto de 24 cargas de trabajo, y es la media geométrica de las cargas de trabajo de servidor de ML representativas (media geométrica) y las cargas de trabajo de servidor de HPC representativas (media geométrica). Configuración “Genoa” (todo NPS1): EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/ CCD en 12+1), FF de 3 GHz, 12 DDR5-4800 (2Rx4 de 64 GB), xGMI de 32 Gbps; configuración “Turin” (todo NPS1): EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD en 12+1), FF de 3 GHz, 12 DDR5-6000 (2Rx4 de 64 GB), xGMI de 32 Gbps utilizando el Determinismo de Rendimiento y el controlador de rendimiento en Ubuntu 22.04 con kernel OS 6.8.0-40-generic para todas las cargas de trabajo excepto LAMMPS, HPCG, NAMD, OpenFOAM y Gromacs, que usan 24.04 con kernel 6.8.0-40-generic. SPEC® y SPECrate® son marcas comerciales registradas de Standard Performance Evaluation Corporation. Obtén más información en spec.org.
GD-183A: las funciones de AMD Infinity Guard varían según las generaciones o las series de procesadores EPYC™ Los fabricantes de equipos originales (OEM) de servidores o proveedores de servicios en la nube deben activar las funciones de seguridad de Infinity Guard para poder usarlas. Comunícate con tu OEM o proveedor para confirmar la disponibilidad de estas funciones. Obtén más información sobre Infinity Guard en https://www.amd.com/en/products/processors/server/epyc/infinity-guard.html
9xx5-009: Resultados de rendimiento de Llama3.1-8B basados en pruebas internas de AMD realizadas al 5/9/2024. Configuraciones de Llama3-8B: IPEX.LLM 2.4.0, NPS=2, BF16, tamaño de lote 4, casos de uso de configuraciones de tokens de entrada/salida: [Summary = 1024/128, Chatbot = 128/128, Translate = 1024/1024, Essay = 128/1024, Caption = 16/16]. 2P AMD EPYC 9965 (384 núcleos totales), 6 instancias de 64 núcleos, 24 DDR5-6400 de 64 GB (a 6000 MT/s) de 1,5 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB de Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.3 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C, (SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=2 2P AMD EPYC 9755 (256 núcleos totales), 4 instancias de 64 núcleos, 24 DDR5-6400 de 64 GB (a 6000 MT/s) de 1,5 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB de Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu 22.04.3 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=2 2P AMD EPYC 9654 (192 núcleos totales) 4 instancias de 64 núcleos, 24 DDR5-4800 de 64 GB de 1,5 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB de Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 5.15.85-051585-generic (tuned-adm profile throughput-performance, ulimit -l 1198117616, ulimit -n 500000, ulimit -s 8192), BIOS RVI1008C (SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=2 en comparación con 2P Xeon Platinum 8592+ (128 núcleos totales), 2 instancias de 64 núcleos, AMX activado, 16 DDR5-5600 de 64 GB de 1 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5719 Gigabit Ethernet PCIe, 3,84 TB de KIOXIA KCMYXRUG3T84 NVMe®, Ubuntu 22.04.4 LTS 6.5.0-35-generic (tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT=off, Determinism=Power, Turbo Boost = Enabled). Resultados: CPU 2P EMR de 64 núcleos 2P Turin de 192 núcleos 2P Turin de 128 núcleos 2P Genoa de 96 núcleos Rendimiento total medio agregado en promedio 99,474 193,267 182,595 138,978 Competencia 1 1,943 1,836 1,397 NA generacional 1,391 1,314 1 Los resultados pueden variar debido a factores como las configuraciones del sistema, las versiones de software y la configuración del BIOS.
9xx5-011: resultados de rendimiento de FAISS (solicitudes/hora) basados en pruebas internas de AMD realizadas al 5/9/2024. Configuraciones de FAISS: conjunto de datos sift1m, instancias de 16 núcleos, FP32, MKL 2024.2.1 2P AMD EPYC 9965 (384 núcleos totales), 24 instancias de 16 núcleos, 24 DDR5-6400 de 64 GB (a 6000 MT/s) de 1,5 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB de Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=42P AMD EPYC 9654 (192 núcleos totales) 12 instancias de 16 núcleos, 24 DDR5-4800 de 64 GB de 1,5 TB, 1DPC, dos Samsung MZQL21T9HCJR-00A07 NVMe de 1,92 TB, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT=off, Determinism=Power), NPS=4 en comparación con 2P Xeon Platinum 8592+ (128 núcleos totales), 8 instancias de 16 núcleos, AMX activado, 16 DDR5-5600 de 64 GB de 1 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5719 Gigabit Ethernet PCIe, 3,84 TB de KIOXIA KCMYXRUG3T84 NVMe, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT=off, Determinism=Power, Turbo Boost = Enabled) Resultados: Rendimiento relativo medio de CPU generacional 2P Turin de 192 núcleos 64,2 3,776 1,861 2P Genoa de 96 núcleos 34,5 2,029 1 2P EMR de 64 núcleos 17 1 NA Los resultados pueden variar debido a factores como las configuraciones del sistema, las versiones de software y la configuración del BIOS.
9xx5-012: resultados de rendimiento de tamaño de instancia de TPCxAI @SF30 de instancia múltiple y 32 núcleos con base en pruebas internas de AMD realizadas al 5/9/2024, ejecutando múltiples instancias de VM. La prueba de rendimiento de IA integral agregado se deriva de la evaluación comparativa TPCx-AI y, como tal, no es comparable con los resultados publicados de TPCx-AI, ya que los resultados de la prueba de rendimiento de IA integral no cumplen con la especificación de TPCx-AI. 2P AMD EPYC 9965 (384 núcleos totales), 12 instancias de 32 núcleos, NPS1, 24 DDR5-6400 de 64 GB (a 6000 MT/s) de 1,5 TB, 1DPC, 1,0 Gbps NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB de Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT=off, Determinism=Power, Turbo Boost=Enabled) 2P AMD EPYC 9755 (256 núcleos totales), 8 instancias de 32 núcleos, NPS1, 24 DDR5-6400 de 64 GB (a 6000 MT/s) de 1,5 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB de Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT=off, Determinism=Power, Turbo Boost=Enabled) 2P AMD EPYC 9654 (192 núcleos totales) 6 instancias de 32 núcleos, NPS1, 24 DDR5-4800 de 64 GB de 1,5 TB, 1DPC, dos Samsung MZQL21T9HCJR-00A07 NVMe de 1,92 TB, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT=off, Determinism=Power) en comparación con 2P Xeon Platinum 8592+ (128 núcleos totales), 4 instancias de 32 núcleos, AMX activado, 16 DDR5-5600 de 64 GB de 1 TB, 1DPC, 1,0 Gbps de NetXtreme BCM5719 Gigabit Ethernet PCIe, 3,84 TB de KIOXIA KCMYXRUG3T84 NVMe, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT=off, Determinism=Power, Turbo Boost = Enabled) Resultados: CPU relativa media generacional Turin de 192 núcleos, 12 Inst 6067,531 3,775 2,278 Turin de 128 núcleos, 8 Inst 4091,85 2,546 1,536 Genoa de 96 núcleos, 6 Inst 2663,14 1,657 1 EMR de 64 núcleos, 4 Inst 1607,417 1 NA Los resultados pueden variar debido a factores que incluyen configuraciones de sistema, versiones de software y configuración del BIOS. TPC, TPC Benchmark y TPC-C son marcas comerciales de Transaction Processing Performance Council.
9xx5-040A: resultados de rendimiento de XGBoost (ejecuciones/hora) basados en pruebas internas de AMD realizadas al 5/9/2024. Configuraciones de XGBoost: v2.2.1, conjunto de datos de Higgs, instancias de 32 núcleos, FP32 2P AMD EPYC 9965 (384 núcleos totales), 12 instancias de 32 núcleos, 24 DDR5-6400 de 64 GB (a 6000 MT/s) de 1,5 TB, 1,0 Gbps NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 6.8.0-45-generic (tuned-adm profile throughput-performance, ulimit -l 198078840, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=1 2P AMD EPYC 9755 (256 núcleos totales), 24 DDR5-6400 de 64 GB (a 6000 MT/s) de 1,5 TB, 1DPC, 1,0 Gbps NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198094956, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT=off, Determinism=Power, Turbo Boost=Enabled), NPS=1 2P AMD EPYC 9654 (192 núcleos totales), 24 DDR5-4800 de 64 GB de 1,5 TB, 1DPC, dos Samsung MZQL21T9HCJR-00A07 NVMe® de 1,92 TB, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198120988, ulimit -n 1024, ulimit -s 8192), BIOS TTI100BA (SMT=off, Determinism=Power), NPS=1 en comparación con 2P Xeon Platinum 8592+ (128 núcleos totales), AMX activado, 16 DDR5-5600 de 64 GB de 1 TB, 1DPC, 1,0 Gbps NetXtreme BCM5719 Gigabit Ethernet PCIe, KIOXIA KCMYXRUG3T84 NVMe® de 3,84 TB, Ubuntu 22.04.4 LTS, 6.5.0-35-generic (tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT=off, Determinism=Power, Turbo Boost = Enabled) Resultados: CPU Ejecución 1 Ejecución 2 Ejecución 3 Rendimiento relativo medio generacional 2P Turin 192C, NPS1 1565,217 1537,367 1553,957 1553,957 3 2,41 2P Turin 128C, NPS1 1103,448 1138,34 1111,969 1111,969 2,147 1,725 2P Genoa 96C, NPS1 662,577 644,776 640,95 644,776 1,245 1 2P EMR 64C 517,986 421,053 553,846 517,986 1 NA Los resultados pueden variar debido a factores como las configuraciones del sistema, las versiones de software y la configuración del BIOS.

Centro de datos

Sistemas Comerciales

Dispositivos personales y para gaming

Productos Integrados

Recursos

Aceleradores de GPU

Aceleradores Adaptables

Aceleradores de DPU

Adaptadores de ethernet

Workstations

Equipos de Escritorio

Computadoras Portátiles

Recursos

FPGA y SoC Adaptables

Sistemas en Módulos (SOM)

Tecnologías

Recursos para el Desarrollador

Placas y Kits de Prueba

Herramientas para Procesadores

Herramientas y Aplicaciones para Tarjetas Gráficas

Herramientas de FPGA y SoC Adaptables

Propiedad Intelectual y Aplicaciones

Herramientas y Apps para Aceleradores de GPU

Resumen

Para centros de datos y la nube

Para el borde y los puntos de conexión

Para desarrolladores

Industrias

Industrias

Industrias

Industrias

Industrias

Cargas de Trabajo

Juegos

Sistemas

Tecnologías

Recursos

Procesadores EPYC

Tarjetas gráficas Radeon y chipsets AMD

FPGA y SoC Adaptables

Aceleradores Alveo y SOM Kria

Procesadores Ryzen

Adaptadores de Ethernet

Resumen

Procesadores

Aceleradores

SOM, FPGA y SoC adaptables

Tarjetas Gráficas

Página de inicio del Centro para socios

Recursos por producto

Recursos por tipo

Acerca de nuestros socios

Soporte global de AMD

Procesadores y Tarjetas Gráficas

Aceleradores

FPGA y SoC Adaptables

Experiencia de juego y computación personal

Informática embebida y adaptable

Get AMD Fan Gear

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Acelera tus implementaciones de AI Inference empresarial con los procesadores AMD EPYC™ 9005

Cartera de productos líderes para abordar las cargas de trabajo de inferencia de IA empresarial

Baja tolerancia de latencia

Tolerancia de latencia moderada

Alta tolerancia de latencia

Aplicaciones e industrias

Industria automotriz

Servicios financieros

Venta minorista

Fabricación

Medicina

Automatización de servicios

La opción ideal para cargas de trabajo de inferencia de IA empresarial

Diseñado para inferencia de IA

Optimizaciones de software AMD para inferencia de IA

La seguridad de los datos es aún más importante en la era de la IA