EPYC 9005 para AI Inference

Portfólio de ponta para lidar com cargas de trabalho de AI Inference empresarial

A AI Inference usa um modelo de IA treinado para fazer previsões sobre novos dados. A AMD oferece uma grande variedade de soluções para AI Inference dependendo do tamanho do seu modelo e dos requisitos de aplicação. Os processadores AMD EPYC™ são uma excelente opção para modelos de IA de pequeno a médio porte e cargas de trabalho em que a proximidade aos dados é importante. Para aplicativos de processamento em lote ou off-line em que a latência não é essencial, os processadores AMD EPYC oferecem uma solução de inferência econômica.

Estas são apenas algumas das cargas de trabalho de IA que funcionam bem nos processadores AMD EPYC. Para saber mais sobre cada tipo de carga de trabalho, leia este artigo com os detalhes.

Saiba mais sobre as cinco principais cargas de trabalho de inferência de CPU

Tolerância de baixa latência
Tolerância de latência moderada
Tolerância de alta latência

Tolerância de baixa latência

Tipo de sistema	Exemplos	Fundamentação
Sistemas de recomendação	Filtragem baseada em conteúdo Filtragem colaborativa Classificação e similaridade	Geralmente usa modelos menores Suporte a dados esparsos e diversos Alguma tolerância de precisão
Aprendizado de máquina	Árvores de decisão Regressão linear Suporte a máquinas de vetor	Usa operações sequenciais Variedade de cálculos matemáticos

Tolerância de latência moderada

Tipo de sistema	Exemplos	Fundamentação
Processamento de linguagem natural	Classificação do texto Análise de sentimento Texto para fala e fala para texto	Requisito de desempenho definido para taxa de compreensão humana Modelos e conjuntos de dados menores
Aplicações mistas habilitadas para IA	Análise de banco de dados Simulação e modelagem Interatividade em tempo real	Manipulação de dados sequenciais Alternância rápida de contexto dentro do fluxo de trabalho

Tolerância de alta latência

Tipo de sistema	Exemplos	Fundamentação
IA generativa	Geração de documento Criação de texto para imagem Criação de imagem para vídeo	Fluxos de trabalho de criação em lote, geralmente repetitivos Usado para tarefas tradicionalmente humanas que consomem muitos recursos e tempo
Modelos de linguagem grandes	Chatbots Resumos Tradução	Tamanho de prompt menor Conjuntos de dados menores

Aplicações e setores

Os modelos de IA integrados na visão computacional, de processamento de linguagem natural e de sistemas de recomendação têm impactado significativamente as empresas em vários setores. Esses modelos ajudam as empresas a reconhecer objetos, classificar anomalias, entender palavras escritas e faladas e fazer recomendações. Ao acelerar o desenvolvimento desses modelos, as empresas podem aproveitar os benefícios, independentemente do setor onde atuam.

Automotivo

Os modelos de visão computacional ajudam a impulsionar carros autônomos e a reconhecer sinalização, pedestres e outros veículos a serem evitados. Modelos de processamento de linguagem natural podem ajudar a reconhecer comandos falados para telemática no carro.

Serviços financeiros

A detecção de anomalias com tecnologia de IA ajuda a impedir fraudes em cartões de crédito, enquanto os modelos de visão computacional analisam documentos suspeitos, incluindo verificações de clientes.

Varejo

Automatize as filas do caixa com reconhecimento de produtos ou até mesmo crie experiências de compras autônomas em que os modelos vinculam os clientes aos itens que eles escolhem e colocam em suas sacolas. Use mecanismos de recomendação de produtos para oferecer alternativas, seja on-line ou na loja.

Fabricação

Use modelos de visão computacional para monitorar a qualidade de produtos fabricados, de itens alimentícios até mesmo de placas de circuito impresso. Alimente dados de telemetria em mecanismos de recomendação para sugerir manutenção proativa: As unidades de disco estão prestes a falhar? O motor está usando muito óleo?

Top view of cardiologist doctor medical healthcare desk

Saúde

Detecte anomalias, incluindo fraturas e tumores, com modelos de visão computacional. Use os mesmos modelos em pesquisa para avaliar o crescimento e a proliferação celular in vitro.

Automação de serviços

Quando TI e cliente se encontram, o processamento de linguagem natural pode ajudar na tomada de decisões com base em solicitações faladas, e os mecanismos de recomendação podem ajudar a direcionar os clientes a encontrar soluções satisfatórias e alternativas de produtos.

A escolha ideal para cargas de trabalho de AI Inference empresarial

Os processadores AMD EPYC™ Série 9005 foram projetados com as mais modernas tecnologias de padrões abertos para acelerar cargas de trabalho de AI Inference empresarial, estejam eles implementados apenas como CPU ou sendo usados como host para GPUs que executam modelos maiores.

Hardware
Software
Segurança

Projetado para AI Inference

Até 192 núcleos AMD "Zen 5": com amplo e completo caminho de dados de 512 b para compatibilidade com instrução AVX-512, fornece ótimo paralelismo para cargas de trabalho de AI Inference e reduz a necessidade de aceleração da GPU.

Projetado para cargas de trabalho tradicionais e de IA simultâneas: os processadores AMD EPYC de 5ª geração oferecem o mais alto desempenho inteiro para cargas de trabalho tradicionais.¹ Os processadores AMD EPYC oferecem uma inferência eficiente em uma variedade de cargas de trabalho de IA e tamanhos de modelo.

Processamento rápido e E/S: aumento de 37% entre gerações para cargas de trabalho de IA nas instruções por ciclo do clock (IPC).² Memória DDR5 e E/S PCIe® de 5ª geração para rapidez no processamento de dados.

Descubra quando usar CPUs para inferência

Saiba mais sobre as cinco principais cargas de trabalho de inferência de CPU

Otimizações de software AMD para AI Inference

Suporte para estruturas: a AMD oferece suporte para as estruturas de IA mais populares, incluindo TensorFlow, PyTorch e ONNX Runtime, abrangendo diversos casos de uso, como classificação de imagens e mecanismos de recomendação.

Código aberto e compatibilidade: as otimizações são integradas em estruturas populares que oferecem ampla compatibilidade e familiaridade com upstream de código aberto. Além disso, a AMD está trabalhando com a Hugging Face para possibilitar modelos de código aberto direto da produção com o ZenDNN.

Plug-ins ZenDNN: esses plug-ins aceleram as cargas de trabalho de AI Inference ao otimizar operadores, aproveitar microkernels e implementar multithreading eficiente em núcleos AMD EPYC.

Veja como é fácil usar o ZenDNN

Ampliar imagem

A segurança dos dados é ainda mais importante na era da IA

À medida que o uso de digitalização, computação na nuvem, IA e outras tecnologias emergentes fomentam o crescimento dos dados, a necessidade de implementar medidas de segurança avançadas se torna ainda mais urgente. Essa maior necessidade por segurança é amplificada ainda mais pela ênfase global em regulamentos de privacidade e penalidades severas por violações, o que destaca o valor incomparável dos dados em meio ao aumento dos riscos de segurança.

Incorporado ao nível de silício, o AMD Infinity Guard oferece os recursos avançados necessários para ajudar na defesa contra ameaças internas e externas e manter seus dados protegidos.³

Saiba mais

Modelos de carga de trabalho de IA

Os servidores baseados no processador AMD EPYC™ 9005 e as instâncias em nuvem permitem soluções rápidas e eficientes habilitadas para IA, próximas de seus clientes e dados.

Servidores 2P executando Llama3.1-8B BF16⁴ (tokens relativos/segundo)

AMD EPYC™ 9965 de 5ª geração

1,8x

AMD EPYC™ 9654 de 4ª geração

1,3x

Xeon® Platinum® 8592+ de 5ª geração

1,0x

Servidores 2P executando FAISS⁵ (solicitações/hora)

AMD EPYC™ 9965 de 5ª geração

3,8x

AMD EPYC™ 9654 de 4ª geração

2,0x

Xeon® Platinum® 8592+ de 5ª geração

1,0x

Servidores 2P executando TPCx-AI a SF30⁶ (produtividade/min.)

AMD EPYC™ 9965 de 5ª geração

3,8x

AMD EPYC™ 9654 de 4ª geração

2,3x

Xeon® Platinum® 8592+ de 5ª geração

1,0x

Servidores 2P executando XGBoost a SF30⁷ (execução/hora)

AMD EPYC™ 9965 de 5ª geração

3,0x

AMD EPYC™ 9654 de 4ª geração

2,0x

Xeon® Platinum® 8592+ de 5ª geração

1,0x

Recursos

Resumos da IA empresarial do AMD EPYC

Encontre a documentação da AMD e de parceiros descrevendo IA e inovação de aprendizado de máquina

Visite a biblioteca

Processadores AMD EPYC Série 9005

Os processadores AMD EPYC™ 9005 permitem AI Inference rápida e eficiente próxima dos dados empresariais, resultando em um desempenho de negócios transformador.

Saiba mais

Podcasts

Ouça os principais especialistas da AMD e do setor analisam os tópicos mais recentes sobre servidores, computação na nuvem, IA, HPC e muito mais.

Visite o Arquivo

Notas de rodapé

9xx5-002D: comparação de SPECrate®2017_int_base baseada nas pontuações publicadas em www.spec.org em 10/10/2024. 2P AMD EPYC 9965 (3000 SPECrate®2017_int_base, 384 núcleos totais, 500W TDP, $14,813 CPU $), 6.060 SPECrate®2017_int_base/CPU W, 0.205 SPECrate®2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2024q4/cpu2017-20240923-44837.html) 2P AMD EPYC 9755 (2720 SPECrate®2017_int_base, 256 núcleos totais, 500W TDP, $12,984 CPU $), 5.440 SPECrate®2017_int_base/CPU W, 0.209 SPECrate®2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2024q4/cpu2017-20240923-44824.html) 2P AMD EPYC 9754 (1950 SPECrate®2017_int_base, 256 núcleos totais, 360W TDP, $11,900 CPU $), 5.417 SPECrate®2017_int_base/CPU W, 0.164 SPECrate®2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html) 2P AMD EPYC 9654 (1810 SPECrate®2017_int_base, 192 núcleos totais, 360W TDP, $11,805 CPU $), 5.028 SPECrate®2017_int_base/CPU W, 0.153 SPECrate®2017_int_base/CPU $, https://www.spec.org/cpu2017/results/res2024q1/cpu2017-20240129-40896.html) 2P Intel Xeon Platinum 8592+ (1130 SPECrate®2017_int_base, 128 núcleos totais, 350W TDP, $11,600 CPU $) 3.229 SPECrate®2017_int_base/CPU W, 0.097 SPECrate®2017_int_base/CPU $, http://spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html) 2P Intel Xeon 6780E (1410 SPECrate®2017_int_base, 288 núcleos totais, 330W TDP, $11,350 CPU $) 4.273 SPECrate®2017_int_base/CPU W, 0.124 SPECrate®2017_int_base/CPU $, https://spec.org/cpu2017/results/res2024q3/cpu2017-20240811-44406.html) SPEC®, SPEC CPU® e SPECrate® são marcas registradas da Standard Performance Evaluation Corporation. Consulte www.spec.org para obter mais informações. Intel CPU TDP em https://ark.intel.com/.
9xx5-001: Com base em testes internos da AMD em 10/09/2024, melhoria de desempenho de média geométrica (IPC) em frequência fixa. - Cargas de trabalho de servidor ML/HPC geracional EPYC de 5ª geração IPC com melhoria de 1,369x (média geométrica) usando um conjunto selecionado de 24 cargas de trabalho e a média geométrica de cargas de trabalho representativas do servidor ML (média geométrica) e cargas de trabalho representativas do servidor HPC (média geométrica). Configuração "Genoa" (todos os NPS1): EPYC 9654 BIOS TQZ1005D 12 núcleos e 12 threads (1 núcleo e 1 thread/CCD em 12+1), FF 3 GHz, 12x DDR5-4800 (2Rx4 64 GB), xGMI de 32 Gbps; config. "Turin" (todos os NPS1): EPYC 9V45 BIOS RVOT1000F com 12 núcleos e 12 threads (1 núcleo e 1 thread/CCD em 12+1), FF 3 GHz, 12x DDR5-6000 (2 Rx4 de 64 GB), xGMI de 32 Gbps Utilizando o determinismo de desempenho e o regulador de desempenho no sistema operacional Ubuntu 22.04 com kernel genérico 6.8.0-40 para todas as cargas de trabalho, exceto LAMMPS, HPCG, NAMD, OpenFOAM e Gromacs, que utilizam o 24.04 com kernel genérico 6.8.0-40. SPEC® e SPECrate® são marcas registradas da Standard Performance Evaluation Corporation. Saiba mais em spec.org.
Os recursos do AMD Infinity Guard GD-183A variam de acordo com as gerações e/ou séries de processadores EPYC™. Para que funcionem, os recursos de segurança do Infinity Guard devem ser habilitados pelos OEMs do servidor e/ou pelos provedores de serviços em nuvem. Entre em contato com seu OEM ou fornecedor para confirmar o suporte para esses recursos. Saiba mais sobre o Infinity Guard em https://www.amd.com/en/products/processors/server/epyc/infinity-guard.html
9xx5-009: resultados de produtividade do Llama3.1-8B com base em testes internos da AMD em 05/09/2024. Configurações do Llama3-8B: IPEX.LLM 2.4.0, NPS=2, BF16, tamanho do lote: 4, configurações do token de entrada/saída do caso de uso: [Resumo = 1024/128, Chatbot = 128/128, Traduzir = 1024/1024, Ensaio = 128/1024, Legenda = 16/16]. 2P AMD EPYC 9965 (384 núcleos totais), 6 instâncias de 64 núcleos DDR5-6400 de 1,5 TB 24x64 GB (a 6000 MT/s), 1 DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu® 22.04.3 LTS, 6.8.0-40-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C, (SMT = desativado, Determinismo = potência, Turbo Boost = ativado), NPS=22P AMD EPYC 9755 (256 núcleos totais), 4 instâncias de 64 núcleos, DDR5-6400 de 1,5 TB 24x64 GB (a 6000 MT/s), 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu 22.04.3 LTS, 6.8.0-40-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT = desativado, Determinismo = potência, Turbo Boost = ativado), NPS=2 2P AMD EPYC 9654 (192 núcleos totais) 4 instâncias de 48 núcleos, DDR5-4800 de 1,5 TB 24x64 GB, 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu® 22.04.4 LTS, 5.15.85-051585-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 1198117616, ulimit -n 500000, ulimit -s 8192), BIOS RVI1008C (SMT = desativado, Determinismo = potência, Turbo Boost = ativado), NPS=2 em comparação com o 2P Xeon Platinum 8592+ (128 núcleos totais), 2 instâncias de 64 núcleos, AMX ativado, DDR5-5600 de 1 TB 16x64 GB, 1DPC, NetXtreme BCM5719 Gigabit Ethernet PCIe de 1,0 Gbps, KIOXIA KCMYXRUG3T84 NVMe® de 3,84 TB, Ubuntu 22.04.4 LTS 6.5.0-35-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT = desativado, Determinismo = potência, Turbo Boost = ativado). Resultados: CPU 2P EMR 64c 2P Turin 192c 2P Turin 128c 2P Genoa 96c Média Agregada Mediana Total Produtividade 99.474 193.267 182.595 138.978 Competitiva 1 1.943 1.836 1.397 Geracional NA 1.391 1.314 1 Os resultados podem variar de acordo com fatores que incluem configurações do sistema, versões de software e configurações do BIOS.
9xx5-011: Resultados de produtividade FAISS (solicitações/hora) com base em testes internos da AMD em 05/09/2024. Configurações do FAISS: conjuntos de dados sift1m, instâncias de 16 núcleos, FP32, MKL 2024.2.1 2P AMD EPYC 9965 (384 núcleos totais), 24 instâncias de 16 núcleos, DDR5-6400 de 1,5 TB 24x64 GB (a 6000 MT/s), 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT = desativado, Determinismo = potência, Turbo Boost = ativado), NPS=42P AMD EPYC 9654 (192 núcleos totais) 12 instâncias de 16 núcleos, DDR5-4800 de 1,5 TB 24x64 GB, 1DPC, 2 Samsung MZQL21T9HCJR-00A07 NVMe de 1,92 TB, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT = desativado, Determinismo = potência), NPS=4 em comparação com o 2P Xeon Platinum 8592+ (128 núcleos totais), 8 instâncias de 16 núcleos, AMX ativado, DDR5-5600 de 1 TB 16x64 GB, 1DPC, NetXtreme BCM5719 Gigabit Ethernet PCIe de 1,0 Gbps, KIOXIA KCMYXRUG3T84 NVMe de 3,84 TB, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT = desativado, Determinismo = potência, Turbo Boost = ativado) Resultados: CPU Mediana Relativa Produtividade Geracional 2P Turin 192C 64.2 3.776 1.861 2P Genoa 96C 34.5 2.029 1 2P EMR 64C 17 1 NA Os resultados podem variar de acordo com fatores que incluem configurações do sistema, versões de software e configurações do BIOS.
9xx5-012: resultados de produtividade do TPCxAI SF30 com tamanho de instância de 32 núcleos de várias instâncias, com base em testes internos da AMD em 05/09/2024 executando várias instâncias de VM. O teste completo e agregado de produtividade de IA é derivado da avaliação de desempenho TPCx-AI e, como tal, não é comparável aos resultados do TPCx-AI publicados, já que os resultados do teste completo de produtividade de IA não atendem à especificação TPCx-AI. 2P AMD EPYC 9965 (384 núcleos totais), 12 instâncias de 32 núcleos, NPS1, DDR5-6400 de 1,5 TB 24x64 GB (a 6000 MT/s), 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT = desativado, Determinismo = potência, Turbo Boost = ativado); 2P AMD EPYC 9755 (256 núcleos totais), 8 instâncias de 32 núcleos, NPS1, DDR5-6400 de 1,5 TB 24x64 GB (a 6000 MT/s), 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT = desativado, Determinismo = potência, Turbo Boost = ativado); 2P AMD EPYC 9654 (192 núcleos totais) 6 instâncias de 32 núcleos, NPS1, DDR5-4800 de 1,5 TB 24x64 GB, 1DPC, 2 Samsung MZQL21T9HCJR-00A07 NVMe de 1,92 TB, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT = desativado, Determinismo = potência), em comparação com o 2P Xeon Platinum 8592+ (128 núcleos totais), 4 instâncias de 32 núcleos, AMX ativado, DDR5-5600 de 1 TB 16x64 GB, 1DPC, NetXtreme BCM5719 Gigabit Ethernet PCIe de 1,0 Gbps, KIOXIA KCMYXRUG3T84 NVMe de 3,84 TB, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT = desativado, Determinismo = potência, Turbo Boost = ativado). Resultados: CPU Mediana Relativa Geracional Turin 192C, 12 Inst 6067.531 3.775 2.278 Turin 128C, 8 Inst 4091.85 2.546 1.536 Genoa 96C, 6 Inst 2663.14 1.657 1 EMR 64C, 4 Inst 1607.417 1 NA Os resultados podem variar de acordo com fatores que incluem configurações do sistema, versões de software e configurações do BIOS. TPC, TPC Benchmark e a TPC-C são marcas comerciais do Transaction Processing Performance Council.
9xx5-040A: resultados de produtividade (execuções/hora) do XGBoost com base em testes internos da AMD em 05/09/2024. Configurações do XGBoost: v2.2.1, conjunto de dados Higgs, instâncias de 32 núcleos, FP32 2P AMD EPYC 9965 (384 núcleos totais), 12 instâncias de 32 núcleos, DDR5-6400 de 1,5 TB 24x64 GB (a 6000 MT/s), NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu® 22.04.4 LTS, 6.8.0-45-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198078840, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT= desativado, Determinismo = potência, Turbo Boost = ativado), NPS=1 2P AMD EPYC 9755 (256 núcleos totais), DDR5-6400 de 1,5 TB 24x64 GB (a 6000 MT/s), 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198094956, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT= desativado, Determinismo = potência, Turbo Boost = ativado), NPS=1 2P AMD EPYC 9654 (192 núcleos totais), DDR5-4800 de 1,5 TB 24x64GB, 1DPC, 2 Samsung MZQL21T9HCJR-00A07 NVMe® de 1,92 TB, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 198120988, ulimit -n 1024, ulimit -s 8192), BIOS TTI100BA (SMT= desativado, Determinismo = potência), NPS=1, em comparação com o 2P Xeon Platinum 8592+ (128 núcleos totais), AMX ativado, DDR5-5600 de 1 TB 16x64 GB, 1DPC, NetXtreme BCM5719 Gigabit Ethernet PCIe de 1,0 Gbps, KIOXIA KCMYXRUG3T84 NVMe® de 3,84 TB, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (desempenho de produtividade de perfil tuned-adm, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT= desativado, Determinismo = potência, Turbo Boost = ativado) Resultados: produtividade relativa mediana da CPU Run 1 Run 2 Run 3 entre gerações 2P Turin 192C, NPS1 1565.217 1537.367 1553.957 1553.957 3 2.41 2P Turin 128C, NPS1 1103.448 1138.34 1111.969 1111.969 2.147 1.725 2P Genoa 96C, NPS1 662.577 644.776 640.95 644.776 1.245 1 2P EMR 64C 517.986 421.053 553.846 517.986 1 NA. Os resultados podem variar de acordo com fatores que incluem configurações do sistema, versões de software e configurações do BIOS.

Data Center

Sistemas de negócios

Pessoais e para gamers

Embedded

Recursos

Aceleradores de GPU

Aceleradores adaptativos

Aceleradores DPU

Adaptadores de ethernet

Estações de trabalho

Desktops

Notebooks

Recursos

FPGAs e SoCs adaptativos

Sistemas em módulos (SOMs)

Tecnologias

Recursos do desenvolvedor

Kits e Placas de avaliação

Ferramentas para processador

Ferramentas para placas de vídeo e Apps

FPGA e Ferramentas SoC adaptativas

Propriedade intelectual e Apps

Ferramentas de acelerador de GPU e Apps

Visão Geral

Comunicados à imprensa

Para borda e endpoints

Para desenvolvedores

Setores

Setores

Setores

Setores

Industrias

Cargas de trabalho

Jogos

Sistemas

Tecnologias

Recursos

Processadores EPYC

Placas de vídeo Radeon e Chipsets AMD

FPGA e SoCs adaptativos

Aceleradores Alveo e SOMs Kria

Processadores Ryzen

Adaptadores de ethernet

Visão Geral

Processadores

Aceleradores

SOMs, FPGAs e SoCs, adaptativos

Placas de vídeo

Visão Geral

Recursos por produto

Recursos por tipo

Sobre os nossos parceiros

Suporte global da AMD

Processadores e Placas de vídeo

Aceleradores

FPGA e SoCs adaptativos

Jogos e computação pessoal

Computação incorporada e adaptativa

Get AMD Fan Gear

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Acelere suas implementações de AI Inference empresarial com os processadores AMD EPYC™ 9005

Portfólio de ponta para lidar com cargas de trabalho de AI Inference empresarial

Tolerância de baixa latência

Tolerância de latência moderada

Tolerância de alta latência

Aplicações e setores

Automotivo

Serviços financeiros

Varejo

Fabricação

Saúde

Automação de serviços

A escolha ideal para cargas de trabalho de AI Inference empresarial

Projetado para AI Inference

Otimizações de software AMD para AI Inference

A segurança dos dados é ainda mais importante na era da IA