Webinar ao vivo

Tecnologia AMD EPYC™ transformando desafios da IA empresarial

Saiba como a combinação vencedora entre processadores AMD EPYC™ e os principais aceleradores de GPU entrega a força necessária para enfrentar os mais exigentes desafios da IA empresarial.

AMD EPYC

Os processadores AMD EPYC™ maximizam o valor dos grandes investimentos em GPU

Os aceleradores de GPU tornaram-se a pedra angular da IA moderna, destacando-se no treinamento de modelos grandes e complexos e suportando inferência em tempo real eficiente e em grande escala. Mas, para maximizar o potencial do seu investimento em GPU, você precisa de um parceiro robusto de CPU.

Por que usar GPUs para cargas de trabalho de IA?

As GPUs são a ferramenta ideal para muitas cargas de trabalho de IA.

  • Treinamento de IA: com suas capacidades de processamento paralelo, as GPUs aceleram o treinamento dos modelos de tamanho grande e médio.
  • Implantações de IA dedicadas: as GPUs oferecem a velocidade e a escalabilidade necessárias para inferência em tempo real em implantações em grande escala

A vantagem da CPU:

Combinar o poder das GPUs com a CPU certa pode aumentar significativamente a eficiência da IA para determinadas cargas de trabalho. Procure por esses principais recursos da CPU:

  • Alta frequência e contagem de núcleos: lida com tarefas extensivas de preparação e pós-processamento de dados de forma rápida e eficiente.
  • Tamanho de cache grande: facilita o acesso rápido de dados a conjuntos de dados maciços.
  • Alta largura de banda de memória e E/S de alto desempenho: permite a troca de dados rápida e contínua entre CPU e GPU.
  • Núcleos com uso eficiente de energia: libera energia para o uso da GPU e ajuda a reduzir o consumo geral de energia.
  • A compatibilidade com GPU e ecossistema de softwares permite a otimização de desempenho, eficiência e operação.
GPU System

Processadores AMD EPYC

Sua escolha ideal para desbloquear o verdadeiro potencial de suas grandes cargas de trabalho de IA. Eles ajudam a maximizar o desempenho do acelerador de GPUs e a eficiência geral da carga de trabalho de IA.  Além disso, com recursos de segurança avançados e um compromisso longo e consistente com padrões abertos, os processadores AMD EPYC permitem que as empresas implantem com confiança a próxima fase da sua jornada de IA.  

Aplicações e setores

As soluções baseadas em aceleradores de GPU com tecnologia das CPUs AMD EPYC alimentam muitos dos supercomputadores e instâncias de nuvem mais rápidos do mundo, oferecendo às empresas uma plataforma de sucesso comprovado para otimizar cargas de trabalho orientadas por dados e alcançar resultados inovadores em IA.

CPUs AMD EPYC: a escolha certa para maximizar o valor dos grandes investimentos em GPU

As CPUs desempenham um papel crucial na orquestração e sincronização de transferências de dados entre GPUs, no tratamento de sobrecargas de lançamento de kernel e gerenciamento da preparação de dados. Esta função de “condutor” garante que as GPUs operem com eficiência máxima.

Otimize o valor de investimento da GPU com CPUs de alto desempenho

Algumas cargas de trabalho se beneficiam de altas velocidades do clock da CPU para melhorar o desempenho da GPU, simplificando o processamento de dados, transferência e execução simultânea e aumentando a eficiência das GPUs.

Para provar o conceito de que frequências mais altas de uma CPU aumentam a produtividade da carga de trabalho Llama2-7B, usamos CPUs AMD EPYC 9554 personalizadas em um servidor 2P equipadas com 8x GPUs NVIDIA H1001

Ajuste fino da Llama2-7B
Desempenho relativo em 2,0 GHz
1,0x
Desempenho relativo em 2,5 GHz
1.12x
Desempenho relativo em 3,0 GHz
1.28x

Treinamento da Llama2-7B (comprimento de sequência 1K)
Desempenho relativo em 2,0 GHz
1,0x
Desempenho relativo em 2,5 GHz
1.16x
Desempenho relativo em 3,0 GHz
1.2x

Treinamento da Llama2-7B (comprimento de sequência 2K)
Desempenho relativo em 2,0 GHz
1,0x
Desempenho relativo em 2,5 GHz
1.1x
Desempenho relativo em 3,0 GHz
1.14x

Implemente a IA corporativa de forma eficiente

Processadores que combinam alto desempenho, baixo consumo de energia, manuseio eficiente de dados e recursos eficazes de gerenciamento de energia permitem que sua infraestrutura de IA opere com desempenho máximo, otimizando o consumo de energia e os custos.

Os processadores AMD EPYC estão atuando nos servidores mais eficientes em termos de energia do mundo, oferecendo desempenho excepcional e ajudando a reduzir os custos de energia.2 Implante-os com confiança para criar soluções energeticamente eficientes e ajudar a otimizar sua jornada de IA.

Nos processadores AMD EPYC Série 9004, o AMD Infinity Power Management oferece excelente desempenho padrão e permite ajuste fino para comportamento específico das cargas de trabalho.

Abstract illustration with glowing blue lines

Paz de espírito: adote soluções de IA confiáveis

Escolha entre várias soluções aceleradas por GPU certificadas ou validadas e hospedadas por CPUs AMD EPYC para potencializar suas cargas de trabalho de IA.

Prefere soluções equipadas com o acelerador AMD Instinct?

Usando outras GPUs? Peça pelas soluções equipadas com CPU AMD EPYC disponíveis nos principais fornecedores de soluções de plataforma, incluindo Asus, Dell, Gigabyte, HPE, Lenovo e Supermicro.

Ecossistema crescente de opções de instâncias de CPU AMD EPYC + GPU Cloud e IA/ML

Peça por instâncias que combinam CPU AMD EPYC com GPUs para cargas de trabalho de IA/ML de grandes provedores de nuvem, incluindo AWS, Azure, Google, IBM Cloud e OCI.

server room photo

Recursos

Aceleradores AMD Instinct

Excepcionalmente adequados para avançar suas cargas de trabalho de IA mais exigentes.

Resumos da IA empresarial do AMD EPYC

Encontre a documentação da AMD e de parceiros descrevendo IA e inovação de aprendizado de máquina usando CPUs e GPUs

Podcasts

Ouça os principais especialistas da AMD e do setor analisam os tópicos mais recentes sobre servidores, computação na nuvem, IA, HPC e muito mais.

Notas de rodapé
  1. SP5-292: resultados de ajuste fino e produtividade do treinamento da Llama2-7B com base em testes internos de prova de conceito da AMD em 15/6/2024.

    Configurações do servidor: 2P EPYC 9554 (CPU com frequências customizadas, 64C/128T, 16 núcleos ativos), memória de 1,5 TB (24 x 64 GB DDR5-5600 rodando a 4800 MT/s), SSD de 3,2 TB, Ubuntu® 22.04.4 LTS, com 8x NVIDIA H100 80 GB HBM3, Transformadores HuggingFace v 4.31.0, NVIDIA PyTorch 23.12, PEFT 0.4.0, Python 3.10.12, CUDA 12.3.2.001, TensorRT-LLM v 0.9.0.dev2024, CUDNN 8.9.7.29+cuda12.2, Driver NVIDIA-SMI versão 550.54.15, TRT v8.6.1.6+cuda12.0.1.011, Transformer Engine v1.1

    Ajuste fino da Llama2-7B: BS por dispositivo = 4, seqln = 128, média em quatro execuções, 10 epochs por execução, FP16

    Treinamento em Llama2-7B (1K): BS = 56 (7 x 8 GPUs), seqln = 1k, gradientes na GPU

    Treinamento em Llama2-7B (2K): BS = 24 (3 x 8 GPUs), seqln = 2k, gradientes na GPU

    Resultados:

    CPU Freq              2000 MHz           2500 MHz           3000 MHz

    Ajuste fino do tempo médio de execução do treinamento em segundos: 649,38 584,24 507,1

    Aumento de % na produtividade: 0,00% 11,15% 28,06%

    Produtividade do treinamento, comprimento da sequência 1K: 276,08 238,81 230,82

    Aumento de % na produtividade: 0,00% 15,61% 19,61%

    Produtividade do treinamento, comprimento da sequência 2K: 883,85 807,94 778,72

    Aumento de % na produtividade: 0,00% 9,40% 13,50%

    Os resultados podem variar devido a fatores como configuração do sistema, versões de software e configurações do BIOS. OBSERVAÇÃO: Este desempenho é a prova de conceito. Dados coletados em 2P personalizado com AMD EPYC™ 9554 como processador host com várias frequências, utilizando aceleradores 8x Nvidia H100 80 GB. Os processadores EPYC de 4a geração não permitem que os usuários finais ajustem as frequências

  2. EPYC-028D: SPECpower_ssj® 2008, SPECrate®2017_int_energy_base e SPECrate®2017_fp_energy_base com base nos resultados publicados no site da SPEC em 21/02/2024. Resultados baseados no desempenho de energia do servidor/desempenho de energia do servidor e de armazenamento (PPKW) do VMmark®, publicados em https://www.vmware.com/products/vmmark/results3x.1.html?sort=score. As primeiras 105 publicações classificadas do SPECpower_ssj®2008 com os resultados ssj_ops/W de eficiência geral mais altos foram de processadores AMD EPYC. Para o SPECrate®2017 Integer (base de energia), as CPUs AMD EPYC equipam as primeiras 8 pontuações W de desempenho/sistema SPECrate®2017_int_energy_base. Para o SPECrate®2017 Floating Point (base de energia), as CPUs AMD EPYC equipam as primeiras 12 pontuações W de desempenho/sistema SPECrate®2017_fp_energy_base. Para o desempenho de energia de servidor (PPKW) do VMmark®, elas têm os cinco melhores resultados de par combinado de dois e quatro soquetes, superando todos os outros resultados de soquete, e para o desempenho de energia do servidor e de armazenamento (PPKW) do VMmark®, elas têm a maior pontuação geral. Acesse https://www.amd.com/en/claims/epyc4#faq-EPYC-028D para ver a lista completa. Para mais informações sobre as metas de sustentabilidade da AMD, acesse https://www.amd.com/en/corporate/corporate-responsibility/data-center-sustainability.html. Mais informações sobre SPEC® estão disponíveis em http://www.spec.org. SPEC, SPECrate e SPECpower são marcas registradas da Standard Performance Evaluation Corporation. VMmark é uma marca registrada da VMware nos EUA ou em outros países.