IA: dos endpoints à borda e à nuvem, graças à AMD

A IA generativa está transformando a maneira como os clientes empresariais operam. Na verdade, a IA vem rapidamente se tornando parte de quase todos os processos de negócios aos quais respalda, do atendimento ao cliente à análise de dados, e esse aprofundamento da integração só vai crescer. No entanto, a IA é uma carga de trabalho relativamente nova, adicionada à infraestrutura existente e que coloca pressão nas configurações de hardware atuais.

Se os clientes querem aproveitar experiências de IA uniformes e ganhos de produtividade imediatos e a longo prazo, eles precisam de ajuda para desenvolver sua infraestrutura de TI. É aí que entram as tecnologias AMD, proporcionando às empresas o desempenho e a eficiência para operar fluxos de trabalho existentes, juntamente com as novas possibilidades que a IA oferece. 

Abra o mundo da IA com os processadores AMD EPYC™

Os processadores AMD EPYC™ são confiáveis para equipar um terço dos servidores do mundo, e por um bom motivo.1 Oferecendo a melhor CPU de data center do mundo para clientes corporativos, os processadores AMD EPYC de uso geral fornecem opções de até 96 núcleos que entregam até 1,75 vez o desempenho por watt de CPU e 1,8 vez o desempenho em SPECrate® 2017_int_base, em comparação com produtos concorrentes.2

As CPUs de alto desempenho da AMD oferecem uma sólida opção para empresas que implantam cargas de trabalho de IA, como sistemas de recomendação, soluções de aprendizado de máquina e outros usos da IA generativa. 

Aproveitar a infraestrutura padrão comprovada, combinada com a atualização para processadores AMD EPYC potentes, ajuda os clientes a manter os custos em toda a área de ocupação do servidor, energia e despesas iniciais baixos e pode aumentar o desempenho e a densidade do servidor, ajudando a colocar mais casos de uso ao alcance e melhorar o ROI.

Saiba mais sobre os processadores AMD EPYC™.

Agilizando a IA com os aceleradores AMD Instinct™

Muitas cargas de trabalho e casos de uso de IA exigem mais do que as CPUs AMD EPYC podem fazer sozinhas. Grandes modelos de linguagem continuam a crescer em centenas de bilhões (ou mesmo trilhões) de parâmetros.

Felizmente, a AMD oferece uma variedade de mecanismos de carga de trabalho para lidar até mesmo com as tarefas de IA mais exigentes. Estendendo o conjunto de cargas de trabalho de IA gerenciadas de forma eficaz pelos processadores AMD EPYC, entra o poder da aceleração da GPU, graças aos aceleradores AMD Instinct™. Onde as CPUs de servidor AMD gerenciam modelos pequenos a médios e implantações mistas de inferência de carga de trabalho, os aceleradores AMD facilitam o treinamento em IA em tempo real e alto volume, implantações de IA dedicadas, modelos médios a grandes e inferência em tempo real em grande escala, acelerando os resultados de IA para empresas que buscam aproveitar ao máximo as novas tecnologias.

A AMD oferece uma gama de soluções de GPU para vários níveis de desempenho e fatores de forma. O carro-chefe, acelerador AMD Instinct™ MI300X, equipado com a pilha de software AMD ROCm™, oferece uma melhoria de aproximadamente 2,1 vezes na latência em comparação com o produto Nvidia H100 executando o chat Llama2-70b e uma melhoria de cerca de 8 vezes em comparação com produtos de geração anterior na latência geral do Llama2-70b.3,4

Com software de código aberto pronto para a empresa, a AMD ROCm™ apoia a aceleração da AMD, as empresas podem estar em funcionamento rapidamente em cargas de trabalho de IA, com suporte para cerca de 400.000 modelos Hugging Face e engajamentos profundos com outros líderes de IA, incluindo PyTorch e OpenAI.

Saiba mais sobre os aceleradores AMD Instinct™.

Oferecendo versatilidade com os aceleradores AMD Alveo™

Propositadamente adaptáveis, os aceleradores AMD Alveo™ oferecem desempenho em tempo real no data center para uma variedade de casos de uso. Os clientes podem otimizar a plataforma para a carga de trabalho necessária, adaptando-se a algoritmos em evolução e requisitos de aplicação, conforme necessário.

Com baixa latência para aplicativos em tempo real e alta produtividade e eficiência, os aceleradores AMD Alveo são ideais para clientes que querem ter certeza de que têm o que precisam para análise de dados, HPC, aceleração de mídia e infraestrutura e muito mais.

Saiba mais sobre os aceleradores AMD Alveo™.

Trazendo IA para máquinas locais com processadores AMD Ryzen™

A IA não opera apenas em servidores; agora está em dispositivos de usuário final, aprimorando a maneira como as pessoas trabalham e elevando os processos tradicionais, o que facilita e acelera o trabalho e deixa as equipes livres para se concentrarem no cenário geral.

Os processadores AMD Ryzen™ PRO são os mais avançados e ultra-eficientes do mundo para desktops corporativos5 e fornecem o primeiro mecanismo de IA integrado em um processador x86.6 Esse nível de ativação de IA de servidores para dispositivos clientes traz recursos incríveis que simplesmente não eram possíveis antes.

Saiba mais sobre os processadores AMD Ryzen™ PRO.

Completando o panorama com SoCs adaptativos AMD Versal™ para IA de borda

Mas a IA também não é apenas para PCs e servidores. Existem muitas aplicações em que o processamento de IA local em dispositivos de borda pode ter um enorme impacto no desempenho e na segurança.

No setor automotivo, a IA na borda pode aumentar a segurança, permitindo que os dados do sensor sejam processados localmente para que as decisões possam ser tomadas em tempo real. Você não quer que o seu veículo autônomo espere os dados serem processados na nuvem para decidir se deve aplicar os freios para evitar um acidente.

Na área da saúde, a IA na borda pode melhorar o equipamento de imagem para acelerar diagnósticos ou fornecer visualização em tempo real para ajudar em cirurgias. Ela também pode ajudar a proteger a privacidade do paciente ao não precisar enviar dados pela nuvem.

E no espaço industrial, a IA na borda pode ajudar os equipamentos de fábrica a funcionar de forma mais segura e eficiente. Os FPGAs AMD e os SoCs adaptativos gerenciam eficientemente o pré-processamento, a inferência e o pós-processamento de dados para sistemas incorporados clássicos e orientados por IA, com sua mais nova oferta, o SoC adaptativo AMD Versal™ Série AI Edge Gen 2, controlando todas essas funções com um único chip.

Com os produtos AMD Versal, os clientes podem trazer a IA para todos os aspectos de seus negócios, tornando os ambientes industriais e de consumidor existentes mais inteligentes e habilitados com IA.

Saiba mais sobre os SoCs adaptativos AMD Versal™.

Os benefícios da IA são generalizados, e ela está se tornando uma parte fundamental da computação moderna. As empresas precisam se adaptar e adotar tecnologias inovadoras, como as da AMD, se quiserem aproveitar os benefícios.

Se quiser saber mais sobre os produtos AMD e seu suporte para o crescente ecossistema de IA, entre em contato com seu representante local ou acesse as Soluções de IA da AMD.

AMD Arena


Melhore seu conhecimento sobre os produtos AMD com treinamentos do AMD Ryzen™ PRO, AMD EPYC™, AMD Instinct™ e muito mais.

Artigos relacionados

Notas de rodapé
  1. Fonte: Estimativas de Expedição de Receita de Vendas Internas da Mercury Research, 4º trim. de 2023
  2. SP5-013D: comparação de SPECrate®2017_int_base baseada nas pontuações publicadas em www.spec.org em 02/06/2023. Comparação do 2P AMD EPYC 9654 publicado (1800 SPECrate®2017_int_base, 720 TDP total W, US$ 23.610,00 total 1Ku, 192 núcleos totais, 2.500 Perf/W, 0,076 Perf/CPU US$, http://spec.org/cpu2017/results/res2023q2/cpu2017-20230424-36017.html) é 1,8 vez o desempenho do 2P Intel Xeon Platinum 8490H publicado (1000 SPECrate®2017_int_base, 700 TDP total W, US$ 34.000,00 total 1Ku, 120 núcleos totais, 1.429 Perf/W, 0,029 Perf/CPU  S$, http://spec.org/cpu2017/results/res2023q1/cpu2017-20230310-34562.html) [a 1,75 vez o desempenho/W] [a 2,59 vezes o desempenho/CPU US$]. 2P AMD EPYC 7763 publicado (861 SPECrate®2017_int_base, 560 TDP total W, US$ 15.780,00 total 1Ku, 128 núcleos totais, 1.538 Perf/W, 0,055 Perf/CPU US$, http://spec.org/cpu2017/results/res2021q4/cpu2017-20211121-30148.html) é mostrado para referência a 0,86 vez o desempenho [a 1,08 vez o desempenho/W] [a 1,86 vez o desempenho/CPU US$]. Preços do AMD 1Ku e especificações e preços do Intel ARK.intel.com em 01/06/2023. SPEC®, SPEC CPU® e SPECrate® são marcas registradas da Standard Performance Evaluation Corporation. Consulte www.spec.org para obter mais informações.
  3. MI300-38A: Latência geral para geração de texto usando o modelo de bate-papo Llama2-70b com comparação vLLM usando o contêiner docker personalizado para cada sistema com base em testes internos da AMD em 14/12/2023. Comprimento da sequência de 2048 tokens de entrada e 128 tokens de saída. Os testes vLLM usaram uma versão aprimorada do script benchmark_latency.py do diretório de avaliações de desempenho de https://github.com/vllm-project/vllm.  Melhorias foram adicionadas para permitir o uso de prompts de entrada com comprimentos específicos. A versão vLLM usada para MI300X contém modificações que ainda não estão disponíveis fora da AMD. Configurações: Servidor 2P Intel Xeon Platinum 8480C CPU com 8 GPUs AMD Instinct™ MI300X (192 GB, 750 W), pré-lançamento do ROCm® 6.1.0, PyTorch 2.2.0, vLLM para ROCm, Ubuntu® 22.04.2. em comparação com um Nvidia DGX H100 com 2 processadores Intel Xeon Platinum 8480CL, 8 GPUs Nvidia H100 (80 GB, 700 W), CUDA 12.1., PyTorch 2.1.0., vLLM v.02.2.2 (mais recente), Ubuntu 22.04. Os fabricantes de servidores podem ter outras configurações, gerando resultados diferentes. O desempenho pode variar baseado no uso dos drivers e otimizações mais recentes.
  4. MI300-33: Texto gerado com o chat Llama2-70b usando comprimento de sequência de entrada de 4096 e comparação de 32 tokens de saída usando o contêiner de encaixe personalizado para cada sistema com base em testes internos da AMD em 17/11/2023. Configurações: Servidor 2P Intel Xeon Platinum CPU usando 4 GPUs AMD Instinct™ MI300X (192 GB, 750 W), ROCm® 6.0 versão de pré-lançamento, PyTorch 2.2.0, vLLM para ROCm, Ubuntu® 22.04.2. em comparação com CPU de servidor 2P AMD EPYC 7763 usando  GPUs AMD Instinct™ MI250 (128 GB HBM2e, 560 W), ROCm® 5.4.3, PyTorch 2.0.0, HuggingFace Transformers 4.35.0, Ubuntu 22.04.6. 4 GPUs em cada sistema foram usadas neste teste. Os fabricantes de servidores podem ter outras configurações, gerando resultados diferentes. O desempenho pode variar baseado no uso dos drivers e otimizações mais recentes.
  5. Com base em um tamanho de nó menor do processador AMD para uma plataforma x86, a partir de setembro de 2023. GD-203.
  6. Desde janeiro de 2024, a AMD tem o primeiro mecanismo de IA dedicado disponível em um processador para PC desktop. "Mecanismo de IA dedicado" é definido como um mecanismo de IA que não tem outra função além de processar modelos de inferência de IA e que faz parte do die do processador x86. Para informações detalhadas, consulte: https://www.amd.com/pt/products/processors/consumer/ryzen-ai.html. PXD-03