CPUs de servidor AMD EPYC
Não importa o tamanho ou a escala de suas implantações de IA, as CPUs de servidor AMD EPYC oferecem uma base de alto desempenho e eficiência energética para IA empresarial e cargas de trabalho de uso geral.
A IA generativa introduziu sistemas capazes de raciocinar e responder.
Na IA agêntica, o agente executa as ações. Ela transforma metas em planos, recupera e processa dados, aciona inferência, utiliza ferramentas de software e, finalmente, valida resultados, iterando entre etapas até que a tarefa seja concluída com sucesso.
Na prática, a IA agêntica é muito mais do que algo com o qual você "conversa". É um assistente digital que ajuda a concluir tarefas, acionadas por uma solicitação do usuário, um trabalho programado, um evento ou outro agente, operando o software em seu nome. Agentes de programação, agentes de pesquisa, agentes de automação de TI e agentes de processos de negócios são exemplos iniciais do uso de agentes para concluir tarefas.
Essa mudança da conversa para a ação altera fundamentalmente o equilíbrio da computação. Os agentes são executados em CPUs, alterando assim os requisitos de infraestrutura para IA, aumentando exponencialmente a demanda de computação da CPU. Embora a IA agêntica possa aumentar o uso da CPU, ela também pode aumentar o uso da GPU. A IA agêntica normalmente usa inferência de IA (carga de trabalho com uso intenso de GPU) para funções de inteligência e ferramentas (cargas de trabalho com uso intenso de CPU) para executar tarefas.
As implantações tradicionais de IA se concentram em um loop de prompt/resposta, no qual um usuário fornece um prompt e o modelo de IA fornece uma resposta. A IA agêntica refere-se a sistemas com autonomia: a capacidade de realizar ações de forma independente dentro dos limites definidos. Em vez de um único loop de prompt/resposta, os agentes expandem esse loop em um sistema:
Esse padrão único de looping está transformando os processos de negócios. Os sistemas de IA agora atuam como um conjunto de tarefas. Uma única solicitação pode gerar muitos agentes, cada um operando de forma independente, mas dentro de restrições definidas, interagindo com software, dados e serviços, e sendo encerrados quando sua tarefa é concluída.
Os agentes são executados em CPUs. Cada agente também precisa de várias CPUs para lidar com todas as tarefas que o agente cria. À medida que a IA agêntica se expande, as tarefas executadas fora da GPU aumentam:
Responsável pelo pré-processamento e o pós-processamento de dados para maximizar a eficiência da GPU que executa a inferência. As CPUs AMD EPYC 9005 de alta frequência permitem eficiência excepcional da GPU.
Responsável por hospedar o framework do agente. Coordena todas as tarefas entre CPUs e GPUs, incluindo controles de políticas como controle de identidade, orçamento e priorização. As CPUs AMD EPYC 9005, especificamente as ofertas com alto número de núcleos, oferecem a capacidade de computação necessária para escalar as cargas de trabalho agênticas.
Responsável pela execução de tarefas em plataformas corporativas padrão, como bancos de dados, armazenamento, computação, pesquisa etc., geradas por vários agentes. As CPUs para ferramentas estão disponíveis em diversas configurações de CPU e servidor. As CPUs de servidor AMD EPYC 9005 oferecem um conjunto abrangente de desempenho, número de núcleos e faixas de preço para suportar praticamente qualquer tamanho e escala.
Esses requisitos refletem por que a IA agêntica é fundamentalmente um paradigma de computação de propósito geral.
As CPUs de servidor AMD EPYC™ Série 9005 destacam-se como a principal opção para oferecer suporte à variedade completa de cargas de trabalho de IA agêntica porque oferecem:
As CPUs de servidor AMD EPYC permitem que os clientes combinem a infraestrutura com diversas necessidades de carga de trabalho, usando uma capacidade de CPU com alto número de núcleos onde a produtividade é fundamental e núcleos de alto desempenho onde a capacidade de resposta é essencial, sem forçar a IA agêntica a se adequar a um modelo único para todos os casos.
A IA agêntica normalmente funciona combinando raciocínio, planejamento, uso de ferramentas, memória e feedback. Um agente de IA recebe uma meta, cria um plano, seleciona as ferramentas ou fontes de dados adequadas, executa ações, verifica o resultado e ajusta conforme necessário. Dependendo do caso de uso, ele pode se conectar a aplicações de negócios, bancos de dados, APIs, e-mail, plataformas de chat ou sistemas de fluxo de trabalho.
A IA generativa cria conteúdo como texto, imagens, código, resumos ou recomendações. A IA agêntica vai além ao executar ações. Ela pode dividir uma meta em etapas, decidir o que fazer em seguida, usar ferramentas de software, recuperar informações, concluir tarefas e monitorar o progresso. Na maioria dos casos, a IA agêntica utiliza a IA generativa para fornecer a inteligência como parte de um fluxo de trabalho mais abrangente.
A IA agêntica pode oferecer suporte a fluxos de trabalho complexos em diversas funções de negócios. Os casos de uso comuns incluem atendimento ao cliente, suporte de vendas, pesquisa, desenvolvimento de software, análise de dados, operações de TI, marketing, RH, finanças e automação de back-office. Por exemplo, um agente de IA poderia pesquisar um cliente potencial, atualizar um CRM, redigir um e-mail de acompanhamento e agendar a próxima etapa.
A IA agêntica pode ajudar as organizações a aumentar a produtividade, reduzir o trabalho repetitivo, acelerar a tomada de decisões e melhorar as experiências dos clientes e dos funcionários. Como ela pode gerenciar processos em várias etapas, é especialmente útil para trabalhos que exigem coordenação entre sistemas, equipes ou fontes de dados. Ela também pode ajudar os funcionários a se concentrarem em tarefas de maior valor ao lidar com atividades rotineiras ou demoradas.
A IA agêntica pode ser segura e eficaz quando projetada com os controles adequados. As proteções importantes incluem supervisão humana, permissões claras, segurança de dados, trilhas de auditoria, testes, fluxos de trabalho de aprovação e limites para as ações que um agente pode executar.