L’ère de l’IA agentique est arrivée

Zoom sur l'image
Digital AI system interacting with multiple tools and environments

L’IA générative a introduit des systèmes qui pouvaient raisonner et réagir.

L’IA agentique renforce ces systèmes pour planifier, agir et accomplir des tâches.

Avec l'IA agentique, c'est l'agent qui intervient. Il transforme les objectifs en plans, récupère et traite les données, déclenche l'inférence, utilise des outils software et enfin valide les résultats, en passant par différentes étapes jusqu'à l'accomplissement de la tâche.

En pratique, l'IA agentique est bien plus qu'un simple interlocuteur. Il s'agit d'un assistant numérique qui aide à effectuer des tâches (déclenchées par une demande utilisateur, une tâche planifiée, un événement ou un autre agent) en utilisant un software en votre nom. Les agents de codage, de recherche, d'automatisation informatique et de processus métier sont les premiers exemples d'agents utilisés pour accomplir des tâches.

Ce passage de la conversation à l'action modifie fondamentalement l'équilibre du calcul. En effet, les agents s'exécutent sur des CPU, ce qui modifie les exigences d'infrastructure pour l'IA en augmentant de manière exponentielle les besoins des CPU en matière de calcul. Bien que l'IA agentique puisse augmenter l'utilisation de CPU, elle peut également augmenter l'utilisation de GPU. L'IA agentique utilise généralement l'inférence d'IA (charge de travail gourmande en GPU) pour l'intelligence et des outils (charges de travail gourmandes en CPU) pour exécuter les tâches.

Des modèles aux systèmes : ce qui rend l'IA « agentique »

Les déploiements d'IA traditionnels s'articulent autour d'une boucle « prompt/réponse » dans laquelle l'utilisateur fournit un prompt et le modèle d'IA lui apporte une réponse. L'IA agentique désigne des systèmes dotés d'une capacité d'action, c'est-à-dire la capacité d'agir de manière autonome dans des limites définies. Avec les agents, cette simple boucle de prompt/réponse s'étend pour former un système :

  • Demande et tokenisation : décomposition de l'entrée ou du prompt, lancement de la session agentique

  • Planification et récupération : couches qui contextualisent les connaissances de l'entreprise et décident de la suite des opérations

  • Raisonnement et génération : inférence du modèle principal qui fournit une réponse à l'agent ou lui donne des instructions supplémentaires pour mener à bien la tâche
  • Exécution d'outils : couches qui commandent des software, des services et des API pour agir

  • Vérification et réaction : contrôle de l'exhaustivité et de l'exactitude de la réponse, afin de fournir le résultat à l'utilisateur ou de répéter les processus si nécessaire
Agentic AI diagram

Ce schéma en boucle unique transforme les processus métier. Les systèmes d'IA prennent désormais en charge un ensemble de tâches. Une seule requête peut faire appel à de nombreux agents, qui fonctionnent chacun indépendamment mais dans des limites définies, interagissent avec des software, des données et des services, puis s'effacent lorsque la tâche est terminée.

Pourquoi l'IA agentique renforce l'importance du CPU

Les agents s'exécutent sur des CPU. Chaque agent a également besoin de plusieurs CPU pour gérer toutes les tâches qu'il crée. À mesure que l'IA agentique évolue, le travail effectué en dehors du GPU augmente :

  • Coordination de nombreux agents simultanés
  • Gestion de l'état du système et de la mémoire
  • Connexion et interaction avec les software d'entreprise
  • Gestion de la logique de chemin de commande et des E/S
Pour prendre en charge tous ces éléments, il existe trois types fondamentaux de rôles de CPU dans les systèmes agentiques

CPU hôte de l'IA

Chargé du pré- et post-traitement des données afin d'optimiser l'efficacité du GPU exécutant l'inférence. Les CPU haute fréquence AMD EPYC 9005 permettent une efficacité GPU exceptionnelle.

CPU d'agents

Chargé d'héberger le framework des agents. Il coordonne toutes les tâches entre les CPU et les GPU, y compris les contrôles de politique tels que le contrôle d'identité, le budget et la hiérarchisation des priorités. Les CPU AMD EPYC 9005, en particulier les modèles à nombre élevé de cœurs, fournissent la capacité de calcul nécessaire pour faire évoluer les charges de travail agentiques.

CPU d'outils

Responsable de l'exécution des tâches sur les plateformes d'entreprise standard auxquelles font appel différents agents, telles que les bases de données, le stockage, le calcul, la recherche, etc.. Une variété de configurations de CPU et de serveur existe pour les CPU d'outils. Les CPU pour serveur AMD EPYC 9005 offrent une palette complète de performances, de nombres de cœurs et de gammes de prix pour s'adapter à pratiquement toutes les tailles et échelles.

En quoi consiste un bon CPU d'agents ?

Un nombre élevé de cœurs pour prendre en charge des agents simultanés et l'exécution de nombreuses tâches
Une grande efficacité énergétique pour maximiser la capacité des agents dans votre centre de données
Une bonne rentabilité pour dimensionner les agents en fonction de la demande et réduire le TCO (coût total de possession)
Un écosystème software mature pour les outils et les frameworks d'entreprise

Ces exigences reflètent ce qui fait que l'IA agentique est fondamentalement un paradigme de calcul polyvalent.

AMD EPYC 9005 Series

Les CPU pour serveur AMD EPYC conviennent parfaitement à l'IA agentique

Les CPU pour serveur AMD EPYC™ Série 9005 s'imposent comme le choix idéal pour prendre en charge l'ensemble des charges de travail d'IA agentique, car ils offrent les avantages suivants :

  • Une densité de cœurs de pointe permettant d'exécuter de nombreux agents en parallèle
  • Une efficacité énergétique optimale grâce au nombre de vCPU par TDP le plus élevé du marché
  • Un rapport coût-efficacité idéal grâce à un nombre élevé de cœurs par rapport au TCO (coût total de possession)
  • Une compatibilité native avec un écosystème software x86 d'entreprise robuste

Les CPU pour serveur AMD EPYC permettent aux clients d'adapter leur infrastructure à des charges de travail variées, en utilisant des CPU à nombre élevé de cœurs là où le débit est primordial et des cœurs hautes performances là où la réactivité est essentielle, sans imposer à l'IA agentique une conception unique.

FAQ sur l'IA agentique

L'IA agentique combine généralement le raisonnement, la planification, l'utilisation d'outils, la mémoire et le retour d'information. Un agent d'IA reçoit un objectif, élabore un plan, sélectionne les outils ou les sources de données appropriés, exécute des actions, vérifie le résultat et s'adapte si nécessaire. Selon le cas d'utilisation, il peut se connecter à des applications métier, des bases de données, des API, des e-mails, des plateformes de chat ou des systèmes de flux de travail.

L’IA générative crée du contenu tel que du texte, des images, du code, des résumés ou des recommandations. L'IA agentique va plus loin en agissant. Elle peut décomposer un objectif en étapes, décider de la prochaine action à entreprendre, utiliser des outils software, récupérer des informations, accomplir des tâches et suivre les progrès. Dans la plupart des cas, l'IA agentique utilise l'IA générative comme source d'informations dans le cadre d'un flux de travail plus étendu.

L'IA agentique peut prendre en charge des flux de travail complexes dans de nombreux domaines d'activité. Les cas d'utilisation courants incluent le service à la clientèle, l'aide à la vente, la recherche, le développement de software, l'analyse de données, les opérations informatiques, le marketing, les RH, les finances et l'automatisation du back-office. Par exemple, un agent d’IA pourrait rechercher un prospect, mettre à jour un CRM, rédiger un courriel de suivi et planifier l’étape suivante.

L’IA agentique peut aider les entreprises à accroître leur productivité, à réduire le travail répétitif, à accélérer la prise de décision et à améliorer l’expérience des clients et des collaborateurs. Comme elle peut gérer des processus en plusieurs étapes, elle est particulièrement utile pour les tâches nécessitant une coordination entre plusieurs systèmes, équipes ou sources de données. Elle permet également aux collaborateurs de se concentrer sur des tâches à plus forte valeur ajoutée en prenant en charge les activités routinières ou chronophages.

L'IA agentique peut être sûre et efficace lorsqu'elle est conçue avec les contrôles appropriés. Les mesures de sécurité importantes comprennent la supervision humaine, des autorisations claires, la sécurité des données, les pistes d'audit, les tests, les flux de travail d'approbation et les limites des actions qu'un agent peut effectuer.

Ressources

CPU pour serveur AMD EPYC

Quelle que soit la taille ou l'échelle de vos déploiements d'IA, les CPU pour serveur AMD EPYC vous offrent une base hautes performances et économe en énergie pour les applications d'IA d'entreprise et les charges de travail générales.