Étude de cas Iterate.ai
Iterate.ai s'appuie sur les processeurs AMD Ryzen™ AI PRO pour exécuter des modèles LLM privés de 32 milliards de paramètres avec une fenêtre contextuelle de 32k, atteignant une vitesse d'environ 60 à 80 jetons par seconde, ce qui réduit les coûts et les risques liés au cloud.