AMD Radeon AI PRO R9700
* Image à des fins d'illustration. Non disponible à l'achat.

Conçues pour les professionnels axés sur l'IA.

Évolutivité et performances optimisées pour l'inférence locale, le développement et l'IA générative.

Fonctionnalités

Tampon VRAM optimal pour l'IA locale avancée

Répondez aux exigences de mémoire des modèles LLM modernes et des modèles texte-image sur votre PC de bureau avec les cartes graphiques AMD Radeon™ AI PRO R9700, dotées de 32 Go de VRAM.

Utilisation typique de la VRAM par les modèles les plus courants

LLM
DeepSeek R1 Distill Qwen 32B Q6
28 Go
Mistral Small 3.1 24B Instruct 2503 Q8
27 Go
Texte-image
Flux.1 Schnell
24 Go
SD 3.5 Medium
17 Go

Voir note de fin RPW-496

Cartes graphiques AMD Radeon™ AI PRO R9700 : 32 Go de VRAM pour les plus grands modèles d'IA

Des gains considérables pour de grands modèles, jusqu'à 5 fois plus rapides avec la VRAM 32 Go

Performances des grands modèles d'IA

100 %
361 %
437 %
454 %
447 %
496 %
Phi 3.5 MoE Q4
Mistral Small 3.1 24B Instruct 2503 Q8
DeepSeek R1 Distill Qwen 32B Q6
Qwen 3 32b Q6
Qwen 3 32b Q6 Large Prompt (+ 3 000 jetons)

GeForce RTX 5080 (16 Go)

AMD Radeon™ AI PRO R9700 (32 Go)

Voir note de fin RPW-495

AMD Radeon AI PRO R9700

En avant vers l'IA avec AMD

Les cartes graphiques AMD Radeon™ AI Série PRO sont conçues pour accélérer les expériences avancées d'IA et fonctionnent sur plusieurs structures d'apprentissage automatique, afin d'augmenter la vitesse des charges de travail d'IA locales et de traiter de grands ensembles de données d'apprentissage automatique.

Spécifications du modèle

Cartes graphiques AMD Radeon AI PRO Série R9000 avec architecture AMD RDNA 4

Ressources

AMD ROCm

Une pile software ouverte offrant une suite d'optimisations pour les charges de travail d'IA et prenant en charge l'ensemble de l'écosystème software d'IA. 

Notes de bas de page

RPW-495 : tests réalisés en mai 2025 par AMD. Nombre moyen de jetons par seconde sur trois exécutions, en excluant les cas extrêmes où le modèle commence à diverger (plus de 2 000 jetons « pensants ») afin de standardiser la longueur des réponses. Pas de décodage spéculatif. Tous les tests ont été menés sur LM Studio 0.3.15 (version 11). Vulkan Llama.cpp 1.28 a été utilisé pour AMD, CUDA 12 llama.cpp 1.30 avec Flash Attention recommandé par NVIDIA utilisé pour NVIDIA. Invite courte :  « How long would it take for a ball dropped from 10 meter height to hit the ground? » (Combien de temps faut-il pour qu'une balle lancée à 10 mètres de hauteur atteigne le sol ?). Invite longue : « Summarize the following in exactly five lines: [Insert Scene 1 Act 1 of Romeo and Juliet] » 'Résume ce qui suit en exactement cinq lignes : [Insérer la scène 1 de l'acte 1 de Roméo et Juliette]) Modèles testés : Phi 3.5 MoE Q4 K M, Mistral Small 3.1 24B Instruct 2503 Q8, DeepSeek R1 Distill Qwen 32B Q6, Qwen 32b Q6 Spécifications système : AMD Ryzen™ 9 7900X, 32 Go de RAM DDR5 6 000 MT/s, Windows 11 PRO 24H2, AMD Radeon™ AI PRO R9700 32 Go utilisant Adrenalin 25.6.1 RC vs AMD Ryzen™ 9 7900X, 32 Go DDR5 RAM 6 000 MT/s, Windows 11 PRO 24H2 avec NVIDIA GeForce RTX 5080 et les pilotes GeForce 576.4. Les performances peuvent varier. RPW-495.

RPW-496 : Tests réalisés en mai 2025 par AMD à l'aide des modèles DeepSeek R1 Distill Qwen 32B Q6, Mistral Small 3.1 24B Instruct 2503 Q8, Flux.1 Schnell et SD 3.5 Medium. Les tests ont été effectués sur un système équipé d'un CPU AMD Ryzen 9 7900X, d'un GPU Radeon AI PRO R9700, de 32 Go de RAM DDR5, de 1 To de stockage, Windows 11 PRO 24H2, avec les pilotes Adrenalin 25.6.1 RC, ComfyUI - PyTorch 2.4 sur Windows. Les configurations système peuvent varier et donc donner des résultats différents. RPW-496

GD-239a : Les cartes graphiques Radeon™ PRO Séries W6000 et W7000, et Radeon™ AI PRO Série R9000 et modèles ultérieurs) ne sont pas conçues, ni recommandées pour une utilisation en centre de données. L'utilisation dans un centre de données peut nuire à la gestion, à l'efficacité, à la fiabilité et/ou aux performances.