AMD Radeon AI PRO R9700
*Künstlerisches Konzept-Rendering. Nicht zum Kauf verfügbar.

Entwickelt für AI-First-Profis.

Skalierbarkeit und optimierte Performance für lokale Inferenz, Entwicklung und generative KI.

Funktionen

Optimaler VRAM-Puffer für erweiterte lokale KI

Erfüllen Sie die Speicheranforderungen moderner LLMs und Text-zu-Bild-Modelle auf Ihrem Desktop mit der AMD Radeon™ AI PRO R9700 Grafikkarte mit 32 GB VRAM.

Typische VRAM-Nutzung bei gängigen Modellen

LLM
DeepSeek R1 Distill Qwen 32B Q6
28 GB
Mistral Small 3.1 24B Instruct 2503 Q8
27 GB
Text-zu-Bild
Flux.1 Schnell
24 GB
SD 3.5 Medium
17 GB

Siehe Endnote RPW-496.

AMD Radeon™ AI PRO R9700 Grafikkarte: 32 GB VRAM für größere KI-Modelle

Enorme Vorteile für enorm große Modelle – bis zu 5-mal schneller mit 32 GB VRAM

Performance großer KI-Modelle

100 %
361 %
437 %
454 %
447 %
496 %
Phi 3.5 MoE Q4
Mistral Small 3.1 24B Instruct 2503 Q8
DeepSeek R1 Distill Qwen 32B Q6
Qwen 3 32b Q6
Qwen 3 32b Q6 Large Prompt (3000+ Token)

GeForce RTX 5080 (16 GB)

AMD Radeon™ AI PRO R9700 (32 GB)

Siehe Endnote RPW-495.

AMD Radeon AI PRO R9700

KI mit AMD beschleunigen

AMD Radeon™ AI PRO-Serie Grafikkarten sind darauf ausgelegt, fortschrittliche KI-Erfahrungen voranzutreiben und an mehreren Frameworks für maschinelles Lernen zu arbeiten, lokale KI-Auslastungen zu beschleunigen und große Datensätze für das maschinelle Lernen zu verarbeiten.

Modellspezifikationen

AMD Radeon AI PRO R9000-Serie Grafikkarten mit AMD RDNA 4 Architektur

Ressourcen

AMD ROCm

Ein offener Software-Stack, der eine Reihe von Optimierungen für KI-Auslastungen bietet und das breitere KI-Software-Ökosystem unterstützt. 

Fußnoten

RPW-495: Tests durchgeführt von AMD im Mai 2025. Durchschnittliche Tokens pro Sekunde in drei Durchläufen, wobei Edge-Fälle weggelassen werden, in denen das Modell anfängt, eine Spirale zu bilden (mehr als 2.000 Thinking-Tokens), um die Antwortlänge zu standardisieren. Keine spekulative Dekodierung. Alle Tests durchgeführt auf LM Studio 0.3.15 (Build 11). Vulkan Llama.cpp 1.28 wird für AMD verwendet, von NVIDIA empfohlenes CUDA 12 llama.cpp 1.30 mit Flash Attention für NVIDIA. Kurzer Prompt:  „Wie lange würde es dauern, bis ein Ball aus einer Höhe von 10 Metern auf den Boden fällt?“ Langer Prompt: „Folgendes in genau fünf Zeilen zusammenfassen: [Szene 1 Akt 1 von Romeo und Julia einfügen]“, Getestete Modelle: Phi 3.5 MoE Q4 K M, Mistral Small 3.1 24B Instruct 2503 Q8, DeepSeek R1 Distill Qwen 32B Q6, Qwen 32b Q6 Systemspezifikationen: AMD Ryzen™ 9 7900X, 32 GB DDR5 RAM 6000 MT/s, Windows 11 PRO 24H2, AMD Radeon™ AI PRO R9700 32 GB unter Verwendung von Adrenalin 25.6.1 RC im Vergleich zu AMD Ryzen™ 9 7900X, 32 GB DDR5 RAM 6000 MT/s, Windows 11 PRO 24H2 mit NVIDIA GeForce RTX 5080 und GeForce 576.4 Treibern. Die Performance kann variieren. RPW-495.

RPW-496: Tests durchgeführt von AMD im Mai 2025 unter Verwendung der Modelle DeepSeek R1 Distill Qwen 32B Q6, Mistral Small 3.1 24B Instruct 2503 Q8, Flux.1 Schnell, SD 3.5 Medium. Getestet auf einem System mit AMD Ryzen 9 7900X CPU, Radeon AI PRO R9700 GPU, 32 GB DDR5 RAM, 1 TB Speicher, Windows 11 PRO 24H2, Adrenalin 25.6.1 RC Treiber, ComfyUI - PyTorch 2.4 für Windows. Systemkonfigurationen können abweichen und führen zu unterschiedlichen Ergebnissen. RPW-496.

GD-239a: Radeon™ PRO W6000- und W7000-Serie und Radeon™ AI PRO R9000-Serie Grafikkarten (und neuere Modelle) sind für die Nutzung im Rechenzentrum weder konzipiert noch dafür empfohlen. Die Verwendung in einem Rechenzentrum kann sich nachteilig auf Manageability, Effizienz, Zuverlässigkeit und/oder Performance auswirken.