Open-Source-Projekte von AMD Research

Open-Source-Projekte von RAD

AMD treibt Innovationen durch Open-Source-Beiträge voran, sodass Entwickler Tools für Hochleistungs-GPU- und -CPU-Computing erhalten und gemeinsam künftige Systeme gestalten können.

Ausgewählte Projekte

ACCL

ACCL bietet MPI-ähnliche kollektive Kommunikation für Xilinx FPGAs über einen Vitis Kernel und XRT Treiber und ermöglicht so eine schnelle, skalierbare Datenverschiebung.

Mehr erfahren

ASTRA-sim

ASTRA-sim ist ein führender verteilter ML-Systemsimulator, der durch AMD erweitert wurde, um die von MSCCL++ generierten kollektiven Kommunikationsalgorithmen genauer zu modellieren.

Mehr erfahren

Eine breite Palette von AMD KI-Notebooks, die sich über den gesamten Entwicklungszyklus erstrecken und in fünf Bereiche unterteilt sind: erste Schritte, Modelldesign, Spezialisierung, Optimierung und Service.

Mehr erfahren

Brevitas

Brevitas ist eine PyTorch-Bibliothek, die eine flexible Quantisierung neuronaler Netzwerke ermöglicht und sowohl Post-Training (PTQ) als auch Quantization Awareness Training (QAT) unterstützt.

Mehr erfahren

Chakra

Chakra ist ein offenes, mobiles Benchmarking- und Co-Design-Ökosystem mit grafikbasierter Ablaufverfolgung. AMD hat das Toolkit und das Schema für MI Instinct GPU-Kompatibilität verbessert.

Mehr erfahren

FINN

FINN ist ein Forschungsrahmen für die Inferenz von KI-Datenflüssen auf FPGAs, der Brevitas zur Quantisierung verwendet und CNNs, Residualnetze und neue Transformatormodelle unterstützt.

Mehr erfahren

gem5

gem5 ist der weltweit am weitesten verbreitete Architektursimulator, der unter anderem von AMD Research geleitet wird und das einzige vollständig quelloffene Modell von MI Instinct GPUs weiterentwickelt.

Mehr erfahren

GeniePIM

AMD GeniePIM ist ein PIM-basiertes analytisches Modell für GenAI, das die GEMV-Performance auf neu entstehenden PIM-Architekturen abschätzt und Beschleunigung, Timing und Konfigurationen mit Host-GPUs vergleicht.

Mehr erfahren

Iris

Iris ist ein Triton-basiertes Framework für Remote Memory Access, das von AMD RAD entwickelt wurde und SHMEM-ähnliche APIs in Triton bereitstellt, um eine effiziente Multi-GPU-Programmierung zu ermöglichen.

Mehr erfahren

IRON

IRON ist eine Open-Source-Python-API für die schnelle und effiziente Ausführung auf AMD Ryzen™ AI NPUs, die auf Sprachbindungen für den MLIR-AIE-Dialekt basiert.

Mehr erfahren

LogicNets

LogicNets ist eine Methodik zum Entwerfen, Trainieren und Bereitstellen quantisierter neuronaler Sparse-Netzwerke, die aus hardwarefreundlichen Bausteinen für eine effiziente Inferenz aufgebaut sind.

Mehr erfahren

MLIR-AIR

MLIR-AIR ist ein Compiler-Framework zur Optimierung der räumlichen Ausführung, Datenverschiebung und Synchronisierung auf Beschleunigern, die auf AMD NPUs und ähnliche Architekturen ausgerichtet sind.

Mehr erfahren

NPUEval

NPUEval ist ein LLM-Evaluierungsdatensatz, der auf die Generierung von AIE-Kernel-Code auf Ryzen™ AI Hardware ausgerichtet ist und ein präzises Benchmarking von NPU-fokussierten Modellen ermöglicht.

Mehr erfahren

Omnistat

Omnistat bietet Dienstprogramme für die Aggregation von erweiterbaren Systemmetriken durch Sampling mit geringem Overhead über ganze Cluster oder Untergruppen von Hosts, die an den Job eines Benutzers gebunden sind.

Mehr erfahren

OmniTrace

OmniTrace ist ein umfassendes Profilerstellungs- und Tracing-Tool für parallele C, C++, Fortran, HIP, OpenCL und Python Anwendungen, die auf CPUs oder hybriden CPU- und GPU-Systemen ausgeführt werden.

Mehr erfahren

OpenNIC

Das OpenNIC Projekt bietet eine FPGA-basierte NIC-Plattform für die Open-Source-Community mit einer NIC-Shell zusammen mit Linux Kernel und DPDK Treibern.

Mehr erfahren

P2P

P2P ermöglicht effiziente Datenübertragungen zwischen AMD GPUs und FPGAs über PCIe ohne Verwendung von Host-Speicher. Diese Funktion wird jetzt in die Coyote Laufzeitumgebung der ETH Zürich vorgelagert.

Mehr erfahren

P4AI

P4AI ist ein Framework für die schnelle Prototypenerstellung von DNN-basierten SmartNIC-Lösungen, bei dem automatisierte Codegenerierung verwendet wird, um High-Performance-Designs auf AMD Alveo™-Karten zu erstellen.

Mehr erfahren

PACE

AMD PACE ist eine High-Performance-Inferenzlösung für LLMS auf AMD Plattformen und bietet eine PyTorch Erweiterung für die schnelle Integration neuer Kernel und Diagrammoptimierungen.

Mehr erfahren

PYNQ

PYNQ ist ein quelloffenes Xilinx Projekt, das das Design eingebetteter Systeme auf Zynq APSoCs vereinfacht und eine schnelle Entwicklung mit Python und flexiblen Hardware-Overlays ermöglicht.

Mehr erfahren

QONNX

QONNX erweitert ONNX um benutzerdefinierte Operationen – IntQuant, FloatQuant, BipolarQuant und Trunc –, um die Quantisierung von Ganzzahlen und Minifloat mit beliebiger Präzision darzustellen.

Mehr erfahren

RapidWright

RapidWright ist ein Open-Source-Framework, das angepasste, domänenspezifische FPGA-Implementierungsabläufe ermöglicht und Entwicklern detailgenaue Kontrolle über die Designzuordnung gibt.

Mehr erfahren

RecoNIC

RecoNIC ist eine RDMA-fähige SmartNIC mit Rechenbeschleunigung, die den Overhead beim Kopieren von Daten reduziert und Daten näher an die Berechnung verschiebt, um eine schnellere und effizientere Verarbeitung zu ermöglichen.

Mehr erfahren

rocSHMEM

rocSHMEM begann als AMD Research Initiative, um GPU-zentrische Netzwerke über eine OpenSHMEM-ähnliche Schnittstelle bereitzustellen, und ist nun eine vollständige Produktionsbibliothek auf der ROCm Plattform.

Mehr erfahren

ROCR/AIE

ROCR/AIE erweitert die ROCm™-Software-Laufzeit, um AMD Ryzen™ AI NPUs zu unterstützen, die von RAD in enger Zusammenarbeit mit den ROCm™-Softwareproduktteams entwickelt wurden.

Mehr erfahren

Ryzers

Dieses Repository bietet zusammenstellbare Dockerdateien und Build-Skripte für die Bereitstellung von Software, vollständigen Anwendungen und Demonstratoren auf AMD Ryzen™ AI Hardware.

Mehr erfahren

SLASH

SLASH ist eine Forschungsplattform für die Alveo™ V80 Beschleunigerkarte, die Shell, Runtime und Linker für XRT-ähnliche Entwicklung mit Community-basierten Erweiterungen bietet.

Mehr erfahren

TensorCast

TensorCast ist eine PyTorch basierte Übertragungs- und Quantisierungsbibliothek, die sich auf OCP MX und AMD relevante Datentypen mit niedriger Präzision konzentriert sowie Tools und Referenzcode für die Verifizierung bereitstellt.

Mehr erfahren

Triton-XDNA

Triton-XDNA ermöglicht es, Triton durch Integration mit dem MLIR-basierten Compiler-Stack auf AMD XDNA™ NPUs auszurichten, wodurch die Ausführung auf Ryzen™ AI NPUs ermöglicht wird.

Mehr erfahren

Server-CPUs

Business-Systeme

Personal Computing und Gaming

Embedded

Ressourcen

GPU-Beschleuniger

Adaptive Beschleuniger

DPU-Beschleuniger

Ethernet-Adapter

Workstations

Desktops

Notebooks

Ressourcen

FPGAs und adaptive SoCs

Systemmodule (SOMs)

Technologien

Ressourcen für Entwickler

Probeplatinen und Bausätze

Prozessor-Tools

Grafik-Tools und -Apps

Tools für FPGAs und adaptive SoCs

Urheberrechte und Apps

Tools und Apps für GPU-Beschleuniger

Ethernet-Adapter-Tools

Übersicht

Für Rechenzentren und die Cloud

Für Edge und Endpunkte

Für Entwickler

Branchen

Branchen

Branchen

Branchen

Industrias

Einsatzbereiche

Gaming

Systeme

Technologien

Ressourcen

EPYC Prozessoren

Radeon GPUs und AMD Chipsätze

FPGAs und adaptive SoCs

Alveo-Beschleuniger & Kria-SOMs

Ryzen Prozessoren

Ethernet-Adapter

Übersicht

Prozessoren

Beschleuniger

Embedded Produkte

Grafikprodukte

Übersicht

Ressourcen nach Produkt

Ressourcen nach Typ

Über unsere Partner

Weltweiter AMD Support

Prozessoren und Grafikprodukte

Beschleuniger

FPGAs und adaptive SoCs

Gaming und Personal Computing

Adaptive und Embedded Computing

Get AMD Fan Gear

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Open-Source-Projekte von AMD Research and Advanced Development

Open-Source-Projekte von RAD

Ausgewählte Projekte

AMD.com Feedback