Open-Source-Projekte von RAD

AMD treibt Innovationen durch Open-Source-Beiträge voran, sodass Entwickler Tools für Hochleistungs-GPU- und -CPU-Computing erhalten und gemeinsam künftige Systeme gestalten können.

ACCL

ACCL bietet MPI-ähnliche kollektive Kommunikation für Xilinx FPGAs über einen Vitis Kernel und XRT Treiber und ermöglicht so eine schnelle, skalierbare Datenverschiebung.

ASTRA-sim

ASTRA-sim ist ein führender verteilter ML-Systemsimulator, der durch AMD erweitert wurde, um die von MSCCL++ generierten kollektiven Kommunikationsalgorithmen genauer zu modellieren.

AUP KI-Tutorials

Eine breite Palette von AMD KI-Notebooks, die sich über den gesamten Entwicklungszyklus erstrecken und in fünf Bereiche unterteilt sind: erste Schritte, Modelldesign, Spezialisierung, Optimierung und Service.

Brevitas

Brevitas ist eine PyTorch-Bibliothek, die eine flexible Quantisierung neuronaler Netzwerke ermöglicht und sowohl Post-Training (PTQ) als auch Quantization Awareness Training (QAT) unterstützt.

Chakra

Chakra ist ein offenes, mobiles Benchmarking- und Co-Design-Ökosystem mit grafikbasierter Ablaufverfolgung. AMD hat das Toolkit und das Schema für MI Instinct GPU-Kompatibilität verbessert.

FINN

FINN ist ein Forschungsrahmen für die Inferenz von KI-Datenflüssen auf FPGAs, der Brevitas zur Quantisierung verwendet und CNNs, Residualnetze und neue Transformatormodelle unterstützt.

gem5

gem5 ist der weltweit am weitesten verbreitete Architektursimulator, der unter anderem von AMD Research geleitet wird und das einzige vollständig quelloffene Modell von MI Instinct GPUs weiterentwickelt.

GeniePIM

AMD GeniePIM ist ein PIM-basiertes analytisches Modell für GenAI, das die GEMV-Performance auf neu entstehenden PIM-Architekturen abschätzt und Beschleunigung, Timing und Konfigurationen mit Host-GPUs vergleicht.

Iris

Iris ist ein Triton-basiertes Framework für Remote Memory Access, das von AMD RAD entwickelt wurde und SHMEM-ähnliche APIs in Triton bereitstellt, um eine effiziente Multi-GPU-Programmierung zu ermöglichen.

IRON

IRON ist eine Open-Source-Python-API für die schnelle und effiziente Ausführung auf AMD Ryzen™ AI NPUs, die auf Sprachbindungen für den MLIR-AIE-Dialekt basiert.

LogicNets

LogicNets ist eine Methodik zum Entwerfen, Trainieren und Bereitstellen quantisierter neuronaler Sparse-Netzwerke, die aus hardwarefreundlichen Bausteinen für eine effiziente Inferenz aufgebaut sind.

NPUEval

NPUEval ist ein LLM-Evaluierungsdatensatz, der auf die Generierung von AIE-Kernel-Code auf Ryzen™ AI Hardware ausgerichtet ist und ein präzises Benchmarking von NPU-fokussierten Modellen ermöglicht.

Omnistat

Omnistat bietet Dienstprogramme für die Aggregation von erweiterbaren Systemmetriken durch Sampling mit geringem Overhead über ganze Cluster oder Untergruppen von Hosts, die an den Job eines Benutzers gebunden sind.

OmniTrace

OmniTrace ist ein umfassendes Profilerstellungs- und Tracing-Tool für parallele C, C++, Fortran, HIP, OpenCL und Python Anwendungen, die auf CPUs oder hybriden CPU- und GPU-Systemen ausgeführt werden.

OpenNIC

Das OpenNIC Projekt bietet eine FPGA-basierte NIC-Plattform für die Open-Source-Community mit einer NIC-Shell zusammen mit Linux Kernel und DPDK Treibern.

P2P

P2P ermöglicht effiziente Datenübertragungen zwischen AMD GPUs und FPGAs über PCIe ohne Verwendung von Host-Speicher. Diese Funktion wird jetzt in die Coyote Laufzeitumgebung der ETH Zürich vorgelagert.

P4AI

P4AI ist ein Framework für die schnelle Prototypenerstellung von DNN-basierten SmartNIC-Lösungen, bei dem automatisierte Codegenerierung verwendet wird, um High-Performance-Designs auf AMD Alveo™-Karten zu erstellen.

PACE

AMD PACE ist eine High-Performance-Inferenzlösung für LLMS auf AMD Plattformen und bietet eine PyTorch Erweiterung für die schnelle Integration neuer Kernel und Diagrammoptimierungen.

PYNQ

PYNQ ist ein quelloffenes Xilinx Projekt, das das Design eingebetteter Systeme auf Zynq APSoCs vereinfacht und eine schnelle Entwicklung mit Python und flexiblen Hardware-Overlays ermöglicht.

QONNX

QONNX erweitert ONNX um benutzerdefinierte Operationen – IntQuant, FloatQuant, BipolarQuant und Trunc –, um die Quantisierung von Ganzzahlen und Minifloat mit beliebiger Präzision darzustellen.

RapidWright

RapidWright ist ein Open-Source-Framework, das angepasste, domänenspezifische FPGA-Implementierungsabläufe ermöglicht und Entwicklern detailgenaue Kontrolle über die Designzuordnung gibt.

RecoNIC

RecoNIC ist eine RDMA-fähige SmartNIC mit Rechenbeschleunigung, die den Overhead beim Kopieren von Daten reduziert und Daten näher an die Berechnung verschiebt, um eine schnellere und effizientere Verarbeitung zu ermöglichen.

rocSHMEM

rocSHMEM begann als AMD Research Initiative, um GPU-zentrische Netzwerke über eine OpenSHMEM-ähnliche Schnittstelle bereitzustellen, und ist nun eine vollständige Produktionsbibliothek auf der ROCm Plattform.

Ryzers

Dieses Repository bietet zusammenstellbare Dockerdateien und Build-Skripte für die Bereitstellung von Software, vollständigen Anwendungen und Demonstratoren auf AMD Ryzen™ AI Hardware.

TensorCast

TensorCast ist eine PyTorch basierte Übertragungs- und Quantisierungsbibliothek, die sich auf OCP MX und AMD relevante Datentypen mit niedriger Präzision konzentriert sowie Tools und Referenzcode für die Verifizierung bereitstellt.