Projets RAD open source

AMD stimule l'innovation grâce à des contributions open source en offrant aux développeurs des outils spécialement conçus pour le calcul GPU et CPU hautes performances et les invitant à collaborer pour créer les systèmes de demain.

ACCL

ACCL dote les FPGA Xilinx de fonctions de communication collective de type MPI via un noyau Vitis ainsi que de pilotes XRT qui garantissent des transferts de données rapides et évolutifs.

Astra-Sim

Astra-Sim est un simulateur de systèmes d'apprentissage automatique distribués de pointe, amélioré par AMD pour modéliser plus précisément les algorithmes de communication collective générés par MSCCL++.

Tutoriels IA AUP

Vaste ensemble de guides IA AMD couvrant l'ensemble du cycle de développement, organisés en cinq modules : prise en main, conception de modèles, spécialisation, optimisation et mise en service.

Brevitas

Brevitas est une bibliothèque PyTorch qui permet une quantification flexible des réseaux neuronaux pour la quantification post-entraînement (PTQ) et l'entraînement basé sur la quantification (QAT).

Chakra

Chakra est un écosystème de co-conception et de benchmarking ouvert et portable utilisant des traces d'exécution sous forme de graphiques. AMD a amélioré la boîte à outils et le schéma afin de garantir la compatibilité avec les GPU MI Instinct.

FINN

FINN est un framework de recherche pour l'inférence de flux de données d'IA sur FPGA qui utilise Brevitas pour la quantification et prend en charge les CNN, les réseaux résiduels ainsi que les modèles de transformateurs émergents.

gem5

gem5 est le simulateur d'architecture le plus utilisé au monde, co-dirigé par AMD Research, qui continue de développer le seul modèle entièrement open source de GPU MI Instinct.

GeniePIM

AMD GeniePIM est un modèle analytique PIM pour l'IA générative qui évalue les performances GEMV des architectures PIM émergentes et compare les accélérations, la synchronisation et les configurations avec celles des GPU hôtes.

Iris

Iris est un framework Triton d'accès mémoire à distance développé par la RAD AMD qui intègre des API de type SHMEM dans Triton pour garantir une programmation multi-GPU efficace.

IRON

IRON est une API Python open source close-to-metal qui permet une exécution rapide et efficace sur les NPU AMD Ryzen™ AI, grâce aux liaisons du dialecte MLIR-AIE.

LogicNets

LogicNets est une méthodologie de conception, d'entraînement et de déploiement de réseaux neuronaux épars et quantifiés, construits à partir de composants adaptés au hardware pour une inférence efficace.

NPUEval

NPUEval est un ensemble de données d'évaluation LLM conçu pour cibler la génération de code de noyau AIE sur le hardware Ryzen™ AI, permettant un benchmarking précis des modèles orientés NPU.

Omnistat

Omnistat offre des utilitaires permettant d'agréger les indicateurs d'un système scale-out grâce à un échantillonnage à faible surcharge de clusters entiers ou de sous‑ensembles d'hôtes associés à une même tâche utilisateur.

Omnitrace

Omnitrace est un outil complet de profilage et de traçage pour les applications parallèles C, C++, Fortran, HIP, OpenCL et Python exécutées sur le CPU ou sur des systèmes hybrides CPU+GPU.

OpenNIC

Le projet OpenNIC propose une plateforme NIC FPGA destinée à la communauté open source, comprenant un shell NIC ainsi que des noyaux Linux et des pilotes DPDK.

P2P

P2P permet des transferts de données efficaces entre les GPU et FPGA AMD via PCIe sans recourir à la mémoire hôte, une capacité désormais intégrée au runtime Coyote de l'École polytechnique fédérale de Zurich.

P4AI

P4AI est un framework qui permet de prototyper rapidement des solutions SmartNIC DNN et génère automatiquement du code afin de produire des conceptions haute performance sur les cartes AMD Alveo™.

PACE

AMD PACE est une solution d'inférence hautes performances pour les LLM sur les plateformes AMD. Son extension PyTorch permet d'intégrer rapidement de nouveaux noyaux et d'optimiser les graphiques.

PYNQ

PYNQ est un projet open source Xilinx qui simplifie la conception de systèmes intégrés sur les APSoC Zynq, accélère le développement via Python et permet de créer des overlays hardware flexibles.

QONNX

QONNX étend ONNX avec des opérations personnalisées (IntQuant, FloatQuant, BipolarQuant et Trunc) pour représenter les quantifications de nombres entiers à précision arbitraire ou en minifloat.

RapidWright

RapidWright est un framework open source qui permet de créer des processus d'implémentation FPGA spécialisés et personnalisés, offrant aux développeurs un contrôle très fin du mapping de conception.

RecoNIC

RecoNIC est une SmartNIC compatible RDMA avec accélération de calcul qui réduit la surcharge liée aux copies de données et rapproche les données de calcul pour garantir un traitement plus rapide et efficace.

ROC_SHMEM

rocSHMEM est le fruit des travaux d'AMD Research visant à permettre la création de réseaux centrés sur le GPU via une interface similaire à OpenSHMEM, et est aujourd'hui une bibliothèque de production intégrée à la plateforme ROCm.

Ryzers

Ce référentiel propose des Dockerfiles composables et des scripts de création permettant de déployer des software, des applications complètes et des démonstrateurs sur le hardware AMD Ryzen™ AI.

Tensorcast

TensorCast est une bibliothèque PyTorch de quantification et de casting axée sur l'OCP MX et les types de données à faible précision d'AMD, offrant des outils et du code de référence pour la vérification.