RAD オープンソース プロジェクト

AMD は、オープンソースの貢献を通じてイノベーションを推進しています。ハイ パフォーマンス GPU および CPU コンピューティングのためのツールを開発者に提供し、将来のシステムを構築するためのコラボレーションを促進します。

ACCL

ACCL は、Vitis カーネルおよび XRT ドライバーを介して Xilinx FPGA 向けの MPI 形式の集合通信を提供し、高速でスケーラブルなデータ移動を可能にします。

ASTRA-sim

ASTRA-sim は、AMD によって強化された主要な分散型 ML システム シミュレータで、MSCCL++ によって生成された集合的な通信アルゴリズムをより正確にモデル化します。

AUP AI Tutorials

開発サイクル全体を網羅した広範な AMD AI ノート PC です。入門、モデル設計、専門性、最適化、サービスの 5 つの分野で構成されています。

Brevitas

Brevitas は、柔軟なニューラル ネットワークの量子化を可能にする PyTorch ライブラリであり、トレーニング後量子化 (PTQ) と量子化対応トレーニング (QAT) の両方をサポートしています。

Chakra

Chakra は、グラフベースの実行トレースを使用したオープンでポータブルなベンチマークおよび共同設計エコシステムです。AMD は、MI Instinct GPU の互換性のためのツールキットとスキーマを強化しました。

FINN

FINN は、FPGA 上で AI データフロー推論を実行するための研究フレームワークであり、Brevitas を用いて量子化を実行し、CNN、残差ネットワーク、および新興の変換モデルをサポートしています。

gem5

gem5 は、AMD リサーチが共同で主導する世界で最も広く使用されているアーキテクチャ シミュレータであり、MI Instinct GPU の唯一の完全オープンソース モデルを推進し続けています。

GeniePIM

AMD GeniePIM は、生成 AI 向けの PIM ベースの分析モデルであり、新しい PIM アーキテクチャでの GEMV パフォーマンスを推定し、ホスト GPU との速度、タイミング、構成を比較します。

Iris

Iris は、AMD RAD によって開発された Triton ベースのリモート メモリ アクセス用フレームワークで、Triton で SHMEM のような API を提供し、効率的なマルチ GPU プログラミングを可能にします。

IRON

IRON とはハードウェアに近いオープンソース Python API です。AMD Ryzen™ AI NPU 上で高速かつ効率的に実行でき、MLIR-AIE ダイアレクトの言語バインディングで構築されています。

LogicNets

LogicNets は、スパースで量子化されたニューラル ネットワークの設計、トレーニング、導入のための手法です。ハードウェアに適したビルディング ブロックが使用されており、効率的な推論を実現します。

NPUEval

NPUEval は、Ryzen™ AI ハードウェア上で AIE カーネル コード生成をターゲットとするように設計された LLM 評価データセットであり、NPU を中心としたモデルの正確なベンチマークを可能にします。

Omnistat

Omnistat は、ユーザーのジョブに関連付けられたクラスター全体やホストのサブセットを対象に低負荷のサンプリングを実行することでスケールアウト システムの指標を集約するユーティリティを提供します。

Omnitrace

Omnitrace は、CPU または CPU+GPU ハイブリッド システム上で動作する並列 C、C++、Fortran、HIP、OpenCL、および Python アプリケーションのための包括的プロファイリング トレーシング ツールです。

OpenNIC

OpenNIC プロジェクトは、Linux カーネルおよび DPDK ドライバーと共に NIC シェルを備えたオープンソース コミュニティー向けの FPGA ベースの NIC プラットフォームを提供します。

P2P

P2P は、AMD GPU と FPGA 間の PCIe を介したデータ転送を、ホスト メモリを使用せずに効率的に実現します。この機能は現在、ETH Zürich の Coyote ランタイムにアップストリームされています。

P4AI

P4AI は、DNN を搭載した SmartNIC ソリューションの迅速なプロトタイプ作成のためのフレームワークであり、自動化されたコード生成を使用して AMD Alveo™ カード上に高性能設計を構築します。

PACE

AMD PACE は AMD プラットフォーム上の LLM 向けの高性能推論ソリューションであり、新しいカーネルとグラフ最適化を迅速に統合するための PyTorch 拡張機能を提供します。

PYNQ

PYNQ はオープンソースの Xilinx プロジェクトであり、Zynq APSoC でのエンベデッド システムの設計を簡素化し、Python と柔軟なハードウェア オーバーレイを使用した迅速な開発を可能にします。

QONNX

QONNX は、IntQuant、FloatQuant、BipolarQuant、Trunc といったカスタム オペレーションで ONNX を拡張し、任意精度型の整数およびミニフロートの量子化を表現します。

RapidWright

RapidWright は、カスタマイズされたドメイン固有の FPGA 実装フローを可能にするオープンソース フレームワークであり、開発者はデザイン マッピングを詳細に制御できます。

RecoNIC

RecoNIC は、RDMA 対応の SmartNIC であり、演算アクセラレーションを備えています。これにより、データコピーのオーバーヘッドが削減され、データを計算に近づけることで、より高速で効率的な処理が実現します。

ROC_SHMEM

rocSHMEM は、AMD リサーチによる GPU 中心のネットワーキングを OpenSHMEM のようなインターフェイスで提供するための取り組みとして始まり、現在は ROCm プラットフォームの完全なプロダクション ライブラリとなっています。

Ryzers

このリポジトリでは、AMD Ryzen™ AI ハードウェアにソフトウェア、フル アプリケーション、デモンストレータを展開するための、組み立て可能な Dockerfiles とビルド スクリプトを提供しています。

TensorCast

TensorCast は、OCP MX および AMD 関連の低精度データ型に焦点を当てた PyTorch ベースのキャスティングおよび量子化ライブラリで、検証用のツールとリファレンス コードを提供します。