RAD 開放原始碼專案

AMD 透過開放原始碼貢獻推動創新,為開發人員提供高效能顯示卡與處理器運算工具,並邀請各界協作,共同形塑未來系統。

ACCL

ACCL 透過 Vitis 內核與 XRT 驅動程式,為 Xilinx FPGA 提供 MPI 式的集體通訊,實現快速且可擴充的資料移動。

Astra-Sim

Astra-Sim 是頂尖的分散式機器學習系統模擬器,經 AMD 強化後,可更精準地模擬由 MSCCL++ 產生的集體通訊演算法。

AUP AI 教學課程

一系列完整涵蓋整個開發生命週期的 AMD AI 講義,分為五大領域:入門、模型設計、專業化、最佳化與投產部署。

Brevitas

Brevitas 是一個 PyTorch 程式庫,可實現有彈性的神經網路量化,同時支援訓練後量化 (post-training quantization, PTQ) 與量化感知訓練 (quantization-aware training, QAT)。

Chakra

Chakra 是一個開放且可攜式的基準測試與共同設計生態系統,採用以圖表為基礎的執行軌跡。AMD 強化了該工具套件與結構,導入 MI Instinct 顯示卡的相容性。

FINN

FINN 是一個用於 FPGA 上 AI 資料流推論的研究框架,採用 Brevitas 的量化技術,並支援 CNN、殘差網路,以及新興的 Transformer 模型。

gem5

gem5 是全球運用最廣泛的架構模擬器,由 AMD 研究部門共同主導,持續推進著唯一完全開放原始碼的 MI Instinct 顯示卡模型。

GeniePIM

AMD GeniePIM 是一個以 PIM 為基礎的生成式 AI 分析模型,用於估算新興 PIM 架構上的 GEMV 效能,並與主機顯示卡在加速比、時序及配置上進行比較。

Iris

Iris 是一個以 Triton 為基礎的遠端記憶體存取架構,由 AMD RAD 開發,以 Triton 語言提供類似 SHMEM 的 API,以實現高效率的多顯示卡程式設計。

IRON

IRON 是一套開放原始碼、貼近硬體層的 Python API,建構於 MLIR-AIE 方言的語言繫結之上,可在 AMD Ryzen™ AI NPU 上實現快速且高效率的執行。

LogicNets

LogicNets 是一套設計、訓練與部署方法論,主張以硬體友善的建構區塊打造稀疏量化神經網路,以實現高效率推論。

NPUEval

NPUEval 是一套 LLM 評估資料集,專為 Ryzen™ AI 硬體 AIE 內核程式碼產生而設計,可對以 NPU 為核心的模型進行精準基準測試。

Omnistat

Omnistat 提供公用程式,可對整個叢集,或對綁定於某個使用者工作的主機子集進行低負載取樣,以此彙整出橫向擴充系統的指標數值。

Omnitrace

Omnitrace 是一款完整的剖析與追蹤工具,適用於在處理器系統或處理器 + 顯示卡混合式系統上平行執行的 C、C++、Fortran、HIP、OpenCL 及 Python 應用程式。

OpenNIC

OpenNIC 專案為開放原始碼社群提供一個以 FPGA 為基礎的 NIC 平台,包含 NIC 腳本,以及 Linux 內核與 DPDK 驅動程式。

P2P

P2P 可在不使用主機記憶體的情況下,透過 PCIe 在 AMD 顯示卡與 FPGA 之間啟用高效率資料傳輸,此能力現已向上整合至蘇黎世聯邦理工學院的 Coyote 執行階段軟體。

P4AI

P4AI 是一套用於快速原型化 DNN 驅動 SmartNIC 解決方案的架構,透過自動化程式碼產生,打造出在 AMD Alveo™ 加速卡上運行的高效能設計。

PACE

AMD PACE 是一套適用於 AMD 平台的 LLM 高效能推論解決方案,提供 PyTorch 延伸程式庫,以快速整合新內核與圖形最佳化。

PYNQ

PYNQ 是一項 Xilinx 的開放原始碼專案,旨在簡化 Zynq APSoC 的嵌入式系統設計,讓開發人員能以 Python 與又彈性的硬體疊加層進行快速開發。

QONNX

QONNX 透過自訂運算子 IntQuant、FloatQuant、BipolarQuant 與 Trunc 擴充 ONNX,用以表達任意精度整數及迷你浮點量化。

RapidWright

RapidWright 是一套開放原始碼架構,可實現客製化、領域特定的 FPGA 實作流程,讓開發人員對設計對應擁有細緻的控制能力。

RecoNIC

RecoNIC 是一款採用 RDMA 技術並具備運算加速能力的 SmartNIC,可降低資料複製負擔,並將資料移近運算位置,以實現更快速且更高效率的處理。

ROC_SHMEM

rocSHMEM 起初是由 AMD 研究部門所推動,透過類似 OpenSHMEM 的介面提供以顯示卡為核心的網路通訊,現已成為 ROCm 平台中的完整投產程式庫。

Ryzers

此存放庫提供可組合的 Dockerfile 與建置腳本,用於在 AMD Ryzen™ AI 硬體上部署軟體、完整應用程式與展示範例。

Tensorcast

TensorCast 是一套以 PyTorch 為基礎的投射與量化程式庫,聚焦於 OCP MX 及與 AMD 相關的低精度資料類型,並提供驗證用工具與參考程式碼。