RAD 오픈 소스 프로젝트

AMD는 오픈 소스에 기여하며 혁신을 주도합니다. 고성능 GPU 및 CPU 컴퓨팅을 위한 도구로 개발자의 역량을 강화하고 미래의 시스템을 구축하기 위한 협업을 촉진합니다.

ACCL

ACCL은 빠르고 확장 가능한 데이터 이동이 가능하도록 Vitis 커널 및 XRT 드라이버를 통해 Xilinx FPGA에 MPI 스타일 통합 통신을 제공합니다.

Astra-Sim

Astra-Sim은 선도적인 분산형 ML 시스템 시뮬레이터로, MSCCL++에서 생성된 집합 통신 알고리즘을 보다 정확하게 모델링할 수 있도록 AMD에서 개선했습니다.

Brevitas

Brevitas는 유연한 신경 네트워크 양자화를 지원하는 PyTorch 라이브러리로, 사후 학습(PTQ)과 양자화 인식 학습(QAT)을 모두 지원합니다.

Chakra

Chakra는 그래프 기반 실행 추적을 사용하는 개방형 포터블 벤치마킹 및 공동 설계 에코시스템입니다. AMD는 MI Instinct GPU 호환성을 위해 툴킷과 스키마를 개선했습니다.

FINN

FINN은 FPGA에서의 AI 데이터 흐름 추론을 위한 연구 프레임워크로, 양자화에 Brevitas를 사용하며 CNN, 레지듀얼 넷 최신 트랜스포머 모델을 지원합니다.

gem5

gem5는 세계에서 가장 널리 사용되는 아키텍처 시뮬레이터로, AMD Research가 공동 주도하며, MI Instinct GPU의 유일한 완전 오픈 소스 모델을 지속적으로 발전시키고 있습니다.

GeniePIM

AMD GeniePIM은 생성형 AI를 위한 PIM 기반 분석 모델로, 새로운 PIM 아키텍처에서 GEMV 성능을 추정하고, 속도 향상, 타이밍, 구성을 호스트 GPU와 비교합니다.

Iris

Iris는 AMD RAD가 개발한 원격 메모리 액세스용 Triton 기반 프레임워크로, 효율적인 다중 GPU 프로그래밍을 위해 Triton에 SHMEM 유사 API를 제공합니다.

IRON

IRON은 AMD Ryzen™ AI NPU에서 빠르고 효율적으로 실행할 수 있는 오픈 소스, 하드웨어 근접 Python API로, MLIR-AIE 다이어렉트를 위한 언어 바인딩을 기반으로 구축되었습니다.

LogicNets

LogicNets는 효율적인 추론을 위해 하드웨어 친화적 요소로 구축된 희소 양자화 방식의 신경 네트워크를 설계, 학습, 구축하기 위한 방법론입니다.

NPUEval

NPUEval은 Ryzen™ AI 하드웨어의 AIE 커널 코드 생성을 목표로 설계된 LLM 평가 데이터세트로, NPU 중심 모델을 정확하게 벤치마킹할 수 있습니다.

Omnistat

Omnistat은 전체 클러스터 또는 사용자 작업과 연결된 호스트 하위 집합에서 오버헤드가 낮은 샘플링을 통해 스케일 아웃 시스템 메트릭을 집계하는 유틸리티를 제공합니다.

Omnitrace

Omnitrace는 CPU 또는 CPU+GPU 하이브리드 시스템에서 실행되는 병렬 C, C++, Fortran, HIP, OpenCL, Python 애플리케이션을 위한 포괄적 프로파일링 및 추적 도구입니다.

OpenNIC

OpenNIC 프로젝트는 Linux 커널 및 DPDK 드라이버와 함께 NIC 셸을 갖춘 오픈 소스 커뮤니티를 위해 FPGA 기반 NIC 플랫폼을 제공합니다.

P2P

P2P는 호스트 메모리를 사용하지 않고도 PCIe를 통해 AMD GPU와 FPGA 간에 효율적인 데이터 전송을 가능하게 합니다. 이 기능은 이제 ETH Zürich의 Coyote 런타임으로 업스트림됩니다.

P4AI

P4AI는 DNN 기반 SmartNIC 솔루션의 신속한 프로토타입 제작을 위한 프레임워크로, 자동화된 코드 생성을 통해 AMD Alveo™ 카드에 고성능 설계를 구축합니다.

PACE

AMD PACE는 AMD 플랫폼의 LLM을 위한 고성능 추론 솔루션으로, 새로운 커널과 그래프 최적화를 신속하게 통합할 수 있도록 PyTorch 확장을 제공합니다.

PYNQ

PYNQ는 Zynq APSoC의 임베디드 시스템 설계를 간소화하는 오픈 소스 Xilinx 프로젝트로, Python과 유연한 하드웨어 오버레이를 사용하여 신속한 개발을 지원합니다.

QONNX

QONNX는 IntQuant, FloatQuant, BipolarQuant, TRUNC 등의 사용자 지정 작업을 통해 ONNX를 확장하여 임의 정밀 정수와 미니플로트 양자화를 표현합니다.

RapidWright

RapidWright는 개발자들이 설계 매핑을 세밀하게 제어할 수 있도록 사용자 정의된 도메인별 FPGA 구현 흐름을 지원하는 오픈 소스 프레임워크입니다.

RecoNIC

RecoNIC은 컴퓨팅 가속 기능을 통해 RDMA를 지원하는 SmartNIC으로, 데이터 복사 오버헤드를 줄이고 더욱 빠르고 효율적인 처리를 위해 데이터를 컴퓨팅 영역에 더 가깝게 이동시킵니다.

ROC_SHMEM

rocSHMEM은 OpenSHMEM과 유사한 인터페이스를 통해 GPU 중심 네트워킹을 제공하려는 AMD Research의 노력으로 시작되었으며 현재 ROCm 플랫폼의 전체 프로덕션 라이브러리입니다.

Ryzers

이 저장소는 AMD Ryzen™ AI 하드웨어에 소프트웨어, 전체 애플리케이션, 데모를 배포하기 위해 구성할 수 있는 Dockerfile과 빌드 스크립트를 제공합니다.

Tensorcast

TensorCast는 OCP MX 및 AMD 관련 저정밀도 데이터 유형을 중심으로 하는 PyTorch 기반 캐스팅 및 양자화 라이브러리로, 검증을 위한 도구와 참조 코드를 제공합니다.