IRON IRON 是一个开源、接近硬件 (close-to-metal) 的 Python API,它基于 MLIR-AIE 方言的语言绑定,可在 AMD 锐龙 AI NPU 上实现快速且高效的执行。 了解更多
Omnitrace Omnitrace 是一款功能全面的性能分析和跟踪工具,适用于在 CPU 或混合 CPU + GPU 系统上运行的并行 C、C++、Fortran、HIP、OpenCL 和 Python 应用。 了解更多
P2P P2P 技术能够在不使用主机内存的情况下,通过 PCIe 实现 AMD GPU 与 FPGA 之间的高效数据传输,这一功能现已上游合入苏黎世联邦理工学院的 Coyote 运行时系统中。 了解更多
QONNX QONNX 通过自定义操作(即 IntQuant、FloatQuant、BipolarQuant 和 Trunc)来扩展 ONNX,以实现任意精度整数和迷你浮点数 (minifloat) 的量化表示。 了解更多
ROC_SHMEM rocSHMEM 起初是由 AMD 研究团队开展的一个项目,旨在通过类似 OpenSHMEM 的接口实现以 GPU 为中心的网络连接,如今它已成为 ROCm 平台上的一个完整生产库。 了解更多