Proyectos de código abierto de RAD

AMD impulsa la innovación mediante contribuciones de código abierto, lo que brinda a los desarrolladores herramientas para la informática de GPU y CPU de alto rendimiento e invita a la colaboración a fin de dar forma a los sistemas futuros.

ACCL

ACCL proporciona comunicación colectiva tipo MPI para FPGA (Field-Programmable Gate Arrays, matriz de puertas lógicas programable en campo) de Xilinx a través de un kernel de Vitis y controladores XRT, lo que permite un movimiento de datos rápido y escalable.

Astra-Sim

Astra-Sim es un simulador líder de sistemas de ML distribuidos, mejorado por AMD para modelar con mayor precisión los algoritmos de comunicación colectiva generados por MSCCL++.

Brevitas

Brevitas es una biblioteca de PyTorch que permite la cuantificación flexible de redes neuronales, y es compatible tanto con la PTQ (Post Training Quantization, Cuantificación posterior al entrenamiento) como con el QAT (Quantzation Aware Training, Entrenamiento consciente de la cuantificación).

Chakra

Chakra es un ecosistema de evaluación comparativa y codiseño abierto y portátil que utiliza trazas de ejecución basadas en grafos. AMD mejoró el kit de herramientas y el esquema para la compatibilidad con las GPU Instinct MI.

FINN

FINN es un marco de investigación para la inferencia de flujos de datos de IA en FPGA, el cual utiliza Brevitas para la cuantificación y es compatible con las CNN, las redes residuales y los modelos de transformadores emergentes.

gem5

gem5 es el simulador de arquitectura más utilizado en el mundo, codirigido por AMD Research, el cual continúa impulsando el único modelo completamente de código abierto de las GPU Instinct MI.

GeniePIM

AMD GeniePIM es un modelo analítico basado en PIM para GenAI, el cual estima el rendimiento de GEMV en arquitecturas PIM emergentes y compara aceleraciones, tiempos y configuraciones para alojar a las GPU.

Iris

Iris es un marco basado en Triton para el acceso remoto a la memoria, desarrollado por AMD RAD, que proporciona API similares a SHMEM en Triton para permitir una programación eficiente de varias GPU.

IRON

IRON es una API de Python de código abierto y a nivel de hardware para una ejecución rápida y eficiente en la NPU AMD Ryzen™ AI, construida sobre enlaces de lenguaje para el dialecto MLIR-AIE.

LogicNets

LogicNets es una metodología para diseñar, entrenar e implementar redes neuronales dispersas y cuantificadas creadas a partir de bloques de construcción compatibles con hardware para una inferencia eficiente.

NPUEval

NPUEval es un conjunto de datos de evaluación de LLM diseñado para orientar la generación de código de kernel AIE en hardware Ryzen™ AI, lo que permite realizar evaluaciones comparativas precisa de modelos centrados en NPU.

Omnistat

OmniStat ofrece utilidades para agregar métricas de sistemas de escalabilidad horizontal mediante muestreos de baja sobrecarga en clústeres completos o subconjuntos de hosts vinculados al trabajo de un usuario.

Omnitrace

Omnitrace es una herramienta integral de perfilado y trazado para aplicaciones paralelas de C, C++, Fortran, HIP, OpenCL y Python que se ejecutan en CPU o sistemas híbridos de CPU+GPU.

OpenNIC

El proyecto OpenNIC ofrece una plataforma NIC basada en FPGA para la comunidad de código abierto y cuenta con una estructura base de NIC junto con controladores de kernel de Linux y DPDK.

P2P

P2P permite transferencias de datos eficientes entre las GPU AMD y las FPGA (Field-Programmable Gate Arrays, matriz de puertas lógicas programable en campo) a través de PCIe sin utilizar la memoria del host, una capacidad que ahora ha sido integrada en el tiempo de ejecución Coyote de ETH Zürich.

P4AI

P4AI es un marco para la creación rápida de prototipos de soluciones SmartNIC con tecnología DNN que utiliza la generación automatizada de código para crear diseños de alto rendimiento en tarjetas AMD Alveo™.

PACE

AMD PACE es una solución de inferencia de alto rendimiento para LLM en plataformas AMD, la cual ofrece una extensión PyTorch para la integración rápida de nuevos kernels y optimizaciones de grafos.

PYNQ

PYNQ es un proyecto de código abierto de Xilinx que simplifica el diseño de sistemas integrados en APSoC de Zynq, lo que permite un desarrollo rápido mediante el uso de Python y superposiciones de hardware flexibles.

QONNX

QONNX extiende ONNX con operaciones personalizadas (IntQuant, FloatQuant, BipolarQuant y Trunc) para representar la cuantificación de enteros y miniflota de precisión arbitraria.

RapidWright

RapidWright es un marco de código abierto que permite flujos de implementación de FPGA personalizados y específicos de un dominio, lo que brinda a los desarrolladores un control detallado sobre el mapeo del diseño.

RecoNIC

RecoNIC es una SmartNIC habilitada para RDMA con aceleración de cómputo, lo que reduce la sobrecarga de copia de datos y acerca los datos al procesamiento para una ejecución más rápida y eficiente.

ROCSHMEM

rocSHMEM comenzó como un esfuerzo de AMD Research para ofrecer redes centradas en la GPU a través de una interfaz similar a OpenSHMEM, y ahora es una biblioteca de producción completa en la plataforma ROCm.

Ryzers

Este repositorio ofrece Dockerfiles y scripts de compilación componibles para implementar software, aplicaciones completas y demostradores en el hardware AMD Ryzen™ AI.

Tensorcast

TensorCast es una biblioteca de conversión y cuantificación basada en PyTorch y enfocada en OCP MX y tipos de datos de baja precisión relevantes para AMD, la cual proporciona herramientas y código de referencia para su verificación.