Projetos de código-fonte aberto da RAD

A AMD impulsiona a inovação por meio de contribuições de código-fonte aberto, capacitando os desenvolvedores com ferramentas para a computação de GPU e CPU de alto desempenho e convidando a colaboração para moldar sistemas futuros.

ACCL

A ACCL fornece comunicação coletiva ao estilo MPI para FPGAs Xilinx por meio de um kernel Vitis e drivers XRT, permitindo a movimentação rápida e dimensionável de dados.

Astra-SIM

O Astra-SIM é um importante simulador de sistema de ML distribuído, aprimorado pela AMD para modelar com mais precisão os algoritmos de comunicação coletiva gerados pelo MSCCL++.

Tutoriais do AUP AI

Um amplo conjunto de notebooks AMD AI abrangendo todo o ciclo de desenvolvimento, organizados em cinco áreas: introdução, design de modelo, especialização, otimização e atendimento.

Brevitas

Brevitas é uma biblioteca PyTorch que permite a quantização flexível de redes neurais, suportando tanto o treinamento pós-treinamento (PTQ) quanto o treinamento com reconhecimento de quantização (QAT).

Chakra

Chakra é um ecossistema aberto e portátil de valor de referência e coprojetado que utiliza rastreamentos de execução baseados em gráficos. A AMD aprimorou o kit de ferramentas e o esquema para compatibilidade com GPU MI Instinct.

FINN

FINN é uma estrutura de pesquisa para inferência de fluxo de dados de IA em FPGAs, usando Brevitas para quantização e suporte a CNNs, redes residuais e modelos de transformadores emergentes.

gem5

O gem5 é o simulador de arquitetura mais usado do mundo, co-liderado pela AMD Research, que continua a impulsionar o único modelo de código-fonte totalmente aberto de GPUs MI Instinct.

GeniePIM

O AMD GeniePIM é um modelo analítico baseado em PIM para GenAI, estimando o desempenho do GEMV em arquiteturas PIM emergentes e comparando velocidade, tempo e configurações a GPUs host.

Iris

Iris é uma estrutura baseada em Triton para acesso remoto à memória, desenvolvida pela AMD RAD, que fornece APIs semelhantes a SHMEM no Triton para permitir uma programação eficiente de várias GPUs.

IRON

O IRON é uma API Python de código-fonte aberto e close-to-metal para execução rápida e eficiente em NPUs AMD Ryzen™ AI, criada com base em ligações em linguagem do dialeto MLIR-AIE.

LogicNets

LogicNets é uma metodologia para projetar, treinar e implantar redes neurais esparsas e quantificadas, criadas a partir de componentes básicos compatíveis com hardware para uma inferência eficiente.

NPUEval

O NPUEval é um conjunto de dados de avaliação de LLM projetado para avaliar a geração de código de kernel AIE em hardware Ryzen™ AI, permitindo um valor de referência preciso e comparativo de modelos focados em NPU.

Omnistat

O Omnistat oferece utilitários para agregar métricas de sistema expandidas por meio da amostragem de baixa sobrecarga em todos os clusters ou subconjuntos de hosts vinculados ao trabalho de um usuário.

Omnitrace

O Omnitrace é uma ferramenta de criação de perfis e rastreamento abrangente para C, C++, Fortran, HIP, OpenCL e aplicativos Python em paralelo que estão em execução em CPUs ou sistemas híbridos CPU + GPU.

OpenNIC

O projeto OpenNIC oferece uma plataforma de NIC baseada em FPGA para a comunidade de código-fonte aberto, com uma NIC shell junto com kernel do Linux e drivers DPDK.

P2P

P2P permite transferências de dados eficientes entre GPUs e FPGAs AMD via PCIe sem usar a memória do host, um recurso agora atualizado para o tempo de execução do Coyote da ETH Zürich.

P4AI

O P4AI é uma estrutura para a rápida criação de protótipos de soluções SmartNIC com DNN, usando a geração automatizada de código para criar projetos de alto desempenho em placas AMD Alveo™.

PACE

O AMD PACE é uma solução de inferência de alto desempenho para LLMs em plataformas AMD, oferecendo uma extensão PyTorch para rápida integração de novos kernels e otimizações gráficas.

PYNQ

O PYNQ é um projeto de código aberto da Xilinx que facilita o design de sistemas incorporados em APSoCs Zynq, permitindo o desenvolvimento rápido usando Python e sobreposições de hardware flexíveis.

QONNX

QONNX amplia o ONNX com operações personalizadas (IntQuant, FloatQuant, BipolarQuant e Trunc) para representar a quantização de números inteiros e minifloats de precisão arbitrária.

RapidWright

O RapidWright é uma estrutura de código aberto que permite fluxos de implementação de FPGA personalizados e específicos de domínio, dando aos desenvolvedores controle de granulação específica sobre o mapeamento do projeto.

RecoNIC

O RecoNIC é um SmartNIC habilitado para RDMA com aceleração de computação, reduzindo a sobrecarga de cópia de dados e aproximando os dados da computação para proporcionar um processamento mais rápido e eficiente.

ROC_SHMEM

O rocSHMEM começou como um esforço de pesquisa da AMD para fornecer uma rede centrada em GPU por meio de uma interface semelhante à OpenSHMEM e agora é uma biblioteca de produção completa na plataforma ROCm.

Ryzers

Esse repositório oferece Dockerfiles compostos e scripts de compilação para a implantação de software, aplicativos completos e demonstradores no hardware AMD Ryzen™ AI.

Tensorcast

O TensorCast é uma biblioteca de transmissão e quantização baseada em PyTorch focada em tipos de dados de baixa precisão relevantes para OCP MX e AMD, fornecendo ferramentas e código de referência para verificação.