Radeon Instinct and Epyc

Aceleradores para cómputo de alto rendimiento

Una nueva era de cómputo heterogéneo para la inteligencia de las máquinas y HPC ha llegado de la mano de los procesadores de servidor EPYC™ y los aceleradores de GPU Radeon Instinct™.

Impulso en una nueva era de cómputo de escalamiento horizontal para HPC y aprendizaje profundo

Acelerar realmente el ritmo del aprendizaje profundo y abordar las necesidades amplias de los centros de datos requiere de una combinación de cómputo de alto rendimiento y aceleración por GPU optimizados para controlar cantidades masivas de datos con un gran volumen de computación de punto flotante que se pueda distribuir entre muchos núcleos. Actualmente, los diseñadores de sistemas grandes también necesitan la habilidad de diseñar sistemas eficaces con la flexibilidad y la amplitud de configurar sistemas que enfrenten el desafío de las cargas de trabajo sumamente exigentes de hoy.

AMD otorga esas capacidades a los diseñadores, lo que les permite elevar los estándares en las densidades de cómputo alcanzables a través de diseños de servidores optimizados con mayor rendimiento, menor latencia y mejor eficiencia en un entorno abierto y flexible. Gracias a la incorporación de los nuevos servidores basados en el procesador EPYC con aceleradores por GPU Radeon Instinct, combinados con la plataforma de software abierto ROCm, AMD marca el inicio de una nueva era de cómputo heterogéneo para HPC y aprendizaje profundo.

Aceleradores de servidor Radeon Instinct™ MI25

AMD cambia las reglas del juego con la presentación de Radeon Instinct, su nueva familia de productos basada en estándares abiertos. Los aceleradores Radeon Instinct, combinados con nuestro enfoque de cómputo heterogéneo basado en un ecosistema abierto, subenel listón en cuanto al rendimiento alcanzable, la eficiencia y la flexibilidad necesarios para diseñar sistemas capaces de hacer frente a las cargas de trabajo centradas en los datos de la actualidad.​

El nuevo acelerador Radeon Instinct MI25, basado en la arquitectura “Vega” de última generación de AMD, con su potente motor de cómputo en paralelo, es el principal acelerador de capacitación del mundo para aplicaciones de aprendizaje profundo a gran escala y es un caballo de batalla para las cargas de trabajo de HPC con un rendimiento de punto flotante máximo de 24,6 TFLOPS en FP16 y 12,3 TFLOPS en FP32.1 Al combinar esta potencia con la plataforma de software abierto ROCm y la arquitectura de memoria de la GPU más avanzada del mundo (HBM2 de 16 GB y ancho de banda de memoria de hasta 484 Gb/s), se obtiene la solución definitiva para las cargas de trabajo de cómputo de la actualidad.​

Puntos destacados de Radeon Instinct MI25:

  • Basado en “Vega”, la arquitectura de última generación de AMD con la arquitectura de memoria de la GPU más avanzada del mundo​
  • Rendimiento superior en FP16 y FP32 para HPC y aprendizaje profundo
  • Plataforma de software abierto ROCm para escalamiento en bastidor de clase HPC
  • Compatibilidad con BAR grande para mGPU punto a punto
  • Tecnologías de hardware MxGPU para una utilización optimizada en el centro de datos

Nivel superior de rendimiento y densidad de cómputo por nodo cuando se combinan los nuevos servidores basados en procesador AMD EPYC™ con los aceleradores Radeon Instinct MI25

Rendimiento de EPYC™ para aplicaciones de HPC enlazadas a memoria

El procesador AMD EPYC proporciona un rendimiento excelente para las cargas de trabajo de HPC enlazadas a memoria.

HSA and Rocm logos

Plataforma de software abierto ROCm

La plataforma de software abierto ROCm ofrece una base de fuente abierta para los diseños de sistemas de centro de datos de calidad mundial y para los sistemas de cómputo heterogéneo de clase HPC. La plataforma ROCm proporciona controladores, compiladores, herramientas y bibliotecas Linux® con rendimiento optimizado. La filosofía de diseño de software presente en ROC ofrece un enfoque con opciones de programación, minimalismo y desarrollo de software modular para un cómputo de aceleración por GPU optimizado.

Gracias a la combinación de este enfoque con la tecnología de MxGPU virtualizada de hardware seguro de AMD, los desarrolladores ahora pueden cambiar el modo en que diseñan los sistemas para alcanzar niveles de eficiencia más altos e impulsar un uso y capacidades optimizados del centro de datos.

Elementos de base de ROCm:

  • Controlador abierto desatendido Linux® de 64 bits y pila enriquecida de tiempo de ejecución del sistema para el cómputo a hiperescala y de clase HPC
  • Cómputo de múltiples GPU que admite la comunicación de entrada y salida entre nodo y servidor a través de RDMA con compatibilidad directa de sincronización de pares RDMA en el controlador
  • Modelo de programación más simple para brindar control a los desarrolladores cuando es necesario
  • Compiladores heterogéneos reales de HCC C++ de origen único para abarcar todo el sistema y no un solo dispositivo
  • Herramienta de conversión HIP CUDA con opciones de plataforma para usar la API de cómputo de GPU

La plataforma de software abierto ROCm proporciona una base sólida para implementaciones de centros de datos de inteligencia de las máquinas y HPC a gran escala con un controlador Linux abierto optimizado y un tiempo de ejecución del sistema ROCr enriquecido que no depende del lenguaje y usa masivamente la API de tiempo de ejecución de la arquitectura de sistema heterogéneo (HSA). Esto brinda una base sólida para ejecutar lenguajes de programación como HCC C++, OpenCL™ de Khronos Group, Anaconda Python de Continuum y la herramienta de conversión HIP CUDA.2

AMD mantiene un enfoque abierto para extender la compatibilidad de las características esenciales que se requieren para la aceleración de clase NUMA a sus aceleradores por GPU Radeon™ para las implementaciones de HPC y aprendizaje profundo. La plataforma ROCm ahora admite la nueva familia de productos de los aceleradores por GPU Radeon Instinct. También se siguen admitiendo las otras tarjetas gráficas AMD FirePro™ Serie S, Radeon™ Serie RX y Radeon™ Pro Duo. Visita el sitio web de ROCm para obtener una lista completa de las tarjetas de GPU compatibles.

OpenCL logo

Compatibilidad con OpenCL™, OpenMP y OpenACC

AMD continúa admitiendo estos estándares en las ofertas de productos más recientes3. Creemos que la mayoría de las personas en la comunidad de HPC desean estándares abiertos como la mejor forma de ejecutar sus proyectos y simulaciones. AMD se compromete a respaldar este objetivo y trabaja arduamente con la comunidad para impulsar el progreso de los estándares abiertos.

Notas a pie de página
  1. Cálculos de TFLOPS: Para calcular los valores de FLOPS, se toma la velocidad de reloj de motor en el estado de DPM más alto y se la multiplica por la cantidad de CU por GPU. A continuación, se multiplica ese número por la cantidad de procesadores de transmisión que existen en cada CU. Luego, se multiplica ese número por 2 FLOPS por reloj para FP32. Para calcular el valor de TFLOPS de FP16, se utilizan 4 FLOPS por reloj. La velocidad TFLOPS de FP64 se calcula con el índice 1/16.
  2. La compatibilidad con Python ya se ha programado, pero todavía se encuentra en desarrollo.
  3. Algunas tarjetas de la Serie S no admiten todos los estándares mencionados. Consulta las especificaciones del producto de cada tarjeta para obtener más información sobre las API admitidas.