Radeon Vega 7nm

Technologie Vega 7 nm 

Le premier GPU « Vega 7 nm » au monde 

Radeon Instinct and Epyc

Accélérateurs pour calcul hautes performances

Une nouvelle ère de calcul hétérogène pour l'intelligence machine et le HPC est arrivée avec les processeurs de serveur EPYC™ et les accélérateurs de GPU Radeon Instinct™.

Une nouvelle ère de calcul pour le HPC et le Deep Learning

Accélérer considérablement le rythme de l'apprentissage en profondeur et répondre aux besoins généraux des centres de données nécessite une combinaison de calcul hautes performances et d'accélération GPU optimisée pour traiter des quantités massives de données, avec beaucoup de calculs de virgule flottante qui peuvent être répartis sur plusieurs cœurs. Les concepteurs de grands systèmes ont aujourd'hui besoin de pouvoir concevoir des systèmes efficaces avec la flexibilité et l'ouverture permettant de configurer des systèmes qui répondent au défi des charges de travail très exigeantes.

AMD permet aux concepteurs de disposer de ces fonctionnalités, ce qui leur permet de placer encore plus haut la barre des densités de calcul réalisables avec des conceptions de serveurs optimisées offrant des performances plus élevées, des latences réduites et des gains d'efficacité améliorés dans un environnement ouvert et flexible. Avec l'introduction des nouveaux serveurs basés sur le processeur EPYC et munis d'accélérateurs de GPU Radeon Instinct, combinés à notre plateforme logicielle ouverte ROCm, AMD inaugure une nouvelle ère de calcul hétérogène pour le HPC et le Deep Learning.

Accélérateurs de serveur Radeon Instinct™ MI25

AMD change la donne avec l'introduction de sa gamme de produits Radeon Instinct basée sur des standards ouverts. Les accélérateurs Radeon Instinct, combinés à notre approche écosystémique ouverte des calculs hétérogènes, augmentent la performance, l'efficacité et la flexibilité requises pour concevoir des systèmes capables de relever les défis des charges de travail axées sur les données.

Le nouvel accélérateur Radeon Instinct MI25, basé sur l'architecture de nouvelle génération « Vega » d'AMD et son puissant moteur de calcul parallèle, est l'accélérateur de formation ultime pour les applications d'apprentissage en profondeur à grande échelle et constitue un puissant outil pour les charges de travail HPC offrant 24,6 TFLOPS de FP16 et 12,3 TFLOPS de performance en virgule flottante FP32.1 Combinez cette puissance avec la plateforme logicielle ouverte ROCm et l'architecture de mémoire GPU la plus avancée au monde, 16 Go de HBM2 et jusqu'à 484 Go/s de bande passante mémoire, et vous obtenez la solution ultime pour les charges de travail axées sur les calculs d'aujourd'hui.

Points forts du Radeon Instinct MI25 :

  • Basé sur l'architecture de nouvelle génération « Vega » d'AMD avec l'architecture de mémoire GPU la plus avancée au monde
  • Performances FP16 et FP32 supérieures pour le HPC et le Deep Learning
  • Plateforme logicielle ouverte ROCm pour les déploiements d'échelle de classe HPC
  • Large prise en charge BAR pour le mGPU peer to peer
  • Technologies de virtualisation matérielle MxGPU pour une utilisation optimisée du centre de données

Densité de calcul et performance par nœud supérieures en combinant les nouveaux serveurs AMD EPYC™ et les accélérateurs Radeon Instinct MI25

Calcul hautes performances (HPC) lié à la mémoire avec EPYC™

Les processeurs AMD EPYC bénéficient de performances hors du commun en matière de charges de travail HPC liées à la mémoire.

HSA and Rocm logos

Plateforme logicielle ouverte ROCm

La plateforme logicielle ouverte ROCm offre une base open-source pour le calcul hétérogène de classe HPC et la conception de systèmes de datacenter de classe mondiale. La plateforme ROCm fournit des pilotes, des compilateurs, des outils et des bibliothèques Linux® optimisés pour la performance. La philosophie de conception logicielle de ROCm offre un choix de programmation, un minimalisme et une approche de développement modulaire permettant d'optimiser les calculs des accélérateurs de GPU.

Cette approche combinée avec les technologies de sécurité matérielle virtualisées MxGPU d'AMD permet aux concepteurs de systèmes de modifier la façon dont ils conçoivent les systèmes pour obtenir des rendements plus élevés et optimiser l'utilisation et les capacités du centre de données.

Éléments fondamentaux de ROCm :

  • Pilote Linux® Open Headless 64 bits et puissance système optimisée pour le calcul de classe Hyperscale et HPC
  • Prise en charge du calcul multi-GPU dans et hors de la communication nœud-serveur via RDMA avec un prise en charge de la synchronisation des pairs RDMA dans le pilote
  • Un modèle de programmation plus simple procurant aux développeurs le contrôle dont ils ont besoin
  • Compilateurs hétérogènes C++ à source unique HCC traitant le système entier et pas seulement un seul périphérique
  • Outil de conversion HIP CUDA offrant un choix de plateforme pour l'utilisation de l'API de calcul GPU

La plateforme logicielle ouverte ROCm fournit une base solide pour les déploiements à grande échelle de centres de données d'intelligence machine et de HPC avec un pilote Linux ouvert et optimisé ainsi qu'une riche exécution système ROCr indépendante du langage et utilisant fortement l'API Runtime Heterogeneous System Architecture (HSA). Cette approche fournit une base riche pour exécuter des langages de programmation tels que HCC C ++, l'OpenCL™ de Khronos Group, l'Anaconda Python de Continuum et l'outil de conversion HIP CUDA.2

AMD continue d'adopter une approche ouverte pour étendre la prise en charge des fonctionnalités critiques requises pour l'accélération de classe NUMA à ses accélérateurs de GPU Radeon™ pour les déploiements HPC et l'apprentissage en profondeur, et la plateforme ROCm prend désormais en charge notre nouvelle famille d'accélérateurs de GPU Radeon Instinct tout en offrant la prise en charge continue pour un certain nombre de ses autres cartes graphiques AMD FirePro™ série S, Radeon ™ série RX et Radeon™ Pro Duo. Visitez le site Web de ROCm pour obtenir la liste complète des cartes GPU prises en charge.

OpenCL logo

Prise en charge OpenCL™, OpenMP et OpenACC

AMD continue de prendre en charge ces standards sur les dernières offres de produits3. AMD a bien compris que la plupart des acteurs et utilisateurs de la communauté HPC souhaitaient des standards ouverts pour l’exécution de leurs projets et de leurs simulations et s'est engagé à soutenir cet objectif. Nous travaillons de manière intensive en synergie avec cette communauté pour promouvoir des standards ouverts.

Notes
  1. Calculs TFLOPS : les calculs FLOPS sont effectués en prenant l'horloge du moteur à l'état DPM le plus élevé et en la multipliant par xx cœurs par GPU. Ensuite, ce nombre est multiplié par xx processeurs de flux présents dans chaque UC. Ensuite, ce nombre est multiplié par 2 FLOPS par horloge pour FP32. Pour calculer TFLOPS pour FP16, 4 FLOPS par horloge ont été utilisés. Le taux TFLOPS FP64 est calculé en utilisant le taux 1/16.
  2. La prise en charge de Python est prévue, mais toujours en développement.
  3. Il se peut que certaines cartes série S ne prennent pas en charge toutes les normes mentionnées. Reportez-vous aux spécifications de chaque carte pour en savoir plus sur les API prises en charge