Accélérateurs pour calcul hautes performances

ÉVOLUTION, ADAPTATION ET APPRENTISSAGE

Une nouvelle ère de calcul hétérogène pour l'intelligence machine et le HPC est arrivée avec les processeurs de serveur EPYC™ et les accélérateurs de GPU Radeon Instinct™.

AMD EPYC™Radeon Instinct™

Une nouvelle ère de calcul pour le HPC et le Deep Learning

Accélérer considérablement le rythme de l'apprentissage en profondeur et répondre aux besoins généraux des centres de données nécessite une combinaison de calcul hautes performances et d'accélération GPU optimisée pour traiter des quantités massives de données, avec beaucoup de calculs de virgule flottante qui peuvent être répartis sur plusieurs cœurs. Les concepteurs de grands systèmes ont aujourd'hui besoin de pouvoir concevoir des systèmes efficaces avec la flexibilité et l'ouverture permettant de configurer des systèmes qui répondent au défi des charges de travail très exigeantes.

AMD permet aux concepteurs de disposer de ces fonctionnalités, ce qui leur permet de placer encore plus haut la barre des densités de calcul réalisables avec des conceptions de serveurs optimisées offrant des performances plus élevées, des latences réduites et des gains d'efficacité améliorés dans un environnement ouvert et flexible. Avec l'introduction des nouveaux serveurs basés sur le processeur EPYC et munis d'accélérateurs de GPU Radeon Instinct, combinés à notre plateforme logicielle ouverte ROCm, AMD inaugure une nouvelle ère de calcul hétérogène pour le HPC et le Deep Learning.

Accélérateurs de serveur Radeon Instinct™ MI25

AMD change la donne avec l'introduction de sa gamme de produits Radeon Instinct basée sur des standards ouverts. Les accélérateurs Radeon Instinct, combinés à notre approche écosystémique ouverte des calculs hétérogènes, augmentent la performance, l'efficacité et la flexibilité requises pour concevoir des systèmes capables de relever les défis des charges de travail axées sur les données.

Le nouvel accélérateur Radeon Instinct MI25, basé sur l'architecture de nouvelle génération « Vega » d'AMD et son puissant moteur de calcul parallèle, est l'accélérateur de formation ultime pour les applications d'apprentissage en profondeur à grande échelle et constitue un puissant outil pour les charges de travail HPC offrant 24,6 TFLOPS en virgule flottante 16 bits et 12,3 TFLOPS de performance en virgule flottante 32 bits.1 Combinez cette puissance avec la plateforme logicielle ouverte ROCm et l'architecture de mémoire GPU la plus avancée au monde, 16 Go de HBM2 et jusqu'à 484 Go/s de bande passante mémoire, et vous obtenez la solution ultime pour les charges de travail axées sur les calculs d'aujourd'hui.

Points forts du Radeon Instinct MI25 :

  • Basé sur l'architecture de nouvelle génération « Vega » d'AMD avec l'architecture de mémoire GPU la plus avancée au monde
  • Performances de calcul en virgule flottante 16 et 32 bits supérieures pour le calcul hautes performances (HPC) et le Deep Learning
  • Plateforme logicielle ouverte ROCm pour les déploiements d'échelle de classe HPC
  • Large prise en charge BAR pour le mGPU peer to peer
  • Technologies de virtualisation matérielle MxGPU SR-IOV pour une utilisation optimisée du centre de données

Densité de calcul et performance par nœud supérieures en combinant les nouveaux serveurs AMD EPYC™ et les accélérateurs Radeon Instinct MI25

EN SAVOIR PLUS


 

Plateforme logicielle ouverte ROCm

La plateforme logicielle ouverte ROCm offre une base open-source pour le calcul hétérogène de classe HPC et la conception de systèmes de datacenter de classe mondiale. La plateforme ROCm fournit des pilotes, des compilateurs, des outils et des bibliothèques Linux® optimisés pour la performance. La philosophie de conception logicielle de ROCm offre un choix de programmation, un minimalisme et une approche de développement modulaire permettant d'optimiser les calculs des accélérateurs de GPU.

Cette approche combinée avec les technologies de sécurité matérielle virtualisées MxGPU d'AMD permet aux concepteurs de systèmes de modifier la façon dont ils conçoivent les systèmes pour obtenir des rendements plus élevés et optimiser l'utilisation et les capacités du centre de données.

Éléments fondamentaux de ROCm :

HSA Foundation logo ​ ROCm Platform logo
  • Pilote Linux® Open Headless 64 bits et puissance système optimisée pour le calcul de classe Hyperscale et HPC
  • Prise en charge du calcul multi-GPU dans et hors de la communication nœud-serveur via RDMA avec un prise en charge de la synchronisation des pairs RDMA dans le pilote
  • Un modèle de programmation plus simple procurant aux développeurs le contrôle dont ils ont besoin
  • Compilateurs hétérogènes C++ à source unique HCC traitant le système entier et pas seulement un seul périphérique
  • Outil de conversion HIP CUDA offrant un choix de plateforme pour l'utilisation de l'API de calcul GPU

La plateforme logicielle ouverte ROCm fournit une base solide pour les déploiements à grande échelle de centres de données d'intelligence machine et de HPC avec un pilote Linux ouvert et optimisé ainsi qu'une riche exécution système ROCr indépendante du langage et utilisant fortement l'API Runtime Heterogeneous System Architecture (HSA). Cette approche fournit une base riche pour exécuter des langages de programmation tels que HCC C ++, l'OpenCL™ de Khronos Group, l'Anaconda Python de Continuum et l'outil de conversion HIP CUDA.2

AMD continue d'adopter une approche ouverte pour étendre la prise en charge des fonctionnalités critiques requises pour l'accélération de classe NUMA à ses accélérateurs de GPU Radeon™ pour les déploiements HPC et l'apprentissage en profondeur, et la plateforme ROCm prend désormais en charge notre nouvelle famille d'accélérateurs de GPU Radeon Instinct tout en offrant la prise en charge continue pour un certain nombre de ses autres cartes graphiques AMD FirePro™ série S, Radeon ™ série RX et Radeon™ Pro Duo. Visitez le site Web de ROCm pour obtenir la liste complète des cartes GPU prises en charge.


 

Prise en charge OpenCL™, OpenMP et OpenACC

OpenCL  

AMD continue de prendre en charge ces standards sur les dernières offres de produits3. AMD a bien compris que la plupart des acteurs et utilisateurs de la communauté HPC souhaitaient des standards ouverts pour l’exécution de leurs projets et de leurs simulations et s'est engagé à soutenir cet objectif. Nous travaillons de manière intensive en synergie avec cette communauté pour promouvoir des standards ouverts.

 Accélérateurs AMD FirePro™ série-S

AMD FirePro™ S9300 x2 

Accélérateur AMD FirePro™ S9300 x2 Le premier accélérateur GPU au monde possédant une bande passante mémoire de 1 To/s Accélérez vos charges de travail HPC les plus complexes en analyses de données ou traitement des données sismiques grâce à l'accélérateur GPU le plus rapide au monde en calcul simple précision : le GPU pour serveur AMD FirePro™ S9300 x24,5. Tirez parti des nombreux outils et logithèques à votre disposition, dont les outils ROCm, présents sur notre page développeurs à l'adresse : http://www.gpuopen.com/?sessionGUID=19a21a7b-29e9-525c-9876-67ad3aeb2e79&webSyncID=79e9a94d-12cd-1236-3665-5eacc850c9cd&sessionGUID=e8485a29-c782-b424-5038-bdc37a33c4e8.

Un essai a été effectué récemment par un de nos clients : CGG. CGG est un pionnier en matière de géosciences de pointe et a récemment mesuré les performances en termes de modélisation d'équation d'onde de plusieurs accélérateurs GPU, dont le nouveau GPU AMD FirePro™ S9300 x2. Alors que la complexité de l'équation d'onde était croissante, l'avantage de performances s'est accru en faveur du GPU AMD FirePro™ S9300 x2, à tel point que ce dernier était deux fois plus rapide que n'importe quelle autre carte testée.6

Wave Table 

Graphique fourni par CGG

Accélérateurs AMD FirePro™ S9100, S9150 et S9170

Les personnes qui recherchent d'excellentes performances de calcul double précision peuvent se tourner vers les accélérateurs AMD FirePro™ de la série S9100. L'AMD FirePro™ S9150, équipant le superordinateur en tête de la liste Green500 en 2014, surpasse aisément ses concurrents en proposant 50 % de performances double précision supplémentaires par rapport au GPU Tesla K40 correspondant.7

Regarder l'entretien vidéo avec le Docteur David Rohr et le Professeur Lindenstruth au sujet du cluster L-CSC, classé nº1 des superordinateurs sur la liste Green500 en 2014.

La DGEMM, ou double précision du produit matriciel général, mesure le taux d'exécution de la virgule flottante en double précision, ou produit matriciel réel. De nombreuses applications pouvant être mises en œuvre dans le monde réel tirent profit des opérations matricielles en double précision. Cela inclut la mécanique des fluides numérique, l'analyse des éléments finis et la modélisation structurale, ainsi que la dynamique moléculaire.

Grâce à l'implémentation de l'interface de programmation BLAS utilisant AMD OpenCL, nous sommes capables d'atteindre 2 TFLOPS de performances constantes en DGEMM avec le GPU AMD FirePro™ S9150, tandis que le Tesla K40 n'atteint que 1,3 TFLOPS de performances DGEMM.

Le GPU AMD FirePro™ S9170 est tout indiqué pour les personnes ayant besoin de capacités de produit matriciel particulièrement importantes, où la vaste quantité de mémoire GDDR5 de 32 Go est plus qu'avantageuse. Les Nvidia K80 et K40, avec leurs mémoires de 24 et 12 Go respectivement, ne peuvent traiter de matrices plus conséquentes que ce que leur quantité de mémoire plus restreinte peut manipuler.

 Spécifications des AMD FirePro™ série-S

Solutions AMD FirePro™ de GPU pour serveur pour les calculs hautes performances

Recherche scientifique, dynamiques computationnelles de fluides, traitement de données sismiques et simulation de réservoirs dans l’industrie pétrolière ou gazière, les domaines ne manquent pas où les GPU pour serveur AMD FirePro™ série-S offrent une gamme complète de produits pouvant répondre à pratiquement tous les besoins. Grâce à leurs performances de pointe en calculs simple et double précisions, les GPU pour serveur AMD FirePro sont la solution pour n’importe quel projet de calculs complexes exigeant du GPU des capacités de traitement parallèle massif.4

​​​​S9100​S9150S9170​​S9300 X2
AMD FirePro™ S9300 x2​​
​PROCESSEURS
DE FLUX GCN
​2560​2816​2816​​8192
​SIMPLE PRÉCISION
(EN GFLOP)
​4220​50705240​13900​
​DOUBLE PRÉCISION
(EN GFLOP)
​2110​2530​2620​​870​
MÉMOIRE INTÉGRÉE​12 Go GDDR5​16 Go GDDR5​32​ Go GDDR5​8GB HBM
​ECC​Oui (externe)​Oui (externe)Oui (externe)​Non​
​BANDE
PASSANTE MÉMOIRE
(EN GO/S)
​320​320​320​1024
​INTERFACEPCIe 3.0, deux slotsPCIe 3.0, deux slotsPCIe 3.0, deux slots​PCIe 3.0, deux slots
PUISSANCE MAX​225W​235W​2​75W300W​
​REFROIDISSE-MENT​Dissipateur
thermique passif
​Dissipateur
thermique passif
Dissipateur
thermique passif
​Dissipateur
thermique passif
​RECOMMANDÉ POUR

Workflows double précision :

Clusters pour la
recherche scientifique et l’administration publique

Pétrole et gaz –
simulation de réservoirs

​Workflows double précision :

Clusters pour la
recherche scientifique et l’administration publique

Pétrole et gaz –
simulation de réservoirs

Workflows double précision :

Clusters pour la
​recherche scientifique et l’administration publique

Pétrole et gaz –
simulation de réservoirs​

​Charges de travail en simple précision telles que :

Dynamique moléculaire

Sciences géologiques

Réseaux d'apprentissage profond/apprentissage automatique

 Où acheter

Les accélérateurs AMD FirePro™ sont disponibles chez de nombreux OEM et fabricants de systèmes, tels Dell, HPE et SuperMicro, entre autres.

Dell ​ ​ ​ ​​ ​HPE
 ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​ SuperMicro ​ ​ ​ ​​ 
​​

Pour de plus amples informations, sur les serveurs Dell équipés de GPU AMD FirePro™, rendez-vous à l'adresse : www.amd.com/dell-server

Pour de plus amples informations sur les serveurs HPE équipés de GPU AMD FirePro™, rendez-vous à l'adresse : www.amd.com/hpe

 

 

 

 

 

Notes