Le NLHPC au Chili a boosté ses performances de recherche avec AMD

Le Laboratoire national pour le calcul hautes performances (HPC) au Chili a doublé ses performances de calcul scientifique par watt avec les CPU AMD EPYC™ et les GPU AMD Instinct™

L'informatique hautes performances booste la recherche universitaire dans le monde entier. En Amérique du Sud, le Chili joue un rôle de premier plan via son Laboratoire national pour le calcul hautes performances (NLHPC, hébergé au Centre de modélisation mathématique (CMM) de l'Université du Chili). Comme toutes les institutions qui dépendent des financements publics, le NLHPC doit atteindre les meilleures performances possibles tout en respectant les objectifs nationaux en matière de développement durable. Les CPU AMD EPYC™ et les GPU AMD Instinct™ ont fourni tout ce dont le NLHPC avait besoin pour son dernier déploiement HPC.

« Nous fournissons des ressources informatiques à la communauté scientifique du Chili depuis 15 ans », explique Ginés Guerrero, directeur exécutif, NLHPC. « Bien que l'Université du Chili reste notre principal partenaire, 44 autres universités sont actuellement associées à nous, regroupant pratiquement l'ensemble des chercheurs scientifiques du Chili. Notre financement provient de l'Agence nationale de recherche et du développement (ANID) du pays. » Le large éventail de ses charges de travail rend les besoins en calcul du NLHPC particulièrement complexes. « Le nombre et la diversité des utilisateurs représentent un véritable défi. Nos 500 utilisateurs proviennent de 40 domaines de recherche différents, tels que la chimie quantique, la bio-informatique, l'astronomie, la nanotechnologie et la physique. »

Universidad de Chile Case Study
Les processeurs AMD ont permis au centre de données du NLHPC de doubler ses performances par watt

Des performances par watt multipliées par deux

« L'une des charges de travail les plus intenses est liée à la lutte contre le changement climatique et à la découverte de nouveaux matériaux », explique Ginés Guerrero. « Par exemple, les chercheurs étudient des matériaux photovoltaïques qui capturent l'énergie solaire de manière plus efficace. L'astronomie occupe également une place importante au Chili. Notre ciel est l'un des meilleurs au monde pour étudier les étoiles. Nous disposons de nombreux télescopes de grande envergure financés à l'échelle internationale. Dans le domaine de l'astro-informatique, nous examinons la formation de la galaxie. De nombreuses publications ont été consacrées aux trous noirs supermassifs et aux images obtenues par les télescopes. Cela inclut ALeRCE (Automatic Learning for the Rapid Classification of Events), un courtier astronomique qui traite toutes les images issues des télescopes. Ces images doivent être analysées en temps réel afin qu'ALeRCE puisse envoyer des alertes en cas de changements, comme l'apparition de supernovas. »

« En tant que Laboratoire national du calcul au Chili, nous devons nous tenir au courant des évolutions concernant le hardware HPC », explique Ginés Guerrero. « L'équipe d'AMD a été très proactive en nous informant des dernières avancées de sa technologie. Lorsque nous avons commencé à nous intéresser aux CPU AMD EPYC de 4e génération, l'équipe nous a rapidement familiarisés avec les capacités AVX-512 du CPU. Nous étions également préoccupés par le changement de GPU, car nous faisions appel au même fournisseur depuis longtemps. L'équipe d'AMD nous a donc mis en relation avec des ingénieurs basés aux États-Unis pour faciliter la transition lorsque nous avons commencé à intégrer les GPU AMD dans notre système. »

Le NLHPC a testé les processeurs AMD EPYC de 4e génération et les GPU AMD Instinct MI210. « Lors de l'installation des serveurs et de la réalisation des tests, nous avons été surpris par les résultats », explique Ginés Guerrero. Au cours du processus d'appel d'offres, la performance était le critère principal, mais l'efficacité énergétique a également joué un rôle majeur. « Nos tests étaient très variés. Nous avions compilé au moins 100 charges de travail. Tous les utilisateurs ont constaté que les performances étaient bien meilleures avec les CPU AMD EPYC et nous avons également utilisé le benchmark LINPACK. Lorsque nous avons exécuté ce test sur l'ancienne architecture, nous avons constaté que les performances étaient jusqu'à 60 % inférieures au maximum théorique. Avec le cluster actuel alimenté par des CPU AMD EPYC de 4e génération, nous avons obtenu plus de 100 % du maximum théorique. L'ancien cluster consommait également deux fois plus d'énergie pour obtenir les mêmes résultats. Avec les CPU AMD EPYC, nous avons obtenu une performance quatre fois supérieure avec LINPACK, avec une consommation énergétique multipliée par deux seulement. »

Universidad de Chile Case Study
Les CPU AMD EPYC accélèrent les recherches du NLHPC sur les mystères de l'univers.

Accélérer le progrès scientifique au Chili

« Avec les CPU AMD EPYC, bon nombre de nos charges de travail ont pu être exécutées immédiatement », explique Ginés Guerrero. « Mais une fois que nous avons recompilé les applications avec GNU Compiler Collection ou AMD Optimizing C/C++ Compiler, nous avons obtenu des performances bien supérieures à celles du code généré avec notre compilateur précédent. Avec les GPU AMD Instinct, il était nécessaire d'utiliser un nouveau software. Nous avons donc déployé les conteneurs fournis par AMD Infinity Hub. Les plateformes disponibles avec le software AMD ROCm™ se sont révélées être le meilleur choix pour cette transition. »

Le nouveau cluster du NLHPC est composé de 27 serveurs Lenovo ThinkSystem SR645 V3, chacun équipé de deux CPU AMD EPYC 9754 de 4e génération à 128 cœurs et de 768 Go de mémoire, pour un total de 6 912 cœurs pour les nœuds de calcul et d'accès. Ses deux serveurs GPU Lenovo ThinkSystem SR675 V3 sont dotés de deux CPU AMD EPYC 9224 de 4e génération à 24 cœurs et de six GPU AMD Instinct MI210 chacun, pour un total de 12 accélérateurs. Le système de refroidissement liquide Neptune de Lenovo a été utilisé pour maintenir les températures de fonctionnement des CPU et des GPU pendant les charges de travail d'IA intensives.

« Ce qui compte le plus pour nous, c'est de pouvoir contribuer au progrès scientifique du Chili », déclare Ginés Guerrero. « Plus nous pouvons offrir de ressources, plus l'impact est important pour l'ensemble de la communauté. » Les retours des scientifiques chiliens ont été extrêmement positifs. « Un utilisateur exécutant le modèle WRF (Weather Research & Forecasting) nous a indiqué que sa charge de travail s'exécutait beaucoup plus rapidement qu'auparavant. Le modèle NAMD (Nanoscale Molecular Dynamics) a également offert d'excellentes performances. »

Universidad de Chile Case Study
Le NLHPC exploite les performances des CPU AMD EPYC pour la recherche climatique à forte intensité de calcul.

Vers un avenir prometteur pour la recherche avec AMD

Le nouveau cluster améliore la façon dont les chercheurs déploient leurs charges de travail. « Si nous avons de nombreux cœurs dans un même serveur, nous pouvons exécuter des tâches en mémoire partagée », explique Ginés Guerrero. « Avec les CPU AMD EPYC, nous pouvons désormais utiliser 256 cœurs pour une seule tâche. La plupart de nos utilisateurs n'utilisent pas MPI. Ils lancent des tâches en mémoire partagée. S'ils disposent de plus de 200 cœurs dans un seul serveur, ils peuvent utiliser 200 unités de calcul. Ce n'était pas possible auparavant, lorsque nous n'avions que des serveurs avec 40 cœurs, comme avec nos anciens CPU. C'est un avantage considérable. » Les accélérateurs AMD Instinct du NLHPC offrent également de meilleures performances par watt. « Avec les GPU AMD Instinct MI210, nous pouvons effectuer davantage d'opérations en virgule flottante par seconde avec une plus grande efficacité énergétique. La plupart de nos utilisateurs exploitent cette technologie pour la dynamique moléculaire. »

« J'utilise souvent une phrase espagnole qui se traduit ainsi : "Si vous ne calculez pas, vous n'entrez pas en concurrence" », déclare Ginés Guerrero. « Si nous n'investissons pas dans le calcul et que nous ne progressons pas, nous serons moins compétitifs sur la scène mondiale. » Au Chili, un concours permet d'obtenir 7 millions de dollars pour l'achat d'infrastructures en utilisant davantage de GPU pour des charges de travail émergentes telles que l'IA. Bien sûr, nous participerons à ce concours. « Aujourd'hui, avec l'IA, on voit des pays investir des sommes colossales pour augmenter leur capacité de calcul. Cela a un impact sur l'industrie, l'État, la recherche et l'ensemble des citoyens. Les États-Unis, l'Europe et la Chine sont en tête, mais en Amérique latine, il reste encore beaucoup à faire et nous travaillons sans relâche pour faire avancer les choses.

Ginés Guerrero entrevoit un avenir prometteur pour la relation entre le NLHPC et AMD dans cette nouvelle phase. « Dans la liste des 500 premiers supercalculateurs du monde, il est clair que les processeurs AMD gagnent du terrain », affirme-t-il. « Ils sont de plus en plus présents. Quand on regarde ce qui se passe à l'échelle mondiale, nous recommandons vraiment l'intégration de la technologie AMD, car les résultats que nous avons obtenus sont très positifs. AMD a fait un travail sensationnel. L'architecture est impeccable. Cela représente une avancée globale pour la société, en permettant un calcul de meilleure qualité. La collaboration entre le NLHPC et l'équipe d'ingénierie d'AMD a été la clé pour offrir la meilleure solution avec plus de performances et une efficacité énergétique optimale. Cela a vraiment été incroyable. »

Universidad de Chile Case Study
Les GPU AMD Instinct ont fourni l'accélération dont le NLHPC avait besoin pour ses charges de travail en dynamique moléculaire

À propos du client


Le Laboratoire national pour les calculs hautes performances (NLHPC) du Chili est le principal centre de supercalcul du pays. Il fournit des ressources de calcul avancées pour soutenir la recherche scientifique, l'innovation et le développement technologique. Le NLHPC dessert la communauté scientifique nationale, les organismes gouvernementaux et les industries, en favorisant la collaboration et en stimulant les avancées dans des domaines tels que la modélisation climatique, l'astrophysique et la génomique. Sa mission est de démocratiser l'accès au calcul hautes performances, en permettant une recherche de pointe et en contribuant aux progrès scientifiques et économiques du Chili. Pour obtenir plus d'informations, rendez-vous sur nlhpc.cl.

Profil de l'étude de cas


  • Secteur :
    Recherche scientifique
  • Les défis :
    Améliorer les performances et la consommation d'énergie pour la recherche scientifique au Chili
  • La solution :
    Déployer les serveurs Lenovo ThinkSystem SR675 V3 et SR645 V3 alimentés par les CPU AMD EPYC de 4e génération et les GPU AMD Instinct
  • Les résultats :
    Deux fois plus de performance pour une consommation énergétique identique par rapport à l'ancienne infrastructure du centre de données
  • La technologie AMD en un coup d'œil :
    CPU AMD EPYC 9754 de 4e génération (nœuds de calcul et d'accès) et AMD EPYC 9224 (hôte de GPU)
    GPU AMD Instinct MI210
  • Partenaire technologique :
Lenovo

Vous souhaitez découvrir tout ce qu'AMD peut apporter à votre centre de données ?