Optimiser les capacités HPC tout en réduisant les émissions dans le centre de données de Shell à Houston
Les centres de données relient les chaînes d'approvisionnement, favorisent la collaboration et l'innovation, assurent la sécurité des informations et contribuent de plus en plus au bon fonctionnement de la société et de l'économie.
Parallèlement, l'utilisation de technologies gourmandes en données, telles que l'IA, le machine learning et l'Internet des objets, stimule une croissance exponentielle de la demande en espace serveur et impose des exigences toujours plus élevées aux centres de données modernes.
En tant qu'utilisateur et fournisseur d'énergie, Shell plc (Groupe Shell) est directement confronté à ces défis. Dans la gestion de ses propres centres de données, son service informatique reconnaît que les performances doivent être équilibrées par rapport aux objectifs en matière de coûts et de durabilité. Récemment, pour son cluster de calcul haute performance (HPC) situé dans son centre de données de Houston, Shell Information Technology International (Shell IT) a identifié les serveurs Altus de Penguin Computing, équipés de processeurs AMD EPYC et associés à une technologie de refroidissement par immersion, comme un élément clé pour optimiser les performances par rapport aux coûts, tout en révolutionnant l'efficacité du système.
Répondre à un besoin croissant en puissance de calcul
« Le groupe Shell s'est fixé pour objectif de devenir une entreprise énergétique à émissions nettes nulles d'ici 2050 », déclare Sjors van de Rijt, responsable mondial des partenariats durables, Technologie et énergie, Shell Energy. « Nous jouons plusieurs rôles dans cette transition, de la production et de la fourniture d'énergie à notre propre consommation, en passant par notre rôle de partenaire du changement. Notre équipe HPC chez Shell IT s'efforce de soutenir l'ensemble de ces activités. La mise à disposition d'installations de calcul pour une exploration et une production plus efficaces du pétrole et du gaz naturel est un élément important des prestations fournies par Shell IT. Mais nos besoins informatiques prennent également en charge un éventail toujours plus grand d'initiatives numériques, telles que des solutions de recharge innovantes pour véhicules électriques capables de connecter les communautés de manière plus sûre, plus propre et plus intelligente. »
Les solutions numériques constituent un élément essentiel de l'activité du groupe Shell et un facilitateur fondamental pour la réalisation de ses propres objectifs de développement durable et de ceux de ses clients. « La technologie ouvre de nouvelles possibilités pour les systèmes d'énergie propre, contribue à optimiser les opérations existantes et permet de suivre et de déclarer les émissions avec plus de précision », explique M. van de Rijt. « Mais la numérisation implique également une augmentation des données et des charges de travail, ce qui nécessite davantage d'énergie. Les impacts sur les performances du système, les coûts et l'empreinte carbone sont autant de défis que mon équipe au sein de Shell Energy s'efforce de relever en collaboration avec nos clients. »

« Le groupe Shell est un très grand consommateur de données, de stockage de données et d'analyse, qui sont ensuite utilisés dans le machine learning et l'IA », explique David Baldwin, responsable des calculs hautes performances, Shell IT. « Nous sommes à la fois utilisateurs et acheteurs de plateformes cloud, de services sur site et de jumeaux numériques. Par l'intermédiaire de Shell Energy, nous commercialisons également des solutions dédiées à l'énergie et à l'efficacité pour l'industrie technologique. Nous sommes présents à tous les niveaux de cette chaîne de valeur. »
« Nous utilisons un large éventail d'applications », explique M. Baldwin. « Cela inclut des applications en amont, notamment pour le traitement de données sismiques, la recherche de réserves de pétrole et de gaz, ainsi que les objectifs de captage du carbone. Shell IT prend également en charge tout ce qui touche à la chimie informatique, à la dynamique des fluides et à l'ingénierie des réservoirs, aux réseaux intelligents, ainsi qu'à l'IA et au machine learning. Dans toutes ces applications, nous affinons les systèmes afin d'optimiser les performances et la rentabilité. Nous mettons en œuvre des contrôles intelligents, des software de virtualisation et l'intelligence artificielle (IA) pour aider à gérer intelligemment les charges de travail, répartir les tâches de calcul de manière plus uniforme et optimiser les taux d'utilisation. »
« L'entreprise a accumulé des décennies de données. Le traitement de ces données pose d'importants défis en matière de consommation énergétique, d'autant plus que la puissance des puces des processeurs ne cesse d'augmenter », poursuit M. Baldwin.
Le centre de données de Shell à Houston est déjà alimenté à 100 % par de l'énergie renouvelable fournie par Shell Energy North America. Le défi pour l'équipe HPC de Shell IT est d'améliorer son indicateur d'efficacité énergétique tout en augmentant les performances. Cela a motivé la mise à niveau vers les serveurs Altus de Penguin Computing, équipés de processeurs AMD EPYC associés à une technologie de refroidissement par immersion. « Penguin a 25 ans d'expérience dans la construction et le déploiement de grands clusters HPC capables d'exécuter certaines des charges de travail les plus exigeantes au monde », explique Phil Pokorny, directeur technique, Penguin Solutions. « Nos partenariats technologiques nous permettent d'être à la pointe de l'intégration des technologies nouvelles et émergentes, comme le refroidissement par immersion. »

Résoudre le problème de refroidissement des centres de données
La relation entre Shell IT et les processeurs AMD EPYC remonte à six ans. « Nous avons changé car la plupart de nos applications sont limitées par la bande passante mémoire et les processeurs AMD EPYC avaient l'avantage dans ce domaine », explique David Baldwin. Au cours de cette période, Shell IT a commencé à travailler avec Penguin Solutions en tant que partenaire technologique. « Grâce à Penguin, nous bénéficions d'un accès anticipé aux nouvelles technologies. »
Shell IT a collaboré avec Penguin pour trouver un moyen de refroidir les processeurs de plus en plus gourmands en énergie. « Notre objectif est d'obtenir une bande passante mémoire très élevée de nos CPU », explique M. Baldwin. « Nous choisissons toujours soit les processeurs les plus performants, soit ceux juste en dessous. Au cours des six dernières années, nous sommes passés de processeurs de 140 watts à des processeurs de 360 watts. À ce stade, le refroidissement par air n'est plus suffisant. Nous avons mis en place un refroidissement liquide direct-to-chip, mais nous avons estimé que nous devions passer à l'étape suivante avec le refroidissement par immersion. Nous continuons à repousser les limites du possible en termes de performances, d'efficacité et de durabilité. »
« Le refroidissement liquide direct-to-chip prend en charge environ deux tiers de la chaleur dans le serveur, qui provient principalement du CPU », explique David Baldwin. « Il reste encore un tiers de refroidissement par air, qui manque d'efficacité. La mémoire et les réseaux consomment de plus en plus d'énergie à mesure que nous augmentons la bande passante. Et puis il y a aussi les périphériques de stockage. Avec le refroidissement par immersion, vous plongez tout le système dans un liquide non conducteur (diélectrique) qui absorbe la chaleur plus de mille fois mieux que l'air, ce qui améliore considérablement votre capacité à gérer toute la chaleur produite. »

Shell IT a installé 864 systèmes à double socket dans son nouveau centre de données de Houston, utilisant des CPU AMD EPYC 9654 de 4e génération à 96 cœurs, pour un total de 1 728 processeurs et 165 888 cœurs. « Nous constatons que la 4e génération de processeurs AMD est un cran au-dessus de la 3e », se réjouit David Baldwin. « Elle est capable d'en faire bien plus. Nous avons plus de cœurs et plus de mémoire. Ainsi, nous en avons plus pour notre argent. » Mais cela a accentué la nécessité d'un refroidissement efficace. « À mesure que nous avons augmenté le nombre de cœurs et la puissance de nos processeurs, la consommation des racks de notre centre de données a augmenté. Nous utilisons des racks refroidis par air à environ 30 kW. Nous pouvons utiliser un refroidissement liquide direct-to-chip à environ 60 kW par rack, et les nouvelles machines refroidies par immersion fonctionnent à environ 100 kW par rack. »
Présentation des avantages de l'immersion en termes de performances
« Il y a environ deux ans, nous avons déployé pour la première fois le refroidissement par immersion pour notre cluster de calcul hautes performances dans un centre de données Shell à Amsterdam », explique David Baldwin. « Les deux sites utilisent des liquides de refroidissement par immersion Shell, mais notre dernière installation à Houston est beaucoup plus grande et bénéficie également de solutions d'énergie renouvelable et de gestion intelligente de l'énergie fournies par Shell Energy. » Shell Lubricants est un pionnier dans le nouveau domaine des fluides de refroidissement par immersion pour les centres de données. Avec Shell Energy, il utilise ces déploiements pour faire la démonstration de solutions entièrement intégrées, optimisées et évolutives adaptées aux calculs hautes performances à l'échelle des entreprises. « Chez Shell, nos activités sont confrontées aux mêmes défis que nos clients en matière d'hébergement de données et de besoins énergétiques », explique M. van de Rijt. « Cela nous place dans une position unique pour aider les entreprises leaders du secteur technologique et d'autres secteurs grâce à notre connaissance directe des produits et services qui, selon nous, seront essentiels pour atteindre leurs objectifs commerciaux et de développement durable. »
Bien que la puissance globale par rack ait augmenté, grâce à la densité de cœurs des processeurs AMD EPYC, c'est une solution beaucoup plus efficace que le refroidissement par air qui oblige à répartir l'empreinte du centre de données dans l'espace pour obtenir les mêmes performances. « Plus l'empreinte est importante, plus il est difficile de gérer l'air dans le centre de données », explique David Baldwin. « Vous finissez par avoir des points chauds. Sans parler de la mise en réseau. Si vous espacez tous vos ordinateurs, vous avez besoin de plus de câbles à fibres optiques, ce qui est extrêmement coûteux. Le refroidissement par immersion nous permet de regrouper davantage de nœuds dans une empreinte réduite et dense. »
« En tant qu'opérateur de centre de données, nous pensons que le refroidissement par immersion représente l'avenir », déclare David Baldwin. « Penguin Solutions a joué un rôle déterminant en nous aidant à réunir les technologies appropriées pour atteindre les objectifs commerciaux et de durabilité de Shell IT, en collaboration avec AMD. Le prix, les performances et la bande passante mémoire des CPU AMD EPYC sont parfaitement adaptés à nos besoins. Ce sont des processeurs de classe mondiale. »

À propos du client
Shell plc est une société internationale du secteur de l'énergie spécialisée dans l'exploration, la production, le raffinage et la commercialisation de pétrole et de gaz naturel, ainsi que dans la fabrication et la commercialisation de produits chimiques. Elle compte plus de 90 000 employés dans plus de 70 pays. La société utilise des technologies de pointe et adopte une approche innovante pour contribuer à bâtir un avenir énergétique durable. Pour obtenir plus d'informations, rendez-vous sur shell.com.
Profil de l'étude de cas
- Secteur :
Énergie - Les défis :
Fournir un refroidissement efficace et performant pour prendre en charge des performances de pointe répondant aux besoins en calculs hautes performances de Shell IT à mesure que la consommation énergétique des CPU augmente - La solution :
Déployer des processeurs AMD EPYC™ de 4e génération avec un système de refroidissement par immersion monophasé - Les résultats :
Améliorer les performances tout en soutenant les objectifs commerciaux et de développement durable de Shell IT - La technologie AMD en un coup d'œil :
CPU AMD EPYC™ de 4e génération - Partenaire technologique :