Potencia la capacidad de HPC con menores emisiones en el centro de datos de Shell en Houston

Los centros de datos conectan cadenas de suministro, permiten la colaboración y la innovación, conservan la seguridad de la información y mantienen cada vez más el funcionamiento de la sociedad y la economía.

Mientras tanto, el manejo de tecnologías de uso intensivo de datos, como la IA, el aprendizaje automático y la Internet de las cosas están impulsando un crecimiento exponencial de la demanda de espacio de servidor y poniendo cada vez mayores exigencias en los centros de datos modernos.
Como usuario y proveedor de energía, Shell plc (Shell Group) se enfrenta a estos desafíos de primera mano. En la gestión de sus propios centros de datos, su organización de las tecnologías de la información reconoce que el rendimiento debe equilibrarse con los objetivos de costo y sostenibilidad. Recientemente, para el clúster de HPC (high-performance computing, computación de alto rendimiento) dentro del centro de datos de Houston, Shell Information Technology International (Shell IT) descubrió que los servidores Altus de Penguin Computing, impulsados por procesadores AMD EPYC combinados con tecnología de refrigeración por inmersión, eran una pieza esencial del rompecabezas para ayudar a optimizar el rendimiento en relación con el costo y revolucionar la eficiencia del sistema.

Satisfacer una creciente necesidad de potencia computacional

“Shell Group busca convertirse en un negocio de energía con emisiones cero neto para el 2050”, comenta Sjors van de Rijt, director global de Asociaciones de Sostenibilidad, Tecnología y Energía de Shell Energy. “Cumplimos distintas funciones en este viaje. Nuestras actividades van desde la de un productor y proveedor de energía, hasta el usuario de energía en sí, así como un socio para el cambio. Nuestro equipo de HPC en Shell IT está ayudando a contribuir a ese objetivo en apoyo de todas las actividades. La distribución de instalaciones computacionales para una exploración y producción más eficientes de petróleo y gas natural es una parte importante de lo que Shell IT ofrece. Pero nuestras necesidades informáticas también apoyan cada vez más una serie de iniciativas digitales, por ejemplo, soluciones innovadoras de carga de EV (electric vehicle, vehículos eléctricos) que pueden conectar a las comunidades de maneras más seguras, limpias e inteligentes”.

Las soluciones digitales son una parte crucial del negocio de Shell Group y un facilitador fundamental de los propios objetivos de sostenibilidad y los de los clientes. “La tecnología ofrece nuevas posibilidades para los sistemas de energía limpia, lo que ayuda a optimizar las operaciones existentes y permite el seguimiento y la notificación de las emisiones con mayor precisión”, dice van de Rijt. “Pero la digitalización también supone aumentar los datos y las cargas de trabajo, que requieren más energía, y los impactos en el rendimiento del sistema, los costos y la huella de carbono son lo que el equipo de Shell Energy está trabajando junto con los clientes para ayudar a tratar”.

David Baldwin, High Performance Computing Manager, Shell IT
David Baldwin, gerente de Computación de Alto Rendimiento del departamento de TI de Shell

“Shell Group es un gran consumidor de datos, almacenamiento de datos y análisis, que luego se dedica al aprendizaje automático y la IA”, afirma David Baldwin, director de computación de alto rendimiento de Shell IT. “Somos un usuario y un comprador de plataformas en la nube, servicios en las instalaciones y gemelos digitales. A través de Shell Energy también comercializamos soluciones de energía y eficiencia para la industria tecnológica. Abarcamos todas las partes de esa cadena de valor”.

“Utilizamos una amplia gama de aplicaciones”, dice Baldwin. “Esto incluye aplicaciones de flujo ascendente, como el procesamiento sísmico, la búsqueda de reservas de petróleo y gas, y objetivos de captura de carbono. Shell IT también es compatible con todo, desde química computacional, dinámica de fluidos e ingeniería de yacimientos, hasta redes inteligentes, así como IA y aprendizaje automático. En todas estas aplicaciones, ajustamos los sistemas para optimizar el rendimiento y la rentabilidad. Estamos implementando controles inteligentes, software de virtualización e inteligencia artificial (IA) para ayudar a gestionar de forma inteligente las cargas de trabajo, distribuir las tareas informáticas de manera más uniforme y maximizar las tasas de utilización”.

“La compañía tiene datos acumulados de décadas atrás. El procesamiento de estos datos plantea desafíos significativos en torno al consumo energético, en particular a medida que la potencia del chip del procesador continúa aumentando”, continúa Baldwin.

El centro de datos de Shell en Houston ya utiliza energía 100 % renovable que suministra Shell Energy North America. El desafío para su equipo de HPC de Shell IT es cómo reducir su alcance de la PUE (Power Usage Effectiveness, eficacia en el uso de energía) mientras aumenta el rendimiento. Esto motivó la actualización a los servidores Altus de Penguin Computing, con los procesadores AMD EPYC emparejados con tecnología de refrigeración por inmersión. “Penguin tiene 25 años de experiencia en la creación e implementación de grandes clústeres de HPC que ejecutan algunas de las cargas de trabajo más exigentes del mundo”, comenta Phil Pokorny, director de Tecnología de Penguin Solutions. “Nuestras asociaciones tecnológicas nos permiten estar a la vanguardia de la integración de tecnologías nuevas y emergentes, como la refrigeración por inmersión”.

Immersion cooling tank
Tanque de refrigeración de inmersión

Resolver el problema de refrigeración del centro de datos

La relación de Shell IT con los procesadores AMD EPYC se remonta a seis años atrás. “Cambiamos porque la mayoría de nuestras aplicaciones tienen un ancho de banda de memoria limitado, y los chips AMD EPYC tenían la ventaja en esta área”, afirma Baldwin. Durante este período, Shell IT comenzó a trabajar con Penguin Solutions como su socio de tecnología. “Tenemos acceso anticipado a las nuevas tecnologías con Penguin”.

Shell IT trabajó con Penguin para encontrar una manera de mantener refrigerados los procesadores que necesitan cada vez más energía. “Nuestro objetivo es obtener un ancho de banda de memoria muy alto de nuestras CPU”, dice Baldwin. “Siempre estamos eligiendo procesadores de nivel superior o solo uno inferior. Solo en los últimos seis años, pasamos de chips de 140 watts a chips de 360 watts. Esto nos llevó al punto en que la refrigeración por aire no es suficiente. Implementamos la refrigeración líquida directa al chip, pero sentimos que necesitábamos dar el siguiente paso para la refrigeración por inmersión. Seguimos pasando los límites de lo que es posible en términos de rendimiento, eficiencia y sostenibilidad”.

“Cuando ejecutamos la refrigeración líquida directa al chip, esto cubre alrededor de dos tercios del calor en el servidor, que es principalmente la CPU”, afirma Baldwin. “Todavía tienes el otro tercio que estás tratando de enfriar al aire, lo que no es eficiente. La memoria y las redes necesitan más energía a medida que aumentamos el ancho de banda. Luego, están también los dispositivos de almacenamiento. Con la refrigeración por inmersión, se sumerge todo en un fluido no conductor (dieléctrico) que absorbe el calor más de mil veces mejor que el aire, por lo que se mejora de forma drástica su capacidad para controlar todo el calor que se produce”.

Servers are immersed in Shell's proprietary dielectric fluid, enabling faster conductivity of heat
Los servidores se sumergen en el fluido dieléctrico patentado de Shell, lo que permite una conductividad más rápida del calor

Shell IT instaló 864 sistemas de doble socket en su nuevo centro de datos de Houston, y utilizó CPU AMD EPYC 9654 de 4.ª generación de 96 núcleos, para un total de 1728 procesadores y 165 888 núcleos. “Observamos un cambio radical entre un chip AMD de 4.ª generación y uno de 3.ª generación”, declara Baldwin. “Pueden hacer mucho más. Tenemos más núcleos y más memoria. Logramos una mayor rentabilidad”. Pero esto destacó la necesidad de una refrigeración eficaz. “A medida que aumentamos los núcleos y la potencia en los chips, nuestro consumo de rack de centro de datos incrementó. Ejecutamos bastidores de aire frío a alrededor de 30 kW. Podemos hacer funcionar la refrigeración líquida directa al chip a unos 60 kW por rack, y las nuevas máquinas refrigeradas por inmersión funcionan a unos 100 kW por rack”.

Muestra de los beneficios de rendimiento de la inmersión

“Hace alrededor de dos años, implementamos por primera vez la refrigeración por inmersión para nuestro clúster de computación de alto rendimiento en un centro de datos de Shell en Ámsterdam”, afirma Baldwin. “Ambos utilizan fluidos de refrigeración por inmersión de Shell, pero nuestra última instalación en Houston es mucho más grande, y también se beneficia de las soluciones de energía renovable y de gestión inteligente de energía que suministra Shell Energy”. Shell Lubricants es pionero en la nueva frontera de los fluidos de refrigeración por inmersión para centros de datos y, junto con Shell Energy, está utilizando estas implementaciones para demostrar soluciones integradas en su totalidad, optimizadas y escalables adecuadas para HPC de nivel empresarial. “En Shell, nuestras empresas se enfrentan a muchos de los mismos desafíos que nuestros clientes con nuestro propio alojamiento de datos y necesidades de energía”, dice van de Rijt. “Esto nos pone en un lugar especial para ayudar a las empresas líderes en la industria de la tecnología y más allá, a través del conocimiento de primera mano de productos y servicios que creemos que serán fundamentales para alcanzar sus objetivos de negocio y sostenibilidad”.

Aunque la potencia total por rack aumentó, la densidad de núcleo de los procesadores AMD EPYC significa que es una solución mucho más eficiente que la refrigeración por aire, ya que tiene una huella de centro de datos que debe distribuirse en particular para lograr el mismo rendimiento. “Cuanto más grande se vuelva la huella, más difícil será gestionar el aire en el centro de datos”, comenta Baldwin. “Terminas con hotspots. También hay desafíos de networking. Si colocas todas tus computadoras con un espacio entre ellas, necesitas más cableado de fibra óptica, lo que es muy caro. La refrigeración por inmersión nos permite consolidar más nodos en una huella de densidad de potencia más pequeña”.

“Como operador de un centro de datos, creemos que la refrigeración por inmersión es el futuro”, dice Baldwin. “Penguin Solutions fue fundamental para ayudarnos a unir las tecnologías adecuadas a fin de cumplir con los objetivos de negocio y sostenibilidad de Shell IT junto con AMD. El precio, el rendimiento y el ancho de banda de memoria de las CPU AMD EPYC son perfectos para nuestras necesidades. Son de primera categoría”.

Operator manipulating an immersion cooling tank
Operador manipulando un tanque de refrigeración de inmersión

Acerca del cliente


Shell plc es una empresa energética internacional con experiencia en la exploración, producción, refinación y comercialización de petróleo y gas natural, y la fabricación y comercialización de productos químicos, con más de 90 000 empleados en más de 70 países. La compañía utiliza tecnologías avanzadas y adopta un enfoque innovador para ayudar a construir un futuro de energía sostenible. Para obtener más información, consulta shell.com.

Perfil del caso de estudio


  • Sector:
    Energía
  • Desafíos:
    Proporcionar refrigeración eficiente para respaldar el mejor rendimiento de su clase para las necesidades de HPC de Shell IT a medida que aumenta el consumo energético de la CPU
  • Solución:
    Implementar procesadores AMD EPYC™ de 4.ª generación con refrigeración de inmersión monofásica
  • Resultados:
    Aumentar el rendimiento y apoyar los objetivos de negocio y sostenibilidad de Shell IT
  • Tecnología AMD utilizada:
    CPU AMD EPYC™ de 4.ª generación
  • Socio tecnológico:
Penguin Solutions logo