Aumentando a capacidade de Computação de alto desempenho com emissões mais baixas no data center de Houston da Shell
Os data centers conectam cadeias de suprimentos, permitem a colaboração e a inovação, mantêm a segurança das informações e, cada vez mais, mantêm a sociedade e a economia funcionando.
Enquanto isso, o uso de tecnologias com uso intensivo de dados, incluindo IA, aprendizado de máquina e a Internet das Coisas, está estimulando o crescimento exponencial da demanda por espaço em servidores e impondo demandas cada vez maiores aos data centers modernos.
Como usuário e provedor de energia, a Shell plc (Grupo Shell) está enfrentando esses desafios em primeira mão. Ao gerenciar seus próprios data centers, sua organização de tecnologia da informação reconhece que o desempenho deve ser equilibrado com os objetivos de custo e sustentabilidade. Mais recentemente, para seu cluster de HPC (High Capacity Computing, Computação de alto desempenho) no data center de Houston, a Shell Information Technology International (Shell IT) entendeu que os servidores da Penguin Computing Altus, equipados com processadores AMD EPYC combinados com a tecnologia de resfriamento por imersão, eram uma peça essencial do quebra-cabeça para ajudar a otimizar o desempenho em relação ao custo, ao mesmo tempo em que revolucionavam a eficiência do sistema.
Satisfazendo uma crescente necessidade de poder computacional
"O Grupo Shell estabeleceu uma meta de se tornar um negócio de energia com emissões líquidas zero até 2050", declara Sjors van de Rijt, chefe global de parcerias de sustentabilidade, tecnologia e energia, Shell Energy. "Desempenhamos vários papéis nessa jornada. Nossas atividades vão desde a de um produtor e provedor de energia até o usuário de energia, bem como um parceiro para a mudança. E é em apoio a todas essas atividades que a equipe de Computação de alto desempenho da Shell IT está ajudando a contribuir para essa meta. Oferecer instalações computacionais para exploração e produção mais eficientes de petróleo e gás natural é uma parte importante do que a Shell IT oferece. Mas nossas necessidades de computação também apoiam cada vez mais uma série de iniciativas digitais, por exemplo, soluções inovadoras de carregamento de veículos elétricos (EV) que podem conectar comunidades de maneiras mais seguras, limpas e inteligentes."
As soluções digitais são uma parte essencial dos negócios do Grupo Shell e um fator fundamental para suas próprias metas de sustentabilidade e as de seus clientes. "A tecnologia está abrindo novas possibilidades para sistemas de energia limpa, ajudando a otimizar as operações existentes e permitindo que as emissões sejam rastreadas e reportadas com mais precisão", declara van de Rijt. "Mas a digitalização também significa aumento de dados e cargas de trabalho, que exigem mais energia, e minha equipe na Shell Energy está trabalhando em conjunto com os clientes para ajudar a resolver os impactos no desempenho do sistema, no custo e na pegada de carbono."

"O grupo Shell é um grande consumidor de dados, armazenamento de dados e análise, que depois entra em aprendizado de máquina e IA", diz David Baldwin, gerente de Computação de alto desempenho da Shell IT. "Somos usuários e compradores de plataformas de nuvem, serviços locais e gêmeos digitais. Por meio da Shell Energy, também comercializamos soluções de energia e eficiência para o setor de tecnologia. Estamos presentes em todas as partes dessa cadeia de valor."
"Utilizamos uma ampla variedade de aplicativos", declara Baldwin. "Isso inclui aplicativos de exploração e produção, como processamento sísmico, busca de reservas de petróleo e gás e alvos de captura de carbono. A Shell IT também oferece suporte a tudo, desde química computacional, dinâmica de fluidos e engenharia de reservatórios até redes inteligentes, além de IA e aprendizado de máquina. Em todas essas aplicações, ajustamos os sistemas para otimizar o desempenho e a economia. Estamos implementando controles inteligentes, software de virtualização e inteligência artificial (IA) para ajudar a gerenciar cargas de trabalho de forma inteligente, distribuindo as tarefas de computação de forma mais uniforme e maximizando as taxas de utilização."
"A empresa possui décadas de dados acumulados. O processamento desses dados representa desafios significativos em relação ao consumo de energia, especialmente porque a potência nos chips do processador continua a aumentar", continua Baldwin.
O data center da Shell em Houston já utiliza energia 100% renovável fornecida pela Shell Energy da América do Norte. O desafio para a equipe de Computação de alto desempenho da Shell IT é como reduzir sua taxa de PUE (Power Usage Effectiveness, Eficiência no uso de energia) e, ao mesmo tempo, aumentar o desempenho. Isso motivou a atualização para servidores da Penguin Computing Altus, equipados com processadores AMD EPYC combinados com a tecnologia de resfriamento por imersão. "A Penguin tem 25 anos de experiência na construção e implementação de grandes clusters HPC que executam algumas das cargas de trabalho mais exigentes do mundo", declara Phil Pokorny, diretor de tecnologia da Penguin Solutions. "Nossas parcerias tecnológicas nos permitem estar na vanguarda da integração de tecnologias novas e emergentes, como o resfriamento por imersão."

Solução do problema de resfriamento do data center
O relacionamento da Shell IT com os processadores AMD EPYC já dura seis anos. "Nós mudamos porque a maioria das nossas aplicações é limitada pela largura de banda de memória, e os chips AMD EPYC apresentam vantagem nessa área", diz Baldwin. Durante esse período, a Shell IT começou a trabalhar com a Penguin Solutions como sua parceira de tecnologia. "Obtemos acesso antecipado a novas tecnologias com a Penguin."
A Shell IT trabalhou com a Penguin para encontrar uma maneira de resfriar os processadores cada vez mais ávidos por energia. "Nosso objetivo é obter uma largura de banda de memória muito alta com nossas CPUs", diz Baldwin. "Optamos sempre pelos processadores mais avançados ou o anterior. Considerando somente os últimos seis anos, deixamos de usar chips de 140 watts e passamos a usar chips de 360 watts. Por causa disso, o resfriamento a ar já não é mais suficiente. Implementamos o resfriamento líquido direto para o chip, mas sentimos que precisávamos dar o próximo passo para o resfriamento por imersão. Continuamos a superar os limites do que é possível em termos de desempenho, eficiência e sustentabilidade."
"Ao executarmos resfriamento líquido direto no chip, cobrimos cerca de dois terços do calor no servidor, que é principalmente a CPU", diz Baldwin. "Ainda sobra o outro terço tentando resfriar com ar, o que é ineficiente. A memória e as redes estão ficando ávidos por energia à medida que aumentamos a largura de banda. Em seguida, estão os dispositivos de armazenamento. Com o resfriamento por imersão, submergimos tudo em um fluido não condutor (dielétrico) que absorve calor mais de mil vezes melhor do que o ar, melhorando drasticamente sua capacidade de lidar com todo o calor produzido."

A Shell IT instalou 864 sistemas de soquete duplo em seu novo data center em Houston, equipado com CPUs AMD EPYC 9654 de 4ª geração, com 96 núcleos cada, totalizando 1.728 processadores e 165.888 núcleos. "Percebemos uma mudança significativa dos chips AMD de 4ª geração em relação aos de 3ª geração, conta Baldwin. "Eles podem fazer muito mais. Temos mais núcleos e mais memória. Conseguimos fazer nosso dinheiro render mais". Mas isso acentuou a necessidade de um resfriamento eficaz. "À medida que passamos a utilizar mais núcleos e maior potência nos chips, o consumo dos racks do nosso data center aumentou. Nós operamos racks de resfriamento a ar a aproximadamente 30 kW. Podemos executar o resfriamento líquido direto no chip a cerca de 60 kW por rack, e as novas máquinas resfriadas por imersão funcionam a cerca de 100 kW por rack".
Demonstrando os benefícios de desempenho da imersão
"Há cerca de dois anos, implantamos primeiro o resfriamento por imersão em nosso cluster de computação de alto desempenho em um data center da Shell em Amsterdã", diz Baldwin. "Ambos usam fluidos de resfriamento por imersão da Shell, mas nossa instalação mais recente em Houston é consideravelmente maior e também se beneficia de soluções de gerenciamento de energia inteligente e de energia renovável fornecidas pela Shell Energy." A Shell Lubricants é pioneira na nova fronteira de fluidos de resfriamento por imersão para data centers e, juntamente com a Shell Energy, está utilizando essas implantações para demonstrar soluções totalmente integradas, otimizadas e dimensionáveis adequadas para Computação de alto desempenho de nível empresarial. "Na Shell, nossos negócios estão enfrentando muitos dos mesmos desafios dos nossos clientes com nossas próprias necessidades de hospedagem de dados e energia", diz van de Rijt. "Isso nos coloca em uma posição única para ajudar as empresas líderes no setor de tecnologia e outros setores, por meio do conhecimento em primeira mão de produtos e serviços que acreditamos serem fundamentais para atender às suas metas de negócios e sustentabilidade."
Embora a potência geral por rack tenha aumentado, a densidade do núcleo dos processadores AMD EPYC significa que é uma solução muito mais eficiente do que o resfriamento a ar, pois tem uma área de ocupação de data center que deve ser espalhada espacialmente para atingir o mesmo desempenho. "Quanto maior a área ocupada, mais difícil é gerenciar o ar no data center", diz Baldwin. "Isso resulta na formação de pontos de aquecimento. Há também os desafios de rede. Ao espaçar todos os computadores, são necessários mais cabeamento de fibra óptica, o que é extremamente caro. O resfriamento por imersão nos permite consolidar mais nós em um espaço menor de densidade de energia".
"Como operadores de data center, acreditamos que o resfriamento por imersão seja o futuro", diz Baldwin. "A Penguin Solutions tem sido fundamental para nos ajudar a reunir as tecnologias certas para cumprir as metas comerciais e de sustentabilidade da Shell IT, juntamente com a AMD. O preço, o desempenho e a largura de banda de memória das CPUs com AMD EPYC são perfeitos para nossas necessidades. Eles são de classe mundial."

Sobre o cliente
A Shell plc é uma empresa internacional de energia com experiência na exploração, produção, refinação e comercialização de petróleo e gás natural, e na fabricação e comercialização de produtos químicos, com mais de 90.000 funcionários em mais de 70 países. A empresa usa tecnologias avançadas e adota uma abordagem inovadora para ajudar a construir um futuro sustentável para a energia. Para obter mais informações, visite shell.com.
Perfil do estudo de caso
- Setor:
Energia - Desafios:
oferecer resfriamento eficiente e eficaz para suportar o melhor desempenho da categoria para as necessidades de Computação de alto desempenho da Shell IT à medida que o consumo de energia da CPU aumenta - Solução:
implantar os processadores AMD EPYC™ da 4ª geração com resfriamento por imersão monofásico - Resultados:
aumento do desempenho enquanto apoia os objetivos de negócios em TI e sustentabilidade da Shell - Resumo da tecnologia AMD:
CPUs AMD EPYC™ de 4ª geração - Parceiro de tecnologia: