Shell, 휴스턴 데이터 센터에서 배출량 감소로 HPC 용량 증대

데이터 센터는 공급망을 연결하고, 협업과 혁신을 가능하게 하며, 정보 보안을 유지하고, 사회와 경제가 지속적으로 작동하도록 하는 데 중요한 역할을 합니다.

한편 AI, 머신 러닝, 사물 인터넷 등 데이터 집약적인 기술 사용으로 인해 서버 공간 수요가 기하급수적으로 증가하고 있으며, 오늘날의 데이터 센터에 대한 수요가 점점 더 증가하고 있습니다.
에너지 사용자 및 공급자인 Shell plc(Shell Group)는 이러한 문제를 직접 해결하고 있습니다. 자체 데이터 센터를 관리하는 Shell의 정보 기술 조직은 성능이 비용 및 지속 가능성 목표와 균형을 이루어야 한다는 점을 인식하고 있습니다. Shell IT(Shell Information Technology International)는 최근 휴스턴 데이터 센터 내 HPC(고성능 컴퓨팅) 클러스터의 경우 액침 냉각 기술과 결합된 AMD EPYC 프로세서 기반의 Penguin Computing Altus 서버가 시스템 효율성을 혁신하는 동시에 비용 대비 성능을 최적화하는 데 필수적인 장비라는 사실을 확인했습니다.

컴퓨팅 능력에 대한 증가하는 요구 사항 만족

Shell Energy의 기술 및 에너지 부문 지속가능성 파트너십 글로벌 책임자인 Sjors van de Rijt은 말합니다. "Shell Group은 2050년까지 탄소 순배출량 제로 에너지 기업이 되는 것을 목표로 삼았습니다. 저희는 이 여정에서 여러 가지 역할을 합니다. Shell은 에너지 생산자이자 공급자, 에너지 사용자, 그리고 변화를 위한 파트너 등 다양한 역할을 수행하고 있습니다. Shell IT의 HPC 팀은 이러한 모든 활동을 지원하는 데 도움을 주고 있습니다. 석유와 천연가스를 더 효율적으로 탐사하고 생산할 수 있도록 컴퓨팅 시설을 제공하는 것은 Shell IT가 제공하는 중요한 역할 중 하나입니다. 하지만 Shell의 컴퓨팅 요구는 지역 사회를 더욱 안전하고 깨끗하며 스마트한 방식으로 연결할 수 있는 혁신적인 EV(전기차) 충전 솔루션과 같은 다양한 디지털 이니셔티브를 지원하는 방향으로도 확대되고 있습니다."

디지털 솔루션은 Shell 그룹 비즈니스의 핵심 요소이자, 자사와 고객사의 지속 가능성 목표를 실현하는 데 있어 근본적인 촉매 역할을 합니다. Van de Rijt는 말합니다. "기술은 기존 작업을 최적화하고 배기가스 배출을 더욱 정확하게 추적 및 보고할 수 있도록 뒷받침해줌으로써 청정 에너지 시스템의 새로운 가능성을 열어줍니다. 하지만 디지털화는 곧 데이터와 작업 부하의 증가로 이어지며 따라서 더 많은 에너지를 필요하게 됩니다. Shell Energy의 팀은 고객과 협력하여 시스템 성능, 비용 및 탄소 배출량에 미치는 영향을 해결하기 위해 노력하고 있습니다."

David Baldwin, High Performance Computing Manager, Shell IT
David Baldwin, 고성능 컴퓨팅 매니저, Shell IT

Shell IT의 고성능 컴퓨팅 매니저인 David Baldwin은 말합니다. "Shell Group은 데이터, 데이터 스토리지, 분석을 대규모로 활용하며, 이를 기반으로 머신러닝과 AI를 발전시킵니다. Shell은 클라우드 플랫폼, 온프레미스 서비스, 디지털 트윈의 사용자이자 구매자입니다. 또한 Shell Energy를 통해 기술 산업에 에너지 및 효율성 솔루션의 마케팅 활동도 수행하고 있습니다. Shell은 이러한 가치 사슬의 모든 단계에 참여하고 있습니다."

또 Baldwin은 말합니다. "저희는 다양한 응용 분야에서 활동하고 있습니다. 여기에는 지진파 처리, 석유 및 가스 매장량 탐색, 탄소 포집 목표와 같은 업스트림 응용 분야가 포함됩니다. 또한 Shell IT는 컴퓨터 화학, 유체 역학 및 유전 공학에서부터 스마트 그리드, 인공 지능, 기계 학습에 이르기까지 모든 것을 지원합니다. Shell은 이러한 모든 응용 분야에서 성능 및 비용 효율성을 최적화하기 위해 시스템을 미세 조정합니다. 지능적으로 워크로드를 관리하고 컴퓨팅 작업을 보다 고르게 분산하며 활용률을 최대화할 수 있도록 스마트 컨트롤, 가상화 소프트웨어, 인공 지능(AI)을 구현하고 있습니다."

이어서 Baldwin은 말합니다. "저희 회사는 수십 년간 축적된 데이터를 보유하고 있습니다. 이 데이터를 처리하는 과정은 전력 소비 측면에서 상당한 도전 과제를 안고 있으며, 특히 프로세서 칩의 소비 전력이 계속 증가함에 따라 그 어려움이 더욱 커지고 있습니다."

Shell의 휴스턴 데이터 센터는 이미 Shell Energy North America에서 공급하는 100% 재생에너지를 사용하고 있습니다. Shell IT의 HPC 팀이 직면한 과제는 성능을 향상시키면서 동시에 전력 사용 효율(PUE) 비율을 낮추는 방법을 찾는 것입니다. 이러한 이유로, AMD EPYC 프로세서와 액침 냉각 기술이 결합된 Penguin Computing Altus 서버로 업그레이드하게 되었습니다. Penguin Solutions의 최고 기술 책임자 Phil Pokorny는 말합니다. "Penguin은 세계에서 가장 까다로운 워크로드를 처리하는 대규모 HPC 클러스터를 구축하고 운영한 경험이 25년에 달합니다. Penguin의 기술 파트너십 덕분에, 액침 냉각과 같은 신기술과 최신 기술을 통합하는 최전선에 설 수 있습니다."

Immersion cooling tank
액침 냉각 탱크

데이터 센터 냉각 문제 해결

Shell IT와 AMD EPYC 프로세서의 관계는 6년 전으로 거슬러 올라갑니다. Baldwin은 말합니다. "대부분의 애플리케이션이 메모리 대역폭에 제한이 있었고, AMD EPYC 칩이 이 분야에서 우위를 점하고 있었기 때문에 전환했습니다." 이 기간 동안 Shell IT는 기술 파트너인 Penguin Solutions와 함께 협력을 시작했습니다. "Penguin 덕분에 새로운 기술을 먼저 접할 수 있습니다."

Shell IT는 점점 더 전력 소모가 큰 프로세서를 효율적으로 냉각할 방법을 찾기 위해 Penguin과 협력했습니다. Baldwin은 말합니다. "Shell은 CPU에서 매우 높은 메모리 대역폭을 달성하는 것을 목표로 하고 있습니다. 따라서 항상 최상위 등급 프로세서를 선택하거나, 그보다 한 단계 낮은 프로세서를 선택합니다. 지난 6년 동안만 해도 140와트 칩에서 360와트 칩으로 전환했으며 이로 인해 공랭식 냉각으로는 더 이상 충분하지 않은 상황이 되었습니다. 칩에 직접 수랭 방식을 도입했지만 이제는 액침 냉각으로 한 단계 더 나아가야 한다고 생각했습니다. 저희는 성능, 효율성, 지속 가능성 측면에서 가능성의 한계를 계속해서 넓혀가고 있습니다."

Baldwin은 말합니다. "칩에 직접 수랭 방식을 적용하면 주로 CPU에서 발생하는 서버 열의 약 3분의 2를 냉각할 수 있습니다. 나머지 3분의 1은 여전히 비효율적인 공랭식으로 냉각해야 합니다. 메모리와 네트워크는 대역폭이 높아지면서 전력 소모가 증가하고 있습니다. 저장 장치도 고려해야 합니다. 액침 냉각 방식은 공기보다 열을 1,000배 이상 잘 흡수하는 비전도성(유전체) 유체에 모든 것을 담그는 방식으로, 발생하는 모든 열을 처리하는 능력이 획기적으로 향상됩니다."

Servers are immersed in Shell's proprietary dielectric fluid, enabling faster conductivity of heat
서버는 Shell의 독점 유전체액에 잠겨 있어 열 전도율이 더 빠릅니다.

Shell IT는 96코어 4세대 AMD EPYC 9654 CPU를 사용하는 새로운 휴스턴 데이터 센터에 864개의 듀얼 소켓 시스템을 설치하여 총 1,728개의 프로세서와 165,888개의 코어를 보유하고 있습니다. Baldwin은 말합니다. "3세대 AMD 칩에 비해 4세대 AMD 칩의 성능이 한층 더 향상되었습니다. 4세대 칩으로 더 많은 작업을 처리할 수 있게 되었습니다. 코어와 메모리도 더 많아졌으며 더 많은 수익을 낼 수 있었습니다." 그러나 이 때문에 효과적인 냉각이 더욱 절실해졌습니다. "칩의 코어 수와 와트 수가 증가함에 따라 데이터 센터의 랙 전력 사용량도 함께 늘었습니다. Shell은 공랭식 랙을 약 30kW로 가동합니다. 칩 직접 수랭 방식은 랙당 약 60kW로 작동하며, 새로운 액침 냉각 시스템은 랙당 약 100kW로 작동합니다."

액침 냉각의 성능상 이점 소개

Baldwin은 말합니다. "약 2년 전에 먼저 암스테르담에 있는 Shell 데이터 센터에 고성능 컴퓨팅 클러스터를 위한 액침 냉각 시스템을 구축했습니다. 두 곳 모두 Shell 액침 냉각 유체를 사용하지만, 휴스턴에 최근 설치한 시스템은 규모가 훨씬 더 크며, Shell Energy가 제공하는 재생 가능 전력 및 스마트 에너지 관리 솔루션의 이점도 활용하고 있습니다." Shell Lubricants는 데이터 센터용 액침 냉각 유체 분야의 새로운 지평을 개척하고 있으며, Shell Energy와 함께 이러한 구축 사례를 활용해 기업 수준의 HPC에 적합한 완전 통합되고 최적화된 확장형 솔루션을 선보이고 있습니다. Van de Rijt는 말합니다. "Shell의 비즈니스는 고객과 동일한 데이터 호스팅 및 에너지 요구 사항에 직면해 있습니다. 이를 통해 Shell은 기술 산업을 비롯한 여러 분야의 선도 기업들을 비즈니스 및 지속 가능성 목표 달성에 도움이 될 제품 및 서비스에 대한 직접적인 지식을 바탕으로 지원할 수 있는 독보적인 입지를 확보하게 되었습니다."

랙당 전체 전력 소모는 증가했지만, AMD EPYC 프로세서의 높은 코어 밀도로 인해 동일한 성능을 내기 위해 공간을 넓게 차지해야 하는 공랭식보다 훨씬 효율적인 솔루션이 되었습니다. Baldwin은 말합니다. "공간이 커질수록 데이터 센터의 실온 관리가 더 어려워집니다. 이는 열점이 발생하고 네트워킹 문제도 있기 때문입니다. 모든 컴퓨터를 분산 배치하면 매우 비싼 광섬유 케이블이 더 많이 필요하게 됩니다. 액침 냉각을 이용하면 더 작은 전력 밀도 공간에 더 많은 노드를 통합할 수 있습니다."

그리고 Baldwin은 말합니다. "데이터 센터 운영사로서 저희는 액침 냉각이 미래라고 믿습니다. Penguin Solutions는 AMD와 함께 Shell IT의 비즈니스 및 지속 가능성 목표를 달성하기 위해 적합한 기술을 통합하는 데 핵심적인 역할을 해왔습니다. AMD EPYC CPU의 가격, 성능, 메모리 대역폭은 저희의 요구와 완벽하게 일치합니다. 가히 세계적인 수준의 제품입니다.”

Operator manipulating an immersion cooling tank
액침 냉각 탱크를 조작하는 작업자

고객 소개


Shell plc는 70개국 이상에서 90,000명 이상의 직원을 보유한 글로벌 에너지 기업으로, 석유와 천연가스의 탐사, 생산, 정제, 마케팅뿐만 아니라 화학제품의 제조와 마케팅 분야에서도 전문성을 갖추고 있습니다. 이 회사는 첨단 기술을 사용하며, 지속 가능한 에너지 미래를 구축하는 데 도움이 되는 혁신적인 접근 방식을 취하고 있습니다. 자세한 내용은 shell.com에서 확인할 수 있습니다.

사례 연구 프로파일


  • 산업:
    에너지
  • 과제:
    CPU 전력 소비량이 증가함에 따라 Shell IT의 HPC 요구 사항에 맞는 동급 최고의 성능을 지원하기 위해 효율적이고 효과적인 냉각 기능을 제공
  • 솔루션:
    단상 액침 냉각 방식의 4세대 AMD EPYC™ 프로세서 배포
  • 결과:
    Shell IT의 비즈니스 및 지속 가능성 목표를 지원하면서 성능을 향상
  • AMD 기술 요약:
    4세대 AMD EPYC™ CPU
  • 기술 파트너:
Penguin Solutions logo