在 Shell 的休士頓資料中心以更低排放量提升 HPC 處理能力

資料中心連接著供應鏈、實現協作與創新、維護資訊安全性,已日益成為社會與經濟運作的關鍵。

與此同時,資料密集型技術的運用,包括 AI、機器學習和物聯網,卻也造成伺服器空間需求呈現指數型成長,使現代資料中心壓力日增。
同時身為能源使用者和供應者的 Shell plc(Shell 集團),站在第一線面對著這些挑戰。在管理自己的資料中心時,Shell 的資訊科技部門知道必須在效能與成本和永續發展之間取得平衡。就在不久之前,Shell Information Technology International (Shell IT) 發現在休士頓資料中心的高效能運算 (HPC) 叢集中,搭載 AMD EPYC 處理器與浸沒式冷卻技術的 Penguin Computing Altus 伺服器,正是革新系統效率,又能的關鍵。

滿足日益增加的運算能力需求

Shell Energy 永續合作、科技與能源的全球總監 Sjors van de Rijt 表示:「Shell Group 訂定了在 2050 年成為淨零排放能源企業的目標。」「我們在這個旅程中扮演著許多角色。我們在經營活動中既是能源的生產者和供應者,同時也是能源的使用者,更是推動變革的合作夥伴。而我們 Shell IT 的 HPC 團隊就是為這全部活動提供支援,幫助我們達成此目標。提供運算設施讓石油和天然氣的探勘和生產更有效率,是 Shell IT 的重要貢獻之一。但我們也逐漸將運算需求投注於多樣化的數位計畫,例如創新的電動車 (EV) 充電解決方案,能夠以更安全、更乾淨也更智慧化的方式將不同社區的人們串聯在一起。」

數位解決方案是 Shell 集團的其中一項關鍵業務,也是實現其自身與客戶永續發展目標的基礎。van de Rijt 表示:「科技為乾淨的能源系統帶來新的可能性,幫助最佳化既有的營運模式,並讓排放量追蹤和報告都能更準確。」「但數位化同時也代表資料和工作負載增加,這就需要更多能源,也對系統效能、成本和碳足跡產生影響;這些就是我在 Shell Energy 的團隊要與客戶合作解決的問題。」

David Baldwin, High Performance Computing Manager, Shell IT
Shell IT 高效能運算經理,David Baldwin

Shell IT 高效能運算經理 David Baldwin 表示:「為了因應機器學習和 AI 方面的需求,Shell Group 在資料、資料儲存和分析方面,是用量極大的消費者。」「我們是雲端平台、內部部署服務以及數位孿生的使用者與購買者。透過 Shell Energy,我們也對科技業銷售能源和效率解決方案。價值鏈的每一環,都有我們的角色在。」

Baldwin 表示:「我們的應用非常多樣。」「這包括上游應用程式,像是震測處理、探勘石油和天然氣油田,以及碳捕捉目標。Shell IT 也廣泛支援一切,從運算化學、流體力學和儲油層工程,乃至於智慧電網、AI 和機器學習無所不包。在這全部應用當中,我們都會微調系統以最佳化效能和成本效益。我們會實現智慧控制、虛擬化軟體及人工智慧 (AI),以協助智慧管理工作負載,將運算工作平均分散並最佳化使用率。」

「公司擁有數十年下來累積的資料。要處理這些資料是可觀的耗電量挑戰,尤其是當處理器晶片用電持續增加。」Baldwin 繼續表示。

Shell 在休士頓的資料中心已經取用 Shell Energy North America 所提供的 100% 可再生能源。Shell IT 的 HPC 團隊所面對的挑戰,是該如何壓低其電力使用效率 (PUE) 比率,同時仍提升效能。於是公司下定決心,升級成搭載了 AMD EPYC 處理器,並採用浸沒式冷卻技術的 Penguin Computing Altus 伺服器。Penguin Solutions 技術長 Phil Pokorny 表示:「Penguin 打造和部署大型 HPC 叢集已經有 25 年歷史,世界上某些最高要求的工作負載就是由這些叢集執行。」「我們的技術合作夥伴讓我們能站在最前線,將全新和新興技術整合,像是浸沒式冷卻。」

Immersion cooling tank
浸沒式冷卻槽

解決資料中心冷卻問題

Shell IT 與 AMD EPYC 處理器的關係可追溯至六年前。Baldwin 表示:「我們因為大部分的應用程式都受到記憶體頻寬限制所以決定要設備翻新,而 AMD EPYC 晶片在這方面擁有優勢。」在這段期間,Shell IT 開始與 Penguin Solutions 合作,成為技術合作夥伴。「我們能提早取得 Penguin 的新技術。」

Shell IT 與 Penguin 協力尋找解答,想辦法冷卻用電量越來越大的處理器。Baldwin 表示:「我們想要從處理器得到極高的記憶體頻寬。」「我們一直都只選最高級或僅次一級的處理器產品。光是在過去這六年,我們就已經從 140 瓦的晶片提高到 360 瓦。到這個地步,氣冷就已經不再足夠。我們已實現晶片直接液冷,但我們覺得有必要再踏出一步到浸沒式冷卻。我們持續開拓效能、效率和永續性的極限。」

Baldwin 表示:「使用晶片直接液冷的時候,可處理伺服器大約三分之二的廢熱,主要是來自處理器。」「但還有剩下三分之一要靠氣冷,這樣效率不夠。頻寬越高,記憶體和網路耗電也都越高。當然還有儲存裝置。有了浸沒式冷卻,就能全部浸沒在絕緣(介電)液體,它的吸熱能力比空氣高一千倍,所以能大幅改善系統處理這些廢熱的能力。」

Servers are immersed in Shell's proprietary dielectric fluid, enabling faster conductivity of heat
伺服器浸沒於 Shell 獨家的介電液,讓熱傳導更快速

Shell IT 已經在新的休士頓資料中心安裝 864 組雙插槽系統,使用 96 核心的第 4 代 AMD EPYC 9654 處理器,總計共達 1,728 個處理器和 165,888 個核心。Baldwin 表示:我們從第 4 代 AMD 晶片中看到了遠勝第 3 代的驚人改變。」「實力更加強大。我們獲得了更多核心和更多記憶體。我們成功設法讓成本投資獲得了更高的效益。」但這也凸顯出對於有效冷卻的需求。「因為我們增加核心數,晶片瓦數也提高,這導致資料中心機架耗電也水漲船高。我們的氣冷式機架大約可運轉到 30 kW。晶片直接液冷每個機架可跑到大約 60 kW,而新的浸沒式冷卻則每個機架約 100 kW。」

展現浸沒式冷卻的效益

Baldwin 表示:「大約兩年前,我們在阿姆斯特丹的 Shell 資料中心高效能運算叢集首次部署浸沒式冷卻。」「兩邊用的都是浸沒式冷卻液,但我們在休士頓最新安裝的尺寸大很多,並且受惠於 Shell Energy 所提供的可再生能源和智慧能源管理解決方案。」Shell Lubricants 是資料中心浸沒式冷卻液這個尖端領域的先驅,與 Shell Energy 一同運用這些部署來展現完全整合式、最佳化且可擴充的企業級 HPC 解決方案。van de Rijt 表示:「我們 Shell 集團旗下公司在自己的資料伺服器和能源需求方面所面對的許多挑戰,都和我們的客戶相同。」「這讓我們佔據了得天獨厚的優勢,能透過我們對於產品和服務的第一手知識,來幫助科技業的領導大廠及其他合作夥伴;我們相信這些都會成為他們實現商業與永續發展目標的關鍵。」

雖然每機架的整體用電增加,但 AMD EPYC 處理器的核心密度讓它成為比氣冷更有效率的解決方案,不需要分散佔用大量資料中心空間即可達到相同效能。Baldwin 表示:「佔用的空間越大,就越難管理資料中心的氣流。」「結果就會出現熱點。然後還有網路連線上的挑戰。如果所有電腦都分散開來,就需要更多光纖纜線,而這非常昂貴。浸沒式冷卻讓我們能將較多節點合併於較小的高用電密度空間。」

Baldwin 表示:「身為一個資料中心經營者,我們相信浸沒式冷卻就是未來。」「Penguin Solutions 扮演了關鍵角色,協助我們整合對的技術,來實現 Shell IT 的商業和永續發展目標,而 AMD 也是居功厥偉。AMD EPYC 處理器的價格、效能和記憶體頻寬最符合我們的需求。他們是世界級的公司。」

Operator manipulating an immersion cooling tank
人員操作浸沒式冷卻槽

關於客戶


Shell plc 是一家國際能源公司,擁有石油與天然氣的探勘、生產、精煉與行銷,以及化學製品製造與行銷的專業,逾 90,000 名員工,服務超過 70 個國家/地區。Shell 運用先進技術,並以創新取徑協助打造可永續發展的能源未來。如需更多資訊,請造訪 shell.com

案例研究檔案


  • 產業:
    能源
  • 挑戰
    提供有效率且有效的冷卻技術,在處理器耗電量日益增加之際,為 Shell IT 的 HPC 需求支援同類最佳效能
  • 解決方案:
    部署第 4 代 AMD EPYC™ 處理器並使用單相浸沒式冷卻
  • 成果:
    提升效能,同時支援 Shell IT 的業務與永續發展目標
  • AMD 技術概覽:
    第 4 代 AMD EPYC™ 處理器
  • 技術合作夥伴:
Penguin Solutions logo