TSMC 採用 AMD 技術實現半導體製造擴展
部署第 4 代 AMD EPYC 處理器,用更少的伺服器實現更好的成本效益
台積電 (Taiwan Semiconductor Manufacturing Company, TSMC) 已是全球領先的半導體晶圓代工企業,但這家晶圓代工巨擘還有著更為大膽的擴展計畫。這將需要更強大的運算能力來執行生產、研究、開發和一般 IT 基礎架構。AMD EPYC™ 處理器已在 TSMC 扮演著關鍵角色,但第 4 代 AMD EPYC 處理器進一步提升公司實現成長目標所需的額外能力。
「TSMC 正在迅速擴展。」TSMC 基礎架構與通訊服務部總監 Simon Wang 如此說道。「我們正在擴大全球的製造足跡,並在台灣、日本、德國和美國建造新的晶圓製造廠。這表示我們將需要大量的運算力來處理晶圓廠的生產、研究與開發模擬,以及業務營運。」
在升級的基礎架構方面,TSMC 既想要最大化運算效能,又希望能夠限制耗電量。「當我們評估伺服器和儲存裝置時,我們看重的是每單位耗電的運算效能、佔用的空間和成本。」Wang 如此表示。「我們的工作負載大致分成三類。第一類是自動化晶圓廠生產。第二類則是與 Cadence 和 Synopsys 等電子設計自動化廠商共同合作,進行模擬與設計等研發工作。光罩製作和路徑探尋也需要大量的運算力。我們也在為新一代產品尋找新材料和新技術。第三類是業務營運,也就是訂單處理、人力資源和法務等支援單位。」

全面提升 TSMC 三種工作負載類型的能力
Wang 表示:「我們大多數的晶圓廠自動化都是以處理器為基礎,並使用 Linux 平台搭配虛擬機器或 Kubernetes。這需要大量儲存空間支援。在研發方面,我們使用配備顯示卡的處理器。在第三類業務營運中,其數量相較於其他兩類較為有限,因為這些系統是由我們的支援單位所使用,而且大部分都是使用處理器伺服器。」
雖然 TSMC 是 AMD EPYC 處理器系列的製造合作夥伴,但由於內部規定,Wang 對即將推出的 AMD 產品沒有特別了解,不過他對於前幾代產品的使用體驗給予正面評價。雖然已經從 AMD 的台灣區經理這邊得知了發展藍圖,但 Wang 仍需要確保新一代產品能滿足 TSMC 的要求。他表示:「IT 部門有額外的責任,必須證明我們的產品是十分優秀的。我想要證明,TSMC 所製造的最新 AMD 處理器在較低耗電量的效能表現比上一代更好。」
「IT 部門先根據工作負載訂出我們要的配置。」Wang 這樣說道。「我們訂下了處理器、時脈頻率、記憶體和固態硬碟 (SSD) 的規格。我們每年都會訂出五到七種模型,並將這些模型傳送給廠商,請他們提供意見回饋。這是一個公開招標的過程,我們會在這個過程中決定最終廠商。我們不受限於特定廠商。最終廠商都是根據價格、效能和能效來決定的。」

採用 AMD EPYC 處理器代表更好的成本效益
Wang 表示:「在佈建第 4 代 AMD EPYC 時,我們認為有兩種選擇:較多核心的單插槽處理器,或每個處理器核心數比較少,但總核心數相同的雙插槽處理器。我們評估這兩種配置的成本效益。原本我們以為核心數較少的雙插槽處理器會比較好,但實際上有著更多核心的單插槽處理器卻表現得更好。」
「在效能測試方面,我們使用的是市面上通用的工具。」Wang 如此說道。「除了這些工具外,我們也會使用模擬生產環境,來瞭解工作負載的效能以及反應時間。這件事情,我們也會在晶圓生產廠和研發設計中心進行測試。除了測試效能與耗電量之外,我們也會測試伺服器的可操作性,包括自動佈建,所以這點我們會與廠商合作進行。」
「與上一代相比,我們發現第 4 代 AMD EPYC 處理器的成本效益提升超過 30%。」Wang 如此表示。「晶圓廠生產和自動化的移轉作業非常容易。IT 部門也能順利轉移。我們唯一花費較多時間的是光罩製作的研發工作,因為這個製程需要非常高的精準度,但是最後,AMD 處理器獲得了團隊的一致認證。」
Wang 表示:「今年一月,我們查看了去年購買的處理器總數和今年的計畫。我們發現,藉由部署第 4 代 AMD EPYC 處理器,我們不但可以減少伺服器的購買數量,還可以將運算效能提高 30% 到 40%。因此,移轉這件事情是勢在必行。」每一部伺服器的效能提升,也代表 TSMC 資料中心能以更少的空間來提供相同效能。

更優異的效能、更低的成本、更低的耗電
由於伺服器密度的關係,耗電量也因此降低。「每瓦耗電量的運算效能增加了 10% 至 20%。」Wang 這樣說道。「每個處理器有更多的核心數,且支援更多記憶體,是 AMD 處理器的最佳特點。每插槽的成本效益也比較好。在核心數量相同的條件下,我們發現一個插槽的效能提升將近 10%,而且成本更低。根據我們的經驗,在使用第 4 代 AMD EPYC 處理器時,能效提高了 30% 以上。在最先進的 TSMC 晶圓廠中,目前有超過 90% 的工作負載採用了第 4 代 AMD EPYC 處理器。TSMC IT 部門現在在我們的三種工作負載領域中,已有將近 20,000 台採用 AMD EPYC 處理器的伺服器,其中 6,600 台已採用第 4 代 AMD EPYC 處理器。」
TSMC 針對其 Kubernetes 一般工作節點使用第 4 代 AMD EPYC 9124 和 9354P 處理器,Kubernetes 資料庫節點使用的是 9254,Cassandra 節點則使用 9254 或 9454P。Wang 表示:「我們將繼續在資料中心部署 AMD 處理器,因為根據我們過往的經驗,AMD 處理器在成本、效能和每瓦運算力等方面都表現更好。我們目前購買的 X86 伺服器中,有超過 90% 採用第 4 代 AMD EPYC 處理器。我們會密切關注 AMD 的新一代產品。」
Wang 表示:「一直以來,TSMC IT 部門的政策就是使用最新產品來提升強化資料中心的效能。因為核心密度與支援大量記憶體,AMD 產品十分適合雲端原生環境。它非常適合多租戶與多工環境。而且成本也不高。」
Wang 總結道:「我們與 AMD 的合作關係非常順利。這些產品非常符合我們的效能與成本需求。我們正引頸期待 AMD 最新的顯示卡,包括速度更快、效能更高的 Instinct MI300X。到時我們就能將 AMD 技術部署到更多工作負載上。」

關於客戶
TSMC 創立於 1987 年,開創了純晶圓代工的商業模式,並且迄今一直都是全球領先的專業半導體晶圓代工企業。TSMC 以領先業界的製程技術與設計實現解決方案產品組合,支援全球客戶與合作夥伴蓬勃發展的生態系統,為全球半導體產業釋放創新能量。TSMC 的全球營運範圍涵蓋亞洲、歐洲和北美,致力成為負責任的全球性企業公民。TSMC 藉由提供最廣泛的專業和先進封裝技術服務,在 2023 年部署了 288 種獨特製程技術,為 528 位客戶製造了 11,895 樣產品。公司總部位於台灣新竹。更多資訊,請造訪 tsmc.com。
