針對機器學習與人工智慧推出全球首款7奈米製程高效能GPU

展示全球首款基於「Zen 2」處理器核心並採用突破性Chiplet設計的

高效能7奈米製程x86 CPU

AMD EPYC處理器方案為亞馬遜雲端運算服務廣受歡迎的Instance系列採用

台北

AMD(NASDAQ: AMD)在舊金山登場的Next Horizon大會上揭示即將推出的7奈米製程運算與繪圖產品陣容,旨在擴充現代資料中心效能,全面展現其對資料中心運算創新的承諾與決心。AMD在會中分享即將問市的「Zen 2」處理器核心基礎架構的全新細節,介紹採用chiplet的革命性x86 CPU設計,並宣佈推出7奈米製程AMD Radeon Instinct™ MI60繪圖加速器,以及首度公開展示代號為「Rome」的新一代7奈米製程EPYC™伺服器處理器。此外,全球最全面與廣受採用的雲端平台亞馬遜雲端運算服務(Amazon Web Services;AWS)在活動上宣佈在其廣受歡迎的Amazon Elastic Compute Cloud(EC2)上推出3款基於AMD EPYC™處理器的實例(Instance)。

AMD總裁暨執行長蘇姿丰博士表示,AMD在資料中心硬體與軟體藍圖投入多年,致力推動雲端、企業與高效能運算客戶採用AMD CPU與GPU。在接下來的季度,我們將推出業界最廣泛、最強大的資料中心CPU與GPU陣容,採用領先業界的7奈米製程技術,我們將加速推動AMD在資料中心的發展動能。

AMD運算架構更新

AMD首度揭示即將推出的「Zen 2」高效能x86處理器核心,透過革命性的模組化設計方法開發。這種模組化系統設計採用強化版本的AMD Infinity Fabric互連技術,連結單一處理器封裝內的各個獨立矽晶片(「chiplet」)。這種多晶片處理器的「Zen 2」CPU核心採用7奈米製程技術打造,除了受益於先進製程技術,還能運用成熟的14奈米製程技術打造晶片的輸入/輸出部分,從而大幅提升效能,在相同功耗下嵌入更多CPU核心,達到比傳統單片式晶片設計更具成本效率的製造模式。

這項突破性的設計方法與台積電尖端的7奈米製程技術結合,「Zen 2」在效能、功耗以及密度方面帶來顯著的改進,協助降低資料中心的營運成本、碳足跡以及散熱需求。「Zen」核心屢獲殊榮,其他跨世代的提升包括:

  • 更優良的執行管線,更有效率地將資料傳送到各個運算引擎。
  • 前端方面的進步:改良分支預測器,更好的指令預取,重新優化的指令快取以及容量更大的運算快取。
  • 浮點運算的改進:浮點運算寬度加倍至256位元,載入/儲存頻寬加倍,提高分派(dispatch)/回收(retire)頻寬,所有模式都能夠保持高吞吐量。
  • 領先的安全防護:硬體強化的Spectre漏洞修復,採用軟體遷移並將其強化到設計中,並提高記憶體加密的靈活性。

AMD現正研發多款7奈米製程產品,其中包括在此次活動介紹與展示的新一代AMD EPYC CPU以及AMD Radeon Instinct GPU。此外,AMD還透露後續採用7nm+製程的「Zen 3」以及「Zen 4」x86核心架構也都按計畫進行。

AMD EPYC伺服器CPU更新

AMD現行的EPYC處理器維持強勁動能,AWS運算服務副總裁Matt Garman在此次活動中宣佈在Amazon EC2推出首款基於AMD EPYC處理器的Instance。AWS Instance系列中廣受歡迎的方案搭載新款AMD EPYC處理器,擁有領先業界的核心密度與記憶體頻寬,為通用型與記憶體優化工作負載提供優異的每元效能。針對網路與應用程式伺服器、企業應用程式的後端伺服器、開發與測試環境,AMD EPYC處理器優異的核心密度透過無縫移植的應用程式,為M5a與T3a客戶提供運算、記憶體與網路資源。對於R5a客戶,AMD EPYC處理器在記憶體頻寬方面的優勢,極適合用來執行內存運算、資料探勘以及動態資料處理等作業。

AMD另外還揭露了代號為「Rome」的新一代EPYC處理器細節以及預覽其運行效能:

  • 處理器的強化包括多達64個「Zen 2」核心,增加每週期處理的指令1,以及領先的運算、I/O和記憶體頻寬2
  • 平台方面的強化包括業界首款支援PCIe 4.0的x86伺服器處理器,每通道配置加倍的頻寬3,大幅提升資料中心加速器的效能。
  • 與現行的AMD EPYC處理器相比,每插槽的運算效能加倍4,每個插槽的浮點運算效能則為目前的4倍5
  • 與目前AMD EPYC伺服器平台維持插槽相容。

AMD在會中進行兩場展示,展現新一代EPYC處理器的效能以及平台優勢:

  • 新一代單插槽AMD EPYC處理器的試產晶片,效能超越搭載兩顆英特爾Xeon處理器的頂規市售伺服器,比較依據是採用密集運算的業界標準「C-Ray」量測程式6
  • 展示業界首款x86 PCIe 4.0平台,利用一顆Radeon Instinct MI60處理器加快影像辨識。

代號為「Rome」的新一代處理器現已向客戶送樣,預計將成為全球首款高效能x86 7奈米製程CPU。

AMD資料中心繪圖方案更新

AMD推出全球首顆7奈米製程GPU以及業界唯一硬體虛擬化的GPU,AMD Radeon Instinct MI60以及MI50,預計在本季向客戶出貨。這些全新繪圖卡採用高效能、高靈活性的「Vega」基礎架構,專為機器學習與人工智慧(AI)量身設計,為資料中心部署提供更佳的浮點運算效能7、效率8與嶄新功能9。會中展示了旗艦款AMD Radeon Instinct MI60運行即時訓練、推導以及影像分類等處理作業。

除了發表全新硬體產品,AMD還宣佈推出ROCm 2.0,針對加速運算打造的新版開放軟體平台包含全新數學函式庫、支援更多軟體框架以及優化的深度學習處理作業。ROCm 2.0拓展至各個Linux核心發行版,讓ROCm版圖涵蓋數百萬Linux開發者與使用者。專為擴充設計的ROCm讓客戶能在開放環境中部署高效能且節能的異質化運算系統。

活動簡報可參考官網,完整版影片將於線上維持一年。

相關資源

關於AMD

49年來,AMD(NASDAQ:AMD)推動創新高效能運算、繪圖及視覺技術,建構遊戲、高臨場感平台與資料中心等重要領域。全球數以百萬的消費者、世界500強企業以及尖端科學研究機構皆仰賴AMD的技術來改善生活、工作及娛樂。AMD全球員工致力於研發卓越的產品,不斷突破技術的極限。欲瞭解AMD如何成就今天,啟發未來,請瀏覽AMD網站部落格FacebookTwitter


©2018年,AMD公司版權所有。AMDAMD箭頭、EPYCRadeon及上述名稱的組合是AMD公司的商標。其他名稱只為提供資訊的目的,也可能是各自所有者的商標。

免責聲明

新聞稿中涉及美商超微半導體(「AMD」或「公司」)的前瞻性陳述,其中包括特色、功能、供貨、產品時序、以及AMD預期透過「Zen 2」、「Zen 3」、「Zen 4 」、「Rome」、AMD Radeon Instinct™ MI60、MI50加速器和ROCm 2.0開放軟體平台;AMD致力推動雲端、企業與高效能運算客戶採用AMD CPU與GPU;在未來幾個季度AMD推出的業界最廣泛、最強大的資料中心陣容;和採用AMD EPYCTM處理器的亞馬遜雲端運算服務、M5a與T3a實例所獲得的益處,這些事項都依循1995年私人證券訴訟法修正條文的安全港免責條款。這些前瞻性聲明含有像「將會」、「打算」、「相信」、「預計」、「可能」、「應該」、「尋求」、「預備」、「預期」、「預料」,或這些詞和短語的否定詞,以及其他和這些詞語和短語相似的詞彙。投資者應注意本文件中的前瞻性陳述僅根據本文公佈當時的見解、假設以及預期,僅反映本檔發布時的情況,且涉及到許多風險與不確定因素,可能會導致實際結果與預期存在重大差異;此聲明依照特定已知或未知的風險與不確定因素,其難以預期且不在AMD的控制範圍,可能會導致實際結果和未來事件與表示、暗示、預期的前瞻性資訊和聲明存在重大差異。重大因素可能會導致實際結果與預期存在差異,包含甚至不排除以下情況:Intel公司支配微處理器市場,其侵略性經營手段可能限制AMD與之效率競爭的能力;AMD和GLOBALFOUNDRIES公司(GF)達成晶圓供應協定(WSA),購買我們所有的微處理器和APU產品要求,以及其GPU產品要求的一定部分,僅有限定例外;倘若GF無法滿足生產方面的各項要求,可能對AMD業務產生負面影響;AMD目前依賴協力廠商製造產品,如果這些廠商無法及時足量交貨,或是使用競爭對手的技術,AMD的業務可能遭受嚴重的負面衝擊;AMD的產品無法達到預期的生產良率,可能對營收產生負面影響;其業務推動的成功,有賴於AMD能及時推出產品,且產品的功能與效能水準須能為顧客帶來價值,支援及協助大幅度的產業轉型;若AMD無法獲得足夠的營收與現金流,或取得外部資金挹注,可能面臨現金短缺以及無法進行所有規劃進行的投資,推動研究開發或其他策略性投資;流失大量的客戶可能帶來嚴重的負面衝擊。AMD從其半客製化SoC產品獲得利潤的能力,仰賴於設計在協力廠商產品的技術以及這些產品的成功;AMD產品可能會面臨可能對AMD造成重大不利影響的安全漏洞;數據洩露和網絡攻擊可能會損害AMD的知識產權或其他敏感訊息,對其業務和聲譽進行補救並造成重大損失;AMD的經營業績受到季度和季度銷售模式的影響;全球經濟局勢的不確定性,可能對AMD的業務與營運結果產生不利的衝擊;AMD可能無法收入足夠的現金來償還債務或因應營運資金的需求;AMD的債務可能對其財務狀況產生不利影響,使其無法執行其策略或履行合約義務;規範AMD公司債及有擔保循環信貸額度的協議,對AMD產生許多限制,可能對其經營業務產生負面影響;AMD產品銷售的市場競爭激烈;AMD發行West Coast Hitech L.P.公司認股權證以購買7,500萬股普通股,如果行使時將削弱其現有股東的所有權權益,及2026年轉換的2.125%可轉換優先債可能稀釋其現有股東的所有者權益,否則可能會降低其普通股的價格。涉及AMD產品的訂購與出貨的不確定因素,可能產生嚴重的負面影響;AMD產品的需求有賴於銷售目標產業的市場景氣。AMD產品需求的波動或這些產業市場衰退,都會對營運結果產生嚴重的負面衝擊;AMD設計新產品還有產品及時問市的能力,有賴於協力廠商業者的智產;AMD依賴協力廠商企業協助自己設計、製造、以及供應主機板、軟體、以及其他電腦平台零組件來支持其事業;若AMD失去微軟對其產品的支持,或是其他軟體廠商不為AMD的產品設計與開發軟體,AMD銷售產品的能力就會受到嚴重的負面影響;AMD對協力廠商經銷商與擴充卡(AIB)夥伴的依賴,使自己承擔一定的風險。呼籲投資者詳閱公司呈交美國證管會各項財報中提及的風險與不確定因素,其中包括但不限於AMD於2018年9月29日提出的Form 10-Q季報。

新聞聯絡人:

美商超微半導體

高惠如 Robyn Kao

Tel:2655-8885 EXT.23352

Email:Robyn.Kao@amd.com

世紀奧美公關

廖承運 Anthony Liao / 黎淑玲 Jannie Lai

Tel:2577-2100 EXT.806 / 819

Email:AnthonyCY.Liao@eraogilvy.com 

   JannieSL.Lai@eraogilvy.com     

註解

註1:每個週期(IPC)指令的預估增加是基於AMD對微基準測試中Zen 2」的內部測試,測量值為4.53 IPC使用組合浮點和整數,與先前的「Zen 1」生成CPU(在3.5 IPC為DKERN + RSA測量)相比,DKERN + RSA為基準。

註2: NAP-42 - AMD EPYC™ 7601處理器支持多達8個通道的DDR4-2667,而Xeon Platinum 8180處理器則支持6個通道的DDR4-2667。NAP-43 - AMD EPYC 7601處理器包含多達32個CPU內核,而Xeon Platinum 8180處理器包含28個CPU內核。

註3:Per Silicon Labs的PCIe Gen 4為解決方案的提供商。(網址:https://www.silabs.com/community/blog.entry.html/2015/12/04/what_is_pcie_gen4a-oobp)PCIe Gen4是一種新的標準化數據傳輸總線,它將先前Gen3版本的每個通道數據傳輸速率從8.0 GT / s(千兆傳輸/秒)加倍到16.0 GT / s。 這意味著單個PCIe Gen4互連將允許高達2GB / s(千兆字節/秒)的數據速率傳輸,並且用於圖形卡和高端固態驅動器的完整16插槽PCIe Gen4互連將允許數據傳輸速率達到 到32GB / s。

註4:截至2018年10月,AMD工程部使用AMD參考系統和預生產的Rome」工程樣品進行測試,與「Naples」系統相比,「Rome」得分高出約2倍。

註5:根據「Zen 2」的AMD內部設計規格與「Zen 1」相比,預估的代數增加。「Zen 2」比「Zen 1」的核心密度高出2倍。並且當在每個核心上乘以2X峰值FLOP時,在相同頻率下,吞吐量的FLOP為4倍。

註6:截至2018年11月6日,在AMDEthanol」參考系統(2018年10月)基於AMD內部測試的估計基於AMD EPYC™的系統採用AMD「Rome」 開發機箱配置,配備一台新一代AMD EPYC的Ethanol X開發板(「Rome」)處理器,XXXXX共有XXXXX DIMM; 與基於Intel的系統配置Supermicro的SYS-1029U-TRTP;OS:Ubuntu 7.3.0-27ubuntu1~18.04;Linux:4.15.0-36-generic;編譯器:GCC 7.3.0,帶2x Intel(R)Xeon(R)Platinum 8180M CPU, 24x32GB,2666兆赫。AMD「Rome」1P服務器~      秒完成C-Ray演示,Intel 8180M在~      秒完成基準測試。AMD出於保密目的對基準測試數據進行了編輯,發布後將全面披露。

註7:在2018年10月22日。文中提及結果是根據Radeon Instinct MI60這顆採用Vega 7奈米FinFET製程的晶片擁有29.5 TFLOPS半精度(FP16)、14.8 TFLOPS 單精度(FP32)、以及7.4 TFLOPS 倍精度(FP64)尖理論浮點運算效能。如此卓越的效能是透過在比前一代MI25 GPU產品還要小且底面積僅有331.46mm2的晶粒內嵌入132億個電晶體,而且功耗還維持在300瓦以內。

文中結果的計算是在Radeon Instinct MI50,這顆採用Vega 7奈米FinFET製程技術的晶片提供26.8 TFLOPS 尖峰半精度(FP16)、13.4 TFLOP

尖峰單精度(FP32)、以及6.7 TFLOPS尖峰倍精度(FP64)浮點運算效能。如此卓越的效能是透過在比前一代MI25 GPU產品還要小且底面積僅有331.46mm2的晶粒內嵌入132億個電晶體,而且功耗還維持在300瓦以內。

文中結果的計算是採用Radeon Instinct MI25,這顆採用「Vega10」架構的晶片提供24.6 TFLOPS 尖峰半精度(FP16)、12.3 TFLOPS尖峰單精度(FP32)、以及768 GFLOPS尖峰倍精度(FP64)浮點運算效能。如此卓越的效能源自於在底面積僅494.8mm2的晶粒內嵌入125億個電晶體,而且功耗還維持在300瓦以內。

AMD TFLOPS的計算是根據以下公式,對Radeon Instinct MI25、MI50、以及MI60 GPUs進行計算: FLOPS的計算是將引擎時脈最高DPM狀態乘以每個GPU內含的xx個CU單元。之後再將結果乘以每個CU單元含有的xx個串流處理器。接著再把結果乘以FP32每個時脈2 FLOPS,以及FP16每個時脈乘以4 FLOPS。在對Vega 7奈米產品MI50與MI60的FP64 TFLOPS速率時,採用1/2的運算速率,而「Vega 10」架構的MI25則採用1/16的速率。

針對MI50與MI60 GPU的TFLOP計算,詳情可參閱 https://www.amd.com/en/products/professional-graphics/instinct-mi50 以及https://www.amd.com/en/products/professional-graphics/instinct-mi60

運算速度/瓦

 

MI25

MI50

MI60

FP16

0.082

0.089

0.098

FP32

0.041

0.045

0.049

FP64

0.003

0.022

0.025

業界支援文件/網頁:

http://www.tsmc.com/english/dedicatedFoundry/technology/7nm.htm

https://www.globalfoundries.com/sites/default/files/product-briefs/product-brief-7lp-7nm-finfet-technology.pdf

AMD並未獨立測試或驗證外部/第三方機構的結果/資料,因此對於其中疏失或遺漏概不承擔責任。

註8:Radeon Instinct™ MI60包含132.2億個晶體管,封裝尺寸為331.46mm2,而上一代Radeon Instinct™ MI25封裝尺寸為494.8mm2,有125億個晶體管 — 每mm2晶體管數量增加58%。