Press Image

AMD Instinct MI200系列加速器採用全新AMD CDNA™ 2架構,與對手的資料中心加速器相比,在HPC效能方面提供極具突破性的4.9倍提升註1,加速科學研發

AMD Instinct MI200系列加速器為首款多晶片(multi-die)GPU,率先支援128GB的HBM2e記憶體,為科學基礎的關鍵應用提供大幅效能提升

台北 11/09/2021 -- AMD(NASDAQ: AMD)今日發表全新AMD Instinct™ MI200系列加速器,為首款exascale等級的GPU加速器。AMD Instinct MI200系列加速器中的AMD Instinct™ MI250X為全球最快的高效能運算(HPC)與人工智慧(AI)加速器註1

AMD Instinct MI200系列加速器基於AMD CDNA™ 2架構打造,可為廣泛的HPC工作負載提供領先的應用效能註2。在雙精度(FP64)HPC應用中,AMD Instinct MI250X加速器提供比競爭對手加速器高達4.9倍的效能提升,並為AI工作負載提供超過380 teraflops的半精度(FP16)尖峰理論效能,以強大的效能進一步加速資料導向的研究註1

AMD全球資深副總裁暨資料中心與嵌入式解決方案事業群總經理Forrest Norrod表示,AMD Instinct MI200加速器提供了領先的HPC與AI效能,協助科學家在研究工作中實現跨世代的進展,大幅縮短從最初假設到實際印證的時間。憑藉在架構、封裝以及系統設計方面的關鍵性創新,AMD Instinct MI200系列加速器為有史以來最先進的資料中心GPU,為超級電腦與資料中心挹注卓越效能,以解決全球最複雜的難題。

AMD引領Exascale時代

AMD與美國能源部、橡樹嶺國家實驗室以及HPE聯手設計Frontier超級電腦,預計可提供超過1.5 exaflops的尖峰運算效能。搭載優化的AMD第3代EPYC™ CPU與AMD Instinct MI250X加速器,Frontier將透過大幅提升的AI、分析、大規模模擬效能,推動科學探索的發展,協助科學家完成更多計算、從資料洞悉出新模式,並開發創新的資料分析方法,從而加快科學發現的步伐。

橡樹嶺國家實驗室總監Thomas Zacharia表示,Frontier超級電腦是AMD、HPE以及美國能源部緊密合作的結晶,旨在提供具有exascale等級運算能力的系統,透過大幅提升人工智慧、分析、大規模模擬的效能,推動科學探索的發展。

推動HPC的未來發展

AMD Instinct MI200系列加速器搭配AMD第3代EPYC CPU與ROCm™ 5.0開放軟體平台,旨在推動exascale等級時代的新發現,並解決從氣候變遷到疫苗研究等最迫切的挑戰。

AMD Instinct MI200系列加速器的關鍵功能與特色包括:

  • AMD CDNA™ 2架構-第2代Matrix Cores加速的FP64與FP32矩陣運算,帶來比AMD前一代GPU高達4倍的FP64尖峰理論效能提升註1,3,4
  • 領先的封裝技術-業界首款採用多晶片(multi-die)GPU設計與2.5D Elevated Fanout Bridge技術(EFB),與AMD前一代GPU相比,可提供1.8倍的核心數以及2.7倍的記憶體頻寬,帶來業界最佳的聚合尖峰理論記憶體頻寬,每秒達到3.2 terabytes註4,5,6
  • AMD第3代Infinity Fabric™技術-多達8個Infinity Fabric通道將AMD Instinct MI200與節點中的第3代EPYC CPU和其他GPU連結,實現統一CPU/GPU記憶體的一致性,達到最高的系統吞吐量,藉由加速器的強大效能讓CPU程式碼更簡化。

專為Exascale等級科學研發打造的軟體

AMD ROCm™為開放軟體平台,讓研究人員能發揮AMD Instinct™加速器的強大效能,推動科學探索。ROCm平台基於開放可攜性的基礎,支援各加速器供應商與各種架構環境。AMD藉由ROCm 5.0拓展其開放平台,透過AMD Instinct MI200系列加速器支援頂尖HPC與AI應用,為開發者增進ROCm的可及性,並在關鍵工作負載中提供卓越效能。

藉由AMD Infinity Hub,研究人員、資料科學家和終端使用者可以輕鬆地搜尋、下載並安裝在AMD Instinct加速器和ROCm上優化和支援的容器化HPC應用與機器學習(ML)框架。AMD Infinity Hub目前提供眾多容器,支援Radeon Instinct™ MI50、AMD Instinct™ MI100與AMD Instinct MI200加速器,Chroma、CP2k、LAMMPS、NAMD、OpenMM等多種應用,以及TensorFlow和PyTorch等熱門ML框架。AMD Infinity Hub也持續在增加新容器。

現有的伺服器解決方案

AMD Instinct MI250X和AMD Instinct MI250目前以開放硬體運算加速器模組或OCP加速器模組(OAM)的規格供貨。AMD Instinct MI210將以PCIe®介面卡規格搭載於OEM伺服器。

AMD Instinct MI250X加速器目前搭載於HPE的HPE Cray EX超級電腦,更多AMD Instinct MI200系列加速器預計將從2022年第1季開始搭載於各大OEM與ODM夥伴廠商的企業系統,包括華碩、ATOS、戴爾科技集團、技嘉、HPE、聯想、Penguin Computing以及美超微(Supermicro)。

AMD MI200系列規格

型號

運算單元

串流

處理器

FP64 | FP32 Vector (Peak)

FP64 | FP32 Matrix (Peak)

FP16 | bf16

(Peak)

INT4 | INT8

(Peak)

HBM2e

ECC

記憶體

記憶體頻寬

規格

AMD Instinct MI250x

220

14,080

高達

47.9 TF

高達

95.7 TF

高達

383.0 TF

高達

383.0 TOPS

128GB

3.2

TB/秒

 OCP加速器模組

AMD Instinct MI250

208

13,312

高達

45.3 TF

高達

90.5 TF

高達

362.1 TF

高達

362.1 TOPS

128GB

3.2

TB/秒

 OCP加速器模組

相關資源

關於AMD

50多年來,AMD(NASDAQ:AMD)推動創新高效能運算、繪圖及視覺技術,建構遊戲、高臨場感平台與資料中心等重要領域。全球數以百萬的消費者、世界500強企業以及尖端科學研究機構皆仰賴AMD的技術來改善生活、工作及娛樂。AMD全球員工致力於研發卓越的產品,不斷突破技術的極限。欲瞭解AMD如何成就今天,啟發未來,請瀏覽AMD網站部落格FacebookTwitter

 

©2021年,AMD公司版權所有。AMD、AMD箭頭、AMD CDNA、EPYC、AMD Instinct、Infinity Fabric、Radeon Instinct、ROCm及上述名稱的組合是AMD公司的商標。PyTorch係PyTorch公司的註冊商標。TensorFlow、the TensorFlow及任何相關標誌係Google公司的註冊商標。其他名稱只為提供資訊的目的,並用於標識公司和產品,也可能是各自所有者的商標。更多的測試基準資料可以在AMD.com上找到。

免責聲明

本新聞稿包含有關Advanced Micro Devices, Inc(AMD)的前瞻性陳述,如AMD預估全年營收呈現成長以及多項帶動原因;包括AMD Instinct™ MI200系列加速器在內的AMD產品的特色、功能、效能、上市時間、時程以及預期收益。這些陳述皆基於1995年《私人證券訴訟改革法案》(U.S. Private Securities Litigation Reform Act)的「安全港」(Safe Harbor)條款所訂定出。這些前瞻性聲明含有像「將會」、「可能」、「預期」、「相信」、「計劃」、「打算」、「估計」,或這些字詞和短語的其它類似詞彙。投資者應注意本資料中的前瞻性陳述僅根據本文公佈當時的見解、假設以及預期,僅反映本新聞稿發布時的情況,且涉及到許多風險與不確定因素,可能會導致實際結果與預期存在重大差異。這類陳述受到特定已知與未知風險與不確定因素所影響,其中許多因素難以預測且大多非AMD所能掌控,並可能響應實際結果與其他未來事件和文中陳述有所出入,或是和前瞻性陳述資訊與陳述的暗示或預期狀況有所不同。可能導致實際結果和當前預期有所出入的實質因素包括但不限於:包括Intel公司佔據微處理器市場,及其侵略性經營手段;全球經濟局勢不確定性;失去重要客戶;COVID-19疫情對AMD業務、財務狀況和營運結果的影響;AMD產品鎖定的市場競爭極為競爭;AMD產品銷售行業的市場狀況;半導體產業的周期性;季度和季節性銷售模式;AMD充分保護其技術或其他知識產權的能力;不利的貨幣匯率波動;第三方廠商能及時製造足夠數量AMD的產品、或使用競爭對手的技術;基本設備、材料、載板或製造過程的可用性;達到AMD產品預期製造良率的能力;AMD能及時推出具有預期功能與效能水準的產品;AMD的半客製化SoC產品產生營收的能力;潛在的安全漏洞;潛在的安全事件,包括IT中斷、數據丟失、數據洩露和網絡攻擊;有關AMD產品訂購和發貨的不確定性;AMD依賴第三方廠商知識產權來及時設計和推出新產品;AMD依賴第三方廠商來設計、製造和供應主機板,軟體和其他電腦平台零組件;AMD依賴Microsoft和其他軟體供應商的支持來設計和開發可在AMD產品上運行的軟體;AMD依賴第三方分銷商和外接合作夥伴;修改或中斷AMD內部業務流程和資訊系統的影響;AMD產品與部分或全部行業標準軟體和硬體的兼容性;缺陷產品所產生的有關費用;AMD供應鏈的效率;AMD依靠第三方供應鏈物流功能的能力;AMD有效控制其產品在灰色市場上銷售的能力;政府行動和法規的影響,例如出口管理法規,關稅和貿易保護措施;AMD實現遞延所得稅資產的能力;潛在的稅收負債;當前和將來的索賠和訴訟;環境法律,與衝突礦物有關的規定以及其他法律或法規的影響;併購、合資與/或投資可能對業務產生的影響,包含發布併購賽靈思公司以及整合併購事業的能力;AMD完成收購賽靈思的能力;發布併購賽靈思及其所帶來的不確定性對AMD業務造成的影響;合併公司資產的減值對企業財務狀況與經營成果的影響;管理AMD票據的協議和循環信用額度施加的限制;AMD債務;AMD產生足夠的現金來滿足其營運資金需求的能力或產生足夠的營收和營運現金流以進行其所有計畫的研發或策略性投資的能力;政治,法律,經濟風險和自然災害;商譽和技術許可購買的未來減損;AMD吸引和留住人才的能力;AMD的股價波動以及全球政治條件。呼籲投資者詳閱公司呈交美國證管會各項財報中提及的風險與不確定因素,其中包括但不限於AMD最近的Form 10-K和10-Q報告。

註1:全球最快資料中心GPU是AMD Instinct™ MI250X。計算是由AMD實驗室於2021年9月15日執行,受測的AMD Instinct™ MI250X(128GB HBM2e OAM模組)加速器在1,700 MHz尖峰升頻引擎時脈下測得95.7 TFLOPS尖峰理論倍精度(FP64 Matrix)、47.9 TFLOPS 尖峰理論倍精度(FP64)、95.7 TFLOPS尖峰理論單精度矩陣(FP32 Matrix)、47.9 TFLOPS尖峰理論單精度(FP32)、383.0 TFLOPS尖峰理論半精度(FP16)以及383.0 TFLOPS尖峰理論Bfloat16格式精準度(BF16)浮點運算效能。計算是由AMD效能實驗室於2020年9月18日執行,受測對象為AMD Instinct™ MI100(32GB HBM2 PCIe®介面卡)加速器,1,502 MHz尖峰升壓引擎時脈下測得11.54 TFLOPS尖峰理論倍精度(FP64)、46.1 TFLOPS尖峰理論單精度矩陣(FP32)、23.1 TFLOPS尖峰理論單精度(FP32)、184.6 TFLOPS尖峰理論半精度(FP16)浮點運算效能。公布結果反映NVIDIA Ampere A100 (80GB) GPU加速器在升壓引擎時脈1410 MHz下測得19.5 TFLOPS尖峰倍精度tensor核心(FP64 Tensor Core)、9.7 TFLOPS尖峰倍精度(FP64)、19.5 TFLOPS尖峰單精度(FP32)、78 TFLOPS 尖峰半精度(FP16)、312 TFLOPS尖峰半精度(FP16 Tensor Flow)、39 TFLOPS 尖峰Bfloat 16 (BF16)、312 TFLOPS尖峰Bfloat16格式精度(BF16 Tensor Flow)的理論浮點運算效能。TF32資料格式不是IEEE協會的相容規格,這項比較沒有採用。https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf, 第15頁表格1。MI200-01

註2:AMD Instinct MI250X加速器應用與量測效能的詳細資訊可參閱https://www.amd.com/en/graphics/server-accelerators-benchmarks

註3:計算由AMD效能實驗室於2021年9月15日執行,受測對象為AMD Instinct™ MI250X 加速器(128GB HBM2e OAM模組),1,700 MHz 尖峰升壓引擎時脈,測得95.7 TFLOPS尖峰倍精度矩陣(FP64 Matrix)理論浮點運算效能。公布結果NVIDIA Ampere A100 (80GB) GPU 加速器測得19.5 TFLOPS 尖峰倍精度(FP64 Tensor Core)理論浮點運算效能。上述結果參照官網文件:https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf,第15頁表格1。MI200-02

註4:計算由AMD效能實驗室於2021年9月21日執行,受測對象為AMD Instinct™ MI250X 與MI250 (128GB HBM2e) OAM加速器,採用AMD CDNA™ 2、6奈米FiNFET製程技術進行研發,1,600 MHz尖峰記憶體時脈,配備128GB HBM2e 記憶體容量,3.2768 TFLOPS尖峰理論記憶體頻寬效能。MI250/MI250X記憶體匯流排介面4,096 bits 乘以2個晶片以及記憶體資料傳輸率3.20 Gbps,推算出總記憶體頻寬為3.2768 TB/s ((3.20 Gbps*(4,096 bits*2))/8)。公布的最高量測數據是在NVIDIA Ampere A100 (80GB) SXM GPU加速器上測得,80GB HBM2e記憶體容量,測得2.039 TB/s GPU記憶體頻寬效能。 https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/a100/pdf/nvidia-a100-datasheet-us-nvidia-1758950-r4-web.pdf。MI200-07

註5:AMD Instinct™ MI250X加速器內含220個運算單元(CU)與14,080 個串流核心。AMD Instinct™ MI100加速器內含120 個運算單元(CU)與7,680個串流核心。MI200-027

註6:計算是由AMD效能實驗室於2021年9月21日執行,受測對象為AMD Instinct™ MI250X與MI250 (128GB HBM2e) OAM加速器,晶片採用AMD CDNA™ 2、6奈米FinFet製程技術,1,600 MHz尖峰記憶體時脈,測得3.2768 TFLOPS尖峰理論記憶體頻寬效能。MI250/MI250X記憶體匯流排介面的4,096 bits乘以2個晶片與記憶體資料傳輸率3.20 Gbps,推算出總記憶體頻寬為3.2768 TB/s ((3.20 Gbps*(4,096 bits*2))/8)。計算由AMD效能實驗室於2020年10月5日執行,受測對象為AMD Instinct™ MI100加速器,晶片採用AMD CDNA 7奈米FinFET製程技術,1,200 MHz尖峰記憶體時脈,測得1.2288 TFLOPS尖峰理論記憶體頻寬效能。MI100記憶體匯流排介面為4,096 bits,記憶體資料傳輸率為2.40 Gbps,故推算出總記憶體頻寬為1.2288 TB/s ((2.40 Gbps*4,096 bits)/8)。MI200-33

新聞聯絡人:

美商超微半導體
高惠如 Robyn Kao
Tel:2655-8885 EXT.23352
Email: Robyn.Kao@amd.com

世紀奧美公關
黎淑玲 Jannie Lai / 江曉婷 Linda Chiang / 吳品萱 Sophia Wu
Tel:7745-1688 EXT.139 / 137 / 170
Email: JannieSL.Lai@eraogilvy.com
LindaHT.Chiang@eraogilvy.com
SophiaPH.Wu@eraogilvy.com

Share:

媒體庫


搜尋並下載最新的 AMD 公司和產品標誌、影像和幕後花絮