
微軟、戴爾科技集團、HPE、聯想、Meta、Oracle與美超微等廠商為訓練與推論解決方案採用全新AMD MI300X與MI300A資料中心AI加速器
AMD也推出ROCm 6軟體堆疊,提供強大效能最佳化與大型語言模型的全新功能;並為AI PC推出Ryzen 8040系列行動處理器
台北,2023年12月7日 -- AMD(NASDAQ: AMD)在「Advancing AI」活動上與微軟、Meta、Oracle、戴爾科技集團、HPE、聯想、美超微(Supermicro)、Arista、博通(Broadcom)與思科(Cisco)等各大廠商展示其如何與AMD攜手合作帶來從雲端到企業與PC的先進人工智慧(AI)解決方案。AMD於活動中推出多個全新產品,包括AMD Instinct™ MI300系列資料中心AI加速器、提供強大最佳化效能與支援大型語言模型(Large Language Model,LLM)的ROCm™ 6開放軟體堆疊以及具備Ryzen AI的Ryzen™ 8040系列處理器。
AMD董事長暨執行長蘇姿丰博士表示,AI是運算的未來,而AMD具有獨特優勢,能夠為定義此AI時代的端對端基礎架構挹注動能,範圍涵蓋大型雲端安裝、企業叢集到支援AI的智慧嵌入式裝置與PC。我們看到對於全新Instinct MI300 GPU的強勁需求,此為全球最高效能的生成式AI加速器。我們也在與最大的雲端公司、領先業界的伺服器供應商以及最具創新性的AI新創公司攜手合作,為我們的資料中心AI解決方案打造重要動能,將Instinct MI300解決方案快速帶進市場,從而大幅加速全面AI產業體系的創新進程註1。
推動從雲端到企業資料中心與超級電腦的資料中心AI
AMD在活動中與多家合作夥伴同台展現AMD Instinct資料中心AI加速器的強勁採用狀況與成長動能。
- 微軟闡述其如何採用AMD Instinct MI300X加速器於全新Azure ND MI300x v5虛擬機器(VM),為AI工作負載進行最佳化。
- Meta分享正在新增AMD Instinct MI300X加速器至其資料中心,並與ROCm 6結合來為AI推論工作負載挹注效能,也透過Llama 2模型陣容體認到AMD所做的ROCm 6最佳化效能。
- Oracle發表其計劃提供搭載AMD Instinct MI300X加速器的OCI裸機運算解決方案(OCI bare metal compute solution),也預計在接下來的生成式AI服務中納入AMD Instinct MI300X加速器。
- 最大資料中心基礎架構供應商宣布計劃於其產品組合整合AMD Instinct MI300加速器。戴爾科技集團宣布將AMD Instinct MI300X加速器與其PowerEdge XE9680伺服器解決方案整合,以模組化和可擴展格式為客戶帶來生成式AI工作負載的突破性效能。HPE宣布計劃將AMD Instinct MI300加速器帶進其企業與高效能運算(HPC)產品。聯想分享計劃於Lenovo ThinkSystem平台搭載AMD Instinct MI300X加速器,帶來橫跨零售、製造、金融服務與醫療等產業的AI解決方案。美超微宣布計劃於其AI解決方案產品組合提供AMD Instinct MI300 GPU。華碩、技嘉科技(Gigabyte)、鴻佰科技(Ingrasys)、英業達(Inventec)、雲達科技(QCT)、緯創(Wistron)與緯穎(Wiwynn)也計劃提供基於AMD Instinct MI300加速器的解決方案。
- Aligned、Arkon Energy、Cirrascale、Crusoe、Denvr Dataworks與Tensorwaves等專門AI雲端服務供應商皆計劃為開發人員與AI新創公司提供可擴大存取AMD Instinct MI300X GPU的方案。
為市場帶來開放、經過驗證且準備就緒的AI軟體平台
AMD展現在擴展支援AMD Instinct資料中心加速器的軟體產業體系之重大進展。
- AMD發表為AMD Instinct GPU推出的最新版本開源軟體堆疊ROCm 6,其為生成式AI進行最佳化,特別是大型語言模型。ROCm 6可支援全新資料型式、先進繪圖與核心最佳化、最佳化函式庫與最先進的注意力演算法。相較於MI250上執行的ROCm 5,於MI300X上執行的ROCm 6在Llama 2 text generation模型帶來高達8倍的全面延遲效能提升註2。
- Databricks、Essential AI和Lamini這三家建立新興模型和AI解決方案的AI新創公司與AMD同台探討他們如何透過AMD Instinct MI300X加速器與開放ROCm 6軟體堆疊為企業客戶帶來差異化AI解決方案。
- OpenAI正在為AMD Instinct加速器新增支援到Triton 3.0,為AMD加速器提供開箱即用支援,讓開發人員能夠在AMD硬體上進行更高的抽象層工作。
欲了解更多關於AMD Instinct MI300系列加速器、ROCm 6與AMD AI解決方案的成長產業體系的資訊,請參閱此連結。
在AI PC持續領先的地位
至今AI PC出貨量已達數百萬台,AMD宣布推出全新領先行動處理器並發表最新AMD Ryzen 8040系列處理器,提供強勁的AI運算能力。AMD也推出Ryzen AI 1.0軟體,藉由此軟體堆疊,開發人員能輕鬆部署使用預先訓練模型的應用,為Windows應用新增AI功能。AMD也公布即將推出的新一代“Strix Point” CPU,預計將在2024年推出。“Strix Point” CPU將採用AMD XDNA™ 2架構,相較前一代提供超越3倍的AI運算效能提升註3,將帶來全新的生成式AI體驗。微軟也加入探討其如何在Windows PC的未來AI體驗與AMD緊密合作。
相關資源
- 更多關於:AMD Advancing AI主題演講完整版
- 更多關於:Advancing AI活動期間最新發表
- 更多關於:AMD 30x25能源效率倡議
- X:於@AMD追蹤AMD新訊
- LinkedIn:於AMD LinkedIn追蹤AMD新訊
關於AMD
50多年來,AMD(NASDAQ:AMD)推動創新高效能運算、繪圖及視覺技術,建構遊戲、高臨場感平台與資料中心等重要領域。AMD員工致力於研發領先的高效能與自行調適產品,不斷突破技術的極限。全球數十億的消費者、世界500強企業以及尖端科學研究機構皆仰賴AMD的技術來改善生活、工作及娛樂。欲瞭解AMD如何成就今天,啟發未來,請瀏覽AMD網站、部落格、LinkedIn及X。
©2023年,AMD公司版權所有。AMD、AMD箭頭、AMD Instinct、Ryzen及上述名稱的組合是AMD公司的商標。其他產品名稱只為提供資訊為目的,也可能是各自所有者的商標。
免責聲明
本新聞稿包含有關Advanced Micro Devices, Inc(AMD)的前瞻性陳述,包括AMD Instinct™ MI300系列資料中心AI加速器、Ryzen™ 8040系列處理器與ROCm™ 6開放軟體堆疊等AMD產品與技術的特色、功能、效能、上市時間、時程以及預期收益。這些陳述皆基於1995年《私人證券訴訟改革法案》(U.S. Private Securities Litigation Reform Act)的「安全港」(Safe Harbor)條款所訂定出。這些前瞻性聲明含有像「將會」、「可能」、「預期」、「相信」、「計劃」、「打算」、「估計」,或這些字詞和短語的其它類似詞彙。投資者應注意本資料中的前瞻性陳述僅根據本文公佈當時的見解、假設以及預期,僅反映本文發布時的情況,且涉及到許多風險與不確定因素,可能會導致實際結果與預期存在重大差異。這類陳述受到特定已知與未知風險與不確定因素所影響,其中許多因素難以預測且大多非AMD所能掌控,並可能響應實際結果與其他未來事件和文中陳述有所出入,或是和前瞻性陳述資訊與陳述的暗示或預期狀況有所不同。可能導致實際結果和當前預期有所出入的實質因素包括但不限於:包括Intel公司佔據微處理器市場,及其侵略性經營手段;經濟局勢不確定性;半導體產業的周期性;AMD產品銷售行業的市場狀況;失去重要客戶;COVID-19疫情對AMD業務、財務狀況和營運結果的影響;AMD產品鎖定的市場競爭極為競爭;季度和季節性銷售模式;AMD充分保護其技術或其他知識產權的能力;不利的貨幣匯率波動;第三方廠商能及時製造足夠數量AMD的產品、或使用競爭對手的技術;基本設備、材料、載板或製造過程的可用性;達到AMD產品預期製造良率的能力;AMD能及時推出具有預期功能與效能水準的產品;AMD的半客製化SoC產品產生營收的能力;潛在的安全漏洞;潛在的安全事件,包括IT中斷、數據丟失、數據洩露和網路攻擊;有關AMD產品訂購和發貨的不確定性;AMD依賴第三方廠商知識產權來及時設計和推出新產品;AMD依賴第三方廠商來設計、製造和供應主機板、軟體、記憶體和其他電腦平台零組件;AMD依賴Microsoft和其他軟體供應商的支持來設計和開發可在AMD產品上運行的軟體;AMD依賴第三方分銷商和外接合作夥伴;修改或中斷AMD內部業務流程和資訊系統的影響;AMD產品與部分或全部行業標準軟體和硬體的兼容性;缺陷產品所產生的有關費用;AMD供應鏈的效率;AMD依靠第三方供應鏈物流功能的能力;AMD有效控制其產品在灰色市場上銷售的能力;政府行動和法規的影響,例如出口法規,關稅和貿易保護措施;AMD實現遞延所得稅資產的能力;潛在的稅收負債;當前和將來的索賠和訴訟;環境法律,與衝突礦物有關的規定以及其他法律或法規的影響;併購、合資與/或投資可能對業務產生的影響,以及整合收購事業的能力;AMD對合併公司資產的任何損害可能產生的的影響;管理AMD票據的協議、賽靈思票據的保證和循環信用額度施加的限制;AMD債務;AMD產生足夠的現金來滿足其營運資金需求的能力或產生足夠的營收和營運現金流以進行其所有計畫的研發或策略性投資的能力;政治,法律,經濟風險和自然災害;技術許可購買的未來減損;AMD吸引和留住人才的能力;AMD的股價波動。呼籲投資者詳閱公司呈交美國證管會各項財報中提及的風險與不確定因素,其中包括但不限於AMD最近的Form 10-K和10-Q報告。
註1:由AMD效能實驗室於2023年11月11日進行測量,針對AMD Instinct™ MI300X(750W)GPU,採用AMD CDNA™ 3 5nm|6nm FinFET製程技術,在2,100 MHz峰值增強引擎時脈下,結果為163.4 TFLOPS峰值理論雙精度矩陣(FP64)、81.7 TFLOPs峰值理論雙精度(FP64)、163.4 TFLOPs峰值理論單矩陣矩陣(FP32矩陣)、163.4 TFLOPs峰值理論單精度(FP32)、653.7 TFLOPS峰值理論TensorFloat-32 (TF32)、1307.4 TFLOPS峰值理論半精度(FP16)、1307.4 TFLOPS峰值理論Bfloat16格式精度(BF16)、2614.9TFLOPS峰值理論8位元格式精度(FP8)、2614.9 TOPs INT8浮點效能。在NVIDIA H100 SXM (80GB) GPU上發布的結果為66.9 TFLOPs峰值理論雙精度張量(FP64 Tensor)、33.5 TFLOPs峰值理論雙精度(FP64)、66.9 TFLOPs峰值理論單精度(FP32)、494.7 TFLOPs峰值理論雙精度張量TensorFloat-32 (TF32)*、989.4 TFLOPS峰值理論半精度張量(FP16 Tensor)、133.8 TFLOPS峰值理論半精度(FP16)、989.4 TFLOPS峰值理論Bfloat16張量精度(FP16)、989.4 TFLOPS峰值理論Bfloat16張量精度(BF16 Tensor)、133.8TFLOPS峰值理論Bfloat16格式精度(BF16)、1,978.9 TFLOPS峰值理論8位元精度(FP8)、1,978.9 TOPs理論峰值INT8浮點效能。NVIDIA H100來源:https://resources.nvidia.com/en-us-tensor-core/ * NVIDIA H100 GPU不支援FP32 Tensor。MI300-18
註2:使用Llama2-70b對話生成的文字,使用輸入序列長度為4096和32個輸出標誌進行比較,基於AMD內部測試截至2023年11月17日。配置為:2P Intel Xeon Platinum CPU伺服器,使用4x AMD Instinct™ MI300X(192GB, 750W)GPU,ROCm® 6.0預發行版,PyTorch 2.2.0,vLLM for ROCm,Ubuntu® 22.04.2。對比2P AMD EPYC 7763 CPU伺服器,使用4個AMD Instinct™ MI250(128 GB HBM2e, 560W)GPU,ROCm® 5.4.3,PyTorch 2.0.0,HuggingFace Transformers 4.35.0,Ubuntu 22.04.6。每個系統均使用4個GPU進行此測試。各家伺服器製造商配置各異,故測得結果亦可能不同。效能可能會根據使用最新驅動程式和最佳化方式而有差異。MI300-33
註3:AMD Ryzen “Strix point”處理器預計在AI工作負載中的NPU效能將比AMD Ryzen 7040系列處理器快3倍。這是由AMD工程人員預測的效能。工程預測並不能保證最終效能。具體的預測基於參考設計平台,當最終產品在市場上推出時亦可能會改變。STX-01
新聞聯絡人:
美商超微半導體
高惠如 Robyn Kao
Tel:2655-8885 EXT.23352
Email: Robyn.Kao@amd.com
世紀奧美公關
黎淑玲 Jannie Lai / 江曉婷 Linda Chiang / 何文仁 Alicia Ho
Tel:7743-9139 / 7743-9137 / 7743-9135
Email: JannieSL.Lai@eraogilvy.com
LindaHT.Chiang@eraogilvy.com
AliciaWJ.Ho@eraogilvy.com
媒體庫
搜尋並下載最新的 AMD 公司和產品標誌、影像和幕後花絮