AMD HPC 和 AI 客戶:ROCm™ 5.7 版現已推出
AMD ROCm™ 開放平台為一開放原始碼軟體平台,專為促進 AMD 及其他供應商硬體的 HPC 和 AI 運算所打造。透過 ROCm,客戶在執行其 HPC 工作負載時,可享有更上一層樓的自由與可及性。
ROCm 更新 5.7 版帶來豐富的全新更新、功能與提升,確保您的客戶可從其各種應用上的 AMD 硬體中獲得更好的效能。支援額外 AMD 顯示卡、hipTensor 支援以及效能提升;ROCm™ 5.7 版可為使用者改善所有這些功能。
AMD Radeon™ 顯示卡的機器學習採用 AMD RDNA™ 3 架構
得力於 ROCm 5.7 版在 Linux® 上支援 AMD Radeon™ RX 7900 XTX 與 AMD Radeon™ PRO W7900 顯示卡,客戶現在可以運用 AMD Radeon™ RX 7900 系列桌上型電腦顯示卡的威力,執行其機器學習模型和演算法。
AMD Radeon™ RX 7900 系列顯示卡採用 AMD RDNA™ 3 架構,與前代產品相較,每運算單元可有超過兩倍的 AI 效能。1 此外,其可提供高達 192 個 AI 加速器,以及令人驚嘆的記憶體頻寬,高達 24 或 48GB 的顯示卡記憶體,能協助客戶處理最大的機器學習模型。
客戶現在可以使用立即可用的硬體,建立本機私有工作流程,以啟用機器學習訓練等功能,這可為先前仰賴雲端解決方案的使用者提供絕佳選項。
支援 hipTensor
ROCm 更新 5.7 版針對 hipTensor,即用於加速張量基元(可用於複雜 HPC 和 AI 工作流程的建構塊)的 AMD C++ 資源庫導入全新支援,提高其彈性、縮短開發時間並提升端對端效率。
MIGraphX 的新功能
MIGraphX 是一款推理引擎,透過運用多個圖像層級變形和最佳化、將現有模型帶入一系列最佳化並同時著重速度和精確度,以此專注於加速 AMD 硬體的機器學習推理。
MIGraphX 現在擁有全新功能 Dynamic Batch。在 ROCm 5.7 版以前,如果批量大小不同,則客戶可能需要彙整不同模型。對期待依資料輸入執行多個批量大小模型的客戶而言,此新功能現在可讓他們使用單一彙整模型,支援多個批量大小,簡化機器學習工作流程、降低儲存空間要求,並可減少系統判定應使用哪個模型所需的指令碼邏輯。
rocRAND RNG 針對離散分布的效能提升
rocRAND 資源庫屬於 ROCm 開放原始碼軟體平台的一部分,在 AMD 顯示卡上提供隨機數生成功能,最適合應用於模擬、統計模型和機器學習演算法。
rocRAND 隨機數生成 (RNG) 的效能搭配與 ROCm 更新 5.7 版一起提供的其他更新,對於離散分布提升高達 15%,確保客戶為此類應用套用 AMD 硬體時,可享有提升的效率和產出。
AMD 持續為新技術與現有技術不斷提供改善,增強客戶跨 HPC 和機器學習的應用體驗。由於持續專注於開放原始碼,為客戶提供易於存取的軟體和更好的成果,讓合作夥伴可以繼續向客戶提供可靠的 AMD 產品,瞭解他們所提供的是能支援未來幾年業務目標的領先產品。
若要取得更多 ROCm 更新 5.7 版的資訊,請閱讀此處的 AMD 部落格文章。若要瞭解更多 AMD 在 HPC 領域的產品和技術,請聯絡您的 AMD 代表或從這裡聯絡我們。
尾註
- 基於 2022 年 11 月的 AMD 内部量測,將每時脈發出 2 倍 Bfloat16 數學運算、擁有 96 個 CU、提升時脈為 2.5GHz 的 AMD Radeon™ RX 7900 XTX 與每時脈發出 1 倍 Bfloat16 數學運算、擁有 80 個 CU、提升時脈為 2.25 GHz 的 AMD Radeon™ RX 6900 XT 顯示卡相比較。RX-821。
- 基於 2022 年 11 月的 AMD 内部量測,將每時脈發出 2 倍 Bfloat16 數學運算、擁有 96 個 CU、提升時脈為 2.5GHz 的 AMD Radeon™ RX 7900 XTX 與每時脈發出 1 倍 Bfloat16 數學運算、擁有 80 個 CU、提升時脈為 2.25 GHz 的 AMD Radeon™ RX 6900 XT 顯示卡相比較。RX-821。