Versal Prime

Versal Prime 系列

提供多種不同的運算引擎、新一代輸入/輸出 (Input/Output, I/O),以及整合式雙倍資料速率 (Double Data Rate, DDR) 控制器,可為多種工作負載提供低延遲加速

針對連線、內嵌加速和多種工作負載最佳化

Versal Prime block diagram

主要功能

abstract processor
處理系統

Versal 自適應 SoC 提供三種純量處理器類型,可支援多種不同的應用需求。應用處理單元是 OS 支援之複雜應用程式的理想選擇,而即時處理單元則適合需要低延遲、決定性和即時控制的應用程式。獨立的平台管理控制器可管理系統開機、安全性及除錯。

abstract processor
可編程邏輯

可編程邏輯讓使用者能開發出客製運算區塊,以適應不斷變化的演算法。Versal 自適應 SoC 中重新設計的邏輯,可提供 4 倍的每可配置邏輯區塊 (Configurable Logic Block, CLB) 密度,以減少對昂貴全域路由的需求。可編程邏輯包含各式各樣的記憶體元素,並與可編程 I/O 緊密結合,讓使用者能為任何應用建立強大的加速器。

wave texture
DSP 引擎

增強的數位訊號處理 (Digital Signal Processing, DSP) 引擎可支援新的運算及資料類型,包括單精度及半精度浮點與複雜的 18x18 運算。系統可與 UltraScale+™ 裝置設計向後相容,讓使用者能繼續使用現有程式庫和智財 (Intellectual Property, IP),或更新設計以享有此新架構帶來的運算效能提升。

generic processor image
新一代 I/O

Versal Prime 系列結合符合 PCIe® Gen5/Gen4 標準的高效能通用 I/O (General Purpose Input/Output, GPIO)、400 G 高速加密 (High-Speed Crypto, HSC) 引擎*,以及支援各種乙太網路組態的多速率乙太網路 MAC,可大幅提升連線能力與彈性。此外,Versal Prime 系列裝置具有經過重新設計的低延遲 32.75 Gb/s 收發器,且特定裝置還支援 58 Gb/s 與 112 Gb/s* PAM4 收發器。

* 僅 VM2152 裝置支援 400 G HSC 引擎和 112 Gb/s PAM4 收發器

Programming code abstract technology background of software developer and  Computer script
整合式 DDR 記憶體控制器

Versal Prime 裝置支援整合式 DDR5/4 與 LPDDR5/4 控制器*,這些控制器已針對線性及隨機流量進行最佳化。

使用經強化的記憶體控制器 IP 結合可編程晶片上網路(兩者均針對效能與區域進行最佳化),可節省開發時間與邏輯資源。

*僅 VM2152 裝置包含 DDR5 與 LPDDR5 記憶體控制器

3D rendering of AI. Circuit board.
可編程晶片上網路

可編程晶片上網路 (NoC) 提供最佳化的多兆位元互連功能,可在 Versal 自適應 SoC 架構中不同的運算引擎和整合式 IP 區塊之間進行互連,進而簡化時序收斂並節省邏輯資源。NoC 編譯器提供精簡化的編程體驗,同時讓使用者能管理延遲與服務品質 (Quality of Serivce, QoS),確保優先處理重要資料路徑。

Versal Prime 系列產品簡介

Prime 系列是高度整合的多核心異構運算平台,能為針對連線進行最佳化的裝置實現低延遲內嵌加速功能,為多種應用提供突破性的效能,包括資料中心網路、儲存及有線通訊。

AMD Versal Prime Series product brief

應用與產業

儲存加速

隨著 AI 時代的降臨及現代應用程式產生的資料量暴增,傳統運算能力已成為資料中心越來越珍貴的資源。要維持運算能力,其中一種解決方案就是在儲存控制器和端點增添加速器,從主要處理器卸載壓縮和其他一般任務。Versal Prime 系列結合 PCIe® Gen5/Gen4 支援、強大的 Arm® 純量處理引擎、整合式記憶體控制器及新一代可編程邏輯,可減少系統層級的瓶頸並提高效率。

資料中心網路加速

現場可程式化閘陣列(Field-Programmable GateArray, FPGA) 和 SoC 在加速資料中心應用方面,長久以來都扮演關鍵角色,可卸載常見的網路功能以保留運算週期,例如加密/解密,以及從系統的中央處理器進行虛擬切換等。Versal 自適應 SoC 結合了 PCIe Gen5/Gen4 支援、新一代序列器/解除序列器 (Serializer/Deserializer, SerDes) 和多速率乙太網路 MAC,以及強大的異構運算引擎,來卸載網路作業,並以額外的內嵌處理能力來補強伺服器運算能力,進一步加速資料中心系統。

5G xHaul

隨著 5G 的興起,對於高頻寬連線的需求,使得存取網路必須能夠適應以支援演進版通用公共無線電介面 (evolved Common Public Radio Interface, eCPRI) 等新通訊協定,同時仍維持與現有標準的相容性。Versal Prime 系列將自行調適引擎與領先業界的 SerDes 和乙太網路技術相結合,讓營運商能具備處理 5G 輸送量需求的處理能力,同時維持對舊有標準的支援並降低擁有總成本。

被動光纖網路

隨著無線服務的競爭日益激烈,有線寬頻供應商必須擴充其網路並提供頻寬更高的服務,才能保持競爭力。Versal Prime 系列提供現有多處理器晶片上系統 (Multiprocessor System-on-Chip, MPSoC) 裝置兩倍的可編程邏輯、強大的 Arm 純量處理引擎、更大的 SerDes 密度、整合式乙太網路 IP 區塊以及散熱最佳化封裝,能在不影響效能的情況下實現低功耗、高效率的設計。

通訊測試設備

伴隨著最新通訊標準而來的頻寬暴增,使測試設備廠商難以跟上市場需求。Versal Prime 系列支援 58 G 收發器和多速率乙太網路 MAC,能為有線通訊測器提供高效能資料處理與分析功能。可編程 NoC 與整合式記憶體控制器可為複雜的測試演算法,提供快速且有效率的資料移動功能。

產品規格

當您需要最快速的 DDR 記憶體介面時

隆重推出 Versal Prime VM2152 裝置,配備業界最快的 DDR 記憶體介面1,支援 LPDDR5(最高 6400 Mb/s)/DDR5(最高 5600 Mb/s)、112 Gb/s 收發器,以及更強大的 DSP 效能2(比前一代 Versal Prime 裝置更強),可支援新一代通訊、測試與測量、儲存及其他廣泛市場應用所需要的更多資料輸送量。

處理子系統規格

  VM1102 VM1302 VM1402 VM1502 VM1802 VM2152 VM2202 VM2302 VM2502 VM2902
應用處理單元 雙核心 Arm® Cortex®-A72,48 KB/32 KB L1 快取記憶體搭配奇偶校驗及 ECC;1 MB L2 快取記憶體搭配 ECC
即時處理單元 雙核心 Arm Cortex-R5F,32 KB/32 KB L1 快取記憶體及 256 KB TCM 搭配 ECC
記憶體 256 KB 晶片上記憶體搭配 ECC
連線 乙太網路 (x2);USB 2.0 (x1);UART (x2);SPI (x2);I2C (x2);CAN-FD (x2)

DSP 引擎規格

  VM1102 VM1302 VM1402 VM1502 VM1802 VM2152 VM2202 VM2302 VM2502 VM2902
DSP 引擎 464 848 1,696 1,312 1,968 1,704 1,312 1,904
3,984 2,672

可編程邏輯功能

  VM1102 VM1302 VM1402 VM1502 VM1802 VM2152 VM2202 VM2302 VM2502 VM2902
系統邏輯單元 (K) 329 703 1,238 981
1,968 757 1,139 1,575 1,969 2,233
LUT 150,272 321,536 565,760 448,512
899,840 346,112 520,704 719,872 900,224 1,020,928

基礎平台規格

  VM1102 VM1302 VM1402 VM1502 VM1802 VM2152 VM2202 VM2302 VM2502 VM2902
NoC 主要/NoC 從屬連接埠 5 9 18 21
28 12 21 30 28
42
DDR4 記憶體控制器 1 2 4 3
4 - 3 3
4
3
DDR5 記憶體控制器 - - - - - 4 - - - -
PCIe® 搭配 DMA (CPM) - 1 個 Gen4x16 1 個 Gen4x16 1 個 Gen4x16 1 個 Gen4x16 - 2 個 Gen5x8 -
2 個 Gen5x8 -
PCIe 1 個 Gen4x8 2 個 Gen4x8 2 個 Gen4x8 4 個 Gen4x8 4 個 Gen4x8 2 個 Gen5x4 4 個 Gen5x4 2 個 Gen5x4 - 2 個 Gen5x4
100 G 多速率乙太網路 MAC 1 2 2 4 4 2 2 6 - 6
600 G 乙太網路 MAC - - - - - 1 - - - -
400 G 高速加密 - - - - - 1 - - - -
GTY 收發器 0 24 24 44 44 0 0 0 0 0
GTYP 收發器 8
0 0 0 0 8 321 8
161
8
GTM 收發器 (58 G (112 G))2 0
0
0
0
0
8 (4)2 0 36 (0) 0 36 (0)

1.16 GTYP 收發器專門供 CPM 用於 PCI Express。
2.結合兩部 GTM 收發器可支援 112 G。

適用於所有開發人員

AMD 提供領先業界的軟體開發環境,可使用自適應 SoC 和現場可程式化閘陣列 (Field-Programmable Gate Arrays, FPGAs) 進行設計,包括工具(編譯器、模擬器等)、IP 和解決方案。

此環境可縮短開發時間,同時讓開發人員達成高每瓦效能的目標。這些工具讓 AI 科學家、應用程式與演算法工程師、嵌入式軟體開發人員,以及傳統硬體開發人員等各種開發人員,都能使用 AMD 自適應運算解決方案。

現在開始

利用套件所提供的經實證的硬體、軟體支援、工具、設計範例及文件,快速展開設計週期並快速上市。

AMD Versal™ Prime Series VMK180 Evaluation Kit

使用 Versal Prime VMK180 評估套件著手開發

立即使用含 VM1802 裝置的 VMK180 評估套件,著手評估 Versal Prime 系列的功能。自適應 SoC 可使用各種工具、軟體、程式庫、IP、中介軟體及架構,透過業界標準設計流程,提供可動態自訂的加速運算解決方案。Versal Prime 系列 VMK180 評估套件提供您立即展開設計所需的一切。

資源

掌握最新動態

加入 Versal 自適應 SoC 通知清單,以接收最新消息與更新。

尾註
  1. 根據 2023 年 10 月的 AMD 內部分析,比較 Versal Prime VM2152 自適應 SoC 及 Intel Agilex 7 M/I/F-系列、Intel Agilex 5 D/E-系列與 Achronix Speedster7t FPGA 的 LPDDR/DDR 記憶體介面資料率。資料率速度可能會有所不同。VER-18
  2. 根據 2023 年 10 月的 AMD 內部分析,比較 Versal Prime VM2152 自適應 SoC 及前一代 Versal Prime 裝置的 DSP 邏輯比(DSP 引擎/系統邏輯單元)。VER-20