Versal Premium 系列

專為最嚴苛的運算與資料移動應用而設計,現在搭載全球最大的自適應晶片上系統 (System-on-Chip, SoC)

產品優勢

在全球最先進的軟體可編程自適應 SoC 平台上,結合可編程邏輯、數位訊號處理 (Digital Signal Processing, DSP) 引擎、AI 引擎與更多應用程式特定的智財 (Intellectual Property, IP),達到前所未有的整合程度。

佔位符

主要功能

digital brain image
AI 引擎與 DSP 引擎

AI 引擎數位訊號處理 (Digital Signal Processing, DSP) 引擎均支援邊緣應用中常見的多種工作負載,包括 AI 推理、影像處理和動作控制。AI 引擎是以可擴充的向量處理器陣列和分散式記憶體為基礎的突破性架構,提供突破性的每瓦 AI 效能。DSP 引擎是以前一代 Zynq™ 自適應晶片上系統 (System-on-Chip, SoC) 中經實證的分割架構為基礎,現在更搭載整合式浮點支援,是無線與影像訊號處理、資料分析、動作控制等作業的理想選擇。

abstract processor
可程式化邏輯

可編程邏輯支援使用者開發客製運算區塊以實現差異化、讓系統與時俱進,以及適應不斷變化的演算法。可編程邏輯包含各式各樣的記憶體元素,並與可編程 I/O 緊密結合,讓使用者能為任何應用建立強大的加速器。

hexagonal wave texture
處理系統

我們有提供三種處理器類型以滿足各種應用需求。應用處理單元非常適合 OS 支援的複雜應用程式,而即時處理單元則是延遲敏感型應用程式的理想選擇。獨立的平台管理控制器可管理系統開機、安全性及除錯。

112 Gb/s PAM4 收發器

800 G 網路及更高規格

Versal Premium 系列的 112 Gb/s PAM4 收發器是支援省電最佳化 800 G 網路系統的核心要素。Versal Premium 自適應 SoC 在同一裝置上具有廣泛的收發器選擇,包括 32 Gb/s、58 Gb/s 及 112 Gb/s,讓廠商能擴充主流的 100 G 系統、加速 400 G 部署,以及具備提供 800 G 及更高規格的能力。

digital shield image
400 G 高速加密引擎

適用於安全網路的線路速率加密

Versal Premium 自適應 SoC 提供 1.6 Tb/s 的線路速率加密輸送量,是安全網路的理想平台。該自行調適平台中採用經強化的 400 G 通道化高速加密 (High-Speed Crypto, HSC) 引擎。HSC 引擎支援進階加密標準伽羅瓦計數器模式 (Advanced Encryption Standard Galois Counter Mode, AES-GCM) 加密/解密、媒體存取控制安全性 (Media Access Control security, MACsec) 及網際網路通訊協定安全性 (Internet Protocol security, IPsec) 以實現多層安全性。

多速率乙太網路核心搭配 FEC

適用於 10 G 至 800 G 的單一平台

專屬連線 IP 提供安全的多兆位元乙太網路,並支援多種資料率與通訊協定。混合 100 G 和 600 G 乙太網路核心的組合可提供高達 5 Tb/s 的輸送量,並能從存取網路擴充至都會及核心,這一切全部都在單一平台上完成。

600 G Interlaken 搭配 FEC

可擴充的晶片對晶片互連功能

裝置中的整合式 Interlaken 核心可支援高達 600 Gb/s,搭配內置流量控制,提供可靠的高頻寬資料傳輸。Versal Premium 可透過整合式里德所羅門前向錯誤修正 (Reed Solomon Forward Error Correction, RS-FEC) 進行省電最佳化錯誤修正,以支援可擴充的晶片對晶片互連功能,同時將網路系統的 I/O 與電力負荷降至最低。

PCIe Gen5 搭配 DMA

最佳處理器至加速器通訊

PCIe® Gen5 能為新一代運算應用,加速伺服器處理器至加速器的通訊,而經強化的直接記憶體存取 (Direct Memory Access, DMA) 引擎搭配具備可編程晶片上網路 (Network on Chip, NoC) 則可提供可擴充的統包式虛擬化功能,以供進行工作負載佈建及部署作業。

3D rendering of AI. Circuit board.
可編程晶片上網路

具保證的 QoS 和能效

可編程晶片上網路 (NoC) 提供最佳化的多兆位元互連功能,可在 Versal 自適應 SoC 架構中不同的運算引擎和整合式 IP 區塊之間進行互連,進而簡化時序收斂並節省邏輯資源。NoC 編譯器提供精簡化的編程體驗,同時讓使用者能管理重大資料路徑的延遲與服務品質 (Quality of Serivce, QoS)。

Versal Premium 系列產品簡介

Versal Premium 系列透過整合 AI 引擎,提供領先業界的自適應訊號處理能力。

Kria SOM 產品選擇指南

應用與產業

Phased Array Radar

相位陣列雷達

相位雷達陣列的自適應波束成型技術可在光譜競爭環境中,執行精準追蹤與引導作業。配備 AI 引擎的 Versal™ Premium 裝置可提供比上一代高出 4 倍的訊號處理量1,支援設計師實現更多波束成形以外的運算密集型功能。AI 引擎與 DSP 引擎原生支援各種資料類型(包括高效率的單精度浮點),以提供更大的動態範圍,這對雷達應用而言至關重要。

Versal Premium 系列提供 112 G PAM4 收發器,具有省電最佳化的 IP,可確保從天線到後端介面的網路安全,同時簡化系統整合並降低延遲與功耗。Versal 架構創新的異構整合在減少尺寸、重量與功耗 (Size, Weight, and Power, SWaP) 方面,可為許多雷達系統設計帶來領先業界的優勢。

1:比較同等 DSP 引擎總容量及 Virtex™ UltraScale+™ VU13P 現場可程式化閘陣列 (Field Programmable Gate Array, FPGA)

都會/核心傳輸網路

5G 無線網路、xHaul、被動式光纖網路 (Passive Optical Network, PON) 與纜線存取的頻寬需求快速成長,因此都會/傳輸網路在彙總並以智慧方式處理網路流量這方面的作業,面臨巨大的壓力。Versal™ Premium 系列提供 112 G PAM4 收發器,具有 600 G 通道化多速率乙太網路及整合式 600 G Interlaken 搭配 FEC 等專用連線 IP,能在複雜的都會/核心傳輸網路中支援高熱效率的設計。

Versal Premium 的運算密度是傳統硬體可編程裝置的兩倍,因此能支援硬體差異化、適應不斷演變的標準,並能將 AI/機器學習 (Machine Learning, ML) 帶入未來的自動化和智慧型網路。

為資料中心提供可擴充加速功能

Versal Premium 是一個異構平台,擁有全球最高的運算密度,可為各式各樣的工作負載提供自行調適雲端加速功能,包括基因體學、視訊轉碼、搜尋和機器學習。

動態功能交換 (Dynamic Function Exchange, DFX) 可讓使用者在毫秒內交換運算內核以佈建加速器,以便最有效率地使用雲端基礎架構。Versal Premium 憑藉龐大的晶片上記憶體容量與頻寬,以及目前部署之 FPGA 加速器的雙倍運算密度,提供優異的運算能力與流暢的協調能力。

Versal Premium 是為了與雲端基礎架構無縫整合而徹底從頭打造,具備整合式外殼,可確保主機伺服器與系統記憶體在開機時可進行通訊,讓加速器設計師能減少花在連線上的時間,並將更多時間用來實現差異化。

資料中心互連

在資料中心擴充規模時,資料中心互連 (Data Center Interconnect, DCI) 技術也必須隨之進化,才能支援高容量、擴充性和能效。Versal Premium 系列提供高達 112 G 的可擴充收發器,高達 5 Tb/s 的乙太網路輸送量,以及 1.6 Tb/s 的線路速率加密功能,讓服務商能在資料中心之間快速安全地連線,以部署彈性的傳輸技術。

測試與量測

若要率先採用從資料中心到 5G 的網路技術,廠商必須利用前沿的通訊測試設備,來確保互通性及落實健全的網路流量管理。Versal Premium 系列的 AI 引擎與 DSP 引擎提供領先業界的訊號處理效能與邏輯容量,可針對自動化測試、資料流量控制、追蹤及報告,實作最複雜的測試邏輯。

112 G PAM4 收發器已為新興通訊協定整合 KP4 FEC,並可與光纖和背板互通。專用通道化多速率乙太網路核心具有 5 Tb/s 的彙總輸送量,配備模組化可存取媒體存取控制器 (Media Access Controller, MAC)、實體編碼子層 (Physical Coding Sublayer, PCS) 及 FEC 區塊,以及可編程邏輯資源,可進行自訂錯誤注入及統計分析。

產品規格

處理子系統規格

  VP1002 VP1052 VP1102 VP1202 VP1402 VP1502 VP2502 VP1552 VP1702 VP1802 VP2802 VP1902
應用處理單元 雙核心 Arm® Cortex® A72,48 KB/32 KB L1 快取記憶體搭配奇偶校驗及 ECC;1 MB L2 快取記憶體搭配 ECC
即時處理單元 雙核心 Arm Cortex R5F,32 KB/32 KB L1 快取記憶體及 256 KB TCM 搭配 ECC
記憶體 256 KB 晶片上記憶體搭配 ECC
連線能力 乙太網路 (x2);UART (x2);CAN FD (x2);USB 2.0 (x1);SPI (x2);I2C (x2)

AI 引擎與 DSP 引擎規格

  VP1002 VP1052
VP1102 VP1202 VP1402 VP1502 VP2502 VP1552 VP1702 VP1802 VP2802 VP1902
AI 引擎 - - - - - - 472
- - - 472 -
DSP 引擎 1,140 1,572 1,904 3,984 2,672 7,440 7,392 7,392 10,896 14,352 14,304 6,864

可程式化邏輯規格

  VP1002 VP1052 VP1102 VP1202 VP1402 VP1502 VP2502 VP1552 VP1702 VP1802 VP2802 VP1902
系統邏輯單元 (K) 833 1,186 1,575 1,969 2,233 3,763 3,738 3,837 5,558 7,352 7,326 18,507
LUT 380,800 542,080 719,872 900,224 1,020,928 1,720,448 1,708,672 1,753,984 2,540,672 3,360,896 3,349,120 8,460,288

基礎平台規格

  VP1002 VP1052 VP1102 VP1202 VP1402 VP1502 VP2502 VP1552 VP1702 VP1802 VP2802 VP1902
GTY 收發器 (32.75 Gb/s) 20 20   - - - - - - - - -
GTYP 收發器1 (32.75 Gb/s) - - 8 281 8 281 281 681 281 281 281 128
GTM 收發器 (58G (112G)) 24 (12) 36 (18) 64 (32) 20 (10) 96 (64) 60 (30) 60 (30) 20 (10) 100 (50) 140 (70) 140 (70) 32 (16)
PCIe® 搭配 DMA (CPM4) 2 個 Gen4x4 2 個 Gen4x4 - - - - -
- - - - -
PCIe 搭配 DMA (CPM5) -
-
- 2 個 Gen5x8 -
2 個 Gen5x8 2 個 Gen5x8 2 個 Gen5x8  2 個 Gen5x8 2 個 Gen5x8 2 個 Gen5x8 -
PCI Express®  1 個 Gen4x8 1 個 Gen4x8 2 個 Gen5x4 2 個 Gen5x4 2 個 Gen5x4 2 個 Gen5x4 2 個 Gen5x4 8 個 Gen5x4 2 個 Gen5x4 2 個 Gen5x4 2 個 Gen5x4 16 個 Gen5x4
100 G 多速率乙太網路 MAC 3 5 6 2 6
4 4 4 6 8 8 12
600 G 乙太網路 MAC 2 3 7 1 11 3 3 1 5 7 7 4
600 G Interlaken 1 2 0 0 0 1 1 0 2 3 3 0
400 G 高速加密引擎 1 1 3 1 4 2 2 2 3 4 4 0

1.16 GTYP 收發器是專供 CPM5 用於 PCI Express 的收發器。

適用於所有開發人員

AMD 提供領先業界的軟體開發環境,可使用自適應 SoC 和現場可程式化閘陣列 (Field Programmable Gate Array, FPGA) 進行設計,包括工具(編譯器、模擬器等)、IP 和解決方案。

此環境可縮短開發時間,同時讓開發人員達成高每瓦效能的目標。AMD 自適應 SoC 與 FPGA 設計工具讓 AI 科學家、應用程式與演算法工程師、嵌入式軟體開發人員,以及傳統硬體開發人員等各種開發人員,都能使用 AMD 自適應運算解決方案。

現在開始

利用套件所提供的經實證的硬體、軟體支援、工具、設計範例及文件,快速展開設計週期並快速上市。

Versal Premium VP1902

使用全球最大的1 自適應 SoC,打造新一代突破性技術。VP1902 裝置提供前一代模擬級裝置 AMD Virtex™ UltraScale+™ VU19P FPGA 的 2 倍容量。

Versal Premium 系列 VPK120 評估套件

VPK120 評估套件包含 Versal Premium VP1202 裝置,提供省電最佳化的網路連線核心,搭配多種高速連線選項。此套件專為需要大量序列頻寬、安全性與運算密度的網路與雲端應用所打造。

AMD Vitis logo

AI Engine DSP 設計流程

您可以使用 AMD Vitis™ 開發工具,或使用 Vitis Model Composer 流程來設計目標為 AMD Versal™ AI Engine 的高效能 DSP 功能,藉此善用 MathWorks Simulink® 工具的模擬與圖形功能。

資源

Versal Premium 白皮書

在省電最佳化的自行調適平台上實現突破性網路 IP 整合功能

掌握最新動態

加入 Versal 通知清單,搶先收到最新消息。

尾註
  1. 根據 AMD 2023 年 5 月的內部分析,比較 Versal Premium VP1902 裝置與 Virtex UltraScale+ VU19P 裝置之間系統邏輯單元數量的差異。(VER-001)