Série Versal AI Core

Offre une inférence d'IA révolutionnaire et une accélération sans fil avec des moteurs d'IA intégrés qui offrent des performances de calcul exceptionnelles

La plus grande puissance de calcul de la gamme pour une accélération maximale des charges de travail et de l'IA

Versal™ AI Core Series block diagram

Fonctionnalités clés

abstract processor
Système de traitement

Trois types de processeurs scalaires sont disponibles dans les systèmes sur puce (SoC) adaptatifs Versal pour répondre aux différents besoins des applications. L'unité de traitement des applications est idéale pour les applications complexes prises en charge par un système d'exploitation, tandis que l'unité de traitement en temps réel est parfaite pour les applications nécessitant un faible temps de latence, un déterminisme et un contrôle en temps réel. Un contrôleur de gestion de plateforme distinct gère le démarrage du système, la sécurité et le débogage.

abstract processor
Logique programmable

La logique programmable permet de développer des blocs de calcul personnalisés pour des algorithmes en constante évolution. La logique repensée des SoC adaptatifs Versal fournit une densité par CLB multipliée par 4, ce qui réduit les coûts liés au routage global. Grâce à sa grande variété d'éléments de mémoire et à un couplage étroit avec des E/S programmables, la logique programmable permet aux utilisateurs de créer des accélérateurs puissants pour n'importe quelle application.

wave texture
Moteurs d'IA et moteurs DSP

Les moteurs d'IA fournissent une densité de calcul jusqu'à 5 fois plus élevée pour les algorithmes vectoriels. Ils sont en outre optimisés pour les calculs du traitement de signal numérique (DSP) et de l'IA/du ML en temps réel et offrent des performances déterministes.

Les moteurs DSP améliorés prennent en charge de nouveaux types de données et d'opérations, y compris les opérations à virgule flottante en simple et demi-précision et les opérations complexes 18x18.

generic processor image
E/S de nouvelle génération

La série Versal Prime combine la conformité PCIe® de 4e et 5e générations, des entrées-sorties à usage général (GPIO) hautes performances, des moteurs de cryptographie haute vitesse (HSC) 400G* et des MAC Ethernet multirate prenant en charge diverses configurations Ethernet pour optimiser la connectivité et la flexibilité. En outre, les appareils de la série Versal Prime intègrent des émetteurs-récepteurs 32,75 Gbit/s repensés à faible temps de latence, et certains appareils prennent en charge les émetteurs-récepteurs PAM4 58 Gbit/s et 112 Gbit/s*.

* Seul le modèle VM2152 prend en charge les moteurs HSC 400G et les émetteurs-récepteurs PAM4 112 Gbit/s

Programming code abstract technology background of software developer and  Computer script
Unité de décodage vidéo

Les unités de décodage vidéo (VDU) renforcées à puissance optimisée comprennent plusieurs moteurs de décodeur vidéo (VDE) prenant en charge H.264 et H.265 d'un flux 4Kp60 unique à trente-deux flux 720p15 maximum par moteur. Les VDU sont idéales pour de nombreuses applications de traitement d'image où plusieurs entrées vidéo alimentent un hub central qui assure le décodage et exécute des algorithmes de ML avancés.

3D rendering of AI. Circuit board.
Réseau sur puce programmable

Le réseau sur puce (NoC) programmable fournit une interconnexion multitérabit optimisée entre les différents moteurs de calcul et les blocs IP intégrés présents dans l'architecture de SoC adaptatifs Versal, ce qui simplifie la fermeture temporelle et économise les ressources logiques. Le compilateur NoC offre une expérience de programmation rationalisée tout en permettant aux utilisateurs de gérer le temps de latence et la qualité de service, assurant ainsi que les chemins de données critiques soient prioritaires.

Applications et secteurs

Radio 5G et formation de faisceaux

La formation de faisceaux nécessite un traitement du signal en temps réel massif. Alors que les moteurs adaptables gèrent le contrôle de l'état et le formatage des données, les moteurs d'IA et DSP gèrent des charges de travail de traitement de signaux à virgule fixe et flottante pour un traitement parallèle hautes performances.

Calcul dans le centre de données

À mesure que les réseaux neuronaux convolutionnels continuent d'évoluer, faire face aux exigences croissantes en matière de densité de calcul est un véritable défi qui ne peut être relevé que par les appareils de la série Versal AI Core, ceux-ci disposant de moteurs d'IA optimisés pour fournir une densité de calcul à la fois économique et efficace sur le plan énergétique.

Traitement vidéo pour les villes intelligentes

Les appareils de la série Versal AI Core propulsent la myriade de nouvelles applications de traitement vidéo déployées en périphérie pour les villes intelligentes, avec des moteurs d'IA qui assurent la reconnaissance en temps réel des plaques d'immatriculation, la reconnaissance faciale ou la classification des objets, des unités de décodage vidéo pour le transcodage vidéo et des moteurs adaptables pour la mise à l'échelle, la compression et la personnalisation des vidéos.

Traitement d'images médicales

La série Versal AI Core accélère la formation de faisceaux parallèles et le traitement d'images en temps réel pour créer des images de meilleure qualité et des analyses d'images basées sur des machines, pour permettre aux médecins et aux radiologues d'établir des diagnostics plus rapides et plus précis.

Traitement de radars

L'association de puissants moteurs DSP vectoriels à des moteurs d'IA dans un format compact permet de créer des radars avancés, comme les radars à balayage électronique à antenne active. Les appareils de la série AI Core offrent une bande passante d'antenne de plusieurs térabits par seconde dans un seul boîtier.

Équipement de test sans fil

Le DSP en temps réel est largement utilisé dans les équipements de test des communications sans fil. L'architecture du moteur Versal AI Engine est parfaitement adaptée à la gestion de tous les types d'implémentation de protocoles, y compris la 5G, du front-end numérique à la bande de base, en passant par la formation de faisceaux.

Spécifications de produits

Fonctionnalités du sous-système de traitement

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
Unité de traitement d'application Arm® Cortex®-A72 double cœur, 48 Ko/32 Ko de cache L1 avec parité et ECC ; 1 Mo de cache L2 avec ECC
Unité de traitement en temps réel Arm Cortex-R5F double cœur, 32 Ko/32 Ko de cache L1 et TCM 256 Ko avec ECC
Mémoire Mémoire sur puce 256 Ko avec ECC 
Connectivité Ethernet (x2) ; USB 2.0 (x1) ; UART (x2) ; SPI (x2) ; I2C (x2) ; CAN-FD (x2)

Fonctionnalités du moteur d'IA et du moteur DSP

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
Moteurs d'IA 198 304 300 400 0 0
Moteur d'IA-ML 0 0 0 0 152 304
Moteurs DSP 1 032 1 312 1 600 1 968 984 1 312

Fonctionnalités de la logique programmable

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
Cellules logiques du système (K) 815 981 1 586 1 968 820 1 139
LUT  372 352 448 512 725 000 899 840 375 000 520 704

Fonctionnalités de la plateforme de base

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
Unité principale NoC/Ports secondaires NoC 21 21
28 28 21 21
Contrôleurs de mémoire DDR 3 3
4 4 3 3
PCIe® avec DMA (CPM) 1 x Gen4x16
1 x Gen4x16
1 x Gen4x16
1 x Gen4x16
2 x Gen5x8
2 x Gen5x8
PCI Express® 4 x Gen4x8 4 x Gen4x8 4 x Gen4x8 4 x Gen4x8 4 x Gen5x4 4 x Gen5x4
MAC Ethernet multirate 100G 3 4 4 4 2 2
Moteurs de décodeur vidéo (VDE) - - - - 2 4
Émetteurs-récepteurs GTY 32 44 44 44 0 0
Émetteurs-récepteurs GTYP 0 0 0 0 321 321

1. 16 émetteurs-récepteurs GTYP sont dédiés à CPM5 pour une utilisation PCI Express.

Pour tous les développeurs

AMD fournit un environnement de développement logiciel de pointe pour la conception avec des FPGA et SoC adaptatifs, y compris des outils (compilateurs, simulateurs, etc.), des IP et des solutions.

Cet environnement permet aux développeurs de réduire le temps de développement tout en atteignant des performances par watt élevées. Ces outils permettent à tous les développeurs, des scientifiques en IA aux ingénieurs d'applications et d'algorithmes en passant par les développeurs de logiciels intégrés et les développeurs de matériel traditionnels, d'utiliser les solutions de calcul adaptatives AMD.

Démarrer

Lancez votre cycle de design et accélérez la mise sur le marché grâce au matériel éprouvé, à l'assistance logicielle, aux outils, aux exemples de design et à la documentation disponibles avec le kit.

Sapphire Edge+ VPR-4616

Commencez votre développement avec le kit d'évaluation VCK190 de la série Versal AI Core

Commencez à évaluer les capacités de la série Versal AI Core dès aujourd'hui avec le kit d'évaluation VCK190, qui comprend le modèle VC1902. Tirant parti des moteurs d'IA sur puce optimisés pour l'inférence ML et le traitement de signal, cette plateforme est idéale pour développer des applications DSP et ML extrêmement gourmandes en ressources de calcul et sensibles au temps de latence. Lancez votre cycle de design et accélérez la mise sur le marché grâce au matériel éprouvé, à l'assistance logicielle, aux outils, aux exemples de design et à la documentation disponibles avec le kit.

Ressources

Formations en ligne

Les ressources de formation et d'apprentissage AMD vous offrent les compétences pratiques et les connaissances fondamentales dont vous avez besoin pour être pleinement productif dans votre prochain projet de développement.

Tenez-vous au courant

Inscrivez-vous à la liste de notification sur les SoC adaptatifs Versal pour recevoir les dernières actualités et mises à jour.