exascale supercomputer - Frontier

Leistung für das Exascale-Zeitalter

Die Grenzen der Forschung sprengen – AMD kündigt Pläne zur Ausrüstung eines neuen Supercomputers der Exascale-Klasse in Zusammenarbeit mit dem amerikanischen Energieministerium, Oak Ridge National Laboratory und Cray Inc. an.

Radeon Instinct and Epyc

Lösungen für Hochleistungs-Computing

Ein neues Zeitalter heterogenen Computings für Maschinenintelligenz und HPC bricht durch die Ankunft der EPYC™ Serverprozessoren und Radeon Instinct™ GPU-Beschleuniger an

Der Anbruch eines neuen Zeitalters horizontal skalierbaren Computings für HPC und Deep Learning

Um das Tempo des Deep Learning zu beschleunigen und die breiten Anforderungen des Rechenzentrums zu erfüllen, ist eine Kombination aus Hochleistungs-Computing und GPU-Beschleunigung notwendig, die dafür optimiert wurde, enorme Datenmengen mit einer Menge von Gleitkommaberechnungen, die über viele Kerne verteilt werden können, zu bewältigen. Wer heute große Systeme entwickelt, braucht ein effizientes System, das ebenso flexibel wie offen ist. Nur so lassen sich die Herausforderungen großer Arbeitslasten bewältigen.

AMD legt die Latte höher in Sachen Rechnerdichte. Das macht optimierte Serverkonzepte mit hoher Leistung, niedriger Latenz und herausragender Effizienz in einer offenen, flexiblen Umgebung möglich. Mit der Einführung neuer, auf dem EPYC Prozessor basierender Server mit Radeon Instinct GPU-Beschleunigern und in Kombination mit unserem offenen Software-Ökosystem ROCm (Radeon Open  eCosystem Rechenplattform) läutet AMD ein neues Zeitalter heterogenen Computings für HPC und Deep Learning ein.

AMD + HPE + Notre Dame case study

University of Notre Dame

Das Center of Research Computing der University of Notre Dame nutzt AMD EPYC™ Prozessoren für bessere HPC-Dichte und schnellere Ergebnisse.

EPYC OSU

Oregon State University

Die Oregon State University braucht Prozessoren mit mehreren physischen und logischen Kernen für ihre datengestützte Genomforschung in der Bio- und Umweltwissenschaft.

Radeon™ Instinct™

Entfesseln Sie Entdeckungen auf dem weltweit schnellsten Double Precision PCIe® Beschleuniger¹

Die Radeon Instinct™ MI60 Compute Card wurde für hohe Deep-Learning-Leistung, Hochleistungs-Computing (HPC), Cloud-Computing und Rendering-Systeme konzipiert. Dieser neue Beschleuniger ist ausgestattet mit optimierten Deep-Learning-Operationen, innovativer Leistung mit doppelter Präzision1 und hyperschnellem HBM2 Speicher mit Geschwindigkeiten von bis zu 1 TB/s Speicherbandbreite. Damit lassen sich schnell zuverlässige und genaue Ergebnisse bei großen Systembereitstellungen mit Full-Chip-ECC- und -RAS-Fähigkeiten erreichen.

Wird diese genauestens ausbalancierte und ultra-skalierbare Lösung mit unserem offenen ROCm-Ökosystem kombiniert, das für Radeon Instinct optimierte Treiber, Compiler, Bibliotheken und Leistungstools enthält, so entsteht eine Lösung, die für das nächste Zeitalter der Rechner- und Maschinenintelligenz bereit ist.

ROCm logo

ROCm – Das Open Software-Ökosystem für GPU Computing.

Die ROCm-Ökosystem liefert eine Open-Source-Grundlage für heterogenes Computing der HPC-Klasse und Systemkonzepte der Spitzenklasse für Rechenzenten. Die ROCm-Software-Designphilosophie bietet Wahlmöglichkeiten bei der Programmierung, Minimalismus und einen modularen Software-Entwicklungsansatz, der optimiertes GPU-Beschleuniger-Computing ermöglicht. Darüber hinaus sorgen die virtualisierten MxGPU-Technologien der AMD Hardware für mehr Effizienz und optimierte Nutzung von Rechenzentren.

Zu den grundlegenden Elementen von ROCm gehören:

  • Open Headless Linux® 64-Bit-Treiber und Rich-System-Runtime-Stack, optimiert für Hyperscale und Computing der HPC-Klasse
  • Multi-GPU-Computing, das Kommunikation innerhalb und außerhalb der Server-Knoten über RDMA unterstützt, mit direkter RDMA-Peer-Sync-Unterstützung im Treiber
  • Ein einfaches Programmiermodell gibt Entwicklern dort die im Bedarfsfall erforderliche Kontrolle.
  • Echte HCC-Single-Source- und heterogene C++-Compiler, die das ganze System behandeln und nicht nur ein einzelnes Gerät
  • HIP CUDA-Konvertierungstool ermöglicht die Wahl der Plattform

AMD setzt auch weiterhin auf einen offenen Ansatz beim Ausbau kritischer Funktionen, die für eine Beschleunigung der NUMA-Klasse für unsere Radeon™ GPU Beschleuniger bei HPC- und Deep-Learning-Bereitstellungen erforderlich ist.

OpenCL logo

OpenMP-, HIP-, OpenCL™- und Python-Programmierunterstützung

Diese Standards werden auch bei unseren aktuellen Produktangeboten weiterhin unterstützt2. Unserer Erfahrung nach bevorzugen die meisten Anwender im Bereich Hochleistungs-Computing (HPC) offene Standards als Basis für ihre Projekte und Simulationen. Darum hat sich AMD der Unterstützung dieses Ziels verpflichtet und arbeitet eng mit der HPC-Community zusammen, um mit Nachdruck diese offenen Standards zu fördern.

Fußnoten

FUSSNOTEN

  1. Nach den am 22. Oktober 2018 durchgeführten Berechnungen erreicht die Radeon Instinct MI60 GPU einen Spitzenwert von 7,4 TFLOPS bei der Gleitkommaleistung (FP64) mit doppelter Genauigkeit. Mit der folgenden Gleichung durchgeführte AMD TFLOPS-Berechnungen: FLOPS-Berechnung werden durchgeführt, indem die Speichertaktrate vom höchsten DPM-Status mit xx CUs pro GPU multipliziert wird. Diese Zahl wird dann mit xx Stream-Prozessoren multipliziert, die in jeder CU vorhanden sind. Diese Zahl wird schließlich mit 2 FLOPS pro Takt für FP64 multipliziert.  Die TFLOP-Berechnung für MI60 finden Sie unterhttps://www.amd.com/de/products/professional-graphics/instinct-mi60  Externe Ergebnisse für den NVidia Tesla V100 GPU-Beschleuniger (16-GB-Karte) ergaben einen Spitzenwert von 7 TFLOPS bei der Gleitkommaleistung (FP64) mit doppelter Genauigkeit.  Ergebnisse unter: https://images.nvidia.com/content/technologies/volta/pdf/437317-Volta-V100-DS-NV-US-WEB.pdf  AMD hat die Ergebnisse externer Dritter nicht eigens getestet und übernimmt keine Verantwortung für Fehler oder Auslassungen in diesen Daten. RIV-3
  2. Einige Karten unterstützen möglicherweise nicht alle der aufgeführten Standards. Einzelheiten zu den unterstützten Standards entnehmen Sie bitte den technischen Daten der jeweiligen Grafikkarte.

 

OpenCL ist eine Marke von Apple Inc.; Verwendung mit Genehmigung der Khronos Group Inc.