Ускорители для высокопроизводительных вычислений

РАЗВИТИЕ, АДАПТАЦИЯ И ОБУЧЕНИЕ

С появлением процессоров EPYC™ для серверов и графических ускорителей Radeon Instinct™ наступила новая эпоха гетерогенных и высокопроизводительных вычислений для искусственного интеллекта.

Процессор AMD EPYC™ Ускоритель Radeon Instinct™

Становление новой эпохи горизонтально масштабируемых решений для высокопроизводительных вычислений и глубинного обучения

Настоящее ускорение глубинного обучения и соответствие разнообразным нуждам центра обработки данных требуют высокопроизводительных вычислений и ускорения графического процессора, что позволит оптимизировать работу с большими объемами данных с множеством вычислений с числами с плавающей запятой. Такие вычисления можно распределить по многим ядрам. Разработчики больших систем также ищут возможности проектировать эффективные системы, которые обладают гибкостью и открытостью, отвечающей требованиям самых тяжелых на сегодняшний день рабочих нагрузок.

Компания AMD предоставляет разработчикам эти возможности и позволяет им поднять планку достигаемой плотности вычислений. Это возможно благодаря оптимизированным серверам с высокой производительностью, сниженным временем задержек и улучшенной эффективностью в открытой, гибкой среде. Представив новые серверы на базе процессора EPYC с графическими ускорителями Radeon Instinct в сочетании с платформой открытого программного обеспечения ROCm, компания AMD открывает новую эру гетерогенных технологий для высокопроизводительных вычислений и глубинного обучения.

Серверные ускорители Radeon Instinct™ MI25

Компания AMD совершила прорыв, представив продукты семейства Radeon Instinct на основе открытых стандартов. Теперь у пользователей есть доступ к опережающим время возможностям высокопроизводительных вычислений и искусственного интеллекта для центра обработки данных. Ускорители Radeon Instinct в сочетании с подходом открытой экосистемы к гетерогенным вычислениям поднимают планку достигаемой производительности, эффективности и гибкости, необходимых для создания систем, которые справятся с сегодняшними рабочими нагрузками по обработке данных.

Новый ускоритель Radeon Instinct MI25 на базе архитектуры следующего поколения Vega от AMD, который обладает мощным движком для параллельных вычислений, является лучшим в мире обучающим ускорителем для крупномасштабных приложений глубинного обучения. Этот исполнительный компонент для высокопроизводительных вычислений показывает пиковую производительность при обработке чисел с плавающей запятой в 24,6 терафлопс для формата FP16 и 12,3 терафлопс для формата FP321. Добавьте к этим показателям платформу открытого программного обеспечения ROCm и самую передовую архитектуру памяти графического процессора, память HBM2 объемом 16 ГБ с пропускной способностью до 484 ГБ/с — и вы получите лучшее решение для современных рабочих нагрузок по обработке данных.

Особенности ускорителя Radeon Instinct MI25

  • Создан на базе архитектуры следующего поколения Vega от AMD — самой передовой в мире архитектуры памяти графического процессора, и вычислительного движка следующего поколения
  • Великолепная производительность в форматах FP16 и FP32 для высокопроизводительных вычислений и глубинного обучения
  • Платформа открытого программного обеспечения ROCm для высокопроизводительных стоечных вычислений
  • Обширная поддержка базовых адресных регистров (BAR) для одноранговой коммуникации между несколькими графическими процессорами
  • Технологии виртуализации программного обеспечения MxGPU SR-IOV для оптимального использования центра обработки данных

При совместной работе серверов с новыми процессорами AMD EPYC™ и ускорителями Radeon Instinct MI25 достигается превосходная плотность вычислений и производительность на узел

Платформа открытого программного обеспечения ROCm является основой создания первоклассных систем для центров обработки данных. Она оснащена оптимизированными для высокой производительности драйверами Linux®, компиляторами, инструментами и библиотеками. В сочетании с технологиями безопасной аппаратной виртуализации MxGPU от AMD платформа позволяет клиентам менять подход к созданию систем, чтобы добиться большей эффективности и обеспечить оптимизированное использование мощностей центра обработки данных.

Подробнее


 

Платформа открытого программного обеспечения ROCm

Платформа открытого программного обеспечения ROCm предоставляет программные решения с открытым кодом для гетерогенных высокопроизводительных вычислений. Принцип создания ПО на платформе ROCm предполагает выбор программирования, минимализм и модульный подход к разработке программного обеспечения. Все этого позволяет проводить более оптимизированные вычисления с помощью ускорителя графического процессора.

Ключевые элементы платформы ROCm

HSA Foundation logo ​ ROCm Platform logo
  • Открытый 64-разрядный драйвер Headless Linux® и расширенный стек для переменных исполняемой программы системы оптимизированы для высокопроизводительных и гипермасштабируемых вычислений
  • Поддержка вычислений на нескольких графических процессорах как посредством серверной узловой коммуникации, так и без нее через удаленный прямой доступ к памяти (RDMA), а также поддержка драйвером прямой одноранговой синхронизированной RDMA-коммуникации
  • Более простая программная модель предоставляет разработчикам контроль тогда, когда это необходимо
  • Подлинные единые гетерогенные компиляторы HCC для C++ взаимодействуют с системой в целом, а не с отдельным устройством
  • Инструмент HIP для преобразования CUDA обеспечивает выбор платформы, на которой будет использоваться программный интерфейс с вычислениями на графическом процессоре

Платформа открытого программного обеспечения ROCm является надежной базой для широкомасштабных развертываний искусственного интеллекта и центра обработки данных с высокопроизводительными вычислениями. Она также содержит оптимизированный драйвер Linux с открытым кодом и независимую от языка обширную среду выполнения системы ROCr. Все это позволяет активно использовать программный интерфейс среды выполнения архитектуры гетерогенных систем (HSA). Такой подход предоставляет обширную основу для использования языков программирования, таких как HCC C++, OpenCL™ от Khronos Group, Anaconda Python от Continuum, а также инструмента HIP для преобразования CUDA.2

Компания AMD продолжает следовать открытому подходу, чтобы расширить поддержку важных инструментов графическими ускорителями процессора Radeon™, требуемых для ускорения класса NUMA и развертывания высокопроизводительных вычислений и глубинного обучения. Сейчас платформа ROCm поддерживает новое семейство ускорителей графического процессора Radeon Instinct, а также ряд других видеокарт AMD FirePro™ S-серии, Radeon™ RX-серии и Radeon™ Pro Duo. Чтобы ознакомиться с полным списком поддерживаемых видеокарт, посетите веб-сайт ROCm.

Подробнее


 

Поддержка стандартов OpenCL™, OpenMP и OpenACC​​

OpenCL 

Компания AMD продолжает поддерживать эти стандарты в своих новейших продуктах3. Мы убеждены, что большинство специалистов в области высокопроизводительных вычислений хотят использовать открытые стандарты в своих проектах и модельных экспериментах. Компания AMD стремится поддерживать эту цель и, продвигая открытые стандарты, активно работает с пользователями.

 Ускорители AMD FirePro™ S-серии

AMD FirePro™ S9300 x2  

У​скорьте работу при высочайших нагрузках, связанных с высокопроизводительными вычислениями в области анализа информации или обработки сейсмических данных с помощью самого быстрого в мире ускорителя для вычислений с одинарной точностью, серверной видеокарты AMD FirePro™ S9300 x24,5. Воспользуйтесь многочисленными инструментами и библиотеками, включая инструменты ROCm, доступными на странице разработчиков на сайте http://www.gpuopen.com/?sessionGUID=19a21a7b-29e9-525c-9876-67ad3aeb2e79&webSyncID=79e9a94d-12cd-1236-3665-5eacc850c9cd&sessionGUID=e8485a29-c782-b424-5038-bdc37a33c4e8

Недавно один из наших клиентов, компания CGG, являющаяся лидером в области современных геофизических исследований, провела сравнительный тест по моделированию решения волнового уравнения на различных ускорителях графических процессоров, включая новую видеокарту AMD FirePro™ S9300 x2. По мере увеличения сложности волнового уравнения возрастало и преимущество видеокарты AMD FirePro™ S9300 x2, скорость которой превысила все другие тестируемые видеокарты в 2 раза.6

Wave Table 

Диаграмма предоставлена компанией CGG

Ускорители AMD FirePro™ S9100, S9150 и S9170

 ​Тем, кому нужна превосходная производительность при обработке чисел двойной точности, следует обратить внимание на серию видеокарт AMD FirePro™ S9100. Видеокарта AMD FirePro™ S9150, установленная в суперкомпьютере, занявшем в 2014 году первое место в списке Green500, обеспечивает более чем 50%-ное превосходство в производительности при обработке чисел двойной точности по сравнению с видеокартой Tesla K40. 7

Посмотрите интервью с доктором наук Дэвидом Рором и профессором Линденcтрутом о кластере L-CSC — №1 в списке суперкомпьютеров Green500 за 2014 год.

 

 

DGEMM, или умножение матриц с двойной точностью, измеряет скорость обработки чисел двойной точности с плавающей запятой при реальном умножении матриц. Существует множество областей, в которых используются матричные операции с числами двойной точности. К ним относятся расчеты в области гидродинамики, анализ методом конечных элементов, структурное моделирование и молекулярная динамика.

Внедрив библиотеку AMD OpenCL BLAS, мы можем получить 2 терафлопс производительности умножения матриц с двойной точностью (DGEMM) при использовании видеокарты AMD FirePro™ S9150, в то время как у Tesla K40 этот показатель составил 1,3 терафлопс.

Благодаря наличию памяти GDDR5 объемом 32 ГБ видеокарта AMD FirePro™ S9170 отлично подходит тем, кому требуется выполнять умножение больших матриц. Видеокарты Nvidia K80 и K40, с объемом памяти 24 ГБ и 12 ГБ соответственно, не способны выполнять вычисления с матрицами, слишком большими для их встроенной памяти.

 Технические характеристики ускорителей AMD FirePro™ S-серии

Решения для высокопроизводительных вычислений на базе серверных видеокарт AMD FirePro™

Серверные видеокарты AMD FirePro™ S-серии используются в продуктах, способных удовлетворить практически любые потребности: от научных исследований в области расчетной гидродинамики до обработки сейсмических данных и моделирования пластов в нефтегазовой отрасли. Благодаря высочайшей производительности при обработке чисел одинарной и двойной точности серверные видеокарты AMD FirePro подходят для любых сложных с вычислительной точки зрения проектов, которые требуют использования возможностей графических процессоров производить массивную параллельную обработку.4​

​​​​​S9100​S9150​​S9170​S9300 X2​
AMD FirePro™ S9300 x2
​Потоковые Процессоры с Архитектурой GCN​2560​28162816​​​8192​
Одинарная точность (Гигафлопс)​4220​5070​5240​​​13900​
Двойная точность (Гигафлопс)​2110​2530​2620​​​​870​
Встроенная память12 ГБ GDDR5​16 ГБ GDDR532 ГБ GDDR5​8 ГБ​ HBM
​ECC​Да (внеш.)Да (внеш.)​Да (внеш.)​​​Нет​
Пропускная способность памяти (Гб/с):​320​320​320​​1024​
Интерфейс​PCIe 3.0,
два разъема
​PCIe 3.0,
два разъема
​PCIe 3.0,
два разъема
​PCIe 3.0,
два разъема​
Максимальное энергопот-pебление​225 Вт​235 Вт​275​ Вт​​300 Вт​
Охлаждение​Пассивный
радиатор
​Пассивный
радиатор
​Пассивный
радиатор
​​Пассивный
радиатор​
Реко
​менуется для

Процессы,
требующие
обработки чисел двойной точности:

Кластеры научных и правительственных организаций

Нефтегазовая
отрасль — моделирование
пластов

Процессы,
требующие
обработки чисел двойной точности:

Кластеры научных и правительственных организаций

Нефтегазовая
отрасль — моделирование
пластов

Процессы,
требующие
обработки чисел двойной точности:

Кластеры научных и правительственных организаций

Нефтегазовая
отрасль — моделирование
пластов​

Процессы,
требующие
​обработки
чисел одинарной
точности:

Молекулярная динамика

Геофизика​

Глубокие
нейронные сети / Машинное
обучение

 Где купить?

Ускорители AMD FirePro™ можно приобрести у различных производителей и системных интеграторов, в том числе у компаний Dell, HPE и SuperMicro.

Dell ​ ​ ​ ​​ ​HPE
 ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​  ​ ​ ​ ​​ SuperMicro ​ ​ ​ ​​ 
​​

Дополнительную информацию о серверах Dell с видеокартами AMD FirePro™ см. на сайте www.amd.com/dell-server

Дополнительную информацию о серверах HPE с видеокартами AMD FirePro™ см. на сайте ​ www.amd.com/hpe

  

  

  

  

  

Сноски