Серверный графический процессор AMD FirePro™ S9300 x2

AMD FirePro™ S9300 Server GPU
 
 
 

​​​​​​Первый в мире графический ускори​тель с пропускной способностью памяти 1 ТБ/с

Ускорьте наиболее сложные высокопроизводительные вычисления в рамках заданий по анализу данных или обработке сейсмических данных с помощью самого быстрого в мире графического ускорителя с обработкой чисел одинарной точности — серверного графического процессора AMD FirePro™ S9300 x2.2,4

 
 
 

 Обзор

​Новый серверный графический процессор AMD FirePro™ S9300 x2 — это первый в мире профессиональный графический ускоритель, оборудованны​й памятью с высокой пропускной способностью (HBM), и первый в мире ускоритель, совместимый с инструментами и библиотеками AMD для профессиональных вычислений GPUOpen. HBM позволяет серверному графическому процессору AMD FirePro S9300 x2 получить преимущество благодаря увеличению пропускной способности памяти в 3,5 раза по сравнению с NVIDIA Tesla M40 и в 2,1 раза по сравнению с NVIDIA Tesla K803.

Серверный графический процессор AMD FirePro S9300 x2, построенный на базе архитектуры AMD Graphics Core Next (GCN) третьего поколения, обеспечивает пиковую производительность при обработке чисел одинарной точности с плавающей запятой до 13,9 терафлопс — больше, чем любой другой имеющийся на рынке графический ускоритель для обработки чисел одинарной точности4. По сравнению с флагманским процессором Intel Xeon E5 преимущество в чистой производительности графического процессора FirePro™ S9300 x2 еще более впечатляюще — 15-кратное увеличение пропускной способности памяти и более чем 12-кратное увеличение пиковой производительности при обработке чисел одинарной точности6.

Превосходный ускоритель нуждается в превосходной экосистеме для разработчиков. Благодаря пакету программ для разработки «Профессиональные вычисления GPUOpen», серверный графический процессор AMD FirePro S9300 x2 использует первый драйвер AMD для Linux® с открытым исходным кодом, разработанный специально для вычислений, а также поддерживает ускорение с использованием C++ в дополнение к OpenCL™. Другим преимуществом для тех, у кого есть код в CUDA, является возможность легко портировать большинство кода в C++, обеспечивая компаниям более свободный выбор между поставщиками.

 Преимущества

  • Серверный графический процессор AMD FirePro™ S9300 x2 обеспечивает наивысшую производительность вычислений при обработке чисел с плавающей запятой среди графических ускорителей4.
  • Серверный графический процессор AMD FirePro™ S9300 x2 является первым и единственным в мире профессиональным графическим процессором, оснащенным памятью с высокой пропускной способностью (HBM)1.
  • Серверный графический процессор AMD FirePro™ S9300 x2 поддерживает пакет программ для разработки AMD GPUOpen, позволяя разработчикам выполнять программирование и компиляцию в C++ или OpenCL™.​

 Особенности

​Платформа Radeon Open Compute (ROCm)

Драйвер для Linux®с открытым исходным кодом, оптимизированный для вычислений, поддержка ускорения графического процессора с использованием нового компилятора для обработки кода, написанного на языке программирования C++, а также другие инструменты для разработчиков, такие как Heterogeneous-compute Interface for Portability (HIP) для преобразования кода CUDA в C++.

Платформа ROCm создана для масштабирования. Она поддерживает одноранговые вычисления на нескольких графических процессорах, включая соединение через удаленный доступ к памяти.

Платформа ROCm отличается высокой продолжительностью непрерывной работы системы, а также важными функциями, требуемыми для требовательных приложений, компиляторов и разработки в языковой исполняющей среде.

HSA Foundation 

Исполняющая среда, совместимая с гипермасштабируемым ускорителем, и драйвер для графических процессоров AMD Radeon™ и FirePro™

Профессиональные вычисления GPUOpen

Состоит из драйвера для Linux с открытым исходным кодом, оптимизированным для вычислений, поддержки графического ускорения с использованием нового компилятора для обработки кода, написанного на языке программирования C++, а также других средств разработчика, таких как инструмент «Интерфейс неоднородных вычислений для обеспечения портируемости (HIP)», для портирования программного кода, написанного для CUDA, в C++.

Инструмент «Интерфейс неоднородных вычислений для обеспечения портируемости (HIP)»

Используя данный бесплатный инструмент с открытым исходным кодом, можно легко конвертировать программный код в C++, обеспечивая при этом совместимость с компиляторами CUDA. Инструмент HIP позволяет разработчикам портировать большую часть их программного кода CUDA в C++ в одно мгновение. Начните использовать сегодня графический процессор AMD FirePro S9300 x2 — ускоритель, расчитанный на работу с открытым исходным кодом от AMD.

Поддержка OpenCL™ 1.2

Помогает профессионалам прикоснуться к параллельной вычислительной мощности современных графических и многоядерных процессоров для ускорения ресурсоемких задач в ведущих приложениях САПР, а также мультимедийных и развлекательных приложениях, поддерживающих OpenCL. Серверный графический процессор AMD FirePro S9300 x2 поддерживает технологию OpenCL™ 1.2, позволяя разработчикам воспользоваться преимуществами нового функционала, который предоставляет графическим процессорам больше свободы при выполнении своей работы.

13,9 терафлопс пиковой производительности при обработке чисел одинарной точности

Ускоряет операции с числами одинарной точности с плавающей запятой в приложениях симуляции, улучшения качества видео, обработки сигнала, перекодировки видео и цифрового рендеринга, в которых высокая производительность важнее точности. Благодаря тому, что пиковая производительность AMD FirePro™ S9300 x2 при обработке чисел одинарной точности составляет 13,9 терафлопс, можно сконфигурировать 2P-сервер с восемью графическими процессорами, достигнув более 111 терафлопс пиковой производительности при обработке чисел одинарной точности. Таким образом, в стандартной серверной стойке 42U с десятью серверами на 4U теоретически можно достичь производительности при обработке чисел одинарной точности более 1 петафлопс!

870 гигафлопс пиковой производительности при обработки чисел двойной точности

Ускоряет операции с числами двойной точности с плавающей запятой в приложениях расчетной гидродинамики, структурной механики, моделирования коллекторов и аэродинамики, где точность чисел является крайне важной.

Поддержка обработки чисел половинной точности (FP16)

Разработчики, которым не нужна точность 32-разрядных математических операций, теперь могут использовать 16-разрядные операции, для того чтобы достичь высокой производительности посредством более эффективного использования пропускной способности памяти и сокращения объема используемой памяти.

Память с высокой пропускной способностью объемом 8 ГБ

Память с высокой пропускной способностью (HBM) — это новый тип памяти с низким энергопотреблением и сверхширокими полосами связи. В ней применяются вертикально расположенные чипы памяти, соединенные микроскопическими проводками, называемыми «сквозные отверстия сквозь кремний» (TSV) , размещенные непосредственно на подложке, благодаря чему сокращается расстояние, которое информация проходит между памятью и процессором.

Технология AMD PowerTune

Технология AMD PowerTune — это система интеллектуального управления энергопотреблением, контролирующая активность и энергозатраты графического процессора. AMD PowerTune оптимизирует работу графического процессора путем сокращения энергопотребления при уменьшении нагрузки и обеспечивает оптимальную тактовую частоту для наивысшей возможной производительности в рамках текущих энергозатрат при высокоинтенсивных нагрузках.5

 Технические характеристики

​Охлаждение/энергопотребление/форм-фактор

  • Максимальное энергопотребление: 300 Вт
  • Интерфейс шины: PCIe® Gen 3 x16
  • Форм-фактор: Два разъема, полная длина, полная высота
  • Охлаждение: Пассивное

Память

  • Объем/тип: 8 ГБ HBM
  • Пропускная способность: 1 ТБ/с (2x 512 ГБ/с)

Поддержка программных интерфейсов и ОС

  • OpenCL™ 1.2
  • HC (Неоднородные вычисления)
  • C++ AMP
  • 64-разрядная ОС Linux®

Поддерживаемые технологии AMD

  • Технология AMD PowerTune5

Системные требования

  • Сервер на базе PCI Express® с одним свободным разъемом x16. AMD рекомендует PCI Express® v 3.0 для достижения оптимальной производительности
  • Источник питания с двумя 8-контактными дополнительными разъемами питания
  • Поток воздуха через графический процессор не менее 25 куб. футов в минуту, максимальная температура на входе — 45˚C
  • Рекомендуемый объем системной памяти DDR3/DDR4 — не менее 16 ГБ

Гарантия и поддержка

  • Трехлетняя ограниченная гарантия на ремонт/замену продукта
  • Прямая бесплатная телефонная линия и связь по электронной почте со специальной командой технической поддержки по рабочим станциям7
  • Дополнительная опция замены компонентов

 Ресурсы

Профессиональные вычисления GPUOpen

Технология «Профессиональные вычисления GPUOpen» разработана для того, чтобы обеспечить всем разработчикам возможность ускорения внедрения их видения и помочь решить самые сложные задачи, связанные с интуитивными высокопроизводительными вычислениями на базе графических процессоров посредством использования оптимизированных драйверов/сред приложений и стандартизированных языков, библиотек и приложений.

Подробнее

 Полезные сведения о заказчиках: Компания CGG

 

Компания CGG является лидером современной геофизики. CGG вышла на лидерские позиции, сконцентрировавшись на инновациях и приверженности разработке наиболее стабильных решений для вопросов энергопотребления, с которыми сталкиваются клиенты компании. Компания обеспечивает своих клиентов уникальными технологиями, услугами и оборудованием, разработанными для получения максимально точных данных и изображений из подземных пластов. CGG также предоставляет современное программное обеспечение и услуги для анализа этих данных и получения более точного представления о подземных пластах для исследования, добычи и оптимизации нефтяных и газовых залежей.

Недавно компания CGG осуществила собственное модельное тестирование волнового уравнения на нескольких графических ускорителях, включая графический процессор AMD FirePro™ S9300 x2. По мере увеличения сложности волнового уравнения графический процессор AMD FirePro™ S9300 x2 увеличивал отрыв от других тестируемых карт в производительности, пока не превысил производительность других тестируемых графических карт в два раза8.

 

График предоставлен компанией CGG 

«Мы очень довольны вычислительными кластерами AMD FirePro™, — сказал Джин-Ив Бланк, главный ИТ-архитектор компании CGG. — Мы также сильно впечатлены пропускной способностью AMD FirePro S9300 x2 в 1 ТБ/с, при том, что эта карта обеспечивает двухкратное превышение производительности других серверных видеокарт в программах моделирования волновых уравнений CGG».

Марк Чибукджян из компании CGG недавно провел в Университете Райс презентацию по GPUWrapper — портируемому программному интерфейсу для неоднородных вычислений. Посмотреть презентацию Марка можно, перейдя по ссылке ниже.

Смотреть

 

Компания CGG установила свою первую стойку вычислительных систем, охлаждаемых погружением в масло, в июне 2011 года. Со временем CGG сделала определенные выводы по результатам внедрения данного решения, включая фактическое сокращение расходов (капитальные затраты, эксплуатационные затраты), количество отказов оборудования, теплотехнические характеристики и оперативные вопросы. Узнать больше о системе охлаждения погружением в масло в дата-центре обработки сейсмических данных компании CGG можно в видео по ссылке ниже.

Смотреть

 Драйверы

  

Сноски