Смысл машинного и глубинного обучения

Сегодня понятие искусственного интеллекта (ИИ) используется в основном в качестве общего термина для всех форм компьютерного интеллекта. Условно его можно применить к любой системе, которая имитирует процессы обучения и принятия решений, характерные для человека, в ответ на входные данные, анализирует данные, распознает шаблоны или разрабатывает стратегии. Понятия машинного обучения (МО) и глубинного обучения (ГО) более точно описывают современные интеллектуальные вычислительные системы и проблемы разработчиков и пользователей, которые они могут решать.

Сравнение машинного обучения и глубинного обучения

Современные интеллектуальные системы машинного и глубинного обучения могут корректировать параметры выполняемых ими операций на основе анализа непрерывно получаемых данных. В реальности эти области компьютерной науки имеют едва заметные различия.

Понятие машинного обучения (МО) применяется к системе, которая может активно обучаться, а не просто пассивно получать информацию для обработки. Такая компьютерная система запрограммирована реагировать на входные данные как человек. Для этого используются алгоритмы анализа данных для поиска шаблонов и структур. Алгоритмы МО разработаны таким образом, что их производительность повышается со временем благодаря получению все большего количества данных.

Когда человек распознает что-то, это происходит мгновенно. Чтобы имитировать этот процесс, в алгоритмах машинного обучения используются нейронные сети. Как и в процессе обучения человека, компьютерная нейронная сеть классифицирует данные (например, большой набор фотографий) на основании распознанных элементов в изображении. При использовании «экспертной» обратной связи от человека доля успешных попыток классификации может расти со временем. Такая обратная связь помогает системе обучаться и подтверждать правильные решения, отличая их от неправильных, что позволяет достичь оптимальной эффективности и повысить точность. После этого алгоритм нейронной сети изменяет все будущие решения на основании полученной обратной связи. Этот процесс имитирует распознавание образов человеком путем обучения сети для выдачи необходимых выходных данных.


1. Нейронная сеть может определить следующее:

а) какая-либо форма является повторяющимся элементом;
б) перечень возможных форм.

machine intelligence example 1

2. Затем алгоритм применяет полученные знания к данным, выполняя поиск заданных элементов и разбивая их на категории.

machine intelligence example 2

3. Со временем этот процесс может совершенствоваться благодаря обратной связи от человека. После этого алгоритм нейронной сети изменяет все будущие решения на основании полученной обратной связи. Это приводит к более точному сбору данных.

Например, если поступила обратная связь от человека «у каждой формы есть несколько вариантов», алгоритм может упорядочить результаты указанным ниже образом.

machine intelligence example 3

Например, компания Google наняла профессиональных фотографов и документалистов, чтобы они выполняли роль экспертов при обучении алгоритма на основе нейронной сети, используемого в интеллектуальной камере Clips этой компании. Обратная связь от людей позволила сделать камеру интуитивно лучше не только с точки зрения технических аспектов цифровой фотографии, но и благодаря предугадыванию более абстрактных качеств съемки памятных моментов1

Глубинное обучение (ГО) — это подмножество машинного обучения, которое более глубоко решает проблемы. Оно работает аналогично тому, как человеческий мозг распознает и вспоминает информацию, и этот процесс выполняется без получения данных от «экспертов». Приложениям ГО необходим доступ к большим объемам данных, на основе которых они обучаются. В алгоритмах ГО используются глубокие нейронные сети, которые получают доступ к огромным наборам информации (например, ко всем музыкальным файлам в Spotify или Pandora), изучают и анализируют их. В результате глубокие нейронные сети принимают решения на основании предпочтений конкретного пользователя.


1. Глубокая нейронная сеть, используемая алгоритмами глубинного обучения, ищет данные в огромных наборах информации, предоставленных ей для анализа. 

deep learning example 1

2. В процессе обработки этой информации глубокая нейронная сеть разрабатывает новые параметры классификации, например перечисленные ниже. 

1. У форм могут быть разные цвета.
2. У форм может быть разная толщина.
3. Существует 2000 различных форм.

3. Это приводит к тому, что система начинает выдавать очень точные результаты, которые со временем будут становиться все точнее и точнее.


Основной фактор, отличающий ГО от МО, — представление данных. Например, в описанном выше случае МО для камеры Google Clips для обучения системы были необходимы входные данные от профессиональных фотографов. В системе ГО для точного определения свойств эксперты не требуются. При оценке входных данных, будь то изображение, новостная статья или песня, они используются в необработанной форме, без меток и с минимальными преобразованиями. Этот неконтролируемый процесс обучения иногда называют обучением представлениям. В процессе обучения алгоритм ГО обучается на данных, чтобы повысить точность своих выводов (также называемых заключениями).

Ниже перечислены современные распространенные примеры применения ГО.

  • Автономное управление автомобилем: сочетание подробных данных (карт, спутниковых снимков дорожного движения, сообщений о погоде, накопленных сведений о предпочтениях пользователя), входных данных об окружающей среде, поступающих от датчиков в режиме реального времени (олень на дороге или автомобиль, выехавший из своей полосы), и вычислительной мощности для принятия решений (снижение скорости, поворот рулевого колеса).
  • Медицина: исследования в области раковых заболеваний, например обучение обнаружению меланомы на фотографиях2.
  • Интеллектуальный дом: интеллектуальные динамики, использующие интеллектуальные личные помощники и алгоритмы распознавания голоса для понимания уникальных голосовых запросов пользователя и реагирования на них.
  • Развлечения: анализ большой библиотеки фильмов и данных телепередач (жанр, актеры, режиссеры, обзоры) и накопление сведений о вкусах и предпочтениях пользователей.
  • Посещение ресторанов: интуитивные рекомендации ресторанов на основе физического расположения пользователей, обзоров критиков, возможности бронирования столиков, заданных предпочтений и поведения в прошлом.

Терминология: МО и ГО

  • Нейронная сеть: компьютерная система, построенная по подобию мозга и нервной системы человека. Состоит из различных компьютерных узлов (конечных устройств в более крупной сети) и упорядочена в виде слоев. Обычно различные слои выполняют операции разных типов над данными.
  • Глубокая нейронная сеть: многослойная нейронная сеть с большим количеством скрытых слоев, которая может получать доступ к большим и более сложным наборам данных, чем стандартные нейронные сети.
  • Обучение: процесс корректировки и настройки, с помощью которого алгоритм учится выполнять оценку данных с большей скоростью и точностью. Обучение может быть контролируемым (с использованием входных данных от человека) или неконтролируемым (выполнение точной самостоятельной корректировки исключительно на основе необработанных данных).
  • Заключение: быстрое создание прогнозных выводов на основании новых данных и знаний, накопленных в процессе обучения.
  • Представление: автоматическое определение свойств или параметров классификации на основе необработанных данных, благодаря чему система может как обучаться, так и выполнять определенные задачи.

Компания AMD и машинное обучение

Для интеллектуальных приложений, которые реагируют подобно рефлексам человека, требуются огромные вычислительные мощности. Основной вклад компании AMD в системы МО и ГО заключается в поставке высокопроизводительных вычислительных решений (центральных и графических процессоров) с открытой экосистемой для разработки программного обеспечения. Для приложений МО и ГО используется компьютерное оборудование с самыми большими возможностями обработки данных (скоростью, емкостью и организацией) для одновременного управления сложными наборами данных, поступающих в нескольких входных потоках.

Например, в сценарии автономного управления автомобилем от алгоритма ГО может требоваться распознавать предстоящую смену цветов светофора с зеленого на желтый, перемещение пешеходов вблизи автомобиля и воду на тротуаре, оставшуюся после дождя, а также множество других переменных, изменяющихся в режиме реального времени, и выполнять основные операции по управлению транспортным средством. Обученный человек-водитель выполняет эти координированные действия как само собой разумеющееся. Тем не менее для эмуляции возможностей человеческого мозга алгоритму автономного управления автомобилем необходимо эффективно и быстро обрабатывать данные, чтобы принимать сложные решения с достаточной скоростью и высокой точностью, а также обеспечивать безопасность пассажиров и окружающих их людей.

Производительность оборудования компании AMD и связанного с ним программного обеспечения дает огромные преимущества при разработке и тестировании систем МО и ГО. Сегодня с помощью вычислительной платформы, созданной с использованием технологий AMD (центральных процессоров AMD EPYC™ и графических процессоров Radeon Instinct™) можно разрабатывать и тестировать новые интеллектуальные приложения за считанные дни или недели, а не за годы, как это было раньше.

Мощь и свобода для движения вперед

С 2013 по 2017 гг. количество патентов в области машинного обучения выросло на 34 %3. Несмотря на то что в настоящее время в этой области ведется большая работа, отрасль по-прежнему находится в стадии становления. На данный момент основная цель заключается в разработке алгоритмом более эффективного обучения машин на основе различных типов данных. Интеллектуальные системы с технологиями МО и ГО имеют огромный потенциал и позволяют имитировать процессы воспоминаний, сопоставления шаблонов и данных в человеческом мозгу с высокой скоростью и точностью. Путь определен, платформа разработана, и новые прорывы не за горами.

Сноски
  1. Josh Lovejoy “The UX of AI,” Google Design, 25 января 2018 г., по состоянию на 23 апреля 2018 г.
  2. Susan Scutti, “Automated dermatologist' detects skin cancer with expert accuracy,” CNN, 26 января 2017 г.
  3. Louis Columbus, “Roundup Of Machine Learning Forecasts And Market Estimates, 2018,” Forbes, 18 февраля 2018 г.