了解机器学习和深度学习

如今,人工智能 (AI) 这一术语已被广泛用于指代各种形式的基于计算的智能。它可宽泛地涵盖任何用来模仿人类学习和决策过程的系统,如响应输入、分析数据、识别模式或制定策略。机器学习 (ML) 和深度学习 (DL) 这两个词很好地表述了当今智能计算系统的现状以及它们可以为开发人员和最终用户解决的问题。

机器学习与深度学习

当前最先进的 ML 和 DL 计算机智能系统可以在连续接触数据和其他输入后调整运算。虽然在本质上有关联,但细微的差别让计算机科学细分成不同领域。

 

机器学习 (ML) 指的是一个可以自己主动学习的系统,而不只是被动地接受信息来进行处理。这种计算机系统的设计目的是使用算法来分析数据,寻找其中的模式或结构,从而让系统更像人类一样对输入做出响应。ML 算法旨在让系统接触更多数据,随时间推移提高性能。

 

当人类辨认出某件事物时,这种辨认是瞬时完成的。机器学习算法采用神经网络来帮助模仿这个过程。像人类学习过程一样,神经网络计算根据图像中识别出的元素对数据(如大量照片集)进行分类。通过“专业”的人类反馈,正确分类的成功率可随着时间推移而提高,这有助于系统学习和区分正确决策和不正确决策,从而获得最优的效率和更高的准确性。然后,神经网络算法根据收到的反馈修正所有未来的判定。该过程通过训练网络生成所需的输出来模拟人类认知。


1.神经网络可以阐述:

1. 一个形状是一个重复出现的元素
2. 这些是可能的形状:

machine intelligence example 1

2. 然后,算法通过查找和分类定义的元素将此学习应用于数据。

machine intelligence example 2

3. 在人类反馈的帮助下,这个过程会随着时间的推移而改善。然后,神经网络算法根据收到的反馈修正所有未来的判定。这会使数据收集更准确。

例如,如果人类反馈是“每个形状有多种变化”,算法可以如下组织结果:

machine intelligence example 3

例如,谷歌聘请专业摄影师和纪录片制片人提供专家指导,以在其智能相机 Clips 背后训练基于神经网络的算法。人类反馈能够帮助摄像机在数码摄影的技术方面变得更直观,而且使其在捕捉精彩瞬间时对较为抽象的图像质量的预测方面也更佳1。 

深度学习 (DL) 专注的是机器学习的其中一部分,即进一步解决问题。其实现方法源自于人类大脑如何识别和回忆信息而且不需要外部专家意见来指导该过程。DL 应用程序需要访问大量的数据来学习。DL 算法利用深度神经网络来获取、探索和分析大量信息,例如 Spotify 或 Pandora 上的所有音乐文件,以根据特定用户的品味提供持续的音乐建议。


1. 深度学习算法使用的深度神经网络需要大量的信息进行分析。

deep learning example 1

2. 处理这些信息时,深度神经网络会开发新分类,例如:

1. 形状可能有不同的颜色。
2. 形状可有不同的厚度。
3. T总共有 2,000 个不同的形状。

3. 这使结果非常精确,而且会变得越来越准确。


DL 与 ML 的主要区别是数据的表示。例如,在上述 Google Clips 相机的 ML 示例中,需要来自专业摄影师的输入来训练系统。但在 DL 系统中,准确的特征识别不需要专家。输入(无论是图像、新闻文章还是歌曲)都是以极少转换的原始或未标记的形式进行评估。这种无监管的训练过程有时被称为表示学习。在训练期间,DL 算法逐步从数据中学习以提高其判断的准确性(也称为推断)。

当前 DL应用的常见例子包括:

  • 自动驾驶:结合深层数据(地图、卫星交通图像、天气预报、用户的累积偏好),来自环境的实时传感器输入(路上的鹿、急转弯的驾驶员),以及制定决策的计算能力(减速、打方向盘)。
  • 医疗:癌症研究,如学习检测照片中的黑色素瘤2
  • 智能家居:使用智能个人助理和语音识别算法的智能扬声器来理解和响应特定用户的口头请求。
  • 娱乐:根据积累的用户口味和偏好,分析庞大的电影/电视数据库(类型、演员、导演、评论)。
  • 餐饮:基于用户的实际位置、重要评论、有无座位、明确的偏好和过去的行为等进行快速的餐厅推荐。

行话和术语:了解 ML 和 DL

  • 神经网络:一种模拟人脑和神经系统的计算机系统。由多个层次构成的不同计算机节点组成(大型网络中的终端设备)。不同的层通常对数据执行不同类型的计算。
  • 深度神经网络:具有许多隐藏级别的多层神经网络可以访问比标准神经网络更庞大、更复杂的数据集。
  • 训练:算法通过学习以更快和更准确地评估数据的校正和调整过程。训练可以是受监督 (利用人类输入)或无监督(仅根据原始数据进行准确的自校正)。
  • 推理:结合新数据和应用的累积培训,做出快速、有预见性的结论。
  • 表示:从原始数据自动检测功能或分类,使系统能够学习和执行特定任务。

AMD 和机器学习

智能应用模拟人类的反应,需要大量的计算机处理能力。AMD 对 ML 和 DL 系统的主要贡献来自于:为软件开发提供开放式生态系统,从而实现高性能计算(包括 CPU 和 GPU)。ML 和 DL 应用程序依赖于可支持最高处理能力(速度、容量和组织)的计算机硬件,以同时管理来自多个输入流的复杂数据集。

例如,在自动驾驶情景下,DL 算法可能需要识别即将到来的交通信号灯从绿色变为黄色、附近的行人的移动、暴雨中人行道上的水等其他实时变量,以及基本的车辆操作。训练有素的驾驶员可能将这些协调反应视为理所当然。然而,为了模拟人脑的能力,自动驾驶算法需要高效和加速的处理,以便快速和高精准地做出复杂决策,确保乘客和周围其他人的安全。

AMD 硬件和相关软件的性能也为 ML 和 DL 系统的开发和测试过程带来了巨大的好处。现在,采用最新 AMD 技术(AMD EPYC™ (霄龙) CPURadeon Instinct™ GPU)构建的计算平台可以在几天或几周内开发并测试新的智能应用程序,这一过程以前往往需要几年的时间。

机器学习专利在 2013 年至 2017 年期间增长率为 34%。3 虽然这一领域目前正在成型阶段,但已经在帮机器从不同类型数据中更高效地学习。采用 ML 和 DL 的智能系统为计算提供了巨大的潜力,可以快速和精确地模拟人类记忆、模式匹配以及数据关联。前进的道路和平台已搭建成功,新的突破很快会接踵而至。

尾注
  1. JJosh Lovejoy “The UX of AI”,Google Design,2018 年 1 月 25 日,资料访问日期 2018 年 4 月 23 日。
  2. Susan Scutti“Automated dermatologist' detects skin cancer with expert accuracy”,CNN,2017 年 1 月 26 日。
  3. Louis Columbus“Roundup Of Machine Learning Forecasts And Market Estimates, 2018”,Forbes,2018 年 2 月 18 日。