瞭解機器學習與深度學習

現在,人工智慧 (AI) 主要作為一般詞彙使用,用來泛指所有基於運算的智慧形式。若以寬鬆定義來看,這個詞彙也適用於模擬人類學習與決策程序,以便回應輸入、分析資料、識別模式或擬定策略的任何系統。機器學習 (ML) 與深度學習 (DL) 這兩個詞更貼切地描述了現今的智慧運算系統,以及這些系統能夠為開發人員及使用者解決的問題。

機器學習與深度學習的比較

現今先進的 ML 與 DL 電腦智慧系統,在持續暴露於資料與其他輸入之後,即可調整運作方式。這些電腦科學領域在本質上雖然彼此相關,但是仍有細微的差異可加以區別。

 

機器學習 (ML) 是指能夠自己主動學習的系統,而不只是被動地接受需要處理的資訊。此種電腦系統被編碼成能夠利用可分析資料的演算法來搜尋模式或結構,以更接近人類的方式對輸入做出回應。ML 演算法的設計是為了讓系統隨著更多資料的暴露,而能逐步提升效能。

 

人類識別事物的過程是一種即時的反應。為了模擬這個程序,機器學習演算法使用了神經網路。就像人類學習的過程一樣,神經網路運算也是根據影像內的識別元素對資料(例如大量的照片)進行分類。正確分類的成功率可透過「專業」的人類回饋而逐步提升,幫助系統從錯誤中學習及確認正確的決策,以期達到最佳效率並提高精確性。隨後,神經網路演算法便會根據收到的回饋,修改日後的所有決策。這個程序是透過訓練網路產生需要的輸出,藉此模仿人類識別事物的能力。


1.神經網路可能會陳述:

1.某個形狀是重複出現的元素
2.這些是可能的形狀:

machine intelligence example 1

2.接著,演算法便會找出指定的元素並加以分類,將此種學習模式套用到資料上。

machine intelligence example 2

3.這項程序可藉助人類回饋而逐步改善。隨後,神經網路演算法便會根據收到的回饋,修改日後的所有決策。最後,資料的收集將會變得更為精確。

例如,若人類回饋是「每個形狀都有多種變化」,則演算法可能會歸納出以下結果:

machine intelligence example 3

舉例來說,Google 便雇用了專業攝影師和記錄片導演來提供專業指導,以訓練其智慧相機 Clips 背後的神經網路演算法。人類回饋使得這款相機獲得明顯改善,這些改善不只反映在數位攝影的技術層面上,也反映在預測更多用來捕捉精彩回憶的抽象特性上1

深度學習 (DL) 側重於機器學習的一個子集;此種學習子集可進一步解決問題,其啟發靈感則是當沒有外在的專家輸入引導此程序時,人類大腦如何識別與回想資訊。DL 應用程式需要存取大量資料以從中學習。DL 演算法利用深度神經網路來存取、探索及分析大量資訊,例如 Spotify 或 Pandora 上的所有音樂檔案,以根據特定使用者的品味,持續提出音樂建議。


1.深度學習演算法所使用的深度神經網路,將會尋求大量資訊以進行分析。

deep learning example 1

2.在處理這些資訊時,深度神經網路會建立新的分類,例如:

1. 形狀可以有不同的顏色。
2. 形狀可以有不同的厚度。
3. 總共有 2,000 個不同的形狀。

3.這會產生非常精準的結果,而且這些結果將會繼續變得愈來愈精確。


區分 DL 和 ML 的主要因素是資料的表示法。例如,在前面所舉的 Google Clips 相機 ML 範例中,需要有專業攝影師的輸入才能訓練系統。但是在 DL 系統中,精準的特徵識別並不需要專家介入。輸入 — 不論是影像、新聞報導,還是歌曲 — 均以其原始或未標記形式,在轉變最小的狀態下進行評估。這種不受監督的訓練程序也稱為表示法學習 (Representation Learning)。在訓練過程中,DL 演算法會循序漸進地透過資料學習,以提高其結論 (也稱為推論) 的精確性。

 

現今常見的 DL 應用實例包括:

  • 自動駕駛:結合深度資料(地圖、衛星交通影像、氣象報告、使用者長期累積的偏好等)、來自周圍環境的即時感測器輸入(路上有一隻鹿、駕駛突然轉彎),以及強大的運算功能,以便進行決策(減速、轉動方向盤)。
  • 醫療:癌症的研究,例如學習透過相片偵測黑色素瘤2
  • 智慧家庭:智慧揚聲器使用智慧型個人助理和語音辨識演算法來理解及回應單一使用者的口頭要求。
  • 娛樂:根據累積的使用者品味和偏好資料,分析大量影視資料庫(類型、演員、導演、評論)。
  • 餐飲:依照使用者實際所在地、評論、可否訂位、明確偏好及過往行為,憑直覺推薦餐廳。

智慧專門術語:瞭解 ML 與 DL

  • 神經網路:靈感來自人類大腦與神經系統的一種電腦系統,由分層組織的不同電腦節點 (較大網路內的端點裝置) 組成。不同分層通常負責執行不同類型的資料計算。
  • 深層神經網路:一種多層次神經網路,內含許多隱藏分層,可以存取大量、比標準神經網路更複雜的資料集。
  • 訓練:演算法學習以更快、更精準的方式評估資料的修正與調整程序。訓練可能受監督  (採用人類輸入),也可能不受監督 (僅依據暴露的原始資料進行精確的自我修正)。
  • 推論:依據新資料與應用累積訓練的組合,做出快速、預測性的結論。
  • 表示法:從原始資料自動偵測特徵或分類,讓系統能夠同時學習並執行特定工作。

AMD 與機器學習

智慧應用程式需要有強大的電腦處理能力,才能做出如同人類本能反應的回應。AMD 對於 ML 和 DL 系統的主要貢獻在於利用開放式軟體開發生態系統提供高效能運算 (包括 CPU 和 GPU)。ML 和 DL 應用程式均需依賴可支援最高處理能力 (速度、容量和組織) 的電腦硬體,才能同時管理來自多重輸入串流的複雜資料集。

例如,在自動駕駛的情境下,除了基本的車輛操作之外,DL 演算法可能還需要辨識各種其他即時變數,例如下一個紅綠燈由綠燈變黃燈的情況、附近行人的動態,以及暴雨造成路面積水等等。訓練有素的駕駛人可能會將這些協調反應視為理所當然。不過,為了模擬人類大腦的能力,自動駕駛演算法需要經過高效率的加速處理程序,利用足夠的速度與高精確度進行複雜的決策,以保護乘客和周遭其他人的安全。

AMD 硬體及相關軟體的效能,也為 ML 和 DL 系統的開發與測試提供了極大優勢。以往,新的智慧應用程式需要幾年的時間才能完成開發及測試;現在,採用最新 AMD 技術 (AMD EPYC™ CPUsRadeon Instinct™ GPUs) 的運算平台只需要幾天或幾週就能完成這個程序。

向前邁進的能力與自由

2013 年到 2017 年間,機器學習專利的成長率為 34%3。雖然目前這個領域已有許多工作正在進行,但是業界對於如何幫助機器利用各種不同資料更有效率地學習,仍只處於成形的階段。採用 ML 和 DL 的智慧系統提供了極大的運算潛力,能夠快速又精確地模仿人類的記憶、模式比對與資料關聯等能力。我們已經打造了一條道路和平台,相信不久就能獲得全新的突破性進展。

註解
  1. Josh Lovejoy「The UX of AI」,Google Design,2018 年 1 月 25 日,資料截取日期 2018 年 4 月 23 日。
  2. Susan Scutti,「Automated dermatologist' detects skin cancer with expert accuracy」,CNN,2017 年 1 月 26 日。
  3. Louis Columbus,「Roundup Of Machine Learning Forecasts And Market Estimates, 2018」,Forbes,2018 年 2 月 18 日。