Maschinelles Lernen und Deep Learning verstehen

Heutzutage wird künstliche Intelligenz (KI) hauptsächlich als allgemeiner Begriff für jegliche Arten computer-basierter Intelligenz verwendet. Der Begriff kann im Grunde auf jedes System angewandt werden, das aufgrund von eingehenden Informationen, der Analyse von Daten, dem Erkennen von Mustern und dem Entwickeln von Strategien menschliche Lern- und Entscheidungsprozesse imitiert. Die Bezeichnungen Maschinelles Lernen (ML) und Deep Learning (DL; dt.: tiefgehendes Lernen) beschreiben die Realität moderner intelligenter Computing-Systeme und die Probleme, die sie für Entwickler und Endnutzer lösen können, deutlich besser.

Maschinelles Lernen vs. Deep Learning

Die heutigen, hochmodernen ML- und DL-Computer-Intelligenz-Systeme können Ihre Prozesse aufgrund eines kontinuierlichen Eingangs von Daten und anderem Input anpassen. Wenn sie auch miteinander verwandt sind, gibt es doch subtile Unterschiede zwischen diesen Feldern der Computerwissenschaften.

 

Maschinelles Lernen (ML) bezeichnet ein System, das aktiv und selbstständig lernen kann und nicht nur passiv Informationen zur Verarbeitung geliefert bekommt. Das Computersystem ist so programmiert, dass es auf Input eher wie ein Mensch reagiert, indem es mithilfe von Algorithmen Daten auf Muster und Strukturen analysiert. ML-Algorithmen wurden so entwickelt, dass sie ihre Leistung verbessern, je mehr Daten sie gesammelt haben.

 

Wenn ein Mensch etwas erkennt, geschieht dieses Erkennen sofort. Um zu helfen, diesen Vorgang zu imitieren, verwenden Algorithmen für maschinelles Lernen neuronale Netzwerke. Wie auch der menschliche Lernprozess, klassifiziert neuronale Netzwerk-Datenverarbeitung Daten (wie z. B. große Mengen an Fotos) nach bekannten Elementen im Bild. Die Erfolgsrate der korrekten Klassifizierung kann mit der Zeit durch menschliches „Expertenfeedback“ verbessert werden, wodurch das System im Lernprozess unterstützt wird und richtige Entscheidungen von falschen im Hinblick auf optimale Effizienz und größere Präzision unterschieden werden können. Der Algorithmus des neuronalen Netzwerks passt dann alle zukünftigen Entscheidungen basierend auf diesem Feedback an. Dieser Prozess stellt die menschliche Erkennung nach, indem es das Netzwerk darauf trainiert, die gewünschte Ausgabe zu erstellen.


1. Ein neuronales Netzwerk könnte feststellen:

1. Eine bestimmte Form ist ein wiederkehrendes Element
2. Dies sind mögliche Formen:

machine intelligence example 1

2. Der Algorithmus wendet das Gelernte auf Daten an, indem er definierte Elemente findet und kategorisiert.

machine intelligence example 2

3. Dieser Prozess kann mithilfe von menschlichem Feedback über die Zeit verbessert werden. Der Algorithmus des neuronalen Netzwerks passt dann alle zukünftigen Entscheidungen basierend auf diesem Feedback an. Dies resultiert in einer präziseren Datensammlung.

Wenn zum Beispiel das menschliche Feedback „Jede Form existiert in mehreren Variationen“ lautet, sortiert der Algorithmus die Ergebnisse vermutlich wie folgt:

machine intelligence example 3

Google hat beispielsweise professionelle Fotografen und Dokumentarfilmer beauftragt, ihr Expertenwissen in das Training des Neuronal-Netzwerk-Algorithmus' einzubringen, der Googles intelligente Kamera, Clips, steuert. Durch das menschliche Feedback konnte die Kamera nicht nur die technischen Aspekte der digitalen Fotografie intuitiv verbessern, sondern auch abstraktere Merkmale bei erinnerungswürdigen Momenten besser vorhersehen1

Deep Learning (DL) legt den Fokus auf eine Unterform des maschinellen Lernens, welches noch weiter geht, um Probleme zu lösen. Es ist inspiriert durch das menschliche Gehirn, welches Informationen auch ohne Anweisung durch Experten erkennt und wieder aufruft. DL-Anwendungen erfordern Zugriff auf riesige Datenmengen, von denen sie lernen können. DL-Algorithmen verwenden sogenannte „Deep Neural Netzwerke“, um auf große Mengen von Informationen zuzugreifen, sie zu erkunden und zu analysieren — wie zum Beispiel sämtliche Musikdateien auf Spotify oder Pandora, um kontinuierlich neue Musikvorschläge basierend auf dem Geschmack eines individuellen Benutzers zusammenstellen zu können.


1. Ein „Deep Neural Netzwerk“, das von DL-Algorithmen verwendet wird, sucht sich riesige Informationsgruppen, um diese zu analysieren.

deep learning example 1

2. Bei der Verarbeitung dieser Informationen entwickelt das „Deep Neural Netzwerk“ neue Klassifizierungen, wie z. B.:

1. Formen können verschiedene Farben haben.
2. Formen können verschiedene Dicken haben.
3. Es gibt insgesamt 2.000 verschiedene Formen.

3. Dadurch entstehen sehr präzise Ergebnisse, die auch weiterhin immer akkurater werden.


Die primären unterscheidenden Faktoren zwischen DL und ML ist die Repräsentation von Daten. So wird zum Beispiel in dem zuvor genannten Beispiel für ML, der Google Clips-Kamera, der Input von professionellen Fotografen benötigt, um das System zu trainieren. Bei einem DL-System hingegen werden für eine präzise Identifizierung von Merkmalen keine Experten benötigt. Der Input — sei es ein Bild, ein Zeitungsartikel oder ein Lied — wird in seiner unbearbeiteten oder unmarkierten Form mit minimalen Transformationen ausgewertet. Dieses unüberwachte Training wird auch Representation Learninggenannt. Während des Trainings lernt der DL-Algorithmus progressiv aus den Daten, um die Präzision seiner Schlussfolgerungen (auch Inferenzen genannt) zu verbessern.

 

Gebräuchliche Beispiele für die Anwendung von DL heutzutage sind:

  • Autonomes Fahren: Entscheidungen (wie Brems- und Lenkvorgänge) werden basierend auf einer Kombination aus „Deep Data“ (Landkarten, Satelliten-Verkehrsaufnahmen, Wetterberichte, gesammelte Informationen zu Präferenzen des Benutzers), Echtzeit-Sensor-Input aus der Umgebung (einem Reh auf der Straße, einem ausweichenden Fahrer), und Rechenleistung getroffen.
  • Medizintechnik: Krebsforschung, z. B. das Erkennen von Melanomen auf Fotos2.
  • Smart Home: Smarte Lautsprecher, die intelligente persönliche Assistenten und Spracherkennungsalgorithmen verwenden, um die verbalen Aufforderungen eines Benutzers zu verstehen und darauf zu antworten.
  • Unterhaltung: Analysen einer großen Bibliothek von Film-/TV-Daten (Genre, Schauspieler, Regisseure, Bewertungen) gegen gesammelte Benutzerdaten und -Einstellungen.
  • Restaurantempfehlungen: Intuitive Restaurantempfehlungen basierend auf dem Standort des Benutzers, Kritikerbewertungen, Verfügbarkeit für Reservierungen, definierte Einstellungen und vorheriges Verhalten.

Smart Jargon: ML und DL verstehen

  • Neuronales Netzwerk: Ein Computersystem, inspiriert von dem menschlichen Gehirn und Nervensystem und bestehend aus verschiedenen Rechenknoten (Endgeräte in einem größeren Netzwerk), die auf verschiedenen Ebenen angeordnet sind. Die verschiedenen Ebenen führen typischerweise verschiedene Arten von Berechnungen der Daten durch.
  • Deep Neural Netzwerk: Ein mehrschichtiges neuronales Netzwerk mit vielen unsichtbaren Leveln, das auf riesige, komplexere Datenmengen zugreifen kann, als herkömmliche neuronale Netzwerke.
  • Training: Der Korrektur- und Anpassungsprozess, durch den ein Algorithmus lernt, Daten schneller und präziser auszuwerten. Das Training kann überwacht (unter Einwirkung menschlichen Inputs) oder unüberwacht (akkurate Selbst-Korrekturen werden ausschließlich aufgrund von Rohdaten durchgeführt) stattfinden.
  • Inferenz: Das Treffen schneller, prognostischer Schlussfolgerungen, basierend auf einer Kombination aus neuen Daten und durchgeführtem, kumuliertem Training.
  • Repräsentation: Automatisches Erkennen von Merkmalen oder Klassifizierungen aus rohen Daten, welches es einem System erlaubt, sowohl dazu zu lernen, als auch spezifische Aufgaben auszuführen.

AMD und maschinelles Lernen

Intelligente Anwendungen, die mit menschenähnlichen Reflexen reagieren, benötigen eine massive Rechenleistung. AMDs Hauptbeiträge zu ML- und DL-Systemen bestehen in der Entwicklung von Hochleistungscomputern (sowohl CPUs als auch GPUs) mit einem offenen Technologieumfeld für Softwareentwicklung. ML- und DL-Anwendungen sind abhängig von Computerhardware, die auch die komplexesten Verarbeitungsprozesse (Geschwindigkeit, Kapazität und Organisation) unterstützt, um gleichzeitig komplexe Datensets aus mehreren Inputstreams zu verarbeiten.

So ist es bspw. beim autonomen Fahren möglicherweise nötig, dass der DL-Algorithmus eine kommende Ampel, die von grün auf gelb wechselt, sich bewegende Fußgänger und Wasser auf der Straße nach einem Schauer erkennen muss, zusätzlich zu anderen Echtzeit-Variablen, sowie einfache Fahrzeug-Vorgänge. Ein trainierter menschlicher Fahrer hält diese koordinierenden Reaktionen möglicherweise für selbstverständlich. Um jedoch die Fähigkeiten des menschlichen Gehirns zu simulieren, benötigt der Algorithmus für autonomes Fahren effiziente und beschleunigte Verarbeitungsmöglichkeiten, um seine komplexen Entscheidungen schnell und präzise genug treffen zu können, und die Sicherheit der Mitfahrenden und anderer Beteiligter nicht zu gefährden.

Die Performance von AMD-Hardware und der dazugehörigen Software liefert außerdem große Vorteile in der Entwicklung und dem Testen von ML- und DL-Systemen. Eine Datenverarbeitungs-Plattform mit den neuesten AMD Technologien (AMD EPYC™ CPUs und Radeon Instinct™ GPUs) kann heute eine neue, intelligente Anwendung in Tagen oder Wochen entwickeln und testen - dieser Vorgang hätte früher mehrere Jahre in Anspruch genommen.

Die Leistung und Freiheit, über sich hinaus zu wachsen

Patente für maschinelles Lernen haben zwischen 2013 und 2017 mit einer Rate von 34 % zugenommen.3 Während aktuell viel Arbeit in diesem Bereich getätigt wird, befindet sich die Industrie noch in der Anfangsphase wenn es darum geht, Maschinen beizubringen, effizienter aus verschiedenen Datentypen zu lernen. Intelligente Systeme mit ML und DL bieten ein enormes Potenzial für Datenverarbeitung, die menschliches Erinnerungsvermögen und die schnelle und präzise Zuordnung von Mustern und Daten imitiert. Ein Weg und eine Plattform wurden bereits gefunden und neue Durchbrüche lassen nicht lange auf sich warten.

Fußnoten
  1. Josh Lovejoy “The UX of AI,” Google Design, 25. Januar 2018, aufgerufen am 23. April 2018.
  2. Susan Scutti, “Automated dermatologist' detects skin cancer with expert accuracy,” CNN, 26. Januar 2017.
  3. Louis Columbus, “Roundup Of Machine Learning Forecasts And Market Estimates, 2018,” Forbes, 18. Februar 2018.