Machine Learning gehört zur künstlichen Intelligenz. Die dafür eingesetzten IT-Syteme erkennen Muster in Datenbeständen und wenden auf diese bestimmte Algorithmen an. Dadurch sind sie imstande, eigenständige Problemlösungen zu finden.
Machine Learning: Definition
Definiert ist das maschinelle Lernen durch das Generieren von künstlichem Wissen aus Daten, die gesicherte Erfahrungen repräsentieren. Auch ein Abstraktionsprozess gehört dazu: Die gewonnenen Erkenntnisse sind verallgemeinerungsfähig und können daher für verwandte Probleme genutzt werden. Selbst die Analyse bislang unbekannter Daten sollte mithilfe von Machine Learning gelingen.
Voraussetzung für Machine Learning
Die eingesetzte Software muss vorab mit Algorithmen gefüttert werden, damit sie anschließend eigenständig lernt und Lösungen findet. Des Weiteren benötigt sie einen weitgehend automatisierten Dateninput. Drittens sind Regeln für die Datenanalyse und die Mustererkennung aufzustellen. Die Systeme leisten dann folgende Arbeitsschritte:
- Erfassen und Identifizieren relevanter Daten, Extraktion, Zusammenfassung
- Prognoseerstellung auf der Basis von analysierten Daten
- Wahrscheinlichkeitsberechnung für das Eintreffen von prognostizierten Ereignissen
- eigenständige Anpassung an Entwicklungen
- Prozessoptimierung auf der Basis der erkannten Muster
Die Rolle der Algorithmen
Algorithmen sind zentral für das maschinelle Lernen. Sie erkennen Muster in Datenbeständen und generieren Lösungen. Es gibt sie in den Kategorien des überwachten, unüberwachten, teilüberwachten, bestärkenden und aktiven Lernens. Beim überwachten Lernen werden im Vorfeld die Beispielmodelle definiert. Informationen ordnet das System dann den Modellgruppen der angewendeten Algorithmen zu. Beim unüberwachten Lernen bildet das System die Modellgruppen automatisiert, weil es die Muster eigenständig erkennt. Das teilüberwachte Lernen mischt beide Methoden, während bestärkendes Lernen auf einem Bonus-/Malus-System basiert. Diese Lernweise ähnelt sehr dem menschlichen Lernen. Durch aktives Lernen kann der Algorithmus die gewünschten Ergebnisse für bestimmte Eingangsdaten erfragen. Er wählt zuvor die Fragen mit einer hohen Ergebnisrelevanz aus.
Verknüpfung mit der Datenbasis
Abhängig vom verwendeten System gibt es Online- und Offline-Databases, die wiederholbar oder einmalig zur Verfügung stehen. Die Ein- und Ausgabepaare können gleichzeitig existieren (Batch-Learning) oder sich zeitlich versetzt entwickeln (sequenzielles Lernen).
Machine Learning in der Praxis
Das Spektrum der praktischen Anwendungsmöglichkeiten ist sehr groß. Webbasierte Technologien setzen es unter anderem für folgende Aufgaben ein:
- selbstständiges Erkennen von Spam, parallel dazu Entwicklung des Spam-Filters
- Text- und Spracherkennung durch digitale Assistenten
- Identifizierung von Bots bzw. deren Unterscheidung von menschlicher Aktivität
- Bild- und Gesichtserkennung
- Gewichtung von Suchbegriffen nach Relevanz
- automatische Empfehlungsdienste
- automatische Betrugserkennung vorrangig beim versuchten Online-Kreditkartenbetrug
Big Data als Motor des maschinellen Lernens
Big-Data-Technologien kommen ohne Machine Learning praktisch nicht aus. Unmengen von Daten sind zu erfassen, zu analysieren, nach Relevanz zu gewichten, zu verknüpfen und in Muster einzufügen, aus denen die Maschine Erkenntnisse generiert. Daher treiben die Industrien, die permanent mit Big Data operieren, auch das Machine Learning voran. In den betreffenden Systemen können strukturierte und unstrukturierte Daten mit relativ preiswerter Hardware analysiert und den Lernalgorithmen zugeführt werden. Die Firmen tüfteln permanent an neuen Algorithmen und erzeugen damit einen großen Innovationsschub. Jüngste Systeme setzen auf die Blockchain oder den Directed Acyclic Graph. Hardwareseitig kommen blitzschnelle Datenbanksysteme in verteilten Rechnerstrukturen und künstliche neuronale Netze zum Einsatz. Modernste Lösungen nähern sich in Teilbereichen immer mehr dem menschlichen Gehirn an.
Bildquelle: Pixabayuser athree23