Voll im Trend: Machine Learning. Aber was ist das eigentlich genau? - Empolis Blog

Voll im Trend: Machine Learning. Aber was ist das eigentlich genau?

0

Was können Unternehmen mit Machine Learning machen? Ist das nicht eher etwas für die Forschungsabteilungen der ganz Großen, wie Google oder IBM?

„Machine Learning is the field of study that gives computers the ability to learn without explicitly being programmed“ (Arthur Samuel, 1959).

Computer lernen im Machine Learning also selbstständig, ohne dass man dafür Programmcode verändern oder Regeln konfigurieren müsste. Oder anders ausgedrückt: Mit zunehmender Erfahrung erfüllt eine Maschine ihre Aufgabe mit immer besserer Performanz, ohne dass sie dafür explizit angepasst werden müsste. Für alle, die sich bereits mit Expertensystemen oder anderen regelbasierten, „intelligenten“ Systemen befasst haben, klingt das äußerst verheißungsvoll: einfach einschalten und sich zurücklehnen, bis der Computer alles Relevante von selbst gelernt hat…

Ganz so weit ist das Machine Learning leider (noch) nicht. Im Wesentlichen gibt es drei Ansätze, die je nach Zielsetzung und Voraussetzungen in Frage kommen.

Am weitesten verbreitet ist das „Supervised Learning“ d. h. das Lernen anhand von Beispielen. Der Computer wird dabei mit möglichst vielen Datensätzen in einer Lernphase trainiert und ist danach in der Lage, z. B. neue Datensätze zu klassifizieren oder Vorhersagen zu treffen. Um ihm beizubringen, Hunde oder Katzen zu erkennen, präsentiert man dem Computer möglichst viele Trainingsbilder von Hunden und Katzen. Hier spricht man von gelabelten Trainingsdaten. Bei sinnvoller Wahl dieser Trainingsmenge wird der Computer danach in der Lage sein, auch unbekannte Bilder nach Hunden oder Katzen zu klassifizieren. Im besten Falle sogar einen Tiger oder einen Wolf richtig einordnen. Hier kann man aber einiges falsch machen. Trainiert man z. B. nur mit schwarzen Katzen und weißen Hunden, hat die Maschine u. U. nur gelernt, zwischen schwarzen und weißen Tieren zu unterscheiden. Hat man nur mit Dackeln trainiert, ist der Computer wahrscheinlich verwirrt, wenn er das erste Mal einen Bernhardiner zuordnen soll.

Ein weiterer wichtiger Anwendungsfall für das Supervised Learning ist die Vorhersage. Basierend auf einer großen Menge bekannter Beispiele kann so z. B. von Daten wie Wohnort, Einkommen, Gesundheit, Familienstand, und Essgewohnheiten auf die Zufriedenheit einer Person geschlossen werden. Supervised Learning funktioniert immer dann sehr gut, wenn eine ausreichend große, geeignete Menge an Trainingsdaten zur Verfügung steht. Und nur dann. Sind passende, gelabelte Daten noch nicht ausreichend vorhanden, können sie z. B. durch Crowdworking oder „klassische“ Verfahren wie Textmining oder Bildanalyse erzeugt werden. Die inzwischen immense Rechenleistung von Spezialprozessoren aus dem Grafikbereich hat gerade in diesem Bereich Neuronalen Netzen zu einem Durchbruch verholfen.

Häufigster Anwendungsfall für die zweite Gruppe von Machine-Learning-Verfahren, das Unsupervised Learning, ist das Clustering, d. h. das Gruppieren von Daten. Basis hierfür sind meist statistische Verfahren, wodurch Fakten und Regeln aus Daten extrahiert werden können. Zum Beispiel, dass Kunden, die sich für Woks und asiatische Gewürze interessieren, auch gerne Fernreisen buchen. Oder dass jemand, der eine hochwertige Kamera und Objektive ordert, oft auch ein Blitzgerät erwirbt. Dies ermöglicht z. B. den richtigen Einstieg in ein Online-Portal oder die Zielgruppendefinition für eine Marketingkampagne. Ein weiterer wichtiger Anwendungsfall von Unsupervised Learning ist die Anomalie-Erkennung. Durch geeignete Bildung von Clustern wird dabei ermittelt, welche Datensätze der Norm entsprechen, und welche eher auffällig sind. Bei der Bewertung kann auch das automatisierte Ableiten von Regeln unterstützen. Der Computer könnte z. B. aus vorhandenen Reisedaten ableiten, dass bei Menschen, die ohne Gepäck reisen, typischerweise maximal ein Tag zwischen Hin- und Rückreise liegt. Sind Gepäcklose länger unterwegs, oder haben sie sogar nur ein One Way Ticket ohne Rückreise gebucht, könnte dies ein Hinweis auf Auffälligkeiten sein. Auch für die Vorhersage von Maschinenausfällen im Rahmen der Industrial Analytics ist diese Art der Regelbildung äußerst effizient.

Beim Reinforcement Learning, der dritten Art des Machine Learning, geht es um die Vorhersage und die Kontrolle von Verhalten. Vergleichbar mit dem Training von Tieren geht es darum, angebotenes Verhalten zu belohnen oder zu bestrafen, um das gewünschte Verhalten zu erreichen. Die Maschine muss also von sich aus verschiedene Verhaltensmuster anbieten und ein Feedback bekommen, ob es sich dabei um eine erfolgreiche oder eine unerwünschte Strategie handelt. Diese Aufgabe übernehmen Agenten, die verschiedenste Strategien ausprobieren. Bekanntestes Beispiel hierfür ist AlphaGo, der unzählige Partien Go gegen sich selbst gespielt hat, um daraus die langfristig erfolgreichen Spielzüge zu erlernen.

„Das ist ja alles hochspannend, steckt ja aber eher noch in den Kinderschuhen. Da sollen sich die Forschungsabteilungen der „Großen“ mal mit beschäftigen“, denken Sie jetzt vielleicht. Die gute Nachricht ist aber: Die beschriebenen Verfahren sind inzwischen alle in Form von Frameworks oder Services allgemein verfügbar und (relativ) einfach nutzbar. Und Anwendungsfälle, um stupide, wiederkehrende Klassifizierungs- oder Analyseaufgaben von hochqualifizierten Mitarbeitern auf intelligente Maschinen zu verlagern und damit kreatives Potenzial freizusetzen, gibt es sicher auch in Ihrem Unternehmen viele. Damit Sie dabei nicht selbst alle Details über Machine Learning lernen müssen und in den – ohne Zweifel noch vorhandenen – Fallstricken verheddern, haben wir bei Empolis die Smart Data Labs initiiert. Hier beschäftigen wir uns mit verschiedensten Themen und Methoden der künstlichen Intelligenz, wie Deep Learning, Datenanalyse mit statistischen Verfahren und automatisiertem, semantischem Textmining. Gemeinsam mit unseren Kunden führen wir hier an Hand von echten Use Cases aus der Praxis Experimente – Proofs of Concepts – durch. Dabei wird die jeweils geeignetste Methode oder Kombination mehrerer Verfahren identifiziert und der Nutzen des Einsatzes von Machine Learning gemeinsam mit unseren Kunden evaluiert.

Kontaktieren Sie uns, wenn auch Sie das Gefühl haben, dass in Ihren Vorgängen noch einiges an Optimierungspotenzial schlummert, das eine intelligente Maschine heben könnte.

Bildquelle: Chinnawat Ngamsom / iStock / Getty Images Plus

Teilen:

Über den Autor

Boris Kownatzki

Als Director Professional Services ist Boris Kownatzki für die Umsetzung von PoCs in den Smart Data Labs verantwortlich. Zudem hat er für Empolis mehrere erfolgreiche Projekte mit wichtigen Kunden des öffentlichen Sektors realisiert. Dazu gehören Informationsmanagement- sowie Content-Management-Lösungen innerhalb der Kerngeschäftsfelder der deutschen Bundesbehörden.

Sagen Sie Ihre Meinung!