Wie Maschinen weltweit lernen

Künstliche Intelligenz ist mittlerweile ein wichtiger wirtschaftlicher und strategischer Faktor geworden. Eine Schlüsseltechnologie dafür ist das maschinelle Lernen. Vor welchen Herausforderungen steht diese Technologie, und wie weit ist Deutschland im internationalen Vergleich bei ihrer Anwendung? Die aktuelle Fraunhofer-Studie "Maschinelles Lernen" gibt Antworten auf diese und weitere Fragen.
Es war eine Sensation: 1996 gewann der Schachcomputer Deep Blue eine Partie gegen den amtierenden Weltmeister Garri Kasparow und erlangte in zwei weiteren Auseinandersetzungen ein Remis. Kasparow konnte den Sechs-Partien-Wettkampf zwar für sich entscheiden, ein Jahr später aber gewann ein – deutlich aufgerüsteter – Deep Blue gegen das Schachgenie den ganzen Wettkampf. Seitdem machen künstliche Intelligenzen (KI) immer wieder durch Spielgewinne auf sich aufmerksam: 2011 gewann Watson bei Jeopardy, 2017 schlug Alpha Go in einem Wettkampf über fünf Partien Lee Sedol, einen der besten Go-Spieler der Welt und vor wenigen Wochen besiegte eine KI eine ganze Gruppe menschlicher Spieler im populären Multiplayer-Onlinespiel Dota 2.
Der Erfolg der KI, wie wir sie heute kennen, begann mit technologischen Fortschritten und dem Aufkommen von Big Data um die Jahrtausendwende. Denn diese beiden Faktoren machten es möglich, dass sehr komplexe – oder auch “tiefe” – künstliche neuronale Netze lernen konnten und insbesondere in der Analyse von Bild-, Video-, Sprach- und Textdaten enorme Fortschritte verzeichneten. Inzwischen können KI Gesichter und Objekte besser identifizieren, als Menschen dies vermögen. Außerdem übersetzen sie Texte, beantworten Fragen und E-Mails, verfassen Texte und produzieren Bilder.
Voraussetzungen und Anwendungsbereiche
Bei allen Fortschritten hat das maschinelle Lernen, das eine Schlüsseltechnologie für KI ist und oft synonym dazu verwendet wird, nach wie vor seine ganz eigenen Herausforderungen. Damit tiefe neuronale Netze gut lernen können (Deep Learning), sollte der Lernalgorithmus möglichst viele Trainingsdaten erhalten. Das verringert die Fehlerquote. Der Lernerfolg hängt außerdem von der Qualität der Trainingsdaten ab: Werden zu viele falsche Beispiele gezeigt, lernt die Maschine nicht die korrekten Antworten. Sind die Beispiele nicht repräsentativ, sind die Ergebnisse nicht sicher genug.
Es gibt einige Bereiche, in denen bestimmte Datentypen mittels KI bzw. maschinellem Lernen verarbeitet werden: Die Bild- und Videoanalyse ermöglicht es einer Maschine, Objekte, Szenen und Aktivitäten wahrzunehmen und zu identifizieren. Visuelle Daten können mit hoher Genauigkeit und Zuverlässigkeit in einem einzigen Schritt verarbeitet werden. Die Text- und Sprachverarbeitung befähigt Computer, natürliche Sprache in Wort und Schrift zu interpretieren und zu erzeugen. Große Mengen von Daten aus heterogenen Quellen – etwa von verschiedenen Sensortypen – können damit zusammengeführt werden.
Wissenschaft und Forschung
Das Thema nimmt in der Wissenschaft immer mehr Raum ein: Die Anzahl der Artikel in wissenschaftlichen Fachzeitschriften, Konferenzbeiträge und zitierbaren Publikationen wuchs in den vergangenen Jahren stärker als der allgemeine Publikationstrend, was auf eine intensivere Forschungstätigkeit schließen lässt. Mehr als 60 Prozent der relevanten Publikationen entfallen auf die USA, EU und China. Die drei Spitzenplätze bei den publikationsstärksten Forschungseinrichtungen entfallen auf China (Tsinhua University), die USA (Carnegie Mellon University) und wieder China (Zhejiang University), die deutsche Max-Planck-Gesellschaft ist erst auf Platz 31 zu finden. Bei den Unternehmen belegen IBM, Microsoft und Google die Plätze eins bis drei, Siemens folgt abgeschlagen auf Platz 13.
Die Zahl der Patentanmeldungen ist ebenfalls deutlich gestiegen; mehr als 75 Prozent davon stammen von Organisationen aus den USA, China und Südkorea. Führend sind hier Microsoft, IBM, Google, Amazon, Cisco und Qualcomm aus den USA, Samsung und Korea Electronics Telecomm aus Südkorea sowie Huawei und ZTE aus China. Deutsche Akteure spielen eine eher kleine Rolle. Die deutsche Wirtschaft ist stark im Automobil-, Maschinen- und Anlagenbau sowie der chemischen und pharmazeutischen Industrie. Aber natürlich melden auch Unternehmen in Deutschland Patente im Bereich KI an; führend sind dabei Siemens, Bosch, die Deutsche Telekom, Daimler, BMW und SAP.
Kommerzieller Nutzen
Maschinelles Lernen hat das Potenzial, in nahezu allen Branchen erfolgreich kommerziell eingesetzt zu werden. Die ersten Produkte in Deutschland wurden Anfang der 1990er Jahre entwickelt, heute kommt maschinelles Lernen vor allem in der Bild- und Videoanalyse sowie der Sprachverarbeitung zum Einsatz. Eine weitere wichtige Anwendungsbranche ist das Gesundheitswesen. Hier wird Deep Learning eingesetzt, um MRT-, CT- und Röntgenbilder sowie andere unstrukturierte Daten zu analysieren. Andere Beispiele für Einsatzmöglichkeiten sind die effiziente Verwaltung von Patientendaten, Systeme zur Entscheidungsunterstützung in der klinischen Diagnostik und Anwendungen in der Radiologie, Pathologie und Dermatologie. Brustkrebs, Herzerkrankungen, Osteoporose und erste Anzeichen von Hautkrebs können bereits heute mit KI identifiziert werden. In Zukunft sind Systeme zur frühzeitigen Erkennung und Prävention von Pandemien denkbar.
Natürlich bietet maschinelles Lernen auch bei der Digitalisierung von Produktionsprozessen viel Potenzial. Bis 2030 wird sich die globale Produktivität dadurch nach Schätzungen von PWC um 55 Prozent erhöhen. Die Fortschritte beim maschinellen Sehen, der maschinellen Wahrnehmung und Kommunikation werden die vorausschauende Wartung verbessern. Das wird die Anlagenproduktivität perspektivisch um bis zu 20 Prozent steigern und die Wartungskosten gleichzeitig um bis zu 10 Prozent senken.
Der Weg in die Zukunft
Es gibt also zahlreiche Gründe, das Thema Machine Learning konsequent weiterzuverfolgen. Damit kommen nicht nur auf die Forschung neue Aufgaben zu: Der Bedarf an Fachkräften für KI und maschinelles Lernen ist sehr groß, die Anzahl der aktuell in Deutschland ausgebildeten Akademiker reicht nicht aus, um den Bedarf zu decken. Die Hochschulen reagieren aber zögerlich: Von rund 18.500 Studiengängen, die 2016/2017 in Deutschland angeboten wurden, wiesen nur 23 eine explizite Spezialisierung auf Big Data, Data Science und Advanced Analytics/Business Analytics auf. Es ist also abzusehen, dass sich der Mangel an Fachkräften weiter verschärfen wird.
Außerdem haben US-amerikanische und chinesische Unternehmen wie Google, Facebook, Amazon oder Alibaba dank ihrer meist globalen Nutzerschaft einen deutlich größeren Datenpool, auf den sie zugreifen können, als deutsche Unternehmen, für die außerdem strenge Datenschutzregeln gelten. Eine mögliche Lösung wäre die Bereitstellung von “Open Data”, offen zugänglichen Daten, die frei genutzt, weiterverarbeitet und weiterverwendet werden dürfen. Öffentliche Einrichtungen oder öffentlich geförderte Forschungsprojekte könnten diese liefern. Eine Pilotinitiative der EU-Kommission dazu gibt es bereits.
Die komplette Fraunhofer-Studie “Maschinelles Lernen” ist hier erhältlich.
Autor: Redaktion Zukunft. Kunde.
Bild: © spainter_vfx – AdobeStock