Das Digitale als Brückenbauer

Die interaktive Bedienungsanleitung

17. Juli 2019 Künstliche Intelligenz

Nicht nur missverständliche Spielanleitungen können ganze Familienabende zerstören: So mancher
Leser hat vermutlich auch mit Montageanleitungen schon seine „wutentbrannten“ Erfahrungen  gemacht. Hilfreich wären Sprachassistenten wie Alexa oder Siri, die heute zum Alltag vieler Menschen gehören.

Kluge Kommunikation: Die Forscherinnen und Forscher von RECOLAGE setzen kleine Steine ein, aus denen sich unterschiedliche Figuren legen lassen. Der Computer kennt die Lösungen und weiß, wie das Endprodukt aussieht, er antwortet situationsangemessen.

Nur: Die sind bisher so einfach „gestrickt“, dass sie nicht in der Lage sind, derart komplexe Zusammenhänge zu erkennen, wiederzugeben und vor allem korrigierend einzugreifen. Obwohl im  Zusammenhang mit gängigen Sprachassistenten immer wieder die Rede von Künstlicher Intelligenz (KI) ist, spricht der Mensch nur mit einer Maschine, die relativ einfache Antworten gibt.

„Alle Äußerungen, die Alexa und Siri beispielsweise von sich geben, wurden im Vorfeld von Menschen als Satzmuster programmiert und vom Computer produziert“, sagt der Computerlinguist David Schlangen von der Universität Potsdam. „Die Schwachstelle ist inzwischen nicht mehr so sehr das Verstehen einfacher Befehle, sondern die Intelligenz hinter den Antworten.“ Für Schlangen steht  deshalb fest, dass sprachgesteuerte Systeme ihren großen gesellschaftlichen Durchbruch erst dann erleben werden, wenn sie situationsbezogen reagieren können. Darum geht es in seinem 2019 von der DFG genehmigten Einzelvorhaben „Kollaborative Sprachgenerierung in Echtzeit und aus visuellem Input (RECOLAGE)“, dessen übergeordnetes Ziel es ist, die Interaktion zwischen Mensch und Maschine natürlicher zu gestalten.

„Das Computersystem übernimmt dabei eine Mitverantwortung für den Erfolg des jeweiligen  Prozesses oder Produkts“, sagt Schlangen. „Man kann sich das Ganze wie eine interaktive  Bedienungsanleitung vorstellen.“ Hierzu muss die Maschine das Vorgehen des menschlichen Kooperationspartners kontinuierlich visuell verfolgen, um im richtigen Augenblick Feedback geben zu können und Schritt für  Schritt geeignete weitere Anweisungen formulieren zu können. Konkret arbeitet RECOLAGE mit Pentomino-Steinen: kleinen Puzzleteilen, aus denen sich unterschiedliche Figuren legen lassen. Der Computer kennt die Lösungen und weiß, wie das Endprodukt aussieht. Er ist in der Lage, dem Spieler zu sagen, welches Teil er nehmen und in welcher Weise er es drehen  muss. Nimmt der Mensch nun stattdessen ein falsches Teil oder dreht es falsch, korrigiert ihn der Computer und antwortet situationsangemessen.

„Diese Anwendung lässt sich auf alltägliche Situationen wie Kochrezepte oder Wegbeschreibungen übertragen – und eben auch auf die Montageanleitung eines Möbelstücks“, erklärt Schlangen. Die klassische KI-Forschung würde versuchen, sämtliche Handlungsoptionen zu modellieren –  gewissermaßen vom Ziel aus rückwärts zu rechnen. RECOLAGE hingegen verfolgt einen datengetriebenen Ansatz, bei dem linguistische Entscheidungen durch Techniken des Maschinellen  Lernens optimiert werden: „Wir sammeln Beispiele, wie Menschen Anweisungen produzieren“, sagt Schlangen. „Die Interpretationen der Handlungen, die unausgesprochen dahinterstecken, lernt der Computer automatisch, sodass er angemessen reagiert.“ So kann er dem Nutzer im besten Fall  sagen, wie er das Möbelstück richtig zusammenbaut.

Weitere Informationen