Das Digitale als Brückenbauer

Spielanleitungen im Fokus

17. Juli 2019 Computerlinguistik

Um eine ganz andere Textspezies geht es in der Emmy Noether-Gruppe „Computerlinguistische Methoden zur Missverständnismodellierung für komplexe Anleitungstexte“, die die DFG seit 2019 fördert: Es geht um Spielanleitungen. Und die können es bekanntlich in sich haben. 

Steine richtig setzen: Spielanleitungen stehen im Fokus der Emmy Noether-Gruppe  Computerlinguistische Methoden zur Missverständnismodellierung für komplexe Anleitungstexte“, die die DFG seit 2019 fördert.

„Beginnend mit dem Startspieler führt in jeder Runde ein Spieler eine Aktion aus.“ Zurück bleibt ein irritierter Leser, der sich fragt, ob nur jeweils ein Spieler pro Runde eine Aktion ausführt. Oder kommt jeder Spieler in jeder Runde an die Reihe? Und: In welcher Reihenfolge sind die Spieler überhaupt am Zug?

„Es bleibt letztlich unklar, was der Autor der Spielanleitung konkret gemeint hat, da er wichtige Aspekte
mehrdeutig oder gar nicht explizit beschreibt“, erklärt Michael Roth vom Institut für Maschinelle Sprachverarbeitung an der Universität Stuttgart. Der 34-jährige Computerlinguist sieht in der  Kombination von Sprachwissenschaft und Informatik viel Potenzial, um solche Missverständnisse von vornherein zu vermeiden.

Unklare Formulierungen treten aber nicht nur bei Spielanleitungen auf, sondern auch in unserem Alltag, beispielsweise bei Wegbeschreibungen oder ärztlichen Anweisungen. Die Emmy Noether-Gruppe will auch hier computerlinguistische Verfahren entwickeln, die automatisch erkennen, ob mehrere Nutzer die Textpassagen falsch oder möglicherweise mehrdeutig interpretieren. „Wir  gestalten zunächst Prozesse zum Auffinden von Textsegmenten, aus denen Missverständnisse entstehen können“, sagt Roth, „und wir entwickeln dann Berechnungsmethoden, die solche  Segmente automatisch finden.“ Damit das gelingt, nutzt die Gruppe sowohl computerlinguistische  Verfahren, die die Verwendung einzelner Wörter berücksichtigen, als auch neuronale Modelle, die auf semantische Phänomene wie die Bedeutungsgleichheit zweier Ausdrücke angepasst werden können.

Um Text- oder Sprachdaten mithilfe des Computers algorithmisch auszuwerten, soll später auch relevantes Weltwissen bei den Modellierungen berücksichtigt werden. Ein einfaches Beispiel: Liest man eine Nachricht über Brüssel, ist oft gar nicht die Landeshauptstadt gemeint, sondern die
EU. Solche Formulierungen können bei maschinellen Übersetzungssystemen zu falschen Aussagen führen. Die systematische Analyse von Missverständnisursachen auf Basis computerlinguistischer Ansätze könnte demnach dazu beitragen, maschinelle Übersetzungssysteme zu optimieren, Nutzer von Schreibassistenzprogrammen auf unklare Formulierungen hinzuweisen und unsichere  Vorhersagen semantischer Analysewerkzeuge zu erkennen.

Weitere Informationen