Das Digitale als Brückenbauer

Einheit in die Vielfalt bringen

6. Oktober 2020 Analyseverfahren von Texten

Literaturwissenschaftlerinnen und -wissenschaftler setzen digitale Analyseverfahren schon seit den  1960er-Jahren ein: Seitdem gibt es eine kleine, aber stetig wachsende Community, die Texte mithilfe von Computern auf Inhalt, Wortwahl oder Sprachstil untersucht.

„So scholl der Gesang der Okeaniden, / Der schönen, mitleidigen Wasserfraun, / Bis lautere Wogen ihn überrauschten“ – Sprache in Gedichten ist höchst emotional. Das DFG-Schwerpunktprogramm „Computational Literary Studies“ übersetzt sie trotzdem in kü

„Nun haben wir aufgrund von zwei Entwicklungen einen historischen Schwellenmoment erreicht, der dem gesamten Feld einen enormen Schub gibt“, sagt Fotis Jannidis, Computerphilologe an der Julius-Maximilians-Universität Würzburg. Zum einen gäbe es inzwischen Tausende von Romanen, Dramen und lyrischen Werken, die in digitaler Form als Datenschatz vorlägen. Zum anderen hätten sich die  Methoden der Datenanalyse deutlich verbessert.

„Deep Learning und andere Methoden des Maschinellen Lernens machen neue Analyseverfahren für Texte möglich“, sagt Jannidis, der seit 20 Jahren in den Digital Humanities und seit rund acht Jahren im  Feld der quantitativen Analyse von Literatur forscht. „Das eröffnet der Forschung neue Wege, um Erkenntnisse über Strukturen und Entwicklungen von Literatur zu gewinnen.“ Hiervon profitiert auch das 2019 genehmigte Schwerpunktprogramm „Computational Literary Studies“, das Jannidis koordiniert und in dem Wissenschaftlerinnen und Wissenschaftler mit sehr unterschiedlichen Expertisen in zehn Projekten zusammenarbeiten.

Aufgrund ihrer Fiktionalität und ihrer kreativen bis emotionalen Sprache stellen literarische Texte eine besonders große Herausforderung für Algorithmen dar. Deshalb wurden sie bisher quantitativ viel seltener untersucht als nicht literarische Texte. Zudem war der Kanon der untersuchten Werke bisher stark begrenzt. „Jetzt liegen uns viele Tausende Werke digital vor, die wir gar nicht alle lesen und besprechen können“, sagt Jannidis. „Hier wollen wir mit unseren analytischen Verfahren gezielt Aspekte untersuchen und sichtbar machen.“ Denkbar sei beispielsweise, dass die Forscherinnen und Forscher mit ihren Algorithmen bisher unbeschriebene Textgattungen entdecken. Emotionskodierungen sollen helfen, Gefühlsverläufe in Gedichten wiederzugeben, um Rückschlüsse über kulturelle Phänomene oder gesellschaftliche Veränderungen zu replizieren oder neu zu beschreiben. Auch Fragen nach literarischen Epochengrenzen, letztlich künstliche Konstruktionen, sollen mithilfe digitaler Analyseverfahren untersucht werden.

„Mit einem Management- und einem Datenmanagementprojekt haben wir gleich zwei zentrale  Projekte, was ungewöhnlich für ein Schwerpunktprogramm ist“, erklärt Jannidis. Doch diese Unterteilung sei zukunftsweisend, da die Textkorpora, mit denen die Teilprojekte arbeiten, auf diese  Weise von Anfang an in einheitlichen Formaten aufbereitet werden und so später auch der weiteren Forschung zur Verfügung gestellt werden könnten. „Da wollen wir für künftige Projekte einen Vorbildcharakter übernehmen.“

Weitere Informationen