"Aufi owi umi, Oida": Zur Digitalisierung von Dialekten

7. Dezember 2017, 15:49

Digitale Editionen und quantitative Textanalyse erfordern neue Arbeitsweisen und Qualifikationen

Wien – Es sind vor allem die text- und sprachbezogenen Disziplinen der Geisteswissenschaften, in denen seit den 1990-Jahren immer häufiger computergestützte Methoden eingesetzt werden. Als Pionier der sogenannten Digital Humanities gilt der italienische Jesuitenpater Roberto Busa, der in Zusammenarbeit mit dem IBM-Gründer Thomas Watson in den 1940er-Jahren die Texte des Thomas von Aquin mittels Computer digitalisiert und indexiert hat.

Mittlerweile laufen an den meisten Bibliotheken große Digitalisierungsprojekte, der Einsatz digitaler Werkzeuge gehört für viele Geisteswissenschafter zum Alltag. Damit wuchs auch der Bedarf an entsprechender Software, digitalen Infrastrukturen und Know-how. Vor vier Jahren wurde deshalb das Austrian Centre for Digital Humanities (ACDH) an der Österreichischen Akademie der Wissenschaften gegründet. An diesem Forschungsinstitut werden nicht nur digitale Methoden und Werkzeuge für die unterschiedlichsten geisteswissenschaftlichen Anwendungen entwickelt, sondern auch riesige Datenbestände digitalisiert, bearbeitet und verknüpft.

ACDH-Experten erstellten gemeinsam mit der Austria Presse Agentur etwa das "Austrian Media Corpus": eine Sammlung von mehr als 40 Millionen Texten. "Diese Sammlung deckt die gesamte österreichische Medienlandschaft der vergangenen zwei Jahrzehnte ab", sagt Alexandra Lenz, die am ACDH eine eigene Forschungsabteilung zum Thema "Variation und Wandel des Deutschen in Österreich" leitet. Die Linguistin nutzt mit ihrem Team diesen gigantischen Datenpool, um die österreichische Schriftsprache, ihre regionalen Eigenheiten und Veränderungen zu untersuchen.

Wörterbuch der Mundarten

"Früher wurden die regionalen Besonderheiten von den jeweiligen Experten eher intuitiv ermittelt", so Lenz. "Mit dieser riesigen Sammlung von Zeitungstexten können wir nun objektive, generalisierende Aussagen machen." Ein anderes sprachbezogenes Großprojekt am ACDH ist das Wörterbuch der bairischen Mundarten. Wobei zum bairischen Sprachraum (nicht zu verwechseln mit dem bayrischen) auch fast alle österreichischen Dialekte gehören. Zwischen 1913 und 1936 wurden dazu umfangreiche Fragebogenerhebungen in 2000 österreichischen Dörfern durchgeführt. "Diese Daten lagern in einem riesigen Zettelkasten mit rund vier Millionen Dateikarten", berichtet Lenz. Nun wird dieser wertvolle Datenschatz digitalisiert, sodass auch Interessierte außerhalb der akademischen Welt mehr als einen Blick in die faszinierende Welt der verschwundenen Dialektwörter und Wortbedeutungen werfen können.

Am entsprechenden Wörterbuch arbeiten ÖAW-Forscher seit 100 Jahren, die ersten fünf Bände von A bis E sind schon erschienen. Durch die Digitalisierung wird sich das Tempo nun steigern – "in rund 15 Jahren wollen wir fertig sein", so die Linguistin.

Suche nach Hybridwesen

Basis der Digital Humanities sind nicht nur digitalisierte Texte, sondern beispielsweise auch digitalisierte Fotos von Museumsartefakten oder Audio- und Filmaufnahmen. Wirklich spannend wird das Arbeiten mit diesen Daten, wenn sie (text)technologisch aufbereitet sind. So können etwa digitale Editionen über ein Internetportal zugänglich und durchsuchbar gemacht werden. Außerdem lassen sich unterschiedliche Dokumente über Hyperlinks untereinander sowie mit externen Quellen wie beispielsweise Landkarten, Fotos oder Enzyklopädien verbinden. Hier kommen Begriffe wie "Open Data", "Linked Data" und "Interoperabilität" ins Spiel.

Müssen Geisteswissenschafter heute also auch IT-Experten sein? "Nicht unbedingt", sagt ACDH-Direktor Karlheinz Mörth. "Um seriöse Auswertungen zu bekommen, sollten sie aber schon wissen, was die von ihnen benutzten digitalen Tools machen und wie die Daten strukturiert sind." Sich einfach einen Techniker zum Projekt dazu zu holen reiche jedenfalls nicht. "Die nächste Forschergeneration braucht ein neues Methodeninventar und muss damit auch umgehen lernen."

Zurzeit ist diese Expertise unter den Geisteswissenschaftern noch nicht allzu weit verbreitet. "Die passenden Leute für unser Zentrum zu finden ist nach wie vor ein Problem", sagt Mörth. Einerseits müssen sie über solide IT-Kenntnisse verfügen, andererseits brauchen sie auch ein tieferes Verständnis für die Geisteswissenschaften. "Die meisten unserer Mitarbeiter sind deshalb Hybridwesen, die sich parallel zu einem geisteswissenschaftlichen Studium profunde IT-Kenntnisse angeeignet haben." Durch diverse Förderprogramme habe sich die Situation zuletzt allerdings gebessert. Auch die beiden neuen Professuren für Digital Humanities an den Unis Wien und Graz werden künftig für den sehnlich erwarteten Nachwuchs sorgen.

Ob das der Auftakt zu einer umfassenden qualitativen Wende in den Geisteswissenschaften ist? Manche hoffen darauf, andere fürchten um das eigenständige Interpretieren und Denken zugunsten von Statistik. Eines ist jetzt schon klar: Ohne intelligente Fragen und eine korrekte Interpretation der Resultate werden selbst die smartesten digitalen Methoden nicht funktionieren. (Doris Griesser, 7.12.2017)