Das Collegium Carolinum veranstaltet in Kooperation mit dem Lehrstuhl „Verflechtungsgeschichte Deutschlands mit dem östlichen Europa“ der Universität Augsburg einen Workshop zum Thema „KI-gestützte Texterkennung (OCR/HTR) bei ‚kleinen‘ Sprachen“ - am 14. September 2023 (Museumspädagogik im Sudetendeutschen Haus, Erdgeschoss, Hochstr. 8, 81669 München)
Martina Niedhammer (CC) und Jana Osterkamp (Universität Augsburg)
Automatische Text- und zunehmend auch Handschriftenerkennung (OCR / HTR) spielen im historischen Arbeitsalltag eine nicht zu unterschätzende Rolle. Dabei wird jedoch häufig übersehen, dass entsprechende Modelle oftmals anhand „großer“ Sprachen, wie Englisch oder Deutsch, entwickelt wurden, weshalb ihr Nutzen für „kleine“ Sprachen begrenzt ist. In dem am 14. September am Collegium Carolinum stattfindenden Workshop nehmen wir mit dem östlichen Europa eine Region in den Blick, in der Historiker:innen traditionell mit einer Vielzahl „kleiner“ Quellensprachen konfrontiert werden und fragen einerseits nach den Spezifika der Forschungsarbeit mit eben diesen Sprachen. Andererseits erproben und diskutieren wir Lösungsansätze, die für die Forschungspraxis „kleiner“ Sprachen bereits entwickelt wurden.
Das besondere Augenmerk der eintägigen Veranstaltung liegt auf der Verzahnung von methodischer Reflexion und Praxis, weshalb neben Historiker:innen auch Kolleg:innen aus den Digital Humanities, der IT und dem Bibliothekswesen beteiligt sind. Auf diese Weise möchten wir unter anderem folgende Fragen adressieren: Welchen Mehrwert kann das ursprünglich in der Soziolinguistik entwickelte Konzept der „kleinen“ Sprache für die historische Forschung zu Zentral- und Osteuropa entfalten? Inwieweit knüpft es an die Selbstwahrnehmung von historischen Akteur:innen und / oder die praktische Frage nach der Sichtbarkeit und Zugänglichkeit von Quellen an? Anders gefragt: Gibt es auch große „kleine“ Sprachen? Inwiefern sind dabei auch das Nebeneinander mehrerer „kleiner“ Sprachen oder Interferenzen mit „großen“ Sprachen, die sich in Quellen häufig finden, von Bedeutung?
Interessierte Gäste sind nach vorheriger Anmeldung herzlich willkommen. Eine digitale Zuschaltung per Zoom ist auf Anfrage möglich. Teilnehmende sind eingeladen, für die Hands-on-Session gedruckte und handschriftliche Quellenbeispiele (in digitalisierter Form) aus ihrer eigenen historischen Forschungsarbeit zum östlichen Europa mitzubringen. Zur besseren Planung bitten wir um eine entsprechende Nachricht bis einschließlich 11. September 2023 an martina.niedhammer@collegium-carolinum.de
PROGRAMM
9.00 – 9.30 Uhr
„Kleine“ Sprachen in den Geschichtswissenschaften. Probleme und Herausforderungen einer Quellen- und Analysekategorie
Martina Niedhammer / München; Jana Osterkamp / Augsburg
9.30 – 10.15 Uhr
Keynote: Das „Ruthenische“ im habsburgischen Galizien (1772–1918): Aspekte der Sichtbarkeit und Nachhaltigkeit einer großen „kleinen“ Sprache
Michael Moser / Wien
10.15 – 10.45 Uhr Kaffeepause
Slavische Sprachen: Wege zur „digitalen Gleichberechtigung“
Moderation: Johannes Gleixner / München
10.45 – 11.15 Uhr
Die Neukatalogisierung der Ruthenica-Sammlung an der Österreichischen Nationalbibliothek: neue Zugänge mithilfe von KI?
Annette Höslinger-Finck / Wien
11.15 – 12.15 Uhr
Quelloffene Workflows zur automatischen Texterkennung für ressourcenarme Sprachen am Beispiel des Obersorbischen
Kay-Michael Würzner / Dresden; Wito Böhmak / Bautzen
Mittagessen
13.30 – 15.30 Uhr
Hands-on-Session
Moderation: Michael Kabelka / Augsburg
Praktischer Teil mit eigenen Quellenbeispielen der Teilnehmenden
Niklas Platzer / Florenz; Florian Langhanki / Würzburg
15.30 – 16.00 Uhr Kaffeepause
Diasporasprachen im östlichen Europa und ihre Quellen
Moderation: Martina Niedhammer / München
16.00 – 17.30 Uhr
Erfahrungen aus der Praxis: Armenisch und Armeno-Kipčak
Arpine Maniero / München; Jürgen Heyde / Leipzig (online)
Erfahrungen aus der Praxis: Jiddisch
Daria Vakhrushova / München, Düsseldorf (online)
Von der Handschrift zum Algorithmus: HTR in der Slavistischen Linguistik und darüber hinaus. Das Beispiel nichtlateinischer Alphabete
Aleksej Tikhonov / Freiburg i. Br.
Abschlussdiskussion und gemeinsames Abendessen