Nachhaltige DH in Forschung und Lehre
20. & 21. Juli 2023
Einführung in die Transkription von Handschriften und Drucken mit eScriptorium
Larissa Will
21.07.2023, 13:00 – 15:00
Egal, ob es sich um Editionsvorhaben, ein Seminar zur Handschriftenkunde oder Citizen-Science-Projekte handelt: Schriftgut aus vergangenen Zeiten lässt sich oft nicht ohne Weiteres entziffern und maschinell weiterverarbeiten.
Die Texterkennungs- und Transkriptionsplattform eScriptorium kann hier bei der Erschließung von historischen Quellen unterstützen. Dabei spielt es keine Rolle, ob es sich um eine Postkarte, eine historische Zeitung oder ein behördliches Dokument handelt. eScriptorium ist eine freie Open-Source-Alternative zu Transkribus, die sich auf dem eigenen PC oder Server betreiben lässt. Handschriftliche und gedruckte Texte können automatisiert oder manuell segmentiert und transkribiert werden. Segmentierung und Texterkennung lassen sich auch trainieren und die so neu erzeugten Modelle können weitergegeben werden. Die Universitätsbibliothek Mannheim betreibt seit Oktober 2021 eine eigene Instanz von eScriptorium und hat seitdem schon einige Projekte damit umgesetzt.
Beim Workshop werden die Teilnehmenden anhand eigener oder bereitgestellter Dokumente den gesamten OCR-Workflow durchlaufen. Von der Layouterkennung und -korrektur über die automatisierte Texterkennung bis hin zur manuellen Korrektur der OCR-Ergebnisse und dem Training eigener Modelle bietet der Workshop einen spannenden Einstieg in die Welt der modernen Transkriptionsarbeit.