Service | Vom Dokument zur Edition: Texte automatisiert erschließen und publizieren mit Transkribus und TEI-Publisher
Ein Angebot des Center für Digitale Systeme (CeDiS)
Mit dem Medienwandel zeichnet sich auch im Bereich kritischer Editionen ein Paradigmenwechsel ab: Die Tendenz geht zur „digitalen Edition“, die entweder begleitend zur klassischen Print-Publikation eingesetzt wird oder diese als genuin digitales Produkt immer häufiger vollständig substituiert. Das Internet, sog. neue Medien sowie der verstärkte Einsatz von Informationstechnologie in den Geisteswissenschaften eröffnen dabei neue Möglichkeitsräume für Erfassung, Analyse und Visualisierung von Inhalten. Um diese Potenziale ausschöpfen und in nachhaltige Editionsprodukte umsetzen zu können, muss das „digitale Paradigma“ bei Konzeption und Realisierung konsequent mitgedacht werden. Dies erfordert u. a. ein grundlegendes Verständnis der involvierten Technologien und technischen Prozesse von der Erschließung des zu edierenden Gegenstands bis hin zu dessen Präsentation in ggf. multiplen Wiedergabeszenarien.
Dieser Workshop vermittelt einen Gesamtüberblick über eine mögliche technische Infrastruktur für die digitale Edition handschriftlicher Dokumente. Zunächst wird die Dokumenterschließung betrachtet, wobei ausgehend von Digitalisaten mit HTR-Verfahren unter Verwendung der Software „Transkribus“ automatisiert Transkriptionen erzeugt, annotiert und in XML/TEI-Daten exportiert werden. Im Anschluss werden Wiedergabeszenarien für die erschlossenen Daten konzipiert und mithilfe des Publikationsframeworks „TEI Publisher“ umgesetzt. Die Prozessschritte können dabei in praktischen Übungen an Beispieldaten nachvollzogen werden.
Zielgruppe
- Forschende und Lehrende der Freien Universität Berlin
- Fokus auf Forschung an/mit Textdaten, insb. Textedition
Voraussetzungen
Inhaltliche Voraussetzungen:
- Grundkenntnisse in XML bzw. TEI sind von Vorteil, aber nicht erforderlich
Technische Voraussetzungen:
- Eigener Laptop
- Installation von Transkribus (Nutzen Sie bitte den „Expert Client“; Download & Installationsanleitung: https://readcoop.eu/de/transkribus/wiki/download-und-installation/; für den Download ist es nötig, einen kostenlosen Account einzurichten.)
- Installation des Oxygen XML Editor (Download & Installationsanleitung: https://www.zedat.fu-berlin.de/Benutzerservice/OXygenXMLEditor)
Inhalt
- Handschriftenerkennung: Layout-Analyse, Transkription, Machine Learning/Model Training
- Handschrifterschließung: Strukturerkennung, Tagging, Datei- und Datenexport
- Konzeption, Bearbeitung und Kontrolle von XML-Daten gemäß der Richtlinien der Text Encoding Initiative
- Konfiguration des „TEI Publisher“ für die Wiedergabe von TEI-Daten entsprechend bestimmter Anforderungen
Lernziele
- Sie lernen die Möglichkeiten der automatischen Handschriftenerkennung mit „Transkribus“ kennen
- Sie sensibilisieren sich für die zentrale Rolle der Daten in Editionsvorhaben
- Sie lernen mit dem „TEI Publisher“ ein Framework für die Wiedergabe XML-basierter Textdaten kennen
- Sie bekommen ein Verständnis für die technische Architektur und die Prozessschritte XML-basierter Publikationsworkflows
Weitere Informationen sowie das Anmeldeformular finden Sie hier.
Zeit & Ort
14.12.2022 | 09:00 - 13:00
Garystr 39
Voranmeldung notwendig