NFDI-Projekt "Text+ohd"
Text+-Schnittstellen zu den Interview-Sammlungen in Oral-History.Digital
Das Projekt „Text+-Schnittstellen zu den Interview-Sammlungen in Oral-History.Digital (text+oh.d)“ zielt darauf ab, in geschichtswissenschaftlichen Projekten erarbeiteten Interview-Bestände in der Infrastruktur des NFDI-Konsoriums Text+ zugänglich zu machen. Durch die Weiterentwicklung von Schnittstellen und die standardkonforme Transformation von Transkripten im sammlungsübergreifenden Interviewportal Oral-History.Digital (oh.d) sollen umfangreiche Korpora aus der mündlichen Alltagssprache für die text- und sprachbasiert arbeitenden Forschungscommunities nachnutzbar werden.
Beschreibung:Im Projekt text+ohd sollen die Metadaten von Interview-Archiven und -Sammlungen über eine OAI-PMH-Schnittstelle (Open Archives Initiative Protocol for Metadata Harvesting) in der Text+-Registry nachweisbar gemacht werden; andererseits sollen die Transkripte der mehrstündigen Interviews bei entsprechender Zugangsberechtigung in ISO-konformen TEI-XML-Dateien (Text Encoding Initiative) zur Verfügung gestellt werden.
Durch Schnittstellenentwicklung und die Umwandlung von Transkripten in standardisierte Formate werden diese Daten künftig leichter durchsuchbar und disziplinübergreifend nutzbar. Damit unterstützt die Universitätsbibliothek die interdisziplinäre Zusammenarbeit von Geschichts- und Sprachwissenschaft bundesweit.
OAI-Schnittstelle für Interviewsammlungen
Im Projekt text+oh.d soll die bereits vorhandene OAI-PMH-Schnittstelle in Oral History.Digital zunächst in Bezug auf die Anforderungen der Text+-Infrastruktur evaluiert werden. Neben einzelnen Interviews sollen nun auch die in oh.d verfügbaren Interviewarchive und ihre Teilsammlungen über frei zugängliche (CC0) Metadaten in der Text+-Registry verzeichnet werden.
Im Rahmen der Evaluation werden zu Projektbeginn auch die in der OAI-Schnittstelle zu implementierenden Datenformate festgelegt. Kriterien der Auswahl sind die Verbreitung des Standards und die konkrete Nutzbarkeit für sprachwissenschaftliche Forschungsprojekte, die Flexibilität angesichts der sich entwickelnden Infrastruktur und die Umsetzbarkeit innerhalb des begrenzten Projektzeitraums.
TEI-XML-Transformation von Interviewmetadaten und Transkripten
Darüber hinaus sollen bei entsprechender Berechtigung auch Volltexte in standardkonformen Formaten über Text+ für eine Nachnutzung bereitgestellt werden. Die Interviews können bislang in oh.d mit Verschlagwortungen, Überschriften und Anmerkungen als CSV-Tabelle heruntergeladen werden. Viele Transkripte enthalten zudem Auszeichnungen von Mimik, Gestik, fremdsprachigen Ausdrücken, Pausen, Wortabbrüchen und weiteren sprachlichen und nicht-sprachlichen Phänomenen.
Im Projekt text+oh.d sollen diese Transkripte zusammen mit den Metadaten in XML-Dateien transformiert werden, die dem TEI-basierten Standard „ISO 24624:2016 Language resource management — Transcription of spoken language“ entsprechen (Hedeland/Schmidt 2022). Dabei müssen Timecodes, Sprecherwechsel und die je nach Sammlung unterschiedlichen Transkriptionszeichen in TEI-Tags umgewandelt werden.
In text+ohd wird die Transformation von Transkripten in ein ISO-konformes TEI-XML-Format an drei exemplarischen Sammlungen spezifiziert und erprobt, die unterschiedliche Transkriptionsmethoden ebenso repräsentieren wie Sprachvielfalt mit Übersetzungen, und darüber hinaus ein breites Themenspektrum abdecken.
Laufzeit und Förderung:Die Nationale Forschungsdateninfrastruktur (NFDI) arbeitet daran, Forschungsdaten nach den FAIR-Prinzipien langfristig auffindbar (findable), zugänglich (asscessible), verknüpfbar (interoperable) und wiederverwendbar (reusable) zu machen.
Das Konsortium „Text+“, geleitet vom Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim, bündelt Expertise und Daten aus Universitäten, Akademien und Forschungszentren. Der Fokus liegt auf:
- Korpora und Textsammlungen
- Lexikalischen Ressourcen
- Editionen und Infrastrukturen
Jedes Jahr fördert „Text+“ neue Projekte, um Daten und Services für sprach- und textorientierte Wissenschaften zu verbessern.
Das Projekt „Text+ohd“ ist eines von fünf im Jahr 2025 geförderten Kooperationen mit einer Laufzeit vom 01.01.2025 bis zum 30.11.2025. Durch die Beteiligung an „Text+“ gestaltet die Universitätsbibliothek der FU die Zukunft der digitalen Forschungs-, Lehr- und Informationsinfrastrukturen für die text- und sprachorientierten Wissenschaften aktiv mit
Team: Kontakt:Freie Universität Berlin
Universitätsbibliothek
Digitale Interview-Sammlungen
Projekt Text+ohd
Garystr. 39
14195 Berlin
Web: https://www.fu-berlin.de/text_ohd
Mail: text+ohd@oral-history.digital