FDM-Glossar
D
Datenjournal (Data journal)
Datenjournale publizieren Artikel mit Beschreibungen von Forschungsdaten. Damit unterscheiden sie sich von herkömmlichen wissenschaftlichen Journalen, bei denen die wissenschaftliche Interpretation im Vordergrund steht. Datenjournal-Artikel beschrieben meist große und komplexe Datensätze und die Artikel durchlaufen in aller Regel ein Peer-Review-Verfahren, wie es bei herkömmlichen wissenschaftlichen Zeitschriften üblich ist. Die Daten selbst, die in Datenjournal-Artikeln beschrieben werden, werden größtenteils separat in Datenrepositorien publiziert.
Datenjournale fördern die Nachnutzung von Forschungsdaten und deren Anerkennung als wissenschaftliche Leistung und versuchen, die Transparenz von wissenschaftlichen Methoden und Ergebnissen zu verbessern sowie gute Datenmanagementpraktiken zu unterstützen.
Eine Übersicht qualitätsgesicherter Datenjournale liefert forschungsdaten.org.
Datenmanagementplan
Ein Datenmanagementplan (DMP) beschreibt systematisch, wie mit in Projekten erstellten Forschungsdaten umgegangen werden wird. Er dokumentiert die Speicherung, Verzeichnung, Pflege und Verarbeitung der Daten. Der Datenmanagementplan ist wichtig, um Daten für Dritte interpretierbar und nachnutzbar zu machen. Es ist sinnvoll, bereits vor Projektbeginn Verantwortlichkeiten im Umgang mit den Daten zu klären.
Viele Forschungsförderinstitutionen erwarten inzwischen bei der Beantragung von Fördermitteln auch Aussagen zum Forschungsdatenmanagement, die mindestens Elemente eines Datenmanagementplans enthalten, so z. B. die Deutsche Forschungsgemeinschaft in ihren Leitlinien zum Umgang mit Forschungsdaten. Das Team Forschungsdatenmanagement der Universitätsbibliothek berät Sie gern bei der Erstellung eines DMP.
Digitalisat
Ein Digitalisat ist das Endprodukt einer Digitalisierung. Während der Digitalisierung wird ein analoger Gegenstand (Buch, Handschrift, Bild, Plastik usw.) in digitale Werte überführt, um diesen elektronisch zu speichern. Gegenüber dem analogen Gegenstand sind die einfache Verteilung und Nutzung von Forschungsdaten als Digitalisat und die Möglichkeit einer maschinellen Verarbeitung von Vorteil. Außerdem verhindert die Arbeit mit Digitalisaten die Verfälschung bzw. Beschädigung des Originals durch weitere analoge Verarbeitung.
Die Universitätsbibliothek bietet verschiedene Services zur Digitalisierung von Medien aus Bibliotheken der Freien Universität an.
Dokumentation von Forschungsdaten
Die Dokumentation von Forschungsdaten dient der Auffindbarkeit und Recherchierbarkeit von Forschungsdaten, ihrer Nachvollziehbarkeit und Nachnutzung. Während die Auffindbarkeit in der Regel durch die Verwendung strukturierter Metadaten ermöglicht wird, ist eine ergänzende Beschreibung des Entstehungskontextes, der Methoden und der entstandenen Daten erforderlich, um sie zu verstehen und nutzen zu können. Im Refubium, dem institutionellen Repositorium der Freien Universität, wird daher begleitend zu den eigentlichen Daten eine Datenbeschreibung (Textdatei) veröffentlicht.
F
FAIR-Prinzipien
Der Begriff FAIR (Findable, Accessible, Interoperable und Reusable) Data wurde 2016 erstmals von der FORCE11-Community für ein nachhaltiges Forschungsdatenmanagement geprägt. Hauptziel der FAIR-Prinzipien ist eine optimale Aufbereitung der Forschungsdaten, die demnach sowohl für Menschen als auch Maschinen auffindbar, zugänglich, interoperabel und wiederverwendbar sein sollen.
Die umfangreichen Prinzipien sind auf der FORCE11-Website aufgelistet. Initiativen wie GO-FAIR erarbeiten entsprechende Umsetzungsleitlinien zu den weiterhin in der Ausgestaltung begriffenen Kriterien.
Forschungsdaten
Forschungsdaten sind sowohl forschungsrelevante, im Forschungsverlauf zu digitalisierende analoge Daten, Dokumente und Objekte, sowie genuin digitale Daten, Dokumente und Objekte („born digital“), die während eines Forschungsprozesses entstehen, Forschungsgegenstand oder -ergebnis sind. Darüber hinaus zählen hier auch solche Informationen als Forschungsdaten, die die Dokumentation, Nachvollziehbarkeit und – abhängig vom Forschungsgebiet – Reproduzierbarkeit der Ergebnisse gewährleisten (Metadaten).
Als Beispiele für Forschungsdaten werden üblicherweise etwa Digitalisate, audiovisuelle Daten, digitale Repräsentationen von analogen Daten, Mess-, Beobachtungs- und Befragungsdaten, Texte und Texteditionen, Datenbanken und Objektsammlungen, Protokolle, methodische Testverfahren, wie Fragebögen, Software und Simulationen genannt. Die DFG formuliert zudem Quellcode und Software-Entwicklungen dann als Forschungsdaten, wenn sie zentrale Ergebnisse wissenschaftlicher Forschung darstellen. Die Bandbreite der Datentypen spiegelt die Vielfalt der wissenschaftlichen Disziplinen und ihrer Forschungsansätze und -verfahren wider.
Forschungsdaten können im Rahmen ihrer Beforschung verschiedene Formen (z. B. unterschiedliche Qualitätsstufen der Aufbereitung bzw. Anreicherung, unterschiedliche Verarbeitungsstände, unterschiedliche Ergebnispräsentationen) annehmen und mit unterschiedlichen Zugangsberechtigungen versehen werden, z. B. als offene, zugriffsbeschränkte und nichtöffentliche Daten.
Siehe auch: Deutsche Forschungsgemeinschaft. 2022. „Leitlinien zur Sicherung guter wissenschaftlicher Praxis (Kodex)“. https://doi.org/10.5281/zenodo.6472827.
Forschungsdatenmanagement
Forschungsdatenmanagement begleitet den gesamten Forschungsprozess und umfasst die Organisation und Dokumentation, die Speicherung, Sicherung und Archivierung sowie das Teilen und die Publikation von Daten. Neben einer erhöhten Sichtbarkeit der eigenen Daten und der zugehörigen Forschung ermöglicht es eine verbesserte Datenqualität bzw. -aufbereitung, die einfachere (Nach-)Nutzung durch die Forschenden selbst oder durch andere und – durch Verknüpfung verschiedener Datensätze – die Kontextualisierung in neuen, bisher unbekannten Zusammenhängen. Darüber hinaus gewährleistet ein nachhaltiges Forschungsdatenmanagement die Umsetzung von Anforderungen und Standards aus den Fachdisziplinen, der Forschungsförderung, der Publikationsorgane sowie forschungsethischer Leitlinien.
G
Gute wissenschaftliche Praxis
Mit dem Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ liefert die Deutsche Forschungsgemeinschaft (DFG) ein Referenzwerk zur wissenschaftlichen Integrität. Mit 19 Leitlinien setzt sie einen Orientierungsrahmen und beschreibt Standards für das wissenschaftliche Arbeiten.
Forschungsdatenmanagement wird in mehreren dieser Leitlinien thematisiert, z. B. im Zusammenhang mit Qualitätssicherung, Dokumentation, Veröffentlichung und Archivierung von Forschungsdaten. Dazu zählt die Empfehlung, alle den Forschungsergebnissen zugrundeliegenden Materialien und Daten für einen Zeitraum von in der Regel zehn Jahren aufzubewahren. Auch die Dokumentation und Veröffentlichung von Forschungssoftware werden als zentrale Elemente der guten wissenschaftlichen Praxis benannt.
Siehe auch:
- Deutsche Forschungsgemeinschaft. 2022. „Leitlinien zur Sicherung guter wissenschaftlicher Praxis (Kodex)“. https://doi.org/10.5281/zenodo.6472827.
- Freie Universität Berlin. 2024. „Satzung zur Sicherung guter wissenschaftlicher Praxis (GWP-Satzung)“. Mitteilungen. Amtsblatt der Freien Universität Berlin 2024 (2).https://www.fu-berlin.de/service/zuvdocs/amtsblatt/2024/ab022024.pdf.
L
Lizenzen
Um eine maximale Nachnutzbarkeit auch solcher Forschungsdaten zu gewährleisten, die prinzipiell dem Urheberrecht unterliegen können, kann die Vergabe zusätzlicher Nutzungsrechte z. B. durch eine entsprechende Lizenzierung der Daten in Betracht gezogen werden. Die Verwendung liberaler Lizenzmodelle, insbesondere der weltweit anerkannten Creative-Commons-Lizenzen (CC), ist dabei eine Möglichkeit, Bedingungen für die Nachnutzung der publizierten Forschungsdaten nachvollziehbar festzulegen.
M
Maschinenlesbarkeit
Strukturierte maschinenlesbare (Forschungs-)Daten sind von Maschinen les- und interpretierbar. In standardisierten Formaten übertragene Daten ermöglichen den effizienten Informationsaustausch zwischen Systemen, z. B. Metadaten zu Forschungsdaten, die im DataCite-Schema ausgezeichnet sind.
Metadaten
Metadaten sind Daten, die strukturierte Informationen über andere Daten bzw. Ressourcen und deren Merkmale enthalten. Sie werden als Kontextinformation unabhängig von oder gemeinsam mit den Daten, die sie näher beschreiben, gespeichert.
In der Regel werden fachliche und technische bzw. administrative Metadaten unterschieden.
Um die Auffindbarkeit und Nachvollziehbarkeit von Daten durch Metadaten zu erhöhen, wird eine Standardisierung der Beschreibung angestrebt. Durch einen Metadatenstandard können Metadaten aus unterschiedlichen Quellen miteinander verknüpft und gemeinsam bearbeitet werden.
Mindestaufbewahrungszeit
Forschungsförderer und Forschungseinrichtungen verpflichten im Rahmen der guten wissenschaftlichen Praxis zur Aufbewahrung von im Kontext von Projekten, Dissertationen und anderen Forschungsarbeiten generierten Forschungsdaten. In diesem Zusammenhang wird in der Regel eine Mindestaufbewahrungszeit von zehn Jahren empfohlen.
Siehe auch:
- Deutsche Forschungsgemeinschaft. 2022. „Leitlinien zur Sicherung guter wissenschaftlicher Praxis (Kodex)“. https://doi.org/10.5281/zenodo.6472827.
- Freie Universität Berlin. 2020. „Satzung zur Sicherung guter wissenschaftlicher Praxis (GWP-Satzung)“. Mitteilungen. Amtsblatt der Freien Universität Berlin 2020 (42). https://www.fu-berlin.de/service/zuvdocs/amtsblatt/2020/ab422020.pdf.
O
Open Access
Open Access bezeichnet einen kostenlosen und möglichst barrierefreien Zugang zu digitalen wissenschaftlichen Inhalten. Nutzenden werden dabei in der Regel umfangreiche Nutzungsrechte und einfache Zugangswege ermöglicht. Die Urheberschaft bleibt in der Hand der Autorinnen und Autoren. Durch Open Access können wissenschaftliche Informationen maximal verbreitet, genutzt und weiterverarbeitet werden.
Open Access bildet ein Kernelement der unter Open Science / Open Research / Open Scholarship formulierten Wissenschaftspraxis.
Die seit 2008 an der Freien Universität vorliegende Open-Access-Policy (Aktualisierung: 2021) regelt Empfehlungen und Leitlinien zur Umsetzung von Open Access. Die 2017 erarbeitete Open-Access-Strategie 2018–2020 der Freien Universität hat zudem u. a. eine signifikante Erhöhung des Anteils der Open-Access-Zeitschriftenpublikationen bis 2020 zum Ziel.
Weitere Informationen: Open Access an der Freien Universität
Open Science / Open Research / Open Scholarship
Open Science / Open Research / Open Scholarship bezeichnet eine durch freie Zugänglichkeit, Transparenz und Partizipation gekennzeichnete Wissenschaftspraxis. Forschungsdaten, aber auch -Methoden, -Software, -Bildungsressourcen und Publikationen sollen dabei frühzeitig frei zugänglich, geteilt und kollaborativ weiterentwickelt werden. Zu Open Science / Open Research / Open Scholarship zählen u. a. die Bereiche Open Access, Open Data, Open Source, Open Educational Resources und Open Methods.
Zu Open Science an der Freien Universität siehe Open Science Working Group.
P
Persistenter Identifikator
Als persistenten Identifikator versteht man einen dauerhaften digitalen Identifikator, bestehend aus Ziffern und/oder alphanumerischen Zeichen, der einem Datensatz (oder einem anderen digitalen Objekt) zugeordnet wird und direkt auf diesen verweist.
Häufig verwendete Identifikatoren-Systeme sind DOI (Digital Object Identifiers) und URN (Uniform Resource Names). Im Gegensatz zu anderen seriellen Identifikatoren (z. B. URL-Adressen) verweist ein persistenter Identifikator auf das Objekt selbst und nicht auf seinen Standort im Internet. Ändert sich der Standort eines mit einem persistenten Identifikator assoziierten digitalen Objekts, so bleibt der Identifikator derselbe. Es muss lediglich in der Identifikator-Datenbank der URL-Standort geändert oder ergänzt werden. So wird sichergestellt, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt.
An der Freien Universität können über den DOI-Service persistente Identifikatoren vergeben werden.
R
Repositorium
Ein Repositorium dient als verwalteter Speicherort für digitale Objekte zur Veröffentlichung und Archivierung von Forschungsdaten. Neben institutionellen Repositorien existieren zahlreiche fachspezifische Repositorien (vgl. re3data).
Das institutionelle Repositorium Refubium der Universitätsbibliothek ermöglicht Angehörigen der Freien Universität die kostenfreie Veröffentlichung von Dissertationen, Forschungsarbeiten und Forschungsdaten.
Weitere Informationen: Refubium A-Z
S
Speicherung, Sicherung und Archivierung
Bei der Aufbewahrung von digitalen Forschungsdaten werden folgende Aspekte berücksichtigt:
Speicherung umfasst Verfahren und Methoden der (physischen) Aufbewahrung von Daten in Rechner- und Informationssystemen (z. B. während eines laufenden Projekts oder Vorhabens).
Sicherung umfasst Methoden der Datensicherheit (z. B. Zugriffskontrolle, Zugriffsbeschränkungen, Verschlüsselung), die einen unberechtigten Zugriff auf Forschungsergebnisse verhindern (sollen).
Archivierung umfasst Methoden der langfristigen Aufbewahrung (in der Regel von Ergebnissen abgeschlossener Projekte oder Vorhaben). Hierbei kommen häufig Standardformate zum Einsatz. Ergebnisse werden für eine Mindestaufbewahrungszeit aufbewahrt.
Die Universitätsbibliothek und die ZEDAT unterstützen bei entsprechenden Fragestellungen.
Siehe auch: Freie Universität Berlin. 2019. „IT-Sicherheitsrichtlinie der Freien Universität Berlin (Version 4.0)“. https://www.fu-berlin.de/sites/it-sicherheit/downloads/IT-Sicherheitsrichtlinie.pdf.
Standardformate
Standardformate entsprechen üblicherweise uneingeschränkt nutzbaren Datei- bzw. Datenformaten. Je nach Dateityp handelt es sich dabei um unterschiedliche offene und standardisierte Formate (z. B. CSV für Tabellen), die von einer Vielzahl von Anwendungen gelesen und verarbeitet werden können. Standardformate weisen zum Teil disziplinenspezifische Ausdifferenzierungen auf.
Gängige Standardformate: Übersicht häufig gebrauchter Dateiformate auf der Informationsplattform forschungsdaten.info.
Mehrere Definitionen sind dem Glossar der Informationsplattform forschungsdaten.info entnommen, die unter Creative Commons Zero CC0 1.0 stehen.