Bei der Wahl des Dateiformats sollte vor allem auf langfristige Speicherung und Nutzung geachtet werden. Die Formate sollten möglichst nicht verschlüsselt, nicht komprimiert und nicht proprietär sein. Die Formate sollten nach Möglichkeit von weitverbreiteten, in der Wissenschaft üblichen Standardprogrammen lesbar sein.
Zusammenstellungen von empfehlenswerten Formaten finden Sie z.B. beim RADAR-Projekt oder sehr ausführlich bei IANUS.
Es gilt Dateinamen zu wählen, die möglichst aussagekräftig und eindeutig sind. Die Dateibenennung kann zum Beispiel folgende Informationen enthalten:
Auch hier gilt es eine Benennung zu finden, die auf den Inhalt schließen lassen. Passen Sie die Struktur an den Inhalt an, Ordner können z.B. nach Erhebungszeitraum, Ort oder Bearbeitungsstatus eingeteilt sein. Eine ausführlichere Anleitung mit einem Beispiel aus den Altertumswissenschaften finden Sie bei IANUS.
Metadaten sind Daten, die Daten beschreiben. Sie sind nach einem festen Schema strukturiert und enthalten wichtige Informationen wie Titel, AutorIn/BearbeiterIn, Zeit, Ort und Inhalt. In vielen Disziplinen, besonders in den Natur- und Lebenswissenschaften, haben sich bereits fachspezifische Metadatenstandards etabliert. Listen mit allgemeinen und fachspezifischen Metadatenschemata wurde von der Research Data Alliance und vom Digital Curation Center zusammengestellt.
Dublin Core ist ein weitverbreiteter Basisstandard für Datenbeschreibung, mit seinen 15 Feldern sind die wichtigsten Grundinformationen durch ihn abgedeckt. Ein anderer wichtiger Metadatenstandard ist DataCite Metadata Standard, der auch vom Refubium (LINK) genutzt wird. Für die Geisteswissenschaften sind darüber hinaus die Standards der Text Encoding Initiative (TEI) weitverbreitet.
Überlegen Sie, in welcher Sprache sie Metadaten anlegen, es empfiehlt sich neben Deutsch auch Englisch zu verwenden,so dass sie bei Veröffentlichung international gefunden, verstanden und nachgenutzt werden können. Falls die Daten selbst in einer weiteren Sprache sind, sollten sie auch in diese Sprache beschrieben werden.
Daten können auf viele Arten verloren gehen oder zerstört werden, z.B. durch Festplattenausfälle, Datenkorruption, Diebstahl oder versehentliches Löschen bzw. überschreiben. Dabei kann ein erheblicher Kosten- und Zeitaufwand zur Wiederherstellung oder Neuerhebung der Daten anfallen. Deswegen sollten die Daten zum einen immer an einem sicheren, am besten passwortgeschützten Ort (besonders beim Umgang mit sensiblen Daten) gesichert werden. Des Weiteren sollten Sicherungskopien erstellt und dafür ein regelmäßiger Zeitabstand festgelegt werden. Je häufiger Backups erstellt werden, desto weniger Aufwand entsteht bei eventuellem Datenverlust. Hier finden Sie Informationen zu dem Backup-Service der ZEDAT an der Freien Universität Berlin.
Gehen Sie besonders sorgfältig mit sensiblen (personenbezogenen) Daten um. Diese sollte mit einem Passwort verschlüsselt werden und so früh wie möglich anonymisiert werden.
Wie gehe ich bei der Anonymisierung vor?
Achten Sie im Vorfeld, bei der Erhebung von personenbezogenen Daten darauf, eine Einverständniserklärung einzuholen. Anonymisierung sollte so früh wie möglich erfolgen.
Zu dem Thema gibt es bereits einige Literatur:
Die Freie Universität Berlin bietet mit dem File Service und Volumesharing Service eine Möglichkeit, Daten in der Cloud (fu.box) zu speichern und über einen Link (auch mit Externen) zu teilen. MitarbeiterInnen der Freien Universität Berlin stehen 10 GB Speicherplatz zur Verfügung.
Dazu hat die Deutsche Forschungsgemeinschaft (DFG) eine nützliche Handreichung (http://www.dfg.de/formulare/12_151/12_151_de.pdf) publiziert.