Datenpublikation
Möglichkeiten zur Publikation von Forschungsdaten
Daten zu veröffentlichen bedeutet, diese zugänglich und zitierbar zu machen. Wichtig für die Zitierfähigkeit eines Datensatzes ist die Vergabe eines Persistent Identifier (PID).
Für die Publikation von Forschungsdaten existieren verschiedene Modelle, die sich drei grundlegenden Gruppen zuordnen lassen:
- als eigenständiges Objekt in einem Forschungsdatenrepositorium
Erklärung zur Rechteeinräumung für die Veröffentlichung von Forschungsdaten auf dem institutionellen Repositorium der RWTH Aachen University - mit textueller Dokumentation in einem Data Journal oder
- als Anreicherung einer interpretativen Text-Publikation in Form eines Datensupplements.
.....
Persistent Identifier (PID)
Ein Identifier ist die eindeutige Identifikation einer (digitalen) Ressource. Beispiel für Identifikationssysteme aus dem Bereich der Printmedien ist die International Standard Book Number (ISBN). Für digitale Objekte wird häufig der Uniform Resource Locator (URL) verwendet. Aufgrund der "Kurzlebigkeit" eigenen sich die URLs nicht für eine dauerhafte und eindeutige wissenschaftliche Zitierbarkeit von Forschungsdaten. Hier werden sogenannte Persistent Identifier (PID) benötigt.
Der PID verleiht Forschungsdaten einen permanenten und unveränderbaren Bezeichner (URI), der ihnen während des gesamten Lebenszyklus zugeordnet bleibt. Beispiele für solche PIDs sind u.a. das Handle System®, Digital Object Identifier (DOI), Archival Research Key (ARK). Mit Hilfe dieser PIDs können die Forschungsdaten eindeutig identifiziert, abgerufen und ähnlich einer Printpublikation zitiert werden. Es gibt sowohl PIDs von Drittanbietern (z.B. DOI) als auch Verfahren, die lokal implementiert werden müssen (z.B. HANDLE).
DOI ist das bekannteste und am weitesten verbreite System zur Zitierung und Recherchierbarkeit von Forschungsdaten. Die Mitglieder des Vereins DataCite e.V fungieren als DOI-Vergabestelle für Forschungsdaten.
I. Forschungsdatenrepositorien
In einem Repositorium erfolgt die Publikation von Forschungsdaten als eigenständiges Objekt zeitlich und örtlich unabhängig von einer interpretativen Veröffentlichung.
Je nach Fachdisziplin existieren mehr oder weniger zahlreiche Forschungsdatenzentren und Repositorien. Das von der DFG geförderte Projekt Re3Data (Registry of Research Data Repositories) setzt sich mit Qualitätsanforderungen an Forschungsdaten-Repositorien verschiedener wissenschaftlicher Disziplinen auseinander und hat die Erfassung dieser in einem zentralen, web-basierten Recherche- und Nachweissystem zum Ziel.
Das World Data System des International Council for Science (ICSU) ist ein Netzwerk von Datenzentren und anderen Institutionen, die Forschungsdaten für einzelne Disziplinen aufbewahren oder andere Dienste in diesem Zusammenhang anbieten. Das ICSU World Data System garantiert durch Evaluierung der Mitglieder Qualität, Langzeitverfügbarkeit, Interoperabilität und Daten-Service. Der Verein DataCite bietet eine Liste von qualitätsgeprüften Repositorien, mit denen er bei der Vergabe von DOI zusammenarbeitet. Die Liste beinhaltet auch die Repositorien des ICSU World Data System.
Wichtige interdisziplinäre Forschungsdaten-Repositorien, die auch die Vergabe von DOI unterstützen, sind:
Beispiele für fachspezifische Datenarchive sind Dryad für den Bereich Biowissenschaften/Medizin und Pangaea für die Geowissenschaften.
II. Data Journals
In Data Journals werden Forschungsdaten mit einer i.d.R. begutachteten, nicht-interpretativen Dokumentation publiziert. Diese Form der Datenpublikation setzt eine textuelle Aufbereitung der Daten seitens der Forschenden voraus. Diese beinhaltet keine Interpretation, aber dokumentiert den Kontext zur Erhebung der Daten (Methoden, Struktur, Relevanz, Zugang). Diese qualitätsgesicherten Kontextinformationen ermöglichen Interessenten/-tinnen die Nachnutzung. Begutachtungsverfahren sichern die Qualität der publizierten Datensätze. Gleich einer Textpublikation sind publizierte Datensätze nicht mehr veränderbar.
Bei dieser Publikationsform wird meist nur die Dokumentation des Datensatzes im Journal publiziert, während die Daten selbst in einem externen Repositorium liegen. Data Journal und Repositorium sind in diesem Fall getrennt.
Beispiele für Data Journals
Earth System Science Data (ESSD)
Journal of Open Archaeology Data (JOAD)
III. Datensupplemente
Ursprünglich wurden supplementäre Daten als Anhang zum interpretativen Artikel in Form von Abbildungen, Tabellen oder detaillierteren Angaben zur Methodik publiziert. Dabei wurden die Daten auf der gleichen Plattform wie auch die Textpublikation veröffentlicht, aber nicht individuell persistent und standardisiert adressiert. Bei diesem Modell sind die Daten Bestandteil des Artikels.
Bei neueren Modellen können Forschungsdaten aber auch als eigenständige Objekte auf der Verlagsplattform oder zeitlich parallel zum interpretativen Artikel in einem externen Datenrepositorium publiziert werden. Die Referenzierbarkeit wird über Persistent Identifier gewährleistet. Im interpretativen Artikel wird dann diese Identifizierung angegeben. Zum Teil gibt es Kooperationen zwischen Verlagen und Datenrepositorien (z.B. Elsevier und PANGEA). Bei diesem Modell können Textpublikation und Forschungsdaten individuell genutzt und zitiert werden.