Datenpublikation

 

Möglichkeiten zur Publikation von Forschungsdaten

Daten zu veröffentlichen bedeutet, diese zugänglich und zitierbar zu machen. Wichtig für die Zitierfähigkeit eines Datensatzes ist die Vergabe eines Persistent Identifier (PID).

Für die Publikation von Forschungsdaten existieren verschiedene Modelle, die sich drei grundlegenden Gruppen zuordnen lassen:

 

.....

Persistent Identifier (PID)

Ein Identifier ist die eindeutige Identifikation einer (digitalen) Ressource. Beispiel für Identifikationssysteme aus dem Bereich der Printmedien ist die International Standard Book Number (ISBN). Für digitale Objekte wird häufig der Uniform Resource Locator (URL) verwendet. Aufgrund der "Kurzlebigkeit" eigenen sich die URLs nicht für eine dauerhafte und eindeutige wissenschaftliche Zitierbarkeit von Forschungsdaten. Hier werden sogenannte Persistent Identifier (PID) benötigt.

Der PID verleiht Forschungsdaten einen permanenten und unveränderbaren Bezeichner (URI), der ihnen während des gesamten Lebenszyklus zugeordnet bleibt. Beispiele für solche PIDs sind u.a. das Handle System®, Digital Object Identifier (DOI), Archival Research Key (ARK). Mit Hilfe dieser PIDs können die Forschungsdaten eindeutig identifiziert, abgerufen und ähnlich einer Printpublikation zitiert werden. Es gibt sowohl PIDs von Drittanbietern (z.B. DOI) als auch Verfahren, die lokal implementiert werden müssen (z.B. HANDLE).

DOI ist das bekannteste und am weitesten verbreite System zur Zitierung und Recherchierbarkeit von Forschungsdaten. Die Mitglieder des Vereins DataCite e.V fungieren als DOI-Vergabestelle für Forschungsdaten.

I. Forschungsdatenrepositorien

In einem Repositorium erfolgt die Publikation von Forschungsdaten als eigenständiges Objekt zeitlich und örtlich unabhängig von einer interpretativen Veröffentlichung.

Je nach Fachdisziplin existieren mehr oder weniger zahlreiche Forschungsdatenzentren und Repositorien. Das von der DFG geförderte Projekt Re3Data (Registry of Research Data Repositories) setzt sich mit Qualitätsanforderungen an Forschungsdaten-Repositorien verschiedener wissenschaftlicher Disziplinen auseinander und hat die Erfassung dieser in einem zentralen, web-basierten Recherche- und Nachweissystem zum Ziel.

Das World Data System des International Council for Science (ICSU) ist ein Netzwerk von Datenzentren und anderen Institutionen, die Forschungsdaten für einzelne Disziplinen aufbewahren oder andere Dienste in diesem Zusammenhang anbieten. Das ICSU World Data System garantiert durch Evaluierung der Mitglieder Qualität, Langzeitverfügbarkeit, Interoperabilität und Daten-Service. Der Verein DataCite bietet eine Liste von qualitätsgeprüften Repositorien, mit denen er bei der Vergabe von DOI zusammenarbeitet. Die Liste beinhaltet auch die Repositorien des ICSU World Data System.

Wichtige interdisziplinäre Forschungsdaten-Repositorien, die auch die Vergabe von DOI unterstützen, sind:

Zenodo

Figshare

Beispiele für fachspezifische Datenarchive sind Dryad für den Bereich  Biowissenschaften/Medizin und Pangaea für die Geowissenschaften.

II. Data Journals

In Data Journals werden Forschungsdaten mit einer i.d.R. begutachteten, nicht-interpretativen Dokumentation publiziert. Diese Form der Datenpublikation setzt eine textuelle Aufbereitung der Daten seitens der Forschenden voraus. Diese beinhaltet keine Interpretation, aber dokumentiert den Kontext zur Erhebung der Daten (Methoden, Struktur, Relevanz, Zugang). Diese qualitätsgesicherten Kontextinformationen ermöglichen Interessenten/-tinnen die Nachnutzung. Begutachtungsverfahren sichern die Qualität der publizierten Datensätze. Gleich einer Textpublikation sind publizierte Datensätze nicht mehr veränderbar.

Bei dieser Publikationsform wird meist nur die Dokumentation des Datensatzes im Journal publiziert, während die Daten selbst in einem externen Repositorium liegen. Data Journal und Repositorium sind in diesem Fall getrennt.

Beispiele für Data Journals

Scientific Data (NPG)

Earth System Science Data (ESSD)

GigaScience

Journal of Open Archaeology Data (JOAD)

Journal of Chemical and Engineering Data

Scientific Technical Report Data (STR-Data), GFZ

III. Datensupplemente

Es besteht die Möglichkeiten der Anreicherung von interpretativen Text-Publikationen mit sog. Datensupplementen. Die Publikation bezieht sich dabei auf Daten, die insbesondere der Unterstützung der interpretativen Publikation dienen. Bei diesem Publikationsmodell sind die Forschungsdaten am engsten an den traditionellen Publikationsprozess geknüpft.

Ursprünglich wurden supplementäre Daten als Anhang zum interpretativen Artikel in Form von Abbildungen, Tabellen oder detaillierteren Angaben zur Methodik publiziert. Dabei wurden die Daten auf der gleichen Plattform wie auch die Textpublikation veröffentlicht, aber nicht individuell persistent und standardisiert adressiert. Bei diesem Modell sind die Daten Bestandteil des Artikels.

Bei neueren Modellen können Forschungsdaten aber auch als eigenständige Objekte auf der Verlagsplattform oder zeitlich parallel zum interpretativen Artikel in einem externen Datenrepositorium publiziert werden. Die Referenzierbarkeit wird über Persistent Identifier gewährleistet. Im interpretativen Artikel wird dann diese Identifizierung angegeben. Zum Teil gibt es Kooperationen zwischen Verlagen und Datenrepositorien (z.B. Elsevier und PANGEA). Bei diesem Modell können Textpublikation und Forschungsdaten individuell genutzt und zitiert werden.