Datendokumentation und Wissenschafts-Karma

So machst du deine Forschung fit für andere

Ein Beitrag von Jannes Uhlott und Sophie Boße – Teil 1

Daten gibt es viele – aber welche haben die Qualität, die ich brauche? Die Vorteile von Datenqualitätsinformationen sind enorm. Die Daten sind zuverlässig und die Nutzenden  können aufgrund der umfangreichen Informationen für sich selbst bewerten, ob die Daten für ihren spezifischen Zweck anwendbar sind. Leider hat die Datenqualität momentan allerdings keinen guten Stand in der agrarwissenschaftlichen Community. Unsere Umfrage zeigt, dass die meisten Forschenden keine Zeit haben, um sich tiefergehend mit dem Thema zu beschäftigen oder es auf die eigenen Daten anzuwenden. Ein Großteil der Teilnehmenden, die sich selbst wünschen, zusätzliche Informationen über Datensätze zu erhalten, geben an, dass sie pro Datensatz maximal 30 Minuten aufbringen wollen würden, um Datenqualitätsinformationen bereitzustellen. Zusätzlich werden neben dem Mangel an Zeit auch fehlende Standards im Bereich Metadaten und Datenqualität sowie fehlendes Wissen über die Themen genannt.

Um diesem entgegenzuwirken, werden in FAIRagro Tools geschaffen, die möglichst automatisierte Daten(qualitäts)informationen erfasst. Da die Daten in den Agrarwissenschaften sehr heterogen sind und oft der Teufel im Detail liegt, müssen wir auf diese Wundertools leider noch etwas warten. Wie können wir uns bis dahin sowohl selbst als auch unsere Community motivieren, Datenqualität einen Platz in unserem (Daten-)Alltag einzuräumen? Was sind einfache und vor allem schnelle Methoden? 

Daten teilen und Zitationen abstauben: Wie du mit guter Doku dein Wissenschafts-Karma aufwertest

Generell ermöglicht die Veröffentlichung deiner Daten anderen deren Nachnutzung. Das spart der Wissenschaft Zeit und somit enorme Kosten, da die Daten nicht nochmals erhoben und aufbereitet werden müssen. Je ausführlicher deine Daten dokumentiert und mit Qualitätsinformationen versehen sind, desto einfacher können sie durch andere weiterverwendet werden. Daten und ihre Qualität ausführlich zu beschreiben und für die Nachnutzung zu veröffentlichen, bringt dir noch mehr als nur ein paar Karma-Punkte! Dir selbst kann es vor allem Zitationen ermöglichen, die ja bekannterweise die Währung in der Wissenschaft sind. Außerdem wirst du somit bekannter – wer wollte nicht schon immer mal bei einer Konferenz auf seine/ihre tollen Daten angesprochen werden?! 

Generell ist aber das Schaffen von neuem Wissen und das Teilen dessen das Grundprinzip der Wissenschaft und sollte deswegen sowieso dein inneres Forschenden-Ich motivieren. Mit einer Veröffentlichung entsteht die Möglichkeit, dass dein Wissen weiter genutzt wird – dass deine Arbeit anerkannt wird und nicht nur in der Schublade verstaubt!

Ein weiterer großer Vorteil von Daten- oder Codeveröffentlichungen ist, dass du später selbst deine Sachen nochmal wieder findest. Und zwar ganz egal, ob du mittlerweile an einem anderen Institut oder am anderen Ende der Welt arbeitest. Und da du für die  Veröffentlichung eine Dokumentation der Daten oder des Codes erstellen musstest, stehen die Chancen sogar sehr gut, dass du deine Sachen auch Jahre später selber noch verstehst. Dies wird durch die zusätzliche Sicherung der Daten durch Veröffentlichung in Repositorien o.ä. ergänzt. Selbst wenn du die Festplatte verlierst oder dein Laptop einen Wasserschaden hat, sind die Daten dort gespeichert. Ist die Dokumentation und Veröffentlichung von Daten oder Code erstmal abgeschlossen, kannst du diesen Punkt ein für alle mal von deiner inneren To-Do-Liste streichen. Du musst somit nicht jede Woche nochmal daran denken, dass du ja nochmal irgendwann den Datenmüll durchschauen und aussortieren solltest. Das hast du schon vor langer Zeit erledigt und alles ist sortiert und hochgeladen – so hilft dir die Veröffentlichung und Dokumentation sogar auch beim Stressabbau und innerer Ordnung!

Teil 2 des Beitrages erscheint am 17.10.2024

Autoren: Sophie Boße & Jannes Uhlott


Beitrag veröffentlicht

in

,