So machst Du Deine Forschung fit für andere
Ein Beitrag von Jannes Uhlott und Sophie Boße – Teil 2
Im ersten Teil des Beitrages haben Sophie und Jannes erklärt, was es mit der Qualität von Daten auf sich hat und warum es sich lohnt, seine Daten möglichst gut zu dokumentieren und mit Qualitätsinformationen zu versehen – und was das mit gutem Karma zu tun hat. Heute erklären sie, wie das am besten funktioniert:
Datenqualität leicht gemacht: Aufräumen, Dokumentieren und Tools nutzen
Generell wirkt das Thema Datenqualität von außen sehr komplex, aber schon mit wenigen Schritten kannst du deine Daten an sich schon mal selbst gut aufbereiten. Um dich dann dem Thema Datenqualität zu nähern, ist der nächste Schritt eine ausführliche Dokumentation deiner Daten. Sie ermöglicht anderen, die Qualität deiner Daten für ihren spezifischen Zweck einzuschätzen. Für die Bewertung der Datenqualität selbst kannst du Unterstützung durch verschiedene Tools bekommen.
Im ersten Schritt hilft es, deine Daten sortiert abzulegen. Steigst du eigentlich selbst durch deine Ordnerstruktur durch? Eine geeignete Dateibenennung mit Datum, Projektname, Ersteller und Inhalt kann schon sehr viel helfen.
Mehr Infos und Tipps zur Datenorganisation findest du hier.
Als Unterstützung kannst du Versionskontrollsysteme nutzen, die zudem deine Daten sichern. Natürlich ist es mit viel Aufwand verbunden, schon bestehende Ordnersysteme aufzuräumen, aber lass dir davon nicht die Motivation nehmen. Mach hier einen Schritt bzw. Ordner nach dem anderen oder nimm dir einfach für dein neues Projekt vor, es nun von vornherein etwas strukturierter anzugehen. Bei Fragen dazu findest du Unterstützung beim Forschungsdatenmanagement deiner Institution.
Wenn es darum geht, deine Daten nach außen zu teilen oder in einem Repositorium zu veröffentlichen, ist es ein erster Schritt, die Daten mit Metadaten zu versehen. Versuche diese möglichst ausführlich auszufüllen. Dieses kostet zwar ein paar Minuten Zeit, aber ist essentiell, damit andere später deine Daten finden und nachnutzen können – denn wenn deine Daten nicht gefunden und genutzt werden, profitierst du auch nicht von den Zitationen.
Eine Einführung dazu, was Metadaten sind und wie sie helfen, deine Daten zu dokumentieren, kannst du hier lesen oder dir in einem Video anschauen. Im Data Management Support Pack der CGIAR findest du übrigens noch viel mehr hilfreiche Infos und Templates für den Umgang mit deinen Forschungsdaten. Noch mehr Infos zur Datendokumentation mit Metadaten findest du hier.
Wenn du darüber hinaus noch Zeit hast, kannst du dir Gedanken um zusätzliche Informationen wie die eigentliche Qualität deiner Daten machen. Zurzeit werden leider kaum Informationen über die Datenqualität durch Repositorien abgefragt. Hier können dir Tools wie das Bonares DQKit helfen. Zusammenfassende Statistiken wie Anzahl der fehlenden Zellen oder Anzahl der Duplikate sowie Korrelationen zwischen den Variablen geben bereits viel Aufschluss über deine Daten.
Wenn du mehr darüber wissen willst, was qualitative Daten sind, wie du die Datenqualität ermitteln und erhöhen kannst, schau dir das Kapitel “Quality and provenance” im Open Data Onlinekurs von GODAN an.
Besonders hilfreich ist es außerdem, wenn du die Methodik deiner Arbeit kurz erläuterst. Dazu musst du keinen Roman schreiben. Für andere ist es schon hilfreich, eine kurze (z.B. stichpunktartige) Auflistung zu bekommen, welche Materialien (z.B. Sensoren) du verwendet hast und ob es äußere Einflüsse (wie Regen oder direkte Sonneneinstrahlung) gab, die eventuell Einfluss auf deine Daten haben könnten.
Wissensweitergabe leicht gemacht: Wie du deinen Nachwuchs fit machst
Du denkst: “Das mache ich doch schon alles”? – Super! Dann kannst du mit einem guten Beispiel vorangehen. Gib dein Wissen doch am besten direkt an die Young Scientists deiner Arbeitsgruppe weiter. Hilf ihnen, sich eine gute Ordnerstruktur aufzubauen und direkt zu lernen, wie Qualitätskontrollen und Dokumentationen in den Forschungsalltag integriert werden können. Setz zum Beispiel ein Wiki für deine Arbeitsgruppe auf, in dem du dein Wissen teilen kannst und was jederzeit durch andere ergänzt werden kann. So geht dein Wissen auch nicht verloren, wenn du irgendwann mal die Arbeitsgruppe verlässt.
Du willst dein Wissen weitergeben und suchst nach Lehrmaterialien zum Thema Forschungsdatenmanagement in den Agrosystemwissenschaften, die du einfach nutzen kannst? Eine Sammlung Open Educational Resources findest du hier.
Die einzelnen Schritte hin zu einer guten Datendokumentation sind klein und benötigen nicht viel Zeit. Am besten fängst du direkt jetzt an, den einen Ordner aufzuräumen, den du eigentlich schon so lange mal anschauen müsstest.
Autoren: Sophie Boße & Jannes Uhlott