UC 6 Update and Progress Report

Revolutionierung von Pflanzenmodellanwendungen durch FAIRes Forschungsdatenmanagement

Erfahren Sie hier, wie FAIRes Forschungsdatenmanagement die Anwendungen von Erntemodellen revolutioniert: Welche Schritte hat das Team von Use Case 6 unternommen, welchen Herausforderungen muss es sich stellen und welches Potenzial für weitere Fortschritte ist vorhanden? Dieser Bericht beginnt mit einem Überblick über die Grenzen und Anwendungen von Erntemodellen. Er beleuchtet weiterhin die Zusammenarbeit zwischen FAIRagro und Wissenschaftlern auf diesem Gebiet.

Schließlich werden die nächsten Schritte auf dem Weg zu innovativen Anwendungen von Pflanzenmodellen skizziert. Lesen Sie bis zum Ende und finden Sie heraus, wie FAIRes Forschungsdatenmanagement Ihren Forscheralltag revolutionieren kann. Teilen Sie uns gerne Ihre eigenen Herausforderungen beim Fotschungsdatenmanagement mit und bereichern Sie FAIRagro mit Ihrem eigenen Use Case.

Teilen Sie uns Ihre eigenen Herausforderungen im Datenmanagement mit und beteiligen Sie sich an FAIRagro mit Ihrem eigenen Use Case!

UC 6 Partner

  • Technical University Munich
  • Bayerische Landesanstalt für Landwirtschaft
  • Weihenstephan-Triesdorf University of Applied Sciences
  • Directorate General of the Bavarian State Archives
  • Leibniz Institute for Agricultural Engineering and Bioeconomy

Motivation

Kulturpflanzenmodelle für künftige Anwendungen fit machen

Kulturpflanzenmodelle dienen als Werkzeugkasten für Agrarforscher, die mit Hilfe von Gleichungen simulieren oder vorhersagen, wie Kulturpflanzen auf verschiedene Faktoren reagieren, die von Umweltbedingungen über Bewirtschaftungspraktiken bis hin zur Pflanzen- oder Sortenauswahl reichen. Traditionell werden diese Modelle eingesetzt, um die Leistung von Nutzpflanzen unter verschiedenen Umweltbedingungen vorherzusagen.

Die Wirksamkeit dieser Modelle – ob zur Kalibrierung, Validierung oder Anwendung – hängt von qualitativ hochwertigen Eingangsdaten ab. Dazu gehören Wetterparameter wie Temperatur, Niederschlag und Sonneneinstrahlung, Bodeneigenschaften wie Beschaffenheit und Wassergehalt, landwirtschaftliche Betriebsmittel wie Pflanztermine und Düngung, Beobachtungen des Pflanzenwachstums und Messungen wie Blühtermin und Ertrag und sogar pflanzengenetische Merkmale wie die Empfindlichkeit gegenüber Vernalisation oder Photoperiode. Die erforderlichen Daten sind sehr vielfältig, und ihre Sammlung – einschließlich der Datensuche, Formatierung und Qualitätskontrolle – erfordert einen erheblichen Zeit- und Ressourcenaufwand. Obwohl diese Modelle theoretisch die Entscheidungsfindung im Pflanzenbau unterstützen könnten, z. B. durch die Modellierung von Veränderungen im Pflanzenwachstum als Reaktion auf das bevorstehende Wetter, ist eine praktische Anwendung aufgrund der mühsamen Datenverarbeitung nur selten möglich.

Das „Ernten“ (Harvesting) von Daten aus verschiedenen Ressourcen, einschließlich domänenspezifischer Repositorien und allgemeiner Datenbanken wie dem Open Data Server des Deutschen Wetterdienstes (DWD), ist eine Voraussetzung für die Einrichtung automatisierter Datenerfassungs- und -verarbeitungsabläufe. Trotz der scheinbar einfachen und unterhaltsamen Konnotation des Wortes „Ernten“ von Daten ist die Realität jedoch eine ganz andere. Es gibt mehrere Hürden für eine bequeme Datenerfassung, unter anderen:

  • Verstreute und unterschiedliche Datenquellen, begrenzte Auffindbarkeit und Zugänglichkeit der Daten
  • Mangel an standardisierten Vokabularen für die Datenbeschreibung
  • Unzureichende oder fehlende Datendokumentation und Metadatenstandards
  • Begrenzte Kenntnisse über die Verwaltung von Forschungsdaten unter den Pflanzenmodellierern

Das Team von Use Case 6 will einen Schritt weiter gehen, indem es die Kombination vorhandener Daten mit Echtzeitdaten von Sensoren im Feld ermöglicht und wissenschaftliche Arbeitsabläufe implementiert, die verschiedene Datenquellen integrieren und fortgeschrittene Modellanwendungen ermöglichen.

Use Case 6 ermöglicht es, die praktischen Möglichkeiten, die FAIRe Forschungsdaten Wissenschaftlern und Nutzern eröffnen können, zu erfassen und zu erleben. Wir sind mehr als begeistert davon ☺.

Figure 1: Sensors from the field “feed in” data to the crop models for real time simulations and advanced model applications.

Bisherige Erfolge 

Aktionsplan für das Data Harvesting

Festlegung von Mindestanforderungen an (Meta-)Daten

Der erste Schritt zur Maximierung des Potenzials von Kulturpflanzenmodellen ist die Festlegung der wesentlichen (Meta-)Datenanforderungen für die Modellierung von Kulturpflanzen und fortgeschrittene Anwendungen. Wichtige Metadatenattribute – wie Sorte, Reifedatum und Ertrag – wurden identifiziert, um das Auffinden von Datensätzen zu Ernteversuchen zu erleichtern, die die notwendigen Daten für Modellierungsanwendungen enthalten. Das Ziel ist es, Dateninfrastrukturen mit relevanten Dateneigenschaften bereitzustellen, um die Qualität der Suchergebnisse für Pflanzenmodellierer zu verbessern.

Harmonisierung von Metadaten-Standards

Das UC6-Team hat etablierte FAIRe (Meta-)Datenstandards und Vokabulare identifiziert, um die Zuordnung von Daten aus Pflanzenversuchen zu harmonisieren. Für die Veröffentlichung und Archivierung von Pflanzenversuchsdaten wurden strukturierte Vokabulare wie AGROVOC und das BonaRes LTE-Datenmodell, das sowohl die englische als auch die deutsche Sprache abdeckt, als effektive, für den Menschen lesbare und gut etablierte Standards in der Landwirtschaft identifiziert. Durch die Förderung der Verwendung dieser strukturierten Datenvokabulare will UC6 die veröffentlichten Daten von Pflanzenexperimenten standardisieren, ihre Integration in Datenverarbeitungspipelines erleichtern und ihr Potenzial zur Wiederverwendung erhöhen. Das UC6-Team arbeitet auch mit FAIRagro und dem DataPlant-Konsortium zusammen und stellt Beispieldatensätze zur Verfügung, um digitale FAIRe Objekte zu entwerfen, die den gesamten Lebenszyklus der Daten dokumentieren.

Entwicklung von Standard-Workflows für die Datenintegration

Kulturpflanzenmodelle erfordern umfangreiche Daten. Um die Wiederverwendung von Daten Dritter zu erleichtern, konzentriert sich Use Case 6 auf die Entwicklung von Standard-Workflows zur Extraktion, Umwandlung und Integration von Daten aus Repositorien, die auf Pflanzenexperimente (z. B. BonaRes-Repositorium), Wetter (z. B. historische und Vorhersagedaten vom DWD Open Data Server) und Bodenprofile (z. B. National Agricultural Soil Inventory) spezialisiert sind, in Eingabeformate für Modellierungsrahmen.

Für Modellierungsanwendungen dient der ICASA-Standard, der in der Gemeinschaft der Pflanzenmodellierer weithin akzeptiert ist, als idealer Zwischenschritt für die Datentransformation. Er lässt sich leicht in Eingabeformate für mehrere Pflanzenmodellierungssysteme wie DSSAT oder APSIM übersetzen. Dieser Übersetzungsprozess, auch Data Mapping genannt, beinhaltet die Konvertierung von Daten aus verschiedenen Quellen in ein spezifisches strukturiertes Format, einschließlich Namensanpassung, Einheitenumwandlung und Variablenableitung. Das UC6-Team arbeitet mit der AgMIP-Initiative (Agricultural Model Intercomparison and Improvement Project) zusammen, die Tools entwickelt hat, um das Mapping von Daten in das ICASA-Format und die anschließende Übersetzung in Eingabeformate für mehrere etablierte Pflanzenmodelle zu erleichtern. Ab 2024 wurde eine vollständige Datenintegrations- und Simulationspipeline auf der Grundlage von Prototyp-Datensätzen entwickelt. Die derzeitigen Arbeiten zielen darauf ab, diesen Ansatz auf alle Datensätze zu verallgemeinern, die nach dem BonaRes-LTE-Datenmodell annotiert sind.

Figure 2: From minimum dataset to model application – the UC 6 data harvesting action plan

Verbesserte Kontrolle der Datenqualität

Zusätzlich zur Datenintegration und -formatierung entwickelt das UC6-Team Tools zur Verbesserung der Datenqualitätskontrolle bei Anwendungen zur Modellierung von Nutzpflanzen. Zu diesen Werkzeugen gehört die Implementierung eines veröffentlichten Bewertungssystems zur Beurteilung der Eignung von Daten aus Pflanzenversuchen für die Kalibrierung und Validierung von Pflanzenmodellen. Interaktionen mit Pflanzenmodellierern helfen bei der Bestandsaufnahme der routinemäßigen Qualitätskontroll- und Fehlerkorrekturverfahren und der damit verbundenen Datenqualitätsprobleme. Diese Arbeit wird mit Datenqualitätsexperten im gesamten Konsortium geteilt, um die Entwicklung von Qualitätskontrollinstrumenten innerhalb der FAIRagro-Infrastruktur zu unterstützen. Darüber hinaus entwickelt das Team einen prototypischen Workflow für die Anpassung genetischer Parameter im Nwheat-Pflanzenmodell, der Schätzalgorithmen durch Expertenwissen ergänzt, um die Verwendung biologisch genauer genetischer Merkmale in Pflanzenmodellen zu gewährleisten.

Gewährleistung der internationalen Interoperabilität

UC6 stellt nicht nur praktische Anforderungen an die Datenqualität, die für die Entwicklung nützlicher FAIRagro-Dienste erforderlich sind, sondern stellt auch Verbindungen zu internationalen Initiativen her und fördert die Interoperabilität auf internationaler Ebene innerhalb der Forschungsgemeinschaft und darüber hinaus.

Streaming von Daten aus dem Feld in Simulationsmodelle

UC6 konzentriert sich auf die Entwicklung schneller Datenströme „vom Feld zur Simulation“, um das Potenzial von Erntemodellen als Systeme zur Unterstützung bei Entscheidungen für den Pflanzenbau aufzuzeigen. Im Jahr 2024 startete das UC6-Team einen Pilot-Feldversuch, bei dem Daten zu Pflanzenwachstum, Boden und Wetter über verschiedene Sensortechnologien wie Bodensonden, Wetterstationen und UAVs (Drohnen) gesammelt werden. Diese Eingangsdatenströme werden über eine spezielle Webanwendung mit den zuvor beschriebenen Arbeitsabläufen verbunden.

Ziel ist die automatische Integration von Felddaten mit experimentellen Metadaten (z. B. Management-Inputs) und Daten von Dritten (z. B. Wettervorhersagen), um mit dem DSSAT-Rahmenwerk für die Modellierung von Kulturpflanzen Wachstumssimulationen durchzuführen. Dieses Experiment dient als Grundlage für die Erstellung robuster Datenströme, die in einem groß angelegten Feldversuch im Jahr 2025 erweitert werden sollen. Ziel ist es, das Potenzial der prädiktiven Simulation des Pflanzenwachstums zur Unterstützung kurzfristiger Entscheidungen im Pflanzenbau zu testen.

Umfassende Annotation von Metadaten

Die Smart Rural Area Data Infrastructure (SRADI) ist eine Forschungsdatenmanagement-Infrastruktur zur Dokumentation von Metadaten im Zusammenhang mit landwirtschaftlichen Forschungsprojekten der Technischen Universität München und von Partnerforschungseinrichtungen, die auf anerkannten internationalen Standards wie OGC, ISO oder DCAT basieren.  SRADI besteht aus der bereits erwähnten Sensormanage- mentanwendung (Sensorhub) und einem Metadatenkatalog (Agrihub). Digitale Zwillinge aller am Projekt beteiligten Ressourcen (z. B. Feldparzellen, Sensoren, Webdienste, Arbeitsabläufe, Datensätze usw.) werden nach und nach in einem Datenkatalog (SRADI Agrihub) registriert, um eine umfassende und transparente Kommentierung der im Laufe des Projekts erzeugten Daten zu ermöglichen. Dies ist ein entscheidender Schritt, um sicherzustellen, dass alle während des Experiments erzeugten Daten umfassend dokumentiert und für die Veröffentlichung und langfristige Archivierung gemäß den FAIR-Grundsätzen geeignet sind.

Nächste Schritte und Anknüpfungspunkte für neue Use Cases

Kulturpflanzenmodelle auf dem Laufsteg

Die nächsten Schritte im Datenmanagement für Kulturpflanzenmodelle

Zu den nächsten Schritten gehört die Etablierung einer Langzeitarchivierung, um die Auffindbarkeit und Wiederverwendbarkeit der umfangreichen Daten, die von den Agronomen der Bayerischen Landesanstalt für Landwirtschaft (LfL) produziert werden, zu fördern. Diese Daten bergen ein großes Potenzial für die Wiederverwendung bei der Anwendung von Agrarmodellen, das derzeit jedoch durch das Fehlen systematischer Dokumentations- und Archivierungsprozesse vergeudet wird. Um die Daten der LfL für die Forschung verfügbar zu machen, veranstalten wir im Herbst 2024 einen Datenmanagement-Workshop unter der Leitung des Bayerischen Staatsarchivs in Zusammenarbeit mit den Aus- und Weiterbildungsexperten des FAIRagro-Konsortiums. Dieser Workshop zielt darauf ab, Konzepte zu erweitern, um landwirtschaftliche Daten aus landwirtschaftlichen Versuchen auffindbar, zugänglich und wiederverwendbar für Agrarwissenschaftler im Einklang mit Datenmanagementrichtlinien zu machen. Außerdem soll ein Konzept zur systematischen Archivierung von Feldversuchen erarbeitet werden. Die Umsetzung von Metadatenstandards ist von entscheidender Bedeutung und wird ein Schwerpunkt des geplanten Workshops sein.

FAIRagro Joint-Venture mit SRADI

Ein weiteres FAIRagro-Joint Venture ist die Anbindung der Smart Rural Areas Data Infrastructure (SRADI) des World Agricultural Systems Center/Hans Eisenmann-Forum für Agrarwissenschaften (HEF) an der TUM an das FAIRagro-Suchportal. Diese Zusammenarbeit wird FAIRagro bereichern und die Auffindbarkeit von Projekten der bayerischen Forschungseinrichtungen im Bereich der Agrarsystemforschung verbessern. Wir freuen uns darauf, innovative wissenschaftliche Arbeitsabläufe zu implementieren und sie einer breiten Community zugänglich zu machen. Dieser Ansatz wird modernste Modellanwendungen mit großem Potenzial für Forscher und Praktiker ermöglichen.

Bewerben Sie sich bis 5. Juli 2024, 18.00 Uhr, als neuer Use Case für FAIRagro

by Benjamin Leroy and Anne Sennhenn, May 2024