Use Case 4:
Lernen aus unvollständigen Daten
Dieser Use Case befasst sich mit der Frage, wie mit unvollständigen Daten aus Langzeitexperimenten umgegangen werden kann.
Inhaltsverzeichnis
Hintergrund
Daten aus landwirtschaftlichen Langzeit-Feldversuchen (LTE) sind in den Agrarsystemwissenschaften von großem Interesse, insbesondere für die Verwendung in der Modellvalidierung und -simulation. Obwohl sowohl national als auch international zahlreiche LTEs mit unterschiedlichen Faktoren durchgeführt werden (z.B. lte.bonares.de), sind deren Daten selten veröffentlicht worden und stehen somit nicht für die Anwendung in Pflanzenbau-Modellen zur Verfügung. LTE-Studien zielen häufig darauf ab, die jeweiligen Haupteinschränkungen der Ernteerträge in einem bestimmten Umfeld zu ermitteln, z. B. die Auswirkungen von Schädlingen und Krankheiten, Wasser- oder Nährstoffmangel oder nachteilige klimatische Bedingungen, und versuchen, die langfristigen Auswirkungen auf den Bodenkohlenstoff zu verstehen, um Maßnahmen zur Verbesserung der Kohlenstoffbindung im Boden zu unterstützen. In der Regel werden jedoch nur ein oder zwei Faktoren berücksichtigt, die nur begrenzte Informationen über das jeweilige Umfeld liefern, was ein großes Hindernis für die Verwendung von LTE-Daten für allgemeinere Metastudien oder die Anwendung von biophysikalischen oder maschinellen Ertragsmodellen darstellen kann. Darüber hinaus erfordert die Verwendung von LTE-Daten für die Kalibrierung und Validierung von Erntemodellen Kenntnisse über die Qualität und Plausibilität der Daten, die in veröffentlichten Datensätzen oft fehlen.
Ziele
Dieser Use Case zielt darauf ab, die Verfügbarkeit von LTE-Daten zu verbessern und diese zu ergänzen, die für Modellierer von Kulturpflanzen oder Metastudien von besonderem Interesse sind. Eine Aktivität in diesem Anwendungsfall wird die Unterstützung von LTE-Experimentatoren bei der Veröffentlichung ihrer Datensätze in bestehenden FAIRagro-Infrastrukturen sein. Um die LTE-Daten für allgemeine Studien nutzbar zu machen, werden zusätzliche Kontextinformationen gesammelt, die die LTE-Daten ergänzen. Es wird ein iterativer Ansatz entwickelt, der so weit wie möglich automatisiert und als Leitfaden für die Ergänzung bestehender LTE-Datensätze zur weiteren Verwendung veröffentlicht wird. Darüber hinaus wird ein Dienst zur Analyse und Bewertung der Datenqualität und -plausibilität entwickelt, die für die Wiederverwendung von LTE-Daten in Modellanwendungen erforderlich ist.
Maßnahmen:
- Unterstützung und Standardisierung der Veröffentlichung neuer LTE-Daten
- Datenkuratierung zur Ergänzung bereits veröffentlichter unvollständiger LTE-Daten
- Implementierung eines Dienstes zur Bewertung der Datenplausibilität
Status & Ausblick
UC Update: KI-gestützte Metadatenextraktion für Langzeitexperimente
Das Use Case-Team um Lachmuth et al. hat gezeigt, wie Large Language Models (LLMs) die Extraktion und Strukturierung von Metadaten in landwirtschaftlichen Langzeitexperimenten unterstützen können. Der Ansatz verbessert die Auffindbarkeit und Interoperabilität von Forschungsdaten und zeigt das Potenzial Künstlicher Intelligenz im Forschungsdatenmanagement.
Lachmuth, S., Hoffmann, C., Donmez, C., Ryo, M., & Lischeid, G. (2025). LLM-Based Metadata and Context Extraction for Agricultural Long-Term Experiments. FAIRagro Plenary 2025, Julius Kühn-Institut (JKI) Federal Research Centre for Cultivated Plants Königin-Luise-Straße 19 14195 Berlin. Zenodo.
https://doi.org/10.5281/zenodo.17302672
Noch Fragen zu diesem Use Case?
Kontaktieren Sie gern Anne Sennhenn für weitere Informationen.





