Use Case (Pilot) 9

Erhöhung der FAIRness von FAIRagro-Daten durch KI unterstützte Metadatenanreicherung

Dieser Use Case Pilot befasst sich mit den Möglichkeiten KI-basierter Methoden zur Unterstützung der Anreicherung von Metadaten, um eine Verbesserung der FAIRness von Daten im Rahmen der Agrosystemforschung zu erreichen.

Partner:

Informationszentrum Lebenswissenschaften (ZB MED)

Beschreibung

Hochwertige Metadaten sind für die FAIR-Grundsätze unerlässlich. Da die Verwaltung von Forschungsdaten (RDM) immer wichtiger wird, erkennen die Beteiligten den Bedarf an aussagekräftigen Metadaten und automatisierten Erstellungsprozessen. Diese Fortschritte stellen sicher, dass Metadaten in Zukunft FAIR sind, aber sie betreffen nicht die bestehenden Metadaten, für die es keine standardisierten Erfassungsmethoden gibt.


FAIRagro entwickelt ein Metadatenschema zur Harmonisierung heterogener Metadaten der teilnehmenden Forschungsdateninfrastrukturen (FEI), um eine zentrale Suche zu erleichtern und die Auffindbarkeit von Agrarsystemressourcen zu verbessern. Um eine effiziente Umwandlung der bestehenden Metadaten der FEI zu ermöglichen und die Integration in den zentralen FAIRagro-Suchdienst so effizient wie möglich zu gestalten, wird in diesem Pilotprojekt getestet, inwieweit moderne KI-basierte Textmining-Techniken, z. B. Deep-Learning-Modelle und „few-shot learning“, in der Lage sind, automatisch relevante Informationen aus unstrukturierten Daten (z. B. Datensatz-Zusammenfassungen, verwandte Publikationen, die Daten selbst usw.) zu extrahieren, indem sie die Erkennung benannter Entitäten (NER) verwenden.

Diese Aufgaben beinhalten die Identifizierung sowohl allgemeiner als auch agrosystemspezifischer Entitäten und Beziehungen. Ziel dieses Pilotprojekts ist es, Informationen zu zwei verschiedenen Kernentitäten (Pflanzen, Boden) aus zwei verschiedenen FAIRagro-FDIs (OpenAgrar, BonaRes Repository) zu extrahieren und in strukturierter Form zur Verfügung zu stellen. Darüber hinaus wird untersucht, ob Text Mining eine praktikable Methode zur Anreicherung von Metadaten in dem für den zentralen Suchdienst entwickelten Schema darstellt.


Das Ergebnis wird zeigen, inwieweit KI-Methoden bereit sind, die Ressourcen des Agrarsystems FAIRer zu machen und die teilnehmenden FEI dabei zu unterstützen, ihre bereitgestellten Metadaten ressourceneffizient zu erweitern. Wenn das Pilotprojekt erfolgreich ist, können weitere Entwicklungen vorgenommen werden, um alle FAIRagro-Infrastrukturen oder sogar andere Bereiche bei der Metadatenerweiterung zu unterstützen, wodurch sich Möglichkeiten für eine zukünftige Zusammenarbeit zwischen verschiedenen NFDI-Konsortien eröffnen.

Weitere Use Cases

Use Case 1: Nutzung der Wechselwirkungen zwischen Genotyp, Standort, Jahr und Bewirtschaftung für eine nachhaltige Pflanzenproduktion

Use Case 2: Bewertung von Trade-offs für ein optimales Stickstoffmanagement bei Pflanzen

Use Case 3: Optimierung von Schädlings- und Krankheitsdaten zur Förderung des integrierten Pflanzenschutzes

Use Case 4: Lernen aus unvollständigen Daten

Use Case 5: Nichtinvasive Phänotypisierung mit autonomen Robotern

Use Case 6: Automatisierte Datenflüsse für Pflanzenmodelle

Use Case 7: Tools der nächsten Generation für Extremereignisse und Bewertung der Pflanzenresilienz (NEXT-Gen-EXPERT)

Use Case (Pilot) 8: Systematische Ansätze zur effizienten Datensynchronisation in den Gartenbauwissenschaften (HortSEEDS)