Erhöhung der FAIRness von FAIRagro-Daten durch KI unterstützte Metadatenanreicherung
Dieser Use Case Pilot befasst sich mit den Möglichkeiten KI-basierter Methoden zur Unterstützung der Anreicherung von Metadaten, um eine Verbesserung der FAIRness von Daten im Rahmen der Agrosystemforschung zu erreichen.
Partner:
Informationszentrum Lebenswissenschaften (ZB MED)
Beschreibung
Hochwertige Metadaten sind für die FAIR-Grundsätze unerlässlich. Da die Verwaltung von Forschungsdaten (RDM) immer wichtiger wird, erkennen die Beteiligten den Bedarf an aussagekräftigen Metadaten und automatisierten Erstellungsprozessen. Diese Fortschritte stellen sicher, dass Metadaten in Zukunft FAIR sind, aber sie betreffen nicht die bestehenden Metadaten, für die es keine standardisierten Erfassungsmethoden gibt.
FAIRagro entwickelt ein Metadatenschema zur Harmonisierung heterogener Metadaten der teilnehmenden Forschungsdateninfrastrukturen (FEI), um eine zentrale Suche zu erleichtern und die Auffindbarkeit von Agrarsystemressourcen zu verbessern. Um eine effiziente Umwandlung der bestehenden Metadaten der FEI zu ermöglichen und die Integration in den zentralen FAIRagro-Suchdienst so effizient wie möglich zu gestalten, wird in diesem Pilotprojekt getestet, inwieweit moderne KI-basierte Textmining-Techniken, z. B. Deep-Learning-Modelle und „few-shot learning“, in der Lage sind, automatisch relevante Informationen aus unstrukturierten Daten (z. B. Datensatz-Zusammenfassungen, verwandte Publikationen, die Daten selbst usw.) zu extrahieren, indem sie die Erkennung benannter Entitäten (NER) verwenden.
Diese Aufgaben beinhalten die Identifizierung sowohl allgemeiner als auch agrosystemspezifischer Entitäten und Beziehungen. Ziel dieses Pilotprojekts ist es, Informationen zu zwei verschiedenen Kernentitäten (Pflanzen, Boden) aus zwei verschiedenen FAIRagro-FDIs (OpenAgrar, BonaRes Repository) zu extrahieren und in strukturierter Form zur Verfügung zu stellen. Darüber hinaus wird untersucht, ob Text Mining eine praktikable Methode zur Anreicherung von Metadaten in dem für den zentralen Suchdienst entwickelten Schema darstellt.
Das Ergebnis wird zeigen, inwieweit KI-Methoden bereit sind, die Ressourcen des Agrarsystems FAIRer zu machen und die teilnehmenden FEI dabei zu unterstützen, ihre bereitgestellten Metadaten ressourceneffizient zu erweitern. Wenn das Pilotprojekt erfolgreich ist, können weitere Entwicklungen vorgenommen werden, um alle FAIRagro-Infrastrukturen oder sogar andere Bereiche bei der Metadatenerweiterung zu unterstützen, wodurch sich Möglichkeiten für eine zukünftige Zusammenarbeit zwischen verschiedenen NFDI-Konsortien eröffnen.
Weitere Use Cases
Use Case 1: Nutzung der Wechselwirkungen zwischen Genotyp, Standort, Jahr und Bewirtschaftung für eine nachhaltige Pflanzenproduktion
Use Case 2: Bewertung von Trade-offs für ein optimales Stickstoffmanagement bei Pflanzen
Use Case 3: Optimierung von Schädlings- und Krankheitsdaten zur Förderung des integrierten Pflanzenschutzes
Use Case 4: Lernen aus unvollständigen Daten
Use Case 5: Nichtinvasive Phänotypisierung mit autonomen Robotern
Use Case 6: Automatisierte Datenflüsse für Pflanzenmodelle
Use Case 7: Tools der nächsten Generation für Extremereignisse und Bewertung der Pflanzenresilienz (NEXT-Gen-EXPERT)
Use Case (Pilot) 8: Systematische Ansätze zur effizienten Datensynchronisation in den Gartenbauwissenschaften (HortSEEDS)