In Use Case 5 konnten vier Datensätze zu einer Benchmark-Datensatzsammlung für die umfassende Phänotypisierung im Feld zusammengefasst werden, die mehrere Vegetationsperioden und verschiedene räumliche und zeitliche Auflösungen abdeckt und eine breite Reihe von Pflanzenmerkmalen der wichtigsten mitteleuropäischen Nutzpflanzen erfasst. Die Daten wurden sorgfältig ausgewählt, kuratiert und mit detaillierten Metadaten angereichert.
1. Einleitung
Der Klimawandel, der sich in veränderten Temperatur- und Niederschlagsmustern und häufigeren extremen Wetterereignissen äußert, stellt die weltweite Pflanzenproduktion und Ernährungssicherheit vor erhebliche Herausforderungen (Davis, 2021). Um zu verstehen, wie Pflanzen auf diese sich verändernden Bedingungen reagieren, sind robuste Daten und Erkenntnisse über strukturelle und funktionelle Merkmale von Nutzpflanzen erforderlich. Die Phänotypisierung im Feld, bei der Pflanzeneigenschaften unter realistischen Bedingungen untersucht werden, spielt eine entscheidende Rolle bei der Bewältigung dieser Herausforderungen, indem fortschrittliche Technologien wie Spektralsensoren, Fernerkundung und maschinelles Lernen eingesetzt werden. Diese Fortschritte ermöglichen zerstörungsfreie, skalierbare Messungen auf räumlicher und zeitlicher Ebene, die Einblicke in das Pflanzenwachstum, die photosynthetischen Prozesse und das Ertragspotenzial liefern.
Die zunehmende Komplexität und der Umfang von Feldphänotypisierungsdaten erfordern jedoch Lösungen, die sich den Herausforderungen der Datenstandardisierung, -integration und des Metadatenmanagements stellen. Um diesem Bedarf gerecht zu werden, präsentieren wir eine Benchmark-Datensatzsammlung als Teil der FAIRagro-Konsortiumsinitiative. Dieser Benchmark folgt den FAIR-Grundsätzen – auffindbar, zugänglich, interoperabel und wiederverwendbar (Wilkinson et al., 2016) – und beinhaltet verschiedene Datensätze, die mit detaillierten Metadaten angereichert sind. Diese Datensätze, die mehrere zeitliche und räumliche Auflösungen, Sensortechnologien und Forschungsziele umfassen, bieten eine umfassende Darstellung des Bereichs der Feldphänotypisierung.
Diese Benchmark zielt darauf ab, die Herausforderung der Datenheterogenität anzugehen und Innovationen in der Feldphänotypisierungsforschung zu unterstützen, indem eine wertvolle Ressource für das Verständnis der Reaktionen von Pflanzen unter dynamischen Umweltbedingungen bereitgestellt wird. In den folgenden Abschnitten werden die Datensätze und ihre Beiträge zum Fortschritt der Agrarforschung vorgestellt.
2. Beschreibung der Datensätze
2.1 HyPlant
Autor: Buffat, Jim (IBG-2: Plant Sciences, Forschungszentrum Jülich)
Der Datensatz umfasst die solarinduzierte Fluoreszenz (SIF) und damit verbundene Strahlungsmessungen, die zwischen 2018 und 2023 gesammelt wurden. Er beinhaltet Daten des luftgestützten HyPlant-Sensorsystems und der FLOX „top of canopy“ Reflexion und konzentriert sich auf die Ableitung der SIF und ihre Beziehung zur photosynthetischen Aktivität der Pflanzen. Zusätzlich zu den Rohmessungen enthält der Datensatz abgeleitete Produkte, die mit spektralen Anpassungsmethoden (SFM) und einem auf einem neuronalen Netz basierenden SFM-Modell (SFMNN) erzeugt wurden, was fortgeschrittene rechnerische Ansätze zur SIF-Ermittlung erleichtert.
Der Datensatz hat eine Gesamtgröße von 1,6 TB und umfasst 3.748 Dateien in 16 verschiedenen Dateiformaten.
Datenspeicher: HyPlant Data
Metadaten: HyPlant Metadata , einschließlich einer erweiterten MIAPPE-basierten .xlsx-Metadaten-Datei.
ARC Struktur Version: ARC Structure
Der Datensatz wird unter der CC-BY 4.0 – „Attribution“-Lizenz veröffentlicht.
2.2 PhenoRob
Autor: Kraemer, Julie (IBG-2: Plant Sciences, Forschungszentrum Jülich)
Der Datensatz mit dem Titel „Multi-scale field phenotyping of wheat-bean intercrops: Integrating spectral and agronomic datasets from a three-year trial“ wurde während eines Zwischenfruchtanbauversuchs mit Sommerweizen und Ackerbohne gesammelt, der von 2021 bis 2023 auf dem Campus-Klein Altendorf (CKA) durchgeführt wurde. Die Versuche wurden mit ökologischen Anbaumethoden in einem vollständig randomisierten Design durchgeführt, wobei Zwischenfruchtsysteme aus drei Sommerweizensorten mit zwei Ackerbohnensorten und ihren jeweiligen Einzelkulturkontrollen verglichen wurden.
Der Datensatz umfasst eine heterogene Sammlung von Fernerkundungs- und agronomischen Daten, die 6,3 GB in verschiedenen Dateiformaten umfassen. Zu den Fernerkundungsparametern gehören hochauflösende Bilder, Blatt- und Kronenreflexion sowie aktive und solarinduzierte Fluoreszenzmessungen, die Aufschluss über die Vegetationsleistung und die photosynthetische Aktivität der Pflanzen geben. Herkömmliche agronomische Messungen wie Biomasse, Blattfläche, Chlorophyllgehalt und Kornertrag ergänzen die Fernerkundungsdaten, um einen umfassenden Überblick über das Pflanzenwachstum und die Produktivität in Zwischenfruchtsystemen zu geben.
Datenspeicher: PhenoRob Data
Metadaten: PhenoRob Metadata
Der Datensatz wird unter der CC-BY 4.0 – „Attribution“ Lizenz veröffentlicht.
2.3 UAV Campus Klein-Altendorf
Autor: Warstat, Kevin (IBG-2: Plant Sciences, Forschungszentrum Jülich)
Der Datensatz besteht aus RGB- und multispektralen UAV-Messungen des zentralen PhenoRob-Experiments, das 2023 am Campus Klein-Altendorf durchgeführt wurde. Er enthält Rohbilddaten, Produkte, die mit der Structure-from-Motion-Methode abgeleitet wurden, und zusätzliche Informationen etwa in README-Dateien, Bodenkontrollpunktkoordinaten und Verarbeitungsberichten. Die Daten sind in 13 einzelne Flugtage während der Vegetationsperiode unterteilt, wobei jeder Tag alle notwendigen Daten enthält, um die resultierenden Modelle zu reproduzieren. Zu den wichtigsten Produkten gehören ein aus RGB-Daten abgeleitetes digitales Höhenmodell (DEM) und zwei Orthomosaike, eines mit Reflexions- und das andere mit Radianz Informationen.
Der Datensatz hat eine Gesamtgröße von etwa 309 GB.
Datenspeicher: UAV Data
Metadaten: UAV Metadata
Der Datensatz wird unter der CC-BY 4.0 – „Attribution“ Lizenz veröffentlicht.
2.4: BreedFACE
Autor: Knopf, Oliver (IBG-2: Plant Sciences, Forschungszentrum Jülich)
Der Datensatz enthält Ergebnisse eines im Rahmen des BigBaking-Projekts durchgeführten Experiments, bei dem 10 Weizenarten unter einer künstlich erhöhten CO2-Konzentration analysiert wurden. Die Messungen wurden mit fortschrittlichen Sensorsystemen durchgeführt, darunter das auf einer autonomen Plattform (FieldSnake) montierte Light-Induced Fluorescence Transient (LIFT)-Gerät, sowie RGB- und multispektrale UAV-Daten. Zusätzliche Daten von Umweltsensoren sind ebenfalls enthalten.
Der Datensatz hat eine Gesamtgröße von ca. 4,2 MB und umfasst 19 `.csv` und 8 `.xlsx` Dateien.
Datenspeicher und Metadaten: BreedFACE Data and Metadata
Der Datensatz wird unter der CC0 – „Public Domain Dedication“-Lizenz veröffentlicht, die den offenen Zugang und die Wiederverwendung mit ordnungsgemäßer Quellenangabe ermöglicht.
2.5: Benchmark Metadata
Alle Datasets sind verlinkt auf DOI.