STREAM
Semantische Repräsentation, Vernetzung und Kuratierung von qualitätsgesicherten Materialdaten.
Förderkennzeichen: 16QK11
Die Materialwissenschaften stehen vor der großen Herausforderung, umfangreich vorliegende und neu hinzukommende Forschungsdaten qualitativ zu vernetzen und zugleich die Reproduzierbarkeit der Daten sicherzustellen. Darüber hinaus stellen die Bewertung, Bestandspflege und Speicherung, vor allem aber die Nutzbarmachung dezentral gespeicherter Daten im Zusammenhang mit der fortschreitenden Digitalisierung und dem daraus resultierenden Umgang mit neuem Wissen bisher nicht gekannte Anforderungen für die Materialwissenschaftler dar.
Mit dem BMBF-geförderten Projekt STREAM („Semantische Repräsentation, Vernetzung und Kuratierung von qualitätsgesicherten Materialdaten“) widmen sich die Projektpartner dem Problem der Qualitätsbewertung und Kuratierung wissenschaftlicher Daten. Hierzu werden neue Methoden und Denkansätze entwickelt, um im Anschluss an das Projekt der Wissenschaftler-Gemeinschaft Lösungen zum Bewältigen der neuen Herausforderungen zur Verfügung stellen zu können. Hierbei gilt es in Bezug auf Materialdaten zuerst, zeitnah Kurationskriterien zu formulieren, auf deren Basis die Sicherstellung der Vollständigkeit von Datensätzen, der Kohärenz und Konsistenz von Material- und Kontextdaten sowie auf die portalübergreifende Auffind- und Nutzbarkeit von Daten realisierbar wird.
STREAM steht zu allererst jedoch vor der großen Herausforderung, ein gemeinsames Verständnis zur Struktur von Material- und Kontextdaten zu etablieren, soll heißen, eine agile Ontologiemodellierung einzuführen, welche zu einem abgestimmten Repräsentationsschema für Materialdaten aus Computersimulation und Experiment und entsprechenden Kontextinformationen führt. Sobald dieses gemeinsame Verständnis der Materialrepräsentation vorhanden ist, können im nächsten Schritt Material- und Kontextdaten durch eine gemeinsame Ontologie abgebildet werden. Diese sind somit auf ihrer Basis vollständig digitalisiert und über ihrer Eigenschaften beschrieben. Die Ontologie ermöglicht dabei, die Struktur von Materialdaten sowohl aus Computersimulationen als auch aus Experimenten sinnvoll mit den jeweiligen Kontextinformationen zu erfassen. Die erfassten und digitalisierten Daten können in einem darauffolgenden Prozess kontinuierlich einer Bewertung unterzogen werden. Hierzu werden standardisierte Methoden zum Testen und für die Datenanalytik mittels maschinellen Lernens eingeführt. Die digitalisierten Daten, das heißt, sowohl die Materialdaten als auch die Kontextinformationen, werden anderen Materialwissenschaftlerinnen und –wissenschaftlern über neu zu entwickelnde Plattformen zugänglich gemacht. Durch diesen Schritt kann die Reproduzierbarkeit bzw. die Validität von Experimenten gefördert, neue Ergebnisse direkt verglichen und Daten für neue Experimente wiederverwendet werden.