STREAM: Semantische Repräsentation, Vernetzung und Kuratierung von qualitätsgesicherten Materialdaten.

Förderkennzeichen: 16QK11C

Die Materialwissenschaften stehen vor der großen Herausforderung, umfangreich vorliegende und neu hinzukommende Forschungsdaten qualitativ zu vernetzen und zugleich die Reproduzierbarkeit der Daten sicherzustellen. Darüber hinaus stellen die Bewertung, Bestandspflege und Speicherung, vor allem aber die Nutzbarmachung dezentral gespeicherter Daten im Zusammenhang mit der fortschreitenden Digitalisierung und dem daraus resultierenden Umgang mit neuem Wissen bisher nicht gekannte Anforderungen für die Materialwissenschaftler dar.

Mit dem BMBF-geförderten Projekt STREAM („Semantische Repräsentation, Vernetzung und Kuratierung von qualitätsgesicherten Materialdaten“) widmen sich die Projektpartner dem Problem der Qualitätsbewertung und Kuratierung wissenschaftlicher Daten. Hierzu werden neue Methoden und Denkansätze entwickelt, um im Anschluss an das Projekt der Wissenschaftler-Gemeinschaft Lösungen zum Bewältigen der neuen Herausforderungen zur Verfügung stellen zu können. Hierbei gilt es in Bezug auf Materialdaten zuerst, zeitnah Kurationskriterien zu formulieren, auf deren Basis die Sicherstellung der Vollständigkeit von Datensätzen, der Kohärenz und Konsistenz von Material- und Kontextdaten sowie auf die portalübergreifende Auffind- und Nutzbarkeit von Daten realisierbar wird.

STREAM steht zu allererst jedoch vor der großen Herausforderung, ein gemeinsames Verständnis zur Struktur von Material- und Kontextdaten zu etablieren, soll heißen, eine agile Ontologiemodellierung einzuführen, welche zu einem abgestimmten Repräsentationsschema für Materialdaten aus Computersimulation und Experiment und entsprechenden Kontextinformationen führt. Sobald dieses gemeinsame Verständnis der Materialrepräsentation vorhanden ist, können im nächsten Schritt Material- und Kontextdaten durch eine gemeinsame Ontologie abgebildet werden. Diese sind somit auf ihrer Basis vollständig digitalisiert und über ihrer Eigenschaften beschrieben. Die Ontologie ermöglicht dabei, die Struktur von Materialdaten sowohl aus Computersimulationen als auch aus Experimenten sinnvoll mit den jeweiligen Kontextinformationen zu erfassen. Die erfassten und digitalisierten Daten können in einem darauffolgenden Prozess kontinuierlich einer Bewertung unterzogen werden. Hierzu werden standardisierte Methoden zum Testen und für die Datenanalytik mittels maschinellen Lernens eingeführt. Die digitalisierten Daten, das heißt, sowohl die Materialdaten als auch die Kontextinformationen, werden anderen Materialwissenschaftlerinnen und –wissenschaftlern über neu zu entwickelnde Plattformen zugänglich gemacht. Durch diesen Schritt kann die Reproduzierbarkeit bzw. die Validität von Experimenten gefördert, neue Ergebnisse direkt verglichen und Daten für neue Experimente wiederverwendet werden.

Project Team

Publications

by (Editors: ) [BibTex of ]

News

SANSA 0.7.1 (Semantic Analytics Stack) Released ( 2020-01-17T09:52:41+01:00 by Prof. Dr. Jens Lehmann)

2020-01-17T09:52:41+01:00 by Prof. Dr. Jens Lehmann

We are happy to announce SANSA 0.7.1 – the seventh release of the Scalable Semantic Analytics Stack. SANSA employs distributed computing via Apache Spark and Flink in order to allow scalable machine learning, inference and querying capabilities for large knowledge graphs. Read more about "SANSA 0.7.1 (Semantic Analytics Stack) Released"

More Complete Resultset Retrieval from Large Heterogeneous RDF Sources ( 2019-12-05T15:46:09+01:00 Andre Valdestilhas)

2019-12-05T15:46:09+01:00 Andre Valdestilhas

Over recent years, the Web of Data has grown significantly. Various interfaces such as LOD Stats, LOD Laundromat and SPARQL endpoints provide access to hundreds of thousands of RDF datasets, representing billions of facts. Read more about "More Complete Resultset Retrieval from Large Heterogeneous RDF Sources"

DL-Learner 1.4 (Supervised Structured Machine Learning Framework) Released ( 2019-09-24T22:41:46+02:00 by Simon Bin)

2019-09-24T22:41:46+02:00 by Simon Bin

Dear all, The Smart Data Analytics group [1] and the E.T.-db-MOLE sub-group located at the InfAI Leipzig [2] is happy to announce DL-Learner 1.4. DL-Learner is a framework containing algorithms for supervised machine learning in RDF and OWL. Read more about "DL-Learner 1.4 (Supervised Structured Machine Learning Framework) Released"

DBpedia Day @ SEMANTiCS 2019 ( 2019-08-01T10:35:05+02:00 Sandra Bartsch)

2019-08-01T10:35:05+02:00 Sandra Bartsch

 We are happy to announce that SEMANTiCS 2019 will host the 14th DBpedia Community Meeting at the last day of the conference on September 12, 2019. Read more about "DBpedia Day @ SEMANTiCS 2019"

LDK conference @ University of Leipzig ( 2019-03-22T09:21:41+01:00 by Julia Holze)

2019-03-22T09:21:41+01:00 by Julia Holze

With the advent of digital technologies, an ever-increasing amount of language data is now available across various application areas and industry sectors, thus making language data more and more valuable. Read more about "LDK conference @ University of Leipzig"