DALIA: Knowledge-Base für „FAIR data usage and supply“ als Knowledge-Graph

Datenkompetenz von Anfang an

Mit diesem Paradigma betonen wir die Wichtigkeit von Bildung in Datenkompetenz (Datennutzung, Datenbereitstellung) und zeigen den Weg zur Nachhaltigkeit in der Nutzung und Bereitstellung von Forschungsdaten auf. DALIA leistet einen nennenswerten Beitrag zur Umsetzung des Paradigmas durch die Entwicklung einer Plattform für Lehr- und Lernmaterialien als Knowledge-Base „FAIR data usage and supply“. Diese wird modern, zu NFDI und dem FAIR-Konzept passend, als semantischer verknüpfter Knowledge-Graph umgesetzt.

Eine Knowledge-Base kann nur dann erfolgreich, d.h. akzeptiert sein, wenn erstens qualitätsbewertete Informations-, Lehr- und Lernmaterialien vorliegen und zweitens diese Materialien den persönlichen Bedürfnissen der Nutzer:innen entsprechend angeboten und empfohlen werden. Der Projektfokus liegt beim Nutzen und den Nutzer:innen. Daher wird die zu entwickelnde Knowledge-Base als zentraler Einstiegspunkt (Single-Point-of-Entry) konzipiert, die in einer heterogenen und ständig wachsenden Landschaft von Informations-, Lehr- und Lernmaterialien Vorschläge für Materialien entsprechend den individuellen Bedürfnissen macht. Nutzer:innen sind Personen aus dem akademischen und angrenzenden Umfeld, die unterschiedliche Rollen (Forschende:r, Lehrende:r, Lernende:r), verschiedene Karriere- und FDM – Erfahrungsstufen aufweisen und aus den verschiedenen Wissenschaftsdisziplinen stammen. Im Ergebnis wird die Knowledge-Base den Nutzer:innen bei Ihren Fragen zur Nutzung (Data-Science) und Bereitstellung von FAIRen Daten (FAIR Data Management) behilflich sein, auf geeignete Lehr- und Lernmaterialien verweisen sowie Lernpfade, Best-Practice-Dokumente vorschlagen. Diese soll die Kreditierung von Data-Stewardship Bildungsprogrammen enthalten. Ferner wird eine Vernetzung mit Expert:innen über die Knowledge-Base möglich sein.

Ausgangspunkt sind Forschungsarbeiten, Entwicklungen und Validierungen für ein Informationsmodell, für Infrastruktur und für einen Such- und Empfehlungsdienst. Im Sinne der Nachhaltigkeit werden bestehende Arbeiten zu Lernplattformen von Projektpartnern aufgegriffen und genutzt, sodass in diesem Projekt neue Forschungsaspekte bei der Entwicklung der Knowledge-Base in den Vordergrund rücken. Der nachhaltige Betrieb der Knowledge-Base ist sichergestellt. Das Konsortium der Projektpartner bringt die dafür notwendige Expertise ein und stellt mit ihrem umfassenden und disziplinenübergreifenden Netzwerk an Nutzer:innen und Anbieter:innen von Informations-, Lehr- und Lernmaterialien eine zukünftige Nutzung der Projektergebnisse sicher.

Die enge Verbindung zum NFDI e.V. und seinen Sektionen ermöglichen eine sehr starke Synergie zwischen der Auffindbarkeit, Empfehlung und Qualitätssicherung von Lehr- und Lernmaterialien sowie der zukünftigen Entwicklung dieser Materialien im Rahmen der NFDI-Konsortien. In diesem Sinne ist die Entwicklung von inhaltlichen sowie formalen Qualitätsstandards für die Lehr- und Lernmaterialien vorgesehen. Zusammenfassend leistet das Projekt mit den angestrebten Ergebnissen einen wichtigen Beitrag zur Steigerung der Datenkompetenz und der Etablierung einer Datenkultur im akademischen Umfeld und darüber hinaus.

Im Projekt werden Grundlagen erarbeitet und für die Entwicklung und Validierung einer bedürfnis- und nutzerorientierten Plattform – die Knowledge-Base – für Lehr- und Lernmaterialien „FAIR data usage und supply“ genutzt. Diese Knowledge-Base auf Basis von Semantic-Web-Technologie wird Nutzer:innen dienen, indem Fragen zur Datennutzung (Data Science) und Datenbereitstellung (Forschungsdatenmanagement) beantwortet werden. Dafür hat das Projekt Anwendungsfälle, sogenannte Use Cases, im Fokus, aus denen Bedürfnisse der zukünftigen Nutzer:innen entwickelt werden. Als Ergebnis wird die Knowledge-Base auf Informationen, Best-Practices und Lehr- und Lernmaterialien verweisen sowie personalisierte Lehr- und Lernpfade aufzeigen, einschließlich Kreditierung für Data Stewards. Die Verweise und Vorschläge der Knowledge-Base werden abhängig von (i) Karrierestufe (Grad der Selbstständigkeit), (ii) Rolle (Forschende, Lehrende, Lernende), (iii) Datenkompetenz und (iv) Wissenschaftsdisziplin sein und mithilfe von KI-Methoden auf der Basis von Qualitätsbewertungen der Inhalte erfolgen. Auf diese Weise soll die Vermittlung von Datenkompetenz bestmöglich unterstützt und ermöglicht werden. Die Bedürfnisse und Fragen der Nutzenden an die Knowledge-Base sollen über Anfragen in natürlicher Sprache verarbeitet werden (Natural-Language-Processing). Insgesamt erhalten die Nutzenden die für ihr individuelles Profil relevanten Materialien und Informationen, vgl. Abbildung .

Wichtiges Merkmal der Knowledge-Base ist ihre Auslegung als Single-Point-of-Entry, d.h. zentraler Einstiegspunkt. Damit können bestehende oder in Arbeit befindliche Plattformen und Materialien über Schnittstellen mit der Knowledge-Base verbunden werden, indem die Knowledge-Base darauf verweist bzw. weiterleitet. Damit leistet das Projekt einen Beitrag zur Vernetzung und Zugänglichkeit heterogener Quellen, fachspezifischer Lehr- und Lernmaterialien, in den jeweiligen Communities bekannten und akzeptierten Plattformen. Im Projekt werden zudem Schnittstellen für Inhalte entwickelt, die für Anbieter:innen von Lehr- und Lernmaterialien eine hohe Attraktivität zeigen. Ferner werden Werkzeuge für die Qualitätsbewertung der Materialien entwickelt. Über die enge Anbindung an die NFDI-Sektion „Training & Education“ (edutrain) werden bestehende und zukünftige Materialien im Bereich Datenkompetenz, d.h. Forschungsdatenmanagement (FDM) und Data Science (DS), integriert und verfügbar gemacht. Über die enge Verbindung zum NFDI e.V. darüber hinaus werden Kooperationen zu weiteren bestehenden deutschen und europäischen Plattformen angestrebt. Gleichzeitig werden insbesondere die relevanten und umfangreichen Vorarbeiten des Projektpartners TIB Hannover mit deren Lernplattform „eDoer“ aufgegriffen und für das Projekt nutzbar gemacht. Konzeptionelle Grundlagen der Lernplattform „eDoer“ wurden bereits im Projekt EDUWORKS, welches im Zeitraum 2013 – 2017 durch die EU gefördert wurde (Fördernummer FP7-PITN-GA-2013-608311) [1], gelegt. Somit liegt bereits zu Projektbeginn ein nutzbarer Entwicklungstand der Knowledge-Base vor, der zum einen ein frühzeitiges Erreichen von Teilzeilen ermöglicht und zum anderen den Fokus auf neue und bisher ungelöste Forschungs- und Entwicklungsfragen ermöglicht.

Abbildung 1: Aufbau der Knowledge-Base: Die Nutzer:innen formulieren ihre Bedürfnisse. Die Knowledge-Base liefert abhängig von der Karrierestufe, der Wissenschaftsdisziplin und der FDM/DS – Erfahrungsstufe eine Antwort.
Abbildung 1: Aufbau der Knowledge-Base: Die Nutzer:innen formulieren ihre Bedürfnisse. Die Knowledge-Base liefert abhängig von der Karrierestufe, der Wissenschaftsdisziplin und der FDM/DS – Erfahrungsstufe eine Antwort.

Um die genannte Funktionalität und Qualität zu erreichen, wird im Projekt ein Informationsmodell entwickelt, das die Grundlage für die semantische Verknüpfung der Inhalte und Entitäten darstellt. Dadurch kann die Knowledge-Base als ein Knowledge Graph auf Basis der Semantic-Web-Technologie (Linked Data) entwickelt werden. Die so ermöglichte semantische Verknüpfung der Lehr- und Lernmaterialien ist einer der zentralen Aspekte für die Realisierung FAIRer Materialien. Der aktuelle Stand der Technik zeigt, dass digitale Bildungsangebote, die den Lernenden offene und digitale Lernmaterialien anbieten, dem dringenden Bedarf an integrativer, gerechter und effektiver digitaler Bildung gerecht werden. Gleichzeitig müssen diese Bildungsangebote durch die technologische Entwicklung in Funktion und Qualität verbessert werden. Auf Grundlage des neuen Informationsmodells wird es möglich, die Forschung in diesem Projekt unter anderem auf einen Such- und Empfehlungsdienst für personalisierte, hochwertige Informationen und Lehr- und Lernmaterialien auszurichten. Durch das personalisierte und problemspezifische Anbieten von Materialien auf der Knowledge-Base werden Forschende, Lehrende und Lernende in der Wissenschaft (und in angrenzenden Bereichen) in die Lage versetzt, die notwendige Datenkompetenz für eine nachhaltige Forschung zu erwerben, eigene Autonomie und Motivation zu stärken und dadurch die Effektivität der individuellen Lernerfahrung zu verbessern.

Im Projekt werden weiterhin Qualitätsstandards und Mechanismen der Kuration für auf der Knowledge-Base angebotene Informationen und Lehr- und Lernmaterialien entwickelt und validiert. Auf diese Weise soll eine hohe formale, d.h. den FAIR-Prinzipien entsprechende, und inhaltliche Datenqualität garantiert werden. Gleichzeitig ermöglicht die Entwicklung von Qualitätsstandards einen Einfluss auf zukünftige Materialien zu nehmen. Dabei liegt ein besonderes Augenmerk auf der Kombinierbarkeit (Interoperabilität) und Nachnutzbarkeit von Lehr- und Lernmaterialien, die bisher meist unzureichend erfüllt ist. Zusammenfassend führen die genannten Punkte dazu, dass die Knowledge-Base mit den bestehenden Tätigkeiten im Bereich „Education und Training“ vernetzt wird. Eine Verstetigung der Knowledge-Base wird sowohl für den technischen Betrieb als auch für die Leitung und Überwachung (Governance) über die Projektlaufzeit hinaus sichergestellt.

Abbildung 2: Themen von Data Literacy der Knowledge-Base „FAIR data usage and supply“
Abbildung 2: Themen von Data Literacy der Knowledge-Base „FAIR data usage and supply“
TUDa-FST Technische Universtität Darmstadt,
Institut für Fluidsystemtechnik,
Prof. Dr.-Ing. Peter F. Pelz
RWTH-IAC RWTH Aachen University,
Lehrstuhl für Bioanorganische Chemie,
Prof. Dr. rer. nat. Sonja Herres-Pawlis
RWTH-ITC RWTH Aachen University,
IT Center, Lehrstuhl für Informatik 12
Prof. Dr. rer. nat. Matthias Müller
AdW Akademie der Wissenschaften und der Literatur Mainz,
Digitale Akademie,
Prof. Torsten Schrade
TUDa-ULB Technische Universität Darmstadt,
Universitäts- und Landesbibliothek,
Prof. Dr. Thomas Stäcker
UMG Universitätsmedizin Göttingen,
Institut für Medizinische Informatik,
Prof. Dr. rer. nat. Ulrich Sax
TIB Technische Informationsbibliothek Hannover,
Leibniz Informationszentraum Technik und Naturwissenschaften
Dr. Gábor Kismihók