
Plattform für zentrales Datenmanagement in interdisziplinären Forschungsprojekten.
Für Forschungszwecke werden oft mittels unterschiedlicher Sensoren Daten erfasst. Verschiedene Partnerorganisationen stellen dabei unterschiedliche Datensätze bereit. Dies führt zu einigen Herausforderungen, die mit der Human Motion Data Platform bewältigt werden können.
Herausforderungen im Datenmanagement
- Unterschiedliche Datenquellen: In interdisziplinären Forschungsprojekten werden meist Daten von verschiedenen Personen und Organisationen gesammelt, gemeinsam genutzt, angereichert und analysiert. Jede Schnittstelle, an der Daten von einer Organisation, Maschine oder Person zu einer anderen übertragen werden, erzeugt „Data Friction“: Schwierigkeiten und Probleme, die auftreten können, wenn Daten von unterschiedlichen Quellen genutzt oder Datensätze in einem fremden Kontext verwendet werden. Bei Datensammlung über einen längeren Zeitraum hinweg können sich zudem Sensoren und damit auch die generierten Daten ändern – die Auswertungsprozesse müssen aber angepasst werden.
- Datenqualität und Datenschutzkonformität: Eine grundsätzliche Anforderung an Daten zum erfolgreichen Daten-Austausch ist die Datenqualität. Das Sicherstellen einer ausreichenden Datenqualität beginnt nicht erst beim Verarbeiten, und auch nicht beim Erfassen der Daten: Es muss bereits in der Vorbereitung, beim Erstellen eines sogenannten Datenmanagement-Plans erfolgen. Zusätzlich muss ein Austausch von Daten DSGVO-konform erfolgen: also der Schutz persönlicher Daten, falls diese verarbeitet werden, sichergestellt werden.
- Metadaten: Ein wichtiger Aspekt bei all diesen Überlegungen sind Metadaten. Mit diesen werden beschrieben, wie und wann, bei welchem Experiment oder Studie, mit welchen Probanden die Daten erfasst wurden, aber auch nicht zuletzt, welche Personen Zugriff auf die Daten haben dürfen.
Die Lösung: Human Motion Data Platform (HMDP)
Für die Verwaltung dieser Daten und Metadaten wurde die Human Motion Data Platform (HMDP) geschaffen. Über diese wird der „Research Data Management Lifecycle“ abgebildet. Die HMDP besteht aus drei Modulen:
Research Data Management Modul
Hauptzweck ist das Verwalten und Organisieren von Forschungsdaten und Metadaten. Das Research Data Management Modul unterstützt beim Erstellen des Datenmanagement-Plans und beim sogenannten „data wrangling“ (Datenaufbereitung), indem beim Organisieren der Daten und Metadaten unterstützt wird.
Sensor-Selection Modul
Das Sensor-Selection Modul unterstützt Forschende bei der Auswahl geeigneter Sensoren für die Durchführung der geplanten Studie und Experimente. Durch die Zuordnung von Sensoren zu Studien werden außerdem Metadaten über diese Sensoren, und damit zu den Daten, erstellt und verfügbar gemacht.
Workflow Management Modul
Dieses Modul adressiert eine weitere Anforderung an das Forschungsdatenmanagement: die Reproduzierbarkeit von Analyse- und Arbeitsabläufen und -prozessen, die mit den Daten durchgeführt werden. Über die mit diesem Modul definierten Arbeitsabläufe können mit den zugeordneten Daten jederzeit, und von jedem Berechtigen, wieder ausgeführt werden. Die Arbeitsabläufe können auch versioniert werden, so ist es möglich auch frühere Analysen zu reproduzieren.