Reproduzierbarkeit und Open Science: Bestandteile und erste Erfahrungswerte - mit besonderem Augenmerk auf Software
Dr. Sünje Dallmeier-Tiessen
CERN

Reproduzierbarkeit von wissenschaftlichen Ergebnissen wird zunehmend in vielen Wissenschaftskreisen und in der Öffentlichkeit diskutiert. Der Zugang zu Forschungsdaten, Workflows oder Arbeitsschritten, sowie zur Dokumentation und der zugrunde liegenden Software sind wichtige Bestandteile dieser Diskussion. Insbesondere in Disziplinen in denen große Datenmengen, Prozessierungsschritte und Modellberechnungen betrieben werden, wird der Langzeitarchivierung und dem Zugang zu wissenschaftlicher Software besondere Beachtung zugeschrieben.

Am CERN und in der Hochenergiephysik gibt es verschiedene Diskussionen und Lösungsansätze, die zum Teil auf andere Communities übertragbar sind und im Vortrag vorgestellt werden. Ein Beispiel ist CERNVM, was bereits als eine Lösung im Bereich Software Preservation in mehreren LHC Kollaborationen eingesetzt wird.

Um einen Paradigmenwechsel im Hinblick auf Reproduzierbarkeit und Open Science umsetzen zu können, werden verschiedene Komponenten benötigt. Hierbei nehmen neben technischen Lösungen insbesondere die Anreizmechanismen eine Sonderrolle ein, wenn etablierte Community Workflows und neuere Angebote überzeugend zusammengebracht werden müssen. Dies gilt z.B. für automatisierte Verfahren (mit DOI-Registrierung) über Github.

Am Beispiel von INSPIREHEP illustriert der Vortrag, wie in dieser Community versucht wird pragmatische Lösungsvorschläge einzubringen, die hoffentlich einige Hürden abbauen werden. INSPIREHEP ist eine offen zugängliche Informationsplattform, die alle relevanten Informationsressourcen in der Hochenergiephysik aggregiert und insbesondere die Daten- und Softwaresammlung ausbaut, um deren Sichtbarkeit zu erhöhen. Daten- und Softwarepublikationen werden gezählt und auf der Autorenseite der Plattform bereitgestellt.

Des weiteren zeigen die Arbeiten am CERN Analysis Preservation Service wie der wissenschaftliche Ablauf früh mit Werkzeugen unterstützt werden kann, die einen vertrauenswürdigen Zugang zu wissenschaftlichen Analysen und zu den resultierenden Materialien auf lange Sicht fördern und wie Wissenschaftler/innen von diesem Service profitieren können.