"Entwurf eines Metadatenrepositoriums zur Erfassung technischer Nachhaltigkeit von Forschungssoftware"
Stephan Druskat
Humboldt-Universität zu Berlin
Die ressourcenbezogene Nachhaltigkeit von Forschungssoftware ist abhängig von ihrer technischen Nachhaltigkeit. Die Ziele letzterer können definiert werden als 1. Sicherung der Existenz der Software, 2. Erhaltung ihres Produktivpotentials, 3. Schaffung und Erhalt ihres Potenzials für Weiterentwicklung und Adaption. Der Zugang zu existierender, geeigneter und technisch nachhaltiger Software scheitert häufig an fehlender Auffindbarkeit sowie ungenügender Dokumentation der technischen Nachhaltigkeit. Abhilfe schaffen kann ein Metadatenrepositorium, das neben der Anwendungsdokumentation Maße bereitstellt, die das Potenzial technischer Nachhaltigkeit einer Software abbilden. Bereits existierende Plattformen tun dies nicht, in ungenügendem Umfang oder nur implizit. Nachhaltigkeitsmaße müssen auf Kriterien basieren, die sich nach ihrer Objektivität und Quantifizierbarkeit auf Grundlage der drei Nachhaltigkeitsziele kategorisieren lassen. Erweiterbare Grundlage für diese Kriterienkataloge bieten u.a. das kriterienbasierte Assessment des SSI und das Projekt CodeMeta. Zusätzlich lassen sich durch Interaktivität, wie bspw. die Dokumentation von Softwaregebrauch durch Verknüpfung mit Veröffentlichungen oder die Erfassung subjektiverer Datenpunkte wie Nutzbarkeit, wertvolle weitere Anhaltspunkte für Nachhaltigkeit gewinnen. Die unterschiedliche Qualität der Metadaten - von subjektiv und nicht-quantifizierbar bis objektiv und quantifizierbar - legt eine nach Härte und Reproduzierbarkeit gestaffelte Messung und Dokumentation über mehrere Maße nah. Während solch ein Repositorium ein geeigneter Dokumentationsträger für Softwaremanagementpläne wäre, sind aber mindestens folgende Hürden zu überwinden: 1. Operationalisierbare Definition technischer Nachhaltigkeit; 2. Definition, Katalogisierung und Kategorisierung von Nachhaltigkeitskriterien; 3. Entwurf genauer, reproduzierbarer, manipulationssicherer und nachvollziehbarer Maße; 4. Entwurf von Berechnungsalgorithmen für diese Maße.
"Qualitätsmanagement von und Infrastruktur für Open Source Software in der Wissenschaft am Beispiel des Medical Imaging Interaction Toolkits (MITK)"
Stefan Kislinskiy, Caspar Goch
Deutsches Krebsforschungszentrum (DKFZ)
MITK ist eine modulare Softwareplattform im Bereich der medizinischen Bildverarbeitung. Sie wird weltweit sowohl von Forschern zur Entwicklung eingesetzt, als auch als Anwendung von Medizinern, um die Translation der Forschungsergebnisse in die Klinik zu beschleunigen. An und mit MITK wird in der Abteilung Medizinische und Biologische Informatik des DKFZ Heidelberg seit 15 Jahren entwickelt. Das Umfeld der Wissenschaft bedingt dabei einige Hürden, die es zu überwinden gilt:
(1) Das Gros der Entwickler setzt sich aus Doktoranden und Masteranden zusammen und unterliegt damit einer hohen Fluktuation
(2) Eine fachliche Ausbildung oder tiefergehende Kenntnisse im Bereich der Softwareentwicklung sind meist nicht gegeben
(3) Die Prioritäten der Entwickler liegen auf der eigenen Forschung
(4) Über die Jahre hat sich das Spektrum der Forschungsthemen im Bereich der medizinischen Bildverarbeitung breit aufgefächert.
Daraus ergeben sich besondere Anforderungen an das Qualitätsmanagement und die Software-Infrastruktur, um - ohne großen Mehraufwand für die entwickelnden Forscher - einen hohen Standard aufrechtzuerhalten. Unsere Werkzeuge reichen dabei von der Code- und Versionsverwaltung, über garantierte Plattformunabhängigkeit, kontinuierliche Integration, Dokumentation und Schulungen, Bug und Feature Tracking, automatisierte Regeln und Abläufe, Lizenzen bis hin zum Projektmanagement im allgemeineren Sinne. Wir stellen unsere etablierten Abläufe und Erfahrungen der letzten 15 Jahre in diesem Kontext vor.
“Wissenschaftliche Software pflegen – aber wie?”
Professor Andreas Zeller
Universität des Saarlandes
Wissenschaftliche Software entsteht oft ungeplant, ist dann unerwartet erfolgreich, und will auf einmal auch für Dritte gepflegt werden, auch wenn die ursprünglichen Forschungsmittel längst verbraucht sind. Wie lässt sich dies organisieren? In meinem Vortrag illustriere ich das Problem am Beispiel der erfolgreichen Bioinformatik-Software BALL, und zeige, wie etablierte Verfahren der Open Source-Entwicklung helfen, Aufwand im Rahmen zu halten.