FAQ: "Informationsinfrastrukturen für Forschungsdaten"

Allgemeine Informationen

Forschungsdaten(interner Link) sind eine wesentliche Grundlage für das wissenschaftliche Arbeiten. Die Vielfalt solcher Daten spiegelt die Vielfalt unterschiedlicher wissenschaftlicher Disziplinen, Erkenntnisinteressen und Forschungsverfahren wider. Zu Forschungsdaten zählen u. a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Survey- oder Beobachtungsdaten, methodische Testverfahren sowie Fragebögen. Auch Korpora und Simulationen können zentrale Ergebnisse wissenschaftlicher Forschung darstellen und werden daher ebenfalls unter den Begriff Forschungsdaten gefasst.

Da Forschungsdaten in einigen Fachbereichen auf der Analyse von Objekten basieren (z. B. Gewebe-, Material-, Gesteins-, Wasser- und Bodenproben, Prüfkörper, Installationen, Artefakte und Kunstgegenstände), muss der Umgang mit diesen sorgfältig sein.

Im Rahmen des Förderprogramms „Informationsinfrastrukturen für Forschungsdaten“ umfasst der Begriff „Forschungsdaten“ keine Forschungssoftware.

Das Ziel der Forschungsförderung der DFG ist es, aus der Wissenschaft selbst entwickelte Vorhaben im Bereich der erkenntnisgeleiteten Forschung zu unterstützen. Die DFG-Infrastrukturförderung zielt hingegen auf die (Weiter-)Entwicklung von Technologien, Systemen und Werkzeugen, mit denen wissenschaftlich relevante Daten z. B. erhoben, analysiert, verbreitet oder langfristig gesichert werden können.

Bei der Infrastrukturförderung stehen Aufbau und Weiterentwicklung leistungsstarker Informationsinfrastrukturen für die Wissenschaften im Zentrum der Förderung.

In der Infrastrukturförderung – zu der alle LIS-Förderprogramme gehören – kann keine Grundlagenforschung gefördert werden. Somit sollten die in Infrastrukturvorhaben zu bearbeitenden Fragestellungen auch nicht als „Forschungsfragen“ bezeichnet werden. Dies gilt in diesem Programm insbesondere für förderbare Studien, die ebenfalls nicht unter die von der DFG geförderte Grundlagenforschung fallen. Diese Studien dienen vielmehr dazu, Fragen rund um das Forschungsdatenmanagement zu klären, die für den Aufbau und die Weiterentwicklung von Forschungsdateninfrastrukturen relevant sind.

Mit der Infrastrukturförderung kann keine wissenschaftliche Qualifikation gefördert werden.

„Informationsinfrastrukturen für Forschungsdaten“ oder „Forschungsdateninfrastrukturen“ umfassen sowohl technische als auch organisatorische Strukturen, die der Wissenschaft den Umgang mit Forschungsdaten ermöglichen.

Ein Aspekt der technischen Grundlagen von Informationsinfrastrukturen ist Informationsinfrastruktursoftware. Diese beruht überwiegend auf einem Softwarestack. Die einzelnen hierarchischen Komponenten dieses Stacks sind häufig nachnutzbare und etablierte Software (z. B. Betriebssystem, Web-Server-Technologie, Laufzeitumgebung, Programmiersprachen, Compiler, Datenbanken, Frameworks, Bibliotheken und Schnittstellen). 

Die Bezeichnung „Informationsinfrastruktursoftware“ verdeutlicht, dass es sich bei Informationsinfrastrukturen auf der Anbieter- und Betriebsseite um Softwaresysteme handelt, deren Entwicklung, Implementierung und funktionelle Weiterentwicklung im Rahmen des Förderprogramms gefördert werden kann.

Die vertikale Integration meint die nutzerorientierte, technische und ggf. organisatorische Einbindung einer Informationsinfrastruktur, die am Arbeitsplatz der Wissenschaftler*innen beginnt und sich von dort über die lokalen Strukturen und Prozesse, die regionale (z. B. Forschungsdatenmanagement-Landesinitiativen) und nationale (z. B. Nationale Forschungsdateninfrastruktur (NFDI)) bis hin zur internationalen Ebene (z. B. European Open Science Cloud (EOSC)) erstreckt.

Antragsteller*innen wird empfohlen, sich frühzeitig mit nationalen und internationalen Initiativen zu befassen und zu vernetzen.

Insbesondere im Sinne der vertikalen Integration, aber auch im Sinne der Harmonisierung von Standards, Organisationsmaßnahmen etc. ist eine Interoperabilität und Nutzung von Synergieeffekten unbedingt anzustreben.

Unter einer Implementierung wird im Kontext des Förderprogramms die Umsetzung eines Prototyps bzw. Softwareentwurfs in einen verlässlichen Dienst verstanden.

Eine funktionelle Weiterentwicklung meint die Erweiterung des Funktions- und Leistungsspektrums einer bestehenden Informationsinfrastruktur. Die Weiterentwicklungen sind an den sich verändernden Bedarfen in den Wissenschaften ausgerichtet.

Unter einer rein technischen Neuerung wird die Integration neuer bzw. aktualisierter Hardware- oder Softwarekomponenten (beispielsweise Softwareupdates) verstanden. Dies fällt unter die Wartung einer Informationsinfrastruktur und ist in der Regel Aufgabe des Betreibers. Eine rein technische Neuerung ist nicht förderbar.

Digitale Dienste sind Software und deren organisatorische Umgebung für die wissenschaftliche Nutzung. Die Nutzung eines Dienstes muss nicht mit Kosten verbunden sein.

Je nach Fokus können digitale Dienste kategorisiert werden in:

  • Digitaler wissenschaftlicher Dienst: Informationstechnische Dienstleistung, die z. B. Umgebungen, Werkzeuge und Lösungskomponenten für die wissenschaftliche Arbeit von Forscher*innen und Forschungsgruppen bereitstellt.
  • Digitaler generischer Dienst: Infrastrukturell bereitgestellter Dienst z. B. für das Identitäts- und Berechtigungsmanagement, das Übertragen, Speichern, Verarbeiten, Teilen, Archivieren sowie Auffinden von Daten und Informationen.

Die Organisationform einer Informationsinfrastruktur umfasst die Ausgestaltung sämtlicher Arbeitsabläufe, die im Kontext des Auf- und Ausbaus sowie des Betriebs einer Informationsinfrastruktur für Forschungsdaten anfallen. Bei der Konzeption einer Organisationsform werden Zuständigkeiten, Rechte und Pflichten rund um die Gestaltung und Nutzung der Informationsinfrastruktur definiert.

Bei Vernetzungsformen geht es um die Einbindung der (zu entwickelnden) Informationsinfrastruktur für Forschungsdaten in die wissenschaftlichen Fachcommunitys, und/oder in die Entwickler- bzw. Betreibercommunitys. Hierbei können unterschiedliche Formate (Konferenzbeiträge, Workshops, Rundgespräche, Zeitschriftenartikel, Öffentlichkeitsarbeit etc.) genutzt werden, um die Etablierung der Informationsinfrastruktur zu befördern.

Ein Betriebsmodell beschreibt Strukturen und Abläufe, die den nachhaltigen Betrieb der Informationsinfrastruktur ermöglichen. Entsprechend können in einem Betriebsmodell Regelungen zur Nutzung der Informationsinfrastruktur getroffen werden (Umfang der Nutzung, ggf. für unterschiedliche Nutzergruppen, Rechte, Pflichten, ggf. Kosten, Datenclearingstelle etc.). Auch organisatorische Abläufe und Zuständigkeiten können definiert werden (z. B. für die Beantragung eines Speicherkontingents, für Wartungszyklen, Aufgabenverteilung zwischen verschiedenen am Projekt beteiligten Institutionen etc.).

Ein Betriebsmodell kann auch ein Geschäftsmodell beinhalten, bei dem finanzielle Aspekte wie beispielsweise Nutzungsgebühren geregelt werden.

Die Entwicklung eines Betriebsmodells ist im Programm „Informationsinfrastrukturen für Forschungsdaten“ förderbar; dabei ist zu beachten, dass alle Projektergebnisse auch im Falle von zu entwickelnden Betriebsmodellen unter einer freien Lizenz zur Nachnutzung zur Verfügung gestellt werden müssen.

Die Gestaltung des Leistungs- und Funktionsspektrums ist immer an den wissenschaftlichen Bedarfen auszurichten. Dabei verdeutlichen die nachfolgenden Beispiele verschiedene Aspekte innerhalb des Leistungs- und Funktionsspektrums und können bei der Planung einer Forschungsdateninfrastruktur als Orientierung dienen. Die Aufzählung ist nicht abschießend.

Information und Planung für das Management von Forschungsdaten vor, in und nach Forschungsprojekten (z. B. Planung des Datenmanagements, Erfassung des Datenlebenszyklus, Einhaltung von Förderrichtlinien, Informationsangebote etc.)

Organisation und Aufbereitung von Forschungsdaten (z. B. Definition eines Datenkurationsprofils, Rechte- und Zugangsmanagement etc.)

Beschreibung und Dokumentation von Forschungsdaten mit strukturierten Informationen (z. B. Nutzung von Metadaten und Metadatenstandards, kontrollierten Vokabularien, Normdaten, Ontologien etc.)

Speicherung und Anschlussfähigkeit von Forschungsdaten für die Analyse (z. B. Wahl und Einrichtung der Speicherorte, Authentifikations- und Autorisierungsinfrastruktur, Strategien und Maßnahmen für die Datensicherheit und das Datenbackup, Planung von Schnittstellen zu Analyse- und Visualisierungssoftware sowie dem wissenschaftlichen Rechnen etc.)

Veröffentlichung und Archivierung von Forschungsdaten (z. B. Publikation nach den FAIR-, CARE- oder FACT-Prinzipien in einem geeigneten Repositorium, Nutzung persistenter Identifikatoren, Maßnahmen für die Langzeitarchivierung, Wahl offener und maschinenlesbarer Dateiformate etc.)

Auffindbarkeit und Nachnutzung von Forschungsdaten (z. B. Verzeichnisse von Repositorien, Metadatendienste und -indizes, Datenzitation etc.)

Rechte und Pflichten für den Umgang mit Forschungsdaten (z. B. Klärung und Festlegung urheber- und datenschutzrechtlicher Spezifikationen für die Nachnutzung, die Zugriffsmöglichkeiten und die Publikation von Daten sowie Festlegung von Nutzungslizenzen etc.)

Ethik und gute wissenschaftliche Praxis (z. B. Klärung und Einhaltung von Ethikrichtlinien entlang des Lebenszyklus von Daten, Erarbeitung und Umsetzung disziplinärer Richt- und Leitlinien zum Umgang mit Forschungsdaten etc.).

Ein Nachhaltigkeitskonzept sollte auf die Entwicklungsphase der Informationsinfrastruktur abgestimmt sein. Je reifer ein Projekt ist, desto verbindlicher ist der langfristige Betrieb der Informationsinfrastruktur technisch, finanziell und organisatorisch abzusichern.

  • Die Ergebnisse aus jeder Entwicklungsphase müssen FAIR (findable, accessible, interoperable, reusable) sein. Bei der Entwicklung von Prototypen kann die Sicherung der Nachnutzbarkeit ggf. bereits als eine Form der Nachhaltigkeit anerkannt werden. Zu beachten ist hierbei, dass auch bei negativer Evaluierung eines Prototyps die Verpflichtung besteht, die Projektergebnisse in wohl dokumentierter Form zu sichern und verfügbar zu machen.
  • Führt ein Projekt zum Betrieb einer Informationsinfrastruktur für Forschungsdaten, steht die Organisation des Dauerbetriebs im Fokus des Nachhaltigkeitskonzepts. Zentral ist hierbei ein langfristig tragfähiges Konzept, das den Betrieb der Informationsinfrastruktur sicherstellt. Dabei sind unterschiedliche Organisationsformen denkbar. Neben der Verantwortung der antragstellenden Organisationen ist auch die Übergabe der Verantwortung an andere Institutionen oder Organisationen (wie beispielsweise NFDI-Konsortien) denkbar, sofern diese die Organisation des Dauerbetriebs verbindlich zusagen.
  • Für die kontinuierliche Weiterentwicklung einer Informationsinfrastruktur kann der Aufbau einer Entwicklergemeinschaft angestrebt werden.
  • Sollte sich im Projektverlauf ergeben, dass ein Dienst nur für eine überschaubare Zeit in Betrieb genommen wird, ist ein End-of-Life-Konzept zu erarbeiten.

Zur Sicherung der Nachhaltigkeit sollen sogenannte Lock-in-Effekte, also Abhängigkeiten von kommerziellen Anbietern, vermieden werden.

Die Lizenzierung der Informationsinfrastruktursoftware wird durch das Programmmerkblatt geregelt. Es müssen Open-Source-Lizenzen gewählt werden, die eine kostenlose Nachnutzung durch Dritte ermöglichen. Bei der Lizenzierung von Forschungsdaten wird empfohlen, diese so frei und offen wie möglich zu gestalten.

Ziel der Datenkuration ist es, kohärente, reproduzierbare und nachnutzbare Datensätze zusammenzustellen. Das Datenkurationsprofil beschreibt die Kriterien zur Auswahl von Datensätzen (z. B. Qualität, Inhalt, Format, Metadaten, Auszeichnungstiefe etc.) und definiert einen Beschreibungsstandard für diese Daten (Metadatenschema, Normdaten, Persistent Identifier, Auszeichnungsformat etc.).

Antragstellung

Die Antragstellung richtet sich nach dem Leitfaden(interner Link) für die Antragstellung von Projektanträgen im Bereich „Wissenschaftliche Literaturversorgungs- und Informationssysteme“.

Bitte reichen Sie Ihren Antrag in englischer Sprache ein.

Die Kriterien zur Antragsberechtigung sind in Abschnitt(interner Link) 2.1 des Programmmerkblatts dargelegt. Daraus wird deutlich, dass Wissenschaftler*innen und auch Einrichtungen antragsberechtigt sind.

Eine kooperative Antragstellung von Infrastrukturanbietern und Nutzer*innen wird ausdrücklich empfohlen, damit Vorhaben frühzeitig und konsequent auf den Nutzen für Wissenschaftler*innen ausgerichtet werden können.

Personen oder Institutionen, die z. B. in NFDI, EOSC, Fachinformationsdiensten (FID) oder einer anderen Initiative mitwirken, können selbstverständlich Anträge im Förderprogramm „Informationsinfrastrukturen für Forschungsdaten“ stellen, sofern die formalen Voraussetzungen erfüllt sind. Dabei ist eine Doppelförderung desselben Vorhabens ausgeschlossen.

Der Antrag sollte neben den im Muster(interner Link) vorgegebenen Inhalten folgende Aspekte beinhalten:

  • Bedarfsanalyse
  • Umfeldanalyse
  • Risikoanalyse

Der Antrag sollte bzgl. der drei genannten Analysen für sich sprechen. Im Bedarfsfall können sie jedoch zusätzlich als Erläuterungen zum Antrag als separate Dokumente mit dem Antrag eingereicht werden.

Alle Vorhaben müssen bedarfsorientiert sein, d. h. spezifische Anforderungen einschlägiger Communitys erfüllen; dieser Bedarf kann in den Wissenschaften oder auch bei wissenschaftlichen Infrastruktureinrichtungen bestehen. Dies aufzuzeigen ist das Ziel der Bedarfsanalyse.

Grundlagen für die Bedarfsanalyse können Ergebnisse aus Workshops, Umfragen, Letters of Support etc. sein. Bereits vorhandene Informationen können nachgenutzt werden.

Die Umfeldanalyse zeigt auf, dass es für den ermittelten Bedarf noch keine angemessene oder ausreichende Lösung gibt. Dies begründet das beantragte Vorhaben.

Im Hinblick auf die Ziele des Vorhabens zeigt die Umfeldanalyse auf, welche technischen und organisatorischen Lösungen ggf. nachgenutzt werden können und wie sich neue Lösungen von vorhandenen abgrenzen.

Gleichzeitig geht aus der Umfeldanalyse hervor, in welche horizontalen und vertikalen Strukturen ein Vorhaben eingebettet werden kann bzw. soll.

Eine Risikoanalyse beschreibt mögliche Abweichungen von der Projektplanung, die bei der Durchführung des Projekts eintreten können. Darüber hinaus zeigt sie Strategien auf, wie Risiken minimiert werden können bzw. wie mit Abweichungen angemessen umgegangen werden kann.

Die Risikoanalyse kann zum Beispiel personelle, technische, organisatorische, inhaltliche oder andere Aspekte adressieren.

Vorhaben oder Arbeitspakete, in denen es alleine um die Integration neuer Datensätze in eine Informationsinfrastruktur oder einzig um die Kuration von Daten geht, ohne dass diese im direkten Zusammenhang mit der (Weiter-)Entwicklung der Forschungsdateninfrastruktur stehen, sind von der Förderung ausgeschlossen.

Mit der Entwicklung eines Prototyps wird die technische Machbarkeit einer avisierten Forschungsdateninfrastruktur aufgezeigt. Ein Ziel des Projekts ist es dabei, zu einer Beurteilung zu kommen, ob der Prototyp zu einem verlässlichen Dienst ausgebaut und danach betrieben werden kann und soll.

Daher ist in Anträgen zu Prototypen darzulegen, nach welchen Kriterien die Eignung des Prototyps festgestellt werden kann. Kriterien können z. B. die technische Funktionalität (Skalierbarkeit etc.), oder der Nutzen für Anwender*innen (Stichwort Usability: Bedienfreundlichkeit, Passgenauigkeit etc.) sein. Anhand dieser Kriterien kann im Projektverlauf und zum Projektende die Evaluation des Prototyps erfolgen; dies wird im Zwischen- oder Abschlussbericht dokumentiert.

Der Übergang in eine weitere Entwicklungsphase erfordert einen Fortsetzungsantrag, dem ein Zwischenbericht über die Evaluation des Prototyps beigefügt wird. Sind Prototyp und Folgeantrag im Begutachtungsverfahren überzeugend, kann eine Weiterentwicklung gefördert werden.

Mittelbeantragung und MIttelverausgabung

Hinsichtlich der Antragssumme gibt es weder eine Mindest- noch eine Höchstgrenze. Die Höhe der beantragten Mittel ist abhängig von der jeweiligen Projektidee und muss sich aus dem geplanten Arbeitsprogramm ergeben.

Die Beantragung von Investitionsmitteln zur Beschaffung von Hardware ist nur dann möglich, wenn der projektspezifische Bedarf überzeugend dargelegt wird. Wenn es zum Beispiel um die Beschaffung von Arbeitsplatzrechnern bzw. Laptops oder dauerhaften Speicherplatz geht, muss dies aus der Grundausstattung finanziert werden.

Die Höhe der Eigenleistung ist im Programm „Informationsinfrastrukturen für Forschungsdaten“ nicht festgelegt. In der Begutachtung wird jedoch geprüft, ob die dargestellte Eigenleistung vor dem Hintergrund der beantragten Mittel und den Projektzielen angemessen erscheint.

Als Eigenleistung können beispielsweise Stellenanteile von im Projekt beschäftigten Personen oder Sachmittel, die spezifisch für das Projekt genutzt werden, angegeben werden. Nicht zur Eigenleistung zählen Grundaufgaben der antragstellenden Einrichtungen.

Die Eigenleistung kann quantifiziert, tabellarisch, qualitativ oder als Fließtext angegeben werden. Bitte beachten Sie, dass die Projektleitungs- bzw. Arbeitspaketleitungsaufgaben keine Eigenleistung darstellen, sondern Voraussetzung für die Durchführbarkeit des Projekts sind.

Werden externe Dienstleistungen im Projekt benötigt, muss bei der Antragstellung ein Angebot vorgelegt werden. Grundsätzlich wird empfohlen, die technische Expertise zum Aufbau bzw. der Weiterentwicklung von Informationsinfrastrukturen in den Einrichtungen der Antragsteller*innen zu verankern.

Begutachtung und Berichtslegung

Bei der Begutachtung werden die allgemeinen Begutachtungskriterien(interner Link) für LIS-Programme angewandt. Diese sind auf der DFG-Website veröffentlicht.

In der Regel wird der Antrag sowohl von Gutachter*innen aus dem Anwendungsfach / den Anwendungsfächern als auch von Personen mit infrastruktureller/technischer bzw. digitaler Expertise begutachtet.

Der Abschlussbericht orientiert sich am Leitfaden für Projektberichte im Bereich „Wissenschaftliche Literaturversorgungs- und Informationssysteme(interner Link). Bitte gehen Sie insbesondere auf das Thema „Nachhaltigkeit“ ein.