Forschungsdatenmanagement
Von der Planung und Antragstellung eines Forschungsprojekts, über die Projektlaufzeit bis hin zur Publikation, ein strukturierter Umgang mit Forschungsdaten spart langfristig Zeit und erhöht die Nachnutzbarkeit von Forschungsergebnissen.
Springe zu
Einführung und Definitionen
Forschungsdaten sind die Basis einer jeden Forschungstätigkeit. Der Begriff Forschungsdaten wird verschieden definiert und ist daher zunächst weit auszulegen.
Unter Forschungsdaten sind […] Daten zu verstehen, die im Zuge eines wissenschaftlichen Vorhabens z. B. durch Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen. (DFG 2009)
Hieraus ergibt sich zunächst keine Beschränkung auf digitale Daten, auch die oft verwendete Unterscheidung zwischen Primär- und Sekundärdaten verschwimmt in der Praxis häufig. Abzugrenzen sind Forschungsdaten von Daten über Forschung, z.B. Informationen über Forschungsprojekte.
Je nach Disziplin existieren verschiedene Workflows oder auch Vorgaben zum Umgang mit eigens generierten Daten und zur Nutzung fremder Daten. Im Forschungsprozess durchlaufen die Daten jedoch in der Regel einen allgemeinen Datenlebenszyklus.
Von der Planung eines Forschungsvorhabens über die kurzfristige Speicherung und den Austausch der Daten mit Projektpartnern in der Projektlaufzeit bis hin zur Veröffentlichung und Nachnutzung durch andere Forschende, jede Phase stellt unterschiedliche Anforderungen an den Umgang mit Forschungsdaten. Der Datenlebenszyklus ist unter anderem angelehnt an den Research Data Lifecycle des UK Data Service.
Wozu sollte man sich mit dem Thema Forschungdatenmanagement befassen? Ein geplanter und strukturierter Umgang mit Forschungsdaten kann einen Nutzen bieten:
- durch Vermeidung von redundanten Datenerhebungen und Reanalysen unter anderen Fragestellungen oder mit neuen Methoden Zeit zu sparen
- nicht replizierbarer Daten zu sichern
- die Regeln guter wissenschaftlicher Praxis einzuhalten sowie Transparenz und Validität der Daten zu fördern
- Vorgaben von Mittelgebern (EU, DFG, BMBF) zu erfüllen
- den wissenschaftlichen Austausch und die interdisziplinäre Zusammenarbeit voranzutreiben
- die Sichtbarkeit durch die Publikation von Forschungsdaten zu steigern
Die folgenden Informationen sollen Orientierung geben für Angebote der TH Köln oder von Drittorganisationen rund um das Thema Forschungsdatenmanagement und auf existierende Vorgaben und Initiativen hinweisen.
Planen und Strukturieren
Zu Beginn eines Forschungsvorhabens ist es hilfreich, sich über bestimmte Aspekte in der Handhabung der entstehenden Forschungsdaten Gedanken zu machen.
Für Einsteiger ist zur umfangreichen Information und Einführung in das Thema Forschungsdaten die Informationsplattform forschungsdaten.info zu empfehlen. Zahlreiche nützliche Tipps und Links werden zur Vertiefung zusammengestellt.
Bei der Beantragung von Forschungsprojekten gilt es, sich über die genauen Vorgaben der Forschungsförderer zu informieren. Diese werden in allgemeinen Leitlinien, aber auch in den einzelnen Bekanntmachungen zu Förderprogrammen definiert. Für Horizon 2020-Projekte existieren die umfangreichsten Vorgaben zum Forschungsdatenmanagement, es sei denn, die Antragsteller machen von der sogenannten Opt-out-Option Gebrauch.
Ist ein konkretes Forschungsprojekt geplant, kann die Erstellung eines Datenmanagementplans (DMP) vorgegeben oder zumindest hilfreich sein. Ein Datenmanagementplan fasst die wichtigen Punkte zum Umgang mit Forschungsdaten im Projekt zusammen, z.B.:
Beispiele für Datenmanagementpläne (DMP)
- Muster-DMP für unterschiedliche Forschungsförderer Die HU Berlin hat Muster-DMP für Projektanträge bei DFG, BMBF und Horizon 2020 erarbeitet.
- Wie ist das Projekt definiert? Was sind die Ziele und wer ist verantwortlich?
- Wie werden die Daten erhoben bzw. was ist die Datenquelle?
- Wie werden Daten dokumentiert und gespeichert? Welche Metadaten und Formate werden gewählt?
- Wo werden die Daten gespeichert?
- Wem werden die Daten zur Verfügung gestellt und unter welchen Bedingungen?
- Gibt es rechtliche oder ethische Aspekte zu beachten?
- Wie werden die Daten nach Projektende archiviert und wie lange?
- Welche Kosten fallen für FDM an?
Ausführliche Informationen, welche Punkte in einem DMP beachtet werden sollten, bieten z.B. die Checklist for a Data Management Plan des Digital Curation Centre oder die Checkliste zur Erstellung eines Datenmanagementplans in der empirischen Bildungsforschung des Verbunds Forschungsdaten Bildung.
Speichern und Austauschen
Bei der Datenablage berücksichtigen
Für die Speicherung von Forschungsdaten in einem Forschungsprojekt ergeben sich unterschiedliche Anforderungen. Hier spielt z.B. die Datenmenge oder der Datenschutz eine Rolle, aber auch die Frage, welche Personen Zugriff auf die Daten erhalten sollen. Im folgenden werden einige Angebote zusammengestellt.
Bei Anliegen zur Einrichtung von persönlichem Speicherplatz wenden Sie sich bitte an den IT-Admin (intern verfügbar) Ihrer jeweiligen Fakultät. Sofern für ein Forschungsprojekt ein gemeinsamer Speicherplatz für Personen aus verschiedenen Organisationseinheiten notwendig ist, bietet die Campus IT die Gruppenverzeichnisse an. Diese sind geeignet bei der Nutzung durch eine festgelegte Gruppe an Personen der TH Köln über einen längeren Zeitraum hinweg.
Darüber hinaus bietet die nicht-kommerzielle Cloud-Plattform Sciebo zur gemeinsamen Dateiablage eine kostenlose Alternative zu den häufig verwendeten kommerziellen Cloud-Anbietern. Vor der Nutzung sind die Empfehlungen für die Verwendung von Sciebo, insbesondere zum Datenschutz, zu beachten. Für Projekte mit besonders großem Speicherbedarf können spezielle Projektboxen in Sciebo beantragt werden.
Die Software Angebote und weitere Services der Campus IT für Mitarbeiterinnen und Mitarbeiter der TH Köln sind im internen Webauftritt zusammengestellt. Angebote für Studierende sind hier zusammengestellt. Konkrete Anfragen für weitere Software richten Sie bitte direkt an die Campus IT (software@campus-it.th-koeln.de).
Veröffentlichen und Archivieren
FDM-Initiativen auf Landes-, Bundes- und EU-Ebene
- Landesinitative für Forschungsdatenmanagement - fdm.nrw Die Landesinitiative trägt als zentrale Kontaktstelle dazu bei die Hochschul- und Landesaktivitäten in Sachen FDM in NRW zu bündlen und Synergien zwischen Einrichtungen zu schaffen.
- Nationale Forschungsdateninfrastruktur (NFDI) Mit den von der NFDI erarbeiteten Standards sollen Datenbestände von Wissenschaft und Forschung erschlossen, nachhaltig gesichert und zugänglich gemacht werden.
- Übersicht der Konsortien/ Initiativen In jedem Fachkonsortium engagieren sich zahlreiche Einrichtungen wie Universitäten oder Forschungszentren und arbeiten gemeinsam an fachinternen- sowie übergreifenden Themen.
- European Open Science Cloud (EOSC) Mit der EOSC sollen fachspezifische und nationale Strukturen zum FDM zu einer virtuellen Umgebung zusammengeführt werden.
Mit der Publikation eines wissenschaftlichen Artikels werden in der Regel bereits verarbeitete und nur ausgewählte Forschungsdaten veröffentlicht. Immer mehr Journale erwarten allerdings von den Autorinnen und Autoren die Bereitstellung der zugehörigen Original-Datensätze, entweder für den Peer-Review-Prozess oder für die spätere Veröffentlichung.
Sofern die Journale selbst keine Möglichkeit zur Publikation der Datensätze bieten, helfen spezielle Datenrepositorien weiter. In einem Datenrepositorium werden Daten strukturiert abgelegt und mit einem persistenten Identifier (z.B. DOI) versehen. So sind diese dauerhaft verfügbar und zitierbar. Es existieren fachspezifische sowie fachunabhängige Repositorien. Weitere Informationen zu Datenrepositorien bietet die Plattform forschungsdaten.info und Recherchemöglichkeiten für das für Sie geeignete Repositorium finden Sie hier.
Für die Datenveröffentlichung hilfreich
- Entscheidungshilfe Datenveröffentlichung Orientierung bei eventuell zu beachtenden rechtlichen Vorgaben auf forschungsdaten.info.
- ORCID Ein digitaler Identifier für Forscherinnen und Forscher!
Bei der Veröffentlichung oder der Weitergabe von Forschungsdaten an Dritte ist es wichtig, relevante rechtliche Aspekte zu berücksichtigen und über die Auswahl der passenden Lizenz die Regeln zur Nachnutzung festzulegen. Eine inhaltliche Einführung in das Thema bietet die Plattform forschungslizenzen.de.
Die Ordnung zur Sicherung guter wissenschaftliche Praxis der TH Köln gibt zudem vor, dass die Originaldaten als Grundlagen für Veröffentlichungen auf haltbaren und gesicherten Trägern für zehn Jahre aufbewahrt werden müssen. Dieser Aspekt sollte von den Projektverantwortlichen vor allem beim Weggang eines Mitarbeiters oder einer Mitarbeiterin beachtet werden.
Workshops und Weiterbildung zu FDM
Einen allgemeinen und aktuellen Überblick zu Veranstaltungen rund um das Thema FDM finden Sie auf der Plattform forschungsdaten.info und hier im besondern im Veranstaltungskalender.
Zertifikatskurs Forschungsdatenmanagement der TH Köln
In zehn Modulen wird in diesem Zertifiaktskurs u. a. der Forschungskreislauf in verschiedenen Fachgebieten, Open Science, FDM-Beratung, technische Infrastruktur, Datenmanagement, auch unter Berücksichtigung rechtlicher Aspekte vermittelt. Der Zertifikatskurs dauert etwa 10 Monate und ist als Blended-Learning-Kurs mit einem Wechsel von Live-Online-Terminen (80 Stunden) sowie anschließenden Selbstlernphasen (etwa 125 Stunden) konzipiert. Der Zeitaufwand beträgt insgesamt 240 Stunden. Zur Erlangung eines Zertifikates mit 8 ECTS kann fakultativ eine Projektarbeit abgelegt werden, deren Arbeitsaufwand mit etwa 35 Stunden kalkuliert wird.
Zertifikatskurs Research Data Management and Sharing
Dieser Online-Kurs gibt eine Einführung zum FDM und Forschungsdaten teilen, und kann mit einem Zeitaufwand von ca. 12 Stunden mit einem Zertifikat abgeschlossen werden. Als Lerninhalte werden angegeben: "...learners will understand the diversity of data and their management needs across the research data lifecycle, be able to identify the components of good data management plans, and be familiar with best practices for working with data including the organization, documentation, and storage and security of data. Learners will also understand the impetus and importance of archiving and sharing data as well as how to assess the trustworthiness of repositories."
OpenGeoEdu
Das E-Learning-Angebot „OpenGeoEdu“ online – mitentwickelt vom Leibniz-Institut für ökologische Raumentwicklung (IÖR) - richtet sich an Studierende raumbezogener Studiengänge wie Geografie, Raum-, Stadt- oder Umweltplanung, Geodäsie oder Land- und Forstwirtschaft. Aber auch Beschäftigte in Wissenschaft, Planung und Verwaltung können mit dem frei zugänglichen Online-Angebot ihr Wissen zum Umgang mit offenen Geodaten auffrischen und vertiefen. Mehr zum Projekt OpenGeoEdu.
FOSTER Open Science Training Courses
Das Portal FOSTER ist eine englischsprachige E-learning Plattform für alle, die mehr über Open Science wissen möchten. Es werden Trainings zu verschiedenen Themen angeboten, u.a. "Managing and Sharing Research Data", "Open Licensing" oder "Data Protection and Ethics".
MANTRA Research Data Management Training
MANTRA ist ein englischsprachiges Selbstlernangebot mit insgesamt neun bis zu einstündigen Modulen (von Research Data Explained bis Data Protection, Rights & Access). Ein ein zielgruppenspezifischer Zugang von Student*in bis Expert*in wird angeboten.
E-learning-Webseite zum Thema Forschungsdatenmanagement der HTW Chur und der HEG Genf
Auf der Webseite finden Sie ein deutschsprachiges Selbstlernangebot zum Thema FDM mit einzelnen Modulen, von Basiswissen bis hin zu Fallbeispielen.