Gastbeitrag „Forschungsdatenmanagement in der Psychologie“

Gastbeitrag von Gidon Frischkorn

Wer von uns kennt das nicht: Ein Kollege fragt uns nach den Daten eines Projekts, das vor 2 Jahren abgeschlossen wurde oder eine Studentin oder ein Student fragt nach einer Abschlussarbeit und wir erinnern uns an einen Datensatz, mit dem noch ein paar interessante Fragestellungen exploriert werden könnten. Doch in ersterem Fall müssen wir den Datensatz häufig erstmal suchen und dann entscheiden, welcher der 5 Datensätze, die wir finden, denn der Richtige ist. Oder im zweiten Fall fragen wir uns beim Öffnen des Datensatzes erstmal, was hinter den Variablen „EI_01“ bis „EI_20“ und den Variablen „Agg_Meth1_EI“ und „Agg_Meth2_EI“ steht und ob das Rohdaten sind oder schon Daten, die irgendwie aufbereitet wurden.

Das Problem von Forschungsdatenmanagement besteht schon länger und doch wurde es durch die öffentliche Diskussion um die Reproduzierbarkeit psychologischer Forschung wieder mehr in den Fokus gerückt. Die Reproduzierbarkeit von Ergebnissen hängt vor allem mit einer guten Dokumentation der verschiedenen Schritte zusammen, die im Rahmen eines Forschungsprojekts durchgeführt werden (Asendorpf et al., 2013; interessant übrigens, dass hier Klaus Fiedler und Brian Nosek, die in letzter Zeit sehr unterschiedliche Meinung vertreten haben, beide auf dem gleich Papier als Autoren stehen).

Ein wesentlicher Schritt im Prozess wissenschaftlicher Forschung, insbesondere empirischer Forschung, ist das Management von Forschungsdaten. Eine gute Dokumentation der erhobenen Daten und auch der Aufbereitung von Rohdaten ermöglicht es, die aus den Daten gezogenen Schlüsse nachvollziehbar und reproduzierbar zu machen. Ich denke, es ist selbstverständlich, dass diese beiden Dinge wünschenswerte Attribute für wissenschaftliche Ergebnisse sind.

Dennoch ist die Dokumentation von Daten und deren Aufbereitung im Alltag der Wissenschaft häufig aufwändiger als gedacht. Häufig wird die knappe Zeit also eher auf weitere Möglichkeiten zur Analyse verwendet, als die Daten zu dokumentieren. Und ehrlich gesagt kann auch ich mir wenig anstrengendere Aufgaben vorstellen, als am Ende eines Projekts alle Daten zu sammeln und gut zu dokumentieren, Codebücher zu schreiben und Details zu den Fragebögen zu sammeln, um alle Scores und Variablen für jeden einigermaßen informierten Kollegen verständlich zu machen.

Wie kann also gutes Forschungsdatenmanagement aussehen? Zu diesem Thema hat das Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID) ein Projekt ins Leben gerufen: DataWiz. Die Idee ist, ein fachgerechtes Datenmanagement in der Psychologie zu etablieren und dadurch eine nachhaltige Sicherung von Forschungsdaten zu ermöglichen. Darüber hinaus wird durch ein gutes Datenmanagement eben auch die Möglichkeit, Forschungsdaten zu teilen und öffentlich verfügbar zu machen, stark vereinfacht.

Zum Start dieses Projekts hat das ZPID zu einem Kick-Off Workshop eingeladen, der Mitte März am Psychologischen Institut in Heidelberg stattgefunden hat. Neben einer illustren Runde von Professoren und Post-Docs (für eine Übersicht aller Teilnehmer klicken Sie auf den Link) durfte auch ich an diesem Workshop teilnehmen. Die wichtigsten Erkenntnisse aus diesem Workshop waren, dass Forschungsdatenmanagement so wenig Aufwand wie möglich sein sollte und das Thema schon so früh wie möglich an die Studierenden und Nachwuchswissenschaftler herangetragen werden sollte. Idealerweise wird also schon im Studium (eventuell im Rahmen des Empirischen Praktikums oder bei Abschlussarbeiten) über Datenmanagement gesprochen.

Insgesamt hat mir der Workshop gezeigt, dass das Thema Forschungsdatenmanagement im wissenschaftlichen Alltag wenig diskutiert wird. Wie so häufig ist es eben „selbstverständlich“, dass sich jeder einzelne Wissenschaftler um die Ordnung in seinen Daten kümmert. Ich denke jedoch: ein gewisser Standard kann an dieser Stelle nicht schaden. Die Transparenz von wissenschaftlicher Forschung halte ich für eines der wichtigsten aktuellen Themen und damit besteht eine Notwendigkeit für eine gute Dokumentation von Daten und Skripten zur Aufbereitung von Daten. In anderen Disziplinen ist das übrigens selbstverständlich, so sagte Ronny Bölter, der Informatiker im Team von DataWiz, dass es in der Informatik für unzureichend kommentierten Code innerhalb des Studiums Punktabzug gibt. Ein solcher Default wäre für die Psychologie eventuell auch wünschenswert.

Archive
Kategorien