Diese Musterlösung wurde erstellt von Peter Hähner (Ruhr-Universität Bochum).

(c) Luhmann: R für Einsteiger, 5. Aufl., Beltz, 2020

Aufgabe

Im Open Science Framework (https://osf.io/) stellen viele Wissenschaftlerinnen und Wissenschaftler ihre Daten zur Verfügung. Gehen Sie auf die Startseite und klicken Sie auf “Search”. Dort können Sie nach Projekten zu verschiedenen Forschungsthemen suchen (z.B. “life satisfaction”). Suchen Sie ein Projekt zu einem Sie interessierenden Forschungsthema, das offene Daten zur Verfügung stellt. Laden Sie die Daten herunter, lesen Sie sie in R ein und speichern Sie die Daten in einer .RData-Datei.

Lösungshinweise

Nachdem eine Datei gefunden wurde, sollte sie in einem geeigneten Ordner gespeichert werden. Hier wurden die folgenden Daten verwendet: https://osf.io/xsymc/

Dann erstellt man entweder ein R-Projekt mit der entsprechenden Datei (Kap. 23) oder legt den Ordner, in dem die Datei ist, als Arbeitsverzeichnis fest.

In Windows könnte das zum Beispiel so aussehen:

setwd("C:/Users/ordner 1/ordner 2")

Vor dem Einlesen der csv-Datei müssen wir prüfen, welche Symbole für Datenfeld- und Dezimaltrennzeichen verwendet wurden. Die meisten Datendateien auf OSF verwenden Kommata als Datenfeldtrennzeichen und Punkte als Dezimaltrennzeichen. In dem Fall können wir die read.csv-Funktion zum Einlesen der Daten verwenden, so wie in diesem Beispiel:

daten <- read.csv("LSSstudy1data.csv")

Werden stattdessen Semikolons als Datenfeldtrennzeichen und Kommata als Dezimaltrennzeichen verwendet, setzen wir die read.csv2-Funktion zum Einlesen ein.

Nach dem Einlesen können wir die Daten als .RData-Datei speichern.

save(daten, file = "Beispieldaten.RData")