Diese Musterlösung wurde erstellt von Peter Hähner (Ruhr-Universität Bochum).

(c) Luhmann: R für Einsteiger, 5. Aufl., Beltz, 2020

Vorbereitungen

Setzen Sie ein Arbeitsverzeichnis oder legen Sie ein entsprechendes R-Projekt an (Kap. 23).

Laden Sie dann die Datei erstis.RData.

load("erstis.RData")

Laden Sie die benötigten Pakete (ggf. müssen Sie diese vorab noch installieren).

library(psych)
library(dplyr)

Aufgabe 1

Erstellen Sie eine Tabelle mit den prozentualen Häufigkeiten für die Variable gruppe.

(100 * prop.table(table(erstis$gruppe)))
## 
##   Kurs 1   Kurs 2   Kurs 3   Kurs 4 
## 25.13089 28.79581 20.94241 25.13089

Aufgabe 2

Bestimmen Sie den Modalwert und den Wertebereich der Variablen gute vs. schlechte Stimmung (gs.1).

which.max(table(erstis$gs.1))
##  4 
## 10
range(erstis$gs.1, na.rm = TRUE)
## [1] 2 5

Der Modalwert ist 4. Der Wertebereich geht von 2 bis 5.

Aufgabe 3

Beschreiben Sie die Stichprobe anhand der Variablen Geschlecht (geschl) und Alter (alter), indem Sie die folgenden Fragen beantworten:

a. Wie viele Frauen haben an der Befragung teilgenommen?

table(erstis$geschl)
## 
## weiblich männlich 
##      115       55

Es haben 115 Frauen an der Befragung teilgenommen.

b. Wie hoch ist der Frauenanteil an der Stichprobe?

prop.table(table(erstis$geschl))
## 
##  weiblich  männlich 
## 0.6764706 0.3235294

Der Frauenanteil liegt bei etwa 68 %.

c. Wie alt sind die Teilnehmer im Durchschnitt?

mean(erstis$alter, na.rm = TRUE)
## [1] 25.59659

Das Durchschnittsalter liegt bei 25.60 Jahren.

d. Wie hoch ist die Standardabweichung für das Alter?

sd(erstis$alter, na.rm = TRUE)
## [1] 6.661771

Die Standardabweichung des Alters liegt bei 6.66 Jahren.

Aufgabe 4

Verwenden Sie die describe-Funktion aus dem psych-Paket, um deskriptive Kennwerte für die intervallskalierten Variablen Lebenszufriedenheit (lz.1) und Extraversion (extra) zu berechnen.

# Auswahl der Variablen mit der select-Funktion aus dem dplyr-Paket
auswahl <- erstis %>% select(lz.1, extra)

# Anwendung der describe-Funktion auf den neuen Date Frame
describe(auswahl)
##       vars   n  mean   sd median trimmed  mad min max range  skew kurtosis   se
## lz.1     1 189 24.53 5.62   26.0   24.94 5.93 9.0  35  26.0 -0.57    -0.27 0.41
## extra    2 188  3.59 0.64    3.5    3.60 0.74 1.5   5   3.5 -0.15     0.05 0.05

Aufgabe 5

Berechnen Sie die mittlere Lebenszufriedenheit (lz.1) getrennt für Frauen und Männer (geschl) mit der describeBy-Funktion aus dem psych-Paket.

describeBy(erstis$lz.1, erstis$geschl)
## 
##  Descriptive statistics by group 
## group: weiblich
##    vars   n  mean   sd median trimmed  mad min max range  skew kurtosis   se
## X1    1 113 24.76 5.63     26   25.25 5.93   9  34    25 -0.68    -0.22 0.53
## ------------------------------------------------------------ 
## group: männlich
##    vars  n  mean  sd median trimmed  mad min max range  skew kurtosis  se
## X1    1 55 24.18 5.2     25   24.51 4.45  11  32    21 -0.51    -0.39 0.7