Diese Musterlösung wurde erstellt von Peter Hähner (Ruhr-Universität Bochum).
(c) Luhmann: R für Einsteiger, 5. Aufl., Beltz, 2020
Setzen Sie ein Arbeitsverzeichnis oder legen Sie ein entsprechendes R-Projekt an (Kap. 23).
Laden Sie dann die Datei erstis.RData.
load("erstis.RData")
Laden Sie die benötigten Pakete (ggf. müssen Sie diese vorab noch installieren).
library(psych)
library(interactions)
library(emmeans)
Überprüfen Sie regressionsanalytisch, ob sich Personen mit und ohne Kinder (kinder) in ihrer Prokrastination (prok) unterscheiden. Die Prokrastination ist Ihre abhängige Variable.
# Kodierung der Variable "kinder" prüfen
contrasts(erstis$kinder)
## nein
## ja 0
## nein 1
# Modell aufstellen
aufgabe.1 <- lm(prok ~ kinder, data = erstis)
summary(aufgabe.1)
##
## Call:
## lm(formula = prok ~ kinder, data = erstis)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.48462 -0.35743 0.04257 0.43577 1.24257
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.48462 0.11011 22.566 <2e-16 ***
## kindernein -0.02718 0.11939 -0.228 0.82
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5614 on 172 degrees of freedom
## (17 observations deleted due to missingness)
## Multiple R-squared: 0.0003013, Adjusted R-squared: -0.005511
## F-statistic: 0.05184 on 1 and 172 DF, p-value: 0.8202
Personen mit Kindern und ohne Kinder unterscheiden sich nicht signifikant in ihrer Prokrastination (b = -0.03, SE = 0.12, t(172) = -0.23, p = .820).
Berechnen Sie den Interaktionseffekt von Gewissenhaftigkeit (gewiss) und Neurotizismus (neuro) auf die Prokrastination (prok). Vergessen Sie nicht, die unabhängigen Variablen zu zentrieren. Stellen Sie die bedingten Regressionsgeraden grafisch dar.
# Variablen zentrieren
erstis$gewiss.c <- as.numeric(scale(erstis$gewiss, scale = FALSE))
erstis$neuro.c <- as.numeric(scale(erstis$neuro, scale = FALSE))
# Modell schätzen
aufgabe.2 <- lm(prok ~ gewiss.c * neuro.c, data = erstis)
summary(aufgabe.2)
##
## Call:
## lm(formula = prok ~ gewiss.c * neuro.c, data = erstis)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.30617 -0.27484 -0.00424 0.22931 1.35533
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.44909 0.03424 71.524 < 2e-16 ***
## gewiss.c -0.39429 0.04372 -9.018 4.21e-16 ***
## neuro.c 0.22546 0.04727 4.770 3.98e-06 ***
## gewiss.c:neuro.c 0.05861 0.05260 1.114 0.267
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4456 on 168 degrees of freedom
## (19 observations deleted due to missingness)
## Multiple R-squared: 0.3748, Adjusted R-squared: 0.3636
## F-statistic: 33.57 on 3 and 168 DF, p-value: < 2.2e-16
Es liegt keine signifikante Interaktion zwischen den Variablen neuro und gewiss vor (b = 0.06, SE = 0.05, t(168) = 1.11, p = .267).
# Bedingte Regressionsgeraden darstellen
interact_plot(aufgabe.2, pred = gewiss.c, modx = neuro.c,
plot.points = TRUE,
point.shape = TRUE,
interval = TRUE,
x.label = "Gewissenhaftigkeit (zentriert)",
y.label = "Prokrastination")
Führen Sie eine Kovarianzanalyse durch mit der abhängigen Variablen Prokrastination (prok) und den Prädiktoren kinder und gewiss. Berechnen Sie die adjustierten Mittelwerte für Personen mit und ohne Kinder.
# Modell schätzen
aufgabe.3 <- lm(prok ~ gewiss.c + kinder, data = erstis)
summary(aufgabe.3)
##
## Call:
## lm(formula = prok ~ gewiss.c + kinder, data = erstis)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.29961 -0.25460 -0.00779 0.24949 1.28403
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.52384 0.09462 26.672 < 2e-16 ***
## gewiss.c -0.36727 0.04663 -7.877 3.99e-13 ***
## kindernein -0.07442 0.10285 -0.724 0.47
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4818 on 168 degrees of freedom
## (20 observations deleted due to missingness)
## Multiple R-squared: 0.2698, Adjusted R-squared: 0.2611
## F-statistic: 31.04 on 2 and 168 DF, p-value: 3.374e-12
# Adjustierte Mittelwerte berechnen
emmeans(aufgabe.3, specs = "kinder")
## kinder emmean SE df lower.CL upper.CL
## ja 2.53 0.0947 168 2.34 2.72
## nein 2.46 0.0400 168 2.38 2.54
##
## Confidence level used: 0.95
Überprüfen Sie, ob es einen quadratischen Zusammenhang zwischen der Prokrastination (prok; Prädiktor) und der Lebenszufriedenheit (lz.1; abhängige Variable) gibt.
# Prädiktor zentrieren
erstis$prok.c <- as.numeric(scale(erstis$prok, scale = FALSE))
# Modell schätzen
aufgabe.4 <- lm(lz.1 ~ prok.c + I(prok.c^2), data = erstis)
summary(aufgabe.4)
##
## Call:
## lm(formula = lz.1 ~ prok.c + I(prok.c^2), data = erstis)
##
## Residuals:
## Min 1Q Median 3Q Max
## -17.0072 -3.6955 0.9928 3.8492 10.0955
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 25.1696 0.4985 50.490 < 2e-16 ***
## prok.c -3.7713 0.6948 -5.428 1.93e-07 ***
## I(prok.c^2) -2.0558 1.0035 -2.049 0.042 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.094 on 171 degrees of freedom
## (17 observations deleted due to missingness)
## Multiple R-squared: 0.1549, Adjusted R-squared: 0.145
## F-statistic: 15.67 on 2 and 171 DF, p-value: 5.653e-07
Es gibt einen signifikanten quadratischen Effekt von Prokrastination auf Lebenszufriedenheit (b = -2.06, SE = 1.00, t(171) = -2.05, p = .042).
Versuchen Sie mit einer logistischen Regression vorherzusagen, welche Personen einen Nebenjob (job; abhängige Variable haben). Prüfen Sie die folgenden Variablen als Prädiktoren: kinder, gewiss, lz.1.
# Modell schätzen
aufgabe.5 <- glm(job ~ kinder + gewiss + lz.1, family = binomial, data = erstis)
summary(aufgabe.5)
##
## Call:
## glm(formula = job ~ kinder + gewiss + lz.1, family = binomial,
## data = erstis)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.3817 -1.1641 -0.9798 1.1917 1.4240
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.05327 0.99969 0.053 0.958
## kindernein -0.39541 0.43280 -0.914 0.361
## gewiss -0.10789 0.20111 -0.536 0.592
## lz.1 0.02638 0.02923 0.903 0.367
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 235.65 on 169 degrees of freedom
## Residual deviance: 233.86 on 166 degrees of freedom
## (21 observations deleted due to missingness)
## AIC: 241.86
##
## Number of Fisher Scoring iterations: 4
# Odds Ratio berechnen
exp(coef(aufgabe.5))
## (Intercept) kindernein gewiss lz.1
## 1.0547130 0.6734040 0.8977279 1.0267360
Keiner der Prädiktoren kinder, gewiss und lz.1 trägt signifikant zur Vorhersage bei, ob jemand einen Nebenjob hat oder nicht.