Warning! It seems that you are using Dodona within another webpage, so not everything may work properly. Let your teacher know so that he can solve the problem by adjusting a setting in the learning environment. In the meantime, you can click this link to open Dodona in a new window.
3.2. Gepaarde en ongepaarde testen (Half)
Sign in to test your solution.
---
title: "Stokstaartjes"
output: html_document
---
Stokstaartjes, een mangoestensoort die voorkomt in zuidelijk Afrika, leven in groepen. Elke groep kent zijn dominant vrouwtje, die grotendeels het monopolie heeft op de voortplanting binnen de groep: ze is de moeder van meer dan tachtig procent van de jongen die hun eerste maand overleven. Hoe ze dit monopolie bewerktstelligt, is echter minder goed begrepen. Een mogelijke verklaring ligt in het feit dat het dominante vrouwtje ongeveer een maand voor ze bevalt de andere vrouwtjes terroriseert, wat voor hen vaak uitmondt in een tijdelijke verbanning uit de groep. In een onderzoek tracht men na te gaan of deze verbanning gerelateerd is met factoren die een nadelige invloed hebben op de voortplanting.
De studiepopulatie waarop het onderzoek betrekking heeft, bedraagt individuen uit 15 willekeurig gekozen groepen stokstaartjes. In een eerste luik van het experiment werd het gewichtsverschil bekeken van 15 stokstaartjes die verbannen werden uit de groep. In een tweede luik van het experiment werden op gelijkaardige tijdstippen als het vertrek en de terugkomst van de verbannen vrouwtjes het gewichtsverschil gemeten van 15 andere stokstaartjes uit dezelfde regio, maar die in hun eigen groep konden blijven. Deze laatste groep van individuen worden aangeduid in de dataset met `verbannen == 0` .
De dataset `stokstaartjesDat.txt` bestaat uit $60$ observaties van de volgende variabelen:
- `gewicht` het gewicht van het stokstaartje
- `tijdstip` tijdstip van de meting. `"voor"` indien gewogen werd voor de verbanning, anders `"na"`
- `verbannen` $1$ indien verbannen, $0$ indien niet.
```{r}
library(ggplot2)
library(dplyr)
data = read.table("stokstaartjesDat.txt")
data$verbannen = factor(data$verbannen)
```
```{r}
data
```
# Gewichtsverschil tijdens verbanning
Een mogelijk relevante factor met negatieve invloed op de voortplanting die de onderzoekers beschouwen, is gewichtsverlies. Lichamelijke verzwakking (tengevolge van het gewichtsverlies) heeft namelijk een nadelige invloed op de voortplanting. De onderzoekers trachten te weten te komen of verbanning uit de groep leidt tot een (aanzienlijk) gewichtsverlies.
Men bekeek hiervoor telkens één willekeurig stokstaartje die verbannen werd uit de groep, en mat het gewicht eenmaal vóór de verbanning en eenmaal op terugkomst van het vrouwtje.
Test op het 5% significantieniveau of er inderdaad gewichts**verlies** optreedt bij stokstaartjes op hun terugkomst versus voor de verbanning. Stel zelf eerst de nul- en alternatieve hypothese op.
Kan je aan de hand van het resultaat van de test bepalen of verbanning causaal leidt tot gewichtsverlies in vrouwelijke stokstaartjes?
### Data-exploratie
```{r}
# maak een nieuwe dataset aan met enkel de verbannen individuen, noem deze variabele dataVerbannen
# Maak een histogram "hist_Verbannen" aan van het gewicht voor en na verbanning. Maak gebruik van facet_grid.
```
### Checken van assumpties en uitvoeren van test
```{r}
#Controleer de normaliteit binnen de tijdstip groepen. Maak een boxplot "bp_Verbannen" en een qqplot "qq_Verbannen" aan met ggplot.
#Voer de test uit op het 5% significantieniveau of er inderdaad gewichtsverlies optreedt bij stokstaartjes op hun terugkomst versus voor de verbanning. Sla het resultaat op in Test_Verbannen
```
### Kan je reeds een causaal verband leggen op basis van deze test?
# Gewichtsverschil met en zonder verbanning
Men vergeleek tevens de gewichtsverandering tussen enerzijds vrouwtjes die uit de groep verbannen waren en vrouwtjes die in hun groep konden blijven. Test op het 5% significantieniveau de onderstelling dat de gemiddelde gewichtsverandering bij vrouwtjes die verbannen waren uit de groep **verschilt van** vrouwtjes die in hun groep konden blijven. Noteer tevens duidelijk uw conclusie.
### Data-exploratie
```{r}
# Bereken het gewichtsverschil in de verbannen individuen, noem deze variabele diffVerbannen
# Bereken het gewichtsverschil in de gebleven individuen, noem deze variabele diffGebleven
#Maak een ggplot histogram "hist_diff" om de distributies van diffGebleven en diffVerbannen te vergelijken. Gebruik facet_grid.
#tip: een ggplot heeft een dataframe nodig, in deze oefening kan ze verkregen worden met "data.frame(list(diff = c(diffVerbannen, diffGebleven), verbannen = as.factor(c(rep(1,15), rep(0,15)))))"
# Merk op dat ook bij de individuen die in de groep bleven er gewichtsverlies lijkt op te treden.
```
### Checken van assumpties en uitvoeren van test
```{r}
#Controleer nu de normaliteit van het gewichtsverschil in verbannen en gebleven individuen.
#Maak hiervoor een boxplot "bp_diff" en een qqplot "qq_diff" aan met ggplot.
#homoscedasticiteit
#Test op het 5% significantieniveau de onderstelling dat de gemiddelde gewichtsverandering bij vrouwtjes die verbannen waren uit de groep **verschilt van** vrouwtjes die in hun groep konden blijven. Sla het resultaat op in Test_diff.
```
# Zou je op basis van deze test een causaal verband kunnen maken?
You can submit as many times as you like. Only your latest submission will be taken into account.
Sign in to test your solution.