Use LEFT and RIGHT arrow keys to navigate between flashcards;
Use UP and DOWN arrow keys to flip the card;
H to show hint;
A reads text to speech;
27 Cards in this Set
- Front
- Back
Wat is multiple regression?
|
een statistische methode voor het bestuderen van de relatie tussen een enkele afhankelijke variabele en 'e' en of meerdere onafhankelijke variabelen.
|
|
Wat is de volledige naam voor multiple regression?
|
Ordinary least squares multiple linear regression
|
|
Twee voordelen multiple regression
|
Ten eerste kunnen er meerdere variabelen gebruikt worden om een voorspelling te doen. Ten tweede mogelijk om onafhankelijke variabelen te scheiden en voor elkaar te controleren, hierdoor kan de invloed van elke unieke onafhankelijke variabele op de afhankelijke variabele getest worden.
|
|
Hoe kan een two variable linear regression geschreven worden?
|
Y = a + bX
|
|
Wat is a
|
intercept
|
|
Wat is b
|
Slope
|
|
Wat is Y
|
afhankelijke variabele
|
|
Wat is X
|
onafhankelijke variabele
|
|
Kan een relatie tussen de AV en de OV non linear zijn?
|
Ja
|
|
Wat zijn convenience samples?
|
Data die gebruikt wordt in regressie analyses die makkelijk vergaard worden.
|
|
Nadeel van convenience samples?
|
NIet altijd generaliseerbaar naar de hele populatie
|
|
Welk soort data is het beste bruikbaar bij regressie analyses?
|
Interval Ratio data
|
|
Welk soort schalen zorgen voor minder cijfermatige waarden?
|
ordinale en nominale
|
|
Wat zijn dummy/indicator variabelen?
|
Dat zijn nominale variabelen met twee mogelijkheden 1 of 0
|
|
Hoe wordt de prediction error berekend?
|
Error = observed value - predicted value
|
|
least squares criterion
|
Hier gaat het om de grootte van de error, niet de richting
|
|
Wat doet de coefficient of determination?
|
Daarmee wordt gemeten hoe 'goed' een voorspelling is. Dit gebeurd aan de hand van R square.
|
|
Hoe bereken je R2 oftwel R squared?
|
R-squared = 1 - (SSE ( regression)/ SSE (mean only))
|
|
3 mogelijke vormen van error
|
1: Measurement error
2: sampling error 3: uncontrolled variation |
|
Measurement error
|
slecht weinig variabelen kunnen echt gemeten worden met perfecte nauwkeurigheid.
|
|
Sampling error
|
de steekproef heeft nooit precies dezelfde eigenschappen als de te onderzoeken populatie
|
|
uncontrolled variation
|
in een regressie ontbreken soms variabelen die wel invloed hebben. Zolang deze niet meegenomen worden - onnauwkeurig beeld.
|
|
Hoe bereken je de t - statistic
|
Coefficient/ standard error
|
|
Wat doet de p - value
|
Geeft weer hoe groot de kans is dat een effect puur door kans is ontstaan. Hoe kleiner de p hoe groter het bewijs dat de coefficient/slope niet gelijk is aan 0, oftewel er een effect is.
|
|
p-value < 0
|
significant
|
|
p-value < 0.01
|
highly significant
|
|
Nadelen Multiple regression
|
1: misleidend wanneer niet linear
2: kunnen alleen meetbare variabelen opgenomen worden. |