Regressie modellen

27 belangrijke vragen over Regressie modellen

Welke drie criteria moet een regressie model voldoen om causaal genoemd te worden?

-associatie tussen de variabelen
-correcte tijdsvolgorde
-alternatieve verklaring moeten uitgesloten worden. 

Wat betekent Spurieuze relatie?

Een associatie tussen X1 en Y is spurieus als beide afhankelijk zijn van een derde variabel X2. Er bestaat niet echt een verband tussen X1 en Y. Voorbeeld: ijsjes eten op strand,verdrinken op het strand en hoge temperatuur

Wat is een suppressor variabel?

Een suppressor variabele verhoogt de voorspellende waarde zonder dat het gerelateerd is aan dit criterium. Als dit zich voordoet dan wordt er gecontroleerd voor de suppresor variabele. ( hij werkt eigenlijk als een unsupressor variabele)
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wat geeft een significante F weer?

dat er bewijs is van een effect  van de onafhankelijke variabelen op y. Dit betekent niet alle onafhankelijke variabelen. 

Wat zijn de aannames van ANOVA?

-De populatie verdeling van y is normaal verdeelt voor elke groep
-Homoscedasticiteit :de standaard deviatie van y is voor elke groep gelijk 
-De steekproeven zijn onafhankelijke en willekeurig getrokken.

pHs

Wat is de multipele correlatie van een regressie model?

Dat is de correlatie van meerdere factoren die Y verklaren. Ook wel zo gezegd: Bij meer dan dan 1 predictorvariabele kan de 'fit' van de regressie geschat worden door een correlaie tussen werkelijke Y-scores en voorspelde Y-scores. 

Wat zijn de aannames van een multipel regressie?

-Variabele y is in de populatie normal verdeeld onder elke combinatie van X1 tot en met Xk
-De variantie van de conditionele verdeling van de responsen op y is hetzelfde bij elke combinatie van X1 tot en met Xk.
- De data is op aselecte wijze verzameld.

Als X en Y op ordinaal niveau zijn gemeten, welke testen kan men dan het beste gebruiken?

Spearman rangcorrelatie (rs) of Kendalls Tau (τ) 

Hoe wordt een canonische correlatie ook wel genoemd?

Een multipele correlatie (R) berekenen. De multipele correlatie kan eigenlijk alleen berekend worden tussen variabelen op interval niveau. Maar ook met variabelen in combinatie met dummy-variabelen.

Wanneer gebruik je een Repeated measures ANOVA?


-Als de aanname van onafhankelijke steekproeftrekking wordt geschonden vanwege het feit dat proefpersonen worden gemeten op meerdere momenten in tijd, of reactie tijden bij dezelfde proefpersonen bij verschillende soorten stimuli.

Wat zijn de aannames van Repeated measure ANOVA?

-De afhankelijke variabele is op populatieniveau normaal verdeeld voor ieder niveau van de within subject factor.
-Sphericiteit: de varianties van de verschilscores zijn gelijk voor alle paren verschilscores. groep1 en groep 2 = groep 3 en groep 4
-aselect steekproef

aSa

Wat zijn de eigenschappen van een ANCOVA?

-laat zien of groepen van elkaar verschillen als je ze gelijk trekt door een covariaat.
-de variantie van SSWithin word gereduceerd
-het kan de geschatte gemiddelde veranderen. 
- als er geen verschillen zijn tussen groepen dan ook geen verschillen op de afhankelijke variabele. 
-bij aselecte toewijzing verwacht je geen aanpassing

Wat is backward selection?

uitzoeken van predictoren door alle predictoren steeds de slechtste aan de hand van een alpha te verwijderen.

Wat is en groot nadeel van alle algoritmes om de 'beste
 predictoren te kiezen

Ze zijn gevoelig voor kans kapitalisme. 
Ook laat R2 kan bekeken worden of er verhoging is in voorspelling, maar deze verhoogt altijd bij toevoeging van predictoren, dus ook een probleem. --> oplossing is adjusted R2

Wat is Mallow's Cp?

Ook een maat om een passend model te vinden voor een regressie model, aan de hand van ordinary least squares (OLS). lijkt een beetje op AIC

Wat is een noise suppressor?

een noise suppressor is een covariaat dat haalt 'noise' =ruis weg waneer het wordt opgenomen. Als MSwithin kleiner wordt dan werkt Xc. Een lagere Mswithin leidt tot lagere SSresidual en hogere relatie tussen X en Y. 

Wat is een Lurking variabelen?

Dit veroorzaakt een oorzaak gevolg relatie, die verborgen is door een lurking variabel. Het komt er op neer dat er geen oorzaak gevolg relatie is, de lurking variabel is niet opgenomen in het model, het beïnvloed de X en Y variabel en veranderingen in X en Y vinden dus plaats door de lurking variabel. Voorbeeld: grootte van ziekenhuis hangt samen met  lengte van tijd voor blijven, maar eigenlijk worden beide verklaard door serieusheid van de ziektes.

Wat is een spuriouse relatie?

Een relatie waardoor het lijkt alsof twee variabelen statistisch met elkaar gerelateerd zijn, maar eigenlijk worden verklaard door een derde variabel ( confounder of lurking variabel). 

Wat is Variance of inflation factors (VIF)?

een model dat variabelen opspoort die hoge correlaties met elkaar hebben. Door de index voor multicollinearity. Een lage VIF is gewenst en beter voor de betrouwbaarheid.

Hoe heet een interactie effect tussen twee factoren?

Deze twee factoren zijn dan afhankelijke van elkaar en lopen niet parallel met elkaar. 

Wat is conservatiever en waarom typ 3 of typ 1 SS

Type 3 is conservatiever omdat het hier moeilijker is om een significant resultaat te vinden. 

Noem de aannames van een twee-factor ANOVA

-afhankelijke variabele is minstens interval niveau
-scores in elke steekproef moeten onafhankelijke zijn
-de populatie waar uit de steekproef is getrokken moet normaal verdeeld zijn. 
-Homogeniteit: de populaties waaruit de samples worden getrokken moeten dezelfde variantie hebben. 

Welke reden heb je om een MANOVA  uit te voeren?

-Multipel indicators: indicatoren van zelfde onderliggende construct.
-Multimethod om gevoeligheid methode-bias te verkleinen. ( kans kapitalisme verkleinen)
-Rijkere en meer gedetailleerde beschrijving van data. 

Wat gebeurt is als een Univariaat met een Multivariaat wordt getoetst?

Een univariaat toetst met vierkanten (alles wat hier in val dat staat gelijkt aan de nul hypothese). Een multivariaat toetst met een ellipsvorm dat soms andere resultaten geeft voor sommige punten die wel in het vierkant voorkomen maar niet in de ellips en vice-versa.

Welke stappen gaan we af als we naar signifivantie van een MANOVA willen kijken?

-eerst alle assumpties wil je niet significant
-vervolgens bekijk je Wilk's Lambda ( in tabel multivariate test).
-Mocht sign. verschil zijn dan zoek je in de tabel Tests of between subjects effects uit welke groepen met elkaar significant verschillen. 

Wat doe je als je een Wilk's lambda significant resultaat hebt maar je vind in de test of between subjects geen significantie

Dan gebruik je de discriminant analyse, Dit vergelijkt de regressie niet in exacte maten maar in verhouding lineaire combo's. Vervolgens bekijk je per as dus op functie 1 en niet op functie 2. Als je op functie 2 kijkt dan niet op functie 1. 

Noem de voor en nadelen van Reapeated measures

voordelen
-meer metingen per observatie, meer info, subject en zijn eigen controle
-individuele neigingen wegfilteren.
-bij vereiste power vaak veel minder proefpersonen nodig.
nadeel
-mogelijk last van carryover- en volgorde effecten. 

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo