Lineare regressie

20 belangrijke vragen over Lineare regressie

Hoe behandel je influential observations? (3)

- Nooit zomaar verwijderen! Je verwijdert mogelijk de variantie
- Je kunt de steekproef groter maken
- Bootstrapping

Met welke grafiek spoor je influential cases op?

Adjusted vs. predicted

De tests voor normaliteit en heteroscedasticiteit (Levene's test) zijn niet altijd de beste. Hoe komt dit?

Het is moeilijk significante resultaten te bereiken met kleine steekproeven wanneer nodig en makkelijk met grote steekproeven als het niet echt van belang is.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

(Homoscedasticiteit) Coefficienten zijn juist, standaardfouten niet. Hoe toets je dit?

Met de scatterplot van standardized predicted value en standardized residual

(Normaliteit residuen) Coefficienten zijn juist, maar de standaardfouten niet. Hoe testen we dit?

Histogram en normal p-p van residuen

Wat is het probleem met gecorreleerde residuen van verschillende observaties en hoe toetsen we dit?

De standaardfouten en confidence intervals zijn dan biased. We toetsen dit met de Durbin Watson. Deze moet rond de 2 liggen, anders is er sprake van autocorrelatie

Zijn de VIF en een lage tolerance altijd het bewijs voor mutlicollineariteit? Wat is de oplossing?

- Een grotere steekproef gebruiken
- Verwijder verantwoordelijke variabele
- Centreer de continue variabelen in een interactie

Mogen de F-test en T-test van mening verschillen (multicollineariteit)?

Als tenminste 1 test significant is, moet de F-test ook significant zijn, maar als de F-test significant is, terwijl geen enkele t-toets significant is, hebben we multicolli poppen aan het dansen

Geen autocorrelatie en lineariteit zijn assumpties van

Lineaire regressie

Aselecte steekproef, continue afhankelijke variabele en predictoren met non-zero variantie zijn assumpties van

Lineaire regressie

Geen multicollineariteit is een assumptie van

Lineaire regressie

Waar staan de b-waardes en z-waardes voor in een regressievergelijking

b= het verschil met de referentiecategorie
z= andere categorieën (variabelen)

Hoeveel dummy variabelen maken we hiervoor aan:

0 = basisschool
1 = middelbare school
2 = hoger onderwijs

Altijd het aantal minus 1, dus 2

In wat voor analyse splits je categorische variabelen altijd op in dummy variabelen?

Regressieanalyse. Ook in een logistische en lineaire regressie

Wat kenmerkt een multipele regressie? (variabelen)

Categorische variabelen: groepslidmaatschap met meerdere categorieën

Er zijn twee tests voor de multivariate regressie. Welke 2 tests zijn dit?

1. Algemene F-toets
2. Verschillende partiale t-toets in populatie

Mogen Beta's met elkaar worden vergeleken? En zijn ze onafhankelijk van meeteenheden?

Ja
Nee, want de relatie is gemeten in standaarddeviaties

Hoe kan de BETA worden geïnterpreteerd?

Als x met 1 standaarddeviatie toeneemt, neemt y toe met de BETA score

Neemt de adjusted R2 altijd toe met een toevoeging van een predictor?

Nee

Betekent een hoge R2 automatisch dat een model goed is?

Nee

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo