Regressieanalyse - Stappenplan regressie

6 belangrijke vragen over Regressieanalyse - Stappenplan regressie

Wat is het stappenplan van een regressieanalyse?


Voor regressie volg je het volgende stappenplan (belangrijk!):
  • Formuleer hypothese voor je regressiemodel en -coëfficiënten
  • Schat modelparameters
  • Check verdeling variabelen (we kijken dan naar: Skewness en kurtosis)
  • Check model assumpties
    • Lineariteit + additiviteit (alleen bij multiple regressie)
    • Uitschieters
    • Normale verdeling (van de residuen)
    • Homoscedasticiteit (gelijke varianties)/homogeniteit
    • Multicollineariteit (alleen bij multiple regressie)
  • Evalueer het model (dan kijken we naar 3 dingen):
    • Bruikbaarheid model (F-toets)
    • Verklaringskracht (determinatiecoëfficiënt R2)
    • Bijdrage van individuele variabelen (t-toets)
  • Gebruik model voor schattingen en voorspellingen

Uit welke twee delen bestaat een hypothese? Licht beide delen kort toe.

De hypothese bestaat uit twee componenten: een deterministisch deel, dat specificeert hoe de relatie tussen de onafhankelijke en de afhankelijke variabele er volgens je theorie uitziet, en uit aselecte errors, de residuen, hetgeen dat je model niet verklaart.

Wat zijn vier assumpties bij enkelvoudige lineaire regressieanalyse?


  • Lineariteit: er moet een lineair verband zijn voor een geldig resultaat.
  • Outliers/uitschieters: uitschieters die totaal afwijken van het lineaire verband en niet logisch zijn. Hier moet rekening mee worden gehouden.
  • Normaliteit: de residuen moeten normaal verdeeld zijn.
  • Homoscedasticiteit: de varianties voor de residuen moeten voor elke waarde van x gelijk zijn.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wat moet worden gedaan als niet wordt voldaan aan de assumpties? Licht hierbij ook het begrip assumpties toe.

De assumpties zijn de voorwaarden waaraan moet worden voldaan voor een geldige toets en een geldig toets resultaat. Als hier niet aan voldaan wordt, moet je een andere toets kiezen, de bestaande toets aanpassen door een correctie in te bouwen of je resultaten voorzichtiger interpreteren.

Wat is SSM bij regressieanalyse?

SSM wordt nu de verklaarde variantie. Het meet de spreiding die verklaard wordt door de relatie tussen X en Y.

Wat is SSE bij regressieanalyse?

SSE wordt de onverklaarde variantie. Het meet de spreiding die verklaard wordt door andere factoren buiten het model. Het wordt ook weergeven als SSR, met de R voor residuen.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo