Regressie - De p-waarde van bèta

10 belangrijke vragen over Regressie - De p-waarde van bèta

Op dezelfde manier als bij correlaties kunnen we een steekproevenverdeling opstellen voor een populatie-regressiecoëfficiënt van 0

Die steekproevenverdeling bevat dan alle mogelijke regressiecoëfficiënten die gevonden kunnen worden als er in de populatie geen verband tussen de twee variabelen is.

Met deze steekproevenverdelingen kan vervolgens de kans worden berekend op elk van de regressiecoëfficiënten onder de aanname dat deze in de populatie eigenlijk 0 zijn. Hiervoor moeten we eerste weer bepalen welke proportie van deze nulhypothese-steekproevenverdelingen hoort bij regressiecoëfficiënten gelijk aan of sterker dan die in de steekproef.

Statistische software berekent naast de p-waarden voor de regressiecoëfficiënten, ook een

p-waarde voor het gehele model. Zoals elke p-waarde is ook deze berekend onder de aanname van een nulhypothese. De nulhypothese van de p-waarde voor het gehele model is dat R2 gelijk is aan 0

Wat is er bij een enkelvoudige regressieanalyse?

is R2 het kwadraat van r en is de p-waarde van het gehele model gelijk aan de p-waarde van de enige voorspeller in het model en dus gelijk aan de p-waarde van de correlatiecoëfficiënt.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wat is variantie (MS)?

is het gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde. Deze wordt berekend door de variatie (de som van de gekwadrateerde afwijkingen van het gemiddelde, SS) te delen door de bijbehorende vrijheidsgraden (Df).

Wat moeten we doen om de F-waarde uit te rekenen?

eerst uitrekenen welke proportie van de variatie (SS) wordt verklaard en welk deel niet. Dit kan met de proportie verklaarde variantie (R2 ).

Wat krijgen we door de totale variatie in de afhankelijke variabele (SStotal) te vermenigvuldigen met de proportie verklaarde variantie?

de verklaarde variatie (SSverklaard). Het verschil tussen de totale variatie en de verklaarde variatie is dan de onverklaarde variatie (SSonverklaard).

Het verschil tussen de totale variatie en de verklaarde variatie is dan de onverklaarde variatie (SSonverklaard). Wat kunnen we met deze variaties?

kunnen we vervolgens delen door de bijbehorende vrijheidsgraden om de verklaarde variantie (MSverklaard) en onverklaarde variantie (MSonverklaard) te verkrijgen. Het aantal vrijheidsgraden van het model is gelijk aan het aantal voorspellers (1 bij enkelvoudige regressie). Aangezien de vrijheidsgraden worden opgedeeld tussen de verklaarde en onverklaarde variatie, zijn de resterende vrijheidsgraden voor de errorvariatie (n−1−k, waarbij k staat voor het aantal voorspellers in het model)

Als de nulhypothese niet waar is en het model in de populatie wel iets van de variantie in de afhankelijke variabele verklaart (dus als R^2 > 0), dan is?

de MSverklaard groter dan de MSonverklaard. De F-waarde stijgt dan. Bij de F-toets is de redenering daarom dat als er een F-waarde wordt gevonden die zo hoog is dat hij onder de nulhypothese maar zelden voorkomt (in minder dan 5% van de gevallen bij de gebruikelijke α), dat de nulhypothese dan wordt verworpen. De R^2 is dan significant. Daarmee is het regressiemodel significant.

De F-verdeling is gewoon een steekproevenverdeling. Het enige verschil met andere verdelingen is dat

F, als verhouding tussen ‘het signaal’ (de verklaarde variantie, het model, of het effect) en ‘de ruis’ (de onverklaarde variantie, de error, of het residu), uitsluitend dient als tussenstap om de p-waarde te berekenen. Waar z, t, en r zelf ook betekenisvolle getallen waren, wordt F dus alleen gebruikt als noodzakelijke tussenstap om binnen een NHST-context de p-waarde uit te rekenen.

Wat geldt er voor multipele regressie?


Voor multipele regressie, dus met meerdere voorspellers, zijn ook meer deelnemers nodig. Hoeveel meer hangt af van de samenhang tussen de voorspellers. Als de voorspellers sterk samenhangen dan resulteert dat in een afname van de power.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo