De p-waarde van Pearson's r - Lineaire regressie analyse

15 belangrijke vragen over De p-waarde van Pearson's r - Lineaire regressie analyse

Hoe luidt de formule van de regressievergelijking?

Y = bX + a

Waarbij

Y = de beste voorspelling van de afhankelijke variabele (ook wel criterium genoemd)
bX = de stijging (ook wel b1 genoemd)
a = het vertrekpunt (de hoogte op de y-as) van de lijn (ook wel b0 of intercept genoemd)

Hoe verhoudt regressie zich tot correlatie?

Correlatie is de samenhang tussen de variabelen en regressie analyseert hoe de ene variabele de andere variabele voorspelt.

Als je een enkelvoudige regressieanalyse hebt, dan heb je maar 1 voorspeller en dus R = r.

Regressielijnen komen voort uit regressieanalyse en we kunnen berekenen hoe die lijn moet lopen in scatterplot. Over welke 2 vragen gaat het bij deze analyse?

1. hoe vinden we de beste lijn in een scatterplot?
2. hoe goed past die lijn bij de data?

Aan de hand van de lijn kunnen we voorspellingen doen. Als we de score op de voorspeller-variabele weten, dan kunnen we de uitkomst van de afhankelijke variabele voorspellen
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wat betekent proportie verklaarde variantie (R2) ?

Dat betekent het deel van de variantie van de afhankelijke variabelen dat verklaart kan worden door het regressiemodel (= formule in regressieanalyse). Dit getal ligt altijd tussen 0 en 1.

Het zegt iets over hoe goed de voorspelling (regressiecoëfficiënt) is.

R2 van .5 betekent de de afhankelijke variabelen voor 50% goed kunnen worden voorspeld uit de onafhankelijke variabele.

Door een verticale lijn te trekken op een datapunt, kruis de je regressielijn. Wat is de volgende stap? En de stap daarna?

Een horizontale lijn trekken, omdat we dan kunnen zien wat de beste voorspeller is.
Dan leg je het scatterplot erover heen en kijk je of het punt wat hij hebt berekend overeenkomt met echte score van de deelnemer. Dan blijkt dat er eigenlijk altijd wel een afwijking bij de punten is.

Wat betekent het dat regressiecoëfficiënten asymmetrisch zijn?

Alle ruis wordt aan de variabele op de y-as wordt toegeschreven (over het algemeen de afhankelijke variabele), wat betekent dat we andere regressiecoëfficiënten zouden krijgen als we de regressieanalyse om zouden draaien.

Hoe minimaliseer je de afwijkingen?

Door de regressieanalyse. Het is een methode om de lijn te vinden zodat je minimale afwijkingen hebt.

Wat is het geval als beide regressiecoëfficiënten gestandaardiseerd zijn?

Dan is het intercept 0 en zijn de gemiddelden van beide variabelen 0. Als de voorspeller 0 is, is de beste voorspelling van y ook 0. Als er niets bekend is, is de beste voorspelling het gemiddelde.

Wat is de regressiecoëfficiënt voor de helling?

De tweede regressiecoëfficiënt oftewel β1 is de helling van de lijn. Dit is de stijging (of daling) in de variabele op de y-as als de variabele op de x-as.

Waar staat de x1 (zie formule blz. 116) voor?

Deze staat voor de onafhankelijke variabele (= de voorspeller) en heet ook wel de covariaat in regressiecontext - hij varieert mee  met criterium.
Deze is genummerd, omdat in regressieanalyse meerdere covariaten kunnen worden geanalyseerd.

De vermenigvuldiging van de correlatie met de uitkomst van de sd's kan je zien als een vertaling van de correlatie (tussen -1 en 1) naar de schalen van de variabelen.

zie foto

Waar staat R voor en is R=r?

R staat voor multipele correlatie, omdat het de correlatie is van alle voorspellers in het regressiemodel met de afhankelijke variabele.
R=r -> r staat voor enkelvoudige regressie en er is maar 1 voorspeller. Dus de multipele correlatie is gelijk aan gewone correlatie.

Wat betekent R square .9 en wat 0.06?

.9 betekent dat de samenhang van de variabelen door 90% van de variantie in de data wordt verklaard.
0.06 betekent dat er nauwelijks samenhang is die de relatie tussen de 2 variabelen verklaard. De samenhang geldt voor  6% van de variantie.

Je hebt onderzoek gedaan naar het aantal verkochte albums en hoe zich dit verhoudt t.o.v. het de advertenties.
Als je waarde van b1 (de helling van lijn) 0.096 is. Wat zegt dit dan?

Het geeft de verandering aan in de uitkomsten als je de voorspeller (onafhankelijke variabele) naar 1 zet (zo krijg je de lijn van de helling). In dit voorbeeld zegt het: 0.096 extra albums zullen wordt verkocht.
Als je dan dit doet op de meetschaal (in dit geval 1000, dan doe je 0.096 x 1000).

Onderzoek gedaan waarbij de verwachting is dat de angst voor statistiek afneemt als de kennis voor statistiek toeneemt. Bij de data komt eruit dat de R  sq is .018. Wat zegt dit?

Dit zegt dat nog geen 2% van de angst wordt verklaard door kennis.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo