Correlatie - Het verband tussen twee interval variabelen

10 belangrijke vragen over Correlatie - Het verband tussen twee interval variabelen

Hoe kunnen wij zien of 2 variabelen samenhangen?

Dat kunnen we door naar de histogrammen kijken. Elke staaf representeert in zo’n histogram het aantal deelnemers met een bepaalde score.

Leg uit wat een scatterplot (een spreidingsdiagram) is.

Een scatterplot laat door middel van punten zien hoe 2 variabelen met elkaar samenhangen. De ene variabele staat op de x-as en de andere op de y-as. Daar waar ze elkaar raken zet je een punt en die punt representeert een onderzoekseenheid (bijv. een deelnemer). En deze is op 2 variabelen onderzocht.

Een wolk van punten is een scatterplot. Het zegt iets over de samenhang, maar niet over causaliteit.

Wat is het nadeel van op deze manier naar histogrammen kijken?

Op deze manier is het lastig om snel inzicht te krijgen in een eventueel verband. We moeten dan één voor één naar alle deelnemers kijken.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wanneer drukt een scatterplot een positief verband uit? En wanneer een negatief verband? En geen verband?

Het laat een positief verband zien als de stipjes rond een lijn van linksonder naar rechtsboven gaat.
Een negatief verband als de stipjes rond de lijn van linksboven naar rechtsonder gaat.
Het kan ook gemakkelijk zijn om een ellips rondom de meeste stipjes te tekenen, dan kun je het positieve of negatieve verband ook zien.
Geen verband is als de lijn horizontaal is of de ellips rond is.

Wat is de oplossing voor dit probleem?

We kunnen deze histogrammen combineren door het histogram van de ene te roteren en op de y-as te plaatsen. Die staven staan voor (groepen) deelnemers. We kunnen dus voor elke deelnemer een lijn trekken van hun score op elke as, en een stipje tekenen waar die lijnen elkaar kruisen. Dit kunnen we voor alle deelnemers doen.

Wat is een correlatiecoëfficiënt? oftewel een correlatie of Pearson's (aangeduid met een 'r')

Het is een maat voor samenhang/ hoe sterk hangen 2 continue variabelen (interval en ratio-variabelen) met elkaar samen. Het vat het scatterplot samen in een getal. Dit getal heb je nodig voor de steekproevenverdeling, omdat je altijd iets wilt zeggen over de populatie en daar heb je deze steekproevenverdeling voor nodig.

Het getal drukt uit hoe sterk de samenhang tussen 2 internetvariabelen is en ligt altijd tussen -1 en 1.

Het is een effectgrootte: deze maten geven aan hoe sterk er een verband is op schaalverdeling ongeacht welke operationalisatie je gebruikt. Zo kun je studie vergelijken.

Wat is het nadeel van een histogram t.o.v een scatterplot bij meerdere variabelen?

Het is moeilijk om een beeld van het verband te krijgen, omdat er individueel naar de afzonderlijke onderzoekseenheden gekeken moet worden.

Een onderzoeker vindt een correlatie tussen 2 variabelen, schoolprestaties en eigen-effectiviteit, van .1
Hoeveel variatie verklaart eigen-effectiviteit van schoolprestaties?  1% of 90%?

1 procent.
Want hoe hoger de correlatie hoe meer verband en hoe meer er dan ook verklaard kan worden.

Hoe kan je de mate van samenhang zien in een scatterplot?

Wanneer de punten dichter bij elkaar liggen (de ellips wordt ovaler), is de kans groter dat de samenhang groter is.

Hoe kan je zien of een scatterplot een negatief verband uitdrukt?

Als een scatterplot een negatief verband uitdrukt, liggen de stipjes grofweg in een wolk, of rond een lijn, die van linksboven naar rechtsonder gaat.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo