Relaties tussen twee interval variabelen - Correlatie - Type 1- en type 2-fouten

7 belangrijke vragen over Relaties tussen twee interval variabelen - Correlatie - Type 1- en type 2-fouten

Wat is er bij aan α van p% sprake van?

van een type 1-fout in p% van de gevallen waarbij een steekproef wordt genomen uit een populatie waarin het betreffende verband niet bestaat. De nulhypothese wordt dan immers verworpen als in een steekproef een verband wordt gevonden dat zo sterk is dat het in maximaal p% van de steekproeven voorkomt.

Anders gezegd: α is de tolerantie voor het maken van een type 1-fout. Uiteraard is het van belang de kans op een type 1-fout zo laag mogelijk te houden. Dat kan door een lagere α te kiezen.

Bij de gebruikelijke α van 0.05 wordt in 5% van de gevallen een type 1-fout gemaakt. Maar?

als we een lagere α kiezen om de kans op een type 1-fout te verlagen, lopen we het risico een type 2-fout te maken. Een gevonden steekproefcorrelatie heeft dan een p-waarde die kleiner is dan de oorspronkelijke α (waardoor een type 1-fout vermeden wordt), maar groter dan de lagere α. We maken dan een type 2-fout: we verwerpen de nulhypothese niet en concluderen onterecht dat er in de populatie geen verband bestaat.

Wat is een bijkomend effect van het vergroten van de steekproefomvang?

is dat de kans dat we een relatief lage correlatie in de steekproef vinden ook lager wordt.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Type 1- en type 2-fout en steekproefomvang

Een steekproefcorrelatie van 0.3 is niet verwaarloosbaar klein en kan zelfs een indicatie zijn van een correlatie in de populatie. Stel dat de populatiecorrelatie (die we niet werkelijk kennen) 0.4 is

Dan komt de steekproefcorrelatie van 0.3 niet uit de steekproevenverdeling die we hadden opgesteld, maar uit een andere steekproevenverdeling, die in grijs is toegevoegd: zie afbeelding.

De steekproefcorrelatie van 0.3 ligt nu een stuk dichter bij het midden van de verdeling. Maar bij de gekozen steekproefgrootte van 50 zou de p-waarde van de correlatie groter zijn dan een α van 0.01 en we zouden de nulhypothese verwerpen. Dat komt niet overeen met de werkelijkheid (de grijze verdeling van de populatie) en we maken een type 2-fout.

Als we de steekproefomvang echter vergroten naar 500 komt het er heel anders uit te zien (afbeelding links):

De kans op een type 1-fout blijft nu beperkt tot 1%, omdat de correlatie nu in het meest extreme deel van de verdeling valt. Ook de kans op een type 2-fout blijft beperkt. Bovendien is de kans op het vinden van een lagere correlatie dan 0.3 kleiner geworden, omdat de steekproevenverdeling waaruit de steekproefcorrelatie komt bij een grotere steekproefomvang ook een stuk smaller is. Dat is te zien aan het donkergrijze deel van de rechts afgebeelde plot.

Wat kunnen we door een aanname te doen van de werkelijke populatiecorrelatie?

kunnen we uitrekenen hoe groot de kans op een type 2-fout is. Daarvoor bepalen we eerst de kans dat we de nulhypothese verwerpen als de populatiecorrelatie in werkelijkheid de veronderstelde waarde heeft. Die kans komt overeen met het gedeelte van de steekproevenverdeling voor deze aanname dat buiten de kritieke grenzen van de steekproevenverdeling van de nulhypothese valt. Deze kans is het omgekeerde van de kans op een type 2-fout, die β wordt genoemd. De genoemde kans is dan ook 1 – β.

De power wordt groter naarmate de daadwerkelijke populatiecorrelatie groter is. Het omgekeerde geldt ook:

als de daadwerkelijke populatiecorrelatie dichter in de buurt van de nulhypothesecorrelatie ligt, wordt de power kleiner.

Uitgaande van een lage daadwerkelijke populatiecorrelatie (en de verbanden die we onderzoeken zijn meestal niet zo sterk) is het nodig om de steekproef aanzienlijk te vergroten om de kans op een type 2-fout te verlagen en tot een aanvaardbaar niveau te brengen.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo