Cohen's d en t-toetsen - Onafhankelijke steekproeven

17 belangrijke vragen over Cohen's d en t-toetsen - Onafhankelijke steekproeven

De twee meetwaarden van een dichotome variabele manifesteren zich als twee groepen (bijvoorbeeld man en vrouw). Het verband tussen een dichotome variabele en een intervalvariabele kan worden gezien als?

het verschil tussen twee gemiddelden. Maar als de gemiddelden van twee groepen aan elkaar gelijk zijn, is het niet mogelijk om op basis van de groep waarin iemand zit te voorspellen welke score die persoon zal hebben, of vice versa.

Wat kunnen we als het gemiddelde van de ene groep echter hoger is dan dat van de andere groep?

kunnen we iemands score op de afhankelijke variabele (de intervalvariabele in dit geval) beter voorspellen als we weten in welke groep iemand zit, dan wanneer we dat niet weten. De onderstaande afbeelding illustreert dit:

Het verschil tussen de twee groepsgemiddelden heeft weer een'?

standaardfout, want het komt immers uit een steekproevenverdeling. Dit is precies de standaardfout uit de regressieanalyse.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Net als voor andere steekproefwaarden geldt weer dat de puntschatting uit een gegeven steekproef op zichzelf niet informatief is.

Dit betekent dat deze t-verdeling gebruikt kan worden om het betrouwbaarheidsinterval voor het verschil tussen gemiddelden op te stellen. Dit betrouwbaarheidsinterval kunnen we berekenen volgens de standaardformule:

Net als bij correlaties en regressiecoëfficiënten bevat dit interval (berekend met kritieke t-waarde)?

de 95% minst extreme waarden van de steekproevenverdeling, aangenomen dat deze gecentreerd zou zijn rond de steekproefwaarde voor het verschil tussen de gemiddelden.

De gemiddelden en het gevonden betrouwbaarheidsinterval worden gemeten in de eenheden van de intervalvariabele. Dat heeft voordelen en nadelen.

Een voordeel is dat dit verschil wordt uitgedrukt in een concrete eenheid, waardoor het gemakkelijk te interpreteren is.

Een nadeel is dat het moeilijk is om te bepalen hoe groot dit verschil is.
Een tweede nadeel is dat de sterkte van dit verband nu niet te vergelijken is met verschillen uit andere studies. We willen dus een maat voor het verschil tussen de gemiddelden die onafhankelijk is van de schaal van de intervalvariabele. Die bestaat en heet Cohen’s d.

Cohen’s d

is een maat voor effectgrootte die wordt gebruikt om het verschil tussen twee gemiddelden uit te drukken op een manier die onafhankelijk is van de schaal waarop de afhankelijke variabele is gemeten. Cohen’s d wordt gedefinieerd als het verschil tussen de gemiddelden van twee groepen, gecorrigeerd voor (gedeeld door) de standaarddeviatie. Cohen’s d wordt ook standardized mean difference (SMD) genoemd.

Cohen’s d en aanduiding variabelen

In de formule voor Cohen’s d wordt een y gebruikt omdat het conventie is om de afhankelijke variabele met y aan te duiden en de onafhankelijke variabele met x. Als we naar het verschil tussen gemiddelden kijken is de variabele waarvan we het gemiddelde berekenen meestal de afhankelijke variabele en daarom y.

Net als andere waarden heeft Cohen’s d een bekende steekproevenverdeling en een bekende formule voor de standaardfout.

In onderstaande afbeelding worden voorbeelden van steekproevenverdelingen getoond van Cohen’s d voor steekproeven met 100 deelnemers in populaties waar twee gemiddelden verschillen met 0 (grijs), 0.2 (rood), 0.5 (oranje) en 0.8 (groen) standaarddeviaties:

Omdat elke waarde van Cohen’s d die in een steekproef gevonden kan worden afkomstig is uit een steekproevenverdeling, geldt net als bij andere steekproefwaarden dat de puntschatting weinig informatief is. Ook voor Cohen’s d is het daarom belangrijk een betrouwbaarheidsinterval te berekenen. In de praktijk wordt dit altijd berekend met statistische software.

Net als bij correlaties gelden vuistregels voor de sterkte van een verband: Tentatieve interpretatie Cohen's d

In de praktijk worden overigens zelden verbanden gevonden die sterker zijn dan 1.

De t-toets bestaat uit twee stappen.

Eerst wordt de waarde van t berekend; daarna wordt de bijbehorende p-waarde opgezocht met behulp van de t-verdeling. Net als de berekening voor Cohen’s d is de berekening voor t bijna hetzelfde als die voor de z-waarde. De formule voor t is:

Bij de t-waarde wordt het verschil tussen beide gemiddelden dus gedeeld door de standaardfout van dat verschil. Omdat standaardfout de naam is van een standaarddeviatie in een steekproevenverdeling, geldt hier dat een t-waarde een indicatie is van de afstand tussen twee gemiddelden, gemeten in standaardfouten.

Welch’s t-toets

Er bestaat een correctie voor de t-toets, waarbij rekening gehouden wordt met verschillende varianties tussen de twee groepen. Inmiddels is gebleken dat deze Welch’s t-toets altijd beter is dan de hier beschreven t-toets. Deze correctie kan met statistische software berekend worden.

NHST, t-waarden en p-waarden

De uitgangspunten voor dit voorbeeld zijn als volgt: een variabele met twee groepen (mannen en vrouwen), een steekproefomvang van 20 en daarom een aantal vrijheidsgraden van 18, een t-waarde van 1.41 en een standaardfout van de t-verdeling van 142.38.

Bij NHST nemen we aan dat in de populatie geen verband bestaat tussen twee variabelen. Dat betekent in dit geval dat we aannemen dat het verschil tussen twee gemiddelden in de populatie nul is. Het middelpunt van de steekproevenverdeling is dan ook 0

NHST, t-waarden en p-waarden

In de nulhypothese-steekproevenverdeling kan de t-waarde gemarkeerd worden (zie afbeelding)

Vervolgens gebruiken we de verdeling om na te gaan wat de kans is op een verschil in de variabele voor mannen en vrouwen dat minstens zo groot is als het verschil dat we hebben gevonden (onder aanname dat de nulhypothese klopt). In de afbeelding hierboven valt deze kans samen met de oppervlakte onder de curve aan de rechterkant van de t-waarde

NHST, t-waarden en p-waarden

Om de p-waarde te vinden moeten we echter ook de oppervlakte aan de andere kant hebben

De nulhypothese stelt immers dat er geen verschil bestaat en dat elk verschil dat wordt gevonden in de steekproef uitsluitend het gevolg is van steekproeftoeval of meetfout en beiden zijn gedefinieerd als normaal verdeeld. Als we de kans willen uitrekenen op een steekproefwaarde zo extreem als die die wij hebben gevonden, dan moeten we ook de negatieve waarden meenemen:

Cohen’s d en power

Het onderzoeken van het verband tussen een dichotome variabele en een intervalvariabele vereist veel meer deelnemers dan het onderzoeken van het verband tussen twee intervalvariabelen. Dit sluit aan bij wat we eerder vaststelden: hoe lager het meetniveau van de variabelen, hoe lager de power.

Cohen’s d en onderzoek

Degelijk onderzoek vereist vaak honderden deelnemers. Zelfs als wordt uitgegaan van een verschil tussen gemiddelden van 0.5 zijn met slechts 80% power al 128 deelnemers nodig. Als bovendien meer p-waarden worden berekend neemt het aantal benodigde deelnemers snel toe. In studies waarin meerdere p-waarden worden berekend met minder dan 100 deelnemers, zullen veel ‘significante’ uitkomsten daarom type 1-fouten representeren.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo