Psychometrie, meetpretentie en eigenschappen instrumenten - Kennis psychometrische eigenschappen en diagnostische instrumenten - Betrouwbaarheid

6 belangrijke vragen over Psychometrie, meetpretentie en eigenschappen instrumenten - Kennis psychometrische eigenschappen en diagnostische instrumenten - Betrouwbaarheid

Er zijn drie soorten betrouwbaarheid, test-hertest, interbeoordelaars en interconsistentie. Licht toe wat test-hertest betrouwbaarheid inhoudt en beschrijf van welke drie dingen het afhankelijk is

Test-hertest betrouwbaarheid = relatie tussen de scores van een groep respondenten op een test bij herhaalde afname. Je berekent bijvoorbeeld de Pearson’s r als correlatie tussen beide scores. Dus: dezelfde steekproef op test 1 en op test 2 (bijvoorbeeld 3 maanden later).

Dit is afhankelijk van:
- Stabiliteit trait (bijvoorbeeld angst of hyperactiviteit);
-  Leer- en oefeneffecten (bijvoorbeeld bij executieve functies);
- Interval tussen testafnamen.

We kunnen hierbij ook kijken naar de paralleltest betrouwbaarheid. Wat houdt dit in? Wanneer wordt het gebruikt?

Paralleltest betrouwbaarheid = relatie tussen de scores van een groep respondenten op twee parallelle versies. Dus je neemt bij dezelfde persoon verschillende tests af.
- Dit wordt met name gebruikt als er sprake kan zijn van een leereffect.

Wat houdt interbeoordelaarsbetrouwbaarheid in? Is het hoog of laag en waarom? Wanneer is het belangrijk?

Interbeoordelaarsbetrouwbaarheid = relatie tussen de scores van meerdere beoordelaars.
- Deze vorm van betrouwbaarheid is vaak het laagst, omdat het kan wijzen op verschillen in waarneming van de informant, het zegt echter niet direct dat de test niet betrouwbaar is.
- Vooral belangrijk bij subjectieve methoden, zoals een diagnostisch interview.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Normen voor betrouwbaarheidscoëfficiënten hangen af van het doel waar de vragenlijst voor wordt gebruikt. Licht de richtlijn van COTAN toe voor belangrijke beslissingen op individueel niveau, minder belangrijke beslissingen op individueel niveau en minder belangrijke beslissingen op groepsniveau.

Richtlijn volgens de COTAN: dit geldt voor iedere normgroep en score uit de test.
- Belangrijke beslissingen op individueel niveau = r > .80
- Minder belangrijke beslissingen op individueel niveau = r > .70
- Minder belangrijke beslissingen op groepsniveau = r > .60

Wat zijn twee punten van kritiek op de klassieke maten van COTAN?

Kritiek op klassieke maten COTAN:
- Wanneer gepubliceerd wordt dat een test onbetrouwbaar is, zijn mensen geneigd de test daarom niet gebruiken. Terwijl de test wel bruikbaar kan zijn voor bepaalde doeleinden.
- De meetfout wordt daarnaast als gelijk gesteld voor de hele populatie, terwijl dit in werkelijkheid niet telt (extreme scores hebben over het algemeen een grotere meetfout).

Hoe onbetrouwbaarder de test, hoe groter de meetfout. Hoe verder je van het gemiddelde af zit, hoe groter de afwijking (in het uiterste/extreme van de verdeling). Je kunt hiermee omgaan met betrouwbaarheidsinterval = definieert het bereik waarbinnen ware score met bepaalde zekerheid valt. Licht de BI intervallen toe (x3)

- 68% BI = geobserveerde score ± 1 * SEM
- 95% BI = geobserveerde score ± 1.96 * SEM
- 99% BI = geobserveerde score ± 3 * SEM

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo