Betrouwbaarheid - Speciale Onderwerpen - Betrouwbaarheid en Testlengte

18 belangrijke vragen over Betrouwbaarheid - Speciale Onderwerpen - Betrouwbaarheid en Testlengte

Hoe wordt het verband tussen betrouwbaarheid en testlengte uitgedrukt?

Dit verband wordt uitgedrukt in de Spearman-Brown-formule: deze formule is gebaseerd op de veronderstelling van parallele metingen.

Wat zijn redenen waarom een test niet eindeloos verlengd kan worden? (3)

1. Niet altijd mogelijk om zoveel items te maken
2. Afname kost meer tijd
3. Validiteit profiteert maar marginaal

Welke 3 algemene conclusies kunnen worden getrokken over testverlenging op basis van de Spearman-Brown formule?

1. De betrouwbaarheidswinst wordt minder, naar mate er er meer items aan de test worden toegevoegd boven een bepaalde waarde. De grootste winst zit in het begin.

2. Het verlengen van een test met geringe betrouwbaarheid (rxx') om zo voldoende betrouwbaarheid te verkrijgen heeft weinig zin. De toename factor is veelal zo hoog dat het zijn doel mist.

3. Een testscore profiteert over het algemeen slechts marginaal bij een testverlening.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Welke praktische problemen kom je tegen als je een test met een lage betrouwbaarheid door testverlenging probeert op te krikken?

  • Nieuwe items verzinnen zonder in herhaling te vallen is lastig
  • Testlengte wordt lang (vermoeidheid, motivatie)
  • Validiteit profiteert niet zoveel van testverlenging

Welk beeld zie je als je de betrouwbaarheid van een vragenlijst afzet tegen de verlengingsfactor K (1,2,3, ....10)?

Dat de meeste winst op de betrouwbaarheid in het begint wordt behaald, maar daarna afvlakt.

Levert een testverlenging een hogere validiteit op?

De validiteit van een testscore profiteert maar marginaal van een testverlenging.

Figuur 6.5 )blz 236) laat zien dat rkk een monotoom toenemende functie is van verlengingsfactor k. Wat zijn de 3 conclusies die je daaraan kan verbinden

  • Winst op betrouwbaarheid wordt kleiner als meer items aan test wordt gevoegd.
  • Heeft weinig zin om test met geringe betrouwbheid te verlengen tot een test met voldoende betrouwbheid > is toevoegen van zoveel items haalbaar en test wordt erg lang.
  • Validiteit v testscore wordt niet veel beter van test verlenging.

Welke 2 voorwaarden kunnen worden gesteld voor een succesvolle testverlenging?

1. Een redelijke aanvangsbetrouwbaarheid (ongeveer 0,60 - 0,80).
2. Een niet te groot aantal items bij aanvang (hooguit 10 - 20).

Uitzondering hierop zijn eenvoudige analogieën en rekenopgaven, die makkelijk uit te breiden zijn en snel te maken.   

Heeft het zin om een test met een geringe betruwbaarheid te verlengen om tot een voldoende betrouwbare test te komen?

In de praktijk vaak niet omdat je de vragenlijst al gauw veel grote moet maken, wat weer een andere complicaties geeft (te lang om goed in te vullen, lastig om veel goede nieuwe items te construeren, de validiteit van een testscore profiteert maar marginaal van een testverlenging).

Wanneer heeft een testverlenging zin om de validiteit te verhogen?

- als de aanvangsbetrouwbaarheid (rxx') niet al te laag is (bijv. 0.60 tot 0.80)
- en het aantal items in de test niet al te groot is

Wanneer heeft testverlenging zin?

- Als aanvangsbetrouwbheid niet te laag is (o.60-0.80).
- Als items in test niet al te groot zijn > rekenopgaven is gemakkelijker dan vragen over persoonlijkheid.

Wat zijn mogelijke conclusies over testverlenging volgens de tekst?

Betrouwbaarheidswinst neemt af bij toevoegen items, weinig zin bij lage betrouwbaarheid.

Wat zijn 2 gevolgen van deze formule?

  1. De betrouwbaarheidswinst wordt kleiner naarmate meer items aan de test worden toegevoegd
  2. Het is weinig zinvol om een test met geringe betrouwbaarheid te verlengen om een voldoende betrouwbaarheid te bereiken

Welke algemene uitspraak kan worden gedaan over parallellie ten opzichte van de praktijk?

Parallellie is een ideaal waarin empirisch niet voldaan kan worden, waardoor in de praktijk meer items nodig zijn dan de factor K aangeeft.

Op welke wijze wordt de standaarddeviatie van de schattingsfout van T bepaald bij deze methode?

T - ^T
De ware score zoals berekend in bovenstaande formule en de geschatte ware score. Door die van elkaar af te halen blijft de schattingsfout over

Wat is een belangrijke voorwaarde voor de formules met betrekking tot testverlenging?

Parallellie, maar dit is een ideaal dat empirisch niet kan worden gehaald.

Op welke wijze kunnen we de S(T) schatten? Leg de formule uit

betrouwbaarheid 0.67; standaarddeviatie ruwe score is 1,14
S(T) = wortel van 0.67 x 1,14
S(T) = 0,82 x 1,14
S(T) = 0,93


ook hier kan betrouwbaarheid middels Cronbachs alfa worden geschat en kan de S(X) kan berekend worden vanuit de testgegevens. Uiteindelijk kan standaarddeviatie van de ware score in de formule van de standaarddeviatie van de schattingsfout worden gebruikt

Waarom is een testscore toch ook praktisch te gebruiken (ook al lijkt dat nu niet)?

  1. Tests zijn goede meetinstrumenten voor individuele verschillen als hun standaardmeetfout of standaardschattingsfout gering is tov de lengte van de schaal.
  2. voor gebruik in wetenschappelijk onderzoek om groepen met elkaar te vergelijken is nauwkeurigheid minder van belang. Het is dan belangrijker om grotere steekproeven te hebben. Als het gaat om individueel testgebruik worden er hogere eisen gesteld.
  3. het vaak geringe aantal items kan in een test gecompenseerd worden door diverse testprestaties en zo mogelijk ook andere gegevens over de persoon te betrekken

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo