Betrouwbaarheid - De klassieke testtheorie

17 belangrijke vragen over Betrouwbaarheid - De klassieke testtheorie

Uit wat bestaat de testscore van een persoon?

Een centrale vooronderstelling is dat de testscore van een persoon kan worden opgevat als bestaande uit een 'ware' component en een meetfout, die het gevolg is van toevalsinvloeden.

Van wie is de eerste uitwerking van de testtheorie en wie hebben het uiteindelijk uitgewerkt?

De eerste uitwerking werd gedaan door Gulliksen en de definitieve formulering door Lord en Novick.

Wat wordt beschreven als de oorsprong van de klassieke testtheorie?

- Begin vorige eeuw
- Eerste uitwerking door Gullikson in 1950
- Definitieve formulering door Novick in 1966
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Beschrijf de veranderingen aan de klassieke testtheorie van Spearman sinds 1904,1910 en enkele belangrijke onderscheidingen

Veranderingen:
  • De eerste uitwerking door Gulliksen (1950)
  • Definitieve formule door Novick (1966) en Lord en Novick (1968)


Onderscheidingen:
  • Betrouwbare score en meetfout

Waar komt de klassieke testtheorie uit voort?

  1. Basis gelegd door Spearman 1904, 1910
  2. Definitief gemaakt door Novick 1966

Wat geeft de ware score T aan?

De gemiddelde tesprestatie over een groot aantal onafhankelijke replicaties.

Waar gaat men bij praktisch testgebruik vanuit?

Dat de standaardmeetfout identiek is voor alle personen (niet per sé realistisch).

3. Wat zegt de betrouwbare score  (T)?

= gemidd testprestatie over groot aantal onafh replica's die indicatie geeft over hoe iemand gemiddeld presteert of aan gedrag laat zien.
= De ware (betrouwbare) score is de vaste, systematische component van de geobserveerde score. De betrouwbare score representeert de eigenschap van de persoon die men met de test wil meten.

4. Welke 2 eigenschappen zijn af te leiden van de verdeling van meetfouten voor persoon (i) over de onafh replica's (q) van een specifieke test?

  • Gemidd meetfout = 0  (6.4)
  • SD (of S) =  een standaarddeviatie die bekend staat als standaardmeetfout van persoon i en is identiek voor alle personen. (6.5)

5. Waarom is  de veronderstelling SD is identiek voor alle personen, niet altijd realistisch?

Kennistest in vorm v meerkeuze:
Iemand weet niet veel? > veel gissen bij kennistest.
Iemand weet veel? > kennis neemt toe en kan op toevallig fout hebben neemt af. Deze hebben hogere T-waarde  > persoonsgebonden standaardfout neemt af.

6. Waarom in standaardmeetfout voor psychologische metingen aanzienlijk?

Door onderliggende psychologische processen op bijv reactietijden > tijden zijn betrouwbaar, maar de factoren van persoon en omgeving zorgen voor wisselingen.

7. Wat zijn de 2 veronderstellingen over meetfouten in populatie?

  1. Gemidd meetfout in een populatie van n personen = 0 --> meetfouten vallen tegen elkaar weg.
  2. In populatie v personen correleren meetfouten op test met geen enkele variabele, tenzij ze er deel van uitmaken.  ZIE formules 6.8 en 6.9 (blz 200).r
r(E,Y) = 0 : Y is bijv score op een andere test die ook door proefpersonen is gedaan.
De meetfout (E) van X (bestaande uit allerlei toevallige omstandigheden) mag niet correleren met Y. Zou dit wel het geval zijn, dan zijn de omstandigheden niet meer toevallig.

8. Als het gaat over acceptabele waarde van de betrouwbaarheid: welke 2 praktische situatie moeten dan onderscheiden worden?

1. Test voor wetensch onderzoek: gaat over uitspraken over groepen (bijv jongens en meisjes vergelijken in rekenvaardigheid).
>> indiv testprestatie staat NIET centraal, men schat groepsgemidd en correlaties.
>> nauwkeurigheid bepaald door aantal waarnemingen in steekproef en minder door betrouwbaarheid
>> rxx' > 0.7.

2 Test voor indiv diagnostiek:
>> betrouwbaarheid hoog
>> rxx' > 0.9 = acceptabel, maar er is geen 'harde' ondergrens.

9. Waarom is er bij betrouwbaarheid indiv tests geen 'harde' ondergrens?

het gaat over of indiv testscores significant van elkaar verschillen en 'harde' ondergrens voor betrouwbaarheid biedt daarvoor geen garantie.

10. Testscores op te delen in niet-systematisch en systematisch. Maar ook in bedoeld en onbedoeld. Wat houdt dit in?

Bedoeld deel is dat wat je wilt meten (test voor rigiditeit - dit kenmerk is de bedoelde scorecomponent).
Onbedoeld deel bevat ook de meetfout, maar ook andere variabelen (in test voor rigiditeit bijv ook agressiviteit, woordbegrip).

Dus ook in bedoelde scorecomponent kan een onbedoeld scorecomponent zitten  >> test met hoge betrouwbheid zegt niet per se iets over dat wat je wilt meten.

12. Geef een omschrijving van het begrip 'standaardmeetfout'.

= standaarddeviatie van de meetfouten die zouden optreden als de test een groot aantal malen zou worden afgenomen bij dezelfde persoon.
Standaardmeetfout is van belang als geobserveerde score (X) wordt opgevat als de beste schatter van de ware (betrouwbare) score.

= gemiddelde onnauwkeurigheid ve indiv score.  

= is niet direct meetbaar: hij is de standaardafwijking die we krijgen in een gedachteproef, waarbij persoon j de test ontelbaar vaak uitvoert en na iedere test zijn geheugen is kwijtgeraakt. Het is dus een maat voor de spreiding binnen een persoon.

13. Geef een omschrijving van het begrip 'standaardschattingsfout'.

= standaarddeviatie van de fouten die het gevolg zijn van afwijking van de geschatte ware score ten opzichte van de ware score.
Standaardschattingsfout is van belang als beste schatter van de ware score wordt verkregen met de regressieformule (6.46) blz 231.

= standaardafwijking van de werkelijke waarden van de testscores in de populatie van p personen gegeven de testscore X = x

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo