Reliability of test scores and test items

8 belangrijke vragen over Reliability of test scores and test items

Wat houdt test-retest betrouwbaarheid in?

Test herhaaldafgenomen in de zelfdesteekproef met tijdsinterval d.
De correlatie tussen X1 en X2 = rxx = var(T) / var(X)

Want: (hoef je niet letterlijk te weten, alleen te snappen)
var(X1) = var(T) + var(E1) = var(X)
var(X2) = var(T) + var(E2) = var(X)

var(E1) = var(E2)

cov(E1,E2) = 0
cov(T1,T2) = var(T)
cov(X1,X2) = var(T)

cor(X1,X2) = cov(X1,X2) / √(var(X1)*var(X2))
cor(X1,X2) = var(T) / √(var(X)*var(X))

Test-hertest betrouwbaarheid is gebaseerd op de aanname T1 = T2. Wat zijn 4 mogelijke oorzaken waardoor deze aanname niet klopt?

  • Reactivity: antwoorden op t = 1 beïnvloeden antwoorden op t = 2. De interval tussen 2 tests moet dus niet te kort zijn.
  • Natuurlijke ontwikkeling: bv. bij persoonlijkheid of IQ door cognitieve ontwikkeling.
  • Invloedrijke gebeurtenissen: bv. dood van naaste kan leiden tot depressie.
  • Toename kennis: bv. rekenvaardigheid op 8j. vs. 12j.

Wat houdt alternate forms reliability in?

Test A en B zijnparallel tests zelfdegemiddeldeenvariantie. Constructie van tests via domain sampling theorie: Parallel tests zijn tests die bestaanuithetzelfdeaantal items P random getrokkenuit de populatie van items (zie H.5).
rxx berekenen door correlatie tussen parallelltests.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wat is een nadeel van de split halve methode en hoe kan dit opgelost worden?

Split halves: liever even / oneven items dan eerste helft / tweede helft.
  • Nadeel: rxx is dan gebaseerd op een test met 2x zo weinig items, en rxx hangt af van het aantal items (want var(e) = var(E)/P). Dus deze methode geeft altijd een onderschatting van rxx.
  • Dus: Spearman-Brown correctie: rcc' = k*rxx / (1+ (k-1)*rxx)
  • k = factor waarmee P vermenigvuldigd moet worden om nieuwe testlengte te krijgen (dus k = 2 in dit geval).
  • rcc' = 2 * rxx / (1 + rxx)

Wat is Cronbach's alfa betrouwbaarheid? & Leg de formule uit: Alfa = P*(rmean) / ( (1+rmean) * (P-1) ) & Wanneer wordt KR21 gebruikt?

Maat voor interne consistentie, net als split halve betrouwbaarheid. > Alfa is gemiddelde van alle mogelijke split halves.
Gebaseerd op gemiddelde interitem correlatie
Alfa = P*(rmean) / ( (1+rmean) * (P-1) )
  • r mean = gemiddelde interitem correlatie
  • P = aantal items
Cronbach’s alpha is geen maat voor unidimensionateit, dwz. alpha kan hoog zijn ook al liggen er twee of meer factoren ten grond slag aan de test.
> niet te verwarren met coefficient theta gebaseerd op eigenvalue labda (lijkt op cronbach's alfa).

Kuder-Richardson 21 (KR21): Cronbach's alfa voor dichotome items

Wat wordt bedoeld met de betrouwbaarheid van een composite? & Leg de formule uit: 1 – (k – (k*mean[rxx])) / (k + (k2 – k)*mean[r])

Gegeven de betrouwbaarheden van tests in een test batterij, wat is de betrouwbaarheid van de som van de tests? Bv. IQ subtests sommeren tot een general intelligence score (= 'composite').

1 - (k – (k*mean[rxx])) / (k + (k^2 – k)*mean[r])

  • mean[rxx]   = gemiddelde van de subtest betrouwbaarheden
  • mean[r]   = gemiddelde correlatie tussen de subtests
  • k   = aantal subtests

Leg de formule uit behorende bij de betrouwbaarheid van de verschilscores: rDD = [(rxx + ryy)/2 – rxy] / (1-rxy)

  • rDD: de betrouwbaarheid van de verschilscore (D = X1 - X2), gegeven dat de correlatie tussen T1 en T2 < 1 (oftewel: rxy < 1).
  • rxx: de betrouwbaarheid van de eerste test (x)
  • ryy: de betrouwbaarheid van de tweede test (y)
  • rxy: de correlatie tussen x en y

Dus hoe hoger de correlatie tussen x en y (rxy), hoe lager de betrouwbaarheid van het verschil (rDD).

Waarom wordt de volgende formule gebruikt om T te schatten?: var(T) = var(X)*rxx & Hoe kan hieruit de betrouwbaarheidsinterval van T worden berekend?

We kunnen theoretisch gezien T schatten door de test bv. 25x af te nemen en het gemiddelde van X te nemen. Maar is de praktijk is dat onhandig, dus wordt gebruik gemaakt van de betrouwbaarheid van test x (rxx).
Hieruit kunnen we T plotten met M = T & SD = √(var(E)) = sd(E) = SEM
  • var(E) = var(X)*(1-rxx)
  • sd(E) = sd(X) * Wortel(1-rxx)

De BI kan worden berekend m.b.v. de SEM.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo