Nieuwe ontwikkelingen in testtheorie en testconstructie - Opdrachten

30 belangrijke vragen over Nieuwe ontwikkelingen in testtheorie en testconstructie - Opdrachten

Noem vier voordelen van de itemresponstheorie in vergelijking met de klassieke testtheorie.

Voordelen van de itemresponstheorie zijn:
– adaptief testen
– controlemogelijkheid of het IR-model past bij de testgegevens
– het meetniveau is afleidbaar uit de theorie
– mogelijkheid tot populatieonafhankelijk meten.

Wat is een populatie-onafhankelijke meting?

Laat de klassieke testtheorie dit type meting toe?

Waarom (niet)?

  • een meting is populatieonafhankelijk indien de meetwaarde van een persoon niet afhangt van de moeilijkheidsgraad van een test
  • de klassieke testtheorie laat populatieonafhankelijk meten niet toe
  • dat komt omdat in dit model het niveau van de proefpersoon niet gescheiden kan worden van het moeilijkheidsniveau van de test (p. 255)

Wat is populatieonafhankelijk meten?

Populatieonafhankelijk meten betekent dat iemands meetniveau vastgesteld kan worden onafhankelijk van de moeilijkheid van de items. Dus als items en personen voldoen aan een IR-model, verkrijgen we voor een willekeurige deelpopulatie dezelfde meetwaarden, ongeacht welke deelpopulatie items aan de personen voorgelegd wordt.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Beschrijf hoe de item-responsfunctie in figuur 7.1 verandert als respectievelijk de moeilijkheid δ toeneemt, het discriminerend vermogen α afneemt, en het pseudokansniveau γ toeneemt.

als de moeilijkheidsgraad δ van een item toeneemt, schuift de functie 'naar rechts'als het discriminerend vermogen α toeneemt wordt de helling van de functie rondom δ 'steiler'een toename van het pseudokansniveau γ leidt tot 'ophoging van de ondergrens' van de functie (links onderaan)

Waarom wordt gesproken van pseudokansniveauparameter en niet van gisparameter?

een echte gisparameter hangt louter en alleen af van de kans op het (toevallig) goed beantwoorden van een item zonder de vraag- en antwoordcategorieën te kennendenk aan een test met vierkeuze-items, giskans = 0.25omdat personen niet volkomen blind items beantwoorden, maar ook door de inhoud van het item en de antwoordcategorieën worden beïnvloed, kan het pseudokansniveau hoger of lager uitvallen dan de pure giskans (p. 261)het is daarom een empirische vraag welk pseudokansniveau γ bij een specifiek item hoort, en niet zozeer een kans die op voorhand theoretisch vast te leggen is

Welke drie itemkenmerken bepalen de vorm van de IRF?

De vorm van de IRF wordt bepaald door de drie itemparameters.

Bespreek de rol van de itemparameters δ,  α en γ in het Raschmodel.

in het Rasch-model heeft elk item een eigen moeilijkheidsgraad δde itemfunctie van een 'moeilijk' item g ligt op een Rasch-schaal rechts van de itemfunctie van een 'makkelijk' item h (δg > δh)de itemfuncties in het Rasch-model hebben echter allemaal dezelfde vorm:1) het discriminerend vermogen α (= de vaste steilheid van de functies) wordt berekend uit de data;2) het pseudokansniveau van elk item is vastgelegd op nul (γ = 0)

Van welk type testgegevens zou het Rasch-model een goede beschrijving kunnen geven?

  • het Rasch-model kan zinvol worden gebruikt bij het meten van een psychologische eigenschap die uiteen te leggen is in verschillende deelaspecten (items) die qua 'moeilijkheid' geordend kunnen worden op een enkele dimensie
  • te denken valt aan intelligentie-, vaardigheids- en persoonlijkheidstests

Aan welke twee voorwaarden moet het Rasch-model voldoen?

Voor de items die aan het Rasch-model voldoen, geldt:
– het pseudokansniveau is gelijk aan 0: γg = 0;
– de discriminatiewaarden zijn gelijk: αg = αh.

Welke transformaties zijn in het algemeen toegestaan?

In het algemeen zijn díe transformaties toegestaan die de succeskans niet veranderen.

Laat zien dat invullen in formule (7.1) van θ* voor θ en δ*g voor δg (formule 7.2) geen invloed heeft op de succeskans van het Rasch-model.

Het volgende eenvoudige bewijs toont aan dat het stukje θ – δg in formule 7.1 (p. 264) hetzelfde blijft:
θ* - δ*g = (θ + a) – (δg + a) = θ + a – δg – a = θ – δg

Laat zien dat lineaire transformaties van het type θ* = bθ + a en δ* = bδ + a, waarin b en a constante getallen zijn, de succeskans op het item veranderen, en dus in het Rasch-model niet zijn toegestaan.

Het volgende bewijs toont aan dat het stukje θ – δg in formule 7.1 (p. 264) verandert:
θ* - δ*g = (bθ + a) – (bδg + a) = bθ + a – bδg – a = bθ – bδg = b(θ – δg)

Het functievoorschrift verandert daarmee in:
P(Xg = 1Iθ) = exp [b(θ – δg)]{1 + exp [b(θ – δg)]}

We zien dat de bovenstaande functie op een essentieel punt verschilt van formule 7.1:
de descriminatieparameter is nu vastgelegd voor elke itemfunctie op de waarde 'b'Omdat een lineaire transformatie de steilheid van de logistische functie beïnvloedt, en daarmee de succeskansen, is een dergelijke transformatie niet toegestaan.

Welke transformatie is op de ξ-schaal in het Rasch-model toegestaan?

In het Rasch-model zijn op de ξ-schaal de volgende transformaties toegestaan: ξ* = aξ en ε* = aε.

Wat is het belangrijkste verschil tussen het Rasch-model enerzijds en de twee Birnbaum-modellen anderzijds?

In het Rasch-model hebben de items gelijke discriminatiewaarden; in de Birnbaum-modellen mogen de discriminatiewaarden ongelijk zijn.

Wat is het belangrijkste verschil tussen het Rasch-model en de twee Birnbaum-modellen enerzijds en de twee Mokken-modellen anderzijds?

In het Mokken-model van de dubbele monotonie kunnen de IRF’s elkaar niet snijden; in het model van de monotone homogeniteit kunnen de IRF’s elkaar wél snijden.

Geef de definitie van het begrip ‘odds’.

Odds: de verhouding van de kans op een positief antwoord en de kans op een negatief antwoord op hetzelfde item voor een vaste meetwaarde ξ: P(Xg = 1|ξ)/P(Xg = 0|ξ).

Beschrijf het verschil tussen de klassieke testtheorie en de itemresponstheorie in nauwkeurigheid van een meting.

In de klassieke testtheorie wordt de nauwkeurigheid van de meting uitgedrukt in de standaardmeetfout, die voor de gehele test geldt. In de item-responstheorie is een test niet op de hele θ-schaal even nauwkeurig: de test is voor sommige θ-waarden informatiever dan voor andere.

1. Een voordeel van de itemresponstheorie boven de klassieke testtheorie is dat in de itemresponstheorie

Uw antwoord
  • iemands meetwaarde onafhankelijk is van de moeilijkheid van de test.
  • de onderzoeker niet hoeft te toetsen of het model past bij de gegevens.
  • de onderzoeker als meetniveau een intervalschaal mag veronderstellen.
  • de validiteit van een test altijd groter is dan in de klassieke testtheorie. 


Juist
Terugkoppeling op het gegeven antwoord:


Een voordeel van de itemresponstheorie boven de klassieke testtheorie is dat in de itemresponstheorie iemands meetwaarde onafhankelijk is van de moeilijkheid van de test.

2. Wanneer men factoranalyse toepast op een verzameling items die aan één bepaald IR-model voldoen, zal men in het algemeen vinden:

Uw antwoord
  • één factor; de items meten gezamenlijk één psychologische eigenschap.
  • verscheidene factoren die tezamen veel variantie verklaren.
  • soms verscheidene factoren, soms één factor, dat hangt van de inhoud van de items af.
  • dat de items onderling hoog correleren en dus zijn er verscheidene groepsfactoren


één factor; de items meten gezamenlijk één psychologische eigenschap.

3. De succeskans van persoon i is 0,70. In de itemresponstheorie betekent dit dat deze persoon

Uw antwoord
  • 70 procent kans heeft om boven een bepaalde testscore te komen..
  • 70 procent van de items goed zal hebben.
  • op elk item 70 procent kans heeft om dat item goed te hebben.
  • 70 procent kans heeft om een bepaald item g goed te hebben.

70 procent kans heeft om een bepaald item g goed te hebben.

4. In het Rasch-model is van de items g en h gegeven dat δg> δh. Hieruit kan men concluderen dat


Uw antwoord
  • item g gemakkelijker is dan item h.
  • item g moeilijker is dan item h.
  • de IRF van item g links loopt van die van item h.
  • item g beter discrimineert dan item h.

item g moeilijker is dan item h.Juist

5. Het verschil tussen het Rasch-model en de twee Birnbaum-modellen is dat

Uw antwoord
  • het Rasch-model minder streng is dan de Birnbaum-modellen.
  • in het Rasch-model de items dezelfde discriminatiewaarde hebben en in het Birnbaum-model niet.
  • uit het Rasch-model een ordinaal meetniveau volgt en uit de Birnbaum-modellen een intervalmeetniveau.
  • in het Rasch-model alle items dezelfde moeilijkheidsparameter hebben en in de Birnbaum-modellen niet.

in het Rasch-model de items dezelfde discriminatiewaarde hebben en in het Birnbaum-model niet.Juist

6. Beoordeel de juistheid van de volgende twee stellingen.

Een grote verzameling rekenitems voor tienjarigen voldoet aan het Rasch-model. Populatieonafhankelijk meten betekent:
I Elke steekproef uit deze grote verzameling items die aan tienjarige kinderen wordt voorgelegd, levert dezelfde θ-waarden op.
II Als de items aan een groep elfjarige kinderen wordt voorgelegd, voldoen de items ook dan aan het Rasch-model.


Uw antwoord
  • I en II zijn onjuist.
  • I en II zijn juist.
  • Alleen II is juist.
  • Alleen I is juist.

Alleen I is juist.

7. De nauwkeurigheid van een test waarvan de items voldoen aan een IR-model, is

Uw antwoord
  • onafhankelijk van de nauwkeurigheid van elk afzonderlijk item.
  • niet op alle plaatsen van de θ-schaal even groot.
  • onafhankelijk van het aantal items in de test.
  • hetzelfde, ongeacht de deelverzameling van items uit de itembank die men in de test opneemt. 

niet op alle plaatsen van de θ-schaal even groot.Juist

8. Voor de modellen van Mokken is kenmerkend dat
Uw antwoord

  • de items niet alleen gelijke discriminatiewaarden, maar ook gelijke moeilijkheidsparameters moeten hebben.
  • de meting op intervalniveau plaatsvindt.
  • elke IRF voldoet zo lang deze maar monotoon niet-dalend is.
  • wanneer de waarde van de persoonsparameter gelijk is aan de moeilijkheidsparameter, de succeskans dan 0,50 is. 

elke IRF voldoet zo lang deze maar monotoon niet-dalend is.Juist

9. Van de items in een itembank die voldoen aan het tweeparametermodel,
Uw antwoord
  • zijn de schattingen van sommige α- en δ-parameters nog onbekend
  • is vastgesteld dat zij een beroep doen op één en dezelfde psychologische eigenschap.
  • is alleen voor sommige θ-waarden bekend hoe informatief zij zijn.
  • is niet vastgesteld voor welke populatie personen zij bedoeld zijn.

is vastgesteld dat zij een beroep doen op één en dezelfde psychologische eigenschap

11. Wanneer men een doelinformatiefunctie van een test opstelt, dan is voor een bepaald punt op de θ-schaal de functiewaarde
Uw antwoord
  • gelijk aan de maximumwaarde van de testinformatiefunctie; de waarde van de testinformatiefunctie mag ook hoger zijn.
  • hoger of lager dan de waarde van de testinformatiefunctie; hoevéél hoger of lager hangt af van hoe nauwkeurig de test op dat punt moet meten.
  • gelijk aan de minimumwaarde van de testinformatiefunctie die nog acceptabel is; de waarde van de testinformatiefunctie mag niet lager zijn.
  • precies gelijk aan de waarde van de testinformatiefunctie; een hogere of lagere waarde is niet toegestaan.

gelijk aan de minimumwaarde van de testinformatiefunctie die nog acceptabel is; de waarde van de testinformatiefunctie mag niet lager zijn. (Juist)

12. Wanneer een persoon een ‘afwijkend scorepatroon’ heeft, worden
Uw antwoord

  • weinig items goed en veel items foutief beantwoord.
  • veel items goed en weinig items foutief beantwoord.
  • items met grote succeskansen goed beantwoord en items met lage succeskansen foutief.
  • items met grote succeskansen foutief beantwoord en items met lage succeskansen goed. 

items met grote succeskansen foutief beantwoord en items met lage succeskansen goed.

13. Beoordeel de juistheid van de volgende twee stellingen.

I In de itemresponstheorie is de meting op elke plaats van de θ-schaal even betrouwbaar.
II In de klassieke testtheorie zijn de metingen populatieafhankelijk.

Uw antwoord

  • I en II zijn juist.
  • Alleen II is juist.
  • I en II zijn onjuist.
  • Alleen I is juist.   

Alleen II is juist.

14. Adaptief testen in de itemresponstheorie betekent dat men
Uw antwoord
  • via het afnemen van een veelheid aan tests de sterke en zwakke punten van een persoon opspoort.
  • op grond van de antwoorden op items die voor elke persoon verschillend kunnen zijn, een zo nauwkeurig mogelijke schatting van iemands meetwaarde geeft.
  • de items in volgorde van opklimmende moeilijkheid aanbiedt.
  • op grond van de antwoorden die een persoon op een aantal items heeft gegeven, een gedifferentieerd individueel scoreprofiel opstelt.

op grond van de antwoorden op items die voor elke persoon verschillend kunnen zijn, een zo nauwkeurig mogelijke schatting van iemands meetwaarde geeft.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo