Afneming van tests en verwerking van testgegevens - Opdrachten
21 belangrijke vragen over Afneming van tests en verwerking van testgegevens - Opdrachten
Welke rol kan de klinisch-intuitieve interpretatie spelen in de verwerking van testgegevens?
De rol van de klinisch-intuitieve interpretatie hangt af van het belang van het testonderzoek.
Gaat het 'slechts' om het genereren van hypothesen of om het vinden van wegen waarlangs verder onderzoek nuttig zou kunnen zijn, dan mag men best langs klinisch-intuitieve weg de genoemde elementen van de testsituatie in de evaluatie verwerken.
Men dient zich er daarbij wel van bewust te zijn dat de subjectieve impressies en ideeen geen waarheidsgarantie bezitten, ook al wekken ze bij de psycholoog vaak een gevoel van juistheid.
Noem de drie manieren waarop de reacties op geprecodeerde items gescoord kunnen worden.
- handscoring
- zelfscoring
- machinale scoring
De giscorrectieformule (5.1) wordt uitgelegd voor vierkeuzeitems. Doe deze uitleg eens helemaal over voor driekeuze-items.
- k = 32
- A = 3
- XJan = 23
- background-colorXc(Jan) = X - 4,5 = 23 - 4,5 = background-color18,5
- ( k - X = 32 - 23 = 9 : A - 1 = 9 : 3 - 1 = 9 : 2 = 4,5)
- XEls = 24
- background-colorXc(Els) = 24 - 4,5 = background-color19,5
- Hogere cijfers + sneller leren
- Niets twee keer studeren
- 100% zeker alles onthouden
Leg uit wat het verschil is tussen de twee toestanden waarin personen zich kunnen bevinden als zij gissen naar het goede antwoord en de drie typen antwoorden die dit kan opleveren.
de twee toestanden zijn:
- hij weet met volledige zekerheid wat het goede antwoord is en geeft dat antwoord
- hij heeft geen idee en gist blind met succeskans
drie typen antwoorden:
- goede antwoorden die het gevolg zijn van kennis
- goede antwoorden die het gevolg zijn van blind gissen
- foute antwoorden die het gevolg zijn van gissen
Leg uit waarom onder het model voor giscorrectie (formule (5.1)) het aantal goed gegiste antwoorden een binomiale verdeling volgt.
iemand die 10 keer gist met een succeskans van 1/4, heeft naar verwachting 2.5 maal succes, maar in werkelijkheid gist hij/zij natuurlijk 0, 1, 2, 3, 4, 5 maal (enz.) goed, met kansen gegeven door de binomiale verdeling
Beantwoord de volgende vragen:
a) Met welke factor neemt de variantie van de gecorrigeerde testscores gebaseerd op driekeuze-items toe ten opzichte van de ongecorrigeerde testscore?
b) Hoe zit dit bij vierkeuze-items? En bij vijfkeuze-items?
c) Welke trend valt te zien in de resultaten bij de vragen a en b?
a) na correctie 2,25 zo grote variantie
b) 1,7777 und 1,5625
c) de variantie neemt met een steeds kleinere factor toe bij toevoeging van meer antwoordalternatieven
In de tekst wordt gesteld dat de voor gissen gecorrigeerde testscore, Xc, en de ongecorrigeerde testscore, X, perfect correleren: dus, r(Xc, X) = 1
- bewijs dit door gebruik te maken van de formules (A.16) en (A.17) in de appendix
Xc is een lineaire transformatie van X en dat betekent dat de correlatie tussen Xc en X gelijk is aan 1.
Wat is 'on-line testing'? Wat is de zwakke plek van deze methode?
'on-line testing' (Baker, 1984):
- de leerling of student bepaalt zelf het moment waarop hij de studiestof naar zijn idee voldoende beheerst en vraagt de computer om een toets
- der computer selecteert uit de itembank een studietoets, presenteert deze aan de student, codeert de reacties, levert een eindbeoordeling aan de student en slaat de toetsgegevens centraal op
- de docent komt er in directe zijn niet meer aan te pas
- een gevaar bij deze vorm van toetsen is de beveiliging
Welke conclusie trekken de auteurs uit het onderzoek dat is gedaan naar de invloed van de wijze van testen, via 'paper and pencil' of de computer, op de testprestatie?
- Hofer en Green (1985) noemen twee factoren die het gevolg zijn van het testen per computer en waarbij personen of groepen verschillen kunnen vertonen: testangst en ervaring met computers
- de auteurs veronderstellen dat dergelijke verschillen zullen verdwijnen als respondenten voldoende gelegenheid krijgen om voorafgaand aan de testsessie te oefenen en zo aan het medium te wennen
- verschillen in 'computer skills' kunnen bestaan, die invloed kunnen hebben op de testprestaties
- proefpersonen dienen vooraf voldoende gelegenheid te krijgen om 'computer skills' te oefenen en tests met een duidelijk verbale component behoren eenvoudig van taal te zijn
Wat is de kern van adaptief testen?
- adaptief testen = testen op maat
- iedere respondent krijgt een test voorgelegd die op zijn of haar niveau is toegesneden
- door de respondent items voor te leggen die wat moelijkheid betreft bij zijn niveau passen, zal hij sommige wel en andere niet oplossen, en dit biedt juist wel informatie over zijn niveau
- de test zal dan vanuit het gezichtspunt van de respondent gemiddeld moeilijk zijn
Wat wordt bedoeld als wordt gezegd dat vanuit de geteste persoon gezien de kans op het goed maken van een item 0.5 is?
- binnen de item-responstheorie kan worden aangetoond dat de meting van een eigenschap van een persoon met een bepaald item de grootste nauwkeurigheid heeft als de moeilijkheid van het item en het niveau van de persoon op de psychologische eigenschap, beide gemeten op dezelfde schaal, samenvallen
- als dit het geval is, dan is de subjectieve kans op een positief antwoord op het item gelijk aan 0.5
- het item heeft voor de respondent dus een middelmatige moeilijkheid, want vanuit de persoon gezien is de kans op een goed antwoord even groot als de kans op een fout antwoord
Leg uit dat het bij adaptief testen niet 'oneerlijk' is dat de ene persoon veel gemakkelijker items krijgt voorgelegd dan de andere.
- een belangrijke eigenschap van metingen in de context van de item-responstheorie is dat zij gecorrigeerd kunnen worden voor het moeilijkheidsniveau van de test
- dat is de reden waarom de meetwaarden van verschillende personen kunnen worden vergeleken ondanks het feit dat zij tests van uiteenlopend moeilijkheidsniveau hebben gemaakt
- daarbij geldt wel als randconditie dat de itembank in zijn geheel voldoet aan de eisen van de item-responstheorie
Wat is nu nog de belangrijkste hindernis bij het testen via het internet?
- de ontwikkeling van een adaptief testsysteem - itembank, software, maar ook de inrichting van speciale testruimtes met aansluiting op het computersysteem - is een kostbare aangelegenheid
- toepassingen in Nederland beperken zich vooralsnog tot het grootschalige toetsen van het CITO
- voorals nog baren zaken als beveiliging van gegevens, zowel van de test als de onderzochte, nog wel de nodige zorgen
Wat is het verschil tussen een bewerkte score en een normscore?
Niet ieder bewerkte score heeft een normkarakter:
- onder een norm verstaan we een referentiekader voor de evaluatie van de ruwe scores dat is gebaseerd op de kenmerken van de verdeling van de ruwe scores dat is gebaseerd op de kenmerken van de verdeling van de ruwe scores in een populatie
- deze kenmerken worden geschat op basis van een representatieve steekproef
Zijn voor een zinvol testgebruik normen altijd noodzakelijk? Licht het antwoord toe.
- niet altijd is het nodig of zelfs gewenst normen te berekenen of te gebruiken
- vaak kan worden volstaan met een eenvoudiger vorm van bewerkte scores
- soms hoeft men slechts de plaats in de rangschikking binnen de onderzochte groep te weten, bijv. in het geval dat de drie besten van een groep van sollicitanten moeten worden uitgezocht
- een ander type bewerkte score is het percentage goede antwoorden
- bij bijv. een lager percentage dan 80 in een taaksimulatie mag men niet zelfstandig werken omdat de kans op fouten te groot is
In welke type testtoepassing kan men volstaan met ruwe scores?
- als men voor onderzoeksdoeleinden geïnteresseerd is in de samenhang tussen testscores en criteriumscores, is een omzetting in bewerkte scores niet noodzakelijk
- het berekenen van bijv. de correlatie tussen de ruwe testscores en schoolcijfers is afdoende om de vraag naar de samenhang te beantwoorden
Stel, de scores op een test zijn normaal verdeeld met een gemiddelde gelijk aan 10 en een variantie gelijk aan 9/ Bereken met behulp van uw statistiekboek de percentielscores van iemand met een testscore van 12 en iemand anders met een testscore van 6.
hab ich noch nicht verstanden....
Laat zien dat z-scores een lineare transformatie zijn van de ruwe scores.
- om standaardscores of z-scores te verkrijgen, worden de ruwe scores, X, uitgedrukt in het aantal standaarddeviatie-eenheden dat zij van het gemiddelde verwijderd liggen: s. boek p. 182
- standaardscores behouden, op gemiddelde en standaarddeviatie na, dezelfde verdelingskenmerken als de ruwe scores, X
- een ernstig en veel voorkomend misverstand is dat z-scores automatisch normaal verdeeld zouden zijn
- omzetten in z-scores betekent slechts twee dingen:
- de verdeling van X wordt verschoven
- de afstand tussen de scores wordt met een constante factor veranderd
dus: een niet-normale verdeling blijft niet-normaal
Laat zien dat z-scores een gemiddelde gelijk aan 0 en een standaarddeviatie gelijk aan 1 hebben.
??
Welk percentage van de normaalverdeling ligt tussen het Xgemiddeld en (Xgemiddeld + 3SX)?
SX = standaarddeviatie
- deze z is in dat geval 3
- uit de z-tabel p. 186 blijkt dat tussen Xgemiddeld en een z van 3 = 49,87 (?) van de normaalverdeling ligt
Wat is een nadeel van genormaliseerde standaardscores?
- genormaliseerde standaardscores worden verkregen uit niet-lineaire transformaties, die de verdeling vqn X zodanig vervormen dat wel een normaalverdeling ontstaat
- dat betekent dat sommige van de oorspronkelijke score-eenheden worden 'uitgerekt' en andere 'ineengedrukt'
- in vele gevallen is normalisering echter een probleem omdat de werkelijkheid te zeer geweld wordt aangedaan
De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:
- Een unieke studie- en oefentool
- Nooit meer iets twee keer studeren
- Haal de cijfers waar je op hoopt
- 100% zeker alles onthouden