Validiteit en betekenis - Predictieve validiteit - Validiteitsgeneralisatie

22 belangrijke vragen over Validiteit en betekenis - Predictieve validiteit - Validiteitsgeneralisatie

Wat is de reden dat er duizenden valideringsonderzoeken zijn gedaan?

  1. De opvatting dat de predictieve validiteit in hoge mate situatiespecifiek is
  2. Hierdoor wordt in onderzoeken steeds nagegaan of een bepaalde test geschikt is voor een specifiek voorspellingsdoel

Welke vraag stelt validiteitsgeneralisatie aan de kaak?

In hoeverre tests en functies inwisselbaar zijn, dus in hoeverre we hier met dezelfde voorspellingssituatie te maken hebben.

Wat is volgens Schmidt en Hunter de belangrijkste oorzaak van variantie die generalisatie van validiteitscoëfficiënten in de weg staat?

Methodologische fouten, met name steekproeffouten, onbetrouwbaarheid van predictoren en criteria en beperking van de variatiebreedte (restriction of range).

Op basis van onderzoek werd vastgesteld dat validiteitscoëfficiënten maar weinig situatie-specifiek zijn en dus gegeneraliseerd kunnen worden.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Het is de vraag in hoeverre de gevonden validiteit van een test generaliseerbaar is naar een andere (bv in selectie tests van de ene functie naar de andere). Schmidt en Hunter (1977) hebben hier onderzoek naar gedaan. Welke elementen namen zij mee in hun onderzoek?

1. Het bepalen van de standaarddeviatie van de validiteitscoëfficiënten (meestal de product-moment correlatie). Dit geeft de variatie in de gevonden validiteitscoëfficiënten van een bepaald type tests over praktische toepassingen.

2.. Deze standaarddeviatie wordt gecorrigeerd voor deze veronderstelde methodologische fouten (steekproeffouten, onbetrouwbaarheid van predictoren en criteria en beperkingen van variatiebreedte (restriction of range).

Tests hebben vaak een lage valideringscoëfficiënt (niet hoger dan 0.3 of 0.4). Waarom kunnen deze test toch een bijdrage leveren?

Tests die minder valide zijn kunnen een bijdrage leveren, doordat ze een beroep doen op unieke eigenschappen.
Zo is een intelligentietest een goede valide voorspeller van schoolsucces. Toch kunnen toetsen (die minder valide zijn dan een intelligentietest) ook voorspellende waarden hebben omdat zij unieke eigenschappen meten, zoals studiemotivatie en kritisch kijken.

Welke twee vragen hebben betrekking op validiteitsgeneralisatie ?

  1. De vraag in hoeverre predictieve validiteit daadwerkelijk situatiespecifiek is (dus alleen geldt voor bijv. de geschiktheid voor de functie van programmeur)
  2. In hoeverre gebleken validiteit kan worden gegeneraliseerd naar nieuwe voorspellingssituaties (is de validiteit van de test voor een geschikte programmeur ook te generaliseren naar een test voor de geschiktheid voor een helpdeskfunctie?)


Beoordeel de juistheid van de volgende twee stellingen:
  1. Volgens Schmidt en Hunter zijn validiteitsresultaten generaliseerbaar over organisaties, geografische gebieden, functies en tijdsperioden.
  2. Tests voor cognitieve vaardigheden zijn volgens Schmidt en Hunter niet situatiespecifiek.

Beide stellingen zijn correct.

Wat zijn de 2 voornaamste kritieken op het onderzoek van Schmidt en Hunter naar generaliseerbaarheid?

1. Complexe criteria worden veelal te sterk vereenvoudigd gemeten en criteriumscores veelal gebaseerd op subjectieve oordelen, waardoor validiteit te laag uitvalt en spreiding gering is. Bij een grotere spreiding is de kans op generaliseerbaarheid kleiner.

2. De correctie van de standaarddeviatie voor methodologische fouten is veelal te groot, waardoor de overblijvende variantie van de validiteitscoëfficiënten te klein uitvalt en de mate van generaliseerbaarheid toeneemt.

Welke fouten/methodologische artefacten verklaren volgens Schmidt en Hunter de grote variatie in validiteitscoëfficienten in (situatie-specifieke) valideringsonderzoeken?

1. Steekproeffouten
  • kleine steekproefgrootte waardoor toevalsinvloeden verhoudingsgewijs een grote invloed hebben en
  • subtiele verschillen in samenstelling van steekproeven, die niet volledig represnetatief zijn voor populatie
  • -> te hoge of te lage validiteitscoefficient
2. Onbetrouwbaarheid van predictoren en criteria
  • -> grote meetfouten waardoor correlaties (validiteitscoefficienten) te laag worden geschat)
3.Beperking van de variatiebreedte
  • leidt tot een onderschatting van de validiteitscoefficient
  • over een smal interval van test- en/of criteriumscores valt de correlatie lager uit dan over een breed interval
  • t.g.v afwijzen ongeschikte kandidaten en vetrek geschikte kandidaten

Wat zijn volgens Schmidt en Hunter (1977) de 3 belangrijkste fouten die gemaakt worden bij validiteitsgeneralisatie?

  1. Steekproeffouten, waardoor validiteitscoëfficiënten te hoog of te laag worden geschat
  2. Onbetrouwbaarheid van predictoren en criteria. Dit betekent grote meetfouten, waardoor correlaties (validiteitscoëfficiënten) te laag worden geschat)
  3. Beperking van de variatiebreedte, als gevolg van het afwijzen van ongeschikt geachte kandidaten en het later uit de organisatie vertrekken van juist de meest geschikte kandidaten, leidt tot een onderschatting van de validiteitscoëfficiënt)

Hoe kan de vraag beantwoord worden in hoeverre de gebleken validiteit kan worden gegeneraliseerd naar nieuwe voorspellingssituaties?

Door middel van de voor methodologische fouten gecorrigeerde effectiviteit. Dit kan worder opgevat als de representatieve validiteit binnen een specifieke categorie van tests en functies. Het tiende percentiel wordt genomen als de ondergrens van validiteit.

Wat wordt er binnen de validiteitsgeneralisatie verstaan onder effectiviteit?

De effectiviteit is de representatieve validiteit binnen een specifieke categorie van tests en functies. Samen met de ondergrens van het betrouwbaarheidsinterval dienen deze als basis voor uitspraken over de te verachten validiteit bij generalisatie.

Wat is de conclusie van Schmidt, (1988) over de generaliseerbaarheid van validiteitscoëfficiënten?

Validiteitscoëfficiënten zijn in veel gevallen nier of maar weinig situatiespecifiek en dat generalisatie mogelijk is over organisaties, geografische gebieden, functies en tijdvakken.

UIt welke stappen bestaat de methode van Schmidt en Hunter waarmee ze de situatie-specifieke predictiviteit en de generaliseerbaarheid van validiteit onderzoeken ?

  1. Corrigeren van de standaarddeviatie voor de methodologische fouten -> meer realistische schatting van de validiteitscoëfficient. Wanneer de standaarddeviatie van de validiteitscoefficienten gelijk is aan 0, dan betekent dit dat de validiteit van de test(s) niet verschilt over de selectiesituaties en dat er dus NIET in elke voorspellingssituaties opnieuw de validiteit bepaald hoeft te worden.
  2. De voor methodologische fouten gecorrigeerde effectiviteit wordt geschat en de ondergrens voor de validiteit wordt bepaald (het tiende percentiel) -> uitspraak over de te verwachte validiteit in de onderzochte categorie van tests en functies (=validiteitsgeneralisatie)

Wat zijn twee belangrijke bezwaren tegen de methode van Schmidt en Hunter?

1. Het gebruik van slecht geoperationaliseerde criteria leidt tot te lage validiteiten met te weinig spreiding
2. De toegepaste correctie is vaak te groot

Welke maat wordt gebruik om te bepalen in hoeverre de validiteit kan worden gegeneraliseerd naar nieuwe voorspellingssituaties, en wanneer is die wel/niet generaliseerbaar?

De effectiviteit.
Is de effectiviteit tussen de 0.1 en de -0.1 dan is de validiteitsgeneralisatie zeer discutabel. Is de effectiviteit daarentegen bijvoorbeeld 0.4 en de ondergrens 0.35 dan is met grote zekerheid generalisatiemogelijk naar toekomstige, gelijksoortige voorspellingssituaties.

Miskenning van niet-lineaire relatie tussen predictor en criterium

Het is verleidelijk om aan te nemen dat de relatie tussen predictor en criterium rechtlijnig is en overal even sterk. Dit is niet altijd het geval en kan worden gecheckt door het bekijken van een scatterplot.  Bij duidelijke afwijkingen geeft de product-momentcorrelatie een onderschatting van de sterkte van het verband en leiden regressieformules tot ernstige vertekening in de voorspelling

Wat concludeert Schmidt (1988) over de mate waarin tests generaliseerbaar zijn?

Hij concludeert in een studie naar validiteitsgeneralisatie dat de effectiviteit groot genoeg is en de resterende variantie klein genoeg is om in 90% á 95% van de nieuwe toepassingen een positieve validiteit te verwachten. Voor tests voor cognitieve vaardigheden gaat hij er zelfs van uit dat de gecorrigeerde standaarddeviatie nul is, geen situatie specificiteit, en dat de validiteit derhalve constant is over situaties

Welke conclusies trekken Schmidt en Hunter n.a.v. hun onderzoek naar specifieke-predictiviteit en generaliseerbaarheid van validiteit

  1. Validiteitscoefficienten in veel gevallen niet of maar weinig situatiespecifiek zijn
  2. Generalisatie is mogelijk over organisaties, geografische gebieden, functies en tijdvakken.
  3. De resterende variantie en de effectiviteit is groot genoeg om in 90 a 95% van de nieuwe toepassingen een positieve validiteit te vewachten
  4. Voor cognitieve testen is de gecorrigeerde sd =0 (geen situatiespecificiteit) en de validiteit constant over situaties

Wat zijn de kritiekpunten van Jansen.a. op de ideeen van Schmidt en Hunter?

Bezwaar tegen de methoden die zijn gebruikt om de validiteitsgeneralisatie te onderzoeken:
  1. Het gebruik van slecht geoperationaliseerde criteria ( te simpel/globaal of te subjectief) -> te lage lage validiteit en te weinig spreiding -> te snel de situatiespecificiteit kunnen verwerpen
  2. De correctie van de sd/variantie van de validiteitscoefficienten t.g.v. de methodologische fouten is te groot -> overblijvende variantie valt te klein uit -> is in het voordeel van de situatiespecificiteit

Op welke manier geven Schmidt en Hunter antwoord op de eerste vraag (in hoeverre is predectieve validiteit daadwerkelijk situatiespecifiek)?

  1. Er worden meerdere tests verzameld die hetzelfde meten en afkomstig uit gelijksoortige functies (redeneercapaciteiten & in de sfeer van de ICT)
  2. beschikbare validiteitscoëfficiënten worden verzameld
  3. standaarddeviatie wordt bepaald, deze geeft de variatie in de gevonden validiteitscoëfficiënten weer
  4. deze variatie wordt gezien als methodologisch fouten (steekproeffouten, onbetrouwbaarheid van predictoren en criteria)
  5. standaarddeviatie wordt gecorrigeerd op deze veronderstelde fouten
  6. na de correctie zijn de resulterende standaarddeviatie van de validiteitscoëfficiënten gelijk aan nul (validiteit van de tetst verschilt niet meer over selectiesituaties)

Op welke manier geven Schmidt en Hunter antwoord op de tweed vraag (generaliseerbaarheid naar nieuwe situaties)?

  1. Er wordt een schatting gemaakt van de, wederom voor methodologische fouten gecorrigeerde, effectiviteit
  2. Deze effectiviteit kan worden opgevat als de representatieve validiteit binnen een specifieke categorie van tests en functies. Mocht de standaarddeviatie van de validiteitscoëfficiënten na correctie niet gelijk zijn aan nul, dan wordt een betrouwbaarheidsinterval berekend waarvan het tiende percentiel doorgaans wordt beschouwd als een ondergrens voor de validiteit

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo