Datascreening - Controleren van verdelingsvormen - Toetsing van verdelingsvormen tegen de kansverdeling: Kolmogorov-Smirnov en Shapiro-Wilk’s

3 belangrijke vragen over Datascreening - Controleren van verdelingsvormen - Toetsing van verdelingsvormen tegen de kansverdeling: Kolmogorov-Smirnov en Shapiro-Wilk’s

Hoe werkt de Kolmogorov-Smirnov (KS-toets)?

Net als de Q-Q-plot deelt de KS-toets de data op in gelijke (cumulatieve) stukken vergelijkt deze met hoe dezelfde stukken eruit zouden zien in een ideaal (normaal verdeeld) geval.
Kortom de KS-toets geeft dus een indruk van hoe goed de data overeenkomen met de ideale verdeling en wordt daarom een goodness-of-fitmaat genoemd.

Wat is de parametrische variant van de KS-toets die als non-parametrische toets wordt gezien?
Wat geldt als vuistregel?

Shapering-Wilk’s toets (SW-toets).
Als vuistregel geldt dat de KS-toets gekozen wordt bij een steekproef van N>50 en dat de SW-toets gekozen wordt bij N<50.

Wat voor 2 probleem hebben de KS-toets en de WS-toets waardoor zij niet de voorkeursmethoden zijn?

Ze zijn erg gevoelig voor de steekproefgrootte en voor deze toetsen is N>50 al een grote steekproef. Hof groter N des te eerder deze toetsen een significante uitkomst opleveren. Dit kan gecompenseerd worden met een strenge alfa, zoals alfa=.001, maar voor zowel de KS-toets als de WS-toets zal een hoge N ook bij een strenge alfa (te) snel significant zijn.
Daarnaast zijn de toetsen alleen geschikt voor continue data.

Om deze 2 problemen wordt een KS-toets of een SW-toets vaak in combinatie met een Q-Q-plot gebruikt.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo