Variabelen beschrijven en data-integriteit verifiëren - Univariatie analyse - Betrouwbaarheidsintervallen

7 belangrijke vragen over Variabelen beschrijven en data-integriteit verifiëren - Univariatie analyse - Betrouwbaarheidsintervallen

Hóe accuraat een steekproefgemiddelde is,

bepalen we aan de hand van betrouwbaarheidsintervallen.

Het gemiddelde van een steekproef van 100 leeftijden is 39, de standaarddeviatie 23.57. De standaardfout is, volgens de formule, 2.36. We doen net of we het populatiegemiddelde 40.76 kennen. De steekproevenverdeling ziet er dan als volgt uit:

In het interval tussen twee standaardfouten van het populatiegemiddelde, dus van 36.04 tot 45.47 (dit wordt geschreven als [36.04;45.47]), liggen dus 95% van alle gemiddelden die met een steekproef van 100 deelnemers verkregen kunnen worden. Dat betekent dat het gemiddelde van een gegeven steekproef van 100 deelnemers in 95% van de steekproeven die we nemen in dat interval zal liggen

Echter, elke steekproefwaarde komt tot stand door toeval:

elke steekproefwaarde is een willekeurig gekozen waarde uit de bijbehorende steekproevenverdeling. Van die steekproevenverdeling kennen we de verdelingsvorm en weten we de standaarddeviatie (de standaardfout).
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

We kunnen deze kennis van de steekproevenverdeling van de schatters gebruiken door een interval te berekenen waar in 95% van de steekproeven de bijbehorende populatiewaarde in zal vallen

Dit interval heet het betrouwbaarheidsinterval.

De betrouwbaarheid van het betrouwbaarheidsinterval drukt vertrouwen uit in het principe van het betrouwbaarheidsinterval over oneindig veel herhalingen en zegt dus niets over de betrouwbaarheid van één enkel interval. Betrouwbaarheidsintervallen zijn desondanks heel bruikbaar

Ze geven een duidelijke indicatie van de inschatting van een schatter en bovendien hoe accuraat die schatting is. Die accuraatheid zit in de breedte van het interval: brede intervallen (bijvoorbeeld uit kleine steekproeven) zijn weinig accuraat

Hoe hoger het percentage, hoe vaker het populatiegemiddelde in het betrouwbaarheidsinterval zal liggen. Hoe hoger de betrouwbaarheid, hoe breder het interval wordt.

Een 50% betrouwbaarheidsinterval is dus relatief smal en lijkt dus accuraat, maar bevat maar in de helft van de steekproeven het populatiegemiddelde. Een 99% betrouwbaarheidsinterval is een stuk breder en lijkt dus veel minder nauwkeurig, maar bevat wel in bijna alle steekproeven het populatiegemiddelde.

Voor alle maten die kunnen worden berekend op basis van een datareeks uit een steekproef kunnen betrouwbaarheidsintervallen worden berekend,

want al deze maten komen uit een steekproevenverdeling waarvan de verdelingsvorm en de standaardfout bekend zijn. Dit geldt dus voor de centrummaten, de spreidingsmaten en de verdelingsmaten. Hierdoor kunnen we dus op basis van een steekproef toch informatie afleiden over de populatie waarin we eigenlijk zijn geïnteresseerd.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo