Univariaat onderzoek: beschrijvende analyse en schatten

21 belangrijke vragen over Univariaat onderzoek: beschrijvende analyse en schatten

Wat is het verschil tussen beschrijvende en inferentiële statistiek?

Beschrijvende statistiek gebruikt slimme samenvattingen van steekproefgegevens om data om te zetten in informatie.
Inferentiële statistiek gebruikt deze samengevatte steekproefimformatie om uitspraken te doen over de populatie waaruit de steekproef afkomstig is, waarbij onzekerheid als gevolg van steekproefvariantie wordt gekwantificeerd.

Wat zijn de 4 belangrijke punten van een histogram

Vorm, Zwaartepunt, Variatie en Uitbijters

Waarom maakt men bij inferentiële statistiek gebruik van statistische theorie?

Inferentiële statistiek doet uitspraken over eigenschappen van populaties op basis van steekproefinformatie, waarbij de onzekerheid als gevolg van steekproefvariantie wordt gemodelleerd (gekwantificeerd). Het interpreteren van deze onzekerheid vereist statistische theorie.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Welke relatie bestaat er tussen locatiemaatstaven en de vorm van een verdeling?

Bij een symmetrische verdeling zijn de modus, mediaan en gemiddelde gelijk. Bij een linksscheve verdeling is deze verhouding: gemiddelde -> mediaan -> modus. Bij een rechtsscheve verdeling is deze verhouding: modus -> mediaan -> gemiddelde.

Wanneer gebruik je grafieken en tabellen in je verslag?

Alleen spaarzaam en functioneel en als het de tekst ondersteunt (niet vervangt)

Hoe wordt de verdeling van uitkomsten van kwantitatieve gegevens uitgebeeld?

Met een histogram; andere opties zijn een stem-and-leave diagram of een boxplot. Bij de beoordeling van een histogram wordt er gelet op de vorm, locatie, spreiding en uitbijters. De verdeling van uitkomsten van kwantitatieve gegevens wordt samengevat met kengetallen (beschrijvende kenmerken, descriptive statistics). Deze worden weergeven in een tabel.

Discriptive statistics: N (per variabele het aantal bruikbare en gebruikte observaties), min, max, mean, std dev, en valid N (het aantal bruikbare observaties over alle betrokken variabelen heen).

Welke 2 vragen stel je jezelf bij een uitbijteranalyse

Wat is er aan de hand? En is dit erg of relevent?

Hoe wordt de verdeling van uitkomsten van kwalitatieve gegeven uitgebeeld?

Kenmerkend voor kwalitatieve gegevens is dat de uitkomsten van variabelen gemeten op een nominaal of ordinaal meetniveau geen natuurlijk nulpunt of afstandsbegrip hebben. Het gevolg is dat kengetallen zoals gemiddelde en standaarddeviatie, geen geëigende samenvatting zijn.

De uitkomsten van kwalitatieve gegevens worden samengevat met een staafdiagram en frequentietabellen. Bij de beoordeling van staafdiagrammen wordt er gelet op de locatie en variatie(verschillen).

In het frequentietabel: frequentie, percentage, valid percentage (verschillen) en het cumulatieve percentage.

Op welke 3 manieren kan je uitbijters opsporen

Visuele inspectie, beoordelen histogram of boxplot, z-scores bekijken

Wanneer haal je uitbijters uit de uitkomsten

Als ze niet onder de populatie vallen

Wat zijn uitbijters en waarom is uitbijteranalyse van belang?

Uitbijters zijn waarnemingsuitkomsten die kennelijk ver buiten het bereik van de andere waarnemingsuitkomsten liggen. Uitbijters zijn dus vooral bij kwantitatieve gegevens te verwachten.
Het opsporen en beoordelen van extreme uitkomsten (uitbijters) is van belang vanwege de opmerkelijke invloed op steekproefkenmerken (gemiddelde, variantie, etc.), maar ook voor een beter begrip van de gehanteerde trekkingsmethode of zelfs van de theorie.

Wat is de bedoeling van uitbijteranalyse en hoe zijn uitbijters op te sporen?

Doel:
Nagaan achtergrond extremiteit van de observaties (is de observatie onderdeel van de beoogde populatie of niet?);
Nagaan gevoeligheid steekproefkenmerken voor uitbijters (gevoeligheids- of robuustheidsanalyse).

Uitvoering:
Visuele inspectie van het gegevensbestand;
Beoordelen histogram of Box-Whiskers plot;
Berekenen gestandaardiseerde waarnemingsuitkomsten (z-scores). Afstand waarnemingsuitkomst tot steekproefgemiddelde uitgedrukt in steekproefstandaarddeviaties.

Welke 2 schatters(Wasmachines) bestaan er

puntschatter, intervalschatter

Hoe spoor je uitbijters op met een histogram?

De uitbijters bevinden zich altijd in de beide uiteinden van de verdeling. Niet elke extreme waarnemingsuitkomst is een uitbijter (let op de aansluiting bij andere waarnemingsuitkomsten).

Met welke formule kan je schatten of mu in het interval ligt?

X ± zα/2 * σ / √ n

Hoe spoor je uitbijters op met een Box-and-Whiskers plot?

Je tekent de box and whiskers. De box bestaat uit de IQR =Q3-Q1. De whiskers bestaan uit de grenzen van de box (Q1-3/2*IQR) en (Q3 + 3/2*IQR). De waarde die buiten de box + whiskers vallen zijn uitbijters.

Hoe beoordeel je de invloed van uitbijters?

Vergelijken kengetallen voor en na weglaten extreme waarnemingsuitkomst; hoe groter de verschillen, des te groter de invloed van de uitbijter. Ga wel na of het verschil relevant is gezien de context. €100 verschil op waarden die in de €10,000 lopen is niet echt relevant.

vergelijken absoluut verschil:
Gemiddelde voor - gemiddelde na
Gemiddelde na bereken je met:
(N * gemiddelde) - waarde extreme waarden / n-#weggelate extreme waarde

Relatief verschil:
(Gemiddelde na - gemiddelde voor) / gemiddelde voor.

Wat betekenen: schatters, schatten en schattingen?

Schatten (activiteit): verkrijgen inzicht in kenmerken van de populatie (parameters), zoals gemiddelde, variantie en proportie, op basis van (functies van) steekproefinformatie (statistics).

Puntschatter (instrument): functie van steekproef met als uitkomst een getal dat als benadering van de te schatten populatieparameter wordt opgevat (puntschatting = realisatie puntschatter)

Intervalschatter (instrument): functie van steekproef met als uitkomst een interval van getallen dat de te schatten populatieparameter met een bepaalde waarschijnlijkheid omsluit (intervalschatting = realisatie intervalschatter)

Schattingen (uitkomsten): de uitkomsten van de schatter met steekproefinformatie als brandstof.

Wat betekend het begrip betrouwbaarheid?

Betrouwbaarheid van de schatter met een (1-alpha)100% betrouwbaarheid betekend dat wanneer het aselect trekken eindeloos herhaald wordt, in (1-alpha)100% van de berekende intervallen de te schatten populatieparameter omsluit. Echter kan men niet van afzonderlijke intervallen beweren dat ze de populatieparameter omsluiten.

Wat betekend het begrip nauwkeurigheid?

Nauwkeurigheid wordt gemeten met de breedte van het interval: hoe breder het interval, des te minder nauwkeurig; en vice versa. De helft van de breedte van het interval wordt error margin genoemd. De nauwkeurigheid van intervalschatters (Beta) varieert met de gekozen betrouwbaarheid (Alpha), de steekproefomvang (N) en de variabiliteit van de steekproefgegevens (S).

Beta wordt berekend als de Cr - Cl = Beta.

In het geval van een student's t verdeelde variabele:
2t n-1, alpha/2 * standaardfout van de steekproef.

Waar hangt de nauwkeurigheid van een (1-alpha)100%-betrouwbaarheidsintervalschatter van af?

Betrouwbaarheid, 1-alpha: hoe hoger de gewenste betrouwbaarheid, des te lager alpha, des te groter de grenswaarde t n-1,alpha/2, des te breder het interval, des te onnauwkeuriger de uitspraken.

Variabiliteit gegevens, S: hoe meer variantie in de uitkomsten, des te groter de variantie S², des te groter de geschatte standaardfout S / wortel N, des te breder het interval, des te onnauwkeuriger de uitspraken.

Steekproefomvang, N: hoe groter de steekproefomvang, des te kleiner de geschatte standaardfout S / wortel N, des te smaller het interval, des te nauwkeuriger de uitspraken.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo