Samenvatting: Statistics
- Deze + 400k samenvattingen
- Een unieke studie- en oefentool
- Nooit meer iets twee keer studeren
- Haal de cijfers waar je op hoopt
- 100% zeker alles onthouden
Lees hier de samenvatting en de meest belangrijke oefenvragen van Statistics
-
1 Kijken naar gegevens - verdelingen
Dit is een preview. Er zijn 18 andere flashcards beschikbaar voor hoofdstuk 1
Laat hier meer flashcards zien -
Waarom moeten we letten bij het beschrijven van de vorm van een verdeling?
- Is de verdeling Unimodaal (slechts één top)?
- Is verdeling symmetrisch?
scheef naar rechts:de rechterstaart is veel langer dan de linkerstaart
- Is de verdeling Unimodaal (slechts één top)?
-
Wat is een histogram? Hoe gaat men te werk?
Een histogram verdeelt het waardebereik van een 'random variabele' in gelijke intervallen en toont slechts het aantal of percentage waarnemingen dat in elk interval terechtkomt.
Ga als volgt te werk:- Verdeel het bereik van de gegevens in klassen met gelijke breedte.
- Tel het aantal waarnemingen in elke klasse.
De aantallen noemt men frequenties.
De tabel met frequenties noemt men een frequentietabel.
Deze tabel kan ook de relatieve frequenties (percentages) bevatten - Teken het histogram.
-
Wat is de verdeling van een kwantitatieve variabele?
Het variatiepatroon van een variabele wordt zijn verdeling genoemd. De verdeling van een kwantitatieve variabele legt de numerieke waarden van de variabele vast en het aantal keren dat elke waarde voorkomt. -
Hoe kunnen we het centrum van een verdeling beschrijven?
- Mediaan: de waarde waarvoor geldt dat de helft van de waarnemingen een lagere waarde heeft en de helft een hogere waarde.
- Gemiddelde:
- Modus
-
Waarvoor kan een tijdreeksgrafiek interessant zijn?
De variabiliteit van de metingen kan bvb. in de loop van de tijd afnemen wegens een leereffect tijdens het meten. Uitschieters kunnen dan beter geinterpreteerd worden bvb. tijdens de eerste metingen.
Een weergave van de verdeling van een variabele die de volgorde in de tijd negeert, zoals een histogram, kan misleidend zijn wanneer er in de loop van de tijd een systematische verandering plaatsvindt. -
Hoe kunnen we het globale patroon van een verdeling beschrijven?
Door middel van zijn vorm, centrum en spreiding. -
Hoe kunnen we de spreiding van een verdeling beschrijven?
- bereik tussen de laagste en hoogste waarden
- de Interkwartielafstand IKA Q3-Q1
- de variantie
- de standaardafwijking
- bereik tussen de laagste en hoogste waarden
-
Wat wordt bedoeld met: "Het gemiddelde is geen resistente maat"?
Dat het gemiddelde niet bestand is tegen de invloed van extreme waarnemingen. Een resistente maat doet meer dan alleen de invloed van uitschieters beperken; zijn waarde reageert niet sterk op veranderingen in enkele waarnemingen, ongeacht hoe groot die veranderingen ook zijn. -
Wat wordt bedoelt met kwartielen en percentielen, 'quantiles'?
The 2-quantile = median
The 4-quantiles = kwartielen
the 100-quantiles = percentielen
De mediaan is het 50ste percentiel.
Het eerste kwartiel Q1 is de mediaan van de waarnemingen links van de plaats van de globale mediaan; Analoog voor Q3, maar dan aan rechterkant.
Het p-de percentiel van een verdeling is de waarde, zodanig dat p procenten van de waarnemingen lager uitvalt of eraan gelijk is. -
Wat is de vijf-getallen samenvatting?
Minimum, Q1, M, Q3, Maximum
Deze kunnen grafisch voorgesteld worden in een doosdiagram (Boxplot).
Een boxplot is goed om verdelingen te vergelijken.
Niet zo goed voor een enkele verdeling, verbergt clusters (beter te zien in een histogram)
Deze vijf-getallen samenvatting is echter niet de meest gangbare numerieke beschrijving van een verdeling. Geschikter is een combinatie van het gemiddelde om het centrum te meten en de standaardafwijking om de spreiding te meten.
- Hogere cijfers + sneller leren
- Niets twee keer studeren
- 100% zeker alles onthouden