Samenvatting: Statistiek 2
- Deze + 400k samenvattingen
- Een unieke studie- en oefentool
- Nooit meer iets twee keer studeren
- Haal de cijfers waar je op hoopt
- 100% zeker alles onthouden
Lees hier de samenvatting en de meest belangrijke oefenvragen van Statistiek 2
-
1 Week 1
-
1.1 Hoofdstuk 1
Dit is een preview. Er zijn 3 andere flashcards beschikbaar voor hoofdstuk 1.1
Laat hier meer flashcards zien -
Leg uit wat betrouwbaarheid, validiteit en falsificatie inhoudt
- Falsificatie = ontkrachting, je bent op zoek naar bewijs tegen de hypothese. - Betrouwbaarheid = de mate waarin meerdere metingen hetzelfde resultaat geven. Het wordt ook wel consistentie of precisie genoemd. Hierbij geldt dat hoe groter de steekproef hoe hoger de betrouwbaarheid- Validiteit = de mate waarin hetgeen dat je gemeten hebt overeenkomt met het begrip dat je wilt meten, de werkelijke waarde. Het wordt ook wel juistheid genoemd. Hierbij is het van belang dat je steekproef representatief is voor de populatie/ het construct. -
1.2 Hoofdstuk 2
-
Wat is een variabele? We hebben twee soorten variabelen: categorisch versus continue. Licht het verschil toe
- Categorische variabele = de meetschaal bestaat uit groepen of categorieën (nominaal of ordinaal). Wordt ook wel een kwalitatieve of discrete variabele genoemd, waarbij de meeteenheid ondeelbaar is.
- Continue variabele = de meestschaal bestaat uit numerieke waarden die verschillende grootte van de variabele vertegenwoordigen (interval of ratio). Wordt ook wel een kwantitatieve of continue variabele genoemd, waarbij de meeteenheid oneindig deelbaar is -
2 Week 2 + 3
Dit is een preview. Er zijn 17 andere flashcards beschikbaar voor hoofdstuk 2
Laat hier meer flashcards zien -
Als we het hebben over een enkelvoudige lineaire regressie, dan hebben we twee parameters nodig. Welke zijn dit?
A (constante/ of het intercept) = de waarde voor y als x = 0
B(oftewel de regressie coefficient) = hoe steil de lijn is. Als je op je x-as met 1 eenheid omhoog gaat, met hoeveel
neemt y dan toe. -
Een regressiemodel is niet deterministisch (voor iedere waarde van x geldt 1 waarde van y), maar stochastisch. Licht toe wat dit inhoudt
Stochastisch model = Dat betekent dat we niet met zekerheid de y kunnenvoorspellen als we de x weten. Je kan alleen maaruitspraken doen over dat het waarschijnlijk is dat iemand een bepaaldey-waarde heeft gebaseerd op dex-waarde (stochastisch). -
Wie is de grondlegger van de regressieanalyse? En wat is een regressielijn nou eigenlijk? Wat is de notatie en wat is hierbij y^?
- Sir Francis Galton is de grondlegger van de tweelingenmethode en ook de regressieanalyse
- De regressielijn is een voorspelling. De waarnemingen kunnen daarvan afwijken.
- In de steekproef is de notatie voor het regressiemodel als volgt: y^=a+b∗x of y=a+b∗x+e. Y^ = de voorspelde y -
Wat bepaalt de standaardfout van b? De standaardfout wordt kleiner bij.... (vul 3x aan)
Destandaardfout wordt kleiner bij:
- Een afname in s (deresiduele variantie van y).
- Een toename van n (grotere steekproeven).
- Een toename vansx (de spreiding van x). -
Een verband tussen X en Y betekent niet meteen dat een verband causaal is. Om causaliteit de concluderen moeten er aan drie voorwaarden worden voldaan:
1. Er moet een verband zijn tussen x en y.
2. Er moet eentoepasselijke tijdsvolgorde zijn.3. Alternatieve verklaringen moeten worden uitgesloten. We kunnen een oorzaak nooit bewijzen, maar welfalsificeren . -
Als we kijken naar drie typen verbanden voor statistische controle, wat krijg je dan als je 1. kwantitatieve y en x hebt 2. een kwantitatieve x en 3. categorische x en een categorische y en een categorische x?
Kwantitatief y, kwantitatief x: Correlatie en regressiecoefficient voor gegeven niveau van derde variabele.
Kwantitatief y, categorisch x: Groepsgemiddelden bij gegeven niveau van derde variabele.
Categorisch y, categorisch x: Kruistabellen bij gegeven niveau van derde variabele. -
Wat houdt een lurking variabele in?
Lurking variabele = Een variabele waarvan je je niet bewust bent, maar die mogelijk als derde variabele je onderzoek beïnvloedt.
- Variabele is in praktijk niet gemeten. Als variabele niet in model opgenomen, dan helaas ook niet controleren voor variabele. DUS: Neem alle relevante variabelen op in onderzoek en model! -
Als we het hebben over multivariate relatie, dan hebben we het ook over het spurieuze verband. Wanneer spreken we hiervan? Wanneer is het een zorg?
Hetspurieuze verband (ookwel oneigenlijk verband genoemd) = we spreken van een spurieus verband tussenX1 en Y als beide variabelen afhankelijk zijn van een derde variabele (X2, ook wel deconfounder genoemd).
- Met name een zorg bijniet-experimenteel onderzoek, maar kan ook in experimenteel onderzoek voorkomen.
- Hogere cijfers + sneller leren
- Niets twee keer studeren
- 100% zeker alles onthouden