Samenvatting: Statistiek Voor Data Science

Studiemateriaal generieke omslagafbeelding
  • Deze + 400k samenvattingen
  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
LET OP!!! Er zijn slechts 60 flashcards en notities beschikbaar voor dit materiaal. Deze samenvatting is mogelijk niet volledig. Zoek a.u.b. soortgelijke of andere samenvattingen.
Gebruik deze samenvatting
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo

Lees hier de samenvatting en de meest belangrijke oefenvragen van Statistiek voor Data Science

  • 0 Inleiding

    Dit is een preview. Er zijn 2 andere flashcards beschikbaar voor hoofdstuk 0
    Laat hier meer flashcards zien

  • Welke definitie is er voor Data Science 1?

    "The computational aspects of carrying out a complete data analysis, including acquisition, management, and analysis of data"
  • Welke definitie is er voor Data Science 2?

    "Data science is the science of learning from data"
    Gericht op het vergaren van kennis uit gegevens, en maakt gebruik van tools en software om gegevens te bewaren, bewerken en te analyseren.
  • Wat is de inhoud van het college?

    - Verdelingen van steekproefgrootheden
    - Theorie van schatters
    - Betrouwbaarheidsintervallen, 1 steekproef
    - Toetsen van hypothesen, 1 steekproef
    - Conclusies gebaseerd op 2 steekproeven
    - Variantieanalyse
    - Analyse van aantallen
    - Enkelvoudige en meervoudige regressie
  • 6 Verdelingen voor steekproefgrootheden

    Dit is een preview. Er zijn 2 andere flashcards beschikbaar voor hoofdstuk 6
    Laat hier meer flashcards zien

  • Wat kunnen we zeggen over de verdeling van een steekproefgrootheid?

    Deze hangt van het toeval af. Een steekproefgrootheid is dus een stochastische variabele en heeft een kansverdeling.
  • Wat kunnen we zeggen zeggen over de kansverdeling van gem.x

    1. De verwachting van de kansverdeling van het steekproefgemiddelde is de verwachting van de populatie waaruit de steekproef wordt genomen. Mu,x = E(gem.x) = Mu
    2. De standaardafwijking van de kansverdeling van het steekproefgemiddelde is gelijk aan sig,x = sig / sqrt(n)
    sig,x = standaardfout van het gemiddelde
  • Welke twee belangrijke stellingen kunnen we maken?

    1: Steekproef uit een normale verdeling
    Als een aselecte steekproef van n waarnemingen uit een populatie met een normale kansverdeling wordt genomen, zal de kansverdeling van gem,x een normale verdeling

    2: Steekproef uit een willekeurige verdeling: centrale limietstelling
    Als een aselecte steekproef van n waarnemingen uit een willekeurige populatie met verwachting mu en standaardafwijking sigma wordt genomen, zal, als n groot genoeg is (>30), de kansverdeling van gem,x bij benadering normaal zijn met mu,x = mu en sigma,x = sigma / sqrt(n). Hoe groter de steekproef des te beter zal de benadering zijn
  • 7 Betrouwbaarheidsintervallen gebaseerd op een enkele steekproef

    Dit is een preview. Er zijn 4 andere flashcards beschikbaar voor hoofdstuk 7
    Laat hier meer flashcards zien

  • Wat is een schatter/puntschatter?

    Een schatter voor een populatieparameter is een regel of een formule die ons zegt hoe we uit de steekproef een getal moeten berekenen om de populatieparameter te schatten. Een schatter is dus een steekproefgrootheid. De uitkomst van een schatter noemen we een schatting
  • Wat is een betrouwbaarheidsinterval/intervalschatter?

    Is een regel of een formule die ons zegt hoe we uit de steekproef een interval moeten bereken dat de waarde van de parameter met een bepaalde waarschijnlijkheid bevat.
  • Welke voorwaarden zijn er voor de geldigheid van de formules voor een betrouwbaarheidsinterval voor mu?

    1. De streekproef is een aselecte steekproef uit de populatie. 
    2. De steekproefgrootte n is groot. Deze voorwaarde komt voort uit de centrale limietstelling. Hierdoor is de kansverdeling van x bij benadering normaal. Bij een grote n zal s ook een goede schatter zijn voor st.dev
  • Hoe werkt het betrouwbaarheidsinterval voor een verwachting bij kleine n?

    1. We kunnen niet langer veronderstellen dat de kansverdeling van -x bij benadering normaal is, omdat de centrale limietstelling geldt voor grote n. Enkel als de populatie waaruit de steekproef komt normaal verdeeld is, is de kansverdeling van -x exact normaal. 
    2. De standaardafwijking st.dev van de populatie is bijna altijd onbekend. Bij kleine steekproeven kan s van de steekproef een slechte benadering zijn. Als de populatie normaal is, kunnen we gebruikmaken van de steekproefgrootheid t
LET OP!!! Er zijn slechts 60 flashcards en notities beschikbaar voor dit materiaal. Deze samenvatting is mogelijk niet volledig. Zoek a.u.b. soortgelijke of andere samenvattingen.

Om verder te lezen, klik hier:

Lees volledige samenvatting
Deze samenvatting +380.000 andere samenvattingen Een unieke studietool Een oefentool voor deze samenvatting Studiecoaching met filmpjes
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart