Kijken naar gegevens - relaties

10 belangrijke vragen over Kijken naar gegevens - relaties

Wat is een spreidingsdiagram? (scatterplot)
Hoe kan het globale patroon beschreven worden?

Een spreidingsdiagram toont het verband tussen twee kwantitatieve variabelen gemeten bij dezelfde individuen. Indien het onderscheid te maken valt dan verklarende variabele op x-as en de te verklaren variabele op de y-as.
Beschrijving door vorm, richting en sterkte van de relatie:
  • vorm: zijn er verschillende clusters aanwezig?
  • richting: positieve of negatieve samenhang:
    bvb. negatief: ene hoge waarde, dan andere lage waarde
  • sterkte: bvb. sterk lineair verband aanwezig?
  • zijn er uitschieters?
Soms kan de relatie tussen twee weergegeven variabelen niet geheel worden doozien zonder kennis te hebben van een derde variabele.
Onvolledige data kan de interpretatie ook bemoeilijken.

Wat wordt bedoeld met gladstrijken van een spreidingsdiagram?

  • y-waarden uitmiddelen bij een dezelfde x-waarde
  • in vertikale stroken verdelen en in elke strook de mediaan (evt. gemiddelde, maar minder resistent) berekenen.
Men noemt dit ook het mediaanspoor.
ZIjn er lineaire relaties, gebogen vormen of clusters?

Welke numerieke maat gebruiken we als aanvulling op het spreidingsdiagram?

Correlatie. (Francis Galton, 1888, r 'de index van co-relatie')
Deze meet de richting en de sterkte van de lineaire relatie tussen twee kwantitatieve variabelen.

Dit getal ligt altijd tussen -1 en 1.
De correlatie is niet resistent (sterk afwijkende waarnemingen kunnen r in grote mate beinvloeden).
Wanneer geen lineaire relatie aanwezig is, dan is het getal r onbruikbaar.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Van waar komt de term regressie?

Francis Galton, onderzoek naar erfelijkheid.
Lange ouders -> lange kinderen, maar niet zo lang als de ouders.
Regressie naar de middelmaat

Wat word bedoelt met 'y dakje 'y hat' ?

Het gaat hier om een voorspelling en zal over het algemeen niet identiek zijn aan de werkelijk waargenomen reactie .

Wat is de betekenis van bij regressie?

De fractie van de variatie in de y-waarden die verklaard zordt door de kleinste-kwadratenregressie van y op x.

Hoe kan men verborgen variabelen ontdekken die systematisch met de tijd veranderen?

Zet zowel de te verklaren variabele alsook de regressieresiduen uit tegen de tijdsvolgorde van de waarnemingen.

De waarden van kunnen misleidend laag zijn door het 'beperkt bereik probleem'. Leg uit!

De gegevens bevatten geen informatie over het volledige bereik van de verklarende variabelen. Bvb. Studenten worden toegelaten na goede resultaten in een toelatingsproef. We zullen echter nooit geen studieresultaten hebben van de niet toegelaten studenten met lage cijfers op de toelatingsproef.

Lineaire groei versus exponentiele groei?

Lineaire groei stijgt per tijdsperiode met een vaste hoeveelheid; exponentiele groei stijgt met een vast percentage van het voorafgaande totaal.
Door een logaritmische transformatie toe te passen krijgen we terug een lineair verband. Dan kunnen we lineaire regressie toepassen van log y op x.

Geef enkele verklaringen voor samenhang tussen twee variabelen!

  • Oorzaak en gevolg: dit kan enkel d.m.v. een zorgvuldig ontworpen experiment (beheerst effect van verborgen variabelen), maar dit is moreel of praktisch niet altijd mogelijk.
  • gemeenschappelijke afhankelijkheid
  • verstrengeling: we kunnen niks zeggen van de invloed van x op y als x verstrengeld is met een andere variabele z (hun effect op een te verklaren variabele is vermengd). bvb. type anesthesie is afhankelijk van de soort ingreep en bijgevolg is zijn invloed op de overlevingskans moeilijk te bepalen.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo