Lineaire regressie en correlatie

10 belangrijke vragen over Lineaire regressie en correlatie

Wat houdt een lineaire regressie in? Wat is de nulhypothese hierbij?

Regressieanalyse = bij een regressieanalyse willen we kijken of er een statistisch significante associatie is tussen een kwantitatieve y en een kwantitatieve x (e.g. ‘het tentamen cijfer Y’ en ‘de uren zelfstudie X’).
- De nulhypothese is dan: er is geen associatie.
- Formule H0 = p=0 & R=0

Wat is een ANOVA? Wat stelt de nulhypothese?

ANOVA = Een kwantitatieve afhankelijke variabele en een kwalitatieve X.
- De nulhypothese is: dat de gemiddelden van de groepen gelijk zijn.
Dat zou betekenen dat de variantie in onze afhankelijke variabele niet verklaard zou kunnen worden door de ‘tussen groep’ (between groups) variantie.

De formule y = a + Bx drukt waarneming op y (responsvariabele) uit als een lineaire functie van waarnemingen op de x (verklarende variabele). Als een spreidingsdiagram suggereert dat het model voor een parameter y = Bx geschikt kan zijn, gebruiken we de voorspellingsvergelijking y dakje = a + bx om het lineaire model te schatten. Wat is hierbij het residue en hoe wordt de grootte samengevat?

Residu = het verschil tussen een waargenomen responsvariabele en de waarde die wordt voorspeld door de voorspellingsvergelijking
- De grootte van de residuen wordt samengevat door de som van hun gekwadrateerde waarden: zie foto
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Een correlatie wordt aangegeven met een r. Wat houdt de correlatie eigenlijk in in deze situatie?

De correlatie = de gestandaardiseerde versie van de helling b om te corrigeren voor het feit dat de standaarddeviaties van x en y (sx, sy) afhangen van hun meeteenheden.

Een correlatie wordt aangegeven met een r. Wat houdt de correlatie eigenlijk in in deze situatie?

De correlatie = de gestandaardiseerde versie van de helling b om te corrigeren voor het feit dat de standaarddeviaties van x en y (sx, sy) afhangen van hun meeteenheden.

De maat die r2 of determinatiecoefficient wordt genoemd, vat samen hoe goed x y kan voorspellen (R = TSS - SSE / TSS). Wat is hierbij de nulhypothese B = 0?

B = 0 betekent dat de twee variabelen statistisch onafhankelijk zijn en dat er geen correlatie is.

In een regressie analyse is de functie voor de populatie yi = B0 + BXi + Ej. De Yi' is hierbij de voorspelde waarde voor Y, de Xi de geobserveerde waarde voor persoon i, de B0 de intercept en de B de slope. Wat betekent Yi-My, Yi'-My en Yi-Yi'?

- Yi-My = de totale afwijking van één puntje naar het gemiddelde (blauw gemaakt in de afbeelding).

- Yi’-My = het stukje van de voorspelde waarde tot aan het gemiddelde
(groen).

- Yi-Yi’ = het stukje tussen de echte waarde van Y en de voorspelde waarde van Y (geel).

In een regressie analyse is de functie voor de populatie yi = B0 + BXi + Ej. De Yi' is hierbij de voorspelde waarde voor Y, de Xi de geobserveerde waarde voor persoon i, de B0 de intercept en de B de slope. Wat is de R2 (R kwadraat) en de standaarderror van de estimate (SEest)?

- De R2 = de proportie verklaarde variantie/de totale variantie.
- De standaarderror of the estimate (SEest) = hoe precies we de coefficient
schatten.

Wat is de kleinste kwadratenmethode?

Kleinste kwadratenmethode = de b0 en b worden zo berekend dat ze de beste voorspelling geven voor y (de som van y-y kwadraat).

Wat zijn de vijf aannames van een bivariate lineaire regressie?

Bivariate lineaire regressie (gebruik hiervoor een scatterplot)
1. Afhankelijke variabele is kwantitatief en de onafhankelijke variabele is kwantitatief of ditochoom
2. Er is een lineaire relatie tussen x en y (lineairiteit)
3. Er is sprake van onafhankelijke observaties
4. De variantie van de errors is gelijk
5. Fouten zijn normaal verdeeld met een gemiddelde van 0 voor alle waarden van X

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo