Variabelen beschrijven en data-integriteit verifiëren - univariate analyse - Centrum en spreidingsmaten

3 belangrijke vragen over Variabelen beschrijven en data-integriteit verifiëren - univariate analyse - Centrum en spreidingsmaten

Variatie (Sum of Squares; SS)

  • Bereken eerst het gemiddelde van een datareeks
  • Vervolgens het verschil van een datapunt met het gemiddelde (< gemiddelde = een mingetal; > dan het gemiddelde is een plusgetal!) = afwijking
  • Zou je deze afwijkingen van het gemiddelde bij elkaar optellen, kom je altijd op 0 uit. Dit is logisch: het gemiddelde ligt immers precies in het midden van alle datapunten.


  • Daarom: de afwijking kwadrateren (= met zichzelf vermenigvuldigen)
  • Als we deze kwadraten bij elkaar optellen, komen we wel uit op een positief getal: variatie.


Nadeel:
De variatie wordt groter naarmate we datapunten aan de datareeks toevoegen, terwijl de spreiding niet noodzakelijk ook meer wordt.

Variantie (Mean Squares; MS)

Het gemiddelde van de kwadraten.
Een gemiddelde gekwadrateerde afwijking van het gemiddelde.

In de formule van de variantie trekken we 1 af van het aantal datapunten (veiligheidsgraden van deze datareeks).

Dus:
Variantie = optellen van de afwijkingen / (het aantal opgetelde afwijkingen - 1)

Rangschik de spreidingvariaties van groot naar klein:

1. Sum of Squares
2. Variantie
3. Standaardeviatie

De variatie (SS) is de variantie vóórdat deze gecorrigeerd is voor het aantal datapunyten en de variatie is dus altijd groter dan de variantie. De standaardeviatie is de wortel van de variantie en dus altijd de kleinste van de drie.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo