ω², η² en ANOVA - Variatieanalyse

15 belangrijke vragen over ω², η² en ANOVA - Variatieanalyse

Wat doen we in het geval van een predictor met meer dan twee categorieën?

dummycoderen we daarvoor de variabele tot meerdere categorische predictors met elk twee categorieën.

Wat presenteren de b's?

de verschillen tussen gemiddelden. Als we meer dan twee gemiddelden willen vergelijken, kan dat dus met het lineaire model. In een situatie met drie condities, ziet het model er bijvoorbeeld als volgt uit:

In de situatie met drie condities levert dummycodering het volgende op:

De voorspelde uitkomstwaarden van het model zijn de gemiddelden van de groepen. Met andere woorden: als we een uitkomst willen voorspellen en we weten tot welke groep de persoon in kwestie behoort, dan is het groepsgemiddelde de beste schatting die we kunnen maken.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Voor de controlegroep, met de dummyvariabelen beiden 0, geldt dan (als we de foutfactor negeren):

De condities 1 en 2 vallen uit het model weg. De voorspelde waarde is het gemiddelde van de controlegroep. In het model is b0 altijd de baselinecategorie.

Op dezelfde manier kunnen we de uitkomst voor conditie 1 bepalen:

Formules

Wat is er met de scenario met drie condities?

Dit scenario met drie condities, kan met dezelfde aanpak worden uitgebreid naar een model met vier groepen.

Variantie en variatie (de sum of squares) zijn als volgt aan elkaar gerelateerd:

s^2 = SS/(N – 1). Dan geldt ook: SS = s2 (N – 1). Op grond hiervan kunnen we de totale sum of squares (SST) bepalen aan de hand van de variantie van alle datapunten (de grand variance), onafhankelijk van de groep waaruit de datapunten afkomstig zijn, namelijk als volgt:

(De vrijheidsgraden zijn in dit geval N – 1, de steekproefomvang minus 1.)

Vervolgens willen we weten hoeveel van de totale variatie verklaard wordt door het model.

Omdat het model de uitkomst voorspelt op basis van de gemiddelden van de verschillende groepen, geeft de model sum of squares (SSM) aan hoeveel van de totale variatie in de uitkomst kan worden verklaard door het feit dat verschillende scores uit verschillende groepen afkomstig zijn. Met andere woorden, SSM gebruikt de verschillen tussen het gemiddelde van de uitkomst en de groepsgemiddelden. De gemakkelijkste manier om SSM te berekenen is als volgt:

SSM formule in woorden:

bereken het verschil tussen het gemiddelde van elke groep en het totale gemiddelde, kwadrateer deze verschillen, vermenigvuldig elk resultaat met het aantal deelnemers binnen de groep en tel de waarden van elke groep bij elkaar op. (De vrijheidsgraden zijn in dit geval k – 1, het aantal groepen minus 1.)

Tenslotte maakt de residual sum of squares (SSR) duidelijk hoeveel van de totale variatie niet wordt verklaard door het model, maar door meetfouten en andere afwijkingen.

SSR wordt berekend door het verschil te berekenen tussen een datapunt van een deelnemer en het gemiddelde van de groep waartoe de deelnemer behoort en kan worden uitgedrukt als SSgroep1 + SSgroep2 + … + SSgroepk.

In formule:

(De vrijheidsgraden zijn in dit geval N – k, het totaal aantal vrijheidsgraden minus de vrijheidsgraden van het model.)

SSR en SST zijn afhankelijk

van het totale aantal datapunten.

Dat we desondanks niet kiezen voor een opzet van meerdere modellen met elk twee te vergelijken gemiddelden, ligt in het feit dat?

elke keer dat een test met dezelfde data wordt gedaan de hoeveelheid type 1-fouten groter wordt. Bij een enkelvoudige test met meer gemiddelden blijft het aantal type 1-fouten beperkt.

De formule voor t (in de t-toets voor onafhankelijke steekproeven, zie pagina 79) en die voor F komen tot op zekere hoogte overeen

Voor beide geldt dat de formule hoger is als er meer ‘signaal’ is dan ‘ruis’. Dit correspondeert in beide gevallen met extreme waarden van t en F, wat weer correspondeert met lagere p-waarden

Bij het vergelijken van gemiddelden met een lineair model, kunnen?

alle mogelijke vormen van bias optreden. We testen op schending van aannames, zoals de aanname van gelijke varianties, op basis van data binnen groepen, niet over de hele steekproef.

Zoals met elk lineair model nemen we aan dat de variantie van de uitkomst stabiel blijft als de predictor wijzigt

Als de groepen verschillen in omvang, kan schending van deze aanname van homogeniteit van variantie ernstige gevolgen hebben. Deze aanname kan worden getoetst met Levene’s test. Als de uitkomst van deze test significant is, zijn de varianties significant verschillend en is er volgens de conventionele benadering reden voor aanpassingen

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo