Factoriële designs - T-toetsen (FIELD

35 belangrijke vragen over Factoriële designs - T-toetsen (FIELD

Geef een voorbeeld van waarbij twee condities worden vergeleken;

Werken dieetpillen? neem twee groepen die random worden toegewezen in een groep met dieetpillen en een groep met placebo's. Als de groep met dieetpillen meer afvalt kunnen we concluderen dat dieetpillen werken.

10.5:
Wat is het verschil tussen een onafhankelijke t-toets en een gepaarde t-toets?

Met een t-toets bereken je het verschil tussen de gemiddelden van 2 groepen

De onafhankelijke wordt gebruikt als je de gemiddelden van 2 verschillende entiteiten (groepen/gehelen) wilt vergelijken.
andere namen: independent-measures of independent-means t-test  

Gepaarde wordt gebruikt als je in dezelfde of verwante entiteit  gemiddelden wilt vergelijken.
De paired t-test vergelijkt niet de gemiddelde van twee groepen, maar de gemiddelde verschilscore tussen gepaarde waarnemingen.
Andere namen: dependent t-test of matched-paired t-test.

Wat is het voordeel van systematisch manipuleren?

Systematisch manipuleren van de onafhankelijke variabele (predictor) is een krachtig instrument, omdat het een stap verder gaat dan alleen observeren.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Welke twee soorten t test kennen we?

Independent (onafhankelijk) t-test en de Paired-sample t-test (dependent afhankelijk)

Als verschil tussen steekproeven groter is dan we op basis van SE hadden verwacht, door welke 2 dingen kan dit worden verklaard?

  • Er is geen effect, maar de steekproefgemidd uit onze populatie fluctueren veel en we hebben toevallig 2 steekproeven verzameld die veel van elkaar verschillen.
  • De steekproeven komen uit verschillende populaties en het verschil is een echt verschil tussen de steekproeven en de 0-hypothese is onwaarschijnlijk.

Welke 2 verklaringen zijn er voor een groter verschil in steekproefgemiddelden dan verwacht op basis van de standaardfout?

1. Er is geen effect, maar de steekproefgemiddelden fluctueren te sterk.
2. De steekproefgemiddelden komen uit verschillende populaties.

Hoe groter het verschil in steekproefgemiddelden, hoe waarschijnlijker rede 2 is.    

10.5.1
De meeste toets statistieken zijn een signaal-ruis verhouding. De variantie verklaard wordt gedeeld door de onverklaarde variantie. Oftewel: het effect wordt gedeeld door error.
Hoe zit de t-statistiek eruit?

Waargenomen verschil tussen steekproefgemidd minus verwacht verschil tussen populatiegemidd gedeeld door een geschatte SE van het verschil tussen 2 steekproefgemidd.

Als 0-hypo is waar danD = 0 ; we verwachten geen verschil tussen populatiegemidd.

Hoe moet de waarde van t worden geïnterpreteerd?

Feitelijk is t de verhouding tussen effect en ruis. Als we een effect van een manipulatie verwachten, moet het effect groter zijn dan de ruis en groter dan 1 zijn.

De waarde van t kan worden gebruikt om een p-waarde te bepalen en te vergelijken met het significantieniveau. Als p kleiner is dan alfa, dan had deze effect. 

Er zijn twee varianten van de t-test:

-Independent t-test: Deze test wordt gebruik om twee gemiddelde te vergelijken, die komen uit verschillendegroepen.


-Paired-samples t-test: Ook wel dependent t-test, wordt gebruikt wanneer je twee gemiddelde wil vergelijken die uit dezelfde of gerelateerde groepenkomen.

Welke maar wordt gehanteerd voor het bereken van de effectgrote van een t-toets?

Voor een t-toets wordt de effectgrote berekend met Cohens d of r.

Hoe kunnen de effectgroottes van omega^2 geïnterpreteerd worden?

0.01: gering
0.06: middelmatig
0.14: sterk

10.5.2 Gepaarde t-toets
Uit de steekproeftheorie weten we dat gemiddelden sterk lijkt op de populatiegemidd. Gebeurt het vaak dat het een gemiddelde zeer afwijkt van het populatiegemidd?

Het is mogelijk, maar het gebeurt vrij weinig.

Hoe wordt de SD  van de steekproevenverdeling van verschillen tussen gemiddelden genoemd? En wat zegt het als deze klein is of groot?

Dat is de SE van verschillen (standard error of differences).
Het geeft inzicht in de spreiding van steekproefgemidd.
Als SE klein --> het verschil tussen de gemiddelden van de gepaarde steekproefgemidd ligt dichtbij het populatiegemidd.

De SE helpt ons om te peilen wat maakt dat er afwijkingen zijn. Substantiële verschillen zijn gebruikelijker dan dat de steekproefgemiddelen gecentreerd zijn rond 0.
-----> SE levert een meetschaal op: hoe plausibel is het dat het waargenomen verschil tussen steekproefgemidd de uitkomsten zijn van het afnemen van 2 willekeurige steekproeven uit dezelfde populatie.

Wanneer gebruik je een gepaarde t-toets?

De paired samples t-test (gepaarde t-toets) gebruik je om het verschil tussen twee herhaalde metingen te toetsen. Gepaarde steekproeven zijn afhankelijk van elkaar (bijvoorbeeld de lengte meten van dezelfde personen in 2015 en 2018. Omdat je dezelfde persoon meet, zijn deze waarden afhankelijk van elkaar - within subjects design). Een klassiek voorbeeld de voor- en de nameting.

Wat doet de T-test voor gepaardesteekproeven?


·Vergelijkt twee gemiddelden gebaseerd op gerelateerdedata.
·Bijv. data vergaard bij mensen op twee verschillendetijdstippen.
·Data van gekoppelde (matched)steekproeven
-T-test voor onafhankelijkesteekproeven
·Vergelijkt twee gemiddelden gebaseerd op onafhankelijkedata
·Bijv. data vergaard onder verschillende groepenmensen. Testen op significantie

Welke typen t-toetsen worden er onderscheiden?

Een between- en within-subjects design. (De aanname is dat de groepen niet homogeen zijn).

Onder welke 3 voorwaarden zijn de resultaten van een t-toets betrouwbaar?

  1. De afhankelijke variabele wordt gemeten op interval- of rationiveau (scale).
  2. De personen binnen de twee groepen zijn onafhankelijk van elkaar. Je kunt hiervoor werken met aselecte steekproeven.
  3. Als je steekproef minder dan 30 observaties telt, moet de afhankelijke variabele normaal verdeeld zijn. Dit kun je controleren in SPSS met de Shapiro-Wilk- of Kolmogorov-Smirnov-toets. Als de variabele niet normaal verdeeld is, kun je beter de Wilcoxon- of de Mann-Whitney-toets gebruiken.

D gemiddelde  is een effect size.  Wat is de betekenis hiervan?

Het is het gemiddelde verschil tussen de scores van mensen in 2 condities.

Wat neemt de onderzoeker aan als de uitkomst lager is dan alpha (.05)?

Dan neemt hij haar dat zijn manipulatie een significant effect heeft gehad en dat de verschillen tussen de scores niet ligt aan steekproefvariatie.

Hoe kan je een t-toets simpel (verhouding tussen signaal en ruis) omschrijven?

Een t-toets is een lijnfunctie met een intercept (snijpunt met de y-as bij x=0) en een hellingshoek. Omdat in een t-toets 2 groepen worden vergeleken, kan x maar 2 waarden aannemen (0 en 1). Dat betekent dan dat het intercept het gemiddelde van 'groep' 0 is, en de hellingshoek aangeeft hoeveel 'groep' 1 van 'groep' 0 gemiddeld verschilt.

10.5.3 Onafhankelijke t-toets.
Wat is zijn de verschillen met de gepaarde t-toetsen?

- dit zijn 2 verschillende scores die niet gerelateerd zijn.
- ook andere verschillen (naast de manipulatie) zullen meetellen, zoals IQ, motivatie, etc.).
- je gaat de gemiddelden op  'per conditie' met elkaar vergelijken.
- je berekent gemiddelde X1 en gemidd X2 uit en dit trek je van elkaar af.
- ook trek je de gemidd van 2 populatie van elkaar af 1 - 2
- de standaardfout  en ook het effect wordt anders berekend.

10.5.3 Onafhankelijke t-toets.
Wat is een gepoolde variantie?

Je hebt bijna altijd te maken met verschillende steekproefgroottes waardoor elke groep evenveel meetelt in de formule. Een grote steekproef moet meer gewicht hebben om te komen tot een goed gemiddelde (grotere steekproeven benaderen de populatie beter dan de kleinere).
---> de variantie van iedere steekproef wordt gewogen .

het is een gewogen gemiddelde

10.5.2 gepaarde t-toetsen.
Wat zijn gepaarde t-toetsen en zit er chronologie in de herhaalde meting?

De gepaarde t-toets wordt gebruikt om het verschil tussen twee ‘herhaalde metingen’ te toetsen. Het is van groot belang om te onthouden dat ‘herhaalde meting’ niet noodzakelijkerwijs een chronologie inhoudt. Een voor- en nameting is een klassiek voorbeeld van een herhaalde meting, maar een herhaalde meting is bijvoorbeeld ook de observatie van een moeder en een vader van het gedrag van hun kind. Kortom: in een binnenproefpersoonontwerp (within subjects design) kan een gepaarde t-toets uitkomst bieden.

Wanneer gebruik je een onafhankelijke t-toets?

Voor scores in een tussenproefpersoonontwerp (between-subjects design)kan een onafhankelijke t-toets uitkomst bieden.

10.8.6.
Effect sizes: ook al is de t-statistiek niet statistisch significant, het betekent niet dat het effect onbelangrijk is. Hoe zet je de t-waarde om in r-waarde?

Door t in het kwadraat te doen en deze te delen door de som van t in kwadraat en df.
Dan wortel trekken van deze uitkomst.

Waar gaat de Cohen's d over?

Dat is het verschil tussen 2 groepen, gecorrigeerd door sd. Je kijkt naar het verschil tussen 2 gemiddelden.
cohen's d = gemidd Y1 - gemidd Y2 gedeeld door sd van Y

Waarom deel je bij 2 groepen de uitkomst van Y1 - Y2 door de sd van de controlegroep?

Omdat men er vanuit gaat dat dit de meest zuivere schatter is, onder de aanname dat er geen effect is. Want de andere sd kan beïnvloed zijn door manipulatie/interventie/behandeling in de experimentele groep.

Verdere uitleg uitgeprint

De centrale limietstelling is een universele wetmatigheid. Wat is het?

De steekproevenverdeling van het gemiddelde is altijd normaal verdeeld --> als de steekproef maar groot genoeg is is de steekproevenverdeling van het gemiddeld normaal verdeeld.

Deze aanname gaat er vanuit dat de errors (residuals) van het model normaal verdeeld zijn, of de steekproevenverdeling of de parameter. NIET de data zelf.
Maar: om dat onderzoeker geen directe toegang heeft tot de steekproevenverdeling, maken ze een inschatting van de vorm. Je kijkt dan naar de data en als deze normaal is verdeeld dan ga je er vanuit dat de errrors in het model en de steekproevenverdeling ook normaal verdeeld zijn.

Welke stappen zet je om de normaalverdeling te bekijken?

- schatting van de parameter = variabele waaraan een bepaalde waarde wordt toegekend om met behulp daarvan andere onbekende grootheden te kunnen berekenen.
Het gemiddelde is een parameter

- betrouwbaarheidsintervallen.

- NHST

10.9.2
Als je wilt testen op normaliteit bij gepaarde t-toetsen, wat zijn dan de stappen?

Bij de gepaarde t-toets hoort de steekproevenverdeling van de verschilscores. Je moet dus berekenen wat de verschillen zijn tussen de scores. Vervolgens controleren of de nieuwe variabele normaal verdeeld is.

Of neem een hele grote steekproef, dan hoef je je geen zorgen te maken over de normaliteit.

Wat hier staat is: in een t-toets (in dit geval de gepaarde) wordt de verschiltoets niet gedaan op de twee vergeleken scores, maar op de verschilscore van de twee vergeleken scores. Deze, en niet de twee losse scores, moet normaal verdeeld zijn.

Klopt het dat de t bij een gepaarde t-toets leidt tot een overschatting van de populatie effectgrootte (uitkomst r)?

Ja, dat klopt, om die reden moet je de cohen's d berekenen in plaats van de r.

maar de uitkomst blijft hoe dan ook groot. Dat is goed, omdat het consistentie betekent in beide studies --> want ze laten beide het verschil tussen gemiddelden zien.

zie formule blz 3 samenvatting


Waarom moet statistische significantie worden onderscheiden van ‘praktische significantie’ ?

Over het algemeen de regel wordt gehanteerd dat als de uitgerekende kans (p-waarde) kleiner is dan .05, de nulhypothese kan worden verworpen.
Maar aan de grootte van de p-waarde is geen conclusie te ontlenen. Het zegt niets over de verschillen of de mate waarin de afhankelijke factor bijdraagt aan de verschillen of de variantie van de afhankelijke variabele.
Je moet weten wat of het significante effect ook uitmaakt.

Waarom is het nog meer nodig om naast significantie ook effectgrootte te weten of te weten wat de mate is waarin de gemiddelden van elkaar verschillen?

Omdat als een steekproef maar groot genoeg is, deze altijd een vorm van significantie laat zien.

Wat is bij t-toets geschikt effectgrootte maat? En bij ANOVA, ANCOVA en repeated measures ANOVA?

Bij een t-toets is een Cohen’s d een geschikte maat. Helaas wordt deze niet in SPSS gegeven en zal deze middels de formule te vinden in Field (blz 386) met de hand worden berekend.
De effectgrootten bij de andere 3 worden uitgedrukt met een partieel ètakwadraat (ɳ2).

Wanneer wordt de independent t-toets gebruikt?

De independent-samples t-test (of onafhankelijke t-test) wordt gebruikt wanneer twee groepen aan twee verschillende condities worden onderworpen en je de scores van de groepen met elkaar wil vergelijken. Een voorbeeld hiervan zou het toedienen van koffie kunnen zijn om het effect van koffie op een reactietaakje te meten. De helft van de proefpersonen krijgt dan koffie voordat het reactietaakje gedaan wordt en de andere helft niet.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo