Natascha experimenteel - Ethiek van experimenteel onderzoek

176 belangrijke vragen over Natascha experimenteel - Ethiek van experimenteel onderzoek

Bedreigers van IV in experimenteel onderzoek. Uitval (experimental mortality)

PP die niet meer vergelijkbaar door verschillende steekproefkenmerken op eigenschappen die voor het onderzoek relevant zijn.

Bedreigers van IV in experimenteel onderzoek. Interactie tussen bedreigers.

Een combinatie van bedreigers die elkaar versterken.

Bedreigers van de externe validiteit. Interactie voormeting en externe stimulus.

Wanneer de voormeting een situatie creëert die zich buiten het experiment niet voor zou doen; b.v. De voormeting maakt deelnemers meer bewust van waarnaar ze worden gevraagd. Naast leren uit de voormeting (probleem van IV) is een voormeting ook onnatuurlijk; in de realiteit worden mensen niet gemeten voordat ze gedrag vertonen. Om reactiviteit te voorkomen kan de onderzoeker de voormeting weglaten, kiezen voor een retrospectieve voormeting of pp misleiden.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Bedreigers van externe validiteit. Reactieve experimentele locatie.

Pp kunnen zich te coöperatief opstellen jegens de proefleider, maar ook verwachtingen die proefleiders hebben over de resultaten van het experiment kunnen soms een aantoonbaar effect hebben op die resultaten, ook wel 'experimenter bias'. Het is ook mogelijk dat proefleiders op grond van hun ideeën over de uitkomsten van het experiment, bepaalde reacties of gedragingen die in strijd zijn daarmee, niet opmerken of signaleren of 'selectieve perceptie'. Dit kan men voorkomen door deelnemers blind te houden voor de conditie waarin ze ingedeeld zijn. Als ook de proefleiders deze info niet hebben, is het experiment 'dubbelblind'.

Experimenter bias is lastig te kwalificeren als een bedreiger van interne of externe validiteit. De redenen om het bij externe validiteit te plaatsen ijn bijzonder subtiel verschillend van de redenen om het bij interne validiteit te plaatsen. Waarom experimenter bias och als een bedreiging van externe validiteit wordt genoemd is dat de aanwezige proefleider een bijzondere omgeving schept

Met de eigen aanwezigheid en de eigen biases. Dezelfde groep personen met dezelfde experimentele manipulaties zouden zich bij een andere proefleider anders gedragen. Omdat dit heel dicht aanleunt tegen ecologische validiteit wordt experimenter bias bij de externe validiteitsbedreigers ingedeeld. Consensus hierover ontbreek echter.

Een nadeel van within-subject designs is dat er volgorde-effecten kunnen optreden. Om dit te voorkomen gebruikt men counterbalancing:

het over deelnemers varieren van de volgorde waarin treatmens worden aangeboden.

Mill's method voorkomt dat experimenteel onderzoek de vorm 'onschuldig is tot schuldig bewezen' aanneemt. Het gebeurt weleens dat een onderzoeker een sterke claim doet op basis van een observatie en critici worden uitgedaagd om dan maar te bewijzen dat deze claim niet waar is.

Een goed onderzoeker test dus zelf beide claims

Via ... kunnen allerlei externe factoren die naast of in plaats van de experimentele variabele effect kunnen hebben op de afhankelijke variabele onder controle worden gehouden

randomisatie

Matchen en homogeniseren zijn methodes die trachten de experimentele en controlegroep gelijk te maken op een aantal externe bekende kenmerken waarvan men denkt dat ze in belangrijke mate van invloed zijn op

De afhankelijke variabele

Bij matching wordt rekening gehouden met de diversiteit in een populatie. Men dekt een bredere populatie in het onderzoek, maar essentiële verschillen (leeftijd, geslacht) worden opgelost door

in iedere conditie iemand te plaatsen die op belangrijke achtergrondkenmerken gelijk is.

Matching kan middels precisiecontrole, maar als het volstaat dat de achtergrondkenmerken op zichzelf voldoende voorkomen in elke conditie, gebruikt men

Globale controle

Homogeniseren; men wil geen diversiteit in de populatie en dus een nauwere populatie dekken door zo veel mogelijk achtergrondverschillen uit te sorteren zodat

in de steekproef een heel specifiek soort van deelnemers overblijft.

Causaties kunnen bestudeerd worden in experimentele context waarbij pp bijvoorbeeld d.m.v. Randomisatie

Willekeurig over twee groepen worden verdeeld.

Als de steekproef maar groot genoeg is dan wordt elke afwijking van nul, hoe klein ook,

In de steekproef significant.

Voorwaarde 2 voor een causaal verband; de predictor mag in tijd voorafgaan aan het effect.

Het gevolg mag niet optreden als de oorzaak niet aanwezig is en het gevolg moet (in theorie) altijd optreden als de oorzaak aanwezig is.

Men moet er zeker van zijn dat een causaal verband niet veroorzaakt is door een andere variabele dan degene die bestudeerd wordt.

Er mag behalve de predictor dus geen andere plausibele verklaring te vinden zijn voor het optreden van het gevolg

In een ... worden de gegevens op twee of meer tijdstippen verzameld bij dezelfde subjecten.

longitudinaal dataverzameling

Het verlies van controle over sommige bedreigingen enerzijds kan daarom soms gecompenseerd worden met

een winst in ecologische validiteit

Een gecontroleerde methode van waarnemen waarbij de waarden van één of meer onafhankelijke variabelen door de onderzoeken worden gemanipuleerd om het oorzakelijke of causale effect vast te stellen op één of meer afhankelijke variabelen

Experiment

Proceduresectie. Bondig maar voldoende gedetailleerd om replicatie mogelijk te maken. Moet informatie bevatten over;

Ethiek, samenvatting informed consent, beschrijving experimentele manipulatie, duur van het onderzoek, eventuele beloning voor deelname.

Bedreigers van interne validiteit. Instrumentatie.

Door verandering van meetinstrument of beoordelaar verandert het resultaat. Oplossing; retrospectieve voormeting.

Met ... kan men enkel verbanden tussen variabelen aantonen, maar geen causaliteit: variabelen worden gemeten zonder te manipuleren.

correlationeel onderzoek

... geeft de met van samenhang tussen twee variabelen weer, oftewel in hoeverre twee variabelen elkaar beïnvloeden.

Correlatie

Pearson's r meet lineaire correlatie en kan gebruikt worden wanneer de variabelen

op een continue schaal ('scale') gemeten worden. Bijvoorbeeld lengte of gewicht.

Power is de waarschijnlijkheid dat de nulhypothese verworpen wordt

Gegeven de werkelijkheid van de populatie op grond waarvan dit inderdaad zou moeten gebeuren.

Met een experimenteel onderzoek kan men causaliteit aantonen door de onafhankelijke variabele te manipuleren, ... en te controleren op confounders.

de invloed te meten op de afhankelijke variabele

Factorieel design. Ieder niveau van de ene onafhankelijke variabele wordt gecombineerd met ieder niveau van de andere variabele

om verschillende condities te creëren.

Men spreekt van two-way design bij manipulatie van twee onafhankelijke variabelen,

van three-way design bij drie onafhankelijke variabelen.

In mixed factorieel design wordt (minstens) één variabele between subjects gevarieerd

en (minstens) één variabele within subjects

Factoriele ANOVA. Variante berekenen, F berekenen.


2 onafhankelijke variabelen, nominaal
1 afhankelijke variabele, interval +

Repeated measures. F berekenen: experimenteel effect binnen het individu.

Drie of meer meetmomenten bij dezelfde deelnemer.

Multilevel analyse. Onderzoek met herhaalde metingen nadat aannames geschonden zijn.


2 onafhankelijke variabele, interval +
1 afhankelijke variabele, interval +

Bij toetsing op een significantieniveau van A = 5%, accepteert men 1/20 kans op een type-1-fout, het onterecht verwerpen van de nulhypothese,

Oftewel het significant resultaat te vinden terwijl er geen verband is in de populatie.

Bij een t-toets wordt daarom een uitspraak gedaan adhv een 95& bi (1-0.05). Maar als er meerdere t-toetsen nodig zijn omdat er meer dan eén (paarsgewijze) waarneming wordt vergeleken,

Heeft elk van die t-toetsen 5% kans op een type-1 fout toe.

Kanskapitalisme. Deze afname van b is exponentieel. De nieuwe betrouwbaarheid is gelijk aan de initiele betrouwbaarheid tot de macht van het aantal toetsen.

Bijvoorbeeld bij het vergelijken van drie groepen zal de kans op een type-1-fout van 5% toenemen tot 14%.

Manipulatiechecks. Gaan altijd over verbanden met variabelen die niet de afhankelijke variabele zijn.

Er wordt namelijk nog geen hypothese getoets.

In sommige experimenten wordt bedrog gebruikt. Een manipulatie kan dan bijvoorbeeld de vraag zijn of de proefpersoon het voorgelogen verhaal gelooft.

In dit geval fungeert de manipulatiecheck als filter: respondenten die het verhaal niet geloven, zijn problematisch voor de IV.

Bij het onderzoeken van meerdere variabelen (bijvoorbeeld naast type film ook popcornsmaak) blijft het

Proces van toetsing hetzelfde

Experimenteel onderzoek zoekt causale verklaringen door het systematisch manipuleren van de onafhankelijke variabele (...) waarvan men verwacht dat hij een effect zal hebben op de afhankelijke variabele.

Predictor

De eenvoudigste vorm van een experimenteel is het opsplitsen van het sample in een experimentele en een controlegroep die identiek zijn behalve wat betreft

de onafhankelijke variabele.

De t-toets wordt gebruikt om de gemiddelden van maximaal twee groepen te vergelijken en kan gezien worden als een lijnfunctie met intercept (b0) (snijpunt X-as) en hellingshoek b1. Omdat er maar twee waarden worden vergeleken kan x maar 2 waarden hebben (0 of 1).

Het intercept is dus het gemiddelde van groep 0 en de hellingshoek geeft aan hoeveel goep 1 gemiddeld van groep 0 verschilt.

Er zijn twee soorten t toetsen. 1. Paired samples t-toets (dependent t-test):

Om twee gemiddelden te vergelijken van condities die bestaan uit dezelfde of gerelateerde entiteiten (Within subjects!)

Er zijn twee soorten t toetsen. 2. independent t toets:

Om twee gemiddelden te vergelijken van condities die bestaan uit verschillende entiteiten. (Between-subjects).

Beide T-toetsen hebben een gelijkwaardige rationale (redenering)

Twee datasamples worden verzameld en hun gemiddelden berekend. Deze gemiddelden kunnen veel of weinig verschillen.

Als samples uit dezelfde populatie komen, verwacht men ruwweg gelijkende gemiddelden. Gemiddelden kunnen verschillend door sample variatie, maar grote verschillen zouden eerder zeldzaam moeten zijn.

Onder de nulhypothese wordt ervan uitgegaan dat de externe manipulatie geen effect heeft op het gedrag van de deelnemers, de gemiddelden van twee random samples zouden daarom gelijkend moeten zijn.

T toetsen. Het verschil tussen de gemiddelden die verwacht worden als er geen effect zou zijn (als de nulhypothese waar is). Standaardfout is een graadmeter voor de variabiliteit tussen sample gemiddelden. Als de standaardfout klein is, wordt verwacht dat alle samples heel gelijkende gemiddelden hebben.

Hoe groter de standaardfout, hoe waarschijnlijker grote verschillen worden in sample gemiddelden.

T-toetsen. Als het verschil tussen de gemiddelden groter is dan wat verwacht wordt volgens de standaardfout kan dat aan twee oorzaken hebben;

1. Er is geen effect. Maar sample gemiddelden uit de populatie fluctueren veel en de geselecteerde samples hebben erg verschillende gemiddelden geproduceerd.

T-toetsen. Als het verschil tussen de gemiddelden groter is dan wat verwacht wordt volgens de standaardfout kan dat aan twee oorzaken hebben;

2. De twee samples komen uit verschillende populaties en hebben daarom verschillende gemiddelden, die dus een echte indicatie zijn voor het verschil tussen de samples, de nulhypothese is dus onwaarschijnlijk.

De paired samples t-test (of dependent t-test) wordt gebruikt wanneer men dezelfde groep aan

Twee condities onderwerpt en deze twee scores vervolgens met elkaar vergelijkt.

Standard error of differences. Een kleine standaardfout suggereert dat het verschil tussen de gemiddelden van de meeste paren dicht bij het populatiegemiddelde ligt en

substantiële verschillende eerder zeldzaam zijn.

Standard error of differences.. Een grote standaardfout zegt dat het verschil tussen gemiddelden van de meeste paren van samples erg variabel kan zijn, ook al zullen de verschillen tussen de gemiddelden van de meeste paren nog steeds rond 0 centreren,

Maar substantiële verschillen van 0 komen vaker voor dan wanneer de standaardfout klein is.

Wanneer scores van twee groepen van verschillende deelnemers afkomstig zijn, zullen paren van scores niet enkel verschillen o.b.v. De experimentele manipulatie, maar ook

Door andere soorten variatie (b.v. motivatie, IQ).

Omdat de scores in beide condities geen logische connectie hebben, worden de gemiddelden ... vergeleken.

per conditie

Independent t test; men berekent het verschil tussen sample gemiddelden en niet

Tussen individuele paren van scores.

Zowel de gepaarde als de independant t-toets zijn parametrische testen en daarom onderhevig aan bronnen van

Bias.

De standaard two sample ongepaarde t-toets veronderstelt dar beide groepen uit een verdeling komen met

Dezelfde variantie (spreiding).

In SPSS kan de etakwadraat worden opgevraagd, maar de omegakwadraat is een betere maat voor effectgrootte.

Deze is lastig te berekenen, daarom is er een omegakwadraatcalculator gemaakt.

In onderzoek wordt vaak gewerkt met nulhypothese toetsen, d.w.z. Dat er getoetst wordt of de kans op een in het onderzoek gedane observatie klein is,

Gegeven de nulhypothese waar zou zijn.

Nulhypothesetoetsing is daarmee een ja/nee-spel: zodra de p-waarde kleiner is dan het gestelde criterium, maakt het niet uit

Hoe klein de p-waarde is: de observatie wordt onwaarschijnlijk geacht als de nulhypothese zou kloppen.

Toetsingsgrootheden en overschrijdingskansen meelden niets over de grootte van verschillen of voor de mate waarin een afhankelijke factor bijdraagt aan de variantie van de afhankelijke variabele.

Daarom moet statistische significantie worden onderscheiden van 'praktische significantie'.

Daarom os het nodig om naast de significantie ook de grootte van een effect vast te stellen,

Of de mate waarin gemiddelden van elkaar. Dit wordt in de statistiek effectgrootte genoemd.

Iedere statistische toets heeft een eigen effectgrootte. Om de te bepalen zijn er ruwweg twee benadering.

2. De effectgrootten kunnen in ANOVA, ANCOVA en repeated measures ANOVA worden uitgedrukt met een partieel eta-kwadraat (np2). Het voordeel van partial n2 is dat SPSS dit kan weergeven, maar deze effectgrootte is niet optimaal, en wordt best omgerekend naar de omegakwadraat (w2).

De effectgrootte van een T toets

Cohen's d - r

Er bestaan verschillende soorten Anova's; factoriele Anova bij twee of meer groepsvariabelen. Naast de verschillende groepen kunnen meerdere onafhankelijke variabelen getoetst worden o.b.v. Groepsgemiddelden.

Hiervoor kunnen naast de hoofdeffecten ook interactie-effecten ook interactie effecten tussen de onafhankelijke variabelen worden getoetst. De onafhankelijke variabelen in een factorial ANOVA zijn categorisch en de afhankelijke variabele is continu (between subjects design).

Mixed designs (ANOVA); als er twee types onafhankelijke variabelen in het design zitten

Ten minste één between-subject variabele en ten minste één within-subject variabele.

De ANOVA heeft als voordeel t.o.v. De T-toets dan men meerdere dingen tegelijk kan meten zonder

Kanskapitalisme

De One-way ANOVA is een parametrische toets procedure voor

Het testen van hypothesen over de gemiddelden van (semi-) continue data.

De ANOVA toetst of de gemiddelden van 2 of meer onafhankelijke groepen

Gelijk zijn.

De ongepaarde t-test is een parametrische test die gebruikt wordt bij 2 ongepaarde steekproeven waarbij een continue

Normaal verdeelde variabele vergeleken wordt.

In de praktijk wordt de one-way ANOVA alleen gebruikt bij het vergelijken van minstens

Drie groepen

De One-way ANOVA kan niet vertellen welke specifieke groepen statistisch significant van elkaar verschillen, maar geeft alleen aan dat ten minste

Twee groepen verschillend zijn.

De F-toets is een parametrische toets die nagaat

of de varianties van twee normale verdelingen verschilt.

De F-toets. Een score van 1 wil zeggen dat de varianties

Gelijk zijn.

F-toets. Is de variantie van de X-variabele groter dan die van de y-variabele dan krijgt men waarden groter dan 1

Tot oneindig.

In de Anova wordt de F-toets enkel gebruikt voor eenzijdig toetsen. Bovendien worden in deze analyse de varianties van de teller en de noemer

Gedeeld door het aantal vrijheidsgraden. Men toetst dus of de variantie tussen de groepen groter is dan de rest-variantie.

Voorbeeld; meting van de lichaamslengte van drie groepen: voetballers, handballers en basketballers. Er kunnen nu drie soorten varianties worden berekend.

1. De variantie als gevolg van de afwijking van de groepsgemiddelden t.o.v. Het algemene gemiddelde. Dit is de variantie tussen groepen.

Voorbeeld; meting van de lichaamslengte van drie groepen: voetballers, handballers en basketballers. Er kunnen nu drie soorten varianties worden berekend.

2. De variantie van elke onderzoekseenheid t.o.v. Het groepsgemiddelde van de eigen groep. Dit is de variantie binnen groepen.

Voorbeeld; meting van de lichaamslengte van drie groepen: voetballers, handballers en basketballers. Er kunnen nu drie soorten varianties worden berekend.

3. De variantie van elke onderzoekseenheid t.o.v. Het algemeen gemiddelde. Dit is de totale variantie.

De totale variantie bestaat dus uit de variantie tussen groepen + de variantie van de individuen t.o.v. Het groepsgemiddelde. Men kan nu vaststellen hoeveel procent van de groepsvariantie deel uitmaakt van de totale variantie (= 1/3) en hoeveel procent van de individuele variantie binnen de groepen deel uitmaakt van de totale variantie (=2/3). Op die manier kan men aangeven hoeveel procent van de totale variantie verklaard kan worden door die groepsindeling. Alles wat niet door de groepsindeling verklaard kan worden noemt men dan

Niet verklaarde variantie, restvariantie of error.

Substantieel wil zeggen of de variantie tussen groepen voldoende groot is om te kunnen zeggen dat de gemiddelden van elkaar verschillen. Want, als de variantie tussen groepen 0 is,

Is er geen verschil tussen de gemiddelden.

Om dat vast te stellen gaat men de variantie van de groepsgemiddelden delen door de variantie van de individuele onderzoekseenheden t.o.v.

De groepsgemiddelden.

Dat delen van de groepsgemiddelden door de variantie van de individuele onderzoekseenheden is niet juist, want de verschillen tussen de groepen

Zijn gebaseerd op veel individuen. Daarom dient men eerst de varianties door het aantal vrijheidsgraden te delen.

Zo berekent men dan een F-waarde die te vergelijken is met een F-waarde in een tabellenboek. Als de berekende F-waarde groter is dan de kritieke waarde in de tabel, dan zegt men

Dat er een statistische significant verschil is.

F waarden interpreteren. De F-test is een omnibus-test. De test levert enkel algemene informatie over of er verschillen zijn de gemiddelden tussen

De groepen

Een significante F geeft aan dat de gemiddelden van de samples

Niet gelijk zijn.

Verschillende modellen runnen die telkens 2 gemiddelden met elkaar vergelijken zou de kans op een type-1 fout vergroten,

Daarom is de f-test interessant.

De ANOVA wordt historisch gezien als een robuuste test. Ook in het geval dat een deel van de assumpties wordt geschonden het resultaat nog steeds interpreteerbaar is.

Tegen deze bewering zijn recnte bezwaren.

Ook voor de One-way ANOVA gelden de assumpties van het lineair model; normaalverdeling;

De afhankelijke variabele moet voor iedere groep normaal verdeeld zijn. Vast te stellen per groep, dus niet voor de volledige steekproef!

Assumpties bij het vergelijken van gemiddelden. Homogeniteit van varianties: de variantie van de afhankelijke variabele moet voor iedere groep ruwweg hetzelfde zijn,

De variantie van de uitkomst moet dezelfde blijven als de predictor wijzigt. Deze assumptie kan getest worden met de Levene's test. Als deze significanti is (p < 0.05), moet men concluderen dat de varianties significant verschillend zijn en dient dit bijgesteld te worden via de Brown-Forsythe F of Welch's F correctie.

Assumpties bij het vergelijken van gemiddelden. De scores zijn onafhankelijk: de assumptie dat de groepen uit verschillende deelnemers bestaan er geen

participanten in beide condities hebben gezeten.

Door het gebruik van de dummy-variabelen moeten 2 t-toetsen uitgevoerd worden om te bepalen of de coefficienten verschillen van 0, dit verhoogt de kans op een error. Daarbij komt ook dat de dummy variabelen misschien niet alle nodige vergelijkingen kunnen genereren.

Hiervoor zijn een aantal oplossingen. Contrast coding en Post-hoc testen.

Post-hoc testen: wordt uitgevoerd na de algemene statistische test om significantie te bepalen.

Deze worden gebruikt wanneer er geen speciale hypothesen zijn.

De precieze contrasten hangen af van de hypothese die getest wort. Belangrijk bij het uitwerken:

Indien er een controlegroep is, wil men die meestal vergelijken met een andere groep.

De precieze contrasten hangen af van de hypothese die getest wort. Belangrijk bij het uitwerken:

Elk contrast mag slechts 2 chunks van variatie bekijken.

De precieze contrasten hangen af van de hypothese die getest wort. Belangrijk bij het uitwerken:

Als een groep gekozen is voor een contrast, kan deze niet meer voor een ander contrast gebruikt worden.

Post-hoc-procedures. Soms heeft men voorafgaand aan de data verzameling geen voorspellingen. Post-hoc testen bestaan uit paarsgewijze vergelijkingen die

alle verschillende combinaties van treatment groepen met elkaar vergelijken.

Er moet altijd een balans gezocht worden tussen typ1 en type 2 fouten: als de test conservatief is (een lage kans op type 1 fout) zal hij waarschijnlijk

te kort schieten in statistische power (een hoge kans op type-2 fout) en andersom.

Post hoc procedures. Het is belangrijk dat meerdere vergelijkingstesten de type 1 error onder controle houden

Maar zinder substantieel verlies in power.

De effect-size berekenen. Het gebruik van etá kwadraat en partiele eta-kwadraat worden

Afgeraden wegens biases.

De omega kwadraat is een zuivere schatting van het effect in de

Populatie.

De kanskapitalisatie wordt onder controle gehouden door het significatie niveau voor elke test zo bij te stellen dat het

algemene significantieniveau 0.05 blijft.

Met de factoriele ANOVA wordt het lineair model uitgebreid voor situaties met 2 categorische predictors en kan naast een onafhankelijke variabele (b.v. Oogkleur, bruin, blauw)

ook nog een andere onafhankelijke variabele, b.v. Sekse meegenomen worden in de analyse.

Factoriele ANOVA.. De onafhankelijke variabelen (oogkleur en sekse) zijn categorisch en de

afhankelijke variabele (score) is continu.

Wanneer een experiment twee of meer onafhankelijk variabelen of factoren telt, spreekt men van een factorieel design. Er zijn meerdere types 1. Independant factorieel design:

Er zijn meerdere onafhankelijke variabelen en elke daarvan is gemeten bij verschillende entiteiten (between groups!)

Varianties worden berekend obv het optellen van gekwadrateerde afwijkingen van gemiddelden. Dit wordt

Kwadraatsommen of sum of squares (SS) genoemd.

Aan de andere kant analyseert ANOVA de verschillen binnen iedere groep. In iedere subgroep wordt niet door iedereen precies het gemiddelde gescoord, maar is er ongetwijfeld individuele variatie. Deze binnengroepenvariantie is niet deel van het model, maar eigenlijk

Onverklaarde individuele afwijkingen van groepsgemiddelden.

Net als bij een gepaarde t-toets gaat het bij herhaalde metingen om het verschil tussen gemiddelden van metingen die aan elkaar gerelateerd zijn.

Bij 3 of meer metingen wordt de Repeated Measures ANOVA gebruikt.

Om de verschillen te analyseren voor 3 metingen zou men 3 gepaarde t-toetsen nodig hebben (metingen 1 vs 2, 1 vs 3, 2 vs 3) waardoor kanskapitalisme ontstaan. Het alternatief hiervoor is de

Repeated Measures ANOVA

Bij herhaalde metingen gaat het om within-groups variantie

Zoals bij de factoriele ANOVA

Bij herhaalde metingen gaat het echter niet om metingen binnen groepen, maar metingen binnen

Individuen.

De repeated measures ANOVA is een statistische methode om herhaalde metingen van een continue, normaal verdeelde afhankelijke variabele te analyseren.

continue, normaal verdeelde afhankelijke variabele te analyseren.

De repeated measures ANOVA. Deze methode is te gebruiken als de afhankelijke variabele op een beperkt aantal vaste tijdstippen is gemeten

en waarbij alle deelnemers op alle tijdstippen gemeten zijn.

Men kan voor sphericity testen ahv

Mauchly's test.

De assumptie van sphericity. Net als bij de anova's berust een herhaalde metingen analyse op de aanname dat

de variabiliteit tussen meetmomenten grofweg vergelijkbaar is.

De aanname van sphericity is een specifieke aanname voor een repeated measures ANOVA en kan gelinkt worden aan de assumptie van homogeniteit van variantie in between-group designs.

Het verwijst dus naar de gelijkheid van de varianties van de verschilscores tussen groepen.

Bij een herhaalde meting met drie of meer meetmomenten wordt automatisch een Mauchly's test toegevoegd in SPSS om te bepalen of er sprake is van sphericity.

Als die significant is, is de voorwaarde van een repeated measures Anova geschonde.

Als Machly's test significant is, bekijk dan de Greenhouse-Geisser of Huynf-Feldt schattingen van Sphericity: <

Greenhouse-Geisser kleiner dan .75: gebruik de Huynh-Feldt correctie

Bij een mixed design ANOVA gaan meerdere between-subjects factoren een rol spelen,

Er gaan dan een interactie-effect spelen tussen de between-subjects factoren

De uitkomsten van de between-subjects effecten hebben uitsluitend betrekking op de gemiddelde waarden van

Deze within-subjects effecten factoren

Mixed designs: verdeel de hoofd en interactie effecten a.d.h.v

Contrasten

Omdat mixed designs zowel independant measures als repeated measures combineert, moet rekening gehouden worden met zowel homogeniteit als sphericity. Gelukkig kan de greenhouse-geisser correctie toegepast worden zodat het probleem van

Sphericity alvast verdwijnt.

Tegenwoordig wordt multilevel analyse vaak gebruikt voor analyses van herhaalde metingen omdat

Het een alternatieve benadering met vele voordelen biedt voor het analyseren ervan

Multilevel analyse heeft minder strikte veronderstellingen an de repeated measures anova en kan gebruikt worden wanneer de assumptie van constante varianties (homogeniteit van varianties) wordt geschonden door de

Repeated measures anova.

Multilevel analyse maakt een hierarchische structuur mogelijk en kan worden gebruikt voor steekproefprocedures van een hogere orde

Terwijl repeated measures zich anova zich beperkt tot onderzoek van steekproefprocedures op twee niveaus (personen gemeten op verschillende tijdstippen).

De multilevel analyse kan dus herhaalde metingen analyseren binnen personen, binnen een derde niveau van analyses etc

Terwijl repeated measures anova beperkt is tot herhaalde metingen binnen personen

Multilevel analyse kan ontbrekende gegevens verwerken, want die zijn toegestaan in multilevel analyse zonder

Extra complicaties te veroorzaken.

Zowel repeated measures anova als multilevel analyse veronderstelt dat de afhankelijke variabele continu is en gemeten op een interval + schaal

en dat de residuen normaal verdeeld zijn.

In tegenstelling tot multilevel analyse werkt repeated measures ANOVA niet goed wanneer de onderzoeksopzet niet gebalanceerd is,

Een situatie die in de praktijk zeer vaak voorkomt

Bij een eenvoudig ontwerp en wanneer er geen ontbrekende gegevens zijn, leveren repeateds measures ANOVA en multilevel analyse

waarschijnlijk identieke resultaten op.

Voorwaarden mixed designs - interactie-effect

Wanneer het effect van de onafhankelijke variabele niet op elk niveau van de andere onafhankelijke variabele hetzelfde is.

Assumptie van de mixed design anova. Homogeniteit

De variantie van residuen is onafhankelijk van de onafhanekleijke variabele.

Welke informatie moet vermeld worden in het informed-consent-gedeelte van een experimenteel onderzoek?

Men heeft het recht de deelname zonder opgave van reden op elk ogenblik te stoppen

Welke informatie moet vermeld worden in het informed-consent-gedeelte van een experimenteel onderzoek?

Beschrijving van alle voorziene risico's en ongemakken

Welke informatie moet vermeld worden in het informed-consent-gedeelte van een experimenteel onderzoek?

Beschrijving verwerking gegevens. Anonimiteit ja of nee?

Bij eerste jaars studenten wordt een vragenlijst afgenomen voor verzekeringsbereidheid. Vervolgens krijgt dee groep een voorlichtingsmiddag over het nut van verzekerd zijn. Na afloop van de voorlichting wordt nogmaals gevraagd naar verzekeringsbereidheid. Dit is een voorbeeld van

Een pre-experimenteel design

Welke van de volgende designs zijn vormen van zuiver experimentele designs?

Solomon vier groependesign (en posttest-only control (alleen nameting met controlegroep), pretest-posttest control design (voor en nameting met controlegroep).

In een aantal orthopedagogische centra werden door de groepsleiders aan zwakbegaafde jongeren trainingen gegeven in sociale vaardigheden. Sommige gropen in de centra kregen de training wel, andere niet. De sociale vaardigheid van jongeren werd vooraf en achteraf gemeten m.b.v. Een zogenaamdescreeningslijst (SL)

Dit is een voorbeeld van een quasi-experimenteel design.

Een onderzoeker wil weten of hardlopers inderdaad doodlopers zijn. Hiervoor laat hij hardlopers twee weken lang aangeven hoe hard ze trainen en of ze gezondheidsproblemen ervaren. Vervolgens krijgt de helft van de hardlopers voorzichting over gezond sporten. Hierna wordt na opnieuw twee weken gevraagd naar hun training en gezondheid.

Dit is een voorbeeld van een enkelvoudige tijdreeks.

Soms wordt in een studie nulhypothesetoetsing toegepast. In dat geval wordt een p-waarde berkend en vergeleken met alpha (meestal 0.5). Wat geldt er in zo'n situatie?

Hoe meer p-waarden er worden berekend, hoe groter de kans dat er door toeval één significant is, zelfs als de nulhypothese in alle gevallen waar is.

Soms worden in een studie meerdere p-waarden berekend, bijvoorbeeld omdat een onderzoeker is geintresseerd in meerdere verbanden of effecten. In welk van deze twee scenario's voert de onderzoeker de analyse op de juiste manier uit?

De onderzoeker vergelijkt vijf behandelingen. Er wordt een eenweg Anova uitgevoerd gevolgd door post-hoc toetsen. De p-waarden worden niet gecorrigeerd.

Een onderzoeker meet in een experiment het effect van waargenomen normen op risicoperceptie. De onderzoeker kijkt of de groepen na de manipulatie verschillen in waargenomen normen. Welke uitspraak is juist?

Dit betreft een manipulatiecheck

Assumptie van de one-way ANOVA 3

De scores zijn onafhankelijk: de assumptie dat de groepen uit verschillende deelnemers bestaan en er geen participanten in beide condities hebben gezet

Het is altijd zinvol om ervan uit te gaan dat varianties tussen groepen ongelijk zijn,

ondanks dat deze niet altijd significant verschillen.

F-test. Een groep die in het ene contrast voorkomt, kan niet meer gebruikt worden in een volgend contrast.

Een groep kan in een volgend contrast wel nog verder opgedeeld worden.

Elk contrast mag maar 2 chunks informatie vergelijken. De F-waarde vertelde enkel dat er verschillend waren in gemiddelden

Maar niet in welke

N2 eta kwadraat van 0.078

Geeft een middelgroot aan

Er is een onderzoek uitgevoerd naar het effect van mindfulness op geluk. Deelnemers aan de cursus mindfulness is gevraagd om hun geluk op te geven, voorafgaand aan de cursus, na de eerste bijeenkomst en na de tweede bijeenkomst. Er waren twee docenten. De deelnemers zijn willekeurig aan de twee docenten toegedeeld. Het geluk is over tijd toegenomen.

Om een uitspraak te kunnen doen over de toename in geluk, moet het verschil tussen de docenten ook betrokken worden.

Er is een onderzoek uitgevoerd naar de smaakbeleving van drie verschillende soorten wijn in twee situaties: tijdens een borrel en tijdens een diner. Deelnemers (N = 32) aan de proeverij dronken in een willekeurige volgorde van elke soort een glas wijn tijdens een borrel. Dit werd enige dagen later herhaald tijdens een diner. Na elk glas gaf men de wijn een cijfer, waarbij een 10 de perfecte smaak weergaf. Welke uitspraak obv de bijgevoegde analyse over de smaakbeleving van deze wijnen is correct?

De verschillen in smaakwaardering tussen de wijnen wordt mede bepaald door de situatie.

Effectiviteit van EMDR, een onderzoek bij mensen met angstklachten. P van 0.487

Niet significant, er is dus waarschijnlijk geen verschil tussen mannen en vrouwen.

Dat de assumptie van homogeniteit van regressiecoëfficiënten (homogenity of regression slopes) geschonden is

hoeft niet altijd een probleem te zijn.

Welke van de volgende factoren is een bedreiging voor de externe validiteit?

Reactieve experimentele locatie

Stel er wordt een experiment uitgevoerd waarbij studenten van de OU naar het lab komen en door een proefleider willekeurig worden ingedeeld in een positieve stemmingscondititie en een negatieve stemmingsconditie. Vervolgens vullen de respondenten een aantal vragenlijsten in om na te gaan of stemming een effect heeft op zelfverzekerdheid. Waardoor wordt de externe validiteit in dit experiment bedreigd?

Selecte steekproef

In een quasi experiment wordt geobserveerd en gemanipuleerd in

zogenaamde bestaande groepen. Er wordt niet gerandomiseerd.

Wat is een voorwaarde om te mogen spreken van een causale relatie tussen een predictor en een afhankelijke variabele?

De relatie tussen de predictor en de afhankelijke variabele wordt niet veroorzaakt door een derde, mogelijk onbekende variabele.

Er is sprake van een gerandomiseerd blokontwerp wanneer pp, voorafgaand aan het eigenlijke experiment,

Ingedeeld worden in homogene categorien

Een groep brugklassers krijgt de hele maand elke week extra les over milieubewuste eetgewoonten. Aan het einde van de maand wordt geïnventariseerd hoe milieubewust hun eetgewoonten zijn

Dit is een voorbeeld van een pre-experimenteel design

Zuiver experimentele designs

Solomon vier groepen design, posttest-only control (alleen nameting met controlegroep), pretest-posttest control design (voor en nameting met controlegroep)

Onderzoek naar ouderen met dementie, twee metingen in verzorgingstehuis

Quasi-experimenteel

Kanskapitalisme. De toename van de kans op een type-1-fout. Bij iedere toets is er een kans op type-1-fout en

Bij elke bijkomende toets neemt dus de kans op een type-1-fout toe.

Soms worden in een studie meerdere p-waarden berekend, bijvoorbeeld omdat een onderzoeker is geïnteresseerd in meerdere verbanden of effecten. In welk van deze twee scenario's voert de onderzoeker de analyses op de juiste manier uit?

E onderzoeker vergelijkt met een eenweg-anova twee behandelingen. De onderzoeker voert geen post-hoctesten uit.

Een onderzoeker meet in een experiment het effect van eigen effectiviteit op waargenomen normen. De onderzoeker kijkt of de groepen na manipulatie verschillen in waargenomen normen. Welke uitspraak is juist?

Dit betreft een analyse om de onderzoeksvraag te benatwoorden.

Welke stelling over t-toetsen is waar?

Bij een onafhankelijke t-toets zijn de te vegelijken gemiddelden onafhankelijk van elkaar

Wat betekent het resultaat: Mauchly's test of sphericity <.05?

De voorwaarde van sphericity is geschonden, want de Mauchly's test is significant.

B = -0.43, P = 0.236. Dit verschil kan gekwalificeerd worden als

Niet-significant-negatief.

Het doel van de ANCOVA is dus om de gemiddelde scores van groepen op een afhankelijke variabele te vergelijken rekening houdend met

andere variabelen (covariaten) die ook invloed hebben op de afhankelijke variabele.

De Ancova verschilt van de one-way ANOVA en factoriele ANOVA  door het gebruik van covariaten. Het gebruik van covariaten heeft twee voordelen. 1.

Het neemt ruis in de data weg waardoor er meer onderscheidend vermogen is om een verschil tussen groepen te kunnen vinden.

De Ancova verschilt van de one-way ANOVA en factoriele ANOVA  door het gebruik van covariaten. Het gebruik van covariaten heeft twee voordelen 2.

Er wordt rekening gehouden met verschillen in de achtergrondvariabelen voor de verschillende groepen.

Een ancova of analysis of covariance is een design waarin het lineair model om gemiddelden te vergelijken wordt uitgebreid om één of meer continue variabelen die de outcome voorspellen (afhankelijke variabelen) te incorporeren. Wanneer de belangrijkste focus van het model het vergelijken van gemiddelden is,

Worden deze bijkomende predicties covariaten genoemd.

Men zou b.v. Geluksniveau's kunnen meten: hoe gelukkig worden deelnemers van honden? Maar er zijn ook andere zaken die geluk beinvloeden, bv temperament. Als deze variabelen (covariaten) gemeten worden, is het mogelijk om ze

aan te passen volgens de invloed die ze hebben op de outcome variabele door ze in te brengen in het lineair model

Zie lineaire regressie: als de covariaat eerst in het model wordt gebracht en daarna de dummy variabelen die de groepsgemiddelden representeren, wordt duidelijk welk effect een predictorvariabele heeft, met aanpassing voor het effect van de covariaat. Dus, i.p.v. De outcome van groepsgemiddelden te voorspellen,

voorspelt men groepsgemiddelden die aangepast zijn voor het effect van de covariaat of covariaten.

De ancova is feitelijk een uitbreiding van de ANOVA en behoort dus tot dezelfde familie van

Lineaire regressie toetsen

De covariaat is dus een interval+ predictor in

een lineair model.

Na meting en analyse kan de covariatie die veroorzaakt is door de covariaat

Verwijderd worden, waardoor de overgebleven variantie zuiverder wordt.

Variantie zegt hoeveel de waarde afwijkt

Van het gemiddelde

Er zijn twee redenen om covariaten in te passen inde ANOVA, 2:

Eliminatie van confounders, er kunnen in elk experiment niet gemeten variabelen zijn die de resultaten beïnvloeden. Wanneer deze variabelen bekend zijn, moeten deze worden toegevoegd als covariaten zodat ze worden verwijderd als potentiële verklaring voor het effect waarin men interesse heeft.

Assumpties van de Ancova. Onafhankelijkheid van de covariaat en het treatment effect.

Covariaten kunnen gebruikt worden om de within-groep error variantie te reduceren als ze (een deel van) deze variantie verklaren. Dit is het geval wanneer de covariaat onafhankelijk is van het experimenteel effect (groepsgemiddelden).

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo