Preparing data - Werkgroep

21 belangrijke vragen over Preparing data - Werkgroep

Doe nu een regressie analyse waarbij je “sekse10” als voorspeller gebruikt voor de variabele “dominantie”.

  1. Analyze + Regression + Linear
  2. Voer de predictor en de afhankelijke variabele in

De slope, B1, van de vergelijking is de toename in de afhankelijke variabele wanneer de voorspeller van 0 naar 1 gaat.
  • Dus wat kun je uitrekenen op basis van B0 en B1? Met andere woorden, wat betekent B1 hier?

Je kunt de gemiddelde waarde van de afhankelijke variabele, dominantie, voor mannen uitrekenen door B1 op te tellen bij B0. B1 is de slope, het verschil in gemiddelde dominantie tussen mannen en vrouwen.
  • LET OP! B1 is NIET het gemiddelde voor mannen. B1 is het verschil in dominantie tussen sekse=0 en sekse=1. Het verschil reken je dus niet uit. Het verschil wordt je gegeven. 

Als de mannen B1 zijn, wat scoren die dus op dominantie?


Vrouwen scoren gemiddeld 2,704 op dominantie
Mannen scoren gemiddeld 2,704+,786 = 3,490 op dominantie
  • Het verschil tussen mannen en vrouwen is significant. Dat kun je afleiden uit de coefficients tabel in je output, zie hieronder. De p-waarde onder de kolom Sig. achter sekse10 lager is dan .05. In dit geval is .036<.05 daaruit kun je concluderen dat het verschil tussen mannen en vrouwen, de slope, significant groter is dan nul.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wat krijg je als je parameter estimates aanvinkt?

Als je dit aanvinkt krijg je een anova maar dan in regressietermen, dus je krijgt zo een regressie tabel te zien die vergelijkbaar is met de tabel met de B0 en B1 waardes.

Wat geeft de intercept van een univariate ANOVA weer?

De intercept bij de univariate ANOVA geeft het gemiddelde van de variabele die gecodeerd is als 1 (mannen in dit geval).

Waarvoor wordt de term "dummy" codering gebruikt?

De term “dummy” codering wordt gebruikt voor een dichotome variabele waarbij waardes 0 en 1 worden gebruikt. Univariate GLM/ANOVA maakt ZELF dummy variabelen en neemt dus een besluit over welke groep de waarde 0 krijgt. Dit is van belang omdat 0 de groep is waarop het intercept is gebaseerd.

Regressie neemt altijd 0 als referentiepunt, maar wat doet univariate?

De intercept bij de univariate ANOVA geeft het gemiddelde van de variabele die gecodeerd is als 1. Univariate ANOVA maakt zelf dummy variabele aan en neemt de LAATSTE type als referentie punt. Bij 0 en 1 is dat 1. LET OP! Het is niet standaard altijd 1, bij 0, 1 en 2 is het 2, de laatste.

Vervolgens ga je de Cronbach’s alpha van deze vragenlijst uitrekenen.

  1. Analyze + Scale + reliability”.
  2. Voer de items in het venster in  (dus alleen de item die je gebruikt om de schaal te maken, dit betekent dat je van de contra-indicatieve items niet de originelen gebruikt maar de ge-hercodeerde!).
  3. Vraag ook op de “inter-item correlaties” en “scale if item deleted” (bij “statistics”)

Hoe kan je het gemiddelde uitrekenen van items?

  1. Eén manier om het gemiddelde uit te rekenen is door de items op te tellen en te delen voor het aantal items.
  2. Een andere manier is om SPSS direct te vertellen dat je de mean wilt. Dit kan in de compute module maar ook in de syntax, bijvoorbeeld.

Wat kan je in een factor analyse onderzoeken?

In een factor analyse kun je onderzoeken of de data van alle items ondersteuning geven aan de claim dat er twee afzonderlijke factoren fatsoenlijk worden gemeten in deze vragenlijst.

Hoe voer je een factor analyse uit?

  1. Analyze + Dimension Reduction + Factor
  2. Voer alle items in de analyse in en kies onder “Rotation” voor een “Direct Oblimin”.
  3. Voer deze analyse uit en kijk naar de uitkomsten in de Pattern Matrix.

Wat zijn vragen die je jezelf stelt bij het analyseren van de output van een factor analyse?

  1. Hoeveel factoren zijn er volgens deze analyse in de vragenlijst? Hoeveel zouden er moeten zijn?
  2. Uitgaande van de items die bij promotion horen en die bij prevention horen, hoe goed is deze vragenlijst als geheel?
  3. Zijn er items die er zeer duidelijk uitvallen?

Hoe kan je de gegevens in een Pattern Matrix interpreteren?

De gegevens in de Pattern Matrix kun je interpreteren als een regressievergelijking. Wat in één rij staat is een soort expressie van wat je krijgt als je met de drie gehele factoren dat ene geobserveerde item voorspelt. Dat betekent dus dat die matrix weergeeft wat iedere factor gemeen heeft met ieder item wanneer gecontroleerd wordt voor het effect van de ANDERE factoren op dat item.

Waarmee zijn de getallen in een Structure Matrix vergelijkbaar?

De getallen in de Structure Matrix zijn vergelijkbaar met “losse” correlaties van de losse items met de gehele factor. Een soort item-test correlaties dus (zie Cronbach’s alpha berekening), maar waarbij geen rekening wordt gehouden met de andere factoren. Als de items zeer sterk op één factor laden en niet of amper op de andere dan zit er weinig verschil tussen de twee matrices. Dit betekent dat de factoren ook min of meer onafhankelijk van elkaar zijn. Dat is vaak niet het geval dus meestal is het meest informatieve om naar de Pattern Matrix te kijken.

Wat zijn een paar voorbeelden van situaties waarin je theoretisch of analytisch reden hebt om te aggregeren en waarin je moet onderzoeken of aggregeren nuttig en valide is?

  • Meerdere ondergeschikten beoordelen dezelfde leider
  • Teamleden beoordelen de cultuur in een team
  • Teamleden beoordelen elkaar

In dit geval ga je “dominantie” aggregeren.

  1. Data + Aggregate
  2. Bij “Break Variables” plaats je de variabele die aangeeft binnen welke eenheid (nummer) moet worden geaggregeerd. Dat betekent dus dat SPSS het gemiddelde in die persoon gaat uitrekenen en een nieuwe variabele gaat maken waarbij alle raters van die persoon dezelfde, gemiddelde, score krijgen.
  3. Bij “Aggregated Variables” plaats je de te aggregeren variabele (dominantie).

Als je uitgaat van dat ICC1 de verklaarde variantie is, oftewel de ratio van de variantie tussen groepen t.o.v. variantie binnen groepen, hoe reken je ICC1 dan uit?

Dan kun je de ICC uitrekenen op basis van een relatief simpele ANOVA waarbij je “groepen” als factor gebruikt. ANOVA test immers of de ratio van verklaarde en onverklaarde variantie door het toevoegen van een indeling in groepen significant is (door een grote F-waarde).
  1. Voer die ANOVA eerst uit zodat je de gegevens bij de hand hebt.
  2. Analyze + Compare Means + One-way ANOVA

Wat voor variantie is ICC1?

ICC1 is de ratio van de verklaarde variantie (MSB, mean-square between) en onverklaarde variantie (MS, within of MS error) waarbij gecontroleerd wordt voor het aantal raters. Dit is qua redenering vergelijkbaar met wat je doet als je F uitrekent in een ANOVA en voor deze berekening heb je dezelfde getallen nodig (waarbij k  het aantal raters is).

Vanaf welke waardes zijn ICC1 en ICC2 acceptabel?

In het algemeen zijn ICC1 van onder de .10 en ICC2 van onder de .60 signalen dat aggregeren niet acceptabel is (zeker als je geen significante ANOVA hebt), maar in de literatuur worden velaal strengere criteria gehanteerd

Als de Mean-Square Between (verklaarde variantie) en Mean Square (onverklaarde variantie) gelijk blijven, maar het aantal raters neemt toe, wat gebeurt er dan met ICC1 en ICC2?

ICC1 wordt kleiner en ICC2 wordt groter.

Zoals genoemd geeft SPSS geen goede mogelijkheid om ICCs snel en makkelijk uit te rekenen.  Er is één uitzondering: wanneer je evenveel ratings hebt voor ieder “gerate” object, wat kun je dan doen?

Dit kun je via de “reliability” interface uitrekenen wat de ICCs zijn, maar in de meeste gevallen is dit niet het geval.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo