Principal Components Analysis

5 belangrijke vragen over Principal Components Analysis

Principal Components Analysis

is een multivariatie data analyse techniek, wat betekend dat het wordt gebruikt om een analyse te maken van grote aantallen variabelen tegelijk. Het belangrijkste is om date reductie te maken, dus het samenvatten van de totale belangrijke informatie die in de data te vinden is.

PCA is het niet hetzelfde als factor analyse (FA), wat een andere multivariabele techniek is. Ook al zijn de twee totaal verschillend in techniek, toch komen er meestal dezelfde conclusies uit.

Variantie uitgelegd: communalities en eigenvalues

Een component legt een bepaalde hoeveelheid van de variantie van de geobserveerde waarde van X uit. Alle componenten samen maakt dat het de totale variantie van de geobserveerde variabelen uitlegt. Voor elk variabele apart is het ook mogelijk om te zeggen, voor hoe veel de variabele variantie uit te leggen is met elke component apart of alle componenten samen.
Bij standaardisatie van de variabelen, betekend het dat er een gemiddelde van 0 is en een variantie van 1. bij 5 variabelen van variantie 1 is het 5x1 = 5  die uitgelegd kunnen worden aan de hand van twee componenten.

Uitlegde variantie van variabelen: commulatities

Het gedeelte van de variantie van variabele Xi dat wordt verklaard door de componenten wordt communality van de variabele genoemd (h2). Omdat alle component ladingen ongecorreleerd met elkaar zijn, geeft de som van alle gekwadrateerde component ladingen van een variabele de communality van die variabele. Wat uit de formule komt, geeft aan hoe goed de variabele te voorspellen zijn uit de twee componenten. Het woord 'fit' wordt ook wel gebruikt. Bij lage communalities, is er een slechte fit. Dit kan verwijderd worden uit de PCA oplossing.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Volledige dimensies en unieke oplossingen

Full dimensionality (volledige dimensies): Als het aantal componenten hetzelfde is als het aantal geobserveerde variabelen. Begrijp het niet verkeerd, dit is sowieso, maar zijn alle componenten bruikbaar genoeg hiervoor of is het nuttiger om er een of meer weg te laten als component. Eigen is k altijd een stuk kleiner dan p. Dit brengt een belangrijk vraag met zich mee: Hoe krijgen we de juiste aantal van bruikbare componenten?
Rotation problem: Er zijn meerdere interessante oplossingen voor de wijze van coördinatie van de componenten.

De factor analyse model

Het model specificeert elke geobserveerde variabele als gewicht van de som van gelijkwaardige factoren en unieke factoren. In het diagram wordt dit net als bij PCA laten zien als een pijl. De pijlen van de geobserveerde variabele naar hun unieke factor gaan alleen tegen de richting in. Een ander nieuw iets is dat er Unieke factoren in de diagram zijn verwerkt.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo