Observing behavior - Ten common characteristics of big data

9 belangrijke vragen over Observing behavior - Ten common characteristics of big data

Hoe kan je de validiteit van je onderzoek verhogen als je niet de benodigde data (volledig) bezit?

  • Verzamel de data die je nodig hebt voor je onderzoek
  • Gebruik informatie die je bezit van andere mensen om een uitspraak te doen op een andere groep mensen(user - attribute inference or imputation)
  • Combineer verschillende bronnen van data (record linkage)

Wat kunnen redenen zijn voor bedrijven en overheden om Big Data af te schermen en voor onderzoekers ontoegankelijk te maken?

  • Er zijn ethische barrières die de data moeten beschermen (zoals informatie die zorgt voor een sterkte positie van het bedrijf).

In welke gevallen kan Big Data niet gebruikt worden bij onderzoek mbt de karakteristiek nonrepresentative?

Bij vragen die vragen om gegeneraliseerde resultaten van de sample naar de bijbehorende populatie waarbij de sample is getrokken, is big data niet geschikt (nonrepresentative), omdat veel big data bronnen veel niet representatieve samples bevatten van sommige wel gedefinieerde populaties.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

In welke gevallen kan Big Data wel gebruikt worden bij onderzoek mbt de karakteristiek nonrepresentative?

nonrepresentative data kan gebruikt worden bij "within - sample comparisons", zolang de onderzoekers duidelijk en helder zijn over de karakteristieken van de sample en daarnaast de claims ondersteunen over transportability met theoretisch en empirisch bewijs.

Wat verstaan we onder de karakteristiek "drifting". Noem 3 soorten Drifting en leg uit wat ze betekenen.

Sociale onderzoekers gebruiken Big Data vaak om data over een langere tijd te verzamelen (longitudinal data). Hiervoor is een stabiel meetsysteem nodig. Echter veel big data systemen, met name business systemen, veranderen in der loop der tijd, een proces dat "drifting" genoemd wordt. Deze systemen veranderen op drie manieren:

1. Population Drift (verandering in wie het systeem gebruikt)
2. Behavioral drift (verandering in hoe mensen het systeem gebruiken)
3. system drift (verandering in het systeem zelf)

Wat is Algorithmically confounded en waarmee moet je oppassen bij het gebruik van big data gerelateerd aan deze karakteristiek?

Gedrag van big data systems is niet natuurlijk, het is met een doel ontwikkeld. De manier waarop de doelen van systeemontwerpers hun patronen in data kunnen verkrijgen wordt alogrithmic confounding. Het probleem is dat dit grotendeels onzichtbaar is. Het is nog gevaarlijker als de ontwerpers van deze systemen bekend zijn met wat de sociale theorieën en deze implementeren in deze systemen (performativity: de theory verandert de wereld op een manier waarbij de wereld dichterbij de theorie wordt gebracht). De dynamische oorsprong van algorithmic confounding is een vorm van system drift.

Wat is Dirty data?

Data dat automatisch verzameld is en niet echte acties of interesses van onderzoekers bevat. Deze data is nooit verzameld met als doel het te gebruiken voor onderzoek.

Hoe kan je Dirty Data tegengaan?

De beste manier om dirty data te vermijden is te begrijpen hoe je data die je hebt verzameld tot stand is gekomen.

Wat is een gevaar bij het verzamelen van big data dat gevoelig kan zijn voor mensen?

Het beschermen van privacy gevoelige data kan uit de hand lopen: gegevens kunnen op straat komen. Daarom zal deze informatie goed beschermd moeten worden en zal deze informatie ontoegankelijk zijn voor onderzoekers.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo