Instrumenten voor Business Intelligence - Data Mining - Data Mining Methoden, -Technieken en -Algoritmen
21 belangrijke vragen over Instrumenten voor Business Intelligence - Data Mining - Data Mining Methoden, -Technieken en -Algoritmen
Welke data mining methoden kunnen worden onderscheiden?
- Classificatie
- Regressie
- (Dynamische) Associatieregels
Wat kan met de methode classificatie ontdekt worden?
Hiermee kunnen relaties ontdekt worden tussen kenmerken van bijvoorbeeld een klant en de klasse waartoe de klant behoord.
Bijv. klant en klasse wanbetaler. Het kenmerk kan slechts beperkte waarden aannemen: wel/geen wanbetaler
Welke technieken kunnen worden toegepast binnen de methode classificatie?
- Classificatiebomen
- Neurale Netwerken
- Hogere cijfers + sneller leren
- Niets twee keer studeren
- 100% zeker alles onthouden
Wat is een root node?
De bovenste knoop in de beslisboom.
De root node wordt bepaald door het algoritme, dooe in de dataverzameling te zoeken naar een attribuutwaardecombinatie die het beste de doelvariabele kan voorspellen.
Waarom wordt een beslisboom een classificatieboom genoemd?
Beslisbomen die worden gebruikt om categoriale variabelen te voorspellen, worden classificatiebomen genoemd, omdat ze records in categorieën of klassen plaatsen.
Welke manieren zijn er om een boom van een database met 1 miljoen records te blijven begrijpen?
- Het aantal vertakkingen beperken
- Eerst de boom helemaal genereren en dan de boom handmatig stap voor stap snoeien
Welke algoritmen kunnen worden toegepast om classificatiebomen te genereren?
- CHAID = Chi-squared Automatic Interaction Detection
- CART = Classification And Regression Trees
- ID3
- C4.5
- C5
Deze algoritmen zijn varianten op hetzelfde thema: de opsplitsing van een dataset in descrete groepen dmv iteratie, waarij het doel moet zijn om afstand tussen de groepen bij elke split te maximaliseren.
Welke 2 belangrijke structuurelementen zijn er in een neuraal netwerk?
- Het knooppunt, dat enigzins overeenkomt met het neuron in het menselijk brein
- De koppeling, die enigzins overeenkomt met de verbindingen tussen neuronen in het menselijk brein
Noem de meest gebruikte trainingsmethode bij neurale netwerken (algoritme)
Backpropagation
Hoe wordt de architectuur van het neurale netwerk bepaald?
- Door de ingangs- en uitgangsvariabelen,
- het aantal knopen en verborgen lagen
- en de verbindingen hiertussen
Wat zijn de voordelen van neurale netwerken ten opzichte van beslisbomen?
- Neurale netwerken zijn in staat om zeer nauwkeurige modellen te maken, met name voor complexe problemen.
Beslisbomen zijn ook in staat goede modellen te maken, bij simpele lineaire problemen echter worden soms te complexe modellen gegenereerd - Neurale netwerken kunnen goed omgaan met ontbrekende waarden, omdat bij deze wijze van berekenen (via gewichten en sommaties) het ontbreken van een waarde geen heel grote invloed heeft op de uiteindelijke waarde van de uitgangsknoop.
Beslisbomen kunnen minder goed omgaan met ontbrekende waarden en zullen diverse alternatieve berekeningen moeten uitvoeren
Wat kan met Regressie ondekt worden?
Hiermee kunnen relaties worden ontdekt tussen kenmerken van een klant en een te voorspellen kenmerk dat numeriek is.
Wat is het verschil tussen Regressie en Classificatie?
Het verschil is dat bij Regressie het te voorspellen kenmerk numeriek is en typisch een groot aantal verschillende waarden kan aannemen
Welke technieken kunnen bij Regressie worden toegepast?
- Regressiebomen
- Neurale Netwerken
- Statistische regressie
- Dynamische associatieregels
Wat kun je met dynamische associatieregels?
Hiermee kunnen relaties worden ontdekt tussen een groot aantal kenmerken zonder dat er een specifiek doelkenmerk hoeft te worden aangegeven.
Waarvoor worden dynamische associatieregels gebruikt?
Dynamische associatieregels worden gebruikt om relaties te ontdekken waarbij het tijdsaspect een belangrijke rol speelt.
Waar ligt de basis van de technieken die worden gebruikt bij dynamische associatieregels?
De basis van de techniek ligt bij het vinden van (eenvoudige) regels in de dataset, waarbij de regels elemanten weergeven die op een bepaalde manier gezamenlijk optreden.
Welke twee maten kent een associatieregel?
- Nauwkeurigheid
- Dekking
Wat meet de maat nauwkeurigheid?
De sterkte van de relatie: hoe vaak komt de regel voor
Wat meet de maat dekking?
Hoe vaak is de regel van toepassing
Welk algoritme wordt veel gebruikt bij associatieregels?
Brute kracht algoritme
De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:
- Een unieke studie- en oefentool
- Nooit meer iets twee keer studeren
- Haal de cijfers waar je op hoopt
- 100% zeker alles onthouden