Classificatie en predictie

9 belangrijke vragen over Classificatie en predictie

Wat is een logistische regressie en wanneer gebruik je deze?

Dit is een S-curve die van 0 tot 1 gaat. Het wordt gebruikt wanneer de afhankelijke waarde dichotoom/categoriaal is, zoals 0 en 1 voor niet ziek en wel ziek

Hoe kan je met logistische regressie iets voorspellen?

Met de functie glm in R kan je een lijn laten opstellen met alle variabelen. Vervolgens kan je voor een sample deze variabelen invullen en kan het een voorspelling geven of de sample 0 of 1 is

Wat is machine learning?


- Machine learning is de studie van computeralgoritmen die
automatisch verbeteren door ervaring.
- Het wordt gezien als een subset van kunstmatige intelligentie.
- Machine learning-algoritmen bouwen een wiskundig model
op basis van voorbeeldgegevens, bekend als "trainingsgegevens", om voorspellingen te doen of beslissingen te nemen zonder dat ze daartoe expliciet geprogrammeerd zijn om dit te doen.
- Voorbeelden zijn random forest, K-nearest neighbors, etc.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wanneer krijg je dan een neuraal netwerk?

Wanneer je meerdere neuronen samenvoegt en waarbij neuronen elkaars output gebruiken. Er zijn hidden layers

Hoe zitten de onderdelen van een dicision tree?

Een node is vraag die we stellen en die hebben takken naar andere nodes. En aan het eind de blaadjes die de beslissingen/conclusies zijn.

Hoe werken de hidden layers in een neural network?

Stel je raakt vuur aan, dan wil je je hand weghalen. Daarvoor zijn signalen en chemicaliën nodig uit je lichaam. Dit is in een computer de hidden layers (de signalen en chemische stoffen).

Het 75/25 kiezen moet wel zonder bias gebeuren. Wat is anders het gevaar? En hoe los je dit op?

Stel je pakt alleen zieke mensen, dan weet je niet hoe goed je model is voor gezonde menen. Als er niet een balans in zit kan je up of down sampling doen om wel een balans te krijgen.

Wat is external validation?

Dat je je model test aan de hand van een andere dataset. Het liefst van en door andere onderzoekers

Waarom zouden we een random forest aanpak gebruiken?


- Het is onovertroffen in nauwkeurigheid onder de huidige algoritmen.

- Het werkt efficiënt op grote gegevensbestanden en meestal snel!
- Het kan duizenden input variabelen aan zonder variabele schrapping.
- Het geeft schattingen van welke variabelen belangrijk zijn in de
classificatie.
- Het genereert een interne onbevooroordeelde schatting van de
generalisatiefout naarmate de bosbouw vordert.
- Het heeft methoden voor het in evenwicht brengen van fouten in klassepopulaties ongebalanceerde datasets.
- Gegenereerde bossen kunnen worden opgeslagen voor toekomstig gebruik op andere gegevens.
- Random forests maakt geen over-fit. U kunt zoveel bomen uitvoeren als je wil.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo