Classificatie en predictie modellen

10 belangrijke vragen over Classificatie en predictie modellen

Wat is binary en multi-class data in classificatie?

Binary : je hebt twee groepen
Multi-class: meerder groepen hier kan je bepalen welke je wil scheiden van elkaar en classificeren

Wat is de classificatie aanpak

  • Classificatie model porbeerd een conclusie te maken van de geobserveerde waarden
  • het geven van een of meerder inputs aan een classificatie model zou prberen om de individuele metingen in de goede categorie te plaatsen

Wat is machine learning?

  • Studie van computer algorithmen die automatisch verbeteren door ervaring
  • subset artificial intelligence
  • algorithms build with mathematical model gebaseerd op traning data en uitgeprobeerd op een test data
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Hoe wordt neural networks gebruikt om tumoren op foto'ste kunnen detecteren?

  1. Er wordt een foto gemaakt
  2. gegeven aan het algorithme
  3. die kijkt er na en kijkt in de verborgen informatielagen welke dingen die ziet
  4. op die manier maar hij zijn keuze

Wat is random forest en hoe wordt het gedaan?

  • Een classificatie algoritme die bestaat heel veel beslisbomen
  • het maken van een indivuduele beslisboom wordt random gedaan, om er voor te zorgen dat er een bos van bomen komen die niet aan elkaar zijn gecorreleerd, zodat je all belsisbomen nodig hebt om tot een antwoord te komen.
  • elke beslisboom heeft andere variabelen (vragen, condities) en in een andere volgorde
  • aan het eind van alle classificatie van de samples kijk je naar de majority-vote --> op die basis maak je de final classificatie

Waarom gebruiken we de random forest aanpak? (8)

  • Betrouwbaarheid hoog
  • effieciënt met grote dataset en runt snel
    • geen variabelen deletie
  • het geeft de gemiddelde van de variabelen die belangrijk zijn voor de classificatie (de vragen waarop je antwoord geeft)
  • heeft internal unbiased gemiddelde inzich
  • gebalenceerde error in de classificatie van de populatie in een schreven data set
  • de beslisbomen kunnen bewaard worden voor toekomstige data
  • overfitting bestaat niet, je kan beslisbomen zo veel runnen als je wilt

Wat is K-nearest neighbors?

  • Een makkelijke, supervised machine learning algoritme dat gebruikt kan worden voor classificatie en regressie problemen.
  • zorgt dat dingen die op elkaar lijken dicht bij elkaar zijn.
  • afstand zegt iets over de gelijkenis of ongelijkenis
  • de afstand tot aan de buren worden bekeken
    • buren aantal kan je zelf aanpassen


voorbeeld: K is op 5 gesteld dus je kijkt naar 5 buren in dit geval hoort de zwarte datapunt bij de blauwe driehoeken

Wat zijn de voordelen en nadelen van K-nearest neighbors?

Voordelen:
  • algoritme is simpel en makkelijk in te bouwen
  • geen extra aannamens
  • algoritme kan voro meerder dingen gebruikt worden, classifictie, regressie en search.

nadelen:
  • het algoritme wordt heel langzaam als je het aantal voorbeelde, voorstellers en idividuele variabelen omhoog gaan. 

Wat is cross-validatie en de doelen ervan?

  • Interne validatie
  • wortd gebruikt als externe valdiatie niet mogelijk is.
  • het aan een manier om een classificatie/predictie model on een test set om te kijken of het werkt
  • 75% van de dataset is traning set en 25% van de dataset is test set.



  • het test de vraadigheid van het model om een predictie te maen van nieuwe data.
  • kan overfitting en selectie bias aangeven
  • kan een K of andere parameter voorspellen

Wat is leave-one-out cross-validatie?

  • Je gebruikte alle samples behalve een, de ene die je niet gebruikt wordt als een test gebruikt. De rest gebruik je dan als traning data. En die doe je op nieuwe maar dan gebruik je sample 2 als een test set en gebruikt de rest als training en dit doe je heel veel keer.
  • Bij leave-one-out kan er geen confusion matrix, want het kan alleen 100% goed zijn of 0% goed zijn dus kan er geen statische toets opgedaan worden

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo