
Wat is een Classifier?
Een classifier is een machine learning-model dat data toewijst aan vooraf gedefinieerde categorieën. Het ontvangt een input (beeld, tekst, datapunt) en voorspelt tot welke klasse die input behoort. Classificatie is een van de meest fundamentele en wijdverspreide ML-taken.
Waarom het ertoe doet
Classifiers drijven onzichtbare AI-toepassingen aan die dagelijks miljarden beslissingen nemen: spam/geen spam, frauduleus/legitiem, positief/negatief sentiment, tumor/geen tumor. Het is de meest mature en betrouwbare toepassing van ML en de basis waarop veel complexere systemen zijn gebouwd.
Hoe het werkt
Typen classificatie:
- Binaire classificatie — twee klassen (spam/geen spam, positief/negatief)
- Multiclass classificatie — meerdere klassen (kat/hond/vogel/vis)
- Multilabel classificatie — meerdere labels per input (een foto kan zowel "strand" als "zonsondergang" als "mensen" bevatten)
Populaire classifiers:
- Logistische regressie — simpel, interpreteerbaar, goed voor lineair scheidbare data
- Random Forest — ensemble van beslissingsbomen, robuust en veelzijdig
- SVM (Support Vector Machine) — vindt de optimale grens tussen klassen
- Neuraal netwerk — leert complexe patronen, dominant voor beeld en tekst
- LLM als classifier — taalmodellen ingezet voor zero-shot classificatie via prompting
Evaluatiemaatstaven:
- Accuracy — percentage correcte voorspellingen
- Precision — van alle positieve voorspellingen, hoeveel zijn correct?
- Recall — van alle werkelijk positieve gevallen, hoeveel zijn gevonden?
- F1-score — harmonisch gemiddelde van precision en recall
- Confusion matrix — overzicht van alle correcte en incorrecte voorspellingen
Aandachtspunten:
- Ongebalanceerde klassen (99% geen fraude, 1% fraude) misleiden accuracy
- De keuze van de drempelwaarde beïnvloedt precision-recall trade-off
Voorbeeld
Een e-mailprovider bouwt een spamclassifier. Het model ontvangt features van een e-mail (afzender, onderwerp, inhoud, links) en voorspelt: "spam" (92% zekerheid) of "geen spam" (8%). Bij een drempelwaarde van 50% wordt de e-mail als spam geclassificeerd en naar de spammap verplaatst.