
Wat is Supervised Learning?
Supervised learning is een machine learning-paradigma waarbij een model wordt getraind op gelabelde data — input-outputparen waarvan het correcte antwoord bekend is. Het model leert de relatie tussen input en output, zodat het daarna voorspellingen kan doen op nieuwe, ongeziene data.
Waarom het ertoe doet
Supervised learning is het meest gebruikte en best begrepen ML-paradigma. Elke keer dat een model een e-mail als spam classificeert, een huisprijs voorspelt, een gezicht herkent of een medische diagnose ondersteunt, is supervised learning aan het werk. Het is de basis van de meeste productie-ML-systemen.
Hoe het werkt
Het basisproces:
- Verzamel gelabelde data — input-outputparen (foto → "kat", e-mail → "spam")
- Kies een model — logistische regressie, random forest, neuraal netwerk, etc.
- Train het model — het model past parameters aan om fouten te minimaliseren
- Evalueer — test op data die het model nog niet gezien heeft
- Deploy — zet het model in voor nieuwe voorspellingen
Twee hoofdtypen:
- Classificatie — voorspel een categorie (spam/geen spam, hond/kat/vogel)
- Regressie — voorspel een continu getal (huisprijs, temperatuur)
Evaluatiemaatstaven:
- Classificatie: accuracy, precision, recall, F1-score
- Regressie: MSE, MAE, R²-score
Beperkingen:
- Vereist grote hoeveelheden gelabelde data (duur en tijdrovend)
- Het model kan niet verder leren dan wat in de labels zit
- Vatbaar voor bias in de labels
Voorbeeld
Een dermatoloog labelt 10.000 huidfoto's als "goedaardig" of "kwaadaardig". Een supervised learning-model leert de visuele patronen die de twee categorieën onderscheiden. Na training kan het nieuwe huidfoto's beoordelen met een nauwkeurigheid die vergelijkbaar is met die van een specialist — maar alleen voor de typen huidaandoeningen die in de trainingsdata voorkwamen.