Wat is Supervised Learning?

Supervised learning is een machine learning-paradigma waarbij een model wordt getraind op gelabelde data — input-outputparen waarvan het correcte antwoord bekend is. Het model leert de relatie tussen input en output, zodat het daarna voorspellingen kan doen op nieuwe, ongeziene data.

Waarom het ertoe doet

Supervised learning is het meest gebruikte en best begrepen ML-paradigma. Elke keer dat een model een e-mail als spam classificeert, een huisprijs voorspelt, een gezicht herkent of een medische diagnose ondersteunt, is supervised learning aan het werk. Het is de basis van de meeste productie-ML-systemen.

Hoe het werkt

Het basisproces:

Verzamel gelabelde data — input-outputparen (foto → "kat", e-mail → "spam")
Kies een model — logistische regressie, random forest, neuraal netwerk, etc.
Train het model — het model past parameters aan om fouten te minimaliseren
Evalueer — test op data die het model nog niet gezien heeft
Deploy — zet het model in voor nieuwe voorspellingen

Twee hoofdtypen:

Classificatie — voorspel een categorie (spam/geen spam, hond/kat/vogel)
Regressie — voorspel een continu getal (huisprijs, temperatuur)

Evaluatiemaatstaven:

Classificatie: accuracy, precision, recall, F1-score
Regressie: MSE, MAE, R²-score

Beperkingen:

Vereist grote hoeveelheden gelabelde data (duur en tijdrovend)
Het model kan niet verder leren dan wat in de labels zit
Vatbaar voor bias in de labels

Voorbeeld

Een dermatoloog labelt 10.000 huidfoto's als "goedaardig" of "kwaadaardig". Een supervised learning-model leert de visuele patronen die de twee categorieën onderscheiden. Na training kan het nieuwe huidfoto's beoordelen met een nauwkeurigheid die vergelijkbaar is met die van een specialist — maar alleen voor de typen huidaandoeningen die in de trainingsdata voorkwamen.