
Wat is het verschil tussen Regressie en Classificatie?
Classificatie voorspelt een categorie ("spam" of "niet spam") — de output is een discrete klasse. Regressie voorspelt een continu getal ("de huisprijs is €350.000") — de output is een numerieke waarde. Het zijn de twee fundamentele typen supervised learning-taken die samen het overgrote deel van ML-toepassingen bestrijken.
Waarom het ertoe doet
De keuze tussen regressie en classificatie is de eerste beslissing in elk ML-project. Ze bepaalt welk algoritme je gebruikt, hoe je het model evalueert en welke loss function je kiest. De verkeerde keuze leidt tot een model dat het verkeerde probleem oplost — bijvoorbeeld een prijs voorspellen als categorie ("duur"/"goedkoop") terwijl je het exacte bedrag nodig hebt.
Hoe het werkt
Classificatie:
- Output — categorie (klasse)
- Voorbeelden — spam detectie, beeldherkenning, sentiment analyse
- Algoritmen — logistische regressie, random forest, SVM, neurale netwerken
- Loss function — cross-entropy loss
- Metrics — accuracy, precision, recall, F1, AUC-ROC
Regressie:
- Output — continu getal
- Voorbeelden — huisprijsvoorspelling, temperatuurforecast, omzetprognose
- Algoritmen — lineaire regressie, random forest regressor, neurale netwerken
- Loss function — MSE (Mean Squared Error), MAE
- Metrics — MSE, MAE, R², RMSE
Grijze gebieden:
- Ordinale classificatie — categorieën met een volgorde ("slecht" < "matig" < "goed" < "excellent")
- Classificatie als drempel op regressie — voorspel een kans (regressie), classificeer boven een drempel
- Binning — een continu getal omzetten naar categorieën ("<€200K", "€200K-€400K", ">€400K")
De keuze maken:
- Is het antwoord een categorie → classificatie
- Is het antwoord een getal op een continue schaal → regressie
- Twijfel? Vaak kan het probleem beide kanten op — kies op basis van de businessvraag
Voorbeeld
Een verzekeraar wil schadeclaims verwerken. Classificatie: Is de claim frauduleus of legitiem? (ja/nee). Regressie: Wat is het verwachte schadebedrag? (€5.420). Beide modellen werken samen: eerst classificeert het systeem de claim, dan voorspelt het regressiemodel het bedrag voor legitieme claims.