Regressie vs Classificatie Uitgelegd | AI Woordenboek

Wat is het verschil tussen Regressie en Classificatie?

Classificatie voorspelt een categorie ("spam" of "niet spam") — de output is een discrete klasse. Regressie voorspelt een continu getal ("de huisprijs is €350.000") — de output is een numerieke waarde. Het zijn de twee fundamentele typen supervised learning-taken die samen het overgrote deel van ML-toepassingen bestrijken.

Waarom het ertoe doet

De keuze tussen regressie en classificatie is de eerste beslissing in elk ML-project. Ze bepaalt welk algoritme je gebruikt, hoe je het model evalueert en welke loss function je kiest. De verkeerde keuze leidt tot een model dat het verkeerde probleem oplost — bijvoorbeeld een prijs voorspellen als categorie ("duur"/"goedkoop") terwijl je het exacte bedrag nodig hebt.

Hoe het werkt

Classificatie:

Output — categorie (klasse)
Voorbeelden — spam detectie, beeldherkenning, sentiment analyse
Algoritmen — logistische regressie, random forest, SVM, neurale netwerken
Loss function — cross-entropy loss
Metrics — accuracy, precision, recall, F1, AUC-ROC

Regressie:

Output — continu getal
Voorbeelden — huisprijsvoorspelling, temperatuurforecast, omzetprognose
Algoritmen — lineaire regressie, random forest regressor, neurale netwerken
Loss function — MSE (Mean Squared Error), MAE
Metrics — MSE, MAE, R², RMSE

Grijze gebieden:

Ordinale classificatie — categorieën met een volgorde ("slecht" < "matig" < "goed" < "excellent")
Classificatie als drempel op regressie — voorspel een kans (regressie), classificeer boven een drempel
Binning — een continu getal omzetten naar categorieën ("<€200K", "€200K-€400K", ">€400K")

De keuze maken:

Is het antwoord een categorie → classificatie
Is het antwoord een getal op een continue schaal → regressie
Twijfel? Vaak kan het probleem beide kanten op — kies op basis van de businessvraag

Voorbeeld

Een verzekeraar wil schadeclaims verwerken. Classificatie: Is de claim frauduleus of legitiem? (ja/nee). Regressie: Wat is het verwachte schadebedrag? (€5.420). Beide modellen werken samen: eerst classificeert het systeem de claim, dan voorspelt het regressiemodel het bedrag voor legitieme claims.

Wat is het verschil tussen Regressie en Classificatie?

Waarom het ertoe doet

Hoe het werkt

Classificatie:

Output — categorie (klasse)
Voorbeelden — spam detectie, beeldherkenning, sentiment analyse
Algoritmen — logistische regressie, random forest, SVM, neurale netwerken
Loss function — cross-entropy loss
Metrics — accuracy, precision, recall, F1, AUC-ROC

Regressie:

Output — continu getal
Voorbeelden — huisprijsvoorspelling, temperatuurforecast, omzetprognose
Algoritmen — lineaire regressie, random forest regressor, neurale netwerken
Loss function — MSE (Mean Squared Error), MAE
Metrics — MSE, MAE, R², RMSE

Grijze gebieden:

Ordinale classificatie — categorieën met een volgorde ("slecht" < "matig" < "goed" < "excellent")
Classificatie als drempel op regressie — voorspel een kans (regressie), classificeer boven een drempel
Binning — een continu getal omzetten naar categorieën ("<€200K", "€200K-€400K", ">€400K")

De keuze maken:

Is het antwoord een categorie → classificatie
Is het antwoord een getal op een continue schaal → regressie
Twijfel? Vaak kan het probleem beide kanten op — kies op basis van de businessvraag

Wat is het Verschil tussen Regressie en Classificatie?

Wat is het verschil tussen Regressie en Classificatie?

Waarom het ertoe doet

Hoe het werkt

Voorbeeld

Bronnen

Wat is het Verschil tussen Regressie en Classificatie?

Wat is het verschil tussen Regressie en Classificatie?

Waarom het ertoe doet

Hoe het werkt

Voorbeeld

Bronnen