Wat is Explainability in AI? | AI Woordenboek

Wat is Explainability?

Explainability (uitlegbaarheid) in AI verwijst naar het vermogen om te begrijpen en uit te leggen waarom een AI-model een bepaalde beslissing heeft genomen. Het gaat om het openen van de "black box" — inzichtelijk maken welke factoren bijdroegen aan de output, zodat mensen de beslissing kunnen verifiëren, vertrouwen en verantwoorden.

Waarom het ertoe doet

De EU AI Act vereist uitlegbaarheid voor hoog-risico AI-systemen. Maar los van regelgeving: als een model een lening afwijst, een medische diagnose stelt, of een sollicitant afwijst, moeten betrokkenen begrijpen waarom. Explainability is de brug tussen technische AI-capaciteiten en maatschappelijk vertrouwen.

Hoe het werkt

Niveaus van uitlegbaarheid:

Globale uitleg — hoe werkt het model in het algemeen? Welke features zijn het belangrijkst?
Lokale uitleg — waarom nam het model deze specifieke beslissing voor deze specifieke input?

Technieken:

Model-agnostisch (werkt met elk model):

SHAP (Shapley Additive Explanations) — berekent de bijdrage van elke feature aan de voorspelling via speltheorie
LIME (Local Interpretable Model-agnostic Explanations) — benadert het model lokaal met een eenvoudig, interpreteerbaar model
Feature importance — rangschik features op invloed op de output

Model-specifiek:

Attention visualisatie — toon welke delen van de input de meeste aandacht krijgen (transformers)
Gradient-gebaseerd — Grad-CAM voor beelden toont welke pixels de beslissing beïnvloedden
Concept-gebaseerd — identificeer abstracte concepten die het model gebruikt

Interpreteerbare modellen:

Beslissingsbomen, lineaire regressie, regelgebaseerde systemen
Inherent uitlegbaar maar beperkt in complexiteit

Uitdagingen:

Trade-off: meer complexiteit = betere prestaties maar minder uitlegbaarheid
LLM's zijn extreem moeilijk uit te leggen (miljarden parameters)
"Post-hoc" verklaringen zijn benaderingen, geen perfecte uitleg

Voorbeeld

Een bank wijst een hypotheekaanvraag af op basis van een ML-model. SHAP-analyse toont: "De afwijzing werd voor 40% gedreven door de verhouding schuld/inkomen, voor 30% door de korte arbeidsgeschiedenis, en voor 20% door het ontbreken van spaargeld." De klant begrijpt de beslissing en weet wat te verbeteren — dit is explainability in de praktijk.