Wat is een Foundation Model?

Een foundation model is een groot AI-model dat getraind is op brede, diverse data op schaal en vervolgens aangepast kan worden voor een breed scala aan taken. GPT-5, Claude 4, Gemini 3, LLaMA en Stable Diffusion zijn allemaal foundation models. De term benadrukt dat deze modellen dienen als fundament waarop toepassingen worden gebouwd.

Waarom het ertoe doet

Foundation models veranderden het AI-paradigma fundamenteel. In plaats van voor elke taak een apart model te trainen, train je één groot model op diverse data en pas je het aan voor specifieke taken via fine-tuning, prompting of RAG. Dit maakt AI toegankelijk voor organisaties die niet de middelen hebben om modellen van scratch te trainen.

Hoe het werkt

Het foundation model-paradigma:

Pre-training — het model leert algemene patronen uit enorme datasets (internet, boeken, code)
Adaptatie — het model wordt aangepast voor een specifieke taak:

Fine-tuning — verder trainen op taakspecifieke data
Prompting — het model aansturen via instructies in natuurlijke taal
RAG — het model verrijken met externe kennis

Kernkenmerken:

Emergente vermogens — grotere modellen vertonen onverwachte capaciteiten die niet expliciet getraind zijn
Transfer — kennis opgedaan tijdens pre-training is breed inzetbaar
Schaalbaarheid — prestaties verbeteren voorspelbaar met meer data en parameters (scaling laws)

Categorieën:

Taalmodellen — GPT-4, Claude, Gemini, LLaMA (tekst en code)
Beeldmodellen — Stable Diffusion, DALL-E (beeldgeneratie)
Multimodale modellen — GPT-4o, Gemini (tekst + beeld + audio)
Codemodellen — Codex, StarCoder (gespecialiseerd in code)

Voorbeeld

LLaMA 3 van Meta is een foundation model getraind op triljoenen tokens uit het internet. In zijn basisvorm is het een general-purpose taalmodel. Bedrijven passen het aan: een ziekenhuis fine-tunet het op medische teksten voor diagnoseondersteuning, een advocatenkantoor op juridische documenten voor contractanalyse — allemaal vanuit hetzelfde fundament.