
Wat is het verschil tussen Open Weights en Open Source?
Open weights betekent dat de getrainde modelgewichten publiek beschikbaar zijn — je kunt het model downloaden en draaien. Open source gaat verder en omvat ook de trainingsdata, trainingscode, evaluatie-scripts en volledige reproduceerbaarheid. De meeste "open-source" AI-modellen zijn in werkelijkheid open weights.
Waarom het ertoe doet
Het onderscheid is cruciaal voor iedereen die AI-modellen inzet. Open weights geeft je het model maar niet de mogelijkheid om het volledig te reproduceren, auditen of de trainingsdata te inspecteren. Echte open source biedt volledige transparantie. De terminologieoorlog — Meta noemt LLaMA "open source" terwijl het technisch open weights is — beïnvloedt verwachtingen, vertrouwen en juridische zekerheid.
Hoe het werkt
Open Weights:
- ✅ Modelgewichten beschikbaar voor download
- ✅ Kun je lokaal draaien en finetunen
- ❌ Trainingsdata niet beschikbaar
- ❌ Trainingscode niet beschikbaar
- ❌ Niet volledig reproduceerbaar
- Voorbeelden: LLaMA 3, Mistral, Gemma
Open Source (volledig):
- ✅ Modelgewichten beschikbaar
- ✅ Trainingsdata beschikbaar of gedocumenteerd
- ✅ Trainingscode open
- ✅ Volledig reproduceerbaar
- Voorbeelden: OLMo (Allen AI), BLOOM, StarCoder
Proprietary (gesloten):
- ❌ Geen gewichten beschikbaar
- ❌ Alleen toegankelijk via API
- Voorbeelden: GPT-4, Claude, Gemini
Licentiemodellen:
- Apache 2.0 — vrij commercieel gebruik (Mistral, Gemma)
- LLaMA License — gratis maar met beperkingen (geen >700M gebruikers)
- GPL — viraal: afgeleiden moeten ook GPL zijn
- Responsible Use License — gebruik met ethische beperkingen
Waarom het uitmaakt:
- Auditeerbaarheid — zonder trainingsdata kun je bias niet volledig analyseren
- Reproduceerbaarheid — wetenschappelijke verificatie vereist volledige code en data
- Vertrouwen — open source = meer vertrouwen in veiligheid en eerlijkheid
Voorbeeld
Meta's LLaMA 3 wordt breed "open source" genoemd, maar de trainingsdata (15T tokens) is niet publiek beschikbaar en de trainingscode is niet volledig gedeeld. OLMo van Allen AI publiceert alles: gewichten, data, trainingscode, evaluatiescripts en logs. Alleen OLMo voldoet aan de strikte definitie van open source.