
Wat is Natural Language Processing?
Natural language processing (NLP) is het AI-vakgebied gericht op het vermogen van computers om menselijke taal te begrijpen, interpreteren en genereren. Het overbrugt de kloof tussen hoe mensen communiceren (natuurlijke taal) en hoe computers data verwerken (gestructureerde input).
Waarom het ertoe doet
NLP maakt de meest natuurlijke vorm van mens-computer interactie mogelijk — gewoon praten of typen in je eigen taal. Het drijft chatbots, zoekmachines, vertaalsystemen, sentimentanalyse, spraakassistenten en de hele generatieve AI-revolutie aan. Zonder NLP zou je niet met ChatGPT, Siri of Google Translate kunnen communiceren.
Hoe het werkt
Kerntaken van NLP:
- Tekstclassificatie — spam detectie, sentimentanalyse, categorisatie
- Named entity recognition (NER) — personen, organisaties, locaties herkennen in tekst
- Machine translation — automatisch vertalen tussen talen
- Tekstgeneratie — nieuwe tekst produceren (het hart van LLM's)
- Samenvatting — lange teksten automatisch inkorten
- Vraag-antwoord — vragen beantwoorden op basis van context
De NLP-revolutie in drie fases:
- Regelgebaseerd (1960-2000) — handgeschreven grammaticaregels en woordenboeken
- Statistisch ML (2000-2017) — patronen leren uit data (TF-IDF, word2vec)
- Deep learning / transformers (2017-nu) — BERT, GPT en de huidige LLM-generatie die vrijwel alle NLP-taken domineert
Moderne NLP = Large Language Models: Sinds de introductie van de transformer-architectuur (2017) worden vrijwel alle NLP-taken opgelost met één groot taalmodel dat voor meerdere taken inzetbaar is, in plaats van aparte modellen per taak.
Voorbeeld
Wanneer je Gmail een e-mail automatisch als spam markeert, je iPhone Siri vraagt om het weer, of Google Translate een tekst vertaalt, draait er NLP. De meest indrukwekkende NLP-toepassing vandaag zijn LLM's zoals ChatGPT, die alle bovenstaande taken — en meer — in één model combineren.