
Wat is Semantische Zoeken?
Semantische zoeken (semantic search) is een zoekmethode die de betekenis van een zoekvraag begrijpt, in plaats van alleen te zoeken op exacte woordovereenkomsten. Het gebruikt AI-embeddings om teksten te vergelijken op basis van hun conceptuele gelijkenis, waardoor het relevante resultaten vindt zelfs wanneer de zoekvraag andere woorden gebruikt dan het document.
Waarom het ertoe doet
Semantische zoeken is de basis van moderne AI-systemen die informatie opvragen — van RAG-pipelines die LLM's met actuele kennis verrijken tot interne kennisbanken en e-commerce zoekmachines. Het lost het fundamentele probleem op van traditionele zoeksystemen: een zoekopdracht "Hoe bouw ik een huis" vindt ook documenten over "woningconstructie" en "bouwprojecten."
Hoe het werkt
Het proces:
- Indexering — alle documenten worden omgezet naar embedding-vectoren (eenmalig)
- Query — de zoekvraag wordt omgezet naar een embedding-vector
- Vergelijking — de query-vector wordt vergeleken met alle documentvectoren via cosine similarity
- Ranking — resultaten worden gesorteerd op semantische gelijkenis
Kerncomponenten:
- Embedding model — zet tekst om naar vectoren (OpenAI text-embedding-3, Cohere Embed, E5)
- Vector database — slaat en doorzoekt embedding-vectoren efficiënt (Pinecone, Weaviate, Qdrant, pgvector)
- Similarity metric — meestal cosine similarity
Hybride zoeken:
- Combineert semantische zoeken met keyword-zoeken (BM25)
- Vangt zowel conceptuele als exacte matches
- De standaard in productiesystemen
Toepassingen:
- RAG — ophalen van relevante context voor LLM's
- Kennisbanken — interne documentzoekmachines
- E-commerce — productzoeken op basis van beschrijvingen
- Klantenservice — relevante FAQ's vinden
Voorbeeld
Een juridisch kantoor implementeert semantische zoeken over 50.000 contracten. Een advocaat zoekt "aansprakelijkheid bij vertraging" en vindt relevante clausules — ook die geformuleerd als "schadevergoeding bij niet-tijdige levering" of "boetebeding bij deadline-overschrijding." Keyword-zoeken zou alleen documenten vinden met exact die woorden.