
Een vectordatabase is een gespecialiseerd databasesysteem ontworpen voor het opslaan, indexeren en efficiënt doorzoeken van hoog-dimensionale embedding-vectoren. Terwijl traditionele databases uitblinken in exacte overeenkomsten en bereikquery's, zijn vectordatabases geoptimaliseerd voor similarity search — het vinden van de vectoren (en hun bijbehorende content) die het dichtst bij een queryvector liggen in een hoog-dimensionale ruimte. Deze mogelijkheid is de infrastructuurbasis van Retrieval-Augmented Generation (RAG), semantisch zoeken, aanbevelingssystemen en elke applicatie die content moet vinden op basis van betekenis in plaats van exacte trefwoorden. Moderne vectordatabases (Pinecone, Weaviate, Qdrant, Milvus, Chroma, pgvector) verwerken miljoenen tot miljarden vectoren met querytijden onder de 100ms.
Waarom het belangrijk is
Vectordatabases zijn de kritieke infrastructuurlaag die RAG-systemen op schaal mogelijk maakt. Zonder efficiënt zoeken op gelijkenis over grote documentcollecties zou elke RAG-query het vergelijken van de query-embedding met elke opgeslagen embedding vereisen — een proces dat lineair schaalt en onpraktisch wordt voorbij duizenden documenten. Productie-RAG-systemen indexeren miljoenen documentchunks, en vectordatabases maken dit doorzoekbaar in milliseconden met approximate nearest neighbor-algoritmen. Voor organisaties die AI-applicaties bouwen is het kiezen en beheren van een vectordatabase net zo fundamenteel als het kiezen van een relationele database voor traditionele applicaties. De vectordatabase bepaalt zoekkwaliteit, querylatentie, updatesnelheid en uiteindelijk de gebruikerservaring van elke AI-aangedreven zoekfunctie of assistent.
Hoe het werkt
Vectordatabases slaan embedding-vectoren op naast hun metadata (brondocument, chunktekst, tags, timestamps). Wanneer een query binnenkomt, zet de database deze om naar een vector (of ontvangt een vooraf berekende queryvector) en gebruikt gespecialiseerde indexeringsalgoritmen om de meest vergelijkbare opgeslagen vectoren te vinden. Deze algoritmen — voornamelijk HNSW (Hierarchical Navigable Small World), IVF (Inverted File Index) en PQ (Product Quantization) — ruilen perfecte nauwkeurigheid voor dramatische snelheidsverbeteringen door approximate nearest neighbors te zoeken. HNSW bouwt een meerlaags grafiek waarin elke vector verbonden is met zijn dichtstbijzijnde buren, wat efficiënte traversal mogelijk maakt vanaf elk startpunt naar de dichtstbijzijnde overeenkomsten. De meeste vectordatabases ondersteunen hybride zoeken (vectorsimilariteit combineren met metadatafilters), multi-tenancy (data van verschillende gebruikers isoleren) en realtime updates (vectoren toevoegen of verwijderen zonder de index opnieuw op te bouwen).
Voorbeeld
Een mediabedrijf bouwt een AI-aangedreven artikelaanbevelingssysteem over hun archief van 2 miljoen artikelen dat 20 jaar bestrijkt. Elk artikel wordt opgesplitst in paragrafen, ingebed met een embedding-model en opgeslagen in een vectordatabase — in totaal 15 miljoen vectoren. Wanneer een lezer een artikel over hernieuwbaar energiebeleid in Nederland voltooit, genereert het systeem een embedding van het artikel, bevraagt de vectordatabase naar de 50 meest vergelijkbare paragrafen, dedupliceert per artikel en presenteert 5 aanbevolen artikelen. De vectordatabase retourneert resultaten in 40ms uit 15 miljoen vectoren. Metadatafilters zorgen ervoor dat aanbevelingen van de afgelopen 2 jaar zijn (niet verouderd), van verschillende auteurs (diverse perspectieven) en uit toegankelijke secties (met respect voor paywallregels). Vergeleken met hun vorige op trefwoorden gebaseerde aanbevelingssysteem verbetert de doorklikratio met 34% omdat de vectorsearch thematisch gerelateerde artikelen vindt zelfs wanneer ze volledig andere terminologie gebruiken.