
GraphRAG is een retrieval-augmented generation-architectuur die ongestructureerde tekst structureert in een kennisgraaf om de nauwkeurigheid van AI-retrieval drastisch te verbeteren, vooral voor complexe multi-hop queries die het synthetiseren van informatie uit vele documenten vereisen.
Oorspronkelijk voorgesteld door Microsoft Research en snel geadopteerd door de open-source gemeenschap gedurende 2025–2026, adresseert GraphRAG de kernbeperking van standaard RAG-systemen: hun onvermogen om vragen te beantwoorden die het verbinden van feiten uit verschillende documentfragmenten vereisen.
Waarom het belangrijk is
Standaard RAG (Retrieval-Augmented Generation) haalt tekstfragmenten op op basis van vectorovereenkomst en voegt ze toe aan een taalmodel. Dit werkt goed voor eenvoudige feitelijke opzoekingen maar faalt wanneer het antwoord redenering over relaties tussen entiteiten vereist — bijvoorbeeld: "Welke klanten in sector X hadden projecten die vertraagd waren door supply chain-problemen vermeld in onze Q4-rapporten?" GraphRAG lost dit op door vooraf een expliciete kennisgraaf van entiteiten en hun relaties op te bouwen, waardoor het model verbindingen kan doorlopen in plaats van uitsluitend te vertrouwen op embeddingproximiteit.
Hoe het werkt
GraphRAG werkt in twee fasen. Indexering: het systeem neemt documenten op, gebruikt een LLM om entiteiten (personen, organisaties, concepten, gebeurtenissen) en hun relaties te extraheren, en construeert vervolgens een kennisgraaf met nodes en edges. Het genereert ook "community-samenvattingen" — natuurlijke-taalbeschrijvingen van clusters van gerelateerde entiteiten. Retrieval: wanneer een gebruiker een vraag stelt, bevraagt het systeem zowel de graafstructuur (door relaties te doorlopen) als de community-samenvattingen, waardoor een rijkere context ontstaat voor de uiteindelijke LLM-antwoordgeneratie dan platte vectorzoekopdrachten alleen.
Voorbeeld
Een juridisch team moet alle contracten vinden waar Bedrijf A zowel leverancier als onderaannemer is van verschillende divisies van Bedrijf B. Standaard RAG zou individuele contractfragmenten ophalen die een van beide bedrijven noemen maar de dubbele relatie niet verbinden. GraphRAGs kennisgraaf slaat expliciet de leverancier- en onderaannemerrelaties op, waardoor het de graaf kan doorlopen en beide koppelingen in één enkele query kan opleveren.
Verwante concepten
- RAG (Retrieval-Augmented Generation)
- Embedding
- Large Language Model (LLM)