
Agentic RAG breidt traditionele Retrieval-Augmented Generation uit door het ophaalproces zelf aan een autonome agent te geven die iteratief kan zoeken, evalueren, queries verfijnen en resultaten synthetiseren over meerdere bronnen. In tegenstelling tot standaard RAG die één ophaalstap uitvoert vóór generatie, kunnen Agentic RAG-systemen beslissen wanneer extra ophaling nodig is, queries herformuleren op basis van tussenresultaten, meerdere bronnen kruislings verifiëren voor nauwkeurigheid, en tools gebruiken naast eenvoudige vectorzoekopdrachten (webbrowsing, API-aanroepen, databasequeries). Dit patroon wordt mogelijk gemaakt door de nieuwe tool-orkestratiemogelijkheden in OpenAI's Responses API, Anthropic's programmatic tool calling en het Everything Claude Code framework.
Waarom het belangrijk is
Standaard RAG heeft een fundamentele beperking: het voert één ophaalpass uit en hoopt dat de resultaten voldoende zijn. Voor eenvoudige feitelijke vragen werkt dit, maar voor complexe vragen die synthese vereisen over meerdere documenten, het verbinden van uiteenlopende feiten, of het oplossen van tegenspraken tussen bronnen, levert single-pass ophaling vaak onvolledige of misleidende context op. Agentic RAG adresseert dit door een autonome agent de gehele ophaallus te laten besturen — beslissen wat te zoeken, evalueren of resultaten toereikend zijn, en itereren tot het antwoord compleet is. Dit is vooral cruciaal voor enterprise kennisbanken, juridisch onderzoek en wetenschappelijke literatuurreviews waar antwoordkwaliteit afhangt van grondigheid.

Hoe het werkt
De agent opereert in een ophaal-evalueer-verfijn lus. Hij begint met een initiële query, haalt kandidaatdocumenten op, en evalueert dan of de resultaten de vraag adequaat beantwoorden. Als er hiaten blijven, herformuleert hij de query — door de scope te vernauwen, andere terminologie te gebruiken, of een geheel andere ophaalbackend te benaderen. De agent heeft toegang tot meerdere tools naast vectorzoekopdrachten: webbrowsing voor actuele informatie, SQL-queries voor gestructureerde data, API-aanroepen naar gespecialiseerde databases, en zelfs andere agents voor deelvragen. Tool-orkestratie via MCP of programmatic tool calling maakt efficiënte ketening van deze ophaalstappen mogelijk. De uiteindelijke synthesestap kruisrefereert alle verzamelde bewijzen, lost tegenspraken op en citeert bronnen met herkomstinformatie.
Voorbeeld
Een juridische onderzoeksagent gevraagd 'Wat zijn de nalevingsvereisten voor het deployen van AI in de gezondheidszorg in EU-lidstaten?' illustreert het verschil. Standaard RAG retourneert mogelijk een algemene samenvatting van de EU AI Act. Een Agentic RAG-systeem haalt eerst de EU AI Act-tekst op, identificeert gezondheidszorg als hoog-risicocategorie, zoekt vervolgens naar implementatierichtlijnen per lidstaat, kruisrefereert met recente handhavingsacties, controleert sectorspecifieke regelgeving in belangrijke markten (Duitsland, Frankrijk, Nederland), en bevraagt databases voor medische hulpmiddelenregelgeving. Na vijf ophaaliteraties synthetiseert het een uitgebreid antwoord met jurisdictie-specifieke vereisten en primaire bronvermeldingen — ver voorbij wat een enkele ophaalpass zou kunnen produceren.