
Agent Browser Protocol (ABP) is een open-source aangepaste Chromium-build die Model Context Protocol (MCP)-servers en REST API's direct in de browser-engine integreert, waardoor deterministische webautomatisering voor AI-agents mogelijk wordt. ABP pauzeert JavaScript-uitvoering en virtuele tijd volledig tussen agent-acties, waardoor webbrowsing wordt getransformeerd tot een discrete stapmachine waarin agents alleen handelen op stabiele, bevroren wereldtoestanden. Dit elimineert race conditions tussen continue webrendering en stapsgewijs AI-redeneren. Op de Online Mind2Web-benchmark behaalde ABP een reproduceerbaar succespercentage van 90,53%, waarmee het traditionele DOM-scraping-benaderingen die breken op dynamische content, shadow DOMs en anti-botmaatregelen drastisch overtreft.
Waarom het belangrijk is
Traditionele webautomatiseringstools zoals Selenium en Playwright werken op DOM-niveau — ze bevragen HTML-elementen, klikken op knoppen en lezen tekst uit de gerenderde pagina. Deze aanpak is fundamenteel fragiel omdat moderne webapplicaties dynamische rendering, shadow DOMs, single-page application-routing en agressieve anti-botdetectie gebruiken. Elke keer dat een website zijn markup wijzigt, breekt de automatisering. AI-agents hebben een bijkomend probleem: ze redeneren in discrete stappen, maar de browser rendert continu. Tussen het moment dat een agent besluit op een knop te klikken en de daadwerkelijke klik, kan de paginastatus veranderd zijn. ABP lost beide problemen tegelijk op door de volledige browsertoestand te bevriezen tussen agentacties en browsermogelijkheden beschikbaar te stellen via gestandaardiseerde MCP-tools in plaats van fragiele DOM-selectors. Dit maakt betrouwbare autonome webworkflows mogelijk die voorheen onmogelijk waren.

Hoe het werkt
ABP wijzigt de Chromium browser-engine op drie niveaus. Eerst onderschept het de JavaScript-eventloop en virtuele klok, waarbij uitvoering volledig wordt gepauzeerd tussen agentstappen — geen animaties draaien, geen timers vuren, geen netwerkverzoeken worden voltooid totdat de agent gereedheid signaleert. Vervolgens stelt het browsermogelijkheden beschikbaar als MCP-servers, wat betekent dat elk AI-model dat MCP spreekt pagina's kan navigeren, formulieren kan invullen, elementen kan aanklikken en content kan extraheren via gestandaardiseerde toolaanroepen in plaats van aangepaste scripting. Ten derde biedt het REST API's voor taken die directe programmatische controle vereisen, zoals screenshot-capture, cookiebeheer en netwerkonderschepping. De combinatie van bevroren toestand en gestandaardiseerde interfaces transformeert het inherent asynchrone, niet-deterministische web tot een voorspelbare toestandsmachine die AI-agents stap voor stap betrouwbaar kunnen navigeren.
Voorbeeld
Stel dat een AI-agent prijzen moet vergelijken op vijf e-commercesites, elk met verschillende layouts, dynamische laadpatronen en anti-botmaatregelen. Met traditionele Playwright-automatisering heb je site-specifieke selectors, wacht-op-element-logica en CAPTCHA-afhandeling nodig per site — en de scripts breken telkens wanneer een site herontworpen wordt. Met ABP navigeert de agent naar elke site via MCP-tools, de browser bevriest na elke paginalading, de agent leest de stabiele DOM om prijzen te vinden, en gaat verder naar de volgende site. Geen aangepaste selectors, geen timingproblemen, geen race conditions. Als een site een shadow DOM gebruikt of prijzen laadt via JavaScript, handelt ABP dit af op engine-niveau omdat de volledige pagina bevroren en volledig gerenderd is voordat de agent deze onderzoekt.