Wat is Test-Time Co-Evolution?

Een trainingsvrije techniek die evolueert hoe multi-agent AI-systemen samenwerken tijdens inferentie, waardoor agents gespecialiseerde rollen kunnen ontwikkelen en kennis kunnen routeren naar waar het het meest nodig is.

Ook bekend als:

EVOCHAMBER

collaborative dreaming

multi-agent co-evolution

evolutionary multi-agent systems

Wat is Test-Time Co-Evolution?

Test-time co-evolution is een trainingsvrije techniek die de prestaties van multi-agent AI verbetert door agents toe te staan hun samenwerkingsstrategieën, kennisdistributie en rollen te evolueren tijdens inferentie — zonder gradient-updates of hertraining van het model. De agentpopulatie past zich in real time aan op basis van wat werkt en wat niet.

Waarom het ertoe doet

Standaard multi-agent systemen lijden aan geïsoleerd leren: de ervaring van elke agent blijft opgesloten in zijn eigen context. Wanneer een team faalt, is er geen mechanisme om wat er mis ging door te sturen naar de agents die het het meest nodig hebben. Test-time co-evolution lost dit op door de agentpopulatie te behandelen als een evoluerend systeem, waarbij evolutionaire operatoren tegelijkertijd op individueel, team- en populatieniveau worden toegepast.

EVOCHAMBER, het eerste framework dat deze aanpak implementeert, behaalt state-of-the-art resultaten op complexe multi-domein redeneer-benchmarks, waarbij agents spontaan gespecialiseerde rollen ontwikkelen door evolutionaire druk alleen — geen roltowijzingen, geen fine-tuning.

Hoe het werkt

Test-time co-evolution opereert op drie lagen:

Individueel niveau — elke agent verfijnt zijn eigen redenering via herhaalde zelfevaluatie
Teamniveau — wanneer een team faalt of het oneens is, triggert een Collaborative Dreaming-protocol: agents destilleren het falen collectief en sturen asymmetrisch kennis van sterkere naar zwakkere agents, zodat capaciteitsgaten worden opgevuld
Populatieniveau — populatiebrede operatoren samenvoegen, snoeien en zaaien agents onder druk, wat selectiedruk creëert voor capabelere configuraties

Het resultaat is emergente specialisatie: agents die identiek begonnen belanden uiteindelijk in afzonderlijke functionele rollen (planner, uitvoerder, criticus) puur door evolutionaire dynamiek.

Praktisch voorbeeld

Een team van 5 agents dat aan een logisch puzzel werkt, faalt op de deductieve stap. Collaborative Dreaming triggert: de agent het dichtst bij een correct antwoord destilleert zijn inzicht in een compact principe en stuurt het door naar de twee zwakste agents. Bij de volgende poging passen die agents het principe toe en slaagt het team. Na veel taken wordt één agent consequent de deductiespecialist — een rol die voortkomt uit selectiedruk, niet uit ontwerp.

Bron

Zhang, Xu, Dai, Shao, Wu, Wang (2026): EVOCHAMBER — arXiv:2605.11136

Wat is Test-Time Co-Evolution?

Waarom het ertoe doet

Hoe het werkt

Test-time co-evolution opereert op drie lagen:

Individueel niveau — elke agent verfijnt zijn eigen redenering via herhaalde zelfevaluatie
Teamniveau — wanneer een team faalt of het oneens is, triggert een Collaborative Dreaming-protocol: agents destilleren het falen collectief en sturen asymmetrisch kennis van sterkere naar zwakkere agents, zodat capaciteitsgaten worden opgevuld
Populatieniveau — populatiebrede operatoren samenvoegen, snoeien en zaaien agents onder druk, wat selectiedruk creëert voor capabelere configuraties

Het resultaat is emergente specialisatie: agents die identiek begonnen belanden uiteindelijk in afzonderlijke functionele rollen (planner, uitvoerder, criticus) puur door evolutionaire dynamiek.

Praktisch voorbeeld

Bron

Zhang, Xu, Dai, Shao, Wu, Wang (2026): EVOCHAMBER — arXiv:2605.11136

Wat is Test-Time Co-Evolution?

Wat is Test-Time Co-Evolution?

Waarom het ertoe doet

Hoe het werkt

Praktisch voorbeeld

Bron

Bronnen

Wat is Test-Time Co-Evolution?

Wat is Test-Time Co-Evolution?

Waarom het ertoe doet

Hoe het werkt

Praktisch voorbeeld

Bron

Bronnen