
Wat is Test-Time Co-Evolution?
Test-time co-evolution is een trainingsvrije techniek die de prestaties van multi-agent AI verbetert door agents toe te staan hun samenwerkingsstrategieën, kennisdistributie en rollen te evolueren tijdens inferentie — zonder gradient-updates of hertraining van het model. De agentpopulatie past zich in real time aan op basis van wat werkt en wat niet.
Waarom het ertoe doet
Standaard multi-agent systemen lijden aan geïsoleerd leren: de ervaring van elke agent blijft opgesloten in zijn eigen context. Wanneer een team faalt, is er geen mechanisme om wat er mis ging door te sturen naar de agents die het het meest nodig hebben. Test-time co-evolution lost dit op door de agentpopulatie te behandelen als een evoluerend systeem, waarbij evolutionaire operatoren tegelijkertijd op individueel, team- en populatieniveau worden toegepast.
EVOCHAMBER, het eerste framework dat deze aanpak implementeert, behaalt state-of-the-art resultaten op complexe multi-domein redeneer-benchmarks, waarbij agents spontaan gespecialiseerde rollen ontwikkelen door evolutionaire druk alleen — geen roltowijzingen, geen fine-tuning.
Hoe het werkt
Test-time co-evolution opereert op drie lagen:
- Individueel niveau — elke agent verfijnt zijn eigen redenering via herhaalde zelfevaluatie
- Teamniveau — wanneer een team faalt of het oneens is, triggert een Collaborative Dreaming-protocol: agents destilleren het falen collectief en sturen asymmetrisch kennis van sterkere naar zwakkere agents, zodat capaciteitsgaten worden opgevuld
- Populatieniveau — populatiebrede operatoren samenvoegen, snoeien en zaaien agents onder druk, wat selectiedruk creëert voor capabelere configuraties
Het resultaat is emergente specialisatie: agents die identiek begonnen belanden uiteindelijk in afzonderlijke functionele rollen (planner, uitvoerder, criticus) puur door evolutionaire dynamiek.
Praktisch voorbeeld
Een team van 5 agents dat aan een logisch puzzel werkt, faalt op de deductieve stap. Collaborative Dreaming triggert: de agent het dichtst bij een correct antwoord destilleert zijn inzicht in een compact principe en stuurt het door naar de twee zwakste agents. Bij de volgende poging passen die agents het principe toe en slaagt het team. Na veel taken wordt één agent consequent de deductiespecialist — een rol die voortkomt uit selectiedruk, niet uit ontwerp.
Bron
Zhang, Xu, Dai, Shao, Wu, Wang (2026): EVOCHAMBER — arXiv:2605.11136