
Wat is het Bicameral Model?
Het Bicameral Model is een neurale architectuur die twee parallelle taalmodellen koppelt via een trainbare neurale interface die direct op hun tussenliggende hidden states werkt. Dit maakt real-time latente coördinatie mogelijk zonder dat er teksttokens tussen de modellen uitgewisseld worden.
Waarom het ertoe doet
Traditionale multi-agent systemen communiceren door tekst tussen modellen door te sturen — een langzaam, tokenintensief proces dat informatie verliest bij de omzetting. Het Bicameral Model vervangt dit door een continu latent kanaal, wat bewijst dat agents op representatieniveau kunnen coördineren. In experimenten verhoogde het koppelen van twee modellen van 0,5 miljard parameters met een rekenhulpmodel de rekennauwkeurigheid van 36% naar 96%. Op ZebraLogic behaalden twee modellen van 0,6 miljard parameters 1,7× de prestaties van een niet-uitgebreid basismodel — zonder enige aanvullende training op de basismodellen.
Hoe het werkt
Een primair model stuurt de hoofdredenering aan. Een hulpmodel loopt gelijk op en specialiseert zich in tooluitvoering, constraint-controle of codecomputatie. Een kleine trainbare neurale interface verbindt de twee: het leest de tussenliggende hidden states van beide modellen en injecteert correctieve signalen terug in de representatiestroom van het primaire model.
De twee basismodellen zijn doorgaans bevroren — alleen de interface wordt getraind. Dit geeft drie kernkenmerken:
- Parallelle uitvoering — beide modellen verwerken elk token tegelijkertijd, niet sequentieel
- Latente communicatie — coördinatie vindt plaats op hidden-state niveau, waarbij het tokenbottleneck wordt omzeild