
Embodied AI is een deelgebied van kunstmatige intelligentie dat zich richt op het creëren van agents die fysieke of complexe virtuele omgevingen waarnemen, ermee interageren en ervan leren, in plaats van strikt binnen tekst of statische datasets te opereren.
In tegenstelling tot een LLM dat in een browsertabblad zit, bezit een embodied agent een "lichaam" — dat kan een fysieke robot zijn, een drone of een avatar in een gesimuleerde 3D-wereld. Deze systemen moeten real-time multimodale sensorische input verwerken (visie, ruimtelijk bewustzijn, audio, aanraking) en die inputs vertalen naar fysieke acties of motorcommando's binnen hun omgeving.
Waarom het belangrijk is
Embodied AI overbrugt de kloof tussen digitaal redeneren en de fysieke wereld. Het is de fundamentele technologie die nodig is voor de volgende generatie autonome robotica, zelfrijdende voertuigen, geautomatiseerde productie en slimme huisassistenten. Door de uitgebreide semantische kennis van foundationmodellen te combineren met ruimtelijk-actiebeleid, evolueren embodied agents voorbij rigide, voorgeprogrammeerde robotbewegingen naar aanpasbaar probleemoplossen in open werelden.
Hoe het werkt
Embodied AI steunt doorgaans op Vision-Language-Action (VLA) modellen of reinforcement learning-paradigma's. De agent neemt continue sensorische data in (bijv. van een camerafeed) en combineert deze met een taaldoel op hoog niveau ("pak de rode beker op"). Het model verwerkt de visuele data om ruimtelijke relaties en object-affordances te begrijpen, redeneert over de noodzakelijke fysica en genereert een reeks motorcommando's op laag niveau om de taak uit te voeren.
Voorbeeld
NVIDIA's GR00T-project richt zich op foundationmodellen voor humanoïde robotleren. In plaats van een robot expliciet te programmeren hoe hij zijn gewrichten moet buigen om te lopen of te grijpen, stelt een embodied AI-model de robot in staat om ruimtelijke coördinatie en behendigheid te leren door menselijke demonstraties te observeren en in fysisch nauwkeurige simulaties te oefenen, voordat die vaardigheden naar de fysieke hardware worden overgedragen.