
Wat is Edge AI?
Edge AI is het uitvoeren van AI-modellen direct op lokale apparaten ("de edge") — smartphones, IoT-sensoren, camera's, auto's — in plaats van data naar de cloud te sturen voor verwerking. Het model draait op het apparaat zelf, wat resulteert in lagere latentie, betere privacy en offline-functionaliteit.
Waarom het ertoe doet
Niet alles kan of mag naar de cloud. Zelfrijdende auto's moeten in milliseconden reageren (latentie), medische apparatuur mag geen patiëntdata naar externe servers sturen (privacy), en industriële robots moeten functioneren zonder internetverbinding (beschikbaarheid). Edge AI maakt AI-toepassingen mogelijk waar cloud-afhankelijkheid onacceptabel is.
Hoe het werkt
Het principe:
- Train het model in de cloud met veel rekenkracht
- Optimaliseer het model voor beperkte hardware (smartphone, microcontroller)
- Deploy het geoptimaliseerde model op het edge-apparaat
- Inference draait volledig lokaal
Optimalisatietechnieken:
- Quantization — verlaag de precisie van weights (FP32 → INT8 of INT4)
- Pruning — verwijder minder belangrijke verbindingen uit het netwerk
- Model distillation — train een klein model dat een groot model nabootst
- Architectuurontwerp — compacte architecturen zoals MobileNet, EfficientNet