
Wat is Edge AI?
Edge AI is het uitvoeren van AI-modellen direct op lokale apparaten ("de edge") — smartphones, IoT-sensoren, camera's, auto's — in plaats van data naar de cloud te sturen voor verwerking. Het model draait op het apparaat zelf, wat resulteert in lagere latentie, betere privacy en offline-functionaliteit.
Waarom het ertoe doet
Niet alles kan of mag naar de cloud. Zelfrijdende auto's moeten in milliseconden reageren (latentie), medische apparatuur mag geen patiëntdata naar externe servers sturen (privacy), en industriële robots moeten functioneren zonder internetverbinding (beschikbaarheid). Edge AI maakt AI-toepassingen mogelijk waar cloud-afhankelijkheid onacceptabel is.
Hoe het werkt
Het principe:
- Train het model in de cloud met veel rekenkracht
- Optimaliseer het model voor beperkte hardware (smartphone, microcontroller)
- Deploy het geoptimaliseerde model op het edge-apparaat
- Inference draait volledig lokaal
Optimalisatietechnieken:
- Quantization — verlaag de precisie van weights (FP32 → INT8 of INT4)
- Pruning — verwijder minder belangrijke verbindingen uit het netwerk
- Model distillation — train een klein model dat een groot model nabootst
- Architectuurontwerp — compacte architecturen zoals MobileNet, EfficientNet
Hardware voor edge AI:
- NPU's — Neural Processing Units in smartphones (Apple Neural Engine, Qualcomm Hexagon)
- Edge TPU's — Google's edge tensor processing units
- Microcontrollers — TinyML op Arduino en ESP32
- GPU-modules — NVIDIA Jetson voor robotica en autonome systemen
Cloud vs Edge trade-offs:
- Cloud: meer rekenkracht, grotere modellen, altijd actueel
- Edge: lagere latentie, betere privacy, werkt offline, geen dataoverdrachtkosten
Voorbeeld
De gezichtsherkenning op je iPhone draait volledig lokaal via Apple's Neural Engine — een edge AI-chip. Je gezichtsdata verlaat nooit het apparaat. Dit is sneller dan cloud-verwerking (geen netwerklatentie) en privacyvriendelijker (Apple kan je biometrische data niet zien).