Wat is Edge AI / On-Device AI? | AI Woordenboek

Wat is Edge AI?

Edge AI is het uitvoeren van AI-modellen direct op lokale apparaten ("de edge") — smartphones, IoT-sensoren, camera's, auto's — in plaats van data naar de cloud te sturen voor verwerking. Het model draait op het apparaat zelf, wat resulteert in lagere latentie, betere privacy en offline-functionaliteit.

Waarom het ertoe doet

Niet alles kan of mag naar de cloud. Zelfrijdende auto's moeten in milliseconden reageren (latentie), medische apparatuur mag geen patiëntdata naar externe servers sturen (privacy), en industriële robots moeten functioneren zonder internetverbinding (beschikbaarheid). Edge AI maakt AI-toepassingen mogelijk waar cloud-afhankelijkheid onacceptabel is.

Hoe het werkt

Het principe:

Train het model in de cloud met veel rekenkracht
Optimaliseer het model voor beperkte hardware (smartphone, microcontroller)
Deploy het geoptimaliseerde model op het edge-apparaat
Inference draait volledig lokaal

Optimalisatietechnieken:

Quantization — verlaag de precisie van weights (FP32 → INT8 of INT4)
Pruning — verwijder minder belangrijke verbindingen uit het netwerk
Model distillation — train een klein model dat een groot model nabootst
Architectuurontwerp — compacte architecturen zoals MobileNet, EfficientNet

Hardware voor edge AI:

NPU's — Neural Processing Units in smartphones (Apple Neural Engine, Qualcomm Hexagon)
Edge TPU's — Google's edge tensor processing units
Microcontrollers — TinyML op Arduino en ESP32
GPU-modules — NVIDIA Jetson voor robotica en autonome systemen

Cloud vs Edge trade-offs:

Cloud: meer rekenkracht, grotere modellen, altijd actueel
Edge: lagere latentie, betere privacy, werkt offline, geen dataoverdrachtkosten

Voorbeeld

De gezichtsherkenning op je iPhone draait volledig lokaal via Apple's Neural Engine — een edge AI-chip. Je gezichtsdata verlaat nooit het apparaat. Dit is sneller dan cloud-verwerking (geen netwerklatentie) en privacyvriendelijker (Apple kan je biometrische data niet zien).

Wat is Edge AI?

Waarom het ertoe doet

Hoe het werkt

Het principe:

Train het model in de cloud met veel rekenkracht
Optimaliseer het model voor beperkte hardware (smartphone, microcontroller)
Deploy het geoptimaliseerde model op het edge-apparaat
Inference draait volledig lokaal

Optimalisatietechnieken:

Quantization — verlaag de precisie van weights (FP32 → INT8 of INT4)
Pruning — verwijder minder belangrijke verbindingen uit het netwerk
Model distillation — train een klein model dat een groot model nabootst
Architectuurontwerp — compacte architecturen zoals MobileNet, EfficientNet

Hardware voor edge AI:

NPU's — Neural Processing Units in smartphones (Apple Neural Engine, Qualcomm Hexagon)
Edge TPU's — Google's edge tensor processing units
Microcontrollers — TinyML op Arduino en ESP32
GPU-modules — NVIDIA Jetson voor robotica en autonome systemen

Cloud vs Edge trade-offs:

Cloud: meer rekenkracht, grotere modellen, altijd actueel
Edge: lagere latentie, betere privacy, werkt offline, geen dataoverdrachtkosten

Wat is Edge AI?

Wat is Edge AI?

Waarom het ertoe doet

Hoe het werkt

Voorbeeld

Bronnen

Wat is Edge AI?

Wat is Edge AI?

Waarom het ertoe doet

Hoe het werkt

Voorbeeld

Bronnen