
Wat is MLOps?
MLOps (Machine Learning Operations) is de discipline die machine learning-modellen van experiment naar productie brengt en ze daar betrouwbaar draaiend houdt. Het combineert ML-engineering, DevOps en data-engineering om de volledige levenscyclus van ML-modellen te beheren: van training en validatie tot deployment, monitoring en hertraining.
Waarom het ertoe doet
De meeste ML-modellen komen nooit in productie. MLOps lost dit op door het pad van notebook-experiment naar schaalbare, betrouwbare productie-service te structureren. Zonder MLOps is een model een eenmalig experiment; met MLOps wordt het een betrouwbaar software-product dat zichzelf monitort, waarschuwt bij degradatie en automatisch hertraind kan worden.
Hoe het werkt
De ML-levenscyclus:
- Data management — dataverzameling, -validatie, -versioning
- Experiment tracking — hyperparameters, metrics en resultaten bijhouden
- Training pipeline — reproduceerbare, geautomatiseerde trainingsprocessen
- Model registry — versiebeheer van getrainde modellen
- Deployment — model serveren als API of edge-deployment
- Monitoring — prestaties, drift, latentie en kosten bewaken
- Hertraining — automatisch hertrainen bij prestatiedaling
Kernpraktijken:
- CI/CD voor ML — automatische tests en deployment bij modelwijzigingen
- Data versioning — DVC, LakeFS voor reproduceerbare datasets
- Experiment tracking — MLflow, Weights & Biases, Neptune
- Model serving — TensorFlow Serving, Triton, vLLM, BentoML
- Feature stores — Feast, Tecton voor herbruikbare features
Tools:
- MLflow — experiment tracking, model registry, deployment
- Kubeflow — ML-workflows op Kubernetes
- Weights & Biases — experiment tracking en visualisatie
- DVC — dataversioning en pipeline-management
MLOps voor LLM's (LLMOps):
- Prompt management en versioning
- Evaluatie van LLM-output (automatisch en menselijk)
- Kosten- en latentie-optimalisatie
- Guardrails en veiligheidstests
Voorbeeld
Een e-commercebedrijf deployt een aanbevelingsmodel. Het MLOps-platform traint het model wekelijks op verse koopdata, evalueert automatisch of de nieuwe versie beter presteert, deployt het via een canary release, en monitort de click-through rate. Als de prestaties dalen (seizoensdrift), triggert het automatisch hertraining.