
Wat is Latent Space?
Latent space (latente ruimte) is een wiskundige representatie van gecomprimeerde, abstracte kenmerken die een AI-model intern gebruikt om data te begrijpen. Het is de verborgen ruimte waarin het model data "ziet" — niet als ruwe pixels of woorden, maar als compacte vectoren die de essentie van de data vastleggen.
Waarom het ertoe doet
Latent space is waar de "magie" van AI plaatsvindt. Het is de reden dat een diffusion model afbeeldingen kan genereren die nog nooit bestonden, dat een LLM concepten kan combineren tot nieuwe ideeën, en dat een embedding-model semantische gelijkenis tussen teksten kan meten. Begrijpen wat latent space is onthult hoe AI-modellen werkelijk met informatie omgaan.
Hoe het werkt
Het kernidee:
- Ruwe data (beelden, tekst) leeft in een hoogdimensionale ruimte (bijv. een afbeelding van 256×256 pixels = 196.608 dimensies)
- Het model comprimeert dit naar een latente ruimte met veel minder dimensies (bijv. 512)
- In deze gecomprimeerde ruimte worden betekenisvolle kenmerken gecodeerd
- Nabije punten in de latente ruimte hebben vergelijkbare eigenschappen
Latent space in de praktijk:
Embeddings (LLM's):
- Woorden en zinnen worden gemapt naar punten in een latente ruimte
- "Koning" - "man" + "vrouw" ≈ "koningin" (vectorrekenkunde in latent space)
- Semantisch gelijkaardige zinnen liggen dicht bij elkaar
Diffusion models (beeldgeneratie):
- De latente ruimte codeert visuele concepten (stijl, compositie, kleur)
- Navigeren door de latente ruimte interpolateert tussen beelden
- "Tekst-naar-beeld" werkt door tekst te mappen naar een punt in de visuele latente ruimte
VAE's (Variational Autoencoders):
- Encoder comprimeert data naar latent space
- Decoder reconstrueert data vanuit latent space
- De gestructureerde latente ruimte maakt generatie van nieuwe data mogelijk
Dimensionaliteitsreductie:
- t-SNE en UMAP visualiseren latente ruimtes in 2D/3D
- Toont clusters en structuur die onzichtbaar zijn in de ruwe data
Voorbeeld
In de latente ruimte van Stable Diffusion worden visuele concepten als vectoren gecodeerd. "Een schilderij in de stijl van Van Gogh" en "een foto van een zonnebloem" zijn twee punten in deze ruimte. Door te interpoleren tussen deze punten — een gewogen gemiddelde te nemen — genereert het model een impressionistisch zonnebloem-schilderij. De latente ruimte maakt deze creatieve combinatie mogelijk.