Wat is Latent Space?

Latent space (latente ruimte) is een wiskundige representatie van gecomprimeerde, abstracte kenmerken die een AI-model intern gebruikt om data te begrijpen. Het is de verborgen ruimte waarin het model data "ziet" — niet als ruwe pixels of woorden, maar als compacte vectoren die de essentie van de data vastleggen.

Waarom het ertoe doet

Latent space is waar de "magie" van AI plaatsvindt. Het is de reden dat een diffusion model afbeeldingen kan genereren die nog nooit bestonden, dat een LLM concepten kan combineren tot nieuwe ideeën, en dat een embedding-model semantische gelijkenis tussen teksten kan meten. Begrijpen wat latent space is onthult hoe AI-modellen werkelijk met informatie omgaan.

Hoe het werkt

Het kernidee:

Ruwe data (beelden, tekst) leeft in een hoogdimensionale ruimte (bijv. een afbeelding van 256×256 pixels = 196.608 dimensies)
Het model comprimeert dit naar een latente ruimte met veel minder dimensies (bijv. 512)
In deze gecomprimeerde ruimte worden betekenisvolle kenmerken gecodeerd
Nabije punten in de latente ruimte hebben vergelijkbare eigenschappen

Latent space in de praktijk:

Embeddings (LLM's):

Woorden en zinnen worden gemapt naar punten in een latente ruimte
"Koning" - "man" + "vrouw" ≈ "koningin" (vectorrekenkunde in latent space)
Semantisch gelijkaardige zinnen liggen dicht bij elkaar

Diffusion models (beeldgeneratie):

De latente ruimte codeert visuele concepten (stijl, compositie, kleur)
Navigeren door de latente ruimte interpolateert tussen beelden
"Tekst-naar-beeld" werkt door tekst te mappen naar een punt in de visuele latente ruimte

VAE's (Variational Autoencoders):

Encoder comprimeert data naar latent space
Decoder reconstrueert data vanuit latent space
De gestructureerde latente ruimte maakt generatie van nieuwe data mogelijk

Dimensionaliteitsreductie:

t-SNE en UMAP visualiseren latente ruimtes in 2D/3D
Toont clusters en structuur die onzichtbaar zijn in de ruwe data

Voorbeeld

In de latente ruimte van Stable Diffusion worden visuele concepten als vectoren gecodeerd. "Een schilderij in de stijl van Van Gogh" en "een foto van een zonnebloem" zijn twee punten in deze ruimte. Door te interpoleren tussen deze punten — een gewogen gemiddelde te nemen — genereert het model een impressionistisch zonnebloem-schilderij. De latente ruimte maakt deze creatieve combinatie mogelijk.