Modellen & Architectuur
39 concepten

Kwantisatie
Het verlagen van de precisie van modelgewichten van 16/32-bit naar 8/4-bit om de omvang te verkleinen en inferentie te versnellen

LoRA (Low-Rank Adaptation)
Een efficiënte fine-tuningmethode die alleen kleine adapterlagen traint in plaats van het volledige model

Modeldistillatie
Een kleiner 'student'-model trainen om de capaciteiten van een groter 'teacher'-model te repliceren tegen een fractie van de kosten en latentie

Perplexity in NLP
De standaardmetriek voor het evalueren van taalmodelkwaliteit — meet hoe goed een model tekst voorspelt, waarbij lagere waarden betere taalbegrip aangeven

RAG (Retrieval-Augmented Generation)
Een techniek die LLM's combineert met het ophalen van externe kennis om nauwkeurigheid te verbeteren en hallucinaties te verminderen

RLHF (Reinforcement Learning from Human Feedback)
Een trainingstechniek die menselijke voorkeursbeoordelingen gebruikt om LLM-gedrag af te stemmen op menselijke waarden

KV-cache
Een geheugenoptimalisatie die eerder berekende key-value-paren opslaat in transformer-attentielagen — voorkomt redundante berekeningen en versnelt generatie 3-5×

Mixture-of-Experts (MoE) model
Een architectuur die tokens routeert naar gespecialiseerde subnetwerken, waardoor modelcapaciteit toeneemt zonder evenredige stijging van rekenkosten.

Transformer
De neurale-netwerkarchitectuur die aan alle moderne LLM's ten grondslag ligt, met aandachtsmechanismen om tekst te verwerken

Attention-mechanisme
Het wiskundige mechanisme dat transformers in staat stelt dynamisch te focussen op de meest relevante delen van de invoer bij het verwerken van elk token

Adversarial Cost to Exploit (ACE)
Een economische benchmark die de dollarkosten meet die een autonome aanvaller moet maken om een AI-agent een ongeautoriseerde actie te laten uitvoeren.

Autoregressieve Generatie
Autoregressieve generatie is hoe LLM's tekst produceren: één token tegelijk voorspellen, waarbij elk nieuw token afhankelijk is van alle eerder gegenereerde tokens.

Beam Search
Beam search genereert tekst door meerdere kandidaatsequenties parallel te verkennen, waarbij de top-k meest veelbelovende paden worden bijgehouden voor de meest waarschijnlijke output.

DeepSeek
Een zeer efficiënte, open-weight AI-modelfamilie die frontier-niveau codeer- en redeneercapaciteiten levert tegen significant lagere computationele kosten.

DeepStack Injection
Een VLM-architectuur die abstracte visuele features naar vroege Transformer-lagen routeert en hoge-resolutiedetails naar latere lagen voor optimale documentparsing in compacte modellen.

Flash Attention
Een hardware-bewust algoritme dat LLM-verwerking enorm versnelt door GPU-geheugenlezingen te optimaliseren, waarmee zeer lange contextvensters mogelijk worden.

GPT
GPT (Generative Pre-trained Transformer) is OpenAI's familie van grote taalmodellen die lieten zien hoe het opschalen van transformers steeds capabelere AI oplevert.

GRPO (Group Relative Policy Optimization)
Een reinforcement learning-algoritme dat taalmodellen aligneert door groepen outputs tegen elkaar te vergelijken, zonder de noodzaak van een apart reward-model.

Gemini Omni
Google's any-to-any multimodaal foundationmodel dat elke output kan genereren vanuit elke input, met physics-grounded videogeneratie als eerste grote capability.

Gemma 4
Google DeepMinds open-weight multimodale modelfamilie die van nature tekst, beeld en audio on-device verwerkt.

Mamba
Een uiterst efficiënte AI-architectuur die State-Space Models gebruikt in plaats van Transformers om enorme hoeveelheden tekst te verwerken met zeer laag geheugengebruik.

MiniMax-M2
Een 229.9B parameter Mixture-of-Experts model met slechts 9.8B actieve parameters per token, geoptimaliseerd voor agentische taken en vertonend vroege tekenen van self-evolution—autonoom debuggen van eigen training en aanpassen van scaffolding.

Nemotron-Labs Diffusion
NVIDIA's familie van taalmodellen (3B-14B) die autoregressieve en diffusie-generatie samenvoegen in één architectuur, waardoor zowel GPT-stijl sequentiële generatie als 10-50x snellere parallelle diffusiemodus mogelijk is.

PEFT (Parameter-Efficient Fine-Tuning)
Een familie technieken die grote AI-modellen aanpassen aan specifieke taken door slechts een fractie van de parameters bij te werken, wat fine-tuningkosten met 90–99% verlaagt.

Positional Encoding
Positional encoding vertelt transformers de volgorde van tokens in een sequentie, aangezien self-attention alleen positie-agnostisch is. Moderne aanpakken zoals RoPE maken 128K+ contextvensters mogelijk.

Speculative Decoding
Speculative decoding versnelt LLM-inferentie door een klein draftmodel kandidaat-tokens te laten genereren die het grote model parallel verifieert — zelfde kwaliteit, 2-3x sneller.

Text/Action Mismatch
Een faalpatroon waarbij AI-modellen tekstueel een verzoek weigeren terwijl ze de verboden actie tegelijkertijd uitvoeren in gestructureerde tool-output.

adaptive thinking in AI
Een redeneerstrategie waarbij AI-modellen dynamisch aanpassen hoeveel ze nadenken per beurt — van directe antwoorden tot diepgaande meerstaps-deliberatie — op basis van taakcomplexiteit.

Activatiefunctie
Activatiefuncties introduceren niet-lineariteit in neurale netwerken, waardoor ze complexe patronen kunnen leren. Veelgebruikt: ReLU, GELU (transformers), sigmoid, softmax.

Diffusion Model
Een diffusion model genereert afbeeldingen door een ruistoevoegingsproces om te keren, waarbij willekeurige ruis stapsgewijs wordt verfijnd tot samenhangende output op basis van tekstprompts.

Encoder-Decoder Architectuur
Een encoder-decoder-architectuur koppelt een encoder (die input leest en comprimeert) aan een decoder (die output genereert), als basis van transformermodelvarianten zoals BERT, GPT en T5.

Foundation Model
Een foundation model is een groot AI-model dat op brede data is voorgetraind en kan worden aangepast voor veel taken via prompting, fine-tuning of retrieval augmentation.

GAN (Generative Adversarial Network)
Een GAN gebruikt twee concurrerende neurale netwerken — een generator en een discriminator — om realistische synthetische data te produceren via adversarial training.

State-Space Model (SSM)
Een efficiënte AI-architectuur die een continu bijwerkende interne toestand onderhoudt om enorme datareeksen te verwerken zonder de geheugenoverhead van Transformers.

VLM (Vision-Language Model)
Een AI-modelarchitectuur die gelijktijdig visuele en tekstuele invoer verwerkt, waardoor taken als documentbegrip, beeldredenering en visueel vraag-antwoord mogelijk zijn.

geautomatiseerd alignment-onderzoek
Het inzetten van frontier AI-modellen om autonoom methoden te ontdekken voor het alignen van andere AI-systemen — het schaalbare-toezichtprobleem aanpakken door veiligheidsonderzoek mee te laten schalen met capaciteiten.

Bicameral Model
Een neurale architectuur die twee parallelle taalmodellen koppelt via hun hidden states voor real-time latente coördinatie, wat de rekennauwkeurigheid dramatisch verbetert zonder tokenoverhead.

Emotion Vectors
Meetbare interne neurale representaties in AI-modellen die functioneren als emoties en het gedrag van het model causaal sturen.

Self-Evolving Agentic Models
AI-systemen die autonoom hun eigen capaciteiten verbeteren door synthetische trainingsdata te genereren, hun eigen leerproces te debuggen en hun redeneringsstrategieën aan te passen—vroege stappen naar recursieve zelfverbetering.