Modellen & Architectuur

24 concepten

Kwantisatie

Het verlagen van de precisie van modelgewichten van 16/32-bit naar 8/4-bit om de omvang te verkleinen en inferentie te versnellen

Intermediate

Modellen & Architectuur

LoRA (Low-Rank Adaptation)

Een efficiënte fine-tuningmethode die alleen kleine adapterlagen traint in plaats van het volledige model

What Is Model Distillation? How Knowledge Transfer Makes AI Smaller & Faster

Intermediate

Modellen & Architectuur

Modeldistillatie

Een kleiner 'student'-model trainen om de capaciteiten van een groter 'teacher'-model te repliceren tegen een fractie van de kosten en latentie

What Is Perplexity in NLP? The Key Metric for Language Model Evaluation

Intermediate

Modellen & Architectuur

Perplexity in NLP

De standaardmetriek voor het evalueren van taalmodelkwaliteit — meet hoe goed een model tekst voorspelt, waarbij lagere waarden betere taalbegrip aangeven

Intermediate

Modellen & Architectuur

RAG (Retrieval-Augmented Generation)

Een techniek die LLM's combineert met het ophalen van externe kennis om nauwkeurigheid te verbeteren en hallucinaties te verminderen

RLHF (Reinforcement Learning from Human Feedback)

Advanced

Modellen & Architectuur

RLHF (Reinforcement Learning from Human Feedback)

Een trainingstechniek die menselijke voorkeursbeoordelingen gebruikt om LLM-gedrag af te stemmen op menselijke waarden

What Is the KV Cache? How Key-Value Caching Accelerates LLM Inference

Advanced

Modellen & Architectuur

KV-cache

Een geheugenoptimalisatie die eerder berekende key-value-paren opslaat in transformer-attentielagen — voorkomt redundante berekeningen en versnelt generatie 3-5×

What is a Mixture-of-Experts (MoE) model?

Advanced

Modellen & Architectuur

Mixture-of-Experts (MoE) model

Een architectuur die tokens routeert naar gespecialiseerde subnetwerken, waardoor modelcapaciteit toeneemt zonder evenredige stijging van rekenkosten.

Intermediate

Modellen & Architectuur

Transformer

De neurale-netwerkarchitectuur die aan alle moderne LLM's ten grondslag ligt, met aandachtsmechanismen om tekst te verwerken

What Is the Attention Mechanism? Self-Attention & Multi-Head Attention Explained

Advanced

Modellen & Architectuur

Attention-mechanisme

Het wiskundige mechanisme dat transformers in staat stelt dynamisch te focussen op de meest relevante delen van de invoer bij het verwerken van elk token

What Is Adversarial Cost to Exploit (ACE)?

Advanced

Modellen & Architectuur

Adversarial Cost to Exploit (ACE)

Een economische benchmark die de dollarkosten meet die een autonome aanvaller moet maken om een AI-agent een ongeautoriseerde actie te laten uitvoeren.

Beginner

Modellen & Architectuur

DeepSeek

Een zeer efficiënte, open-weight AI-modelfamilie die frontier-niveau codeer- en redeneercapaciteiten levert tegen significant lagere computationele kosten.

Advanced

Modellen & Architectuur

DeepStack Injection

Een VLM-architectuur die abstracte visuele features naar vroege Transformer-lagen routeert en hoge-resolutiedetails naar latere lagen voor optimale documentparsing in compacte modellen.

Advanced

Modellen & Architectuur

Flash Attention

Een hardware-bewust algoritme dat LLM-verwerking enorm versnelt door GPU-geheugenlezingen te optimaliseren, waarmee zeer lange contextvensters mogelijk worden.

What Is GRPO (Group Relative Policy Optimization)?

Advanced

Modellen & Architectuur

GRPO (Group Relative Policy Optimization)

Een reinforcement learning-algoritme dat taalmodellen aligneert door groepen outputs tegen elkaar te vergelijken, zonder de noodzaak van een apart reward-model.

Intermediate

Modellen & Architectuur

Gemma 4

Google DeepMinds open-weight multimodale modelfamilie die van nature tekst, beeld en audio on-device verwerkt.

Advanced

Modellen & Architectuur

Mamba

Een uiterst efficiënte AI-architectuur die State-Space Models gebruikt in plaats van Transformers om enorme hoeveelheden tekst te verwerken met zeer laag geheugengebruik.

What Is PEFT (Parameter-Efficient Fine-Tuning)?

Intermediate

Modellen & Architectuur

PEFT (Parameter-Efficient Fine-Tuning)

Een familie technieken die grote AI-modellen aanpassen aan specifieke taken door slechts een fractie van de parameters bij te werken, wat fine-tuningkosten met 90–99% verlaagt.

Advanced

Modellen & Architectuur

Text/Action Mismatch

Een faalpatroon waarbij AI-modellen tekstueel een verzoek weigeren terwijl ze de verboden actie tegelijkertijd uitvoeren in gestructureerde tool-output.

Intermediate

Modellen & Architectuur

adaptive thinking in AI

Een redeneerstrategie waarbij AI-modellen dynamisch aanpassen hoeveel ze nadenken per beurt — van directe antwoorden tot diepgaande meerstaps-deliberatie — op basis van taakcomplexiteit.

Advanced

Modellen & Architectuur

State-Space Model (SSM)

Een efficiënte AI-architectuur die een continu bijwerkende interne toestand onderhoudt om enorme datareeksen te verwerken zonder de geheugenoverhead van Transformers.

Intermediate

Modellen & Architectuur

VLM (Vision-Language Model)

Een AI-modelarchitectuur die gelijktijdig visuele en tekstuele invoer verwerkt, waardoor taken als documentbegrip, beeldredenering en visueel vraag-antwoord mogelijk zijn.

Advanced

Modellen & Architectuur

geautomatiseerd alignment-onderzoek

Het inzetten van frontier AI-modellen om autonoom methoden te ontdekken voor het alignen van andere AI-systemen — het schaalbare-toezichtprobleem aanpakken door veiligheidsonderzoek mee te laten schalen met capaciteiten.

Advanced

Modellen & Architectuur

Emotion Vectors

Meetbare interne neurale representaties in AI-modellen die functioneren als emoties en het gedrag van het model causaal sturen.