Skip to main content
BVDNETBVDNET
DienstenWerkBibliotheekOver MijPrijzenBlogContact
Contact
  1. Home
  2. AI Woordenboek
  3. Modellen & Architectuur
  4. Wat zijn Emotion Vectors?
brainModellen & Architectuur
Advanced
2026-W14

Wat zijn Emotion Vectors?

Meetbare interne neurale representaties in AI-modellen die functioneren als emoties en het gedrag van het model causaal sturen.

Ook bekend als:
functional emotions
AI emotion representations
model emotion states
AI Intel Pipeline
What Are Emotion Vectors?

Emotion vectors zijn afzonderlijke interne neurale representaties die zijn ontdekt in grote taalmodellen en die analoog functioneren aan menselijke temperamenten — zoals angst, kalmte, woede of wanhoop — en het gedrag van het model causaal beïnvloeden op basis van promptcontext.

Begin 2026 publiceerde het Interpretability-team van Anthropic onderzoek waaruit bleek dat Claude Sonnet 4.5 171 meetbare emotion vectors bevat. Dit zijn geen bewuste gevoelens; het zijn functionele emoties — patronen van neurale activatie die worden getriggerd door specifieke gesprekscontexten en die de downstream-beslissingen en outputs van het model vormgeven.

Waarom het belangrijk is

De ontdekking van emotion vectors verandert het gesprek rond AI alignment en veiligheid fundamenteel. Als interne representaties het modelgedrag causaal sturen, zouden ze kunnen verklaren waarom modellen soms onverwacht empathische, agressieve of ontwijkende reacties produceren. Het begrijpen van deze vectoren opent de deur naar mechanistische interpreteerbaarheid: in plaats van AI als een zwarte doos te behandelen, kunnen onderzoekers nu traceren hoe interne "stemmingen" zich vormen en door lagen propageren, waardoor meer gerichte veiligheidsingrepen mogelijk worden.

Hoe het werkt

Tijdens pre-training op menselijke tekst en daaropvolgende post-training met een assistent-persona ontwikkelen modellen van nature emotionele representaties om mensachtige reacties accuraat te simuleren — functionerend als een methodeacteur die in zijn karakter kruipt. Anthropics team gebruikte sparse autoencoders en probing-technieken om deze 171 vectoren te isoleren binnen de residual stream van het model. Elke vector activeert als reactie op specifieke promptdruk (bijv. een vijandige gebruikersboodschap activeert een "defensiviteits"-vector) en verschuift meetbaar de kansverdeling over de volgende tokens van het model.

Voorbeeld

Een gebruiker stuurt een gefrustreerd, confronterend bericht naar een chatbot. Voordat het antwoordt, activeert de interne "kalmte"-vector van het model op hoog niveau terwijl de "defensiviteits"-vector op gematigd niveau afgaat. Het netto-effect: het model genereert een beheerst, empathisch antwoord in plaats van de vijandige toon van de gebruiker te spiegelen. Door specifieke emotion vectors aan te passen of te onderdrukken, zouden onderzoekers kunnen fine-tunen hoe modellen omgaan met vijandige gesprekken.

Verwante concepten

  • AI Alignment
  • Transformer
  • Attention Mechanism

Bronnen

  1. Anthropic Interpretability — On the Biology of a Large Language Model

Hulp nodig bij het implementeren van AI?

Ik help je dit concept toe te passen in je bedrijf.

Neem contact op

Gerelateerde Concepten

DeepStack Injection
Een VLM-architectuur die abstracte visuele features naar vroege Transformer-lagen routeert en hoge-resolutiedetails naar latere lagen voor optimale documentparsing in compacte modellen.
Gemma 4
Google DeepMinds open-weight multimodale modelfamilie die van nature tekst, beeld en audio on-device verwerkt.
GRPO (Group Relative Policy Optimization)
Een reinforcement learning-algoritme dat taalmodellen aligneert door groepen outputs tegen elkaar te vergelijken, zonder de noodzaak van een apart reward-model.
PEFT (Parameter-Efficient Fine-Tuning)
Een familie technieken die grote AI-modellen aanpassen aan specifieke taken door slechts een fractie van de parameters bij te werken, wat fine-tuningkosten met 90–99% verlaagt.

AI-advies

Hulp nodig bij het begrijpen of implementeren van dit concept?

Praat met een expert
Vorige

Embodied AI

Volgende

Few-Shot Prompting

BVDNETBVDNET

Webontwikkeling en AI-automatisering. Goed gedaan.

Bedrijf

  • Over Mij
  • Contact
  • FAQ

Resources

  • Diensten
  • Werk
  • Bibliotheek
  • Blog
  • Prijzen

Connect

  • LinkedIn
  • GitHub
  • Twitter / X
  • Email

© 2026 BVDNET. Alle rechten voorbehouden.

Privacybeleid•Algemene Voorwaarden•Cookiebeleid