Wat is Safetensors?

Safetensors is een binair bestandsformaat voor het veilig opslaan en laden van tensoren — de numerieke gewichten die een getraind AI-model definiëren. Het is ontwikkeld door Hugging Face als vervanging voor Python's pickle-formaat, dat bij het laden willekeurige code kan uitvoeren en daardoor een aanzienlijk beveiligingsrisico vormt bij het downloaden van modellen van derden.

Waarom het ertoe doet

Bij traditionele modelformaten (zoals .bin of .pt op basis van pickle) vertrouw je erop dat de maker van het model geen kwaadaardige code in het bestand heeft verborgen. Dat is een probleem wanneer miljoenen ontwikkelaars modellen downloaden van open platforms. Safetensors lost dit op door alleen pure tensordata op te slaan, zonder uitvoerbare code-paden.

In april 2026 is Safetensors officieel toegetreden tot de PyTorch Foundation onder de Linux Foundation. Deze bestuurlijke verschuiving positioneert het als het toekomstige standaardformaat binnen PyTorch core, met geplande ondersteuning voor device-aware GPU-loading en pipeline-parallel laden voor grootschalige modellen.

Hoe het werkt

Safetensors slaat modelgewichten op als een platte byte-array met een JSON-header die de tensor-metadata beschrijft: naam, datatype, afmetingen en byte-offsets. Bij het laden leest de consumer eerst de header, valideert het verwachte formaat en mapt vervolgens de gewenste tensoren rechtstreeks vanuit de bytes naar het geheugen — zonder deserialisatie of code-interpretatie.

Het resultaat is aanzienlijk snellere laadtijden (met name bij grote modellen) en gegarandeerde veiligheid: het formaat kan structureel geen code uitvoeren, ongeacht de inhoud.

Voorbeeld

Een team downloadt een open-weight model van Hugging Face om lokaal te draaien. Met het oude pickle-formaat zou het laden een potentieel onveilige deserialisatie triggeren. Met Safetensors worden de gewichten direct als numerieke gegevens geladen — geen code-uitvoering, geen beveiligingsrisico. Het model laadt bovendien sneller doordat alleen de benodigde tensoren in het geheugen worden gemapt.

Parameter-Efficient Fine-Tuning (PEFT), open-source AI