Multimodaal & Creatief

3 concepten

Multimodale AI

Multimodale AI-systemen verwerken en genereren meerdere datatypen — tekst, afbeeldingen, audio, video — binnen één model, voor cross-modaal begrip en creatie.

Beginner

Multimodaal & Creatief

Speech AI

Speech AI omvat technologieën voor spraak-naar-tekst (STT), tekst-naar-spraak (TTS), voice cloning en spraakvertaling, voor natuurlijke spraakinteractie met AI.

Beginner

Multimodaal & Creatief

Text-to-Image Generatie

Text-to-image-generatie gebruikt AI-modellen om afbeeldingen te maken van tekstbeschrijvingen, aangedreven door diffusion models in tools als Midjourney, DALL-E en Stable Diffusion.