3 concepten
Multimodale AI-systemen verwerken en genereren meerdere datatypen — tekst, afbeeldingen, audio, video — binnen één model, voor cross-modaal begrip en creatie.
Speech AI omvat technologieën voor spraak-naar-tekst (STT), tekst-naar-spraak (TTS), voice cloning en spraakvertaling, voor natuurlijke spraakinteractie met AI.
Text-to-image-generatie gebruikt AI-modellen om afbeeldingen te maken van tekstbeschrijvingen, aangedreven door diffusion models in tools als Midjourney, DALL-E en Stable Diffusion.
© 2026 BVDNET. Alle rechten voorbehouden.