CLIP (Contrastive Language-Image Pre-training)
Ein multimodales KI-Modell von OpenAI, das Text und Bilder gemeinsam in einem einheitlichen Vektorraum repräsentiert. Grundlage für viele moderne Text-zu-Bild-Generatoren und ermöglicht das Verstehen von Bild-Text-Beziehungen ohne explizite Bildbeschriftungen.