KI-Lexikon

Das erste große deutschsprachige KI-Lexikon

Ein Community-Projekt von David Mirga

← Zurück zur Übersicht

Joint Visual-Text Models (Gemeinsame Visuell-Textuelle Modelle)

KI-Modelle, die darauf spezialisiert sind, Informationen aus visuellen Daten (Bildern, Videos) und textuellen Daten gleichzeitig zu verarbeiten und zu verstehen, um Aufgaben wie Bildbeschriftung, visuelle Fragenbeantwortung oder multimodale Suche zu lösen.

Kategorie: J | Quelle: Das große KI-Lexikon von David Mirga