VQA (Visual Question Answering)
Eine KI-Aufgabe, bei der Systeme Fragen über Bilder beantworten müssen, was sowohl Bild- als auch Sprachverständnis erfordert. Wichtig für multimodale KI-Systeme.
Das erste große deutschsprachige KI-Lexikon
Ein Community-Projekt von David Mirga
Eine KI-Aufgabe, bei der Systeme Fragen über Bilder beantworten müssen, was sowohl Bild- als auch Sprachverständnis erfordert. Wichtig für multimodale KI-Systeme.