Multimodality / Multimodal Training / Multimodalität
Die Fähigkeit von KI-Systemen, Informationen aus verschiedenen Datentypen (Modalitäten) wie Text, Bild, Audio und Video zu verarbeiten, zu verstehen und zu generieren; erfordert oft sehr hohe Rechenleistung für das Training.