Evaluation / Evaluierung
Der systematische Prozess der Bewertung und Messung der Leistung, Genauigkeit, Robustheit, Fairness, Sicherheit und anderer relevanter Qualitätsmerkmale eines KI-Modells oder -Systems. Erfolgt typischerweise anhand vordefinierter Metriken und unter Verwendung separater Testdaten (Daten, die das Modell während des Trainings nicht gesehen hat).