Language Model Evaluation
Die Bewertung der Leistung eines Sprachmodells anhand definierter Metriken wie Genauigkeit, Kohärenz oder Relevanz. Ziel ist es, die Qualität generierter Texte messbar zu machen und Modelle vergleichbar zu evaluieren – sowohl automatisch als auch durch menschliches Feedback.