Human Feedback Loops
Ein iterativer Prozess im KI-Training (wie bei RLHF), bei dem menschliche Bewertungen oder Korrekturen genutzt werden, um das Verhalten oder die Ausgaben eines KI-Modells schrittweise zu verbessern und an gewünschte Kriterien anzupassen.