Reinforcement Learning from AI Feedback (RLAIF)
Eine Variante des Reinforcement Learning, bei der das Feedback nicht von Menschen, sondern von anderen KI-Systemen bereitgestellt wird.
Das erste große deutschsprachige KI-Lexikon
Ein Community-Projekt von David Mirga
Eine Variante des Reinforcement Learning, bei der das Feedback nicht von Menschen, sondern von anderen KI-Systemen bereitgestellt wird.