KI-Lexikon

Das erste große deutschsprachige KI-Lexikon

Ein Community-Projekt von David Mirga

← Zurück zur Übersicht

Reinforcement Learning with Verifiable Rewards (RVR)

Eine Methode, bei der das KI-Modell nur dann belohnt wird, wenn seine Antworten nachweislich korrekt sind.

Kategorie: R | Quelle: Das große KI-Lexikon von David Mirga