Upper Confidence Bound
Ein Algorithmus für das Verstärkungslernen, der den Kompromiss zwischen Exploration (Erkundung neuer Optionen) und Exploitation (Nutzung bekannter guter Optionen) steuert.
Das erste große deutschsprachige KI-Lexikon
Ein Community-Projekt von David Mirga
Ein Algorithmus für das Verstärkungslernen, der den Kompromiss zwischen Exploration (Erkundung neuer Optionen) und Exploitation (Nutzung bekannter guter Optionen) steuert.