KI-Lexikon

Das erste große deutschsprachige KI-Lexikon

Ein Community-Projekt von David Mirga

← Zurück zur Übersicht

Banditenalgorithmen (Bandit Algorithms)

Eine Klasse von Algorithmen des Reinforcement Learning, die Entscheidungen unter Unsicherheit treffen, um eine Belohnung zu maximieren. Sie balancieren zwischen der Erkundung neuer Optionen (Exploration) und der Nutzung bekannter guter Optionen (Exploitation), z.B. bei A/B-Tests oder Empfehlungssystemen.

Kategorie: B | Quelle: Das große KI-Lexikon von David Mirga