Filter (ethisch/moralisch)
Spezifische Mechanismen oder Algorithmen (oft als Teil von Moderationssystemen oder in LLMs integriert), die darauf ausgelegt sind, die Generierung oder Verbreitung von schädlichen, unethischen, illegalen, voreingenommenen oder anderweitig unerwünschten Inhalten durch KI zu verhindern oder zu reduzieren. Ein Aspekt des AI Alignment.