Network Pruning
Eine Technik zur Reduzierung der Größe und Komplexität von trainierten neuronalen Netzen durch systematisches Entfernen von weniger wichtigen Gewichten, Neuronen oder Verbindungen, oft mit dem Ziel, die Inferenzgeschwindigkeit zu erhöhen, den Speicherbedarf zu senken und die Energieeffizienz zu verbessern, ohne die Performanz signifikant zu beeinträchtigen.