WO2021195643A1

WO2021195643A1 - Compression de réseaux neuronaux convolutifs par élagage

Info

Publication number: WO2021195643A1
Application number: PCT/US2021/030480
Authority: WO
Inventors: Bochen GUAN; Qinwen Xu; Weiyi Li
Original assignee: Innopeak Technology, Inc.
Priority date: 2021-05-03
Filing date: 2021-05-03
Publication date: 2021-09-30

Abstract

Un système informatique obtient un modèle de réseau neuronal ayant une pluralité de couches, et chaque couche a un nombre respectif de filtres. Le système informatique identifie une taille de modèle cible à laquelle le modèle de réseau neuronal est comprimé et dérive une ou plusieurs tailles de modèle intermédiaire à partir de la taille de modèle cible du modèle de réseau neuronal. La ou les tailles de modèle intermédiaire et la taille de modèle cible forment une séquence ordonnée de tailles de modèle. Le système informatique met en œuvre une séquence d'opérations d'élagage dont chacune correspond à une taille de modèle respective dans la séquence ordonnée de tailles de modèle. Pour chaque opération d'élagage, le système informatique identifie un sous-ensemble respectif de filtres à éliminer sur la base de la taille de modèle respective et met à jour le modèle de réseau neuronal pour élaguer le sous-ensemble respectif de filtres, ce qui permet de réduire la taille du modèle de réseau neuronal à la taille de modèle respective.