WO2020048389A1

WO2020048389A1 - Procédé de compression de modèle de réseau neuronal, dispositif et appareil d'ordinateur

Info

Publication number: WO2020048389A1
Application number: PCT/CN2019/103511
Authority: WO
Inventors: 金玲玲; 饶东升; 何文玮
Original assignee: 深圳灵图慧视科技有限公司
Priority date: 2018-09-05
Filing date: 2019-08-30
Publication date: 2020-03-12
Also published as: CN109165720A

Abstract

La présente invention concerne un procédé de compression de modèle de réseau neuronal, un dispositif, un appareil d'ordinateur et un support lisible par ordinateur. Le procédé consiste : à acquérir un premier modèle de réseau neuronal entraîné (S202) ; à sélectionner une ou plusieurs couches parmi des couches du premier modèle de réseau neuronal en tant que couches à compresser (S204) ; à trier les couches à compresser selon une règle prédéterminée (S206) ; et à compresser, selon un ordre séquentiel à partir du tri et au moyen d'un algorithme génétique, une partie ou la totalité des couches à compresser, et à obtenir un second modèle de réseau neuronal (S208), la précision du second modèle de réseau neuronal sur la base d'un échantillon d'apprentissage pré-configuré n'étant pas inférieure à une valeur de précision prédéterminée. Le procédé, le dispositif, l'appareil d'ordinateur et le support lisible par ordinateur compressent un modèle de réseau neuronal entraîné au moyen d'un algorithme génétique, ce qui permet de réduire une charge de calcul et un espace de stockage du modèle de réseau neuronal, et de fournir une applicabilité de ce dernier à des appareils ayant des ressources de mémoire et de calcul limitées sans compromettre la précision ou la compression du modèle de réseau neuronal.