WO2022103291A1

WO2022103291A1 - Procédé et système permettant de quantifier un réseau neuronal

Info

Publication number: WO2022103291A1
Application number: PCT/RU2020/000601
Authority: WO
Inventors: Vladimir Maximovich CHIKIN; Kirill Igorevich SOLODSKIKH; Anna Dmitrievna TELEGINA
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2020-11-13
Filing date: 2020-11-13
Publication date: 2022-05-19
Also published as: EP4196919A1; CN116472538A

Abstract

La présente invention concerne un procédé et un système informatique permettant de déterminer des paramètres de quantification de précision mixte pour quantifier un réseau neuronal. Le procédé comprend la détermination d'un vecteur de paramètres de quantification sur la base d'une taille des vecteurs de pondération du réseau neuronal et, pour chacun de multiples vecteurs d'apprentissage d'un ensemble de données d'apprentissage, l'évaluation d'une seconde fonction de perte sur la base du vecteur d'apprentissage et du vecteur de paramètres de quantification et la modification des vecteurs de pondération et du vecteur de paramètres de quantification afin de minimiser une sortie de la seconde fonction de perte. Chacun des paramètres de quantification du vecteur de paramètres de quantification contraint la taille d'un vecteur de pondération quantifié d'une couche d'un réseau neuronal quantifié correspondant au vecteur de pondération de la couche correspondante du réseau neuronal.