WO2023050707A1

WO2023050707A1 - Procédé et appareil de quantification de modèle de réseau, et dispositif informatique et support de stockage

Info

Publication number: WO2023050707A1
Application number: PCT/CN2022/078256
Authority: WO
Inventors: 梁玲燕; 董刚; 赵雅倩; 温东超
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2021-09-28
Filing date: 2022-02-28
Publication date: 2023-04-06
Also published as: CN113610232A; CN113610232B

Abstract

La présente demande divulgue un procédé et un appareil de quantification de modèle de réseau, ainsi qu'un dispositif informatique et un support de stockage, qui sont applicables au domaine technique de l'intelligence artificielle. Le procédé de quantification de modèle de réseau consiste à : acquérir un modèle de réseau à traiter en fonction des exigences de quantification, effectuer séparément un traitement de quantification sur un paramètre de poids et une sortie d'activation du modèle de réseau à traiter de manière à obtenir un paramètre de poids initial et un paramètre de quantification initial de la sortie d'activation, puis construire un modèle de réseau initial ; acquérir un premier modèle de réseau d'étalonnage, puis ajuster le paramètre de poids initial du modèle de réseau initial d'après le premier modèle de réseau d'étalonnage afin d'obtenir un premier modèle prétraité ; et acquérir un second modèle de réseau d'étalonnage, puis ajuster un paramètre de quantification initial d'une sortie d'activation du premier modèle prétraité d'après le second modèle de réseau d'étalonnage afin d'obtenir un modèle de réseau cible. Le procédé permet de résoudre le problème de la réduction de précision d'un modèle de réseau neuronal profond de grande taille provoqué par la réduction du modèle de réseau neuronal profond au moyen d'une compression de modèle telle que la quantification et le recadrage.