WO2022006919A1

WO2022006919A1 - Procédé et système basés sur un ajustement de point fixe d'activation pour la quantification post-apprentissage d'un réseau neuronal convolutif

Info

Publication number: WO2022006919A1
Application number: PCT/CN2020/101550
Authority: WO
Inventors: 王培松; 程健
Original assignee: 中国科学院自动化研究所
Priority date: 2020-07-10
Filing date: 2020-07-13
Publication date: 2022-01-13
Also published as: CN111783961A

Abstract

L'invention concerne un procédé et un système basés sur un ajustement de point fixe d'activation pour la quantification post-apprentissage d'un réseau neuronal convolutif, qui vise à résoudre le problème de la technologie existante dans laquelle la quantification post-apprentissage d'un réseau neuronal convolutif ne peut pas être mise en œuvre au moyen d'un procédé de quantification plus efficace à débit binaire faible. Le procédé de quantification consiste à : effectuer une quantification de point fixe à débit binaire faible sur une matrice de pondération de chaque couche d'un réseau neuronal convolutif d'origine ; obtenir un groupe de données de vérification, construire une fonction cible optimisée d'une activation d'entrée vers une activation de sortie, optimiser de manière itérative une matrice de poids à point fixe et un facteur d'échelle de quantification de poids, puis obtenir un réseau neuronal convolutif de quantification à point fixe de poids ; et d'après les données de vérification et le réseau neuronal convolutif de quantification à point fixe de poids, résoudre un facteur d'échelle de quantification d'activation, puis obtenir un réseau neuronal convolutif à point fixe activé par le poids. L'apprentissage direct d'une fonction de mappage à faible débit binaire d'une activation d'entrée vers une activation de sortie garantit que la sortie de convolution avant et après la quantification de poids est similaire, que la précision d'un modèle quantifié est élevée et que le processus de quantification ne nécessite pas l'utilisation de données pour un apprentissage.