WO2019127362A1

WO2019127362A1 - Procédé de compression de bloc de modèle de réseau neuronal, procédé d'apprentissage, dispositif informatique et système

Info

Publication number: WO2019127362A1
Application number: PCT/CN2017/119819
Authority: WO
Inventors: 张悠慧; 季宇; 张优扬
Original assignee: 清华大学
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2019-07-04
Also published as: CN109791628B; CN109791628A

Abstract

L'invention concerne un procédé de compression de bloc de modèle de réseau destiné à être utilisé avec un réseau neuronal, comprenant : une étape d'obtention d'une matrice de pondération, comprenant l'obtention d'une matrice de pondération d'un modèle de réseau d'un réseau neuronal qui est obtenu après un apprentissage ; une étape de blocage d'une matrice de pondération, comprenant la division de la matrice de pondération selon une taille de réseau prédéterminée en un réseau composé d'une pluralité de sous-blocs initiaux ; une étape de concentration d'éléments de pondération à recadrer, selon la valeur absolue de pondération et la valeur d'éléments matriciels dans les sous-blocs, comprenant la concentration d'éléments matriciels ayant une pondération plus faible au moyen d'un échange rangée-colonne dans un sous-bloc à recadrer de telle sorte que la valeur absolue de pondération et la valeur des éléments matriciels dans le sous-bloc à recadrer sont inférieures à la valeur absolue de pondération et à la valeur d'éléments matriciels dans d'autres sous-blocs qui ne doivent pas être recadrés ; une étape de recadrage d'un sous-bloc, comprenant le recadrage de la pondération des éléments matriciels dans le sous-bloc à recadrer pour obtenir une matrice de pondération finale de manière à mettre en œuvre la compression du modèle de réseau du réseau neuronal. Ainsi, les ressources et le surdébit peuvent être économisés, et un réseau neuronal à grande échelle est configuré avec des ressources limitées.