WO2023059723A1

WO2023059723A1 - Compression de modèle par analyse en composantes principales parcimonieuse quantifiée

Info

Publication number: WO2023059723A1
Application number: PCT/US2022/045785
Authority: WO
Inventors: Andrey Kuzmin; Marinus Willem VAN BAALEN; Markus Nagel; Arash BEHBOODI
Original assignee: Qualcomm Incorporated
Priority date: 2021-10-05
Filing date: 2022-10-05
Publication date: 2023-04-13

Abstract

Un procédé mis en œuvre par processeur comprend la récupération, pour une couche d'un ensemble de couches d'un réseau de neurones artificiels (ANN), d'une matrice quantifiée dense représentant un livre de codes et d'une matrice quantifiée creuse représentant des coefficients linéaires. La matrice quantifiée dense et la matrice quantifiée creuse peuvent être associées à un tenseur de poids de la couche. Le procédé mis en œuvre par processeur comprend également la détermination, pour la couche de l'ensemble de couches, du tenseur de poids sur la base d'un produit de la matrice quantifiée dense et de la matrice quantifiée creuse. Le procédé mis en œuvre par processeur comprend en outre le traitement, au niveau de la couche, d'une entrée sur la base du tenseur de poids.