WO2017185257A1

WO2017185257A1 - Dispositif et procédé d'exécution d'un algorithme d'apprentissage de descente de gradient adam

Info

Publication number: WO2017185257A1
Application number: PCT/CN2016/080357
Authority: WO
Inventors: 郭崎; 刘少礼; 陈天石; 陈云霁
Original assignee: 北京中科寒武纪科技有限公司
Priority date: 2016-04-27
Filing date: 2016-04-27
Publication date: 2017-11-02

Abstract

L'invention porte également sur un dispositif et sur un procédé permettant d'exécuter un algorithme d'apprentissage de descente de gradient Adam, le dispositif comprenant une unité d'accès direct à la mémoire (1), une unité de mémoire cache d'instructions (2), une unité de commande (3), une unité de mémoire cache de données (4) et un module de traitement de données (5). Le procédé consiste : premièrement, à lire un vecteur de gradient et un vecteur de valeur à mettre à jour, et à initialiser un vecteur de premier ordre, un vecteur de second ordre et un taux de décroissance exponentielle correspondant ; à chaque itération, à mettre à jour le vecteur de premier ordre et le vecteur de second ordre à l'aide du vecteur de gradient, et à calculer un vecteur d'estimation polarisé de premier ordre et un vecteur d'estimation polarisé de second ordre ; à mettre à jour des paramètres à mettre à jour à l'aide du vecteur d'estimation polarisé de premier ordre et du vecteur d'estimation polarisé de second ordre ; et à poursuivre l'apprentissage jusqu'à ce que le vecteur des paramètres à mettre à jour soit convergé. La présente invention permet d'obtenir l'application de l'algorithme de descente de gradient Adam et d'améliorer considérablement l'efficacité du traitement des données.