WO2020062299A1

WO2020062299A1 - Processeur de réseau neuronal, procédé de traitement de données et dispositif associé

Info

Publication number: WO2020062299A1
Application number: PCT/CN2018/109208
Authority: WO
Inventors: 顾雄礼; 李艳华; 张惠敏
Original assignee: 华为技术有限公司
Priority date: 2018-09-30
Filing date: 2018-09-30
Publication date: 2020-04-02
Also published as: CN112789627B; CN112789627A

Abstract

Des modes de réalisation de la présente invention concernent un processeur de réseau neuronal, un procédé et un dispositif associé, le processeur de réseau neuronal comprenant : n noyaux de calcul, une unité d'accumulation d'opération atomique et une mémoire cache partagée intégrée ; chaque noyau est utilisé pour calculer une moyenne μ à l'intérieur d'un noyau d'une matrice d'entrée en fonction de la matrice d'entrée et pour écrire μ dans l'unité d'accumulation d'opération atomique ; le calcul d'une moyenne v de m x²s en fonction de la matrice d'entrée, et l'écriture de v dans l'unité d'accumulation d'opération atomique ; l'unité d'accumulation d'opération atomique est utilisée pour accumuler n µ écrits par les n noyaux pour obtenir S1 et pour écrire S1 dans la mémoire cache partagée intégrée ; l'accumulation de n v écrits par les n noyaux pour obtenir S2, et l'écriture de S2 dans la mémoire cache partagée intégrée. Chaque noyau est en outre utilisé pour acquérir S1 et S2 à partir de la mémoire cache partagée intégrée et pour calculer la variance globale de n matrices d'entrée de n noyaux en fonction de S1 et de S2. L'utilisation de la présente invention permet d'augmenter la vitesse d'apprentissage du réseau neuronal.