WO2020215124A1

WO2020215124A1 - Primitive matérielle améliorée pour des mises en œuvre de réseaux neuronaux profonds

Info

Publication number: WO2020215124A1
Application number: PCT/AU2020/050395
Authority: WO
Inventors: SeyedRamin Rasoulinezhad; Philip Leong
Original assignee: The University Of Sydney
Priority date: 2019-04-26
Filing date: 2020-04-24
Publication date: 2020-10-29

Abstract

Selon la présente invention, la quantification est une stratégie d'optimisation clé pour améliorer la performance d'accélérateurs d'un réseau neuronal profond (DNN) à virgule flottante. Les accélérateurs à base de FPGA utilisent habituellement des ressources de grande précision telles que des tables de consultation (LUT), car les blocs de traitement de signal numérique (DSP) disponibles sur les FPGA ne sont pas utilisés efficacement lorsqu'ils sont appliqués à des calculs de faible précision. Ce problème est abordé pour les calculs les plus importants dans des accélérateurs DNN intégrés, à savoir les couches de convolution standard, par profondeur et par points par l'intermédiaire de trois modifications apportées aux blocs DSP Xilinx DSP48E2. D'abord, l'invention concerne une architecture de multiplicateur décomposable en temps d'exécution, de précision flexible pour des mises en œuvre de CNN. Deuxièmement, une mise à jour considérable de l'interconnexion DSP-DSP est proposée, fournissant une capacité de chaînage de basse précision semi -2D qui prend en charge notre multiplicateur de basse précision. Ceci permet à une colonne de DSP 1D d'être exploitée dans un agencement de maillage semi -2D, réduisant l'énergie d'accès de lecture de données en évitant les interconnexions hors DSP lors de la diffusion en continu de données. L'invention concerne également la réutilisation de données par l'intermédiaire d'un fichier de registre qui peut également être configuré comme FIFO.