CN107229967B - 一种基于fpga实现稀疏化gru神经网络的硬件加速器及方法 - Google Patents
一种基于fpga实现稀疏化gru神经网络的硬件加速器及方法 Download PDFInfo
- Publication number
- CN107229967B CN107229967B CN201611105597.1A CN201611105597A CN107229967B CN 107229967 B CN107229967 B CN 107229967B CN 201611105597 A CN201611105597 A CN 201611105597A CN 107229967 B CN107229967 B CN 107229967B
- Authority
- CN
- China
- Prior art keywords
- unit
- matrix
- data
- vector
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Neurology (AREA)
- Complex Calculations (AREA)
Abstract
Description
权值 | W00 | W20 | W41 | W62 | W43 | W04 | W24 | W45 | W26 |
相对行索引 | 0 | 0 | 4 | 4 | 2 | 1 | 0 | 4 | 2 |
列位置 | 0 | 2 | 3 | 4 | 5 | 7 | 8 | 9 | 9 |
Claims (13)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/390,744 US10810484B2 (en) | 2016-08-12 | 2016-12-27 | Hardware accelerator for compressed GRU on FPGA |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/242,625 | 2016-08-22 | ||
US15/242,624 US20180046903A1 (en) | 2016-08-12 | 2016-08-22 | Deep processing unit (dpu) for implementing an artificial neural network (ann) |
US15/242,622 US10621486B2 (en) | 2016-08-12 | 2016-08-22 | Method for optimizing an artificial neural network (ANN) |
US15/242,622 | 2016-08-22 | ||
US15/242,624 | 2016-08-22 | ||
US15/242,625 US20180046895A1 (en) | 2016-08-12 | 2016-08-22 | Device and method for implementing a sparse neural network |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107229967A CN107229967A (zh) | 2017-10-03 |
CN107229967B true CN107229967B (zh) | 2021-06-15 |
Family
ID=59932331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611105597.1A Active CN107229967B (zh) | 2016-08-12 | 2016-12-05 | 一种基于fpga实现稀疏化gru神经网络的硬件加速器及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107229967B (zh) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10366322B2 (en) | 2017-10-06 | 2019-07-30 | DeepCube LTD. | System and method for compact and efficient sparse neural networks |
CN107807971A (zh) * | 2017-10-18 | 2018-03-16 | 北京信息科技大学 | 一种自动图像语义描述方法 |
WO2019078885A1 (en) | 2017-10-20 | 2019-04-25 | Google Llc | PARALLEL EXECUTION OF OPERATIONS OF ACTIVATION UNITS WITH RELEASE |
DE102017218889A1 (de) * | 2017-10-23 | 2019-04-25 | Robert Bosch Gmbh | Unscharf parametriertes KI-Modul sowie Verfahren zum Betreiben |
CN107944555B (zh) * | 2017-12-07 | 2021-09-17 | 广州方硅信息技术有限公司 | 神经网络压缩和加速的方法、存储设备和终端 |
CN107992940A (zh) * | 2017-12-12 | 2018-05-04 | 郑州云海信息技术有限公司 | 一种卷积神经网络在fpga上的实现方法及装置 |
WO2019114842A1 (zh) | 2017-12-14 | 2019-06-20 | 北京中科寒武纪科技有限公司 | 一种集成电路芯片装置 |
CN109961136B (zh) * | 2017-12-14 | 2020-05-19 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN111126588B (zh) * | 2017-12-14 | 2023-05-23 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN108153190B (zh) * | 2017-12-20 | 2020-05-05 | 新大陆数字技术股份有限公司 | 一种人工智能微处理器 |
EP3789871B1 (en) | 2017-12-27 | 2023-06-07 | Cambricon Technologies Corporation Limited | Integrated circuit chip device |
CN109978152B (zh) * | 2017-12-27 | 2020-05-22 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN109978154A (zh) * | 2017-12-28 | 2019-07-05 | 北京中科寒武纪科技有限公司 | 集成电路芯片装置及相关产品 |
CN109978153B (zh) * | 2017-12-27 | 2020-10-09 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN109978158B (zh) * | 2017-12-28 | 2020-05-12 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN109978131B (zh) * | 2017-12-28 | 2020-05-22 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置、方法及相关产品 |
CN108196882A (zh) * | 2017-12-29 | 2018-06-22 | 普强信息技术(北京)有限公司 | 一种针对神经网络计算的加速方法及装置 |
CN109993292B (zh) | 2017-12-30 | 2020-08-04 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
EP3624019A4 (en) * | 2017-12-30 | 2021-03-24 | Cambricon Technologies Corporation Limited | CHIP DEVICE WITH INTEGRATED CIRCUIT AND ASSOCIATED PRODUCT |
CN109993289B (zh) | 2017-12-30 | 2021-09-21 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN109993290B (zh) | 2017-12-30 | 2021-08-06 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN108280514B (zh) * | 2018-01-05 | 2020-10-16 | 中国科学技术大学 | 基于fpga的稀疏神经网络加速系统和设计方法 |
CN108133270B (zh) * | 2018-01-12 | 2020-08-04 | 清华大学 | 卷积神经网络加速方法及装置 |
WO2019136764A1 (zh) * | 2018-01-15 | 2019-07-18 | 深圳鲲云信息科技有限公司 | 卷积器及其所应用的人工智能处理装置 |
CN108320051B (zh) * | 2018-01-17 | 2021-11-23 | 哈尔滨工程大学 | 一种基于gru网络模型的移动机器人动态避碰规划方法 |
CN110163349B (zh) * | 2018-02-12 | 2021-03-23 | 上海寒武纪信息科技有限公司 | 一种网络模型的计算方法及装置 |
CN110147249B (zh) * | 2018-02-12 | 2021-02-09 | 上海寒武纪信息科技有限公司 | 一种网络模型的计算方法及装置 |
CN110197262B (zh) * | 2018-02-24 | 2021-07-30 | 赛灵思电子科技(北京)有限公司 | 用于lstm网络的硬件加速器 |
US20190266482A1 (en) * | 2018-02-26 | 2019-08-29 | Gsi Technology Inc. | Distance based deep learning |
CN108376285A (zh) * | 2018-03-23 | 2018-08-07 | 中国科学院计算技术研究所 | 一种面向多变异体lstm神经网络加速器及数据处理方法 |
CN108734270B (zh) * | 2018-03-23 | 2020-11-10 | 中国科学院计算技术研究所 | 一种兼容型神经网络加速器及数据处理方法 |
CN108446761B (zh) * | 2018-03-23 | 2021-07-20 | 中国科学院计算技术研究所 | 一种神经网络加速器及数据处理方法 |
CN108647774B (zh) * | 2018-04-23 | 2020-11-20 | 瑞芯微电子股份有限公司 | 一种优化稀疏性矩阵运算的神经网络方法和电路 |
CN108710505A (zh) * | 2018-05-18 | 2018-10-26 | 南京大学 | 一种基于fpga的可扩展稀疏矩阵向量乘处理器 |
CN109102064B (zh) * | 2018-06-26 | 2020-11-13 | 杭州雄迈集成电路技术股份有限公司 | 一种高精度的神经网络量化压缩方法 |
CN109086879B (zh) * | 2018-07-05 | 2020-06-16 | 东南大学 | 一种基于fpga的稠密连接神经网络的实现方法 |
CN109255429B (zh) * | 2018-07-27 | 2020-11-20 | 中国人民解放军国防科技大学 | 一种用于稀疏神经网络模型的参数解压方法 |
EP3690679A4 (en) | 2018-08-06 | 2021-02-17 | Huawei Technologies Co., Ltd. | MATRIX PROCESSING PROCESS AND APPARATUS, AND LOGIC CIRCUIT |
CN109376853B (zh) * | 2018-10-26 | 2021-09-24 | 电子科技大学 | 回声状态神经网络输出轴突电路 |
CN109472350B (zh) * | 2018-10-30 | 2021-11-16 | 南京大学 | 一种基于块循环稀疏矩阵的神经网络加速系统 |
CN109245773B (zh) * | 2018-10-30 | 2021-09-28 | 南京大学 | 一种基于块循环稀疏矩阵神经网络的编解码方法 |
CN109492761A (zh) * | 2018-10-30 | 2019-03-19 | 深圳灵图慧视科技有限公司 | 实现神经网络的fpga加速装置、方法和系统 |
WO2020118555A1 (zh) * | 2018-12-12 | 2020-06-18 | 深圳鲲云信息科技有限公司 | 一种网络模型数据存取方法、装置及电子设备 |
CN109657782B (zh) * | 2018-12-14 | 2020-10-27 | 安徽寒武纪信息科技有限公司 | 运算方法、装置及相关产品 |
CN109711540B (zh) * | 2018-12-20 | 2021-09-21 | 中科寒武纪科技股份有限公司 | 一种计算装置及板卡 |
CN109685208B (zh) * | 2018-12-24 | 2023-03-24 | 合肥君正科技有限公司 | 一种用于神经网络处理器数据稀梳化加速的方法及装置 |
WO2020133492A1 (zh) * | 2018-12-29 | 2020-07-02 | 华为技术有限公司 | 一种神经网络压缩方法及装置 |
CN109740748B (zh) * | 2019-01-08 | 2021-01-08 | 西安邮电大学 | 一种基于fpga的卷积神经网络加速器 |
CN109784484A (zh) * | 2019-01-31 | 2019-05-21 | 深兰科技(上海)有限公司 | 神经网络加速方法、装置、神经网络加速芯片及存储介质 |
CN109919826B (zh) * | 2019-02-02 | 2023-02-17 | 西安邮电大学 | 一种用于图计算加速器的图数据压缩方法及图计算加速器 |
CN109993297A (zh) * | 2019-04-02 | 2019-07-09 | 南京吉相传感成像技术研究院有限公司 | 一种负载均衡的稀疏卷积神经网络加速器及其加速方法 |
CN110020721B (zh) * | 2019-04-09 | 2020-12-18 | 武汉大学 | 一种基于参数压缩的目标检测深度学习网络优化方法 |
CN110062233B (zh) * | 2019-04-25 | 2020-04-28 | 西安交通大学 | 卷积神经网络全连接层稀疏的权值矩阵的压缩方法及系统 |
CN110442321B (zh) * | 2019-07-19 | 2021-05-11 | 南京芯驰半导体科技有限公司 | 一种预取fifo电路及方法 |
CN110516801B (zh) * | 2019-08-05 | 2022-04-22 | 西安交通大学 | 一种高吞吐率的动态可重构卷积神经网络加速器 |
CN112749782A (zh) * | 2019-10-31 | 2021-05-04 | 上海商汤智能科技有限公司 | 数据处理方法及相关产品 |
CN110889259B (zh) * | 2019-11-06 | 2021-07-09 | 北京中科胜芯科技有限公司 | 针对排列的块对角权重矩阵的稀疏矩阵向量乘法计算单元 |
CN111008698B (zh) * | 2019-11-23 | 2023-05-02 | 复旦大学 | 用于混合压缩循环神经网络的稀疏矩阵乘法加速器 |
CN110991631A (zh) * | 2019-11-28 | 2020-04-10 | 福州大学 | 一种基于fpga的神经网络加速系统 |
CN111126569B (zh) * | 2019-12-18 | 2022-11-11 | 中国电子科技集团公司第五十二研究所 | 一种支持剪枝稀疏化压缩的卷积神经网络装置和计算方法 |
CN111178519B (zh) * | 2019-12-27 | 2022-08-02 | 华中科技大学 | 卷积神经网络加速引擎、卷积神经网络加速系统及方法 |
CN111277564B (zh) * | 2020-01-08 | 2022-06-28 | 山东浪潮科学研究院有限公司 | 一种基于动态存储网络的企业网络异常检测方法及系统 |
CN111368974B (zh) * | 2020-02-25 | 2023-11-21 | 北京声智科技有限公司 | 一种fsmn数据处理方法、装置、介质和设备 |
CN111445013B (zh) * | 2020-04-28 | 2023-04-25 | 南京大学 | 一种针对卷积神经网络的非零探测器及其方法 |
CN112214326B (zh) * | 2020-10-22 | 2022-10-21 | 南京博芯电子技术有限公司 | 一种面向稀疏递归神经网络的均衡运算加速方法与系统 |
CN112309405A (zh) * | 2020-10-29 | 2021-02-02 | 平安科技(深圳)有限公司 | 多种声音事件的检测方法、装置、计算机设备及存储介质 |
CN114692843A (zh) * | 2020-12-25 | 2022-07-01 | 中科寒武纪科技股份有限公司 | 计算神经网络的装置、板卡、方法及可读存储介质 |
CN112906887B (zh) * | 2021-02-20 | 2023-03-24 | 上海大学 | 稀疏gru神经网络加速的实现方法和装置 |
US11631210B2 (en) * | 2021-03-03 | 2023-04-18 | Nvidia Corporation | Fully-fused neural network execution |
CN113269316B (zh) * | 2021-03-26 | 2022-10-11 | 复旦大学 | 支持稀疏神经网络计算加速器的稀疏数据选择逻辑模块 |
CN115828044B (zh) * | 2023-02-17 | 2023-05-19 | 绍兴埃瓦科技有限公司 | 基于神经网络双重稀疏性矩阵乘法运算电路、方法和装置 |
CN116187408B (zh) * | 2023-04-23 | 2023-07-21 | 成都甄识科技有限公司 | 稀疏加速单元、计算方法及稀疏神经网络硬件加速系统 |
CN116882468B (zh) * | 2023-09-05 | 2024-01-16 | 苏州浪潮智能科技有限公司 | 一种硬件加速器、硬件加速方法和电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN205139973U (zh) * | 2015-10-26 | 2016-04-06 | 中国人民解放军军械工程学院 | 基于fpga器件构建的bp神经网络 |
CN105681628A (zh) * | 2016-01-05 | 2016-06-15 | 西安交通大学 | 一种卷积网络运算单元及可重构卷积神经网络处理器和实现图像去噪处理的方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8209080B2 (en) * | 2009-04-27 | 2012-06-26 | Toyota Motor Engineering & Manufacturing North America, Inc. | System for determining most probable cause of a problem in a plant |
CN103632138B (zh) * | 2013-11-20 | 2016-09-28 | 南京信息工程大学 | 一种低秩分块稀疏表示的人脸识别方法 |
CN105512680B (zh) * | 2015-12-02 | 2019-01-08 | 北京航空航天大学 | 一种基于深度神经网络的多视sar图像目标识别方法 |
CN105513591B (zh) * | 2015-12-21 | 2019-09-03 | 百度在线网络技术(北京)有限公司 | 用lstm循环神经网络模型进行语音识别的方法和装置 |
-
2016
- 2016-12-05 CN CN201611105597.1A patent/CN107229967B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN205139973U (zh) * | 2015-10-26 | 2016-04-06 | 中国人民解放军军械工程学院 | 基于fpga器件构建的bp神经网络 |
CN105681628A (zh) * | 2016-01-05 | 2016-06-15 | 西安交通大学 | 一种卷积网络运算单元及可重构卷积神经网络处理器和实现图像去噪处理的方法 |
Non-Patent Citations (5)
Title |
---|
EIE: Efficient Inference Engine on Compressed Deep Neural Network;Song Han等;《https://arxiv.org/pdf/1602.01528v2.pdf》;20160503;第1-12页 * |
ESE: Efficient Speech Recognition Engine with Compressed LSTM on FPGA;Song Han等;《https://arxiv.org/pdf/1612.00694v1.pdf》;20161201;第3-4节,图5 * |
Gated Feedback Recurrent Neural Networks;Junyoung Chung等;《Proceedings of the 32 nd International Conference on Machine Learning》;20150711;第37卷;摘要,第2节 * |
Recurrent Neural Network Hardware Implementation on FPGA;Ander Xian Ming Chang等;《https://arxiv.gg363.site/pdf/151.05552.pdf》;20160304;第1-7页 * |
Song Han等.ESE: Efficient Speech Recognition Engine with Compressed LSTM on FPGA.《https://arxiv.org/pdf/1612.00694v1.pdf》.2016,第1-6页. * |
Also Published As
Publication number | Publication date |
---|---|
CN107229967A (zh) | 2017-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107229967B (zh) | 一种基于fpga实现稀疏化gru神经网络的硬件加速器及方法 | |
CN107704916B (zh) | 一种基于fpga实现rnn神经网络的硬件加速器及方法 | |
US10698657B2 (en) | Hardware accelerator for compressed RNN on FPGA | |
US10810484B2 (en) | Hardware accelerator for compressed GRU on FPGA | |
CN107689948B (zh) | 应用于神经网络硬件加速系统的高效数据访存管理装置 | |
JP6905573B2 (ja) | 計算装置と計算方法 | |
CN110163353B (zh) | 一种计算装置及方法 | |
CN110321997B (zh) | 高并行度计算平台、系统及计算实现方法 | |
JP3228927B2 (ja) | プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法 | |
CN110766128A (zh) | 卷积计算单元、计算方法及神经网络计算平台 | |
CN110674927A (zh) | 一种用于脉动阵列结构的数据重组方法 | |
US11983616B2 (en) | Methods and apparatus for constructing digital circuits for performing matrix operations | |
CN111626413A (zh) | 一种计算装置及方法 | |
Hsiao et al. | Design of a sparsity-aware reconfigurable deep learning accelerator supporting various types of operations | |
CN110766136B (zh) | 一种稀疏矩阵与向量的压缩方法 | |
CN111178492B (zh) | 计算装置及相关产品、执行人工神经网络模型的计算方法 | |
CN110716751B (zh) | 高并行度计算平台、系统及计算实现方法 | |
Wang et al. | FPAP: a folded architecture for efficient computing of convolutional neural networks | |
CN115700605A (zh) | 一种应用于卷积神经网络训练的可重构硬件加速器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180115 Address after: 100083 Beijing city Haidian District Wangzhuang Road No. 1 Building No. 4 hospital 8 floor No. 807 Applicant after: Beijing insight Technology Co., Ltd. Address before: 100084 Beijing city Haidian District Wangzhuang Road No. 1 Building No. 4 hospital 17 floor No. 1706 Applicant before: Beijing deep Intelligent Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180531 Address after: 100083, 17 floor, 4 Building 4, 1 Wang Zhuang Road, Haidian District, Beijing. Applicant after: Beijing deep Intelligent Technology Co., Ltd. Address before: 100083, 8 floor, 4 Building 4, 1 Wang Zhuang Road, Haidian District, Beijing. Applicant before: Beijing insight Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190930 Address after: 2100 San Jose Rojack Avenue, California, USA Applicant after: XILINX INC Address before: 100083, 17 floor, 4 Building 4, 1 Wang Zhuang Road, Haidian District, Beijing. Applicant before: Beijing Shenjian Intelligent Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |