CN109948784A - 一种基于快速滤波算法的卷积神经网络加速器电路 - Google Patents
一种基于快速滤波算法的卷积神经网络加速器电路 Download PDFInfo
- Publication number
- CN109948784A CN109948784A CN201910003898.0A CN201910003898A CN109948784A CN 109948784 A CN109948784 A CN 109948784A CN 201910003898 A CN201910003898 A CN 201910003898A CN 109948784 A CN109948784 A CN 109948784A
- Authority
- CN
- China
- Prior art keywords
- module
- convolution
- caching
- algorithm
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 69
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 61
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 42
- 238000004364 calculation method Methods 0.000 claims abstract description 31
- 230000004913 activation Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000013461 design Methods 0.000 claims abstract description 11
- 210000004027 cell Anatomy 0.000 claims description 30
- 238000012805 post-processing Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 238000011112 process operation Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 abstract description 7
- 230000007423 decrease Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 230000012223 nuclear import Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Complex Calculations (AREA)
- Image Processing (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910003898.0A CN109948784B (zh) | 2019-01-03 | 2019-01-03 | 一种基于快速滤波算法的卷积神经网络加速器电路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910003898.0A CN109948784B (zh) | 2019-01-03 | 2019-01-03 | 一种基于快速滤波算法的卷积神经网络加速器电路 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109948784A true CN109948784A (zh) | 2019-06-28 |
CN109948784B CN109948784B (zh) | 2023-04-18 |
Family
ID=67007218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910003898.0A Active CN109948784B (zh) | 2019-01-03 | 2019-01-03 | 一种基于快速滤波算法的卷积神经网络加速器电路 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109948784B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555519A (zh) * | 2019-10-08 | 2019-12-10 | 东南大学 | 一种基于符号随机计算的低复杂度卷积神经网络 |
CN110738311A (zh) * | 2019-10-14 | 2020-01-31 | 哈尔滨工业大学 | 基于高层次综合的lstm网络加速方法 |
CN110837806A (zh) * | 2019-11-11 | 2020-02-25 | 辽宁科技学院 | 一种基于深度卷积记忆网络的室内定位方法 |
CN111258839A (zh) * | 2020-02-16 | 2020-06-09 | 苏州浪潮智能科技有限公司 | 一种基于ResNet50网络的AI加速卡仿真测试系统及其工作方法 |
CN111258574A (zh) * | 2020-01-14 | 2020-06-09 | 中科驭数(北京)科技有限公司 | 加速器体系结构的编程方法和系统 |
CN111445018A (zh) * | 2020-03-27 | 2020-07-24 | 国网甘肃省电力公司电力科学研究院 | 基于加速卷积神经网络算法的紫外成像实时信息处理方法 |
CN111488983A (zh) * | 2020-03-24 | 2020-08-04 | 哈尔滨工业大学 | 一种基于fpga的轻量级cnn模型计算加速器 |
CN111667053A (zh) * | 2020-06-01 | 2020-09-15 | 重庆邮电大学 | 一种新型卷积神经网络加速器及其前向传播计算加速方法 |
CN111882050A (zh) * | 2020-07-20 | 2020-11-03 | 复旦大学 | 基于fpga的用于提高bcpnn速度的设计方法 |
CN111932436A (zh) * | 2020-08-25 | 2020-11-13 | 成都恒创新星科技有限公司 | 一种用于智慧泊车的深度学习处理器架构 |
CN112183732A (zh) * | 2020-10-22 | 2021-01-05 | 中国人民解放军国防科技大学 | 卷积神经网络加速方法、装置和计算机设备 |
WO2021031154A1 (zh) * | 2019-08-21 | 2021-02-25 | 深圳市大疆创新科技有限公司 | 神经网络的特征图装载方法及设备 |
CN112529799A (zh) * | 2020-12-07 | 2021-03-19 | 中国工程物理研究院流体物理研究所 | 一种基于fpga卷积神经网络结构的光学像差畸变校正系统 |
CN112784974A (zh) * | 2019-11-07 | 2021-05-11 | 财团法人工业技术研究院 | 动态多组态cnn加速器架构与操作方法 |
CN112862080A (zh) * | 2021-03-10 | 2021-05-28 | 中山大学 | EfficientNet的注意力机制的硬件计算方法 |
CN112990157A (zh) * | 2021-05-13 | 2021-06-18 | 南京广捷智能科技有限公司 | 一种基于fpga的图像目标识别加速系统 |
CN113392963A (zh) * | 2021-05-08 | 2021-09-14 | 北京化工大学 | 基于fpga的cnn硬件加速系统设计方法 |
CN115130666A (zh) * | 2022-08-31 | 2022-09-30 | 之江实验室 | 一种二维光子卷积加速方法和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106203617A (zh) * | 2016-06-27 | 2016-12-07 | 哈尔滨工业大学深圳研究生院 | 一种基于卷积神经网络的加速处理单元及阵列结构 |
CN107633297A (zh) * | 2017-03-10 | 2018-01-26 | 南京大学 | 一种基于并行快速fir滤波器算法的卷积神经网络硬件加速器 |
CN207458128U (zh) * | 2017-09-07 | 2018-06-05 | 哈尔滨理工大学 | 一种基于fpga在视觉应用中的卷积神经网络加速器 |
CN108229645A (zh) * | 2017-04-28 | 2018-06-29 | 北京市商汤科技开发有限公司 | 卷积加速和计算处理方法、装置、电子设备及存储介质 |
CN109032781A (zh) * | 2018-07-13 | 2018-12-18 | 重庆邮电大学 | 一种卷积神经网络算法的fpga并行系统 |
CN109086867A (zh) * | 2018-07-02 | 2018-12-25 | 武汉魅瞳科技有限公司 | 一种基于fpga的卷积神经网络加速系统 |
-
2019
- 2019-01-03 CN CN201910003898.0A patent/CN109948784B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106203617A (zh) * | 2016-06-27 | 2016-12-07 | 哈尔滨工业大学深圳研究生院 | 一种基于卷积神经网络的加速处理单元及阵列结构 |
CN107633297A (zh) * | 2017-03-10 | 2018-01-26 | 南京大学 | 一种基于并行快速fir滤波器算法的卷积神经网络硬件加速器 |
CN108229645A (zh) * | 2017-04-28 | 2018-06-29 | 北京市商汤科技开发有限公司 | 卷积加速和计算处理方法、装置、电子设备及存储介质 |
CN207458128U (zh) * | 2017-09-07 | 2018-06-05 | 哈尔滨理工大学 | 一种基于fpga在视觉应用中的卷积神经网络加速器 |
CN109086867A (zh) * | 2018-07-02 | 2018-12-25 | 武汉魅瞳科技有限公司 | 一种基于fpga的卷积神经网络加速系统 |
CN109032781A (zh) * | 2018-07-13 | 2018-12-18 | 重庆邮电大学 | 一种卷积神经网络算法的fpga并行系统 |
Non-Patent Citations (4)
Title |
---|
GAN FENG,ZUYI HU,SONG CHEN,FENG WU: ""Energy-efficient and high-throughput FPGA-based accelerator for Convolutional Neural Networks"", 《2016 13TH IEEE INTERNATIONAL CONFERENCE ON SOLID-STATE AND INTEGRATED CIRCUIT TECHNOLOGY(ICSICT) PROCEEDINGS》 * |
Y. NAITO, T. MIYAZAKI AND I. KURODA: ""A fast full-search motion estimation method for programmable processors with a multiply-accumulator"", 《1996 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING CONFERENCE PROCEEDINGS》 * |
赵博然,张犁,石光明等: ""传输触发架构的可编程神经网络处理器设计"", 《西安电子科技大学学报》 * |
陆维娜,胡瑜,叶靖: ""面向卷积神经网络加速器吞吐量优化的FPGA自动化设计方法"", 《计算机辅助设计与图形学学报》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021031154A1 (zh) * | 2019-08-21 | 2021-02-25 | 深圳市大疆创新科技有限公司 | 神经网络的特征图装载方法及设备 |
CN110555519B (zh) * | 2019-10-08 | 2023-07-28 | 东南大学 | 一种基于符号随机计算的低复杂度卷积神经网络架构 |
CN110555519A (zh) * | 2019-10-08 | 2019-12-10 | 东南大学 | 一种基于符号随机计算的低复杂度卷积神经网络 |
CN110738311A (zh) * | 2019-10-14 | 2020-01-31 | 哈尔滨工业大学 | 基于高层次综合的lstm网络加速方法 |
CN112784974A (zh) * | 2019-11-07 | 2021-05-11 | 财团法人工业技术研究院 | 动态多组态cnn加速器架构与操作方法 |
CN110837806A (zh) * | 2019-11-11 | 2020-02-25 | 辽宁科技学院 | 一种基于深度卷积记忆网络的室内定位方法 |
CN110837806B (zh) * | 2019-11-11 | 2020-07-28 | 辽宁科技学院 | 一种基于深度卷积记忆网络的室内定位方法 |
CN111258574B (zh) * | 2020-01-14 | 2021-01-15 | 中科驭数(北京)科技有限公司 | 加速器体系结构的编程方法和系统 |
CN111258574A (zh) * | 2020-01-14 | 2020-06-09 | 中科驭数(北京)科技有限公司 | 加速器体系结构的编程方法和系统 |
CN111258839A (zh) * | 2020-02-16 | 2020-06-09 | 苏州浪潮智能科技有限公司 | 一种基于ResNet50网络的AI加速卡仿真测试系统及其工作方法 |
CN111258839B (zh) * | 2020-02-16 | 2022-11-29 | 苏州浪潮智能科技有限公司 | 一种基于ResNet50网络的AI加速卡仿真测试系统及其工作方法 |
CN111488983A (zh) * | 2020-03-24 | 2020-08-04 | 哈尔滨工业大学 | 一种基于fpga的轻量级cnn模型计算加速器 |
CN111445018A (zh) * | 2020-03-27 | 2020-07-24 | 国网甘肃省电力公司电力科学研究院 | 基于加速卷积神经网络算法的紫外成像实时信息处理方法 |
CN111445018B (zh) * | 2020-03-27 | 2023-11-14 | 国网甘肃省电力公司电力科学研究院 | 基于加速卷积神经网络算法的紫外成像实时信息处理方法 |
CN111667053A (zh) * | 2020-06-01 | 2020-09-15 | 重庆邮电大学 | 一种新型卷积神经网络加速器及其前向传播计算加速方法 |
CN111667053B (zh) * | 2020-06-01 | 2023-05-09 | 重庆邮电大学 | 一种卷积神经网络加速器的前向传播计算加速方法 |
CN111882050A (zh) * | 2020-07-20 | 2020-11-03 | 复旦大学 | 基于fpga的用于提高bcpnn速度的设计方法 |
CN111882050B (zh) * | 2020-07-20 | 2024-02-06 | 复旦大学 | 基于fpga的用于提高bcpnn速度的设计方法 |
CN111932436A (zh) * | 2020-08-25 | 2020-11-13 | 成都恒创新星科技有限公司 | 一种用于智慧泊车的深度学习处理器架构 |
CN111932436B (zh) * | 2020-08-25 | 2024-04-19 | 成都恒创新星科技有限公司 | 一种用于智慧泊车的深度学习处理器架构 |
CN112183732A (zh) * | 2020-10-22 | 2021-01-05 | 中国人民解放军国防科技大学 | 卷积神经网络加速方法、装置和计算机设备 |
CN112529799A (zh) * | 2020-12-07 | 2021-03-19 | 中国工程物理研究院流体物理研究所 | 一种基于fpga卷积神经网络结构的光学像差畸变校正系统 |
CN112862080B (zh) * | 2021-03-10 | 2023-08-15 | 中山大学 | EfficientNet的注意力机制的硬件计算方法 |
CN112862080A (zh) * | 2021-03-10 | 2021-05-28 | 中山大学 | EfficientNet的注意力机制的硬件计算方法 |
CN113392963A (zh) * | 2021-05-08 | 2021-09-14 | 北京化工大学 | 基于fpga的cnn硬件加速系统设计方法 |
CN113392963B (zh) * | 2021-05-08 | 2023-12-19 | 北京化工大学 | 基于fpga的cnn硬件加速系统设计方法 |
CN112990157B (zh) * | 2021-05-13 | 2021-08-20 | 南京广捷智能科技有限公司 | 一种基于fpga的图像目标识别加速系统 |
CN112990157A (zh) * | 2021-05-13 | 2021-06-18 | 南京广捷智能科技有限公司 | 一种基于fpga的图像目标识别加速系统 |
CN115130666B (zh) * | 2022-08-31 | 2022-11-22 | 之江实验室 | 一种二维光子卷积加速方法和系统 |
CN115130666A (zh) * | 2022-08-31 | 2022-09-30 | 之江实验室 | 一种二维光子卷积加速方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109948784B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109948784A (zh) | 一种基于快速滤波算法的卷积神经网络加速器电路 | |
Wang et al. | ADSCNet: asymmetric depthwise separable convolution for semantic segmentation in real-time | |
CN108090565A (zh) | 一种卷积神经网络并行化训练加速方法 | |
CN105488565A (zh) | 加速深度神经网络算法的加速芯片的运算装置及方法 | |
Jiang et al. | Video image defogging recognition based on recurrent neural network | |
Chu et al. | Mixed-precision quantized neural networks with progressively decreasing bitwidth | |
Chen et al. | Deep convolutional neural network on iOS mobile devices | |
Yu et al. | Real-time object detection towards high power efficiency | |
Guan et al. | Dais: Automatic channel pruning via differentiable annealing indicator search | |
CN109272110A (zh) | 基于光子神经网络芯片的光电融合智能信号处理系统 | |
Duan et al. | Energy-efficient architecture for FPGA-based deep convolutional neural networks with binary weights | |
Ding et al. | Slimyolov4: lightweight object detector based on yolov4 | |
Zhong et al. | DualConv: Dual convolutional kernels for lightweight deep neural networks | |
Wang et al. | Convolutional embedding makes hierarchical vision transformer stronger | |
Ma et al. | Acceleration of multi‐task cascaded convolutional networks | |
Chang et al. | VSCNN: Convolution neural network accelerator with vector sparsity | |
CN109472734B (zh) | 一种基于fpga的目标检测网络及其实现方法 | |
Ju et al. | Threshnet: An efficient densenet using threshold mechanism to reduce connections | |
Chen et al. | Vip: Virtual pooling for accelerating cnn-based image classification and object detection | |
Ma et al. | YOLOX-Mobile: a target detection algorithm more suitable for mobile devices | |
Zhaoa et al. | Semantic segmentation by improved generative adversarial networks | |
Limonova et al. | Bipolar morphological u-net for document binarization | |
Wang et al. | Calyolov4: lightweight yolov4 target detection based on coordinated attention | |
Zhang et al. | FPGA-based implementation of hand gesture recognition using convolutional neural network | |
Kang et al. | Design of convolution operation accelerator based on FPGA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240208 Address after: 210000 Room 201, 8 / F, building a, qiaomengyuan, Nanjing, Jiangsu Province, No. 100, Tianjiao Road, Qilin science and Technology Innovation Park, Nanjing, Jiangsu Province Patentee after: Nanjing Modular Smart Chip Microelectronics Technology Co.,Ltd. Country or region after: China Address before: 400065 No. 2, Chongwen Road, Nan'an District, Chongqing Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS Country or region before: China |
|
TR01 | Transfer of patent right |