CN108491929A - 一种基于fpga的可配置并行快速卷积核的结构 - Google Patents
一种基于fpga的可配置并行快速卷积核的结构 Download PDFInfo
- Publication number
- CN108491929A CN108491929A CN201810242673.6A CN201810242673A CN108491929A CN 108491929 A CN108491929 A CN 108491929A CN 201810242673 A CN201810242673 A CN 201810242673A CN 108491929 A CN108491929 A CN 108491929A
- Authority
- CN
- China
- Prior art keywords
- register
- fast convolution
- convolution
- convolution core
- fpga
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于FPGA的可配置并行快速卷积核的结构。该快速卷积核在硬件结构上主要由序号寄存器、数据宽度寄存器、地址宽度寄存器、锁存宽度寄存器、突发长度寄存器这五个寄存器和两列缓存器、一个乘法器、一个加法器、一个锁存器构成。该快速卷积核可依据所选FPGA的硬件资源,由Verilog程序灵活配置上述五个寄存器,实现快速例化,多核协同进行并行卷积运算,以达到对大量的卷积运算进行硬件加速的目的。
Description
【技术领域】
本发明属于高速数字信号处理领域,充分利用FPGA硬件资源丰富和并行运算的特点,设计可参数化配置、多核协同并行计算的快速卷积核,对两路离散的数字信号进行快速卷积运算,以提高卷积运算的速度和效率。
【背景技术】
在图像处理、数字滤波、时域频域变换和空间定位等实际应用中,卷积运算是常用且十分重要的数字信号处理方法。
当面向高速信号或对信号处理有实时性的要求时,目前常用的软件卷积算法的速度和效率较低,不足以满足对高速信号处理实时性的要求。而采用FPGA配置并行快速卷积核,对数据进行多核协同并行卷积运算,可大大提高运算速度,从而实现对高速信号处理实时性的要求。
【发明内容】
本发明公开了一种基于FPGA的可配置并行快速卷积核的结构,该快速卷积核在硬件结构上主要由序号寄存器、数据宽度寄存器、地址宽度寄存器、锁存宽度寄存器、突发长度寄存器和两列缓存器、一个乘法器、一个加法器、一个锁存器构成。
外部控制逻辑通过配置序号寄存器,赋予每一个快速卷积核以特定的顺序,当两列原始序列输入时,每一个快速卷积核便可根据自己被分配的序号,找出自己需要卷积的有用的数据存入核内两列缓存器中,并根据外部使能信号进行乘法运算和加法运算,并将结果暂时存入锁存器中。
数据宽度寄存器和地址宽度寄存器分别为快速卷积核描述了需要卷积的数据的宽度和深度。在例化时,每一个快速卷积核都可根据这两个寄存器,灵活配置乘法器和加法器的输入、输出位宽和数据总线宽度。
锁存宽度寄存器用来配置锁存器的位宽,也就是锁存器的容量。该寄存器是在用户对卷积运算进行全局设计时就配置好的,其值等于卷积运算所有可能的结果的最大值的位宽。合理得配置该寄存器,可保证数据在卷积运算过程中不产生溢出,从而保证卷积运算的准确性。
突发长度寄存器告诉每一个快速卷积核一共有多少个快速卷积核一起协同参与运算,并为所有的快速卷积核内部的寄存器提供了一个统一的终点,以便可以同时输出卷积结果。另外突发长度寄存器连同序号寄存器一起决定了每一个快速卷积核内的两列缓存器的深度。
【本发明的优点和积极效果】
本发明在实现上具有极强的封装性和程式化,只须根据需求改动顶层模块的五个参数寄存器便可得到合适的快速卷积核,移植方便,例化简单,运算效率高。本发明未使用任何公司的IP核,普适多种FPGA平台,且可根据需求和所选FPGA的型号进行灵活配置。用户根据需求所配置的快速卷积核,可进行多核协同并行卷积运算,配置了n个快速卷积核,就可将卷积运算速度提高n倍。
【附图说明】
图1是序号为0的可配置并行快速卷积核;
图2是序号为127的可配置并行快速卷积核;
图3是序号为254的可配置并行快速卷积核;
图4是序号为255的可配置并行快速卷积核。
【具体实施方式】
为了更清楚地说明本发明的实施方案,下面结合后文附图,对本发明做进一步的说明。
当用户需要将卷积运算的速度提高256倍时,就应例化256个可配置并行快速卷积核,每个核的序号寄存器赋值从0开始一直到255,此时突发长度寄存器设置为256。由于数目过多,仅列出几个关键位置的已配置的并行快速卷积核的硬件结构:如图1所示为序号为0的快速卷积核,如图2所示为序号为127的快速卷积核,如图3所示为序号为254的快速卷积核,如图4所示为序号为255的快速卷积核。当需要卷积的两个序列宽度为12bit,深度为8192字节时,就将数据宽度寄存器设为12,地址宽度寄存器设为13,锁存宽度寄存器设为35。以此方式配置完成后,这256个快速卷积核便可协同进行并行卷积运算,与软件卷积算法相比,相同时间内每一次运算可同时得到256个卷积结果,将卷积运算效率提高了256倍。
Claims (2)
1.一种基于FPGA的可配置并行快速卷积核的结构,由序号寄存器、数据宽度寄存器、地址宽度寄存器、锁存宽度寄存器、突发长度寄存器和两列缓存器、一个乘法器、一个加法器、一个锁存器构成。
2.该快速卷积核受外部的控制逻辑控制,依据所选FPGA的硬件资源灵活配置,所配置的多个快速卷积核间协同进行并行卷积运算,当配置了64个快速卷积核时可将卷积运算速度提升64倍,当配置了128个快速卷积核时可将卷积运算速度提升128倍。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810242673.6A CN108491929A (zh) | 2018-03-20 | 2018-03-20 | 一种基于fpga的可配置并行快速卷积核的结构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810242673.6A CN108491929A (zh) | 2018-03-20 | 2018-03-20 | 一种基于fpga的可配置并行快速卷积核的结构 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108491929A true CN108491929A (zh) | 2018-09-04 |
Family
ID=63319418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810242673.6A Pending CN108491929A (zh) | 2018-03-20 | 2018-03-20 | 一种基于fpga的可配置并行快速卷积核的结构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108491929A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102122275A (zh) * | 2010-01-08 | 2011-07-13 | 上海芯豪微电子有限公司 | 一种可配置处理器 |
CN104035750A (zh) * | 2014-06-11 | 2014-09-10 | 西安电子科技大学 | 一种基于fpga的实时模板卷积实现方法 |
CN106875012A (zh) * | 2017-02-09 | 2017-06-20 | 武汉魅瞳科技有限公司 | 一种基于fpga的深度卷积神经网络的流水化加速系统 |
CN107463990A (zh) * | 2016-06-02 | 2017-12-12 | 国家计算机网络与信息安全管理中心 | 一种卷积神经网络的fpga并行加速方法 |
CN107656899A (zh) * | 2017-09-27 | 2018-02-02 | 深圳大学 | 一种基于fpga的模板卷积实现方法和系统 |
-
2018
- 2018-03-20 CN CN201810242673.6A patent/CN108491929A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102122275A (zh) * | 2010-01-08 | 2011-07-13 | 上海芯豪微电子有限公司 | 一种可配置处理器 |
CN104035750A (zh) * | 2014-06-11 | 2014-09-10 | 西安电子科技大学 | 一种基于fpga的实时模板卷积实现方法 |
CN107463990A (zh) * | 2016-06-02 | 2017-12-12 | 国家计算机网络与信息安全管理中心 | 一种卷积神经网络的fpga并行加速方法 |
CN106875012A (zh) * | 2017-02-09 | 2017-06-20 | 武汉魅瞳科技有限公司 | 一种基于fpga的深度卷积神经网络的流水化加速系统 |
CN107656899A (zh) * | 2017-09-27 | 2018-02-02 | 深圳大学 | 一种基于fpga的模板卷积实现方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100499371C (zh) | 一种可编程内插滤波器装置及其实现方法 | |
CN107656899A (zh) | 一种基于fpga的模板卷积实现方法和系统 | |
WO2017000756A1 (zh) | 基于3072点快速傅里叶变换的数据处理方法及处理器、存储介质 | |
CN102098509B (zh) | 基于Farrow结构的可重构插值滤波器 | |
CN109284475B (zh) | 一种矩阵卷积计算装置及矩阵卷积计算方法 | |
WO2021232843A1 (zh) | 图像数据存储方法、图像数据处理方法、系统及相关装置 | |
WO2018027706A1 (zh) | Fft处理器及运算方法 | |
CN104579240B (zh) | 一种基于fpga的可配置系数的滤波器、电子设备及滤波方法 | |
CN107168927B (zh) | 一种基于流水反馈滤波结构的稀疏傅里叶变换实现方法 | |
CN203617974U (zh) | 一种基于fpga的可配置系数的滤波器及电子设备 | |
WO2021135572A1 (zh) | 神经网络的卷积实现方法、卷积实现装置及终端设备 | |
CN108491929A (zh) | 一种基于fpga的可配置并行快速卷积核的结构 | |
Wei et al. | Fast median filtering algorithm based on FPGA | |
CN112559952B (zh) | 基于序列分层的异构众核快速傅里叶变换方法 | |
CN105975436A (zh) | 一种SoC系统中通用可配置加速单元的IP电路 | |
CN114185014B (zh) | 一种应用于雷达信号处理的并行卷积方法及装置 | |
CN105608054A (zh) | 基于lte系统的fft/ifft变换装置及方法 | |
CN202043074U (zh) | 可配置数字下变频器 | |
CN106649905A (zh) | 一种利用进位链的工艺映射方法 | |
Grayver et al. | A reconfigurable 8 GOP ASIC architecture for high-speed data communications | |
CN1937605B (zh) | 一种相位获取装置 | |
CN103916140A (zh) | 卷积交织/解交织的实现方法及装置 | |
CN105578083B (zh) | 低噪声ccd信号成像电子学系统 | |
CN109743125B (zh) | 针对超大带宽无线信道仿真实现精确延时处理的电路结构 | |
CN102238348A (zh) | 一种可变数据个数的fft/ifft处理器的基4模块 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180904 |
|
WD01 | Invention patent application deemed withdrawn after publication |