CN108491929A - 一种基于fpga的可配置并行快速卷积核的结构 - Google Patents

一种基于fpga的可配置并行快速卷积核的结构 Download PDF

Info

Publication number
CN108491929A
CN108491929A CN201810242673.6A CN201810242673A CN108491929A CN 108491929 A CN108491929 A CN 108491929A CN 201810242673 A CN201810242673 A CN 201810242673A CN 108491929 A CN108491929 A CN 108491929A
Authority
CN
China
Prior art keywords
register
fast convolution
convolution
convolution core
fpga
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810242673.6A
Other languages
English (en)
Inventor
孙桂玲
王鹏霄
马方舒
郑祥雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nankai University
Original Assignee
Nankai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nankai University filed Critical Nankai University
Priority to CN201810242673.6A priority Critical patent/CN108491929A/zh
Publication of CN108491929A publication Critical patent/CN108491929A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Neurology (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于FPGA的可配置并行快速卷积核的结构。该快速卷积核在硬件结构上主要由序号寄存器、数据宽度寄存器、地址宽度寄存器、锁存宽度寄存器、突发长度寄存器这五个寄存器和两列缓存器、一个乘法器、一个加法器、一个锁存器构成。该快速卷积核可依据所选FPGA的硬件资源,由Verilog程序灵活配置上述五个寄存器,实现快速例化,多核协同进行并行卷积运算,以达到对大量的卷积运算进行硬件加速的目的。

Description

一种基于FPGA的可配置并行快速卷积核的结构
【技术领域】
本发明属于高速数字信号处理领域,充分利用FPGA硬件资源丰富和并行运算的特点,设计可参数化配置、多核协同并行计算的快速卷积核,对两路离散的数字信号进行快速卷积运算,以提高卷积运算的速度和效率。
【背景技术】
在图像处理、数字滤波、时域频域变换和空间定位等实际应用中,卷积运算是常用且十分重要的数字信号处理方法。
当面向高速信号或对信号处理有实时性的要求时,目前常用的软件卷积算法的速度和效率较低,不足以满足对高速信号处理实时性的要求。而采用FPGA配置并行快速卷积核,对数据进行多核协同并行卷积运算,可大大提高运算速度,从而实现对高速信号处理实时性的要求。
【发明内容】
本发明公开了一种基于FPGA的可配置并行快速卷积核的结构,该快速卷积核在硬件结构上主要由序号寄存器、数据宽度寄存器、地址宽度寄存器、锁存宽度寄存器、突发长度寄存器和两列缓存器、一个乘法器、一个加法器、一个锁存器构成。
外部控制逻辑通过配置序号寄存器,赋予每一个快速卷积核以特定的顺序,当两列原始序列输入时,每一个快速卷积核便可根据自己被分配的序号,找出自己需要卷积的有用的数据存入核内两列缓存器中,并根据外部使能信号进行乘法运算和加法运算,并将结果暂时存入锁存器中。
数据宽度寄存器和地址宽度寄存器分别为快速卷积核描述了需要卷积的数据的宽度和深度。在例化时,每一个快速卷积核都可根据这两个寄存器,灵活配置乘法器和加法器的输入、输出位宽和数据总线宽度。
锁存宽度寄存器用来配置锁存器的位宽,也就是锁存器的容量。该寄存器是在用户对卷积运算进行全局设计时就配置好的,其值等于卷积运算所有可能的结果的最大值的位宽。合理得配置该寄存器,可保证数据在卷积运算过程中不产生溢出,从而保证卷积运算的准确性。
突发长度寄存器告诉每一个快速卷积核一共有多少个快速卷积核一起协同参与运算,并为所有的快速卷积核内部的寄存器提供了一个统一的终点,以便可以同时输出卷积结果。另外突发长度寄存器连同序号寄存器一起决定了每一个快速卷积核内的两列缓存器的深度。
【本发明的优点和积极效果】
本发明在实现上具有极强的封装性和程式化,只须根据需求改动顶层模块的五个参数寄存器便可得到合适的快速卷积核,移植方便,例化简单,运算效率高。本发明未使用任何公司的IP核,普适多种FPGA平台,且可根据需求和所选FPGA的型号进行灵活配置。用户根据需求所配置的快速卷积核,可进行多核协同并行卷积运算,配置了n个快速卷积核,就可将卷积运算速度提高n倍。
【附图说明】
图1是序号为0的可配置并行快速卷积核;
图2是序号为127的可配置并行快速卷积核;
图3是序号为254的可配置并行快速卷积核;
图4是序号为255的可配置并行快速卷积核。
【具体实施方式】
为了更清楚地说明本发明的实施方案,下面结合后文附图,对本发明做进一步的说明。
当用户需要将卷积运算的速度提高256倍时,就应例化256个可配置并行快速卷积核,每个核的序号寄存器赋值从0开始一直到255,此时突发长度寄存器设置为256。由于数目过多,仅列出几个关键位置的已配置的并行快速卷积核的硬件结构:如图1所示为序号为0的快速卷积核,如图2所示为序号为127的快速卷积核,如图3所示为序号为254的快速卷积核,如图4所示为序号为255的快速卷积核。当需要卷积的两个序列宽度为12bit,深度为8192字节时,就将数据宽度寄存器设为12,地址宽度寄存器设为13,锁存宽度寄存器设为35。以此方式配置完成后,这256个快速卷积核便可协同进行并行卷积运算,与软件卷积算法相比,相同时间内每一次运算可同时得到256个卷积结果,将卷积运算效率提高了256倍。

Claims (2)

1.一种基于FPGA的可配置并行快速卷积核的结构,由序号寄存器、数据宽度寄存器、地址宽度寄存器、锁存宽度寄存器、突发长度寄存器和两列缓存器、一个乘法器、一个加法器、一个锁存器构成。
2.该快速卷积核受外部的控制逻辑控制,依据所选FPGA的硬件资源灵活配置,所配置的多个快速卷积核间协同进行并行卷积运算,当配置了64个快速卷积核时可将卷积运算速度提升64倍,当配置了128个快速卷积核时可将卷积运算速度提升128倍。
CN201810242673.6A 2018-03-20 2018-03-20 一种基于fpga的可配置并行快速卷积核的结构 Pending CN108491929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810242673.6A CN108491929A (zh) 2018-03-20 2018-03-20 一种基于fpga的可配置并行快速卷积核的结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810242673.6A CN108491929A (zh) 2018-03-20 2018-03-20 一种基于fpga的可配置并行快速卷积核的结构

Publications (1)

Publication Number Publication Date
CN108491929A true CN108491929A (zh) 2018-09-04

Family

ID=63319418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810242673.6A Pending CN108491929A (zh) 2018-03-20 2018-03-20 一种基于fpga的可配置并行快速卷积核的结构

Country Status (1)

Country Link
CN (1) CN108491929A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102122275A (zh) * 2010-01-08 2011-07-13 上海芯豪微电子有限公司 一种可配置处理器
CN104035750A (zh) * 2014-06-11 2014-09-10 西安电子科技大学 一种基于fpga的实时模板卷积实现方法
CN106875012A (zh) * 2017-02-09 2017-06-20 武汉魅瞳科技有限公司 一种基于fpga的深度卷积神经网络的流水化加速系统
CN107463990A (zh) * 2016-06-02 2017-12-12 国家计算机网络与信息安全管理中心 一种卷积神经网络的fpga并行加速方法
CN107656899A (zh) * 2017-09-27 2018-02-02 深圳大学 一种基于fpga的模板卷积实现方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102122275A (zh) * 2010-01-08 2011-07-13 上海芯豪微电子有限公司 一种可配置处理器
CN104035750A (zh) * 2014-06-11 2014-09-10 西安电子科技大学 一种基于fpga的实时模板卷积实现方法
CN107463990A (zh) * 2016-06-02 2017-12-12 国家计算机网络与信息安全管理中心 一种卷积神经网络的fpga并行加速方法
CN106875012A (zh) * 2017-02-09 2017-06-20 武汉魅瞳科技有限公司 一种基于fpga的深度卷积神经网络的流水化加速系统
CN107656899A (zh) * 2017-09-27 2018-02-02 深圳大学 一种基于fpga的模板卷积实现方法和系统

Similar Documents

Publication Publication Date Title
CN100499371C (zh) 一种可编程内插滤波器装置及其实现方法
CN107656899A (zh) 一种基于fpga的模板卷积实现方法和系统
WO2017000756A1 (zh) 基于3072点快速傅里叶变换的数据处理方法及处理器、存储介质
CN102098509B (zh) 基于Farrow结构的可重构插值滤波器
CN109284475B (zh) 一种矩阵卷积计算装置及矩阵卷积计算方法
WO2021232843A1 (zh) 图像数据存储方法、图像数据处理方法、系统及相关装置
WO2018027706A1 (zh) Fft处理器及运算方法
CN104579240B (zh) 一种基于fpga的可配置系数的滤波器、电子设备及滤波方法
CN107168927B (zh) 一种基于流水反馈滤波结构的稀疏傅里叶变换实现方法
CN203617974U (zh) 一种基于fpga的可配置系数的滤波器及电子设备
WO2021135572A1 (zh) 神经网络的卷积实现方法、卷积实现装置及终端设备
CN108491929A (zh) 一种基于fpga的可配置并行快速卷积核的结构
Wei et al. Fast median filtering algorithm based on FPGA
CN112559952B (zh) 基于序列分层的异构众核快速傅里叶变换方法
CN105975436A (zh) 一种SoC系统中通用可配置加速单元的IP电路
CN114185014B (zh) 一种应用于雷达信号处理的并行卷积方法及装置
CN105608054A (zh) 基于lte系统的fft/ifft变换装置及方法
CN202043074U (zh) 可配置数字下变频器
CN106649905A (zh) 一种利用进位链的工艺映射方法
Grayver et al. A reconfigurable 8 GOP ASIC architecture for high-speed data communications
CN1937605B (zh) 一种相位获取装置
CN103916140A (zh) 卷积交织/解交织的实现方法及装置
CN105578083B (zh) 低噪声ccd信号成像电子学系统
CN109743125B (zh) 针对超大带宽无线信道仿真实现精确延时处理的电路结构
CN102238348A (zh) 一种可变数据个数的fft/ifft处理器的基4模块

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180904

WD01 Invention patent application deemed withdrawn after publication