CN113791753A

CN113791753A - 一种基于fpga的支持快速除法的可编程dsp

Info

Publication number: CN113791753A
Application number: CN202111080085.5A
Authority: CN
Inventors: 唐润龙; 舒毅; 贾一平; 杨海钢
Original assignee: Shandong Xinhui Microelectronics Technology Co ltd
Current assignee: Shandong Xinhui Microelectronics Technology Co ltd
Priority date: 2021-09-15
Filing date: 2021-09-15
Publication date: 2021-12-14

Abstract

本发明涉及一种基于FPGA的支持快速除法的可编程DSP，属于可编程芯片技术领域。该DSP包括数据预处理模块、循环运算模块、进位保留加法器模块、补码模块和异常判断模块；实现包括计算单一循环4bit商值结果、计算当前循环的商与除数的积、计算部分余数值。本发明以较为低耗的方式，实现了FPGA的运算功能拓展，在现有DSP的基础上进行较小的改动，实现了FPGA除法运算功能的扩展，使得FPGA能够胜任不同需求。

Description

一种基于FPGA的支持快速除法的可编程DSP

技术领域

本发明涉及一种基于FPGA的支持快速除法的可编程DSP，属于可编程芯片技术领域。

背景技术

FPGA是一种硬件可重构的体系结构，具有开发周期短、应用场景丰富、高度定制化等优势，在通用计算领域以及各种终端产品中被广泛使用，尤其在数字信号处理、深度学习、高速接口等运算复杂、数据量巨大的方向上，具有很大优势。近年来，数学计算方向上的应用，如金融数据分析、神经网络训练、高清图像处理、5G通讯等，对FPGA的要求越来越高，各种复杂的运算方式和算法，从软件迁移到FPGA硬件加速器上，当前FPGA支持的运算类型和计算效率，已经逐渐无法满足这些要求。目前主流FPGA DSP单元支持多种基本运算处理，而随着当前运算复杂度的提升，除法运算（浮点运算、复数运算）的比例也逐渐提高，当前FPGA芯片只能支持调用由LUT组织形成的除法器IP，无法满足高速数据处理的要求，且逻辑复杂度高、资源消耗巨大。亟需一种能够在FPGA上实现的高性能除法器。

发明内容

本发明要解决的技术问题是：如何基于FPGA实现高性能除法器。

为了解决上述技术问题，本发明提出的技术方案是：一种基于FPGA的支持快速除法的可编程DSP，所述DSP包括数据预处理模块、循环运算模块、进位保留加法器模块、补码模块和异常判断模块；

所述数据预处理模块，用于计算除数A和被除数B的绝对值，计算除数A和被除数B的前导零位数，异或计算除数A和被除数B的符号位；

所述异常判断模块，用于判断是否开始进行除数A与被除数B的除法计算；

所述循环运算模块，用于完成除数A的绝对值与被除数B的绝对值的除法运算；

所述补码模块，在所述循环运算模块的循环次数计满后对其输出结果进行符号位补码；

所述循环运算模块采用所述FPGA的CLB逻辑单元中的LUT查找表、Booth4位乘法器和3-2压缩的进位加法器进行包括计算单一循环4bit商值结果、计算当前循环的商与除数的积、计算部分余数值。

上述技术方案的改进是：所述DSP留有级联运算用接口。

本发明的有益效果是：本发明以较为低耗的方式，实现了FPGA的运算功能拓展，在现有DSP的基础上进行较小的改动，实现了FPGA除法运算功能的扩展，使得FPGA能够胜任不同需求。

附图说明

图1是本发明实施例一的一种基于FPGA的支持快速除法的可编程DSP的逻辑图。

图2是本发明实施例一的一种基于FPGA的支持快速除法的可编程DSP的除法运算流程图。

图3是本发明实施例一的一种基于FPGA的支持快速除法的可编程DSP的编码电路图。

图4是本发明实施例一的一种基于FPGA的支持快速除法的可编程DSP的两级级联图。

图5是本发明实施例一的一种基于FPGA的支持快速除法的可编程DSP的六级级联图。

图6是本发明实施例一的一种基于FPGA的支持快速除法的可编程DSP中的Booth-4乘法器电路图。

具体实施方式

实施例一

一种基于FPGA的支持快速除法的可编程DSP，其中包括数据预处理模块、循环运算模块、进位保留加法器模块、补码模块和异常判断模块；

数据预处理模块，用于计算除数A和被除数B的绝对值，计算除数A和被除数B的前导零位数，异或计算除数A和被除数B的符号位；

异常判断模块，用于判断是否开始进行除数A与被除数B的除法计算；

循环运算模块，用于完成除数A的绝对值与被除数B的绝对值的除法运算；

补码模块，在循环运算模块的循环次数计满后对其输出结果进行符号位补码；

循环运算模块采用FPGA的CLB逻辑单元中的LUT查找表、Booth4位乘法器和3-2压缩的进位加法器进行包括计算单一循环4bit商值结果、计算当前循环的商与除数的积、计算部分余数值。

其具体结构如图1所示，可以看到相较于主流的DSP，本实施例中的DSP仅在此基础上增加了MUX选择逻辑、除法控制逻辑，关键处理单元皆复用了DSP中已有逻辑功能，以较小的改动使其能够支持快速除法运算。具体可以参照图3进行对照。

本实施例的DSP具体运行流程如图2所示，包括移位预处理，商选择，部分余数计算（华莱士加法树），余数修正。结合运算流程来看，乘法和除法都包含华莱士树(CSA TREE)，可复用该部分。商选择逻辑则如前所述采用查表实现，即使用FPGA构成中的CLB逻辑单元中的LUT查找表。图2具体流程如下，

1、计算除数A和被除数B的绝对值，计算除数和被除数的前导零位数，将第一次部分余数计算左移位数传递给后级；

2、异或计算除数和被除数符号位，得到除法运算结果的符号位；

3、进行除零异常判断，得到异常标志位；

4、判断除数和被除数的前导零位数差值判断是否开始除法循环计算；当差值为正数，左移除数，准备开始进行除法循环，计算商和部分余数；

5、前导零位数差值为负数，计算结果为小数，结束本次计算，返回结果；

6、采用查表法，计算单一循环4bit商值结果；同时，将商传递给华莱士加法树；

7、计算部分余数值，将当前除法循环中的部分余数值与除数和商的积进行减法运算，运算采用3-2压缩的进位保留加法器（即CSA TREE），计算结果即为下一次循环的部分余数值；

8、当循环次数记满，完成除法运算，得到商值；根据符号位计算商值的补码。

采用本实施例的基数为16的SRT算法整数除法器，实现25bit有符号除法运算，每次迭代运算可以得到4位商值。如果采用单独DSP单元完成除法，需要多个时钟周期完成运算；如果采用DSP级联形式，可以将Latency成倍缩短，达到快速运算的目的。商值和部分余数值选择非冗余形式数字集，商取值范围为0-15；部分余数值是在全商值范围内进行计算，每次迭代后的最大非负值为下一次迭代的部分余数。

如图3所示，DSP留有多条可旁路配置通路。以便于形成级联方式的除法器，缩短运算周期。以图4、5为例，分别为双级级联和六级级联。

对于实现25bit有符号除法运算，单独运用本实施例中的DSP需要花费6周期得到结果；而采用如图4、5的方式，双DSP级联实现除法运算，第一级DSP输入被除数B，两级DSP均输入除数A，将两级DSP的Sum_io和Co_io接口串联，只保留第二级的加法树后的寄存器；此时每级DSP均可生成4bit商结果，此时，只需要3 周期即可完成除法运算。

六级DSP级联，将各级Sum_io和Co_io接口依次串联起来，旁路加法树后的寄存器，此时，各级分别输出4bit最终的商结果，在1 周期内就可以完成整个除法运算。图4、5未标出上述接口，参照图3对应位置。

此外，本实施例为了满足较小改动的需求，采用的是具有乘法功能的芯片，但若芯片本身不具备该功能，可采用如图6所示电路实现Booth4位乘法器的功能。并不局限于上述实施例所述的具体技术方案，除上述实施例外，本发明还可以有其他实施方式。对于本领域的技术人员来说，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等形成的技术方案，均应包含在本发明的保护范围之内。

Claims

1.一种基于FPGA的支持快速除法的可编程DSP，其特征在于：所述DSP包括数据预处理模块、循环运算模块、进位保留加法器模块、补码模块和异常判断模块；

2.如权利要求1所述的基于FPGA的支持快速除法的可编程DSP，其特征在于：所述 DSP留有若干可旁路配置通路。