CN112286490B - 一种循环迭代乘加运算的硬件架构及方法 - Google Patents

一种循环迭代乘加运算的硬件架构及方法 Download PDF

Info

Publication number
CN112286490B
CN112286490B CN202011254262.2A CN202011254262A CN112286490B CN 112286490 B CN112286490 B CN 112286490B CN 202011254262 A CN202011254262 A CN 202011254262A CN 112286490 B CN112286490 B CN 112286490B
Authority
CN
China
Prior art keywords
selector
multiply
add operation
register
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011254262.2A
Other languages
English (en)
Other versions
CN112286490A (zh
Inventor
王中风
吴博
田静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202011254262.2A priority Critical patent/CN112286490B/zh
Publication of CN112286490A publication Critical patent/CN112286490A/zh
Application granted granted Critical
Publication of CN112286490B publication Critical patent/CN112286490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/544Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
    • G06F7/5443Sum of products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/57Arithmetic logic units [ALU], i.e. arrangements or devices for performing two or more of the operations covered by groups G06F7/483 – G06F7/556 or for performing logical operations
    • G06F7/575Basic arithmetic logic units, i.e. devices selectable to perform either addition, subtraction or one of several logical operations, using, at least partially, the same circuitry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

本申请示出一种循环迭代乘加运算的硬件架构及方法,用于公式的计算,包括:接收单元、选择单元、乘法器、加法器以及存储单元;乘法器计算an‑1和R的乘法结果输出至加法器,加法器计算乘法结果与第二选择器的筛选结果得到加法结果并将其分为高位和低位,输出至选择器进行下一轮循环迭代乘加运算,共进行n(n‑1)个时钟周期完成整个运算。本申请示出的一种循环迭代乘加运算的硬件架构及方法,计算复杂度低、资源消耗低、占用面积小,在需要计算该公式且对面积以及时钟频率有要求的特定场合能起到重要作用。

Description

一种循环迭代乘加运算的硬件架构及方法
技术领域
本发明涉及计算机运算领域,主要涉及一种循环迭代乘加运算的硬件架构及方法。
背景技术
数学公式的在多项式计算中经常被使用,常规计算方法分别计算a0,a1·R,…,an-1·Rn-1,并将其全部相加,总共需要/>个乘法和n-1个加法,不同尺寸的乘法占用资源不同,乘法尺寸越大占用资源越多,常规计算方法需要较大计算量,尤其是当参数n数值较大时,需要较长的计算时间,占用较多的存储资源。
现有技术中,通常采用计算机软件程序计算该数学公式,时间长,功耗高,成本贵,在许多需要计算大数乘法的领域,诸如密码学领域需要提供一种计算复杂度低、资源消耗低、占用面积小,在需要计算该公式且对面积以及时钟频率有要求的特定场合能起到重要作用的硬件架构及方法。
发明内容
基于上述问题,本申请的目的在于提供一种循环迭代乘加的方法及硬件架构及方法,以解决现有计算公式时间长,功耗高,成本贵的问题。
第一方面,本申请示出一种循环迭代乘加运算的硬件架构,其特征在于,用于公式 的计算,包括:接收单元、选择单元、乘法器、加法器以及存储单元;
所述接收单元用于接收参数;所述接收单元包括:第一接收端、第二接收端以及第三接收端;
所述选择单元用于筛选参数;所述选择单元包括:第一选择器、第二选择器、第三选择器、第四选择器、第五选择器以及第六选择器;
所述乘法器用于将筛选出的参数与R进行乘法运算,输出乘法结果;
所述加法器用于将乘法结果与筛选出的参数进行加法运算,输出加法结果;
所述存储单元与选择单元连接,用于寄存参数;所述存储单元包括:第一寄存器、第二寄存器和第三寄存器;
所述第一接收端用于接收R,所述第一接收端与乘法器连接;所述第二接收端用于接收an-1,所述第二接收端与第一选择器连接;所述第一选择器与乘法器连接,第一选择器将筛选出的an-1或Sj传输至乘法器,乘法器将an-1或Sj以及R进行乘法运算,输出乘法结果至加法器;
第一寄存器用于寄存a0~an-2,第二寄存器用于寄存D,第一寄存器和第二寄存器与第二选择器连接,第二选择器将筛选出的a0~an-2或D传输至加法器,所述加法器将乘法结果和第二选择器的筛选结果进行加法运算,输出加法结果Pj,所述加法结果Pj分为高位PH和低位PL,高位PH输入第三选择器,低位PL输入第四选择器;
所述第三接收端用于接收Sj+1,所述第三接收端与第三选择器连接,第三选择器筛选Sj+1或高位PH至第五选择器,第四选择器筛选Sj至第三寄存器,第五选择器筛选Sj+1或高位PH至第三寄存器,第三寄存器筛选Sj或Sj+1至第六选择器,所述第六选择器与所述第一选择器连接。
第二方面,本申请示出一种循环迭代乘加运算的方法,其特征在于,用于公式 的计算,所述一种循环迭代乘加运算的方法基于上述循环迭代乘加运算的硬件架构,所述循环迭代乘加运算的方法包括:
输入公式所述ai(i=0~n-1)取值范围为ai大于或等于0小于R,所述R的取值范围为R大于或等于2w-1小于2w,所述w为位宽;
对参数i从1遍历至n-1;对参数j从1遍历至i;
当i=1,j=1时,根据公式计算an-1·R+an-2,得到加法结果P1,所述加法结果P1分为高位S2和低位S1
将高位S2和低位S1进行循环迭代乘加运算,当j=2时,计算得到(an-1·R+an-2)R+an-3,依次类推,则第i个R相加需要进行i次循环迭代乘加运算,共进行个周期;得到结果C={Sn,Sn-1,…,S1}。
由以上技术方案可知,本申请示出一种循环迭代乘加运算的硬件架构及方法,用于公式的计算,包括:接收单元、选择单元、乘法器、加法器以及存储单元;乘法器计算an-1和R的乘法结果输出至加法器,加法器计算乘法结果与第二选择器的筛选结果得到加法结果并将其分为高位和低位,输出至选择器进行下一轮循环迭代乘加运算,共进行n(n-1)个时钟周期完成整个运算。本申请示出的一种循环迭代乘加运算的硬件架构及方法,计算复杂度低、资源消耗低、占用面积小,在需要计算该公式且对面积以及时钟频率有要求的特定场合能起到重要作用。
附图说明
为了更清楚的说明申请的技术方案,下面将对实施例中所需要使用的附图作简单的介绍,显而易见地,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中硬件架构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请实施例中的技术方案,并使本申请实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例中的技术方案作进一步详细的说明。显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
为了便于理解,首先对本申请的背景进行介绍,公式在多项式计算中常被使用,但其常规计算方法分别计算a0,a1·R,…,an-1·Rn-1,并将其全部相加,总共需要/>个乘法和n-1个加法,不同尺寸的乘法占用资源不同,乘法尺寸越大占用资源越多,常规计算方法需要较大计算量,尤其是当参数n数值较大时,需要较长的计算时间,占用较多的存储资源。本申请的目的在于提供一种循环迭代乘加的方法及硬件架构及方法,以解决现有计算公式/>时间长,功耗高,成本贵的问题。
本申请示出的技术方案首先将公式的常规计算方法进行了一轮变换,变换后公式如下:
该公式适用于本申请提出的硬件架构。
参阅图1,图1为本申请示出的一种循环迭代乘加运算的硬件架构示意图,本申请示出的一种循环迭代乘加运算的硬件架构,用于公式的计算,包括:接收单元1、选择单元2、乘法器3、加法器4以及存储单元5;
所述接收单元1用于接收参数;所述接收单元1包括:第一接收端11、第二接收端12以及第三接收端13;
所述选择单元2用于筛选参数;所述选择单元2包括:第一选择器21、第二选择器22、第三选择器23、第四选择器24、第五选择器25以及第六选择器26;
所述乘法器3用于将筛选出的参数与R进行乘法运算,输出乘法结果;
所述加法器4用于将乘法结果与筛选出的参数进行加法运算,输出加法结果;
所述存储单元5与选择单元2连接,用于寄存参数;所述存储单元5包括:第一寄存器51、第二寄存器52和第三寄存器53;
所述参数包括:i(i=0~n-1)、ai、R、j(j=1~n-1)、D、Sj和Sj+1,所述i(i=0~n-1)、ai和R为公式中参数,所述j为程序运行过程中的循环次数,所述D为循环迭代乘加运算过程中产生的中间值,所述Sj和Sj+1为循环迭代乘加运算过程中产生的运算结果。
所述第一接收端11用于接收R,所述第一接收端11与乘法器3连接;所述第二接收端12用于接收an-1,所述第二接收端12与第一选择器21连接;所述第一选择器21与乘法器3连接,第一选择器21将筛选的an-1或Sj传输至乘法器3,乘法器3将an-1或Sj以及R进行乘法运算,输出乘法结果至加法器4。
第一寄存器51用于寄存a0~an-2,第二寄存器52用于寄存D,第一寄存器51和第二寄存器52与第二选择器22连接,第二选择器22将筛选的a0~an-2或D传输至加法器4,所述加法器4将乘法结果和第二选择器22的筛选结果进行加法运算,输出加法结果Pj,所述加法结果Pj分为高位PH和低位PL,高位PH输入第三选择器23,低位PL输入第四选择器24。
所述第三接收端13用于接收Sj+1,所述第三接收端13与第三选择器23连接,第三选择器23筛选Sj+1或高位PH至第五选择器25,第四选择器24筛选Sj至第三寄存器53,第五选择器25筛选Sj+1或高位PH至第三寄存器53,第三寄存器53筛选Sj或Sj+1至第六选择器26,所述第六选择器26与所述第一选择器连接21。
所述一种循环迭代乘加运算的硬件架构依据于以下方法:
该方法可进一步参照以下方法:
参阅上述方法,所述一种循环迭代乘加运算的方法基于循环迭代乘加运算的硬件架构,所述循环迭代乘加运算的方法包括:
输入公式所述ai(i=0`n-1)取值范围为ai大于或等于0小于R,所述R的取值范围为R大于或等于2w-1小于2w,所述w为位宽;
对参数i从1遍历至n-1;对参数j从1遍历至i;
当i=1,j=1时,根据公式计算an-1·R+an-2,得到加法结果P1,所述加法结果P1分为高位S2和低位S1
将高位S2和低位S1进行循环迭代乘加运算,当j=2时,计算得到(an-1·R+an-2)R+an-3,依次类推,则第i个R相加需要进行i次循环迭代乘加运算,共进行个周期;得到结果C={Sn,Sn-1,…,S1}。
该方法中,由于第i个R相加需要进行i次循环迭代乘加运算,共需要n-1个乘R相加的运算,因此总的循环迭代乘加次数为由于硬件架构中关键路径插入了一级流水线,所以每个方法周期需要在硬件架构中运行两个时钟周期,硬件架构中,完成整个运算需要n(n-1)个时钟周期。
在一可行性实施例中,当i=1,j=1时,第二接收端12接收an-1,第二接收端12与第一选择器21连接,输入an-1至第一选择器21,第一选择器21输入an-1至乘法器3,第一接收端11接收R,输入R至乘法器3,所述乘法器3将an-1与R进行乘法运算,输出第一乘法结果an-1·R至加法器4,第一寄存器51输入a0~an-2至第二选择器22,第二选择器22筛选an-2至加法器4,所述加法器4将第一乘法结果an-1·R和an-2进行加法计算,输出第一加法结果P1=an-1·R+an-2,所述第一加法结果P1位宽为2w,将所述第一加法结果P1分为前w位的高位PH和后w位的低位PL,所述高位PH为S2,低位PL为S1,则C={S2,S1}。
在一可行性实施例中,当i=2,j=1~i时;在i=1,j=1基础上进行循环迭代乘加运算,当i=1,j=1时,输出高位S2和低位S1,所述高位S2输入至第三选择器23,所述低位S1输入至第四选择器24,所述第三选择器23输入高位S2至第五选择器25,所述第四选择器24及第五选择器25分别输入S1及S2至第三寄存器53。
当i=2,j=1时,第三寄存器53输入S1和S2至第六选择器26,第六选择器26输入S1至第一选择器21,第一选择器21输入S1至乘法器3,所述乘法器3将S1与R进行乘法运算,输出第二乘法结果S1·R至加法器4,第一寄存器51输入an-3至加法器4,所述加法器4将第二乘法结果S1·R和an-3进行加法计算,输出第二加法结果P2=S1·R+an-3,所述第二加法结果分为高位的D以及低位的S1,高位D输入第二寄存器52,低位S1输入第四选择器24,第四选择器24输入S1至第三寄存器53,由于此时j不等于i,Sj+1作为下一个乘加的输入,继续进行循环迭代乘加运算;
当i=2,j=2时,第三寄存器53输入S1和S2至第六选择器26,第六选择器26筛选S2至第一选择器21,第一选择器21输出S2至乘法器3,乘法器3将S2及R进行乘法运算,得到第三乘法结果S2·R,第二寄存器52输入D至第二选择器22,第二选择器22输入D至加法器4,所述加法器4将第三乘法结果S2·R与D进行加法运算,得到第三加法结果P3=S2·R+D,由于此时j等于i,Sj+1等于高位PH,所述P3分为高位S3和低位S2,则当i=2,j=2时,所得结果C为C={S3,S2,S1}。
对于i=1~n-1,j=1~i,其计算过程以此类推;
当i=n-1,j=n-1时,C={Sn,Sn-1,…,S1}。
通过上述硬件架构,我们可以低资源消耗、短关键路径地完成计算通过Verilog代码在FPGA板上对本申请所示方法实例进行综合和布局布线。为了使时钟频率能够达到200M赫兹,在乘法过程中插了一级流水线,因此完成整个过程需要n(n-1)个时钟周期。
下表为一可行性实施例中本申请示出的一种循环迭代乘加运算的硬件架构的技术效果:
表1本申请所示方法实施例综合和布局布线的面积和时序结果
该实施例采用vivado设计套件2018.2版本在Xilinx Virtex-7xc7vx690tffg1157-3的集成电路板上对本申请示出的硬件架构进行了综合,取R的位宽为w=63,n=12。结果如上表所示,结果A的位宽为756bit,所消耗的数字信号处理器DSP、查找表LUT、触发器的资源都是比较少的,仅仅等效于746Slices(FPGA中的基本计数单元),且时钟频率能够达到200兆赫兹,由于本申请示出的硬件架构面积小、频率高,且计算量较大,完成这个计算需要132个时钟周期。
同时,为了明确本申请示出的硬件架构具有较优的技术效果,与其他计算 的硬件架构进行比较;对其他硬件架构计算/>的方法进行综合仿真,同样采用公式:
该硬件架构技术效果为:
表2其他硬件架构综合和布局布线的面积和时序结果
由表1和表2比较可知,本申请示出的技术方案能够占用更少面积,达到更高频率,较于其他硬件架构计算公式的方法有更高的优化水平。
本发明的关键点在于针对公式运用循环迭代乘加运算的方法,提出了一种全新的少面积,高频率的硬件架构。这种硬件架构是第一次被提出来,且在一些需要计算该公式的特定场合能起到作用,如在一些对面积或者频率有要求的设计中,较于现有技术采用计算机软件程序计算该数学公式,时间长,功耗高,成本贵,在许多需要计算大数乘法的领域,诸如密码学领域,本申请提供的一种循环迭代乘加运算的硬件架构及方法,计算复杂度低、资源消耗低、占用面积小,在需要计算该公式且对面积以及时钟频率有要求的特定场合能起到重要作用。
应当理解,本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列环节不必限于清楚列出的那些环节,而是可包括没有清楚地列出的或对于这些技术常规使用的其他环节。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (2)

1.一种循环迭代乘加运算的硬件装置,其特征在于,用于公式的计算,包括:接收单元(1)、选择单元(2)、乘法器(3)、加法器(4)以及存储单元(5);
所述接收单元(1)用于接收参数;所述接收单元(1)包括:第一接收端(11)、第二接收端(12)以及第三接收端(13);
所述选择单元(2)用于筛选参数;所述选择单元(2)包括:第一选择器(21)、第二选择器(22)、第三选择器(23)、第四选择器(24)、第五选择器(25)以及第六选择器(26);
所述乘法器(3)用于将筛选出的参数与R进行乘法运算,输出乘法结果;
所述加法器(4)用于将乘法结果与筛选出的参数进行加法运算,输出加法结果;
所述存储单元(5)与选择单元连接,用于寄存参数;所述存储单元(5)包括:第一寄存器(51)、第二寄存器(52)以及第三寄存器(53);
所述第一接收端(11)用于接收R,所述第一接收端(11)与乘法器(3)连接;所述第二接收端(12)用于接收an-1,所述第二接收端(12)与第一选择器(21)连接;所述第一选择器(21)与乘法器(3)连接,第一选择器(21)将筛选出的an-1或Sj输至乘法器(3),j为程序运行过程中的循环次数,所述Sj为循环迭代乘加运算过程中产生的运算结果,乘法器(3)将an-1或Sj以及R进行乘法运算,输出乘法结果至加法器(4);
第一寄存器(51)用于寄存a0~an-2,第二寄存器(52)用于寄存D,所述D为循环迭代乘加运算过程中产生的中间值,第一寄存器(51)和第二寄存器(52)与第二选择器(22)连接,第二选择器(22)将筛选出的a0~an-2或D传输至加法器(4),所述加法器(4)将乘法结果和第二选择器(22)的筛选结果进行加法运算,输出加法结果Pj,所述加法结果Pj分为高位PH和低位PL,高位PH输入第三选择器(23),低位PL输入第四选择器(24);
所述第三接收端(13)用于接收Sj+1,所述Sj+1为循环迭代乘加运算过程中产生的运算结果,所述第三接收端(13)与第三选择器(23)连接,第三选择器(23)筛选Sj+1或高位PH至第五选择器(25),第四选择器(24)筛选Sj至第三寄存器(53),第五选择器(25)筛选Sj+1或高位PH至第三寄存器(53),第三寄存器(53)筛选Sj或Sj+1至第六选择器(26),所述第六选择器(26)与所述第一选择器(21)连接;
所述硬件装置,被配置为:输入公式所述ai(i=0~n-1)取值范围为ai大于或等于0小于R,所述R的取值范围为R大于或等于2w-1小于2w,所述w为位宽;
对参数i从1遍历至n-1;对参数j从1遍历至i;
当i=1,j=1时,根据公式计算an-1·R+an-2,得到加法结果P1,所述加法结果P1分为高位S2和低位S1
将高位S2和低位S1进行循环迭代乘加运算,当j=2时,计算得到(an-1·R+an-2)R+an-3,依次类推,则第i个R相加需要进行i次循环迭代乘加运算,共进行个周期;得到结果C={Sn,Sn-1,…,S1}。
2.一种循环迭代乘加运算的方法,其特征在于,所述一种循环迭代乘加运算的方法基于权利要求1所述的一种循环迭代乘加运算的硬件装置来实现,所述循环迭代乘加运算的方法包括:
输入公式所述ai(i=0~n-1)取值范围为ai大于或等于0小于R,所述R的取值范围为R大于或等于2w-1小于2w,所述w为位宽;
对参数i从1遍历至n-1;对参数j从1遍历至i;
当i=1,j=1时,根据公式计算an-1·R+an-2,得到加法结果P1,所述加法结果P1分为高位S2和低位S1
将高位S2和低位S1进行循环迭代乘加运算,当j=2时,计算得到(an-1·R+an-2)R+an-3,依次类推,则第i个R相加需要进行i次循环迭代乘加运算,共进行个周期;得到结果C={Sn,Sn-1,…,S1}。
CN202011254262.2A 2020-11-11 2020-11-11 一种循环迭代乘加运算的硬件架构及方法 Active CN112286490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011254262.2A CN112286490B (zh) 2020-11-11 2020-11-11 一种循环迭代乘加运算的硬件架构及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011254262.2A CN112286490B (zh) 2020-11-11 2020-11-11 一种循环迭代乘加运算的硬件架构及方法

Publications (2)

Publication Number Publication Date
CN112286490A CN112286490A (zh) 2021-01-29
CN112286490B true CN112286490B (zh) 2024-04-02

Family

ID=74398657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011254262.2A Active CN112286490B (zh) 2020-11-11 2020-11-11 一种循环迭代乘加运算的硬件架构及方法

Country Status (1)

Country Link
CN (1) CN112286490B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0534760A2 (en) * 1991-09-26 1993-03-31 International Business Machines Corporation High speed multiplier device
CN1786900A (zh) * 2005-10-28 2006-06-14 清华大学 基于改进的蒙哥马利算法的模乘器
CN101572602A (zh) * 2008-04-28 2009-11-04 陈婧 一种基于硬件设计的有限域求逆的方法及装置
CN101866278A (zh) * 2010-06-18 2010-10-20 广东工业大学 一种异步迭代的多位整型乘法器及其计算方法
CN101901127A (zh) * 2009-05-31 2010-12-01 国际商业机器公司 一种迦罗华域乘法器
CN103853524A (zh) * 2012-11-30 2014-06-11 安凯(广州)微电子技术有限公司 一种乘法器装置和实现乘法运算的方法
CN105426156A (zh) * 2015-10-28 2016-03-23 南京航空航天大学 一种高性能非精确乘法器及其应用方法
CN110908635A (zh) * 2019-11-04 2020-03-24 南京大学 基于同源曲线的后量子密码学的高速模乘器及其模乘方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0534760A2 (en) * 1991-09-26 1993-03-31 International Business Machines Corporation High speed multiplier device
CN1786900A (zh) * 2005-10-28 2006-06-14 清华大学 基于改进的蒙哥马利算法的模乘器
CN101572602A (zh) * 2008-04-28 2009-11-04 陈婧 一种基于硬件设计的有限域求逆的方法及装置
CN101901127A (zh) * 2009-05-31 2010-12-01 国际商业机器公司 一种迦罗华域乘法器
CN101866278A (zh) * 2010-06-18 2010-10-20 广东工业大学 一种异步迭代的多位整型乘法器及其计算方法
CN103853524A (zh) * 2012-11-30 2014-06-11 安凯(广州)微电子技术有限公司 一种乘法器装置和实现乘法运算的方法
CN105426156A (zh) * 2015-10-28 2016-03-23 南京航空航天大学 一种高性能非精确乘法器及其应用方法
CN110908635A (zh) * 2019-11-04 2020-03-24 南京大学 基于同源曲线的后量子密码学的高速模乘器及其模乘方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A clock generator with cascaded dynamic frequency counting loops for wide multiplication range applications;Pao-Lung Chen等;《IEEE》;1275-1285 *
High-Speed FPGA Implementation of SIKE Based on an Ultra-Low-Latency Modular Multiplier;Jing Tian等;《IEEE》;3719-3731 *
基于ARMv4T架构指令集的乘法器设计;陈海民;李峥;杨先文;;计算机应用研究(第02期);587-590 *
轻量型算术运算电路单元设计与FPGA实现;马怀冲;《中国优秀硕士论文电子期刊网 信息科技辑》(第1期);I135-153 *

Also Published As

Publication number Publication date
CN112286490A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
Reddy et al. An approach for FIR filter coefficient optimization using differential evolution algorithm
Sarbishei et al. Analytical optimization of bit-widths in fixed-point LTI systems
Aksoy et al. Design of digit-serial FIR filters: Algorithms, architectures, and a CAD tool
US7480603B1 (en) Finite impulse response (FIR) filter compiler
Singh et al. Implementation of high speed FIR filter using serial and parallel distributed arithmetic algorithm
Soares et al. Approximate adder synthesis for area-and energy-efficient FIR filters in CMOS VLSI
CN112286490B (zh) 一种循环迭代乘加运算的硬件架构及方法
Sarge Evaluating Simulink HDL coder as a framework for flexible and modular hardware description
CN108631752B (zh) 成形滤波器及其成形方法
Johansson Low power and low complexity shift-and-add based computations
Naik et al. An efficient reconfigurable FIR digital filter using modified distribute arithmetic technique
Ohlsson Studies on implementation of digital filters with high throughput and low power consumption
CN109981077B (zh) 基于乘法器的可编程滤波器
Khurshid et al. Achieving Performance Speed-Up in FPGA Based FIR Filters Using DSP Macro Blocks
CN112988111B (zh) 一种单比特乘法器
Sakthivel et al. A custom reconfigurable power efficient FIR filter
Hussain et al. An Area-Efficient and High Throughput Hardware Implementation of Exponent Function
Liu et al. A pipelined sign-error LMS adaptive filter architecture with low computational complexity
SWETHA et al. Implementation of Area Optimized Fixed Point Circuits using Retiming Techniques
Davis et al. Finite State Machine With Datapath Design
Surapong et al. Implementation of realtime pipeline-folding 64-tap filters on FPGA
CN101105741A (zh) 一种适合于硬件的开高次方的装置及方法
John et al. Design of high speed VLSI Architecture for FIR filter using FPPE
Khurshid et al. Technology-dependent optimization of FIR filters based on carry-save multiplier and 4: 2 compressor unit
Oruganti et al. Efficient ADD/SHIFT architecture for transposed structure of FIR filter using verilog HDL

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant