CN102339217B - 一种浮点数乘加器融合处理装置及方法 - Google Patents

一种浮点数乘加器融合处理装置及方法 Download PDF

Info

Publication number
CN102339217B
CN102339217B CN201010237457.6A CN201010237457A CN102339217B CN 102339217 B CN102339217 B CN 102339217B CN 201010237457 A CN201010237457 A CN 201010237457A CN 102339217 B CN102339217 B CN 102339217B
Authority
CN
China
Prior art keywords
floating
point
input
module
adder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010237457.6A
Other languages
English (en)
Other versions
CN102339217A (zh
Inventor
田丙辛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanechips Technology Co Ltd
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201010237457.6A priority Critical patent/CN102339217B/zh
Publication of CN102339217A publication Critical patent/CN102339217A/zh
Application granted granted Critical
Publication of CN102339217B publication Critical patent/CN102339217B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明提供一种浮点数乘加器融合处理装置及方法,其中,该方法包括:把浮点复数乘数和被乘数的实部和虚部分解输入到浮点乘法模块M0和M1,先进行浮点乘法运算,该输出结果用进位位和部分和表示乘积,并且把该乘积输入到浮点加法模块A2进行浮点加法运算,该输出结果用进位位和部分和表示相加运算,再把表示相加运算的输出结果同时输入到浮点加法模块A0和A1,再把外部输入的加数也输入到浮点加法模块A0和A1,进行浮点加法运算,最后输出运算结果。本发明能够更好地应用于傅里叶变换的蝶形运算,能够简化运算步骤,在硬件实现上容易实现节省资源,用较少资源解决了浮点复数乘加的运算。

Description

一种浮点数乘加器融合处理装置及方法
技术领域
本发明涉及计算机或数字信号处理器的核心计算单元(Central ProcessingUnit(CPU))领域,特别涉及一种浮点复数乘加器融合处理装置及方法。
背景技术
在计算机发明后,研究人员就一直围绕着计算基本单元的设计展开了大量的研究工作,尤其是复数形式的浮点数乘法和加法,以及乘加级联方面的设计。
到目前为止,在浮点乘加设计方面申请的专利也很多,例如,专利“一种浮点复数乘法器”(陈泽宗,何亮,柯亨玉,武汉大学)。但是,该方法只分析了乘法的方法,没有进一步分析乘法输出到加法输入的接口如何进行简化。另外一个已经申请的专利“最佳化微处理器执行x87浮点加法指令的装置及方法”(汤姆.艾尔摩,泰瑞.派克斯,威盛电子股份有限公司),该方法更注重阐述指令对浮点数执行效率的影响,没有细化到硬件具体如何实现。
发明内容
本发明的目的在于,提供一种浮点复数乘加器融合处理装置,能够更好地应用于傅里叶变换的蝶形运算,能够简化运算步骤,在硬件实现上容易实现节省资源,用较少资源解决了浮点复数乘加的运算。
本发明的另一目的在于,提供一种浮点复数乘加器融合处理方法,能够更好地应用于傅里叶变换的蝶形运算,能够简化运算步骤,在硬件实现上容易实现节省资源,用较少资源解决了浮点复数乘加的运算。
本发明的浮点数乘加器融合处理方法,包括:把浮点复数乘数Ai和被乘数Bi的实部和虚部分解输入到浮点乘法模块M0和M1,先进行浮点乘法运算,该输出结果用进位位和部分和表示乘积,并且把该乘积输入到浮点加法模块A2进行浮点加法运算,该输出结果用进位位和部分和表示相加运算,再把该表示相加运算的输出结果同时输入到浮点加法模块A0和A1,再把外部输入的加数也输入到浮点加法模块A0和A1,进行浮点加法运算,最后输出运算结果Z,Z=Ai*Bi±Ci;其中,Z,Ai,Bi,Ci分别是浮点复数;Ai=ar+ai*j;Bi=br+bi*j;Ci=cr+ci*j。
其中,在把浮点复数乘数和被乘数的实部和虚部分解输入到浮点乘法模块M0和M1是指,输入M0的数据分别是ar和br,输入M1的数据分别是ai和bi,M0和M1分别进行浮点数的乘法运算,其中,ar为浮点复数乘数的实部;br为浮点复数被乘数的实部;ai为浮点复数乘数的虚部;bi为浮点复数被乘数的虚部。
其中,乘法模块M0和M1,先进行浮点乘法运算,该输出结果用进位位和部分和表示的乘积,并且把该表示的乘积输入到浮点加法模块A2进行浮点加法运算是ar*br-ai*bi
其中,把浮点加法模块A2表示的和同时输入浮点加法模块A0和A1,再把外部输入的加数也输入到浮点加法模块A0和A1进行浮点加法运算是指:在浮点加法模块A0和A1中分别执行ar*br-ai*bi+cr和ar*br-ai*bi-cr
其中,对所述A0和A1分别执行的ar*br-ai*bi+cr和ar*br-ai*bi-cr进行规格化运算,转换成标准浮点数格式,该结果是傅里叶变换一个蝶形运算的实部结果。
其中,在把浮点复数乘数和被乘数的实部和虚部分解输入到浮点乘法模块M0和M1是指,输入M0的数据分别是ar和bi,输入M1的数据分别是ai和br,M0和M1分别进行浮点数的乘法运算。
其中,乘法模块M0和M1,先进行浮点乘法运算,该输出结果用进位位和部分和表示的乘积,并且把该表示的乘积输入到浮点加法模块A2进行浮点加法运算是ar*bi+ai*br
另外,把浮点加法模块A2表示的和同时输入浮点加法模块A0和A1,再把外部输入的加数也输入到浮点加法模块A0和A1进行浮点加法运算是指:在浮点加法模块A0和A1中分别执行ar*bi+ai*br+ci和ar*bi+ai*br–ci
其中,对所述A0和A1分别执行的ar*bi+ai*br+ci和ar*bi+ai*br–ci进行规格化运算,转换成标准浮点数格式,该结果是傅里叶变换一个蝶形运算的虚部结果。
本发明的浮点数乘加器融合处理装置,其中,包括第一浮点数乘法运算模块M0、第二浮点数乘法运算模块M1、第一浮点数加法运算模块A0、第二浮点数加法运算模块A1、第三浮点数加法运算模块A2,其中,所述第一浮点数乘法运算模块M0,用于接收输入的被乘数和乘数的实部ar和br,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;并且,用于进一步接收输入的被乘数的虚部bi和乘数的实部ar,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;第二浮点数乘法运算模块M1,用于接收输入的被乘数和乘数的虚部ai和bi,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;并且,用于进一步接收输入的被乘数的实部br和乘数的虚部ai,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;第三浮点数加法运算模块A2,用于根据第一浮点数乘法运算模块M0和第二浮点数乘法运算模块M1输入的乘积进行浮点加法运算ar*br-ai*bi,然后将输出结果发送至第一浮点数加法运算模块A0和第二浮点数加法运算模块A1;并进一步用于根据第一浮点数乘法运算模块M0和第二浮点数乘法运算模块M1输入的乘积进行浮点加法运算ar*bi+ai*br,然后将输出结果发送至第一浮点数加法运算模块A0和第二浮点数加法运算模块A1;第一浮点数加法运算模块A0,用于将第三浮点数加法运算模块A2发送来的两次结果分别加cr和ci,得到Z=Ai*Bi+Ci;第二浮点数加法运算模块A1,用于将第三浮点数加法运算模块A2发送来的两次结果分别减cr和ci,得到Z=Ai*Bi-Ci;其中,Z,Ai,Bi,Ci分别是浮点复数;Ai=ar+ai*j;Bi=br+bi*j;Ci=cr+ci*j。
本发明的有益效果是:依照本发明的浮点数乘加器融合处理装置及方法,强调的是浮点复数乘加融合结构的特殊应用,在许多已经申请的关于浮点复数运算的专利中,很多都强调的是如何优化浮点复数数乘加的运算本身,没有强调应用,本发明在浮点复数基本结构的基础上,进行了改进,适用于傅里叶变换中蝶形的运算,并且能够简化运算步骤;另外,本发明在硬件实现上简单易行,在硬件实现上容易实现节省资源,用较少资源解决了浮点复数乘加的运算。
附图说明
图1为本发明实施例的浮点数乘加器融合处理方法的流程图;
图2为本发明实施例的浮点数乘加器融合处理装置的结构示意图。
具体实施方式
以下,参考附图1~2详细描述本发明的浮点数乘加器融合处理装置及方法。
本发明的核心思想是:把浮点复数乘数和被乘数的实部和虚部分解输入到浮点乘法模块M0和M1,数据先进行浮点乘法运算,输出结果用进位位和部分和表示的乘积,并且把结果输入到浮点加法模块A2进行加法运算,输出的也是进位位和部分和表示的和的形式,再把结果同时输入浮点加法模块A0和A1,再把外部输入的加数和被加数也输入到浮点加法模块A0和A1,进行浮点加法运算,最后输出运算结果。
由于傅里叶计算需要大量蝶形运算,并且这些蝶形输入的数据都是浮点复数,所以每次蝶形运算需要4次浮点数的乘法和6次浮点数的加法。如下是一次蝶形运算的计算公式:
Z=Ai*Bi±Ci;
其中,Z,Ai,Bi,Ci分别是浮点复数。也就是说:
Ai=ar+ai*j;
Bi=br+bi*j;
Ci=cr+ci*j;
如图1所示,本发明实施例的浮点数乘加器融合处理方法,包括下列步骤:
步骤100:对输入的被乘数和乘数的实部和虚部分别输入到M0和M1模块,进行浮点乘法运算。例如,输入M0的数据分别是ar和br,输入M1的数据分别是ai和bi,M0和M1分别进行浮点数的乘法运算。
步骤200:把M0和M1的输出结果用进位位和部分和表示的乘积,并输入到A2模块中,进行浮点加法运算,即
ar*br-ai*bi
步骤300:把A2的输出结果分别输入到A0和A1模块,同时将cr输入到A0和A1,进行浮点加法运算。例如,在A0和A1中分别执行:
ar*br-ai*bi+cr
ar*br-ai*bi-cr
步骤400:对A0和A1结果进行规格化运算,转换成标准浮点数格式。这个结果是傅里叶变换一个蝶形运算的实部结果。
其中,在步骤400中,进行规格化运算是:当A0和A1的指数结果不同时,大的指数比小的指数大N,将小的指数加N,并将小的指数附带的尾数的小数点左移N位。例如A0=5,A1=2,此时,将A1的指数加3,变为5,然后将A1的附带的尾数的小数点向左移3位,最后将A0和A1的附带的尾数相加。该相加后的结果是傅里叶变换一个蝶形运算的实部结果。
步骤500:将步骤100中输入M0的数据变为ar和bi,输入M1的数据变为ai和br,M0和M1分别进行浮点数的乘法运算。
步骤600:把M0和M1的输出结果用进位位和部分和表示的乘积,并输入到A2模块中,进行浮点加法运算。
ar*bi+ai*br
步骤700:把A2的输出结果分别输入到A0和A1模块,同时将ci输入到A0和A1,进行浮点加法运算。例如,在A0和A1中分别执行:
ar*bi+ai*br+ci
ar*bi+ai*br–ci
步骤800:对A0和A1结果进行规格化运算,转换成标准浮点数格式。这个结果是傅里叶变换一个蝶形运算的虚部结果。
其中,在步骤800中,进行规格化运算是:当A0和A1的指数结果不同时,大的指数比小的指数大N,将小的指数加N,并将小的指数附带的尾数的小数点左移N位。例如A0=5,A1=2,此时,将A1的指数加3,变为5,然后将A1的附带的尾数的小数点向左移3位,最后将A0和A1的附带的尾数相加。该相加后的结果是傅里叶变换一个蝶形运算的虚部结果。
如图2所示,为本发明实施例的浮点数乘加器融合处理装置的结构示意图。该装置,包括第一浮点数乘法运算模块M0、第二浮点数乘法运算模块M1、第一浮点数加法运算模块A0、第二浮点数加法运算模块A1、第三浮点数加法运算模块A2以及用于暂存数据的寄存器Reg。
其中,第一浮点数乘法运算模块M0,用于接收输入的被乘数和乘数的实部ar和br,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;并且,用于进一步接收输入的被乘数的虚部bi和乘数的实部ar,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;
第二浮点数乘法运算模块M1,用于接收输入的被乘数和乘数的虚部ai和bi,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;并且,用于进一步接收输入的被乘数的实部br和乘数的虚部ai,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;
第三浮点数加法运算模块A2,用于根据第一浮点数乘法运算模块M0和第二浮点数乘法运算模块M1输入的乘积进行浮点加法运算(ar*br-ai*bi),然后将输出结果发送至第一浮点数加法运算模块A0和第二浮点数加法运算模块A1;并进一步用于根据第一浮点数乘法运算模块M0和第二浮点数乘法运算模块M1输入的乘积进行浮点加法运算(ar*bi+ai*br),然后将输出结果发送至第一浮点数加法运算模块A0和第二浮点数加法运算模块A1;
第一浮点数加法运算模块A0,用于将第三浮点数加法运算模块A2发送来的结果加cr,即ar*br-ai*bi+cr和ar*bi+ai*br+cr
第二浮点数加法运算模块A1,用于将第三浮点数加法运算模块A2发送来的结果减cr,即ar*br-ai*bi-cr和ar*bi+ai*br-cr
规格化模块,用于将A0和A1的结果进行规格化,转换成标准浮点数的格式,将相应的结果作为傅里叶变换一个蝶形运算的实部结果和虚部结果。
具体地,在A0为ar*br-ai*bi+cr,A1为ar*br-ai*bi-cr时,如果A0和A1的指数结果不同,大的指数比小的指数大N,将小的指数加N,并将小的指数附带的尾数的小数点左移N位,并将A0中的ar*br-ai*bi+cr和A1中的ar*br-ai*bi-cr的附带的尾数相加。该相加后的结果是傅里叶变换一个蝶形运算的实部结果。在A0为ar*bi+ai*br+cr,A1为ar*bi+ai*br-cr时,如果A0和A1的指数结果不同,大的指数比小的指数大N,将小的指数加N,并将小的指数附带的尾数的小数点左移N位,并将A0中的ar*bi+ai*br+cr和A1中的ar*bi+ai*br-cr的附带的尾数相加。该相加后的结果是傅里叶变换一个蝶形运算的虚部结果。
综上所述,依照本发明的浮点数乘加器融合处理装置及方法,突破现有技术中过分强调浮点复数的单纯注重乘加运算的优化,更注重强调这种结构应用于傅里叶变换的蝶形运算中;另外,本发明用较少资源解决了浮点复数乘加的运算,与现有技术和装置相比,取得了设计简单易行的目的,达到了既实现了系统要求的功能又精简了硬件设计的效果,节省了硬件资源的开销,提高了产品竞争力等,是一种高效的装置。
以上是为了使本领域普通技术人员理解本发明,而对本发明所进行的详细描述,但可以想到,在不脱离本发明的权利要求所涵盖的范围内还可以做出其它的变化和修改,这些变化和修改均在本发明的保护范围内。

Claims (10)

1.一种浮点数乘加器融合处理方法,其特征在于,把浮点复数乘数Ai和被乘数Bi的实部和虚部分解输入到浮点乘法模块M0和M1,先进行浮点乘法运算,该输出结果用进位位和部分和表示乘积,并且把该乘积输入到浮点加法模块A2进行浮点加法运算,该输出结果用进位位和部分和表示相加运算,再把该表示相加运算的输出结果同时输入到浮点加法模块A0和A1,再把外部输入的加数也输入到浮点加法模块A0和A1,进行浮点加法运算,最后输出运算结果Z,Z=Ai*Bi±Ci;其中,Z,Ai,Bi,Ci分别是浮点复数;Ai=ar+ai*j;Bi=br+bi*j;Ci=cr+ci*j。
2.如权利要求1所述的浮点数乘加器融合处理方法,其特征在于,在把浮点复数乘数和被乘数的实部和虚部分解输入到浮点乘法模块M0和M1是指,输入M0的数据分别是ar和br,输入M1的数据分别是ai和bi,M0和M1分别进行浮点数的乘法运算,其中,ar为浮点复数乘数的实部;br为浮点复数被乘数的实部;ai为浮点复数乘数的虚部;bi为浮点复数被乘数的虚部。
3.如权利要求2所述的浮点数乘加器融合处理方法,其特征在于,乘法模块M0和M1,先进行浮点乘法运算,该输出结果用进位位和部分和表示的乘积,并且把该表示的乘积输入到浮点加法模块A2进行浮点加法运算是ar*br-ai*bi
4.如权利要求3所述的浮点数乘加器融合处理方法,其特征在于,把浮点加法模块A2表示的和同时输入浮点加法模块A0和A1,再把外部输入的加数也输入到浮点加法模块A0和A1进行浮点加法运算是指:在浮点加法模块A0和A1中分别执行ar*br-ai*bi+cr和ar*br-ai*bi-cr
5.如权利要求4所述的浮点数乘加器融合处理方法,其特征在于,对所述A0和A1分别执行的ar*br-ai*bi+cr和ar*br-ai*bi-cr进行规格化运算,转换成标准浮点数格式,该结果是傅里叶变换一个蝶形运算的实部结果。
6.如权利要求1所述的浮点数乘加器融合处理方法,其特征在于,在把浮点复数乘数和被乘数的实部和虚部分解输入到浮点乘法模块M0和M1是指,输入M0的数据分别是ar和bi,输入M1的数据分别是ai和br,M0和M1分别进行浮点数的乘法运算。
7.如权利要求6所述的浮点数乘加器融合处理方法,其特征在于,乘法模块M0和M1,先进行浮点乘法运算,该输出结果用进位位和部分和表示的乘积,并且把该表示的乘积输入到浮点加法模块A2进行浮点加法运算是ar*bi+ai*br
8.如权利要求7所述的浮点数乘加器融合处理方法,其特征在于,把浮点加法模块A2表示的和同时输入浮点加法模块A0和A1,再把外部输入的加数也输入到浮点加法模块A0和A1进行浮点加法运算是指:在浮点加法模块A0和A1中分别执行ar*bi+ai*br+ci和ar*bi+ai*br–ci
9.如权利要求8所述的浮点数乘加器融合处理方法,其特征在于,对所述A0和A1分别执行的ar*bi+ai*br+ci和ar*bi+ai*br–ci进行规格化运算,转换成标准浮点数格式,该结果是傅里叶变换一个蝶形运算的虚部结果。
10.一种浮点数乘加器融合处理装置,其特征在于,包括第一浮点数乘法运算模块M0、第二浮点数乘法运算模块M1、第一浮点数加法运算模块A0、第二浮点数加法运算模块A1、第三浮点数加法运算模块A2,其中,
所述第一浮点数乘法运算模块M0,用于接收输入的被乘数和乘数的实部ar和br,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;并且,用于进一步接收输入的被乘数的虚部bi和乘数的实部ar,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;
第二浮点数乘法运算模块M1,用于接收输入的被乘数和乘数的虚部ai和bi,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;并且,用于进一步接收输入的被乘数的实部br和乘数的虚部ai,进行浮点乘法运算,并将输出结果用进位位和部分和表示的乘积输入到第三浮点数加法运算模块A2中;
第三浮点数加法运算模块A2,用于根据第一浮点数乘法运算模块M0和第二浮点数乘法运算模块M1输入的乘积进行浮点加法运算ar*br-ai*bi,然后将输出结果发送至第一浮点数加法运算模块A0和第二浮点数加法运算模块A1;并进一步用于根据第一浮点数乘法运算模块M0和第二浮点数乘法运算模块M1输入的乘积进行浮点加法运算ar*bi+ai*br,然后将输出结果发送至第一浮点数加法运算模块A0和第二浮点数加法运算模块A1;
第一浮点数加法运算模块A0,用于将第三浮点数加法运算模块A2发送来的两次结果分别加cr和ci,得到Z=Ai*Bi+Ci
第二浮点数加法运算模块A1,用于将第三浮点数加法运算模块A2发送来的两次结果分别减cr和ci,得到Z=Ai*Bi-Ci;其中,Z,Ai,Bi,Ci分别是浮点复数;Ai=ar+ai*j;Bi=br+bi*j;Ci=cr+ci*j。
CN201010237457.6A 2010-07-27 2010-07-27 一种浮点数乘加器融合处理装置及方法 Expired - Fee Related CN102339217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010237457.6A CN102339217B (zh) 2010-07-27 2010-07-27 一种浮点数乘加器融合处理装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010237457.6A CN102339217B (zh) 2010-07-27 2010-07-27 一种浮点数乘加器融合处理装置及方法

Publications (2)

Publication Number Publication Date
CN102339217A CN102339217A (zh) 2012-02-01
CN102339217B true CN102339217B (zh) 2014-09-10

Family

ID=45514964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010237457.6A Expired - Fee Related CN102339217B (zh) 2010-07-27 2010-07-27 一种浮点数乘加器融合处理装置及方法

Country Status (1)

Country Link
CN (1) CN102339217B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9461667B2 (en) * 2013-12-30 2016-10-04 Samsung Electronics Co., Ltd. Rounding injection scheme for floating-point to integer conversion
GB2522194B (en) * 2014-01-15 2021-04-28 Advanced Risc Mach Ltd Multiply adder
CN104317774B (zh) * 2014-10-14 2017-07-04 中国航天科技集团公司第九研究院第七七一研究所 利用处理器浮点单元进行复数乘和蝶形运算的装置和方法
US11061672B2 (en) * 2015-10-02 2021-07-13 Via Alliance Semiconductor Co., Ltd. Chained split execution of fused compound arithmetic operations
CN105844040B (zh) * 2016-03-31 2019-01-25 同济大学 一种支持多模式乘加器的数据运算方法
CN109375895B (zh) * 2018-10-17 2021-10-15 中国联合网络通信集团有限公司 多项式乘法的加速方法及装置、ntru加解密加速方法及装置
CN111813371B (zh) * 2020-07-28 2023-08-11 上海赛昉科技有限公司 数字信号处理的浮点除法运算方法、系统及可读介质
CN112748898B (zh) * 2021-02-14 2023-03-14 成都启英泰伦科技有限公司 一种复数向量运算装置及运算方法
CN113076083B (zh) * 2021-06-04 2021-08-31 南京后摩智能科技有限公司 数据乘加运算电路

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720900B2 (en) * 2005-09-09 2010-05-18 International Business Machines Corporation Fused multiply add split for multiple precision arithmetic
US7917568B2 (en) * 2007-04-10 2011-03-29 Via Technologies, Inc. X87 fused multiply-add instruction
CN100570552C (zh) * 2007-12-20 2009-12-16 清华大学 一种并行浮点乘加单元

Also Published As

Publication number Publication date
CN102339217A (zh) 2012-02-01

Similar Documents

Publication Publication Date Title
CN102339217B (zh) 一种浮点数乘加器融合处理装置及方法
Tsoumanis et al. An optimized modified booth recoder for efficient design of the add-multiply operator
US9519460B1 (en) Universal single instruction multiple data multiplier and wide accumulator unit
CN102629189B (zh) 基于fpga的流水浮点乘累加方法
CN102103479B (zh) 浮点运算器及浮点运算的处理方法
CN102760117B (zh) 一种实现矢量运算的方法和系统
CN105045560A (zh) 一种定点乘加运算方法和装置
EP2828737A1 (en) System and method for signal processing in digital signal processors
Gandhi et al. Comparative analysis for hardware circuit architecture of Wallace tree multiplier
CN103135960A (zh) 一种基于fpga的集成浮点运算器的设计方法
Chen et al. A throughput-optimized channel-oriented processing element array for convolutional neural networks
Kuppili et al. Design of Vedic Mathematics based 16 bit MAC unit for Power and Delay Optimization
CN103699729B (zh) 模乘法器
CN102722470B (zh) 一种线性方程组的单机并行求解方法
CN202281998U (zh) 一种标量浮点运算加速器
CN102693118B (zh) 一种标量浮点运算加速器
Bokade et al. CLA based 32-bit signed pipelined multiplier
Lastras et al. A logarithmic approach to energy-efficient GPU arithmetic for mobile devices
Murali et al. An optimized implementation of vedic multiplier using barrel shifter in FPGA technology
David Low latency solver for linear equation systems in floating point arithmetic
CN103440228B (zh) 一种基于融合乘加指令加速fft计算的方法
Shrivastava et al. Implementation of Radix-2 Booth Multiplier and Comparison with Radix-4 Encoder Booth Multiplier
Phuse et al. Design and Implementation of Different Multiplier Techniques and Efficient MAC Unit on FPGA
TW200534164A (en) Static floating point processing unit suitable for embedded digital signal processing and shift control method thereof
CN203276276U (zh) 一种实时数据处理单元及处理器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20151106

Address after: Dameisha Yantian District of Shenzhen City, Guangdong province 518085 Building No. 1

Patentee after: SANECHIPS TECHNOLOGY Co.,Ltd.

Address before: 518057 Nanshan District Guangdong high tech Industrial Park, South Road, science and technology, ZTE building, Ministry of Justice

Patentee before: ZTE Corp.

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20120201

Assignee: Xi'an Chris Semiconductor Technology Co.,Ltd.

Assignor: SANECHIPS TECHNOLOGY Co.,Ltd.

Contract record no.: 2019440020036

Denomination of invention: Fusion processing device and method for floating-point number multiplication-addition device

Granted publication date: 20140910

License type: Common License

Record date: 20190619

EE01 Entry into force of recordation of patent licensing contract
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140910

CF01 Termination of patent right due to non-payment of annual fee