CN117492693A - 一种用于滤波器的浮点数据处理系统 - Google Patents
一种用于滤波器的浮点数据处理系统 Download PDFInfo
- Publication number
- CN117492693A CN117492693A CN202410005509.9A CN202410005509A CN117492693A CN 117492693 A CN117492693 A CN 117492693A CN 202410005509 A CN202410005509 A CN 202410005509A CN 117492693 A CN117492693 A CN 117492693A
- Authority
- CN
- China
- Prior art keywords
- data
- filter
- mantissa
- floating point
- summed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004590 computer program Methods 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 8
- 238000013500 data storage Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 21
- 238000005516 engineering process Methods 0.000 abstract 1
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/483—Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
- G06F7/485—Adding; Subtracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/483—Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
- G06F7/487—Multiplying; Dividing
- G06F7/4876—Multiplying
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Nonlinear Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Complex Calculations (AREA)
Abstract
本申请涉及数据处理技术领域,特别是涉及一种用于滤波器的浮点数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,计算机程序被处理器执行时,实现以下步骤:计算滤波器中各组系数与输入数据乘积对应的阶数和尾数,由尾数组成多个临时子集合,通过3:2加法器进行加法计算,对加法计算结果迭代使用3:2加法器进行求和,得到参考尾数及参考阶数,再进行规格化处理,得到标准尾数和标准阶数,进而确定滤波器的输出结果。可知,利用3:2加法器的硬件优势,提高了计算效率,优化了硬件面积,同时使用未规格化的尾数进行加法运算,避免了大量的运算消耗,在滤波器的数据处理场景下,有效提高了浮点数据处理的效率。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种用于滤波器的浮点数据处理系统。
背景技术
在信号处理场景下,滤波器的输出数据通常可以采用多个输入数据与其所对应滤波器系数的乘积之和来表示,例如FIR滤波器等,因此,用于滤波器的数据处理过程可以通过乘加方式在处理器中实现。
但是,在浮点数使用乘法器进行运算时,需要在运算过程中对尾数部分进行规格化处理,而规格化处理将会消耗较大的运算资源,而在滤波器的数据处理场景下,需要进行多次乘法计算,也相应需要多次规格化处理,进而导致滤波器的数据处理效率较低。
因此,如何在滤波器的数据处理场景下,提高浮点数据处理的效率成为了亟待解决的问题。
发明内容
针对上述技术问题,本发明采用的技术方案为:
一种用于滤波器的浮点数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括滤波器输入向量A=[a1,a2,…,ak,…,aK]和滤波器系数向量B=[b1,b2,…,bk,…,bK],ak为第k个滤波器输入数据,ak以浮点数表示,bk为第k个滤波器系数,k为[1,K]范围内的整数,K为滤波器的总个数,所述处理器包括乘法器、第一加法器和3:2加法器,当所述计算机程序被处理器执行时,实现以下步骤:
S101,根据ak和bk,计算得到ak bk对应的浮点数表示中的阶数Ek和尾数Mk。
S102,令待求和数据的数量P=K,由所有尾数Mk作为待求和数据qp形成临时集合Q={q1,q2,…,qp,…,qP},p为[1,P]范围内的整数。
S103,在临时集合Q中,由q3c-2、q3c-1和q3c形成C个第一临时子集合Dc={q3c-2,q3c-1,q3c},其中,c为[1,C]范围内的整数,C=f(P/3),f()为向上取整函数,步骤S103还包括以下步骤:
S1031,若3c-1>P,将q3c-1和q3c赋值为0。
S1032,若3c-1=P,将q3c赋值为0。
S104,根据q3c-2、q3c-1和q3c分别对应的阶数,确定Dc对应的临时阶数Expc=max(E3c-2,E3c-1,E3c)。
S105,根据Expc,对Dc中的待求和数据进行移位处理,得到第二临时子集合Gc。
S106,将Gc中的元素作为所述3:2加法器的输入数据,得到由所述3:2加法器计算得到的输出数据Rc1和Rc2,其中,所述3:2加法器的输入数据之和与其输出数据之和相同。
S107,更新待求和数据的数量P=2C,由所有Rc1和Rc2作为待求和数据qp更新临时集合Q。
S108,返回执行S103步骤至S107步骤,直至P=4,得到包含4个待求和数据的临时集合Q。
S109,对所述4个待求和数据进行移位处理后,使用所述第一加法器进行求和,得到参考尾数及其对应的参考阶数。
S110,根据所述参考尾数和参考阶数,进行规格化处理,得到标准尾数和标准阶数,由所述标准尾数和标准阶数确定所述滤波器的输出结果。
本发明与现有技术相比具有明显的有益效果,借由上述技术方案,本发明提供的一种用于滤波器的浮点数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
本发明提供一种用于滤波器的浮点数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,数据库包括滤波器输入向量A=[a1,a2,…,ak,…,aK]和滤波器系数向量B=[b1,b2,…,bk,…,bK],ak为第k个滤波器输入数据,ak以浮点数表示,bk为第k个滤波器系数,k为[1,K]范围内的整数,K为滤波器的总个数,处理器包括乘法器、第一加法器和3:2加法器,当计算机程序被处理器执行时,实现以下步骤:根据ak和bk,计算得到ak bk对应的浮点数表示中的阶数Ek和尾数Mk,令待求和数据的数量P=K,由所有尾数Mk作为待求和数据qp形成临时集合Q={q1,q2,…,qp,…,qP},在临时集合Q中,由q3c-2、q3c-1和q3c形成C个第一临时子集合Dc={q3c-2,q3c-1,q3c},根据q3c-2、q3c-1和q3c分别对应的阶数,确定Dc对应的临时阶数Expc=max(E3c-2,E3c-1,E3c),根据Expc,对Dc中的待求和数据进行移位处理,得到第二临时子集合Gc,将Gc中的元素作为3:2加法器的输入数据,得到由3:2加法器计算得到的输出数据Rc1和Rc2,更新待求和数据的数量P=2C,由所有Rc1和Rc2作为待求和数据qp更新临时集合Q,进行迭代处理,直至P=4,得到包含4个待求和数据的临时集合Q,对4个待求和数据进行移位处理后,使用第一加法器进行求和,得到参考尾数及其对应的参考阶数,根据参考尾数和参考阶数,进行规格化处理,得到标准尾数和标准阶数,由标准尾数和标准阶数确定滤波器的输出结果。
可知,以3:2加法器多层计算的方式实现各个乘积的尾数部分相加,能够有效利用3:2加法器的硬件优势,提高了计算效率,优化了硬件面积,同时,将3:2加法器的输入尾数构建为子集合,仅对子集合内的尾数进行移位处理,也即使用未规格化的尾数进行加法运算,仅在多层计算的结果处进行规格化处理,既得到规格化输出结果,又避免了大量的运算消耗,在滤波器的数据处理场景下,有效提高了浮点数据处理的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种用于滤波器的浮点数据处理系统中计算机程序被处理器执行时的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供一种用于滤波器的浮点数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括滤波器输入向量A=[a1,a2,…,ak,…,aK]和滤波器系数向量B=[b1,b2,…,bk,…,bK],ak为第k个滤波器输入数据,ak以浮点数表示,bk为第k个滤波器系数,k为[1,K]范围内的整数,K为滤波器的总个数,所述处理器包括乘法器、第一加法器和3:2加法器,参见图1,为本发明实施例提供的一种用于滤波器的浮点数据处理系统中计算机程序被处理器执行时的流程图,当所述计算机程序被处理器执行时,实现以下步骤:
S101,根据ak和bk,计算得到ak bk对应的浮点数表示中的阶数Ek和尾数Mk。
S102,令待求和数据的数量P=K,由所有尾数Mk作为待求和数据qp形成临时集合Q={q1,q2,…,qp,…,qP},p为[1,P]范围内的整数。
S103,在临时集合Q中,由q3c-2、q3c-1和q3c形成C个第一临时子集合Dc={q3c-2,q3c-1,q3c},其中,c为[1,C]范围内的整数,C=f(P/3),f()为向上取整函数,步骤S103还包括以下步骤:
S1031,若3c-1>P,将q3c-1和q3c赋值为0。
S1032,若3c-1=P,将q3c赋值为0。
S104,根据q3c-2、q3c-1和q3c分别对应的阶数,确定Dc对应的临时阶数Expc=max(E3c-2,E3c-1,E3c)。
S105,根据Expc,对Dc中的待求和数据进行移位处理,得到第二临时子集合Gc。
S106,将Gc中的元素作为所述3:2加法器的输入数据,得到由所述3:2加法器计算得到的输出数据Rc1和Rc2,其中,所述3:2加法器的输入数据之和与其输出数据之和相同。
S107,更新待求和数据的数量P=2C,由所有Rc1和Rc2作为待求和数据qp更新临时集合Q。
S108,返回执行S103步骤至S107步骤,直至P=4,得到包含4个待求和数据的临时集合Q。
S109,对所述4个待求和数据进行移位处理后,使用所述第一加法器进行求和,得到参考尾数及其对应的参考阶数。
S110,根据所述参考尾数和参考阶数,进行规格化处理,得到标准尾数和标准阶数,由所述标准尾数和标准阶数确定所述滤波器的输出结果。
其中,滤波器的输出数据y可以表示为y=∑K k=1(ak bk),ak以浮点数表示,则滤波器的计算过程可以视作K组ak与bk相乘,再将K个相乘结果相加的过程,在本实施例中,bk也采用浮点数表示,则ak/>bk可以采用浮点数乘法进行计算,需要说明的是,浮点数表示中还包括符号位,由于符号位的计算过程较为简单,在本实施例中不作赘述。
在一实施方式中,由于滤波器系数可以由硬件预先配置,因此bk还可以采用定点数表示,从而进一步提高计算效率。
具体地,3:2加法器,或称3:2压缩器,为整数加法单元,能够将3个输入数据相加转换为2个输出数据相加的形式,3:2加法器为硬件优化后的加法基本单元,属于现有技术,在此不具体描述其实现原理,本实施例仅利用3:2加法器经过硬件优化的特性,以起到提高计算效率,精简硬件面积的效果。
在本实施例中,若待求和数据的数量P mod 3≠0,则使用补零方式构成C个第一临时子集合。
在一实施方式中,还可以采用待求和数据保留的方式,此时,在临时集合Q中,由q3c-2、q3c-1和q3c形成C-1个第一临时子集合,由未在任一第一临时子集合中的待求和数据与经3:2加法器输出的所有Rc1和Rc2更新临时集合Q。
在一实施方式中,在S1031步骤中,若3c-1>P,则可以采用待求和数据保留的方式对q3c-1和q3c处理,在S1032步骤中,若3c-1=P,则可以采用补零方式,将q3c赋值为0。
可选的是,ak对应的阶数为EAk,bk对应的阶数为EBk,根据ak和bk,计算得到ak bk对应的浮点数表示中的阶数Ek包括:
以EAk+EBk作为ak bk对应的浮点数表示中的阶数Ek。
可选的是,ak对应的尾数为MAk,bk对应的尾数为MBk,根据ak和bk,计算得到ak bk对应的浮点数表示中的尾数Mk包括:
以MAk MBk作为ak/>bk对应的浮点数表示中的尾数Mk。
其中,尾数相乘、阶数相加为浮点数乘法的处理方式。
可选的是,ak以32位浮点数表示。
本实施例中以32位浮点数为例,需要说明的是,实施者可以根据实际情况确定浮点数位宽。
可选的是,ak bk对应的浮点数表示中的阶数Ek为8bits,尾数Mk为46bits。
其中,由于本实施例在浮点数乘法计算后不进行规格化处理,因此尾数Mk为46bits。
可选的是,步骤S105还包括以下步骤:
S1051,根据Expc分别与E3c-2、E3c-1和E3c的差值,确定Dc中q3c-2、q3c-1和q3c的移位位数。
S1052,根据q3c-2、q3c-1和q3c分别对应的移位位数,对q3c-2、q3c-1和q3c分别进行移位处理,得到q3c-2、q3c-1和q3c分别对应的移位处理结果。
S1053,由q3c-2、q3c-1和q3c分别对应的移位处理结果形成所述第二临时子集合Gc。
其中,对q3c-2、q3c-1和q3c分别进行移位处理,以使得q3c-2、q3c-1和q3c在移位后分别对应的阶数与Expc相同,从而能够进行加法运算。需要说明的是,由于本实施例中q3c-2、q3c-1和q3c未进行规格化处理,仅是进行移位处理后即进行加法运算,省去了常规乘法计算后的规格化资源消耗。
可选的是,步骤S109还包括:
S1091,确定所述4个待求和数据分别对应的阶数中的最大值为所述参考阶数。
S1092,根据所述参考阶数和所述4个待求和数据分别对应的阶数,对所述4个待求和数据进行移位处理,得到所述4个待求和数据分别对应的移位处理结果。
S1093,使用所述第一加法器对所述4个待求和数据分别对应的移位处理结果进行求和,得到参考尾数。
在一实施方式中,可以由4个待求和数据中前3个待求和数据先经过3:2加法器计算,得到2个第一计算结果,再将得到的2个第一计算结果与第4个待求和数据再次经过3:2加法器计算,得到2个第二计算结果,最后使用第一加法器将2个第二计算结果相加,得到参考尾数,其中,每次加法运算均需要阶数对齐操作,也即移位处理过程,从而能够以较低位宽的加法器实现滤波器数据处理。
可选的是,所述规格化处理包括前导零检测。
其中,前导零检测由于存在多次判断,因此在硬件实现,会较为消耗硬件资源,也即会降低计算效率,本实施例中,仅在最终得到滤波器的输出结果时进行规格化处理,从而避免了大量的运算消耗,又得到了规格化的输出结果。
本实施例以3:2加法器多层计算的方式实现各个乘积的尾数部分相加,能够有效利用3:2加法器的硬件优势,提高了计算效率,优化了硬件面积,同时,将3:2加法器的输入尾数构建为子集合,仅对子集合内的尾数进行移位处理,也即使用未规格化的尾数进行加法运算,仅在多层计算的结果处进行规格化处理,既得到规格化输出结果,又避免了大量的运算消耗,在滤波器的数据处理场景下,有效提高了浮点数据处理的效率。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。
Claims (8)
1.一种用于滤波器的浮点数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括滤波器输入向量A=[a1,a2,…,ak,…,aK]和滤波器系数向量B=[b1,b2,…,bk,…,bK],ak为第k个滤波器输入数据,ak以浮点数表示,bk为第k个滤波器系数,k为[1,K]范围内的整数,K为滤波器的总个数,所述处理器包括乘法器、第一加法器和3:2加法器,当所述计算机程序被处理器执行时,实现以下步骤:
S101,根据ak和bk,计算得到ak bk对应的浮点数表示中的阶数Ek和尾数Mk;
S102,令待求和数据的数量P=K,由所有尾数Mk作为待求和数据qp形成临时集合Q={q1,q2,…,qp,…,qP},p为[1,P]范围内的整数;
S103,在临时集合Q中,由q3c-2、q3c-1和q3c形成C个第一临时子集合Dc={q3c-2,q3c-1,q3c},其中,c为[1,C]范围内的整数,C=f(P/3),f()为向上取整函数,步骤S103还包括以下步骤:
S1031,若3c-1>P,将q3c-1和q3c赋值为0;
S1032,若3c-1=P,将q3c赋值为0;
S104,根据q3c-2、q3c-1和q3c分别对应的阶数,确定Dc对应的临时阶数Expc=max(E3c-2,E3c-1,E3c);
S105,根据Expc,对Dc中的待求和数据进行移位处理,得到第二临时子集合Gc;
S106,将Gc中的元素作为所述3:2加法器的输入数据,得到由所述3:2加法器计算得到的输出数据Rc1和Rc2,其中,所述3:2加法器的输入数据之和与其输出数据之和相同;
S107,更新待求和数据的数量P=2C,由所有Rc1和Rc2作为待求和数据qp更新临时集合Q;
S108,返回执行S103步骤至S107步骤,直至P=4,得到包含4个待求和数据的临时集合Q;
S109,对所述4个待求和数据进行移位处理后,使用所述第一加法器进行求和,得到参考尾数及其对应的参考阶数;
S110,根据所述参考尾数和参考阶数,进行规格化处理,得到标准尾数和标准阶数,由所述标准尾数和标准阶数确定所述滤波器的输出结果。
2.根据权利要求1所述的用于滤波器的浮点数据处理系统,其特征在于,ak对应的阶数为EAk,bk对应的阶数为EBk,根据ak和bk,计算得到ak bk对应的浮点数表示中的阶数Ek包括:
以EAk+EBk作为ak bk对应的浮点数表示中的阶数Ek。
3.根据权利要求1所述的用于滤波器的浮点数据处理系统,其特征在于,ak对应的尾数为MAk,bk对应的尾数为MBk,根据ak和bk,计算得到ak bk对应的浮点数表示中的尾数Mk包括:
以MAk MBk作为ak/>bk对应的浮点数表示中的尾数Mk。
4.根据权利要求1所述的用于滤波器的浮点数据处理系统,其特征在于,ak以32位浮点数表示。
5.根据权利要求4所述的用于滤波器的浮点数据处理系统,其特征在于,ak bk对应的浮点数表示中的阶数Ek为8bits,尾数Mk为46bits。
6.根据权利要求1所述的用于滤波器的浮点数据处理系统,其特征在于,步骤S105还包括以下步骤:
S1051,根据Expc分别与E3c-2、E3c-1和E3c的差值,确定Dc中q3c-2、q3c-1和q3c的移位位数;
S1052,根据q3c-2、q3c-1和q3c分别对应的移位位数,对q3c-2、q3c-1和q3c分别进行移位处理,得到q3c-2、q3c-1和q3c分别对应的移位处理结果;
S1053,由q3c-2、q3c-1和q3c分别对应的移位处理结果形成所述第二临时子集合Gc。
7.根据权利要求1所述的用于滤波器的浮点数据处理系统,其特征在于,步骤S109还包括:
S1091,确定所述4个待求和数据分别对应的阶数中的最大值为所述参考阶数;
S1092,根据所述参考阶数和所述4个待求和数据分别对应的阶数,对所述4个待求和数据进行移位处理,得到所述4个待求和数据分别对应的移位处理结果;
S1093,使用所述第一加法器对所述4个待求和数据分别对应的移位处理结果进行求和,得到参考尾数。
8.根据权利要求1所述的用于滤波器的浮点数据处理系统,其特征在于,所述规格化处理包括前导零检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410005509.9A CN117492693B (zh) | 2024-01-03 | 2024-01-03 | 一种用于滤波器的浮点数据处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410005509.9A CN117492693B (zh) | 2024-01-03 | 2024-01-03 | 一种用于滤波器的浮点数据处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117492693A true CN117492693A (zh) | 2024-02-02 |
CN117492693B CN117492693B (zh) | 2024-03-22 |
Family
ID=89673082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410005509.9A Active CN117492693B (zh) | 2024-01-03 | 2024-01-03 | 一种用于滤波器的浮点数据处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117492693B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1532811A (zh) * | 2003-03-21 | 2004-09-29 | ض� | 用于依佛雷姆-玛拉赫滤波器的精确分段多项式近似 |
US7225216B1 (en) * | 2002-07-09 | 2007-05-29 | Nvidia Corporation | Method and system for a floating point multiply-accumulator |
US20090164544A1 (en) * | 2007-12-19 | 2009-06-25 | Jeffrey Dobbek | Dynamic range enhancement for arithmetic calculations in real-time control systems using fixed point hardware |
CN103176767A (zh) * | 2013-03-01 | 2013-06-26 | 浙江大学 | 一种低功耗高吞吐的浮点数乘累加单元的实现方法 |
CN103809931A (zh) * | 2012-11-06 | 2014-05-21 | 西安元朔科技有限公司 | 一种专用高速浮点指数运算器的设计 |
US20150067010A1 (en) * | 2013-09-05 | 2015-03-05 | Altera Corporation | Floating-point adder circuitry |
CN107273090A (zh) * | 2017-05-05 | 2017-10-20 | 中国科学院计算技术研究所 | 面向神经网络处理器的近似浮点乘法器及浮点数乘法 |
CN108804077A (zh) * | 2017-04-28 | 2018-11-13 | 英特尔公司 | 用来执行用于机器学习的浮点和整数操作的指令和逻辑 |
CN112039495A (zh) * | 2020-08-31 | 2020-12-04 | 电子科技大学 | 一种浮点数fir数字滤波器及其设计方法 |
US20200401414A1 (en) * | 2019-06-21 | 2020-12-24 | Flex Logix Technologies, Inc. | Multiplier-Accumulator Circuitry and Pipeline using Floating Point Data, and Methods of using Same |
CN113282273A (zh) * | 2020-02-19 | 2021-08-20 | 脸谱公司 | 用于多种格式的浮点运算的硬件 |
CN114641755A (zh) * | 2019-09-10 | 2022-06-17 | 科尔纳米有限公司 | 可重新配置处理器电路架构 |
-
2024
- 2024-01-03 CN CN202410005509.9A patent/CN117492693B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7225216B1 (en) * | 2002-07-09 | 2007-05-29 | Nvidia Corporation | Method and system for a floating point multiply-accumulator |
CN1532811A (zh) * | 2003-03-21 | 2004-09-29 | ض� | 用于依佛雷姆-玛拉赫滤波器的精确分段多项式近似 |
US20090164544A1 (en) * | 2007-12-19 | 2009-06-25 | Jeffrey Dobbek | Dynamic range enhancement for arithmetic calculations in real-time control systems using fixed point hardware |
CN103809931A (zh) * | 2012-11-06 | 2014-05-21 | 西安元朔科技有限公司 | 一种专用高速浮点指数运算器的设计 |
CN103176767A (zh) * | 2013-03-01 | 2013-06-26 | 浙江大学 | 一种低功耗高吞吐的浮点数乘累加单元的实现方法 |
US20150067010A1 (en) * | 2013-09-05 | 2015-03-05 | Altera Corporation | Floating-point adder circuitry |
CN108804077A (zh) * | 2017-04-28 | 2018-11-13 | 英特尔公司 | 用来执行用于机器学习的浮点和整数操作的指令和逻辑 |
CN107273090A (zh) * | 2017-05-05 | 2017-10-20 | 中国科学院计算技术研究所 | 面向神经网络处理器的近似浮点乘法器及浮点数乘法 |
US20200401414A1 (en) * | 2019-06-21 | 2020-12-24 | Flex Logix Technologies, Inc. | Multiplier-Accumulator Circuitry and Pipeline using Floating Point Data, and Methods of using Same |
CN114641755A (zh) * | 2019-09-10 | 2022-06-17 | 科尔纳米有限公司 | 可重新配置处理器电路架构 |
CN113282273A (zh) * | 2020-02-19 | 2021-08-20 | 脸谱公司 | 用于多种格式的浮点运算的硬件 |
CN112039495A (zh) * | 2020-08-31 | 2020-12-04 | 电子科技大学 | 一种浮点数fir数字滤波器及其设计方法 |
Non-Patent Citations (2)
Title |
---|
ANURADHA等: "An area-delay efficient single-precision floating-point multiplier for VLSI systemsMT", 《 MICROPROCESSORS AND MICROSYSTEMS》, 31 March 2023 (2023-03-31), pages 1 - 9 * |
朱蕾;王斌;: "基于FPGA的浮点FIR滤波器的设计与实现", 微电子学与计算机, no. 07, 5 July 2007 (2007-07-05), pages 59 - 62 * |
Also Published As
Publication number | Publication date |
---|---|
CN117492693B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103064649B (zh) | 控制移位分组数据的位校正的装置 | |
CN108196822A (zh) | 一种双精度浮点开方运算的方法及系统 | |
Feng et al. | Hypergraph based minimum arborescence algorithm for the optimization and reoptimization of multiple constant multiplications | |
CN110852434A (zh) | 基于低精度浮点数的cnn量化方法、前向计算方法及装置 | |
WO2019165602A1 (zh) | 数据转换方法和装置 | |
CN117492693B (zh) | 一种用于滤波器的浮点数据处理系统 | |
Gustafsson et al. | Approximate floating-point operations with integer units by processing in the logarithmic domain | |
Chugh et al. | Logarithmic arithmetic as an alternative to floating-point: A review | |
US20210044303A1 (en) | Neural network acceleration device and method | |
Zhang et al. | A brief review of logarithmic multiplier designs | |
US20230334117A1 (en) | Method and system for calculating dot products | |
CN115827555B (zh) | 数据处理方法、计算机设备、存储介质和乘法器结构 | |
CN116954552A (zh) | 一种浮点型数据处理方法及相关装置 | |
Yang et al. | A low-power approximate multiply-add unit | |
TW202333041A (zh) | 執行浮點運算的系統及方法 | |
CN106168941B (zh) | 一种支持复数乘法的fft蝶形运算硬件实现电路 | |
CN115936965A (zh) | 应用于gpu的函数计算系统、方法和装置 | |
Di Meo et al. | Novel Low-Power Floating-Point Divider With Linear Approximation and Minimum Mean Relative Error | |
Du et al. | Partial factorizations of products of binomial coefficients | |
Iyer et al. | Generalised Algorithm for Multiplying Binary Numbers Via Vedic Mathematics | |
CN113515259B (zh) | 一种适用于浮点格式的复数的近似取模实现电路及方法 | |
TW202209135A (zh) | 運算系統和運算方法 | |
Yinbin et al. | On the stability of the positive radial steady states for a semilinear Cauchy problem involving critical exponents | |
CN116974517A (zh) | 浮点数处理方法、装置、计算机设备和处理器 | |
CN118034642A (zh) | 浮点运算方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |