CN1091900C - 运算处理装置 - Google Patents

运算处理装置 Download PDF

Info

Publication number
CN1091900C
CN1091900C CN97112942A CN97112942A CN1091900C CN 1091900 C CN1091900 C CN 1091900C CN 97112942 A CN97112942 A CN 97112942A CN 97112942 A CN97112942 A CN 97112942A CN 1091900 C CN1091900 C CN 1091900C
Authority
CN
China
Prior art keywords
mentioned
pending
long
sign bit
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN97112942A
Other languages
English (en)
Other versions
CN1176425A (zh
Inventor
三好明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1176425A publication Critical patent/CN1176425A/zh
Application granted granted Critical
Publication of CN1091900C publication Critical patent/CN1091900C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only
    • G06F7/53Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel
    • G06F7/5318Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel with column wise addition of partial products, e.g. using Wallace tree, Dadda counters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/499Denomination or exception handling, e.g. rounding or overflow
    • G06F7/49994Sign extension
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only
    • G06F7/533Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even
    • G06F7/5334Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even by using multiple bit scanning, i.e. by decoding groups of successive multiplier bits in order to select an appropriate precalculated multiple of the multiplicand as a partial product
    • G06F7/5336Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even by using multiple bit scanning, i.e. by decoding groups of successive multiplier bits in order to select an appropriate precalculated multiple of the multiplicand as a partial product overlapped, i.e. with successive bitgroups sharing one or more bits being recoded into signed digit representation, e.g. using the Modified Booth Algorithm
    • G06F7/5338Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even by using multiple bit scanning, i.e. by decoding groups of successive multiplier bits in order to select an appropriate precalculated multiple of the multiplicand as a partial product overlapped, i.e. with successive bitgroups sharing one or more bits being recoded into signed digit representation, e.g. using the Modified Booth Algorithm each bitgroup having two new bits, e.g. 2nd order MBA

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)

Abstract

本发明目的是在并联乘法器的部分积加法运算中,减轻符号扩展所伴随的时间性损失。用把4∶2压缩器并排起来的进位保存加法器20构成用于对每一个皆是已用2的补数表示的2进数且具有互不相的权重的4个部分积P0、P1、P2和P3进行加法运算的部分积加法器。在各个4∶2压缩器中,4输入中的W输入呈现最短的传播延迟,而Y和Z输入构成关键路径。

Description

运算处理装置
本发明涉及具有乘法功能的运算处理装置,特别是涉及乘法器。
在并行乘法器中,采用对用乘数和被乘数并行地生成的多个部分积进行加法运算的办法计算积。倘采用布斯(Booth)的算法,则可以减少部分积的个数。
若采用M.R.Santoro et al.,“SPIM:流水线64×64迭代乘法器”,IEEE Journal of Solid-State Circuit,Vol.24,No.2,pp.487-493,April1989,则可以构成2进数的4∶2压缩器可以应用于部分积的加法运算中去。多个4∶2压缩器并行起来构成的进位保存加法器被提供给部分积的加法运算,而各4∶2压缩器由2个3输入2输出全加器构成。
多个部分积具有互不相同的权重。因此,在各部分积是用2的补数表示的2进数的情况下,必须在部分积的进位保存加法运算之前进行部分积的符号扩展。在这里,考虑一个对采用2次布斯算法所生成的4个部分积P0、P1、P2和P3进行加法运算的例子。假定这4个部分积P0、P1、P2和P3分别具有20,22、24和26的权重,且每一个部分积都由9位构成。各部分积的最高位位是符号位。在本例中,必须对除去具有最大的权重的部分积(最高位部分积)P3之外的3个部分积P0、P1和P2的每一个进行符号扩展。具体地说来就是为了对具有最小的权重的部分积(第1部分积)P0进行符号扩展,把该第1部分积的符号位的值设定于从该第1部分积往上的高位的6位中。另外,为了对具有第2号小的权重的部分积(第2部分积)P1进行符号扩展,把该第2部分积的符号位的值设定于从该第2部分积的符号位往上的高位的4位中。再有,为了对具有第3号小的权重的部分积(第3部分积)P2进行符号扩展,把该第3部分积的符号位的值设定于从该第3部分积的符号位往上的高位的2位中。然后对这些符号扩展后的4个部分积P0、P1、P2和P3的每一位执行进位保存加法运算。
上述4∶2压缩器,顾名思义,是具有4个输入和2个输出的压缩器。该4个输入中的一个仅仅经过2个全加器中的一方达到该4∶2压缩器的两个输出,对此,其余的3个输入则顺次经过2个全加器达到该4∶2压缩器的两个输出。即,后者的3个输入中的不论哪一个将构成具有进位保存加法器中的最长的传播时延的关键路径(Critical path)。然而,如上所述在对除去最高位部分积之外的所有的部分积进行符号扩展的情况下,该关键路径的输入将变成为依赖于不论哪一个部分积的符号位的值,因而将产生时间性的损失(penalty)。
本发明的目的是在部分积加法中减少符号扩展所伴生的时间性损失。
为了达到上述目的,本发明的作法是,先把依据多个的符号位进行了符号扩展的特定的部分积分配给不构成进位保存加法器中的关键路径的特定的输入,然后把构成该进位保存加法器中的关键路径的输入固定到恒定值上。
具体地说来就是使本发明的运算处理装置或乘法器具备有部分积加法器,这一部分积加法器用来对每一个都是用2的补数表示的2进数而且具有互不相同的权重的多个部分积进行加法运算,且该部分积加法器具备有:进位保存加法器和逻辑电路。上述进位保存加法器具有用于对多个部分积进行进位保存计算的多个输入和至少一个输出;上述逻辑电路用于向比上述多个部分积中具有最小的权重的部分积(第1部分积)的符号位高位的多个位中设定该第1部分积的符号位的值与其他的部分积的符号位的值间的多个逻辑运算值。而且,在上述进位保存加法器中,特定的输入在与输出之间至少与一个其他的输入相比呈现出短的传播延迟,且把已用上述逻辑电路进行了符号扩展的第1部分积分配给上述特定的输入。
以下说明附图。
图1的方框图示出了本发明的乘法器的具体例子。
图2的方框图示出了图1中的部分积加法器的内部构成的一部分。
图3的方框图示出了图1中的部分积加法器的内部构成另一部分。
图4的方框图示出了图2和图3中的一个4∶2压缩器的内部构成。
图5的电路图示出了图4中的一个全加器的内部构成。
图6示出的是具有图2和图3的构成的部分积加法器的动作图。
图7示出的是图2的变形例的方框图。
图8示出的是具有图7的构成的部分积加法器的动作图。
实施例
以下,参照附图对作为本发明的一种运算处理装置的乘法器的具体例进行说明。
图1示出了本发明的乘法器的具体的构成例。图1的乘法器,为了使之计算每一个皆是已用2的补数表示的8位的2进数的被乘数U和乘数V之积M,具备有:乘数编码器10;4个部分积产生器11、12、13和14;部分积加法器15;先行进位加法器16。乘数编码器10根据2次布斯算法从乘数V中生成4个编码值E0、E1、E2和E3。4个部分积产生器11、12、13和14从被乘数V和4个编值E0、E1、E2和E3中并行地生成4个部分积P0、P1、P2和P3,上述4个部分积每一个都是已表示为2的补数的2进数而且具有互不相同的权重。这4个部分积P0、P1、P2和P3分别具有20,22,24和26的权重,且每者都由9位构成。各个部分积的最高位位是符号位。部分积加法器15对4个部分积P0、P1、P2和P3的每一位进行进位保存加法运算,并供给其相加结果(由2个2进数构成)Q。先行进位加法器16依据部分积加法器15供给的加法运算结果Q求积M。
图2和图3示出了图1中的部分积加法器15的内部构成。在图2和图3中,20是由15个4∶2压缩器200~214构成的进位保存加法器,30是用异或门电路31与或门电路32构成的逻辑电路。15个4∶2压缩器200~214中的每一个,实际上都是具有5个输入X、Y、Z、W和CI及3个输出C、S和CO的压缩器。其中CI是来自低位位的进位输入,CO是向高位位的进位输出。C是向先行进位加法器16的进位输出,S是向先行进位加法器16的和输出。4个部分积P0、P1、P2和P3已分别分配给进位保存加法器20的W输入、Z输入、Y输入和X输入。在图2中,P0s、P1s、P2s和P3s分别表示具有最小的权重的部分积(第1部分积)P0的符号位,具有第2个小的权重的部分积(第2部分积)P1的符号位,具有第3个小的权重的部分积(第3部分积)P2的符号位和具有最大的权的部分积(最高位部分积)P3的符号位。
若根据图2来看,则第1部分积P0要像下述那样地进行符号扩展。就是说,在比第1部分积的符号位P0s高1位的位(权重为29)中把第1部分积的符号位P0s的值原样不动地进行设定。在与第2部分积的符号位P1s的位置相对应的位置的第1部分积P0的位(权为210)上,用异或门电路31设定第1部分积的符号位P0s的值与第2部分积的符号位P1s的值之间的异或值A。接着,向从与比第2部分积的符号位P1s高1位的位的位置相对应的位置的第1部分积P0的位(权重为211)到与最高位部分积的符号位P3s的位置相对应的位置的第1部分积P0的位(权重为214)中,用或门电路32,设定第1部分积的符号位P0s的值与第2部分积的符号位P1s的值之间的或值B。其中,
A=P0s∧P1s
B=P0s+P1s“∧”与“+”分别表示异或与或。
另一方面,第2部分积P1的符号位(权重为210)与从该符号位往上高4位(权重为从211到214)的各值则被固定为0。此外,在比第3部分积P2的符号位高的2位(从权重为213到214)中,设定该第3部分积的符号位P2s的值。
若按照上述现有例那样分别对第1和第2部分积P0,P1进行符号扩展,则可以把对具有从210到214的权重的5位的两部分积的加法运算表示如下。
若P0s=0且P1s=0,则 00000+00000=00000
若P0s=1且P1s=0,则 11111+00000=11111
若P0s=0且P1s=1,则 00000+11111=11111
若P0s=1且P1s=1,则 11111+11111=11110即倘如上述那样用逻辑电路30来决定第1部分积P0的5位(权重从210到214)的值的话,则第2部分积P1的5位(从权重210到214)的值如上述那样可以全部固定为0。
图4示出了1个4∶2压缩器214的内部构成。4∶2压缩器214由第1和第2全加器101、102构成。该第1和第2全加器101、102是各自具有3个输入IN1、IN2和IN3及2个输出CY(进位)和SUM(和)的全加器。4∶2压缩器214的X输入、Y输入和Z输入分别分配给第1全加器101的IN1输入、IN2输入和IN3输出。4∶2压缩器214的W输入,则分配给第2全加器102的IN2输入。第1全加器101的SUM输出和来自低位位的进位输入CI,则分别供往第2全加器102的IN1输入和IN3输入。送往高位位的进位输出CO和送往先行进位加法器16的C输出和S输出分别由第1全加器101和第2全加器102供给。图2和图3中的其他的14个4∶2压缩器200~213的内部构成也和图4相同。
图5示出了第1全加器101的内部构成。该全加器101由2个异或门电路111和112,3个2输入NAND门电路113,114和115及1个3输入NAND门电路116构成。图4中的第2全加器102的内部构成也和图5相同。
若根据图4和图5来看,4∶2压缩器214的W输入仅仅经由第2全加器102,即最多经由2个门电路达到该4∶2压缩器214的C输出和S输出。X输入至多经过第1和第2全加器101、102之中的3个门电路到达C输出。另一方面。Y和Z输入分别经过第1和第2全加器101、102中的最多4个门电路达到C输出。即,可知W输入呈现最短的传播延迟,而Y和Z输入将构成进位保存加法器20中的关键路径。因此,如前所述,把第1部分积P0、第2部分积P1和第3部分积P2分别分配给W输入、Z输入和X输入。
图6概念性地示出了上述4个部分积P0、P1、P2和P3的符号扩展及分配。由于构成关键路径的Z输入的最高位5位已被固定于不依赖于任意一个部分积的符号位的值的恒定值0,故可以减轻符号扩展所伴随的时间性的损失,可以对高速乘法运算的实现作出贡献。而且第1部分积P0的异或值A及或值B在逻辑电路30中各自由1个门电路生成,而且该第1部分积P0被分配给W输入,故逻辑电路30中的传播延迟不会使部分积加法器15的传播延迟增加。
另外,也可以把4个部分积P0、P1、P2和P3分别分配给进位保存加法器20的X输入、Y输入、Z输入和W输入。在这种情况下,由于构成关键路径的Y输入的最高位5位将被固定于恒定值0,故仍然可以减轻符号扩展所伴有的时间性的损失。而且,由于具有1个门电路的那么大的量的输入延迟的第1部分积P0将被分配给X输入,故逻辑电路30中的传播延迟不会使部分积加法器15的传播延迟增加。
图7示出了图2的变形例。在这一变形例中,不仅仅是进位保存加法器20的Z输入最高位5位,Y输入最高位3位也将被固定于恒定值0。在图7中,40是由2个异或门电路41和43,2个或门电路42及44构成的逻辑电路。在4个部分积P0、P1、P2和P3被分别分配给进位保存加法器20的W输入、Z输入、Y输入和X输入这一点上与图2一样。
倘采用图7的办法,则第1部分积P0可如下述那样地进行符号扩展。就是说,把第1部分积的符号位P0s的值原封不动地设定于比第1部分积的符号位P0s高一位的位(权重为29)中去。用异或门电路41,把第1部分积的符号位P0S的值与第2部分积的符号位P1s的值的异或值A设定于与第2部分积的符号位P1s的位置相对应的位置的第1部分积P0的位(权重为210)中。用或门电路42,把第1部分积的符号位P0s的值与第2部分积的符号位P1s的值或值B设定于与比第2部分积的符号位P1s高一位的位的位置对应的位置的第1部分积P0的位(权重为211)中去。用异或门电路43,把或值B与第3部分积的符号位P2s的值的异或值G设定于与第3部分积的符号位P2s的位置相对应的位置的第1部分积P0的位(权重为212)中去。接着,用或门电路44,把或值B与第3部分积的符号位P2s的值的或值H设定于从与比第3部分积的符号位P2s高1位的位的位置相对应的位置的第1部分积P0的位(权重为213)到与最高位部分积的符号位P3s的位置对应的位置的第1部分积的位(权重为214)中去。其中,
A=P0S∧P1s
B=P0s+P1s
G=B∧P2s
H=B+P2s而“∧”和“+”分别表示异或与或。
另一方面,第2部分积P1的符号位(权重为210)与比该符号位高的4位(权重从211到214)的各值则被固定于0。第3部分积P2的符号位(权重为211)与比该符号位高的2位(权重从213到214)的各值也被固定于0。
图8概念性地示出了上述4个部分积P0、P1、P2和P3的符号扩展与分配。由于构成各关键路径的Y和Z输入这双方的高位位已被固定于不依赖于任一个部分积的符号位的值的恒定值0,故可以进一步减轻符号扩展所伴有的时间性损失,可以对高速乘法运算的实现作出贡献。而且,由于第1部分积P0的异或值A与G以及或值B与H在逻辑电路40中分别最多用2个门电路生成。且由于该第1部分积P0已被分配给W输入,故逻辑电路40中的传播延迟不会使部分积加法器15的传播延迟增加。
此外,上述各具体例虽然都是具备由多个4∶2压缩器构成的进位保存加法器的乘法器,但本发明一般说也可适用于具备有多个输入中的特定输入与至少一个其他的输入比呈现短的传播延迟的进位保存器的乘法器中去。例如,在16×16的乘法器中,就可以把本发明应用到把多个7∶3压缩器并排起来构成的进位保存加法器中的部分积的加法运算中去。另外,在乘数编码器中应当采用的算法不限于2次的布斯算法,也可以采用更高次的布斯算法。
如上所述,倘采用本发明,由于规定为把根据多个的符号位已进行了符号扩展的特定的部分积分配给不构成进位保存加法器中的关键路径的特定的输入,并把构成该进位保存加法器中的关键路径的输入固定于恒定值上,故可以减轻部分积加法运算中的符号扩展所伴随的时间性损失,可对高速乘法的实现作出贡献。

Claims (1)

1.一种用于计算本身皆为已用2的补数表示的2进数的被乘数与乘数之积的乘法器,具备:
乘数编码器(10),用于从上述乘数生成多个编码值;
多个部分积产生器(11~14),用于从上述被乘数和上述多个编值生成每个皆为已用2的补数表示的2进数且具有互不相同的权重的多个部分积;以及
部分积加法器(15),用于像求上述积那样地对上述多个部分积进行加法运算,
上述部分积加法器具有:
进位保存加法器(20),具有多个输入和至少一个输出,用于对上述多个部分积进行进位保存加法运算;以及
逻辑电路,用于为了对上述多个部分积中具有最小的权重的部分积(P0)进行扩展,把多个值设定在比上述第1部分的符号位高的多个位中,
其特征在于,上述逻辑电路具备下述功能:
把上述第1部分积(P0)的符号位(P0s)的值设定在,与从比上述第1部分积的符号位(P0s)高1位的位开始到与比上述多个部分积中具有第2小的权重的第2部分积(P1)的符号位(P1s)低1位的位为止的位置对应的、上述第1部分积的各个位的位置中,
把上述第1部分积的符号位(P0s)的值与上述第2部分积(P1)的符号位(P1s)的值的异或值(41)设定在,与上述第2部分积(P1)的符号位(P1s)的位置对应的、上述第1部分积的位的位置中,
把上述第1部分积(P0)的符号位(P0s)的值与上述第2部分积(P1)的符号位(P1s)的值的第一或值(42)设定在,与从与比上述第2部分积(P1)的符号位(P1s)高1位的位开始,到与比上述多个部分积中具有第3小的权重的第3部分积(P2)的符号位(P2s)低1位的位为止的位置对应的、上述第1部分积(P0)的各个位的位置中,
把上述第一或值(42)与上述第3部分积(P2)的符号位(P2s)的值的第二异或值(43)设定在,与上述第3部分积(P2)的符号位(P2s)对应的上述第1部分积(P0)的位的位置中,
把上述第一或值(42)与上述第3部分积(P2)的符号位(P2s)的值的第二或值(44)设定在,与从与比上述第3部分积(P2)的符号位(P2s)高1位的位开始,到与上述最高位部分积(P3)的符号位(P3s)为止的位置对应的、上述第1部分积的各个位的位置中;
而且,在上述进位保存加法器(20)中,上述多个输入之内的一特定输入与上述输出之间呈现比一个的其他输入短的传播延迟,且把已用上述逻辑电路进行符号扩展的上述第1部分积(P0)分配给上述特定的输入。
CN97112942A 1996-06-06 1997-06-05 运算处理装置 Expired - Fee Related CN1091900C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP144050/96 1996-06-06
JP14405096 1996-06-06

Publications (2)

Publication Number Publication Date
CN1176425A CN1176425A (zh) 1998-03-18
CN1091900C true CN1091900C (zh) 2002-10-02

Family

ID=15353161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97112942A Expired - Fee Related CN1091900C (zh) 1996-06-06 1997-06-05 运算处理装置

Country Status (6)

Country Link
US (1) US5808928A (zh)
EP (1) EP0811908B1 (zh)
KR (1) KR980004016A (zh)
CN (1) CN1091900C (zh)
DE (1) DE69710641T2 (zh)
TW (1) TW421757B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1320446C (zh) * 2004-01-09 2007-06-06 上海交通大学 基于混合压缩结构的部分积压缩树生成方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0158647B1 (ko) * 1995-05-22 1998-12-15 윤종용 부호/무부호 수 겸용 곱셈기
JP3678512B2 (ja) * 1996-08-29 2005-08-03 富士通株式会社 乗算回路、該乗算回路を構成する加算回路、該乗算回路の部分積ビット圧縮方法、および、該乗算回路を適用した大規模半導体集積回路
US6088800A (en) * 1998-02-27 2000-07-11 Mosaid Technologies, Incorporated Encryption processor with shared memory interconnect
US6442582B1 (en) * 1999-06-17 2002-08-27 Ati International Srl Multiplier carry bit compression apparatus and method
US6813628B2 (en) 1999-12-23 2004-11-02 Intel Corporation Method and apparatus for performing equality comparison in redundant form arithmetic
DE10085322B4 (de) 1999-12-23 2006-10-26 Intel Corporation, Santa Clara Schaltungsanordnung, Verfahren und Datenverarbeitungs-Einrichtung zum Durchführen einer Ein-Zyklus-Addition oder -Subtraktion und eines Vergleichs bei einer Arithmetik redundanter Form
US6826588B2 (en) 1999-12-23 2004-11-30 Intel Corporation Method and apparatus for a fast comparison in redundant form arithmetic
US6687722B1 (en) * 2000-03-16 2004-02-03 Agere Systems, Inc. High-speed/low power finite impulse response filter
EP1178397B1 (en) * 2000-08-01 2006-10-04 STMicroelectronics S.A. Carry save adders
KR100423903B1 (ko) * 2000-12-29 2004-03-24 삼성전자주식회사 고속 저전력 4-2 압축기
JP3613396B2 (ja) * 2001-06-25 2005-01-26 日本電気株式会社 機能ブロック
US7313585B2 (en) * 2003-08-30 2007-12-25 Hewlett-Packard Development Company, L.P. Multiplier circuit
US7302460B1 (en) * 2003-09-11 2007-11-27 Altera Corporation Arrangement of 3-input LUT's to implement 4:2 compressors for multiple operand arithmetic
CN1324456C (zh) * 2004-01-09 2007-07-04 上海交通大学 采用混合压缩两级流水乘加单元的数字信号处理器
CN100405288C (zh) * 2004-05-27 2008-07-23 扬智科技股份有限公司 乘法器的符号延伸方法及结构
US8234319B2 (en) * 2005-05-25 2012-07-31 Qualcomm Incorporated System and method of performing two's complement operations in a digital signal processor
US20090063609A1 (en) * 2007-06-08 2009-03-05 Honkai Tam Static 4:2 Compressor with Fast Sum and Carryout

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0295621A2 (en) * 1987-06-15 1988-12-21 Nec Corporation Fast summing circuit
US4879677A (en) * 1987-03-30 1989-11-07 Kabushiki Kaisha Toshiba Parallel adder circuit with sign bit decoder for multiplier

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4228520A (en) * 1979-05-04 1980-10-14 International Business Machines Corporation High speed multiplier using carry-save/propagate pipeline with sparse carries
JPS5856033A (ja) * 1981-09-29 1983-04-02 Fujitsu Ltd 乗算回路
JPS6068432A (ja) * 1983-09-22 1985-04-19 Hitachi Ltd キヤリセ−ブアダ−の符号生成方式
DE3524981A1 (de) * 1985-07-12 1987-01-22 Siemens Ag Anordnung mit einem saettigbaren carry-save-addierer
JPH05119969A (ja) * 1991-10-29 1993-05-18 Nec Eng Ltd 積和演算器
US5220525A (en) * 1991-11-04 1993-06-15 Motorola, Inc. Recoded iterative multiplier
US5418736A (en) * 1994-03-11 1995-05-23 Nexgen, Inc. Optimized binary adders and comparators for inputs having different widths

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4879677A (en) * 1987-03-30 1989-11-07 Kabushiki Kaisha Toshiba Parallel adder circuit with sign bit decoder for multiplier
EP0295621A2 (en) * 1987-06-15 1988-12-21 Nec Corporation Fast summing circuit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1320446C (zh) * 2004-01-09 2007-06-06 上海交通大学 基于混合压缩结构的部分积压缩树生成方法

Also Published As

Publication number Publication date
DE69710641D1 (de) 2002-04-04
EP0811908A1 (en) 1997-12-10
TW421757B (en) 2001-02-11
KR980004016A (ko) 1998-03-30
CN1176425A (zh) 1998-03-18
US5808928A (en) 1998-09-15
EP0811908B1 (en) 2002-02-27
DE69710641T2 (de) 2002-08-01

Similar Documents

Publication Publication Date Title
CN1091900C (zh) 运算处理装置
CN112434801B (zh) 一种按照比特精度进行权重拆分的卷积运算加速方法
Gokhale et al. Design of area and delay efficient Vedic multiplier using Carry Select Adder
Satish et al. Multiplier using NAND based compressors
Soderstrand CSD multipliers for FPGA DSP applications
US6151617A (en) Multiplier circuit for multiplication operation between binary and twos complement numbers
Muralidharan et al. Fast hard multiple generators for radix-8 Booth encoded modulo 2 n− 1 and modulo 2 n+ 1 multipliers
Beuchat et al. Multiplication algorithms for radix-2 RN-codings and two's complement numbers
Cheng et al. Quantum plain and carry look-ahead adders
Patronik et al. Design of residue generators with CLA/compressor trees and multi-bit EAC
Hu et al. Comparison of constant coefficient multipliers for CSD and booth recoding
Sait et al. A novel technique for fast multiplication
Priyadharshini et al. Retracted: Implementation of Distributed Arithmetic based Sum-of-Products
Frougny et al. On-line multiplication in real and complex base
Shanmukh et al. Design of 32-bit MAC unit using fast adders and vedic multiplier
Iyer et al. Generalised Algorithm for Multiplying Binary Numbers Via Vedic Mathematics
Lv et al. Efficient diminished-1 modulo 2 n+ 1 multiplier architectures
Sriharish et al. A Novel VLSI Architecture of Multiplier on Radix-4 using Redundant Binary Technique
Yung et al. Part 2: An optimising analysis of hierarchical multipliers for VLSI
Hsiao et al. Architectural Exploration of Function Computation Based on Cubic Polynomial Interpolation with Application in Deep Neural Networks
Mekhallalati et al. Radix modular multiplication algorithm
Murthy et al. Modulo 2n±1 adder/subtractors for DSP applications
SUREKHA et al. Pre Encoded Multipliers Based on Non Redundant Radix-4 Design Using Modified Wallace Scheme
JYOTHIRMAI et al. Implementation of Spanning Tree Based Add-Multiply Operator for Optimized Power Applications
ASHOK et al. Realization of Fused-Add Multiply (FAM) Operator using Optimized Booth Recoder

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee