CN1091900C - 运算处理装置 - Google Patents
运算处理装置 Download PDFInfo
- Publication number
- CN1091900C CN1091900C CN97112942A CN97112942A CN1091900C CN 1091900 C CN1091900 C CN 1091900C CN 97112942 A CN97112942 A CN 97112942A CN 97112942 A CN97112942 A CN 97112942A CN 1091900 C CN1091900 C CN 1091900C
- Authority
- CN
- China
- Prior art keywords
- mentioned
- pending
- long
- sign bit
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
- G06F7/53—Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel
- G06F7/5318—Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel with column wise addition of partial products, e.g. using Wallace tree, Dadda counters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/499—Denomination or exception handling, e.g. rounding or overflow
- G06F7/49994—Sign extension
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
- G06F7/533—Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even
- G06F7/5334—Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even by using multiple bit scanning, i.e. by decoding groups of successive multiplier bits in order to select an appropriate precalculated multiple of the multiplicand as a partial product
- G06F7/5336—Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even by using multiple bit scanning, i.e. by decoding groups of successive multiplier bits in order to select an appropriate precalculated multiple of the multiplicand as a partial product overlapped, i.e. with successive bitgroups sharing one or more bits being recoded into signed digit representation, e.g. using the Modified Booth Algorithm
- G06F7/5338—Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even by using multiple bit scanning, i.e. by decoding groups of successive multiplier bits in order to select an appropriate precalculated multiple of the multiplicand as a partial product overlapped, i.e. with successive bitgroups sharing one or more bits being recoded into signed digit representation, e.g. using the Modified Booth Algorithm each bitgroup having two new bits, e.g. 2nd order MBA
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
- Image Processing (AREA)
Abstract
本发明目的是在并联乘法器的部分积加法运算中,减轻符号扩展所伴随的时间性损失。用把4∶2压缩器并排起来的进位保存加法器20构成用于对每一个皆是已用2的补数表示的2进数且具有互不相的权重的4个部分积P0、P1、P2和P3进行加法运算的部分积加法器。在各个4∶2压缩器中,4输入中的W输入呈现最短的传播延迟,而Y和Z输入构成关键路径。
Description
本发明涉及具有乘法功能的运算处理装置,特别是涉及乘法器。
在并行乘法器中,采用对用乘数和被乘数并行地生成的多个部分积进行加法运算的办法计算积。倘采用布斯(Booth)的算法,则可以减少部分积的个数。
若采用M.R.Santoro et al.,“SPIM:流水线64×64迭代乘法器”,IEEE Journal of Solid-State Circuit,Vol.24,No.2,pp.487-493,April1989,则可以构成2进数的4∶2压缩器可以应用于部分积的加法运算中去。多个4∶2压缩器并行起来构成的进位保存加法器被提供给部分积的加法运算,而各4∶2压缩器由2个3输入2输出全加器构成。
多个部分积具有互不相同的权重。因此,在各部分积是用2的补数表示的2进数的情况下,必须在部分积的进位保存加法运算之前进行部分积的符号扩展。在这里,考虑一个对采用2次布斯算法所生成的4个部分积P0、P1、P2和P3进行加法运算的例子。假定这4个部分积P0、P1、P2和P3分别具有20,22、24和26的权重,且每一个部分积都由9位构成。各部分积的最高位位是符号位。在本例中,必须对除去具有最大的权重的部分积(最高位部分积)P3之外的3个部分积P0、P1和P2的每一个进行符号扩展。具体地说来就是为了对具有最小的权重的部分积(第1部分积)P0进行符号扩展,把该第1部分积的符号位的值设定于从该第1部分积往上的高位的6位中。另外,为了对具有第2号小的权重的部分积(第2部分积)P1进行符号扩展,把该第2部分积的符号位的值设定于从该第2部分积的符号位往上的高位的4位中。再有,为了对具有第3号小的权重的部分积(第3部分积)P2进行符号扩展,把该第3部分积的符号位的值设定于从该第3部分积的符号位往上的高位的2位中。然后对这些符号扩展后的4个部分积P0、P1、P2和P3的每一位执行进位保存加法运算。
上述4∶2压缩器,顾名思义,是具有4个输入和2个输出的压缩器。该4个输入中的一个仅仅经过2个全加器中的一方达到该4∶2压缩器的两个输出,对此,其余的3个输入则顺次经过2个全加器达到该4∶2压缩器的两个输出。即,后者的3个输入中的不论哪一个将构成具有进位保存加法器中的最长的传播时延的关键路径(Critical path)。然而,如上所述在对除去最高位部分积之外的所有的部分积进行符号扩展的情况下,该关键路径的输入将变成为依赖于不论哪一个部分积的符号位的值,因而将产生时间性的损失(penalty)。
本发明的目的是在部分积加法中减少符号扩展所伴生的时间性损失。
为了达到上述目的,本发明的作法是,先把依据多个的符号位进行了符号扩展的特定的部分积分配给不构成进位保存加法器中的关键路径的特定的输入,然后把构成该进位保存加法器中的关键路径的输入固定到恒定值上。
具体地说来就是使本发明的运算处理装置或乘法器具备有部分积加法器,这一部分积加法器用来对每一个都是用2的补数表示的2进数而且具有互不相同的权重的多个部分积进行加法运算,且该部分积加法器具备有:进位保存加法器和逻辑电路。上述进位保存加法器具有用于对多个部分积进行进位保存计算的多个输入和至少一个输出;上述逻辑电路用于向比上述多个部分积中具有最小的权重的部分积(第1部分积)的符号位高位的多个位中设定该第1部分积的符号位的值与其他的部分积的符号位的值间的多个逻辑运算值。而且,在上述进位保存加法器中,特定的输入在与输出之间至少与一个其他的输入相比呈现出短的传播延迟,且把已用上述逻辑电路进行了符号扩展的第1部分积分配给上述特定的输入。
以下说明附图。
图1的方框图示出了本发明的乘法器的具体例子。
图2的方框图示出了图1中的部分积加法器的内部构成的一部分。
图3的方框图示出了图1中的部分积加法器的内部构成另一部分。
图4的方框图示出了图2和图3中的一个4∶2压缩器的内部构成。
图5的电路图示出了图4中的一个全加器的内部构成。
图6示出的是具有图2和图3的构成的部分积加法器的动作图。
图7示出的是图2的变形例的方框图。
图8示出的是具有图7的构成的部分积加法器的动作图。
实施例
以下,参照附图对作为本发明的一种运算处理装置的乘法器的具体例进行说明。
图1示出了本发明的乘法器的具体的构成例。图1的乘法器,为了使之计算每一个皆是已用2的补数表示的8位的2进数的被乘数U和乘数V之积M,具备有:乘数编码器10;4个部分积产生器11、12、13和14;部分积加法器15;先行进位加法器16。乘数编码器10根据2次布斯算法从乘数V中生成4个编码值E0、E1、E2和E3。4个部分积产生器11、12、13和14从被乘数V和4个编值E0、E1、E2和E3中并行地生成4个部分积P0、P1、P2和P3,上述4个部分积每一个都是已表示为2的补数的2进数而且具有互不相同的权重。这4个部分积P0、P1、P2和P3分别具有20,22,24和26的权重,且每者都由9位构成。各个部分积的最高位位是符号位。部分积加法器15对4个部分积P0、P1、P2和P3的每一位进行进位保存加法运算,并供给其相加结果(由2个2进数构成)Q。先行进位加法器16依据部分积加法器15供给的加法运算结果Q求积M。
图2和图3示出了图1中的部分积加法器15的内部构成。在图2和图3中,20是由15个4∶2压缩器200~214构成的进位保存加法器,30是用异或门电路31与或门电路32构成的逻辑电路。15个4∶2压缩器200~214中的每一个,实际上都是具有5个输入X、Y、Z、W和CI及3个输出C、S和CO的压缩器。其中CI是来自低位位的进位输入,CO是向高位位的进位输出。C是向先行进位加法器16的进位输出,S是向先行进位加法器16的和输出。4个部分积P0、P1、P2和P3已分别分配给进位保存加法器20的W输入、Z输入、Y输入和X输入。在图2中,P0s、P1s、P2s和P3s分别表示具有最小的权重的部分积(第1部分积)P0的符号位,具有第2个小的权重的部分积(第2部分积)P1的符号位,具有第3个小的权重的部分积(第3部分积)P2的符号位和具有最大的权的部分积(最高位部分积)P3的符号位。
若根据图2来看,则第1部分积P0要像下述那样地进行符号扩展。就是说,在比第1部分积的符号位P0s高1位的位(权重为29)中把第1部分积的符号位P0s的值原样不动地进行设定。在与第2部分积的符号位P1s的位置相对应的位置的第1部分积P0的位(权为210)上,用异或门电路31设定第1部分积的符号位P0s的值与第2部分积的符号位P1s的值之间的异或值A。接着,向从与比第2部分积的符号位P1s高1位的位的位置相对应的位置的第1部分积P0的位(权重为211)到与最高位部分积的符号位P3s的位置相对应的位置的第1部分积P0的位(权重为214)中,用或门电路32,设定第1部分积的符号位P0s的值与第2部分积的符号位P1s的值之间的或值B。其中,
A=P0s∧P1s
B=P0s+P1s“∧”与“+”分别表示异或与或。
另一方面,第2部分积P1的符号位(权重为210)与从该符号位往上高4位(权重为从211到214)的各值则被固定为0。此外,在比第3部分积P2的符号位高的2位(从权重为213到214)中,设定该第3部分积的符号位P2s的值。
若按照上述现有例那样分别对第1和第2部分积P0,P1进行符号扩展,则可以把对具有从210到214的权重的5位的两部分积的加法运算表示如下。
若P0s=0且P1s=0,则 00000+00000=00000
若P0s=1且P1s=0,则 11111+00000=11111
若P0s=0且P1s=1,则 00000+11111=11111
若P0s=1且P1s=1,则 11111+11111=11110即倘如上述那样用逻辑电路30来决定第1部分积P0的5位(权重从210到214)的值的话,则第2部分积P1的5位(从权重210到214)的值如上述那样可以全部固定为0。
图4示出了1个4∶2压缩器214的内部构成。4∶2压缩器214由第1和第2全加器101、102构成。该第1和第2全加器101、102是各自具有3个输入IN1、IN2和IN3及2个输出CY(进位)和SUM(和)的全加器。4∶2压缩器214的X输入、Y输入和Z输入分别分配给第1全加器101的IN1输入、IN2输入和IN3输出。4∶2压缩器214的W输入,则分配给第2全加器102的IN2输入。第1全加器101的SUM输出和来自低位位的进位输入CI,则分别供往第2全加器102的IN1输入和IN3输入。送往高位位的进位输出CO和送往先行进位加法器16的C输出和S输出分别由第1全加器101和第2全加器102供给。图2和图3中的其他的14个4∶2压缩器200~213的内部构成也和图4相同。
图5示出了第1全加器101的内部构成。该全加器101由2个异或门电路111和112,3个2输入NAND门电路113,114和115及1个3输入NAND门电路116构成。图4中的第2全加器102的内部构成也和图5相同。
若根据图4和图5来看,4∶2压缩器214的W输入仅仅经由第2全加器102,即最多经由2个门电路达到该4∶2压缩器214的C输出和S输出。X输入至多经过第1和第2全加器101、102之中的3个门电路到达C输出。另一方面。Y和Z输入分别经过第1和第2全加器101、102中的最多4个门电路达到C输出。即,可知W输入呈现最短的传播延迟,而Y和Z输入将构成进位保存加法器20中的关键路径。因此,如前所述,把第1部分积P0、第2部分积P1和第3部分积P2分别分配给W输入、Z输入和X输入。
图6概念性地示出了上述4个部分积P0、P1、P2和P3的符号扩展及分配。由于构成关键路径的Z输入的最高位5位已被固定于不依赖于任意一个部分积的符号位的值的恒定值0,故可以减轻符号扩展所伴随的时间性的损失,可以对高速乘法运算的实现作出贡献。而且第1部分积P0的异或值A及或值B在逻辑电路30中各自由1个门电路生成,而且该第1部分积P0被分配给W输入,故逻辑电路30中的传播延迟不会使部分积加法器15的传播延迟增加。
另外,也可以把4个部分积P0、P1、P2和P3分别分配给进位保存加法器20的X输入、Y输入、Z输入和W输入。在这种情况下,由于构成关键路径的Y输入的最高位5位将被固定于恒定值0,故仍然可以减轻符号扩展所伴有的时间性的损失。而且,由于具有1个门电路的那么大的量的输入延迟的第1部分积P0将被分配给X输入,故逻辑电路30中的传播延迟不会使部分积加法器15的传播延迟增加。
图7示出了图2的变形例。在这一变形例中,不仅仅是进位保存加法器20的Z输入最高位5位,Y输入最高位3位也将被固定于恒定值0。在图7中,40是由2个异或门电路41和43,2个或门电路42及44构成的逻辑电路。在4个部分积P0、P1、P2和P3被分别分配给进位保存加法器20的W输入、Z输入、Y输入和X输入这一点上与图2一样。
倘采用图7的办法,则第1部分积P0可如下述那样地进行符号扩展。就是说,把第1部分积的符号位P0s的值原封不动地设定于比第1部分积的符号位P0s高一位的位(权重为29)中去。用异或门电路41,把第1部分积的符号位P0S的值与第2部分积的符号位P1s的值的异或值A设定于与第2部分积的符号位P1s的位置相对应的位置的第1部分积P0的位(权重为210)中。用或门电路42,把第1部分积的符号位P0s的值与第2部分积的符号位P1s的值或值B设定于与比第2部分积的符号位P1s高一位的位的位置对应的位置的第1部分积P0的位(权重为211)中去。用异或门电路43,把或值B与第3部分积的符号位P2s的值的异或值G设定于与第3部分积的符号位P2s的位置相对应的位置的第1部分积P0的位(权重为212)中去。接着,用或门电路44,把或值B与第3部分积的符号位P2s的值的或值H设定于从与比第3部分积的符号位P2s高1位的位的位置相对应的位置的第1部分积P0的位(权重为213)到与最高位部分积的符号位P3s的位置对应的位置的第1部分积的位(权重为214)中去。其中,
A=P0S∧P1s
B=P0s+P1s
G=B∧P2s
H=B+P2s而“∧”和“+”分别表示异或与或。
另一方面,第2部分积P1的符号位(权重为210)与比该符号位高的4位(权重从211到214)的各值则被固定于0。第3部分积P2的符号位(权重为211)与比该符号位高的2位(权重从213到214)的各值也被固定于0。
图8概念性地示出了上述4个部分积P0、P1、P2和P3的符号扩展与分配。由于构成各关键路径的Y和Z输入这双方的高位位已被固定于不依赖于任一个部分积的符号位的值的恒定值0,故可以进一步减轻符号扩展所伴有的时间性损失,可以对高速乘法运算的实现作出贡献。而且,由于第1部分积P0的异或值A与G以及或值B与H在逻辑电路40中分别最多用2个门电路生成。且由于该第1部分积P0已被分配给W输入,故逻辑电路40中的传播延迟不会使部分积加法器15的传播延迟增加。
此外,上述各具体例虽然都是具备由多个4∶2压缩器构成的进位保存加法器的乘法器,但本发明一般说也可适用于具备有多个输入中的特定输入与至少一个其他的输入比呈现短的传播延迟的进位保存器的乘法器中去。例如,在16×16的乘法器中,就可以把本发明应用到把多个7∶3压缩器并排起来构成的进位保存加法器中的部分积的加法运算中去。另外,在乘数编码器中应当采用的算法不限于2次的布斯算法,也可以采用更高次的布斯算法。
如上所述,倘采用本发明,由于规定为把根据多个的符号位已进行了符号扩展的特定的部分积分配给不构成进位保存加法器中的关键路径的特定的输入,并把构成该进位保存加法器中的关键路径的输入固定于恒定值上,故可以减轻部分积加法运算中的符号扩展所伴随的时间性损失,可对高速乘法的实现作出贡献。
Claims (1)
1.一种用于计算本身皆为已用2的补数表示的2进数的被乘数与乘数之积的乘法器,具备:
乘数编码器(10),用于从上述乘数生成多个编码值;
多个部分积产生器(11~14),用于从上述被乘数和上述多个编值生成每个皆为已用2的补数表示的2进数且具有互不相同的权重的多个部分积;以及
部分积加法器(15),用于像求上述积那样地对上述多个部分积进行加法运算,
上述部分积加法器具有:
进位保存加法器(20),具有多个输入和至少一个输出,用于对上述多个部分积进行进位保存加法运算;以及
逻辑电路,用于为了对上述多个部分积中具有最小的权重的部分积(P0)进行扩展,把多个值设定在比上述第1部分的符号位高的多个位中,
其特征在于,上述逻辑电路具备下述功能:
把上述第1部分积(P0)的符号位(P0s)的值设定在,与从比上述第1部分积的符号位(P0s)高1位的位开始到与比上述多个部分积中具有第2小的权重的第2部分积(P1)的符号位(P1s)低1位的位为止的位置对应的、上述第1部分积的各个位的位置中,
把上述第1部分积的符号位(P0s)的值与上述第2部分积(P1)的符号位(P1s)的值的异或值(41)设定在,与上述第2部分积(P1)的符号位(P1s)的位置对应的、上述第1部分积的位的位置中,
把上述第1部分积(P0)的符号位(P0s)的值与上述第2部分积(P1)的符号位(P1s)的值的第一或值(42)设定在,与从与比上述第2部分积(P1)的符号位(P1s)高1位的位开始,到与比上述多个部分积中具有第3小的权重的第3部分积(P2)的符号位(P2s)低1位的位为止的位置对应的、上述第1部分积(P0)的各个位的位置中,
把上述第一或值(42)与上述第3部分积(P2)的符号位(P2s)的值的第二异或值(43)设定在,与上述第3部分积(P2)的符号位(P2s)对应的上述第1部分积(P0)的位的位置中,
把上述第一或值(42)与上述第3部分积(P2)的符号位(P2s)的值的第二或值(44)设定在,与从与比上述第3部分积(P2)的符号位(P2s)高1位的位开始,到与上述最高位部分积(P3)的符号位(P3s)为止的位置对应的、上述第1部分积的各个位的位置中;
而且,在上述进位保存加法器(20)中,上述多个输入之内的一特定输入与上述输出之间呈现比一个的其他输入短的传播延迟,且把已用上述逻辑电路进行符号扩展的上述第1部分积(P0)分配给上述特定的输入。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP144050/96 | 1996-06-06 | ||
JP14405096 | 1996-06-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1176425A CN1176425A (zh) | 1998-03-18 |
CN1091900C true CN1091900C (zh) | 2002-10-02 |
Family
ID=15353161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97112942A Expired - Fee Related CN1091900C (zh) | 1996-06-06 | 1997-06-05 | 运算处理装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5808928A (zh) |
EP (1) | EP0811908B1 (zh) |
KR (1) | KR980004016A (zh) |
CN (1) | CN1091900C (zh) |
DE (1) | DE69710641T2 (zh) |
TW (1) | TW421757B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1320446C (zh) * | 2004-01-09 | 2007-06-06 | 上海交通大学 | 基于混合压缩结构的部分积压缩树生成方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0158647B1 (ko) * | 1995-05-22 | 1998-12-15 | 윤종용 | 부호/무부호 수 겸용 곱셈기 |
JP3678512B2 (ja) * | 1996-08-29 | 2005-08-03 | 富士通株式会社 | 乗算回路、該乗算回路を構成する加算回路、該乗算回路の部分積ビット圧縮方法、および、該乗算回路を適用した大規模半導体集積回路 |
US6088800A (en) * | 1998-02-27 | 2000-07-11 | Mosaid Technologies, Incorporated | Encryption processor with shared memory interconnect |
US6442582B1 (en) * | 1999-06-17 | 2002-08-27 | Ati International Srl | Multiplier carry bit compression apparatus and method |
US6813628B2 (en) | 1999-12-23 | 2004-11-02 | Intel Corporation | Method and apparatus for performing equality comparison in redundant form arithmetic |
DE10085322B4 (de) | 1999-12-23 | 2006-10-26 | Intel Corporation, Santa Clara | Schaltungsanordnung, Verfahren und Datenverarbeitungs-Einrichtung zum Durchführen einer Ein-Zyklus-Addition oder -Subtraktion und eines Vergleichs bei einer Arithmetik redundanter Form |
US6826588B2 (en) | 1999-12-23 | 2004-11-30 | Intel Corporation | Method and apparatus for a fast comparison in redundant form arithmetic |
US6687722B1 (en) * | 2000-03-16 | 2004-02-03 | Agere Systems, Inc. | High-speed/low power finite impulse response filter |
EP1178397B1 (en) * | 2000-08-01 | 2006-10-04 | STMicroelectronics S.A. | Carry save adders |
KR100423903B1 (ko) * | 2000-12-29 | 2004-03-24 | 삼성전자주식회사 | 고속 저전력 4-2 압축기 |
JP3613396B2 (ja) * | 2001-06-25 | 2005-01-26 | 日本電気株式会社 | 機能ブロック |
US7313585B2 (en) * | 2003-08-30 | 2007-12-25 | Hewlett-Packard Development Company, L.P. | Multiplier circuit |
US7302460B1 (en) * | 2003-09-11 | 2007-11-27 | Altera Corporation | Arrangement of 3-input LUT's to implement 4:2 compressors for multiple operand arithmetic |
CN1324456C (zh) * | 2004-01-09 | 2007-07-04 | 上海交通大学 | 采用混合压缩两级流水乘加单元的数字信号处理器 |
CN100405288C (zh) * | 2004-05-27 | 2008-07-23 | 扬智科技股份有限公司 | 乘法器的符号延伸方法及结构 |
US8234319B2 (en) * | 2005-05-25 | 2012-07-31 | Qualcomm Incorporated | System and method of performing two's complement operations in a digital signal processor |
US20090063609A1 (en) * | 2007-06-08 | 2009-03-05 | Honkai Tam | Static 4:2 Compressor with Fast Sum and Carryout |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0295621A2 (en) * | 1987-06-15 | 1988-12-21 | Nec Corporation | Fast summing circuit |
US4879677A (en) * | 1987-03-30 | 1989-11-07 | Kabushiki Kaisha Toshiba | Parallel adder circuit with sign bit decoder for multiplier |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4228520A (en) * | 1979-05-04 | 1980-10-14 | International Business Machines Corporation | High speed multiplier using carry-save/propagate pipeline with sparse carries |
JPS5856033A (ja) * | 1981-09-29 | 1983-04-02 | Fujitsu Ltd | 乗算回路 |
JPS6068432A (ja) * | 1983-09-22 | 1985-04-19 | Hitachi Ltd | キヤリセ−ブアダ−の符号生成方式 |
DE3524981A1 (de) * | 1985-07-12 | 1987-01-22 | Siemens Ag | Anordnung mit einem saettigbaren carry-save-addierer |
JPH05119969A (ja) * | 1991-10-29 | 1993-05-18 | Nec Eng Ltd | 積和演算器 |
US5220525A (en) * | 1991-11-04 | 1993-06-15 | Motorola, Inc. | Recoded iterative multiplier |
US5418736A (en) * | 1994-03-11 | 1995-05-23 | Nexgen, Inc. | Optimized binary adders and comparators for inputs having different widths |
-
1997
- 1997-05-17 TW TW086106616A patent/TW421757B/zh not_active IP Right Cessation
- 1997-06-05 KR KR1019970023271A patent/KR980004016A/ko not_active Application Discontinuation
- 1997-06-05 CN CN97112942A patent/CN1091900C/zh not_active Expired - Fee Related
- 1997-06-05 US US08/866,251 patent/US5808928A/en not_active Expired - Fee Related
- 1997-06-06 EP EP97109243A patent/EP0811908B1/en not_active Expired - Lifetime
- 1997-06-06 DE DE69710641T patent/DE69710641T2/de not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4879677A (en) * | 1987-03-30 | 1989-11-07 | Kabushiki Kaisha Toshiba | Parallel adder circuit with sign bit decoder for multiplier |
EP0295621A2 (en) * | 1987-06-15 | 1988-12-21 | Nec Corporation | Fast summing circuit |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1320446C (zh) * | 2004-01-09 | 2007-06-06 | 上海交通大学 | 基于混合压缩结构的部分积压缩树生成方法 |
Also Published As
Publication number | Publication date |
---|---|
DE69710641D1 (de) | 2002-04-04 |
EP0811908A1 (en) | 1997-12-10 |
TW421757B (en) | 2001-02-11 |
KR980004016A (ko) | 1998-03-30 |
CN1176425A (zh) | 1998-03-18 |
US5808928A (en) | 1998-09-15 |
EP0811908B1 (en) | 2002-02-27 |
DE69710641T2 (de) | 2002-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1091900C (zh) | 运算处理装置 | |
CN112434801B (zh) | 一种按照比特精度进行权重拆分的卷积运算加速方法 | |
Gokhale et al. | Design of area and delay efficient Vedic multiplier using Carry Select Adder | |
Satish et al. | Multiplier using NAND based compressors | |
Soderstrand | CSD multipliers for FPGA DSP applications | |
US6151617A (en) | Multiplier circuit for multiplication operation between binary and twos complement numbers | |
Muralidharan et al. | Fast hard multiple generators for radix-8 Booth encoded modulo 2 n− 1 and modulo 2 n+ 1 multipliers | |
Beuchat et al. | Multiplication algorithms for radix-2 RN-codings and two's complement numbers | |
Cheng et al. | Quantum plain and carry look-ahead adders | |
Patronik et al. | Design of residue generators with CLA/compressor trees and multi-bit EAC | |
Hu et al. | Comparison of constant coefficient multipliers for CSD and booth recoding | |
Sait et al. | A novel technique for fast multiplication | |
Priyadharshini et al. | Retracted: Implementation of Distributed Arithmetic based Sum-of-Products | |
Frougny et al. | On-line multiplication in real and complex base | |
Shanmukh et al. | Design of 32-bit MAC unit using fast adders and vedic multiplier | |
Iyer et al. | Generalised Algorithm for Multiplying Binary Numbers Via Vedic Mathematics | |
Lv et al. | Efficient diminished-1 modulo 2 n+ 1 multiplier architectures | |
Sriharish et al. | A Novel VLSI Architecture of Multiplier on Radix-4 using Redundant Binary Technique | |
Yung et al. | Part 2: An optimising analysis of hierarchical multipliers for VLSI | |
Hsiao et al. | Architectural Exploration of Function Computation Based on Cubic Polynomial Interpolation with Application in Deep Neural Networks | |
Mekhallalati et al. | Radix modular multiplication algorithm | |
Murthy et al. | Modulo 2n±1 adder/subtractors for DSP applications | |
SUREKHA et al. | Pre Encoded Multipliers Based on Non Redundant Radix-4 Design Using Modified Wallace Scheme | |
JYOTHIRMAI et al. | Implementation of Spanning Tree Based Add-Multiply Operator for Optimized Power Applications | |
ASHOK et al. | Realization of Fused-Add Multiply (FAM) Operator using Optimized Booth Recoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |