JPH04205525A - Multiplier applying pipeline system - Google Patents
Multiplier applying pipeline systemInfo
- Publication number
- JPH04205525A JPH04205525A JP33931390A JP33931390A JPH04205525A JP H04205525 A JPH04205525 A JP H04205525A JP 33931390 A JP33931390 A JP 33931390A JP 33931390 A JP33931390 A JP 33931390A JP H04205525 A JPH04205525 A JP H04205525A
- Authority
- JP
- Japan
- Prior art keywords
- multiplier
- multiplicand
- latch
- pipeline system
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 6
- 201000006054 Mulibrey nanism Diseases 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
Abstract
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明はパイプライン方式を用いた乗算器、特に各段の
キャリー伝播のバスの改良に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a multiplier using a pipeline system, and particularly to improvement of a carry propagation bus in each stage.
[従来の技術]
第2図は、従来のパイプライン方式を用いた乗算器の一
例であって、パイプライン方式の演算ビット長4X4の
乗算器の回路図である。[Prior Art] FIG. 2 is an example of a multiplier using a conventional pipeline method, and is a circuit diagram of a multiplier with an operation bit length of 4×4 using the pipeline method.
図において、従来のパイプライン方式を用いた演算ビッ
ト長4×4の乗算器は、被乗算数Xn入力端子100〜
103と、乗算数Yn入力端子200〜203と、乗加
算器(MUL)10〜13゜20〜23.30〜33.
40〜43と、ラッチレジスタ50〜61と、乗算結果
出力端子300〜307とから構成されている。In the figure, a multiplier with an operation bit length of 4×4 using the conventional pipeline system has input terminals 100 to 100 for the multiplicand Xn.
103, multiplication number Yn input terminals 200-203, multiplication adder (MUL) 10-13°20-23.30-33.
40-43, latch registers 50-61, and multiplication result output terminals 300-307.
図から明らかなように従来のパイプライン方式を用いた
乗算器のラッチレジスタ50〜59は、乗算数の2桁目
と3桁目の間に挿入配置されており、これによって乗算
器を上下に分割している。As is clear from the figure, the latch registers 50 to 59 of the multiplier using the conventional pipeline method are inserted between the second and third digits of the multiplication number, and this allows the multiplier to move up and down. It is divided.
次に、この従来の乗算器の動作について説明する。Next, the operation of this conventional multiplier will be explained.
例えば、演算ビット長4×4の乗算(被乗算数X−11
01(13) 、乗算数Y−1011)のばあい、次の
ようにして演算が行われる。For example, multiplication with arithmetic bit length of 4×4 (multiplicand
01(13), multiplication number Y-1011), the calculation is performed as follows.
(以下余白)
×1011
として求められる。そして、上記計算式からも分かるよ
うに4桁の数の乗算結果は、2X4−8桁の値となる。(The following is a margin) It is obtained as ×1011. As can be seen from the above calculation formula, the result of multiplication of a 4-digit number is a 2×4−8-digit value.
この演算を計算機で行う場合は、上記方法をさらに分解
して、各段の部分積を求め、その結果を用いて加算演算
を行なうことにより求める。When this operation is performed by a computer, the above method is further decomposed to obtain the partial products of each stage, and the results are used to perform an addition operation.
すなわち、被乗算数Xの各桁毎に数をX3.X2、Xi
、XO(1101)とし、乗算数Yの各桁毎の数Y3.
Y2.Yl、YO(1011)とした場合、この計算は
次のようにして行われる。That is, for each digit of the multiplicand X, the number is set to X3. X2, Xi
, XO (1101), and the number Y3 . for each digit of the multiplication number Y.
Y2. When Yl, YO (1011), this calculation is performed as follows.
第1段のMULIO〜13においては、YO・Xと初期
値である0000を加算する。In the first stage MULIO-13, YO·X and the initial value 0000 are added.
lXll0I(YO・X)−1101 +ooo。lXll0I(YO・X)-1101 +oooo.
1101 ・・ 部分積1
第2段のMUL20〜23においては、Yl −Xを
左に1桁シフトしたものと部分積1を加算する。1101 . . . Partial product 1 In the second stage MULs 20 to 23, Yl −X shifted by one digit to the left and partial product 1 are added.
1xl101 (Yl−X)−1101+ 1101
100111・・・ 部分積2
第3段のMUL3o〜33においては、Y2−Xを左に
1桁シフトしたものと部分積2を加算する。1xl101 (Yl-X)-1101+ 1101 100111... Partial product 2 In the third stage MULs 3o to 33, Y2-X shifted by one digit to the left and partial product 2 are added.
1xl101 (Y2−X)−0000000C1s*
+100111
100111 ・・・ 部分積3
第4段のMUL4o〜43においては、Y3−Xを左に
1桁シフトしたものと部分積3を加算する。1xl101 (Y2-X)-0000000C1s* +100111 100111...Partial product 3 In the fourth stage MUL4o to 43, Y3-X shifted one digit to the left and partial product 3 are added.
lXll0I(Y3 ・X)−11011101**
*
+ 100111
10001111・・・解
このようにして、第2図に示す従来の乗算器によって、
4X4ビツト長のデータの乗算の解を得ることができる
。lXll0I(Y3 ・X)-11011101**
* + 100111 10001111...Solution In this way, with the conventional multiplier shown in FIG.
A solution for multiplication of 4×4 bit length data can be obtained.
そして、パイプライン方式を用いた乗算器はパイプライ
ン処理を行うために、ラッチレジスタ50〜61を有し
ており、このラッチレジスタ50〜61において、部分
積n(n−2)の結果等をラッチして、上段側と下段側
において異なるデータについての乗算演算ができるよう
にして演算速度を上げるようにしている。The multiplier using the pipeline method has latch registers 50 to 61 in order to perform pipeline processing, and in these latch registers 50 to 61, the result of partial product n(n-2), etc. The data is latched so that multiplication operations can be performed on different data on the upper and lower sides to increase the calculation speed.
すなわち、第2図においてはラッチレジスタ50〜55
が部分積2の結果をラッチしくキャリービットのラッチ
レジスタ55も含め)、ラッチレジスタ56〜59が被
乗算数Xの入力端子100〜103の入力データをラッ
チし、ラッチレジスタ60.61が乗算数Yn入力端子
202.203の入力データをラッチして、前段と後段
のMULにおいて異なるデータについての演算を可能と
している。That is, in FIG. 2, latch registers 50 to 55
latches the result of partial product 2 (including the carry bit latch register 55), latch registers 56 to 59 latch the input data of input terminals 100 to 103 of the multiplicand X, and latch registers 60 and 61 Input data at the Yn input terminals 202 and 203 is latched to enable calculations on different data in the MULs at the front and rear stages.
そして、演算時間は下位ビットにおけるキャリーが最上
位ビットにまで伝播する時間によって決まるため、この
ようなラッチレジスタを設けるパイプライン方式により
、キャリーの伝播途中において、次の演算を行うことが
可能となり、演算時間を短縮することができる。Since the calculation time is determined by the time it takes for the carry in the lower bits to propagate to the most significant bit, the pipeline method that provides such a latch register makes it possible to perform the next operation during the propagation of the carry. Computation time can be reduced.
なお、MULは第3図に示すように、アンド回路Aと加
算器(フルアダー)Bからなっており、アンド回路Aに
おいて被乗算数の1ビツトXiと乗算数の1ビツトYi
の乗算を行い、加算器Bにおいてアンド回路Aの結果、
部分積の対応ビットのデータSl及び下位側MULから
のキャリーCIの加算を行い、演算結果SO及びキャリ
ーCOを出力する。As shown in Fig. 3, the MUL consists of an AND circuit A and an adder (full adder) B, and in the AND circuit A, 1 bit Xi of the multiplicand and 1 bit Yi of the multiplier
, and in adder B, the result of AND circuit A is
The data Sl of the corresponding bits of the partial product and the carry CI from the lower MUL are added, and the operation results SO and carry CO are output.
[発明が解決しようとする課題]
しかし、従来のパイプライン方式を用いた乗算器のラッ
チレジスタは横方向に挿入され乗算器を上下に分割して
いるので、第2図の乗算器におけるキャリー伝播のワー
ストパス(最も長い経路)は、その前段においてMUL
IO〜11〜12〜13〜22〜23の6MULとなり
、1段分の演算時間としてこの6MUL分の時間かかか
ってしまう。一方、演算時間は短いはとよく、演算時間
を更に短縮したいという要望があった。[Problems to be Solved by the Invention] However, the latch registers of multipliers using the conventional pipeline method are inserted horizontally and divide the multiplier into upper and lower parts, so carry propagation in the multiplier in Figure 2 The worst path (longest path) is the MUL
There are 6 MULs of IO~11-12-13-22-23, and the calculation time for one stage is 6 MULs. On the other hand, the calculation time is desirable to be short, and there has been a desire to further reduce the calculation time.
本発明は上記課題に鑑みなされたものであり、キャリー
伝播のワーストパスを小さくできるパイプライン方式を
用いた乗算器を得ることを目的としている。The present invention has been made in view of the above problems, and an object of the present invention is to obtain a multiplier using a pipeline system that can reduce the worst path of carry propagation.
[課題を解決するための手段]
上記目的を達成するために1本発明に係るパイプライン
方式を用いた乗算器は、被乗算数の上位ビット側におけ
るラッチレジスタを下位ビット側におけるラッチレジス
タに比べ被乗算数の入力側に近い位置に配置することを
特徴とする。[Means for Solving the Problems] In order to achieve the above object, a multiplier using a pipeline system according to the present invention has a method in which a latch register on the upper bit side of the multiplicand is compared with a latch register on the lower bit side. It is characterized by being placed near the input side of the multiplicand.
[作用コ
従って、本発明のパイプライン方式を用いた乗算器によ
れば、ラッチレジスタはキャリー伝播に時間のかかる上
位ビット側において、演算回数の少ない段階で演算結果
をラッチする。これによって、上位側、下位側における
ワーストパスにおけるキャリー伝播経路を短くすること
ができ、パイプライン方式における演算時間を短縮する
ことかできる。[Operations] Therefore, according to the multiplier using the pipeline method of the present invention, the latch register latches the operation result at the stage where the number of operations is small on the upper bit side where carry propagation takes time. As a result, the carry propagation path in the worst path on the upper side and the lower side can be shortened, and the calculation time in the pipeline system can be shortened.
[実施例コ 以下1本発明の一実施例を図に基づいて説明する。[Example code] An embodiment of the present invention will be described below with reference to the drawings.
第1図は本発明のパイプライン方式を用いた乗算器の一
例であって、2段のパイプライン方式の演算ビット長4
X4の符号無し乗算器の回路図である。FIG. 1 shows an example of a multiplier using the pipeline system of the present invention, and shows an operation bit length of 4 in the two-stage pipeline system.
FIG. 2 is a circuit diagram of an unsigned multiplier of X4.
図において、本発明のパイプライン方式を用いた演算ビ
ット長4×4の乗算器は、被乗算数Xの入力端子100
〜103と、乗算数Yの入力端子200〜203と、M
ULIO〜13.20〜23.30〜33.40〜43
と、ラッチレジスタ50〜63と、乗算結果出力端子3
00〜307とから構成されている。In the figure, a multiplier with an operation bit length of 4×4 using the pipeline system of the present invention has an input terminal 100 for a multiplicand X.
~103, input terminals 200 to 203 of the multiplication number Y, and M
ULIO~13.20~23.30~33.40~43
, latch registers 50 to 63, and multiplication result output terminal 3
It consists of 00 to 307.
二こて、これらの構成要素は従来のパイプライン方式を
用いた乗算器と同様であるが、ラッチレジスタ50〜6
3の配置が従来のものと異なり、最上位被乗算数X3ビ
ット位置から最上位乗算数Y3ビット位置方向、すなわ
ち図における左上から右下への斜め方向に挿入配置され
ている。These components are similar to conventional pipelined multipliers, but with latch registers 50 to 6.
3 is different from the conventional one, and is inserted in the direction from the most significant multiplicand X3 bit position to the most significant multiplicand Y3 bit position, that is, in the diagonal direction from the upper left to the lower right in the figure.
このため、本実施例の乗算器においては、ラッチレジス
タ50〜55は部分積2の結果をラッチするのではなく
、部分積2の計算途中の値と、部分積3の計算途中の値
とをラッチすることになる。For this reason, in the multiplier of this embodiment, the latch registers 50 to 55 do not latch the result of partial product 2, but rather the value in the middle of calculation of partial product 2 and the value in the middle of calculation of partial product 3. It will latch.
このため、被乗算数Xの最上位ビットX3と、乗算数Y
の第2ビツトY1のMUL23での乗算は前段では行わ
れず、MUL30での被乗算数Xの最下位ビットXOと
、乗算数の第3ビツトY2との乗算が前段で行われる。Therefore, the most significant bit X3 of the multiplicand X and the multiplier Y
The multiplication of the second bit Y1 in the MUL 23 is not performed in the previous stage, but the multiplication of the least significant bit XO of the multiplicand X in the MUL 30 by the third bit Y2 of the multiplier is performed in the previous stage.
従って、ラッチレジスタ50〜55に部分積2の計算途
中の値がラッチされ、ラッチレジスタ56〜59に被乗
算数X入力端子100〜103の入力データがラッチさ
れ、ラッチレジスタ60にMUL13のキャリービット
がラッチされ、ラッチレジスタ61〜63に乗算数Yn
入力端子201〜203の入力データがラッチされる。Therefore, the value in the middle of calculation of partial product 2 is latched in latch registers 50 to 55, the input data of multiplicand is latched, and the multiplication number Yn is stored in the latch registers 61 to 63.
Input data at input terminals 201-203 is latched.
そして、前記ラッチレジスタにより、後段において最上
位被乗算数X3と乗算数Y3とのMUL23での乗算以
降の演算が引き続いて行われることになる。Then, the latch register causes the calculations after the multiplication of the most significant multiplicand X3 and the multiplier Y3 by the MUL 23 to be performed successively in the subsequent stage.
このため、MULの縦方向と横方向のキャリー伝播速度
とが等しいとするならば、キャリー伝播のワーストパス
は、乗算器の前段においてMUL10〜11〜12〜1
3〜22の5MULとなり、後段のパイプラインではM
UL23〜32〜41〜42〜43の5MULとなる。Therefore, if the vertical and horizontal carry propagation speeds of the MUL are equal, the worst path for carry propagation is the MUL10-11-12-1
5MUL of 3 to 22, and MUL in the latter stage pipeline
It becomes 5 MUL of UL23-32-41-42-43.
従って、従来のパイプライン方式を用いた乗算器の6M
ULに比べ、5MULと経路の短縮を計ることができる
、演算時間として、1/6−17%の演算速度の短縮を
達成することができる。Therefore, the 6M multiplier using the conventional pipeline method
Compared to UL, the route can be shortened by 5 MUL, and the calculation time can be reduced by 1/6 to 17%.
[発明の効果]
以上説明したように1本発明のパイプライン方式を用い
な乗算器によれば、各段におけるキャリー伝播のワース
トパスが最小となるように構成したので、演算速度を大
幅に向上させることかできるという効果がある。[Effects of the Invention] As explained above, according to the multiplier using the pipeline system of the present invention, the worst path of carry propagation in each stage is minimized, so the calculation speed is significantly improved. It has the effect of being able to do something.
第1図は本発明の一実施例を示すバイブライン方式を用
いた乗算器のブロック図、
第2図は従来のバイブライン方式を用いた乗算器のブロ
ック図、
第3図は乗算器に用いられるMULの構成を示すブロッ
ク図である。
10〜43 ・・・ MUL
50〜63 ・・・ ラッチレジスタFig. 1 is a block diagram of a multiplier using the Vibration system, showing an embodiment of the present invention; Fig. 2 is a block diagram of a multiplier using the conventional Vibration system; Fig. 3 is a block diagram of a multiplier using the Vibration system. FIG. 2 is a block diagram showing the configuration of MUL. 10~43...MUL 50~63...Latch register
Claims (1)
トリクス配置すると共に、その配置の内部に桁毎の中間
計算結果データをラッチするラッチレジスタを有するパ
イプライン方式を用いた乗算器であって、 被乗算数の上位ビット側におけるラッチレジスタを下位
ビット側におけるラッチレジスタに比べ被乗算数の入力
側に近い位置に配置することを特徴とするパイプライン
方式を用いた乗算器。[Scope of Claims] A pipeline in which multipliers and adders whose number corresponds to the number of digits of a multiplicand and a multiplier are arranged in a matrix, and a latch register that latches intermediate calculation result data for each digit is provided inside the arrangement. A multiplier using a pipeline method, which is characterized in that a latch register on the upper bit side of the multiplicand is placed closer to the input side of the multiplicand than a latch register on the lower bit side. Multiplier used.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33931390A JPH04205525A (en) | 1990-11-30 | 1990-11-30 | Multiplier applying pipeline system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33931390A JPH04205525A (en) | 1990-11-30 | 1990-11-30 | Multiplier applying pipeline system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04205525A true JPH04205525A (en) | 1992-07-27 |
Family
ID=18326276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33931390A Pending JPH04205525A (en) | 1990-11-30 | 1990-11-30 | Multiplier applying pipeline system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04205525A (en) |
-
1990
- 1990-11-30 JP JP33931390A patent/JPH04205525A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5506799A (en) | Booth array multiplying circuit having carry correction | |
EP0656582B1 (en) | Parallel adding and averaging circuit and method | |
JP3244506B2 (en) | Small multiplier | |
US6026421A (en) | Apparatus for multiprecision integer arithmetic | |
JPS6347874A (en) | Arithmetic unit | |
JPS635774B2 (en) | ||
JPH0477932B2 (en) | ||
US5721697A (en) | Performing tree additions via multiplication | |
US6202078B1 (en) | Arithmetic circuit using a booth algorithm | |
KR100481586B1 (en) | Apparatus for modular multiplication | |
JPH04205525A (en) | Multiplier applying pipeline system | |
US20050246406A9 (en) | Emod a fast modulus calculation for computer systems | |
JP3315042B2 (en) | Multiplier | |
JPH10198552A (en) | Multiplier | |
JPS6259828B2 (en) | ||
JP3198868B2 (en) | Multiplication processing unit | |
JP2607735B2 (en) | Multiplier partial product addition method | |
JP2812365B2 (en) | Multiplication circuit | |
JP2608090B2 (en) | High radix non-restoring divider | |
JP3522167B2 (en) | Arithmetic processing circuit and arithmetic processing method | |
JP3129524B2 (en) | Multiplication circuit on integer and multiplication method | |
JPH01255032A (en) | Arithmetic processing unit | |
JPH02178833A (en) | Adder for adding data different in bit length | |
JPH0831088B2 (en) | Multiply-accumulate operation circuit | |
JPH07160672A (en) | Sum of products operation circuit |