JPH06282418A - Arithmetic unit - Google Patents

Arithmetic unit

Info

Publication number
JPH06282418A
JPH06282418A JP5071326A JP7132693A JPH06282418A JP H06282418 A JPH06282418 A JP H06282418A JP 5071326 A JP5071326 A JP 5071326A JP 7132693 A JP7132693 A JP 7132693A JP H06282418 A JPH06282418 A JP H06282418A
Authority
JP
Japan
Prior art keywords
multiplier
input
output
inputs
selector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5071326A
Other languages
Japanese (ja)
Inventor
Yoshinori Miki
義則 三木
Toshio Miki
俊雄 三木
Tomoyuki Oya
智之 大矢
Yukihiko Okumura
幸彦 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Mobile Communications Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Mobile Communications Networks Inc filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5071326A priority Critical patent/JPH06282418A/en
Publication of JPH06282418A publication Critical patent/JPH06282418A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To use the output result of a multiplier as an input to the multiplier immediately in a next machine cycle. CONSTITUTION:In the arithmetic unit which performs data transfer, multiplication, and ALU arithmetic by a pipeline system by cascading the multiplier 1 having two input and output latches 4 and a data ALU circuit 5 having two inputs, the output latch 4 of the multiplier 1 is connected to a selector 7 for one input of the data ALU circuit 5 and also connected to selectors 2 and 3 for two inputs of the multiplier 1, and a register file 8 and the output latch 4 of the multiplier 1 can be selected as the input to the multiplier 1. Then when continuous arithmetic processing for a three-term product, a four-term product, a five-term product, etc., is performed, the output of the output latch 4 can be supplied directly to the input of the multiplier 1 through the selectors 2 and 3 and the number of execution steps can greatly be decreased.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、一般には、電気信号の
処理を行うプロセッサに関し、特に音声の符号化、画像
の符号化等、ディジタル信号処理を行うプロセッサ、即
ちディジタルシグナルプロセッサ(以下、DSPと称
す)に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention generally relates to a processor for processing electric signals, and more particularly to a processor for digital signal processing such as audio coding and image coding, that is, a digital signal processor (hereinafter referred to as DSP). It refers to)).

【0002】[0002]

【従来の技術】音声や画像の符号化、フィルタリングを
始めとして、ディジタル信号処理における主な(最も出
現回数の多い)処理は積和演算である。従来のDSPの
演算回路の中心部の典型的な構成例を図3に示す。この
例は、データバスを2本持ち、メモリ10とレジスタフ
ァイル8間で同時に2つのデータの転送が可能であるよ
うに構成されたものである。図示するように、積和演算
を高速に行うために、2つの入力を備えたデータALU
回路(OMPY)5の他に、2つの入力と出力ラッチ4
を備えた専用の乗算器(OMLT)1を持ち、乗算器1
とALU回路5を縦列接続して、データ転送、乗算及び
ALU演算をパイプライン方式で実行する構成が採られ
ている。
2. Description of the Related Art The main (most frequently appearing) processing in digital signal processing, including coding and filtering of voice and images, is a sum of products operation. FIG. 3 shows a typical configuration example of the central part of a conventional DSP arithmetic circuit. In this example, two data buses are provided, and two data can be transferred between the memory 10 and the register file 8 at the same time. As shown in the figure, a data ALU having two inputs in order to perform the multiply-accumulate operation at high speed.
Besides the circuit (OMPY) 5, two input and output latches 4
Has a dedicated multiplier (OMLT) 1 equipped with
And ALU circuits 5 are connected in cascade to perform data transfer, multiplication, and ALU operation by a pipeline method.

【0003】データALU回路5の2つの入力はセレク
タ6及び7をそれぞれ有しており、その出力はレジスタ
ファイル8に送られる。また、乗算器1の2つの入力も
セレクタ2及び3をそれぞれ有している。乗算器1の出
力ラッチ4からの出力はセレクタ7を介してデータAL
U回路5の一方の入力に送られる。図3に示す構成にお
いて、メモリ10に格納されたxn及びyn(n=1、2、
3、・・・、n)に対して、積和演算x1×y1+x2×y2
+・・・xN×yNを実行し、結果をメモリ10に返す
処理を行うための手順は次のようになる。ただし、一行
は1ステップに相当する。
The two inputs of the data ALU circuit 5 have selectors 6 and 7, respectively, the output of which is sent to the register file 8. The two inputs of the multiplier 1 also have selectors 2 and 3, respectively. The output from the output latch 4 of the multiplier 1 is sent to the data AL via the selector 7.
It is sent to one input of the U circuit 5. In the configuration shown in FIG. 3, xn and yn (n = 1, 2,
3 ..., n), the sum of products operation x1 × y1 + x2 × y2
The procedure for executing + ... xN × yN and returning the result to the memory 10 is as follows. However, one line corresponds to one step.

【0004】 R1=x1;R2=y1; (1.1) OMLT=R1×R2;R1=x2;R2=y2; (1.2) n=3、・・・、N に対して、次の1ステップを繰り返す。 R3=R3+OMPY;OMLT=R1×R2;R1=xn;R2=yn; (1.3) R3=R3+OMPY;OMLT=R1×R2; (1.4) R3=R3+OMPY; (1.5) R3→MEM; (1.6) 即ち、(N+3)ステップ必要である。R1 = x1; R2 = y1; (1.1) OMLT = R1 × R2; R1 = x2; R2 = y2; (1.2) For n = 3, ..., N, Repeat one step. R3 = R3 + OMPY; OMLT = R1 × R2; R1 = xn; R2 = yn; (1.3) R3 = R3 + OMPY; OMLT = R1 × R2; (1.4) R3 = R3 + OMPY; (1.5) R3 → MEM (1.6) That is, (N + 3) steps are required.

【0005】ここで、=はレジスタファイル8のレジス
タR1、R2、・・・への値の転送を、×は乗算器によ
る演算を、また、→はレジスタ内にある演算結果のメモ
リ(MEM)10への転送をそれぞれ意味する。上記の
(1.3)式において、レジスタR3にはx(n−2)
×y(n−2)の結果が加算され、同時にx(n−1)
×y(n−1)の乗算が実行され、さらに同時に、xn
及びynがメモリ10から転送されている。これがDS
P上の積和演算におけるパイプライン処理の流れであ
る。
Here, = indicates the transfer of values to the registers R1, R2, ... Of the register file 8, × indicates the operation by the multiplier, and → indicates the memory (MEM) of the operation result in the register. Each means transfer to 10. In the above equation (1.3), x (n-2) is stored in the register R3.
The result of xy (n-2) is added, and at the same time x (n-1)
Xy (n-1) multiplication is performed, and at the same time, xn
And yn have been transferred from the memory 10. This is DS
It is a flow of pipeline processing in the product-sum operation on P.

【0006】上記の積和演算x1×y1+x2×y2+
・・・xN×yNの処理において、乗算はN回出現して
いるから、ステップ数がNオーダーで済んでいるという
ことは、処理の初めと終わりのオーバーヘッドを除い
て、乗算器1は常に動作しており、無駄なく処理が行わ
れていることを意味する。上述の説明で明白なように、
図3に示す従来のDSPの回路構成においては、パイプ
ライン方式により積和演算を高速に処理することができ
る。
The above product-sum operation x1 × y1 + x2 × y2 +
... In the processing of xN × yN, since the multiplication occurs N times, it means that the number of steps is N order, so that the multiplier 1 always operates except the overhead at the beginning and end of the processing. It means that the processing is being performed without waste. As is clear from the above description,
In the circuit configuration of the conventional DSP shown in FIG. 3, the product-sum operation can be processed at high speed by the pipeline method.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、音声や
画像の符号化においては、積和演算のみならず三項積、
四項積のように、ALU回路を用いずに乗算器を連続的
に用いるような演算も数多く出現する。このような演算
実行時には、上記図3に示したような従来の構成は必ず
しも有効ではない。何故ならば、乗算器の出力ラッチか
ら乗算器の入力に直接接続されていないため、次のマシ
ンサイクルで直ちに乗算結果を乗算対象として用いるこ
とができず、レジスタ間の転送のみのマシンサイクルが
不可避であるからである。
However, not only the product-sum operation but also the ternary product,
Many operations such as the quaternary product that continuously use the multiplier without using the ALU circuit also appear. The conventional configuration as shown in FIG. 3 is not always effective when performing such an operation. Because the output latch of the multiplier is not directly connected to the input of the multiplier, the multiplication result cannot be immediately used as the multiplication target in the next machine cycle, and the machine cycle of transfer only between registers is inevitable. Because it is.

【0008】この点について上記図3に示した構成のD
SPの場合を例にとって説明する。メモリに格納された
xn、yn、及びzn(n=1、2、3、・・・、n)の三項積を
N個連続的に計算し、結果をメモリに返す演算を行うた
めには、次のような手順を必要とする。ただし、一行は
1ステップに相当する。 R1=x1;R2=y1; (2.1) OMLT=R1×R2;R2=z1; (2.2) R1←OMLT (2.3) n=1、2、3、・・・、N-1 に対して、次の3ステップを繰り返
す。
With respect to this point, D of the configuration shown in FIG.
The case of SP will be described as an example. In order to perform an operation in which N ternary products of xn, yn, and zn (n = 1, 2, 3, ..., N) stored in the memory are continuously calculated and the result is returned to the memory, , Requires the following steps: However, one line corresponds to one step. R1 = x1; R2 = y1; (2.1) OMLT = R1 × R2; R2 = z1; (2.2) R1 ← OMLT (2.3) n = 1, 2, 3, ..., N- Repeat the following 3 steps for 1.

【0009】 OMLT=R1×R2;R1=x(n+1);R2=y(n+1) (2.4) R1←OMLT;OMLT=R1×R2;R2=z(n+1) (2.5) R1→ MEM;R1←OMLT (2.6) OMLT=R1×R2; (2.7) R1←OMLT; (2.8) R1→MEM; (2.9) 即ち、(3N+3)ステップ必要である。OMLT = R1 × R2; R1 = x (n + 1); R2 = y (n + 1) (2.4) R1 ← OMLT; OMLT = R1 × R2; R2 = z (n + 1) (2.5) R1 → MEM; R1 ← OMLT (2.6) OMLT = R1 × R2; (2.7) R1 ← OMLT; (2.8) R1 → MEM; (2.9) That is, (3N + 3) steps are required.

【0010】ここで、=はレジスタへの値の転送を、←
はデータALU経由でのレジスタへの値の転送を、×は
乗算器による演算を、また、→はレジスタ内にある演算
結果のメモリへの転送をそれぞれ意味する。この例で
は、乗算は2N回出現しているので、無駄なく処理が実
行できれば2Nオーダーのステップ数で済む筈である。
ところが、乗算器を使用できずにデータの転送だけを行
っているステップがN+2ステップ現れているために、
3Nオーダーのステップ数が必要となっている。
Here, = indicates the transfer of the value to the register, ←
Means transfer of a value to the register via the data ALU, × means operation by the multiplier, and → means transfer of the operation result in the register to the memory. In this example, since the multiplication occurs 2N times, if the processing can be executed without waste, the number of steps on the order of 2N should be sufficient.
However, since N + 2 steps appear in which only the data is transferred without using the multiplier,
A step count of 3N order is required.

【0011】以上のように、従来のDSPにおいては、
連続したデータの三項積のように、ALU回路を用いず
に乗算器のみを連続的に用いる演算実行時において、乗
算器を使用できないステップ、即ちデータの転送のみの
ステップが生じるため、ステップ数の増加を招き、従っ
て、プロセッサ全体における演算効率が悪くなるという
問題があった。
As described above, in the conventional DSP,
When performing an arithmetic operation that continuously uses only a multiplier without using an ALU circuit, such as a ternary product of continuous data, a step in which the multiplier cannot be used, that is, a step only in which data is transferred occurs. Therefore, there is a problem that the calculation efficiency of the entire processor is deteriorated.

【0012】[0012]

【課題を解決するための手段】本発明は、上記の問題点
を解決するために、DSPのように乗算器とALU回路
を縦列接続し、パイプライン方式に基づいて高速演算処
理を行う演算装置において、乗算器の出力をこの乗算器
の入力に直接入力可能な経路を設け、乗算器の出力結果
を次のマシンサイクルで直ちに乗算器への入力とするこ
とができるように構成したものである。
SUMMARY OF THE INVENTION In order to solve the above problems, the present invention is an arithmetic unit for performing high-speed arithmetic processing based on a pipeline system by connecting multipliers and ALU circuits in cascade like a DSP. In the above, a path is provided in which the output of the multiplier can be directly input to the input of this multiplier, and the output result of the multiplier can be immediately input to the multiplier in the next machine cycle. .

【0013】[0013]

【作用】本発明を適用することにより、三項積、四項積
などのように、ALU回路を用いずに乗算器のみを連続
的に用いるような演算実行時に、乗算器の出力を次のマ
シンサイクルで直ちに乗算器入力として用いることがで
きるので、データ転送のみのステップが出現することが
なくなり、ステップ数の増加を抑えることができる。よ
って、特に三項積、四項積などの演算実行時に、プロセ
ッサ全体の処理能力を著しく向上させることができる。
By applying the present invention, the output of the multiplier can be changed to the following when performing an operation such as a triplet product or a quadratic product that continuously uses only the multiplier without using the ALU circuit. Since it can be used as a multiplier input immediately in a machine cycle, a step only for data transfer does not appear and an increase in the number of steps can be suppressed. Therefore, it is possible to remarkably improve the processing capability of the entire processor, especially at the time of executing an operation such as a product of three terms and a product of four.

【0014】[0014]

【実施例】以下、本発明の実施例について図面を参照し
て詳細に説明する。図1は本発明による演算装置の第1
の実施例を示す回路構成図であり、上記図3に示したD
SPと同様にデータバスを2本持ち、メモリ10とレジ
スタファイル8間で同時に2つのデータを転送すること
ができるDSPに本発明を適用した場合を示す。従っ
て、図3と対応する構成要素、素子等には同一符号を付
して必要のない限りそれらの説明を省略する。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 shows a first arithmetic device according to the present invention.
FIG. 4 is a circuit configuration diagram showing an embodiment of FIG.
Similar to the SP, the present invention is applied to a DSP having two data buses and capable of simultaneously transferring two data between the memory 10 and the register file 8. Therefore, the same reference numerals are given to the components and elements corresponding to those in FIG. 3, and the description thereof will be omitted unless necessary.

【0015】本実施例においては、乗算器1の出力ラッ
チ4をデータALU回路5の一方の入力のセレクタ7に
接続すると同時にこの乗算器1の2つの入力のセレクタ
2、3に直接接続し、出力ラッチ4の出力をセレクタ
2、3を介して乗算器1の2つの入力に直接供給するこ
とを可能にし、乗算器1の出力結果を次のマシンサイク
ルで直ちに乗算器1への入力とすることができるように
したものである。
In this embodiment, the output latch 4 of the multiplier 1 is connected to the selector 7 of one input of the data ALU circuit 5 and at the same time directly connected to the selectors 2 and 3 of the two inputs of the multiplier 1. It enables the output of the output latch 4 to be directly supplied to the two inputs of the multiplier 1 through the selectors 2 and 3, and the output result of the multiplier 1 is immediately input to the multiplier 1 in the next machine cycle. It was made possible.

【0016】即ち、乗算器1の出力ラッチ4からこの乗
算器1の2つの入力に至る経路をそれぞれ設け、乗算器
1の入力としてレジスタファイル8と出力ラッチ4とが
選択できるようにしたものである。図1に示す本実施例
の構成の場合、メモリに格納されたxn、yn、及びz
n(n=1、2、3、・・・、N )の三項積をN個連続的に計算
し、結果をメモリに返す演算を行うためには、次のよう
な手順を必要とする。ただし、一行は1ステップに相当
する。
That is, the paths from the output latch 4 of the multiplier 1 to the two inputs of the multiplier 1 are respectively provided so that the register file 8 and the output latch 4 can be selected as the inputs of the multiplier 1. is there. In the case of the configuration of this embodiment shown in FIG. 1, xn, yn, and z stored in the memory
The following procedure is required in order to perform N arithmetic operations of N ternary products of n (n = 1, 2, 3, ..., N) and return the result to the memory. . However, one line corresponds to one step.

【0017】 R1=x1;R2=y1; (3.1) OMLT=R1×R2;R2=z1; (3.2) OMLT=OMLT×R2;R1=x2;R2=y2; (3.3) n=2、3、・・・、N に対して、次の2ステップを繰り返す。 R1=OMLT;OMLT=R1×R2;R2=zn; (3.4) R1→ MEM;OMLT=OMLT×R2;R1=x(n+1);R2=y(n+1) (3.5) 即ち、(2N+1)ステップで済むことになる。これは
従来の構成に比べて項数N以上のステップ数の削減とな
っている。
R1 = x1; R2 = y1; (3.1) OMLT = R1 × R2; R2 = z1; (3.2) OMLT = OMLT × R2; R1 = x2; R2 = y2; (3.3) The following two steps are repeated for n = 2, 3, ..., N. R1 = OMLT; OMLT = R1 × R2; R2 = zn; (3.4) R1 → MEM; OMLT = OMLT × R2; R1 = x (n + 1); R2 = y (n + 1) (3.5 ) That is, (2N + 1) steps will suffice. This is a reduction in the number of steps of N or more as compared with the conventional configuration.

【0018】かくして、本実施例によれば、三項積、四
項積などのように、ALU回路5を用いずに乗算器1の
みを連続的に用いるような演算実行時に、乗算器1の出
力を次のマシンサイクルで直ちにこの乗算器1の入力と
して用いることができるので、データ転送のみのステッ
プが出現することがなくなり、ステップ数の増加を抑え
ることができる。よって、プロセッサ全体の処理能力を
著しく向上させることができる。
Thus, according to this embodiment, the multiplier 1 of the multiplier 1 is used at the time of executing an operation such as the triplet product or the quartet product which continuously uses only the multiplier 1 without using the ALU circuit 5. Since the output can be immediately used as the input of the multiplier 1 in the next machine cycle, the step of only data transfer does not appear, and the increase in the number of steps can be suppressed. Therefore, the processing capability of the entire processor can be significantly improved.

【0019】次に、本発明の第2の実施例について図2
を参照して説明する。上記第1の実施例では乗算器1の
出力ラッチ4を乗算器1の2つの入力のセレクタ2、3
に直接接続して乗算器1の出力ラッチ4からこの乗算器
1の入力への経路を設けたが、本実施例では図2に示す
ように、乗算器1の出力をレジスタファイル8に直接接
続してレジスタファイル8に乗算器1の出力をラッチす
る機能を持たせ、乗算器1の出力をセレクタ2、3を介
して乗算器1の2つの入力に直接供給することができる
ようにしたものである。
Next, a second embodiment of the present invention will be described with reference to FIG.
Will be described with reference to. In the first embodiment, the output latch 4 of the multiplier 1 is replaced by the selectors 2 and 3 of the two inputs of the multiplier 1.
Although a path from the output latch 4 of the multiplier 1 to the input of the multiplier 1 is provided by directly connecting to, the output of the multiplier 1 is directly connected to the register file 8 in this embodiment as shown in FIG. Then, the register file 8 has a function of latching the output of the multiplier 1 so that the output of the multiplier 1 can be directly supplied to the two inputs of the multiplier 1 through the selectors 2 and 3. Is.

【0020】即ち、本実施例では乗算器1の出力をレジ
スタファイル8に直接供給することによって乗算器1に
出力ラッチを備える必要をなくし、かつ乗算器1の出力
結果を次のマシンサイクルで直ちに乗算器1への入力と
することができるように構成したものである。図2に示
す本実施例の構成の場合、メモリに格納されたxn、y
n、及びzn(n=1、2、3、・・・、N )の三項積をN個連続
的に計算し、結果をメモリに返す演算を行うためには、
次のような手順を必要とする。ただし、一行は1ステッ
プに相当する。
That is, in this embodiment, the output of the multiplier 1 is directly supplied to the register file 8 so that it is not necessary to provide the multiplier 1 with an output latch, and the output result of the multiplier 1 is immediately output in the next machine cycle. It is configured so that it can be used as an input to the multiplier 1. In the case of the configuration of this embodiment shown in FIG. 2, xn, y stored in the memory
In order to perform N operations of n and zn (n = 1, 2, 3, ..., N) consecutively and return the result to the memory,
The following steps are required. However, one line corresponds to one step.

【0021】 R1=x1;R2=y1; (4.1) OMLT=R1×R2;R2=z1; (4.2) n=2、3、・・・、N に対して、次の2ステップを繰り返す。 OMLT→ MEM;OMLT=R1×R2;R2=zn; (4.3) OMLT=OMLT×R2;R1=x(n+1);R2=y(n+1); (4.4) 即ち、2Nステップで済むことになる。R1 = x1; R2 = y1; (4.1) OMLT = R1 × R2; R2 = z1; (4.2) For n = 2, 3, ..., N, the following two steps are performed. repeat. OMLT → MEM; OMLT = R1 × R2; R2 = zn; (4.3) OMLT = OMLT × R2; R1 = x (n + 1); R2 = y (n + 1); (4.4) 2N steps will suffice.

【0022】かくして、本実施例においても、三項積、
四項積などのように、ALU回路5を用いずに乗算器1
のみを連続的に用いるような演算実行時に、乗算器1の
出力を次のマシンサイクルで直ちにこの乗算器1の入力
として用いることができるので、データ転送のみのステ
ップが出現することがなくなり、実行ステップ数を大幅
に削減することができる。よって、プロセッサ全体の処
理能力を著しく向上させることができる。
Thus, also in this embodiment, the product of three terms,
Multiplier 1 without using ALU circuit 5 such as quadratic product
When performing an arithmetic operation in which only one is continuously used, the output of the multiplier 1 can be immediately used as the input of the multiplier 1 in the next machine cycle, so that the step of only data transfer does not appear and the operation is executed. The number of steps can be significantly reduced. Therefore, the processing capability of the entire processor can be significantly improved.

【0023】なお、上記各実施例においては三項積を連
続的に演算する場合について説明したが、三項積に限ら
ず四項積、五項積等の多項積を連続的に演算する場合に
も本発明が適用でき、同様の作用効果が得られることは
言うまでもない。また、データバスを時分割で利用する
構成の装置にも本発明が適用できるし、さらに乗算器の
出力ラッチとデータALU回路への入力との間に、シフ
タが挿入された構成の装置にも本発明が適用できること
は勿論である。その他、必要に応じて種々の変形及び変
更がなし得ることは言うまでもない。
In each of the above embodiments, the case where the ternary product is continuously calculated has been described, but the case where not only the ternary product but also the quadratic product, the quintic product, and the like is continuously calculated. It is needless to say that the present invention can be applied to and the same operational effect can be obtained. Further, the present invention can be applied to a device configured to use the data bus in a time division manner, and further to a device configured to insert a shifter between the output latch of the multiplier and the input to the data ALU circuit. Of course, the present invention can be applied. In addition, it goes without saying that various modifications and changes can be made as necessary.

【0024】[0024]

【発明の効果】以上述べたように、本発明によれば、D
SPのように乗算器とALU回路を縦列接続し、パイプ
ライン方式に基づいて高速演算処理を行う演算装置にお
いて、乗算器の出力をこの乗算器の入力に直接入力可能
な経路を設けたので、乗算器の出力結果を次のマシンサ
イクルで直ちに乗算器への入力とすることができる。こ
のため、乗算器のみを連続的に用いるような演算処理に
おいて、データ転送のみのステップの出現をなくすこと
ができるので、実行ステップ数を大幅に削減することが
可能となり、プロセッサ全体の処理能力を著しく向上さ
せることができるという効果があり、特に、三項積、四
項積、・・・の連続演算処理においその効果は顕著であ
る。
As described above, according to the present invention, D
Since a multiplier and an ALU circuit are connected in cascade like SP and an arithmetic device for performing high-speed arithmetic processing based on a pipeline system is provided with a path capable of directly inputting the output of the multiplier to the input of this multiplier, The output result of the multiplier can be immediately input to the multiplier in the next machine cycle. Therefore, in the arithmetic processing in which only the multiplier is continuously used, the step of only data transfer can be eliminated, so that the number of execution steps can be significantly reduced and the processing capacity of the entire processor can be reduced. There is an effect that it can be remarkably improved, and the effect is particularly remarkable in the continuous arithmetic processing of the ternary product, the quaternary product, ....

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明による演算装置の第1の実施例を示す回
路構成図である。
FIG. 1 is a circuit configuration diagram showing a first embodiment of an arithmetic unit according to the present invention.

【図2】本発明による演算装置の第1の実施例を示す回
路構成図である。
FIG. 2 is a circuit configuration diagram showing a first embodiment of the arithmetic unit according to the present invention.

【図3】従来の演算装置の一例を示す回路構成図であ
る。
FIG. 3 is a circuit configuration diagram showing an example of a conventional arithmetic device.

フロントページの続き (72)発明者 奥村 幸彦 東京都港区虎ノ門二丁目10番1号 エヌ・ ティ・ティ移動通信網株式会社内Front Page Continuation (72) Inventor Yukihiko Okumura 2-10-1 Toranomon, Minato-ku, Tokyo NTT Mobile Communication Network Co., Ltd.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 2つの入力を持ち、それぞれの入力にセ
レクタを有するとともに、出力ラッチを有する乗算器
と、2つの入力を持ち、それぞれの入力にセレクタを有
するALU回路と、複数のレジスタを有するとともに、
データバスとの入出力インターフェースを有し、かつ前
記ALU回路の出力を入力とし、任意のレジスタの値を
前記乗算器及び前記ALU回路のセレクタをそれぞれ介
してこれら乗算器及びALU回路の入力として与えるこ
とができるレジスタファイルとを具備する演算装置にお
いて、 前記乗算器の出力ラッチから前記乗算器の各セレクタに
至る経路を設け、前記乗算器の入力として前記レジスタ
ファイルと前記乗算器の出力ラッチとが選択できるよう
にしたことを特徴とする演算装置。
1. A multiplier having two inputs, each input having a selector and having an output latch, an ALU circuit having two inputs and having a selector at each input, and a plurality of registers. With
It has an input / output interface with a data bus, receives the output of the ALU circuit as an input, and gives the value of an arbitrary register as the input of the multiplier and the ALU circuit via the multiplier and the selector of the ALU circuit, respectively. And a register file capable of storing the register file, and a path from the output latch of the multiplier to each selector of the multiplier is provided, and the register file and the output latch of the multiplier serve as inputs of the multiplier. An arithmetic unit characterized by being selectable.
【請求項2】 2つの入力を持ち、それぞれの入力にセ
レクタを有する乗算器と、2つの入力を持ち、それぞれ
の入力にセレクタを有するALU回路と、複数のレジス
タを有するとともに、データバスとの入出力インターフ
ェースを有し、かつ前記ALU回路の出力を入力とし、
任意のレジスタの値を前記乗算器及び前記ALU回路の
セレクタをそれぞれ介してこれら乗算器及びALU回路
の入力として与えることができるレジスタファイルとを
具備する演算装置において、 前記乗算器から前記レジスタファイルに至る経路を設け
て前記レジスタファイルに前記乗算器の出力をラッチす
る機能を持たせ、前記乗算器の入力として前記レジスタ
ファイルにラッチされた前記乗算器の出力を選択するこ
とができるようにしたことを特徴とする演算装置。
2. A multiplier having two inputs, each input having a selector, an ALU circuit having two inputs and each input having a selector, a plurality of registers, and a data bus. It has an input / output interface and receives the output of the ALU circuit as an input,
An arithmetic unit comprising: a register file capable of giving a value of an arbitrary register as an input to the multiplier and the ALU circuit via a selector of the multiplier and the ALU circuit, respectively. A path is provided to allow the register file to have a function of latching the output of the multiplier, and the output of the multiplier latched in the register file can be selected as an input of the multiplier. An arithmetic unit characterized by.
JP5071326A 1993-03-30 1993-03-30 Arithmetic unit Pending JPH06282418A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5071326A JPH06282418A (en) 1993-03-30 1993-03-30 Arithmetic unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5071326A JPH06282418A (en) 1993-03-30 1993-03-30 Arithmetic unit

Publications (1)

Publication Number Publication Date
JPH06282418A true JPH06282418A (en) 1994-10-07

Family

ID=13457324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5071326A Pending JPH06282418A (en) 1993-03-30 1993-03-30 Arithmetic unit

Country Status (1)

Country Link
JP (1) JPH06282418A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100446564B1 (en) * 1994-12-22 2004-11-03 모토로라 인코포레이티드 Data processing system and how to run calculations on it

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6148037A (en) * 1984-08-13 1986-03-08 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション Floating-point arithmetic unit

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6148037A (en) * 1984-08-13 1986-03-08 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション Floating-point arithmetic unit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100446564B1 (en) * 1994-12-22 2004-11-03 모토로라 인코포레이티드 Data processing system and how to run calculations on it

Similar Documents

Publication Publication Date Title
US6286024B1 (en) High-efficiency multiplier and multiplying method
US6009451A (en) Method for generating barrel shifter result flags directly from input data
KR100310584B1 (en) A system for signal processing using multiply-add operations
US4156922A (en) Digital system for computation of the values of composite arithmetic expressions
US6609143B1 (en) Method and apparatus for arithmetic operation
US5452466A (en) Method and apparatus for preforming DCT and IDCT transforms on data signals with a preprocessor, a post-processor, and a controllable shuffle-exchange unit connected between the pre-processor and post-processor
JPH0640301B2 (en) Parallel multiplier circuit
JPH0231511A (en) Processor
US5694349A (en) Low power parallel multiplier for complex numbers
WO2000059112A2 (en) Multiplier circuit
JP3458518B2 (en) Parallel processor
JPH06282418A (en) Arithmetic unit
CN100392584C (en) Carry save adder and its system
JP3139137B2 (en) Digital signal processing circuit that performs filter operation of digital filter processing
JP3144859B2 (en) Arithmetic logic unit
JPH05324694A (en) Reconstitutable parallel processor
US6792442B1 (en) Signal processor and product-sum operating device for use therein with rounding function
JP2953918B2 (en) Arithmetic unit
Lin et al. Reconfigurable shift switching parallel comparators
JP3462670B2 (en) Calculation execution method and calculation device
JPH04364525A (en) Parallel arithmetic unit
JP3165687B2 (en) Digital signal processor
JPS63197217A (en) Data processor
KR100373367B1 (en) Square logic circuit using adder
JP3486638B2 (en) Constant multiplier