JPH06309151A - Data processor - Google Patents

Data processor

Info

Publication number
JPH06309151A
JPH06309151A JP5120964A JP12096493A JPH06309151A JP H06309151 A JPH06309151 A JP H06309151A JP 5120964 A JP5120964 A JP 5120964A JP 12096493 A JP12096493 A JP 12096493A JP H06309151 A JPH06309151 A JP H06309151A
Authority
JP
Japan
Prior art keywords
data
latch
input
adder
word length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5120964A
Other languages
Japanese (ja)
Inventor
Toshiyuki Naoe
俊之 直江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP5120964A priority Critical patent/JPH06309151A/en
Publication of JPH06309151A publication Critical patent/JPH06309151A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To efficiently perform data processing by changing a machine cycle required for the arithmetic operation of a multiplier corresponding to effective data word length. CONSTITUTION:A control signal EN is set at '1' when the effective data word length shows 32 bits. While, the control signal EN is set at '0' when the effective data word length shows 16 bits, and '0' is inputted to the latch control terminal L of a latch 3, and the latch 3 outputs an input signal as passing it through as it is. Also, an AND circuit 4c is turned off, which disables input to the carry input Cin of an adder 4b with CLA on a low-order side. Also, all the bits of the output of the adder 4b with CLA on the low-order side are changed to '0's compulsorily since no control signal EN is inputted to another input of an AND circuit 4d, and it is outputted to a latch 5. Thereby, it is possible to shorten the propagation delay time of a carry signal propagated between the 32 bits on the low-order side of an adder with CLA at the final stage, and the multiplication of one machine cycle can be executed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、半導体集積回路からな
るデータ処理装置に関し、特にデジタルデータを演算処
理するためのデータ処理装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data processing device composed of a semiconductor integrated circuit, and more particularly to a data processing device for processing digital data.

【0002】[0002]

【従来の技術】並列乗算器を含む従来のデータ処理装置
の回路構成及びその動作内容について図2を参照して説
明する。図に於て破線で囲まれたブロックが並列乗算器
である。この乗算器は2次ブースアルゴリズム及びキャ
リーセーブアダーを用いたものであり、入力は32ビッ
ト幅、出力は63ビット幅であるものとする。
2. Description of the Related Art A circuit configuration of a conventional data processing apparatus including a parallel multiplier and its operation content will be described with reference to FIG. The block surrounded by the broken line in the figure is a parallel multiplier. This multiplier uses the secondary Booth algorithm and carry save adder, and the input is 32 bits wide and the output is 63 bits wide.

【0003】入力側が乗数ラッチ10を介してROM1
4の出力に接続されたブースエンコーダ1の出力はシフ
ト回路を含んだキャリーセーブアダー2に接続されてい
る。このキャリーセーブアダー2には被乗数ラッチ11
及びマルチプレクサ12を介してRAM13の出力も接
続され、またキャリーセーブアダー2の出力はラッチ1
03に入力されるようになっている。ラッチ103から
の乗数及び被乗数の出力は最終段CLA付アダー104
に入力されるようになっている。最終段CLA付アダー
104からの最終的な乗算結果はラッチ回路5にラッチ
され、ALU6に入力されるようになっている。このA
LU6には32ビット幅のデータバス15に接続された
マルチプレクサ9の出力も入力されるようになってい
る。ALU6の出力は63ビット幅のアキュムレータ7
及び32ビット幅のトライステートバッファ8を介して
データバス15に出力されるようになっている。
The input side is connected to the ROM 1 via the multiplier latch 10.
The output of the Booth encoder 1 connected to the output of 4 is connected to a carry save adder 2 including a shift circuit. This carry save adder 2 has a multiplicand latch 11
The output of the RAM 13 is also connected via the multiplexer 12 and the output of the carry save adder 2 is the latch 1
It is designed to be input to 03. The output of the multiplier and the multiplicand from the latch 103 is the final stage adder 104 with CLA.
It is designed to be input to. The final multiplication result from the adder 104 with CLA at the final stage is latched by the latch circuit 5 and input to the ALU 6. This A
The output of the multiplexer 9 connected to the 32-bit wide data bus 15 is also input to the LU 6. The output of ALU6 is accumulator 7 with 63-bit width.
And is output to the data bus 15 via the tri-state buffer 8 having a 32-bit width.

【0004】一方、図の装置に於て、ROM14の読み
出し、RAM13の読み出し及び書き込み、ALUの演
算はそれぞれ1マシンサイクルだけ要し、乗算には2マ
シンサイクルだけ要するものとする。
On the other hand, in the apparatus shown in the figure, the reading of the ROM 14, the reading and writing of the RAM 13, and the calculation of the ALU each require one machine cycle, and the multiplication requires only two machine cycles.

【0005】まず、マシンサイクルの始めにRAM13
またはデータバス15より、乗算器の1つの入力である
乗数が被乗数ラッチ11にラッチされる。またROM1
4より乗算器のもう1つの入力である乗数が乗数ラッチ
10にラッチされる。ラッチ回路10、11にラッチさ
れた乗数、被乗数は次のマシンサイクルの始めに乗算器
内部のラッチ回路103にラッチされ、そのマシンサイ
クルの終わりまでに最終段CLA付アダー104から最
終的な乗算結果が出力され、その次のマシンサイクルの
始めにこの乗算器の出力を入力とするラッチ回路5にラ
ッチされる。
First, at the beginning of the machine cycle, the RAM 13
Alternatively, the multiplier, which is one input of the multiplier, is latched by the multiplicand latch 11 from the data bus 15. Also ROM1
The multiplier, which is the other input of the multiplier from 4, is latched in the multiplier latch 10. The multipliers and multiplicands latched by the latch circuits 10 and 11 are latched by the latch circuit 103 inside the multiplier at the beginning of the next machine cycle, and by the end of the machine cycle, the final multiplication result from the adder 104 with CLA at the final stage. Is output and latched in the latch circuit 5 having the output of this multiplier as an input at the beginning of the next machine cycle.

【0006】ここで、図2の乗算器に於ては、内部ラッ
チ103を除くと、乗算器にデータが入力されてから乗
算結果が出力されるまでの時間が1マシンサイクルでは
おさまらず、従って乗算器内部の最終段CLA付アダー
104の手前にラッチ回路103を挿入することにより
2マシンサイクルかけて乗算を実行することになる。
Here, in the multiplier of FIG. 2, except for the internal latch 103, the time from the input of data to the multiplier to the output of the multiplication result is less than one machine cycle. By inserting the latch circuit 103 in front of the final stage adder 104 with CLA inside the multiplier, the multiplication is executed in two machine cycles.

【0007】[0007]

【発明が解決しようとする課題】従来は、前述のようで
あったため、乗算器の入力となるデータの有効語長が3
2ビットの場合は演算時間に2マシンサイクルかけるの
は当然であるが、凡用性のある処理装置の場合、扱うデ
ータの有効語長が必ずしも一定でなく、例えば有効語長
が16ビットの場合、乗算器の処理能力から見て、1マ
シンサイクルで演算が終了する場合でも演算に必ず2マ
シンサイクル要してしまい、処理速度が低下する問題が
あった。
Conventionally, as described above, the effective word length of the data to be input to the multiplier is 3 bits.
In the case of 2 bits, it is natural to take 2 machine cycles for the calculation time. However, in the case of a processing device with general merit, the effective word length of data to be handled is not always constant. For example, when the effective word length is 16 bits. However, in view of the processing capability of the multiplier, even if the calculation is completed in one machine cycle, the calculation always requires two machine cycles, and there is a problem that the processing speed decreases.

【0008】本発明は上記した従来技術の問題点に鑑み
なされたものであり、その主な目的は、有効データ語長
に応じて乗算器の演算に必要なマシンサイクルを変える
ことにより、効率的なデータ処理を行うことができるデ
ータ処理装置を提供することにある。
The present invention has been made in view of the above-mentioned problems of the prior art, and its main purpose is to efficiently change the machine cycle required for the operation of the multiplier according to the effective data word length. It is to provide a data processing device capable of performing various data processing.

【0009】[0009]

【課題を解決するための手段】上記した目的は、データ
の入力部から出力部までの間に少なくとも1つ以上のラ
ッチ回路が含まれているパイプライン方式の並列乗算器
を含むデータ処理装置であって、前記ラッチ回路をもっ
て当該データ処理装置の扱うデータをその有効語長に応
じてマシンサイクルごとにラッチする第1の状態と、入
力されたデータをそのままスルーする第2の状態とを切
換えるためのラッチ制御手段と、前記並列乗算器内の最
終段加算部に於てデータ長の上位側から見た有効データ
語長以下のビットを強制的に0に設定するデータ設定手
段とを設けたことを特徴とするデータ処理装置を提供す
ることにより達成される。
SUMMARY OF THE INVENTION The above-described object is a data processing apparatus including a pipeline-type parallel multiplier including at least one latch circuit between a data input section and a data output section. In order to switch between the first state in which the data handled by the data processing device is latched in each machine cycle according to the effective word length by the latch circuit and the second state in which the input data is directly passed therethrough. Latch control means and data setting means for forcibly setting to 0 in the final stage adder in the parallel multiplier the bits that are equal to or less than the effective data word length viewed from the upper side of the data length. It is achieved by providing a data processing device characterized by:

【0010】[0010]

【作用】このように、扱うデータをその有効語長に応じ
てマシンサイクルごとにラッチする第1の状態と、入力
されたデータをそのままスルーする第2の状態とを切換
えるためのラッチ制御手段と、乗算器内の最終段加算部
に於てデータ長の上位側から見た有効データ語長以下の
ビットを強制的に0に設定するデータ設定手段とを設け
ることにより、有効データ語長がデータ処理装置のビッ
ト幅に等しいが、それに近いビット幅であれば乗算器の
演算時間に2マシンサイクル使い、また有効データ語長
が装置のビット幅によりかなり短く、例えば半分以下で
あれば乗算時間に1マシンサイクルを使うというよう
に、有効データ語長に応じて効率的な演算を行うことが
できる。
Thus, the latch control means for switching between the first state in which the data to be handled is latched every machine cycle according to the effective word length and the second state in which the input data is passed through as it is. By providing data setting means for forcibly setting the bits less than the effective data word length viewed from the upper side of the data length to 0 in the final stage adder in the multiplier, the effective data word length is It is equal to the bit width of the processing device, but if the bit width is close to it, it takes 2 machine cycles for the operation time of the multiplier, and if the effective data word length is considerably shorter due to the bit width of the device, for example less than half, the multiplication time Efficient operation can be performed according to the effective data word length, such as using one machine cycle.

【0011】[0011]

【実施例】以下に本発明の一実施例について図面を参照
して詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described in detail below with reference to the drawings.

【0012】図1は本実施例に於けるデータ処理装置の
構成を示すブロック図である。入力側が乗数ラッチ10
を介してROM14の出力に接続されたブースエンコー
ダ1の出力はシフト回路を含んだキャリーセーブアダー
2に接続されている。このキャリーセーブアダー2には
被乗数ラッチ11及びマルチプレクサ12を介してRA
M13の出力も接続され、またキャリーセーブアダー2
の出力はラッチ3に入力されるようになっている。ラッ
チ3にはラッチ制御端子Lが設けられ、該ラッチ制御端
子LにはNANDゲート16を介して制御信号ENとク
ロック信号とのNAND出力が供給されている。ここ
で、ラッチ3のラッチ制御端子Lに“1”が入力されて
いるときはラッチ3はクロック信号に同期して入力信号
をラッチし、ラッチ3のラッチ制御端子Lに“0”が入
力されているときはラッチ3は入力信号をそのままスル
ーして出力するようになっている。ラッチ3からの乗数
及び被乗数の出力は最終段CLA付アダー4の後記する
上位側CLA付アダー4aと下位側CLA付アダー4b
とに入力されるようになっている。
FIG. 1 is a block diagram showing the arrangement of a data processing apparatus according to this embodiment. Input side is multiplier latch 10
The output of the Booth encoder 1 connected to the output of the ROM 14 via is connected to a carry save adder 2 including a shift circuit. The carry save adder 2 is connected to the RA via the multiplicand latch 11 and the multiplexer 12.
The output of M13 is also connected, and carry save adder 2
Is output to the latch 3. The latch 3 is provided with a latch control terminal L, and a NAND output of a control signal EN and a clock signal is supplied to the latch control terminal L via a NAND gate 16. Here, when "1" is input to the latch control terminal L of the latch 3, the latch 3 latches the input signal in synchronization with the clock signal, and "0" is input to the latch control terminal L of the latch 3. In this case, the latch 3 outputs the input signal as it is. The outputs of the multiplier and the multiplicand from the latch 3 are the upper CLA adder 4a and the lower CLA adder 4b, which will be described later, in the final stage CLA adder 4.
It is designed to be input to and.

【0013】最終段CLA付アダー4は上位ビット側の
33ビット目から63ビットまでの加算を担当する上位
側CLA付アダー4aと、下位ビット側の0ビット目か
ら32ビットまでの加算を担当する下位側CLA付アダ
ー4bと、下位側CLA付アダー4bの桁上がり出力C
oを一方の入力とし、かつ出力が上位側CLA付アダー
4aの桁上がり入力Cinに接続されたAND回路4c
と、下位側CLA付アダー4bの出力を入力とし、かつ
出力がラッチ5に接続されたAND回路4dとから構成
されている。AND回路4cとAND回路4dとの他方
の入力には、上記ラッチ制御端子Lに入力されるのと同
じ制御信号ENが入力されるようになっている。
The final stage CLA adder 4 is in charge of the addition of the upper side CLA adder 4a which is in charge of addition from the 33rd bit to the 63th bit of the upper bit side and the addition of 0th bit to the 32nd bit of the lower bit side. Carry output C of lower side CLA adder 4b and lower side CLA adder 4b
AND circuit 4c in which o is one of the inputs, and the output is connected to the carry input Cin of the upper CLA adder 4a
And an AND circuit 4d which receives the output of the lower CLA-added adder 4b as an input and whose output is connected to the latch 5. The same control signal EN that is input to the latch control terminal L is input to the other input of the AND circuit 4c and the AND circuit 4d.

【0014】最終段CLA付アダー4からの最終的な乗
算結果はラッチ回路5にラッチされ、ALU6に入力さ
れるようになっている。このALU6の他方の入力には
データバス15に接続されたマルチプレクサ9の出力も
接続されている。ALU6の出力はアキュムレータ7及
びトライステートバッファ8を介してデータバス15に
出力されるようになっている。尚、各ブロックのビット
幅は図2と同様である。
The final multiplication result from the adder 4 with CLA at the final stage is latched by the latch circuit 5 and input to the ALU 6. The other input of the ALU 6 is also connected to the output of the multiplexer 9 connected to the data bus 15. The output of the ALU 6 is output to the data bus 15 via the accumulator 7 and the tristate buffer 8. The bit width of each block is the same as in FIG.

【0015】次に本実施例の作動要領について説明す
る。まず、有効データ語長が32ビットの場合には制御
信号ENは“1”となり、図2の従来回路と同様の動作
を行う。一方、有効データ語長が16ビットの場合には
制御信号ENは“0”となり、ラッチ3のラッチ制御端
子Lに“0”が入力され、ラッチ3は入力信号をそのま
まスルーして出力する。また、AND回路4cはオフ
し、下位側CLA付アダー4bの桁上がり信号は上位側
CLA付アダー4aの桁上がり入力Cinに入力されな
くなる。また下位側CLA付アダー4bの出力はAND
回路4dの他方の入力には制御信号ENが入力されてい
るため強制的に全てのビットが“0”に変えられてラッ
チ5に出力される。尚、図に於て符号A、Bは乗数、被
乗数を示す。
Next, the operating procedure of this embodiment will be described. First, when the effective data word length is 32 bits, the control signal EN becomes "1" and the same operation as the conventional circuit of FIG. 2 is performed. On the other hand, when the effective data word length is 16 bits, the control signal EN becomes "0", "0" is input to the latch control terminal L of the latch 3, and the latch 3 outputs the input signal as it is. Further, the AND circuit 4c is turned off, and the carry signal of the lower CLA adder 4b is not input to the carry input Cin of the upper CLA adder 4a. The output of the lower CLA adder 4b is AND
Since the control signal EN is input to the other input of the circuit 4d, all the bits are forcibly changed to "0" and output to the latch 5. In the figure, reference characters A and B indicate a multiplier and a multiplicand.

【0016】こうすることにより最終段CLA付アダー
の下位側の32ビットの間を伝わる桁上げ信号の伝搬遅
延時間がほとんどかからなくなり、1マシンサイクルで
乗算が実行できる。
By doing so, the propagation delay time of the carry signal transmitted between the lower 32 bits of the adder with CLA in the final stage is almost eliminated, and the multiplication can be executed in one machine cycle.

【0017】[0017]

【発明の効果】以上の説明により明らかなように、本発
明によれば、扱うデータをその有効語長に応じてマシン
サイクルごとにラッチする第1の状態と、入力されたデ
ータをそのままスルーする第2の状態とを切換えるため
のラッチ制御手段と、乗算器内の最終段加算部に於てデ
ータ長の上位側から見た有効データ語長以下のビットを
強制的に0に設定するデータ設定手段とを設けることに
より、有効データ語長がデータ処理装置のビット幅に等
しいが、それに近いビット幅であれば乗算器の演算時間
に2マシンサイクル使い、また有効データ語長が装置の
ビット幅によりかなり短く、例えば半分以下であれば乗
算時間に1マシンサイクルを使うというように、有効デ
ータ語長に応じて乗算に必要なマシンサイクル数を、よ
り効率的に設定することができ、効率的な演算を行うこ
とができる。
As is apparent from the above description, according to the present invention, the first state in which the data to be handled is latched every machine cycle according to its effective word length and the input data is passed through as it is. Latch control means for switching between the second state and the data setting for forcibly setting to 0 in the final stage adder in the multiplier, the bits having a length equal to or less than the effective data word length viewed from the upper side of the data length. By providing the means, the effective data word length is equal to the bit width of the data processor, but if the bit width is close to that, two machine cycles are used for the operation time of the multiplier, and the effective data word length is the bit width of the device. Is very short, for example, if it is less than half, one machine cycle is used for multiplication time, so that the number of machine cycles required for multiplication can be set more efficiently according to the effective data word length. It can, it is possible to perform efficient operations.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明が適用されたデータ処理装置の回路構成
を示すブロック図である。
FIG. 1 is a block diagram showing a circuit configuration of a data processing device to which the present invention is applied.

【図2】従来のデータ処理装置の回路構成を示すブロッ
ク図である。
FIG. 2 is a block diagram showing a circuit configuration of a conventional data processing device.

【符号の説明】[Explanation of symbols]

1 ブースエンコーダ 2 シフト回路付キャリーセーブアダー 3、5、10、11、103 ラッチ 4、104 並列乗算器の最終段加算回路 6 ALU 7 アキュムレータ 8 トライステートバッファ 9、12 マルチプレクサ 13 RAM 14 ROM 15 データバス 16 2入力NAND 1 Booth encoder 2 Carry save adder with shift circuit 3, 5, 10, 11, 103 Latch 4, 104 Final stage addition circuit of parallel multiplier 6 ALU 7 Accumulator 8 Tri-state buffer 9, 12 Multiplexer 13 RAM 14 ROM 15 Data bus 16 2-input NAND

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 データの入力部から出力部までの間に
少なくとも1つ以上のラッチ回路が含まれているパイプ
ライン方式の並列乗算器を含むデータ処理装置であっ
て、 前記ラッチ回路をもって当該データ処理装置の扱うデー
タをその有効語長に応じてマシンサイクルごとにラッチ
する第1の状態と、入力されたデータをそのままスルー
する第2の状態とを切換えるためのラッチ制御手段と、 前記並列乗算器内の最終段加算部に於てデータ長の上位
側から見た有効データ語長以下のビットを強制的に0に
設定するデータ設定手段とを設けたことを特徴とするデ
ータ処理装置。
1. A data processor including a pipeline-type parallel multiplier including at least one latch circuit between a data input section and a data output section, wherein the latch circuit holds the data. Latch control means for switching between a first state in which the data handled by the processing device is latched for each machine cycle according to its effective word length and a second state in which the input data is directly passed through; and the parallel multiplication. A data processing device, comprising: data setting means for forcibly setting, to 0, a bit having a length equal to or less than the effective data word length viewed from the upper side of the data length in the final stage addition section in the device.
JP5120964A 1993-04-23 1993-04-23 Data processor Withdrawn JPH06309151A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5120964A JPH06309151A (en) 1993-04-23 1993-04-23 Data processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5120964A JPH06309151A (en) 1993-04-23 1993-04-23 Data processor

Publications (1)

Publication Number Publication Date
JPH06309151A true JPH06309151A (en) 1994-11-04

Family

ID=14799368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5120964A Withdrawn JPH06309151A (en) 1993-04-23 1993-04-23 Data processor

Country Status (1)

Country Link
JP (1) JPH06309151A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008533617A (en) * 2005-03-17 2008-08-21 クゥアルコム・インコーポレイテッド Method for multiplying two operands and array multiplier

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008533617A (en) * 2005-03-17 2008-08-21 クゥアルコム・インコーポレイテッド Method for multiplying two operands and array multiplier

Similar Documents

Publication Publication Date Title
US6209017B1 (en) High speed digital signal processor
Chang et al. Simple, Fast, and Exact RNS Scaler for the Three-Moduli Set $\{2^{n}-1, 2^{n}, 2^{n}+ 1\} $
US4866652A (en) Floating point unit using combined multiply and ALU functions
US5889689A (en) Hierarchical carry-select, three-input saturation
JPH07107664B2 (en) Multiplication circuit
JPH06309151A (en) Data processor
US4677584A (en) Data processing system with an arithmetic logic unit having improved carry look ahead
US8214419B2 (en) Methods and apparatus for implementing a saturating multiplier
KR100481586B1 (en) Apparatus for modular multiplication
US4989174A (en) Fast gate and adder for microprocessor ALU
US6182105B1 (en) Multiple-operand addition with intermediate saturation
US6904442B1 (en) Method of implementing logic functions using a look-up-table
GB2345562A (en) Digital signal processor for performing fixed-point and/or integer arithmetic
KR100373367B1 (en) Square logic circuit using adder
JPS6259828B2 (en)
US5018092A (en) Stack-type arithmetic circuit
JP3547309B2 (en) Arithmetic unit
KR100251547B1 (en) Digital signal processor
KR0136484B1 (en) Parallel multiplier
JPS63254525A (en) Dividing device
Mayerwieser et al. Testing a high-speed data path the design of the rsaβ crypto chip
KR100451712B1 (en) Method and apparatus for multiplication
KR100246472B1 (en) Digital signal processor
JP3110072B2 (en) Pre-normalization circuit
Leinward et al. Dynamic Boolean Algebras

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000704