JPS59194242A - Digital multiplying and cumulative adding device - Google Patents
Digital multiplying and cumulative adding deviceInfo
- Publication number
- JPS59194242A JPS59194242A JP58068598A JP6859883A JPS59194242A JP S59194242 A JPS59194242 A JP S59194242A JP 58068598 A JP58068598 A JP 58068598A JP 6859883 A JP6859883 A JP 6859883A JP S59194242 A JPS59194242 A JP S59194242A
- Authority
- JP
- Japan
- Prior art keywords
- output
- multiplier
- adder
- data
- digital signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
Abstract
Description
【発明の詳細な説明】
〔発明の技術分野〕
この発明は、並列多ビツトデータからなる2つのディジ
タル信号系列をそれぞれ乗数、波乗数としてデータ毎に
乗算し、その乗算結果を累積加算するディジタル乗算累
積加算装置に関する。[Detailed Description of the Invention] [Technical Field of the Invention] This invention relates to a digital multiplication method in which two digital signal sequences consisting of parallel multi-bit data are multiplied for each data as a multiplier and a wave multiplier, and the multiplication results are cumulatively added. The present invention relates to a cumulative addition device.
一般にアナログ信号について行なわれていたフィルタ処
理をディジクル回路てプロ現する場合、第1図に示すよ
うに遅延回路17乗算器2ノ3よび加算器3等で構成さ
れる巡回形あるいは非巡回形フィルりを何段か縦横接続
して、入カイ:τ吟であるディジタル信号に代数的演算
処理を施すことが行なわれる。ここでAOI〜A 0+
1 + AIl〜Aln+A21〜A 2n + B
+t〜BIll r 821〜B2nは要求さノしる
フィルタ特性により決定される係数であるため、実際の
演算においては乗算器2で乗数としテ扱ワレ、入力ディ
ジタル信号あるいは遅延回路1や加算器3等で処理され
た後のディジタル信号を被乗数として乗算が行なわれる
。When the filter processing that is generally performed on analog signals is expressed using a digital circuit, a cyclic or acyclic filter consisting of a delay circuit 17 multipliers 2 and 3, an adder 3, etc. is used as shown in Figure 1. By connecting several stages vertically and horizontally, algebraic arithmetic processing is performed on the input digital signal. Here AOI~A 0+
1 + AIl ~ Aln + A21 ~ A 2n + B
+t~BIllr 821~B2n are coefficients determined by the required filter characteristics, so in actual calculations, they are treated as multipliers in multiplier 2, and are not handled as input digital signals or in delay circuit 1 or adder 3. Multiplication is performed using the digital signal processed as the multiplicand.
第2図は第1図のディジタルフィルタの基本構成を実際
にハードウェアで構成した一例であり、乗算、加算、遅
延の3つの処理を時分割処理で行なうことにより、小規
模の構成で高次数のフィルタを実現可能とするものであ
る。すなわち、被乗数入力である入力ディジタル信号ま
たはこれをその標本化周期に相当する時間だけ遅延メモ
リ4で遅延した信号を乗算器5に供給して、乗数入力で
ある前記係数に相当するディジタル信号と乗算し、その
乗算結果を加算器6.・ニ送ってレジスタ7の出力であ
る累積加算結果と加「了し、新たな累積加算結果を出力
するとともに、レジスタ7にそれを保持させるという構
成である。Figure 2 shows an example in which the basic configuration of the digital filter shown in Figure 1 is actually configured in hardware. By performing the three processes of multiplication, addition, and delay using time-sharing processing, high-order filters can be achieved with a small-scale configuration. This makes it possible to realize a filter. That is, the input digital signal as the multiplicand input or a signal delayed by the delay memory 4 by a time corresponding to the sampling period thereof is supplied to the multiplier 5, and is multiplied by the digital signal corresponding to the coefficient as the multiplier input. Then, the multiplication result is sent to adder 6. - The configuration is such that it is added to the cumulative addition result that is the output of the register 7, outputs a new cumulative addition result, and is caused to be held in the register 7.
このような遅延を含めた入力信号供給1乗算。Input signal supply 1 multiplication including such delay.
累積力ロ算の一連の動作を一定周期(乗算周期)で繰返
すことで、高速化が図られる。すなわち、人力ディジタ
ル信号の標本化周期内にm回の乗算ができるものとする
と、第1図のフィルり1段の演算には5回の乗算が含ま
れているので、結局m / 5段のフィルタの演算が標
本信置1υ」内にできることになる◇
こころで実際の演算では有限の語長(ビ、1・数)を扱
うので、フィルタ特性のある程度の劣化は避けられず、
これはフィルタか高次となる程問題となってくる。この
ため第2図の乗算器5、加算器6等の演算には、要求さ
れる一ノイルク特性に応じた語長を与える8皮があり、
例えば24ビツトあるいは32ビツトといったかfぶり
の多ビットが要求される。しかしISがら現在、乗算器
として実用化されているものでは16ビツト程度が限界
であり、従って第2図の構成では所望のフィルタ特性を
実現することが事実上不可能となる場合がある。そこで
12ビツトあるいは16ビツトの乗算器を複数個組合せ
て用いることにより、24ビツト、32ビツトといった
より多ビットの乗算を行なう方法が考えられている。By repeating the series of cumulative force multiplication operations at a constant cycle (multiplication cycle), the speed can be increased. In other words, assuming that m multiplications can be performed within the sampling period of a human-powered digital signal, the calculation for one stage of fill in Figure 1 includes five multiplications, so in the end it is m / 5 stages. This means that the filter operation can be performed within 1υ of the sample value ◇ Since the actual operation in the mind deals with a finite word length (bi, 1, number), some deterioration of the filter characteristics is unavoidable.
This becomes a problem as the filter becomes higher-order. For this reason, the operations of the multiplier 5, adder 6, etc. in FIG.
For example, a large number of bits, such as 24 bits or 32 bits, is required. However, the limit of IS multipliers that are currently in practical use is about 16 bits, so it may be virtually impossible to achieve desired filter characteristics with the configuration shown in FIG. Therefore, a method has been considered in which a plurality of 12-bit or 16-bit multipliers are used in combination to perform multiplication with a larger number of bits, such as 24 bits or 32 bits.
第3図に16ビツト乗算器を用いて32ビツト×32ビ
ツトの乗算を行なう場合のアルコ゛リズムを示す。乗数
をX、被乗数をYとし、それらの積f!f:Pとする。FIG. 3 shows an algorithm for performing 32-bit x 32-bit multiplication using a 16-bit multiplier. Let the multiplier be X and the multiplicand be Y, and their product f! Let f:P.
またX’t−32ビツトの並列データとし、これを16
ビツトずつ上位部分データと下位部分データに分け、そ
れぞれA、Bとする。同様にYを16ビツトずつ上位部
分データC゛と下位部分デー、りDとに分ける。そして
p=x*yをP! =A*C*P2 =A*D。Also, let's use X't-32 bits of parallel data, and convert this into 16
Each bit is divided into upper part data and lower part data, and these are designated as A and B, respectively. Similarly, Y is divided into upper part data C' and lower part data D by 16 bits. And p=x*y as P! =A*C*P2 =A*D.
P3 =B * C、P4 =B * Dの4つの部分
積に分けて、4つの16ビツト乗算器で演算する。It is divided into four partial products, P3 = B * C and P4 = B * D, and calculated using four 16-bit multipliers.
これらの各部分積に相当する乗算結果は32ビツトのデ
ータとなる。これらを
P=2 *P1+2 *(P2+P3)+P4とな
るように位どりを合せて加算すれば、ff1pが64ビ
ツトデータとして得られる。The multiplication result corresponding to each of these partial products becomes 32-bit data. If these are added in such a way that P=2*P1+2*(P2+P3)+P4, ff1p is obtained as 64-bit data.
第4図に第3図のアルコ゛リズムに従ってハードウェア
化した従来のディジタル乗算累積加算装置の構成を示す
。すなわち、4個の16ビツト乗算器11912,13
.14を用いて部分積p 1+ P 2 + P 3
、P 4 を32ビツトデータとして得、P 2
+ P 3の加算を32ビツト加9゜器15により行
ない、このP2+P3のデータを64ビツト加算器16
に送って、”I r P4のデータと位どりを合せて
/JlI層し、P = X * Yを64ビツトデータ
として得る。そして第3図と同様に、64ビツト加算器
17とレジスタ18を用いてPを累積加算することで、
乗39−累積加算結果ACCOUTが得られろ。FIG. 4 shows the configuration of a conventional digital multiplication/accumulation addition device implemented in hardware according to the algorithm shown in FIG. That is, four 16-bit multipliers 11912, 13
.. 14 to calculate the partial product p 1 + P 2 + P 3
, P 4 as 32-bit data, P 2
+P3 is added by a 32-bit adder 15, and the data of P2+P3 is added to a 64-bit adder 16.
, and aligns the data with the data of "I r P4 and layers it with /JlI to obtain P = X * Y as 64-bit data. Then, in the same way as in FIG. By cumulatively adding P using
Multiply 39 - Obtain the cumulative addition result ACCOUT.
第5図は第4図の動作を示すタイムチャートを示したも
ので、Ftlz+t3は加汀器15゜16.17のそれ
ぞれの演算時間である。第4図の構成ではこれらの時間
のため、乗算周期の短縮に限界が生じ・でしまう。具体
的な数値例を示すと、tl−1−t2−1−taは加算
器15〜12に高速のものを用いたとして最低で90
ns +乗算器11〜14の出力遅延時間やレジスタ1
8のホールドイン時間など′lrニア7III7L最大
値のマージンを考慮すると、150ns程度は必要とな
る。FIG. 5 shows a time chart showing the operation of FIG. 4, where Ftlz+t3 is the calculation time of each of the boosters 15°, 16.17. In the configuration shown in FIG. 4, due to these times, there is a limit to the shortening of the multiplication period. To give a specific numerical example, tl-1-t2-1-ta is at least 90 assuming high-speed adders 15 to 12 are used.
ns + output delay time of multipliers 11 to 14 and register 1
Considering the margin of the maximum value of 'lr near 7III7L, such as the hold-in time of 8, about 150 ns is required.
一方、乗算器については高速のもので100ns程度ま
で実現可能となっている。従って乗算器11〜14自体
の乗算周期は100 ns程度まで短縮可能でありなが
ら、現実には加算器の全演算時間に制約されてしまうこ
とになる。特に前述のようなディジタルフィルタを考え
た場合、乗算周期によって実現可能なフィルタの段数が
決められるため、数Ionsという乗算周期の差は実際
上非常に大きく、要求されるフィルタ特性が実現できな
いという事態にも結びつく。On the other hand, high-speed multipliers can be realized up to about 100 ns. Therefore, although the multiplication period of the multipliers 11 to 14 itself can be shortened to about 100 ns, in reality it is limited by the total calculation time of the adder. Especially when considering the digital filter mentioned above, the number of stages of the filter that can be realized is determined by the multiplication period, so the difference in the multiplication period of several Ions is actually very large, and there is a situation where the required filter characteristics cannot be achieved. It is also connected to
また、第4図の構成は加算器の必要個数が多いために回
路規模が比較的大きいというのも欠点の一つとなってい
る。Another disadvantage of the configuration shown in FIG. 4 is that the circuit scale is relatively large because a large number of adders are required.
この発明の目的は、動作の高速化と回路規模の縮少を図
ることができるディジタル乗算累積加算装置を提供する
ことである。SUMMARY OF THE INVENTION An object of the present invention is to provide a digital multiplication/accumulation addition device that can operate at high speed and reduce the circuit scale.
この発明は、乗算グロセスにおける部分加算結果の一つ
と、累積加算結果とを蓄積する2つのレジス//を設け
、これら2種の加算演31共通の加算器で交互に行なう
ようにしたものである0
すなわち、この発明は並列多ビツトデータからなる第1
.第2のディジタル信号原料をデータ毎に乗算しその乗
算結果を累積カロ算する装置において、第1のディジタ
ル信号系列の上位部分データと第2のディジタル信号系
列の上位部分データとを乗算する第1の乗算器と、第1
のディジタル信号系列の上位部分データと第2のディジ
タル信号系列の下位部分デ]りとを乗算する第2の乗算
器と、第1のディジタル信号系列の下位部分データと第
2のディジタル信号系列の上位部分データとを乗算する
第3の乗算器と、第2の乗算器の出力と第3の乗算器の
出力とを加算する第1の加算器と、この第1の加算器の
出力と第1の乗算器の出力とt710算するためと累積
加算のための第2の加算器と、この第2の加算器の出力
全一時的に蓄積するための第1、第2のレジスタとを備
え、、第1の加算器の出力と第1の乗算器の出−力とを
位どりを合せて第2の加算器の2つの入力とし、そのと
きの第2の71[]算器の出力を第1.第2のレジスタ
の一方に蓄積する第1のモードと、第1のレジスタの出
力と第2のレジスタの出力とを第2の加算器の2つの入
力とし、そのときの第2の加算器の出力を第1.第2の
レジスタの他方に蓄積する第2のモードとを交互に切換
えるようにしたことを特徴としている。In this invention, two registers are provided to store one of the partial addition results in the multiplication gross and the cumulative addition result, and these two types of addition operations 31 are performed alternately using a common adder. 0 In other words, the present invention provides the first
.. In a device that multiplies a second digital signal raw material for each data and calculates the multiplication results by cumulative calculation, the first a multiplier of
a second multiplier that multiplies the upper part data of the digital signal series by the lower part data of the second digital signal series; and the lower part data of the first digital signal series and the lower part data of the second digital signal series. a third multiplier that multiplies the upper part data; a first adder that adds the output of the second multiplier and the output of the third multiplier; a second adder for performing t710 arithmetic with the output of the first multiplier and for cumulative addition; and first and second registers for temporarily accumulating all the outputs of the second adder. ,,The output of the first adder and the output of the first multiplier are matched in order and are used as two inputs of the second adder, and the output of the second 71[] multiplier at that time is First. The first mode is to accumulate in one of the second registers, the output of the first register and the output of the second register are the two inputs of the second adder, and the output of the second adder at that time is Set the output to 1st. It is characterized in that the second mode in which the storage is stored in the other of the second registers is alternately switched.
また、この発明ではより高精度の演算を行なう場合、第
1〜第3の乗算器に加え、さらに第1、第2のディジタ
ル信号系列の下位部分データどうしを乗算する第4の乗
算器が備えられる。In addition to the first to third multipliers, in addition to the first to third multipliers, the present invention further includes a fourth multiplier that multiplies the lower part data of the first and second digital signal series. It will be done.
その場合、第4の乗算器の出力は第1の乗算器の出力と
位どりを合せて結合され、この結合出力が第2の加算器
で第1の加算器の出力と位どりを合せて加算される。In that case, the output of the fourth multiplier is combined in order with the output of the first multiplier, and this combined output is combined in order with the output of the first adder in the second adder. will be added.
この発明によれば、乗算プロセスにおける1つの部分加
算である第1のモードが終り、累積加算である第2のモ
ードに移行すると直ちに次の乗算に移行できるため、η
日算のための演算時間が乗算周期に対して効果的に割込
む形となって、実際の乗算周期、すなわち乗算累積加算
の繰返し周期が短縮され、大幅な高速化が図られる。従
ってディジタルフィルタへの応用を考えた場合、実現で
きるフィルタ特性が拡張されるという効果がある。According to this invention, as soon as the first mode, which is one partial addition in the multiplication process, is completed and the second mode, which is cumulative addition, is entered, the next multiplication can be started.
The calculation time for the daily calculation is effectively inserted into the multiplication period, and the actual multiplication period, that is, the repetition period of multiplication and accumulation addition, is shortened, and the speed is significantly increased. Therefore, when considering the application to digital filters, there is an effect that the filter characteristics that can be realized are expanded.
また、一般に多くの素子数を占める多ビツト加算器が2
個で済むことから、レジスタが1個増えることを考慮し
ても装置全体としての回路規模はかなり縮少され、コス
トの低減に寄与することができる。In addition, the multi-bit adder, which generally occupies a large number of elements, has two
Since only one register is required, the circuit scale of the entire device can be considerably reduced even considering the addition of one register, which can contribute to cost reduction.
第6図はこの発明の第1の実施例を示したもので、乗算
器が3個となっている点を除けば、基本的な機能は第4
図のものと同様であり、Pの乗算プロセスにおけるPA
+Pnの部分加算と、累積加算のための構成が異なって
いる。FIG. 6 shows the first embodiment of this invention, and except for the fact that there are three multipliers, the basic functions are as follows:
Similar to the one in the figure, PA in the multiplication process of P
The configurations for +Pn partial addition and cumulative addition are different.
すなわち、乗数となる第1のディジタル信号系列Xと、
被乗数となる第2のディジクル信ぢ系列Yが入力される
。Xはディジタルフィルタの場合、一定の係数を与える
一定のデータであり、Yはある周期で標本化された標本
値系列であって、この例ではいずれも並列32ビツトの
データであるとする。これらの信号系列X、Yはそれぞ
れ第3図で説明したように各々16ビツトずつの上位部
分データA、Bと下位部分データC,Dとに分割されて
入力され、第1の乗算器11でP1=A*C,第2の乗
算器12でP2=AID、また第3の乗算器13てP3
=B*Cの各部分積が演算される。これらはいず
−
れも32ビツトのデータである。That is, the first digital signal sequence X serving as a multiplier,
A second digital signal sequence Y serving as a multiplicand is input. In the case of a digital filter, X is constant data that provides a constant coefficient, and Y is a sample value series sampled at a certain period, and in this example, it is assumed that both are parallel 32-bit data. As explained in FIG. P1=A*C, P2=AID in the second multiplier 12, and P3 in the third multiplier 13
Each partial product of =B*C is calculated. These are not
- Both are 32-bit data.
第1の乗算器11の出力データP1は%P1を上位32
ビツトとし、下位32ビツトをオール″0#とする64
ビツトのデータPAとして第1のマルチプレクサ21の
一方の入力に与えられる。The output data P1 of the first multiplier 11 is %P1 in the upper 32
bits, and the lower 32 bits are all "0#" 64
The bit data PA is applied to one input of the first multiplexer 21.
一方、第2.第3の乗算器12.13の出力データP2
+P3は32ビツト構成の第1の加算器15で加算され
、32ビツトの部分加算データP2+P3 となる。こ
のデータP2+P3は、P2+P3を下位32ヒツトと
し、上位32ビツトをオールNO”とする64ビツトの
データPnとして第2のマルチプレクサ22の一方の入
力に与えられる。第1.第2のマルチプレクサ21.2
2の出力は64ビツト構成の第2の加算器23に入力さ
れ、この加算器23の出方は第1.第2のレジスタ24
.25に導かれる。On the other hand, the second. Output data P2 of third multiplier 12.13
+P3 is added by the first adder 15 having a 32-bit configuration, resulting in 32-bit partial addition data P2+P3. This data P2+P3 is given to one input of the second multiplexer 22 as 64-bit data Pn in which P2+P3 is the lower 32 bits and the upper 32 bits are all NO.
The output of the first . second register 24
.. 25.
第1.第2のレジスタ24.25の出方は、第1、第2
のマルチプレクサ21.22の他方の入力となる。1st. The output of the second register 24.25 is the same as that of the first and second registers.
It becomes the other input of the multiplexer 21, 22 of.
次に、この実施例の動作を第7図のクイムチヤードを用
いて説明する。なお、第7図においてMPYINCKお
よびMPY OUT CKは乗算器11〜13の入出力
クロックを示し、MPY OUTは乗算器II〜13の
出力を示し、AD♂*ADR縮第1、第2の加算器15
.23の出力を示し、MPX OUTはマルチプレクサ
21.22の出力を示し、RG I CK 、 RG2
CKはレジスタ24.25の蓄積開始のクロックを示
し、RG 10UT 、RG 2QUTはレジスタ24
.25の出力を示す。Next, the operation of this embodiment will be explained using the quimchard shown in FIG. In FIG. 7, MPYINCK and MPY OUT CK indicate the input/output clocks of multipliers 11 to 13, MPY OUT indicates the output of multipliers II to 13, and AD♂*ADR reduction first and second adders. 15
.. 23, MPX OUT indicates the output of multiplexer 21.22, RG I CK , RG2
CK indicates the clock for starting the accumulation of registers 24 and 25, and RG 10UT and RG 2QUT are the clocks for starting the accumulation of registers 24 and 25.
.. 25 output is shown.
第1.第2のディジタル信号系列X、Yの各1つのデー
タXo 、Yoが入力されることによって、乗算器11
〜13から部分積のデータP1〜P3が出力され、部分
加算データPA + Pnが生成されると、マルチプレ
クサ21.22はセレクト信号SELによってPA r
Psを選択し、力α算器23に送る。これにより加算
器23でPA+P11、つまりZ(、=Xo *Yoが
求められ、このデータZoがクロックRGICKによっ
てレジスタ24に蓄積される。1st. By inputting data Xo and Yo of the second digital signal series X and Y, the multiplier 11
When the partial product data P1 to P3 are output from ~13 and partial addition data PA + Pn is generated, the multiplexers 21 and 22 select PA r by the select signal SEL.
Ps is selected and sent to the force α calculator 23. As a result, the adder 23 calculates PA+P11, that is, Z(,=Xo *Yo), and this data Zo is stored in the register 24 by the clock RGICK.
次に、マルチプレクサ21.22はセレクト信号SEL
によってレジスタ24.25側に切換わり、レジスタ2
4に蓄積されたデータ2゜と、レジスタ25に既に蓄積
されていたx、 * y。Next, the multiplexers 21 and 22 select the select signal SEL.
switches to the register 24 and 25 side, register 2
The data 2° stored in the register 25 and x, *y that had already been stored in the register 25.
までの乗算累積加算データw−1とを加算器23に送る
。これによって加算器23は、今度はz、−4−晩、な
る累積加算を行ない、その結果を新たな乗算累積加算デ
ータtA)oとして出力する。The multiplication cumulative addition data w-1 up to and including the data w-1 are sent to the adder 23. As a result, the adder 23 now performs cumulative addition for z, -4- nights, and outputs the result as new multiplication cumulative addition data tA)o.
このデータwoは同時にクロックRG 2 CKによっ
てレジスタ25に蓄積され、次の累積加算に備この場合
、マルチプレクサ21.22がPAIPB側からレジス
タ24e25側に切換わると同時に、第1の加算器15
は次の加算動作に移ることが可能であるため、乗算器1
1〜13も次の乗算動作に移ることができるようK f
iす、結果的に乗算周期を短くすることができるわけで
ある。すなわち、第7図のタイムチャートからも明らか
なように、乗算周期を制約する演算時間は第1の加算器
15の演算時間tl 、マルチプレクサzz、22のセ
レクト時間t4および第2の加算器23の演算時間t2
の和が大半を占め、これは第4図に示した従来の構成の
90n3に対し20ns以上の短縮となる。This data wo is simultaneously accumulated in the register 25 by the clock RG 2 CK, and in preparation for the next cumulative addition, the multiplexers 21 and 22 are switched from the PAIPB side to the register 24e25 side, and at the same time the first adder 15
can move on to the next addition operation, so multiplier 1
K f so that 1 to 13 can also move on to the next multiplication operation.
As a result, the multiplication period can be shortened. That is, as is clear from the time chart in FIG. 7, the calculation time that constrains the multiplication period is the calculation time tl of the first adder 15, the selection time t4 of the multiplexers zz and 22, and the calculation time t4 of the second adder 23. Computation time t2
The sum accounts for the majority, and this is a reduction of more than 20 ns compared to 90n3 in the conventional configuration shown in FIG.
また、回路構成としては64ビツトのり日算器が1個減
少することにより、レジスタが1個増力口し、またマル
チプレクサが必要となることを考慮に入れても実際の規
模は縮少される。Furthermore, as for the circuit configuration, by reducing the number of 64-bit daily counters by one, the number of registers increases by one, and even taking into account that a multiplexer is required, the actual scale is reduced.
第8図はこの発明の第2の実施例を示すもので、P、=
B*Dの部分積を得る第4の乗算器14を追加すること
によって、より高精度の演算を可能としたものである。FIG. 8 shows a second embodiment of the invention, where P,=
By adding a fourth multiplier 14 that obtains the partial product of B*D, higher precision calculation is made possible.
この場合、P4のデータはPlが上位32ビツトvP<
が下位32ビツトとなるようにPlと結合され、64ビ
ツトのデータ2人となる。第9図は第8図の動作を示す
タイムチャートであり、MPYOUTの中にP4が追加
されている点以外は第7図と同じである。In this case, in the data of P4, Pl is the upper 32 bits vP<
is combined with Pl so that it becomes the lower 32 bits, resulting in two pieces of 64-bit data. FIG. 9 is a time chart showing the operation of FIG. 8, and is the same as FIG. 7 except that P4 is added to MPYOUT.
この発明は上記した実施例に限定されず種々変形した実
施が可能であり、例えば乗算器、加算器、レジスタ等の
出力バッファ部に3−8TATEのものを使用し、その
状態を適宜切換えることで、マルチプレクサを省くこと
もできる。その場合、回数規模の一層の縮少も可能であ
るOまた、入力ディジクル信号系列の各データの分割方
法は、上位、下位半分ずつである必要は必らずしもなく
、データの内容、性質等に応じて任意の分割比を選ぶこ
とができる。The present invention is not limited to the above-described embodiments, and can be implemented in various ways. For example, by using 3-8 TATE for the output buffer sections of multipliers, adders, registers, etc., and switching the state as appropriate. , the multiplexer can also be omitted. In that case, it is possible to further reduce the number of times.In addition, the method of dividing each data of the input digital signal sequence does not necessarily have to be divided into upper and lower halves, but the content and nature of the data Any division ratio can be selected depending on the situation.
第1図はディジタルフ4)レタの基本構成の一例を示す
図、第2図は上記ディジタルフィルタを時分割処理によ
って実現する場合の構成図、第3図は16ビツト×16
ビツトの乗q:ヲ部分積として32ビツト×32ビツト
の乗B’(=行なうアルゴリズムを示す図、第4図は第
3図のアルゴリズムを用いて構成した従来のディジタル
乗算累積加算装置の構成図、第5Mはその動作を示すり
・イムチャート、第6図はこの発明の第1の実施例の構
成図、第7図はその動作を示すタイムチャート、第8図
はこの発明の第2の実施例の構成図、第9図はその動作
を示すタイトチャートである。
11〜14・・・第1〜第4の乗真滲、15・・・第2
の加算器、21.22・・・マルチプレクサ、23・・
・第2の加算器、24.25・・・第1.第2のレジス
タ。Fig. 1 is a diagram showing an example of the basic configuration of a digital filter, Fig. 2 is a block diagram when the above digital filter is implemented by time-division processing, and Fig. 3 is a 16-bit x 16-bit filter.
Bit multiplication q: Partial product of 32 bits x 32 bits B' (=A diagram showing the algorithm to be carried out. Fig. 4 is a block diagram of a conventional digital multiplication accumulative addition device constructed using the algorithm of Fig. 3. , 5M is a time chart showing its operation, FIG. 6 is a configuration diagram of the first embodiment of the present invention, FIG. 7 is a time chart showing its operation, and FIG. 8 is a time chart of the second embodiment of the present invention. The configuration diagram of the embodiment, and FIG. 9 is a tight chart showing its operation.
adder, 21.22... multiplexer, 23...
-Second adder, 24.25...first. Second register.
Claims (2)
タル信号系列をデータ毎に乗算しその乗算結果を累積加
算する装置において、第1のディジタル信号系列の上位
部分データと第2のディジタル信号系列の上位部分デー
タとを乗算する第1の乗算器と、第1のディジタル信号
系列の上位部分データと第2のディジタル信号系列の下
位部分データとを乗算する第2の乗算器と、第1のディ
ジタル信号系列の下位部分データと第2のディジタル信
号系列の上位部分データとを乗算する第3の乗算器と、
第2の乗算器の出力と第3の乗算器の出力とを加算する
第1の加算器と、この第1の加算器の出力と第1の乗算
器の出力とを加算するためと累積加算のための第2の加
算器と、この第2の加算器の出力を一時的に蓄積するた
めの第1.第2のレジスタとを備え、第1の加算器の出
力と第1の乗算器の出力とを位どりを合せて第2の加算
器の2つの入力とし、そのときの第2の加算器の出力を
第1.第2のレジスタの一方に蓄積する第1のモニドと
、第1のレジスタの出力と第2のレジスタの出力とを第
2の加算器の2つの入力とし、そのときの第2の加算器
の出力全灯1.第2のレジスタの他方に蓄積する第2の
モードとを交互に切換えるようにしたこと全特徴とする
ディジタル乗算累積加算装置。(1) The first data consists of parallel multi-bit data. In a device that multiplies a second digital signal series for each data and cumulatively adds the multiplication results, the first a multiplier; a second multiplier that multiplies the upper part data of the first digital signal series by the lower part data of the second digital signal series; a third multiplier that multiplies the upper part data of the digital signal sequence;
a first adder for adding the output of the second multiplier and the output of the third multiplier; a cumulative addition for adding the output of the first adder and the output of the first multiplier; a second adder for temporarily storing the output of this second adder; and a first adder for temporarily storing the output of this second adder. and a second register, the output of the first adder and the output of the first multiplier are matched in order and used as two inputs of the second adder, and the output of the second adder at that time is Set the output to 1st. The first monid accumulated in one of the second registers, the output of the first register, and the output of the second register are the two inputs of the second adder, and the output of the second adder at that time is Output all lights 1. A digital multiplication accumulation addition device characterized in that the second mode of accumulation in the other of the second registers is alternately switched.
タル信号系列をデータ毎に乗算しその乗算結果を累積加
算する装置において、第1のディジタル信号系列の上位
部分データと第2のディジタル信号系列の上位部分デー
タとを乗算する第1の乗算器と、第1のディジタル信号
系列の上位部分データ、と第2のディジタル信号系列の
下位部分データとを乗算する第2の乗算器と、第1のデ
ィジタル信号系列の下位部分データと第2のディジタル
信号系列の上位部分デ−タとを乗算する第3の乗算器と
、第1のディジタル信号系列の下位部分データと第2の
ディジクル信号系列の下位部分データとを乗算しその出
力が第1の乗算器の出力と位どりを合せて結合される第
4の乗算器と、第2の乗算器の出力と第3の乗算器の出
力とを加算する第1の加算器と、この第1の加算器の出
力と第1および第4の乗算器の結合出力とをカロ算する
ためと累積加算のための第2のカロ算器と、この第2の
力目算器の出力を一時的に蓄積するための第1.第2の
レジスタとを備え、第1のり口算器の出力と第1および
第4の乗算器の結合出力とを位どりを合せて第2の加算
器の2つの入力とし、そのときの第2の加算器の出力を
第1.第2のレジスタの一方に蓄積する第1のモードと
、第1のレジスタの出力と第2のレジスタの出力とを第
2の加突:器の2つの入力とし、そのときの第2の加算
器の出力を第1.第2のレジスタの他方に蓄積する第2
のモードとを交互に切換えるようにしたこと全特徴とす
るディジタル乗算累積加算装置。(2) The first data consists of parallel multi-bit data. In a device that multiplies a second digital signal series for each data and cumulatively adds the multiplication results, the first a multiplier; a second multiplier that multiplies the upper part data of the first digital signal series by the lower part data of the second digital signal series; A third multiplier multiplies the upper part data of the digital signal series by the lower part data of the first digital signal series, and the third multiplier multiplies the lower part data of the first digital signal series by the lower part data of the second digital signal series. a fourth multiplier that is coupled in order with the output of the first multiplier; a first adder that adds the output of the second multiplier and the output of the third multiplier; A second Calo calculator is provided for calculating the output of the first adder and the combined output of the first and fourth multipliers, and for cumulative addition, and temporarily converting the output of the second power calculator. 1. a second register, the output of the first multiplier and the combined output of the first and fourth multipliers are matched in order and used as two inputs of the second adder; The output of the adder of the first . The first mode is to accumulate in one of the second registers, and the output of the first register and the output of the second register are the two inputs of the second addition: the second addition at that time. The output of the device is the first. the second one that accumulates in the other of the second registers
A digital multiplication accumulator which is characterized in that the modes are alternately switched.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58068598A JPS59194242A (en) | 1983-04-19 | 1983-04-19 | Digital multiplying and cumulative adding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58068598A JPS59194242A (en) | 1983-04-19 | 1983-04-19 | Digital multiplying and cumulative adding device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59194242A true JPS59194242A (en) | 1984-11-05 |
Family
ID=13378382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58068598A Pending JPS59194242A (en) | 1983-04-19 | 1983-04-19 | Digital multiplying and cumulative adding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59194242A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6373472A (en) * | 1986-09-17 | 1988-04-04 | Fujitsu Ltd | Product sum arithmetic method |
JPH0474219A (en) * | 1990-07-17 | 1992-03-09 | Toshiba Corp | High speed multiplier |
JPH06110659A (en) * | 1992-06-30 | 1994-04-22 | Nec Corp | Microcomputer |
JP2020205045A (en) * | 2019-06-14 | 2020-12-24 | 浦項工科大学校 産学協力団 | Neural network accelerator |
-
1983
- 1983-04-19 JP JP58068598A patent/JPS59194242A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6373472A (en) * | 1986-09-17 | 1988-04-04 | Fujitsu Ltd | Product sum arithmetic method |
JPH0474219A (en) * | 1990-07-17 | 1992-03-09 | Toshiba Corp | High speed multiplier |
JPH06110659A (en) * | 1992-06-30 | 1994-04-22 | Nec Corp | Microcomputer |
JP2020205045A (en) * | 2019-06-14 | 2020-12-24 | 浦項工科大学校 産学協力団 | Neural network accelerator |
US11562218B2 (en) | 2019-06-14 | 2023-01-24 | Samsung Electronics Co., Ltd. | Neural network accelerator |
US11954582B2 (en) | 2019-06-14 | 2024-04-09 | Samsung Electronics Co., Ltd. | Neural network accelerator |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5287299A (en) | Method and apparatus for implementing a digital filter employing coefficients expressed as sums of 2 to an integer power | |
US20040117424A1 (en) | High-speed/low power finite impulse response filter | |
JP2009026308A (en) | High speed and efficient matrix multiplication hardware module | |
WO2021056711A1 (en) | Interpolation filter system implemented by digital circuit | |
JPS6347874A (en) | Arithmetic unit | |
JPH0661792A (en) | Digital filter | |
Gokhale et al. | Design of area and delay efficient Vedic multiplier using Carry Select Adder | |
JPH0377418A (en) | Digital filter | |
US4740906A (en) | Digital lattice filter with multiplexed fast adder/full adder for performing sequential multiplication and addition operations | |
JPS59194242A (en) | Digital multiplying and cumulative adding device | |
JPH08221256A (en) | Multiplier and product-sum arithmetic unit | |
JPH0776914B2 (en) | Multiplication circuit | |
JPH10111791A (en) | Division device | |
Shilparani et al. | FPGA implementation of FIR filter architecture using MCM technology with pipelining | |
JPH06223097A (en) | Circuit description generating method for multiplier and product sum computing unit | |
JPH0816903B2 (en) | Multiply-accumulate operation circuit | |
kumar Bhadavath et al. | An Efficient Approximation Look Up Table Based Distributed Arithmetic (DA) VLSI Architecture for Finite Impulse Response | |
JPS6259828B2 (en) | ||
Stamenković et al. | Constant-coefficient FIR filters based on residue number system arithmetic | |
JP2765516B2 (en) | Multiply-accumulate unit | |
Gopi et al. | 128 Bit unsigned multiplier design and implementation using an efficient SQRT-CSLA | |
JP2864597B2 (en) | Digital arithmetic circuit | |
JP2960595B2 (en) | Digital signal processor | |
Karthik et al. | FPGA implementation of high speed vedic multipliers | |
JPS60254372A (en) | Arithmetic unit for sum of products |