JPH02201686A - 半導体集積回路装置 - Google Patents
半導体集積回路装置Info
- Publication number
- JPH02201686A JPH02201686A JP2109089A JP2109089A JPH02201686A JP H02201686 A JPH02201686 A JP H02201686A JP 2109089 A JP2109089 A JP 2109089A JP 2109089 A JP2109089 A JP 2109089A JP H02201686 A JPH02201686 A JP H02201686A
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic circuit
- circuit unit
- signal
- multiplier
- arithmetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000004065 semiconductor Substances 0.000 title claims description 9
- 238000005070 sampling Methods 0.000 claims abstract description 46
- 230000003111 delayed effect Effects 0.000 claims abstract description 14
- 230000001934 delay Effects 0.000 claims description 3
- 238000007792 addition Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Complex Calculations (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、半導体集積回路装置に係わり、特に積和演算
の実行に適した半導体集積回路装置に関する。
の実行に適した半導体集積回路装置に関する。
(従来の技術)
近年、リアルタイム画像信号処理用LSIにおいては、
大量の演算をリアルタイムで実行するために、超高速、
超高密度な演算回路構成が要求されるようになっている
。
大量の演算をリアルタイムで実行するために、超高速、
超高密度な演算回路構成が要求されるようになっている
。
画像信号処理において、最も多用される演算としては、
いわゆる積和演算かあげられる。従来、この積和演算を
行うLSIにおいては、第4図に示すような回路構成が
多く用いられている。この図においては、乗算器20.
加算器30及び1サンプリング周期遅延回路40からな
る、同一の演算回路ユニット10か複数個接続されてい
る。この回路構成のポイントは、全ての演算回路ユニッ
ト10の第1の入力端子11が同一の信号線に接続され
ていること、同一の演算ユニット10を用いているため
、共通の信号線から入力された値は全ての演算回路ユニ
ット10で同時に乗算の実行を終了し、それに続く加算
も同時に実行を終了すること、及びその演算結果は1サ
ンプリング周期遅延回路40で1サンプリング周期だけ
遅延されたのち、次段の演算回路ユニット10に入力さ
れることである。
いわゆる積和演算かあげられる。従来、この積和演算を
行うLSIにおいては、第4図に示すような回路構成が
多く用いられている。この図においては、乗算器20.
加算器30及び1サンプリング周期遅延回路40からな
る、同一の演算回路ユニット10か複数個接続されてい
る。この回路構成のポイントは、全ての演算回路ユニッ
ト10の第1の入力端子11が同一の信号線に接続され
ていること、同一の演算ユニット10を用いているため
、共通の信号線から入力された値は全ての演算回路ユニ
ット10で同時に乗算の実行を終了し、それに続く加算
も同時に実行を終了すること、及びその演算結果は1サ
ンプリング周期遅延回路40で1サンプリング周期だけ
遅延されたのち、次段の演算回路ユニット10に入力さ
れることである。
第4図に示す回路は、次のような特徴を持っており、L
SI化に適している。第1に、1サンプリング周期遅延
回路40の存在により、サンプリングされた信号を予め
蓄えるためのレジスタ等が不要なため、少ないハードウ
ェアで済むこと。第2に、]サンプリング周期遅延回路
40が加算結果を1サンプリング周期たけ遅延させると
いうだけでなく、積和演算における積項の加算全体をパ
イプライン化していることにより、高速化に適した回路
構成となっていること。第3に、同一の演算回路ユニッ
ト10を用いていることから、回路構成が規則的である
ことである。
SI化に適している。第1に、1サンプリング周期遅延
回路40の存在により、サンプリングされた信号を予め
蓄えるためのレジスタ等が不要なため、少ないハードウ
ェアで済むこと。第2に、]サンプリング周期遅延回路
40が加算結果を1サンプリング周期たけ遅延させると
いうだけでなく、積和演算における積項の加算全体をパ
イプライン化していることにより、高速化に適した回路
構成となっていること。第3に、同一の演算回路ユニッ
ト10を用いていることから、回路構成が規則的である
ことである。
し、かじながら、この種の回路構成にあっては次のよう
な問題があった。即ち、全ての演算回路ユニットに共通
接続されている信号線(この場合、入力端子11に接続
される信号線)の配線長が長くなり、さらにファンアウ
ト数が多くなり、従ってその信号線の負荷容量が非常に
大きくなるという問題があった。
な問題があった。即ち、全ての演算回路ユニットに共通
接続されている信号線(この場合、入力端子11に接続
される信号線)の配線長が長くなり、さらにファンアウ
ト数が多くなり、従ってその信号線の負荷容量が非常に
大きくなるという問題があった。
上記の問題は、サンプリング周期が乗算器や加算器の演
算時間に比べて十分大きい場合は特に問題ではない。し
かし、最近のリアルタイム画像信号処理分野ではサンプ
リング周期は既に100nsを切っており、サンプリン
グ周期は益々小さくなる傾向にある。これに対応するた
め、乗算器や加算器の内部はパイプライン化されている
ことが既に一般的であり、前記第4図の回路においても
そうなっている。さらに、サンプリング周期が小さくな
る傾向から、乗算器や加算器の並列、パイプライン化は
、今後も益々進んでいくと考えられる。
算時間に比べて十分大きい場合は特に問題ではない。し
かし、最近のリアルタイム画像信号処理分野ではサンプ
リング周期は既に100nsを切っており、サンプリン
グ周期は益々小さくなる傾向にある。これに対応するた
め、乗算器や加算器の内部はパイプライン化されている
ことが既に一般的であり、前記第4図の回路においても
そうなっている。さらに、サンプリング周期が小さくな
る傾向から、乗算器や加算器の並列、パイプライン化は
、今後も益々進んでいくと考えられる。
このように高速化が進んでいくと、結局は演算回路ユニ
ットに共通接続されている信号線の負荷容量か、高速化
に対する問題として最後まで残ることになる。この問題
を解決するためには、チップのレイアウトに十分な注意
を払い、その配線の長さを短くするということは当然考
えられるが、前述のように大規模化が進めばそれにも限
界があり、基本的にはその配線の負荷容量を駆動するだ
けの十分大きなドライバが必要となってくる。なお、駆
動力の大きなドライバは、消費電力が大きくなるばかり
でなく、高集積化にも望ましくない。
ットに共通接続されている信号線の負荷容量か、高速化
に対する問題として最後まで残ることになる。この問題
を解決するためには、チップのレイアウトに十分な注意
を払い、その配線の長さを短くするということは当然考
えられるが、前述のように大規模化が進めばそれにも限
界があり、基本的にはその配線の負荷容量を駆動するだ
けの十分大きなドライバが必要となってくる。なお、駆
動力の大きなドライバは、消費電力が大きくなるばかり
でなく、高集積化にも望ましくない。
(発明が解決しようとする課題)
このように、従来の第4図に示す如き積和波算回路の構
成では、全ての演算回路ユニットに接続されている信号
線の負荷容量が非常に大きく、今後、その配線の負荷容
量が高速化に対する問題となってくると考えられる。ま
た、この問題を解決するためには人容瓜のドライバが必
要となるが、大きなドライバを使用することは高集積化
にとって望ましくない。
成では、全ての演算回路ユニットに接続されている信号
線の負荷容量が非常に大きく、今後、その配線の負荷容
量が高速化に対する問題となってくると考えられる。ま
た、この問題を解決するためには人容瓜のドライバが必
要となるが、大きなドライバを使用することは高集積化
にとって望ましくない。
本発明は、上記事情を考慮してなされたもので、その目
的とするところは、従来の積和演算回路の回路構成上の
メリットを損なうことなく積和演算を実行することがで
き、且つ大きなドライバも必要としない半導体集積回路
装置を提供することにある。
的とするところは、従来の積和演算回路の回路構成上の
メリットを損なうことなく積和演算を実行することがで
き、且つ大きなドライバも必要としない半導体集積回路
装置を提供することにある。
[発明の構成]
(課題を解決するための手段)
本発明の骨子は、全ての演算回路ユニットに画像信号等
を並列的に供給するのではなく、演算回路ユニットの内
部で遅延した信号を次の演算回路ユニットに供給するこ
とにある。
を並列的に供給するのではなく、演算回路ユニットの内
部で遅延した信号を次の演算回路ユニットに供給するこ
とにある。
即ち本発明は、所定のサンプリング周期でザンプリング
され第1の入力端子から入力される信号と第2の入力端
子から入力される信号とを乗算し、且つ内部に備えた遅
延回路により必要なタイミングで部分積を発生しパイプ
ライン処理で加算を実行して乗算する乗算器と、この乗
算器の出力信号と第3の入力端子から入力される信号と
を加算する加算器と、この加算器の出力信号を1サンプ
リング周期遅延し第1の出力端子に出力する遅延回路、
とからなる演算回路ユニットを同一チップ上に複数個配
置し、且つ演算回路ユニットの第1の出力端子を次の演
算回路ユニットの第3の入力端子に接続して積和演算を
行う半導体集積回路装置において、前記第1の入力端子
からの入力信号を前記乗算器内部の遅延回路で2サンプ
リング周期だけ遅延させて第2の出力端子に出力させ、
各々の演算回路ユニットの第2の出力端子を次の演算回
路ユニットの第1の入力端子に接続するようにしたもの
である。
され第1の入力端子から入力される信号と第2の入力端
子から入力される信号とを乗算し、且つ内部に備えた遅
延回路により必要なタイミングで部分積を発生しパイプ
ライン処理で加算を実行して乗算する乗算器と、この乗
算器の出力信号と第3の入力端子から入力される信号と
を加算する加算器と、この加算器の出力信号を1サンプ
リング周期遅延し第1の出力端子に出力する遅延回路、
とからなる演算回路ユニットを同一チップ上に複数個配
置し、且つ演算回路ユニットの第1の出力端子を次の演
算回路ユニットの第3の入力端子に接続して積和演算を
行う半導体集積回路装置において、前記第1の入力端子
からの入力信号を前記乗算器内部の遅延回路で2サンプ
リング周期だけ遅延させて第2の出力端子に出力させ、
各々の演算回路ユニットの第2の出力端子を次の演算回
路ユニットの第1の入力端子に接続するようにしたもの
である。
(作用)
本発明によれば、1番目の演算回路ユニットの第1の入
力端子にサンプリングされた信号が入力され、第2の入
力端子に係数等の値が入力される。また、第3の入力端
子には値0が入力される。その結果、1番目の演算回路
ユニットでは乗算のみが実行され、その乗算結果が1サ
ンプリング周期遅延回路で1サンプリング周期だけ遅延
されたのち、2番目の演算回路ユニットに出力される。
力端子にサンプリングされた信号が入力され、第2の入
力端子に係数等の値が入力される。また、第3の入力端
子には値0が入力される。その結果、1番目の演算回路
ユニットでは乗算のみが実行され、その乗算結果が1サ
ンプリング周期遅延回路で1サンプリング周期だけ遅延
されたのち、2番目の演算回路ユニットに出力される。
一方、サンプリングされた信号は、1番目の演算回路ユ
ニットの乗算器内部の遅延回路を経由して、2番目の演
算回路ユニットに出力される。2番目の演算回路ユニッ
トの第1の入力端子には1番目の演算回路ユニットから
のサンプリングされた信号が入力され、第2の入力端子
には係数等の値が入力される。また、第3の入力端子に
は、1番目の演算回路ユニットからの乗算結果が入力さ
れる。その結果、2番目の演算回路ユニットでは、その
演算回路ユニットでの乗算結果と1番目の演算回路ユニ
ットからの乗算結果とが加算され、積和演算が実行され
る。
ニットの乗算器内部の遅延回路を経由して、2番目の演
算回路ユニットに出力される。2番目の演算回路ユニッ
トの第1の入力端子には1番目の演算回路ユニットから
のサンプリングされた信号が入力され、第2の入力端子
には係数等の値が入力される。また、第3の入力端子に
は、1番目の演算回路ユニットからの乗算結果が入力さ
れる。その結果、2番目の演算回路ユニットでは、その
演算回路ユニットでの乗算結果と1番目の演算回路ユニ
ットからの乗算結果とが加算され、積和演算が実行され
る。
ここで、1番目の演算回路ユニットの第1の入力端子か
ら、前記2つの乗算結果が得られるまでに要する遅延時
間を比べると、2番目の演算回路ユニットでの乗算結果
が得られるまでに(加算器の遅延時間+2サンプリング
周期十乗算器の遅延時間)の時間を要し、一方1番目の
演算回路ユニットからの乗算結果が得られるまでに(乗
算器の遅延時間士加算器の遅延時間+1サンプリング周
期)の時間を要する。従って、2番目の演算回路ユニッ
トでの乗算結果が、1番目の演算回路ユニットからの演
算結果よりも相対的に1サンプリング周期だけ遅れて加
算されることになる。
ら、前記2つの乗算結果が得られるまでに要する遅延時
間を比べると、2番目の演算回路ユニットでの乗算結果
が得られるまでに(加算器の遅延時間+2サンプリング
周期十乗算器の遅延時間)の時間を要し、一方1番目の
演算回路ユニットからの乗算結果が得られるまでに(乗
算器の遅延時間士加算器の遅延時間+1サンプリング周
期)の時間を要する。従って、2番目の演算回路ユニッ
トでの乗算結果が、1番目の演算回路ユニットからの演
算結果よりも相対的に1サンプリング周期だけ遅れて加
算されることになる。
以下に続く演算回路ユニットも同様の積和演算を実行す
る。そして、最後の積和演算回路ユニットの第1の出力
端子より最終的な積和演算結果が出力される。
る。そして、最後の積和演算回路ユニットの第1の出力
端子より最終的な積和演算結果が出力される。
なお、第1の入力端子を共通接続した前記第4図に示す
演算回路では、1番目の演算回路ユニットからの演算結
果が、2番目の演算回路ユニットでの乗算結果よりも相
対的に1サンプリング周期だけ遅れて加算されることに
なる。2番目以降も同様である。従って、最後の演算回
路ユニットの第1の出力端子からは、連続的に供給され
るサンプリング信号(例えば、画像信号)と係数との積
を、隣接するもの同士を演算回路ユニットの数たけ加算
した結果が、1サンプリング信号だけずらして順次前ら
れることになる。これは、出力される演算結果が逆に得
られるだけで、全体として得られる積和演算結果は本発
明と同様である。つまり、本発明では、演算回路ユニッ
トへの信号入力の仕方が異なるものの、前記第4図に示
す回路と略同様の積和演算結果が得られることになる。
演算回路では、1番目の演算回路ユニットからの演算結
果が、2番目の演算回路ユニットでの乗算結果よりも相
対的に1サンプリング周期だけ遅れて加算されることに
なる。2番目以降も同様である。従って、最後の演算回
路ユニットの第1の出力端子からは、連続的に供給され
るサンプリング信号(例えば、画像信号)と係数との積
を、隣接するもの同士を演算回路ユニットの数たけ加算
した結果が、1サンプリング信号だけずらして順次前ら
れることになる。これは、出力される演算結果が逆に得
られるだけで、全体として得られる積和演算結果は本発
明と同様である。つまり、本発明では、演算回路ユニッ
トへの信号入力の仕方が異なるものの、前記第4図に示
す回路と略同様の積和演算結果が得られることになる。
(実施例)
以下、本発明の詳細を図示の実施例によって説明する。
第1図は本発明の一実施例に関わる半導体集積回路装置
の概略構成を示すブロック図である。
の概略構成を示すブロック図である。
本装置は、演算回路ユニッ1−10 (10,、〜10
m)を直列的に接続して構成されている。
m)を直列的に接続して構成されている。
個々の演算回路ユニット10は全て同一構成であり、乗
算器20.加算器30及び1サンプリング周期遅延回路
40等から形成されており、3つの入力端子I、、I。
算器20.加算器30及び1サンプリング周期遅延回路
40等から形成されており、3つの入力端子I、、I。
、I3と2つの出力端子01,0□とを備えている。
乗算器20は、遅延回路21(21,、〜21n)、デ
コード回路22及び加算器23から形成されている。1
段目の演算回路ユニット10の第1の入力端子I、には
画像信号等のサンプリング信号が供給されるが、この信
号は乗算器20内の1番目の遅延回路211に供給され
る。遅延回路21は直列に接続されており、それぞれの
出力がデコード回路22に供給される。第2の入力端子
I2には係数等を指定する信号が供給されるが、この信
号はデコード回路22に供給される。デコード回路22
は乗算をパイプライン処理で行うものであり、その各出
力は加算器23に供給される。そして、この加算器23
の出力が乗算器20の乗算結果として加算器30に供給
されている。
コード回路22及び加算器23から形成されている。1
段目の演算回路ユニット10の第1の入力端子I、には
画像信号等のサンプリング信号が供給されるが、この信
号は乗算器20内の1番目の遅延回路211に供給され
る。遅延回路21は直列に接続されており、それぞれの
出力がデコード回路22に供給される。第2の入力端子
I2には係数等を指定する信号が供給されるが、この信
号はデコード回路22に供給される。デコード回路22
は乗算をパイプライン処理で行うものであり、その各出
力は加算器23に供給される。そして、この加算器23
の出力が乗算器20の乗算結果として加算器30に供給
されている。
ここで、乗算器20では、入力端子■2からの入力信号
(係数)がデコード回路22によりデコードされ、その
結果、複数個の部分積を発生する。この複数個の部分積
は加算器23でパイプラインで加算される。乗算を正し
く実行するためには、パイプラインで加算されている個
々の部分積は、入力端チエ、からの同一時刻の入力信号
から得られたものでなければならない。
(係数)がデコード回路22によりデコードされ、その
結果、複数個の部分積を発生する。この複数個の部分積
は加算器23でパイプラインで加算される。乗算を正し
く実行するためには、パイプラインで加算されている個
々の部分積は、入力端チエ、からの同一時刻の入力信号
から得られたものでなければならない。
しかし、入力端子■1からの入力信号は、サンプリング
周期で次々に変化する。もし、乗算器20内部に遅延回
路21が存在しなければ、複数個の部分積を同時に発生
して次々にパイプラインで加算しなければならない。こ
の方式は、回路構成が複雑で面積が大きくなるため、高
集積化には適さない。乗算器20の内部に遅延回路2]
−が存在することで、部分積を同時に発生する必要がな
く、必要なタイミングで部分積を発生してパイプライン
で加算を実行することができる。この方式は、高集積化
にも適している。
周期で次々に変化する。もし、乗算器20内部に遅延回
路21が存在しなければ、複数個の部分積を同時に発生
して次々にパイプラインで加算しなければならない。こ
の方式は、回路構成が複雑で面積が大きくなるため、高
集積化には適さない。乗算器20の内部に遅延回路2]
−が存在することで、部分積を同時に発生する必要がな
く、必要なタイミングで部分積を発生してパイプライン
で加算を実行することができる。この方式は、高集積化
にも適している。
一方、1段目の演算回路ユニット101の第3の入力端
子■3は接地されており、この入力端子■3は加算器3
0に接続されている。加算器30では、乗算器20の乗
算出力と入力端子■3の信号(この場合は0)とを加算
するもので、その加算出力は1サンプリング周期遅延回
路40に供給される。そして、1サンプリング周期遅延
回路40を通して遅延された信号は第2の出力端子02
に供給される。出力端子02は次の演算回路ユニット1
0□の第3の入力端子I3に接続されている。
子■3は接地されており、この入力端子■3は加算器3
0に接続されている。加算器30では、乗算器20の乗
算出力と入力端子■3の信号(この場合は0)とを加算
するもので、その加算出力は1サンプリング周期遅延回
路40に供給される。そして、1サンプリング周期遅延
回路40を通して遅延された信号は第2の出力端子02
に供給される。出力端子02は次の演算回路ユニット1
0□の第3の入力端子I3に接続されている。
ここまでの構成は前記第4図に示した従来装置と同様で
あり、本実施例がこれと異なる点は、各演算回路ユニッ
ト10の入力端子■、を共通接続するのではなく、演算
回路ユニット10の一部を構成する乗算器20内の出力
を、次段の演算回路ユニット10の入力端子11に供給
するようにしたことにある。即ち、演算回路ユニット1
0の乗算器20内の2番目の遅延回路]3 21□を介した信号が第2の出力端子02に出力され、
この出力端子02は次段の演算回路ユニット10□の第
1の入力端子■1に接続されている。
あり、本実施例がこれと異なる点は、各演算回路ユニッ
ト10の入力端子■、を共通接続するのではなく、演算
回路ユニット10の一部を構成する乗算器20内の出力
を、次段の演算回路ユニット10の入力端子11に供給
するようにしたことにある。即ち、演算回路ユニット1
0の乗算器20内の2番目の遅延回路]3 21□を介した信号が第2の出力端子02に出力され、
この出力端子02は次段の演算回路ユニット10□の第
1の入力端子■1に接続されている。
このような構成であれば、1段目の演算回路ユニット1
0.の入力端子I、に入力された信号は、演算回路ユニ
ット10.で(2サンプリング周期)遅延されたのち、
2段目の演算回路ユニット102の入力端子l、に供給
される。
0.の入力端子I、に入力された信号は、演算回路ユニ
ット10.で(2サンプリング周期)遅延されたのち、
2段目の演算回路ユニット102の入力端子l、に供給
される。
2段目以降も同様である。また、1段目の演算回路ユニ
ット10.の加算器30の出力は(1サンプリング周期
)遅延されて2段目の演算回路ユニット10□の入力端
子I3に供給される。
ット10.の加算器30の出力は(1サンプリング周期
)遅延されて2段目の演算回路ユニット10□の入力端
子I3に供給される。
2段目以降も同様である。従って、2段目の演算回路ユ
ニット10□では、該ユニット102での乗算結果と1
段目の演算回路10.からの乗算結果とが加算される。
ニット10□では、該ユニット102での乗算結果と1
段目の演算回路10.からの乗算結果とが加算される。
ここで、1段目の演算回路ユニット101の第1の入力
端子■1から前記2つの乗算結果が得られるまでの時間
を各遅延時間を比べると、2段目の演算回路ユニット1
0□内の乗算結果が得られるまでに(2サンプリング周
期十乗算器の遅延時間)の時間を要し、一方1段目の演
算回路ユニット101からの乗算結果が得られるまでに
(1サンプリング周期十乗算器の遅延時間)の時間を要
する。従って、2段目の演算回路ユニット102内の乗
算結果の方が、1段目の演算回路ユニット101からの
乗算結果よりも相対的に1サンプリング周期だけ遅れる
ことになる。以下に続く演算回路ユニット103〜10
mも同様の積和演算を実行する。そして、最終段の演算
回路ユニット10mの第1の出力端子01から、最終的
な積和演算結果が出力されることになる。
端子■1から前記2つの乗算結果が得られるまでの時間
を各遅延時間を比べると、2段目の演算回路ユニット1
0□内の乗算結果が得られるまでに(2サンプリング周
期十乗算器の遅延時間)の時間を要し、一方1段目の演
算回路ユニット101からの乗算結果が得られるまでに
(1サンプリング周期十乗算器の遅延時間)の時間を要
する。従って、2段目の演算回路ユニット102内の乗
算結果の方が、1段目の演算回路ユニット101からの
乗算結果よりも相対的に1サンプリング周期だけ遅れる
ことになる。以下に続く演算回路ユニット103〜10
mも同様の積和演算を実行する。そして、最終段の演算
回路ユニット10mの第1の出力端子01から、最終的
な積和演算結果が出力されることになる。
このように本実施例によれば、前記第4図に示した従来
装置と同様に、画像信号等のサンプリング信号の積和演
算を行うことができる。そしてこの場合、演算回路ユニ
ット10の全ての入力端子11が共通接続されるのでは
なく、外部からのサンプリング信号が入力される1段目
の演算回路ユニット101の入力端子■、を除いて、他
の入力端子I、は各々前段の演算回路ユニット10の出
力端子02に接続されることになる。従って、回路規模
の増大に伴い入力端子11に接続される信号線が長くな
るという問題を避けることができ、これにより入力に関
する配線の負荷容量を大幅に低減することができ、大き
なドライバ等を用いる必要がなくなる。また、この問題
を解決するために特に付加的な回路を必要とせず、従来
の積和演算回路の回路構成上のメリットを失うこともな
い。
装置と同様に、画像信号等のサンプリング信号の積和演
算を行うことができる。そしてこの場合、演算回路ユニ
ット10の全ての入力端子11が共通接続されるのでは
なく、外部からのサンプリング信号が入力される1段目
の演算回路ユニット101の入力端子■、を除いて、他
の入力端子I、は各々前段の演算回路ユニット10の出
力端子02に接続されることになる。従って、回路規模
の増大に伴い入力端子11に接続される信号線が長くな
るという問題を避けることができ、これにより入力に関
する配線の負荷容量を大幅に低減することができ、大き
なドライバ等を用いる必要がなくなる。また、この問題
を解決するために特に付加的な回路を必要とせず、従来
の積和演算回路の回路構成上のメリットを失うこともな
い。
なお、前記乗算器20は説明を簡単にするために第1図
では簡略化して示したが、これを(特に、デコーダ22
及び加算器23を)より具体的に示すと第2図のように
なる。但し、この図では入力信号を8ビツトとしている
。この回路は、前述した遅延回路21(21+、〜21
8)と共に、単位乗算器51(511,〜51g)、0
〜7ビツトシフトするためのレジスタ52 (52,、
〜、52g)、加算器53(53,、〜、53s)及び
加算出力を保持するためのレジスタ54 (54,、〜
、54s)等から構成されている。
では簡略化して示したが、これを(特に、デコーダ22
及び加算器23を)より具体的に示すと第2図のように
なる。但し、この図では入力信号を8ビツトとしている
。この回路は、前述した遅延回路21(21+、〜21
8)と共に、単位乗算器51(511,〜51g)、0
〜7ビツトシフトするためのレジスタ52 (52,、
〜、52g)、加算器53(53,、〜、53s)及び
加算出力を保持するためのレジスタ54 (54,、〜
、54s)等から構成されている。
この乗算器20では、8ビット入力化号が1段目の単位
乗算器511により係数の最下位ビットに1と乗算され
、レジスタ521及び加算器53.を介してレジスタ5
4、に保持される。
乗算器511により係数の最下位ビットに1と乗算され
、レジスタ521及び加算器53.を介してレジスタ5
4、に保持される。
同様に、8ビット入力化号が2段目の単位乗算器511
により係数の最下位ビットより1つ上のビットに2と乗
算され、レジスタ522により1ビツトシフト(桁上げ
)される。そして、加算器532によりレジスタ541
に保持された信号と加算され、その加算結果がレジスタ
54゜に保持される。ここで、2段目の信号処理におい
ては1段目の遅延回路21□の存在により、1段目の信
号処理よりも1サンプリング周期遅れている。このため
、レジスタ54、に格納された信号とレジスタ52□に
格納された信号とは同一時刻における信号となり、これ
により加算器53□により8ビット入力化号と係数に、
、に2とを掛けた値の和が求められる。
により係数の最下位ビットより1つ上のビットに2と乗
算され、レジスタ522により1ビツトシフト(桁上げ
)される。そして、加算器532によりレジスタ541
に保持された信号と加算され、その加算結果がレジスタ
54゜に保持される。ここで、2段目の信号処理におい
ては1段目の遅延回路21□の存在により、1段目の信
号処理よりも1サンプリング周期遅れている。このため
、レジスタ54、に格納された信号とレジスタ52□に
格納された信号とは同一時刻における信号となり、これ
により加算器53□により8ビット入力化号と係数に、
、に2とを掛けた値の和が求められる。
これを繰返すことにより、最終段のレジスタ548から
は8ビツトの入力信号と8ビツトの係数との積が出力さ
れることになる。
は8ビツトの入力信号と8ビツトの係数との積が出力さ
れることになる。
第3図は本発明の他の実施例の概略構成を示すブロック
図である。なお、第1図と同一部分には同一符号を付し
て、その詳しい説明は省略する。
図である。なお、第1図と同一部分には同一符号を付し
て、その詳しい説明は省略する。
この実施例が先に説明した実施例と異なる点は、前記1
サンプリング周期遅延回路40を省略し、演算回路ユニ
ット10の前記乗算回路20内の遅延回路21で1サン
プリング周期遅延した信号を、次の演算回路ユニット1
0に供給したことにある。
サンプリング周期遅延回路40を省略し、演算回路ユニ
ット10の前記乗算回路20内の遅延回路21で1サン
プリング周期遅延した信号を、次の演算回路ユニット1
0に供給したことにある。
この場合、2段目の演算回路ユニット102内の乗算結
果が得られるまでに(1サンプリング周期十乗算器の遅
延時間)の時間を要し、方1段目の演算回路ユニット1
0、からの乗算結果が得られるまでに(乗算器の遅延時
間)の時間を要する。従って、2段目の演算回路ユニブ
ト102内の乗算結果の方が、1段目の演算回路ユニッ
ト10.からの乗算結果よりも相対的に1サンプリング
周期だけ遅れることになる。
果が得られるまでに(1サンプリング周期十乗算器の遅
延時間)の時間を要し、方1段目の演算回路ユニット1
0、からの乗算結果が得られるまでに(乗算器の遅延時
間)の時間を要する。従って、2段目の演算回路ユニブ
ト102内の乗算結果の方が、1段目の演算回路ユニッ
ト10.からの乗算結果よりも相対的に1サンプリング
周期だけ遅れることになる。
従って、先の実施例と同様に積和演算を実行することが
でき、先の実施例と同様の効果が得られる。
でき、先の実施例と同様の効果が得られる。
なお、本発明は上述した各実施例に限定されるものでは
なく、その要旨を逸脱しない範囲で、種々変形して実施
することができる。
なく、その要旨を逸脱しない範囲で、種々変形して実施
することができる。
[発明の効果]
以上詳述したように本発明によれば、全ての演算回路ユ
ニットに画像信号等のサンプリング信号を並列的に供給
するのではなく、演算回路ユニットの内部で遅延した信
号を次の演算回路ユニットに供給しているので、入力信
号線の長さを短くすることができ、大きなドライバを用
いることなく、従来の積和演算回路と同様に積和演算を
実行することができる。
ニットに画像信号等のサンプリング信号を並列的に供給
するのではなく、演算回路ユニットの内部で遅延した信
号を次の演算回路ユニットに供給しているので、入力信
号線の長さを短くすることができ、大きなドライバを用
いることなく、従来の積和演算回路と同様に積和演算を
実行することができる。
第1図は本発明の一実施例に係わる半導体集積回路装置
の概略構成を示すブロック図、第2図は上記装置に用い
た乗算回路の具体的構成を示すブロック図、第3図は本
発明の他の実施例の概略構成を示すブロック図、第4図
は従来装置の概略構成を示すブロック図である。 10(10,〜10m)・・・演算回路ユニット、20
・・・乗算器、21(21,、〜21o)・・・遅延回
路、22・・・デコード回路、23・・・乗算器20内
の加算器、30・・・加算器、40・・・]サンプリン
グ周期遅延回路、I、、I2,13・・・入力端子、0
1,02・・・出力端子。 出願人代理人 弁理士 鈴 汀 武 彦第 図
の概略構成を示すブロック図、第2図は上記装置に用い
た乗算回路の具体的構成を示すブロック図、第3図は本
発明の他の実施例の概略構成を示すブロック図、第4図
は従来装置の概略構成を示すブロック図である。 10(10,〜10m)・・・演算回路ユニット、20
・・・乗算器、21(21,、〜21o)・・・遅延回
路、22・・・デコード回路、23・・・乗算器20内
の加算器、30・・・加算器、40・・・]サンプリン
グ周期遅延回路、I、、I2,13・・・入力端子、0
1,02・・・出力端子。 出願人代理人 弁理士 鈴 汀 武 彦第 図
Claims (1)
- 【特許請求の範囲】 所定のサンプリング周期でサンプリングされ第1の入力
端子から入力される信号と第2の入力端子から入力され
る信号とを乗算する乗算器と、この乗算器の出力信号と
第3の入力端子から入力される信号とを加算する加算器
と、この加算器の出力信号を1サンプリング周期遅延し
第1の出力端子に出力する遅延回路、とからなる演算回
路ユニットを同一チップ上に複数個配置し、且つ演算回
路ユニットの第1の出力端子を次の演算回路ユニットの
第3の入力端子に接続して積和演算を行う半導体集積回
路装置において、 前記乗算器は、内部に備えた遅延回路により必要なタイ
ミングで部分積を発生しパイプライン処理で加算を実行
するものであり、 前記第1の入力端子からの入力信号を前記乗算器内部の
遅延回路で2サンプリング周期だけ遅延させて第2の出
力端子に出力させ、各々の演算回路ユニットの第2の出
力端子を次の演算回路ユニットの第1の入力端子に接続
してなることを特徴とする半導体集積回路装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2109089A JP2825255B2 (ja) | 1989-01-31 | 1989-01-31 | 半導体集積回路装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2109089A JP2825255B2 (ja) | 1989-01-31 | 1989-01-31 | 半導体集積回路装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02201686A true JPH02201686A (ja) | 1990-08-09 |
JP2825255B2 JP2825255B2 (ja) | 1998-11-18 |
Family
ID=12045173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2109089A Expired - Fee Related JP2825255B2 (ja) | 1989-01-31 | 1989-01-31 | 半導体集積回路装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2825255B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6125438A (en) * | 1997-04-21 | 2000-09-26 | Matsushita Electrical Industrial Co., Ltd. | Data processor |
-
1989
- 1989-01-31 JP JP2109089A patent/JP2825255B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6125438A (en) * | 1997-04-21 | 2000-09-26 | Matsushita Electrical Industrial Co., Ltd. | Data processor |
Also Published As
Publication number | Publication date |
---|---|
JP2825255B2 (ja) | 1998-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100834178B1 (ko) | Mac 연산 방법과 mac 연산을 포함하는 장치, 시스템 및 머신 판독가능한 매체 | |
US5325320A (en) | Area efficient multiplier for use in an integrated circuit | |
US4791600A (en) | Digital pipelined heterodyne circuit | |
US5010510A (en) | Multiplying unit circuit | |
US4802111A (en) | Cascadable digital filter processor employing moving coefficients | |
US5257217A (en) | Area-efficient multiplier for use in an integrated circuit | |
JPH02201686A (ja) | 半導体集積回路装置 | |
Pathan et al. | An optimised 3× 3 shift and add multiplier on FPGA | |
US4041296A (en) | High-speed digital multiply-by-device | |
US5457646A (en) | Partial carry-save pipeline multiplier | |
JPS6310263A (ja) | ベクトル処理装置 | |
JP3155026B2 (ja) | 累算器 | |
USRE37335E1 (en) | Ripple carry logic and method | |
SivaCharanKumar et al. | Design and implementation of RADIX-8 based 32-bit pipelined multiplier by using CLA | |
JPH077336B2 (ja) | マイクロ命令シ−ケンサ | |
KR0157337B1 (ko) | 디지탈신호 처리기의 멀티비트 가산기 | |
JPH0421026A (ja) | 高桁乗算装置 | |
JPH0541632A (ja) | Firデジタルフイルタ装置 | |
JPH04160663A (ja) | ディジタル信号処理装置 | |
WO2000034853A1 (en) | A serial-parallel binary multiplier | |
JPS63167970A (ja) | 演算装置 | |
JPH05108693A (ja) | Iirデジタルフイルタ装置 | |
JPH0773161A (ja) | 演算装置 | |
JPH01109427A (ja) | 2進数乗算方式 | |
JPH08202532A (ja) | 乗算回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |