JP2825255B2 - 半導体集積回路装置 - Google Patents

半導体集積回路装置

Info

Publication number
JP2825255B2
JP2825255B2 JP2109089A JP2109089A JP2825255B2 JP 2825255 B2 JP2825255 B2 JP 2825255B2 JP 2109089 A JP2109089 A JP 2109089A JP 2109089 A JP2109089 A JP 2109089A JP 2825255 B2 JP2825255 B2 JP 2825255B2
Authority
JP
Japan
Prior art keywords
circuit unit
signal
arithmetic circuit
multiplier
input terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2109089A
Other languages
English (en)
Other versions
JPH02201686A (ja
Inventor
直行 畑中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2109089A priority Critical patent/JP2825255B2/ja
Publication of JPH02201686A publication Critical patent/JPH02201686A/ja
Application granted granted Critical
Publication of JP2825255B2 publication Critical patent/JP2825255B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、半導体集積回路装置に係わり、特に積和演
算の実行に適した半導体集積回路装置に関する。
(従来の技術) 近年、リアルタイム画像信号処理用LSIにおいては、
大量の演算をリアルタイムで実行するために、超高速,
超高密度な演算回路構成が要求されるようになってい
る。
画像信号処理において、最も多用される演算として
は、いわゆる積和演算があげられる。従来、この積和演
算を行うLSIにおいては、第4図に示すような回路構成
が多く用いられている。この図においては、乗算器20,
加算器30及び1サンプリング周期遅延回路40からなる、
同一の演算回路ユニット10が複数個接続されている。こ
の回路構成のポイントは、全ての演算回路ユニット10の
第1の入力端子I1が同一の信号線に接続されているこ
と、同一の演算ユニット10を用いているため、共通の信
号線から入力された値は全ての演算回路ユニット10で同
時に乗算の実行を終了し、それに続く加算も同時に実行
を終了すること、及びその演算結果は1サンプリング周
期遅延回路40で1サンプリング周期だけ遅延されたの
ち、次段の演算回路ユニット10に入力されることであ
る。
第4図に示す回路は、次のような特徴を持っており、
LSI化に適している。第1に、1サンプリング周期遅延
回路40の存在により、サンプリングされた信号を予め蓄
えるためのレジスタ等が不要なため、少ないハードウェ
アで済むこと。第2に、1サンプリング周期遅延回路40
が加算結果を1サンプリング周期だけ遅延させるという
だけでなく、積和演算における積項の加算全体をパイプ
ライン化していることにより、高速化に適した回路構成
となっていること。第3に、同一の演算回路ユニット10
を用いていることから、回路構成が規則的であることで
ある。
しかしながら、この種の回路構成にあっては次のよう
な問題があった。即ち、全ての演算回路ユニットに共通
接続されている信号線(この場合、入力端子I1に接続さ
れる信号線)の配線長が長くなり、さらにファンアウト
数が多くなり、従ってその信号線の負荷容量が非常に大
きくなるという問題があった。
上記の問題は、サンプリング周期が乗算器や加算器の
演算時間に比べて十分大きい場合は特に問題ではない。
しかし、最近のリアルタイム画像信号処理分野ではサン
プリング周期は既に100nsを切っており、サンプリング
周期は益々小さくなる傾向にある。これに対応するた
め、乗算器や加算器の内部はパイプライン化されている
ことが既に一般的であり、前記第4図の回路においても
そうなっている。さらに、サンプリング周期が小さくな
る傾向から、乗算器や加算器の並列,パイプライン化
は、今後も益々進んでいくと考えられる。
このように高速化が進んでいくと、結局は演算回路ユ
ニットに共通接続されている信号線の負荷容量が、高速
化に対する問題として最後まで残ることになる。この問
題を解決するためには、チップのレイアウトに十分な注
意を払い、その配線の長さを短くするということは当然
考えられるが、前述のように大規模化が進めばそれにも
限界があり、基本的にはその配線の負荷容量を駆動する
だけの十分大きなドライバが必要となってくる。なお、
駆動力の大きなドライバは、消費電力が大きくなるばか
りでなく、高集積化にも望ましくない。
(発明が解決しようとする課題) このように、従来の第4図に示す如き積和演算回路の
構成では、全ての演算回路ユニットに接続されている信
号線の負荷容量が非常に大きく、今後、その配線の負荷
容量が高速化に対する問題となってくると考えられる。
また、この問題を解決するためには大容量のドライバが
必要となるが、大きなドライバを使用することは高集積
化にとって望ましくない。
本発明は、上記事情を考慮してなされたもので、その
目的とするところは、従来の積和演算回路の回路構成上
のメリットを損なうことなく積和演算を実行することが
でき、且つ大きなドライバも必要としない半導体集積回
路装置を提供することにある。
[発明の構成] (課題を解決するための手段) 本発明の骨子は、全ての演算回路ユニットに画像信号
等を並列的に供給するのではなく、演算回路ユニットの
内部で遅延した信号を次の演算回路ユニットに供給する
ことにある。
即ち本発明は、所定のサンプリング周期でサンプリン
グされ第1の入力端子から入力される信号と第2の入力
端子から入力される信号とを乗算し、且つ内部に備えた
遅延回路により必要なタイミングで部分積を発生しパイ
プライン処理で加算を実行して乗算する乗算器と、この
乗算器の出力信号と第3の入力端子から入力される信号
とを加算する加算器と、この加算器の出力信号を1サン
プリング周期遅延し第1の出力端子に出力する遅延回
路、とからなる演算回路ユニットを同一チップ上に複数
個配置し、且つ演算回路ユニットの第1の出力端子を次
の演算回路ユニットの第3の入力端子に接続して積和演
算を行う半導体集積回路装置において、前記第1の入力
端子からの入力信号を前記乗算器内部の遅延回路で2サ
ンプリング周期だけ遅延させて第2の出力端子に出力さ
せ、各々の演算回路ユニットの第2の出力端子を次の演
算回路ユニットの第1の入力端子に接続するようにした
ものである。
(作用) 本発明によれば、1番目の演算回路ユニットの第1の
入力端子にサンプリングされた信号が入力され、第2の
入力端子に係数等の値が入力される。また、第3の入力
端子には値0が入力される。その結果、1番目の演算回
路ユニットでは乗算のみが実行され、その乗算結果が1
サンプリング周期遅延回路で1サンプリング周期だけ遅
延されたのち、2番目の演算回路ユニットに出力され
る。
一方、サンプリングされた信号は、1番目の演算回路
ユニットの乗算器内部の遅延回路を経由して、2番目の
演算回路ユニットに出力される。2番目の演算回路ユニ
ットの第1の入力端子には1番目の演算回路ユニットか
らのサンプリングされた信号が入力され、第2の入力端
子には係数等の値が入力される。また、第3の入力端子
には、1番目の演算回路ユニットからの乗算結果が入力
される。その結果、2番目の演算回路ユニットでは、そ
の演算回路ユニットでの乗算結果と1番目の演算回路ユ
ニットからの乗算結果とが加算され、積和演算が実行さ
れる。
ここで、1番目の演算回路ユニットの第1の入力端子
から、前記2つの乗算結果が得られるまでに要する遅延
時間を比べると、2番目の演算回路ユニットでの乗算結
果が得られるまでに(加算器の遅延時間+2サンプリン
グ周期+乗算器の遅延時間)の時間を要し、一方1番目
の演算回路ユニットからの乗算結果が得られるまでに
(乗算器の遅延時間+加算器の遅延時間+1サンプリン
グ周期)の時間を要する。従って、2番目の演算回路ユ
ニットでの乗算結果が、1番目の演算回路ユニットから
の演算結果よりも相対的に1サンプリング周期だけ遅れ
て加算されることになる。
以下に続く演算回路ユニットも同様の積和演算を実行
する。そして、最後の積和演算回路ユニットの第1の出
力端子より最終的な積和演算結果が出力される。
なお、第1の入力端子を共通接続した前記第4図に示
す演算回路では、1番目の演算回路ユニットからの演算
結果が、2番目の演算回路ユニットでの乗算結果よりも
相対的に1サンプリング周期だけ遅れて加算されること
になる。2番目以降も同様である。従って、最後の演算
回路ユニットの第1の出力端子からは、連続的に供給さ
れるサンプリング信号(例えば、画像信号)と係数との
積を、隣接するもの同士を演算回路ユニットの数だけ加
算した結果が、1サンプリング信号だけずらして順次得
られることになる。これは、出力される演算結果が逆に
得られるだけで、全体として得られる積和演算結果は本
発明と同様である。つまり、本発明では、演算回路ユニ
ットへの信号入力の仕方が異なるものの、前記第4図に
示す回路と略同様の積和演算結果が得られることにな
る。
(実施例) 以下、本発明の詳細を図示の実施例によって説明す
る。
第1図は本発明の一実施例に関わる半導体集積回路装
置の概略構成を示すブロック図である。本装置は、演算
回路ユニット10(101,〜,10m)を直列的に接続して構成
されている。個々の演算回路ユニット10は全て同一構成
であり、乗算器20,加算器30及び1サンプリング周期遅
延回路40等から形成されており、3つの入力端子I1,I2,
I3と2つの出力端子O1,O2とを備えている。
乗算器20は、遅延回路21(211,〜,21n),デコード回
路22及び加算器23から形成されている。1段目の演算回
路ユニット10の第1の入力端子I1には画像信号等のサン
プリング信号が供給されるが、この信号は乗算器20内の
1番目の遅延回路211に供給される。遅延回路21は直列
に接続されており、それぞれの出力がデコード回路22に
供給される。第2の入力端子I2には係数等を指定する信
号が供給されるが、この信号はデコード回路22に供給さ
れる。デコード回路22は乗算をパイプライン処理で行う
ものであり、その各出力は加算器23に供給される。そし
て、この加算器23の出力が乗算器20の乗算結果として加
算器30に供給されている。
ここで、乗算器20では、入力端子I2からの入力信号
(係数)がデコード回路22によりデコードされ、その結
果、複数個の部分積を発生する。この複数個の部分積は
加算器23でパイプラインで加算される。乗算を正しく実
行するためには、パイプラインで加算されている個々の
部分積は、入力端子I1からの同一時刻の入力信号から得
られたものでなければならない。しかし、入力端子I1
らの入力信号は、サンプリング周期で次々に変化する。
もし、乗算器20内部に遅延回路21が存在しなければ、複
数個の部分積を同時に発生して次々にパイプラインで加
算しなければならない。この方式は、回路構成が複雑で
面積が大きくなるため、高集積化には適さない。乗算器
20の内部に遅延回路21が存在することで、部分積を同時
に発生する必要がなく、必要なタイミングで部分積を発
生してパイプラインで加算を実行することができる。こ
の方式は、高集積化にも適している。
一方、1段目の演算回路ユニット101の第3の入力端
子I3は接地されており、この入力端子I3は加算器30に接
続されている。加算器30では、乗算器20の乗算出力と入
力端子I3の信号(この場合は0)とを加算するもので、
その加算出力は1サンプリング周期遅延回路40に供給さ
れる。そして、1サンプリング周期遅延回路40を通して
遅延された信号は第2の出力端子O2に供給される。出力
端子O2は次の演算回路ユニット102の第3の入力端子I3
に接続されている。
ここまでの構成は前記第4図に示した従来装置と同様
であり、本実施例がこれと異なる点は、各演算回路ユニ
ット10の入力端子I1を共通接続するのではなく、演算回
路ユニット10の一部を構成する乗算器20内の出力を、次
段の演算回路ユニット10の入力端子I1に供給するように
したことにある。即ち、演算回路ユニット10の乗算器20
内の2番目の遅延回路212を介した信号が第2の出力端
子O2に出力され、この出力端子O2は次段の演算回路ユニ
ット102の第1の入力端子I1に接続されている。
このような構成であれば、1段目の演算回路ユニット
101の入力端子I1に入力された信号は、演算回路ユニッ
ト101で(2サンプリング周期)遅延されたのち、2番
目の演算回路ユニット102の入力端子I1に供給される。
2段目以降も同様である。また、1段目の演算回路ユニ
ット101の加算器30の出力は(1サンプリング周期)遅
延されて2段目の演算回路ユニット102の入力端子I3
供給される。2段目以降も同様である。従って、2段目
の演算回路ユニット102では、該ユニット102での乗算結
果と1段目の演算回路101からの乗算結果とが加算され
る。
ここで、1段目の演算回路ユニット101の第1の入力
端子I1から前記2つの乗算結果が得られるまでの時間を
各遅延時間を比べると、2段目の演算回路ユニット102
内の乗算結果が得られるまでに(2サンプリング周期+
乗算器の遅延時間)の時間を要し、一方1段目の演算回
路ユニット101からの乗算結果が得られるまでに(1サ
ンプリング周期+乗算器の遅延時間)の時間を要する。
従って、2段目の演算回路ユニット102内の乗算結果の
方が、1段目の演算回路ユニット101からの乗算結果よ
りも相対的に1サンプリング周期だけ遅れることにな
る。以下に続く演算回路ユニット103〜10mも同様の積和
演算を実行する。そして、最終段の演算回路ユニット10
mの第1の出力端子O1から、最終的な積和演算結果が出
力されることになる。
このように本実施例によれば、前記第4図に示した従
来装置と同様に、画像信号等のサンプリング信号の積和
演算を行うことができる。そしてこの場合、演算回路ユ
ニット10の全ての入力端子I1が共通接続されるのではな
く、外部からのサンプリング信号が入力される1段目の
演算回路ユニット101の入力端子I1を除いて、他の入力
端子I1は各々前段の演算回路ユニット10の出力端子O2
接続されることになる。従って、回路規模の増大に従い
入力端子I1に接続される信号線が長くなるという問題を
避けることができ、これにより入力に関する配線の負荷
容量を大幅に低減することができ、大きなドライバ等を
用いる必要がなくなる。また、この問題を解決するため
に特に付加的な回路を必要とせず、従来の積和演算回路
の回路構成上のメリットを失うこともない。
なお、前記乗算器20は説明を簡単にするために第1図
では簡略化して示したが、これを(特に、デコーダ22及
び加算器23を)より具体的に示すと第2図のようにな
る。但し、この図では入力信号を8ビットとしている。
この回路は、前述した遅延回路21(211,〜,218)と共
に、単位乗算器51(511,〜,518),0〜7ビットシフトす
るためのレジスタ52(521,〜,528),加算器53(531,
〜,538)及び加算出力を保持するためのレジスタ54(54
1,〜,548)等から構成されている。
この乗算器20では、8ビット入力信号が1段目の単位
乗算器511により係数の最下位ビットk1と乗算され、レ
ジスタ521及び加算器531を介してレジスタ541に保持さ
れる。同様に、8ビット入力信号が2段目の単位乗算器
511により係数の最下位ビットより1つ上のビットk2
乗算され、レジスタ522により1ビットシフト(桁上
げ)される。そして、加算器532によりレジスタ541に保
持された信号と加算され、その加算結果がレジスタ542
に保持される。ここで、2段目の信号処理においては1
段目の遅延回路211の存在により、1段目の信号処理よ
りも1サンプリング周期遅れている。このため、レジス
タ541に格納された信号とレジスタ522に格納された信号
とは同一時刻における信号となり、これにより加算器53
2により8ビット入力信号と係数k1,k2とを掛けた値の和
が求められる。これを繰返すことにより、最終段のレジ
スタ548からは8ビットの入力信号と8ビットの係数と
の積が出力されることになる。
第3図は本発明の他の実施例の概略構成を示すブロッ
ク図である。なお、第1図と同一部分には同一符号を付
して、その詳しい説明は省略する。
この実施例が先に説明した実施例と異なる点は、前記
1サンプリング周期遅延回路40を省略し、演算回路ユニ
ット10の前記乗算回路20内の遅延回路21で1サンプリン
グ周期遅延した信号を、次の演算回路ユニット10に供給
したことにある。
この場合、2段目の演算回路ユニット102内の乗算結
果が得られるまでに(1サンプリング周期+乗算器の遅
延時間)の時間を要し、一方1段目の演算回路ユニット
101からの乗算結果が得られるまでに(乗算器の遅延時
間)の時間を要する。従って、2段目の演算回路ユニッ
ト102内の乗算結果の方が、1段目の演算回路ユニット1
01からの乗算結果よりも相対的に1サンプリング周期だ
け遅れることになる。従って、先の実施例と同様に積和
演算を実行することができ、先の実施例と同様の効果が
得られる。
なお、本発明は上述した各実施例に限定されるもので
はなく、その要旨を逸脱しない範囲で、種々変形して実
施することができる。
[発明の効果] 以上詳述したように本発明によれば、全ての演算回路
ユニットに画像信号等のサンプリング信号を並列的に供
給するのではなく、演算回路ユニットの内部で遅延した
信号を次の演算回路ユニットに供給しているので、入力
信号線の長さを短くすることができ、大きなドライバを
用いることなく、従来の積和演算回路と同様に積和演算
を実行することができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる半導体集積回路装置
の概略構成を示すブロック図、第2図は上記装置に用い
た乗算回路の具体的構成を示すブロック図、第3図は本
発明の他の実施例の概略構成を示すブロック図、第4図
は従来装置の概略構成を示すブロック図である。 10(101〜10m)……演算回路ユニット、20……乗算器、
21(211〜21n)……遅延回路、22……デコード回路、23
……乗算器20内の加算器、30……加算器、40……1サン
プリング周期遅延回路、I1,I2,I3……入力端子、O1,O2
……出力端子。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】所定のサンプリング周期でサンプリングさ
    れ第1の入力端子から入力される信号と第2の入力端子
    から入力される信号とを乗算する乗算器と、この乗算器
    の出力信号と第3の入力端子から入力される信号とを加
    算する加算器と、この加算器の出力信号を1サンプリン
    グ周期遅延し第1の出力端子に出力する遅延回路、とか
    らなる演算回路ユニットを同一チップ上に複数個配置
    し、且つ演算回路ユニットの第1の出力端子を次の演算
    回路ユニットの第3の入力端子に接続して積和演算を行
    う半導体集積回路装置において、 前記乗算器は、内部に備えた遅延回路により必要なタイ
    ミングで部分積を発生しパイプライン処理で加算を実行
    するものであり、 前記第1の入力端子からの入力信号を前記乗算器内部の
    遅延回路で2サンプリング周期だけ遅延させて第2の出
    力端子に出力させ、各々の演算回路ユニットの第2の出
    力端子を次の演算回路ユニットの第1の入力端子に接続
    してなることを特徴とする半導体集積回路装置。
JP2109089A 1989-01-31 1989-01-31 半導体集積回路装置 Expired - Fee Related JP2825255B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2109089A JP2825255B2 (ja) 1989-01-31 1989-01-31 半導体集積回路装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2109089A JP2825255B2 (ja) 1989-01-31 1989-01-31 半導体集積回路装置

Publications (2)

Publication Number Publication Date
JPH02201686A JPH02201686A (ja) 1990-08-09
JP2825255B2 true JP2825255B2 (ja) 1998-11-18

Family

ID=12045173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2109089A Expired - Fee Related JP2825255B2 (ja) 1989-01-31 1989-01-31 半導体集積回路装置

Country Status (1)

Country Link
JP (1) JP2825255B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125438A (en) * 1997-04-21 2000-09-26 Matsushita Electrical Industrial Co., Ltd. Data processor

Also Published As

Publication number Publication date
JPH02201686A (ja) 1990-08-09

Similar Documents

Publication Publication Date Title
US5500811A (en) Finite impulse response filter
US6209017B1 (en) High speed digital signal processor
US5010510A (en) Multiplying unit circuit
US4646257A (en) Digital multiplication circuit for use in a microprocessor
CN110647309B (zh) 一种高速大位宽乘法器
JPS62284510A (ja) 移動係数を用いた縦続接続可能なデジタルフイルタプロセツサ
JPH082014B2 (ja) 多段デジタル・フィルタ
EP0517241A2 (en) Interleaved multiplier accumulator
JP2009507413A (ja) 全加算器モジュールおよび該全加算器モジュールを用いる乗算器デバイス
JP2825255B2 (ja) 半導体集積回路装置
US20040128335A1 (en) Fast fourier transform (FFT) butterfly calculations in two cycles
JPH08221256A (ja) 乗算器及び積和演算装置
US4041296A (en) High-speed digital multiply-by-device
EP0174397A2 (en) Dummy load controlled multi-level logic single clock logic circuit
JPH07141148A (ja) パイプライン並列乗算器
JPS6259828B2 (ja)
JP2778478B2 (ja) 相関演算プロセッサ
KR100386979B1 (ko) 갈로아체상에서 비트 직렬 승산기의 병렬화 방법 및 이를이용한 직병렬 승산기
JPH077336B2 (ja) マイクロ命令シ−ケンサ
KR0157337B1 (ko) 디지탈신호 처리기의 멀티비트 가산기
JPH0421026A (ja) 高桁乗算装置
WO2000034853A1 (en) A serial-parallel binary multiplier
JPH05174050A (ja) 級数演算装置
JPS6297061A (ja) デイジタルシグナルプロセツサ
KR19990005455A (ko) 파이프라인 방식의 부스 알고리듬을 이용한 곱셈 방법 및 장치

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees