JP3458518B2

JP3458518B2 - 並列プロセッサ

Info

Publication number: JP3458518B2
Application number: JP07581195A
Authority: JP
Inventors: 益義黒川; 孝雄山崎
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1994-08-30
Filing date: 1995-03-31
Publication date: 2003-10-20
Anticipated expiration: 2018-10-20
Also published as: DE69521464D1; JPH08123769A; US5689450A; EP0701218A1; EP0701218B1; DE69521464T2

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、映像信号等の演算処理
に用いられる並列プロセッサに関する。

【０００２】

【従来の技術】一般に、並列プロセッサを用いたディジ
タルシグナルプロセッサ（ＤＳＰ）は、映像信号等に対
して演算処理を行う演算処理部分と映像信号の各画素の
画素データおよび演算処理結果等のデータを記憶するメ
モリ部分とは別個の信号処理回路素子（デバイス）によ
り実現し、これらの信号処理回路素子の間をデータバス
等で接続して構成されている。このような構成のＤＳＰ
においては、演算処理部分の処理速度に応じた速度でメ
モリ部分から演算処理部分にデータを読み出し、あるい
は、演算処理部分からメモリ部分に演算処理の結果得ら
れたデータを書き込む必要がある。

【０００３】しかしながら、メモリ部分から演算処理部
分へのデータの読み出しの速度は、データバスのビット
幅およびメモリ部分に用いられる回路素子のデータ入出
力の動作速度、つまり演算処理部分とメモリ部分との間
の通信速度により制限される。すなわち、演算処理部分
とメモリ部分との間の通信速度によりＤＳＰ自体の処理
速度が制限されてしまう。従って、演算処理部分とメモ
リ部分とを別個の回路素子を用いたＤＳＰの設計におい
ては、これらの回路素子を接続するデータバスによる動
作速度上の制限を取り除くことができるようにデータバ
スを取り扱うことが重要であり、また、高速かつ高性能
なＤＳＰを設計する上で最も難しい問題であった。

【０００４】演算処理部分とメモリ部分とを別個の回路
素子で実現したＤＳＰにおける演算処理部分とメモリ部
分との間の通信速度の問題を解決するために、映像信号
処理の分野では、リニアアレイプロセッサと呼ばれる並
列プロセッサが用いられるようになってきている。リニ
アアレイプロセッサは、演算処理部分とメモリ部分との
間の通信速度により生じる問題を解決するために考え出
されたものであり、演算処理の対象となる信号に含まれ
る各データ、つまり１ライン分の映像信号に含まれる各
画素データに対応させて演算処理回路およびメモリ回路
を同一回路素子（デバイス）上に構成し、１ライン分の
映像信号の画素データをメモリ回路に取り込んでから各
画素データに対応する演算処理回路により各画素につい
てプログラマブルに同一の演算処理を行う。リニアアレ
イプロセッサにおける演算処理は、ＳＩＭＤ（SingleIn
struction Multiple Data）処理方式とも呼ばれる。リ
ニアアレイプロセッサの構成によれば、演算処理部分と
メモリ部分との間の通信速度に起因する問題を取り除く
ことができるので、高速かつ高性能なＤＳＰを構成する
ことができる。

【０００５】リニアアレイプロセッサとしては、従来か
ら文献「Chiders J. et al, "SVP:Serial Video Proces
sor", IEEE 1990 CICC, pp17.3.1〜17.3.4」に記載され
たものが知られている。

【０００６】以下、図５を参照して上記文献に記載され
た従来の並列プロセッサの演算処理回路（プロセッサエ
レメント８）の構成を説明する。なお、図５に示したプ
ロセッサエレメント８は、上記文献にfigure 4-1: 〜fi
gure 4-11:として記載されているものであり、図解を簡
略化した都合上、ＲＦ０／ＤＩＲ回路９４およびＲＦ１
／ＤＯＲ回路９６の部分を簡略化して示してある。プロ
セッサエレメント８は、入力信号選択回路８０、レジス
タ（Ａ）８２、レジスタ（Ｍ）８４、レジスタ（Ｂ）８
６、レジスタ（Ｃ）９０、Ｌ／Ｒ制御回路９２、ＲＦＯ
／ＤＩＲ回路９４、ＲＦＩ／ＤＯＲ回路９６、および、
算術演算回路９８から構成されている。

【０００７】入力信号選択回路８０は、２つの２入力１
出力のマルチプレクサ８００，８０２から構成されてい
る。レジスタ（Ａ）８２、レジスタ（Ｍ）８４、レジス
タ（Ｂ）８６は、それぞれ８入力１出力のマルチプレク
サ８２０，８４０，８６０およびＤフリップフロップ８
２２，８４２，８６２から構成されている。レジスタ
（Ｃ）９０は、２つの２入力１出力のマルチプレクサ９
００，９０２、８入力１出力のマルチプレクサ９０４お
よびＤフリップフロップ９０６から構成されている。

【０００８】Ｌ／Ｒ制御回路９２は、４入力１出力のマ
ルチプレクサ９２０およびプロセッサエレメント８を用
いた並列プロセッサにおいて、各プロセッサエレメント
８に共通して用いられる１０２４入力１出力のＮＯＲ回
路９２２から構成されている。算術演算回路９８は、Ｏ
Ｒ回路９８０、ＡＮＤ回路９８２、および、全加算回路
として動作するＡＬＵ９８４から構成されている。上記
文献に記載された並列プロセッサは、それぞれプロセッ
サエレメント８およびメモリ回路から構成される単位プ
ロセッサが多数直列に接続されて構成されており、さら
に、各単位プロセッサに対応する画素データを直列（シ
リアル）形式の映像信号から分離して供給する入力用シ
フトレジスタ回路および各単位プロセッサの演算結果を
シリアルな信号に変換して出力する出力用シフトレジス
タを有している。

【０００９】

【発明が解決しようとする課題】リニアアレイプロセッ
サにおいては、処理の対象となる信号のデータ長と同
じ、例えば２，２００個もの単位プロセッサを設ける必
要がある。しかしながら、プロセッサエレメント８の回
路構成は冗長であり、プロセッサエレメント８を用いて
リニアアレイプロセッサを構成した場合には、回路規模
が大きくなるので全回路を同一の素子上に実現しにく
く、また、実現できても素子面積が大きくなってしま
い、非常に高価な素子になってしまうという問題があ
る。プロセッサエレメント８においては、ＡＬＵ（算術
演算処理ユニット）９８４にデータを供給する４個のレ
ジスタ、つまりレジスタ（Ａ）８２、レジスタ（Ｍ）８
４、レジスタ（Ｂ）８６、および、レジスタ（Ｃ）９０
がそれぞれ８入力１出力のマルチプレクサ回路を有して
おり、これらのレジスタおよびマルチプレクサの数は
２，２００個の単位プロセッサ全体で８，８００個にも
及ぶから、回路規模を大きくする最大の原因となってい
た。

【００１０】本発明は上述した従来技術の問題点に鑑み
てなされたものであり、本発明の目的は、プロセッサエ
レメントの性能を下げることなく、特に、ＡＬＵにデー
タを供給するレジスタおよびマルチプレクサの回路規模
を小さくしてプロセッサエレメントの回路構成の冗長性
を減じた並列プロセッサを提供することにある。また本
発明の第２の目的は、各単位プロセッサの回路規模を小
さくして単一素子上の単位プロセッサの数を増加させる
ことができ、より高性能な並列プロセッサを提供するこ
とにある。さらに本発明の第３の目的は、同一数の単位
プロセッサをより小さい素子面積で実現し、安価で高性
能な並列プロセッサを提供することにある。本発明の第
４の目的は、消費電力を削減可能な並列プロセッサを提
供することにある。

【００１１】

【課題を解決するための手段】上記目的を達成するため
に本発明の並列プロセッサは、１周期あたり複数のデー
タからなる入力信号に演算処理を行う並列プロセッサで
あって、当該並列プロセッサが、複数のデータ数に応じ
た数だけ並列に設けられており、それぞれ１データごと
の演算処理を行う複数の単位演算ユニットを具備する。
該単位演算ユニットそれぞれは、メモリ回路と、該メモ
リ回路に接続されたプロセッサエレメントとを有し、隣
接する２つの単位演算ユニットとデータの交換が可能な
ように構成されている。プロセッサエレメントはそれぞ
れ、全加算回路と、該全加算回路の第１の入力に接続さ
れた２つの入力について論理演算を行う論理演算回路
と、単位演算ユニット内のメモリ回路からの第１のデー
タまたは隣接する単位演算ユニット内のメモリ回路から
の第１のデータのいずれかを選択する第１のセレクタ回
路と、単位演算ユニット内のメモリ回路からの第２のデ
ータまたは隣接する単位演算ユニット内のメモリ回路か
らの第２のデータのいずれかを選択する第２のセレクタ
回路と、第２のセレクタ回路が選択した第２のデータ、
論理値１または論理値０のいずれかを選択して論理演算
回路に対する第１の入力として出力する第３のセレクタ
回路と、第１のセレクタ回路が選択した第１のデータ、
論理値１または論理値０のいずれかを選択して論理演算
回路に対する第２の入力として出力する第４のセレクタ
回路と、第２のセレクタ回路が選択した第２のデータ、
論理値１または論理値０のいずれかを選択して全加算回
路の第２の入力として出力する第５のセレクタ回路と、
全加算回路のキャリー出力、論理値１または論理値０の
いずれかを選択して全加算回路の第３の入力として出力
する第６のセレクタ回路とを有する。

【００１２】好適には、第２のセレクタ回路が選択した
第２のデータを保持するレジスタ回路と、第３のセレク
タ回路が保持するデータに従って、全加算回路の加算値
出力またはレジスタ回路に保持された第２のデータのい
ずれかを選択する第７のセレクタ回路をさらに有する。
また好適には、第７のセレクタ回路が選択したデータ、
全加算回路の加算値出力およびキャリー出力のいずれか
を選択する第８のセレクタ回路をさらに有し、第８のセ
レクタ回路が選択したデータを単位演算ユニットのメモ
リ回路に記憶するように構成されている。さらに好適に
は、論理回路は、第３のセレクタ回路が選択したデー
タ、第４のセレクタ回路が選択したデータおよびプロセ
ッサエレメントに供給されたコマンドとに所定の論理演
算を行って全加算回路の第１の入力として出力する。好
適には、第３〜第６のセレクタ回路の内部レジスタおよ
び第２のセレクタ回路が選択した第２のデータを保持す
るレジスタ回路のうち、共用可能なものについて、共用
可能に構成する。また好適には、第３〜第６のセレクタ
回路の内部レジスタおよび第２のセレクタ回路が選択し
た第２のデータを保持するレジスタ回路のうち、メモリ
内部のセンスアンプのレジスタ機能にて代用した構成に
する。さらに好適には、並列プロセッサにおいて、所定
の論理演算に代えてＢｏｏｔｈの乗算アルゴリズムに対
応した演算を行うように構成する。また好適には、クロ
ック信号をグループ分けして所望の動作に合わせて変化
させて消費電力を低減させる。

【００１３】

【作用】メモリ回路は、論理演算手段に対してそれぞれ
１ビット幅の２つの出力バスと１つの入力バスとを有し
ており、データ入力手段から供給された、例えば８ビッ
ト構成の画素データ、演算処理の中間値および結果を記
憶する。メモリ回路は、当該単位演算ユニットおよび隣
接する単位演算ユニットのデータ選択手段にこれらの値
（データ）を２つの１ビットデータとして供給し、演算
処理結果を１ビット単位で記憶する。

【００１４】第１のセレクタ回路および第２のセレクタ
回路は、前置および後置された２つの隣接する単位演算
ユニットのメモリ回路との間に単位演算ユニット間にま
たがるデータバスを有している。データ選択手段は、２
つの隣接する単位演算ユニットのメモリ回路から入力さ
れたデータ、および、当該単位演算ユニットのメモリ回
路から入力されたデータの内の２つを論理演算手段に入
力して、単位演算ユニット間にまたがるデータの送受信
を行うことを可能とし、また、ある単位演算ユニットに
おいて、他の単位演算ユニットのデータを用いた演算処
理を可能としている。

【００１５】論理演算手段は、第３のセレクタ回路およ
び第４のセレクタ回路が選択した２つのデータ、およ
び、各プロセッサエレメントに同一の演算処理を行わせ
るコマンドを選択して所定の論理演算を行う算術演算手
段に供給する。第３〜第６のセレクタ回路は、第１およ
び第２のセレクタ回路が選択したデータをさらにコマン
ドに従って選択して全加算回路の第２および第３の入力
として供給することにより、プロセッサエレメントの回
路規模を小さくする。第３〜第６のセレクタ回路の内部
のレジスタおよび第７のセレクタ回路の前に付属するレ
ジスタのうら、入力信号およびクロック信号が共通なも
のについては共用するこことにより、プロセッサエレメ
ントの回路規模を小さくできる。第３〜第６のセレクタ
回路の内部レジスタおよび第７のセレクタ回路の前に付
属するレジスタのうち、メモリ回路のセンス・アンプで
代用可能なものについては省略することにより、プロセ
ッサエレメントの回路規模を小さくできる。第３〜第６
のセレクタ回路の内部レジスタおよび第７のセレクタ回
路の前に付属するレジスタのうち、クロック信号のグル
ープ分けを行って所望の動作に合わせて供給することに
より、消費電力を大幅に削減することができる。

【００１６】全加算回路は、２つの１ビット入力データ
を全加算して加算値とキャリーを出力する。多ビット幅
のデータを１ビットずつ操作することにより、１ビット
全加算回路を用いて多ビットのデータの処理を行うこと
が可能である。また、多ビット並列処理の算術演算手段
に比べて１ビット全加算回路は回路の規模が小さいの
で、本発明の並列プロセッサのように非常に多くの数が
必要となる用途に好適である。

【００１７】

【実施例】以下、図１〜図３を参照して本発明の並列プ
ロセッサ１の構成を説明する。図１は本発明の並列プロ
セッサ１の構成を示す図である。本発明の並列プロセッ
サ１は、単位演算処理回路１０_iを直列に、例えば７６
８個、１，０２４個、２，２００個といった数、映像信
号の１水平周期分の各画素に対応して接続した構成にな
っており、いわゆるＳＩＭＤ（Single Instruction Mul
tiple Data）方式の動作により、１水平期間（１ライ
ン、または、１Ｈ）分の映像信号の各画素の輝度信号等
の画素データ（画素値Ｄ_i）について並列的に演算処理
を行う。

【００１８】並列プロセッサ１には、１水平期間分（１
ライン分、または、１Ｈ分）の映像信号の画素値Ｄ
_iが、例えば水平期間Ｈ_k（ｋは整数）において入力デ
ータ端子からシリアル（直列）に順次入力される。画素
値Ｄ_iは入力シフトレジスタ１２によりパラレル（並
列）に変換され、水平期間Ｈ_kに続く水平ブランキング
期間Ｂ_kにおいて各メモリ回路１０４_iおよび演算回路
１０６_iに供給される。さらに続く水平期間Ｈ_k+1にお
いて、画素値Ｄ_iについて演算回路１０６_iにより所定
の演算処理が施さる。これらの演算処理結果Ｑ_iは続く
水平ブランキング期間Ｂ_k+1において出力シフトレジス
タ１４に供給され、続く水平期間Ｈ_k+2において順次シ
リアルに出力データ端子から出力される。

【００１９】図１を参照して並列プロセッサ１の構成を
詳細に説明する。データ入力レジスタ１００_i（ｉ＝
１，２，…，ｎ）は、入力シフトレジスタ１２を構成し
ており、それぞれ並列プロセッサ１への入力データ端子
から水平期間Ｈ_kに対して出力される、例えば８ビット
幅の映像信号の画素値Ｄ_iを順次シフトして保持し、続
く水平ブランキング期間Ｂ_kにおいてメモリ回路１０４
_iに供給して記憶させる。

【００２０】データ出力レジスタ１０２_iは、出力シフ
トレジスタ１４を構成しており、それぞれ水平期間Ｈ
_k+1においてメモリ回路１０４_iおよび演算回路１０６
_iにより所定の演算処理が施された画素値Ｄ_iに対応す
る演算処理結果Ｑ_iを、続く水平ブランキング期間Ｂ
_k+1において記憶し、さらに記憶した演算処理結果Ｑ_i
を水平期間Ｈ_k+2において出力データ端子から順次シフ
トしてシリアルに出力する。なお、データ入力レジスタ
１００_iおよびデータ出力レジスタ１０２_iについて
は、図２を参照してさらに詳細に後述する。

【００２１】メモリ回路１０４_iは、例えば複数の８ビ
ットレジスタを有しており、データ入力レジスタ１００
_iから供給されたデータを記憶し、演算制御回路（ＣＮ
ＴＲ）１０８の制御に従って、これらの８ビットレジス
タに記憶されている任意の２個の１ビット幅のデータ
（１ビットデータ）をそれぞれ演算回路１０６_iの読み
出しビット線ｉｎｐ１，ｉｎｐ２を介して演算回路１０
６_i等に供給し、また、書き込みビット線ｗｏｕｔを介
して演算回路１０６_iの加算結果等を読み込んで記憶す
る。

【００２２】演算回路１０６_iは、１ビットプロセッサ
であって、演算制御回路１０８の制御に従って、例えば
１回の演算処理につき、入力された２個の１ビットデー
タ、あるいは、数値１または数値０、および、入力され
た１ビットデータを加算し、その加算結果の値（数値）
またはキャリーをメモリ回路１０４_iに対して出力す
る。さらに演算回路１０６_iは、それぞれ前置および後
置された（前段および後段の、あるいは、隣接する）単
位演算処理回路１０_i-1，１０_i+1のメモリ回路１０４
_i-1，１０４_i+1、および、演算回路１０６_i-1，１０
６_i+1との間に２ビット幅のデータ端子Ｘ_i（Ｘ１_i，
Ｘ２_i），Ｘ_i+1（Ｘ１_i+1，Ｘ２_i+1）、および、デ
ータ端子Ｙ_i（Ｙ１_i，Ｙ２_i），Ｙ_i+1（Ｙ１_i+1，
Ｙ２_i+1）を有しており、データ端子Ｙ_iにより前段の
単位演算処理回路１０_i-1のデータ端子Ｘ_iからデータ
を受け、データ端子Ｘ_i+1により後段の単位演算処理回
路１０ _i+1のデータ端子Ｙ_i+1にデータを送出し、デー
タ端子Ｙ_iにより前段の単位演算処理回路１０_i-1の端
子Ｘ_iからデータを受け、データ端子Ｙ_i+1により後段
の単位演算処理回路１０_i+1のデータ端子Ｘ_i+1からデ
ータを受ける。ただし、図１に示すように、単位演算処
理回路１０₁の前段および単位演算処理回路１０ _nの後
段は存在しないので、データ端子Ｙ₁，Ｙ_n+1には、数
値０が入力されている。

【００２３】これらのデータ端子Ｘ_i，Ｘ_i+1およびデ
ータ端子Ｙ_i，Ｙ_i+1により、単位演算処理回路１０_i
は、隣接する単位演算処理回路１０_i-1，１０_i+1との
間でデータの送受信が可能であり、隣接する単位演算処
理回路１０_i-1，１０_i+1のデータを利用した演算処理
を行うことも可能である。データ入力レジスタ１０
０_i、データ出力レジスタ１０２ｉ、メモリ回路１０４
_iおよび演算回路１０６_iが単位演算処理回路１０_iを
構成する。なお、プロセッサエレメントと演算回路、お
よび、単位プロセッサと単位演算処理回路と同じ意味で
ある。

【００２４】メモリ回路１０４_iに記憶された８ビット
データを、演算回路１０６_iが上述のように複数回演算
処理することにより、水平期間Ｈ_k+1において、水平期
間Ｈ _kに並列プロセッサ１に入力された画素値Ｄ_iにつ
いて所定の演算処理を行うことができる。また、演算制
御回路１０８は、全てのメモリ回路１０４_iに同一のデ
ータ、例えばメモリ回路１０４_iのｍ（ｍ＝１，２，
３，…）番目のレジスタｐ（ｐ＝１，２，３，…）番目
のビットに１ビットデータの読み出し、あるいは、書き
込みを行わせ、また、演算制御回路１０８は演算回路１
０６_iに同一の演算処理を行わせる。従って、単位演算
処理回路１０_iはそれぞれ入力された画素値Ｄ_iについ
て同一の演算処理を行うことになる。すなわち、並列プ
ロセッサ１はＳＩＭＤ方式の並列プロセッサである。

【００２５】演算制御回路１０８は、各単位演算処理回
路１０_iを制御して所定の演算処理を行わせる。なお、
図１においては、演算制御回路１０８から各構成要素へ
の制御信号は省略されており、また、上述の図１を参照
した説明においても制御信号に関する記載は省略してあ
る。これらの点については、図２および図３を参照して
後述する。

【００２６】次に、図２を参照して単位演算処理回路１
０_iを構成する各部分の接続および動作を説明する。図
２は、図１に示した単位演算処理回路１０_iを構成する
データ入力レジスタ（ＤＩＲ）１００_i、データ出力レ
ジスタ（ＤＯＲ）１０２_i、メモリ回路（ＭＥＭ）１０
４_i、および、演算回路（ＰＥ）１０６_iの接続を示す
図である。なお、図２に示す単位演算処理回路１０_iの
各構成要素は、図１に同一符号を付して示した並列プロ
セッサ１の各構成要素に同じである。データ入力レジス
タ１００_iは、上述のように８ビット幅のデータバスで
隣接する単位演算処理回路１０_i-1，１０_i+1のデータ
入力レジスタ１００_i-1，１００_i+1と接続されてお
り、演算制御回路１０８から入力される制御信号ＣＤＩ
Ｒに従って、並列プロセッサ１の入力データ端子に８ビ
ット幅の画素値Ｄ_iが１個入力されるたびに順次その内
容を後段にシフトしてゆく。従って、水平期間の終了時
点では、データ入力レジスタ１００_iはそれぞれ画素値
Ｄ_iを記憶することになる。続く水平ブランキング期間
に、データ入力レジスタ１００_iに記憶された画素値Ｄ
_iは、制御信号ＣＰＥに従ってメモリ回路１０４_iに読
み出されて記憶される。ここで、データ入力レジスタ１
００_iの各ビットは、メモリ回路１０４_iと同じメモリ
空間にあり、画素値Ｄ_iはメモリ回路１０４_iに１ビッ
トずつ読み出される。

【００２７】データ出力レジスタ１０２_iは、上述のよ
うに８ビット幅のデータバスで隣接する単位演算処理回
路１０_i-1，１０_i+1のデータ出力レジスタ１０
２_i-1，１０２_i+1と接続されており、演算制御回路１
０８から入力される制御信号ＣＤＯＲに従って、並列プ
ロセッサ１の入力データ端子に８ビット幅の画素値Ｄ_i
が１個入力されるたびに順次その内容を後段にシフトし
てゆく。従って、水平期間の並列プロセッサ１の出力デ
ータ端子には、その水平期間に先立つ水平ブランキング
期間に出力レジスタ１０２_iに記憶された演算処理結果
Ｑ_iが、画素値Ｄ_iと同じデータレート（データ速度）
で順次出力される。ここで、データ出力レジスタ１０２
_iの各ビットは、メモリ回路１０４_iと同じメモリ空間
にあり、演算処理結果Ｑ_iはメモリ回路１０４_iから１
ビットずつ書き込まれる。メモリ回路１０４_iは、演算
制御回路１０８から入力される制御信号ＣＭＥＭに従っ
て、データ入力レジスタ１００_iから画素値Ｄ_iを読み
出して記憶し、データ出力レジスタ１０２_iに演算処理
結果Ｑ_iを書き込んで記憶させる。またメモリ回路１０
４_iは、制御信号ＣＭＥＭに従って、任意のレジスタの
任意のビットの値を演算回路１０６_iの読み出しビット
線ｉｎｐ１，ｉｎｐ２から演算回路１０６_i、および、
端子Ｘ_i，Ｘ_i+1を介して隣接する単位演算処理回路１
０_i- ₁，１０_i+1の演算回路１０６_i-1，１０６_i+1の
端子Ｙ_i，Ｙ_i+1に供給する。またメモリ回路１０４_i
は、演算制御回路１０８から入力される制御信号ＣＭＥ
Ｍに従って、任意のレジスタの任意のビットに、書き込
みビット線ｗｏｕｔを介して演算回路１０６_iから入力
された加算結果等を記憶する。

【００２８】演算回路１０６_iは、演算制御回路１０８
から入力される制御信号ＣＰＥに従って、メモリ回路１
０４_i、隣接する単位演算処理回路１０_i-1，１０_i+1
のメモリ回路１０４_i-1，１０４_i+1の端子Ｘ_i，Ｘ
_i+1から演算回路１０６_iの端子Ｙ_i，Ｙ_i+1を介し
て、メモリ回路１０４_iから読み出しビット線ｉｎｐ
１，ｉｎｐ２を介してデータを受ける。また、演算回路
１０６_iは、演算制御回路１０８から入力される制御信
号ＣＰＥに従って、その加算結果等を書き込みビット線
ｗｏｕｔを介してメモリ回路１０４_iに対して出力して
記憶させる。図２に示したように、演算回路１０６_iと
メモリ回路１０４_iとの入出力を、演算回路１０６_i側
からみて２入力１出力とした理由は、図３を参照して後
述する演算回路１０６_iが２入力１出力の演算処理を基
本としているからである。なお、演算回路１０６_iの全
加算回路２４０_iは本来３入力２出力であるが、これら
の内、キャリーに関する１出力および１入力は演算回路
１０６_i内部で保存されており、演算回路１０６_i全体
としては２入力１出力で足りることになる。

【００２９】以下、図３を参照して演算回路１０６_iの
構成を説明する。演算回路１０６_iは、上述のように、
全加算回路（ＦＡ；ＦｕｌｌＡｄｄｅｒ）２４０_iを
算術演算処理ユニットとして有する２入力（ｉｎｐ１，
ｉｎｐ２）１出力（ｗｏｕｔ）の１ビットプロセッサで
ある。セレクタ回路（ＳＥＬ）２００_iは、演算制御回
路１０８から入力される制御信号ＣＰＥに含まれる３ビ
ット幅の制御信号ＣＰＥａ２〜ＣＰＥａ０に従って、隣
接する単位演算処理回路１０_i-1，１０_i+1のメモリ回
路１０４_i-1，１０４ _i+1の読み出しビット線ｉｎｐ
１，ｉｎｐ２から端子Ｙ_i（Ｙ１_i，Ｙ２_i），Ｙ_i+1
（Ｙ１_i+1，Ｙ２_i+1）を介して入力されたそれぞれ２
個、合計４個の１ビットデータ、および、メモリ回路１
０４_iの読み出しビット線ｉｎｐ１から入力された１ビ
ットデータの内の１つを選択してセレクタ回路（ａｓ
１）２１２_iに対して出力する。

【００３０】セレクタ回路２０２_iは、演算制御回路１
０８から入力される制御信号ＣＰＥに含まれる３ビット
幅の制御信号ＣＰＥｂ２〜ＣＰＥｂ０に従って、隣接す
る単位演算処理回路１０_i-1，１０_i+1のメモリ回路１
０４_i-1，１０４_i+1の読み出しビット線ｉｎｐ１，ｉ
ｎｐ２から端子Ｙ_i，Ｙ_i+1を介して入力されたそれぞ
れ２個、合計４個の１ビットデータ、および、メモリ回
路１０４_iの読み出しビット線ｉｎｐ２から入力された
１ビットデータの内の１つを選択して、レジスタ回路
（ＲＥＧ）２２８_i、セレクタ回路（ｍｓ１）２０
６_i、および、セレクタ回路（ｂｓ１）２１８_iに対し
て出力する。

【００３１】入力セレクタ（ｍｓ）２０４_iは、セレク
タ回路２０６_i、および、レジスタ回路（ｍｒ１）２０
８_iとから構成されており、レジスタ回路２０８_iは、
セレクタ回路２０２_iから入力される信号Ｉ２を、制御
信号ＣＰＥに含まれるクロック信号ＣＫが有効化（アサ
ート）するタイミングでラッチして保持し、セレクタ回
路２０６_iに対して出力する。セレクタ回路２０６
_iは、セレクタ回路２０６ _i自身の出力信号、レジスタ
回路２０８_iの出力信号、および数値１，０のいずれか
を、演算制御回路１０８から入力される制御信号ＣＰＥ
に含まれる制御信号ＣＰＥｃ１，ＣＰＥｃ０に従って選
択し、ＯＲ回路（ｍｏ３）およびセレクタ回路（ｄｓ）
２３０_iの選択信号入力端子に対して出力する。ここ
で、クロック信号ＣＫは、演算回路１０６_iの動作周期
を規定する。

【００３２】入力セレクタ（ｍｓ）２０４_iの動作につ
いて説明すると、クロック信号ＣＫが有効化された場合
には、レジスタ回路２０８_iには、それ以前のセレクタ
回路２０２_iの出力信号の値が保持される。セレクタ回
路２０６_iがレジスタ回路２０８_iの出力信号を選択し
た場合には、入力セレクタ（ｍｓ）２０４_iの出力信号
の値はレジスタ回路２０８_iの出力信号の値となり、セ
レクタ回路２０６_iが数値１を選択した場合には、入力
セレクタ（ｍｓ）２０４_iの出力信号の値は数値１とな
り、セレクタ回路２０６_iが数値０を選択した場合に
は、入力セレクタ（ｍｓ）２０４_iの出力信号の値は数
値０となる。セレクタ回路２０６_iがセレクタ回路２０
６_i自身の信号を選択した場合には、２０４_iの出力信
号にはそれ以前の値がラッチされる。

【００３３】入力セレクタ（ｍｓ）２０４_iは、入力セ
レクタ（ｍｓ）２０４_iの出力信号をマスクする役割を
有している。すなわち、入力セレクタ（ｍｓ）２０４_i
の出力信号およびコマンド信号ＣＭＤ１の論理値が１で
ある場合には、ＡＮＤ回路２３６_iの出力信号は入力セ
レクタ（ｍｓ）２０４_iの出力信号に一致し、入力セレ
クタ（ｍｓ）２０４_iの出力信号およびコマンド信号Ｃ
ＭＤ１の論理値が０である場合にはＡＮＤ回路２３６_i
の出力信号は常に論理値０となる。

【００３４】また、入力セレクタ（ｍｓ）２０４_iは、
演算回路１０６_iごとに分岐条件を記憶する役割も有し
ている。並列プロセッサ１のようなＳＩＭＤ方式の並列
プロセッサにおいては、単位演算処理回路１０_iごとに
条件による出力データの選択（分岐条件）をソフトウェ
ア的に設定することができない。従って、入力セレクタ
（ｍｓ）２０４_iの出力信号によりセレクタ回路２４２
_iを制御してハードウェア的に条件分岐処理を実現して
いる。

【００３５】入力セレクタ（ａｓ）２１０_iは、セレク
タ回路２１２_iおよびレジスタ回路（ａｒ１）２１４_i
とから構成されており、レジスタ回路２１４_iは、セレ
クタ回路２００_iから入力される信号Ｉ１を、制御信号
ＣＰＥに含まれるクロック信号ＣＫが有効化（アサー
ト）するタイミングでラッチして保持し、セレクタ回路
２１２_iに対して出力する。セレクタ回路２１２_iは、
セレクタ回路２１２_i自身の出力信号、レジスタ回路２
１４_iの出力信号、および数値１，０のいずれかを、演
算制御回路１０８から入力される制御信号ＣＰＥに含ま
れる制御信号ＣＰＥｄ１，ＣＰＥｄ０に従って選択し、
ＡＮＤ回路（ｍａｌ）２３６_iに対して出力する。

【００３６】入力セレクタ（ａｓ）２１０_iの動作につ
いて説明すると、クロック信号ＣＫが有効化された場合
には、レジスタ回路２１４_iには、それ以前のセレクタ
回路２００_iの出力信号の値が保持される。セレクタ回
路２１２_iがレジスタ回路２１４_iの出力信号を選択し
た場合には、入力セレクタ（ａｓ）２１０_iの出力信号
の値はレジスタ回路２１４_iの出力信号の値となり、セ
レクタ回路２１２_iが数値１を選択した場合には、入力
セレクタ（ａｓ）２１０_iの出力信号の値は数値１とな
り、セレクタ回路２１２_iが数値０を選択した場合に
は、入力セレクタ（ａｓ）２１０_iの出力信号の値は数
値０となる。セレクタ回路２１２_iがセレクタ回路２１
２_i自身の信号を選択した場合には、２１０_iの出力信
号にはそれ以前の値がラッチされる。セレクタ回路２２
４_i自身の信号を選択した場合には、２２２_iの出力信
号にはそれ以前の値がラッチされる。

【００３７】入力セレクタ（ｂｓ）２１６_iは、セレク
タ回路２１８_i、および、レジスタ回路（ｂｒ１）２２
０_iとから構成されており、レジスタ回路２２０_iは、
セレクタ回路２０２_iから入力される信号Ｉ２を、制御
信号ＣＰＥに含まれるクロック信号ＣＫが有効化（アサ
ート）するタイミングでラッチして保持し、セレクタ回
路２１８_iに対して出力する。セレクタ回路２１８
_iは、セレクタ回路２１８ _i自身の出力信号、レジスタ
回路２２０_iの出力信号、および数値１，０のいずれか
を、演算制御回路１０８から入力される制御信号ＣＰＥ
に含まれる制御信号ＣＰＥｅ１，ＣＰＥｅ０に従って選
択し、全加算回路２４０_iの端子Ｂに対して出力する。

【００３８】入力セレクタ（ｂｓ）２１６_iの動作につ
いて説明すると、クロック信号ＣＫが有効化された場合
には、レジスタ回路２２０_iには、それ以前のセレクタ
回路２０２_iの出力信号の値が保持される。セレクタ回
路２１８_iがレジスタ回路２２０_iの出力信号を選択し
た場合には、入力セレクタ（ｂｓ）２１６_iの出力信号
の値はレジスタ回路２２０_iの出力信号の値となり、セ
レクタ回路２１８_iが数値１を選択した場合には、入力
セレクタ（ｂｓ）２１６_iの出力信号の値は数値１とな
り、セレクタ回路２１８_iが数値０を選択された場合に
は、入力セレクタ（ｂｓ）２１６_iの出力信号の値は数
値０となる。セレクタ回路２１８_iがセレクタ回路２１
８_i自信の信号を選択した場合には、２１６_iの出力信
号にはそれ以前の値がラッチされる。

【００３９】入力セレクタ（ｃｓ）２２２_iは、セレク
タ回路２２４_iおよびレジスタ回路（ｃｒｌ）２２６_i
とから構成されており、レジスタ回路２２６_iは、全加
算回路２４０_iから入力される信号（ＣＹ）を、制御信
号ＣＰＥに含まれるクロック信号ＣＫが有効化（アサー
ト）するタイミングでラッチして保持し、セレクタ回路
２２４_iに対して出力する。セレクタ回路２２４_iは、
セレクタ回路２２４_i自信の出力信号、レジスタ回路２
２６_iの出力信号、および数値１、０のいずれかを演算
制御回路１０８から入力される制御信号ＣＰＥに含まれ
る制御信号ＣＰＥｆ１、ＣＰＥｆ０に従って選択し、全
加算回路２４０_iの端子Ｃに対して出力する。

【００４０】入力セレクタ（ｃｓ）２２２_iの動作につ
いて説明すると、クロック信号ＣＫが有効化された場合
には、レジスタ回路２２６_iには、それ以前の全加算回
路２４０_iのキャリー出力信号（ＣＹ）の値が保持され
る。セレクタ回路２２４_iがレジスタ回路２２６_iの出
力信号を選択した場合には、入力セレクタ（ｃｓ）２２
２_iの出力信号の値はレジスタ回路２２６_iの出力信号
の値となり、セレクタ回路２２４_iが数値１を選択した
場合には、入力セレクタ（ｃｓ）２２２_iの出力信号の
値は数値１となり、セレクタ回路２２４_iが数値０を選
択した場合には、入力セレクタ（ｃｓ）２２２_iの出力
信号の値は数値０となる。セレクタ回路２２４_iがセレ
クタ回路２２４_i自信の信号を選択した場合は２２４_i
の信号はそれ以前の値となる。以上述べた入力セレクタ
（ａｓ）２１０_i、入力セレクタ（ｂｓ）２１６_i、お
よび、入力セレクタ（ｃｓ）２２２_iにより全加算回路
２４０_iに入力する信号を選択することにより、全加算
回路２４０_iを様々な用途に使用可能である。

【００４１】レジスタ回路２２８_iは、信号Ｉ２を、ク
ロック信号ＣＫが有効化されたタイミングでラッチして
セレクタ回路２３０_iに対して出力する。レジスタ回路
２２８_iは、セレクタ回路２３０_iに入力する信号Ｉ２
と全加算回路２４０_iの出力信号（信号ＳＭ、信号Ｃ
Ｙ）とのタイミングを合わせる役割を有する。

【００４２】ＯＲ回路２３２_iは、レジスタ回路２０８
_iの出力信号と制御信号ＣＰＥに含まれるコマンド信号
ＣＭＤ１との論理和演算を行って、その結果をＡＮＤ回
路２３６_iに対して出力する。コマンド信号ＣＭＤ１が
論理値１の場合にはＯＲ回路２３２_iの出力信号の論理
値は常に１となる。従って、ＡＮＤ回路２３６_iの出力
信号は、常に入力セレクタ（ａｓ）２１０_iの出力信号
に一致する。また、コマンド信号ＣＭＤ１の論理値が０
であって、入力セレクタ（ｍｓ）２０４_iの出力信号の
論理値が０である場合にのみＡＮＤ回路２３６_iの出力
信号の論理値は常に０となりマスクされる。すなわち、
コマンド信号ＣＭＤ１は、入力セレクタ（ｍｓ）２０４
_iの出力信号による入力セレクタ（ａｓ）２１０_iの出
力信号のマスクを制御する役割を有する。

【００４３】ＸＯＲ回路（ｘｏ２）２３８_iは、制御信
号ＣＰＥに含まれるコマンド信号ＣＭＤ２とＡＮＤ回路
２３６_iの出力信号との排他的論理和演算を行って、そ
の結果を全加算回路２４０_iの端子Ａに対して出力す
る。コマンド信号ＣＭＤ２が論理値１である場合にはＸ
ＯＲ回路２３８_iの出力信号はＡＮＤ回路２３６_iの出
力信号の論理値を反転した信号となり、コマンド信号Ｃ
ＭＤ２が論理値０の場合には、ＸＯＲ回路２３８_iの論
理値はＡＮＤ回路２３６_iの出力信号と一致する。従っ
て、コマンド信号ＣＭＤ２は、演算制御回路１０８が入
力セレクタ（ａｓ）２１０_iの出力信号の論理値を反転
するために用いられる。

【００４４】全加算回路２４０_iは、ＸＯＲ回路２３８
_iの出力信号、入力セレクタ（ｂｓ）２１６_iの出力信
号、および、入力セレクタ（ｃｓ）２２２_iの出力信号
に基づいて全加算算術演算処理を行って、その加算結果
（数値；信号ＳＭ）をそれぞれセレクタ回路２４２
_iに、加算結果のキャリー（信号ＣＹ）をセレクタ回路
（ｗｓ）２４２_iおよびセレクタ回路２２４_iに対して
出力する。全加算回路２４０_iの入力信号と出力信号と
の関係は下表に示す通りである。

【００４５】

【表１】Ａ入力；Ｂ入力；Ｃ入力；ＳＭ出力；ＣＹ出力０；０；０；０；０１；０；０；１；００；１；０；１；０１；１；０；０；１０；０；１；１；０１；０；１；０；１０；１；１；０；１１；１；１；１；１

【００４６】セレクタ回路２３０_iは、入力セレクタ
（ｍｓ）２０４_iの出力信号の論理値が０である場合に
レジスタ回路２２８_iの出力信号を選択し、入力セレク
タ（ｍｓ）２０４_iの出力信号の論理値が１である場合
に信号ＳＭを選択して、セレクタ回路２４２_iに対して
出力する。セレクタ回路２４２_iは、演算制御回路１０
８から入力される制御信号ＣＰＥに含まれる制御信号Ｃ
ＰＥｇ１，ＣＰＥｇ０に従って、セレクタ回路２３０_i
の出力信号、信号ＳＭ、および、信号ＣＹのいずれかを
選択して、演算回路１０６ _iの書き込みビット線ｗｏｕ
ｔから出力する。

【００４７】なお、以上述べた並列プロセッサ１の各構
成要素において、演算回路１０６_iが本発明に係るプロ
セッサエレメントに相当し、セレクタ回路２００_i，２
０２ _iは本発明に係る第１および第２のセレクタ回路相
当し、メモリ回路１０４_iが本発明に係るメモリ回路に
相当する。また、全加算回路２４０_iが本発明に係る全
加算回路が本発明に係る算術演算手段に相当し、入力セ
レクタ（ｍｓ）２０４_i、入力セレクタ（ａｓ）２１０
_i、入力セレクタ（ｂｓ）２１６_i、および、入力セレ
クタ（ｃｓ）２２２_iは本発明に係る第３〜第６のセレ
クタ回路に相当し、ＯＲ回路２３２_i、ＡＮＤ回路２３
６_iおよびＸＯＲ回路２３８_iが本発明の論理演算手段
に相当し、セレクタ回路２３０_iおよびセレクタ回路２
４２_iが本発明に係る第７および第８のセレクタ回路に
相当し、レジスタ回路２２８_iが本発明に係るレジスタ
回路に相当する。

【００４８】以下、並列プロセッサ１の動作を説明す
る。まず、並列プロセッサ１の全体的な動作を説明す
る。水平期間Ｈ_kにおいて、並列プロセッサ１には、入
力データ端子から８ビット幅の映像信号の画素値Ｄ_iが
順次入力される。入力シフトレジスタ１２のデータ入力
レジスタ１００_iは、演算制御回路１０８の制御信号Ｃ
ＤＩＲに従って、入力された画素値Ｄ_iを順次シフトす
る。水平期間Ｈ_kが終わる時点では、各画素値Ｄ_iは対
応するデータ入力レジスタ１００_iに保持される。なお
同時に、水平期間Ｈ_kにおいて、メモリ回路１０４_i、
および、演算回路１０６_iは、水平期間Ｈ_k-1において
入力された画素値’Ｄ_iから演算処理結果’Ｑ_iを得る
ための演算処理を行い、出力シフトレジスタ１４は水平
期間Ｈ_k-2において入力された画素値”Ｄ_iに対応する
演算処理結果”Ｑ_iを順次並列プロセッサ１の出力デー
タ端子から出力する。

【００４９】続く水平ブランキング期間Ｂ_kにおいて、
メモリ回路１０４_iは制御信号ＣＭＥＭに従って、１ビ
ットづつ画素値Ｄ_iを読み込んで、メモリ回路１０４_i
の所定のアドレスに記憶する。なお同時に、水平ブラン
キング期間Ｂ_kにおいては、水平期間Ｈ_k-1において入
力された画素値’Ｄ_iに対応する演算処理結果’Ｑ_iが
出力シフトレジスタ１４に書き込まれる。

【００５０】続く水平期間Ｈ_k+1において、演算回路１
０６_iおよびメモリ回路１０４_iは、演算制御回路１０
８から入力される制御信号ＣＰＥ，ＣＭＥＭに従って、
メモリ回路１０４_iおよび隣接する単位演算処理回路１
０_i-1，１０_i+1のメモリ回路１０４_i-1，１０４_i+1
に記憶された画素値Ｄ_i-1，Ｄ_i，Ｄ_i+1および演算回
路１０６_i-1，１０６_i，１０６_i+1の演算処理の中間
値について１ビットごとに処理を行って演算処理結果Ｑ
_iを算出する。算出された演算処理結果Ｑ_iは、メモリ
回路１０４_iの所定のアドレスに記憶される。なお同時
に、水平期間Ｈ_k+1において、次の画素値Ｄ_i’が順次
入力シフトレジスタ１２に入力され、演算処理結果’Ｑ
_iが出力シフトレジスタ１４から順次出力されている。

【００５１】続く水平ブランキング期間Ｂ_k+1におい
て、メモリ回路１０４_iは、演算制御回路１０８から入
力される制御信号ＣＭＥＭに従って、演算処理結果Ｑ_i
を出力シフトレジスタ１４のデータ出力レジスタ１０２
_iに１ビットずつ書き込む。なお同時に、水平ブランキ
ング期間Ｂ_k+1において、入力シフトレジスタ１２から
メモリ回路１０４_iに水平期間Ｈ_k+1に入力された画素
値Ｄ_i’が読み込まれる。

【００５２】続く水平期間Ｈ_k+2において、出力シフト
レジスタ１４は、演算制御回路１０８の制御信号ＣＤＯ
Ｒに従って書き込まれた演算処理結果Ｑ_iを順次シフト
して並列プロセッサ１の出力データ端子から順次出力す
る。なお同時に、水平期間Ｈ_k+2において、次の画素値
Ｄ_i”が順次入力シフトレジスタ１２に入力され、メモ
リ回路１０４_iおよび演算回路１０６_iは、水平期間Ｈ
_k+1に入力された画素値Ｄ_i’について演算処理結果Ｑ
_i’を算出するための演算処理を行っている。以上述べ
たように並列プロセッサ１の単位演算処理回路１０_iは
演算制御回路１０８の制御に従って、順次入力シフトレ
ジスタ１２から順次入力される画素値Ｄ_iを、メモリ回
路１０４_iおよび演算回路１０６_iにより順次演算処理
し、演算処理結果Ｑ_iを算出して順次出力シフトレジス
タ１４から出力する。

【００５３】以下、演算回路１０６_iにより種々の演算
処理動作が可能であることを説明する。まず、論理演算
について説明する。演算回路１０６_iによる論理演算
は、まず、演算制御回路１０８によりコマンド信号ＣＭ
Ｄ１およびコマンド信号ＣＭＤ２を論理値０に設定し、
次に、演算制御回路１０８により制御信号ＣＰＥｄ１，
ＣＰＥｄ０，ＣＰＥｅ１，ＣＰＥｅ０，ＣＰＥｆ１，Ｃ
ＰＥｆ０を設定して、入力セレクタ（ａｓ）２１０_i、
入力セレクタ（ｂｓ）２１６_iおよび入力セレクタ（ｃ
ｓ）２２２_iの出力信号を設定し、次に、制御信号ＣＰ
Ｅｇ１，ＣＰＥｇ０を設定して信号ＳＭ，ＣＹのいずれ
かを出力することにより行われる。

【００５４】すなわち、入力セレクタ（ｃｓ）２２２_i
の出力信号の論理値を０にして、信号ＣＹに入力セレク
タ（ａｓ）２１０_iおよび入力セレクタ（ｂｓ）２１６
_iの出力信号のＡＮＤ（論理積）演算結果を得ることが
できる。また、入力セレクタ（ｃｓ）２２２_iの出力信
号の論理値を１にして、信号ＣＹに入力セレクタ（ａ
ｓ）２１０_iおよび入力セレクタ（ｂｓ）２１６_iの出
力信号のＯＲ（論理和）演算結果を得ることができる。

【００５５】また、入力セレクタ（ｃｓ）２２２_iの出
力信号の論理値を０にして、信号ＳＭに入力セレクタ
（ａｓ）２１０_iおよび入力セレクタ（ｂｓ）２１６_i
の出力信号のＸＯＲ（排他的論理和）演算結果を得るこ
とができる。また、入力セレクタ（ｃｓ）２２２_iの出
力信号の論理値を１にして、信号ＳＭに入力セレクタ
（ａｓ）２１０_iおよび入力セレクタ（ｂｓ）２１６_i
の出力信号のＸＮＯＲ（反転排他的論理和）演算結果を
得ることができる。

【００５６】また、入力セレクタ（ｂｓ）２１６_iの出
力信号の論理値を０、入力セレクタ（ｃｓ）２２２_iの
出力信号の論理値を１にして、信号ＳＭに全加算回路２
４０ _iの端子Ａへの入力信号のＮＯＴ（否定）演算結果
を得ることができる。また、入力セレクタ（ｂｓ）２１
６_iの出力信号の論理値を０、入力セレクタ（ｃｓ）２
２２_iの出力信号の論理値を１、コマンド信号ＣＭＤ１
の論理値を１にして、信号ＳＭに入力セレクタ（ａｓ）
２１０_iおよび入力セレクタ（ｍｓ）２０４_iの出力信
号の論理値のＮＡＮＤ（反転論理積）演算結果を得るこ
とができる。

【００５７】これらの各論理演算処理を繰り返すことに
より、換言すると複合論理演算処理を行うことにより任
意の論理演算処理を実現することができる。例えば１動
作周期でＮＡＮＤ演算を行う他に、複合論理演算処理に
よりＮＡＮＤ演算を行うことができる。まず、演算回路
１０６_iの第１の動作周期において、演算制御回路１０
８により入力セレクタ（ｃｓ）２２２_iの出力信号の論
理値を０にして、セレクタ回路２４２_iを制御して信号
ＣＹをメモリ回路１０４_iに記憶させる。次に第２の動
作周期において、演算制御回路１０８によりメモリ回路
１０４_iに記憶された第１の動作周期におけるＡＮＤ演
算結果を全加算回路２４０_iの端子Ａに入力して入力セ
レクタ（ｂｓ）２１６_iの出力信号の論理値を０、入力
セレクタ（ｃｓ）２２２_iの出力信号の論理値を１に設
定して、２動作周期でＮＡＮＤ演算結果を得ることがで
きる。このように、複合論理演算処理により、メモリ回
路１０４_i等に記憶された任意のデータについて任意の
論理演算を行うことができる。

【００５８】さらに、主要な演算処理について説明す
る。演算回路１０６_iによるメモリ回路１０４_iに記憶
された２個のデータに対する２の補数表現での加算演算
処理は、以下のように行われる。全加算回路２４０_iは
全加算演算処理が可能なので、複数の演算処理によりメ
モリ回路１０４_iに記憶された２個の多ビットデータ、
例えば８ビットの画素値Ｄ_iと定数Ａの加算演算処理が
可能である。まず第１の動作周期において、演算制御回
路１０８は、入力セレクタ（ｃｓ）２２２_iに論理値０
を出力させ、コマンド信号ＣＭＤ１およびコマンド信号
ＣＭＤ２に論理値０を設定する。さらに、加算演算処理
の対象となる画素値Ｄ_iと定数ＡのＬＳＢ（最下位ビッ
ト；ビット０）をそれぞれセレクタ回路２００_i，２０
２_iを介して信号Ｉ１，Ｉ２として入力セレクタ（ａ
ｓ）２１０_iおよび入力セレクタ（ｂｓ）２１６_iに対
して出力し、それぞれの出力信号とさせ、それぞれ全加
算回路２４０_iの端子Ａ、端子Ｂに対して出力させる。
さらに、セレクタ回路２４２_iを制御して信号ＳＭを書
き込みビット線ｗｏｕｔから出力させ、メモリ回路１０
４_iの所定のアドレスのＬＳＢに記憶させ、信号ＣＹを
入力セレクタ（ｃｓ）２２２_iに出力させ、全加算回路
２４０_iの端子Ｃに対して出力させる。

【００５９】続いて次の動作周期ごとに順次、演算制御
回路１０８は、画素値Ｄ_iおよび定数Ａの下位ビットか
ら順に加算演算処理を行ってその結果をメモリ回路１０
４_iの所定のアドレスの下位ビットから書き込んでゆ
く。すなわち、演算制御回路１０８は動作周期ごとに、
画素値Ｄ_iおよび定数Ａの下位ビットから順に入力セレ
クタ（ａｓ）２１０_iおよびレジスタ回路２１４_iに読
み込ませ、入力セレクタ（ｃｓ）２２２_iに一つ前の動
作周期の信号ＣＹを出力させて全加算回路２４０_iに対
して出力する。この結果得られた信号ＳＭを順次メモリ
回路１０４_iの所定のアドレスの下位ビットから順に書
き込んでゆく。以上述べた演算処理を、演算制御回路１
０８が演算回路１０６_iに画素値Ｄ_iおよび定数ＡのＭ
ＳＢ（最上位ビット；ビット７）まで行わせることによ
り、多ビットデータ同士の加算演算処理を行うことが可
能である。

【００６０】なお同様に、演算回路１０６_iにより、２
の補数表現での加算演算処理とほぼ同様の処理により、
２の補数表現での減算演算処理を行うことも可能であ
る。すなわち画素値Ｄ_iから定数Ａを減算する場合、ま
ず第１の動作周期において、演算制御回路１０８は、入
力セレクタ（ｃｓ）２２２_iに論理値１を出力させ、コ
マンド信号ＣＭＤ１に論理値０を、コマンド信号ＣＭＤ
２に論理値１を設定する。さらに、減数である定数Ａの
ＬＳＢの値を入力セレクタ（ａｓ）２１０_iに出力さ
せ、被減数である画素値Ｄ_iのＬＳＢを入力セレクタ
（ｂｓ）２１６_iに出力させてそれぞれ全加算回路２４
０_iの端子Ａ、端子Ｂに対して出力させる。さらに、セ
レクタ回路２４２_iを制御して信号ＳＭを書き込みビッ
ト線ｗｏｕｔから出力させ、メモリ回路１０４_iの所定
のアドレスのＬＳＢに記憶させ、信号ＣＹを入力セレク
タ（ｃｓ）２２２_iの出力として全加算回路２４０_iの
端子Ｃに対して出力させる。

【００６１】続いて次の動作周期ごとに順次、演算制御
回路１０８は、画素値Ｄ_iおよび定数Ａの下位ビットか
ら順に加算演算処理を行ってその結果をメモリ回路１０
４_iの所定のアドレスの下位ビットから書き込んでゆ
く。すなわち、演算制御回路１０８は動作周期ごとに、
画素値Ｄ_iおよび定数Ａの下位ビットから順に入力セレ
クタ（ａｓ）２１０_iおよびレジスタ回路２１４_iに読
み込ませ、入力セレクタ（ｃｓ）２２２_iに一つ前の動
作周期の信号ＣＹを出力させて全加算回路２４０_iに対
して出力する。この結果得られた信号ＳＭを順次メモリ
回路１０４_iの所定のアドレスの下位ビットから順に書
き込んでゆく。

【００６２】以上述べた演算処理を、演算制御回路１０
８が演算回路１０６_iに画素値Ｄ_iおよび定数ＡのＭＳ
Ｂ（ビット７）まで行わせることにより、多ビットデー
タ同士の減算演算処理を行うことが可能である。以上述
べた加算演算処理と減算演算処理との差は、ＬＳＢに対
する演算の際に入力セレクタ（ｃｓ）２２２_iの出力が
論理値１であること、減数を全加算回路２４０_iの端子
Ａから入力し、被減数を全加算回路２４０_iの端子Ｂか
ら入力すること、および、コマンド信号ＣＭＤ２を論理
値１に設定することの３点である。

【００６３】以下、演算回路１０６_iによる乗算演算処
理を説明する。演算回路１０６_iによるメモリ回路１０
４_iに記憶された２個のデータ、例えば被乗数を画素値
Ｄ_i、乗数を定数Ａとした２進数表現（ストレートバイ
ナリ）での乗算演算処理は以下に述べるように、被乗数
を乗数に従ってシフト加算してゆくことによって行われ
る。まず演算制御回路１０８は、メモリ回路１０４_iの
読み出しビット線ｉｎｐ２から演算回路１０６_iに乗数
（定数Ａ）のＬＳＢを信号Ｉ２として入力し、入力セレ
クタ（ｍｓ）２０４_iに乗数の信号Ｉ２を出力させ、コ
マンド信号ＣＭＤ１に論理値１を設定する。これらの設
定により、入力セレクタ（ｍｓ）２０４_iの出力信号の
論理値が１である場合には全加算回路２４０_iの端子Ａ
へ乗数のＬＳＢが入力され、入力セレクタ（ｍｓ）２０
４_iの出力信号の論理値が０である場合には全加算回路
２４０_iの端子Ａへ論理値０が入力されることになる。
さらに演算制御回路１０８は、入力セレクタ（ｂｓ）２
１６_iおよび入力セレクタ（ｃｓ）２２２_iに全加算回
路２４０_iの端子Ｂおよび端子Ｃへ論理値０を入力させ
るように設定する。

【００６４】以上の設定を行った後に、演算制御回路１
０８は演算回路１０６_iの動作周期ごとに、メモリ回路
１０４_iに読み出しビット線ｉｎｐ１を介して被乗数
（画素値Ｄ_i）をＬＳＢから順に演算回路１０６_iに信
号Ｉ１として入力させ、信号Ｉ１の値を入力セレクタ
（ａｓ）２１０_iから出力させて得られた全加算回路２
４０_iの端子ＳＭの出力信号の値を所定のアドレスに乗
算中間結果としてメモリ回路１０４_iの所定のアドレス
のＬＳＢから順に書き込んでゆく。以上の処理により、
乗数のＬＳＢに関する乗算演算処理が終了する。

【００６５】乗数のビット１〜ビット７に関する乗算演
算処理は、以下の通りである。演算制御回路１０８は、
メモリ回路１０４_iに乗数の一つ上位のビットの値、つ
まり、前回の演算で乗数のビット（ｑ−１）（ｑ＝１，
２，…，７）の乗算演算処理を行った場合には乗数のビ
ットｑの値を信号Ｉ２として演算回路１０６_iに対して
出力させ、信号Ｉ２の値を入力セレクタ（ｍｓ）２０４
_iに出力させる。被乗数のＬＳＢについて演算を行う場
合、演算制御回路１０８は上述した加算演算処理と同様
に、入力セレクタ（ｃｓ）２２２_iに論理値０を全加算
回路２４０_iの端子Ｃに対して出力させ、被乗数のＬＳ
Ｂ以外のビット（ビット１〜ビット７）について演算処
理を行う場合には入力セレクタ（ｃｓ）２２２_iに、前
の動作周期における全加算回路２４０_iの端子ＣＹの出
力信号の値を全加算回路２４０_iの端子Ｃに対して出力
させるように設定する。

【００６６】次に演算制御回路１０８は、メモリ回路１
０４_iに被乗数のビット０からビット７までを演算回路
１０６_iに信号Ｉ１として入力させ、入力セレクタ（ａ
ｓ）２１０_iに被乗数のビット０〜ビット７の値を順次
出力させてその都度、全加算回路２４０_iの端子ＳＭか
ら演算結果を順次得させ、メモリ回路１０４_iの所定の
アドレスのワーキングバッファＷのＬＳＢから順に記憶
させる。さらに、演算制御回路１０８は、メモリ回路１
０４_iおよび演算回路１０６_iに、上述した加算演算処
理によりワーキングバッファＷに記憶された値およびメ
モリ回路１０４_iに記憶されている乗算中間結果のビッ
トｑからビット（ｑ＋７）までを加算させ、その加算結
果を乗算中間結果に記憶させる。

【００６７】演算制御回路１０８は、メモリ回路１０４
_iおよび演算回路１０６_iに、以上の乗数のビットｑに
ついての処理を乗数のビット０からビット７まで行わせ
ることにより乗数および被乗数の乗算演算処理を行う。
以上の乗算演算処理を下表参照して説明する。なお下表
においては記載の都合上、４ビット長の乗数および４ビ
ット長に被乗数について示してある。下表に示すよう
に、乗数のビットＡ０〜Ａ３（上述の説明においてはＡ
０〜Ａ７）について被乗数の全てのビットＤ０〜Ｄ３
（上述の説明においてはＤ０〜Ｄ７）の乗算を行い、こ
れらを加算してワーキングバッファＷに記憶する。

【００６８】つまり、ワーキングバッファＷの内容は、
乗数Ａのビット０（Ａ０）に関する演算処理が終わった
時点で（A0*D3 ＋A0*D2 ＋A0*D1 ＋A0*D0 ）となり、乗数Ａのビット１（Ａ１）に関する演算処理が
終わった時点で（A1*D3 ＋A1*D2 ＋A1*D1 ＋A1*D0 ）となり、乗数Ａのビット２（Ａ２）に関する演算処理が
終わった時点で（A2*D3 ＋A2*D2 ＋A2*D1 ＋A2*D0 ）となり、乗数Ａのビット３（Ａ３）に関する演算処理が
終わった時点で（A3*D3 ＋A3*D2 ＋A3*D1 ＋A3*D0 ）となり、これらの値が乗算中間結果の所定の位置に加算
され、乗算演算の結果Ｓのビット７（Ｓ７）にキャリー
が書き込まれて乗算演算の結果が得られる。

【００６９】

【表２】 A0;W0= A0*D3 ＋A0*D2 ＋A0*D1 ＋A0*D0 A1;W1= A1*D3 ＋A1*D2 ＋A1*D1 ＋A1*D0 ＋０ A2;W2= A2*D3 ＋A2*D2 ＋A2*D1 ＋A2*D0 ＋０＋０ A3;W3= A3*D3 ＋A3*D2 ＋A3*D1 ＋A3*D0 ＋０＋０＋０Ｓ７Ｓ６Ｓ５Ｓ４Ｓ３Ｓ２Ｓ１Ｓ０Ｓ＝Ｗ０＋Ｗ１＋Ｗ２＋Ｗ３だだし、Ａ０〜Ａ３は乗数Ａの各ビットを示し、Ｄ０〜Ｄ３は被乗数Ｄ_iの各ビットを示し、Ｓ０〜Ｓ７は乗算演算の結果の各ビットを示し、ＷはワーキングバッファＷの内容を示し、＊は乗算を示す。

【００７０】以下、演算回路１０６_iごとにメモリ回路
１０４_iに記憶された条件を示すデータ（条件データ）
のビットの論理値に従って、各演算回路１０６_iにおい
て演算処理の内容を変更する方法を説明する。演算制御
回路１０８は、メモリ回路１０４_iに、条件データの所
定のビットを演算回路１０６_iに対して出力させ、入力
セレクタ（ｍｓ）２０４_iからその値を出力させ、セレ
クタ回路２３０_iを制御させる。さらに演算制御回路１
０８は、セレクタ回路２３０_iの出力信号を書き込みビ
ット線ｗｏｕｔから出力させるようにセレクタ回路２４
２_iを制御することにより、メモリ回路１０４_iに記憶
された条件データにより演算回路１０６_iそれぞれにお
いて異なる処理を行わせることが可能である。すなわち
演算制御回路１０８は、条件データのビットの論理値に
より、信号Ｉ２の値、あるいは、信号ＳＭのいずれかの
値を演算回路１０６_iの書き込みビット線ｗｏｕｔから
の出力信号の値とすることができる。

【００７１】以下、この条件分岐を用いて２の補数表現
のデータ、例えば画素値Ｄ_iの絶対値を求める方法を説
明する。まず演算制御回路１０８は、コマンド信号ＣＭ
Ｄ１を論理値０に設定し、コマンド信号ＣＭＤ２を論理
値１に設定し、メモリ回路１０４_iに画素値Ｄ_iの符号
を示すサインビットを演算回路１０６_iに対して出力さ
せ、入力セレクタ（ｍｓ）２０４_iにサインビットの値
を出力させる。さらに演算制御回路１０８は、メモリ回
路１０４_iに画素値Ｄ_iの各ビットをＬＳＢから順に読
み出しビット線ｉｎｐ２を介して信号Ｉ２として入力さ
せ、画素値Ｄ_iのＬＳＢに関する処理においては入力セ
レクタ（ｃｓ）２２２_iに論理値１を出力させ、入力セ
レクタ（ａｓ）２１０_iに論理値０を出力させ、画素値
Ｄ_iのＬＳＢ以外に関する処理においては入力セレクタ
（ｃｓ）２２２_iに信号ＣＹの値を出力させ、入力セレ
クタ（ａｓ）２１０_iに論理値０を出力させる。

【００７２】上述の設定において、演算回路１０６
_iは、サインビットが論理値０である場合には、信号Ｉ
２をそのまま書き込みビット線ｗｏｕｔから出力する。
一方、全加算回路２４０_iの信号ＳＭは、画素値Ｄ_iの
全ビットを反転して１を加えた値、換言すると、画素値
Ｄ_iの符号を反転した値となる。すなわち、演算制御回
路１０８は、画素値Ｄ_iのサインビットが論理値１、つ
まり画素値Ｄ_iが負である場合にはセレクタ回路２３０
_iに信号ＳＭを選択させて、セレクタ回路２４２_iを介
して画素値Ｄ_iの符号を反転した値を書き込みビット線
ｗｏｕｔから出力させ、サインビットが論理値０、つま
り画素値Ｄ_iが正である場合にはセレクタ回路２３０_i
に信号Ｉ２を選択させて画素値Ｄ_iをそのまま書き込み
ビット線ｗｏｕｔから出力させることができる。このよ
うな演算回路１０６_iの出力信号は、画素値Ｄ_iの絶対
値に他ならない。

【００７３】なお、上述した本発明の並列プロセッサの
実施例においては、演算回路１０６ _iによる論理演算処
理、加算演算処理、減算演算処理、乗算演算処理、およ
び、絶対値の算出の各演算処理処理について示したが、
本発明の並列プロセッサ１において、これらの演算処理
を任意に組み合わせて、画素値Ｄ_iおよびその他のメモ
リ回路１０４_iに記憶された情報について任意の処理を
行うことができる。また、２の補数表現されたデータに
対する乗算演算処理も、上述した単純２進数に対する乗
算演算処理にサインビットに関する処理を加えた、ほぼ
同様の演算処理により行うことが可能である。

【００７４】また、上述した実施例においては、演算回
路１０６_iは入力セレクタ（ａｓ）２１０_iに信号Ｉ１
を入力し、入力セレクタ（ｂｓ）２１６_iに信号Ｉ２を
入力するように構成されているが、この構成は並列プロ
セッサ１の入出力構成（１バンク２ポート構成）に起因
している。また、演算制御回路１０８からメモリ回路１
０４_iに入力される制御信号ＣＭＥＭの内容を適宜変更
することにより、データを入れ換えて全加算回路２４０
_iの端子Ａ、端子Ｂへのデータ供給することも可能であ
る。

【００７５】また、本発明の並列プロセッサ１の演算回
路１０６_iは、従来技術として示したプロセッサエレメ
ント８に比べて非常に簡略化されている。つまり、入力
セレクタ（ｍｓ）２０４_i、入力セレクタ（ａｓ）２１
０_i、入力セレクタ（ｂｓ）２１６_i、および、入力セ
レクタ（ｃｓ）２２２_iに相当するプロセッサエレメン
ト８の部分がそれぞれ８入力１出力のセレクタで構成さ
れているのに対し、本発明の並列プロセッサ１において
は４入力１出力のセレクタ回路２０６_i，２１２，２１
８，２２４により構成されている。従って、本発明の並
列プロセッサによれば、回路規模を大幅に削減可能であ
り、高性能かつ安価な並列プロセッサを提供することが
可能となる。このような全加算回路２４０_iへのデータ
入力回路の簡略化は、入力セレクタ（ｍｓ）２０４_i、
入力セレクタ（ａｓ）２１０_i、入力セレクタ（ｂｓ）
２１６_i、入力セレクタ（ｃｓ）２２２_iにセレクタ回
路２００_i，２０２_iを前置し、単位演算処理回路１０
_iに隣接する単位演算処理回路１０_i-1，１０_i+1から
のデータをセレクタ回路２００_i，２０２_iにより前も
って選択して演算回路１０６_iの内部回路に導くことに
より可能となっている。

【００７６】また、演算回路１０６_iは、セレクタ回路
２００_i，２０２_iにより隣接する単位演算処理回路１
０_i-1，１０_i+1からのデータとメモリ回路１０４_iか
らのデータを選択している。このような選択によって
は、上述した各演算処理においては全加算回路２４０_i
の端子Ａおよび端子Ｂに供給するデータの値に制限を生
じない。上述の実施例に示した他、本発明の並列プロセ
ッサは、例えば変形例として上述したように、種々の構
成をとることができる。

【００７７】図４は、本発明のプロセッサエレメント１
０６_iの変形例の１例を具体的に図示したものである。
図５の構成は、メモリ１０４_iの出力端子であるｉｎｐ
１，ｉｎｐ２からの信号がすでにメモリ１０４_iの内部
のセンス・アンプでラッチされて供給される場合の構成
である。したがって図５の構成では、セレクタ２０
４ _i、セレクタ２１０_i、セレクタ２１６_iの内部のそ
れぞれのレジスタおよびレジスタ２２８_iが削除され、
セレクタ２０２_iの出力信号が、セレクタ２０６_i、セ
レクタ２１８_i、セレクタ２３０_iに、またセレクタ２
００_iの出力信号がセレクタ２２３_iにそれぞれ直接接
続されているほかは、図３の構成と全く同等の構成にな
っている。図４の構成は先に述べた４つのレジスタを削
除しているとはいえ、それと同じレジスタの機能をメモ
リ１０４_iの内部のセンス・アンプに期待しているの
で、図３と同等の機能が実現されることは明らかであ
る。

【００７８】

【発明の効果】以上述べたように本発明の並列プロセッ
サによれば、単位プロセッサに含まれるプロセッサエレ
メントが有するＡＬＵにデータを供給するレジスタの回
路規模を小さくすることができ、回路構成の冗長性を減
じることができ、消費電力を削減することができる。ま
た、本発明においては、プロセッサエレメントの回路規
模を小さくすることができるにもかかわらず、その性能
が低下しない。さらに本発明によれば、各単位プロセッ
サに回路規模を小さくして単一回路素子上の単位プロセ
ッサの数を増加させることができ、より高性能な並列プ
ロセッサを提供することができる。また本発明によれ
ば、同一数の単位プロセッサをより小さい回路素子面積
で実現し、安価な並列プロセッサを提供することができ
る。さらに本発明によれば、結果として削減した回路の
代わりにＢｏｏｔｈの乗算アルゴリズムに適応したハー
ドウエアを追加して、さらなる性能の向上を計ることが
できる。

【図面の簡単な説明】

【図１】本発明の並列プロセッサの構成を示す図であ
る。

【図２】図１に示した単位演算処理回路を構成するデー
タ入力レジスタ（ＤＩＲ）、データ出力レジスタ（ＤＯ
Ｒ）、メモリ回路（ＭＥＭ）、および、演算回路（Ｐ
Ｅ）の接続を示す図である。

【図３】図１および図２に示した演算回路の構成を示す
図である。

【図４】図１および図２に示した演算回路の他の回路構
成を示す図である。

【図５】文献「Chiders J. et al,"SVP:Serial Video P
rocessor", IEEE 1990 CICC, pp17.3.1 〜pp17.3.4」に
記載された従来のプロセッサエレメントの構成を示す図
である。

【符号の説明】

１…並列プロセッサ１０…単位演算処理回路１２…入力シフトレジスタ１４…出力シフトレジスタ１００…データ入力レジスタ１０２…データ出力レジスタ１０４…メモリ回路１０６…演算回路１０８…演算制御回路２００，２０２…セレクタ回路２０４…入力セレクタｍｓ２１０…入力セレクタａｓ２１６…入力セレクタｂｓ２２２…入力セレクタｃｓ２０６，２１２，２１８，２２４，２３０，２４２…セ
レクタ回路２０８，２１４，２２０，２２６，２２８…レジスタ回
路２３２…ＯＲ回路２３６…ＡＮＤ回路２３８…ＸＯＲ回路２４０…全加算回路

フロントページの続き (56)参考文献特開平１−187676（ＪＰ，Ａ) 特開平３−248229（ＪＰ，Ａ) 特開平４−36856（ＪＰ，Ａ) 特開平４−37949（ＪＰ，Ａ) 特開平６−89271（ＪＰ，Ａ) 特開平６−96036（ＪＰ，Ａ) 特開昭60−27984（ＪＰ，Ａ) Ｊ．Ｃｈｉｌｄｅｒｓ他，ＳＶＰ：ｓｅｒｉａｌｖｉｄｅｏｐｒｏｃｅｓｓｏｒ，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥ 1990 ＣｕｓｔｏｍＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔｓＣｏｎｆｅｒｅｎｃｅ，米国，1990年５月13日，ｐ．17．３．１ −17．３．４Ｔ．Ｂａｊｉ他，Ａ 20−ｎｓＣＭＯＳＭｉｃｒｏ−ＤＳＰＣｏｒｅｆｏｒＶｉｄｅｏ−ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，ＩＥＥＥＪｏｕｒｎａｌｏｆＳｏｌｉｄ−ＳｔａｔｅＣｉｒｃｕｉｔｓ，米国，1988年 10月１日，Ｖｏｌ．23，Ｎｏ．５, ｐ．1203−1211 ＪｏｈｎＰ．Ｎｏｒｓｗｏｒｔｈｙ他，ＡＰａｒａｌｌｅｌＩｍａｇｅＰｒｏｃｅｓｓｏｒＣｈｉｐ, 1988 ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｏｌｉｄ−ＳｔａｔｅＣｉｒｃｕｉｔｓＣｏｎｆｅｒｅｎｃｅ, 米国，1988年２月17日，ｐ．158− 159，345 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 15/80 G06F 15/16 - 15/177 G06F 7/00 G06F 9/38 G06T 1/20

Claims

(57)【特許請求の範囲】

【請求項１】１周期あたり複数のデータからなる入力信
号に演算処理を行う並列プロセッサであって、該並列プロセッサは前記複数のデータ数に応じた数だけ
並列に設けられ、それぞれ１データごとの演算処理を行
う複数の単位演算ユニットを具備し、該単位演算ユニットそれぞれは、メモリ回路と、該メモ
リ回路に接続されたプロセッサエレメントとを有し、隣
接する２つの単位演算ユニットとデータの交換が可能な
ように構成されており、該プロセッサエレメントはそれぞれ、全加算回路と、該全加算回路の第１の入力に接続された２つの入力につ
いて論理演算を行う論理演算回路と、前記単位演算ユニット内のメモリ回路からの第１のデー
タまたは隣接する単位演算ユニット内のメモリ回路から
の第１のデータのいずれかを選択する第１のセレクタ回
路と、前記単位演算ユニット内のメモリ回路からの第２のデー
タまたは隣接する単位演算ユニット内のメモリ回路から
の第２のデータのいずれかを選択する第２のセレクタ回
路と、該第２のセレクタ回路が選択した第２のデータ、論理値
１または論理値０のいずれかを選択して前記論理演算回
路に対する第１の入力として出力する第３のセレクタ回
路と、前記第１のセレクタ回路が選択した第１のデータ、論理
値１または論理値０のいずれかを選択して前記論理演算
回路に対する第２の入力として出力する第４のセレクタ
回路と、前記第２のセレクタ回路が選択した第２のデータ、論理
値１または論理値０のいずれかを選択して前記全加算回
路の第２の入力として出力する第５のセレクタ回路と、前記全加算回路のキャリー出力、論理値１または論理値
０のいずれかを選択して前記全加算回路の第３の入力と
して出力する第６のセレクタ回路とを有する並列プロセ
ッサ。
【請求項２】前記第２のセレクタ回路が選択した第２の
データを保持するレジスタ回路と、前記第３のセレクタ回路が保持するデータに従って、前
記全加算回路の加算値出力または前記レジスタ回路に保
持された前記第２のデータのいずれかを選択する第７の
セレクタ回路をさらに有する請求項１に記載の並列プロ
セッサ。
【請求項３】前記第７のセレクタ回路が選択したデー
タ、前記全加算回路の加算値出力またはキャリー出力の
いずれかを選択する第８のセレクタ回路をさらに有し、前記第８のセレクタ回路が選択したデータを当該単位演
算ユニットのメモリ回路に記憶するように構成されてい
る請求項２に記載の並列プロセッサ。
【請求項４】前記論理回路は、前記第３のセレクタ回路
が選択したデータ、前記第４のセレクタ回路が選択した
データおよび該プロセッサエレメントに供給されたコマ
ンドとに所定の論理演算を行って前記全加算回路の第１
の入力として出力する請求項１〜３のいずれかに記載の
並列プロセッサ。
【請求項５】前記第３〜第６のセレクタ回路の内部レジ
スタおよび前記第２のセレクタで選択した第２のデータ
を保持するレジスタ回路のうち、共用可能なものについ
て、共用可能に構成した、請求項２〜４いずれか記載の
並列プロセッサ。
【請求項６】前記第３〜第６のセレクタ回路の内部レジ
スタおよび前記第２のセレクタで選択した第２のデータ
を保持するレジスタ回路のうち、メモリ内部のセンスア
ンプのレジスタ機能にて代用した構成をした、請求項２
〜４いずれか記載の並列プロセッサ。
【請求項７】前記並列プロセッサにおいて、所定の論理
演算に代えてＢｏｏｔｈの乗算アルゴリズムに対応した
演算を行うように構成されている請求項４記載の並列プ
ロセッサ。
【請求項８】クロック信号をグループ分けして所望の動
作に合わせて変化させて消費電力を低減させる、請求項
１〜７いずれか記載の並列プロセッサ。