JPH08161165A - パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法 - Google Patents
パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法Info
- Publication number
- JPH08161165A JPH08161165A JP6330830A JP33083094A JPH08161165A JP H08161165 A JPH08161165 A JP H08161165A JP 6330830 A JP6330830 A JP 6330830A JP 33083094 A JP33083094 A JP 33083094A JP H08161165 A JPH08161165 A JP H08161165A
- Authority
- JP
- Japan
- Prior art keywords
- processing element
- register
- output
- adder
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Advance Control (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】
【目的】 データ処理の効率を高めるパイプライン式及
び心収縮式の単命令多重データストリームのアレイプロ
セッサ及びその方法の提供。 【構成】 本発明は、特に、同報通信方式と心収縮式方
式で多数のパイプライン式処理エレメントを連接し、こ
れにより単命令による多重データストリーム処理を完成
するアレイプロセッサとその方法に関し、並びにコンピ
ュータ平行処理装置、影像処理装置及びディジタル信号
処理装置などの設計に使用することができ、同時に資料
の伝送と転送においてさらに効率的な処理が行え、また
一つのシングルチップに製造することができ、その実用
性を倍増する。
び心収縮式の単命令多重データストリームのアレイプロ
セッサ及びその方法の提供。 【構成】 本発明は、特に、同報通信方式と心収縮式方
式で多数のパイプライン式処理エレメントを連接し、こ
れにより単命令による多重データストリーム処理を完成
するアレイプロセッサとその方法に関し、並びにコンピ
ュータ平行処理装置、影像処理装置及びディジタル信号
処理装置などの設計に使用することができ、同時に資料
の伝送と転送においてさらに効率的な処理が行え、また
一つのシングルチップに製造することができ、その実用
性を倍増する。
Description
【0001】
【産業上の利用分野】本発明は、一種のパイプライン式
及び心収縮式(Systolic)の単命令による多重
データストリーム(SIMD)の処理を行うアレイプロ
セッサ及びその方法に関し、特に、同報通信方式と心収
縮式方式で多数のパイプライン式処理エレメント(pi
pelined Processing Elemen
t)を連接し、これにより単命令による多重データスト
リーム処理を完成するアレイプロセッサ(Array
Processor)とその方法に関し、並びにコンピ
ュータ平行処理装置、影像処理装置及びディジタル信号
処理装置などの設計に使用することができ、同時に資料
の伝送と転送においてさらに効率的な処理が行え、また
一つのシングルチップに製造することができ、その実用
性を倍増する構造を有するものに関する。
及び心収縮式(Systolic)の単命令による多重
データストリーム(SIMD)の処理を行うアレイプロ
セッサ及びその方法に関し、特に、同報通信方式と心収
縮式方式で多数のパイプライン式処理エレメント(pi
pelined Processing Elemen
t)を連接し、これにより単命令による多重データスト
リーム処理を完成するアレイプロセッサ(Array
Processor)とその方法に関し、並びにコンピ
ュータ平行処理装置、影像処理装置及びディジタル信号
処理装置などの設計に使用することができ、同時に資料
の伝送と転送においてさらに効率的な処理が行え、また
一つのシングルチップに製造することができ、その実用
性を倍増する構造を有するものに関する。
【0002】
【従来の技術】従来より、アレイプロセッサのデータ処
理をさらに効率的に行う構造及び方法が求められてい
た。
理をさらに効率的に行う構造及び方法が求められてい
た。
【0003】
【発明が解決しようとする課題】本発明のパイプライン
式と心収縮式及び単命令多重データストリームのアレイ
プロセッサ及びその方法は、データ入出力、データシフ
ト、データ転換などの方式を提供し、データ処理をより
速く効率的に行うことを課題とする。
式と心収縮式及び単命令多重データストリームのアレイ
プロセッサ及びその方法は、データ入出力、データシフ
ト、データ転換などの方式を提供し、データ処理をより
速く効率的に行うことを課題とする。
【0004】また、本発明のパイプライン式と心収縮式
及び単命令多重データストリームのアレイプロセッサ及
びその方法は、データ入出力において有効に使用され、
データライン(Data lines)及び集積回路の
ピン数(pin−count)を節約し、制御ラインの
数が多くなり複雑となることを防ぎ、記憶体の使用効率
を増し、並びに一つのシングルチップに製造することが
次の課題である。
及び単命令多重データストリームのアレイプロセッサ及
びその方法は、データ入出力において有効に使用され、
データライン(Data lines)及び集積回路の
ピン数(pin−count)を節約し、制御ラインの
数が多くなり複雑となることを防ぎ、記憶体の使用効率
を増し、並びに一つのシングルチップに製造することが
次の課題である。
【0005】また、本発明のパイプライン式と心収縮式
及び単命令多重データストリームのアレイプロセッサ及
びその方法は、一次元及び二次元の構造上に使用できる
ものとすることが第3の課題である。
及び単命令多重データストリームのアレイプロセッサ及
びその方法は、一次元及び二次元の構造上に使用できる
ものとすることが第3の課題である。
【0006】さらに、本発明のパイプライン式と心収縮
式及び単命令多重データストリームのアレイプロセッサ
及びその方法は、シングルチップとして直接コンピュー
タ或いはテレビジョン上に取り付けられて多種の影像処
理を行える効果を達成し、実用的で且つ便利であり、且
つ使用空間を節約できるものとすることを課題とする。
式及び単命令多重データストリームのアレイプロセッサ
及びその方法は、シングルチップとして直接コンピュー
タ或いはテレビジョン上に取り付けられて多種の影像処
理を行える効果を達成し、実用的で且つ便利であり、且
つ使用空間を節約できるものとすることを課題とする。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、パイプライン式処理エレメント(pip
elined Processing Elemen
t)、レジスタ(registcr)及びマルチプレク
サ(multiplexer)等から構成し、並びに処
理エレメント(PE)の前後の入出力端に、レジスタ及
びマルチプレクサを連接し、即ち同報通信式(Broa
dcasting)及び心収縮式(systolic)
式でデータを処理エレメント(PE)に伝送し、処理エ
レメント(PE)の入出力端にレジスタとマルチクプレ
クサを加え、各レジスタ及びマルチプレクサを相互に連
接制御する。よって本発明の動作時にはデータを更新す
る時に、全てのデータを新たにロードする必要がなく、
ただ足らないデータをロードすればよく、元のデータは
必要な分を転換してロードすることにより、データをロ
ードする時間、データライン及び制御ラインの数を節約
でき、本発明を集積回路に実現することができる。
に、本発明は、パイプライン式処理エレメント(pip
elined Processing Elemen
t)、レジスタ(registcr)及びマルチプレク
サ(multiplexer)等から構成し、並びに処
理エレメント(PE)の前後の入出力端に、レジスタ及
びマルチプレクサを連接し、即ち同報通信式(Broa
dcasting)及び心収縮式(systolic)
式でデータを処理エレメント(PE)に伝送し、処理エ
レメント(PE)の入出力端にレジスタとマルチクプレ
クサを加え、各レジスタ及びマルチプレクサを相互に連
接制御する。よって本発明の動作時にはデータを更新す
る時に、全てのデータを新たにロードする必要がなく、
ただ足らないデータをロードすればよく、元のデータは
必要な分を転換してロードすることにより、データをロ
ードする時間、データライン及び制御ラインの数を節約
でき、本発明を集積回路に実現することができる。
【0008】
【作用】本発明は、一種のパイプライン式(Pipel
ined)及び心収縮式(Systolic)の単命令
多重データ(SIMD)のアレイプロセッサ(Arra
y Processor)及びその方法に関するもの
で、パイプライン式処理エレメント(pipeline
d Processing Element)、レジス
タ(register)及びマルチクレクサ(mult
iplexer)などより構成され、各処理エレメント
の入力及び出力端に複数のレジスタ及びマルチプレクサ
を加えてデータを転送する。それは同報通信式(Bro
adcasting)及び心収縮式の混合方式により伝
送資料を各処理エレメントにて入出力する。その制御は
一つの制御器により行われるため、運算、移動、転換な
どの処理をより速くできる。且つ各処理エレメントは少
量のレジスタの使用を必要とするだけであり、並びにマ
ルチポート記憶体を制御することで記憶体の使用がより
有効に行える。
ined)及び心収縮式(Systolic)の単命令
多重データ(SIMD)のアレイプロセッサ(Arra
y Processor)及びその方法に関するもの
で、パイプライン式処理エレメント(pipeline
d Processing Element)、レジス
タ(register)及びマルチクレクサ(mult
iplexer)などより構成され、各処理エレメント
の入力及び出力端に複数のレジスタ及びマルチプレクサ
を加えてデータを転送する。それは同報通信式(Bro
adcasting)及び心収縮式の混合方式により伝
送資料を各処理エレメントにて入出力する。その制御は
一つの制御器により行われるため、運算、移動、転換な
どの処理をより速くできる。且つ各処理エレメントは少
量のレジスタの使用を必要とするだけであり、並びにマ
ルチポート記憶体を制御することで記憶体の使用がより
有効に行える。
【0009】
【実施例】図1に示すのは、本発明のパイプライン式と
心収縮式及び単命令多重データストリームのアレイプロ
セッサのブロック回路図である。本発明は、アレイ処理
構造をなす処理エレメントPE1〜PEn、同報通信レ
ジスタrb、シフトレジスタアレイrs11〜rs1
n、rs21〜rs2n、ro1〜ron、マルチプレ
クサMu11〜Mu1n、Mu21〜Mu2n、Mb、
MO1〜MOn、MOb、一つのマルチポート記憶体M
(multi−port memory)、一つの制御
器C(controller)から主に構成される。入
力端において、処理エレメントPE1〜PEnはレジス
タrs11〜rs1n、rs21〜rs2n、rbにマ
ルチプレクサMu11〜Mu1n、Mu21〜Mu2
n、Mbを経て連結される。
心収縮式及び単命令多重データストリームのアレイプロ
セッサのブロック回路図である。本発明は、アレイ処理
構造をなす処理エレメントPE1〜PEn、同報通信レ
ジスタrb、シフトレジスタアレイrs11〜rs1
n、rs21〜rs2n、ro1〜ron、マルチプレ
クサMu11〜Mu1n、Mu21〜Mu2n、Mb、
MO1〜MOn、MOb、一つのマルチポート記憶体M
(multi−port memory)、一つの制御
器C(controller)から主に構成される。入
力端において、処理エレメントPE1〜PEnはレジス
タrs11〜rs1n、rs21〜rs2n、rbにマ
ルチプレクサMu11〜Mu1n、Mu21〜Mu2
n、Mbを経て連結される。
【0010】出力端において、処理エレメントPE1〜
PEnはレジスタro1〜ronにマルチプレクサMO
1〜MOn、MObを経て連結される。さらに、マルチ
ポート記憶体Mは、レジスタrs21、rs11、r
b、ro1に連結される。そして、本発明の全ての構成
要素は制御器Cにより制御される。制御器Cから送り出
される制御信号については以下説明する: 制御信号1:シフトレジスタアレイ(Shift re
gister Array)rs21〜rs2nのシフ
ト/ロード制御信号 制御信号2:シフトレジスタアレイrs21〜rs2n
のクリア制御(clear control)信号 制御信号3:シフトレジスタアレイrs11〜rs1n
のシフト/ロード制御信号 制御信号4:シフトレジスタアレイrs11〜rs1n
のクリア制御信号 制御信号5:マルチプレクサMu11〜Mu1nのデー
タ選択制御信号 制御信号6:マルチプレクサMu21〜Mu2nのデー
タ選択制御信号 制御信号7:マルチプレクサMbの同報通信データ選択
制御信号 制御信号8:同報通信レジスタrbのロード制御信号 制御信号9:処理エレメントPE1〜PEnの機能制御
信号 制御信号10:処理エレメントPE1〜PEnのリセッ
ト制御信号 制御信号11:シフトレジスタアレイro1〜ronの
シフト/ロード制御信号 制御信号12:マルチプレクサMO1〜MOnのデータ
選択制御信号 制御信号13:マルチプレクサMObのデータ選択制御
信号 制御信号14:マルチポート記憶体の制御信号であり、
アドレス、読み書き、許可などを含む データ及び制御信号15:外部プロセッサからマルチポ
ート記憶体へのデータ及び制御信号 データ伝送制御信号16:他の外部機能ユニットへのデ
ータ信号
PEnはレジスタro1〜ronにマルチプレクサMO
1〜MOn、MObを経て連結される。さらに、マルチ
ポート記憶体Mは、レジスタrs21、rs11、r
b、ro1に連結される。そして、本発明の全ての構成
要素は制御器Cにより制御される。制御器Cから送り出
される制御信号については以下説明する: 制御信号1:シフトレジスタアレイ(Shift re
gister Array)rs21〜rs2nのシフ
ト/ロード制御信号 制御信号2:シフトレジスタアレイrs21〜rs2n
のクリア制御(clear control)信号 制御信号3:シフトレジスタアレイrs11〜rs1n
のシフト/ロード制御信号 制御信号4:シフトレジスタアレイrs11〜rs1n
のクリア制御信号 制御信号5:マルチプレクサMu11〜Mu1nのデー
タ選択制御信号 制御信号6:マルチプレクサMu21〜Mu2nのデー
タ選択制御信号 制御信号7:マルチプレクサMbの同報通信データ選択
制御信号 制御信号8:同報通信レジスタrbのロード制御信号 制御信号9:処理エレメントPE1〜PEnの機能制御
信号 制御信号10:処理エレメントPE1〜PEnのリセッ
ト制御信号 制御信号11:シフトレジスタアレイro1〜ronの
シフト/ロード制御信号 制御信号12:マルチプレクサMO1〜MOnのデータ
選択制御信号 制御信号13:マルチプレクサMObのデータ選択制御
信号 制御信号14:マルチポート記憶体の制御信号であり、
アドレス、読み書き、許可などを含む データ及び制御信号15:外部プロセッサからマルチポ
ート記憶体へのデータ及び制御信号 データ伝送制御信号16:他の外部機能ユニットへのデ
ータ信号
【0011】本発明のデータ処理演算に関して、入力デ
ータは処理エレメントPE1、PE2に送られ、制御信
号1〜8の制御の下で処理される。これらの制御信号の
作用については以下に述べる:もし、制御信号2がロジ
ック1であるならば、レジスタrs21〜rs2nの内
容はロジック0にクリアされる。運算は、データを入力
して処理エレメントPE1〜PEnでデータ処理を行う
のに、制御信号1から制御信号8により制御し、例えば
制御信号2をロジック1とする時には、レジスタrs2
1〜rs2nをクリアして0とする。制御信号4をロジ
ック1とするときには、レジスタrs11〜rs1nを
クリアして0となす。また制御信号1を1とする時に
は、レジスタrs21のデータはマルチポート記憶体M
(ms2)から入力され、もともとrs21のデータは
シフトされてrs22に与えられ、rs22はまずデー
タをrs23にシフトする。このようにシフトを続け、
一つのデータのシフトを構成し、制御信号3を1とする
時には、データのシフトにより、マルチポート記憶体M
(ms1)のデータはレジスタrs11に与えられ、各
レジスタ中には2つのマルチプレクサが含まれる(例:
レジスタrs11とrs12の間にはマルチプレクサM
u11とMu21が含まれる)。マルチプレクサMu1
1〜Mu1nは制御信号5の制御により、またマルチプ
レクサMu21〜Mu2nは制御信号6の制御により、
レジスタrs12の入力したデータを二つのマルチプレ
クサで処理した後データis1を与える。レジスタrs
13はデータis2を入力し、このように、マルチプレ
クサMu11〜Mu1nは制御信号5の制御により、こ
の制御信号5をロジック1となすことで、マルチプレク
サMu11〜Mu1nの出力データとレジスタrs11
〜rs1nの出力データは同じとなる。もし制御信号を
ロジック0とするならば、マルチプレクサMu11〜M
u1nの出力データと処理エレメントPE1〜PEnの
出力データOi1〜Oinは同じとなり、マルチプレク
サMu21〜Mu2nは制御信号6の制御により、該制
御信号6を1とする時にはマルチプレクサMu21〜M
u2nの出力データとマルチプレクサMu11〜Mu1
nの出力データは同じとなり、制御信号6を0とする時
は、マルチプレクサMu21〜Mu2nの出力データと
レジスタrs21〜rs2nの出力データは同じとな
る。このほか、制御信号8はレジスタrbのデータのロ
ードを制御し、もし制御信号8を1とするならばレジス
タrbのデータはマルチポート記憶体Mにロードされ、
制御信号7はマルチプレクサMbのデータ選択を制御す
る。制御信号7を0とするならば、出力信号ib=Ob
であり、制御信号7を1とすると、出力信号ib=レジ
スタrb内のデータとなる。出力制御方面では制御信号
11〜制御信号13により制御する。その制御方法は前
述に述べた制御方法と同じである。制御信号11により
シフトレジスタアレイro1〜ronのデータシフトを
制御し、制御信号12によりマルチプレクサMo1〜M
onのデータ選択を制御し、制御信号13はマルチプレ
クサMobのデータ選択制御を行い、制御信号14は、
マルチポート記憶体Mの制御を行い、もって各種データ
の読み書き制御を行う。
ータは処理エレメントPE1、PE2に送られ、制御信
号1〜8の制御の下で処理される。これらの制御信号の
作用については以下に述べる:もし、制御信号2がロジ
ック1であるならば、レジスタrs21〜rs2nの内
容はロジック0にクリアされる。運算は、データを入力
して処理エレメントPE1〜PEnでデータ処理を行う
のに、制御信号1から制御信号8により制御し、例えば
制御信号2をロジック1とする時には、レジスタrs2
1〜rs2nをクリアして0とする。制御信号4をロジ
ック1とするときには、レジスタrs11〜rs1nを
クリアして0となす。また制御信号1を1とする時に
は、レジスタrs21のデータはマルチポート記憶体M
(ms2)から入力され、もともとrs21のデータは
シフトされてrs22に与えられ、rs22はまずデー
タをrs23にシフトする。このようにシフトを続け、
一つのデータのシフトを構成し、制御信号3を1とする
時には、データのシフトにより、マルチポート記憶体M
(ms1)のデータはレジスタrs11に与えられ、各
レジスタ中には2つのマルチプレクサが含まれる(例:
レジスタrs11とrs12の間にはマルチプレクサM
u11とMu21が含まれる)。マルチプレクサMu1
1〜Mu1nは制御信号5の制御により、またマルチプ
レクサMu21〜Mu2nは制御信号6の制御により、
レジスタrs12の入力したデータを二つのマルチプレ
クサで処理した後データis1を与える。レジスタrs
13はデータis2を入力し、このように、マルチプレ
クサMu11〜Mu1nは制御信号5の制御により、こ
の制御信号5をロジック1となすことで、マルチプレク
サMu11〜Mu1nの出力データとレジスタrs11
〜rs1nの出力データは同じとなる。もし制御信号を
ロジック0とするならば、マルチプレクサMu11〜M
u1nの出力データと処理エレメントPE1〜PEnの
出力データOi1〜Oinは同じとなり、マルチプレク
サMu21〜Mu2nは制御信号6の制御により、該制
御信号6を1とする時にはマルチプレクサMu21〜M
u2nの出力データとマルチプレクサMu11〜Mu1
nの出力データは同じとなり、制御信号6を0とする時
は、マルチプレクサMu21〜Mu2nの出力データと
レジスタrs21〜rs2nの出力データは同じとな
る。このほか、制御信号8はレジスタrbのデータのロ
ードを制御し、もし制御信号8を1とするならばレジス
タrbのデータはマルチポート記憶体Mにロードされ、
制御信号7はマルチプレクサMbのデータ選択を制御す
る。制御信号7を0とするならば、出力信号ib=Ob
であり、制御信号7を1とすると、出力信号ib=レジ
スタrb内のデータとなる。出力制御方面では制御信号
11〜制御信号13により制御する。その制御方法は前
述に述べた制御方法と同じである。制御信号11により
シフトレジスタアレイro1〜ronのデータシフトを
制御し、制御信号12によりマルチプレクサMo1〜M
onのデータ選択を制御し、制御信号13はマルチプレ
クサMobのデータ選択制御を行い、制御信号14は、
マルチポート記憶体Mの制御を行い、もって各種データ
の読み書き制御を行う。
【0012】図2に示すのは、本発明のパイプライン式
処理エレメントPEの内部構造図である。これは、ファ
ーストインファーストアウト記憶体100(first
−in first−out memory)、定数レ
ジスタファイル101(constant regis
ter file)、マルチプレクサ102、103、
108、114、レジスタ106、107、110、乗
算器104(Multiplier)、絶対差値ユニッ
ト105(Absolute−Difference
unit)、加算器109(Adder)、データレジ
スタファイル113(Data register f
ile)、三態バッファ111(tristate b
uffer)及びデコーダ112(Decoder)か
ら構成する。並びに制御器C(Controller)
の制御信号9により機能制御(Function co
ntrol)を行う、その機能制御はさらに以下のよう
に分けられる:ファーストインファーストアウト制御9
1、モード制御92、レジスタロード制御93、加法器
制御94、識別コード(ID)95、定数レジスタファ
イル制御96、データレジスタファイル制御97であ
る。モード制御92についていうと、これは並びに一つ
の読取り専用記憶体921(ROM)を有してその出力
ポートC0〜C7の制御を行い、その制御の方式につい
ては、図3に示すように、読取り専用記憶体921を動
作させ、その出力ポートC0〜C7に6種のモードを発
生させ、C0、C1はマルチプレクサ102を、C2、
C3、C4はマルチプレクサ103を、C5、C6はマ
ルチプレクサ108を、C7はマルチプレクサ114を
制御するためのものである。このように、このモード制
御92を受けることで、処理エレメントの内部処理モー
ドが変化し、即ちそのデータ伝送の異なる変化により本
発明は6種の形態上の変化を有することができる(図
4、5、6、7、8及び図9参照)。各種形態のアレイ
構造は、異なるアレイ運算を処理することができ、これ
により本発明はさらに効率的に多種の運算を処理するこ
とができる。その他の制御線の用途、制御方式は、図を
対照し、以下のように説明を行う: 911・・・ファーストインファーストアウト記憶体1
00のデータ読取り制御信号 912・・・ファーストインファーストアウト記憶体1
00のデータ書込み制御信号 913・・・ファーストインファーストアウト記憶体1
00のリセット信号 931・・・レジスタ106のデータロード制御信号 932・・・レジスタ107のデータロード制御信号 933・・・レジスタ110のデータロード制御信号 94・・・加法器109の加法制御信号 95・・・処理エレメントの識別コード(ID)とな
し、またデコーダ112の入力信号となす 961・・・定数レジスタファイル101のデータ読取
り制御信号 962・・・定数レジスタファイル101のデータ読取
りアドレス信号 963・・・定数レジスタファイル101のデータ書込
み制御信号 964・・・定数レジスタファイル101のデータ書込
みアドレス信号 971・・・データレジスタファイル113のデータ読
取り制御信号 972・・・データレジスタファイル113のデータ読
取りアドレス信号 973・・・データレジスタファイル113のデータ書
込み制御信号 974・・・データレジスタファイル113のデータ書
込みアドレス信号
処理エレメントPEの内部構造図である。これは、ファ
ーストインファーストアウト記憶体100(first
−in first−out memory)、定数レ
ジスタファイル101(constant regis
ter file)、マルチプレクサ102、103、
108、114、レジスタ106、107、110、乗
算器104(Multiplier)、絶対差値ユニッ
ト105(Absolute−Difference
unit)、加算器109(Adder)、データレジ
スタファイル113(Data register f
ile)、三態バッファ111(tristate b
uffer)及びデコーダ112(Decoder)か
ら構成する。並びに制御器C(Controller)
の制御信号9により機能制御(Function co
ntrol)を行う、その機能制御はさらに以下のよう
に分けられる:ファーストインファーストアウト制御9
1、モード制御92、レジスタロード制御93、加法器
制御94、識別コード(ID)95、定数レジスタファ
イル制御96、データレジスタファイル制御97であ
る。モード制御92についていうと、これは並びに一つ
の読取り専用記憶体921(ROM)を有してその出力
ポートC0〜C7の制御を行い、その制御の方式につい
ては、図3に示すように、読取り専用記憶体921を動
作させ、その出力ポートC0〜C7に6種のモードを発
生させ、C0、C1はマルチプレクサ102を、C2、
C3、C4はマルチプレクサ103を、C5、C6はマ
ルチプレクサ108を、C7はマルチプレクサ114を
制御するためのものである。このように、このモード制
御92を受けることで、処理エレメントの内部処理モー
ドが変化し、即ちそのデータ伝送の異なる変化により本
発明は6種の形態上の変化を有することができる(図
4、5、6、7、8及び図9参照)。各種形態のアレイ
構造は、異なるアレイ運算を処理することができ、これ
により本発明はさらに効率的に多種の運算を処理するこ
とができる。その他の制御線の用途、制御方式は、図を
対照し、以下のように説明を行う: 911・・・ファーストインファーストアウト記憶体1
00のデータ読取り制御信号 912・・・ファーストインファーストアウト記憶体1
00のデータ書込み制御信号 913・・・ファーストインファーストアウト記憶体1
00のリセット信号 931・・・レジスタ106のデータロード制御信号 932・・・レジスタ107のデータロード制御信号 933・・・レジスタ110のデータロード制御信号 94・・・加法器109の加法制御信号 95・・・処理エレメントの識別コード(ID)とな
し、またデコーダ112の入力信号となす 961・・・定数レジスタファイル101のデータ読取
り制御信号 962・・・定数レジスタファイル101のデータ読取
りアドレス信号 963・・・定数レジスタファイル101のデータ書込
み制御信号 964・・・定数レジスタファイル101のデータ書込
みアドレス信号 971・・・データレジスタファイル113のデータ読
取り制御信号 972・・・データレジスタファイル113のデータ読
取りアドレス信号 973・・・データレジスタファイル113のデータ書
込み制御信号 974・・・データレジスタファイル113のデータ書
込みアドレス信号
【0013】図10は本発明のマトリックス運算処理
(matrix computation)のアレイ構
造の実施例を示す。本発明がマトリックス運算を行う
時、制御器Cの制御により、その処理エレメントの内部
構造は第1モードの下(図4に示す)にあり、マルチプ
レクサMu11〜Mu1nの制御信号5を制御し、マル
チプレクサMu21〜Mu2nの制御信号6を制御し、
マルチプレクサMbの制御信号7及びマルチプレクサM
obの制御信号13を制御し、すべてをロジック1状態
に制御するため、そのデータ伝送の選択状態は、図10
に示すようになる。且つその使用する2個の処理エレメ
ントを例として本発明でどのように以下数式1で示すマ
トリックス運算が行われるかを説明する:
(matrix computation)のアレイ構
造の実施例を示す。本発明がマトリックス運算を行う
時、制御器Cの制御により、その処理エレメントの内部
構造は第1モードの下(図4に示す)にあり、マルチプ
レクサMu11〜Mu1nの制御信号5を制御し、マル
チプレクサMu21〜Mu2nの制御信号6を制御し、
マルチプレクサMbの制御信号7及びマルチプレクサM
obの制御信号13を制御し、すべてをロジック1状態
に制御するため、そのデータ伝送の選択状態は、図10
に示すようになる。且つその使用する2個の処理エレメ
ントを例として本発明でどのように以下数式1で示すマ
トリックス運算が行われるかを説明する:
【数1】 上記のマトリックス運算は、第1に、本発明では処理エ
レメントPE1に定数データa00、a01、a02、
a03、a20、a21、a22、a23をロードし、
処理エレメントPE2に定数データa10、a11、a
12、a13、a30、a31、a32、a33をロー
ドする。図11に示すように、定数データはレジスタr
s11、rs12を経て処理エレメントにロードされ、
ロード操作は制御信号3、963、964により制御さ
れる。制御信号3は常にロジック1の状態にある。その
ため、レジスタrs11、rs12はデータをマルチポ
ート記憶体Mから処理エレメントへとシフト並びにロー
ドする。第1サイクロでは、データa10をレジスタr
s11にロードする。次のサイクルでは、データa00
をレジスタrs11に、そしてデータa10はレジスタ
rs12へと伝搬する。そして、データが全て来たと
き、レジスタrs11、rs12にそれぞれ保存された
データa00、データa10は処理エレメントPE1、
PE2に個別に転送される。このとき、定数レジスタフ
ァイル101のための書込み制御信号963はロジック
1の状態にある。このように継続し、処理エレメントP
E1は徐々にデータa00、a01、a02、a03、
a20、a21、a22、a23がロードされ、処理エ
レメントPE2にデータa10、a11、a12、a1
3、a30、a31、a32、a33がロードされる。
レメントPE1に定数データa00、a01、a02、
a03、a20、a21、a22、a23をロードし、
処理エレメントPE2に定数データa10、a11、a
12、a13、a30、a31、a32、a33をロー
ドする。図11に示すように、定数データはレジスタr
s11、rs12を経て処理エレメントにロードされ、
ロード操作は制御信号3、963、964により制御さ
れる。制御信号3は常にロジック1の状態にある。その
ため、レジスタrs11、rs12はデータをマルチポ
ート記憶体Mから処理エレメントへとシフト並びにロー
ドする。第1サイクロでは、データa10をレジスタr
s11にロードする。次のサイクルでは、データa00
をレジスタrs11に、そしてデータa10はレジスタ
rs12へと伝搬する。そして、データが全て来たと
き、レジスタrs11、rs12にそれぞれ保存された
データa00、データa10は処理エレメントPE1、
PE2に個別に転送される。このとき、定数レジスタフ
ァイル101のための書込み制御信号963はロジック
1の状態にある。このように継続し、処理エレメントP
E1は徐々にデータa00、a01、a02、a03、
a20、a21、a22、a23がロードされ、処理エ
レメントPE2にデータa10、a11、a12、a1
3、a30、a31、a32、a33がロードされる。
【0014】マトリックス運算に関しては、図12、1
3に処理エレメントPE1、PE2及び同報通信レジス
タrbの内部操作が運算を通じてサイクル毎に示され
る。上に示されるマトリックス運算における運算結果は
以下の数式2に示す:
3に処理エレメントPE1、PE2及び同報通信レジス
タrbの内部操作が運算を通じてサイクル毎に示され
る。上に示されるマトリックス運算における運算結果は
以下の数式2に示す:
【数2】 データ〔aij〕は前もって処理エレメントPE1、P
E2にロードされる。そのため、マトリックス運算処理
の間データx00は最初にマルチポート記憶体Mからレ
ジスタrbに転送される。一方、データa00、a10
は処理エレメントPE1、PE2における定数レジスタ
ファイル101から読取られる。それゆえ、乗算器10
4の操作を経て、処理エレメントPE1、PE2はレジ
スタ106にa00 x00及びa10 x00をそれ
ぞれロードする。それから、次のサイクルで、処理エレ
メントPE1、PE2の加算器109の出力は、a00
x00、a10 x00とそれぞれ等しくなる。そうし
て、次のサイクルで、処理エレメントPE1、PE2の
レジスタ106、110の内容は、a00 x10、a
00 x00及びa11 x10、a10 x00にそ
れぞれなる。このように続けると、処理エレメントPE
1、PE2の加算器109の出力は、y00、y10に
等しくなる。一方、制御信号12はy00、y10をレ
ジスタro1 ro2にそれぞれロードするためにロジ
ック0の状態にある。そして、続くサイクルにおいて
は、運算中に、y20、y30、y00、y10はマル
チポート記憶体M内にシフトされる。図12、13で
は、本発明で上記説明に類似の方法でマトリックス運算
を行う方法が示される。
E2にロードされる。そのため、マトリックス運算処理
の間データx00は最初にマルチポート記憶体Mからレ
ジスタrbに転送される。一方、データa00、a10
は処理エレメントPE1、PE2における定数レジスタ
ファイル101から読取られる。それゆえ、乗算器10
4の操作を経て、処理エレメントPE1、PE2はレジ
スタ106にa00 x00及びa10 x00をそれ
ぞれロードする。それから、次のサイクルで、処理エレ
メントPE1、PE2の加算器109の出力は、a00
x00、a10 x00とそれぞれ等しくなる。そうし
て、次のサイクルで、処理エレメントPE1、PE2の
レジスタ106、110の内容は、a00 x10、a
00 x00及びa11 x10、a10 x00にそ
れぞれなる。このように続けると、処理エレメントPE
1、PE2の加算器109の出力は、y00、y10に
等しくなる。一方、制御信号12はy00、y10をレ
ジスタro1 ro2にそれぞれロードするためにロジ
ック0の状態にある。そして、続くサイクルにおいて
は、運算中に、y20、y30、y00、y10はマル
チポート記憶体M内にシフトされる。図12、13で
は、本発明で上記説明に類似の方法でマトリックス運算
を行う方法が示される。
【0015】図14には、本発明の有限インパルス反応
フィルタリング運算(finite−impulse−
response filtering comput
ation)の実施例におけるアレイ処理構造が示され
る。制御器Cの制御の下で、処理エレメントが図5に示
される第2演算モードの下で駆動される。一方制御信号
5、7、13はロジック1の状態にあり、マルチプレク
サMu11〜Mu1n、Mb、MObを制御する。例と
して、図14に処理エレメントPE1、PE2を有する
構造を挙げる。また、運算のためのデータ処理、すなわ
ちyi=a0xi+a1xi−1+a2xi−2+a3
xi−3 が説明のために示される。yi=a0xi+
a1xi−1+a2xi−2+a3xi−3に従い、運
算結果は以下の数式3のようになる:
フィルタリング運算(finite−impulse−
response filtering comput
ation)の実施例におけるアレイ処理構造が示され
る。制御器Cの制御の下で、処理エレメントが図5に示
される第2演算モードの下で駆動される。一方制御信号
5、7、13はロジック1の状態にあり、マルチプレク
サMu11〜Mu1n、Mb、MObを制御する。例と
して、図14に処理エレメントPE1、PE2を有する
構造を挙げる。また、運算のためのデータ処理、すなわ
ちyi=a0xi+a1xi−1+a2xi−2+a3
xi−3 が説明のために示される。yi=a0xi+
a1xi−1+a2xi−2+a3xi−3に従い、運
算結果は以下の数式3のようになる:
【数3】
【0016】図15に示すように、yiの運算中、本発
明ではレジスタrs21、rs22、rs11、rs1
2及び制御信号6により制御されるマルチプレクサMu
21、Mu22を使用し、入力データ〔xm〕を処理エ
レメントPE1、PE2に転送する。一方定数データ
〔an〕はレジスタrbを経て同報通信され処理エレメ
ントPE1、PE2に至る。また、運算結果yiはマル
チポート記憶体Mにレジスタro1〜ro2と制御信号
12により制御されるマルチプレクサMo1、Mo2を
経て転送される。データの転送と処理に関しては、以下
に説明する:最初に、データx1はマルチポート記憶体
Mからレジスタrs21にロードされる。それから、次
のサイクルにおいて、レジスタrs21にはデータx0
がロードされ、レジスタrs22にはデータx1がロー
ドされる。このとき、マルチプレクサMu21、Mu2
2を制御する制御信号6は、ロジック0の状態にある。
それゆえそれぞれ処理エレメントPE1、PE2の入力
ポートであるis1、is2は、それぞれ値x0、x1
である。またレジスタrbにはデータa0がロードさ
れ、マルチプレクサ104の出力はPE1がa0x0
に、PE2がa0x1になる。1サイクル後で、制御信
号6はロジック1に変化し、そして入力データxnは処
理エレメントPE1、PE2に、レジスタrs11、r
s12を経て転送される。このように続けて、加算器1
09の出力はPE1でy0、PE2でy1となる。この
とき制御信号12はロジック0にセットされる。1サイ
クル後に、y0、y1はro1、ro2にそれぞれロー
ドされる。それから制御信号12がロジック1にセット
され、y0、y1はマルチポート記憶体M或いはその他
の機能ユニットにレジスタro1、ro2を経て転送さ
れる。このようにして有限インパルス反応フィルタリン
グ運算の結果が発生する。
明ではレジスタrs21、rs22、rs11、rs1
2及び制御信号6により制御されるマルチプレクサMu
21、Mu22を使用し、入力データ〔xm〕を処理エ
レメントPE1、PE2に転送する。一方定数データ
〔an〕はレジスタrbを経て同報通信され処理エレメ
ントPE1、PE2に至る。また、運算結果yiはマル
チポート記憶体Mにレジスタro1〜ro2と制御信号
12により制御されるマルチプレクサMo1、Mo2を
経て転送される。データの転送と処理に関しては、以下
に説明する:最初に、データx1はマルチポート記憶体
Mからレジスタrs21にロードされる。それから、次
のサイクルにおいて、レジスタrs21にはデータx0
がロードされ、レジスタrs22にはデータx1がロー
ドされる。このとき、マルチプレクサMu21、Mu2
2を制御する制御信号6は、ロジック0の状態にある。
それゆえそれぞれ処理エレメントPE1、PE2の入力
ポートであるis1、is2は、それぞれ値x0、x1
である。またレジスタrbにはデータa0がロードさ
れ、マルチプレクサ104の出力はPE1がa0x0
に、PE2がa0x1になる。1サイクル後で、制御信
号6はロジック1に変化し、そして入力データxnは処
理エレメントPE1、PE2に、レジスタrs11、r
s12を経て転送される。このように続けて、加算器1
09の出力はPE1でy0、PE2でy1となる。この
とき制御信号12はロジック0にセットされる。1サイ
クル後に、y0、y1はro1、ro2にそれぞれロー
ドされる。それから制御信号12がロジック1にセット
され、y0、y1はマルチポート記憶体M或いはその他
の機能ユニットにレジスタro1、ro2を経て転送さ
れる。このようにして有限インパルス反応フィルタリン
グ運算の結果が発生する。
【0017】図16に示すのは、無限インパルス反応フ
ィルタリング運算処理のための本発明の実施例である。
制御器Cの制御のもとで、処理エレメントは図5に示さ
れる第2演算モードで運転中である。さらにデータ信号
ObがマルチプレクサMbを経て処理エレメントに中間
結果を同報通信するために使用される。一方、制御信号
2、6、7、12がレジスタrs21、rs22をクリ
アし、マルチプレクサMu21、Mu22、マルチプレ
クサMbを制御し、マルチプレクサMo1〜Mo2を制
御するために使用される。図16には、処理エレメント
PE1、PE2と共に結論として出される構造が示され
る。フィードバック信号Obのための回路を除き、図1
6に示される構造は図14に示される有限インパルス反
応フィルタリング運算のための構造と同じである。以下
に置いて、運算のためのデータ処理yi+b1yi−1
+b2yi−2+b3yi−3−a0xi+a1xi−
1+a2xi−2+a3xi−3が説明のために挙げら
れる。それゆえ、運算結果は以下の数式4のようにな
る。
ィルタリング運算処理のための本発明の実施例である。
制御器Cの制御のもとで、処理エレメントは図5に示さ
れる第2演算モードで運転中である。さらにデータ信号
ObがマルチプレクサMbを経て処理エレメントに中間
結果を同報通信するために使用される。一方、制御信号
2、6、7、12がレジスタrs21、rs22をクリ
アし、マルチプレクサMu21、Mu22、マルチプレ
クサMbを制御し、マルチプレクサMo1〜Mo2を制
御するために使用される。図16には、処理エレメント
PE1、PE2と共に結論として出される構造が示され
る。フィードバック信号Obのための回路を除き、図1
6に示される構造は図14に示される有限インパルス反
応フィルタリング運算のための構造と同じである。以下
に置いて、運算のためのデータ処理yi+b1yi−1
+b2yi−2+b3yi−3−a0xi+a1xi−
1+a2xi−2+a3xi−3が説明のために挙げら
れる。それゆえ、運算結果は以下の数式4のようにな
る。
【数4】
【0018】図17には、本発明でy0、y2、y4を
計算するために処理エレメントPE1を使用し、y1、
y3、y5を計算するために処理エレメントPE2を使
用することが示される。データ伝送と処理に関して以下
説明する:最初に、データx1がマルチポート記憶体M
からレジスタrs21にロードされる。それから、次の
サイクルでレジスタrs21にデータx0がロードさ
れ、データx1はレジスタrs21からレジスタrs2
2へと転送される。このとき、マルチプレクサMu2
1、Mu22を制御する制御信号6はロジック0の状態
にある。それゆえ、is1、is2は値x0、x1にそ
れぞれなる。一方、レジスタrbは値a0であり、マル
チプレクサ104の出力はPE1でa0x0、PE2で
a0x1となる。次のサイクルでは、制御信号6はロジ
ック1に変化することになる。そして、データxnがP
E1、PE2にrs11、rs12を経て転送される。
運算の間、制御信号2はロジック1にセットされ、PE
1、PE2のデータ信号O1、O2は、a0x0+a1
x−1、a0x1+a1x0にそれぞれ等しくなり、レ
ジスタrs21、rs22をクリアする。そして、後続
のサイクルでは、データ −bnが処理エレメントPE
1、PE2にレジスタrs21、rs22、rs11、
rs12、とマルチプレクサMu21、Mu22の協力
により転送される。一方ymが同報通信により処理エレ
メントPE1、PE2に送られる。y0が計算された
後、それは処理エレメントPE1、PE2にy1の計算
のために同報通信される。それから、y0、y1はレジ
スタro1、ro2に制御信号12をロジック0にセッ
トすることにより転送され、後続サイクルのマルチポー
ト記憶体Mにシフトされる。このように続けることによ
り、無限インパルス反応フィルタリング運算の結果が発
生する。
計算するために処理エレメントPE1を使用し、y1、
y3、y5を計算するために処理エレメントPE2を使
用することが示される。データ伝送と処理に関して以下
説明する:最初に、データx1がマルチポート記憶体M
からレジスタrs21にロードされる。それから、次の
サイクルでレジスタrs21にデータx0がロードさ
れ、データx1はレジスタrs21からレジスタrs2
2へと転送される。このとき、マルチプレクサMu2
1、Mu22を制御する制御信号6はロジック0の状態
にある。それゆえ、is1、is2は値x0、x1にそ
れぞれなる。一方、レジスタrbは値a0であり、マル
チプレクサ104の出力はPE1でa0x0、PE2で
a0x1となる。次のサイクルでは、制御信号6はロジ
ック1に変化することになる。そして、データxnがP
E1、PE2にrs11、rs12を経て転送される。
運算の間、制御信号2はロジック1にセットされ、PE
1、PE2のデータ信号O1、O2は、a0x0+a1
x−1、a0x1+a1x0にそれぞれ等しくなり、レ
ジスタrs21、rs22をクリアする。そして、後続
のサイクルでは、データ −bnが処理エレメントPE
1、PE2にレジスタrs21、rs22、rs11、
rs12、とマルチプレクサMu21、Mu22の協力
により転送される。一方ymが同報通信により処理エレ
メントPE1、PE2に送られる。y0が計算された
後、それは処理エレメントPE1、PE2にy1の計算
のために同報通信される。それから、y0、y1はレジ
スタro1、ro2に制御信号12をロジック0にセッ
トすることにより転送され、後続サイクルのマルチポー
ト記憶体Mにシフトされる。このように続けることによ
り、無限インパルス反応フィルタリング運算の結果が発
生する。
【0019】図18に示されるアレイ処理構造は、端線
検出と平滑化の計算を処理するための本発明の実施例で
ある。制御器Cの制御の下で、図5に示されるように処
理エレメントは第2演算モードに入る。さらに、ファー
ストインファーストアウト記憶体100がデータバッフ
ァとして使用される。図18は4つの処理エレメントP
E1、PE2、PE3、PE4と共に結果的な構造を示
す。また、以下の数式5が説明のため使用される:
検出と平滑化の計算を処理するための本発明の実施例で
ある。制御器Cの制御の下で、図5に示されるように処
理エレメントは第2演算モードに入る。さらに、ファー
ストインファーストアウト記憶体100がデータバッフ
ァとして使用される。図18は4つの処理エレメントP
E1、PE2、PE3、PE4と共に結果的な構造を示
す。また、以下の数式5が説明のため使用される:
【数5】 データ処理の間、処理エレメントPE1はy30、y3
1を計算するために、PE2はy20、y21を計算す
るために、PE3はy10、y11を計算するために、
PE4はy00、y01を計算するために使用される。
図19、20及び図21に参照されるように、データ転
送及び処理は以下のように説明される:最初に、データ
x30、x20、x10、x00がレジスタrs21、
rs22、rs23、rs24にマルチポート記憶体M
からシフトによりロードされる。このとき、マルチプレ
クサMu21、Mu22、Mu23、Mu24を制御す
る制御信号6がロジック0にセットされる。それゆえ、
is1、is2、is3、is4がx30、x20、x
10、x00の値にそれぞれなる。一方レジスタrbは
w00となり、処理エレメントPE1、PE2、PE
3、PE4に対する乗算器104の出力は、それぞれx
30w00、x20w00、x10w00、x00w0
0となる。後続のサイクルの間、制御信号6はロジック
1にセットされる。そして、x40、x50がレジスタ
rs11を経てシフトされ、レジスタrs21、rs2
2、rs23、rs24は予めx01、x11、x2
1、x31をロードするのに供される。このように続け
て、y30、y20、y10、y00が処理エレメント
PE1、PE2、PE3、PE4により計算される。ま
たy30、y20、y10、y00の計算の間、データ
x31、x32は処理エレメントPE1のファーストイ
ンファーストアウト記憶体100に書込み制御信号91
2の制御を経て記憶される。同様に、データx21、x
22、x11、x12、x01、x02は処理エレメン
トPE2、PE3、PE4のファーストインファースト
アウト記憶体100にそれぞれ記憶される。このよう
に、y31、y21、y11、y01の計算の間、デー
タx31、x21、x11、x01がレジスタrs2
1、rs22、rs23、rs24の代わりにファース
トインファーストアウト記憶体100から読取られる。
それゆえ、ただデータx33、x23、x13、x03
がレジスタrs21、rs22、rs23、rs24を
経てロードされる。これにより、y32、y22、y1
2、y02なども計算されるときに多くのデータのロー
ド時間を節約することができる。yijを計算の間、定
数データwkl,0≦k,1<3がレジスタrbを経て
同報通信により処理エレメントに送られる。同様に制御
信号12の制御のもとでyijがレジスタro1、ro
2、ro3、ro4とマルチプレクサMO1、MO2、
MO3、MO4を経てマルチポート記憶体M或いは他の
機能ユニットへとシフトされる。
1を計算するために、PE2はy20、y21を計算す
るために、PE3はy10、y11を計算するために、
PE4はy00、y01を計算するために使用される。
図19、20及び図21に参照されるように、データ転
送及び処理は以下のように説明される:最初に、データ
x30、x20、x10、x00がレジスタrs21、
rs22、rs23、rs24にマルチポート記憶体M
からシフトによりロードされる。このとき、マルチプレ
クサMu21、Mu22、Mu23、Mu24を制御す
る制御信号6がロジック0にセットされる。それゆえ、
is1、is2、is3、is4がx30、x20、x
10、x00の値にそれぞれなる。一方レジスタrbは
w00となり、処理エレメントPE1、PE2、PE
3、PE4に対する乗算器104の出力は、それぞれx
30w00、x20w00、x10w00、x00w0
0となる。後続のサイクルの間、制御信号6はロジック
1にセットされる。そして、x40、x50がレジスタ
rs11を経てシフトされ、レジスタrs21、rs2
2、rs23、rs24は予めx01、x11、x2
1、x31をロードするのに供される。このように続け
て、y30、y20、y10、y00が処理エレメント
PE1、PE2、PE3、PE4により計算される。ま
たy30、y20、y10、y00の計算の間、データ
x31、x32は処理エレメントPE1のファーストイ
ンファーストアウト記憶体100に書込み制御信号91
2の制御を経て記憶される。同様に、データx21、x
22、x11、x12、x01、x02は処理エレメン
トPE2、PE3、PE4のファーストインファースト
アウト記憶体100にそれぞれ記憶される。このよう
に、y31、y21、y11、y01の計算の間、デー
タx31、x21、x11、x01がレジスタrs2
1、rs22、rs23、rs24の代わりにファース
トインファーストアウト記憶体100から読取られる。
それゆえ、ただデータx33、x23、x13、x03
がレジスタrs21、rs22、rs23、rs24を
経てロードされる。これにより、y32、y22、y1
2、y02なども計算されるときに多くのデータのロー
ド時間を節約することができる。yijを計算の間、定
数データwkl,0≦k,1<3がレジスタrbを経て
同報通信により処理エレメントに送られる。同様に制御
信号12の制御のもとでyijがレジスタro1、ro
2、ro3、ro4とマルチプレクサMO1、MO2、
MO3、MO4を経てマルチポート記憶体M或いは他の
機能ユニットへとシフトされる。
【0020】図22に示されるのは、本発明における2
次元離散的余弦転換(two−dimensional
discrete cosine transfor
m)の処理のアレイ処理構造の実施例を示す。制御器C
の制御の下で、処理エレメントは図4に示される第1演
算モードに入る。さらに、定数レジスタファイル10
1、データレジスタファイル113、デコーダ112、
3態バッファ111もこの計算に関与する。ここで、以
下の数式6で示される計算が説明のために使用される:
次元離散的余弦転換(two−dimensional
discrete cosine transfor
m)の処理のアレイ処理構造の実施例を示す。制御器C
の制御の下で、処理エレメントは図4に示される第1演
算モードに入る。さらに、定数レジスタファイル10
1、データレジスタファイル113、デコーダ112、
3態バッファ111もこの計算に関与する。ここで、以
下の数式6で示される計算が説明のために使用される:
【数6】 で、Tは転換を示す。これは3x3マトリックス〔xi
j〕の2次元離散的余弦転換である〔zij〕を計算す
るためのものである。まず以下の数式7で示す計算を行
う。
j〕の2次元離散的余弦転換である〔zij〕を計算す
るためのものである。まず以下の数式7で示す計算を行
う。
【数7】 さらに以下の数式8で示す計算を行う。
【数8】
【0021】図23、図24、及び図25に示すよう
に、データのロード、運算及び制御信号の動作は以下の
ように説明される:図23に示されるように、まずデー
タaijが処理エレメントPE1、PE2、PE3にお
いて定数レジスタファイル101にロードされる。それ
から図24に示されるように、データxijが以下のシ
ークエンスによりマルチポート記憶体Mからレジスタr
b内にロードされる:x00、x10、x20、x0
1、x11、x21、x02、x12、x22このよう
に、処理エレメントPE1はy00、y01、y02を
計算し、PE2はy10、y11、y12を計算し、そ
してPE3はy20、y21、y22を計算する。その
後、3態バッファ111を制御する制御信号を発生する
ためにデコーダ112を使用することで、yijはマル
チプレクサMbを経てy00、y01、y02、y1
0、y11、y12、y20、y21、y22のシーク
エンスで処理エレメントの入力端ibに送り返されて、
入力されて演算に供され、即ち二次元離散的余弦転換の
演算を完成することができる。図26に示されるのは、
本発明の2次元アレイ処理構造とした実施例を示し、こ
の構造により2次元離散的余弦転換を計算する過程は、
6個の処理エレメントPE11、PE12、PE21、
PE22、PE31、PE32で説明され、そのデータ
ロード、各制御線動作のフローチャート及び演算方式
(図28、図29、図30に示される)について、以下
に説明する:それは、まず、a(ij)のデータを処理
エレメントPE11、PE21、PE31、PE12、
PE22、PE32内の定数レジスタファイル101内
にロードし、図28に示されるように、その後マルチポ
ート記憶体MからX(ij)のデータをレジスタrbよ
り伝送し、処理エレメントPE11、PE21、PE3
1で演算してy(ij)のデータを図29に示すように
求め、Obより処理エレメントPE12、PE22、P
E32中に入力し、処理エレメントPE12にZ00、
Z10、Z20のデータを、処理エレメントPE22に
Z01、Z11、Z21のデータを、処理エレメントP
E32にZ02、Z12、Z22のデータを、図30に
示されるように求めさせ、これにより、2次元離散的余
弦転換の効果を達成する。
に、データのロード、運算及び制御信号の動作は以下の
ように説明される:図23に示されるように、まずデー
タaijが処理エレメントPE1、PE2、PE3にお
いて定数レジスタファイル101にロードされる。それ
から図24に示されるように、データxijが以下のシ
ークエンスによりマルチポート記憶体Mからレジスタr
b内にロードされる:x00、x10、x20、x0
1、x11、x21、x02、x12、x22このよう
に、処理エレメントPE1はy00、y01、y02を
計算し、PE2はy10、y11、y12を計算し、そ
してPE3はy20、y21、y22を計算する。その
後、3態バッファ111を制御する制御信号を発生する
ためにデコーダ112を使用することで、yijはマル
チプレクサMbを経てy00、y01、y02、y1
0、y11、y12、y20、y21、y22のシーク
エンスで処理エレメントの入力端ibに送り返されて、
入力されて演算に供され、即ち二次元離散的余弦転換の
演算を完成することができる。図26に示されるのは、
本発明の2次元アレイ処理構造とした実施例を示し、こ
の構造により2次元離散的余弦転換を計算する過程は、
6個の処理エレメントPE11、PE12、PE21、
PE22、PE31、PE32で説明され、そのデータ
ロード、各制御線動作のフローチャート及び演算方式
(図28、図29、図30に示される)について、以下
に説明する:それは、まず、a(ij)のデータを処理
エレメントPE11、PE21、PE31、PE12、
PE22、PE32内の定数レジスタファイル101内
にロードし、図28に示されるように、その後マルチポ
ート記憶体MからX(ij)のデータをレジスタrbよ
り伝送し、処理エレメントPE11、PE21、PE3
1で演算してy(ij)のデータを図29に示すように
求め、Obより処理エレメントPE12、PE22、P
E32中に入力し、処理エレメントPE12にZ00、
Z10、Z20のデータを、処理エレメントPE22に
Z01、Z11、Z21のデータを、処理エレメントP
E32にZ02、Z12、Z22のデータを、図30に
示されるように求めさせ、これにより、2次元離散的余
弦転換の効果を達成する。
【0022】図31は、本発明を2次元アレイ処理構造
(n×m個の処理エレメント)で影像移動評価(Mot
ion estimation)とテンプレートマッチ
ング(template matching)処理に用
いた実施例のアレイ構造図である。そのうち、P1、P
2、Pmはプログラマブル遅延器(programma
ble delay)とする。ここでは例として図32
に示されるように、3×3の処理アレイにより説明を行
う。そのうちP1、P2は3個のクロックサイクルの遅
延器とし、その処理エレメントPE11、PE12、P
E13、PE21、PE22、PE23、PE31、P
E32、PE33の内部の構造部分では図9に示される
ように第6方式の下で、以下の数式9で示される計算を
行う:
(n×m個の処理エレメント)で影像移動評価(Mot
ion estimation)とテンプレートマッチ
ング(template matching)処理に用
いた実施例のアレイ構造図である。そのうち、P1、P
2、Pmはプログラマブル遅延器(programma
ble delay)とする。ここでは例として図32
に示されるように、3×3の処理アレイにより説明を行
う。そのうちP1、P2は3個のクロックサイクルの遅
延器とし、その処理エレメントPE11、PE12、P
E13、PE21、PE22、PE23、PE31、P
E32、PE33の内部の構造部分では図9に示される
ように第6方式の下で、以下の数式9で示される計算を
行う:
【数9】 例を挙げて説明すると、図33、34及び図35に示さ
れるように処理エレメントPE11はZ20を計算し、
PE12はZ21を計算し、PE13はZ22を計算
し、PE21はZ10を計算し、PE22はZ11を計
算し、PE23はZ12を計算し、PE31はZ00を
計算し、PE32はZ01を計算し、PE33はZ02
を計算し、運算により影像移動評価処理及びテンプレー
トマッチングの効果が得られる。
れるように処理エレメントPE11はZ20を計算し、
PE12はZ21を計算し、PE13はZ22を計算
し、PE21はZ10を計算し、PE22はZ11を計
算し、PE23はZ12を計算し、PE31はZ00を
計算し、PE32はZ01を計算し、PE33はZ02
を計算し、運算により影像移動評価処理及びテンプレー
トマッチングの効果が得られる。
【0023】図36は本発明の分階パイプレイン式構造
を採用した実施例のアレイ構造図であり、パイプライン
式と心収縮式及び単指令多重データストリームのアレイ
処理構造2001、2002...200nのn個のア
レイ処理構造を示す。これをパイプライン方式で連接
し、分階パイプライン式(stage pipelin
ed)の構造とし、並びにマイクロプロセッサ或いはデ
ジタル信号処理器1001と互いに結合し、演算速度を
増加し、1008点のデスクリートフォリアトランスフ
ォーム(discrete Fourier tran
sform)の計算を例にとると(図37に示すよう
に)、マイクロプロセッサ或いはディジタル信号処理器
1001にあって7点のデスクリートフォリアトランス
フォームを計算するパイプライン式と心収縮式の単命令
多重データストリームのアレイプロセッサ3000、9
点のデスクリートフォリアトランスフォームを計算する
パイプライン式と心収縮式の単命令多重データストリー
ムのアレイプロセッサ3001、及び16点のデスクリ
ートフォリアトランスフォームを計算するパイプライン
式と心収縮式の単命令多重データストリームのアレイプ
ロセッサ3002を直列に接続し、この構造により演算
処理を行い、すなわち1008点のデスクリートフォリ
アトランスフォームを計算することができ、且つ演算速
度を倍増する効果を有する。
を採用した実施例のアレイ構造図であり、パイプライン
式と心収縮式及び単指令多重データストリームのアレイ
処理構造2001、2002...200nのn個のア
レイ処理構造を示す。これをパイプライン方式で連接
し、分階パイプライン式(stage pipelin
ed)の構造とし、並びにマイクロプロセッサ或いはデ
ジタル信号処理器1001と互いに結合し、演算速度を
増加し、1008点のデスクリートフォリアトランスフ
ォーム(discrete Fourier tran
sform)の計算を例にとると(図37に示すよう
に)、マイクロプロセッサ或いはディジタル信号処理器
1001にあって7点のデスクリートフォリアトランス
フォームを計算するパイプライン式と心収縮式の単命令
多重データストリームのアレイプロセッサ3000、9
点のデスクリートフォリアトランスフォームを計算する
パイプライン式と心収縮式の単命令多重データストリー
ムのアレイプロセッサ3001、及び16点のデスクリ
ートフォリアトランスフォームを計算するパイプライン
式と心収縮式の単命令多重データストリームのアレイプ
ロセッサ3002を直列に接続し、この構造により演算
処理を行い、すなわち1008点のデスクリートフォリ
アトランスフォームを計算することができ、且つ演算速
度を倍増する効果を有する。
【0024】図38に示すのは、本発明と心伸縮式構造
(systolic Architecture)を互
いに結合した実施例のアレイ構造図である。ここではア
レイ処理構造の前後に多数の処理エレメントで構成する
心収縮式構造を連接し、並びにマイクロプロセッサ或い
はディジタル信号処理器を連接する。ここでは2組のパ
イプライン式及び心収縮式単命令多重データストリーム
のアレイプロセッサ4000、4001の間に数組の処
理エレメントPE1〜PEnを加え、一つの心収縮式構
造(systolic Architecture)4
002を構成する。並びにマイクロプロセッサ或いはデ
ィジタル信号処理器を結合して組合せる。影像圧縮系統
を例として説明すると、図39に示されるように、二次
元離散余弦転換(DCT)のパイプライン式と心収縮式
及び単命令データストリームのアレイプロセッサ500
0を使用し、及び反向二次元離散余弦転換のパイプライ
ン式と心収縮式及び単命令データストリームのアレイプ
ロセッサ5001と心収縮式構造5002を互いに連結
し、並びに二次元離散余弦転換のパイプライン式と心収
縮式及び単命令データストリームのアレイプロセッサ5
000を使用し、及び反向二次元離散余弦転換のパイプ
ライン式と心収縮式及び単命令データストリームのアレ
イプロセッサ5001の所でマイクロプロセッサ或いは
ディジタル信号処理器1001を連接し、心収縮式構造
内部の数個の処理エレメントを連接し、量子化器(Qu
antizer)PE11、斜向走査器(Zig−Za
g scan processor)PE21、デコー
ダPE31、解量子化器具PE12、斜向走査器の反向
器(Inverse Zig−Zag scan pr
ocessor)PE22、デコーダPE32及びマル
チプレクサMu1を設け、各処理エレメントを心収縮式
の方法で連接し、並びに一つの制御信号19によりマル
チプレクサMu1のデータ伝送選項を制御し、これによ
り影像圧縮の効果を達成する。
(systolic Architecture)を互
いに結合した実施例のアレイ構造図である。ここではア
レイ処理構造の前後に多数の処理エレメントで構成する
心収縮式構造を連接し、並びにマイクロプロセッサ或い
はディジタル信号処理器を連接する。ここでは2組のパ
イプライン式及び心収縮式単命令多重データストリーム
のアレイプロセッサ4000、4001の間に数組の処
理エレメントPE1〜PEnを加え、一つの心収縮式構
造(systolic Architecture)4
002を構成する。並びにマイクロプロセッサ或いはデ
ィジタル信号処理器を結合して組合せる。影像圧縮系統
を例として説明すると、図39に示されるように、二次
元離散余弦転換(DCT)のパイプライン式と心収縮式
及び単命令データストリームのアレイプロセッサ500
0を使用し、及び反向二次元離散余弦転換のパイプライ
ン式と心収縮式及び単命令データストリームのアレイプ
ロセッサ5001と心収縮式構造5002を互いに連結
し、並びに二次元離散余弦転換のパイプライン式と心収
縮式及び単命令データストリームのアレイプロセッサ5
000を使用し、及び反向二次元離散余弦転換のパイプ
ライン式と心収縮式及び単命令データストリームのアレ
イプロセッサ5001の所でマイクロプロセッサ或いは
ディジタル信号処理器1001を連接し、心収縮式構造
内部の数個の処理エレメントを連接し、量子化器(Qu
antizer)PE11、斜向走査器(Zig−Za
g scan processor)PE21、デコー
ダPE31、解量子化器具PE12、斜向走査器の反向
器(Inverse Zig−Zag scan pr
ocessor)PE22、デコーダPE32及びマル
チプレクサMu1を設け、各処理エレメントを心収縮式
の方法で連接し、並びに一つの制御信号19によりマル
チプレクサMu1のデータ伝送選項を制御し、これによ
り影像圧縮の効果を達成する。
【0025】
【発明の効果】以上述べてきたように、本発明のパイプ
ライン式と心収縮式及び単命令多重データストリームの
アレイプロセッサ及びその方法は、データの演算、シフ
ト、入力/出力、を全て制御信号の制御により同時に進
行し、その演算時間を節約し、同時にデータロードに費
やす時間、連接線も節約し、並びに一つのシングルチッ
プに製造することができ、産業上の価値を有する。
ライン式と心収縮式及び単命令多重データストリームの
アレイプロセッサ及びその方法は、データの演算、シフ
ト、入力/出力、を全て制御信号の制御により同時に進
行し、その演算時間を節約し、同時にデータロードに費
やす時間、連接線も節約し、並びに一つのシングルチッ
プに製造することができ、産業上の価値を有する。
【図1】本発明のブロック回路図である。
【図2】本発明におけるパイプライン式処理エレメント
PEの内部構造図
PEの内部構造図
【図3】本発明の処理エレメントのモード制御読取り専
用記憶体の出力入力の真理値表である。
用記憶体の出力入力の真理値表である。
【図4】本発明の処理エレメント内部の第1モードのブ
ロック図である。
ロック図である。
【図5】本発明の処理エレメント内部の第2モードのブ
ロック図である。
ロック図である。
【図6】本発明の処理エレメント内部の第3モードのブ
ロック図である。
ロック図である。
【図7】本発明の処理エレメント内部の第4モードのブ
ロック図である。
ロック図である。
【図8】本発明の処理エレメント内部の第5モードのブ
ロック図である。
ロック図である。
【図9】本発明の処理エレメント内部の第6モードのブ
ロック図である。
ロック図である。
【図10】本発明の処理エレメントのマトリックス演算
のブロック回路図である。
のブロック回路図である。
【図11】本発明でマトリックス演算を行う時のクロッ
クサイクルを基準としたデータロード表示図である。
クサイクルを基準としたデータロード表示図である。
【図12】本発明でマトリックス演算を行う時のクロッ
クサイクルを基準としたデータ変換表示図である。
クサイクルを基準としたデータ変換表示図である。
【図13】本発明でマトリックス演算を行う時のクロッ
クサイクルを基準としたデータ変換表示図である。
クサイクルを基準としたデータ変換表示図である。
【図14】本発明で有限インパルス反応フィルター処理
を行うブロック回路図である。
を行うブロック回路図である。
【図15】本発明で有限インパルス反応フィルター処理
を行う時にクロックサイクルを基準としたデータ処理表
示図である。
を行う時にクロックサイクルを基準としたデータ処理表
示図である。
【図16】本発明で無限インパルス反応フィルター処理
を行うブロック回路図である。
を行うブロック回路図である。
【図17】本発明で無限インパルス反応フィルター処理
を行う時にクロックサイクルを基準としたデータ処理表
示図である。
を行う時にクロックサイクルを基準としたデータ処理表
示図である。
【図18】本発明で端縁検出及び平滑処理を行うブロッ
ク回路図である。
ク回路図である。
【図19】本発明で端縁検出及び平滑処理を行う時にク
ロックサイクルを基準としたデータ処理表示図である。
ロックサイクルを基準としたデータ処理表示図である。
【図20】本発明で端縁検出及び平滑処理を行う時にク
ロックサイクルを基準としたデータ処理表示図である。
ロックサイクルを基準としたデータ処理表示図である。
【図21】本発明で端縁検出及び平滑処理を行う時にク
ロックサイクルを基準とする各制御信号の動作説明図で
ある。
ロックサイクルを基準とする各制御信号の動作説明図で
ある。
【図22】本発明で二次元余弦変換処理を行うブロック
回路図である。
回路図である。
【図23】本発明で二次元余弦変換処理を行う定数ロー
ドの制御及びデータ信号表示図である。
ドの制御及びデータ信号表示図である。
【図24】本発明で二次元離散余弦変換処理を行う時に
クロックサイクルを基準とした制御及びデータ信号表示
図である。
クロックサイクルを基準とした制御及びデータ信号表示
図である。
【図25】本発明で二次元離散余弦変換処理を行う時に
クロックサイクルを基準とした制御及びデータ信号表示
図である。
クロックサイクルを基準とした制御及びデータ信号表示
図である。
【図26】本発明を二次元のアレイ構造とした実施例の
ブロック回路図である。
ブロック回路図である。
【図27】本発明を二次元のアレイ構造として処理エレ
メント内部構造と共に示した回路図である。
メント内部構造と共に示した回路図である。
【図28】本発明の二次元のアレイ構造により二次元離
散余弦変換処理を行う時の定数データロード表示図であ
る。
散余弦変換処理を行う時の定数データロード表示図であ
る。
【図29】本発明の二次元のアレイ構造により二次元離
散余弦変換処理を行う時のクロックサイクルを基準とし
た制御及びデータ信号表示図である。
散余弦変換処理を行う時のクロックサイクルを基準とし
た制御及びデータ信号表示図である。
【図30】本発明の二次元のアレイ構造により二次元離
散余弦変換処理を行う時のクロックサイクルを基準とし
た制御及びデータ信号表示図である。
散余弦変換処理を行う時のクロックサイクルを基準とし
た制御及びデータ信号表示図である。
【図31】本発明の二次元のアレイ構造により影像移動
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行うブロック回路図である。
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行うブロック回路図である。
【図32】本発明の影像移動評価(Motion es
timation)及びテンプレート突合せ(temp
late matching)処理を行う二次元アレイ
構造及び処理エレメント内部構造を示す回路図である。
timation)及びテンプレート突合せ(temp
late matching)処理を行う二次元アレイ
構造及び処理エレメント内部構造を示す回路図である。
【図33】本発明の二次元のアレイ構造により影像移動
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行う時、クロックサイクルを基準としたデー
タ信号表示図である。
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行う時、クロックサイクルを基準としたデー
タ信号表示図である。
【図34】本発明の二次元のアレイ構造により影像移動
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行う時、クロックサイクルを基準としたデー
タ信号表示図である。
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行う時、クロックサイクルを基準としたデー
タ信号表示図である。
【図35】本発明の二次元のアレイ構造により影像移動
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行う時、クロックサイクルを基準とした制御
信号表示図である。
評価(Motion estimation)及びテン
プレート突合せ(template matchin
g)処理を行う時、クロックサイクルを基準とした制御
信号表示図である。
【図36】本発明の分階パイプライン式構造を採用した
実施例のアレイ構造図である。
実施例のアレイ構造図である。
【図37】本発明を用いて1008点の離散フーリエ変
換を計算する実施例のアレイ構造図である。
換を計算する実施例のアレイ構造図である。
【図38】本発明を心収縮式(systolic)構造
と結合した実施例のアレイ構造図である。
と結合した実施例のアレイ構造図である。
【図39】本発明の影像圧縮系統における実施例のアレ
イ構造図である。
イ構造図である。
PE1〜PEn・・・処理エレメント rs11〜rs
1n、rs21〜rs2n、rb・・・レジスタ M
u11〜Mu1n、Mu21〜Mu2n、Mb・・・マ
ルチプレクサ ro1〜ron・・・レジスタ MO
1〜MOn、MOb・・・マルチプレクサ レジスタros1〜rosn M・・・マルチポート記
憶体 C・・・制御器 1〜16・・・制御信号 100・・・ファーストインファーストアウト記憶体 101・・・定数レジスタファイル 102、103、108、114・・・マルチプレクサ 106、107、110・・・レジスタ 104・・・
乗算器 105・・・絶対差値ユニット 109・・・加算器 113・・・データレジスタファイル 111・・・三
態バッファ 112・・・デコーダ112 91・・・ファーストインファーストアウト制御 92・・・モード制御 93・・・レジスタロード制御 94・・・加法器制御 95・・・識別コード(ID)
制御 96・・・定数レジスタファイル制御 97・・・データレジスタファイル制御 921・・・読取り専用記憶体 C0〜C7・・・出力
ポート
1n、rs21〜rs2n、rb・・・レジスタ M
u11〜Mu1n、Mu21〜Mu2n、Mb・・・マ
ルチプレクサ ro1〜ron・・・レジスタ MO
1〜MOn、MOb・・・マルチプレクサ レジスタros1〜rosn M・・・マルチポート記
憶体 C・・・制御器 1〜16・・・制御信号 100・・・ファーストインファーストアウト記憶体 101・・・定数レジスタファイル 102、103、108、114・・・マルチプレクサ 106、107、110・・・レジスタ 104・・・
乗算器 105・・・絶対差値ユニット 109・・・加算器 113・・・データレジスタファイル 111・・・三
態バッファ 112・・・デコーダ112 91・・・ファーストインファーストアウト制御 92・・・モード制御 93・・・レジスタロード制御 94・・・加法器制御 95・・・識別コード(ID)
制御 96・・・定数レジスタファイル制御 97・・・データレジスタファイル制御 921・・・読取り専用記憶体 C0〜C7・・・出力
ポート
Claims (21)
- 【請求項1】 一つの制御器を包括し、複数の処理エレ
メントがアレイ式主体構造を構成し、そのうち各処理エ
レメントは、一つの乗法器、一つの加法器及び一つのレ
ジスタで構成し、その中、乗法器の一つの入力端と加法
器の一つの出力端は連接し、乗法器の一つの入力端は処
理エレメントの入力端に連接し、処理エレメントの入力
データを受取り、加法器の出力端は該レジスタに連接
し、該レジスタの出力端は加法器のもう一つの入力端に
連接し、加法器の出力端は処理エレメントの出力端に連
接し、且つ該加法器と該レジスタはいずれも上述の制御
器の制御を受け、複数組のレジスタアレイが、それぞれ
処理エレメント主体構造の入力端と出力端に設けられ、
複数のマルチプレクサがそれぞれ上述の複数組のレジス
タアレイの端子に配置され、一つのマルチポート記憶体
を包括し、該マルチポート記憶体は処理エレメント主体
構造の入力端の複数組のレジスタアレイの前端と互いに
連接し、一組の同報通信式伝送線が、処理エレメント主
体構造の入力端に連接し、もって処理エレメント主体構
造のフィードバック出力及び上述のマルチポート記憶体
のデータを受取り、上述の各レジスタアレイ中のレジス
タ、マルチプレクサ、及びマルチポート記憶体は上述の
制御器により制御される、以上の特徴を有する、パイプ
ライン式及び心収縮式の単命令多重データストリームの
アレイプロセッサ。 - 【請求項2】 一つの制御器を包括し、複数の処理エレ
メントがそのアレイ式主体構造を構成し、そのうち各処
理エレメントは、一つの乗法器、一つの加法器及び一つ
のレジスタで構成し、並びに上述の制御器は該加法器及
び該レジスタに連接してその制御を行い、且つ該加法器
と該乗法器の一つの入力端は処理エレメントの入力端と
し、並びに加法器の出力端と乗法器のもう一つの入力端
の間に、該レジスタを加え、同時に該レジスタの出力端
で加法器のもう一つの入力端上に連接し、乗法器の出力
端は処理エレメントの出力端に連接し、処理エレメント
の一つの出力端となし、複数組のレジスタアレイが、そ
れぞれ処理エレメント主体構造の入力端と出力端に設け
られ、複数のマルチプレクサがそれぞれ上述の複数組の
レジスタアレイの端子に配置され、一つのマルチポート
記憶体を包括し、該マルチポート記憶体は処理エレメン
ト主体構造の入力端の複数組のレジスタアレイの前端と
互いに連接し、一つの同報通信式伝送線が、処理エレメ
ント主体構造の入力端に連接し、もって処理エレメント
主体構造のフィードバック出力及び上述のマルチポート
記憶体のデータを受取り、上述の各レジスタアレイ中の
レジスタ、マルチプレクサ、及びマルチポート記憶体は
上述の制御器により制御される、以上の特徴を有する、
パイプライン式及び心収縮式の単命令多重データストリ
ームのアレイプロセッサ。 - 【請求項3】 一つの制御器を包括し、複数の処理エレ
メントがそのアレイ式主体構造を構成し、そのうち各処
理エレメントは、絶対差演算エレメント、一つの乗法
器、一つの加法器、及び一つのレジスタで構成し、並び
に上述の制御器は該加法器及び該レジスタに連接してそ
の制御を行い、その絶対差演算エレメントの入力端は処
理エレメントの入力端とされ、絶対差演算エレメントの
出力端は乗法器の出力端に連接し、並びにこの乗法器の
出力端は加法器の一つの入力端に連接し、加法器の出力
端上に上述のレジスタか連接し、並びに該レジスタの出
力端は加法器のもう一つの入力端上に連接し、同時に加
法器の出力端は処理エレメントの一つの出力端とされ、
複数組のレジスタアレイが、それぞれ処理エレメント主
体構造の入力端と出力端に設けられ、複数のマルチプレ
クサがそれぞれ上述の複数組のレジスタアレイの端子に
配置され、一つのマルチポート記憶体を包括し、該マル
チポート記憶体は処理エレメント主体構造の入力端の複
数組のレジスタアレイの前端と互いに連接し、一つの同
報通信式伝送線が、処理エレメント主体構造の入力端に
連接し、もって処理エレメント主体構造のフィードバッ
ク出力及び上述のマルチポート記憶体のデータを受取
り、上述の各レジスタアレイ中のレジスタ、マルチプレ
クサ、及びマルチポート記憶体は上述の制御器により制
御される、以上の特徴を有する、パイプライン式及び心
収縮式の単命令多重データストリームのアレイプロセッ
サ。 - 【請求項4】 一つの制御器を包括し、複数の処理エレ
メントがそのアレイ式主体構造を構成し、そのうち各処
理エレメントは、絶対差演算エレメント、一つのレジス
タ及び一つの加法器で構成し、並びに上述の制御器は該
加法器及び該レジスタに連接してその制御を行い、その
絶対差演算エレメントの入力端は処理エレメントの入力
端とされ、絶対差演算エレメントの出力端は加法器の一
つの入力端と連接し、並びに加法器の出力端上にあって
上述のレジスタと連接し、且つ該レジスタの出力端によ
り加法器のもう一つの入力端に連接し、並びに加法器の
出力端をもって処理エレメントの出力端とされ、複数組
のレジスタアレイが、それぞれ処理エレメント主体構造
の入力端と出力端に設けられ、複数のマルチプレクサが
それぞれ上述の複数組のレジスタアレイの端子に配置さ
れ、一つのマルチポート記憶体を包括し、該マルチポー
ト記憶体は処理エレメント主体構造の入力端の複数組の
レジスタアレイの前端と互いに連接し一つの同報通信式
伝送線が、処理エレメント主体構造の入力端に連接し、
もって処理エレメント主体構造のフィードバック出力及
び上述のマルチポート記憶体のデータを受取り、上述の
各レジスタアレイ中のレジスタ、マルチプレクサ、及び
マルチポート記憶体は上述の制御器により制御される、
以上の特徴を有する、パイプライン式及び心収縮式の単
命令多重データストリームのアレイプロセッサ。 - 【請求項5】 処理エレメントの入力及び出力端にあっ
ては、同報通信式(broadcasting)及び心
収縮式(systolic)の混合方式で各レジスタを
直列につなぎ、並びにレジスタの間にマルチプレクサを
加えることでデータシフトの選択を行い、同時に処理エ
レメントが出力するデータもフィードバック入力し、こ
れによりッデータ伝送の応用を行い、同時にデータのシ
フト、演算及び入力/出力を同時に進行、処理する、パ
イプライン式及び心収縮式の単命令多重データストリー
ムのアレイプロセッサの方法。 - 【請求項6】 各処理エレメント中の乗法器の一出力端
と加法器の一入力端の間に、別に一つのレジスタを設け
る、請求項1に記載の、パイプライン式及び心収縮式の
単命令多重データストリームのアレイプロセッサ。 - 【請求項7】 各処理エレメントの入力端と乗法器のも
う一つの入力端の間に、一つの定数レジスタファイルを
設け、且つ乗法器の一出力端と加法器の一入力端の間
に、一つのレジスタを設ける、請求項1に記載のパイプ
ライン式及び心収縮式の単命令多重データストリームの
アレイプロセッサ。 - 【請求項8】 一つのファーストインファーストアウト
記憶体で各処理エレメントの入力データを受取り、並び
にもう一つの処理エレメントに出力し、且つ乗法器の一
つの出力端と加法器の一つの入力端の間に一つのレジス
タを設ける、請求項1に記載のパイプライン式及び心収
縮式の単命令多重データストリームのアレイプロセッ
サ。 - 【請求項9】 各処理エレメントはべつに、処理エレメ
ントの一つの入力端と乗法器の一つの入力端間に連接す
る定数レジスタファイルと、もう一つのレジスタで乗法
器の一つの出力端と加法器の一つの入力端の間に連接さ
れるものと、データレジスタファイルで加法器の出力端
上に連接されるものと、及び、三態バッファとデコーダ
で、データレジスタファイルの出力端に連接すること
で、処理エレメントのもう一つの出力端とされるもの
と、を包括し、上述の定数レジスタファイル、もう一つ
のレジスタ、データレジスタファイル、三態バッファは
いずれも前述の制御器の制御を受ける、請求項1に記載
のパイプライン式及び心収縮式の単命令多重データスト
リームのアレイプロセッサ。 - 【請求項10】 各処理エレメント中では、一つの定数
レジスタファイルを処理エレメントの入力端と乗法器の
一つの入力端の間に設け、且つ定数レジスタファイルは
上述の制御器と連接して制御される、請求項2に記載の
パイプライン式及び心収縮式の単命令多重データストリ
ームのアレイプロセッサ。 - 【請求項11】 各処理エレメント中では、一つの定数
レジスタファイルを処理エレメントの入力端と乗法器の
一つの入力端の間に設け、別に一つのデータレジスタフ
ァイルを乗法器の出力端に連接し、並びにこのデータレ
ジスタファイルを三態バッファとデコーダに連接し、処
理エレメントのもう一つの出力端となし、同時に定数レ
ジスタファイル、データレジスタファイル、三態バッフ
ァ及びデコーダはいずれも上述の制御器に連接されて制
御される、請求項2に記載のパイプライン式及び心収縮
式の単命令多重データストリームのアレイプロセッサ。 - 【請求項12】 各処理エレメント中では一つのファー
ストインファーストアウト記憶体で処理エレメントの入
力端を連接し、並びに処理エレメントのもう一つの出力
端となし、且つ該ファーストインファーストアウト記憶
体は並びに上述の制御器に連接され制御される、請求項
2に記載のパイプライン式及び心収縮式の単命令多重デ
ータストリームのアレイプロセッサ。 - 【請求項13】 各処理エレメント中では一つのレジス
タを絶対差演算エレメントの出力端と乗法器の入力端に
加え、並びにもう一つのレジスタを乗法器の出力端と加
法器の一つの入力端の間に設け、且つこれら二つのレジ
スタは上述の制御器に連接され制御される、請求項3に
記載のパイプライン式及び心収縮式の単命令多重データ
ストリームのアレイプロセッサ。 - 【請求項14】 各処理エレメント中では一つのファー
ストインファーストアウト記憶体で処理エレメントの入
力端を連接し、並びに処理エレメントのもう一つの出力
端となし、且つ該ファーストインファーストアウト記憶
体は並びに上述の制御器に連接され制御される、請求項
3に記載のパイプライン式及び心収縮式の単命令多重デ
ータストリームのアレイプロセッサ。 - 【請求項15】 各処理エレメント中では、一つのデー
タレジスタファイルを加法器の出力端に連接し、並びに
三態バッファとデコーダをデータレジスタファイルに連
接し、処理エレメントのもう一つの出力端とし、同時に
データレジスタファイル、三態バッファとデコーダはい
ずれも上述の制御器に連接されて制御される、請求項3
に記載のパイプライン式及び心収縮式の単命令多重デー
タストリームのアレイプロセッサ。 - 【請求項16】 各処理エレメント中では一つのレジス
タを絶対差演算エレメントの出力端と加法器の一つの入
力端の間に加え、且つ該レジスタは上述の制御器に連接
され制御される、請求項4に記載のパイプライン式及び
心収縮式の単命令多重データストリームのアレイプロセ
ッサ。 - 【請求項17】 各処理エレメント中では一つのファー
ストインファーストアウト記憶体で処理エレメントの入
力端を連接し、並びに処理エレメントのもう一つの出力
端となし、且つ該ファーストインファーストアウト記憶
体は並びに上述の制御器に連接され制御される、請求項
4に記載のパイプライン式及び心収縮式の単命令多重デ
ータストリームのアレイプロセッサ。 - 【請求項18】 各処理エレメント中では、一つのデー
タレジスタファイルを加法器の出力端上に連接し、並び
に三態バッファとデコーダをデータレジスタファイルの
出力端に連接し、処理エレメントのもう一つの出力端と
し、同時にデータレジスタファイル、三態バッファとデ
コーダはいずれも上述の制御器に連接されて制御され
る、請求項4に記載のパイプライン式及び心収縮式の単
命令多重データストリームのアレイプロセッサ。 - 【請求項19】 処理エレメントが構成するアレイ式主
体構造は、二次元のアレイ連接を採用する、請求項1、
2、3又は請求項4に記載のパイプライン式及び心収縮
式の単命令多重データストリームのアレイプロセッサ。 - 【請求項20】 分階パイプライン式のアレイ構造で、
マイクロプロセッサ、ディジタル信号処理器と互いに結
合する、請求項1、2、3又は請求項4に記載のパイプ
ライン式及び心収縮式の単命令多重データストリームの
アレイプロセッサ。 - 【請求項21】 アレイプロセッサの前後にあっては複
数の処理エレメントが構成する心収縮式構造と連接し、
並びに、マイクロプロセッサ、ディジタル信号処理器と
互いに結合する、請求項1、2、3又は請求項4に記載
のパイプライン式及び心収縮式の単命令多重データスト
リームのアレイプロセッサ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6330830A JP2657903B2 (ja) | 1994-11-29 | 1994-11-29 | パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6330830A JP2657903B2 (ja) | 1994-11-29 | 1994-11-29 | パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08161165A true JPH08161165A (ja) | 1996-06-21 |
JP2657903B2 JP2657903B2 (ja) | 1997-09-30 |
Family
ID=18237022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6330830A Expired - Lifetime JP2657903B2 (ja) | 1994-11-29 | 1994-11-29 | パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2657903B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7558943B2 (en) | 2004-07-26 | 2009-07-07 | Riken | Processing unit for broadcast parallel processing |
JP5708634B2 (ja) * | 2010-02-24 | 2015-04-30 | 日本電気株式会社 | Simdプロセッサ |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04227540A (ja) * | 1990-04-04 | 1992-08-17 | Hitachi Ltd | 演算処理装置及びディジタル信号処理プロセッサ |
JPH05189585A (ja) * | 1992-01-14 | 1993-07-30 | Nippon Telegr & Teleph Corp <Ntt> | 並列処理における条件付き演算制御回路 |
JPH05233853A (ja) * | 1992-02-24 | 1993-09-10 | Sharp Corp | 演算処理装置 |
JPH06292178A (ja) * | 1993-03-31 | 1994-10-18 | Sony Corp | 適応形ビデオ信号演算処理装置 |
-
1994
- 1994-11-29 JP JP6330830A patent/JP2657903B2/ja not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04227540A (ja) * | 1990-04-04 | 1992-08-17 | Hitachi Ltd | 演算処理装置及びディジタル信号処理プロセッサ |
JPH05189585A (ja) * | 1992-01-14 | 1993-07-30 | Nippon Telegr & Teleph Corp <Ntt> | 並列処理における条件付き演算制御回路 |
JPH05233853A (ja) * | 1992-02-24 | 1993-09-10 | Sharp Corp | 演算処理装置 |
JPH06292178A (ja) * | 1993-03-31 | 1994-10-18 | Sony Corp | 適応形ビデオ信号演算処理装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7558943B2 (en) | 2004-07-26 | 2009-07-07 | Riken | Processing unit for broadcast parallel processing |
JP5708634B2 (ja) * | 2010-02-24 | 2015-04-30 | 日本電気株式会社 | Simdプロセッサ |
Also Published As
Publication number | Publication date |
---|---|
JP2657903B2 (ja) | 1997-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5659780A (en) | Pipelined SIMD-systolic array processor and methods thereof | |
US6530010B1 (en) | Multiplexer reconfigurable image processing peripheral having for loop control | |
US6898691B2 (en) | Rearranging data between vector and matrix forms in a SIMD matrix processor | |
US4821224A (en) | Method and apparatus for processing multi-dimensional data to obtain a Fourier transform | |
JP2690932B2 (ja) | ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム | |
JP5466211B2 (ja) | 2次元マトリクス処理のためのレジスタ | |
US5659776A (en) | Method and apparatus for inputting data to a single instruction, multiple data processor used in a television receiving system | |
JP3228927B2 (ja) | プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法 | |
JPS635775B2 (ja) | ||
CN111144545B (zh) | 用于实现卷积运算的处理元件、装置和方法 | |
GB2286909A (en) | Pipelined SIMD-systolic array processor. | |
US6185595B1 (en) | Discrete cosine transformation operation circuit | |
JP2657903B2 (ja) | パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法 | |
Tsmots et al. | Design of the processors for fast cosine and sine Fourier transforms | |
EP0831404A2 (en) | Two-dimensional inverse discrete cosine transform circuit | |
US20030055856A1 (en) | Architecture component and method for performing discrete wavelet transforms | |
Van Luong et al. | A massively parallel approach to affine transformataion in medical image registration | |
US9691374B2 (en) | Processing a stream of ordered input data | |
EP1443645A2 (en) | Linearly scalable finite impulse response (FIR) filter | |
JP3977003B2 (ja) | 離散コサイン変換・逆離散コサイン変換手法及びその装置 | |
Weeks et al. | On block architectures for discrete wavelet transform | |
US4987557A (en) | System for calculation of sum of products by repetitive input of data | |
JP3620887B2 (ja) | データ処理装置 | |
JPH0298777A (ja) | 並列積和演算回路及びベクトル行列積演算方法 | |
SU922721A2 (ru) | Устройство ортогонального преобразовани по Уолшу |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19970422 |