JP2011086061A - 並列信号処理装置 - Google Patents

並列信号処理装置 Download PDF

Info

Publication number
JP2011086061A
JP2011086061A JP2009237469A JP2009237469A JP2011086061A JP 2011086061 A JP2011086061 A JP 2011086061A JP 2009237469 A JP2009237469 A JP 2009237469A JP 2009237469 A JP2009237469 A JP 2009237469A JP 2011086061 A JP2011086061 A JP 2011086061A
Authority
JP
Japan
Prior art keywords
parallel signal
simd
control unit
power supply
supply voltage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009237469A
Other languages
English (en)
Inventor
Shinichi Hattori
伸一 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2009237469A priority Critical patent/JP2011086061A/ja
Publication of JP2011086061A publication Critical patent/JP2011086061A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Power Sources (AREA)

Abstract

【課題】異なるSIMD演算器間でPEを連携制御して並列度を可変にすると共に、PE使用効率の低下を抑制した並列信号処理装置を実現する。
【解決手段】各ミクロシーケンサ制御部20−1〜20−nは各SIMD演算器30−1〜30−nの動作を制御する。SIMD演算器30−1〜30−nはそれぞれ複数のPEを有し、各PEは隣接PEバス301で接続され、PE間でデータ交換が可能である。この隣接PEバス301をSIMD演算器単位で結合/切断するSIMD結合スイッチを、全体シーケンス制御部10が制御して、PE並列度を可変にする。
【選択図】図1

Description

この発明は、複数のプロセッサエレメント(PE)に対して単一の命令でデジタル信号データを並列処理するSIMD(Single Instruction Multiple Data)制御方式の並列信号処理プロセッサを複数備える並列信号処理装置に関するものである。
デジタルスチルカメラ、デジタルビデオカメラ、デジタルテレビ、PC(パーソナルコンピュータ)グラフィックス等の分野では、高速且つ大量のデジタル画像信号の処理が必要とされており、大規模な専用ハードウェアにより構成されたLSI(Large Scale Integration)が開発されている。一方で、専用ハードウェアを使用した開発では、短期間で高度化及び複雑化していく信号処理アルゴリズムへの追従が困難である。そこで、プログラマビリティの高い高速プロセッサ又はDSP(Digital Signal Processor)による開発も行われている。しかしながら、画像データの高解像度化及び高画質化により、画像処理装置への要求性能は増大しており、単独のプロセッサ又はDSPでは演算処理量及び演算精度の不足、並びに高速クロック化による消費電力が問題となる。そこで、単一の命令で複数のデータを並列処理するSIMD型プロセッサを利用して演算処理能力を高める方法が提案されている。
SIMD型プロセッサは、算術演算及び論理演算を行う演算装置(Arithmetic Logic Unit:ALU)とこの演算装置の演算結果を一時記憶しておくメモリ等から構成されるPEを1次元に複数個配置し、これらのPEを単一の命令により制御する。このようなSIMD型プロセッサであれば、高速且つ大量のデジタル画像信号の処理が可能であり、また、高度化及び複雑化する信号処理アルゴリズムに容易に対応できるため、高速プロセッサ又はDSPに適している。
近年、SIMD型プロセッサは、画像データの高解像度化及び高画質化による画像処理装置への要求性能増大に対応して、演算処理量及び演算精度を高めるためにPE数の拡大が考えられている。また、多様な信号処理機能を並列処理するために、単なるPE数の拡大だけではなく、SIMD型プロセッサを複数に増設することによりPE数を拡大する方法が考えられている(例えば、非特許文献1参照)。
しかし、単純なPE数の拡大は信号処理内容によってはPE使用効率の低下を生じることがある。この傾向は、PE数の増加が大きくなるほど強まる。従って、対象とする信号処理内容に適切に対応して並列処理を行うことのできる仕組みが重要となる。
こうした課題を踏まえて、特許文献1に開示されたSIMD型マイクロプロセッサ及びデータ処理方法では、各PEが複数の演算回路を備え、状況に応じて、演算回路を独立又は連動して動作させることで、実質的なPE数及び演算ビット幅を変更している。
また、特許文献2に開示された信号処理プロセッサ及びこれを用いた撮像装置では、状況に応じて、演算対象データの分配を単独PE又は複数PEに切り替えることにより、並列度を可変にしている。
さらに、特許文献3に開示されたSIMD制御並列処理方法及び装置では、指定のPEの動作を停止させて並列度を下げて動作させる。また、並列度を下げた動作時、その動作しない余ったPEのローカルメモリを別のPEが使用することにより、メモリ容量を確保している。
特開2006−260479号公報 特開2007−172528号公報 特開2002−7359号公報
日経エレクトロニクス「これがCell」、2005年2月28日、pp.100〜109
上述したような従来の高速プロセッサ又はDSPに適用されているSIMD型プロセッサを備える並列信号処理装置では、各SIMD型プロセッサは固定的なPE数であった。また、SIMD制御用プログラムによりPEの並列度を可変にする場合、特許文献1のように固定的なPE数のビット精度を分割して見かけ上の並列度を上げるか、特許文献2,3のように固定的なPE数の内で必要な個数のみを動作させて並列度を可変にするかしていた。そのため、並列信号処理装置が複数のSIMD型プロセッサを備えていても、あるSIMD型プロセッサ内に動作していない余ったPEが存在しても、別のSIMD型プロセッサで活用できなかった。従って、並列度の可変範囲の上限は、SIMD型プロセッサを構成するPE数に固定され、また、並列度を下げた場合には活用できないPEが生じるため、PEの使用効率が低下するという課題があった。
この発明は、上記のような課題を解決するためになされたもので、演算対象データ内容に応じて、異なるSIMD型プロセッサ間のPEを連携制御して並列度を可変にすると共に、PE使用効率の低下を抑制した並列信号処理装置を実現することを目的とする。
この発明に係る並列信号処理装置は、演算対象データを入力して演算するプロセッサエレメントを複数有し、単一の命令により制御する並列信号処理プロセッサと、並列信号処理プロセッサへ命令を出力して動作を制御するミクロシーケンサ制御部と、複数の並列信号処理プロセッサのプロセッサエレメントにそれぞれ接続して、プロセッサエレメント間でデータ交換を行うための伝送路と、伝送路を並列信号処理プロセッサ単位で結合又は切断する接続切り替え部と、接続切り替え部を制御して、任意の並列信号処理プロセッサ間の接続を結合又は切断する全体シーケンス制御部とを備えるものである。
この発明によれば、任意の並列信号処理プロセッサ間の接続を結合又は切断するようにしたので、演算対象データ内容に応じて、異なる並列信号処理プロセッサ間のプロセッサエレメントを連携制御して並列度を可変にすると共に、プロセッサエレメントの使用効率の低下を抑制した並列信号処理装置を実現することができる。
この発明の実施の形態1に係る並列信号処理装置の構成を示すブロック図である。 図1に示す全体シーケンス制御部10の構成例を示すブロック図である。 図1に示すミクロシーケンサ制御部20−1の構成例を示すブロック図である。 図1に示すSIMD演算器30−1の構成例を示すブロック図である。 この発明の実施の形態2に係る並列信号処理装置の構成を示すブロック図である。 この発明の実施の形態3に係る並列信号処理装置の構成を示すブロック図である。 この発明の実施の形態4に係る並列信号処理装置の構成を示すブロック図である。
実施の形態1.
図1は、この発明の実施の形態1に係る並列信号処理装置の構成を示すブロック図である。図1では、n個のSIMD演算器(並列信号処理プロセッサ)とそのプログラム制御を行う各ミクロシーケンサ制御部、さらに、n組のSIMD演算器とミクロシーケンサ制御部の連携制御を行う全体シーケンス制御部を備えて、最大n個のマルチSIMDプロセッサを構築した並列信号処理装置の一例を示す。
図1において、全体シーケンス制御部10は、全体制御プログラムを格納する不図示のRAM(Random Access Memory)、ROM(Read Only Memory)、プログラムカウンタ等を備え、この全体制御プログラムを実行することにより出力されるSIMD結合制御信号及びミクロシーケンサ通信信号に従ってSIMD演算器(#1〜#n)30−1〜30−n及びミクロシーケンサ制御部(#1〜#n)20−1〜20−nの動作をそれぞれ制御する。
SIMD結合制御信号は、SIMD結合制御信号線101を通じて各SIMD演算器30−1〜30−nに入力され、左右隣接するSIMD演算器間の連結動作と独立動作の設定切り替えを制御する信号である。
ミクロシーケンサ通信信号は、ミクロシーケンサ通信信号線102を通じて各ミクロシーケンサ制御部20−1〜20−nへ入力され、全体シーケンス制御部10のプログラム実行状態等を通知する信号である。
ミクロシーケンサ制御部20−1〜20−nは、各々接続されるSIMD演算器30−1〜30−nを実行するSIMD制御プログラムとSIMD制御プログラムの条件分岐等を制御するシーケンス制御プログラムを格納する不図示のRAM、ROM、プログラムカウンタ等を備え、このシーケンス制御プログラムを実行することにより出力されるSIMD命令制御信号に従って各SIMD演算器30−1〜30−nの演算処理及びその動作等を制御する。また、ミクロシーケンサ制御部20−1〜20−nは、ミクロシーケンサ通信信号線102を通じて全体シーケンス制御部10へミクロシーケンサ通信信号を出力することにより、ミクロシーケンサ制御部20−1〜20−nのプログラム実行状態等を通知する。
SIMD演算器30−1〜30−nは、個別に接続された各ミクロシーケンサ制御部20−1〜20−nからSIMD命令制御信号線201−1〜201−nを通じて入力されるSIMD命令制御信号により所定の演算動作を行う。また、各SIMD演算器30−1〜30−n内部にある各PEは隣接PEバス(伝送路)301で接続されており、この隣接PEバス301を経由してPE間のデータ交換がなされる。さらに、各SIMD演算器30−1〜30−nには、データ入出力バス1001が接続されており、このデータ入出力バス1001を経由して入力データ及び演算出力データが転送される。
図2は、図1に示す全体シーケンス制御部10の構成例を示すブロック図である。図2において、全体シーケンサ命令メモリ11はRAM等で構成され、並列信号処理装置全体の動作を制御する全体制御プログラムを格納する。シーケンサ12は、不図示のプログラムカウンタ、ROM及び制御回路を備え、全体シーケンサ命令メモリ11から全体制御プログラムの命令を順次読み出し、解読して、その命令に従って算術演算器13、SIMD連結制御部14、ワークメモリ15及び通信バス16に動作を指示する。算術演算器13は、算術演算及び論理演算等の論理演算、並びにデータシフト等を行う演算手段である。SIMD連結制御部14は、SIMD結合制御信号を生成する手段である。ワークメモリ15は、レジスタ群又はRAM等で構成され、演算中間結果を記憶する手段である。通信バス16は、ミクロシーケンサ通信信号を生成してミクロシーケンサ通信信号線102へ出力する。
図3は、図1に示すミクロシーケンサ制御部20−1の構成例を示すブロック図である。なお、ミクロシーケンサ制御部20−1〜20−nは各々同一構成となっているので、ここでは図3のミクロシーケンサ制御部20−1を代表例に用いてミクロシーケンサ制御部20−1〜20−nを説明する。
図3において、ミクロシーケンサ命令メモリ21は、RAM等で構成され、ミクロシーケンサ制御部20−1の動作を制御するシーケンス制御プログラムを格納する。シーケンサ22は、不図示のプログラムカウンタ、ROM及び制御回路を備え、ミクロシーケンサ命令メモリ21からシーケンス制御プログラムの命令を順次読み出し、解読して、その命令に従ってSIMD命令制御部24、算術演算器25、通信メモリ26及びワークメモリ27に動作を指示する。SIMD命令メモリ23は、SIMD演算器30−1の動作を制御するSIMD制御プログラムを格納する。SIMD命令制御部24は、不図示のプログラムカウンタ、ROM及び制御回路を備え、シーケンサ22の指示によりSIMD命令メモリ23からSIMD命令を読み出してSIMD命令制御信号を生成し、SIMD命令制御信号線201−1へ出力する。算術演算器25は、算術演算及び論理演算等の論理演算、並びにデータシフト等を行う演算手段である。通信メモリ26は、ミクロシーケンサ通信信号線102に出力するデータを記憶する手段である。ワークメモリ27は、レジスタ群又はRAM等で構成され、演算中間結果等を記憶する手段である。
図4は、図1に示すSIMD演算器30−1の構成例を示すブロック図である。なお、SIMD演算器30−1〜30−nは各々同一構成となっているので、ここでは図4のSIMD演算器30−1を代表例に用いてSIMD演算器30−1〜30−nを説明する。
図4において、命令デコード部31は、ミクロシーケンサ制御部20−1からSIMD命令制御信号線201−1を通じて入力されるSIMD命令制御信号を受けて、SIMD演算器30−1内の全てのPEを制御する。各PE(#1〜#m)32−1〜32−mは、不図示の算術演算及び論理演算等の論理演算、並びにデータシフト等を行う演算手段と、その演算手段への入力データ及び演算結果を格納しておく記憶手段とを備える。図4の例ではPE32はm個の構成であり、m個のデータを同時に演算できるSIMD演算器を構成している。各PE32−1〜32−mは隣接PEバス301−1により接続されて、各PE32−1〜32−mの記憶手段が記憶している各データを相互に参照できる。なお、この隣接PEバス301−1はSIMD演算器30−1〜30−nを繋ぐ隣接PEバス301の一部であり、隣接PEバス301−1の両端と隣接PEバス301との接続部分には接続切り替え部を構成するSIMD結合スイッチ(以下、SW)33−1,33−2がそれぞれ介挿されている。SW33−1,33−2は、全体シーケンス制御部10からSIMD結合制御信号線101を通じて入力されるSIMD結合制御信号によって、隣接するSIMD演算器30−1,30−3内部の隣接PEバスと接続/切断を行う。バスインタフェース(以下、バスI/F)34は、命令デコード部31からの制御指示に従って、PE32−1〜32−mとデータ入出力バス1001とのデータリード/ライト制御を行う。
次に、並列信号処理装置の動作を説明する。
予め、全体シーケンス制御部10には所望の全体制御プログラムを格納しておく。また、各ミクロシーケンサ制御部20−1〜20−nにも所望のシーケンス制御プログラム及びSIMD制御プログラムを格納しておく。このとき、全体制御プログラム中には、各SIMD演算器30−1〜30−nを実行するときのSIMD連結制御(即ち並列度の設定)を指示する命令データがプログラム実行の時系列順に書き込まれている。
先ず、全体シーケンス制御部10において、シーケンサ12が、全体シーケンサ命令メモリ11に格納された全体制御プログラムのSIMD連結制御を指示する命令データに従って、SIMD連結制御部14から指定のSIMD演算器間を結合する指示内容のSIMD結合制御信号を、SIMD結合制御信号線101を通じてSIMD演算器30−1〜30−nへ出力する。
また、シーケンサ12は、このSIMD連結構成中にSIMD制御プログラムが実行されることを抑止するため、各ミクロシーケンサ制御部20−1〜20−nに対して、ミクロシーケンサ通信信号線102を通じて各SIMD制御プログラムの実行待ちを指示しておく。
SIMD結合制御信号線101を通じてSIMD結合制御信号を受けた各SIMD演算器30−1〜30−nは、指定のSIMD演算器のSW33−1,33−2を切り替えて、隣接PEバス301を接続する。隣接PEバス301で連結された各SIMD演算器は、各SIMD演算器内部のPE32−1〜32−m同士でデータを参照できることになり、1つのSIMD演算器として動作可能となる。例えば、3つのSIMD演算器30−1〜30−3を連結すると、各SIMD演算器に含まれるPE数m×3個の並列処理SIMDプロセッサを構成できる。また、SIMD結合制御信号は、SIMD演算器30−1〜30−nを個別に連結設定できるため、n個を分割して、複数個が連結したSIMD演算器グループを複数グループ構成できる。
全体シーケンス制御部10のシーケンサ12は、全体制御プログラム中のSIMD連結制御を指示する命令データを実行後、続いて記述されているミクロシーケンサ通信の命令データに従って、ミクロシーケンサ通信信号線102を介して各ミクロシーケンサ制御部20−1〜20−nに対して、各SIMD制御プログラムの実行開始を指示する。
各ミクロシーケンサ制御部20−1〜20−nにおいて、ミクロシーケンサ命令メモリ21に格納されているシーケンス制御プログラムと、SIMD命令メモリ23に格納されているSIMD制御プログラムには、全体シーケンス制御部10のSIMD連結制御を支持する命令と一致する所望のプログラムが記述されている。例えば、全体シーケンス制御部10がSIMD演算器30−1,30−2を連結指示している期間、SIMD演算器30−1,30−2はm×2個のPE並列度の1つのSIMD演算器として動作するため、対応するミクロシーケンサ制御部20−1,20−2の両シーケンス制御プログラムには同一の命令が記述されており、その命令データを同時に実行する。SIMD制御プログラムについても、ミクロシーケンサ制御部20−1,20−2とも同一の命令が記述されており、その命令データを同時に実行することになる。
各SIMD演算器30−1〜30−nは、各ミクロシーケンサ制御部20−1〜20−nが各SIMD命令制御信号線201−1〜201−nを通じて出力するSIMD命令制御信号を受けると、各命令デコード部31が命令デコードして、各PE32−1〜32−mが所望の演算処理及びデータ転送処理を実行する。
信号処理分野の中でも、特に、デジタルビデオカメラ等の画像信号処理分野では、カメラ入力信号のラスタスキャン系の画素レベルにおける高並列度向きの処理から、圧縮符号化のブロックスキャン系の画素レベルより機能レベルでの並列処理まで、対象とする信号処理の内容が多種多様となる。そのため、並列信号処理装置において並列度の最適化には高い自由度が理想とされるが、本実施の形態1の並列信号処理装置によれば、上述した一連の動作を繰り返すことにより、プログラムに従ってSIMD演算器30−1〜30−nは、PE並列度n個及び最大n個のマルチSIMDプロセッサからPE並列度n×m個のシングルSIMDプロセッサまで構成を最適化して、所望の演算を実行できる。
以上より、実施の形態1によれば、並列信号処理装置を、演算対象データを入力して演算する複数のPE32−1〜32−mを単一の命令により制御するSIMD演算器30−1と、SIMD演算器30−1へ命令を出力して動作を制御するミクロシーケンサ制御部20−1と、n個のSIMD演算器30−1〜30−nの各PE32−1〜32−mにそれぞれ接続して、PE間でデータ交換を行うための隣接PEバス301と、隣接PEバス301をSIMD演算器単位で結合又は接続するSW33−1,33−2と、SW33−1,33−2を制御して、任意のSIMD演算器間の接続を結合又は切断する全体シーケンス制御部10とを備えるように構成した。このため、全体シーケンス制御部10が実行する全体制御プログラムによりPE並列度を定義して、その定義に従ってSIMD演算器30−1〜30−nのPE並列度を設定することにより、異なるSIMD演算器間でPEを連携制御してPE並列度を可変にすることができる。よって、対象とする信号処理の内容に最適な並列度処理を実現することができる。同時に、各SIMD演算器30−1〜30−nが個別のプログラムを並列に実行できるため、PEの使用効率を高めることもできる。
なお、本実施の形態1の並列信号処理装置の構成は、PEの演算ビット幅や演算種に制約を与えるものではない。
実施の形態2.
図5は、この発明の実施の形態2に係る並列信号処理装置の構成を示すブロック図であり、図1と同一又は相当の部分については同一の符号を付し説明を省略する。
図5に示す並列信号処理装置は、図1の全体シーケンス制御部10に代えて全体シーケンス制御部10Aを備え、また、新たにクロック制御部40を備える。全体シーケンス制御部10Aとクロック制御部40とはクロック制御信号線103により接続される。また、クロック制御部40とn組のSIMD演算器及びミクロシーケンサ制御部とはn本のクロック周波数設定信号線401−1〜401−nによりそれぞれ接続される。
図5において、全体シーケンス制御部10Aは、ミクロシーケンサ制御部20−1〜20−nとSIMD演算器30−1〜30−nの組毎に動作クロック周波数を個別指定する命令が記述された全体制御プログラムを格納している。全体シーケンス制御部10Aにおいて、シーケンサ12(図2に示す)が全体制御プログラムに記述された動作クロック周波数を指定する命令を読み出し、その命令に従ってクロック制御信号を生成し、クロック制御信号線103を通じてクロック制御部40へ出力する。
クロック制御部40は、クロック制御信号線103を通じて全体シーケンス制御部10Aからクロック制御信号が入力されると、このクロック制御信号に従って、ミクロシーケンサ制御部20−1〜20−n及びSIMD演算器30−1〜30−nの動作クロックを組毎に設定するクロック周波数設定信号をクロック周波数設定信号線401−1〜401−nを通じてミクロシーケンサ制御部20−1〜20−n及びSIMD演算器30−1〜30−nに出力する。クロック制御部40は、例えばクロック周波数の設定を「0」にすることで、クロックを停止させることもできる。
以上より、実施の形態2によれば、並列信号処理装置は、SIMD演算器30−1と、このSIMD演算器30−1の動作を制御するミクロシーケンサ制御部20−1とを1組として、n組のSIMD演算器30−1〜30−nとミクロシーケンサ制御部20−1〜20−nの動作クロック周波数を制御するクロック制御部40を備え、全体シーケンス制御部10は、動作クロック周波数を組毎に設定するクロック制御信号をクロック制御部40に出力して、n組の動作クロック周波数を組毎に制御させるように構成した。このため、ミクロシーケンサ制御部20−1〜20−n及びSIMD演算器30−1〜30−nの動作クロック周波数を信号処理量に応じて個別に設定及び制御できる。この結果、並列信号処理装置の低消費電力化を図ることができる。
実施の形態3.
図6は、この発明の実施の形態3に係る並列信号処理装置の構成を示すブロック図であり、図1と同一又は相当の部分については同一の符号を付し説明を省略する。
図6に示す並列信号処理装置は、図1の全体シーケンス制御部10に代えて全体シーケンス制御部10Bを備え、また、新たに電源電圧制御部50を備える。全体シーケンス制御部10Bと電源電圧制御部50とは電源電圧制御信号線104により接続される。また、クロック制御部40とn組のSIMD演算器及びミクロシーケンサ制御部とはn本の電源電圧供給線501−1〜501−nによりそれぞれ接続される。
図6において、全体シーケンス制御部10Bは、ミクロシーケンサ制御部20−1〜20−nとSIMD演算器30−1〜30−nの組毎に電源電圧を指定する命令が記述された全体制御プログラムを、全体シーケンサ命令メモリに格納している。全体シーケンス制御部10Bにおいて、シーケンサが全体制御プログラムに記述された電源電圧を個別指定する命令を読み出し、その命令に従って電源電圧制御信号を生成し、電源電圧制御信号線104を通じて電源電圧制御部50へ出力する。
電源電圧制御部50は、電源電圧制御信号線104を通じて全体シーケンス制御部10Bから電源電圧制御信号が入力されると、この電源電圧制御信号に従って、ミクロシーケンサ制御部20−1〜20−n及びSIMD演算器30−1〜30−nの電源電圧を組毎に設定し、設定値に応じた電源電圧を電源電圧供給線501−1〜501−nから供給する。電源電圧制御部50は、例えば電源電圧の設定を「0」にすることで、電源を切断することもできる。
以上より、実施の形態3によれば、並列信号処理装置は、SIMD演算器30−1と、このSIMD演算器30−1の動作を制御するミクロシーケンサ制御部20−1とを1組として、n組のSIMD演算器30−1〜30−nとミクロシーケンサ制御部20−1〜20−nへの電源電圧を制御する電源電圧制御部50を備え、全体シーケンス制御部10は、電源電圧を組毎に設定する電源電圧制御信号を電源電圧制御部50に出力して、n組への電源電圧を組毎に制御させるように構成した。このため、ミクロシーケンサ制御部20−1〜20−n及びSIMD演算器30−1〜30−nの電源電圧を信号処理量に応じて個別に設定及び制御できる。この結果、並列信号処理装置の低消費電力化を図ることができる。
なお、上述した説明では、上記実施の形態1で示した構成に対して上記実施の形態3を適用した構成を示したが、これに限らず、上記実施の形態2に対して適用した構成であっても構わない。実施の形態2及び実施の形態3を組み合わせることにより、低消費電力化の効果をさらに高めることができる。
実施の形態4.
図7は、この発明の実施の形態4に係る並列信号処理装置の構成を示すブロック図であり、図1と同一又は相当の部分については同一の符号を付し説明を省略する。
図7に示す並列信号処理装置は、図1のミクロシーケンサ制御部20−1〜20−nに代えてミクロシーケンサ制御部(#1〜#n)20A−1〜20A−nを備え、また、新たにクロック制御部(#1〜#n)60−1〜60−nを備える。クロック制御部60−1〜60−nとミクロシーケンサ制御部20A−1〜20A−nはn本のクロック制御信号線202−1〜202−nによりそれぞれ接続される。
図7において、ミクロシーケンサ制御部20A−1は、ミクロシーケンサ命令メモリに格納されたシーケンス制御プログラムに記述されたSIMD制御処理からSIMD演算器30−1の動作停止期間を検出すると、クロック停止を指示するクロック制御信号を生成し、クロック制御信号線202−1を通じてクロック制御部60−1へ出力する。
ミクロシーケンサ制御部20A−2〜20A−nの動作も、ミクロシーケンサ制御部20A−1と同様である。
クロック制御部60−1は、クロック制御信号線202−1を通じてクロック制御部60−1からクロック制御信号が入力されると、このクロック制御信号に従って、SIMD演算器30−1の動作クロックを停止させるクロック周波数設定信号をクロック周波数設定信号線601−1を通じてSIMD演算器30−1に出力する。SIMD演算器30−1は、このクロック周波数設定信号に従って、動作停止期間の動作クロックを停止する。
クロック制御部60−2〜60−nの動作も、クロック制御部60−1と同様であり、これによりSIMD演算器30−1〜30−nの動作クロックを個別に出力及び停止できる。
以上より、実施の形態4によれば、並列信号処理装置は、各SIMD演算器30−1〜30−nの動作クロック周波数を制御する各クロック制御部60−1〜60−nを備え、各ミクロシーケンサ制御部20A−1〜20A−nは、SIMD演算器30−1〜30−nが有する複数のPE32−1〜32−mの動作停止期間に動作クロックを停止するクロック制御信号をクロック制御部60−1〜60−nに出力して、SIMD演算器30−1〜30−nの動作クロックを停止させるように構成した。このため、SIMD演算器30−1〜30−nの動作停止期間に動作クロックを停止できるようになり、この結果、並列信号処理装置の低消費電力化を図ることができる。
なお、上記実施の形態4では、各ミクロシーケンサ制御部20A−1〜20A−nが検出するSIMD演算器30−1〜30−nの動作停止期間に従って、クロック制御部60−1〜60−nが各SIMD演算器の動作クロックを出力/停止する構成であったが、動作停止期間に従ってn個の電源電圧制御部が各SIMD演算器の電源電圧を供給/切断する構成にしてもよい。この構成の場合には、SIMD演算器30−1〜30−nの動作停止期間にSIMD演算器30−1〜30−nへの電源電圧供給を停止できるようになり、この結果、並列信号処理装置の低消費電力化を図ることができる。
また、上述した説明では、上記実施の形態1で示した構成に対して上記実施の形態4を適用した構成を示したが、これに限らず、上記実施の形態2から上記実施の形態4までの構成を適宜組み合わせたものであっても構わない。このように組み合わせることにより、低消費電力化の効果を一層高めることができる。
10,10A,10B 全体シーケンス制御部、11 全体シーケンサ命令メモリ、12 シーケンサ、13 算術演算器、14 SIMD連結制御部、15 ワークメモリ、16 通信バス、20−1〜20−n、20A−1〜20A−n ミクロシーケンサ制御部、21 ミクロシーケンサ命令メモリ、22 シーケンサ、23 SIMD命令メモリ、24 SIMD命令制御部、25 算術演算器、26 通信メモリ、27 ワークメモリ、30−1〜30−n SIMD演算器(並列信号処理プロセッサ)、31 命令デコード部、32−1〜32−m PE(プロセッサエレメント)、33−1,33−2 SW(接続切り替え部)、34 バスI/F、40,60−1〜60−n クロック制御部、50 電源電圧制御部、101 SIMD結合制御信号線、102 ミクロシーケンサ通信信号線、103,202−1〜202−n クロック制御信号線、104 電源電圧制御信号線、201−1〜201−n SIMD命令制御信号線、301,301−2 隣接PEバス(伝送路)、401−1〜401−n,601−1〜601−n クロック周波数設定信号線、501−1〜501−n 電源電圧供給線、1001 データ入出力バス。

Claims (5)

  1. 演算対象データを入力して演算するプロセッサエレメントを複数有し、単一の命令により制御する並列信号処理プロセッサと、
    前記並列信号処理プロセッサへ命令を出力して動作を制御するミクロシーケンサ制御部と、
    複数の前記並列信号処理プロセッサのプロセッサエレメントにそれぞれ接続して、プロセッサエレメント間でデータ交換を行うための伝送路と、
    前記伝送路を並列信号処理プロセッサ単位で結合又は切断する接続切り替え部と、
    前記接続切り替え部を制御して、任意の並列信号処理プロセッサ間の接続を結合又は切断する全体シーケンス制御部とを備える並列信号処理装置。
  2. 並列信号処理プロセッサと、当該並列信号処理プロセッサの動作を制御するミクロシーケンサ制御部とを1組として、各組の動作クロック周波数を制御するクロック制御部を備え、
    全体シーケンス制御部は、動作クロック周波数を組毎に設定するクロック制御信号を前記クロック制御部に出力して、前記各組の動作クロック周波数を制御させることを特徴とする請求項1記載の並列信号処理装置。
  3. 並列信号処理プロセッサと、当該並列信号処理プロセッサの動作を制御するミクロシーケンサ制御部とを1組として、各組の電源電圧を制御する電源電圧制御部を備え、
    全体シーケンス制御部は、電源電圧を組毎に設定する電源電圧制御信号を前記電源電圧制御部に出力して、前記各組の電源電圧を制御させることを特徴とする請求項1記載の並列信号処理装置。
  4. 並列信号処理プロセッサの動作クロック周波数を制御するクロック制御部を備え、
    ミクロシーケンス制御部は、前記並列信号処理プロセッサが有する複数のプロセッサエレメントの動作停止期間に動作クロックを停止するクロック制御信号を前記クロック制御部に出力して、前記並列信号処理プロセッサの動作クロックを停止させることを特徴とする請求項1記載の並列信号処理装置。
  5. 並列信号処理プロセッサへの電源電圧供給を制御する電源電圧制御部を備え、
    ミクロシーケンス制御部は、前記並列信号処理プロセッサが有する複数のプロセッサエレメントの動作停止期間に電源電圧供給を停止する電源電圧制御信号を前記電源電圧制御部に出力して、前記並列信号処理プロセッサへの電源電圧供給を停止させることを特徴とする請求項1記載の並列信号処理装置。
JP2009237469A 2009-10-14 2009-10-14 並列信号処理装置 Pending JP2011086061A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009237469A JP2011086061A (ja) 2009-10-14 2009-10-14 並列信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009237469A JP2011086061A (ja) 2009-10-14 2009-10-14 並列信号処理装置

Publications (1)

Publication Number Publication Date
JP2011086061A true JP2011086061A (ja) 2011-04-28

Family

ID=44078967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009237469A Pending JP2011086061A (ja) 2009-10-14 2009-10-14 並列信号処理装置

Country Status (1)

Country Link
JP (1) JP2011086061A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290158A (ja) * 1993-03-31 1994-10-18 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JP2004171530A (ja) * 2002-10-16 2004-06-17 Matsushita Electric Ind Co Ltd 並列実行プロセッサ、命令割当方法
JP2004355153A (ja) * 2003-05-27 2004-12-16 Nec Corp シングルプロセッサ向けosによる並列処理システムにおける電源管理システム及び電源管理プログラム
JP2007323308A (ja) * 2006-05-31 2007-12-13 Fuji Xerox Co Ltd 演算装置、画像処理装置及びデータ処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290158A (ja) * 1993-03-31 1994-10-18 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JP2004171530A (ja) * 2002-10-16 2004-06-17 Matsushita Electric Ind Co Ltd 並列実行プロセッサ、命令割当方法
JP2004355153A (ja) * 2003-05-27 2004-12-16 Nec Corp シングルプロセッサ向けosによる並列処理システムにおける電源管理システム及び電源管理プログラム
JP2007323308A (ja) * 2006-05-31 2007-12-13 Fuji Xerox Co Ltd 演算装置、画像処理装置及びデータ処理装置

Similar Documents

Publication Publication Date Title
US11645224B2 (en) Neural processing accelerator
US20130067203A1 (en) Processing device and a swizzle pattern generator
JP2004534446A (ja) 複数のフィルタ処理モードを有する再構成可能型デジタルフィルタ
JP2006031127A (ja) 再構成可能な演算装置
TW202129518A (zh) 僅使用一單一側自多維陣列加載運算元及輸出結果
JP3987783B2 (ja) アレイ型プロセッサ
JPH04128982A (ja) プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法
CN110574007B (zh) 执行双输入值绝对值和求和操作的电路
JP2006252440A (ja) 再構成可能演算処理装置
JP2006018453A (ja) 半導体装置
US9361065B2 (en) Processor and processing method
US20060236075A1 (en) SIMD microprocessor and data processing method
JP4531398B2 (ja) メモリアドレス技術に関する改良
JP5007838B2 (ja) 情報処理装置および情報処理プログラム
US20140006748A1 (en) Apparatus and method of vector unit sharing
JP3987784B2 (ja) アレイ型プロセッサ
JP4483991B2 (ja) 高速pe間データ再配置機能を有するプロセッサアレイシステム
JP2011086061A (ja) 並列信号処理装置
JP2009123074A (ja) 画像処理装置
JP2006011924A (ja) 再構成可能演算装置および半導体装置
US20070220236A1 (en) Reconfigurable computing device
JP5428862B2 (ja) アレイプロセッサ向けアドレス生成装置と方法並びにアレイプロセッサ
JP3959407B2 (ja) 画像処理装置及び画像処理システム
JP2008113295A (ja) 映像信号処理装置
JP2007323308A (ja) 演算装置、画像処理装置及びデータ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140422