JP4298718B2 - 再構成可能な信号処理プロセッサ - Google Patents

再構成可能な信号処理プロセッサ Download PDF

Info

Publication number
JP4298718B2
JP4298718B2 JP2006114418A JP2006114418A JP4298718B2 JP 4298718 B2 JP4298718 B2 JP 4298718B2 JP 2006114418 A JP2006114418 A JP 2006114418A JP 2006114418 A JP2006114418 A JP 2006114418A JP 4298718 B2 JP4298718 B2 JP 4298718B2
Authority
JP
Japan
Prior art keywords
processor
signal
power supply
processor element
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006114418A
Other languages
English (en)
Other versions
JP2006244519A (ja
Inventor
雅浩 寶積
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006114418A priority Critical patent/JP4298718B2/ja
Publication of JP2006244519A publication Critical patent/JP2006244519A/ja
Application granted granted Critical
Publication of JP4298718B2 publication Critical patent/JP4298718B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Power Sources (AREA)
  • Logic Circuits (AREA)

Description

本発明は、再構成可能な信号処理プロセッサに関する。
近年システムLSIは、多種多様な信号処理が行われる回路を多数搭載することが求められるSystem On Chip(SoC)が一般的である。しかし、SoCにおいてシステムLSIに集積された全ての回路または機能が、同時に動作することは極めてまれで、通常全体のうち数%〜40%くらいの回路が動作しているに過ぎないことが多い。さらに、それぞれ実装された回路ブロックをある大きさの塊に要素分解すると、同じような信号処理や演算動作が繰り返し行なわれている場合がほとんどである。このような場合に面積や消費電力などを削減する手段としてダイナミック・リコンフィギュアブル・プロセッサ(以下、DRPと略す)が提案されている。
DRPは、複数の演算器をマトリックス配置してあり、1クロックサイクルで演算器同士の接続(回路構成)を再構成(コンフィグレーション)可能な機能を有することで、少ない回路資源で、様々な信号処理回路に変化させ、回路面積と電力削減を図るものである。
図13は、従来のリコンフィギュアブル・プロセッサの説明図であり、プロセッサ・エレメント1301、システム制御用CPU1305、コンフィギュレーション情報蓄積メモリ1306、
コンフィギュレーション制御回路1308、データメモリ1310、バス1311およびスイッチ部1312を示す。
また、図14は、従来例の電源再構成機能を持たない場合のバスおよびスイッチ部の説明図であり、バス1401、スイッチ部1402、コンフィギュレーション情報蓄積メモリ1403、コンフィギュレーション情報のデコーダ1404、コンフィギュレーション制御回路1405、入力レジスタ1406、プロセッサ・エレメント(演算器)1407を示す。
従来のDRPは、1マシンサイクルで回路を再構成するために、信号処理部の切り替え回路が複雑で回路規模の増大を招いていた。更に、色々な信号処理を実現するために、マトリックス配置する演算資源(演算器)を非常に多くする場合があるが、特殊な信号処理を除いては大部分の演算資源が使用されないアプリケーシヨンも多く存在する。また信号処理に必要な信号処理量(MIPS(Million Instructions Per Second)量)も一意には決定できず想定した信号処理の最大値で設計する必要があり、回路規模増加によるオーバヘッドが課題になる。
本発明は、回路規模および消費電力を削減することが可能な信号処理プロセッサを提供することを目的としている。
また、本発明は、再構成後のプロセッサ・エレメントおよびその接続部を容易にテストすることができる信号処理プロセッサを提供することを目的としている。
本発明の信号処理プロセッサは、コンフィグレーションを行う手段と演算器のI/F部にレベルシフタを配置し、コンフィグレーション制御回路を高電源電圧で動作させ、演算器を低電源電圧で動作させることにより、切り替え回路の回路規模を削減する。
また、演算部の電源電圧をMIPS量にあわせダイナミックに変化させることにより、設計時に最大処理速度スペックを満たすトランジスタサイズで実現して回路規模を増大させる要素を排除する。
更に、アプリケーションによって使用しない演算器に関して、電源電圧を待機電圧、あるいは電源OFF状態にすることでOFFリーク削減を可能とする。また、演算器の電源制御は、コンフィギュレーション情報蓄積メモリからの命令によって電源制御に伴うコンフィギユレーションを行う。
また、演算器の前後にレジスタを配置し、前後のレジスタを交互に動作するようなクロックを供給するモードを設けることにより、時分割に演算資源をマッピングすることを可能にする。
更に、演算器の内部に小さな制御回路を配置し、ビット幅拡張、あるいはマルチオペレ一シヨン(例えば2回加算など)、またはル一プ実行が可能な機能を持たせ、コンフィグレーションを小規模/局所的にも実行させることにより、システム全体のコンフィグレーシヨン制御回路による制御規模の軽減を図る。
また、テストモード信号で入力レジスタを線形フィードバック・レジスタに変更する機能を設け自己テストを可能とする。
また、本発明の信号処理プロセッサは、演算器(プロセッサ・エレメント)の入出力I/Fにレベルシフタを配置する回路構成とし、リコンフィギュレーション制御回路、マルチプレクサ部(バス含む)、プロセッサ・エレメントの電源電圧を異なるようにする。そして、回路再構成切り替え回路(マルチプレクサ部やバス部)の電源電圧を高く設定して高速化し、プロセッサ・エレメントの電源電圧を低く設定して信号処理の低電力化を図る。
また、回路の再構成を行った信号処理の信号処理量(MIPS量)に応じてプロセッサ・エレメントの電源電圧を変更可能な回路構成とし、リコンフィギュレーション情報(ソフトウ
ェア)によって、プロセッサ・エレメントの電圧制御を、内部判断回路およびチップ外部のコンパイラで実現する。あるいは、回路再構成後にマッピングされなかったプロセッサ・エレメントの電源電圧を遮断する。
また、プロセッサ・エレメントの入出力部にそれぞれ入力レジスタと出力レジスタを配置し、(1)回路再構成後、連続的に信号処理を実施するモードと、(2)出力レジスタから入力レジスタへ転送するステージと演算処理等の信号処理を実施するステージを交互に動作させるモードを有することにより、プロセッサ・エレメントの利用効率を高める。
また、プロセッサ・エレメントの回路構成をコンフィギュレーション情報から判断することにより、自動的に時分割でプロセッサ・エレメントをマッピングする機能を内部判断回路およびチップ外部のコンパイラで実現する。さらに、マッピングされていない、または待機状態のプロセッサ・エレメントの電源電圧を待機電圧(レジスタの内容が保持可能な最低電圧など)に電源制御できる機能を有する。
また、コンフィギュレーション情報から信号処理内容のスケジューリングを行う機能を有し、同様の信号処理が繰り返されている個所、複合演算を実施する個所、あるいはビット幅の拡張適用個所(あるいは倍精度演算個所)を抽出し、プロセッサ・エレメント内にループ機能、複合演算(積和演算、シフト加算、ACS演算、除算等)、あるいは近接エレメント間でのビット拡張が可能な回路構成を有する。
更に、テストモードへ設定することで、入力レジスタあるいは出力レジスタが線形フィードバック・シフトレジスタに回路再構成が可能な機能と、マルチ入力シグネチャ・レジスタに回路再構成が可能な機能を有し、DRPを自己テスト可能な回路構成とする。
本発明によれば、コンフィグレーション回路の高速化を回路規模の増大なく実現可能となる。また、プロセッサ・エレメントの低電力化を可能とし、プロセッサ・エレメントの動作速度をオーバースペックに設計する必要がなく、回路規模の削減が可能となる。
また、従来はプロセッサ・エレメントの速度スペックとマトリックスに配置したプロセッサ・エレメント数で最大の信号処理量が決まるが、本発明では柔軟に処理量を増加させることができる。また、従来はプロセッサ・エレメントの速度スペックが固定であり、マトリックスに配置したプロセッサ・エレメント数が一定であるため、実施する信号処理によっては、活用されないエレメントが発生するケースもあり利用効率が低下していたが、本発明ではエレメントが余るケースでは、並列処理に分解し、且つ電圧を降圧することで低消費電力化およびリーク電流削減を図ることが可能となる。
また、従来はプロセッサ・エレメントの速度スペックが固定であり、マトリックスに配置したプロセッサ・エレメント数が一定であるため、実施する信号処理によっては信号処理能力が不足しマッピング不可能なケースが発生する場合でも、本発明では時分割にマッピングする機能を使って、物理的に不足した信号処理量を時間軸的に解決することが可能となる。
さらに、本発明の信号処理プロセッサでは、リコンフィグレーション情報によってマッピングされるプロセッサ・エレメントを空間的に割り付けるだけでなく、時分割に割り付けることで、システムLSIに実装するエレメント数を少なくすることが出来る。この機能と電源遮断機能を組み合わせることで、低電力化とリーク電流削減を図ることができる。
また、マルチプレクサ部やバス部の回路規模を削減し、プロセッサ・エレメントの利用効率を増加させて低電力化および信号処理量の増加を図り、回路規模の増加を招くことなくテストコストの削減を可能とする。
図1および図2は、本発明の実施形態の信号処理プロセッサにおけるプロセッサ・エレメントの概略構成図である。図1において、レベルシフタ101a,101b、プロセッサ・エレメント102、入力レジスタ103a、出力レジスタ103b、バレルシフタなどの演算器104a、ALUなどの演算器104b、バス105を示す。この場合、電源ラインは、例えば高電源電圧Vdd1=1.5V、低電源電圧Vdd2=0.8〜1.3Vである。
また、図2は、レベルシフタ内蔵レジスタ201a,201b、プロセッサ・エレメント202、バレルシフタなどの演算器204a、ALUなどの演算器204b、バス205を示す。この場合も、電源ラインは、例えば高電源電圧Vdd1=1.5V、低電源電圧Vdd2=0.8〜1.3Vである。
図3は、本発明の実施形態の信号処理プロセッサにおける電源制御の説明図である。同図において、低電圧を供給する電源配線301、高電圧を供給する電源配線302、低電圧を供給する電源配線303、電源IC制御信号304、電源供給部のコンフィギュレーション制御回路305、電源配線コンフィグレーション制御信号306、電源電圧可変ブロック307、電源電圧を低電圧から更に降圧制御された電源ライン308 (Vdd1)、電源電圧を低電圧から更に降圧制御された電源ライン309 (Vdd2)を示す。この場合Vdd2≠Vdd1である。また、レベルシフタ(信号降圧部) 310, 320、プロセッサ・エレメント311, 321、レベルシフタ(信号昇圧部) 312, 322を示す。なお、プロセッサ・エレメント等は信号処理プロセッサ内に多数存在するが、ここでは説明のため2つだけを示す。
図3に示すように、本実施形態の信号処理プロセッサは、基本的な算術演算や論理演算を行う演算器から構成されるプロセッサ・エレメント311,321と、プロセッサ・エレメント311,321間を接続するバス(図示省略)と、プロセッサ・エレメント311,321間の接続を変更するスイッチ部313を有し、ソフトウェアによってプロセッサ・エレメント311,321間の接続関係を自由に変更できる構造を持つ。そして、プロセッサ・エレメント311,321の接続関係を切り替えるスイッチ部313の電源電圧302と、プロセッサ・エレメント311,321の電源電圧303と、プロセッサ・エレメント311,321の接続関係を変更する制御回路314,315の電源電圧301が異なるように設定する。また、プロセッサ・エレメント311,321の入出力I/Fにレベルシフタ310,312,320,322を配置する。
この場合、例えば電源配線301は1.2V、電源配線302は1.5V、電源配線303は0.8〜1.3Vとすることができる。これにより、外部電源IC 316から電源303として1.2Vを供給した場合は、電源電圧可変ブロック307の内蔵オペアンプにおいて、電源ライン308(Vdd1)として1.2Vを供給し、電源ライン309(Vdd2)として1.2Vから降圧した0.9Vを供給することができる。
あるいは、外部電源IC 316から電源303として1.2Vを供給した場合でも、電源電圧可変ブロック307の内蔵オペアンプで、電源ライン308(Vdd1)として1.2Vを供給し、電源ライン309(Vdd2)を遮断して0Vとすることができる。
このように本実施形態の信号処理プロセッサ(DRP)では、プロセッサ・エレメントの電源電圧(図1のVdd2)を下げる場合と、プロセッサ・エレメント毎に電圧を下げる箇所、下げない箇所あるいはゼロ電圧にする箇所等を決める場合の2種類に対応できる。
ある信号処理のアルゴリズムをマッピングして回路を再構成する場合、図3に示した信号処理プロセッサ内の一部のプロセッサ・エレメント311には処理量が少ない演算が割り当てられ、他のプロセッサ・エレメント321には処理量が多く高速動作が必要な演算が割り当てられる。その場合、それぞれのプロセッサ・エレメントに異なる電源電圧を供給し、一律に高電圧(例えば1.2Vや1.3V)を供給しないことにより電力削減を図ることができる。
また、上記の例では電源302を1.5Vとしたが、この電源302も高速に再構成が不要な場合(例えばセルマッピングの切り替え速度が低速の場合)は、1.3Vや1.2Vに下げることで電力削減を行うことができる。多くの場合高速で再構成することが望まれるが、その動作速度に合わせ電圧を決めていては、プロセッサ・エレメント内の演算器の電力が大きくなるため、図1のように電圧Vdd1と電圧Vdd2に分けることもできる。
なお、図3のレベルシフタ310, 320は、図1のレベルシフタ101aまたは図2のレベルシフタ内蔵レジスタ201aに対応し、図3のプロセッサ・エレメント311, 321は、図1の入出力レジスタ103a,bおよび演算器104a,bまたは図2の演算器204a,bに対応する。また、図3のレベルシフタ312, 322は、図1のレベルシフタ101bまたは図2のレベルシフタ内蔵レジスタ201bに対応する。
図4は、本発明の実施形態の信号処理プロセッサにおけるコンフィギュレーション制御回路の概略構成図である。図において、プロセッサ・エレメント401、コンフィギュレーション情報の保持イネーブル信号402a,402b,402c、コンフィギュレーション情報のデコード結果(マルチプレクサ制御信号) 403、コンフィギュレーション制御信号デコード結果保持部の出力イネーブル404、コンフィギュレーション制御信号デコード結果保持部の信号の出力部405、コンフィギュレーション制御信号デコード結果の書き込み制御信号406、コンフィギュレーション制御信号デコード結果の保持部407、コンフィギュレーション・ソフトウェア蓄積メモリ408、コンフィギュレーション制御信号デコード部409、電源供給部のコンフィギュレーション制御回路410、レベルシフタ(信号昇圧部Vdd1:高電圧側) 411を示す。
本実施形態の信号処理プロセッサでは、特にプロセッサ・エレメント401の動作クロック周波数を極力小さくして低消費電力を可能すると共に、プロセッサ・エレメント401間の接続関係を変更し、実行する信号処理内容を自由に変えられる回路再構成制御部分に関してトランジスタ回路のサイズを大きくすることなく、電源電圧をプロセッサ・エレメント401より高く設定することにより高速に回路再構成を行うことを可能とする。
図5は、本発明の再構成可能な信号処理プロセッサにおける第1の実施例(電源遮断制御時)の説明図である。同図において、回路再構成によってマッピングされたプロセッサ・エレメント501、回路再構成の結果マッピングされなかったプロセッサ・エレメント502a,502b、電源電圧供給エリア503、電源電圧遮断エリア504、システム制御用CPU505、コンフィギュレーション情報蓄積メモリ506、コンフィギュレーション制御信号デコード部507、コンフィギュレーション制御回路508、電源供給部のコンフィギュレーション制御回路509、データメモリ510、グローバル・バス(高電圧側)511およびグローバル・バス用のスイッチ(高電圧側)512を示す。
電源供給部のコンフィギュレーション制御回路509は、図3の305および図4の410に相当する。また、コンフィギュレーション制御回路508は、図3の315に相当し、図4のコンフィギュレーション制御回路412からコンフィギュレーション・ソフトウェア蓄積メモリ408、コンフィギュレーション制御信号デコード部409、電源供給部のコンフィギュレーション制御回路410を除いたものに相当する。
図5に示した部品は全てDRPの中に含まれる。また、図5は、図3から電源IC316を除いたものに相当する。また、図5、図4では電源配線および電源供給部の再構成機構が省略されており、この部分を追記したのが、図3の電源ライン308,309、電源配線301,302,303、信号配線304および電源電圧可変ブロック307である。
本実施形態の信号処理プロセッサは、実行する信号処理内容に応じて複数のプロセッサ・エレメント501間の接続関係を変更可能なスイッチ512と、回路再構成を制御する情報を蓄積するコンフィギュレーション情報蓄積メモリ506を有し、且つ回路を再構成する情報によってプロセッサ・エレメント501の電源電圧を選択するコンフィギュレーション制御回路509を有するので、実行させる信号処理内容に応じた各プロセッサ・エレメント501間の回路再構成と、プロセッサ・エレメント501へ供給する電圧を変更する機能を有する。
図6は、本発明の再構成可能な信号処理プロセッサにおける第2の実施例(電源遮断制御時)の説明図である。同図において、回路再構成によってマッピングされたプロセッサ・エレメント601、回路再構成の結果マッピングされなかったプロセッサ・エレメント602a,602b、電源電圧供給エリア603、電源電圧遮断エリア604、システム制御用CPU605、コンフィギュレーション情報蓄積メモリ606、コンフィギュレーション制御信号デコード部607、コンフィギュレーション制御回路608、電源供給部のコンフィギュレーション制御回路609、データメモリ610、グローバル・バス611、ローカル・バスのスイッチ(セレクタ) 612、およびローカル・バス613を示す。
本実施形態の信号処理プロセッサでは、実行する信号処理では使用しないプロセッサ・エレメント602a,602b、即ち回路再構成を制御する情報によってプロセッサ・エレメントの接続関係を変更する際にマッピングされなかったプロセッサ・エレメント602a,602bに対しては、電源電圧を大幅に降圧することで、該当の信号処理では使用しない演算器で生じるオフリーク電流を抑制することが出来る。
例えばLSIのレイアウトを設計する際に、グローバル・バス611は任意のプロセッサ・エレメント同士で接続でき自由度の高い再構成が可能であるが、ローカル・バス613は、配置的に近いもの同士を接続し、プロセッサ・エレメント(演算器)同士の組み合わせに関して自由度は低くなる。ただ、ローカル・バス613は例えば隣あった8bitALU同士を接続して16bitALUを構成する場合などに使用する。この場合グローバル・バス611でも構成可能であるが、スイッチ部分の負荷が重く回路も大きくなる。
そのほか、ローカル・バス613は、ループ演算、組み合わせ演算、例えばALU-MUL, Sift-ALUあるいは上下のセルを組み合わせてACS(ACS:Add-Compare-Select)演算器を構成する場合などに専用特化する機能として用意する。
図7は、本発明の再構成可能な信号処理プロセッサにおける第3の実施例(電圧制御実施時)の説明図である。同図において、回路再構成によってマッピングされたプロセッサ・エレメント(動作可能な電源電圧供給エリア)701、回路再構成の結果マッピングされなかったプロセッサ・エレメント(待機電源電圧供給エリア) 702a,702b、システム制御用CPU705、コンフィギュレーション情報蓄積メモリ706、コンフィギュレーション制御信号デコード部707、コンフィギュレーション制御回路708、電源供給部のコンフィギュレーション制御回路709、データメモリ710、バス703およびスイッチ704を示す。
本実施形態の信号処理プロセッサでは、実行する信号処理では使用しないプロセッサ・エレメント702a,702b 、即ち回路再構成を制御する情報によって演算器の接続関係を変更する際にマッピングされなかったプロセッサ・エレメント702a,702b に対しては、電源電圧の供給を遮断することで、該当の信号処理では使用しない演算器で生じるオフリーク電流を抑制することが出来る。
図8は、本実施形態の信号処理プロセッサにおける連続動作モードの回路再構成制御タイミング図である。同図において、連続動作モード時のマスタークロック801、連続動作モード時のコンフィギュレーションイネーブル802、連続動作モード時の回路再構成期間803、連続動作モード時の入力レジスタ・クロック信号804、連続動作モード時の出力レジスタ・クロック信号805、連続動作モード時の信号処理実行ステージ(演算ステージ) 806、および連続動作モード時の信号処理停止ステージ(No OPeration実行) 807を示す。この場合、連続動作モードとは、例えばプロセッサ・エレメントが毎サイクル演算を行う場合をいう。
連続動作モード時のコンフィギュレーションイネーブル802は、図4のコンフィギュレーション制御信号デコード結果保持部の出力イネーブル404に対応し、後述する図10のイネーブル制御信号1010,1011,1012,1013に対応する。
図8において、EX1a,EX1b等 806は実行ステージを表し、どこかの演算器(DRPではどこかのプロセッサ・エレメント)で該当する命令(EX1a,EX1b等)を実行することを表す。例えば、EX1a,EX1b等が乗算命令なら乗算が出来るプロセッサ・エレメントに接続されるようスイッチ704を切り替え、データバス703から乗算が出来るプロセッサ・エレメントにデータを流し込む。またEX2a,EX2b等が加算命令であれば加算機能を持ったプロセッサ・エレメントに接続して加算を行う。
一方、NOP807はノー・オペレーション(NoOPeration)を示し、何も実行されない命令(或いはステージ)を表わす。NOP807は何も命令がないステージなので、この遊びの時間を使って切り替えを行う期間がコンフィギュレーションイネーブル802の動作している時間803である。
マスタークロック801、コンフィギュレーションイネーブル802、入力レジスタ・クロック信号804および出力レジスタ・クロック信号805は、コンフィギュレーション制御回路608,708から送られる。これらの命令に相当する情報は、コンフィギュレーション情報蓄積メモリ606,706に蓄積してあり、これをコンフィギュレーション制御信号デコード部607,707でデコードする。
マスタークロック801は、コンフィギュレーション情報蓄積メモリ606,706、コンフィギュレーション制御信号デコード部607,707、コンフィギュレーション制御回路608,708に供給されるクロックであり、コンフィギュレーションイネーブル802は、コンフィギュレーション制御信号デコード部607,707におけるデコード結果から作られ、コンフィギュレーション制御回路608,708で使用されるとともに出力される。また、レジスタ・クロック804,805は、マスタークロック801を基に命令をデコードした信号でコンフィギュレーション制御回路608,708が生成する。
図9は、本実施形態の信号処理プロセッサにおけるオルターネード動作モードの回路再構成制御タイミング図である。同図において、オルターネードモード(時分割マッピングモード)時のマスタークロック901、オルターネードモード(時分割マッピングモード)時のコンフィギュレーションイネーブル902、オルターネードモード(時分割マッピングモード)時の回路再構成期間903、オルターネードモード(時分割マッピングモード)時の入力レジスタ・クロック信号904、オルターネードモード(時分割マッピングモード)時の出力レジスタ・クロック信号905、オルターネードモード(時分割マッピングモード)時の信号処理実行ステージ(演算ステージ) 906、およびオルターネードモード(時分割マッピングモード)時のデータ転送ステージ907を示す。
図9において、クロック周期の(3),(4)サイクル目、(7),(8)サイクル目、(9),(10)サイクル目(以下省略)の部分が上記の遊びの部分である。つまり、EX906(プロセッサ・エレメントが演算する時間)とTR907(データRAMまたはプロセッサ・エレメントからプロセッサまたは次段のプロセッサ・エレメントへのデータ転送期間)以外の時間が切り替えを行える時間となる。この時間にコンフィギュレーションイネーブル902を動作させ切り替え(再構成/再接続)を行う。この場合、レジスタ・クロック904の下がりエッジに同期した場合が最も内部遅延時間的に余裕がある。
コンフィギュレーションイネーブル902は切り替え(再構成/再接続)のイネーブル信号である。図9のオルターネード(交互)動作モードではEX(演算)、TR(転送)期間が交互に行われ、再構成/再接続はバス部分も再構成するのでTR期間には行えない。従って交互動作モードではEX(演算)時間を使って切り替えを行う。
このように本実施形態の信号処理プロセッサは、連続動作モード(第一の動作モード)において、プロセッサ・エレメントのデータ入力とデータ出力部に配置された入力レジスタと出力レジスタを信号処理内容に応じて再構成し、プロセッサ・エレメントで連続して演算処理等のデジタル信号処理を実施する。また、オルターネード動作モード(第二の動作モード)において、演算処理等のデジタル信号処理動作と、出力レジスタから入力レジスタへデータを転送する動作とを交互に行い、プロセッサ・エレメントでデジタル信号処理を実施している期間に、プロセッサ・エレメント間の接続関係を変更する回路再構成動作を行う。これにより、プロセッサ・エレメントの利用効率を高め且つ低消費電力を実現することの出来る。
なお、入力レジスタまたは出力レジスタのいずれか一方を配置しても、連続してプロセッサ・エレメント間で演算処理等を実施する事は可能である。例えば、あるプロセッサ・エレメントで演算した結果は一度レジスタで受けなければ、直接次のプロセッサ・エレメントに流れ込んでしまい、切れ目なく演算データが流れるとバスの切り替えも再構成も出来なくなる。また、クロック信号に同期させる必要があるため、入力または出力部にレジスタをおく必要がある。入力および出力の両方にレジスタを配置すると、EX(演算)とTR(転送)のステージを作ることが出来る。
単位時間内で処理される信号量が多い場合に第一のモード(高速動作モードあるいは高スループットモード)とする。一方、第二のモードは第一のモードに比べ低電力モードである。
プロセッサ・エレメントにおける電力は、容量C、クロック周波数f、電源電圧Vddとすると、C×f×Vdd^2で表わされる。図8のレジスタ・クロック804はマスタークロック801の半分の周波数で入力されており、一方、図9のレジスタ・クロック904は図8のレジスタ・クロック804を間欠的に入力している。例えば、マスタークロック801の周波数を100MHzとする場合、図8のレジスタ・クロック804は50MHz、図9のレジスタ・クロック904は25MHzに相当し、上記の式の周波数fが下がる分だけ電力を削減することが出来る。
このように本実施形態の信号処理プロセッサでは、プロセッサ・エレメントの入力側と出力側にレジスタを設けるので、プロセッサ・エレメントでデジタル信号処理を実施している期間に、プロセッサ・エレメント間の接続関係を変更することが可能である。
すなわち、入力レジスタから信号を出力してプロセッサ・エレメントで演算し出力側レジスタへ信号が伝播している間(演算している間)にバスの接続関係を変更する。一方、出力側レジスタからバスを経由して入力側レジスタへ信号を転送する期間(再構成できない期間)は、プロセッサ・エレメントは演算動作をしないので消費電力は小さい。
また、本実施形態の信号処理プロセッサでは、信号処理内容を実行する時刻順にスケジューリングするための情報をコンフィギュレーション情報蓄積メモリに蓄積しておくことにより、実行する信号処理内容を回路再構成可能な信号処理プロセッサにマッピングする際に、一度に全ての処理をマッピングできない場合などは、信号処理内容を実行する時刻順にスケジューリングし、第二の動作モードを用いて時分割にマッピングすることが可能である。
図10は、本実施形態の信号処理プロセッサにおけるオルターネード動作モード時のクロック制御回路の説明図である。同図において、プロセッサ・エレメント1001、レベルシフタ1002、入力レジスタ1003a、出力レジスタ1003b、演算器1004、入力レジスタのクロック信号(オルターネード動作時にクロック供給される個所) 1005、出力レジスタのクロッ
ク信号(オルターネード動作時にクロック供給される個所) 1006、入力レジスタのクロック信号(マッピングされないプロセッサ・エレメント) 1007、出力レジスタのクロック信号(マッピングされないプロセッサ・エレメント) 1008、マスタークロック1009、オルターネードモードおよびマッピング時の入力レジスタ用イネーブル制御信号1010、オルターネードモードおよびマッピング時の出力レジスタ用イネーブル制御信号1011、オルターネードモードおよび非マッピング時の入力レジスタ用イネーブル制御信号1012、オルターネードモードおよび非マッピング時の出力レジスタ用イネーブル制御信号1013、バス1014およびスイッチ1015を示す。
図10に示す回路は、コンフィギュレーション制御回路708の内部回路の一部であり、イネーブル制御信号1012,1010,1011,1013は、例えば、コンフィギュレーション制御信号デコード部707から送られてくる。イネーブル制御信号1010は、プロセッサ・エレメントの入力部が動作する期間を決め、イネーブル制御信号1011はプロセッサ・エレメントの出力部が動作する期間を決める。これらはマスタークロック1009に同期して動作する。
図10の上段に示すプロセッサ・エレメントは、イネーブル制御信号1010で形成したクロック信号1005の期間にバスからデータを入力して演算(EX)を実行する。一方、イネーブル制御信号1011で形成したクロック信号1006の期間で、図10の上段に示したプロセッサ・エレメントから下段に示したプロセッサ・エレメントへデータ転送(TR)を実行する。
図11は、本実施形態の信号処理プロセッサにおけるバスおよびスイッチ部の説明図である。同図において、バス1101、スイッチ部1102、コンフィギュレーション情報蓄積メモリ1103、コンフィギュレーション情報のデコーダ1104、コンフィギュレーション制御回路1105、レベルシフタ1106、入力レジスタ1107、演算器1108、出力レジスタ1109およびレベルシフタ1110を示す。
スイッチ部1102は、図5の512、図6の612、図7の704に対応する。コンフィギュレーション制御回路1105は、バス1101のデータを入力レジスタ1107、演算器1108、出力レジスタ1109に送って演算するか否かを決めるコンフィギュレーションイネーブル信号(再構成制御信号)を生成する。よってコンフィギュレーションイネーブル信号がアクティブな場合は、バス1101、スイッチ部1102、入力レジスタ1107、演算器1108および出力レジスタ1109の経路が構成され演算が行われる。
例えば、図10ではプロセッサ・エレメントを6個示しているが、右上端のプロセッサ・エレメントの演算結果を次に何処へ送ってどのプロセッサ・エレメントで次の演算を行うかをスイッチ部1102が決定する。
各プロセッサ・エレメントの入口にはスイッチ部1102があり、バス1101のデータを取り込んで演算を行うか行わないかをコンフィギュレーション制御回路1105が指示する。コンフィギュレーション制御回路1105から出力されるコンフィギュレーションイネーブル信号がアクティブでない場合、バス1101の信号は、スイッチ部1102、入力レジスタ1107、演算器1108および出力レジスタ1109へ入力されないので、そのプロセッサ・エレメントが再構成の対象外となる。
図12は、本実施形態の信号処理プロセッサにおける局所的回路再構成に関する実施例の説明図である。同図において、ループ動作コンフィギュレーションイネーブル信号1201a,1201b、複合演算動作コンフィギュレーションイネーブル信号1202、右シフト拡張信号1203a、左シフト拡張信号1203b、偶数カラムに配置されたプロセッサ・エレメント1204a、奇数カラムに配置されたプロセッサ・エレメント1204b、レベルシフタ1205a,1205b、レベルシフタ1206a,1206b、入力レジスタ1207a,1207b、出力レジスタ1208a,1208b、演算器(ALUや乗算器など) 1209a,1209b、シフト演算器(バレルシフタなど) 1210a,1210b、およびシフト演算器拡張回路1211を示す。
偶数カラムに配置されたプロセッサ・エレメント1204aと奇数カラムに配置されたプロセッサ・エレメント1204bは、例えば、夫々が4bitALUだった場合にその2つを横方向に再構成して、8bitALUとして機能させることができる。したがってプロセッサ・エレメント1204a,1204bは、ビット拡張信号が下位bit用と上位bit用になっている点が相違する。例えば、プロセッサ・エレメント1209bは、プロセッサ・エレメント1209aのALU(算術論理演算器)からの桁上げ信号が入力される。
ループ動作コンフィギュレーションイネーブル信号1201a等は、演算器1209bおよび演算器1209b内のALUにおいて繰り返し足し算をする場合、例えば5回足し算する場合に、プロセッサ・エレメントを5個使ってシリアルに接続するよう再構成するのではなく、1個のプロセッサ・エレメントを使って5回実行することで少ない演算器の資源(個数)で再構成させるための制御信号である。
5回連続して足し算を行う場合に、この信号がない場合は足し算を行うプロセッサ・エレメントを5個直列にマッピングして演算を行う必要がある。また、再構成機能を使うと、1個のプロセッサ・エレメントで演算できるが、外部バス経由でデータをループさせる必要があるので、バスの使用効率が下がる可能性がある。バスの自由度を上げるためにもグローバル・バスは必要最小限の使用に留めることが望まれる。
そこで本実施形態のように、ループ動作コンフィギュレーションイネーブル信号1201a,1201bを使用すると、1個のプロセッサ・エレメントを使用するだけでループ演算を行うことが出来る。かつ外部のグローバル・バスを使わずプロセッサ・エレメントを内部で独立させて使用するのでバスの使用効率の低下を抑制できる。
複合演算動作コンフィギュレーションイネーブル信号1202は、ビット拡張機能の信号である。例えば、プロセッサ・エレメント1209a,1209bが4bit ALUの場合、複合演算動作コンフィギュレーションイネーブル信号1202を使用して8bit ALUとして動作させることができる。複合演算動作コンフィギュレーションイネーブル信号1202を使ってビット拡張すると、プロセッサ・エレメント1209aからC信号が入力されプロセッサ・エレメント1209bが上位ビット用のプロセッサ・エレメントとして動作する。
右シフト拡張信号1203aおよび左シフト拡張信号1203bについて、例えばシフト演算器1210a、1210bが夫々4bitシフタの場合は、右シフト拡張信号1203a、左シフト拡張信号1203bがOFFになるとシフト演算器1210a、1201bは夫々別の4bitシフタとして動作する。一方、右シフト拡張信号1203aがONになると右シフトに関して8bitシフタとして動作し、左シフト拡張信号1203bがONになると左シフトに関して8bitシフタとして動作する。
ループ動作コンフィギュレーションイネーブル信号1201a,1201b、複合演算動作コンフィギュレーションイネーブル信号1202、右シフト拡張信号1203aおよび左シフト拡張信号1203b は、コンフィギュレーション制御回路1105,708,608から送られてくる。
例えば、ループ動作コンフィギュレーションイネーブル信号1201aに"1"が入るとセレクタの左側矢印が選択され、S0,S1の信号が演算器1209aに入力され、LOOP演算が行われる。
また、ループ動作コンフィギュレーションイネーブル信号1201aに"0"が入るとセレクタの右矢印入力が選択され、入力レジスタ1207aのレジスタ情報が演算器1209aに入力され、通常パスとなる。
本実施形態の信号処理プロセッサによれば、ソフトウェアによって与えられた回路再構成情報中に、例えば繰り返し演算や、積和演算などの組み合わせ演算や、プロセッサ・エレメント内の演算器におけるビット幅に対して倍精度演算がある場合を検出し、且つ近接して配置されたプロセッサ・エレメント間を、ループ、直列あるいは並列に接続することでプロセッサ・エレメント間のバス接続回路規模を削減することができる。
図5あるいは図7においては、グローバルにどのプロセッサ・エレメント同士も接続できるが、全ての組み合わせが可能な構成にした場合、バス配線とスイッチ部分が肥大化して、回路規模や消費電力とのトレードオフが発生する。本実施形態の信号処理プロセッサではこの点を改善することができる。
図15は、本実施形態の信号処理プロセッサにおいて入力レジスタを自己テスト回路へ再構成する場合の説明図である。図において、レベルシフタ1501、演算器への出力1502、入力レジスタ(スキャンテスト機能つきフリップフロップ) 1503、テストモード信号(コンフィギュレーション制御信号) 1504およびテストモード時のリセット信号1505を示す。
本実施形態の信号処理プロセッサにテスト機能を持たせるために、入力側レジスタを図15の回路で構成する。そして、回路再構成により入力側レジスタを線形フィードバック・レジスタ回路に変更すると、プロセッサ・エレメント(演算器)には擬似ランダム信号が入力される。
一方、プロセッサ・エレメントの出力側レジスタを同様に再構成してMISR(マルチ・インプット・シグネチャ・レジスタ)にすると、ランダム入力されたデータがプロセッサ・エレメント経由でMISRの入力される。MISRは圧縮器なので、多数回ランダムデータを圧縮した結果をDRPの外部で期待値と比較すれば、LSIのスキャンテストを行うことができる。バスの場合も同様にスキャンテストが可能である。
本発明の信号処理プロセッサは、コンフィグレーション回路の高速化を回路規模の増大なく実現可能となるという効果を有し、再構成可能な信号処理プロセッサ等として有用である。
本発明の実施形態の信号処理プロセッサにおけるプロセッサ・エレメントの概略構成図 本発明の実施形態の信号処理プロセッサにおけるプロセッサ・エレメントの概略構成図 本発明の実施形態の信号処理プロセッサにおける電源制御の説明図 本発明の実施形態の信号処理プロセッサにおけるコンフィギュレーション制御回路の概略構成図 本発明の再構成可能な信号処理プロセッサにおける第1の実施例(電源遮断制御時)の説明図 本発明の再構成可能な信号処理プロセッサにおける第2の実施例(電源遮断制御時)の説明図 本発明の再構成可能な信号処理プロセッサにおける第3の実施例(電圧制御実施時)の説明図 本実施形態の信号処理プロセッサにおける連続動作モードの回路再構成制御タイミング図 本実施形態の信号処理プロセッサにおけるオルターネード動作モードの回路再構成制御タイミング図 本実施形態の信号処理プロセッサにおけるオルターネード動作モード時のクロック制御回路の説明図 本実施形態の信号処理プロセッサにおけるバスおよびスイッチ部の説明図 本実施形態の信号処理プロセッサにおける局所的回路再構成に関する実施例の説明図 従来のリコンフィギュアブル・プロセッサの説明図 従来例の電源再構成機能を持たない場合のバスおよびスイッチ部の説明図 本実施形態の信号処理プロセッサにおいて入力レジスタを自己テスト回路へ再構成する場合の説明図
符号の説明
101a, 101b レベルシフタ
102, 202, 311, 401 プロセッサ・エレメント
103a 入力レジスタ
103b 出力レジスタ
104a, 204a 演算器(バレルシフタ)
104b, 204b 演算器(ALU)
105, 205 バス
201a, 201b レベルシフタ内蔵レジスタ
301, 303 低電圧を供給する電源配線
302 高電圧を供給する電源配線
304 電源IC制御信号
305, 410, 509, 609 電源供給部のコンフィギュレーション制御回路
306 電源配線コンフィグレーション制御信号
307 電源電圧可変ブロック
308 電源電圧を低電圧から更に降圧制御された電源ライン(vdd1)
309 電源電圧を低電圧から更に降圧制御された電源ライン(Vdd2)
310, 320 レベルシフタ(信号降圧部)
312, 411 レベルシフタ(信号昇圧部)
409, 507, 607 コンフィギュレーション制御信号デコード部
501, 601 回路再構成によってマッピングされたプロセッサ・エレメント
502a, 502b, 602a, 602b 回路再構成の結果マッピングされなかったプロセッサ・エレメント
503, 603 電源電圧供給エリア
504, 604 電源電圧遮断エリア
505, 605 システム制御用CPU
506, 606 コンフィギュレーション情報蓄積メモリ
508, 608 コンフィギュレーション制御回路
510, 610 データメモリ
512, 612 スイッチ
611 グローバル・バス
613 ローカル・バス

Claims (1)

  1. 演算器の入力部に入力レジスタを備えるとともに、前記演算器の出力部に出力レジスタを備える複数のプロセッサ・エレメントと、
    前記複数のプロセッサ・エレメント間を接続するバスと、
    前記バスの接続を変更するスイッチ部と、
    ソフトウェアに応じて前記スイッチ部を制御する制御回路と
    前記プロセッサ・エレメントによる信号処理を実行する順番に関するスケジューリング情報を格納するメモリと、を有する信号処理プロセッサであって、
    前記プロセッサ・エレメントが連続して信号処理を行う第一の動作モードと、
    前記プロセッサ・エレメントによる信号処理と、前記プロセッサ・エレメントの前記出力レジスタから前記入力レジスタへのデータ転送処理とを交互に行い、前記プロセッサ・エレメントによる信号処理期間に、前記複数のプロセッサ・エレメント間の接続を変更する第二の動作モードとを有し、
    前記制御回路は、前記第二の動作モードにおいて、前記スケジューリング情報に従って時分割に回路再構成を行う信号処理プロセッサ。
JP2006114418A 2006-04-18 2006-04-18 再構成可能な信号処理プロセッサ Expired - Fee Related JP4298718B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006114418A JP4298718B2 (ja) 2006-04-18 2006-04-18 再構成可能な信号処理プロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006114418A JP4298718B2 (ja) 2006-04-18 2006-04-18 再構成可能な信号処理プロセッサ

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004354385A Division JP3810419B2 (ja) 2004-12-07 2004-12-07 再構成可能な信号処理プロセッサ

Publications (2)

Publication Number Publication Date
JP2006244519A JP2006244519A (ja) 2006-09-14
JP4298718B2 true JP4298718B2 (ja) 2009-07-22

Family

ID=37050795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006114418A Expired - Fee Related JP4298718B2 (ja) 2006-04-18 2006-04-18 再構成可能な信号処理プロセッサ

Country Status (1)

Country Link
JP (1) JP4298718B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5115307B2 (ja) 2008-04-25 2013-01-09 富士通セミコンダクター株式会社 半導体集積回路
US8612789B2 (en) * 2011-01-13 2013-12-17 Xilinx, Inc. Power management within an integrated circuit
US9465620B2 (en) * 2012-12-20 2016-10-11 Intel Corporation Scalable compute fabric
JP6087663B2 (ja) * 2013-02-28 2017-03-01 キヤノン株式会社 構成情報生成装置およびその制御方法
JP6141073B2 (ja) * 2013-04-02 2017-06-07 キヤノン株式会社 情報処理装置及び情報処理装置の制御方法
JP6920238B2 (ja) * 2018-03-22 2021-08-18 住友電装株式会社 電力供給制御装置
JP7433931B2 (ja) 2020-01-27 2024-02-20 キヤノン株式会社 情報処理装置及びその制御方法及びプログラム

Also Published As

Publication number Publication date
JP2006244519A (ja) 2006-09-14

Similar Documents

Publication Publication Date Title
JP3810419B2 (ja) 再構成可能な信号処理プロセッサ
JP4298718B2 (ja) 再構成可能な信号処理プロセッサ
JP4485272B2 (ja) 半導体装置
JPH07130856A (ja) 半導体集積回路およびその製造方法
KR20090030498A (ko) Fp-ra를 구성하는 pe 구조 및 그 fp-ra제어하는 fp-ra 제어 회로
US20070136560A1 (en) Method and apparatus for a shift register based interconnection for a massively parallel processor array
JP4451733B2 (ja) 半導体装置
KR101000099B1 (ko) 프로그래머블 논리 디바이스
JP5704240B2 (ja) 集積回路
JP2006011825A (ja) 再構成可能演算装置および半導体装置
US11579875B2 (en) Computing chip, hashrate board and data processing apparatus
Jain et al. Processor energy–performance range extension beyond voltage scaling via drop-in methodologies
US20030154347A1 (en) Methods and apparatus for reducing processor power consumption
US20060152980A1 (en) Low-power delay buffer circuit
CN101236576B (zh) 一种适用于异质可重构处理器的互联模型
KR20090114773A (ko) Odc 클록 게이팅을 이용한 저전력 레지스터 블록
JP2002033457A (ja) 半導体集積回路装置
JP5565456B2 (ja) 集積回路及びその使用方法
JP6046319B1 (ja) 再構成可能命令セルアレイのシリアル構成
Veleski et al. Design and implementation strategy of adaptive processor-based systems for error resilient and power-efficient operation
JP4562679B2 (ja) データフローグラフ生成装置
JP4437439B2 (ja) データ処理装置
Mongiya et al. A Review on Designing of Power and Delay Efficient 10T and 14T SRAM Cell
Van Dyken et al. A medium-grain reconfigurable processing unit
JP5187303B2 (ja) デュアルレイル・ドミノ回路、ドミノ回路及び論理回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070816

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090415

R150 Certificate of patent or registration of utility model

Ref document number: 4298718

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130424

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130424

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140424

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees