JP2014222437A - Simd型プロセッサ - Google Patents

Simd型プロセッサ Download PDF

Info

Publication number
JP2014222437A
JP2014222437A JP2013101993A JP2013101993A JP2014222437A JP 2014222437 A JP2014222437 A JP 2014222437A JP 2013101993 A JP2013101993 A JP 2013101993A JP 2013101993 A JP2013101993 A JP 2013101993A JP 2014222437 A JP2014222437 A JP 2014222437A
Authority
JP
Japan
Prior art keywords
processor
register
simd type
elements
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013101993A
Other languages
English (en)
Other versions
JP6089949B2 (ja
Inventor
山中 俊輝
Toshiteru Yamanaka
俊輝 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2013101993A priority Critical patent/JP6089949B2/ja
Publication of JP2014222437A publication Critical patent/JP2014222437A/ja
Application granted granted Critical
Publication of JP6089949B2 publication Critical patent/JP6089949B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

【課題】ピーク電流の抑制をするとともに、プロセッサエレメント間のデータ転送が生じる場合にも最適なタイミングで動作させる。【解決手段】レジスタ3および演算器2を有するプロセッサエレメントPEが複数配置され、他のプロセッサエレメントPEのデータを参照しながら、単一のグローバルプロセッサ1で同時に並列処理するSIMD型プロセッサ110において、プロセッサエレメントPEは、レジスタ3が出力するデータを2つの異なるタイミングで出力するレジスタ読出手段を備えるとともに、隣接するプロセッサエレメントを制御するクロック信号CKの位相差を、レジスタ読出手段が出力する遅延差となるように設定する設定手段を備える。【選択図】図3

Description

本発明は、1つの演算命令により複数の画像データ等を並列処理するSIMD(Single Instruction-stream Multiple Data-stream)型プロセッサに関する。
デジタルテレビジョン放送受信装置、デジタル複写機、又はファクシミリ装置などの画像処理装置において用いられる画像処理専用のマイクロプロセッサにおいては、SIMD型のマイクロプロセッサが用いられることが多い。これは1つの命令で複数のデータに対して、並列に演算処理が行なわれるSIMD方式の特徴が画像処理には適しているからである。
SIMD型プロセッサ(SIMD型マイクロプロセッサともいう)は、それぞれ演算器(ALU)とレジスタ(REG)とを備える複数のプロセッサエレメント(PE)と、そのプロセッサエレメントを制御する制御回路としてのグローバルプロセッサと、備えて構成されている。プロセッサエレメントの個数は、例えば、画像データの大きさに応じて決定され、これらの複数のプロセッサエレメントを、単一のグローバルプロセッサが、同時に演算処理を行うように制御している。
具体的には、SIMD型プロセッサにおいて、各プロセッサエレメントは、画像データのうちの1画素の画素データの画像処理を行う。そのプロセッサエレメントが複数あるため、複数の画素に対応する画素データが並列に演算処理される。このように、複数の画素データを同時に処理することで、画像処理の効率を高めている。
近年、デジタル複写機やファクシミリ装置などの画像処理では、画素数の増加、画像処理の多様化などにより画質の向上が図られている。そして、この画質の向上に伴い、処理すべきデータ数がどんどん増加しており、SIMD型プロセッサにおいてもより多くのプロセッサエレメントが必要になっている。
SIMD型プロセッサの特徴は、全プロセッサエレメントが同時に同一の動作を行うところにある。従って、各プロセッサエレメントが同一のデータ処理を実行すると、全てのプロセッサエレメントに同一の消費電流が流れる。その総消費電流量はプロセッサエレメントの数に比例して増加するのは言うまでもないが、電流を消費するタイミングも同一であるため、ピーク電流を消費するタイミングも全てのプロセッサエレメントで揃っており、ピーク電流値はより大きなものとなってしまう。この大きなピーク電流が電源ノイズや消費電力の増加に伴って電源配線に生じる電圧降下(IRドロップ)などを引き起こし、SIMD型プロセッサの性能劣化を引き起こす原因となっている。
すなわち、近年の画像データの増大傾向は、同時動作するプロセッサエレメントの数がより多くなることを意味しており、このため、画像処理の効率を高めると、電源ノイズによる処理効率の低下につながってしまうという問題がある。
このSIMD型プロセッサにおける同時動作の問題を解決するために、特許文献1には、
グローバルプロセッサを全プロセッサエレメントの中央に配置して、プロセッサエレメントを2つのグループに分割し、プロセッサエレメントをグループ毎に異なるタイミングで制御するSIMD型プロセッサが開示されている。このSIMD型プロセッサでは、特定のブロックにかかる制御信号を一定期間遅らせて、ピーク電流を分散させるとともに、プロセッサエレメント間のデータ転送に関しては、データの転送方向に応じて制御タイミングを切り替えること、すなわち、隣接画素参照時は参照方向に応じて遅延させるクロックを選択させることが開示されている。
また、ピーク電流を削減するために、特許文献2には、隣接するプロセッサエレメントとの同時動作による電流集中回避を、レジスタ内のデータによる電流集中を判別しながら動作タイミングを変更するSIMD型マイクロプロセッサが開示されている。
しかしながら、特許文献1のSIMD型プロセッサのように、制御タイミングをデータの転送方向に応じて動的に切り替える制御では、転送方向が切り替わるような連続動作に対応することができず、該当命令による動作が完了するまでの数サイクル間、次の命令に移行ができないこととなり、処理能力の低下につながってしまうという問題がある。
また、特許文献2のSIMD型プロセッサでは、プロセッサエレメント間のデータ転送の際に、データの取り込みタイミングが異なる点について考慮されていないため、動作性能の向上に検討の余地を残していた。
そこで本発明は、SIMD型プロセッサの同時動作によって生じる電源ノイズや、IRドロップなどの問題を回避するため、ピーク電流の抑制をするとともに、プロセッサエレメント間のデータ転送が生じる場合にも最適なタイミングで動作させることができるSIMD型プロセッサを提供することを目的とする。
かかる目的を達成するため、本発明に係るSIMD型プロセッサは、レジスタおよび演算器を有するプロセッサエレメントが複数配置され、他のプロセッサエレメントのデータを参照しながら、単一の制御回路で同時に並列処理するSIMD型プロセッサにおいて、前記プロセッサエレメントは、前記レジスタが出力するデータを2つの異なるタイミングで出力するレジスタ読出手段を備えるとともに、隣接する前記プロセッサエレメントを制御する制御クロックの位相差を、前記レジスタ読出手段が出力する遅延差となるように設定する設定手段を備えるものである。
本発明によれば、ピーク電流の抑制をするとともに、プロセッサエレメント間のデータ転送が生じる場合にも最適なタイミングで動作させることができる。
SIMD型プロセッサの基本構成を示すブロック図である。 図1に示したSIMD型プロセッサのプロセッサエレメントのブロック図である。 本発明に係るSIMD型プロセッサの一実施形態の構成を示すブロック図である。 プロセッサエレメントPE(0),PE(1),PE(2)に入力されるクロック信号CK0,CK1,CK2、プロセッサエレメントPEにおけるレジスタ出力REG−Out、および遅延回路からの出力−Delayのタイミングチャートである。 本発明に係るSIMD型プロセッサの他の実施形態の構成を示すブロック図である(第2の実施形態)。 本発明に係るSIMD型プロセッサの他の実施形態の構成を示すブロック図である(第3の実施形態)。 本発明に係るSIMD型プロセッサの他の実施形態の構成を示すブロック図である(第4の実施形態)。 本発明に係るSIMD型プロセッサの他の実施形態の構成を示すブロック図である(第5の実施形態)。 選択切替回路の構成を示すブロック図である。
以下、本発明に係る構成を図面に示す実施の形態に基づいて詳細に説明する。
[SIMD型プロセッサの基本構成]
本発明に係るSIMD型プロセッサ(SIMD型マイクロプロセッサ)の説明に先立って、前提となる基本構成(従来例)について説明する。図1は、SIMD型プロセッサ100の基本構成を示すブロック図である。
図1に示すSIMD型プロセッサ100は、命令を判別したグローバルプロセッサ(Global Processor)1がクロック信号(CK)を含む制御信号を生成し、複数のプロセッサエレメント(PE(0)〜PE(n)、PEと総称および略称する)が同時に動作するように構成されている。
複数のプロセッサエレメントPEは全て同じ命令で一斉に動作するため、例えば、レジスタ(REG)3からデータを読み出し、演算器(Arithmetic Logic Unit,ALU)2で演算を行う場合は、全てのプロセッサエレメントPEで同様の動作が実行されることとなる。なお、図1においてプロセッサエレメントPEのレジスタ3から異なるプロセッサエレメントPEの演算器2に線が引かれているのは、隣接する異なるプロセッサエレメントPEのデータを用いて演算が行われることがあることを意味するものとし、以下の図面においても同様とする。
図2に、SIMD型プロセッサ100のプロセッサエレメントPEのブロック図を示す。プロセッサエレメントPEは、レジスタ3、第一マルチプレクサ(MPX)21と、第二マルチプレクサ22と、パイプラインレジスタ(FF)23と、ALU2と、Aレジスタ(A)24と、を備え、グローバルプロセッサ1から入力されたプロセッサエレメント制御信号に従ってレジスタ3に格納されたデータを演算する。
レジスタ3は、32ある記憶素子(R0〜R31)の中から選択され読み出しを行うものであり、レジスタ3に格納されたデータをプロセッサエレメント制御信号に従って第一マルチプレクサ21へ出力したり、Aレジスタ24の内容を格納したりする。
レジスタ3ブロック後の第一マルチプレクサ21は、複数のレジスタ3から入力されたデータを選択して出力する。この第一マルチプレクサ21は、当該PEを含む前後の数PEのデータから一つが選択される仕組みとなっている。例えば、画像処理系などで用いられる演算(例えば、隣接画素との演算)で、あるプロセッサエレメントPE(n)のレジスタ3のデータとPE(n)に隣接するPE(n−1)やPE(n+1)のレジスタ3のデータを演算する場合に、隣接するPE(n−1)やPE(n+1)のレジスタ3のデータを、PEnのレジスタ3のデータと同様に扱うことができるようにするために設けられており、これによって、PEnのALU2を用いて一命令で演算を実行することが可能となる。
第一マルチプレクサ21で選択されたデータは、パイプラインレジスタ23に一度保持される。パイプラインレジスタ23は、ここまでの処理とALU2の処理とのパイプライン処理におけるステージを分割するために設けられているレジスタである。
ALU2は、算術論理演算器であり、パイプラインレジスタ23から入力されたデータおよびAレジスタ24のデータを入力としてプロセッサエレメント制御信号により指定された演算を行いAレジスタ24に出力する。演算結果はAレジスタ24に格納される。
Aレジスタ24は、ALU2で演算された結果を格納するアキュムレータである。さらに、必要に応じて演算結果は、第二マルチプレクサ22を介して、レジスタ3に書き戻される。なお、この場合も同様に、異なるPEへの転送を行う場合があるが、図1での図示は省略している。この第一マルチプレクサ21と、第二マルチプレクサ22と、パイプラインレジスタ23と、ALU2と、Aレジスタ24と、で演算部を構成する。
以上説明した図1に示すSIMD型プロセッサ100においては、静止している場合には全てプロセッサエレメントPEが静止、動作する場合には全てプロセッサエレメントPEが同時動作を起こすものであるため、動作電流の増減が非常に激しいものになるという問題がある。この同時スイッチングによる非常に大きなピーク電流が、電源ノイズを引き起こす原因となっていた。
[第1の実施形態]
そこで本実施形態に係るSIMD型プロセッサは、レジスタ(レジスタ3)および演算器(演算器2)を有するプロセッサエレメント(プロセッサエレメントPE)が複数配置され、他のプロセッサエレメントのデータを参照しながら、単一の制御回路(グローバルプロセッサ)で同時に並列処理するSIMD型プロセッサ(SIMD型プロセッサ110)において、プロセッサエレメントは、レジスタが出力するデータを2つの異なるタイミングで出力するレジスタ読出手段(遅延回路5、等)を備えるとともに、隣接するプロセッサエレメントを制御する制御クロック(クロック信号CK0〜CK3)の位相差を、レジスタ読出手段が出力する遅延差となるように設定する設定手段(遅延素子4、等)を備えるものである。なお、括弧内は実施形態での符号、適用例を示す。また、ここでいう「隣接」とは、連続する両隣の2つのプロセッサエレメントPEに限らず、両側の複数のプロセッサエレメントPEを含むものとする。
図3は、本発明に係るSIMD型プロセッサの一実施形態の構成を示すブロック図である。このSIMD型プロセッサ110は、クロック信号(CK)を一定時間遅延させ、複数の位相が一定時間異なるクロック信号(CK0(=CK),CK1,CK2,CK3)を生成する遅延素子(Delay)4を備えている。
図3の例では、3つの遅延素子4を有することで4種類のクロック信号を生成する例を示しているが、遅延素子4の数はこれに限られるものではない。3つの遅延素子により生じるクロック信号の遅延差は同一であるものとする。
生成された複数のクロック信号CK0〜CK3は、異なるプロセッサエレメントPEに接続される。この時、隣り合うプロセッサエレメントPEを制御するクロック信号の遅延差は遅延素子4の1個分になるように組み合わせる。
また、各プロセッサエレメントPEのレジスタ3には、それぞれクロック信号の遅延素子4と同等の遅延量を生じさせる遅延回路5が設けられている。そして、例えば、プロセッサエレメントPE(0)からPE(1)のように、接続されたクロック信号の位相が、早いものから遅いものへと、異なるプロセッサエレメントPE間で転送が行われる場合、この遅延回路5からのパスが接続される。
図4はプロセッサエレメントPE(0),PE(1),PE(2)に入力されるクロック信号(CK0,CK1,CK2)、それぞれのプロセッサエレメントPEにおけるレジスタ出力(REG−Out)および遅延回路5からの出力(−Delay)のタイミングチャートである。図4を参照してプロセッサエレメントPE間の転送について説明する。
図4に示すように、連続するプロセッサエレメントPE間のクロック信号の位相差は遅延素子1個分(Delay)となっている。また、レジスタ出力(REG−Out)からの遅延出力(−Delay)までのスキューも、遅延素子1個分(Delay)となる。
図4に示すように、レジスタ3から読みだされたデータは、次のサイクルのクロックエッジで取り込まれる。ここで、同一のプロセッサエレメントPE内のデータを取り込む場合であれば、同一のクロック信号で制御することとなるが、プロセッサエレメントPE間のデータ転送がある場合には、位相の異なるクロック間のデータ転送となるため、セットアップタイムやホールドタイムの問題が生じることとなる。
図3に示すように、プロセッサエレメントPE(0)のレジスタ3のデータを、プロセッサエレメントPE(1)に転送する場合は、プロセッサエレメントPE(0)の遅延回路5を通した出力がプロセッサエレメントPE(1)に転送される。これは、図4に示すように、プロセッサエレメントPE(0)の出力をプロセッサエレメントPE(1)のクロックで取り込む場合、ホールドタイムの関係上、遅延回路5を通した出力しか取り込めないためである。
逆に、図3に示すように、プロセッサエレメントPE(1)のレジスタ3のデータをプロセッサエレメントPE(0)に転送する場合は、プロセッサエレメントPE(1)の遅延回路5を通さない出力がプロセッサエレメントPE(0)に転送される。これは、図4に示すように、プロセッサエレメントPE(1)の出力をプロセッサエレメントPE(0)のクロックで取り込む場合、セットアップタイムの関係上、遅延回路5を通さない出力しか取り込めないためである。
以上説明したように、本実施形態では、各プロセッサエレメントPEのクロック信号CKにスキューを持たせても、各プロセッサエレメントPE内のレジスタ3の出力側にクロックスキューと同等の遅延回路5を設けてタイミング制御することで、異なるプロセッサエレメントPE間の転送がある場合でも、タイミングエラーを起こすことなく動作させることが可能となる。
したがって、SIMD型プロセッサのように全でのプロセッサエレメントPEを同時に並列処理させるプロセッサにおいても、一定期間のスキューを持たせることが可能となり、これにより、動作期間をばらつかせ、結果としてピーク電流の抑制を行うことによって電源ノイズ等の不具合を解消させることが可能となる。
なお、転送先のプロセッサエレメントPEを制御するクロック信号に、転送元のプロセッサエレメントPEよりも遅いクロック信号がない場合(転送元のプロセッサエレメントPEのクロック信号が最も遅い場合)は、転送元のプロセッサエレメントPEに遅延回路を設けないことも好ましい。
すなわち、図3において、点線で示される遅延回路5aを備えたプロセッサエレメントPE(3)は、自身のクロック信号CK3より遅いクロック信号を使うプロセッサエレメントPEへの転送がないため、遅延回路5自体が不要となる。このようなプロセッサエレメントPE(3)では、遅延回路5を設けないようにすることもできる。
[第2の実施形態]
以下、SIMD型プロセッサの他の実施形態について説明する。本実施形態のSIMD型プロセッサ(SIMD型プロセッサ120)は、プロセッサエレメントPEは、隣接する両側n個のプロセッサエレメントPEのデータを参照可能であって、位相差の異なる制御クロックは、それぞれn個毎の連続するプロセッサエレメントPEに接続されるものである。なお、上記実施形態と同様の点についての説明は適宜省略する。
上記第1の実施形態では、プロセッサエレメントPE(n)に対し、両隣の各1PE(PE(n−1)およびPE(n+1)のデータを参照する例について説明したが、両側それぞれ複数のPEを参照可能とすることも好ましい。
図5は、本発明に係るSIMD型プロセッサの他の実施形態の構成(SIMD型プロセッサ120)を示すブロック図である。図5は、プロセッサエレメントPE(n)に対し、両隣の各2PE(PE(n−2),PE(n−1)およびPE(n+1),PE(n+2))のデータを参照する例を示している。なお、クロック信号CK0〜CK3を生成する設定手段については図示を省略している。
仮に、第1の実施形態で説明したSIMD型プロセッサ110の構成において、2PE分のデータ転送を行うと、2PE先のクロック信号は自身のクロック信号とは、遅延素子2個分のスキューを持つこととなるため、データ転送時にタイミングエラーを引き起こしてしまう。
そこで、本実施形態では、図5に示すように、データ転送を行う数に相当する数のプロセッサエレメントPE(図5の例では2つ)を1つのグループとして、同一のクロック信号で制御するようにしたものである。したがって、2PE分のデータ転送が必要な場合でも、クロック信号の位相差は遅延1つ分で済むこととなる。
このように構成することで、第1の実施形態と同様に、タイミングエラーを起こすことなく、クロックの位相差を持たせることが可能となり、動作期間をばらつかせ、結果としてピーク電流の抑制を行うことによって電源ノイズ等の不具合を解消させることが可能となる。
[第3の実施形態]
本実施形態のSIMD型プロセッサ(SIMD型プロセッサ130)は、プロセッサエレメントPEは、隣接する両側n個のプロセッサエレメントPEのデータを参照可能であって、位相差の異なる制御クロックは、それぞれ2n個以上の連続するプロセッサエレメントPEに接続され、かつ、各プロセッサエレメントPEについて転送先のプロセッサエレメントPEを制御する制御クロックの位相は2種類以内であるものである。
図6は、本発明に係るSIMD型プロセッサの他の実施形態の構成(SIMD型プロセッサ130)を示すブロック図である。第3の実施形態では、第2の実施形態と同様に2PE分の転送を想定している。第3の実施形態では、図6に示すように、4つのプロセッサエレメントPEを1つのクロック信号で制御させている。
すなわち、本実施形態では、4PE分の同時動作が生じるが、プロセッサエレメントPE間の転送量を考えた場合、最大2PEまでの転送しかないことを考えると、対象となるクロックの位相は2種類しか存在しないことになる(第2の実施形態では3種類)。
したがって、結果としてレジスタ読み出しにおけるタイミング調整が容易となり、より最適な動作マージンを確保できるため、高速動作や低消費化を図ることが可能となる。
また、転送先のプロセッサエレメントPEを制御する制御クロックに、転送元のプロセッサエレメントPEを制御する制御クロックよりも速いものを含む場合は、該転送元のプロセッサエレメントにおけるレジスタ3は、閾値電圧を変更することで、他のプロセッサエレメントよりも高速で読み出し可能なレジスタ3とすることが好ましい。
すなわち、図6に示すように、自身のプロセッサエレメントPEを制御するクロックより位相が早いクロック信号を用いる他のプロセッサエレメントPEへの転送があり得るプロセッサエレメントPEのレジスタ3を他のレジスタ3よりも高速で読み出し可能な高速化レジスタ3aとすることが好ましい。これにより、より最適なタイミング調整を行うことが可能となる。高速化レジスタ3aの構成方法としては、例えば、閾値電圧(Vth)を変更することで構成することができ、レジスタの回路構成を変更することなく容易に対応することが可能である。
[第4の実施形態]
図7は、本発明に係るSIMD型プロセッサの他の実施形態の構成(SIMD型プロセッサ140)を示すブロック図である。第4の実施形態では、レジスタ3の遅延回路5に替えて、ラッチ回路(LT)6を用いて1位相分遅いクロック信号で制御するようにしたものである。
したがって、レジスタ3からの出力信号を、一つ遅いクロック信号との差分(遅延素子4の1個分の遅延)と同等のデータ保持時間を確保することができる。なお、点線で示すラッチ回路6aは、遅延回路5aと同様に、自身のクロック信号CK3より遅いクロック信号を使うプロセッサエレメントPEへの転送がないため、必須でないラッチ回路を示している。また、図7の例では、第1の実施形態(図3)における遅延回路5をラッチ回路6とする例を示したが、他の実施形態の構成においても同様に適用することができる。
[第5の実施形態]
図8は、本発明に係るSIMD型プロセッサの他の実施形態の構成(SIMD型プロセッサ150)を示すブロック図である。上記第4の実施形態のようにラッチ回路6を用いた構成は、遅延素子4により遅延差のあるクロック信号を生成する方式よりも、クロックと内部クロックとの位相比較を行い、遅延の値を可変させ、外部クロックとメモリ内部のクロック位相を一致させるDLL(Delay Locked Loop)回路によりエッジ制御を行う方式に好適である。
図8のSIMD型プロセッサ150は、クロック信号の生成にDLL回路7を用いてクロック位相を4等分したものである。この位相に合わせて、レジスタ3のデータの出力保持時間が追随するため、より精度の高いクロック位相のシフトを可能とすることができる。
以上説明した実施形態に係るSIMD型プロセッサによれば、並列処理を行う場合においても全てのプロセッサエレメントPEを一斉に同時動作させるのではなく、プロセッサエレメントPEごとにタイミングをずらせて動作させることができるため、同時動作による過大なピーク電流を防止することができる。その結果、電源ノイズやIRドロップをより小さくすることができる。
また、隣接画素との演算処理を行うような場合においても、制御クロックの位相差と同等のタイミング調整機能を持たせているため、過大な動作マージンを付加する必要がなく、動作性能を向上させることができる。したがって、動作速度を落とすことなく、電源ノイズ等による誤動作を起こしにくいSIMD型のマイクロプロセッサを構成することができる。
尚、上述の実施形態は本発明の好適な実施の例ではあるがこれに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変形実施可能である。
例えば、図9に示すように、クロックスキューを生じさせずに動作させる場合に必要なクロックの選択切替回路10を備えることも好ましい。選択切替回路10は、マルチプレクサ8を備えることで、遅延差のない同相のクロック信号の生成をするものである。例えば、SIMD型プロセッサの機能として、並列演算だけでなく、全てのプロセッサエレメントPEのレジスタ3の論理和をグローバルプロセッサ1に転送するなど、機能(命令の種類)によっては消費電流も少なく、同時動作させることが好ましい場合もある。そこで、選択切替回路10を備えることで、そのようなモードに合わせて、クロックの同一制御を選択可能とすることも好ましい。
1 グローバルプロセッサ
2 演算器
3 レジスタ
3a 高速化レジスタ
4 遅延素子
5,5a 遅延回路
6,6a ラッチ回路
7 DLL回路
8 マルチプレクサ
10 選択切替回路
21,22 マルチプレクサ
23 パイプラインレジスタ
24 Aレジスタ
100,110,120,130,140,150 SIMD型プロセッサ
PE プロセッサエレメント
特開2010−140309号公報 特開2012−194774号公報

Claims (8)

  1. レジスタおよび演算器を有するプロセッサエレメントが複数配置され、
    他のプロセッサエレメントのデータを参照しながら、単一の制御回路で同時に並列処理するSIMD型プロセッサにおいて、
    前記プロセッサエレメントは、前記レジスタが出力するデータを2つの異なるタイミングで出力するレジスタ読出手段を備えるとともに、
    隣接する前記プロセッサエレメントを制御する制御クロックの位相差を、前記レジスタ読出手段が出力する遅延差となるように設定する設定手段を備えることを特徴とするSIMD型プロセッサ。
  2. 前記プロセッサエレメントは、隣接する両側n個のプロセッサエレメントのデータを参照可能であって、
    位相差の異なる前記制御クロックは、それぞれn個毎の連続するプロセッサエレメントに接続されることを特徴とする請求項1記載のSIMD型プロセッサ。
  3. 前記プロセッサエレメントは、隣接する両側n個のプロセッサエレメントのデータを参照可能であって、
    位相差の異なる前記制御クロックは、それぞれ2n個以上の連続するプロセッサエレメントに接続され、かつ、各プロセッサエレメントについて転送先のプロセッサエレメントを制御する制御クロックの位相は2種類以内であることを特徴とする請求項1記載のSIMD型プロセッサ。
  4. 転送先のプロセッサエレメントを制御する制御クロックに、転送元のプロセッサエレメントを制御する制御クロックよりも速いものを含む場合は、
    該転送元のプロセッサエレメントにおける前記レジスタは、閾値電圧を変更することで、他のプロセッサエレメントよりも高速で読み出し可能なレジスタとすることを特徴とする請求項3記載のSIMD型プロセッサ。
  5. 転送先のプロセッサエレメントを制御する制御クロックに、転送元のプロセッサエレメントよりも遅い制御クロックがない場合は、
    該転送元のプロセッサエレメントに前記レジスタ読出手段を設けないことを特徴とする請求項1から4までのいずれかに記載のSIMD型プロセッサ。
  6. 前記レジスタ読出手段は、ラッチ回路を備え、前記レジスタが出力するデータを2つの異なるタイミングで出力することを特徴とする請求項1から5までのいずれかに記載のSIMD型プロセッサ。
  7. 前記設定手段は、DLL回路であることを特徴とする請求項6に記載のSIMD型プロセッサ。
  8. 前記設定手段は、命令の種類に応じて、前記制御クロックの位相差をなくして同相とすることを特徴とする請求項1から7までのいずれかに記載のSIMD型プロセッサ。
JP2013101993A 2013-05-14 2013-05-14 Simd型プロセッサ Expired - Fee Related JP6089949B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013101993A JP6089949B2 (ja) 2013-05-14 2013-05-14 Simd型プロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013101993A JP6089949B2 (ja) 2013-05-14 2013-05-14 Simd型プロセッサ

Publications (2)

Publication Number Publication Date
JP2014222437A true JP2014222437A (ja) 2014-11-27
JP6089949B2 JP6089949B2 (ja) 2017-03-08

Family

ID=52121931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013101993A Expired - Fee Related JP6089949B2 (ja) 2013-05-14 2013-05-14 Simd型プロセッサ

Country Status (1)

Country Link
JP (1) JP6089949B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108194A (ja) * 1991-10-17 1993-04-30 Hitachi Ltd 低消費電力型半導体集積回路
JPH1173400A (ja) * 1997-05-30 1999-03-16 Nec Corp ロジック混載dramlsi
JPH11353289A (ja) * 1998-06-10 1999-12-24 Mitsubishi Electric Corp 並列処理プロセッサ及び並列処理方法
JP2002132397A (ja) * 2000-10-27 2002-05-10 Matsushita Electric Ind Co Ltd 半導体集積回路装置
US20030126476A1 (en) * 2002-01-02 2003-07-03 Greene Michael A. Instruction scheduling based on power estimation
JP2007328461A (ja) * 2006-06-06 2007-12-20 Matsushita Electric Ind Co Ltd 非対称マルチプロセッサ
JP2012194774A (ja) * 2011-03-16 2012-10-11 Ricoh Co Ltd Simd型マイクロプロセッサ

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108194A (ja) * 1991-10-17 1993-04-30 Hitachi Ltd 低消費電力型半導体集積回路
JPH1173400A (ja) * 1997-05-30 1999-03-16 Nec Corp ロジック混載dramlsi
JPH11353289A (ja) * 1998-06-10 1999-12-24 Mitsubishi Electric Corp 並列処理プロセッサ及び並列処理方法
JP2002132397A (ja) * 2000-10-27 2002-05-10 Matsushita Electric Ind Co Ltd 半導体集積回路装置
US20030126476A1 (en) * 2002-01-02 2003-07-03 Greene Michael A. Instruction scheduling based on power estimation
JP2007328461A (ja) * 2006-06-06 2007-12-20 Matsushita Electric Ind Co Ltd 非対称マルチプロセッサ
JP2012194774A (ja) * 2011-03-16 2012-10-11 Ricoh Co Ltd Simd型マイクロプロセッサ

Also Published As

Publication number Publication date
JP6089949B2 (ja) 2017-03-08

Similar Documents

Publication Publication Date Title
CN107220023B (zh) 一种嵌入式可配置fifo存储器
JP5231800B2 (ja) 半導体集積回路装置および半導体集積回路装置のクロック制御方法
KR102340679B1 (ko) 전압 드룹을 위한 클록 조정
JP2007133527A (ja) クロック信号生成回路、半導体集積回路及び分周率制御方法
JP5126226B2 (ja) 演算ユニット、プロセッサ及びプロセッサアーキテクチャ
JP2000285016A (ja) メモリ制御回路
JP4753895B2 (ja) 遅延調整回路を有するアレイ型プロセッサ
JP2008181361A (ja) データ処理装置、画像処理装置、及びデータ処理プログラム
JP6089949B2 (ja) Simd型プロセッサ
JP2007065756A (ja) クロック制御回路、クロック制御方法、半導体集積回路装置、及び電子機器
JP2007200180A (ja) プロセッサシステム
US11201622B2 (en) Information processing apparatus, control method thereof, and non-transitory computer-readable storage medium
US20070186072A1 (en) Memory systems capable of reducing electromagnetic interference in data lines
JP5190472B2 (ja) 駆動回路
JP2008198003A (ja) アレイ型プロセッサ
JP2013008265A (ja) パイプライン演算装置
JP6141062B2 (ja) データ処理装置及びクロック供給方法
JPWO2011125174A1 (ja) 動的再構成プロセッサ及びその動作方法
JP2012194774A (ja) Simd型マイクロプロセッサ
US8850256B2 (en) Communication circuit and communication method
JP2013077216A (ja) プロセッサ
JP2006155637A (ja) 信号処理装置
US9798305B2 (en) Calculation device
JP2015014833A (ja) 再構築可能なlsi
JP2009044489A (ja) 転送性能最適化機能付非同期吸収回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161018

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170123

R151 Written notification of patent or utility model registration

Ref document number: 6089949

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees