JP4516495B2 - Simd型マイクロプロセッサにおけるデータ処理方法 - Google Patents

Simd型マイクロプロセッサにおけるデータ処理方法 Download PDF

Info

Publication number
JP4516495B2
JP4516495B2 JP2005214122A JP2005214122A JP4516495B2 JP 4516495 B2 JP4516495 B2 JP 4516495B2 JP 2005214122 A JP2005214122 A JP 2005214122A JP 2005214122 A JP2005214122 A JP 2005214122A JP 4516495 B2 JP4516495 B2 JP 4516495B2
Authority
JP
Japan
Prior art keywords
register
data
processing method
processor
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005214122A
Other languages
English (en)
Other versions
JP2007034473A (ja
Inventor
貴雄 片山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005214122A priority Critical patent/JP4516495B2/ja
Publication of JP2007034473A publication Critical patent/JP2007034473A/ja
Application granted granted Critical
Publication of JP4516495B2 publication Critical patent/JP4516495B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Description

本発明は、SIMD型マイクロプロセッサに関し、特に、プロセッサエレメント内で演算結果を保持するレジスタを分割して使用する構造を備えるSIMD型プロセッサエレメントに関する。
近年、デジタル複写機やファクシミリ装置等の画像処理では、画素数の増加、画像処理の多様化などにより画質の向上が図られている。これらの画像処理では複数の画像データに対して同じ処理をすることが多い。そこで高速性を高めるために、1命令で複数のデータを同時処理するSIMD(Single Instruction−stream Multiple Data−stream)型のマイクロプロセッサが用いられることが多い。
SIMD型マイクロプロセッサは、算術論理演算器(ALU)と演算レジスタを備えたプロセッサエレメントと呼ばれるブロックを持つが、複数のデータを一度に処理するためにプロセッサエレメントを複数個装備している。また、プロセッサエレメントには算術論理演算器に利用する汎用レジスタが装備されており、該算術論理演算器は、汎用レジスタのデータと演算レジスタのデータとの演算、又は、汎用レジスタのデータと命令コード中に記述された数値データとの演算等を行う。
SIMD型マイクロプロセッサは、1クロックサイクルで1命令を処理するから、1命令でプロセッサエレメントの個数分のデータを一度に処理することができる。SIMD型マイクロプロセッサの性能を表すには、動作周波数やプロセッサエレメントの個数、即ち1命令で処理できるデータの数などが重要であるが、一方で命令サイクル数も重要となる。つまり、同じ画像処理を行うのに必要な命令サイクルが少ないほうが性能がよいとされる。ただし、1命令で複雑な処理を行うとすれば、複雑な処理を行うための回路が必要となりコストが増加する。
ところで、1つのプロセッサエレメントで扱えるデータビットサイズを増やし、そのビットサイズを均等分割して一つのプロセッサエレメントで扱えるデータ数を増やしているSIMD型マイクロプロセッサもある。このタイプのSIMD型マイクロプロセッサでは、処理対象のデータのビットサイズが大きくても小さくても、扱うことができるというメリットがある。
例えば、1つのプロセッサエレメントで扱えるデータビットサイズを64ビット、プロセッサエレメントの個数を256個とした場合、1サイクルで同時に処理できるデータ数は、データサイズが64ビットの場合は256データ、データサイズが32ビットの場合は2分割できるため256×2=512データ、データサイズが16ビットに至っては4分割できるため256×4=1024データである。
上記のような分割のないSIMD型マイクロプロセッサにおいてプロセッサエレメント(PE)に順に番号(PE番号)が付されているのと同様に、上記のように一つのプロセッサエレメントで扱えるデータ数を増やしているSIMD型マイクロプロセッサにおいても、分割された個別データ単位に番号が順に付されることが、データ処理上望ましいことがある。例えば、プロセッサ設計段階におけるシミュレーションや、IC化されたときの選別におけるテストを行う場合である。
しかし、プロセッサエレメントにおける汎用レジスタの分割に合わせて、PE番号を分割された個別データ単位に対応させて設定するという構成を実現する発明は為されていない。
特許文献1の発明は、オペランドに指定したデータをレジスタ上に複数格納し、その複数データを一括して演算するとき、比較結果をフラグに残し高速に演算することを特徴とするプロセッサに関するが、レジスタにプロセッサエレメント毎で異なる値を入力する構成とはなっていない。特許文献2の発明は、プロセッサエレメントごとに固有の値とプロセッサエレメント共有の命令によって演算を行うSIMD型並列装置に関するが、分割レジスタについての記述はなく、単体レジスタについての記載のみである。特許文献3の発明は、SIMD型マイクロプロセッサにおいてプロセッサエレメント毎に固有の値を入力できるようにし、各プロセッサエレメントに演算結果により以降の演算に条件を加える、条件フラグを作成する。更に特許文献4の発明は、グローバルプロセッサから各PEに値を同時または条件をつけて設定することを目的とするものである。
特開2001−265592公報 特開2002−91929公報 特開2002−108832公報 特開2001−202351公報
本発明は、前述の汎用レジスタを複数分割し得るプロセッサエレメントを有するSIMD型マイクロプロセッサおいて、複数分割される汎用レジスタを実効的に利用するデータ設定方法と、そのようなデータ設定を実現する手段を開発し、このことにより画像データ処理を行う命令実行サイクル数を減らすようにすることを目的としている。
本発明は、上記の目的を達成するためになされたものである。本発明に係る請求項1に記載のデータ処理方法は、
算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
前記レジスタ外部のデータ設定手段によって、プロセッサエレメントの配置、及びレジスタの分割に基づいて、レジスタの分割単位にデータを設定することを特徴とするデータ処理方法である。
本発明に係る請求項2に記載のデータ処理方法は、
算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
前記レジスタ外部のデータ設定手段によって、プロセッサエレメント間では異なるが、各プロセッサエレメント内のレジスタの分割単位間では同じデータを設定することを特徴とするデータ処理方法である。
本発明に係る請求項3に記載のデータ処理方法は、
算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
レジスタの分割数をiとし、各プロセッサエレメントには異なる番号nを付すとして、
前記レジスタ外部のデータ設定手段によって、プロセッサエレメントにおけるレジスタの分割単位の、上位ビット位置にあるものから、データとして(n×i)、(n×i+1)・・・(n×i+(i−1))を設定することを特徴とするデータ処理方法である。
本発明に係る請求項4に記載のデータ処理方法は、
算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
レジスタの分割数をi、プロセッサエレメントの配置数をmaxとし、各プロセッサエレメントには異なる番号nを付すとして、
前記レジスタ外部のデータ設定手段によって、プロセッサエレメントにおけるレジスタの分割単位の、上位ビット位置にあるものから、データとして(n)、(n+max)・・・(n+max×(i−1))を設定することを特徴とするデータ処理方法である。
本発明に係る請求項5に記載のデータ処理方法は、
各プロセッサエレメントには異なる番号PEnを付すとして、
レジスタを分割しない状態で処理を行う場合には、前記レジスタ外部のデータ設定手段によって、各プロセッサエレメントに含まれるレジスタにはデータとして(n)を設定することを特徴とする請求項1に記載のデータ処理方法である。
本発明に係る請求項6に記載のデータ処理方法は、
算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得る複数のプロセッサエレメントと、前記複数のプロセッサエレメントの制御を行なうグローバルプロセッサとを有するSIMD型マイクロプロセッサにおけるデータ処理方法であって、
前記グローバルプロセッサによって、プロセッサエレメントの配置、及びレジスタの分割に基づいて、レジスタの分割単位にデータを設定することを特徴とするデータ処理方法
本発明を利用すれば、SIMD型マイクロプロセッサにおいて複数分割され得る汎用レジスタを実効的に利用でき、このことにより画像データ処理を行う命令実行サイクル数を減らすようにすることができる。
以下、図面を参照して本発明に係るSIMD型マイクロプロセッサ、及び該SIMD型マイクロプロセッサにおけるデータ処理方法を説明する。
図1は、本発明を含む一般的なSIMD型マイクロプロセッサ2の概略の構成を示すブロック図である。SIMD型マイクロプロセッサ2は、主としてプロセッサ2全体を制御するCISC型のグローバルプロセッサ(以下、GPと言う。)4と、主として外部入出力装置からデータを入力しデータ処理を行い外部入出力装置にデータを出力するプロセッサエレメント3とから構成される。プロセッサエレメント3は、複数のデータを同時に処理するために複数用意されている。図1では、1個のGP4と、(例えば)256個のプロセッサエレメント3とにより、SIMD型マイクロプロセッサ2が構成されている。
《第1の実施形態》
図2は、本発明の第1の実施形態に係るSIMD型マイクロプロセッサ2の構成を示すブロック図である。GP4は、プログラムに記述された命令に従ってSCU(シーケンシャル・コントロール・ユニット;Sequential Control Unit)36でデコードされた制御信号を各プロセッサエレメント3に送って、プロセッサエレメント3の制御を行う。GP4は、算術論理演算装置(ALU)(図示せず。)も保持している。GP4はALUの演算結果などを汎用レジスタ(Gレジスタ)34に保持する。更にGP4は汎用レジスタ(Gレジスタ)34から一度に全プロセッサエレメント3にデータを転送する経路(GAバス)30も有する。
プロセッサエレメント3は、(例えば)R0〜R31までの32本の汎用レジスタ10と、汎用レジスタ10からのデータをシフト処理若しくはデータ拡張処理するシフタ12と、算術論理演算装置(ALU)20と、算術論理演算装置20への2つの入力データを一旦保持する第1の記憶手段16及び第2の記憶手段18と、シフタ12や算術論理演算装置20の演算結果を保持する演算レジスタ(Aレジスタ)24と、演算結果により設定されるフラグデータを保持するPPレジスタ22と、算術論理演算装置20の結果をAレジスタ24に格納するか否かを制御する条件フラグを複数ビット持つTレジスタ26とから構成される。
第1の記憶手段16には、GP4のSCU36で命令コードから抜き出された即値データを転送することも可能である。第1の記憶手段16への即値データの転送はIMMとして示されている。即値は命令コードに1種類しか含まれないため、通常全プロセッサエレメントのIMMは、同じデータである。
図2に示す本発明の第1の実施形態に係るSIMD型マイクロプロセッサ2では、プロセッサエレメントの数は256とし、特に指定のないレジスタのサイズは32ビットとする。また、レジスタのサイズの32ビットに対してレジスタの分割数は2とする。32本の汎用レジスタ10は、図示していないが、外部装置(例えば、画像データの格納されたメモリ)と接続している。256個のプロセッサエレメントにおける同一番号の汎用レジスタは、水平ラインの画像データを一度に保持したりする。
更に、図2に示す本発明の第1の実施形態に係るSIMD型マイクロプロセッサ2のプロセッサエレメント3には、PE番号を保持しているブロック(PE番号保持ブロック)28を設けてある。前述のように、PE番号は、配列されるプロセッサエレメントに順に付される番号である。
例えば、256個のプロセッサエレメント3が装備され汎用レジスタ10が2分割され得る場合は、“分割される個別データ単位に付すべき番号”として0〜511(=2−1)まで必要になる。即ち、9ビットが必要となるため、“分割される個別データ単位に付すべき番号”をAレジスタ24のビット0〜8にロードする構成とする。また、同じく9ビットの“分割される個別データ単位に付すべき番号”をビット16〜24にロードする構成とする。
なお以下では、“分割される個別データ単位に付すべき番号”を、「拡張PE番号」と称することとする。
次に、本発明の第1の実施形態に係るSIMD型マイクロプロセッサ2によるデータ処理方法を説明する。まず、PE番号保持ブロック28から、PE番号がAレジスタ24にロードされる。なお、上述のように、256個のプロセッサエレメント3が装備され汎用レジスタ10が2分割され得る場合は、拡張PE番号として0〜511(=2−1)まで必要になる。
まず、PE番号をAレジスタ24のビット0〜8とビット16〜24にロードする。Aレジスタ24にロードされた後、Aレジスタ24のデータ、若しくは、命令に記述される即値データたるIMMが、第1の記憶手段16に保持され、Aレジスタ24のデータにつきシフタ12を経由させたものが、第2の記憶手段18に保持される。第1の記憶手段16のデータと第2の記憶手段18のデータがALU20にて演算され、その結果が再度Aレジスタ24に設定される。こうすることでAレジスタ24の上位16ビットと下位16ビットとにおいて、PE番号から作られるデータ(ここでは、拡張PE番号)を一度に設定することができる。上記のデータ処理方法は、ALU20を1回しか伝播しないため、クロックサイクルは1サイクルでしかない。
《第2の実施形態》
本発明の第2の実施形態に係るSIMD型マイクロプロセッサ2におけるデータ処理方法を説明する。第2の実施形態に係るデータ処理方法も、図1及び図2に構成を示すSIMD型マイクロプロセッサ2を利用して行うものである。
まず、プロセッサエレメント3毎に異なる番号n(n=0〜255)がAレジスタ24にロードされる。このとき例えば、各プロセッサエレメント3では、PE番号保持ブロック28からPE番号がAレジスタ24のビット0〜8とビット16〜24に設定される。このAレジスタ24の値がシフタ12でのシフトなしに第2の記憶手段18に保持され、一方第1の記憶手段16にはIMMから0が入力保持される。そして、第1の記憶手段16と第2の記憶手段18のデータがALU20にて論理和される、若しくは加算される。こうすることで、Aレジスタ24の上位16ビットと下位16ビットに、同じPE番号が保持される。以上の処理を全プロセッサエレメント3で同時に行うため、結果的に図3に示すパターンAのようにAレジスタ24が設定されることになる。このようなAレジスタ24のデータは、同じプロセッサエレメント3にて2分割された汎用レジスタ10に同じ処理をする場合に用いることができる。
また、図3に示すAレジスタ24のパターンAの設定は、別の手順でも実施できる。まず、各プロセッサエレメント3にて、PE番号保持ブロック28からPE番号をAレジスタ24のビット0〜8に設定する。このAレジスタ24の値をそのまま第1の記憶手段16に保持し、一方Aレジスタ24の値をシフタ12経由で16ビット左シフトして第2の記憶手段18に保持する。第1の記憶手段16と第2の記憶手段18のデータをALU20にて論理和すると、若しくは加算すると、図3に示すAレジスタ24のパターンAが実現される。
図4に示すように、原稿をスキャナで読み取り画像処理をする場合、通常、SIMD型マイクロプロセッサに一度に入力されるデータは、主走査方向に連続する256個のデータの単位である(このデータの単位は、SIMD型マイクロプロセッサで1回で演算し得る最大量であるという意味で1SIMDとも称される。)。各プロセッサエレメント3において2分割処理をする場合には、主走査方向の更なる1SIMD分のデータ、若しくは副走査方向の1SIMD分のデータを同時に処理できる。画像処理では副走査方向に隣接する同じ主走査方向位置では、同じ処理を行うことが多いため、副走査方向に隣接して同じ主走査方向位置にある上下2SIMD分のデータ処理には、パターンAのような演算レジスタ(Aレジスタ)24を用意することが有効である。
《第3の実施形態》
本発明の第3の実施形態に係るSIMD型マイクロプロセッサ2におけるデータ処理方法を説明する。第3の実施形態に係るデータ処理方法も、図1及び図2に構成を示すSIMD型マイクロプロセッサ2を利用して行うものである。
まず、各プロセッサエレメント3では、PE番号保持ブロック28からPE番号がAレジスタ24のビット0〜8とビット16〜24に設定される。このAレジスタ24の値がシフタ12で1ビット左シフトされて第2の記憶手段18に保持され、一方第1の記憶手段16にはIMMから“1”が入力保持される。第1の記憶手段16と第2の記憶手段18のデータがALU20にて加算される。こうすることで、PE番号が連続する複数のプロセッサエレメントの各々において、Aレジスタ24の上位16ビットと下位16ビットに、連続する拡張PE番号が保持されることになる。つまり、図3に示すパターンBのようなAレジスタ24が1クロックサイクルで設定されることになる。
図4に示すような画像処理において、主走査方向に連続する2SIMD分の512個のデータを処理する場合、汎用レジスタ10の分割単位に夫々に異なるデータを設定できることになり一度に512個のデータを扱えるSIMD型マイクロプロセッサとすることができる。
《第4の実施形態》
本発明の第4の実施形態に係るSIMD型マイクロプロセッサ2におけるデータ処理方法を説明する。第4の実施形態に係るデータ処理方法も、図1及び図2に構成を示すSIMD型マイクロプロセッサ2を利用して行うものである。
まず、各プロセッサエレメント3では、PE番号保持ブロック28からPE番号がAレジスタ24のビット0〜8とビット16〜24に設定される。このAレジスタ24の値がシフタ12でのシフト無しで第2の記憶手段18に保持され、一方第1の記憶手段16にはIMMから“256=100h”(“h”は16進表記であることを示す。)が入力保持される。第1の記憶手段16と第2の記憶手段18のデータがALU20にて加算される。こうすることで、PE番号が連続するプロセッサエレメントにおいて、Aレジスタ24の上位16ビットに連続する拡張PE番号が保持され、下位16ビットにその後続の連続する拡張PE番号が保持されることになる。つまり、図3に示すパターンCのようなAレジスタ24が1クロックサイクルで設定されることになる。
《第5の実施形態》
本発明の第5の実施形態に係るSIMD型マイクロプロセッサ2におけるデータ処理方法を説明する。第5の実施形態に係るデータ処理方法も、図1及び図2に構成を示すSIMD型マイクロプロセッサ2を利用して行うものである。
このデータ処理方法は、汎用レジスタ10をフルビットで使用する場合の方法である。このとき、各プロセッサエレメント3にてPE番号保持ブロック28からPE番号をAレジスタ24のビット0〜8に設定することで、分割が無い32ビット×256データのSIMD型マイクロプロセッサに対応できることとなる。このようなAレジスタ24の設定は、上位ビットをマスクする制御信号をグローバルプロセッサ4から出力することでも実現できる。また、PE番号をAレジスタ24のビット0〜8とビット16〜24に設定し、シフタ12で右に16ビットシフトして第2の記憶手段18に保持し、IMMから“0”を第1の記憶手段16に入力保持し、第1の記憶手段16と第2の記憶手段18のデータをALU20で論理和若しくは加算することでも実現できる。
《第6の実施形態》
以上の第1の実施形態から第4の実施形態に係るSIMD型マイクロプロセッサにおいては、32ビットの汎用レジスタが2分割されて使用されることを想定している。汎用レジスタが32ビット以外のデータ幅、例えば64ビットであっても、勿論、上記の第1〜第4の実施形態に係るデータ処理方法は実施できる。
64ビットの汎用レジスタ10を16ビット×4分割で使用する場合、プロセッサエレメント4の数を256個と仮定すると、拡張PE番号には0〜1023(=210−1)の10ビットが必要となる。従って、Aレジスタ24における(拡張)PE番号の設定ビットをビット0〜9、ビット16〜25、ビット32〜41、ビット48〜57の4箇所とする。なお、ALU、シフタ、その他レジスタ、及びバスは、64ビットに対応するものとなっていると仮定する。
図3に示すパターンAを実現するには、まず、PE番号をAレジスタ24のビット0〜9、ビット16〜25、ビット32〜41、ビット48〜57に設定し、それをシフタ12でのシフトなしで第2の記憶手段18に保持する。一方、第1の記憶手段16にはIMMから0を入力保持する。第1の記憶手段16と第2の記憶手段18のデータをALU20にて論理和若しくは加算すれば、4分割されたAレジスタ24の夫々に同じ拡張PE番号を保持することができる。
図3に示すパターンBを実現するには、まず、PE番号をAレジスタ24のビット0〜9、ビット16〜25、ビット32〜41、ビット48〜57に設定し、それをシフタ12で2ビット左シフトして第2の記憶手段18に保持する。一方、第1の記憶手段16にはIMMから“1_0002_0003h”(ここで、“_”は16ビット毎の区切りを示す表記である)を入力保持する。第1の記憶手段16と第2の記憶手段18のデータをALU20にて論理和若しくは加算すれば、4分割されたAレジスタにおける分割単位の各々に、パターンBのように、連続する拡張PE番号が保持されることになる。
図3に示すパターンCを実現するには、まず、PE番号をAレジスタ24のビット0〜9、ビット16〜25、ビット32〜41、ビット48〜57に設定し、それをシフタ12でのシフトなしで第2の記憶手段18に保持する。一方、第1の記憶手段16にはIMMから“100_0200_0300h”を入力保持する。第1の記憶手段16と第2の記憶手段18のデータをALU20にて加算する。こうすることで、PE番号が連続するプロセッサエレメントにおいて、Aレジスタ24のビット48〜57に連続する拡張PE番号が保持され、続いてビット32〜41にその後続の連続する拡張PE番号が保持され、続いてビット16〜25にその後続の連続する拡張PE番号が保持され、更に続いてビット0〜9に更に後続の連続する拡張PE番号が保持されることになる。
本発明を含む一般的なSIMD型マイクロプロセッサの概略の構成を示すブロック図である。 本発明の第1の実施形態に係るSIMD型マイクロプロセッサの構成を示すブロック図である。 本発明における演算レジスタの設定のパターンを複数示す図である。 原稿をスキャナで読み取り画像処理をする場合の主走査方向と副走査方向の関係を示す図である。
符号の説明
2・・・SIMD型マイクロプロセッサ、3・・・プロセッサエレメント、4・・・グローバルプロセッサ、8・・・演算アレイ、10・・・汎用レジスタ、12・・・シフタ、16・・・第1の記憶手段、18・・・第2の記憶手段、20・・・ALU、24・・・Aレジスタ(演算レジスタ)、28・・・PE番号保持ブロック。

Claims (6)

  1. 算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
    前記レジスタ外部のデータ設定手段によって、プロセッサエレメントの配置、及びレジスタの分割に基づいて、レジスタの分割単位にデータを設定することを特徴とするデータ処理方法。
  2. 算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
    前記レジスタ外部のデータ設定手段によって、プロセッサエレメント間では異なるが、各プロセッサエレメント内のレジスタの分割単位間では同じデータを設定することを特徴とするデータ処理方法。
  3. 算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
    レジスタの分割数をiとし、各プロセッサエレメントには異なる番号nを付すとして、
    前記レジスタ外部のデータ設定手段によって、プロセッサエレメントにおけるレジスタの分割単位の、上位ビット位置にあるものから、データとして(n×i)、(n×i+1)・・・(n×i+(i−1))を設定することを特徴とするデータ処理方法。
  4. 算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得るプロセッサエレメントを、複数持つSIMD型マイクロプロセッサにおけるデータ処理方法であって
    レジスタの分割数をi、プロセッサエレメントの配置数をmaxとし、各プロセッサエレメントには異なる番号nを付すとして、
    前記レジスタ外部のデータ設定手段によって、プロセッサエレメントにおけるレジスタの分割単位の、上位ビット位置にあるものから、データとして(n)、(n+max)・・・(n+max×(i−1))を設定することを特徴とするデータ処理方法。
  5. 各プロセッサエレメントには異なる番号nを付すとして、
    レジスタを分割しない状態で処理を行う場合には、前記レジスタ外部のデータ設定手段によって、各プロセッサエレメントに含まれるレジスタにはデータとして(n)を設定することを特徴とする請求項1に記載のデータ処理方法。
  6. 算術論理演算器と演算結果を保持するレジスタを含み前記レジスタが分割された状態で処理を行い得る複数のプロセッサエレメントと、前記複数のプロセッサエレメントの制御を行なうグローバルプロセッサとを有するSIMD型マイクロプロセッサにおけるデータ処理方法であって、
    前記グローバルプロセッサによって、プロセッサエレメントの配置、及びレジスタの分割に基づいて、レジスタの分割単位にデータを設定することを特徴とするデータ処理方法
JP2005214122A 2005-07-25 2005-07-25 Simd型マイクロプロセッサにおけるデータ処理方法 Expired - Fee Related JP4516495B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005214122A JP4516495B2 (ja) 2005-07-25 2005-07-25 Simd型マイクロプロセッサにおけるデータ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005214122A JP4516495B2 (ja) 2005-07-25 2005-07-25 Simd型マイクロプロセッサにおけるデータ処理方法

Publications (2)

Publication Number Publication Date
JP2007034473A JP2007034473A (ja) 2007-02-08
JP4516495B2 true JP4516495B2 (ja) 2010-08-04

Family

ID=37793696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005214122A Expired - Fee Related JP4516495B2 (ja) 2005-07-25 2005-07-25 Simd型マイクロプロセッサにおけるデータ処理方法

Country Status (1)

Country Link
JP (1) JP4516495B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4801605B2 (ja) * 2007-02-28 2011-10-26 株式会社リコー Simd型マイクロプロセッサ

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589262A (ja) * 1991-07-18 1993-04-09 Toshiba Corp プロセツサアドレス設定方式
JP2001202351A (ja) * 2000-01-19 2001-07-27 Ricoh Co Ltd Simd型プロセッサ
JP2001265592A (ja) * 2000-03-17 2001-09-28 Matsushita Electric Ind Co Ltd 情報処理装置
JP2002091929A (ja) * 2000-09-11 2002-03-29 Matsushita Electric Ind Co Ltd Simd型並列処理装置
JP2002108832A (ja) * 2000-09-28 2002-04-12 Ricoh Co Ltd Simdプロセッサにおけるデータ設定装置
JP2002171401A (ja) * 2000-11-29 2002-06-14 Canon Inc 間引き演算命令を備えたsimd型演算装置
JP2002207707A (ja) * 2001-01-11 2002-07-26 Ricoh Co Ltd 定数選択機能を有するsimd型マイクロプロセッサ
JP2003241960A (ja) * 2002-02-15 2003-08-29 Hitachi Ltd プロセッサ、該プロセッサにおける演算命令処理方法及び演算制御方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589262A (ja) * 1991-07-18 1993-04-09 Toshiba Corp プロセツサアドレス設定方式
JP2001202351A (ja) * 2000-01-19 2001-07-27 Ricoh Co Ltd Simd型プロセッサ
JP2001265592A (ja) * 2000-03-17 2001-09-28 Matsushita Electric Ind Co Ltd 情報処理装置
JP2002091929A (ja) * 2000-09-11 2002-03-29 Matsushita Electric Ind Co Ltd Simd型並列処理装置
JP2002108832A (ja) * 2000-09-28 2002-04-12 Ricoh Co Ltd Simdプロセッサにおけるデータ設定装置
JP2002171401A (ja) * 2000-11-29 2002-06-14 Canon Inc 間引き演算命令を備えたsimd型演算装置
JP2002207707A (ja) * 2001-01-11 2002-07-26 Ricoh Co Ltd 定数選択機能を有するsimd型マイクロプロセッサ
JP2003241960A (ja) * 2002-02-15 2003-08-29 Hitachi Ltd プロセッサ、該プロセッサにおける演算命令処理方法及び演算制御方法

Also Published As

Publication number Publication date
JP2007034473A (ja) 2007-02-08

Similar Documents

Publication Publication Date Title
JP2008071130A (ja) Simd型マイクロプロセッサ
JP2009015556A (ja) Simd型マイクロプロセッサ
EP3329363B1 (en) Vector arithmethic instruction
KR100812555B1 (ko) 단일-명령 다중-데이터 마이크로프로세서들에서의 벡터 순열을 위한 장치, 시스템 및 그 방법
JP4516495B2 (ja) Simd型マイクロプロセッサにおけるデータ処理方法
JP4408113B2 (ja) 信号処理方法
JP4442905B2 (ja) 画像データの処理方法
JP4451433B2 (ja) 並列プロセッサ
JP3971543B2 (ja) Simd型プロセッサ
JP4868607B2 (ja) Simd型マイクロプロセッサ
JP3837293B2 (ja) 定数選択機能を有するsimd型マイクロプロセッサ
JP4482356B2 (ja) Simdプロセッサを用いた画像処理方法及び画像処理装置
JP3895267B2 (ja) Simdプロセッサ
JP4398965B2 (ja) Simdプロセッサにおけるデータ設定装置
JP4442907B2 (ja) Simd型プロセッサ
JP3971557B2 (ja) Simdプロセッサにおけるデータ設定装置
JP3969580B2 (ja) データ処理装置、画像処理装置、画像形成装置、プログラム及び記憶媒体
JP2012059131A (ja) Simd型マイクロプロセッサ及びその処理方法
JP4708387B2 (ja) アドレスデータ生成装置及びメモリアドレッシング方法
JP2013161325A (ja) Simd型マイクロプロセッサ、プロセッサシステムおよびsimd型マイクロプロセッサのデータ処理方法
JP5369669B2 (ja) Simd型マイクロプロセッサ
JP2011134042A (ja) Simd型マイクロプロセッサおよびsimd型マイクロプロセッサのデータ整列方法
JP3742745B2 (ja) 演算処理装置
JP3970049B2 (ja) アドレスデータ生成装置及びメモリアドレッシング方法
JP4346039B2 (ja) データ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100514

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees