JP2010086256A - 並列処理型プロセッサ - Google Patents
並列処理型プロセッサ Download PDFInfo
- Publication number
- JP2010086256A JP2010086256A JP2008254228A JP2008254228A JP2010086256A JP 2010086256 A JP2010086256 A JP 2010086256A JP 2008254228 A JP2008254228 A JP 2008254228A JP 2008254228 A JP2008254228 A JP 2008254228A JP 2010086256 A JP2010086256 A JP 2010086256A
- Authority
- JP
- Japan
- Prior art keywords
- memory
- processor
- data
- granularity
- array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
Abstract
【課題】回路規模や配線資源を大幅に増加することなく、演算精度を容易に変更することのできる並列処理型プロセッサを得る。
【解決手段】プロセッサエレメント3a〜3dを、PEアレイ2−1〜2−Nにおける演算の最大粒度となる個数とする。プロセッサエレメント3a〜3dのゲート回路5は、実現する粒度に基づいて他のプロセッサエレメントの桁上がり信号を入力するか否かを切り替える。メモリ調停回路6は実現する粒度に応じてメモリ7にアクセスする領域を分割する。
【選択図】図1
【解決手段】プロセッサエレメント3a〜3dを、PEアレイ2−1〜2−Nにおける演算の最大粒度となる個数とする。プロセッサエレメント3a〜3dのゲート回路5は、実現する粒度に基づいて他のプロセッサエレメントの桁上がり信号を入力するか否かを切り替える。メモリ調停回路6は実現する粒度に応じてメモリ7にアクセスする領域を分割する。
【選択図】図1
Description
この発明は、データの並列処理を行う並列処理型プロセッサに関するものである。
四則演算や論理演算を行う演算装置(Arithmetic Logic Unit:以下、ALUという)と、ALUからの演算結果を一時記憶しておくメモリ等から構成されるプロセッサエレメント(Processor Element:以下、PEという)を複数有したSingle Instruction Multiple Data(SIMD:以下、SIMDという)装置は、単一命令で多数のデータの処理が可能である。その動作は、PE内部のALUで演算を行い、その演算結果をPEと対となるメモリに格納しながら所望の演算を行っている。
このSIMD方式のプロセッサは、演算命令(プログラム)等を自在に書き換えることが可能であるため、同一処理を特定用途向け集積回路で達成するよりも柔軟なデータ処理を行えることが利点に挙げられる。
このSIMD方式のプロセッサは、演算命令(プログラム)等を自在に書き換えることが可能であるため、同一処理を特定用途向け集積回路で達成するよりも柔軟なデータ処理を行えることが利点に挙げられる。
このようなプロセッサが使われる一例は、一度に大量のデータを同時に処理が可能であることから、画像処理(デジタルスチルカメラ、複写装置、音声処理など)に適している。これらは機能の高性能化が進んでおり、これに伴って画像データの処理の複雑化が進んでいる。他方、処理の複雑化に反して、演算の速度を向上させなければ、処理プロセッサとして成立しないという相反した性能が求められている。
従来の処理プロセッサは、メモリとして複数系統の入出力ポートを有するマルチポートメモリを用いていた(例えば、特許文献1参照)。
従来の技術では、マルチポートメモリといった特殊なメモリを使用しているため、高コストとなる問題点があった。また、マルチポートメモリは入出力配線が多くなることから、LSIにて実現しようとした場合は配線が多くなり回路規模が増大するという問題点もあった。
この発明は上記のような課題を解決するためになされたもので、回路規模や配線資源を大幅に増加することなく、演算精度を容易に変更することが可能な並列処理型プロセッサを得ることを目的とする。
この発明に係る並列処理型プロセッサは、複数のプロセッサエレメントと、メモリと、メモリ調停回路とを有するPEアレイを備えた並列処理型プロセッサであって、プロセッサエレメントは、PEアレイにおける演算の最大粒度となる個数が設けられると共に、少なくとも、他のプロセッサエレメントからのデータを受けないプロセッサエレメント以外は、他のプロセッサエレメントからの演算データを受けるためのゲート回路を有し、ゲート回路は、実現する粒度に基づいて、他のプロセッサエレメントの桁上がり信号を入力するか否かを切り替えると共に、メモリ調停回路は、実現する粒度に応じてメモリにアクセスする領域を分割するようにしたものである。
この発明の並列処理型プロセッサは、プロセッサエレメントをPEアレイにおける演算の最大粒度となる個数とし、プロセッサエレメントのゲート回路は、実現する粒度に基づいて他のプロセッサエレメントの桁上がり信号を入力するか否かを切り替え、かつ、メモリ調停回路は実現する粒度に応じてメモリアクセス領域を分割するようにしたので、回路規模や配線資源を大幅に増加することなく、演算精度を容易に変更することができる。
実施の形態1.
図1は、この発明の実施の形態1による並列処理型プロセッサを用いたSIMD処理装置を示す構成図である。
図1に示すSIMD処理装置は、640個のPEを設け、一つのPEアレイ内にALUを装備したPEを四つ保有したSIMD処理装置の一例である。このSIMD処理装置は、制御部1と、PEアレイ2−1〜2−Nを備えている。
図1は、この発明の実施の形態1による並列処理型プロセッサを用いたSIMD処理装置を示す構成図である。
図1に示すSIMD処理装置は、640個のPEを設け、一つのPEアレイ内にALUを装備したPEを四つ保有したSIMD処理装置の一例である。このSIMD処理装置は、制御部1と、PEアレイ2−1〜2−Nを備えている。
制御部1は、処理プログラムを収納する図示しないRAMやROMや、プログラムカウンタなどを備え、その処理プログラムから各PEの演算処理内容およびその動作などを命令102として出力し、SIMD処理装置全体を制御する。また、制御部1は、後述するメモリ調停回路6を介してメモリ7のアドレスも出力する。
それぞれのPEアレイ2−1〜2−Nは、PE3a〜3dと、メモリ調停回路6と、メモリ7とを備えている。PE3a〜3dは、入力101と制御部1からの命令102に基づいて演算処理を行う機能部であり、三つのPE3a〜3cは、ALU4とゲート回路(ゲート)5を有し、PE3dはALU4のみ有している。ALU4は、加算等の数値演算や倫理和等の論理演算を実行する演算装置である。また、ゲート回路5は、下部PE(PE3aの場合はPE3b、PE3cの場合はPE3d)からの演算結果の桁上がりを示すキャリー信号をゲートする回路である。尚、PE3dがゲート回路5を有しないのは、下位のキャリー信号が存在しないためであるが、ゲート回路5を有していてもよい。即ち、四つのPE3a〜3dを全てゲート回路5を備えた同一構成としてもよい。
メモリ調停回路6は、各PE3a〜3dと接続され、各PE3a〜3dとメモリ7とのアクセス時にバスの調停を行う回路である。メモリ7はPE3a〜3dの演算における一時保持用のメモリである。このメモリ7は、一般的な1ポートメモリと呼ばれる入力と出力がそれぞれ1系統、およびアドレスも1系統のものを用いる。
ここでPEアレイ2−1〜2−Nは、演算の粒度(演算精度)を変更する場合の最大粒度となる構成でPE3a〜3dを構成している。例えば、所望の最大粒度を16ビットとした場合、各ALU4の粒度を4ビットとし、このためPEアレイ内には4つのALUを装備している。従って、全PE数を640とした場合は、PEアレイ数は160となり、PEアレイ2−NはPEアレイ2−160となる。本実施の形態において、演算粒度の変更は、4ビット、8ビット、16ビットに変更可能な構成となる。また、メモリ7の構成は4ビット×Mワードの構成とし、MワードはPEが処理に必要な収納量であればよい。
各PEアレイ2−1〜2−N内のPE3a〜3dは、メモリ調停回路6を介して、一つのメモリ7を用いるように構成されている。従って、PEアレイ2−1内のPE3a〜3dはそのPEアレイ2−1のメモリ7を用いて演算処理し、同様にPEアレイ2−2内のPE3a〜3dもPEアレイ2―2のメモリ7を使用する。
処理すべきデータは入力101として図示しない公知の手段(例えばCPU等のデータバス)により各PEアレイ2−1〜2−Nに与えられる。制御部1からは命令102が各PEアレイ2−1〜2−Nに出力され、ALU4及びメモリ調停回路6、メモリ7を用いて所望の演算処理がなされた後、出力300として得られる。
次に、実施の形態1の動作について説明する。
図2は、一つのPEアレイ内を示したもので、PEアレイ内の粒度が4ビットとして動作する場合の構成例である。
PEアレイ内では4ビット×4個のPE3a〜3dがそれぞれ異なる入力データに対して処理を行う。各PE3a〜3dには入力として16ビットのバスが接続されており、それぞれ4ビットを各PE3a〜3dに入力する。但し、この16ビットのデータは各4ビットのデータが独立しており、バス幅だけ16ビットであるとする。
図2は、一つのPEアレイ内を示したもので、PEアレイ内の粒度が4ビットとして動作する場合の構成例である。
PEアレイ内では4ビット×4個のPE3a〜3dがそれぞれ異なる入力データに対して処理を行う。各PE3a〜3dには入力として16ビットのバスが接続されており、それぞれ4ビットを各PE3a〜3dに入力する。但し、この16ビットのデータは各4ビットのデータが独立しており、バス幅だけ16ビットであるとする。
制御部1からは、各PE3a〜3dに対しPE3a〜3d内のゲート回路5に下部PEからのキャリー信号をマスクするように命令が出力される。このことにより下部PEからのキャリー信号は上位のPEに対してその演算結果に影響を与えないこととなる。また、メモリ調停回路6には4ビットの粒度モードである情報を制御部1から命令102として出力する。
次に、制御部1は、各PE3a〜3dに命令102、例えば加算命令を出力する。この際、メモリ調停回路6に対しPE3a〜3dがその演算データをメモリ7に収納するアドレス103を出力する。初期状態ではアドレスは0としておく。
次に、制御部1は、各PE3a〜3dに命令102、例えば加算命令を出力する。この際、メモリ調停回路6に対しPE3a〜3dがその演算データをメモリ7に収納するアドレス103を出力する。初期状態ではアドレスは0としておく。
次いで、各PE3a〜3dは4ビットの加算を実行する。その結果はそれぞれメモリ調停回路6に入力される。メモリ調停回路6では制御部1からの4ビット粒度モードの命令に従い次のような動作を実施する。先ず、制御部1からのアドレス103を各PE3a〜3dがアクセスする領域に変換する。このモードにおいては、メモリ7のアドレス領域がMワードのため、各PE3a〜3dがアクセスする領域(データの保存アドレス)を少なくとも4分割(M/4ワード)の領域に分割する。初期状態で制御部1からは0が与えられるため、PE3dがアクセスする領域7dは、0アドレス以上M/4×1アドレス未満、PE3cがアクセスする領域7cは、M/4×1以上M/4×2アドレス未満、PE3bがアクセスする領域7bは、M/4×2以上M/4×3未満、PE3aがアクセスする領域7aは、M/4×3以上(M−1)/4×4以下、となるようにメモリ7へのアドレス103aとして変換する。
次に、メモリ調停回路6は、PE3a〜3dからの演算データを受信し、時分割で上記アドレス変換と同期してデータの調停を行う。PE3dからの処理データは、時刻t1においてメモリ調停回路6から変換されたアドレス103aと共に演算データ201としてメモリ7に与えられ、PE3dがアクセスする領域7dに収納される。PE3cからの処理データは時刻t2において、アドレス103aと共に演算データ201としてメモリ7に与えられ、PE3cがアクセスする領域7cに収納される。同様に、PE3bとPE3aのデータは、時刻t3とt4において、それぞれメモリ7のPE3bがアクセスする領域7bおよびPE3aがアクセスする領域7aに収納される。
このようにして、各々のPE3a〜3dによって演算処理されたデータが独立に一つのメモリ7上に収納でき、4ビット粒度の演算を4個のPEで処理することが可能となる。
このようにして、各々のPE3a〜3dによって演算処理されたデータが独立に一つのメモリ7上に収納でき、4ビット粒度の演算を4個のPEで処理することが可能となる。
尚、メモリ7上に収納されたデータを再利用する場合は、データ経路として上記の動作とは逆となるメモリ7〜メモリ調停回路6〜PE3a〜3dとなる。この場合も制御部1からの指定されたアドレス103をメモリ調停回路6によって変換し、メモリ7のアドレス上のデータ202を読み出してメモリ調停回路6で時分割によりPE3a〜3dに出力し、PE3a〜3dはそのデータ202について処理を行う。
所望の演算処理を終えた場合は、各PE3a〜3dからPEアレイ2−1〜2−N外に出力300として送出され、図示しないSDRAM等の外部メモリやデータバスに出力される。
所望の演算処理を終えた場合は、各PE3a〜3dからPEアレイ2−1〜2−N外に出力300として送出され、図示しないSDRAM等の外部メモリやデータバスに出力される。
図3は、PEアレイ内の粒度が8ビットとして動作する場合の構成例である。尚、図3においては、図2で示す入力信号線の図示は省略している。
この例では、PE3dとPE3c、PE3bとPE3aでそれぞれ8ビットの粒度を構成する。従って、PEアレイ内のPE数は2となる。前述した4ビット粒度構成による動作と異なる点は、メモリ7のアドレス分割領域が少なくとも2分割され、PE3cとPE3dのアクセス領域7fとPE3bとPE3aのアクセス領域7eにメモリ調停回路6によって調停がなされる。
この例では、PE3dとPE3c、PE3bとPE3aでそれぞれ8ビットの粒度を構成する。従って、PEアレイ内のPE数は2となる。前述した4ビット粒度構成による動作と異なる点は、メモリ7のアドレス分割領域が少なくとも2分割され、PE3cとPE3dのアクセス領域7fとPE3bとPE3aのアクセス領域7eにメモリ調停回路6によって調停がなされる。
また、各PE3a〜3d内のゲート回路5は、PE3bのゲート回路5のみをマスクするように制御部1によって制御される。PE3cとPE3aのゲート回路5はそれぞれPE3dとPE3bのキャリー信号を通過させるようにゲート回路5をオフにする。このことによってキャリー信号が下位PEから上位PEに伝達され、粒度が4ビットの2倍、即ち8ビットとなる。メモリ調停回路6によるPE3a〜3dからの演算データ201と制御部1からのアドレス103の関係は次の通りである。メモリ7のデータ幅が4ビットであるため、先ず、時刻t1ではPE3cとPE3dのアドレスとPE3dのデータがメモリ7に出力されて収納される。次に、時刻t2では、PE3cとPE3dのアドレスとPE3cのデータが収納される。このことにより8ビットのデータを分割して収納する。同様に、時刻t3ではPE3bとPE3aのアドレス及びPE3bのデータが収納され、時刻t4ではPE3bとPE3aのアドレス及びPE3aのデータが調停されてメモリ7へ収納される。このようにして、PEアレイ内の粒度を8ビット、PE数を2とする演算動作が可能となる。
図4は、PEアレイ2−1〜2−N内の粒度が16ビットとして動作する場合を示したものである。
この例では、PE3a〜PE3cのゲート回路5をオフにし、下位PEのキャリー信号を全て通過させるようにしておく。メモリ7はアドレス分割領域が1となる。即ち、PE3a〜3dのアクセス領域7gの一つとなる。上述した構成例と同様に、時刻t1ではPE3d〜PE3aのアドレスとPE3dのデータ、時刻t2ではPE3cのデータ、時刻t3ではPE3b、時刻t4ではPE3aのデータがメモリ7に収納されて所定の演算を行うことができる。
この例では、PE3a〜PE3cのゲート回路5をオフにし、下位PEのキャリー信号を全て通過させるようにしておく。メモリ7はアドレス分割領域が1となる。即ち、PE3a〜3dのアクセス領域7gの一つとなる。上述した構成例と同様に、時刻t1ではPE3d〜PE3aのアドレスとPE3dのデータ、時刻t2ではPE3cのデータ、時刻t3ではPE3b、時刻t4ではPE3aのデータがメモリ7に収納されて所定の演算を行うことができる。
以上のように、PEアレイ2−1〜2−Nを最大粒度となるPE3a〜3dで構成し、PEアレイ2−1〜2−N内で一つのメモリ7を共有して、メモリ調停回路6により粒度を変更可能な構成としたため、特殊なメモリを使用しなくとも回路規模を増やすことなく、演算精度の変更を行うことが可能なSIMD処理装置を得ることができる。また、粒度変更に伴うメモリの確保量もそれに応じて変更することができ、簡易な演算から複雑な演算までを効率よく実行できる。
尚、実施の形態1では、ALU4の基本粒度を4ビットとしたがこの限りではなく所望の粒度となる構成でよい。また、PEアレイ2−1〜2−N内に四つのPE3a〜3dを有した構成としたが、PEアレイ2−1〜2−N内のPE数についてもこの限りではない。但し、PE数は2のべき乗数(2,4,8,16…)である場合がより簡易に構成することができる。
以上説明したように、実施の形態1の並列処理型プロセッサによれば、それぞれが演算装置を有する複数のプロセッサエレメントと、複数のプロセッサエレメントからのデータを一時保持するメモリと、複数のプロセッサエレメントとメモリ間のデータを調停するメモリ調停回路とを有するPEアレイを備えた並列処理型プロセッサであって、プロセッサエレメントは、PEアレイにおける演算の最大粒度となる個数が設けられると共に、少なくとも、他のプロセッサエレメントからのデータを受けないプロセッサエレメント以外は、他のプロセッサエレメントからの演算データを受けるためのゲート回路を有し、ゲート回路は、実現する粒度に基づいて、他のプロセッサエレメントの桁上がり信号を入力するか否かを切り替えると共に、メモリ調停回路は、実現する粒度に応じてメモリにアクセスする領域を分割するようにしたので、回路規模や配線資源を大幅に増加することなく、演算精度を容易に変更することができる。
また、実施の形態1の並列処理型プロセッサによれば、プロセッサエレメントの個数は2のべき乗数で構成するようにしたので、並列処理型プロセッサを簡易に構成することができる。
実施の形態2.
実施の形態2の並列処理型プロセッサは、複数のPEアレイを接続するようにしたものである。
図5は、実施の形態2における並列処理型プロセッサの構成図である。
実施の形態2では、複数のPEアレイ10a,10bを有し、PEアレイ10bの演算データ201がPEアレイ10aに与えられるようになっている。各々のPEアレイ10a,10bは、PE3a〜3d、メモリ調停回路6a(または6b)、メモリ7を備えている。ここで、PE3a〜3d、メモリ7および制御部1は、実施の形態1の構成と同様であるため、その説明は省略する。また、メモリ調停回路6aはPEアレイ10a内の回路、メモリ調停回路6bはPEアレイ10b内の回路であり、メモリ調停回路6bから出力される演算データ201がメモリ調停回路6aに入力されるよう構成されている。この演算データ201は、PEアレイ10b内のメモリ調停回路6bによって時間的な調停がなされた後のデータである。この構成により、PEアレイ10aとPEアレイ10bは最大粒度32ビット(4ビット×8PE)として動作することが可能となる。
実施の形態2の並列処理型プロセッサは、複数のPEアレイを接続するようにしたものである。
図5は、実施の形態2における並列処理型プロセッサの構成図である。
実施の形態2では、複数のPEアレイ10a,10bを有し、PEアレイ10bの演算データ201がPEアレイ10aに与えられるようになっている。各々のPEアレイ10a,10bは、PE3a〜3d、メモリ調停回路6a(または6b)、メモリ7を備えている。ここで、PE3a〜3d、メモリ7および制御部1は、実施の形態1の構成と同様であるため、その説明は省略する。また、メモリ調停回路6aはPEアレイ10a内の回路、メモリ調停回路6bはPEアレイ10b内の回路であり、メモリ調停回路6bから出力される演算データ201がメモリ調停回路6aに入力されるよう構成されている。この演算データ201は、PEアレイ10b内のメモリ調停回路6bによって時間的な調停がなされた後のデータである。この構成により、PEアレイ10aとPEアレイ10bは最大粒度32ビット(4ビット×8PE)として動作することが可能となる。
次に、実施の形態2の動作について説明する。
制御部1からメモリ調停回路6a及び6bに対し32ビット動作である命令が出力されると、メモリ調停回路6aはメモリ調停回路6bの演算データ201を受け付ける。実施の形態1と同様に入力データに対し制御部1からの命令に従ってPEアレイ10aおよびPEアレイ10b内のPE3a〜3dは演算を行う。
制御部1からメモリ調停回路6a及び6bに対し32ビット動作である命令が出力されると、メモリ調停回路6aはメモリ調停回路6bの演算データ201を受け付ける。実施の形態1と同様に入力データに対し制御部1からの命令に従ってPEアレイ10aおよびPEアレイ10b内のPE3a〜3dは演算を行う。
PEアレイ10b内の各PE3a〜3dにより計16ビットの演算が行われる。この演算結果は桁上がり等の情報を含んだ32ビットの下位データとなる。メモリ調停回路6bによってPEアレイ10bのメモリ7に収納される。他方、演算データ201は、PEアレイ10aのメモリ調停回路6aに出力される。メモリ調停回路6aは、この16ビットのデータを受信後、PEアレイ10a内の各PE3a〜3dに出力する。PE3a〜3dは、前記のデータと入力データの上位16ビットを演算し、再びメモリ調停回路6aに出力する。メモリ調停回路6aはこの各PEからデータを調停してメモリ7へ収納する。このようにして粒度32ビットとなる演算が達成可能である。
尚、粒度32ビット未満である粒度16ビット、8ビット、4ビットの場合は、実施の形態1で示した動作と同様である。
尚、粒度32ビット未満である粒度16ビット、8ビット、4ビットの場合は、実施の形態1で示した動作と同様である。
以上のように、PEアレイ10a,10b間をメモリ調停回路6a,6bを介して演算処理を行うように構成したため、更に粒度の拡張を行うことができる。例えば、実施の形態1に比して粒度は2倍となり、メモリ空間もそれに応じた領域を使用することができる。
尚、上記の実施の形態2ではPEアレイ10a,10bの接続を2としたが、この値に限定されるものではなく、メモリ調停回路の接続を増やすことで更に粒度の拡張が可能である。
以上のように、実施の形態2の並列処理型プロセッサによれば、複数のPEアレイを備え、少なくともいずれか一つのメモリ調停回路は他のメモリ調停回路に対して演算データを出力し、演算データを受信したPEアレイは、演算データに対して演算を行うようにしたので、更に粒度の拡張を行うことができる。
1 制御部、2−1〜2−N PEアレイ、3a〜3d プロセッサエレメント(PE)、4 ALU(演算装置)、5 ゲート回路(ゲート)、6,6a,6b メモリ調停回路、7 メモリ、101 入力、102 命令、103,103a アドレス、201 演算データ、202 メモリデータ、300 出力。
Claims (3)
- それぞれが演算装置を有する複数のプロセッサエレメントと、
前記複数のプロセッサエレメントからのデータを一時保持するメモリと、
前記複数のプロセッサエレメントと前記メモリ間のデータを調停するメモリ調停回路とを有するPEアレイを備えた並列処理型プロセッサであって、
前記プロセッサエレメントは、前記PEアレイにおける演算の最大粒度となる個数が設けられると共に、少なくとも、他のプロセッサエレメントからのデータを受けないプロセッサエレメント以外は、他のプロセッサエレメントからの演算データを受けるためのゲート回路を有し、
前記ゲート回路は、実現する粒度に基づいて、他のプロセッサエレメントの桁上がり信号を入力するか否かを切り替えると共に、前記メモリ調停回路は、実現する粒度に応じて前記メモリにアクセスする領域を分割することを特徴とする並列処理型プロセッサ。 - プロセッサエレメントの個数は2のべき乗数で構成されたことを特徴とする請求項1記載の並列処理型プロセッサ。
- 複数のPEアレイを備え、少なくともいずれか一つのメモリ調停回路は他のメモリ調停回路に対して演算データを出力し、当該演算データを受信したPEアレイは、前記演算データに対して演算を行うことを特徴とする請求項1または請求項2記載の並列処理型プロセッサ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008254228A JP2010086256A (ja) | 2008-09-30 | 2008-09-30 | 並列処理型プロセッサ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008254228A JP2010086256A (ja) | 2008-09-30 | 2008-09-30 | 並列処理型プロセッサ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010086256A true JP2010086256A (ja) | 2010-04-15 |
Family
ID=42250160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008254228A Pending JP2010086256A (ja) | 2008-09-30 | 2008-09-30 | 並列処理型プロセッサ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010086256A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01310434A (ja) * | 1988-02-25 | 1989-12-14 | Texas Instr Inc <Ti> | 多段並列2進加減算器 |
JPH07287567A (ja) * | 1993-11-30 | 1995-10-31 | Texas Instr Inc <Ti> | 複数の独立区分と各区分からの結果を記憶するレジスタとを有する算術論理装置 |
JPH10254839A (ja) * | 1997-03-11 | 1998-09-25 | Sony Corp | Simd制御並列プロセッサおよび演算方法 |
JP2004362086A (ja) * | 2003-06-03 | 2004-12-24 | Matsushita Electric Ind Co Ltd | 情報処理装置および機械語プログラム変換装置 |
-
2008
- 2008-09-30 JP JP2008254228A patent/JP2010086256A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01310434A (ja) * | 1988-02-25 | 1989-12-14 | Texas Instr Inc <Ti> | 多段並列2進加減算器 |
JPH07287567A (ja) * | 1993-11-30 | 1995-10-31 | Texas Instr Inc <Ti> | 複数の独立区分と各区分からの結果を記憶するレジスタとを有する算術論理装置 |
JPH10254839A (ja) * | 1997-03-11 | 1998-09-25 | Sony Corp | Simd制御並列プロセッサおよび演算方法 |
JP2004362086A (ja) * | 2003-06-03 | 2004-12-24 | Matsushita Electric Ind Co Ltd | 情報処理装置および機械語プログラム変換装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11386644B2 (en) | Image preprocessing for generalized image processing | |
WO1995009399A1 (fr) | Multiprocesseur | |
US4745546A (en) | Column shorted and full array shorted functional plane for use in a modular array processor and method for using same | |
US20220283985A1 (en) | Data processing engine tile architecture for an integrated circuit | |
US20040111590A1 (en) | Self-configuring processing element | |
JP4838009B2 (ja) | リコンフィグラブル回路 | |
JP4451733B2 (ja) | 半導体装置 | |
JP2008217061A (ja) | Simd型マイクロプロセッサ | |
JP2006302132A (ja) | 信号処理装置及び再構成可能論理回路装置及び再構成可能順序回路 | |
US20220014202A1 (en) | Three-Dimensional Stacked Programmable Logic Fabric and Processor Design Architecture | |
US7814296B2 (en) | Arithmetic units responsive to common control signal to generate signals to selectors for selecting instructions from among respective program memories for SIMD / MIMD processing control | |
JP2010086256A (ja) | 並列処理型プロセッサ | |
US20110271078A1 (en) | Processor structure of integrated circuit | |
US10579559B1 (en) | Stall logic for a data processing engine in an integrated circuit | |
US11061673B1 (en) | Data selection network for a data processing engine in an integrated circuit | |
US10747531B1 (en) | Core for a data processing engine in an integrated circuit | |
JP2006018411A (ja) | プロセッサ | |
JP2005346513A (ja) | 半導体装置 | |
US8764874B2 (en) | Arrangement, method, integrated circuit and device for routing requests | |
US9081901B2 (en) | Means of control for reconfigurable computers | |
JP2005100448A (ja) | データ処理システム、アレイ型プロセッサ、データ処理装置、コンピュータプログラム、情報記憶媒体 | |
JP2010049510A (ja) | バス調停方式およびマルチcpu構成のプログラマブルコントローラ | |
JP4437439B2 (ja) | データ処理装置 | |
Baklouti et al. | Study and integration of a parametric neighbouring interconnection network in a massively parallel architecture on FPGA | |
JPH0784963A (ja) | Cpuを有する半導体集積回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110125 |
|
A977 | Report on retrieval |
Effective date: 20111228 Free format text: JAPANESE INTERMEDIATE CODE: A971007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120207 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120710 |