JP2002108833A - 並列プロセッサ及びそれを用いた画像処理装置 - Google Patents

並列プロセッサ及びそれを用いた画像処理装置

Info

Publication number
JP2002108833A
JP2002108833A JP2000302018A JP2000302018A JP2002108833A JP 2002108833 A JP2002108833 A JP 2002108833A JP 2000302018 A JP2000302018 A JP 2000302018A JP 2000302018 A JP2000302018 A JP 2000302018A JP 2002108833 A JP2002108833 A JP 2002108833A
Authority
JP
Japan
Prior art keywords
data
register
processor
conversion
storing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000302018A
Other languages
English (en)
Other versions
JP3971559B2 (ja
Inventor
Kazuhiko Hara
和彦 原
Shinichi Yamaura
慎一 山浦
Masanobu Fukushima
正展 福島
Keiji Nakamura
圭治 中村
Takao Katayama
貴雄 片山
Kazuhiko Iwanaga
和彦 岩永
Kosuke Takato
浩資 高藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000302018A priority Critical patent/JP3971559B2/ja
Publication of JP2002108833A publication Critical patent/JP2002108833A/ja
Application granted granted Critical
Publication of JP3971559B2 publication Critical patent/JP3971559B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 この発明は、非線形処理を効率よく実現する
ことができる並列プロセッサを提供することを課題とす
る。 【解決手段】プログラムを解読しプロセッサ全体を制御
するグローバルプロセッサ2と、複数のデータを処理す
るためにプロセッサエレメントを複数個備えたプロセッ
サエレメントブロック3と、を有するSIMD型プロセ
ッサにおいて、各プロセッサエレメント100は、変換
前データを記憶するレジスタ102と、変換後データを
記憶するレジスタ101と、加算器105の加算結果を
記憶するレジスタ103と、変換前データを記憶するレ
ジスタ102の内容を比較する比較器104と、を備
え、前記比較器104により両レジスタの内容が一致す
ると、データバス41から送られてくる変換後データを
レジスタ101に格納させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、例えば、デジタル複
写機やファクリミリ装置等の画像データのデジタル処理
等に用いられる並列プロセッサに関するものであり、特
に画像データの非線形変換処理に用いられるSIMD
(Single Instruction Strea
m Multiple Data Stream)型マ
イクロプロセッサ及びそれを用いた画像処理装置に関す
るものである。
【0002】
【従来の技術】近年、デジタル複写機やファクリミリ装
置等の画像処理装置において、画素数を増加したり、或
いはカラー対応にするなど画像の向上が図られている。
そして、この画像の向上に伴い、処理すべきデータ数が
増加している。ところで、複写機等の画像処理装置にお
けるデータ処理は全ての画素に対して同じ演算処理を施
すことが多い。そこで、1つの命令で複数のデータに対
して同時に同じ演算処理を行うSIMD方式のプロセッ
サが用いられるようになっている。
【0003】上記したように、SIMD型マイクロプロ
セッサでは1つの命令で複数のデータに対して同時に同
じ演算処理が実行可能である。ここで、通常の演算処理
は複数の演算器を並べ同じ演算を同時に複数のデータに
対して実行することで実現できる。しかし、画像処理に
おいては、演算処理が式で表すことができない非線形な
処理を行うことが多い。演算処理が式で表すことができ
ない非線形な処理は演算対象のデータによって演算式が
変更となるため同じ処理を同時に実行できない。したが
って、データ毎の逐次処理となりSIMD方式の効果が
無くなってしまう。
【0004】通常のSISD(Single Inst
ruction Stream Single Dat
a Stream)方式のプロセッサにおいても演算デ
ータにより演算式が変更となる非線形処理はプログラム
が非常に複雑になるため、演算前データに対して演算後
の処理済みデータを全て準備しておきテーブル化し、演
算データを元にテーブル変換を行い演算後データを得る
方式が一般的である。具体的にはRAM上にテーブルを
持ち演算前データにテーブルの先頭の番地を加算した値
をアドレスポインタとしてRAMから得られたデータを
演算後のデータとしている。
【0005】演算データが8ビットの場合には256バ
イトの変換テーブルが必要となるが演算ビット幅の増加
とともにテーブルのサイズは2のベキ乗で増加するため
演算ビット幅が大きい場合は演算データを任意の区間に
分けてその区間での近似式をテーブルとして持つ場合も
ある。
【0006】
【発明が解決しようとする課題】さて、このテーブル変
換をSIMD型マイクロプロセッサで採用する場合には
それぞれの演算単位でテーブルが必要となる。例えば、
256個のプロセッサエレメント(PE)を有するSI
MD型プロセッサで8ビットのテーブル変換を行う場合
には256バイトのテーブルRAMがそれぞれの演算単
位つまり256個必要となりコスト面が増大する問題が
あった。そのため、SIMD型マイクロプロセッサのテ
ーブル変換に対して数々の方式が考案されている。
【0007】特開平5−67203号公報においては、
各SIMD単位のプロセッサエレメント内蔵の出力レジ
スタから演算前データを順次外部に出力し、外部で逐次
にテーブル変換を行い、変換後のデータをプロセッサエ
レメント内蔵の入力レジスタに順次入力する方式が提案
されている。この方式では、変換テーブルが1個となる
ためコストの上昇は抑えられるが、逐次処理であるため
演算処理時間は最低でもプロセッサエレメント数だけか
かってしまい演算速度面で不利であった。また、この変
換処理をプロセッサエレメントでの通常処理と並行に実
行すれば演算処理時間はトータルとして削減できるが、
入力・出力のレジスタがこの変換作業専用に使用され他
の用途に使用できない、変換処理後のデータが必要な場
合には演算処理時間だけ待つこととなり並行処理が不可
能であるといった問題があった。
【0008】また、特開平9−305550号公報にお
いては、各プロセッサエレメント(PE)毎に非線形変
換テーブルの元データと変換対象データとの比較を行う
比較器を設け、この比較器で両データを比較し、一致し
たプロセッサエレメントには変換後のデータを格納し、
この値を演算後データとする方式が提案されている。こ
の場合には演算処理時間は演算前データの取りうる値の
組み合わせ(変換テーブルのワード数)となるため、プ
ロセッサエレメント数よりこのワード数が少ない場合に
は高速化される。8ビットデータの場合ではプロセッサ
エレメント数によらず256回程度のサイクル数とな
る。この場合においても演算処理時間が長い問題があ
る。また、他の処理と並行に行った場合には、上記した
特開平5−67203号公報と同じ問題を持っている。
【0009】さらに、特許第2812292号において
は、プロセッサエレメント数と同数の出力ポートを持つ
変換テーブル用のRAMに対して、それぞれのプロセッ
サエレメントから演算前データをアドレスポインタとし
て与えることで演算後データを得る方法が提案されてい
る。この方式においては、変換速度は1サイクル程度で
終了するが、出力ポートの増加はRAMのコストを押し
上げることとなり、特に数10個を超えるポートを持つ
ことは実現不可能である。したがって、プロセッサエレ
メント数が多いSIMD型プロセッサに対応できないと
いう問題があった。
【0010】上記したように、従来技術においては、S
IMD型マイクロプロセッサのテーブル変換に代表され
る非線型処理はSIMD型の最大の特徴である並列処理
が困難であるため数々の方式が考案されているが、それ
らは、入出力レジスタを介した方法、専用のコンパレー
タを使用したもの、専用テーブル用メモリを使用したも
のであり、速度・コストのいずれかの面で問題があっ
た。
【0011】すなわち、特開平5−67203号公報
は、出力レジスタからデータを出力し外部テーブルメモ
リのアドレスとして入力、メモリから出力されたデータ
を変換後のデータとして入力シフトレジスタから入力す
る。全データの変換にはプロセッサエレメント数以上の
サイクルが必要であり処理時間が長い問題がある。ま
た、テーブルメモリは専用のものとなり、さらに入力シ
フトレジスタ、入力シフトレジスタはテーブル変換専用
に使用されることとなる。
【0012】また、特開平9−305550号公報は、
各プロセッサエレメントに変換前データの比較器を設
け、外部から変換前データと変換後データを入力し変換
前データと一致したプロセッサエレメントだけに変換後
のデータを格納する。変換前データのデータ数だけのサ
イクル数が必要であり、さらに専用の比較器が必要であ
る。
【0013】さらに、特許第2812292号では、テ
ーブルメモリの出力ポート数をプロセッサエレメント数
だけ用意してテーブル変換を行う。変換速度は最も速い
がメモリのポート数が非常に多いためコストが高くな
る。プロセッサエレメント数が数10個までしか実現で
きないと思われる。
【0014】この発明は、上述した従来の問題点を解決
するためになされたものにして、非線形処理を効率よく
実現することができる並列プロセッサを提供することを
課題とする。
【0015】
【課題を解決するための手段】この発明にかかる請求項
1に記載の並列プロセッサは、プログラムを解読しプロ
セッサ全体を制御するグローバルプロセッサと、データ
を処理するプロセッサエレメントを複数個備えて構成さ
れるプロセッサエレメントブロックと、を有する並列プ
ロセッサにおいて、各プロセッサエレメントは、変換前
データを記憶するレジスタと、データバスから送られて
くる変換後データを記憶するレジスタと、データバスか
ら送られてくるデータが記憶されている変換前データに
相当する変換後データか判別する手段と、を備え、前記
判別手段の結果に基づき前記変換後データをレジスタに
記憶させることを特徴とする。
【0016】この発明にかかる請求項2に記載の並列プ
ロセッサは、請求項1に加え、前記判別手段は、加算器
と、加算器の加算結果を記憶するレジスタと、加算結果
を記憶するレジスタの内容と変換前データを記憶するレ
ジスタの内容を比較する比較器と、を備え、前記比較器
により両レジスタの内容が一致すると、データバスから
送られてくる変換後データをレジスタに格納させること
を特徴とするものである。
【0017】この発明にかかる請求項3に記載の並列プ
ロセッサは、上記の構成に加え、各プロセッサエレメン
トの前記変換後データを記憶するレジスタに変換後デー
タを格納する経路に接続される全プロセッサエレメント
共有のデータバスを備え、前記データバスに対し変換後
データを変換前データの値の順に従って送出する変換後
データ送出手段を備えたことを特徴とするものである。
【0018】この発明にかかる請求項4に記載の並列プ
ロセッサは、上記の構成に加え、前記変換後データ送出
手段は、命令デコーダと、前記命令デコーダによって入
力される任意の変換前データに対応した変換後データを
前記データバスに送出する記憶手段と、を備えたことを
特徴とするものである。
【0019】この発明にかかる請求項5に記載の並列プ
ロセッサは、上記の構成に加え、前記変換後データ送出
手段は、加算器と前記加算器器の加算結果を記憶するレ
ジスタと、前記レジスタによって入力される任意の変換
前データに対応した変換後データを前記データバスに送
出する記憶手段と、を備えたことを特徴とするものであ
る。
【0020】この発明にかかる請求項6に記載の並列プ
ロセッサは、上記の構成に加え、前記変換後データを記
憶するレジスタをn(n=2のべき乗)個持ち、プロセ
ッサ外部から与えられる変換後データを前記変化後デー
タを記憶するレジスタに格納する経路をn本それぞれ持
つことを特徴とするものである。
【0021】この発明にかかる請求項7に記載の並列プ
ロセッサは、上記の構成に加え、各プロセッサエレメン
トの前記変換後データを記憶するn(n=2のべき乗)
個のレジスタに変換後データを格納する経路に接続され
る全プロセッサエレメント共有のデータバスをn本備
え、前記データバスに対し、変換後データを変換前デー
タの値の順に従ってn個のデータごとに送出する変換後
データ送出手段を備えたことを特徴とするものである。
【0022】この発明にかかる請求項8に記載の並列プ
ロセッサは、上記の構成に加え、前記n(n=2のべき
乗)本のデータバスに対して変換後データを変換前のデ
ータの値の順に従って送出する手段として、命令デコー
ダと、前記命令デコーダによって入力される任意の変換
前データに対応しn個の変換後データを前記データバス
に送出する記憶手段と、を備えたことを特徴とするもの
である。
【0023】この発明にかかる請求項9に記載の並列プ
ロセッサは、上記の構成に加え、前記n(n=2のべき
乗)本のデータバスに対して変換後データを変換前のデ
ータの値の順に従って送出する手段として、加算器と前
記加算器器の加算結果を記憶するレジスタと、前記レジ
スタによって入力される任意の変換前データに対応した
n個の変換後データを前記データバスに送出する記憶手
段とを備えたことを特徴とするものである。
【0024】この発明の請求項10に記載の画像処理装
置は、複数のプロセッサエレメントがアレイ状に設けら
れた並列プロセッサにFIFOを介して画像データが入
力され、入力された画像データを並列演算処理し、演算
処理された画像データがFIFOを介して並列プロセッ
サ外部に出力される画像処理装置であって、前記並列プ
ロセッサの各プロセッサエレメントは、各プロセッサエ
レメントは、変換前データを記憶するレジスタと、デー
タバスから送られてくる変換後データを記憶するレジス
タと、データバスから送られてくるデータが記憶されて
いる変換前データに相当する変換後データか判別する手
段と、を備え、前記判別手段の結果に基づき前記変換後
データをレジスタに記憶させることにより、非線形演算
を行うことを特徴とする。
【0025】前記した並列プロセッサとして、請求項2
乃至9のいずれかに記載の並列プロセッサを用いること
ができる。
【0026】
【発明の実施の形態】以下、この発明に係るSIMD型
プロセッサの実施の形態につき図面を参照して説明す
る。
【0027】まず、この発明にかかるSIMD型プロセ
ッサの全体構成について、図1に従い説明する。
【0028】この発明のSIMD型プロセッサ1は、図
1に示すように、グローバルプロセッサ2、本実施形態
では256組の後述するプロセッサエレメント3aから
なるプロセッサエレメントブロック3と、インターフェ
ース4から構成される。プロセッサエレメント3aは、
複数のレジスタファイル群とこれらレジスタファイル群
に格納されたデータを演算する演算部を有する。インタ
フェース4はグローバルプロセッサ2の命令に基づき、
イメージスキャナなどの外部入力部から演算対象となる
データを各プロセッサエレメント3aのレジスタフィル
に与えるとともに、演算処理されたデータをレジスタフ
ァイルからプリンタなどの外部出力部へ転送するもので
ある。
【0029】この外部入出力装置は、デジタル画像デー
タなどの演算データを入出力するものである。外部入力
装置としては、イメージスキャナや画像が格納された画
像メモリがあり、外部出力装置としては画像データを印
字するプリンタ、データを格納する画像メモリなどがあ
る。
【0030】グローバルプロセッサ2は、いわゆるSI
SD(Single Instruction Str
eam Single Data Stream)タイ
プのプロセッサであり、プログラムRAMとデータRA
Mを内蔵し、プログラムを解読し、各種制御信号を生成
する。この制御信号は内蔵する各種ブロックの制御以外
にもプロセッサエレメント3a…に供給される。また、
GP(グローバルプロセッサ)命令実行時は内蔵する汎
用レジスタ、ALU(算術論理演算器)等を使用して各
種演算処理、プログラム制御処理を行う。
【0031】プロセッサエレメント3aのレジスタファ
イルはPE(プロセッサエレメント)命令で処理される
データを保持している。このPE命令はSIMD(Si
ngle Instruction Stream M
ultiple DataStream)タイプの命令
であり、各プロセッサエレメント3aに同時に同じ処理
を行う。各プロセッサエレメント3a…からのデータの
読み出し/書き込みの制御はグローバルプロセッサ2か
らの制御によって行われる。
【0032】各プロセッサエレメント3a…の演算部に
てPE命令の演算処理が行われる。この処理の制御はす
べてグローバルプロセッサ2から行われる。
【0033】次に、図2を参照して、SIMD型プロセ
ッサ1のプロセッサエレメント3aへのデータの読み出
し/書き込みの一例につき説明する。
【0034】このグロバールプロセッサ2にはこのプロ
セッサのプログラム格納用のプログラムRAM21と演
算データ格納用のデータRAM24が内蔵されている。
さらに、プログラムのアドレスを保持するプログラムカ
ウンタ(PC)、演算処理のデータ格納のための汎用レ
ジスタであるG0〜G3レジスタ、レジスタ退避、復帰
時に退避先データRAMのアドレスを保持しているスタ
ックポインタ(SP)、サブルーチンコール時にコール
元のアドレスを保持するリンクレジスタ(LS)、同じ
くIRQ時とNMI時の分岐元アドレスを保持するL
I、LNレジスタ、プロセッサの状態を保持しているプ
ロセッサステータスレジスタ(P)のレジスタ群25が
内蔵されている。さらに、グローバルプロセッサ2は、
プログラムRAM21に基づきグローバルプロセッサ
2、プロセッサエレメントブロック3、インタフェース
4を制御するシーケンスユニット22を備える。
【0035】また、グローバルプロセッサ2は、これら
のレジスタ群25と図示していない命令デコーダ、算術
論理演算器23(以下、「ALU23」という。)、図
示していないメモリ制御回路、割り込み制御回路、外部
I/O制御回路、GP演算制御回路を使用してGP命令
の実行が行われる。
【0036】また、PE命令実行時は命令デコーダ、図
示していないレジスタファイル制御回路、PE演算制御
回路を使用して、各プロセッサエレメント3a…の制御
を行う。
【0037】また、この実施形態では、後述するよう
に、グローバルプロセッサ2の命令に従いテーブルRA
Mから複数のプロセッサエレメント3aにデータが転送
可能に構成されている。
【0038】上記したように、シーケンスユニット22
は、プロセッサエレメントブロック3を構成する各プロ
セッサエレメント3a…レジスタファイル31及び演算
部36を制御する。
【0039】この演算部36は、マルチプレクサ32、
シフト拡張回路33、算術論理演算器34(以下、「A
LU34」という)、及びAレジスタ35a及びFレジ
スタ35bを備える。なお、この図2には記載していな
いが、この実施形態においては、後述するように、テー
ブル変換後のデータを取得するための変換後データ取得
手段を備える。
【0040】さらに、このシーケンスユニット22は、
インタフェース4に対してデータ転送のための動作設定
用データ及びコマンド等を送る。インタフェース4は、
シーケンスユニット22の動作設定用データ及びコマン
ドに基づき、プロセッサエレメント3aのアドレス指定
のためのアドレス制御信号、プロセッサエレメント3a
を構成するレジスタ31bにデータのリード/ライトを
指示するためのリード/ライト制御信号、クロック信号
を与えるためのクロック制御信号を生成する。
【0041】ここで、リード/ライト制御信号のうちラ
イト制御信号とは、演算処理されるデータをデータバス
41dより取得して、プロセッサエレメント3aのレジ
スタ31bに保持させるための信号をいう。一方、リー
ド/ライト制御信号のうちリード制御信号とは、プロセ
ッサエレメント3aのレジスタ31bが保持している演
算処理されたデータを、データバス41dへ与えるよう
レジスタ31bに指示するための信号をいう。
【0042】インタフェース4は、グローバルプロセッ
サ2からのコマンドを受けて、プロセッサエレメントブ
ロック3を構成するプロセッサエレメント3aのアドレ
スを指定する信号(以下、「アドレス指定信号」とい
う。)を作成し、アドレスバス41aを介してプロセッ
サエレメント3aのレジスタコントローラ31aヘ送
る。また、インタフェース4は、後述するように、プロ
セッサエレメント3aを構成するレジスタ31bに対し
て、データのリード/ライトを指示するための信号(以
下、「リード/ライト指示信号」という。)を、リード
/ライト信号線41bを介してプロセッサエレメント3
aの後述するレジスタコントローラ31aヘリード/ラ
イト信号が与えられる。
【0043】また、インタフェース4は、クロック信号
線41cを介してプロセッサエレメント3aの後述する
レジスタコントローラ31aへクロック信号を与える。
【0044】さらに、外部入出力データバスからは、上
述したように、SIMD型プロセッサ1の外部に設けら
れたイメージスキャナ等で読み込んだデータを、本実施
形態では8ビットのパラレルデータとして、インタフェ
ース4に与える。この8ビットのデータは、データバス
41dに与えられる。この8ビットのパラレルデータに
ついては、データに応じて適宜変更しても問題ない。こ
のデータバス41dは、レジスタ31bに保持されてい
る演算処理されたデータが、SIMD型プロセッサ1の
外部に転送される時にも使用される。
【0045】また、レジスタ群25は、プロセッサエレ
メントブロック3の後述するレジスタ35に接続されて
おり、このレジスタ35との間でシーケンスユニット2
2の制御によりデータの交換が行われる。
【0046】プロセッサエレメントブロック3は、図2
に示すように、レジスタファイル31、マルチプレクサ
32、シフト・拡張回路33、算術論理演算器34(以
下、「ALU34」という。)、レジスタ35a、35
bを一単位とする複数のプロセッサエレメント3aを備
える。レジスタファイル31には、1つのプロセッサエ
レメント3a単位に8ビットのレジスタが32本内蔵さ
れており、本実施形態では256のプロセッサエレメン
ト分の組がアレイ構成になっている。レジスタファイル
31は1つのプロセッサエレメント(PE)3aごとに
R0、R1、R2...R31と呼ばれているレジスタ
が内蔵されている。それぞれのレジスタファイル31は
演算部36に対して1つの読み出しポートと1つの書き
込みポートを備えており、8ビットのリード/ライト兼
用のバスで演算部36からアクセスされる。32本のレ
ジスタの内、24本はプロセッサ外部からアクセス可能
であり、外部からクロックとアドレス、リード/ライト
制御を入力することで任意のレジスタを読み書きでき
る。
【0047】レジスタの外部からのアクセスは1つの外
部ポートで各プロセッサエレメント3aの1つのレジス
タがアクセス可能であり、外部から入力されたアドレス
でプロセッサエレメントの番号(0〜255)を指定す
る。したがって、レジスタアクセスの外部ポートは全部
で24組搭載されている。
【0048】本実施形態では、プロセッサエレメント3
aの数を256個として説明するが、これに限定される
ものでなく適宜変更して使用してもよい。このプロセッ
サエレメント3aには、グローバルプロセッサ2のシー
ケンスユニット22により、インタフェース4に近い順
に0から255までのアドレスが割り付けられる。
【0049】プロセッサエレメント3aのレジスタファ
イル31は、レジスタコントローラ31a、2種類のレ
ジスタ31b、31cを備える。本実施形態では、図2
に示すように、一単位のプロセッサエレメント3a毎
に、レジスタコントローラ31aとレジスタ31bとを
24組備え、さらにレジスタ31cを8個備えている。
図2中の1プロセッサエレメントとは1つのプロセッサ
エレメント3aを表している。ここで、本実施形態で
は、レジスタ31b、31cを8ビットのものとして扱
うが、これに限定されるものでなく適宜変更して使用し
てもよい。
【0050】レジスタコントローラ31aは、図2に示
すように、インタフェース4と、上述したアドレスバス
41a、リード/ライト信号線41b、クロック信号線
41cを介して接続されている。
【0051】インタフェース4は、グローバルプロセッ
サ2からデータ転送指示を受け取ると、アドレス指定信
号をアドレスバス41aを介してプロセッサエレメント
ブロック3ヘ送る。これにより、プロセッサエレメント
3aがアドレス指定される。レジスタコントローラ31
aは、送られてきたアドレス指定信号をデコードし、デ
コードしたアドレスと、自己に割り付けられたアドレス
とが一致する場合には、クロック信号41cを介して送
られてきたクロック信号に同期して、リード/ライト信
号41bから送られてきたリード/ライト指示信号を得
る。具体的には、レジスタコントローラ31aは、リー
ド/ライト信号41bを介してリード/ライト指示信号
を得る。そして、このリード/ライト指示信号はレジス
タ31bに与えられる。
【0052】レジスタコントローラ31aからプロセッ
サエレメント3aに対し、ライト指示信号が送られてき
た場合には、プロセッサエレメント3aのレジスタ31
bは、演算処理されるデータ(8ビット)をデータバス
41dより取得して保持する。また、レジスタコントロ
ーラ31aからプロセッサエレメント3aに対し、リー
ド指示信号が送られてきた場合には、プロセッサエレメ
ント3aのレジスタ31bは、演算処理されたデータ
(8ビット)をデータバス41dへ送る。
【0053】レジスタ31bは、後述するALU34で
これから演算される外部から入力されたデータを保持し
たり、或いはALU34で演算処理されたデータを外部
へ出力するために保持するものであり、いわゆる入力レ
ジスタとしても、或いは出力レジスタとしても機能す
る。また、演算処理されるデータ、或いは演算されたデ
ータを一時的に保持するといった、後述するレジスタ3
1cとしての機能も有する。なお、本実施形態では、レ
ジスタ31bは8ビットのデータを保持できるものとし
て扱うが、データに応じて適宜変更しても問題ない。上
述したレジスタコントローラ31aからライト指示信号
が与えられると、レジスタ31bは演算処理されるデー
タをデータバス41dより取得して保持する。一方、レ
ジスタコントローラ31aからリード指示信号が送られ
てくると、レジスタ31bは保持している演算処理され
たデータをデータバス41dへ与える。このデータはイ
ンタフェース4から外部データバスを介して外部のプリ
ンタなどへ転送される。
【0054】また、レジスタ31bは、本実施形態にお
いては8ビットデータをパラレルで転送するデータバス
37を介してマルチプレクサ32に接続されている。A
LU34で演算処理されるデータ、或いはALU34で
演算処理されたデータは、このデータバス37を介し
て、レジスタ31bとの間で転送される。この転送は、
グローバルプロセッサ2のシーケンスユニット22から
の指示によって、グローバルプロセッサ2に接続された
リード信号線26a、ライト信号線26bを介して行わ
れる。具体的には、グローバルプロセッサ2のシーケン
スユニット22から、リード信号線26aを介してリー
ド指示信号が送られてくると、レジスタ31bは保持し
ている演算処理されるデータをデータバスへ置く。この
データはALU34へ送られ演算処理される。一方、グ
ローバルプロセッサ2のシーケンスユニット22から、
ライト信号線26bを介してライト指示信号が送られて
くると、レジスタ31bはデータバス37を介して送ら
れてきたALU34で演算処理されたデータを保持す
る。
【0055】レジスタ31cは、レジスタ31bより与
えられた演算処理されるデータ、或いは演算されたデー
タがレジスタ31bに与えられる前に、そのデータを一
時的に保持するものである。さらに、この実施の形態に
おいては、レジスタ31cは後述するように、グローバ
ルプロセッサ2からのデータが与えられる。
【0056】演算部36は、マルチプレクサ32、シフ
ト/拡張回路33、16ビットALU34及び16ビッ
トのレジスタ35a、35bを備えている。このレジス
タは、16ビットのAレジスタ35a、Fレジスタ35
bである。
【0057】プロセッサエレメント3aの命令による演
算は、基本的にレジスタファイル31から読み出された
データをALU34の片側の入力としてもう片側にはレ
ジスタ35のAレジスタの内容を入力として結果をAレ
ジスタに格納する。したがって、Aレジスタ35aとレ
ジスタファイル31のR0〜R31レジスタとの演算が
行われることとなる。この実施形態においては、レジス
タファイル31と演算アレイ36との接続に(7to
1)のマルチプレクサ32を置いており、プロセッサエ
レメント方向で左に1、2、3つ離れたデータと右に
1、2、3つ離れたデータ、中央のデータを演算対象と
して選択している。また、レジスタファイル31の8ビ
ットのデータはシフト/拡張回路33により任意ビット
の左シフトしてALU34に入力される。
【0058】上記したように、マルチプレクサ32は、
自己のプロセッサエレメント3aに備えられた上記デー
タバス37に接続されるとともに、両隣3つのプロセッ
サエレメント3aに備えられたデータバス37にも接続
されている。このマルチプレクサ32は7つのプロセッ
サエレメント3aから1つを選択し、その選択したプロ
セッサエレメント3aにおけるレジスタ31b、31c
で保持されているデータをALU34へ送る。或いはA
LU34で演算処理されたデータを、選択したプロセッ
サエレメント3aにおけるレジスタ31b、31cへ送
る。これによって、隣のプロセッサエレメント3aにお
けるレジスタ31b、31cで保持されているデータを
利用した演算処理が可能になり、SIMD型プロセッサ
1の演算処理能力を高めることができる。
【0059】シフト/拡張回路33は、マルチプレクサ
32から送られてきたデータを所定ビットシフトしてA
LU34へ送る。或いはALU34から送られてきた演
算処理されたデータを所定ビットシフトしてマルチプレ
クサ32へ送る。
【0060】ALU34は、シフト/拡張回路33から
送られてきたデータと、レジスタ35に保持されている
データとに基づき算術論理演算を行う。なお、本実施形
態では、ALU34は16ビットのデータに対応できる
ものとして扱うが、データに応じて適宜変更しても問題
ない。演算処理されたデータは、Aレジスタ35aに保
持され、シフト/拡張回路33へ転送したり、或いはグ
ローバルプロセッサ2の汎用レジスタ25へ転送され
る。
【0061】グローバルプロセッサ2からインタフェー
ス4へはI/O用のアドレス、データ、コントロール信
号がバスを介して与えられる。
【0062】上記したように、この実施形態において
は、レジスタファイル31には1つのプロセッサエレメ
ント3a単位に8ビットのレジスタが32本内蔵されて
おり、256プロセッサエレメント分の組みがアレイ構
成になっている。レジスタはプロセッサエレメントごと
にR0、R1、R2...R31と呼ばれている。それ
ぞれのレジスタは演算部36に対して1つの読み出しし
ポートと1つの書き込みポートを備えており、8ビット
のリード/ライト兼用のバス37で演算アレイからアク
セスされる。32本のレジスタの内、24本(R0〜R
23)のレジスタ31bは、プロセッサ外部からアクセ
ス可能であり、外部からクロックとアドレス、リード/
ライト制御を入力することで任意のレジスタを読み書き
できる。
【0063】残りの8本(R24〜R31)のレジスタ
31cはプロセッサエレメント演算の一時的な演算デー
タ保存用として使用されるが、グローバルプロセッサ2
のデータRAM24からのデータを書き込むこともでき
る。グローバルプロセッサ2からのライト制御と演算部
36変換後データ取得手段により、レジスタファイル3
1に内蔵される8本のレジスタ31cにグローバルプロ
セッサ2のデータRAM24のデータの書き込みが可能
に構成されている。また、この実施形態では、データR
AM24にテーブル変換用データが格納されテーブルR
AMとして使用できる。例えば、このRAMは64ビッ
トの出力ポートを持つことで、1つのプロセッサエレメ
ント3aに対しても8本のレジスタ31cに同時に64
ビットの書き込みが可能に構成される。
【0064】上述したように、演算部36は16ビット
ALU34と16ビットAレジスタ35a、Fレジスタ
35bを内蔵している。PE命令による演算はレジスタ
ファイル31から読み出されたデータもしくはグローバ
ルプロセッサ2から与えられたデータをALU34の片
側の入力としてもう片側にはAレジスタ35aの内容を
入力として結果をAレジスタに格納する。したがって、
Aレジスタ35aとR0〜R31レジスタ31b、31
cもしくはグローバルプロセッサ2から与えられたデー
タとの演算が行われることとなる。
【0065】次に、この発明の特徴であるグローバルプ
ロセッサ2の命令に従いテーブルRAMのデータをプロ
セッサエレメント3aに書き込む態様につき参照して説
明する。
【0066】レジスタファイル31の中のレジスタ31
cはグローバルプロセッサ2のレジスタファイル制御回
路を介して、テーブルRAMのデータが入力される。テ
ーブルRAMは、非線形変換処理のためのデータメモリ
として用いる。このテーブルRAMからレジスタ31c
への書き込みは後述する変換後データ取得手段により行
われる。レジスタ31cにはライトコントロール回路
(図示しない)が設けられており、このライトコントロ
ール回路に変換後データ取得手段からライト制御信号が
与えられる。全てのプロセッサエレメント3aのレジス
タ31cにテーブルデータバス41を介してからテーブ
ルRAM26のデータを与え、変換後データ取得手段か
らライト制御信号が与えられている各プロセッサエレメ
ント3aのレジスタ31cにデータが書き込まれる。
【0067】なお、レジスタ31cは演算アレイ36と
もデータバス37を介してデータの転送を行うため、も
う一方の出力ポートを持ち、命令によりグローバルプロ
セッサ2で作成されたリード制御信号によりデータから
データの転送が行われる。
【0068】また、テーブルRAMは例えば、グローバ
ルプロセッサ2の汎用レジスタ(G0〜G3)をアドレ
スのポインタとしてアドレスが指定され、同様に汎用レ
ジスタ(G0〜G3)のデータを書き込まれることで値
が設定される。
【0069】次に、図2に示す実施の形態において非線
形処理のためのテーブル変換について説明する。なお、
演算対象データはレジスタファイル31のレジスタ31
bのうちレジスタR0に格納されているものとして説明
する。以下、この発明の動作の理解を容易にするため
に、1つのレジスタに変換前データが格納され、1つの
レジスタに変換後データを格納する場合につきその要部
を示す図面を用いて説明する。
【0070】図3は、図2で示されるようなSIMDプ
ロセッサのうちの1個のプロセッサエレメント3aと同
様に構成されたプロセッサエレメント(PE)100だ
けを示している。データバス41は、各プロセッサエレ
メント100…間を跨って配置されているデータ幅のバ
スである。例えば、8ビットのデータを扱う場合は8ビ
ットのバスである。以下では、データ幅を8ビットであ
るとして説明する。レジスタ102は、8ビットの変換
前データの格納用レジスタであり、レジスタ101は、
8ビットの変換後データのレジスタである。レジスタ1
01,102は上記したレジスタファイル31の中のレ
ジスタで構成される。少なくともレジスタ101は、デ
ータバス41から値を入力する経路を持つ。
【0071】図示していないレジスタファイル31のレ
ジスタ(R0)に格納された演算(演算前)対象データ
を各プロセッサエレメント100のデータバス37を介
してレジスタ102にロードする。
【0072】変換後データ取得回路106は、レジスタ
102の内容を参照して、レジスタ101へデータバス
41からデータを取得するか否か判断し、データバス4
1に与えられているデータがレジスタ102に格納され
ている変換前データに対応する変換後データと一致する
時に、そのデータをレジスタ101に格納させるもので
ある。
【0073】なお、以下の説明では、変換前データ、変
換後データともに8ビットのデータ幅であると仮定す
る。
【0074】図3で示されるプロセッサエレメント10
0においては、レジスタ102に記憶されている変換前
データを変換し、変換後データとしてレジスタ101に
格納するものである。データバス41上に、変換前デー
タが“00H”の時の変換後データ、変換前データが
“01H”の時の変換後データ、変換前データが“02
H”の時の変換後データ、…、変換前データが“FF
H”の時の変換後データという順で256通りのデータ
が存在するとき、プロセッサエレメント100…では変
換後データ取得回路106がデータバス41上の変換後
データの変換前にあたる変換前データを計算によって求
め、計算によって求められた変換前データが、レジスタ
101の内容と一致したとき、所望の変換後データがデ
ータバス412上にあることを知ることができる。その
タイミングでレジスタ101に入力されたデータは、レ
ジスタ102を変換前データとしたときの変換後データ
となる。このような変換後データ取得回路106につき
図4を参照して説明する。
【0075】次に、上記した変換後データ取得回路10
6につき、図4のブロック図に従いさらに説明する。変
換後データ取得回路106は、加算器105と、加算器
105から演算結果を格納する8ビットのレジスタ10
3と、変換前データの格納レジスタ102と、レジスタ
102とのデータを比較する比較器104と、を備え
る。比較器104からの出力により、レジスタ101に
データバス41に与えられている変換後データが格納さ
れる。この加算器104は、プロセッサエレメントの演
算部に備えている加算器(ALU)を用い、レジスタ1
03もプロセッサエレメント内の演算部に設けられてい
るレジスタ等を用いればよい。
【0076】加算器105は、2個のデータを入力し、
1個の出力を得る。演算幅は8ビットである。2個の入
力のうち1個は固定値“1”または“−1”とする。他
方の入力にはレジスタ103の内容が入力可能となって
いる。レジスタ103は、加算器105の演算結果を記
憶する8ビットのレジスタであり、その内容は加算器1
05の入力データとなるほかに比較器104へ出力され
る。比較器104は、レジスタ103とレジスタ102
の内容を比較する。2つの入力データが一致した場合、
比較器104はレジスタ101にデータ入力の指示が出
される。
【0077】図4に示すプロセッサエレメント100に
おいては、レジスタ102に記憶されている変換前デー
タを変換し、変換後データとしてレジスタ101に格納
するものである。この図4に示す変換後データ取得回路
106の加算器105は、2個のデータの加算を可能と
するが、一方の入力データを固定値“1”とし、他方の
入力データを前サイクルの加算結果、すなわちレジスタ
103に記憶されている値としている。このように構成
すれば、今サイクルの加算結果は、“前回の加算結果+
1”となる。加算器105の加算結果は、レジスタ10
3に毎サイクル記憶されるため、レジスタ103の記憶
する値は、1サイクルにつき”1”上昇する。比較器1
04は、レジスタ102の8ビットデータとレジスタ1
03の8ビットデータを比較し、一致した場合、レジス
タ101に一致信号を送くる。
【0078】レジスタ101は、この一致信号を受けと
ると、データバス41上の8ビットデータを格納する。
変換後データは、変換前データの昇べきの順にデータバ
ス2上に存在するものとしたとき、レジスタ103の値
とデータバス41上のデータは、変換前データと変換後
データであるという関係が保たれる。すなわち、データ
バス41上には、変換前データが“00H”の時の変換
後データ、変換前データが“01H”の時の変換後デー
タ、変換前データが“02H”の時の変換後データ、
…、変換前データが“FFH”の時の変換後データとい
うように256通りのデータが存在し、プロセッサエレ
メント100には変換前データがどんな値であっても、
必ず対応するべき変換後データがデータバス41上に存
在するサイクルがある。
【0079】プロセッサエレメント100としては、レ
ジスタ102に記憶されている変換前データの値がレジ
スタ103と一致しているタイミングで、変換後データ
がデータバス2上にあることを知ることができ、比較器
104の一致信号のタイミングでレジスタ101に入力
されたデータは、レジスタ102を変換前データとした
ときの変換後データとなる。
【0080】図5は、図4で示されるプロセッサエレメ
ント100で構成されたSIMDプロセッサである。プ
ロセッサエレメント100、200、300は図4のプ
ロセッサエレメント100と同じ構成のプロセッサエレ
メントである。
【0081】この図5においては、3つのプロセッサエ
レメントだが、4個目以降のプロセッサエレメントは省
略している。
【0082】データバス41は、すべてのプロセッサエ
レメント100…に共通のバスであり、すべてのプロセ
ッサエレメント100…に変換後データのレジスタ10
1にデータ入力する経路を有している。
【0083】プロセッサエレメント100…を制御する
この実施形態のグローバルプロセッサ2は、変換後デー
タ送出装置20aを備える。変換後データ送出装置20
aは、データバス41にデータを送出する経路を持つ。
【0084】グロバールプロセッサ2は変換後データを
データバス41を介して全プロセッサエレメント100
…に与える。各プロセッサエレメント100…は変換後
データ取得回路106の比較器104が一致信号を出力
するタイミングでレジスタ101に変換後データを格納
する。
【0085】図6は、図5で示されるSIMDプロセッ
サと基本的には同じ構成である。相違する点は、図5で
は、グローバルプロセッサ2が変換後データを送出する
部分が変換後データ送出装置20aとなっているのに対
して、図6では変換テーブル20bと命令デコーダ20
cという構成になっている。変換テーブル20bは、入
力として命令デコーダ20cからデータを受け取り、デ
ータバス41へデータを出力する。
【0086】図7は、図5で示されるSIMDプロセッ
サと基本的には同じ構成である。相違する点は、図5で
は変換前データ送出装置20aとなっている部分が、図
7では変換テーブル20bと加算器20eとレジスタ2
0dという構成になっている。
【0087】加算器20eとレジスタ20dは、アドレ
ス発生回路を構成するもので、加算器20eは、2個の
データを入力し、1個の出力を得る。演算幅は8ビット
である。2個の入力のうち1個は固定値“1”または
“−1”とすることが可能である。また、他方の入力に
はレジスタ20dの内容が入力可能となっている。この
加算器20eは、グローバルプロセッサに備えている加
算器(ALU)を用い、レジスタ20dも内部に設けら
れているレジスタ等を用いればよい。
【0088】レジスタ20dは、加算器20eの演算結
果を記憶する8ビットのレジスタであり、その内容は加
算器20eの入力データとなるほかに変換テーブルRA
M20bの入力となる。変換テーブル20bは、入力と
してレジスタ20dのデータを受け取り、データバス4
1へ対応するアドレスのデータを出力する。
【0089】図5、図6および図7で示した上記実施形
態では、図4で説明したプロセッサエレメント100を
用いているので、図5、図6および図7の動作の説明に
おいては、プロセッサエレメント100、200および
300の動作説明は省略する。
【0090】図5の実施形態では、プロセッサエレメン
ト100、200および300は、同一のデータバス4
1に接続されている。グローバルプロセッサ2には、変
換後データ送出装置20aがあり、変換後データを、変
換前データの昇べきの順あるいは降べきの順にデータバ
ス41上に出力する。これにより、プロセッサエレメン
ト100、200および300は上記説明の通り動作す
ることで、各プロセッサエレメントにおいてデータの変
換という所望の動作を行うことができる。プロセッサエ
レメント100、プロセッサエレメント200およびプ
ロセッサエレメント300では、データバス41を共通
のものとしていることと、各プロセッサエレメントは独
立して動作することから、プロセッサエレメントの数は
図示している数より多くても、上記動作はまったく同じ
である。したがって、プロセッサエレメント数が多けれ
ば多いほど変換するデータが多く、効率が良いことにな
る。
【0091】図6の実施形態では、図5で示された変換
前データ送出装置20aを、変換テーブル20bと命令
デコーダ20cで置き換えている。命令デコーダ20c
は、このSIMDプロセッサが持つ命令をデコードする
部分である。SIMDプロセッサの命令として、変換テ
ーブル20bに制御信号を入力するが、その命令コード
の並び方、すなわちプログラムによって、データバス4
1上には、変換前データが“00H”の時の変換後デー
タ、変換前データが“01H”の時の変換後データ、変
換前データが“02H”の時の変換後データ、…、変換
前データが“FFH”の時の変換後データというように
変換前データの昇べきの順に256通りのデータが出力
するように制御される。仮に、変換前データ“00H”
を変換した変換後データをデータバス41に出力する命
令を、table #00h というコードで表現するならば、図
12に示すプログラムによって昇べきの順にデータバス
41に変換後データを出力できる。図13のプログラム
であれば、降べきの順を実現できる。
【0092】命令デコーダ20cで、生成された制御信
号は、変換テーブル20bで変換後データに変換され、
データバス41に出力される。変換テーブル20bは、
RAMやROMのような記憶装置として構成しても構わ
ない。たとえば、命令デコーダ20cから入力される制
御信号をアドレス入力とすれば、データ出力が丁度変換
後データに相当する。さらに付け加えるならば、アドレ
ス入力は変換前データそのものであっても構わない。こ
の場合は、アドレス8ビット(256ワード)、データ
8ビットのメモリに相当し、アドレス8ビットが変換前
データの8ビットである。また、図6では変換テーブル
20bをグローバルプロセッサ2に内蔵するようになっ
ているが、変換テーブル4をRAMやROMで構成する
場合、グローバルプロセッサ2の外に設けても構わな
い。すなわち、通常のSIMDプロセッサが動作するた
めに必要であるプログラムメモリや、データメモリの一
部として変換テーブル20bが存在しても構わない。
【0093】図7に示す実施形態では、図6で示したも
のと同様の変換テーブル20bを備えているため、変換
テーブル20bの説明は省略する。図7の実施形態で
は、命令デコーダやプログラムによらず、変換前データ
の昇べきの順あるいは降べきの順を実現する。図7の例
では各プロセッサエレメントと同様の加算器20eと加
算結果を記憶するレジスタ20dを備え、加算器20e
で“1”または“−1”の加算を行なうことで、レジス
タ20dの内容を毎サイクル“+1”または“−1”の
値に変更できる。すなわち、これは変換前データの昇べ
きの順あるいは降べきの順に相当し、このデータを入力
される変換テーブル20bで変換後データに変換されデ
ータバス41に出力される。
【0094】次に、この発明の更に異なる実施形態のプ
ロセッサエレメント100の構成につき図8に従い説明
する。
【0095】図8のプロセッサエレメント100は、図
1で示されるようなSIMDプロセッサのうちの1個の
プロセッサエレメント100だけを示している。この実
施形態においては、2つのデータバス41A、41Bを
有する。データバス41Aとデータバス41Bは、各プ
ロセッサエレメント間を跨って配置されているデータ幅
のバスである。ここでは、データバス幅を8ビットであ
るとして説明する。
【0096】レジスタ102は、8ビットの変換前デー
タの格納用レジスタであり、レジスタ101Aとレジス
タ101Bは、8ビットの変換後データのレジスタであ
る。少なくとも、レジスタ101Aには、データバス4
1Aから値を入力する経路を持ち、レジスタ101Bは
データバス41Bから値を入力する経路を持つ。
【0097】加算器105は、2個のデータを入力し、
1個の出力を得る。演算幅は8ビットである。2個の入
力のうち1個は固定値“2”または“−2”とすること
が可能である。他方の入力にはレジスタ103の内容が
入力可能となっている。レジスタ103は、加算器10
5の演算結果を記憶する8ビットのレジスタであり、そ
の内容は加算器105の入力データとなるほかに比較器
104の入力となる。比較器104は、レジスタ103
とレジスタ102の内容を比較する。2つの入力データ
が一致した場合、比較器104はレジスタ101Aとレ
ジスタ101Bにデータ入力の指示を出す。
【0098】図8で示されるプロセッサエレメント10
0においては、レジスタ102に記憶されている変換前
データを変換し、変換後データとしてレジスタ101A
またはレジスタ101Bに格納するものである。
【0099】加算器105は、2個のデータの加算を可
能とするが、一方の入力データを固定値“2”とし、他
方の入力データを前サイクルの加算結果、すなわちレジ
スタ103に記憶されている値とする。このように構成
すれば、今サイクルの加算結果は、“前回の加算結果+
2”となる。加算器105の加算結果は、レジスタ10
3に毎サイクル記憶するため、レジスタ103の記憶す
る値は、1サイクルにつき2上昇する。比較器104
は、レジスタ102の下位1ビットを除くデータとレジ
スタ103の下位1ビットを除くデータを比較し、一致
した場合、レジスタ101Aとレジスタ101Bに一致
信号を送る。
【0100】レジスタ101Aとレジスタ101Bは、
この一致信号を受けると、データバス41A上とデータ
バス41B上の8ビットデータをそれぞれ格納する。変
換後データは、下位1ビットを除く変換前データの昇べ
きの順にデータバス41Aとデータバス41B上に存在
するものとし、データバス41A上には変換前データの
下位1ビットが“0”のときの変換後データとし、デー
タバス41B上には変換前データの下位1ビットが
“1”のときの変換後データとする。このように構成し
たとき、レジスタ103の値とデータバス41Aまたは
データバス41B上のデータは、変換前データと変換後
データであるという関係が保たれる。すなわち、データ
バス41A上には、変換前データが“00H”の時の変
換後データ、変換前データが“02H”の時の変換後デ
ータ、変換前データが“04H”の時の変換後データ、
…、変換前データが“FEH”の時の変換後データとい
うように128通りのデータが存在し、データバス41
B上には、変換前データが“01H”の時の変換後デー
タ、変換前データが“03H”の時の変換後データ、変
換前データが“05H”の時の変換後データ、…、変換
前データが“FFH”の時の変換後データというように
128通りのデータが存在し、プロセッサエレメント1
00では変換前データがどんな値であっても、必ず対応
するべき変換後データがデータバス41Aまたはデータ
バス41B上に存在するサイクルがある。
【0101】プロセッサエレメント100としては、レ
ジスタ102に記憶されている変換前データの下位1ビ
ットを除く値がレジスタ103の下位1ビットを除く値
と一致しているタイミングで、変換後データがデータバ
ス41A上とデータバス41B上にあることを知ること
ができ、比較器104の一致信号のタイミングでレジス
タ101Aとレジスタ101Bに入力されたデータは、
レジスタ102を変換前データとしたときの変換後デー
タとなる。
【0102】図9は、図8で示されるプロセッサエレメ
ント100で構成されたSIMDプロセッサである。プ
ロセッサエレメント100、プロセッサエレメント20
0、プロセッサエレメント300は図8と同じ構成のプ
ロセッサエレメントである。図9では3つのプロセッサ
エレメントを示しているが、4個目以降のプロセッサエ
レメントは省略している。
【0103】データバス41Aとデータバス42Bは、
すべてのプロセッサエレメントに共通のバスであり、そ
れぞれがすべてのプロセッサエレメントの変換後データ
のレジスタ101Aおよびレジスタ101Bにデータ入
力する経路を持つ。
【0104】プロセッサエレメント100…を制御する
この実施形態のグローバルプロセッサ2は、変換後デー
タ送出装置20aを備える。変換後データ送出装置20
aは、データバス41Aおよびデータバス41Bにデー
タを送出する経路を持つ。各プロセッサエレメント10
0…は変換後データ取得回路106の比較器104が一
致信号を出力するタイミングでレジスタ101Aよびレ
ジスタ101Bに変換後データを格納する。
【0105】図10は、図9で示されるSIMDプロセ
ッサと基本的には同じ構成である。相違する点は、図9
では、グローバルプロセッサ2が変換後データを送出す
る部分が変換後データ送出装置20aとなっているのに
対して、図10では変換テーブル20bと命令デコーダ
20cという構成になっている。
【0106】変換テーブル4は、入力として命令デコー
ダ20cからデータを受け取り、データバス41Aおよ
びデータバス41Bへデータを出力する。
【0107】図11は、図9で示されるSIMDプロセ
ッサと基本的には同じ構成である。相違する点は、図9
では変換前データ送出装置20aとなっている部分が、
図11では変換テーブル20bと加算器20eとレジス
タ20dという構成になっている。
【0108】加算器20eとレジスタ20dは、アドレ
ス発生回路を構成するもので、2個のデータを入力し、
1個の出力を得る。演算幅は8ビットである。2個の入
力のうち1個は固定値“2”または“−2”とすること
が可能である。他方の入力にはレジスタ6の内容が入力
可能となっている。レジスタ20dは、加算器20eの
演算結果を記憶する8ビットのレジスタであり、その内
容は加算器7の入力データとなるほかに変換テーブル2
0bの入力となる。変換テーブル20bは、入力として
レジスタ20dのデータを受け取り、データバス41A
およびデータバス41Bへデータを出力する。
【0109】同様に加算器20eの一方の入力値が固定
値“−2”の場合は、変換前データの降べきの順にデー
タバス41Aとデータバス41B上に存在するものとし
たとき、レジスタ20dの値とデータバス41Aまたは
データバス41B上のデータは、変換前データと変換後
データであるという関係が保たれる。
【0110】図9、図10および図11の実施形態で
は、図8にて示されたプロセッサエレメント100を使
用しているので、プロセッサエレメント100、プロセ
ッサエレメント200およびプロセッサエレメント30
0の動作説明は省略する。
【0111】図9の実施例では、プロセッサエレメント
100、プロセッサエレメント200およびプロセッサ
エレメント300は、同一のデータバス41Aとデータ
バス41Bに接続されている。グローバルプロセッサ2
には、変換前データ送出装置20aがあり、変換後デー
タを、変換前データの昇べきの順あるいは降べきの順に
データバス41Aとデータバス41B上に出力する。
【0112】これにより、プロセッサエレメント10
0、プロセッサエレメント200およびプロセッサエレ
メント300は上記説明の通り動作することで、各プロ
セッサエレメントにおいてデータの変換という所望の動
作を行なうことができる。プロセッサエレメント10
0、プロセッサエレメント200およびプロセッサエレ
メント300では、データバス41Aとデータバス41
Bを共通のものとしていることと、各プロセッサエレメ
ントは独立して動作することから、プロセッサエレメン
トの数は図示している数より多くても、上記動作はまっ
たく同じである。したがって、プロセッサエレメント数
が多ければ多いほど変換するデータが多く、効率が良い
ことになる。
【0113】図10の実施例では、図9で示された変換
前データ送出装置20aを、変換テーブル20bと命令
デコーダ20cで置き換えている。
【0114】命令デコーダ20cは、このSIMDプロ
セッサが持つ命令をデコードする部分である。SIMD
プロセッサの命令として、変換テーブル20cに制御信
号を入力するが、その命令コードの並び方、すなわちプ
ログラムによって、データバス41Aとデータバス41
B上には、変換前データが“00H”の時の変換後デー
タと変換前データが“01H”の時の変換後データ、変
換前データが“02H”の時の変換後データと変換前デ
ータが“03H”の時の変換後データ、…、変換前デー
タが“FEH”の時の変換後データと変換前データが
“FFH”の時の変換後データというように変換前デー
タの昇べきの順に128通りのデータが出力するように
制御される。仮に、変換前データ“00H”と“01
H”を変換した変換後データをデータバス41Aとデー
タバス41Bに出力する命令を、table #00h というコ
ードで表現するならば、図14に示すプログラムによっ
て昇べきの順にデータバス41Aとデータバス41Bに
変換後データを出力できる。図15のプログラムであれ
ば、降べきの順を実現できる。
【0115】命令デコーダ20cで、生成された制御信
号は、変換テーブル20bで変換後データに変換され、
データバス41Aとデータバス41Bに出力される。変
換テーブル20cは、上述したように、RAMやROM
のような記憶装置として構成しても構わない。たとえ
ば、命令デコーダ20cから入力される制御信号をアド
レス入力とすれば、データ出力が丁度変換後データに相
当する。さらに付け加えるならば、アドレス入力は変換
前データそのものであっても構わない。この場合は、ア
ドレス7ビット(128ワード)データ16ビットのメ
モリに相当し、アドレス7ビットは、変換前データの上
位7ビットである。また、図10では変換テーブル20
bをグローバルプロセッサ2に内蔵するようになってい
るが、上述したように、変換テーブル20bをRAMや
ROMで構成する場合、グローバルプロセッサ2の外に
設けても構わない。すなわち、通常のSIMDプロセッ
サが動作するために必要であるプログラムメモリや、デ
ータメモリの一部として変換テーブル20bが存在して
も構わない。
【0116】図11の実施例では、図10で示したもの
と同様の変換テーブル20bを備えているため、変換テ
ーブル20bの説明は省略する。図11の実施例では、
命令デコーダやプログラムによらず、変換前データの昇
べきの順あるいは降べきの順を実現する。図11の例で
は各プロセッサエレメントと同様の加算器20eと加算
結果を記憶するレジスタ20dを備え、加算器7で
“2”または“−2”の加算を行なうことで、レジスタ
20dの内容を毎サイクル“+2”または“−2”の値
に変更できる。すなわち、これは変換前データの昇べき
の順あるいは降べきの順に相当し、このデータを入力さ
れる変換テーブル20bで変換後データに変換されデー
タバス41Aとデータバス41Bに出力される。
【0117】以上の説明においては、データバス幅を8
ビットと仮定しているが、データバス幅は任意の値でも
良い。ただし、データバス幅が1ビット増える毎に、全
データの変換に要するサイクル数は、2のべき乗で増加
するため、16ビット以上のデータは、現実的ではない
とも考えられる。
【0118】また、上記した図8乃至図11に示した実
施形態おいては、請求項でいう“n”に相当する数値と
して、“2”を選択した実施形態としたが、他に“4”
や“8”のような2のべき乗の数値が考えられる。その
場合、図8乃至図11では2本であったデータバスがn
本となり、各プロセッサエレメントにおいて変換後デー
タレジスタがn個となる一方、比較器などで比較される
データや、変換テーブルに入力するデータのデータ幅は
削減されることになる。
【0119】図8乃至図11に示した実施形態おいて
は、所望の変換後データが、複数の変換後データレジス
タうちのどれかに存在するという状態であるが、これは
SIMD機能を利用したプログラミングによって変換前
データの下位ビットを調査するなどで解決できる手段と
考えられるため、本発明の説明には敢えて加えていな
い。
【0120】上述した図2に示した実施形態において
は、レジスタファイル31の外部入出力する方式として
アドレッシング方式を採用し、レジスタファイル31を
プロセッサ外部からアクセスし、外部からクロックとア
ドレス、リード/ライト制御を入力することで任意のレ
ジスタを読み書きできるように構成して場合につき説明
したが、この発明は他の方式、例えば、外部入出力にシ
フトレジスタ方式を用いたプロセッサにも適用できる。
図15にシフトレジスタ方式を用いた場合の基本構成を
示す。
【0121】図15に示すように、入力画像データを一
時的に蓄積する入力シフトレジスタと、非線形処理され
た画像データが並列入力される外部出力シフトレジスタ
とを備える。入力シフトレジスタには、イメージスキャ
ナなどから送られる外部画像データが外部データバスか
ら入力シフトレジスタに与えられる。入力シフトレジス
タには並列nビットデータがビット毎に順次シフトされ
る。この入力シフトレジスタの段数は、プロセッサエレ
メント100の組数の段数を有し、この実施形態では2
56段の段数を有する。入力シフトレジスタに蓄積され
たデータはプロセッサエレメント100のレジスタファ
イルへ移される。レジスタファイルへの書き込み動作は
入力シフトレジスタの各段において同時に行われる。こ
のように、レジスタファイル31にデータが格納される
と、上述したこの発明による手法による非線形処理が演
算アレイで行われる。
【0122】非線形処理が行われたレジスタ102等に
格納されたデータは出力シフトレジスタの各段に転送さ
れる。この出力シフトレジスタのレジスタ段数はプロセ
ッサエレメント100の組数分だけであり、プロセッサ
エレメント100のレジスタファイルからデータが出力
シフトレジスタの各段に同時に転送される。この出力シ
フトレジスタに与えられるクロックでデータがシリアル
に出力される。そして、出力されたデータはバッファメ
モリなどに一時格納され、プリンタなどの外部出力装置
に与えられる。
【0123】このように、上記したシフトレジスタ方式
においても、非線形処理において、この発明を適用すれ
ば、効率よく非線形処理が行える。
【0124】次に、この発明のSIMD型プロセッサを
デジタル複写機などの画像処理装置に用いた場合につき
図16ないし図18を参照して説明する。
【0125】イメージスキャナで読み取られた画像デー
タ(nビットのデジタル画像データ)が外部データバス
からFIFO7に与えられる。FIFO7に1走査ライ
ン分のデータが格納されると、SIMD型プロセッサ1
のグローバルプロセッサ2からの制御信号により、この
実施の形態では256個の画像データがプロセッサエレ
メント100のレジスタへ与えられる。
【0126】上記したように、この実施形態において
は、1つのプロセッサエレメント単位に8ビットのレジ
スタが32本内蔵されており、256プロセッサエレメ
ント分の組みがアレイ構成になっている。レジスタはプ
ロセッサエレメントごとにR0、R1、R2、...R
31と呼ばれている。それぞれのレジスタは演算アレイ
に対して1つの読み出ししポートと1つの書き込みポー
トを備えており、8ビットのリード/ライト兼用のバス
37で演算アレイからアクセスされる。32本のレジス
タの内、24本(R0〜R23)は、プロセッサ外部か
らアクセス可能であり、外部からクロックとアドレス、
リード/ライト制御を入力することで任意のレジスタを
読み書きできる。
【0127】残りの8本(R24〜R31)のレジスタ
はプロセッサエレメント演算の一時的な演算データ保存
用として使用されるが、グローバルプロセッサ2の命令
に従いテーブルからのデータを書き込むこともできる。
このデータの書き込みは、変換後データ所得回路106
で一致したプロセッサエレメントに書き込みが可能に構
成されている。
【0128】プロセッサエレメント100内の演算アレ
イ部は上記したように、16ビットALUと16ビット
Aレジスタ、Fレジスタを内蔵している。プロセッサエ
レメント命令による演算はレジスタから読み出されたデ
ータもしくはグローバルプロセッサ2から与えられたデ
ータをALUの片側の入力としてもう片側にはAレジス
タの内容を入力として結果をAレジスタに格納する。し
たがって、Aレジスタ35aとR0〜R31レジスタも
しくはグローバルプロセッサ2から与えられたデータと
の演算が行われることとなる。
【0129】FIFO7より転送され、プロセッサエレ
メント100のレジスタに格納された画像データは、前
述した図4等に示す実施形態に基づき非線形処理のため
のテーブル変換が行われる。すなわち、レジスタファイ
ルのレジスタに格納された演算(演算前)対象データを
このレジスタの内容を参照して、変換後レジスタへデー
タバス4らデータを取得するか否か判断し、データバス
に与えられているデータがレジスタに格納されている変
換前データに対応する変換後データと一致する時に、そ
のデータをレジスタに格納させるものである。そして、
上述した図3等に示す実施形態に基づきテーブル変換が
終了する。
【0130】非線形処理が行われたプロセッサエレメン
ト100のレジスタファイルに格納されたデータがFI
FO8に転送される。FIFO8は1走査ライン分のデ
ータを格納すると、データをプリンタなどの外部出力装
置に転送する。
【0131】また、画像データを予めラインメモリ9に
蓄えておき、ラインメモリ9からプロセッサエレメント
ブロック3にデータを転送し、非線形処理を行ったデー
タをラインメモリ9に格納するように構成しても良い。
このときのデータ転送はメモリコントローラ91を介し
てRAM92へ入出力される。
【0132】図12にFIFO7の一例を図13にFI
FO8の一例をそれぞれ示す。これらFIFO7,8は
メモリコントローラ72(82)、バッファメモリ71
(81)を備える。外部データ入力はメモリコントロー
ラ72を介してバッファメモリ71へデータが格納さ
れ、1ライン分のデータをバッファメモリ71に格納す
ると、メモリコントローラ72からプロセッサエレメン
トブロック3へデータを転送する。外部データ出力はプ
ロセッサエレメントブロック3からメモリコントローラ
72を介してバッファメモリ71へデータが格納され、
1ライン分のデータをバッファメモリ71に格納する
と、メモリコントローラ72から外部へデータを出力す
る。
【0133】上記した画像処理装置は、イメージスキャ
ナで取り込んだ画像データをプリンタ部へ出力する場合
に付き説明したが、これに限らずデジタルビデオ、デジ
タルカメラなどのデジタル画像を非線形処理する場合に
もこの発明は適用できる。また、外部出力もプリンタに
限らず、ディスプレイへの出力、データ転送などの方式
で出力する場合でもこの発明は適用できる。
【0134】
【発明の効果】以上説明したように、この発明の請求項
1によれば、変換テーブルをプロセッサエレメントの内
部に持たない方法で、プロセッサエレメントに入力でき
るデータバスの数が最小の数で、プロセッサエレメント
のデータ変換が可能になる。そして、各プロセッサエレ
メントに変換テーブルを持たずに別の1箇所のみにテー
ブルをもつことによるコストの低減と、各プロセッサエ
レメントを結ぶ共通のデータバスの数を最小限に抑える
ことによるコストの低減と、それらを実現しながら、例
えば、データ幅8ビットの場合256サイクルでの変換
を実現できる。また、データバスを複数にした場合、デ
ータバスが2本の場合でも、約半分の128+αサイク
ルでの変換を実現できる。
【0135】この発明の請求項2の構成によれば、プロ
セッサエレメントが基本的に備えている加算器(AL
U)、レジスタを利用できる構成を提供することで、専
用ハードウエアの追加を抑制することできる。
【0136】また、請求項3の構成によれば、請求項2
の効果に加え、データバスは、各プロセッサエレメント
共通であるため、プロセッサエレメント数がどれだけ増
えようとも変換に要する時間が一定で、プログラミング
する際は実行時間が読みやすいというメリットがある。
また、変換後データをグローバルプロセッサが送出する
ことにより、データバスを即値のデータバスと共有で
き、コスト削減できる。
【0137】更に、請求項4の構成によれば、請求項3
の効果に加え、命令デコーダはグローバルプロセッサが
もともと必要で備えている機能であり、変換テーブルは
システム全体で最低限1個は必要であることから、ほと
んど余分なハードウエアをグローバルプロセッサに追加
することなく請求項2乃至3のメリットを実現できる。
また、変換テーブルはプロセッサの持つプログラムメモ
リやデータメモリを利用できるため、さらにコスト削減
が可能となる。
【0138】また、請求項5の構成によれば、請求項3
の効果に加え、加算器はグローバルプロセッサが備えて
いる加算器(ALU)を使用し、レジスタはグローバル
プロセッサが備えている汎用レジスタを使用などで、ほ
とんど余分なハードウエアをグローバルプロセッサに追
加することなく請求項2乃至3のメリットを実現でき
る。また、変換テーブルはプロセッサの持つプログラム
メモリやデータメモリを利用できるため、さらにコスト
削減が可能となる。
【0139】また、請求項6の構成によれば、請求項1
を複数のデータバスで実現するにあたりプロセッサエレ
メントが基本的に備えている加算器(ALU)、レジス
タを利用できる構成を提供することで、専用ハードウエ
アの追加を抑制できる。
【0140】更に、請求項7の構成によれば、請求項6
のメリットに加え、データバスは、各プロセッサエレメ
ント共通であるため、プロセッサエレメント数がどれだ
け増えようとも変換に要する時間が一定で、プログラミ
ングする際は実行時間が読みやすいというメリットがあ
る。また、変換後データをグローバルプロセッサが送出
することにより、データバスを即値のデータバスと共有
でき、コスト削減できる。
【0141】また、請求項8の構成によれば、請求項7
の効果に加え、命令デコーダはグローバルプロセッサが
もともと必要で備えている機能であり、変換テーブルは
システム全体で最低限1個は必要であることから、ほと
んど余分なハードウエアをグローバルプロセッサに追加
することなく請求項6乃至7のメリットを実現できる。
また、変換テーブルはプロセッサの持つプログラムメモ
リやデータメモリを利用できるため、さらにコスト削減
が可能となる。
【0142】請求項9の構成によれば、請求項7の効果
に加え、加算器はグローバルプロセッサが備えている加
算器(ALU)を使用し、レジスタはグローバルプロセ
ッサが備えている汎用レジスタを使用などで、ほとんど
余分なハードウエアをグローバルプロセッサに追加する
ことなく請求項6乃至7のメリットを実現できる。ま
た、変換テーブルはプロセッサの持つプログラムメモリ
やデータメモリを利用できるため、さらにコスト削減が
可能となる。
【図面の簡単な説明】
【図1】この発明にかかるSIMD型プロセッサの全体
構成を示すブロック図である。
【図2】この発明が適用されるSIMD型プロセッサの
内部構成を示すブロック図である。
【図3】この発明の実施の形態にかかるSIMD型プロ
セッサのプロセッサエレメントを示すブロック図であ
る。
【図4】この発明の実施の形態にかかるSIMD型プロ
セッサのプロセッサエレメントを示すブロック図であ
る。
【図5】この発明の実施の形態にかかるSIMD型プロ
セッサの要部を示すブロック図である。
【図6】この発明の他の実施の形態にかかるSIMD型
プロセッサの要部を示すブロック図である。
【図7】この発明の更に他の実施の形態にかかるSIM
D型プロセッサの要部を示すブロック図である。
【図8】この発明の実施の形態にかかるSIMD型プロ
セッサの他のプロセッサエレメントを示すブロック図で
ある。
【図9】図8のプロセッサエレメントを用いたこの発明
の実施の形態にかかるSIMD型プロセッサの要部を示
すブロック図である。
【図10】図8のプロセッサエレメントを用いたこの発
明の他の実施の形態にかかるSIMD型プロセッサの要
部を示すブロック図である。
【図11】図8のプロセッサエレメントを用いたこの発
明の更に他の実施の形態にかかるSIMD型プロセッサ
の要部を示すブロック図である。
【図12】プログラムによって変換後データを送出する
場合のプログラムを示す図である。
【図13】プログラムによって変換後データを送出する
場合のプログラムを示す図である。
【図14】プログラムによって変換後データを送出する
場合のプログラムを示す図である。
【図15】プログラムによって変換後データを送出する
場合のプログラムを示す図である。
【図16】この発明が適用される他のSIMD型プロセ
ッサの全体構成を示すブロック図である。
【図17】この発明にかかる画像処理装置を示すブロッ
ク図である。
【図18】入力用FIFOの一例を示すブロック図であ
る。
【図19】出力用FIFOの一例を示すブロック図であ
る。
【符号の説明】
2 グローバルプロセッサ 3 プロセッサエレメントブロック 3a プロセッサエレメント 100、200,300 プロセッサエレメント 101 変換後データを記憶するレジスタ 102 変換前データを記憶するレジスタ 106 変換後データ取得回路
───────────────────────────────────────────────────── フロントページの続き (72)発明者 福島 正展 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 中村 圭治 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 片山 貴雄 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 岩永 和彦 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 高藤 浩資 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 Fターム(参考) 5B045 AA01 BB12 BB28 BB35 BB47 GG14 5B057 CE20 CH04 CH20

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 プログラムを解読しプロセッサ全体を制
    御するグローバルプロセッサと、データを処理するプロ
    セッサエレメントを複数個備えて構成されるプロセッサ
    エレメントブロックと、を有する並列プロセッサにおい
    て、各プロセッサエレメントは、変換前データを記憶す
    るレジスタと、データバスから送られてくる変換後デー
    タを記憶するレジスタと、データバスから送られてくる
    データが記憶されている変換前データに相当する変換後
    データか判別する手段と、を備え、前記判別手段の結果
    に基づき前記変換後データをレジスタに記憶させること
    を特徴とする並列プロセッサ。
  2. 【請求項2】 前記判別手段は、加算器と、加算器の加
    算結果を記憶するレジスタと、加算結果を記憶するレジ
    スタの内容と変換前データを記憶するレジスタの内容を
    比較する比較器と、を備え、前記比較器により両レジス
    タの内容が一致すると、データバスから送られてくる変
    換後データをレジスタに格納させることを特徴とする請
    求項1に記載の並列プロセッサ。
  3. 【請求項3】 各プロセッサエレメントの前記変換後デ
    ータを記憶するレジスタに変換後データを格納する経路
    に接続される全プロセッサエレメント共有のデータバス
    を備え、前記データバスに対し変換後データを変換前デ
    ータの値の順に従って送出する変換後データ送出手段を
    備えたことを特徴とする請求項1又は2に記載の並列プ
    ロセッサ。
  4. 【請求項4】 前記変換後データ送出手段は、命令デコ
    ーダと、前記命令デコーダによって入力される任意の変
    換前データに対応した変換後データを前記データバスに
    送出する記憶手段と、を備えたことを特徴とする請求項
    3に記載の並列プロセッサ。
  5. 【請求項5】 前記変換後データ送出手段は、加算器と
    前記加算器器の加算結果を記憶するレジスタと、前記レ
    ジスタによって入力される任意の変換前データに対応し
    た変換後データを前記データバスに送出する記憶手段
    と、を備えたことを特徴とする請求項3に記載の並列プ
    ロセッサ。
  6. 【請求項6】 前記変換後データを記憶するレジスタを
    n(n=2のべき乗)個持ち、プロセッサ外部から与え
    られる変換後データを前記変化後データを記憶するレジ
    スタに格納する経路をn本それぞれ持つことを特徴とす
    る請求項1又は2に記載の並列プロセッサ。
  7. 【請求項7】 各プロセッサエレメントの前記変換後デ
    ータを記憶するn(n=2のべき乗)個のレジスタに変
    換後データを格納する経路に接続される全プロセッサエ
    レメント共有のデータバスをn本備え、前記データバス
    に対し、変換後データを変換前データの値の順に従って
    n個のデータごとに送出する変換後データ送出手段を備
    えたことを特徴とする請求項6に記載の並列プロセッ
    サ。
  8. 【請求項8】 前記n(n=2のべき乗)本のデータバ
    スに対して変換後データを変換前のデータの値の順に従
    って送出する手段として、命令デコーダと、前記命令デ
    コーダによって入力される任意の変換前データに対応し
    n個の変換後データを前記データバスに送出する記憶手
    段と、を備えたことを特徴とする請求項6又は7に記載
    の並列プロセッサ。
  9. 【請求項9】 前記n(n=2のべき乗)本のデータ
    バスに対して変換後データを変換前のデータの値の順に
    従って送出する手段として、加算器と前記加算器器の加
    算結果を記憶するレジスタと、前記レジスタによって入
    力される任意の変換前データに対応したn個の変換後デ
    ータを前記データバスに送出する記憶手段とを備えたこ
    とを特徴とする請求項6又は7に記載の並列プロセッ
    サ。
  10. 【請求項10】 複数のプロセッサエレメントがアレイ
    状に設けられた並列プロセッサにFIFOを介して画像
    データが入力され、入力された画像データを並列演算処
    理し、演算処理された画像データがFIFOを介して並
    列プロセッサ外部に出力される画像処理装置であって、
    前記並列プロセッサの各プロセッサエレメントは、各プ
    ロセッサエレメントは、変換前データを記憶するレジス
    タと、データバスから送られてくる変換後データを記憶
    するレジスタと、データバスから送られてくるデータが
    記憶されている変換前データに相当する変換後データか
    判別する手段と、を備え、前記判別手段の結果に基づき
    前記変換後データをレジスタに記憶させることにより、
    非線形演算を行うことを特徴とする画像処理装置。
  11. 【請求項11】 前記並列プロセッサとして、請求項2
    乃至9のいずれかに記載の並列プロセッサを用いたこと
    を特徴とする請求項10に記載の画像処理装置。
JP2000302018A 2000-10-02 2000-10-02 並列プロセッサ及びそれを用いた画像処理装置 Expired - Fee Related JP3971559B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000302018A JP3971559B2 (ja) 2000-10-02 2000-10-02 並列プロセッサ及びそれを用いた画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000302018A JP3971559B2 (ja) 2000-10-02 2000-10-02 並列プロセッサ及びそれを用いた画像処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006327121A Division JP4451433B2 (ja) 2006-12-04 2006-12-04 並列プロセッサ

Publications (2)

Publication Number Publication Date
JP2002108833A true JP2002108833A (ja) 2002-04-12
JP3971559B2 JP3971559B2 (ja) 2007-09-05

Family

ID=18783458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000302018A Expired - Fee Related JP3971559B2 (ja) 2000-10-02 2000-10-02 並列プロセッサ及びそれを用いた画像処理装置

Country Status (1)

Country Link
JP (1) JP3971559B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008503822A (ja) * 2004-06-21 2008-02-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 電力管理
US8635432B2 (en) 2008-03-04 2014-01-21 Nec Corporation SIMD processor array system and data transfer method thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7327127B2 (ja) * 2019-12-04 2023-08-16 株式会社ジェイ・エム・エス 透析液供給装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008503822A (ja) * 2004-06-21 2008-02-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 電力管理
US8635432B2 (en) 2008-03-04 2014-01-21 Nec Corporation SIMD processor array system and data transfer method thereof

Also Published As

Publication number Publication date
JP3971559B2 (ja) 2007-09-05

Similar Documents

Publication Publication Date Title
US7069423B2 (en) Microcomputer
US6912638B2 (en) System-on-a-chip controller
JPH0562387B2 (ja)
JPH0545985B2 (ja)
JP2002522821A (ja) データプロセッサとデータ処理方法
US8019972B2 (en) Digital signal processor having a plurality of independent dedicated processors
JP3971535B2 (ja) Simd型プロセッサ
US5307300A (en) High speed processing unit
JP2003044273A (ja) データ処理装置及びデータ処理方法
EP0521486B1 (en) Hierarchical structure processor
US5946222A (en) Method and apparatus for performing a masked byte addition operation
JP4451433B2 (ja) 並列プロセッサ
JP2002108833A (ja) 並列プロセッサ及びそれを用いた画像処理装置
JP2683489B2 (ja) データ転送制御装置
JP4442905B2 (ja) 画像データの処理方法
JP4294190B2 (ja) 並列プロセッサ及びそれを用いた画像処理装置
JPH1153189A (ja) 演算装置、演算方法及びコンピュータ読み取り可能な記録媒体
JP2001134538A (ja) 信号処理装置
JPS623332A (ja) 情報処理装置
JP4408113B2 (ja) 信号処理方法
US6405301B1 (en) Parallel data processing
US5463747A (en) Microprogram data processor processing operand address calculation and instruction execution with common hardware
JP4413905B2 (ja) Simd型プロセッサ
JP2005301665A (ja) データ処理装置、及び、データ処理方法
US20080158238A1 (en) Format conversion apparatus from band interleave format to band separate format

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061004

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070608

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110615

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110615

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120615

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130615

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees