JPH11296494A - 複合プロセッサシステム - Google Patents

複合プロセッサシステム

Info

Publication number
JPH11296494A
JPH11296494A JP10436598A JP10436598A JPH11296494A JP H11296494 A JPH11296494 A JP H11296494A JP 10436598 A JP10436598 A JP 10436598A JP 10436598 A JP10436598 A JP 10436598A JP H11296494 A JPH11296494 A JP H11296494A
Authority
JP
Japan
Prior art keywords
processor
sub
main processor
main
local memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10436598A
Other languages
English (en)
Inventor
Masahiro Uminaga
正博 海永
Hideo Maejima
英雄 前島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10436598A priority Critical patent/JPH11296494A/ja
Publication of JPH11296494A publication Critical patent/JPH11296494A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 主プロセッサから、その処理の一部を主プロ
セッサの代わりに行う副プロセッサへ高速に転送するこ
とが可能な、また、主プロセッサと副プロセッサの競合
を少なくして、互いの処理を妨害しないようにした。 【解決手段】 主プロセッサ110と、前記主プロセッ
サの処理の一部を該主プロセッサの代わりに処理する副
プロセッサ100とを有し、主プロセッサから送出され
る書き込みデータを、該主プロセッサに接続されたデー
タ転送路(プロセッサバス)121から直接副プロセッ
サの局所メモリ102へ取り込む経路を設け、主プロセ
ッサから送出される書き込みデータを、主プロセッサの
書き込みサイクルと並行かつ同時に副プロセッサの局所
メモリに取り込む。また、局所メモリを複数のモジュー
ルに分割し、書き込みデータを取り込むモジュールと副
プロセッサの演算部からアクセスされるモジュールを異
ならせ競合をなくした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、主プロセッサと該
主プロセッサの処理の一部を実行する副プロセッサを有
する複合プロセッサシステムに関し、特に、主プロセッ
サから副プロセッサへの高速データ転送が可能な、かつ
主プロセッサと副プロセッサとの競合が少ない並列協調
処理が可能な複合プロセッサシステムに関する。
【0002】
【従来の技術】近年、大容量のデータを高速に処理する
ことが要求されるようになってきており、特に画像処理
分野では1つの汎用プロセッサだけで処理するには荷の
重い処理が多々生じてきている。特に、動画像の圧縮処
理などがその例として挙げられる。例えば、動画像の圧
縮規格MPEG1(Moving Picture Experts Group
1;CD−ROMなどへの記録を想定し転送レートは最
大1.5Mビット/秒)に準拠して動画像を圧縮しよう
とすれば、1秒間当り20億回の演算性能が必要である
といわれている。100MHzの周波数で動作する純粋なRI
SC(ReducedInstruction Set Computer;縮小命
令セット・コンピュータ)プロセッサは、1秒当り最大
で1億個の命令を処理できるが、20億回の演算処理数
または命令処理数とは大きくかけ離れている。従って、
動画像の圧縮規格MPEG1に準拠して動画像を圧縮し
ようとした場合、別のプロセッサ(以下副プロセッサ)
を追加して複数のプロセッサで処理を分担して行なう必
要がある。
【0003】上記動画像の例の場合、演算数が圧倒的に
多い部分は動きベクタの計算部分である。MPEG1な
どでは、ある時点の1枚の画像を圧縮符号化する際に、
例えば、1つ前の時点の画像(以下、参照画像という)
と現時点の画像(以下、現画像という)の差分データで
圧縮符号化する。
【0004】図2は、MPEG1などでの動きベクタの
計算処理を説明するための現画像18と参照画像19の
例を示す図である。圧縮符号化は、現画像内16×16
ピクセルの矩型領域(以下、マクロブロックという)を
単位にして行なわれる。その際、現画像18内の個別の
マクロブロックと参照画像19内の対応マクロブロック
との間で、直接差分を取るのでなく、参照画像19内矩
型領域を上下左右にいくつかずらしてみて、最も近いと
判断されるものとの差分を取る。例えば、図2におい
て、現画像18内マクロブロック10の場合、参照画像
19の矩形領域22よりも矩形領域21の方が近いと判
断される。この判断は、例えば、以下のようにして行な
われる。現画像18内の16×16のマクロブロック1
0内個別ピクセルの値と参照画像19内の16×16矩
型領域内個別ピクセルの値の差分をとった後、その絶対
値を取り、それから全ピクセルに対して総和を取る。そ
れを参照画像19内の16×16矩型領域を上下左右に
1ピクセル単位程度で8ピクセル程度順次ずらしてい
き、上記総和の値が最小となる16×16矩型領域21
が最も近い矩型領域と判断する、などである。従って、
この判断には大量の演算が必要である。
【0005】尚、矩型領域のずれの程度、これは矩型領
域内の物体が動いたと解釈すれば動きの程度を示すもの
で“動きベクタ”と呼ばれているが、動いた矩型領域と
現マクロブロックとの差分を符号化し、さらに動きベク
タを符号化すれば、それを復号化することができるし、
符号化前のデータに0に近いものが増えて、符号化効率
(圧縮率)を向上させることが可能になる。
【0006】
【発明が解決しようとする課題】以上説明したことか
ら、動画像の圧縮規格MPEG1に準拠して動画像を圧
縮しようとした場合、演算量が大量になるため一般的な
機能を遂行する主プロセッサに加え、例えば動きベクタ
を計算する副プロセッサを追加することが考えられる。
しかし、この場合、単純に副プロセッサを追加するだけ
で全てが解決するという訳ではない。その理由は、主プ
ロセッサのデータアクセスと副プロセッサのデータアク
セスが競合して、副プロセッサの追加が期待する程には
有効ではない場合がしばしばあり得るからである。特
に、主プロセッサ側でデータ群を生成し、それらデータ
群を副プロセッサ側が使用して何らかの処理を遂行する
ような用途では主プロセッサの主メモリアクセスと副プ
ロセッサの主メモリアクセスによるバスの競合が生じ、
性能劣化が起こる。
【0007】一般に、マルチプロセッサシステムにおい
て、バス競合での性能劣化を回避するために、プロセッ
サ対応にコピーバックキャッシュを設けることが行われ
ている。しかしマルチプロセッサのコピーバックキャッ
シュは制御が複雑になる。コピーバックキャッシュの特
徴は、書き込み時にキャッシュ内の写しは更新するが主
メモリ内の原本はできるだけ更新しない、という点にあ
る。この状況は、キャッシュ内の写しに最新の値が格納
されていて主メモリ内の原本には古い値が格納されると
いう不一致状態を許すことになる。そしてマルチプロセ
ッサでこの不一致の状況を許せば、データの無矛盾性を
保証するのが極端に難しくなる。例えば、プロセッサA
とプロセッサBからなるマルチプロセッサにおいて、プ
ロセッサA側のキャッシュ内に写しがあってそれが最新
であったとき、プロセッサBがその対応位置に値を書き
込む場合を考える。1つの方式では、まず、プロセッサ
Aの写しをプロセッサB側にコピーし、そこを書き込み
により最新の値にするとともに、プロセッサA側の写し
を無効化するなど、制御が複雑になる。このように制御
が複雑になるのは、一般に、マルチプロセッサが汎用性
を追及していること、および、個々のプロセッサがメモ
リ内の任意の位置にデータの書き込みができるようにし
ていることが主原因である。
【0008】本発明の目的は、主プロセッサから、該主
プロセッサの処理の一部を該主プロセッサの代わりに行
う副プロセッサへ高速に転送することが可能な複合プロ
セッサシステムを提供することである。また、本発明の
他の目的は、主プロセッサと副プロセッサの競合を少な
くして、互いの処理を妨害しないようにした複合プロセ
ッサシステムを提供することである。
【0009】
【課題を解決するための手段】本発明は、専用の処理を
行なう副プロセッサの処理対象データは、副プロセッサ
が処理を行なう前に主メモリ内の特定領域内に予め設定
されるという事実に着目し、副プロセッサ側で主プロセ
ッサが主メモリをアクセスするのを監視して、主プロセ
ッサが主メモリに書き込むデータのうち、副プロセッサ
で必要なデータのみを直接取り込むようにした。これに
より、副プロセッサ処理が主プロセッサ処理に及ぼす影
響を最小化できる。さらに、副プロセッサ内局所メモリ
を複数のモジュールに分割し、主プロセッサからのデー
タ取り込み領域と副プロセッサが演算でアクセスする領
域とを同一の時間間隔では別のモジュールに配置するよ
うにし、データ取り込み処理と演算処理が局所メモリア
クセスで競合するのを回避した。これにより、データ取
り込み処理と演算処理を並列動作可能になり、処理スピ
ードが向上される。
【0010】
【発明の実施の形態】まず、発明の実施に必要な基本的
な機構について説明しておく。 <メモリマップドI/O>ここでのメモリマップドI/
Oとは、アドレス空間の一部をI/Oに割り当て、その
部分のアドレスに対して読み書きを行なうことでI/O
と情報のやり取りをする方式のことである。メモリマッ
プドI/O方式によれば、例えば、副プロセッサ内にコ
マンドレジスタと状態レジスタがあるとして、その2つ
のレジスタがメモリマップされているとする。主プロセ
ッサがコマンドレジスタに対して特定の値を書き込むと
副プロセッサが動作を始める。そして副プロセッサは動
作の状況を状態レジスタに設定していく。主プロセッサ
は状態レジスタの内容を読み取ることで、副プロセッサ
の処理状態を認識できる。
【0011】<特定領域の指定法>特定領域の指定は、
アドレスパターンを指定するものとする。例えば、16
進数「0xFFFC0000(C言語の記述法)」で32ビットア
ドレスの上位14ビットをアドレス監視の対象とし、1
6進数「0x00EC0000」でアドレスパターンを指定するも
のとする。この例の場合、アドレス「0x00EC0004」は取
り込み対象アドレスで、アドレス「0x00AA0004」は取り
込み対象外である。
【0012】<I/O空間に割り当てられたレジスタ>
I/O空間には以下のレジスタが割り当てられる。 名称 アドレス 内容 コマンドレジスタ 「0x1F000000」 値の取り込みの開始や起動開始の指示 状態レジスタ 「0x1F000004」 処理の実行状態を示す マスクレジスタ 「0x1F000008」 取り込みアドレス指示のためのマスク パターンレジスタ 「0x1F00000C」 取り込みアドレスパターン
【0013】次に、本発明の複合プロセッサシステムに
ついて図面を用いて詳細に説明する。図1は、本発明の
複合プロセッサシステムの基本概念図である。同図に示
すように、本発明の複合プロセッサシステムは、主プロ
セッサ110,副プロセッサ100,キャッシュ12
0,主メモリ130から構成されている。副プロセッサ
100は、取り込み部101,局所メモリ102,演算
部105から構成されている。副プロセッサ100内の
取り込み部101は、主プロセッサ110がキャッシュ
120を経由して主メモリアクセスするのを監視し、必
要なデータを局所メモリ102へ取り込むように構成さ
れている。また、演算部105は、局所メモリ102か
らデータを取り出し、必要に応じて局所メモリ102を
作業領域として用いて所定の演算を行う。
【0014】以下、図面を用いて、取り込み部101に
よる主プロセッサ100からのデータの取り込みと演算
部105による演算を逐次的に行う、すなわち、主プロ
セッサ110と副プロセッサ100が逐次的に処理を行
う逐次処理の実施例(第1の実施例)、および取り込み
部101による主プロセッサ100からのデータの取り
込みと演算部105による演算を平行して行う並列処理
(並列協調処理)の実施例(第2の実施例)を詳細に説
明する。
【0015】(第1の実施例)まず最初に、取り込み部
101による主プロセッサ100からのデータの取り込
みと演算部105による演算を逐次的に行う逐次処理の
実施例を説明する。図3は、第1の実施例における複合
プロセッサシステムの構成例を示す図である。主プロセ
ッサ110、キャッシュ120、主メモリ130、プロ
セッサバス121、メモリバス132は通常のシングル
プロセッサに対応するものである。本実施例における副
プロセッサ100は、取り込み部101,局所メモリ1
02,演算部105,バスアクセス部109,コマンド
レジスタ147,パターンレジスタ148,マスクレジ
スタ149からなる。
【0016】取り込み部101はプロセッサバス121
から選択的にデータを取り込み、局所メモリ102に格
納するものである。バスアクセス部109はメモリバス
132を介して主メモリ130や主プロセッサ110と
副プロセッサ100内レジスタ(コマンドレジスタ14
7,パターンレジスタ148,マスクレジスタ149)
との間でデータ転送を行なうものである。バスアクセス
部109および取り込み部101により、主プロセッサ
110からパターンレジスタ148(アドレスパター
ン)やコマンドレジスタ147へデータを転送したり、
また副プロセッサ100内の演算部105で生成したデ
ータを主メモリ130内に格納することが可能である。
局所メモリ102は通常のメモリであり、取り込み部1
01からのデータの格納,演算部105からのデータの
格納,格納データの取り出しが可能である。局所メモリ
102は、取り込み部101が格納し演算部105が取
り出して演算に使用する取り込み領域103、および、
演算部105が作業に使用する作業領域104を有して
いる。
【0017】次に、逐次処理の場合の動作例を説明す
る。最初、副プロセッサ内の取り込み部101と演算部
105は停止していて、バスアクセス部109のみが活
性化されている。局所メモリ102内の一部分は取り込
み領域103に対応している。主プロセッサ110がキ
ャッシュ120とメモリバス132を経由して副プロセ
ッサ100内の3つのレジスタに値を書き込む。1つは
マスクレジスタ149、次の1つはパターンレジスタ1
48へのもので、取り込み対象領域の先頭アドレスを特
定するような値である。残りはコマンドレジスタ147
へのものである。そしてその後、取り込み対象領域13
1へデータ群を設定していく。
【0018】取り込み部101は、コマンドレジスタ1
47の特定ビットが1になると動作を開始して、主プロ
セッサ110からキャッシュ120へのデータ転送を監
視し、そのアドレスが取り込み対象領域131内である
場合にのみ、局所メモリ102にその転送データを書き
込む。局所メモリ102への格納アドレスは、監視した
ときの検出アドレスとマスクレジスタ内容の0/1を反
転したものとのANDをとったアドレスである。例え
ば、マスクレジスタの値が16進数「0xFFFC0000」(C
言語の記述法)で、取り込み対象アドレスが「0x00EC00
04」の場合、局所メモリアドレスは「0x0000004」とな
る。
【0019】以上のようにして、転送データを局所メモ
リ102に取り込んだ後、主プロセッサ110は、キャ
ッシュ120とメモリバス132を経由して副プロセッ
サ100内のコマンドレジスタ147へある値を書き込
む。この場合のある値とは、取り込み部101を停止さ
せ、演算部105を起動するための値である。その後、
主プロセッサ110は、副プロセッサ100の演算完了
を待つ。
【0020】副プロセッサ100側では、取り込み部1
01は取り込み監視を停止し、代わりに、演算部105
が演算処理を開始する。そして、演算部105は、局所
メモリ102内の取り込んだデータ群に対し、所望の演
算を施し、必要に応じて局所メモリ102の作業領域1
04を利用しながら、演算の結果を得る。例えば、取り
込んだデータがMPEG1の動画像で、演算が動きベク
タの計算で、動きベクタの群が局所メモリの作業領域に
設定されたとする。演算部105は結果のデータ群をメ
モリバス132を経由して主メモリ130に転送するよ
うにバスアクセス部109に依頼し、バスアクセス部1
09がその処理を行なう。結果のデータ群は、取り込み
部101から取り込まれたデータ群に較べ2桁程度少な
い数であり、いちいちメモリバス132を経由したとし
ても性能的にはあまり問題とならない。データ群の転送
を終了した後、演算部105は、演算部105内の状態
レジスタ106に演算完了のビットを立てて、動作を休
止する。
【0021】主プロセッサ110側では、適当な時間間
隔でメモリバス132を経由して状態レジスタ106の
内容を監視(ポーリング)している。従って、演算部1
05が演算完了を状態レジスタ106に設定した場合
に、それを検出して次のデータのまとまりに対する処理
に進むことができる。すなわち、次のデータのまとまり
を処理するために、前述の手順と同様に、主プロセッサ
110は、副プロセッサ100内のコマンドレジスタ1
47にメモリバス132を経由して所望の値を書き込
み、取り込み部101の動作を再開させ、主プロセッサ
110自体は取り込み対象領域131へのデータ転送を
再開する。
【0022】以上説明したように、本実施例によれば、
主プロセッサがデータ群を主メモリに格納する際に、副
プロセッサがその処理に必要なデータ群を同時に取り込
むことができるので、データ群を主メモリに格納する動
作と副プロセッサがデータ群を取り込む動作を別々に
(時系列的に)行う場合に比較して処理スピードを向上
させることが可能となる。
【0023】(第2の実施例)次に、取り込み部101
による主プロセッサ110からのデータの取り込みと演
算部105による演算処理を平行して行う並列処理、す
なわち、主プロセッサ110と副プロセッサ199が並
列協調動作する実施例を説明する。本実施例は、副プロ
セッサ内の取り込み部からの局所メモリアクセスと副プ
ロセッサ内演算部からの局所メモリアクセスを並列動作
させるのがキーポイントである。そのために、局所メモ
リを、例えば、4つのモジュールに分割し、ある時間間
隔でみると、取り込み部101がアクセスする部分を1
つのモジュールに限定し、演算部がアクセスする部分を
残りの3つのモジュールに限定するようにすればよい。
以下、1つのモジュールのメモリ容量が64kバイトと
して説明する。
【0024】図4は、第2の実施例における副プロセッ
サ500の構成例を示す図である。同図に示すように、
副プロセッサ500は、取り込み部501,局所メモリ
502,状態レジスタ106を有する演算部505,バ
スアクセス部109,コマンドレジスタ147,パター
ンレジスタ148,マスクレジスタ149から構成さ
れ、前述した第1の逐次処理の実施例とほぼ同様の構成
を有するが、局所メモリ502が4つのモジュールに分
離されているところが大きく異なる。取り込み部501
は、アドレス監視を逐次処理の実施例と同様に行うが、
取り込みアドレスを検出した際にアドレスパターンによ
って起動すべきメモリモジュールを選択する点が異なっ
ている。
【0025】本例におけるメモリモジュールの選択は以
下のように行われる。 アドレスパターンが「0x00EC****」の場合は、第0モジ
ュールを選択 アドレスパターンが「0x00ED****」の場合は、第1モジ
ュールを選択 アドレスパターンが「0x00EE****」の場合は、第2モジ
ュールを選択 アドレスパターンが「0x00EF****」の場合は、第3モジ
ュールを選択 従って、主プロセッサ110が、取り込み領域131を
適当に分割した内の1つに順次にデータを格納している
場合、取り込み部501はそれらを1つの局所メモリモ
ジュールに順次に取り込んでいくようにできる。そし
て、演算部505が残りの3つのメモリモジュールにの
みアクセスするのであれば、取り込み部501と演算部
505で局所メモリアクセスにともなう競合は発生しな
い。本実施例は、このアクセス原理を利用したものであ
る。
【0026】次に、第2の実施例の並列強調処理の場合
の動作例を説明する。まず最初に、副プロセッサ500
内の取り込み部501と演算部505は停止していて、
バスアクセス部109のみが活性化されている。局所メ
モリ502内のある部分は取り込み領域131に対応す
る。主プロセッサ110がキャッシュ120とメモリバ
ス132を経由して副プロセッサ500内の3つのレジ
スタに値を書き込む。1つはマスクレジスタ149、次
の1つはパターンレジスタ148へのもので、取り込み
対象領域の先頭アドレスを特定するような値である。最
初の値は第0モジュールへの取り込みになるものとして
おく。残りはコマンドレジスタ147へのものである。
そして取り込み対象領域へデータ群を設定していく。た
だし、アドレスパターンは「0x00EC****」のもののみと
する。
【0027】取り込み部101は、コマンドレジスタの
特定ビットが1になると動作を開始する。主プロセッサ
110からキャッシュ120へのデータ転送を監視し、
そのアドレスが取り込み対象領域131内のものかどう
かを判別し、取り込み対象領域131内のものであれ
ば、局所メモリ502にその値を書き込む。このときの
局所メモリ502への格納アドレスは、監視したときの
検出アドレスとマスクレジスタ内容の0/1を反転した
ものとのANDをとったアドレスである。例えばマスク
レジスタの値が16進数「0xFFFC0000」(C言語の記述
法)で、取り込み対象アドレスが「0x00EC0004」であれ
ば、局所メモリアドレスは「0x0000004」となる。そし
てこれらは、局所メモリの第0モジュールへの取り込み
となる。このような取り込みの後、主プロセッサ110
がキャッシュ120とメモリバス132を経由して副プ
ロセッサ500内のコマンドレジスタ147へある値を
書き込む。今度は、取り込み部501に加え、演算部5
05を起動する値である。そして、主プロセッサ110
はアドレスパターン「0x00ED****」の領域にデータを格
納していく。そして、格納が終わると副プロセッサ50
0の演算終了を待つ。
【0028】副プロセッサ500側では、取り込み部5
01は取り込み監視を継続する。そして今度は局所メモ
リ第1モジュールへの取り込みとなる。このとき、演算
部505は演算処理を開始し、先に取り込んだ局所メモ
リ第0モジュール内の値群に対し、所望の演算を施し、
その場合に必要に応じて局所メモリ502内の作業領域
(第2、第3モジュール)を利用して演算の結果を得
る。このとき、取り込み部501は第1モジュール1へ
のアクセスであり、演算部505は第0,第2,第3モ
ジュールへのアクセスであり、両者が競合することはな
い。
【0029】ここで、取り込み部501で取り込んだデ
ータがMPEG1の動画像で、演算部505による演算
が動きベクタの計算で、動きベクタの群が局所メモリの
作業領域に設定されるものとする。演算部505は結果
のデータ群をメモリバス132を経由して主メモリ13
0に転送するようにバスアクセス部109に依頼し、バ
スアクセス部109がその処理を行なう。結果のデータ
群は取り込み部501で取り込まれたデータ群に較べ2
桁程度少ない数であり、いちいちメモリバス132を経
由しても性能的にはあまり問題とならない。データ群の
転送を終えると演算部505は状態レジスタ106に演
算完了のビットを立てて、動作を休止する。
【0030】主プロセッサ110側では、適当な時間間
隔でメモリバス132を経由して状態レジスタ106の
内容を監視(ポーリング)している。従って、演算部5
05が演算完了を状態レジスタ106に設定した場合に
演算完了を検出でき、次のデータのまとまりに対する処
理に進むことができる。すなわち、次のデータのまとま
りを処理するために、前述の手順と同様に、主プロセッ
サ110は、副プロセッサ500内のコマンドレジスタ
147にメモリバス132を経由して所望の値を書き込
み、取り込み部501の動作を再開させ、主プロセッサ
110自体は取り込み対象領域131へのデータ転送を
再開する。今度は、主プロセッサ110はアドレスパタ
ーン「0x00FC****」へデータの格納し、取り込み部50
1はそれらを第0モジュールに取り込み、演算部505
は第1,第2,第3モジュールへアクセスすることにな
る。以上が、主プロセッサと副プロセッサが並列協調動
作する第2の実施例である。
【0031】以上説明したように、本実施例によれば、
上述した第1の実施例の効果に加えて、局所メモリを複
数のモジュールに分割しておくことにより、取り込み部
と演算部からの並列アクセスが可能となり、処理スピー
ドをさらに向上させることができる。
【0032】
【発明の効果】以上説明したように、本発明によれば、
主プロセッサがデータ群を主プロセッサが格納する際
に、副プロセッサに必要なデータ群を副プロセッサが同
時に取り込むことができるので、副プロセッサへのデー
タ群取り込み処理時間を削減でき、処理スピードを向上
できる。さらに並列協調動作することにより、主プロセ
ッサと副プロセッサが並列に動作できるので、処理スピ
ードをさらに向上させることができる。
【図面の簡単な説明】
【図1】本発明の複合プロセッサシステムの基本概念図
である。
【図2】MPEG1などでの動きベクタの計算処理を説
明するための現画像と参照画像の例を示す図である。
【図3】本発明の第1の実施例における複合プロセッサ
システムの構成例を示す図である。
【図4】本発明の第2の実施例における副プロセッサの
構成例を示す図である。
【符号の説明】
10:マクロブロック、18:現画像、19:参照画
像、21、22:矩形領域、100:副プロセッサ、1
01:取り込み部、102:局所メモリ、103:取り
込み領域、104:作業領域、105:演算部、10
6:状態レジスタ、109:バスアクセス部、110:
主プロセッサ、120:キャッシュ、121:プロセッ
サバス、130:主メモリ、131:取り込み対象領
域、147:コマンドレジスタ、148:パターンレジ
スタ、149:マスクレジスタ、500:副プロセッ
サ、501:取り込み部、502:局所メモリ、50
5:演算部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 主プロセッサと、前記主プロセッサの処
    理の一部を該主プロセッサの代わりに処理する副プロセ
    ッサとからなる複合プロセッサシステムにおいて、 前記主プロセッサから送出される書き込みデータを、該
    主プロセッサに接続されたデータ転送路から直接前記副
    プロセッサの局所メモリへ取り込む経路を設けたことを
    特徴とする複合プロセッサシステム。
  2. 【請求項2】 前記主プロセッサから送出される書き込
    みデータを、前記主プロセッサの書き込みサイクルと並
    行かつ同時に前記副プロセッサの局所メモリに取り込む
    ようにしたことを特徴とする請求項1記載の複合プロセ
    ッサシステム。
  3. 【請求項3】 前記副プロセッサの局所メモリを複数の
    モジュールに分割し、前記主プロセッサから書き込みデ
    ータを取り込むモジュールと前記副プロセッサの演算部
    からアクセスされるモジュールを異ならせ、前記書き込
    みデータの取り込みと前記演算部からのアクセスを同時
    に行うことを可能としたことを特徴とする請求項1また
    は2記載の複合プロセッサシステム。
  4. 【請求項4】 前記副プロセッサは、動画像圧縮動きベ
    クトル計算を行うことを特徴とする請求項1,2,また
    は3記載の複合プロセッサシステム。
JP10436598A 1998-04-15 1998-04-15 複合プロセッサシステム Pending JPH11296494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10436598A JPH11296494A (ja) 1998-04-15 1998-04-15 複合プロセッサシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10436598A JPH11296494A (ja) 1998-04-15 1998-04-15 複合プロセッサシステム

Publications (1)

Publication Number Publication Date
JPH11296494A true JPH11296494A (ja) 1999-10-29

Family

ID=14378804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10436598A Pending JPH11296494A (ja) 1998-04-15 1998-04-15 複合プロセッサシステム

Country Status (1)

Country Link
JP (1) JPH11296494A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002086816A1 (en) * 2001-04-20 2002-10-31 Digital Vision Ab Method for processing a stream of pictures
JP2005346708A (ja) * 2004-05-26 2005-12-15 Arm Ltd データ処理装置およびそのポーリング・ループ管理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002086816A1 (en) * 2001-04-20 2002-10-31 Digital Vision Ab Method for processing a stream of pictures
JP2005346708A (ja) * 2004-05-26 2005-12-15 Arm Ltd データ処理装置およびそのポーリング・ループ管理方法
JP4738891B2 (ja) * 2004-05-26 2011-08-03 エイアールエム リミテッド データ処理装置およびそのポーリング・ループ管理方法

Similar Documents

Publication Publication Date Title
US4794521A (en) Digital computer with cache capable of concurrently handling multiple accesses from parallel processors
US8108622B2 (en) Memory management system and image processing apparatus
US7500061B2 (en) Preload controller, preload control method for controlling preload of data by processor to temporary memory, and program
KR100538727B1 (ko) 멀티 프로세서 시스템
US5297281A (en) Multiple sequence processor system
JP2006048164A (ja) 情報処理装置およびソフトウェアプリフェッチ制御方法
JPH1049428A (ja) 演算処理機能付メモリlsiとそれを用いる主記憶システム及びその制御方法
JP5853217B2 (ja) プロセッサ
US20220188038A1 (en) Memory access
KR100281007B1 (ko) 마이크로 프로세서 및 이를 사용한 그래픽처리 장치 및 그래픽처리 방법
JPH09138778A (ja) セマフォ命令用のセマフォ・バッファを用いた装置と方法
JP2006520044A (ja) データフローアプリケーションを処理するために最適化されるキャッシュを備えるデータ処理システム
JPH11296494A (ja) 複合プロセッサシステム
JPH03175548A (ja) マイクロプロセッサ及びアドレス制御方式
JP3818172B2 (ja) マルチプロセッサシステム、プロセス制御方法、および、プロセス制御プログラム
JP3814283B2 (ja) マイクロプロセッサ
JP2918601B2 (ja) 動画処理装置
JP2000029788A (ja) キャッシュメモリシステム及びそれに用いるキャッシュ制御方法並びにその制御プログラムを記録した記録媒体
JP2846536B2 (ja) マルチプロセッサ
JPH08161226A (ja) データ先読み制御方法,キャッシュ制御装置およびデータ処理装置
JP2000194554A (ja) 演算処理装置
JP2001022581A (ja) データ処理装置及びコンピュータ読み取り可能な記憶媒体
CN116244005A (zh) 一种多线程异步数据传输系统及方法
JPH0219495B2 (ja)
JP2006260590A (ja) 図形処理装置およびその使用方法ならびにマイクロプロセッサ