JPH06274608A

JPH06274608A - マルチプロセッサ画像処理装置

Info

Publication number: JPH06274608A
Application number: JP6434493A
Authority: JP
Inventors: Fumio Nagasaka; 文夫長坂
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1993-03-23
Filing date: 1993-03-23
Publication date: 1994-09-30

Abstract

(57)【要約】【目的】複数プロセッサを用いた画像処理装置におい
て、個々のプロセッサに分担させる処理の負荷の最適化
を図り、能力を最大限利用した処理を実現する。【構成】画像処理に関する基本操作の処理手順を含む
画像処理ライブラリ７２が、個々の処理毎に処理時間算
定手段１を持つ。画像処理を行なう仮想機械プロセス６
は、実際の画像処理に先だって見積りモードでライブラ
リ呼び出しを実行し、処理単位について予め処理時間の
見積りを行なう。この値はカウンタ２に記録される。実
際のプロセッサへの処理分散は処理分散手段４がこの処
理時間の見積り値により各プロセッサの負荷が均等にな
る様に行なう。各プロセッサの負荷分担は、この見積り
値の累積値としてプロセッサ管理テーブル３に記録され
る。処理分散手段４は各プロセッサへの負荷配分、処理
結果受信を管理し、処理装置全体としては複数のプロセ
ッサの能力を効率よく利用した処理が実現される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、複数のプロセッサ間
で通信を行なうことによって処理の分散、および並列実
行、同期を実現し、所定の処理を行なうマルチプロセッ
サ装置に関する。特に画像処理技術に応用されるマルチ
プロセッサ装置の個々のプロセッサへの最適な負荷分散
を行なう技術に関連する。

【０００２】

【従来の技術】以下の文中において、「プロセッサの負
荷」の意味を明らかにするため、説明を加える。

【０００３】与えられた処理をプロセッサが行なう時、
処理開始から完了までに、のべ何マシンサイクルのプロ
セッササイクルを必要とするかによって、対象処理の処
理時間が決められる。通常、稼働中のプロセッサは停止
することなく、連続して、１マシンサイクル毎に１個な
いし数個の機械語命令を実行し続けるものであるから、
機械語実行という視点から見て、プロセッサに（電気的
な意味での）負荷の変動が起きる事は無い。

【０００４】しかし、プロセッサを応用した情報処理装
置には、複数プログラムの実行や、入出力装置のプログ
ラム間の共用、あるいは周辺装置の資源としての最適利
用などを目的とするオペレーティングシステムを持つも
のが有る。これら特定の情報処理装置（特にコンピュー
タ装置）において、動作時間はオペレーティングシステ
ムが何らかの処理要求を受け付けて、この目的処理のた
めのプログラムを実行する時間と、次の処理要求を受け
取るまでの待機時間、あるいは並行して実行する他の処
理へ切り替えるためのプログラム切り替え処理時間など
の総和である。

【０００５】今、待機時間およびオペレーティングシス
テムの動作時間（プログラム切り替え処理時間など）に
比較して、「要求される処理」の処理時間が長大である
時、この装置の負荷が大きいと表現する。

【０００６】プロセッサ装置の負荷が大きい場合、新た
に別の処理要求を投入しても、これが処理され結果の得
られるまでの時間は長くなる不都合が生じる場合が多
い。極端にプロセッサ装置の負荷が高まった場合は、入
出力装置などの周辺装置を有効に利用するためのオペレ
ーティングシステムの処理にも遅滞を生じ、周辺装置の
性能を有効に利用できない不都合が生じる。特にこの傾
向はマイクロプロセッサ装置を使用したワークステーシ
ョン、パーソナルコンピュータ等において顕著である。

【０００７】さらに従来の技術について説明する。

【０００８】画像処理の応用分野に、ワークステーショ
ンあるいはパーソナルコンピュータを用いる場合、高密
度、多諧調のデータに対しては、現在のマイクロプロセ
ッサ装置の処理速度は充分とは言えない。処理速度不足
の問題点を改善する目的で発明された従来技術として、
「目的処理を複数の処理部分に分割して複数個のプロセ
ッサを用いて並列処理する事によって処理速度の高速化
を図る」技術がある。

【０００９】この技術では各プロセッサにかかる負荷が
最適となるように、処理部分が分割されて各プロセッサ
に配置された時、最も処理速度が向上すると考えられ
る。今、マルチプロセッサ装置を構成する各プロセッサ
の処理能力がおよそ同等であるとすれば、各プロセッサ
に均等な負荷がかかった状態が最適負荷配分であると考
える事ができる。

【００１０】もし、処理を複数の部分に分割して個々の
プロセッサに配置する以前に、各処理部分がどの程度の
負荷をプロセッサに与えるか知ることができれば、負荷
がほぼ均等になる様に処理を分散する事は容易である。
また、分散する個々の「処理単位」の必要処理時間がそ
れぞれ小さい場合、負荷配置（スケジューリング）は容
易である。この様な場合は「処理単位が細粒度であ
る。」と呼び、この反対の状態を「処理単位が粗粒度で
ある。」と呼ぶ。粗粒度の処理を最適に負荷配置する方
法は、あるプロセッサに「必要処理時間の大きい処理」
を連続して投入してしまう危険性があり、より難しいと
言える。

【００１１】汎用の計算処理応用分野を考えると、一般
的には任意の処理について、その計算の負荷を事前に知
るという手段は、極めて困難である。そのため従来技術
は、各プロセッサ装置の処理の待ち行列の長さを観測す
る等の方法を用いて、先行して実行中の処理の負荷を、
言わば外部から観測することで、負荷判定を行なってい
た。この方法について述べた従来発明として、特開昭６
３−２１１０６０号公報がある。

【００１２】

【発明が解決しようとする課題】しかし、この従来方法
は分散する予定の処理の負荷が事前では未知であるた
め、次の処理段階で負荷の最適分散が行なわれるか否か
は不定であるという問題点が有った。特に処理対象のプ
ログラムが処理の並列化を粗粒度で行なう場合、待ち行
列にある現在の処理要求の負荷が未知のまま「待ち行列
の長さ」だけを判断基準として、次の要求を配置する方
法は、危険性が大きい。

【００１３】画像処理に限って説明する。

【００１４】ある画像を複数個のプロセッサで並列に処
理しようとした時、処理の並列化の代表的な方法は、次
の２通りの方法であると考えられる。この内、本発明は
（２）の技術を対象とする。

【００１５】（１）画像が画素データの配列として与え
られる形式の場合、この画素データの配列を複数の領域
に分割して、個々の領域毎に一つのプロセッサを割り当
てる方法。

【００１６】（２）画像が図形形状の記述（曲線、多角
形など）の集合で与えられる場合、この記述を複数の操
作手順に分割し、個々の操作をそれぞれプロセッサに割
り当てる方法。

【００１７】（２）の方法では、連続した操作の中で、
並列処理することの出来ない操作が存在する。たとえ
ば、特定の領域を塗りつぶす操作では、「領域を指定す
る操作」と「塗りつぶす操作」を平行して、独立のメモ
リを持つ別々のプロセッサに分けて操作出来ないことか
らも想像できる。このために、（２）の方法では処理単
位の粒度を小さくすることの出来ない場合が多い。最も
典型的な例は、所定の画像領域を回転、拡大、縮小する
場合である。これらの操作は、いずれも必要となる処理
時間が長い操作である。

【００１８】図１４は、並列実行時に様々な「粒度」を
持つ処理単位をプロセッサに分散する場合の問題点を説
明する図である。プロセッサが処理要求を受け取る待ち
行列４１に、処理要求４２、４３、４４らがエンキュウ
されている状態を示している。ここで説明のために、各
処理単位の必要処理時間を横方向の線分の長さによって
示した。また、処理要求とは”複数の操作からなるプロ
グラムのー部分であって、並列処理のためにプロセッサ
に割り当てられた単位”に対する実行の要求である。図
中、第１の待ち行列４１の長さは３であるのに対し、第
２の待ち行列４１の長さは５である。図から明らかなよ
うに、粒度に大きなばらつきのある場合、待ち行列の長
さからプロセッサの負荷の推移を評価することは出来な
い。

【００１９】すなわち、従来発明である”各プロセッサ
の要求受け付け待ち行列の長さから、負荷判断を行な
い、処理の分散を行なう方法”は、複数の負荷の大きな
処理を特定のプロセッサに集中して配置してしまうこと
を予防できないという問題点を持つ。従来発明を用いる
と、あるプロセッサで実際に処理遅れが発生した後に、
過負荷であったことが検出されることになる。

【００２０】本発明は、上記の従来発明の問題点を鑑み
てなされたものであり、マルチプロセッサによる並列処
理を画像処理分野に用いた場合に、各プロセッサへの負
荷の最適な分散を実現し、画像処理装置の処理能力を最
大限に利用する事を目的としている。

【００２１】

【課題を解決するための手段】このような問題を解決す
るために本発明のマルチプロセッサ画像処理装置は、処
理対象の画像に関する一連の操作を複数の処理単位に分
割して、各処理単位を複数個のプロセッサに分散し、並
列に実行することによって処理速度の向上を図る装置に
おいて、画像処理に関する所定の処理要求を、複数個の
プロセッサの中から選択した一つのプロセッサにそれぞ
れ分散する処理分散手段と、予め定めた特定の画像操作
からなる実行時ライブラリと、この実行時ライブラリ中
の操作の一つ一つに対応した処理負荷の見積りを行う見
積り手段と、によって構成され、目的処理中に前記実行
時ライブラリに含まれる画像操作が呼び出される時、操
作開始に先立ち、負荷見積り手段が処理負荷を計算し、
この値を処理分散手段に通知し、また処理分散手段はこ
こで通知された値から処理単位を分散するプロセッサを
決定する事を特徴とする。

【００２２】

【作用】並列処理の応用分野の内、画像処理に限って考
えた場合、直線発生、塗りつぶし等の典型的な幾つかの
処理は、処理対象領域等の情報を用いて負荷を算定する
事が可能である。そこで本発明では、マルチプロセッサ
による並列画像処理システムの各画像処理実行プログラ
ムライブラリ毎に処理時間算定手段を用意した。これに
よって、実際の処理以前に負荷を求める事ができる。

【００２３】処理時間算定の計算は、画素発生の実際処
理よりは遥かに軽微であるため、全体の処理を妨げる事
は無い。また、事前に処理の負荷を知って処理分散を行
なう事で各プロセッサの現在の負荷、処理能力に最適な
方法で処理の配置を行なう事が可能となる。

【００２４】

【実施例】本発明に好適な実施例について、以下に図を
用いて説明を加える。説明は以下の各節に従って行う。

【００２５】１．本実施例の特徴（従来発明との違い）１．１本実施例の構成１．１．１装置全体の構成（図４、図３）１．１．２オブジェクトコード実行段階の構成（図
２）１．１．３仮想機械プロセスの構成（図２）１．１．４並列実行開始時の仮想機械プロセスの動作
概要（図２）１．２本実施例の特徴（図１、図５）２．負荷検出動作２．１本実施例の負荷計算手段（図９、図１０）３．マルチプロセッサ画像処理装置の構成と処理分散３．１並列処理の記述方法３．１．１並列処理の記述の文法（図１１、図１２、
図１３）３．１．２組み込み手続きの説明（図１２）３．２並列記述の翻訳結果（図１２、図１３、図６、
図８）３．３処理負荷の見積り動作（図７）４．他の実施例（図１５）１．本実施例の特徴（従来発明との違い）本実施例の構成を明らかにするため、図４、図３、図
２、図１の順に説明を行う。処理手順の説明には図５を
用いる。本実施例の特徴となる部分は１．２節で述べ
る。

【００２６】１．１本実施例の構成１．１．１装置全体の構成（図４、図３）図４は、一つの実施例として挙げるマルチプロセッサ画
像処理装置の処理手順の概要を説明した図である。使用
者は入力装置３７を用いてエディタ４０１を操作し、プ
ログラム言語によって画像処理内容を記述したソースフ
ァイル４０４を作成する。次に使用者は、コンパイラ４
０２を実行する。コンパイラ４０２は、ソースファイル
４０４を読み込み、プログラム言語による記述内容を翻
訳してオブジェクトファイル４０５を出力する。オブジ
ェクトファイル４０５は、所定の書式で書かれた一連の
機械語命令によって構成される。本実施例では、特定の
プロセッサの機械語を直接実行する方式に代えて、仮想
機械方式を用いた。オブジェクトファイル４０５は、こ
の仮想機械の機械語で構成される。仮想機械プロセス４
０３は、オブジェクトファイル４０５を読み取り、その
機械語命令を実行する。仮想機械プロセス４０３は、命
令語として表示処理命令があれば、表示装置３８に画像
を出力する。本実施例の仮想機械は、複数のプロセッサ
を用いて実現される。このための構成を以下に説明す
る。

【００２７】図３は、一つの実施例として挙げるマルチ
プロセッサ画像処理装置の全体の構成を示す図である。
マイクロプロセッサユニット（以下ＭＰＵ）３１、ＲＡ
Ｍ３２、ＲＯＭ３３を実装したプロセッサ基板３４が、
システムバス３５によって複数個接続される。入出力周
辺制御装置（以下Ｉ／Ｏ装置）３６もシステムバス３５
を介して接続される。

【００２８】個々のプロセッサ基板３４には、それぞれ
オペレーティングシステムが実装される。オペレーティ
ングシステムは、ＲＯＭ３２に格納され、電源立ち上げ
後、自動的に実行状態に入る。以後、一つのプロセッサ
基板３４は、オペレーティングシステムに管理される独
立した処理装置とみなして、プロセッサエレメント２０
０（ＰＥ２００）と呼ぶ。

【００２９】仮想機械プロセス４０３は、オペレーティ
ングシステムのファイル管理機能を用いて、オブジェク
トファイル４０５をＲＡＭ３２に読み込んだ後、個々の
機械語命令を実行する。仮想機械プロセス４０３、エデ
ィタ４０１等のプログラム、またオペレーティングシス
テムも作業領域としてメモリ領域を消費する。この領域
はいずれもＲＡＭ３２に配置される。個々のメモリの割
り当てはオペレーティングシステムが管理する。

【００３０】オブジェクトファイル４０５の内容につい
て説明を補足する。

【００３１】Fortran、Pascal等に代表される一般的な
プログラム言語では、文字の印字、データの入力など、
ユーザプログラムで一般的に用いられる基本操作を、使
用者がその都度書き下す不便を省くことを目的としてこ
れら基本操作をまとめたライブラリを用意する。ライブ
ラリは、所定の高級言語の文法で使用者が呼び出すこと
の出来る複数の基本的な操作（サブルーチン、プロシー
ジャ）の集合である。

【００３２】本実施例の記述言語については後述する
が、上記に類似したライブラリを用意した。本実施例の
記述言語は、応用分野が画像の記述であることから、直
線描画、曲線描画、塗りつぶし、画像回転等の画像処理
の基本操作をライブラリ化した。使用者がソースファイ
ル４０４を記述した時、必要に応じてライブラリに含ま
れる関数、プロシージャの呼び出しを記述できる。この
結果、オブジェクトファイル４０５には、ライブラリ機
能の呼び出しを行なう機械語命令が含まれる。

【００３３】１．１．２オブジェクトコード実行段階
の構成（図２）図２は本実施例のマルチプロセッサ画像処理装置におい
てプログラムの実行時の状態を説明した図である。

【００３４】一つのプロセッサエレメント２００の中で
は、オペレーティングシステム２０４（以下ＯＳ２０
４）がプログラムの実行を管理する。ＯＳ２０４が管理
するプログラムの実行単位を、これ以後「プロセス」と
呼ぶ。「プロセス」は、オペレーティングシステムにお
ける、プロセッサ資源、メモリ資源割り当ての実行時の
単位である。すなわちプロセスは、プロセスの識別子及
び実行管理、メモリ管理のための情報を含むプロセスヘ
ッダと、中断の際に現在のプロセッサのレジスタの状態
を保存するための領域と、オブジェクトコード領域、ス
タック領域からなる管理単位である。

【００３５】ＰＥ２００に実装された個々のＭＰＵ３１
は、ＯＳ２０４を実行する。ＯＳ２０４は、ＯＳ２０４
に組み込まれたスケジューラ２０５の定める手順で、複
数の応用プログラムを実行する。すなわち、スケジュー
ラ２０５は、Ｉ／Ｏ装置３６への処理で待機状態に入っ
たプロセス、または割り当ての微小時間（ここでは５ms
ec）を経過したプロセスを一時的に停止し、スケジュー
ラ待ち行列２０６の末尾に追加する。次にスケジューラ
２０５は、スケジューラ待ち行列２０６の先頭にあるプ
ロセスを取り出し、停止状態から実行状態に切り替え
る。プロセスの切り替えは、ＯＳ２０４に組み込まれた
サービスプログラム２０７が処理する。この方式によっ
てＯＳ２０４は、同時に複数のプログラムを実行する。

【００３６】使用者は、図４に示したエディタ４０１、
コンパイラ４０２、仮想機械プロセス４０３らを、同時
にＰＥ２００で実行して良い。図２は、仮想機械プロセ
ス４０３の一つが実行中の状態を図示した。実行中の仮
想機械プロセス４０３を、仮想機械プロセス６として図
示する。また、他の実行中のプロセスを２０１で示す。

【００３７】１．１．３仮想機械プロセスの構成（図２）仮想機械プロセス６は、処理対象のオブジェクトファイ
ル４０５をメモリ上に読み込み実行する。メモリ上に展
開された一つのオブジェクトファイル４０５のデータを
ユーザ記述５として図示する。また、メモリ上に読み込
まれた他のオブジェクトファイル４０５のデータを、オ
ブジェクトコード２０２として図示する。仮想機械プロ
セス６の構成要素を２つに分けて説明する。一つは実際
の仮想機械語を読みとって実行する仮想機械のインター
プリタ７である。他の一つは実行時に仮想機械プロセス
６の中に確保されるシステムの資源８である。

【００３８】インタープリタ７は命令語の内容を意味理
解し、必要な処理への分岐を制御するプログラムインタ
ーフェース７１を持つ。また、インタープリタ７は画像
処理の個々の操作の処理プログラムからなるライブラリ
７２と、処理分散手段４を持つ。プログラムインターフ
ェース７１は、入力バッファからの待ち行列７１１と分
岐テーブル７１２を持つ。ユーザ記述５の中にソフトウ
ェア割り込みを引き起こす命令語があると、ＭＰＵ３１
の処理番地はプログラムインターフェース７１の所定の
番地へジャンプする。インタープリタ７は、ソフトウェ
ア割り込みの種類と引数を検査し、この引数の指定に応
じた関数、プロシージャの処理番地を分岐テーブル７１
２から決定する。次にインタープリタ７は、この番地へ
ジャンプする。この手順によって、ＭＰＵ３１の処理番
地はライブラリ内の関数、プロシージャに移動する。こ
の動作については、図６を用いて後述する。

【００３９】システムの資源８は、プロセッサ間の通信
を制御する通信手段８１、これに対する待ち行列８２を
持つ。仮想機械プロセス６は、並列実行を行なう各プロ
セッサ毎に待ち行列８２を作成する。この他システムの
資源８は、仮想機械プロセス６の作業メモリ、ファイル
からの入力バッファ等、ＯＳ２０４のサービスにより確
保した資源を含む。

【００４０】１．１．４並列実行開始時の仮想機械プ
ロセスの動作概要（図２）ユーザ記述５の中に、並列実行を引き起こす命令語が有
った場合の仮想機械プロセス６動作について説明する。

【００４１】ユーザ記述５に処理の並列化を行なう記述
が有った場合、インタープリタ７はこれを解釈し、ＭＰ
Ｕ３１の処理番地を処理分散手段４内の処理番地に書き
換える（すなわちジャンプする）。ＭＰＵ３１は処理分
散手段４を実行し、並列化する処理単位を受け取るＰＥ
２００の番号を決定する。続いて、ＭＰＵ３１は処理分
散手段４を実行し、並列化する処理単位をＰＥ２００に
対して割り当てた待ち行列８２にエンキューする。この
後、ＭＰＵ３１は、通信手段８１を実行する。通信手段
８１は、システムバス３５の空き時間を調停する装置２
０３を制御し、システムバス３５を用いて処理単位を指
定したＰＥ２００に転送する。この時、システムバス３
５の調停装置２０３の処理には、非同期的な時間の遅延
が伴う。そこで、ＭＰＵ３１は通信手段８１の処理に入
った後、処理結果を待たず、再びＯＳ２０４の処理番地
にジャンプする。ここで、ＭＰＵ３１はスケジューラ２
０５の処理を実行し、この仮想機械プロセス６を休眠さ
せ、スケジューラ待ち行列２０６から取り出した次のプ
ロセスの処理番地にジャンプする（これによって次のプ
ロセスが＜再＞走行する）。

【００４２】この結果起動された他のプロセスが、やが
て単位時間を経過するか、非同期の時間待ちで休眠する
か、いずれかの場合、更に他のプロセスが実行される。
この繰り返しの後、再びこの仮想機械プロセス６が実行
される。この時、ＯＳ２０４はＭＰＵ３１の処理番地を
仮想機械プロセス６内部の前回休眠したプログラム番地
に書き換える。これによって先に中断した通信手段８１
が再開される。通信手段８１を呼び出したインタープリ
タ７は、並列実行の処理単位が他のＰＥ２００に転送済
みであれば、次の命令語を読み取り、処理を続ける。

【００４３】１．２本実施例の特徴（図１、図５）本実施例の特徴を図１によって説明する。図１は、図２
の構成の中から、更に本実施例の特徴となる部分を取り
出し示した図である。

【００４４】ＭＰＵ３１は、仮想機械プロセス６を実行
している時、ユーザ記述５の中に画像処理ライブラリ７
２の呼び出しの命令語があると、画像処理ライブラリ７
２の中の個々の処理にジャンプする。この結果、ＭＰＵ
３１は例えば｛塗りつぶし、画像回転、拡大・縮小｝等
の操作を実行する。本実施例では、これら個々の操作は
２通りの処理モードを持っている。すなわち、実際に画
像処理の操作を行なうモード（実行モード）と、画像処
理は行なわず、処理に要する時間を見積もる計算だけを
行ない、この結果を内部のカウンタ２に記録するモード
（見積りモード）である。この目的から、画像処理ライ
ブラリ７２は、個々の操作毎に処理時間算定手段１を持
つ。

【００４５】並列して実行される一つの処理単位は、複
数の仮想機械語命令からなるプログラムの記述である。
この中に、何回かの画像処理実行時ライブラリ７２の呼
び出しが含まれているとき、あらかじめこの処理単位を
見積りモードで実行しておけば、この処理結果として、
処理時間の見積りの値がカウンタ２に積算される。処理
分散手段４は、このカウンタ２の値を処理分散先のプロ
セッサの決定に用いる。この時、処理分散手段４はどの
ＰＥ２００にどの位の規模の処理を配置したか、その累
積を記録する目的でプロセッサ管理テーブル３を使用す
る。

【００４６】処理分散手段４の処理の流れを図５を用い
て説明する。

【００４７】処理分散手段４の実行に先だってユーザ記
述５の記述内容に従い、仮想機械プロセス６が、プロセ
ス複製Ｓ５０１と、見積りモードでの実行Ｓ５０２を処
理する（この処理手順は３節に述べる）。この結果、カ
ウンタ２には、処理時間の見積り値が記録されている。
処理分散手段４は、プロセッサ番号を初期設定し（Ｓ５
０３）、プロセッサ管理テーブル３を参照して、負荷最
小のプロセッサの番号を記録する（Ｓ５０４）。この処
理は、プロセッサ番号を更新しつつ（Ｓ５０５）、全て
のプロセッサに対して行なわれる。これによって、負荷
最小であるプロセッサ番号が決定できるので、このプロ
セッサ番号を持つＰＥ２００に処理を分散する。すなわ
ちプロセッサ管理テーブル３のこのプロセッサ番号に該
当するフィールドに新たな負荷の値を加算し（Ｓ５０
６）、処理単位をＰＥ２００に転送する（Ｓ５０７）。

【００４８】以上の構成で、本実施例と従来発明の差で
あり、本実施例を特徴付けているのは、処理時間算定手
段１である。この動作を次に「２．１本実施例の負荷
計算手段」で説明する。

【００４９】２．負荷検出動作従来技術が待ち行列の長さを負荷判定の指標としていた
のに対し、本実施例は、負荷を予め求めた後に、分散先
を決定する方法を採る。この点が従来技術と、本実施例
の差である。

【００５０】２．１本実施例の負荷計算手段（図９、図１０）処理時間算定手段１の動作について説明する。

【００５１】処理時間算定手段１は、画像処理実行時ラ
イブラリ７２に含まれる処理（プロシージャ）一つにつ
き、一つずつ対応して組み込まれる。処理時間算定手段
１は、対応するプロシージャが呼び出された時、処理開
始から完了までにどの程度の処理時間を必要とするか求
める手段である。この時求める処理時間は、正確な値で
ある必要はない。また、処理時間算定手段１の目的は、
複数個のプロセッサに配置される処理の、それぞれの負
荷を知ることであるから、値は相対的な値で良い。更に
言えば、処理の規模、複雑さの程度に応じて、比例関係
を維持して数値を出力できれば目的を果たすことができ
る。

【００５２】直線発生処理の場合の負荷の見積りを図９
の流れ図を用いて説明する。直線上の画素発生はBresen
hamのアルゴリズム（J.E.Bresenham、"Algorithm for C
omputer Control of a Digital Plotter、"IBM SystemJ
ournal、Vol.4、No.1、1965）を用いる。この時、画素
発生の処理時間は、ほぼ線分の長さに比例する。しか
し、線分が画像メモリの配置に対し、水平または垂直で
ある場合、画素発生手順は大幅に簡略化できる。そこ
で、直線発生の負荷見積りは、線分が水平の場合、線分
の長さ×重みＭ１とし（Ｓ９０１）、斜線の場合は線分
の長さ×重みＭ２とし（Ｓ９０２）、垂直の場合は線分
の長さ×重みＭ３と（Ｓ９０２）した。ここで｛Ｍ１＝
１．０、Ｍ２＝９．０、Ｍ３＝１．３｝である。

【００５３】次に画像の回転の場合を説明する。例え
ば、図１０（ａ）で示した図形１００が、座標軸１０１
に対し図示の位置関係に記述されているとする。これを
図１０（ｂ）に示した様に、座標軸１０１に対して角度
φをなす別の座標軸１０２の系に写像する操作を行な
う。本実施例では、「１．１．１装置全体の構成」に
述べた通り、図形を｛直線、曲線｝と言った形状を表す
操作とそのパラメータを記述したソースファイル４０４
として与える。この方式で回転操作は、「アフィン変換
の操作の命令語」とこの引数として与える「行列の各要
素」で表される。アフィン変換の操作の対象は、曲線、
直線を与える記述（図形を発生する処理関数とその引
数）である。すなわち、実質的には、アフィン変換を経
て、曲線・直線発生の操作に対して与えるパラメータが
変更されるだけである。この結果、本実施例で実際に仮
想機械プロセス４０３を実行するプロセッサの負荷は、
アフィン変換後に変わった線分の長さに比例する。周知
の様にベジエ曲線、円弧、放物線はいずれも最終的に折
れ線近似として画素発生を行なう。このため、プロセッ
サ負荷は、実際に発生すべき直線（折れ線）の長さを求
めて、図９と同じ手順で決定できる。この値によるプロ
セッサ負荷は回転後の図形１００を囲む矩形１０３の面
積に比例しない。

【００５４】図形の拡大、縮小もアフィン変換によって
行なわれるので、負荷見積り方法は上記と同一である。
これに対し、所定領域の塗りつぶし操作は、単純に対象
領域の面積に比例する。従って、本実施例では面積を求
めることによって負荷を見積る。

【００５５】３．マルチプロセッサ画像処理装置の構成
と処理分散３．１並列処理の記述方法本実施例においては、図形発生を発生手順を示す一連の
「操作」と、この操作に対する「パラメータ」を与える
ことによって記述する。ここでプログラム言語の記述に
添って言えば、個々の「操作」は”関数”あるいは”プ
ロシージャ”と呼ばれる機構に相当する。また「操作に
対するパラメータ」は、関数、プロシージャへの”引
数”と見做すことができる。この様な、”図形発生手順
のプログラム記述への置き換え”は周知の技術である。
この種類の記述言語の典型的なものはページ記述言語と
呼ばれ、ページプリンタの制御に使用される。

【００５６】そこで本実施例はページ記述言語の方法に
ならい、プログラム言語によって図形発生手順を記述す
ることにした。説明を容易にするため、言語の文法はお
よそプログラム言語Pascalの文法に準じている。これ
に、並列処理を記述する構文、及び複数個の図形記述の
ための標準手続きを組み込んだ。

【００５７】３．１．１並列処理の記述の文法（図１
１、図１２、図１３）並列処理部分を記述する文法について説明する。周知の
ように、プログラム言語のコンパイラ・プログラムを作
成する方法は、様々な手段が開発され公知となってい
る。ここでは文法の説明のため本実施例で用いる図形記
述言語の並列記述の構文をバッカス記法に類似の記法で
図１１に示した。バッカス記法は言語の構文を”生成規
則”と呼ぶ形の文法で記述するものである。図１１は言
語全体の構文規則を示したものではなく、並列記述文
（cobegin - coend文）およびその周辺の構文規則を示
したものである。

【００５８】図１１の構文定義に従って、図１２の様な
プログラム例を記述できる。ここでcobegin文１２１か
らcoend文１２２までが並列実行の対象となる。並列処
理の単位は、//記号１２３から次の//記号１２３まで、
または//記号１２３から、otherwaize文１２４までであ
る。本実施例のコンパイラは図６のプログラム部分に対
し、図１３に示す機械語プログラムを生成する。但し図
１３は、実際の機械語のオブジェクトコードを、ディス
アセンブルした形式によって記述している。[]内の１６
進数数字は、仮想機械の命令語の値である。

【００５９】図１３のプログラムリストの中で、命令語
TRAP（図示１３１）について説明する。本実施例のコン
パイラの生成するコードでは、ライブラリに含まれる関
数及びプロシージャの呼び出しは一種のソフトウェア割
り込みによって行う。命令語TRAPは、このソフトウェア
割り込みを引き起こす命令語である。仮想機械はこの命
令語を実行すると、予め定められた特定のアドレスの値
にプログラムカウンタを書き換える。この番地に書かれ
たプログラムは、TRAP命令の引数を検査し、引数の値に
基づきライブラリ中の指定された操作を呼び出す内容で
ある。仮想機械はこのプログラムによって、ライブラリ
内の各種関数、プロシージャを呼び出し実行する。

【００６０】１３２、１３３、１３４はライブラリ呼び
出しの実装の例である。ここでは、１３２が手続き（ま
たはプロシージャ）line()の呼び出しに対応し、１３３
が手続きstroke()に、また１３４が手続きfill()に対応
する。図１２のソースコード中に現れるこれら手続きの
呼び出し文は、仮想機械語命令のBSR[0d]（サブルーチ
ン呼び出し命令）に翻訳される。引数は、この時の実行
番地から、手続きの先頭番地への相対値として与えられ
る。

【００６１】３．１．２組み込み手続きの説明（図１２）ライブラリの中にどの様な機能を組み込むべきかは、処
理系開発の目的と、記述言語の仕様によって決まる事項
である。従って、本実施例が挙げる操作は、画像処理の
操作の一例に過ぎない。図１２の記述ではライブラリに
含まれる操作の中から、｛line()、stroke()、fill()｝
を例として用いている。以下これらプロシージャについ
て説明する。

【００６２】○手続きｌｉｎｅ（ｘ１，ｙ１，ｘ２，ｙ
２）このプロシージャは、４つの整数を引数として呼び出さ
れる。上記ｘ１、y1、x2、y2には任意の整数を代入する
事ができる。このプロシージャは、現在処理中の線幅を
用いて、座標(x1,y1)から座標(x2,y2)まで直線上に画素
発生を行なう（この線分は、数学的な線分と異なり、画
素密度に応じた線幅を持つ）。

【００６３】 ○手続きstroke(N,x1,y1,x2,y2, ... ,xN,yN) このプロシージャは、可変個数の整数を引数に持つ。但
し、引数の整数は２個で一対の座標値として評価され
（リスト中の(xi,yi)）、全体の座標の個数は第１の引
数（N）として与える。故に、このプロシージャは、全
体で2N+1個の整数引数を持つ。このプロシージャは、Ｎ
個の座標からなる閉じた多角形領域を登録する（この
時、折れ線は線幅を持たないとして評価する）。

【００６４】○手続きfill() このプロシージャは引数を持たず、直前に登録された領
域があれば、この領域内部を塗りつぶす。塗りつぶしの
パターンおよび、領域の線幅には、この時点でのパター
ン、線幅を用いる。

【００６５】３．２並列記述の翻訳結果（図１２、図
１３、図６、図８）図１２のソースコードの中で、特に１２１から１２２に
示される並列記述部分がどの様に機械語に翻訳され、実
行されるかを図１３と図６を用いて説明する。一つの並
列記述文（//文１２３に続く文）は、機械語FORK[2c]に
始まりEXIT[2d]に終わる一連の記述に翻訳される。１３
５は、文１２３で始まる一行の内容を翻訳した結果の機
械語である。すでに述べた通り、この機械語記述は仮想
機械プロセス４０３によって実行される。仮想機械プロ
セス４０３の処理は図６で示す永久ループである。

【００６６】以下仮想機械プロセス４０３の処理を順次
説明する。

【００６７】まず命令語がフェッチされる（Ｓ６０
１）。この命令語がFORK[2c]であれば、プロセスの複製
が行なわれる（Ｓ５０１）。プロセスの複製は、現処理
中のユーザ記述５と全く同一のオブジェクトコードをメ
モリ上に複製し、このオブジェクトコードに関するプロ
グラムカウンタの記録を、現在処理番地に設定する処理
である。この時、FORK[2c]を実行したユーザ記述５の側
では、内部フラグを０とする。他方、複製された側は内
部フラグを１とする。

【００６８】複製された側のユーザ記述は、転送バッフ
ァに置かれ、配置先のＰＥ２００が決定した時点で、処
理分散手段４によって転送される。転送先のＰＥ２００
では、仮想機械プロセス４０３がこのユーザ記述を受け
とって処理を継続する。処理分散手段４は、命令語EVAL
[2f]の処理で実行される。これは「３．３処理負荷の
見積り動作」で述べる。

【００６９】本実施例のコンパイラ４０２は、通常FORK
[2c]に続いてEVAL[2f]命令を配置する。これを読み取っ
た場合、仮想機械プロセス４０３は、次のプログラム番
地をスタックにプッシュし、見積りモード実行のための
内部フラグを「真」にする（Ｓ６０２）。見積りモード
については「１．２本実施例の特徴」でやや述べた。
これに続いて実際の見積りモードの実行が行なわれる
（Ｓ６０３）。見積りモードの実行が完了すると、見積
りモード実行のための内部フラグを「偽」とし、プログ
ラムカウンタの値をスタックから取り出す（Ｓ６０
４）。

【００７０】これによって通常の実行状態に戻り、処理
が続く。次に実行される命令はBEQ[0c]である。この命
令は内部フラグが０のとき分岐し、非０の時、次の番地
以降の処理を指定する命令である。前述の様に、処理を
FORK[2c]命令で並列化した時、複製元となったユーザ記
述では内部フラグ＝０である。従ってFORK[2c]を実行し
たユーザ記述の側は、分岐して次の実行に入る。すなわ
ち、図１２のソースコードで言えば、//文１２３以後の
文はスキップして、次の//文１２３またはotherwise文
１２４を処理する。

【００７１】次に、処理分岐の発生元となったＰＥ２０
０の側での仮想機械プロセス４０３の動作を更に説明す
る。FORK[2c]とBEQ[0c]命令の実行によって、処理分岐
の発生元となったユーザ記述５は、結局Otherwise文１
２４からcoend文１２２までの範囲だけを実行する。本
実施例のコンパイラ４０２はcoend文１２２に対してWAI
T[2e]命令を発生する。仮想機械プロセス４０３は、WAI
T[2e]命令が有ると、WAIT処理を行なう（Ｓ６０５）。
これは、他の各ＰＥ２００での処理結果が受信バッファ
の待ち行列に有るか検査し、全てのＰＥ２００から処理
結果が戻るまで待機する処理である。

【００７２】処理の流れを図８に示した。仮想機械プロ
セス４０３は、受信バッファを検査し、処理結果の受信
有無を検査する（Ｓ８０３）。受信が無ければ仮想機械
プロセス４０３は休眠し（Ｓ８０４）、受信シグナルを
受けたＯＳ２０４が、このプロセスを再起動（Ｓ８０
５）するまで、他のプロセスが実行される。再起動後、
仮想機械プロセス４０３は、処理結果を取得し、処理終
了となったプロセッサ番号を検出する（Ｓ８０６）。ま
た処理単位に一意に与えられる処理番号を取り出し、こ
れからプロセッサ管理テーブルの該当するプロセッサの
項目にアクセスし、処理番号から処理負荷の値を検索
し、この値をプロセッサ負荷から減算しておく（Ｓ８０
７）。仮想機械プロセス４０３が、分散した全ての処理
単位に対し、この処理を行なった場合（Ｓ８０８）、WA
IT処理は完了する。

【００７３】他方、FORK[2c]命令によって、処理分岐さ
れた側の動作を説明する。処理分岐の結果、処理分散手
段４が、ユーザ記述（複製）を分散先のＰＥ２００に送
る。これを受け取ったＰＥ２００上の仮想機械プロセス
４０３は、図６の流れ図に添った処理を行なう。但し、
内部フラグは'＝１'であり、またプログラムカウンタの
値は、FORK[2c]命令の直後の位置にある。内部フラグ＝
１のとき、EVAL[2f]命令は何も行なわない。しかし仮想
機械プロセス４０３は、他の命令を通常通り処理する。
これにより分散先のＰＥ２００では、記述１３５を例に
とれば、EXIT[2d]命令までが通常通り処理される。

【００７４】EXIT[2d]命令の処理の流れを図８に示し
た。仮想機械プロセス４０３は、EXIT[2d]命令を検出し
た後、処理結果と、処理単位毎に一意に決まる処理番号
を送信バッファに置く（Ｓ８０１）。次に仮想機械プロ
セス４０３は、これを、バス調停装置２０３を用いて、
システムバス３５を介して、処理要求元のＰＥ２００に
送信する（Ｓ８０２）。

【００７５】図６に戻って説明を続ける。

【００７６】ユーザ記述の終了は、機械語命令HALT[10]
に翻訳される。これを検出した仮想機械プロセス４０３
は、一つのユーザ記述５について処理を終える。しかし
更に仮想機械インタープリタ７の待ち行列７１１に、別
のユーザ記述が要求としてエンキュウされていれば、今
度はこの記述を取り出し、同じ様に処理ループを続け
る。

【００７７】３．３処理負荷の見積り動作（図７）負荷の検出方法については、既に「２．１本実施例の
負荷計算手段」で述べた。ここでは、処理時間算定手段
１を呼び出す機械語命令EVAL[2f]の動作を図７によって
説明する。なお本実施例では仮想機械語命令としてEVAL
[2f]を定義し使用したが、この命令自体は複数の機械語
の組み合わせでマクロ定義できる。以下は、負荷見積り
の命令語を実装する上での例を説明するものである。

【００７８】EVAL処理（Ｓ６０３）は、分散されたＰＥ
２００上では、内部フラグ＝１であるため実行されな
い。これ以外のとき、仮想機械プロセス４０３は、負荷
カウンタ２を初期化し（Ｓ７０１）、続く機械語命令を
フェッチする（Ｓ７０２）。この機械語命令が、TRAP[2
a]であるとき、前述の処理時間算定手段１を実行する
（Ｓ７０３）。この処理結果は、負荷カウンタ２に加算
される（Ｓ７０４）。その他の命令は、通常処理され
る。しかし仮想機械プロセス４０３は、EXIT[2d]命令を
検出した場合、処理分散手段４を呼び出し、既にFORK[2
c]命令によって複製されていたユーザ記述を、他のＰＥ
２００に転送する（Ｓ７０５）。この時、処理負荷によ
って適切なプロセッサが選択される必要がある。この処
理は処理分散手段４の特徴であり、既に図５を用いて述
べた通りである。

【００７９】４．他の実施例（図１５）再び図４をに戻り説明する。エディタ４０１とコンパイ
ラ４０２は、必ずしも本実施例の様にマルチプロセッサ
画像処理装置の上で実行される必要は無い。４０１、４
０２を他のコンピュータで実行し、その処理結果として
得られるユーザプログラム４０４を、マルチプロセッサ
画像処理装置への入力として与えても良い。この時、マ
ルチプロセッサ画像処理装置側には、少なくとも仮想機
械プロセス４０３を実装する必要がある。また、処理時
間算定手段１を含んだ画像処理ライブラリ７２が必要で
ある。

【００８０】図１５（ａ）は、本発明の別の実施例とし
て挙げる印刷装置の構成図である。パーソナルコンピュ
ータ１５１と通信経路１５４で接続した電子写真式のプ
リンタにおいて、マルチプロセッサ画像処理装置１５３
が画素発生を行ない、処理結果をプリントエンジン１５
２に出力する。この構成を更に図１５（ｂ）を用いて説
明する。

【００８１】コンピュータ１５１の使用者は、アプリケ
ーション１５５を使用し、ドキュメントの印刷操作を行
なう。この時、アプリケーション１５５はＯＳ１５９の
用意するプリンタドライバ１５７を起動し、印刷処理を
行なう。プリンタドライバ１５７はアプリケーションの
指示に従い、画像記述のソースコードを生成し、続いて
コンパイルまでを行なう。この結果、プリンタドライバ
１５７は前の実施例に述べたような仮想機械の命令語か
らなるデータを作成する。次にプリンタドライバ１５７
が、このデータをデバイスドライバ１５８を用いて通信
経路１５４に送る。このデータはプリンタに組み込まれ
たマルチプロセッサ画像処理装置１５３によって受信さ
れる。

【００８２】マルチプロセッサ画像処理装置１５３内の
仮想機械プロセス４０３は、画像処理ライブラリ７２を
利用して前記実施例と同様に処理を行ない、処理結果を
プリントエンジン１５２に出力する。

【００８３】以上２つの実施例に示した様に、本発明で
は負荷を見積もってからプロセッサに分散する手段が、
最適負荷分散を実現している。そこで、本発明の方法
を、各プロセッサがより独立して構成された処理装置に
用いる事が考えられる。前記実施例では、プロセッサ間
の通信をシステムバス３５によって行なった。これに替
えて、プロセッサ間の通信をローカルエリアネットワー
ク（以下ＬＡＮ）によって行なう事が考えられる。この
方式を用いた場合、ＬＡＮによって接続された複数のワ
ークステーション（以下ＷＳ）を用意し、この上で前記
実施例のと等価な仮想機械プロセスを実行する。ＷＳは
マルチタスク処理を行なうＯＳを実装しており、ここに
仮想機械プロセスを実装した場合、システムバス３５に
替えてＬＡＮを用いる以外は、ほぼ前記実施例と同様の
処理が可能である。この構成では、複雑なドキュメント
の画像処理／印刷処理を、適当な負荷配分の元に複数台
のＷＳを用いて処理できるため、処理速度面で極めて優
秀な処理装置を実現できる。

【００８４】

【発明の効果】以上の説明から明らかな様に、本発明の
マルチプロセッサ画像処理装置では、実行時ライブラリ
中の操作の一つ一つに対応した処理負荷の見積り手段が
備わっている事により、画像処理の実際の操作開始に先
立って処理負荷を見積もる事ができるため、現在待ち行
列にある処理要求も含めて個々のプロセッサの負荷を正
しく評価する事が可能となった。これにより、本発明で
はプロセッサに多大な負荷を与えるため分割して処理を
行なう事が不適当な画像の拡大・縮小、回転等の画像処
理分野において、各プロセッサへの処理の分散を適切な
負荷配分の下に行なうことに成功した。

【００８５】言い替えれば、本発明は個々のプロセッサ
への負荷配分を均等化する有効手段を提供するものであ
り、いわゆる「粒度の大きな」並列処理において、マル
チプロセッサ装置の性能を最大限に引き出すことを可能
にする効果が有る。

【図面の簡単な説明】

【図１】第１の実施例の特徴となる構成を示す図。

【図２】プログラムの実行時の状態の説明図。

【図３】マルチプロセッサ画像処理装置の全体の構成
を示す図。

【図４】マルチプロセッサ画像処理装置の処理手順の
概要を説明した図。

【図５】処理分散手段４の動作を説明した流れ図。

【図６】仮想機械プロセスの動作を説明した流れ図。

【図７】機械語EVALの動作を説明した流れ図。

【図８】機械語EXIT及びWAITの動作を説明した流れ
図。

【図９】直線発生時の負荷見積り方法を示した流れ
図。

【図１０】画像回転の例を説明する図。

【図１１】実施例で用いた並列記述言語の構文規則の
説明図。

【図１２】並列記述言語による記述例の説明図。

【図１３】図１２の記述例をコンパイルした時の機械
語の説明図。

【図１４】粒度のばらつきの大きい場合の負荷分散の
問題点を説明した図。

【図１５】第２の実施例の構成図。

【符号の説明】１…処理時間算定手段２…負荷カウンタ３…プロセッサ管理テーブル４…処理分散手段５…ユーザの記述によるオブジェクトコード６…仮想機械プロセス７…仮想機械インタープリタ８…システムの資源３１…ＭＰＵ３２…ＲＯＭ３３…ＲＡＭ３４…プロセッサ基板３５…システムバス３６…Ｉ／Ｏ装置４１…待ち行列４２…処理要求７１…プログラムインターフェース７２…画像処理実行時ライブラリ８１…通信手段８２…待ち行列１００…図形１０１…座標１０２…回転した座標１０３…図形を囲む領域１２１…cobegin文１２２…coend文１２３…並列記述文１２４…otherwise文１３５…翻訳された機械語の例１５１…パーソナルコンピュータ１５２…プリントエンジン１５３…マルチプロセッサ画像処理装置１５４…通信経路１５５…アプリケーション１５７…プリンタドライバ１５８…デバイスドライバ１５９…オペレーティングシステム２００…一つのプロセッサエレメント２０１…プロセス２０２…オブジェクトコード２０３…バス調停装置２０４…オペレーティングシステム２０５…スケジューラ２０６…スケジューラ待ち行列２０７…サービスプログラム４０１…エディタ４０２…コンパイラ４０３…仮想機械プロセス４０４…ソースファイル４０５…オブジェクトファイル７１１…待ち行列７１２…分岐テーブル

Claims

【特許請求の範囲】

【請求項１】処理対象の画像に関する一連の操作を複
数の処理単位に分割して、各処理単位を複数個のプロセ
ッサに分散し、並列に実行することによって処理速度の
向上を図る装置であって、画像処理に関する所定の処理要求を、複数個のプロセッ
サの中から選択した一つのプロセッサにそれぞれ分散す
る処理分散手段と、予め定めた特定の画像操作からなる実行時ライブラリ
と、前記実行時ライブラリ中の操作の一つ一つに対応した処
理負荷の見積りを行う見積り手段と、によって構成さ
れ、目的処理中に前記実行時ライブラリに含まれる画像
操作が呼び出される時、操作開始に先立ち、負荷見積り
手段が処理負荷を計算し、この値を処理分散手段に通知
し、処理分散手段は前記の通知された値から処理単位を
分散するプロセッサを決定する事を特徴とするマルチプ
ロセッサ画像処理装置。