JP3522820B2

JP3522820B2 - 分散処理システム

Info

Publication number: JP3522820B2
Application number: JP04444894A
Authority: JP
Inventors: 洋一紺野
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1994-03-15
Filing date: 1994-03-15
Publication date: 2004-04-26
Anticipated expiration: 2019-04-26
Also published as: JPH07253951A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、複数の計算機が通信路
で接続された分散処理システムに関する。

【０００２】

【従来の技術】分散処理システムにおいて複数のタスク
を多重化して同時に行わせる場合は計算機単位の多重化
方式が従来より良く知られていた。この計算機単位の多
重化方式には次の二つがある。

【０００３】（１）同一のタスク構成の計算機を多重化
して同時に実行する計算機単位の並列多重方式。

【０００４】（２）多重化した計算機のうち１台のみを
稼動させて故障時には待機している計算機に切り替える
計算機単位の待機冗長方式。

【０００５】これらの計算機単位の多重化方式は、ある
タスクについて分散処理システム内で多重化して並列実
行しているタスクの数（以下、タスクの多重度という）
を２にする場合は多重化処理しない場合の２倍の計算機
を必要とする。同様にタスクの多重度を３にすれば多重
化処理しない場合の３倍の計算機を必要とする。

【０００６】これを具体的に説明する。例えば、図２９
の模式図において、４台の計算機ＰＵ１，ＰＵ２，ＰＵ
３，ＰＵ４をそれぞれ四角形で示す。さらに、５種類の
タスクＴＡ，ＴＢ，ＴＣ，ＴＤ，ＴＥが計算機に割当て
られている様子を、計算機を表わす四角形の中に配置さ
れたタスク名を記した円によって示す。具体的に述べる
と、タスクＴＡが計算機ＰＵ１とＰＵ２に、タスクＴＢ
が計算機ＰＵ１とＰＵ２に、タスクＴＣが計算機ＰＵ１
とＰＵ２に、タスクＴＤが計算機ＰＵ３とＰＵ４に、タ
スクＴＥが計算機ＰＵ３とＰＵ４に、それぞれ割当てら
れて実行されている。すなわち、計算機ＰＵ１とＰＵ２
が同一のタスク構成、計算機ＰＵ３とＰＵ４が同一のタ
スク構成であり、タスクの多重度はいずれも２である。

【０００７】このような計算機単位の多重化方式におい
て、並列多重化方式では、すべての計算機が稼動する。
これに対して、待機冗長方式では、例えば計算機ＰＵ１
とＰＵ３が稼動して、計算機ＰＵ２とＰＵ４は待機す
る。また、これらの方式においてタスクＴＡの多重度を
３にしたいのであれば、（１）さらに計算機を１台追加して計算機ＰＵ１，ＰＵ
２と同一のタスク構成にする。

【０００８】（２）タスクＴＡを計算機ＰＵ３，ＰＵ４
に追加して動作させる。

【０００９】（３）計算機を１台追加してタスクの配置
をやりなおす。

【００１０】などの方法がある。

【００１１】（１）の方法では、計算機を追加すること
によりコストが増大し、タスクＴＢ，ＴＣの多重度まで
３になってしまうことにより無駄な計算が生じる。
（２）の方法では、計算機ＰＵ３，ＰＵ４の計算負荷が
増大することとタスクＴＡの多重度が４になってしまう
ことにより無駄な計算が生じる。（３）の方法は設備コ
ストの増大があり、人手が掛かる。

【００１２】近年、上記した計算機単位の多重化方式の
欠点を考慮して、信頼性向上のために任意のタスクを複
数の計算機上で多重化して並列実行するタスク単位の並
列多重化方式が提案された。実際、タスクが多重化され
ていれば、分散処理システム内のある計算機が故障して
も他の正常な計算機で動作中のタスクで継続実行できる
ので信頼性が向上する。

【００１３】すなわち、タスク単位の多重化方式はタス
クの多重度をタスクの重要度に応じてタスク単位で変え
ることができるので、分散処理システム内の計算機の数
を単純に２倍、３倍とする必要がなくなり、設備コスト
を抑える効果があるという点で優れている。これを具体
的に説明する。例えば、図２８の模式図において、４台
の計算機ＰＵ１，ＰＵ２，ＰＵ３，ＰＵ４をそれぞれ四
角形で示す。さらに、５種類のタスクＴＡ，ＴＢ，Ｔ
Ｃ，ＴＤ，ＴＥが計算機に割当てられている様子を、計
算機を表わす四角形の中に配置されたタスク名を記した
円によって示す。具体的に述べると、タスクＴＡが計算
機ＰＵ１とＰＵ２に、タスクＴＢが計算機ＰＵ１とＰＵ
３に、タスクＴＣが計算機ＰＵ１とＰＵ２とＰＵ３に、
タスクＴＤが計算機ＰＵ２とＰＵ３に、タスクＴＥが計
算機ＰＵ４に、それぞれ割当てられて実行されている。
この場合のタスクＴＡとＴＢとＴＤの多重度は２であ
り、タスクＴＣの多重度は３でありタスクＴＥの多重度
は１である。

【００１４】このようにタスク単位の多重化方式では、
タスクの多重度をタスク毎に自由に指定することがで
き、これらの多重化されたタスクは並列に実行される。
ここでは、タスク間でのメッセージを他のタスクに渡す
場合は、放送通信方式で送信する（以下、放送するとい
う）。また、タスクがメッセージを受信する際は最初に
受信したメッセージを採用する、あるいは、同じ内容の
メッセージが指定された数だけ到着したときにそのメッ
セージを採用する、などの方法をとっている。したがっ
て、タスク実行にあたっては、タスクが割当てられてい
る計算機やタスクの多重度を知る必要がない。例えばタ
スクＴＡがＴＢにメッセージを渡す場合はタスクＴＡを
実行中の計算機ＰＵ１およびＰＵ２からこのメッセージ
を放送する。このメッセージはすべての計算機が受信す
るが、実際に利用されるのはタスクＴＢを実行中の計算
機ＰＵ１およびＰＵ３である。計算機ＰＵ１で実行中の
タスクＴＢは計算機ＰＵ１及びＰＵ２のタスクＴＡから
同一内容のメッセージを２個受け取るが、前記の方法に
より１個のメッセージを採用することになる。また、計
算機ＰＵ３で実行中のタスクＴＢも同様にして１個のメ
ッセージを採用することになる。

【００１５】この方式においてタスクＴＡの多重度を３
にしたいのであれば、タスクＴＡが動作していない計算
機ＰＵ３，ＰＵ４のうちで計算負荷が低いもので動作さ
せればよい。したがって、分散処理システム全体の計算
能力に余裕があれば、計算機を追加する必要がないの
で、設備コストを抑えることができる。

【００１６】

【発明が解決しようとする課題】上記したタスク単位の
多重化方式において、動作中のタスクの増減や計算の程
度により、システム中の計算負荷は常に変化しうる。ま
た、タスクの実行中であっても、タスクが要求される信
頼性は計算内容によって変化しうる。すなわち、タスク
が要求される多重度は計算内容によって変化しうる。

【００１７】ところが、従来のタスク単位の多重化方式
はタスクの多重度がタスクを起動してからは固定されて
おり、利用者が指定する他は変更することはできなかっ
た。したがって、計算負荷が高い状態が続く場合に、許
される範囲内でタスクの多重度を削減して計算負荷を低
下させ、システム全体の処理効率を向上させることがで
きるのにも関わらず、起動時の多重度が固定されている
のでシステム全体の処理効率を低下させることになって
いた。

【００１８】さらに、従来のタスク単位の多重化方式
は、タスクの計算機への割当て方法をタスクを起動する
前に決めておく必要があり、タスク起動時のシステムの
状況をタスク割当ての方法に反映することができない。
また、これらの問題点を解決する際には、人手による操
作を必要としていた。

【００１９】また、計算機が故障した場合はその計算機
上で実行していたタスクの多重度が減少して信頼性が低
下するので、計算機故障時にはタスクの多重度を維持す
る必要がある。さらに、故障した計算機が復旧した場合
や計算機を新規追加した場合のように計算負荷の低い計
算機が追加された場合には、分散処理システムの能力を
活かす意味から計算負荷の高い計算機上のタスクを追加
された計算機に移して負荷分散を図る必要がある。

【００２０】以上のように、上記した従来のタスク単位
の多重化方式による分散処理システムには次のような問
題点があった。

【００２１】（１）タスクを起動する前にタスクの多重
度、及び、タスクの計算機への割当て方法を決めておく
必要があり、タスクが動作中のシステムの状況をタスク
の多重度、及び、タスクの計算機への割当て方法に反映
することができず、システムの処理効率をより望ましい
ものにすることができない（適応性の問題）。

【００２２】（２）計算機の故障時または追加時にはタ
スクの多重度の変更や計算機への割当てを人手で行わな
ければならず、利用者にタスクの多重度や割当てる計算
機を意識させる必要がある（保守性の問題）。

【００２３】（３）タスクの割当ての手段があらかじめ
決められた一つあるいは複数のサービス計算機に設置さ
れており、それらのサービス計算機が故障した場合はタ
スクの割当てが行われない。また、計算機が故障した場
合にタスクの多重度が低下してしまう。さらに、タスク
割当て処理の計算負荷が一部の計算機に偏る（信頼性、
処理性の問題）。

【００２４】本発明の分散処理システムはこのような課
題に着目してなされたものであり、その目的とするとこ
ろは、信頼性、保守性、適応性、処理性に優れた分散処
理システムを提供することにある。

【００２５】

【課題を解決するための手段及び作用】上記の目的を達
成するために、第１の発明は、通信路を介して接続され
た複数の計算機によって複数のタスクをタスク単位で多
重化して実行する分散処理システムであって、前記複数
の計算機の各々は、各タスクにより要求される多重度に
従って作成された要求多重度テーブルを参照して計算機
内で動作中の各タスクの多重度を決定し、多重度の変更
を行う対象タスクと該対象タスクの多重度とを記述した
多重度変更要求を放送する多重度決定手段と、各計算機
において動作中の各タスクに関する情報が記述された計
算機状態テーブルを参照して得られる前記対象タスクの
現在の多重度と、受信した前記多重度変更要求に示され
る前記対象タスクの多重度とを比較し、このときの比較
結果に基づいて前記対象タスクの複写及び削除に関する
処理の決定を行う多重度管理手段と、前記多重度管理手
段からの複写又は削除に関する処理の決定に基づいて前
記対象タスクに対する複写・削除を実行して前記対象タ
スクの多重度を変更するタスク複写・削除手段と、を含
むタスク処理手段を具備する。また、第２の発明は、第
１の発明に係る分散処理装置において、前記要求多重度
テーブルは、各タスクの名称と、各タスクに対応した最
小多重度及び最大多重度情報とを備えており、前記多重
度決定手段は、各タスクにより要求される多重度を記述
した要求多重度メッセージを受信したときに前記要求多
重度テーブルを更新する。また、第３の発明は、第１又
は第２の発明に係る分散処理システムにおいて、前記計
算機状態テーブルは、各計算機の名称と、各計算機の計
算負荷と、各計算機で動作中の各タスクの名称からなる
リストとを備えており、前記多重度管理手段は、前記多
重度変更要求に基づいて作成した計算機状態メッセージ
により前記計算機状態テーブルを更新するとともに、こ
の更新した前記計算機状態テーブルを参照して得られた
前記対象タスクの現在の多重度と、前記多重度変更要求
で指定された多重度とを比較する。また、第４の発明
は、第３の発明に係る分散処理システムにおいて、前記
比較の結果、前記多重度変更要求に記述された前記対象
タスクの多重度の方が大きい場合には、前記多重度管理
手段は、自身が担当する計算機内に前記対象タスクが存
在するか否かを判断し、存在しない場合には、前記計算
機状態テーブルから前記対象タスクを含まない計算機の
リストを作成し、当該リスト内から前記多重度変更要求
により変更された前記対象タスクの多重度と、前記対象
タスクの現在の多重度との差に相当する個数の計算機を
選択し、選択された計算機に自身の担当する計算機が存
在する場合は、当該計算機のタスク複写・削除手段に前
記対象タスクの複写要求を通知する。また、第５の発明
は、第３の発明に係る分散処理システムにおいて、前記
比較の結果、前記計算機状態テーブルを参照して求めら
れた前記対象タスクの現在の多重度の方が大きいとき、
前記多重度管理手段は、自身が担当する計算機内に前記
対象タスクが存在するか否かを判断し、存在する場合に
は、前記計算機状態テーブルから前記対象タスクを含む
計算機のリストを作成し、当該リスト内から、前記対象
タスクの現在の多重度と、前記多重度変更要求により変
更された多重度との差に相当する個数の計算機を選択
し、選択された計算機が自身の担当する計算機である場
合は当該計算機のタスク複写・削除手段に前記対象タス
クの削除要求を通知する。また、第６の発明は、第４の
発明に係る分散処理システムにおいて、前記タスク複写
・削除手段が、前記多重度管理手段から前記対象タスク
の複写要求を受け取ると、前記タスク複写・削除手段
は、前記対象タスクの存在する計算機のタスク複写・削
除手段に転送要求を通知するとともに、この転送要求を
受け取ったタスク複写・削除手段は、前記対象タスクの
内部状態からなる転送データを転送要求を通知した計算
機の前記タスク複写・削除手段に通知する。

【００２６】

【００２７】

【実施例】次に、本発明の分散処理システムについて、
その好ましい実施例を挙げ、添付図面を参照しつつ、具
体的に説明する。ここで、本実施例の分散処理システム
はタスク単位の多重化方式を用いており、その基本的動
作は前記した通りである。

【００２８】まず、図１，図２を参照して、本発明の分
散処理システムの第１実施例について、その構成を詳細
に説明する。

【００２９】第１実施例の分散処理システムは、図１の
構成図に示すように複数の計算機１が通信路２で接続さ
れている。計算機１はタスクを実行するタスク処理装置
３と、このタスク処理装置３が扱うデータを保存する記
憶装置４と、計算機間のメッセージ通信を処理する通信
装置５とからなり、計算機１と通信路２とは通信装置５
を通じて接続されている。

【００３０】図２は、図１に示すタスク処理装置３の構
成を示す図であり、多重度決定手段３１と、多重度管理
手段３２と、タスク複写・削除手段３３とから構成され
る。多重度決定手段３１は、分散処理装置の資源情報に
対応してタスク処理装置３内で動作中のタスクの多重度
を決定して、その多重度を記した多重度変更メッセージ
を分散処理システム内の多重度決定手段３１と多重度管
理手段３２宛に放送する。

【００３１】多重度管理手段３２は、多重度変更メッセ
ージを受信すると、計算機１の状態を記した計算機状態
メッセージを分散処理システム内の多重度管理手段３２
宛に放送するとともに、分散処理システム内の計算機状
態メッセージを受信して記憶装置４に格納する。そし
て、これらのデータを用いて前記タスクの多重度を実現
する方法、具体的にはタスクの複写と削除の方法を決定
して、その方法を記した処理方法メッセージを自計算機
内のタスク複写・削除手段３３宛に送信する。

【００３２】タスク複写・削除手段３３は、前記の処理
方法メッセージを受信すると、前記決定された複写・削
除の方法を実現する。ここで、タスクの複写とは、タス
クが使用する変数の値や、プログラムの位置を示すアド
レスなどからなるタスクの内部状態を、新たに該当タス
クを動作させる計算機に転送することをいう。

【００３３】なお、各計算機のタスク処理装置３が互い
にメッセージ通信を行う場合におけるメッセージは、上
記した３つの手段３１、３２、３３の１つ、例えば多重
度決定手段３１であることを示すデータＭ１と計算機名
を示すデータとメッセージ本体とからなる。また、メッ
セージを放送する場合は計算機名を示すデータの代わり
に放送モードであることを示すデータを使う。例えば、
計算機ＰＵ１がＰＵ２の多重度決定手段３１宛にメッセ
ージを送信する場合、その内容は（Ｍ１，ＰＵ２，メッセージ本体）となる。また、計算機ＰＵ１が分散処理システム内の他
のすべての計算機の多重度決定手段３１宛にメッセージ
を放送する場合、その内容は（Ｍ１，放送，メッセージ本体）となる。

【００３４】以下に、上記した多重度決定手段３１、多
重度管理手段３２、タスク複写・削除手段３３の処理動
作手順を詳細に説明する。

【００３５】図３は同実施例の動作を説明するためのデ
ータの流れの概略を示す図である。図の中の矢印は計算
機間で送信されるデータの流れを示している。また、図
３の要求多重度テーブル４１、計算機状態テーブル４２
は図１に示す計算機１内の記憶装置４に格納されている
テーブルであり、要求多重度テーブル４１の構成が図４
に、計算機状態テーブル４２の構成が図５に示されてい
る。

【００３６】まず、新たにタスクが起動して、タスクが
要求する多重度を実現するためにタスクの複写を実行す
る場合の作用を説明する。ここでは、図２８の状態でタ
スクが動作していて、タスクＴＥは計算機ＰＵ４におい
て起動したばかりであることを仮定する。

【００３７】また、多重化する必要のあるタスクについ
て次の仮定をする。

【００３８】（１）システムの設計者はシステム設計時
に、要求されるタスクの信頼性の程度とシステムの大き
さに応じてタスクの多重度の上限（以下、最大多重度と
いう）と下限（以下、最小多重度という）とを決定して
おく。

【００３９】（２）タスクの最大多重度と最小多重度と
を記した要求多重度メッセージ５１（図３）をタスク起
動時に分散処理システム内の多重度決定手段３１（図
３）宛に放送するようにタスクを記述する。要求多重度
メッセージ５１は、自タスク名、そのタスクが動作して
いる計算機名、最小多重度、最大多重度からなる。な
お、タスクが動作している計算機名をタスク内に固定し
て記述すると保守性が悪くなるので、タスクが動作して
いる計算機名は、分散処理システムが通常有する機能を
通じて、タスクの起動時に獲得して使用するものとす
る。

【００４０】例えば、タスクＴＥの最小多重度と最大多
重度をそれぞれ２と３であるように設計して、計算機Ｐ
Ｕ４で起動した場合の要求多重度メッセージ５１のメッ
セージ本体は（ＴＥ，ＰＵ４，２，３）のようになる。多重度決定手段３１（図３）は、前記要
求多重度メッセージ５１を受信すると（図６のステップ
１１２）、図４に示すような要求多重度テーブル４１を
更新する（同ステップ１１３）。要求多重度テーブル４
１の各項目は、図４に示すようにメッセージ記載のタス
ク名、最小多重度、最大多重度からなり、前記要求多重
度メッセージ５１記載のタスク名に関する項目があれば
メッセージ記載のデータで更新する。また該当タスク名
に関する項目が無ければテーブルに追加する。次に、メ
ッセージ記載の計算機名が自計算機名と一致すれば、多
重度変更メッセージ５２（図３）を作成して、分散処理
システム内の多重度決定手段３１と多重度管理手段３２
宛に放送する（図６のステップ１１４、１１５、１１
６）。

【００４１】多重度変更メッセージ５２は該当タスク名
と多重度からなる。この多重度は要求多重度メッセージ
５１記載の最小多重度と最大多重度の間の値を取るもの
である。ここでは、タスク起動時はシステム全体の計算
負荷が正常であるものと仮定して、該当タスクの多重度
として最大多重度を採用する。したがって、例えばタス
クＴＥについての多重度変更メッセージ５２のメッセー
ジ本体は（ＴＥ，３）のようになる。

【００４２】前記多重度変更メッセージ５２を自計算機
外から受信した多重度決定手段３１は（同ステップ１１
１）、現在の多重度変更処理が終了したことを示す処理
終了メッセージ５３（図３）を受信する（図６のステッ
プ１１７）まで待機する。

【００４３】多重度管理手段３２（図３）は、前記多重
度変更メッセージ５２を受信すると（図７のステップ２
０１）、計算機状態メッセージ５４（図３）を作成し
て、分散処理システム内の多重度管理手段３２宛に放送
する（図７のステップ２０２）。計算機状態メッセージ
５４は、自計算機名、自計算機の計算負荷、自計算機で
動作中のタスクのタスク名リストからなる。例えば計算
機ＰＵ１内の多重度管理手段３２が作成する計算機状態
メッセージ５４のメッセージ本体は（ＰＵ１，０．６５，ＴＡ，ＴＢ，ＴＣ）である。

【００４４】多重度管理手段３２は、前記計算機状態メ
ッセージ５４を受信すると、図５に示すような計算機状
態テーブル４２を更新する（同ステップ２０３）。計算
機状態テーブル４２の各項目は、図５に示すように計算
機状態メッセージ５４の受信時刻、メッセージ記載の計
算機名、計算負荷、タスク名リストからなる。ここで、
受信時刻の欄を調べて一定時間経過した項目は削除す
る。これは、計算機状態メッセージ５４は分散処理シス
テム内のすべての計算機から受信するので、一定時間以
上経過した項目に記載された計算機は何らかの理由によ
り停止していると考えられるからである。

【００４５】次に、更新した計算機状態テーブル４２を
用いて、該当タスクの現在の多重度Ｏｄを求め（同ステ
ップ２０４）、メッセージ記載の変更後のタスクの多重
度Ｎｄとの大小を比較する（同ステップ２０５）。ここ
ではタスクＴＥを起動したときの作用を考えているの
で、現在の多重度Ｏｄは１である。メッセージ記載の変
更後のタスクの多重度Ｎｄは３であるので、Ｎｄの方が
大きい。そこで、多重度管理手段３２は、該当タスクを
複写して多重度を１から３に増やす処理を行うが、以下
にこの手順を図８のフローチャートを参照して述べる。

【００４６】まず、各計算機の多重度管理手段３２は、
自計算機内に該当タスクがあるかどうかを調べる（図８
のステップ２０６）。該当タスクがある場合は、タスク
の内部状態を複写する際の転送元の候補となり、該当タ
スクの動作を中断して転送処理終了時に放送される処理
終了メッセージを受信するまで待機する（同ステップ２
１４）。該当タスクがない場合は、該当タスクを受け入
れる候補となる。これらの候補のうちで、タスクを受け
入れる計算機としては計算負荷の低いものが負荷分散の
点から望ましい。そこで、計算機状態テーブル４２から
該当タスクを含まない計算機について計算負荷が低いも
のから並べたリストを作る（同ステップ２０７）。例え
ば計算機状態テーブル４２ではタスクＴＥを含まない計
算機はＰＵ１，ＰＵ２，ＰＵ３であり、計算負荷が低い
順に並べると（ＰＵ１，ＰＵ２，ＰＵ３）となる。次に、前記リストの先頭からＮｄ−Ｏｄ個の候
補計算機を残して他は除去する（同ステップ２０８）。
例えばタスクＴＥについての前記リストの先頭からＮｄ
−Ｏｄ＝３−１＝２個の計算機だけを残すと、リストは（ＰＵ１，ＰＵ２）となる。すなわち、計算機ＰＵ１とＰＵ２にタスクＴＥ
を複写することになる。

【００４７】以上の結果は、該当タスクを含まないすべ
ての計算機で同じように得られる。これは、先に放送通
信を用いて更新した同内容の計算機状態テーブル４２を
利用しているためである。したがって、この結果に基づ
いて複写処理の方法を個々の計算機で決定しても矛盾は
生じない。ここで、複写処理の方法の決定とはタスクの
内部状態を転送する際の転送元と転送先を決めることで
ある。ここでは、複写先計算機は複写処理の方法を決定
するので、前記リストに自計算機名がある場合は（同ス
テップ２０９）、タスク内部状態の転送元となる計算機
を個々に決定する。また、自計算機名が無い場合は、転
送処理終了時に放送される処理終了メッセージを受信す
るまで待機する。

【００４８】次に、複写元計算機を決定する手順を説明
する。まず、計算機状態テーブル４２により該当タスク
が動作している計算機の数Ｔを求める。次に、前記リス
トの先頭を１番目としたときの自計算機の順番Ｓを求め
る。そしてＳをＴで割ったときの余りＲを計算する。こ
のとき、該当タスクが動作している計算機を計算負荷が
低いものから並べたときにＲ＋１番目にあたる計算機を
転送元計算機とする。例えば、計算機ＰＵ１であればタ
スクＴＥが動作している計算機の数Ｔは１であり、前記
リストにおける自計算機の順番Ｓは１である。したがっ
て、余りＲは０であり、タスクＴＥが動作している計算
機を計算負荷が低いものから並べたときにＲ＋１＝０＋
１＝１番目になる計算機ＰＵ４を転送元計算機とする。
計算機ＰＵ２についても同様にＴ＝１，Ｓ＝２，Ｒ＝０
となり、ＰＵ４を転送元計算機とする。

【００４９】そこで、以上の結果に基づいて処理方法メ
ッセージ５５（図３）を作成して、自計算機内のタスク
複写・削除手段３３（図３）宛に送信する（図８のステ
ップ２１０）。処理方法メッセージ５５は、該当タスク
名、転送元計算機名、タスクを複写する処理であるか、
タスクを削除処理できるかを示すデータ（以下では、前
者の場合に複写フラグといい、後者の場合に削除フラグ
という）からなる。例えば、タスクＴＥに関して計算機
ＰＵ１の多重度管理手段３２が作成する処理方法メッセ
ージ５５のメッセージ本体は（ＴＥ，ＰＵ４，複写）となる。

【００５０】前記処理方法メッセージ５５を受信したタ
スク複写・削除手段３３は（図１０のステップ３０
１）、処理方法メッセージを調べて、この場合は複写フ
ラグがあることを確認する（同ステップ３０２）。複写
フラグがある場合は、転送要求メッセージ５６（図３）
を作成して、メッセージ記載の転送元計算機のタスク複
写・削除手段３３宛に送信する（図１０のステップ３０
３）。転送要求メッセージ５６は、該当タスク名、自計
算機名からなる。例えばタスクＴＥに関して計算機ＰＵ
１のタスク複写・削除手段３３が作成する転送要求メッ
セージ５６のメッセージ本体は（ＴＥ，ＰＵ１）であり、宛先は計算機ＰＵ４のタスク複写・削除手段３
３である。

【００５１】前記転送要求メッセージ５６を受信したタ
スク複写・削除手段３３は（同ステップ３０７）、メッ
セージ記載のタスクの内部状態からなる転送データ５７
（図３）をメッセージ記載の計算機のタスク複写・削除
手段３３宛に送信する（図１０のステップ３０８）。転
送データ５７は例えば（“ＤＡＴＡ”，データ本体）のような構成になる。ここで、“ＤＡＴＡ”はメッセー
ジを識別する目的で使っている。

【００５２】前記転送データ５７を受信したタスク複写
・削除手段３３は（同ステップ３０４）、タスクの複写
処理を実行して、終了後、処理終了メッセージ５３（図
３）を作成して、分散処理システムの各計算機内の多重
度決定手段３１、及び、多重度管理手段３２宛に放送す
る（図１０のステップ３０５）。処理終了メッセージ５
３は、自計算機名、自計算機の計算負荷、自計算機で動
作中のタスクのタスク名リストからなる。例えばタスク
ＴＥを複写後の計算機ＰＵ１内のタスク複写・削除手段
３３が作成する処理終了メッセージ５３のメッセージ本
体は（ＰＵ１，０．７３，ＴＡ，ＴＢ，ＴＣ，ＴＥ）のような構成になる。

【００５３】これまで待機していた多重度決定手段３１
は前記処理終了メッセージ５３を受信すると（図６のス
テップ１１７）、タスクの多重度を決定する処理手順を
再開する。

【００５４】また、これまで待機していた多重度管理手
段３２は前記処理終了メッセージ５３をＮｄ−Ｏｄ個受
信すると（図８のステップ２１１）、複写対象となって
中断していたタスクの動作を再開、あるいは、複写され
てきたタスクの動作を開始する（同ステップ２１２）。
そして、処理終了メッセージ５３記載のデータを用いて
計算機状態テーブル４２を更新する（同ステップ２１
３）。これは、図７のステップ２０３での処理と同じで
ある。

【００５５】このようにして、タスク起動時に分散処理
システム内の計算負荷を考慮してタスクが要求する多重
度を実現することができる。

【００５６】次に、計算負荷が高くなった場合に、信頼
性を考慮して許される範囲内でタスクの多重度を削減す
る方法を説明する。ここでは、図２８の模式図の状態で
タスクが動作している場合について説明する。同図にお
いて、計算機を四角形で、タスクを円でそれぞれ示して
いる。

【００５７】ある計算機の計算負荷が一定値以上になっ
て一定時間経過したことを、その計算機内の多重度決定
手段３１が判定すると（図６のステップ１１８）、多重
度変更メッセージ５２（図３）を作成して、分散処理シ
ステム内の多重度決定手段３１と多重度管理手段３２宛
に放送する（図６のステップ１１４、１１５、１１
６）。ここでは多重度変更メッセージ５２は多重度を削
減するタスクのタスク名とその変更後の多重度からな
る。このタスクと多重度は計算機状態テーブル４２から
得られるタスクの現在の多重度、及び、要求多重度テー
ブル４１から得られるタスクの多重度の許容範囲を用い
て決定する。

【００５８】具体的には、ある計算機において高計算負
荷状態が一定時間接続した場合、その計算機の多重度決
定手段３１は自計算機内で動作中のタスクで現在の多重
度が大きいタスクから順に、要求多重度テーブル４１記
載の最小多重度よりも大きいかどうか探索していき、そ
のようなタスクが見つかった段階で探索処理を終了し
て、該当タスクの多重度を削減することにする。なお、
同一多重度のタスクについては、例えばタスク名に関す
る順番で調べる。ここでは、新しい多重度は現在の多重
度から１個削減したものにする。

【００５９】また、条件にあてはまるタスクが無い場合
は、これ以上タスクの多重度を削減することができない
ので、多重度変更メッセージ５２を作成しないでステッ
プ１１１へ戻る（同ステップ１１５）。例えば、計算機
ＰＵ３が高計算負荷状態にあれば、多重度決定手段３１
は多重度が３のタスクＴＣ、多重度が２のタスクＴＢ、
ＴＤの順に調べる。まず、タスクＴＣに関して、現在の
多重度は３、最小多重度は２であり、探索していたタス
クの条件にあてはまる。したがって、多重度変更メッセ
ージ５２のメッセージ本体は（ＴＣ，２）となる。ここでは、現在の多重度３から１個削減した２
を新しい多重度としている。なお、この段階ではまだ上
記の判定を下した計算負荷が高い計算機で該当タスクを
削除することを決定していない。しかし、以下で述べる
ように、分散処理システム内の各計算機の最新の計算負
荷情報に基づいて該当タスクを削除する計算機を決定す
るので、上記の計算機から該当タスクを削除する可能性
はある。また、何らかの理由により急に計算負荷が高く
なった該当タスクを削除する可能性もある。

【００６０】ここで、前記多重度変更メッセージ５２を
受信した多重度決定手段３１の作用はタスク起動時の作
用において述べたとおりである（図６のステップ１１
１）。

【００６１】前記多重度変更メッセージ５２を受信した
多重度管理手段３２は、図７のステップ１１４まではす
でに述べたとおりの作用をする。ここでは、前記メッセ
ージ記載の変更後の該当タスクの多重度Ｎｄが、現在の
該当タスクの多重度Ｏｄよりも小さいので（図７のステ
ップ２０５）、該当タスクを削除して多重度を減少させ
る方法を次のごとく決定する。

【００６２】まず、各計算機の多重度管理手段３２は、
自計算機内に該当タスクがあるかどうかを調べる（図９
のステップ２１５）。該当タスクが自計算機内に無い場
合は他の計算機で実行される削除処理終了時に放送され
る処理終了メッセージを受信するまで待機する。一方、
該当タスクがある場合は、該当タスクを削除する計算機
の候補となる。これらの候補のうちで、タスクを削除す
る計算機としては計算負荷の高いものが負荷分散の点か
ら望ましい。そこで、計算機状態テーブル４２から該当
タスクを含む計算機について計算負荷が高いものから並
べたリストを作る（同ステップ２１６）。例えば計算器
状態テーブル４２ではタスクＴＣを含む計算機はＰＵ
１，ＰＵ２，ＰＵ３であり、計算負荷が高い順に並べる
と（ＰＵ３，ＰＵ２，ＰＵ１）となる。次に、前記リストの先頭からＯｄ−Ｎｄ個の候
補計算機を残して他は除去する（同ステップ２１７）。
例えばタスクＴＣについての前記リストの先頭からＯｄ
−Ｎｄ＝３−２＝１個の計算機だけを残すと、リストは（ＰＵ３）となる。すなわち、計算機ＰＵ３においてタスクＴＣを
削除することになる。

【００６３】以上の結果は、該当タスクを含むすべての
計算機で同じように得られる。これは、先に放送通信を
用いて更新した同内容の計算機状態テーブル４２を利用
しているためである。したがって、この結果に基づいて
該当タスクを削除することを個々の計算機で決定しても
矛盾は生じない。そこで、前記リストに自計算機名があ
る場合は（同ステップ２１８）、処理方法メッセージ５
５（図３）を作成して自計算機内のタスク複写・削除手
段３３（図３）宛に送信する（図９のステップ２１
９）。

【００６４】処理方法メッセージ５５は、該当タスク
名、自計算機名、削除フラグからなる。例えば、タスク
ＴＣに関して計算機ＰＵ３の多重度管理手段３２が作成
する処理方法メッセージ５５のメッセージ本体は（ＴＣ，ＰＵ３，削除）となる。

【００６５】前記処理方法メッセージ５５を受信したタ
スク複写・削除手段３３は（図１０のステップ３０
１）、メッセージを調べて、この場合は削除フラグがあ
ることを確認する（同ステップ３０２）。そこで、メッ
セージ記載のタスクを自計算機において削除する（同ス
テップ３０６）。そして、処理終了メッセージ５３（図
３）を作成して、分散処理システムの各計算機内の多重
度決定手段３１、及び、多重度管理手段３２宛に放送す
る（図１０のステップ３０５）。処理終了メッセージ５
３は、自計算機名、自計算機の計算負荷、自計算機で動
作中のタスクのタスク名リストからなる。例えばタスク
ＴＣを削除後の計算機ＰＵ３内のタスク複写・削除手段
３３が作成する処理終了メッセージ５３のメッセージ本
体は（ＰＵ３，０．６８，ＴＢ，ＴＤ）のようになる。

【００６６】これまで待機していた多重度決定手段３１
は前記処理終了メッセージ５３を受信すると（図６のス
テップ１１７）、タスクの多重度を決定する処理手順を
再開する。

【００６７】また、これまで待機していた多重度管理手
段３２は前記処理終了メッセージ５３をＯｄ−Ｎｄ個受
信すると（図８のステップ２２０）、処理終了メッセー
ジ５３記載のデータを用いて計算機状態テーブル４２を
更新する（同ステップ２２１）。これは、図７のステッ
プ２０３での処理と同じである。

【００６８】このようにして、計算負荷が高い場合に、
タスクが要求する多重度の許容範囲内でタスクの多重度
を減少させて、分散処理システム内の計算機の計算負荷
を正常に戻すことができる。

【００６９】次に、計算負荷が低くなった場合に、不足
していたタスクの多重度を増加させて信頼性の度合いを
回復する場合の作用を説明する。以下では、図２８の模
式図の状態でタスクが動作している場合について説明す
る。この図で計算機を四角形で、タスクを円で、それぞ
れ示している。

【００７０】ある計算機の計算負荷が一定値未満になっ
て一定時間経過したことを、その計算機内の多重度決定
手段３１が判定すると（図６のステップ１１９）、多重
度変更メッセージ５２（図３）を作成して、分散処理シ
ステム内の多重度決定手段３１と多重度管理手段３２宛
に放送する（図６のステップ１１４、１１５、１１
６）。多重度変更メッセージ５２は多重度を増加するタ
スクのタスク名とその変更後の多重度からなる。このタ
スクと多重度は計算機状態テーブル４２から得られるタ
スクの現在の多重度、及び、要求多重度テーブル４１か
ら得られるタスクの多重度の許容範囲を用いて決定す
る。

【００７１】具体的には、ある計算機において低計算負
荷状態が一定時間持続した場合、その計算機の多重度決
定手段３１は計算機状態テーブル４２を用いて、分散処
理システム内の各計算機で動作中のタスクのうち、自計
算機で動作していないタスクの現在の多重度を調べて、
要求多重度テーブル４１記載の最大多重度との差が大き
いタスクについて多重度を増加させることにする。自計
算機で動作しているタスクを対象外としたのは、そのよ
うなタスクは自計算機に複写することは不可能であり、
このような場合は自計算機の負荷を高くすることになら
ないからである。

【００７２】なお、同一多重度のタスクについは、例え
ばタスク名に関する順番で調べる。ここでは、新しい多
重度は現在の多重度から１個増加したものにする。ま
た、条件にあてはまるタスクが無い場合は、分散処理シ
ステム内のタスクの多重度はすべて要求を満たしている
ので、多重度変更メッセージ５２を作成しないでステッ
プ１１１へ戻る（同ステップ１１５）。

【００７３】例えば、計算機ＰＵ４が低計算負荷状態に
あれば、多重度決定手段３１は計算機状態テーブル４２
と要求多重度テーブル４１を用いて、計算機ＰＵ４で動
作していないタスクについて、現在の多重度とタスクが
要求する最大多重度を比較していく。例えばタスクＴＡ
の現在の多重度は２、最大多重度は２であるので、これ
以上タスクを増加させる必要はない。また、タスクＴＢ
の現在の多重度は２、最大多重度は３であるので、その
差は１である。同様に、タスクＴＣの現在の多重度は
３、最大多重度は３で、差は０、タスクＴＤの現在の多
重度は２、最大多重度は２で、差は０となる。タスクＴ
Ｅは、自計算機で動作しているので対象外である。した
がって、前記差が最大であるのは、タスクＴＢである。
したがって多重度変更メッセージ５２のメッセージ本体
は（ＴＢ，３）となる。ここでは、現在の多重度２から１個増加させた
３を新しい多重度としている。なお、この段階ではまだ
上記の判定を下した計算負荷が低い計算機に該当タスク
を複写することを決定していない。しかし、以下で述べ
るように、分散処理システム内の各計算機の最新の計算
負荷情報に基づいて該当タスクを複写する計算機を決定
するので、上記の計算機に該当タスクを複写する可能性
はある。また、何らかの理由により急に計算負荷が低く
なった他の計算機に該当タスクを複写する可能性もあ
る。

【００７４】ここで、前記多重度変更メッセージ５２を
受信した多重度決定手段３１の作用はタスク起動時の作
用において述べたとおりである（図６のステップ１１
１）。

【００７５】また、この場合の多重度管理手段３２の作
用はタスクの多重度を増加させるためにタスクを複写す
る方法を決めるという点でタスク起動時の作用と一致す
る。したがって、前記多重度変更メッセージ５２を受信
した多重度管理手段３２の作用は、タスク起動時の作用
において述べたとおりである（図７のステップ２０１以
降、及び、図８のステップ２０６以降）。最終的には、
例えば、タスクＴＢはタスクＴＢが動作していない計算
機のうち計算負荷が最も低い計算機ＰＵ４に複写され
て、分散処理システム中のタスクＴＢが動作を再開して
すべての作用が完了する。このとき、タスクＴＢは計算
機ＰＵ１，ＰＵ３，ＰＵ４で動作している。

【００７６】このようにして、計算負荷が低い場合に、
タスクが要求する多重度の許容範囲内でタスクの多重度
を増加させて、分散処理システム内の計算負荷を考慮し
て信頼性を向上させることができる。

【００７７】以上のように、上記した第１実施例は、
（１）タスクを起動する前にタスクの多重度、及び、タ
スクの計算機への割当て方法を決めておく必要がなく、
タスクが動作中のシステムの状況をタスクの多重度、及
び、タスクの計算機への割当て方法に反映することがで
きるので、システムの処理効率をより望ましいものにす
ることができるという適応性の効果と、（２）タスクの
多重度の変更や計算機への割当てを人手によらずに行う
ことができるので、利用者にタスクの多重度や割当てる
計算機を意識させる必要がないという保守性の効果と、
（３）タスクの割当ての手段を分散処理システム内の各
計算機に分散させているので、一部の計算機が故障した
場合でもタスクの割当てを行うことができるという信頼
性の効果と、タスク割当て処理の計算負荷をシステム内
の各計算機に分散するので、システム全体の処理効率が
向上するという処理性の効果と、を有し、信頼性、保守
性、適応性、処理性に優れた分散処理システムを提供す
ることが可能となる。

【００７８】また、タスクの複写と削除は信頼性維持あ
るいは負荷分散のために実行するものであり、通常のタ
スク実行の合間に分散して実行することで、タスクの多
重度変更処理が引き起こす計算負荷の増大や、通信量の
増大を抑えることができる。

【００７９】さらに、多重度決定手段は現在の多重度変
更処理が終了するまで待機するので不必要に多くの多重
度変更メッセージを放送することがない。したがって、
タスクの多重度変更処理が引き起こす計算負荷の増大
や、通信量の増大を抑えることができるまた、システム
内の状況を獲得するときは各計算機で実行して要求され
た多重度を実現する処理方法の決定に用いる情報を分散
処理システム内で一致させているが、多重度決定や多重
度を実現する処理方法の決定については、現在動作中の
任意の計算機で処理が可能である。したがって、第１実
施例では多重度変更処理の信頼性を維持しながら、処理
の負荷分散を図ることで信頼性と処理性の両立性を計っ
ている。

【００８０】以下に上記した第１実施例の変形例を説明
する。

【００８１】上記第１実施例では、多重度変更メッセー
ジをタスク起動時、高計算負荷時、低計算負荷時に多重
度決定手段が放送しているが、例えば１日の時間帯に応
じて処理の重要度が変わることが分かっている場合に
は、各時間帯の区切りに該当タスクの多重度変更メッセ
ージを放送することで、システムの状況に応じたタスク
の多重度の変更が実現できる。あるいは、システム設計
者が作成するタスクが、その計算状況に基づいて多重度
変更メッセージを作成、放送することも上記実施例の枠
組みにおいて可能である。

【００８２】また、上記第１実施例では、タスク起動
時、高計算負荷時、低計算負荷時の多重度変更メッセー
ジに記載する多重度には、それぞれ、最大多重度、現在
の多重度−１、現在の多重度＋１を用いたが、分散処理
システムの状況を考慮して、最小多重度と最大多重度の
間の値を採用する方法を組み込むことができる。例えば
最大多重度が高々２であるようなシステムである場合に
は、高計算負荷時に多重度変更メッセージに記載する多
重度には、最大多重度を用いればよいし、低計算負荷時
には最低多重度を用いればよい。

【００８３】さらに、高計算負荷であること、あるい
は、低計算負荷であることを判定する際の、計算負荷の
上限値、あるいは、下限値に複数の段階をつけて、段階
に応じて、多重度の減少分、あるいは、増加分を決定す
ることができる。これにより、システムの状況に応じ
て、よりきめ細かな対応ができる。また、計算負荷の上
限値、あるいは、下限値を変動する方法を組み込むこと
ができる。例えば、システム設計時に１日の各時間帯毎
に動作するタスクの数が分かっている場合には、時間帯
によって上限値や下限値を変動すれば、不必要なタスク
の複写や削除を削減することができるという効果があ
る。

【００８４】これらの多重度の決め方、及び、計算負荷
の上限値と下限値は、実際の分散処理システムの規模や
動作するタスクの数や性質に依存して決めることができ
る。また、上記実施例では多重化されたタスクは並列に
実行されているとしたが、タスク単位の待機冗長方式を
採用した場合にも本発明は適用可能である。ここでタス
ク単位の待機冗長方式とは、多重化されたタスクのうち
実際に稼動するタスクは一つで、残りのタスクは待機し
て定期的に、あるいは、何らかのきっかけで稼動中のタ
スクから送信されるタスクの内部状態を受信して、稼動
中のタスクが停止したことを検出した場合に待機中のタ
スクの内の一つが稼動を開始する方式である。

【００８５】次に、図１１、図１２を参照しつつ、本発
明の分散処理システムの第２実施例について、その構成
を詳細に説明する。

【００８６】第２実施例の分散処理システムは、図１１
の構成図に示すように複数の計算機１０１（図２８の１
に対応）が通信路１０２（図２８の２に対応）で接続さ
れている。計算機１０１はタスクを実行するタスク処理
装置１０３と、計算機の故障時や追加時にタスクを実行
する計算機を決定して割当てる割当て装置１０４と、タ
スク処理装置１０３およびタスク割当て装置１０４が扱
うデ―タを保存する記憶装置１０５と、計算機間のメッ
セ―ジ通信を処理する通信装置１０６とからなり、計算
機１０１と通信路１０２とは通信装置１０６を通じて接
続されている。

【００８７】図１２は図１１に示すタスク割当て装置１
０４の構成を示す図である。同図において、タスク多重
度減少検出手段１４１はタスクの動作状態を記した動作
状態メッセ―ジを周期的にタスク動作状態収集手段１４
２宛に放送するとともに、周期的にタスク処理装置１０
３で実行中のタスクの多重度を調べて、タスクの多重度
が減少した場合には、該当するタスクを記した多重度減
少タスク名リストを同一計算機１０１内の転送元・転送
先判定手段１４３に渡す。

【００８８】タスク動作状態収集手段１４２は、分散処
理システム内のすべての計算機１０１内のタスク多重度
減少検出手段１４１が周期的に放送する前記の動作状態
メッセ―ジを受信して記憶装置１０５に格納する。

【００８９】転送元・転送先判定手段１４３はタスクの
複写あるいは移動時に、タスクが使用する変数の値やプ
ログラムの位置を示すアドレスなどからなるタスクの内
部状態の転送元となる計算機と転送先となる計算機を判
定する。また、タスクを移動する場合にはタスクを削除
する計算機を判定する。この際、分散処理システムのよ
り正確な状態を判定処理に反映させて、より好ましい負
荷分散の結果を得るために、一度に一つのタスクの割当
て方法を判定する。そのために判定順序を調整するため
の判定権要求メッセ―ジを判定順序管理手段１４４宛に
放送する。

【００９０】また判定処理の判定基準に用いる分散処理
システム内の計算機の状態に関する情報を収集するため
に、計算機状態要求メッセ―ジを計算機状態管理手段１
４５宛に放送して結果を受信する。さらに、転送元とな
る計算機を選定する場合には、受け入れ可能であるかを
確認する問い合わせメッセ―ジを該当計算機内のタスク
受け入れ判定手段１４６宛に送信して結果を受信する。
このようにして得られた情報に基づいて決定した判定結
果を記した転送方法メッセ―ジをタスク内部状態複写手
段１４７宛に放送する。

【００９１】判定順序管理手段１４４は転送元・転送先
判定手段１４３からの前記判定権要求メッセ―ジを受信
して、判定順序を決定して記憶装置１０５に格納する。
転送元・転送先判定手段１４３はこの順序にしたがって
判定処理を開始する。

【００９２】計算機状態管理手段１４５は転送元・転送
先判定手段１４３からの計算機条件要求メッセ―ジを受
信すると、同一計算機１０１内のタスク処理装置１０３
の計算負荷と動作中のタスクのタスク名のリストを送信
元計算機の転送元・転送先判定手段１４３宛に返送す
る。

【００９３】タスク受け入れ判定手段１４６は転送元・
転送先判定手段１４３からの問い合わせメッセ―ジを受
信すると、メッセ―ジ記載のタスクを受け入れることが
できるかどうかを判定して結果を送信元計算機の転送元
・転送先判定手段１４３宛に返送する。

【００９４】タスク内部状態複写手段１４７は受信した
メッセ―ジに記載のタスクが同一計算機１０１内のタス
ク処理装置１０３で動作中であればタスクの動作を中断
する。メッセ―ジ記載の転送元計算機であればタスクの
内部状態を転送先計算機内のタスク内部状態複写手段１
４７宛に送信する。転送先計算機であれば内部状態を受
信後、転送の終了を通知するための転送終了メッセ―ジ
を転送元・転送先判定手段１４３とタスク内部状態複写
手段１４７宛に放送する。また、タスクを削除する計算
機であれば該当タスクを削除する。転送終了メッセ―ジ
を受信した場合は該当タスクの動作を再開する。

【００９５】タスク割当て要求手段１４８は計算機１０
１を追加した場合に計算負荷が高い計算機から計算負荷
がより低い計算機へタスクを移動するためのきっかけと
して計算機が追加されたことを示すタスク割当て要求メ
ッセ―ジを転送元・転送先判定手段１４３宛に放送す
る。タスク割当て要求メッセ―ジは、分散処理システム
内のすべての計算機１０１内の転送元・転送先判定手段
１４３が受信して、前記判定処理を開始する。なお、各
計算機のタスク割当て装置１０４が互いにメッセージ通
信を行う場合におけるメッセージは、上記したタスク割
当て手段１０４内の１つの手段、例えばタスク割当て要
求手段１４８であることを示すデ―タＭ２と計算機名を
示すデ―タとメッセージ本体とからなる。また、放送通
信方式で送信する場合は計算機名を示すデ―タの代わり
に放送モ―ドであることを示すデ―タを使う。例えば、
計算機ＰＵ１がＰＵ２のタスク割当て要求手段１４８宛
にメッセ―ジを送信する場合、その内容は（Ｍ２，ＰＵ２，メッセ―ジ本体）となる。また、計算機ＰＵ１が分散処理システム内のす
べてのタスク割当て要求手段１４８宛にメッセ―ジを放
送する場合、その内容は（Ｍ２，放送，メッセ―ジ本体）となる。

【００９６】以下に、上記したタスク多重度減少検出手
段１４１、タスク動作状態収集手段１４２、転送元・転
送先判定手段１４３、判定順序管理手段１４４、計算機
状態管理手段１４５、タスク受け入れ判定手段１４６、
タスク内部状態複写手段１４７、タスク割当て要求手段
１４８の処理動作手順を詳細に説明する。

【００９７】図１３は同実施例の動作を説明するための
デ―タの流れの概略を示す図であり、図の中の矢印はデ
―タの流れを示している。図１３の動作状態メッセ―ジ
テ―ブル１５１、タスク状態テ―ブル１５２、判定順序
テ―ブル１５３、計算機状態テ―ブル１５４、多重度不
足タスクテ―ブル１５５は計算機１０１内の記憶装置１
０５（図１１）に格納されているテ―ブルであり、動作
状態メッセージテーブル１５１の構成は図１４に、タス
ク状態テーブル１５２の構成は図１５に、判定順序テー
ブル１５３の構成は図１６に、計算機状態テーブル１５
４の構成は図１７に、多重度不足タスクテーブル１５５
の構成は図１８に示されている。

【００９８】まず、分散処理システム内の計算機の構成
に変更がない場合の通常の作用を説明する。ここでは、
図２８の模式図の状態でタスクが動作しているとする。
同図で計算機を四角形で、タスクを円で、それぞれ示し
ている。

【００９９】まず、タスク多重度減少検出手段１４１
（図１３）は、計算機内のタスク処理装置で動作中のタ
スクを調べて、動作状態メッセ―ジ１６１（図１３）を
作成して、分散処理システム内のタスク動作状態収集手
段１４２宛に放送する（図１９のステップ４０１）。動
作状態メッセ―ジ１６１は、自計算機名と自計算機内で
動作中のタスクのタスク名リストからなる。例えば計算
機ＰＵ１においてメッセ―ジ本体は（ＰＵ１，ＴＡ，ＴＢ，ＴＣ）のようになる。

【０１００】タスク動作状態収集手段１４２は分散処理
システム内の動作状態メッセ―ジ１６１を受信すると
（図２０のステップ５０１）、図１４に示すような動作
状態メッセ―ジテ―ブル１５１の計算機名の欄を調べて
（同ステップ５０２）、メッセ―ジ記載の計算機名があ
れば、その項目をテ―ブルから削除する（同ステップ５
０３）。その後で動作状態メッセ―ジ１６１の受信時刻
と動作状態メッセ―ジ１６１を動作状態メッセ―ジテ―
ブル１５１に書き込む（同ステップ５０４）。ここで、
受信時刻の欄を調べて一定時間経過した項目は削除する
（同ステップ５０５）。後述するように、タスク多重度
減少検出手段１４１が動作状態メッセ―ジ１６１を周期
的に放送しているので、このような項目に記載された計
算機は何らかの理由により停止していると考えられる。

【０１０１】次に、タスク多重度減少検出手段１４１
は、タスク動作状態収集手段１４２が随時更新する動作
状態メッセ―ジテ―ブル１５１を用いて、タスク状態テ
―ブル１５２（図１５）を更新する（図１９のステップ
４０２）。タスク状態テ―ブル１５２は、計算機内で動
作中のタスクのタスク名、そのタスクの現在の多重度、
前回更新時の多重度（旧多重度という）を記録したもの
である。ここでテ―ブルの更新とは、多重度の欄のデ―
タを旧多重度の欄にコピ―するとともに、タスク状態テ
―ブル１５２を用いてタスクの多重度を計算して多重度
の欄に記入することを意味する。

【０１０２】テ―ブル更新後、図１９のステップ４０３
以降でタスクの多重度が減少したかどうかを検査すべく
テ―ブルの先頭から順にタスクの多重度と旧多重度の差
を計算していく。通常はタスクの多重度に変化はないの
で、他の処理は実行せずにステップ４１２に到達して一
定時間待ってから再びステップ４０１を実行する。すな
わち、タスク多重度減少検出手段１４１は周期的に動作
状態メッセ―ジ１６１を放送して、タスクの多重度を検
査しているのである。なお、タスク状態テ―ブル１５２
には計算機内で動作中のタスクについてのみ記録してあ
るので、タスクの多重度の算出および検査の処理をタス
ク毎に分散処理システム内の計算機で負荷分散すること
になり効率が良い。

【０１０３】次に、計算機が故障してタスクの多重度が
減少した場合の作用を説明する。

【０１０４】例えば、図２８の状態でタスクが動作して
いて計算機ＰＵ２が故障して停止した場合を考える。す
ると、タスク多重度減少検出手段１４１（図１３）の処
理動作手順の内、上述のステップ４０３（図１９）以降
でタスクＴＡ、ＴＣ、ＴＤの多重度減少が検出される。
例えば計算機ＰＵ１でタスクＴＡ、ＴＢ、ＴＣが動作し
ているので、タスク状態テ―ブル１５２（図１５）のタ
スクＴＡの項目を読み出して（図１９のステップ４０
３）、多重度−旧多重度＝１−２＜０となるので（同ステップ４０６）、多重度減少タスク名
リスト１６２（図１３）にタスク名ＴＡを追加する（図
１９のステップ４０７）。次にタスク状態テ―ブル１５
２のタスクＴＢの項目を読み出すが（同ステップ４０
８、同ステップ４０９）、多重度−旧多重度＝２−２＝０となるので（同ステップ４０６）なにもしない。さら
に、タスク状態テ―ブル１５２のタスクＴＣの項目を読
み出す（同ステップ４０８、４０９）。

【０１０５】多重度−旧多重度＝２−３＜０となるので（同ステップ４０６）、多重度減少タスク名
リスト１６２にタスク名ＴＣを追加する。この場合は図
１５に示すようなタスク状態テ―ブル１５２の最後まで
到達したことになる。なお、多重度が０になった場合は
（同ステップ４０４）、その原因がタスクの正常終了に
よるものか、計算機の故障によるものか、のいずれの場
合にしても、動作しているタスクが存在しないので、タ
スクの複写は不可能である。そこで、タスク状態テ―ブ
ル１５２から該当タスクの項目を削除する（同ステップ
４０５）。

【０１０６】次に、多重度減少タスク名リスト１６２は
空でないので（同ステップ４１０）、多重度減少タスク
名リスト１６２を計算機ＰＵ１内の転送元・転送先判定
手段１４３（図１３）へ出力する（同ステップ４１
１）。例えば、多重度減少タスク名リスト１６２のメッ
セ―ジ本体は（ＰＵ１，ＴＡ，ＴＣ）である。タスクＴＤの多重度も減少しているが、これに
ついては、タスクＴＤが動作中の計算機ＰＵ３で検出し
ている。

【０１０７】計算機ＰＵ１内の転送元・転送先判定手段
１４３は上述の多重度減少タスク名リスト１６２を受信
すると（図２１のステップ６０１）、判定権要求メッセ
―ジ１６３（図１３）を作成して放送する（図２１のス
テップ６０３）。宛先は判定順序管理手段１４４（図１
３）である。この放送は、タスクの内部状態を転送する
際の転送元計算機と転送先計算機を判定する権利（以
下、判定権という）を獲得する計算機を決めることと、
判定する順序を決めることのきっかけとして実施され
る。

【０１０８】実際、タスクＴＣの多重度減少は計算機Ｐ
Ｕ１とＰＵ３で検出されるので、ＰＵ１とＰＵ３は判定
権の獲得に関して競合するので、この競合を解消する必
要がある。また、判定の順序は分散処理システム内で矛
盾無く決まる必要がある。また、判定を順番に実行でき
れば、各転送処理後の計算負荷が正確に反映される。す
なわち、より好ましい負荷分散の結果が得られる。

【０１０９】判定権要求メッセ―ジ１６３は、タスク
名、自計算機名、そして、タスクを複写する処理である
か、タスクを移動する処理であるかを示すデ―タ（以下
では、前者の場合に複写フラグといい、後者の場合に移
動フラグという）からなる。この場合はタスクＴＡに関
する判定権要求メッセ―ジ１６３のメッセ―ジ本体は（ＴＡ，ＰＵ１，複写）であり、タスクＴＣに関する判定権要求メッセ―ジ１６
３のメッセ―ジ本体は（ＴＣ，ＰＵ１，複写）である。上述したように計算機ＰＵ３でもタスクＴＣの
多重度減少を検出しているので、計算機ＰＵ３もタスク
ＴＣに関するメッセ―ジ本体が（ＴＣ，ＰＵ３，複写）であるような判定権要求メッセ―ジ１６３を放送しよう
とする。しかし、同一タスクに関する判定権要求メッセ
―ジ１６３のうち、いずれか一つを採用する場合先着優
先方式を利用することにすれば、後から放送したものは
無駄になる。そこで、後述するように、すでに該当タス
クに関する判定権要求メッセ―ジ１６３を受信している
かどうかを確認できるようにする。このことは、通信量
と通信のための処理を減らし、通信遅延を削減すること
になる。さらに、最も早く判定権要求メッセ―ジ１６３
を放送することができた計算機は計算負荷がより低いと
考えられるので、より低負荷の計算機が判定の処理を実
行することとなり、分散処理システム全体の処理効率が
良くなる。

【０１１０】さて、該当タスクに関する判定権要求メッ
セ―ジ１６３の受信の有無を確認できるようにする手段
が判定順序管理手段１４４（図１３）である。判定順序
管理手段１４４は判定権要求メッセ―ジ１６３を受信す
ると（図２３のステップ７０１）、図１６に示すような
判定順序テ―ブル１５３を更新する。判定順序テ―ブル
１５３の各項目は判定権要求メッセ―ジ１６３と同じで
ある。すなわち、タスク名、計算機名、複写フラグまた
は移動フラグからなる。この場合は、受信した判定権要
求メッセ―ジ１６３は複写フラグ付きであるので（同ス
テップ７０２）、メッセ―ジ記載のタスク名を判定順序
テ―ブル１５３の各項目のタスク名と比較して（同ステ
ップ７０３）、タスク名が同一で複写フラグ付きの項目
があれば、先着メッセ―ジがあるので受信したメッセ―
ジは捨てる。また、タスク名が同一で複写フラグ付きの
項目がなければ、そのメッセ―ジを判定順序テ―ブル１
５３の末尾に追加する（同ステップ７０４）。

【０１１１】再び転送元・転送先判定手段１４３の処理
動作手順の説明に戻る。転送元・転送先判定手段１４３
は上述したような通信遅延の削減のために、判定権要求
メッセ―ジ１６３を放送する際は判定順序テ―ブル１５
３を参照して、すでに該当タスクに関する判定権要求メ
ッセ―ジ１６３を受信しているかどうかを確認して放送
するかどうかを決める（図２１のステップ６０３）。続
いて一定時間停止する（同ステップ６０５）。これは判
定順序テ―ブル１５３の更新を待つためである。次に判
定権を獲得したかどうかを確認するために判定順序テ―
ブル１５３を再び参照する（同ステップ６０６）。判定
順序テ―ブル１５３内に自計算機名がなければ判定権を
獲得できなかったので終了する。判定順序テ―ブル１５
３の先頭に自計算機名があれば（同ステップ６０７）、
判定順序テ―ブル１５３の先頭に記載のタスクに関する
判定処理を開始する（同ステップ６１２以降）。

【０１１２】自計算機名が判定順序テ―ブル１５３の２
番目以降にある場合は、判定処理の結果として実行され
る転送処理が終了したときに送信される転送終了メッセ
―ジ１６４（図１３）を受信するまで、一定時間待つと
ともに（図２１のステップ６０８）、受信の有無の確認
を繰り返す（同ステップ６０９）。転送終了メッセ―ジ
１６４は転送処理の対象のタスク名からなる。例えばタ
スクＴＡの転送処理が終了したときの転送終了メッセ―
ジ１６４のメッセ―ジ本体は（ＴＡ）である。転送終了メッセ―ジ１６４を受信するとメッセ
―ジ記載のタスク名を含む項目を判定順序テ―ブル１５
３から削除する（同ステップ６１０）。その結果判定順
序テ―ブル１５３の先頭に自計算機名があれば（同ステ
ップ６１１）判定処理を実行する（同ステップ６１２以
降）。自計算機名が判定順序テ―ブル１５３の２番目以
降にある場合はステップ６０８に戻り、自計算機名が判
定順序テ―ブル１５３の先頭に来るまで以上の処理を繰
り返す。

【０１１３】転送元・転送先判定手段１４３における判
定処理は計算機状態要求メッセ―ジ１６５（図１３）を
放送することから始まる（図２１のステップ６１２）。
計算機状態要求メッセ―ジ１６５は自計算機名からな
る。宛先は計算機状態管理手段１４５（図１３）であ
る。例えば計算機ＰＵ１内の転送元・転送先判定手段１
４３が放送する計算機状態要求メッセ―ジ１６５のメッ
セ―ジ本体は（ＰＵ１）である。

【０１１４】計算機状態要求メッセ―ジ１６５を受信す
るのは分散処理システム内のすべての計算機状態管理手
段１４５（図１３）である。計算機状態管理手段１４５
は計算機状態要求メッセ―ジ１６５を受信すると（図２
４のステップ８０１）、計算負荷とタスク処理装置で動
作中のタスクを調べる（同ステップ８０２）。次に計算
機状態メッセ―ジ１６６（図１３）を作成する（図２４
のステップ８０３）。計算機状態メッセ―ジ１６６は、
計算機名と計算負荷とタスク処理装置で動作中のタスク
のタスク名リストからなる。例えば計算機ＰＵ３内の計
算機状態管理手段１４５が作成する計算機状態メッセ―
ジ１６６のメッセ―ジ本体は（ＰＵ３，０．７２，ＴＢ，ＴＣ，ＴＤ）である。そして受信したメッセ―ジ記載の計算機名の転
送元・転送先判定手段１４３宛に前記の計算機状態メッ
セ―ジ１６６を送信する（同ステップ８０４）。転送元
・転送先判定手段１４３は前記計算機状態メッセ―ジ１
６６を受信すると（図２２のステップ６１３）、メッセ
―ジの内容で図１７のような計算機状態テ―ブル１５４
を更新する（同ステップ６１４）。計算機状態テ―ブル
１５４の各項目は計算機状態メッセ―ジ１６６と同じで
ある。すなわち、計算機名、該当計算機の計算負荷、該
当計算機のタスク処理装置で動作中のタスクのタスク名
リストからなる。

【０１１５】次に、計算機状態テ―ブル１５４記載の情
報からタスクの内部状態を転送する際の転送先になる計
算機を判定する。転送先には、転送対象となるタスクが
動作していない必要がある。さらに、計算負荷が低い方
が負荷分散の観点から望ましい。そこで、該当タスクが
動作していない計算機を計算機状態テ―ブル１５４から
見つけ出す（同ステップ６１５）。見つからない場合は
複写することができない。したがって該当タスクの多重
度を維持することができない。このようなタスクについ
ては、計算機を追加したときに多重度を回復できるよう
にするために、多重度が不足していることを図１８のよ
うな多重度不足タスクテ―ブル１５５に該当タスク名を
記録しておく（同ステップ６１６）。さて、該当タスク
が動作していない計算機が見つかった場合は、そのうち
で計算負荷が最低の計算機宛に該当タスク受け入れの可
否を確認するための問い合わせメッセ―ジ１６７（図１
３を送信する（図２２のステップ６１７）。問い合わせ
メッセ―ジ１６７は自計算機名と該当タスク名からな
る。例えば計算機ＰＵ１の転送元・転送先判定手段１４
３においてタスクＴＡの転送先を見つける場合は図１７
を調べて、タスクＴＡが動作していない計算機ＰＵ３と
ＰＵ４が転送先計算機の候補となる。そして、そのうち
計算負荷が最低の計算機ＰＵ３のタスク受け入れ判定手
段１４６（図１３）宛にメッセ―ジ本体が（ＰＵ１，ＴＡ）であるような問い合わせメッセ―ジ１６７を送信する。

【０１１６】問い合わせメッセ―ジ１６７を受信するの
は宛先として指定された計算機内のタスク受け入れ判定
手段１４６（図１３）である。タスク受け入れ判定手段
１４６は問い合わせメッセ―ジ１６７を受信すると（図
２５のステップ９０１）、メッセ―ジ記載のタスクの受
け入れ可能性を判定する（同ステップ９０２）。判定基
準は、例えば計算負荷に関して受け入れ可能とする場合
の上限値を用意しておいて、現在の計算負荷がその値を
下回る場合は受け入れ可能であるとして、その値を上回
る場合は受け入れ不可能であると判定する方法がある。
あるいは、タスクが計算負荷へ及ぼす影響に関する情報
などから制限時間内にタスク群を実行できるかどうかを
判定する手段などを用いることができる。判定の結果
（同ステップ９０３）、受け入れ可能であれば、受信し
た問い合わせメッセ―ジ１６７に記載されている計算機
の転送元・転送先判定手段１４３宛に受け入れ可能メッ
セ―ジ１６８（図１３）を返送する（図２５のステップ
９０４）。受け入れ可能であれば、受信した問い合わせ
メッセ―ジ１６７に記載されている計算機の転送元・転
送先判定手段１４３宛に受け入れ不可能メッセ―ジ１６
９（図１３を返送する（図２５のステップ９０５）。受
け入れ可能メッセ―ジ１６８と受け入れ不可能メッセ―
ジ１６９のメッセ―ジ本体は、それぞれ、（“ＯＫ”）（“ＮＧ”）のようなものである。“ＯＫ”、“ＮＧ”はメッセ―ジ
を識別する目的で使っている。

【０１１７】転送元・転送先判定手段１４３は一定時間
内に受け入れ可能メッセ―ジ１６８を受信した場合は
（図２２のステップ６１８）、該当計算機を転送先の計
算機にする（同ステップ６２１）。一定時間内に受け入
れ不可能メッセ―ジ１６９を受信した場合、または、一
定時間内にメッセ―ジを受信できなかった場合は転送先
候補から該当計算機を除いた結果、計算負荷が最低にな
る計算機に問い合わせメッセ―ジ１６７を送信する（同
ステップ６１９、ステップ６２０）。

【０１１８】このような処理を、受け入れ可能メッセ―
ジ１６８を受信して転送先計算機が決定するか、転送先
候補が無くなって転送先計算機が無いことが判明するま
で繰り返す。例えば計算機ＰＵ１でタスクＴＡの転送先
の候補は上述のように計算機ＰＵ３とＰＵ４であるが、
計算負荷が最低の計算機ＰＵ３に問い合わせメッセ―ジ
１６７を送信してから一定時間内に受け入れ可能メッセ
―ジ１６８が届かなかった場合は、計算機ＰＵ４宛に問
い合わせメッセ―ジ１６７を送信する。場合によって
は、計算機ＰＵ４から受け入れ不可能メッセ―ジ１６９
が届くか、あるいは、時間内にメッセ―ジが届かないか
もしれない。その場合はもはや転送先となる計算機は無
いので、該当タスクの多重度は減少したままとなる。そ
こで、このような場合は先ほどと同様に多重度不足タス
クテ―ブル１５５に該当タスク名を登録する。もし計算
機ＰＵ４から受け入れ可能メッセ―ジ１６８が届いた
ら、計算機ＰＵ４を転送先計算機にする。

【０１１９】転送先計算機が決定したら、さらに転送元
計算機を判定する。転送元計算機は転送の対象となるタ
スクが動作中である必要がある。また、転送作業は通常
のタスクの処理の合間を縫って実行するので、計算負荷
が低い計算機が転送元となった方が効率が良い。そこ
で、該当タスクが動作している計算機を計算機状態テ―
ブル１５４から見つけ出し（同ステップ６２２）、その
うち計算負荷が最低の計算機を転送元にする（同ステッ
プ６２３）。ここで考えている例ではタスクＴＡが動作
している唯一の計算機ＰＵ１が転送元計算機になる。な
お、少なくとも判定権を獲得した計算機では該当タスク
が動作しているので、転送元計算機は必ず見つかる。

【０１２０】ここではタスクの複写を考えているので、
転送先と転送元が決まれば転送方法が決定したことにな
る（同ステップ６２４）。そこで、転送方法メッセ―ジ
１７０（図１３）を作成して放送する（図２２のステッ
プ６２６）。転送方法メッセ―ジ１７０は、該当タスク
名、転送元計算機名、転送先計算機名、移動する場合に
該当タスクを削除する計算機名、複写フラグまたは移動
フラグからなる。ここでは複写する場合を考えているの
で削除する計算機は指定せずに計算機名とはなり得ない
デ―タ、例えば−１、を使ってメッセ―ジを作成する。
宛先はタスク内部状態複写手段１４７（図１３）であ
る。例えば、タスクＴＡについて複写する場合は、転送
元計算機がＰＵ１で、転送先計算機がＰＵ４であれば、
転送方法メッセ―ジ１７０のメッセ―ジ本体は（ＴＡ，ＰＵ１，ＰＵ４，−１，複写）のようになる。

【０１２１】転送方法メッセ―ジ１７０を受信するのは
分散処理システム内のすべてのタスク内部状態複写手段
１４７（図１３）である。タスク内部状態複写手段１４
７は転送方法メッセ―ジ１７０を受信すると（図２６の
ステップ９１１）、自計算機内のタスク処理装置で受信
したメッセ―ジ記載のタスクが動作中かどうかを調べる
（同ステップ９１４）。該当タスクが動作中でなければ
そのまま処理を終了する。該当タスクが動作中であれ
ば、そのタスクの動作を中断する（同ステップ９１
５）。自計算機の計算機名が、受信したメッセ―ジ記載
の転送元計算機名と一致すれば（同ステップ９１６）、
該当タスクの内部状態のデ―タを転送デ―タ１７１（図
１３）として、受信したメッセ―ジ記載の転送先計算機
に転送する（図２６のステップ９１７）。例えば、転送
デ―タ１７１は（“ＤＡＴＡ”，デ―タ本体）のような構成である。“ＤＡＴＡ”はメッセ―ジを識別
する目的で使っている。転送先計算機のタスク内部状態
複写手段１４７は、転送デ―タ１７１を受信すると（同
ステップ９１２）、タスク内部状態のデ―タを複写する
（同ステップ９２０）。複写処理終了後、転送終了メッ
セ―ジ１６４を放送する（同ステップ９２１）。転送終
了メッセ―ジ１６４は、すでに説明したように、転送処
理の対象のタスク名からなる。宛先は転送元・転送先判
定手段１４３とタスク内部状態複写手段１４７である。
例えばタスクＴＡの転送処理が終了したときの転送終了
メッセ―ジ１６４のメッセ―ジ本体は（ＴＡ）である。

【０１２２】転送終了メッセ―ジ１６４を受信するのは
分散処理システム内のすべてのタスク内部状態複写手段
１４７および転送元・転送先判定手段１４３である。転
送元・転送先判定手段１４３が受信した場合の処理はす
でに説明したので、タスク内部状態複写手段１４７が受
信した場合の処理をここで説明する。タスク内部状態複
写手段１４７は転送終了メッセ―ジ１６４を受信すると
（同ステップ９１３）受信したメッセ―ジ記載のタスク
の動作を再開する（同ステップ９２２）。

【０１２３】このようにして、計算機が故障した場合で
もタスクの多重度を維持することができる。また、分散
処理システム内の計算負荷、あるいは、計算機の数と多
重度の兼ね合いからタスクの多重度を維持できない場合
は該当タスク名を記録して、計算機を追加したときに多
重度を回復できるようにする。

【０１２４】以下に、計算機を追加して負荷分散を図る
必要がある場合の作用を説明する。なお、計算機が故障
した場合の作用とほぼ同様の内容であるので、違う部分
について主に説明する。

【０１２５】分散処理システム内に新たに計算機を追加
すると、その計算機のタスク割当て要求手段１４８（図
１３）が動作する。これは、計算機追加時に利用者が動
作開始命令を入力することで実現できる。タスク割当て
要求手段１４８はタスク割当て要求メッセ―ジ１７２
（図１３）を作成して、放送する（図２７のステップ９
３１、ステップ９３２）。これは、計算負荷が高い計算
機から計算負荷がより低い計算機へタスクを移動するた
めのきっかけとなる。例えばタスク割当て要求メッセー
ジ１７２は、（“ＲＥＱ”）のようなものである。“ＲＥＱ”はメッセ―ジを識別す
る目的で使っている。

【０１２６】タスク割当て要求メッセ―ジ１７２を受信
するのは転送元・転送先判定手段１４３である。転送元
・転送先判定手段１４３はタスク割当て要求メッセ―ジ
１７２を受信すると（図２１のステップ６０２）、タス
ク割当て方法を判定する権利を獲得するために判定権要
求メッセ―ジ１６３を作成して放送する（同ステップ６
０４）。その際、多重度不足タスクテ―ブル１５５（図
１８）と判定順序テ―ブル１５３（図１６）を参照す
る。多重度不足タスクテ―ブル１５５に記録されたタス
クで、まだ動作しているものは多重度が不足しているの
で、そのタスクは複写すべきである。なお、該当タスク
が動作しているか否かは、自計算機でタスクが動作して
いるか否かで決まる。というのは、多重度不足タスクテ
ーブル１５５に記録する計算機は、タスク割当て方法を
判定する権利を獲得した計算機であり、そのような計算
機では、該当タスクが元々動作しているからである。

【０１２７】そこでそのタスクについて判定権要求メッ
セ―ジ１６３を作成して判定順序管理手段１４４宛に放
送するとともに、そのタスク名を多重度不足タスクテ―
ブル１５５から削除する。例えば、計算機ＰＵ３の多重
度不足タスクテ―ブル１５５にタスクＴＤが記録されて
いれば、判定権要求メッセ―ジ１６３のメッセ―ジ本体
は（ＴＤ，ＰＵ３，複写）である。さらに、計算負荷が一定値以上になっている計
算機は、動作中のタスクを計算負荷がより低い計算機に
移動するために、移動フラグ付きの判定権要求メッセ―
ジ１６３を作成する。例えば、計算機ＰＵ３の計算負荷
が一定値以上であり、タスクＴＢ、ＴＣ、ＴＤが動作中
であれば、判定権要求メッセ―ジ１６３のメッセ―ジ本
体は（ＴＢ，ＰＵ３，移動）（ＴＣ，ＰＵ３，移動）（ＴＤ，ＰＵ３，移動）である。この場合、追加した計算機にタスクが移動する
とは限らないが、その時点で負荷が最も低い計算機にタ
スクを移動することができるので、分散処理システム全
体において、より望ましい負荷分散が実現される。な
お、判定権要求メッセ―ジ１６３を放送する際は判定順
序テ―ブル１５３を参照して、すでに該当タスクに関す
る判定権要求メッセ―ジ１６３を受信しているかどうか
を確認して放送するかどうかを決める。該当タスクに関
するメッセ―ジを受信していなければ放送する。該当タ
スクに関して移動フラグ付きのメッセ―ジを受信してい
る場合は、複写フラグ付きのメッセ―ジについては放送
し、移動フラグ付きのメッセ―ジは放送しない。該当タ
スクに関して複写フラグ付きのメッセ―ジを受信してい
る場合は、移動フラグ付きのメッセ―ジについては放送
し、複写フラグ付きのメッセ―ジは放送しない。

【０１２８】さて、上述のように、判定権要求メッセ―
ジ１６３を受信するのは判定順序管理手段１４４であ
り、タスク名が重複しないように判定順序テ―ブル１５
３を更新するものである。ここでは移動フラグ付きのメ
ッセ―ジがあるので（図２３のステップ７０２）、メッ
セ―ジ記載のタスク名を判定順序テ―ブル１５３の各項
目のタスク名と比較して（同ステップ７０５）、タスク
名が同一で移動フラグ付きの項目であれば、先着メッセ
―ジがあるので受信したメッセ―ジは捨てる。また、タ
スク名が同一で移動フラグ付きの項目がなければ、その
メッセ―ジを複写フラグ付きの項目の前に挿入する（同
ステップ７０６）。タスクの移動を先に実行して負荷分
散を図ってから、タスクの多重度の維持という信頼性の
問題に対処することで、タスクの移動、複写の処理全体
の効率が向上する。

【０１２９】転送元・転送先判定手段１４３は、移動フ
ラグの有無に関する分岐（図２２のステップ６２４）を
除いて、上述したとおりに作用する。移動フラグがある
場合は（同ステップ６２４）、該当タスクを複写した後
に、計算負荷が高い計算機から該当タスクを削除する必
要がある。そこで、計算機状態テ―ブル１５４（図１
７）を参照して、該当タスクが動作している計算機の内
で計算負荷が最高の計算機タスクを削除する計算機とし
て（図２２のステップ６２５）、転送方法メッセ―ジ１
７０を作成して、放送する（同ステップ６２６）。例え
ば、タスクＴＢについて移動する場合は、転送元計算機
がＰＵ１で、転送先計算機がＰＵ４で、タスクを削除す
る計算機がＰＵ３てあれば、メッセ―ジ本体は（ＴＢ，ＰＵ１，ＰＵ４，ＰＵ３，移動）のようになる。このように、タスクを移動する場合に、
必ずしも転送元計算機とタスクを削除する計算機とは一
致しない。これは、より望ましい負荷分散の結果を得る
ためと、より効率的なタスクの内部状態を転送する処理
を実現するための重要な点である。

【０１３０】さて、タスク内部状態複写手段１４７は転
送方法メッセ―ジ１７０を受信すると（図２６のステッ
プ９１１）、すでに述べた処理動作手順を実行する。特
に、メッセ―ジに移動フラグがあり、メッセ―ジ記載の
タスクを削除する計算機名が自計算機名である場合（同
テスップ９１８）、該当タスクを削除する（同ステップ
９１９）。

【０１３１】これで計算機を追加した場合に負荷分散を
実現するとともに、計算機が故障したときに不足したタ
スクの多重度を回復することができる。

【０１３２】以上のように、第２実施例は、（１）計算
機故障時にタスクの多重度の減少を検出してタスクを複
写するのでタスクの多重度を維持することができるとい
う信頼性の効果と、（２）タスクの割当てや多重度の維
持を人手によらずに行うことができるので利用者にタス
クの多重度やタスクを割当てる計算機を意識させる必要
がないという保守性の効果と、（３）タスクの割当て方
法をあらかじめ決めておく必要がなく、分散処理システ
ム内で実行するタスクの変更や計算機の変更が生じたと
きにも人手によらずに割当て方法を変更できるので、よ
り望ましいタスクの割当てが行われるという適応性、保
守性の効果と、（４）タスクの割当ての手段を分散処理
システム内の各計算機に分散させているので、一部の計
算機が故障した場合でもタスクの割当てを行うことがで
きるという信頼性の効果と、タスク割当て処理の計算負
荷をシステム内の各計算機に分散するので、システム全
体の処理効率が向上するという処理性の効果と、を有
し、信頼性、保守性、適応性、処理性に優れた分散処理
システムを提供することが可能となる。

【０１３３】また、タスクの複写と移動は信頼性維持あ
るいは負荷分散のために実行するものであり、通常のタ
スク実行の合間に分散して実行することで、タスク割当
て処理が引き起こす計算負荷の増大や、通信量の増大を
抑えることができる。

【０１３４】また、転送元・転送先判定手段１４３が判
定権を獲得する方法が先着優先であることから、判定権
を獲得する計算機が比較的計算負荷の低いものになる可
能性が高いことと、転送元計算機と転送先計算機が比較
的計算負荷の低いものになる可能性が高いことからし
て、分散処理システム全体の処理効率が向上する。

【０１３５】さらに、タスクの移動の場合に削除する計
算機を単に転送元とせずに、計算負荷が高い計算機にし
ているので、より望ましい負荷分散が実現できる。

【０１３６】また、転送元・転送先判定手段１４３で
は、判定順序管理手段１４４が提供するデ―タを用い
て、競合する判定権要求メッセ―ジをすでに受信済みの
場合については、判定権要求メッセ―ジの放送を取りや
めるので、通信量と通信のための処理が減って通信遅延
を削減できる。

【０１３７】また、タスク多重度減少検出手段１４１で
は自計算機内で動作中のタスクについてのみ多重度の変
化を検査しているので、検査の処理をタスク毎に分散処
理システム内の計算機で負荷分散することになり効率が
良い。

【０１３８】また、タスク動作状態収集手段１４２で
は、メッセ―ジ受信時刻を調べて一定時間を経過したタ
スクに関する項目を削除しているので、タスクが終了し
た場合に終了した事実を通知する必要がなくなり、通信
量を抑えることができる。

【０１３９】また、判定順序管理手段１４４において、
タスクの移動を複写よりも優先的に実行するように順序
を決定しているため、タスクの移動により負荷分散をよ
り早い内に実現できるので、処理全体の効率が向上す
る。

【０１４０】以下に第２実施例の変形例を説明する。

【０１４１】上記第２実施例では多重化されたタスクは
並列に実行されているとしたが、上記したタスク単位の
待機冗長方式を採用した場合にも本発明は適用可能であ
る。また、実際に計算機に実装する方法としては、タス
ク処理装置とタスク割当て装置を同一のプロセッサに実
装する方法と、別のプロセッサに実装する方法がある。
処理効率は後者の方が優れているが、設備コストは前者
の方が低い。

【０１４２】また、上記第２実施例では、タスク割当て
要求メッセージを計算機追加時に放送しているが、これ
を一定時間計算負荷が低下した計算機から放送すること
でも負荷分散や多重度の回復を実現できる。

【０１４３】

【発明の効果】以上説明したように本発明は、（１）タ
スクを起動する前にタスクの多重度、及び、タスクの計
算機への割当て方法を決めておく必要がなく、タスクが
動作中のシステムの状況をタスクの多重度、及び、タス
クの計算機への割当て方法に反映することができるの
で、システムの処理効率をより望ましいものにすること
ができるという適応性の効果と、（２）タスクの多重度
の変更や計算機への割当てを人手によらずに行うことが
できるので、利用者にタスクの多重度や割当てる計算機
を意識させる必要がないという保守性の効果と、（３）
タスクの割当ての手段を分散処理システム内の各計算機
に分散させているので、一部の計算機が故障した場合で
もタスクの割当てを行うことができ、かつタスクの多重
度の減少を検出してタスクを複写するのでタスクの多重
度を維持することができるいう信頼性の効果と、タスク
割当て処理の計算負荷をシステム内の各計算機に分散す
るので、システム全体の処理効率が向上するという処理
性の効果と、を有し、信頼性、保守性、適応性、処理性
に優れた分散処理システムを提供することが可能とな
る。

【図面の簡単な説明】

【図１】本発明の第１実施例のシステム構成図である。

【図２】第１実施例のタスク処理装置のブロック図であ
る。

【図３】第１実施例の動作を説明するためのデータの流
れの概略を示す図である。

【図４】第１実施例において用いる要求多重度テーブル
の一例である。

【図５】第１実施例において用いる計算機状態テーブル
の一例である。

【図６】第１実施例において多重度決定手段の処理動作
手順を示すフローチャートである。

【図７】第１実施例において多重度管理手段の処理動作
手順を示す第１のフローチャートである。

【図８】第１実施例において多重度管理手段の処理動作
手順を示す第２のフローチャートである。

【図９】第１実施例において多重度管理手段の処理動作
手順を示す第３のフローチャートである。

【図１０】第１実施例においてタスク複写・削除手段の
処理動作手順を示すフローチャートである。

【図１１】本発明の第２実施例のシステム構成図であ
る。

【図１２】第２実施例のタスク割当て装置のブロック図
である。

【図１３】第２実施例の動作を説明するためのデ―タの
流れの概略を示す図である。

【図１４】第２実施例においてタスク割当て装置が処理
する動作状態メッセ―ジテ―ブルの一例である。

【図１５】第２実施例においてタスク割当て装置が処理
するタスク状態テ―ブルの一例である。

【図１６】第２実施例においてタスク割当て装置が処理
する判定順序テ―ブルの一例である。

【図１７】第２実施例においてタスク割当て装置が処理
する計算機状態テ―ブルの一例である。

【図１８】第２実施例においてタスク割当て装置が処理
する多重度不足タスクテ―ブルの一例である。

【図１９】第２実施例においてタスク多重度減少検出手
段の処理動作手順を示すフロ―チャ―トである。

【図２０】第２実施例においてタスク動作状態収集手段
の処理動作手順を示すフロ―チャ―トである。

【図２１】第２実施例において転送元・転送先判定手段
の処理動作手順を示す第１のフロ―チャ―トである。

【図２２】第２実施例において転送元・転送先判定手段
の処理動作手順を示す第２のフロ―チャ―トである。

【図２３】第２実施例において判定順序管理手段の処理
動作手順を示すフロ―チャ―トである。

【図２４】第２実施例において計算機状態管理手段の処
理動作手順を示すフロ―チャ―トである。

【図２５】第２実施例においてタスク受け入れ判定手段
の処理動作手順を示すフロ―チャ―トである。

【図２６】第２実施例においてタスク内部状態複写手段
の処理動作手順を示すフロ―チャ―トである。

【図２７】第２実施例においてタスク割当て要求手段の
処理動作手順を示すフロ―チャ―トである。

【図２８】タスク単位の多重化方式を説明するための模
式図である。

【図２９】計算機単位の多重化方式を説明するための模
式図である。

【符号の説明】

１，１０１…計算機、２，１０２…通信路、３，１０３
…タスク処理装置、４，１０５…記憶装置、５，１０６
…通信装置、３１…多重度決定手段、３２…多重度管理
手段、３３…タスク複写・削除手段、１０４…タスク割
当て装置、１４１…タスク多重度減少検出手段、１４２
…タスク動作状態収集手段、１４３…転送元・転送先判
定手段、１４４…判定順序管理手段、１４５…計算機状
態管理手段１４６…タスク受け入れ判定手段、１４７…
タスク内部状態複写手段、１４８…タスク割当て要求手
段。

Claims

(57)【特許請求の範囲】

【請求項１】通信路を介して接続された複数の計算機
によって複数のタスクをタスク単位で多重化して実行す
る分散処理システムであって、前記複数の計算機の各々は、各タスクにより要求される多重度に従って作成された要
求多重度テーブルを参照して計算機内で動作中の各タス
クの多重度を決定し、多重度の変更を行う対象タスクと
該対象タスクの多重度とを記述した多重度変更要求を放
送する多重度決定手段と、各計算機において動作中の各タスクに関する情報が記述
された計算機状態テーブルを参照して得られる前記対象
タスクの現在の多重度と、受信した前記多重度変更要求
に示される前記対象タスクの多重度とを比較し、このと
きの比較結果に基づいて前記対象タスクの複写及び削除
に関する処理の決定を行う多重度管理手段と、前記多重度管理手段からの複写又は削除に関する処理の
決定に基づいて前記対象タスクに対する複写・削除を実
行して前記対象タスクの多重度を変更するタスク複写・
削除手段と、を含むタスク処理手段を具備したことを特徴とする分散
処理システム。
【請求項２】前記要求多重度テーブルは、各タスクの
名称と、各タスクに対応した最小多重度及び最大多重度
情報とを備えており、前記多重度決定手段は、各タスク
により要求される多重度を記述した要求多重度メッセー
ジを受信したときに前記要求多重度テーブルを更新する
ことを特徴とする請求項１記載の分散処理システム。
【請求項３】前記計算機状態テーブルは、各計算機の
名称と、各計算機の計算負荷と、各計算機で動作中の各
タスクの名称からなるリストとを備えており、前記多重
度管理手段は、前記多重度変更要求に基づいて作成した
計算機状態メッセージにより前記計算機状態テーブルを
更新するとともに、この更新した前記計算機状態テーブ
ルを参照して得られた前記対象タスクの現在の多重度
と、前記多重度変更要求で指定された多重度とを比較す
ることを特徴とする請求項１又は２記載の分散処理シス
テム。
【請求項４】前記比較の結果、前記多重度変更要求に
記述された前記対象タスクの多重度の方が大きい場合に
は、前記多重度管理手段は、自身が担当する計算機内に
前記対象タスクが存在するか否かを判断し、存在しない
場合には、前記計算機状態テーブルから前記対象タスク
を含まない計算機のリストを作成し、当該リスト内から
前記多重度変更要求により変更された前記対象タスクの
多重度と、前記対象タスクの現在の多重度との差に相当
する個数の計算機を選択し、選択された計算機に自身の
担当する計算機が存在する場合は、当該計算機のタスク
複写・削除手段に前記対象タスクの複写要求を通知する
ことを特徴とする請求項３記載の分散処理システム。
【請求項５】前記比較の結果、前記計算機状態テーブ
ルを参照して求められた前記対象タスクの現在の多重度
の方が大きいとき、前記多重度管理手段は、自身が担当
する計算機内に前記対象タスクが存在するか否かを判断
し、存在する場合には、前記計算機状態テーブルから前
記対象タスクを含む計算機のリストを作成し、当該リス
ト内から、前記対象タスクの現在の多重度と、前記多重
度変更要求により変更された多重度との差に相当する個
数の計算機を選択し、選択された計算機が自身の担当す
る計算機である場合は当該計算機のタスク複写・削除手
段に前記対象タスクの削除要求を通知することを特徴と
する請求項３記載の分散処理システム。
【請求項６】前記タスク複写・削除手段が、前記多重
度管理手段から前記対象タスクの複写要求を受け取る
と、前記タスク複写・削除手段は、前記対象タスクの存
在する計算機のタスク複写・削除手段に転送要求を通知
するとともに、この転送要求を受け取ったタスク複写・
削除手段は、前記対象タスクの内部状態からなる転送デ
ータを転送要求を通知した計算機の前記タスク複写・削
除手段に通知することを特徴とする請求項４記載の分散
処理システム。