JPH08123768A - 分散システム管理方式及び分散システム管理方法 - Google Patents
分散システム管理方式及び分散システム管理方法Info
- Publication number
- JPH08123768A JPH08123768A JP6256631A JP25663194A JPH08123768A JP H08123768 A JPH08123768 A JP H08123768A JP 6256631 A JP6256631 A JP 6256631A JP 25663194 A JP25663194 A JP 25663194A JP H08123768 A JPH08123768 A JP H08123768A
- Authority
- JP
- Japan
- Prior art keywords
- management
- application
- managed application
- managed
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
Abstract
(57)【要約】
【目的】 管理装置が故障したり、負荷が高くて十分に
機能が発揮できないときでも、被管理装置が管理に関す
る処理を行ない分散システムの運用を可能にする。 【構成】 代替処理が可能な計算機に関する情報を予め
管理装置100から被管理装置200にダウンロードし
ておき、管理装置100が故障しているときなど負荷の
適正な配分ができない場合、被管理装置200が代替処
理可能な計算機上の被管理装置から負荷などの情報を集
め、その情報を評価して代替計算機を決定し、その計算
機に対して負荷を割り当てる。
機能が発揮できないときでも、被管理装置が管理に関す
る処理を行ない分散システムの運用を可能にする。 【構成】 代替処理が可能な計算機に関する情報を予め
管理装置100から被管理装置200にダウンロードし
ておき、管理装置100が故障しているときなど負荷の
適正な配分ができない場合、被管理装置200が代替処
理可能な計算機上の被管理装置から負荷などの情報を集
め、その情報を評価して代替計算機を決定し、その計算
機に対して負荷を割り当てる。
Description
【0001】
【産業上の利用分野】この発明は、複数の計算機によっ
て分散処理システムを管理する方式及び方法に関するも
のである。
て分散処理システムを管理する方式及び方法に関するも
のである。
【0002】
【従来の技術】図16は、特開平4−229356に開
示されているロードバランサ及びトランザクション処理
システムの構成を示す。図16において、後端コンピュ
ータCP1〜CP3(12〜16)は、データベース1
8を共有しており、トランザクション業務を実行してい
る。前端コンピュータ10は、後端コンピュータCP1
〜CP3(12〜16)から、CPU利用度の情報を一
定の時間間隔で帰還情報として収集している。前端コン
ピュータ10は、内部に宛先指定テーブル11を保持し
ており、後端コンピュータ12〜16に送られるトラン
ザクション処理の宛先を制御することができる。
示されているロードバランサ及びトランザクション処理
システムの構成を示す。図16において、後端コンピュ
ータCP1〜CP3(12〜16)は、データベース1
8を共有しており、トランザクション業務を実行してい
る。前端コンピュータ10は、後端コンピュータCP1
〜CP3(12〜16)から、CPU利用度の情報を一
定の時間間隔で帰還情報として収集している。前端コン
ピュータ10は、内部に宛先指定テーブル11を保持し
ており、後端コンピュータ12〜16に送られるトラン
ザクション処理の宛先を制御することができる。
【0003】上記のCPU利用度の情報から、これらの
後端コンピュータの負荷が、過負荷になった場合、前端
コンピュータは、この宛先指定テーブルを変更し、トラ
ンザクションの宛先を負荷の軽い他の後端コンピュータ
に割り当てることにより、過負荷を解消することができ
る。
後端コンピュータの負荷が、過負荷になった場合、前端
コンピュータは、この宛先指定テーブルを変更し、トラ
ンザクションの宛先を負荷の軽い他の後端コンピュータ
に割り当てることにより、過負荷を解消することができ
る。
【0004】
【発明が解決しようとする課題】従来の分散システム管
理方式は上記のように構成されているので、負荷を分散
するには、その前提となるCPU利用情報を前端コンピ
ュータ10に集中管理させる必要がある。従って、前端
コンピュータ10が障害によって停止すると、トランザ
クションの割り当て作業など、重要な管理作業が完全に
停止してしまう問題点があった。
理方式は上記のように構成されているので、負荷を分散
するには、その前提となるCPU利用情報を前端コンピ
ュータ10に集中管理させる必要がある。従って、前端
コンピュータ10が障害によって停止すると、トランザ
クションの割り当て作業など、重要な管理作業が完全に
停止してしまう問題点があった。
【0005】また、後端コンピュータ12〜16の負荷
の状態や動作中かどうかに関する情報が、ネットワーク
の負荷の増大などにより遅延すると、前端コンピュータ
10で管理している後端コンピュータ12〜16の負荷
や稼動状態に関する情報と、実際の後端コンピュータ1
2〜16の負荷や稼動状態の情報との同期がとれず、誤
った後端コンピュータに負荷を分配する可能性がある。
の状態や動作中かどうかに関する情報が、ネットワーク
の負荷の増大などにより遅延すると、前端コンピュータ
10で管理している後端コンピュータ12〜16の負荷
や稼動状態に関する情報と、実際の後端コンピュータ1
2〜16の負荷や稼動状態の情報との同期がとれず、誤
った後端コンピュータに負荷を分配する可能性がある。
【0006】さらに、後端コンピュータ12〜16と前
端コンピュータ10の間の業務に関する通信や、後端コ
ンピュータ12〜16内での業務アプリケーションは、
分散システム管理で使用する後端コンピュータ12〜1
6と前端コンピュータ10の間の通信や後端コンピュー
タ12〜16内の監視処理と競合しているため、従来の
システムでは通信トラフィックの増加や後端コンピュー
タ12〜16の負荷の増加に対応して、分散システム管
理に要する負荷を即時に変更させることができず、最適
なスループットを得ることが難しかった。
端コンピュータ10の間の業務に関する通信や、後端コ
ンピュータ12〜16内での業務アプリケーションは、
分散システム管理で使用する後端コンピュータ12〜1
6と前端コンピュータ10の間の通信や後端コンピュー
タ12〜16内の監視処理と競合しているため、従来の
システムでは通信トラフィックの増加や後端コンピュー
タ12〜16の負荷の増加に対応して、分散システム管
理に要する負荷を即時に変更させることができず、最適
なスループットを得ることが難しかった。
【0007】この発明は、上記のような問題点を解消す
るためになされたもので、管理装置が故障したり、負荷
が高くて十分に機能が発揮できないときでも、被管理装
置側で管理に関する処理を行なうことで、分散処理シス
テムの管理機能を失うことなく運用可能とすることを目
的としている。
るためになされたもので、管理装置が故障したり、負荷
が高くて十分に機能が発揮できないときでも、被管理装
置側で管理に関する処理を行なうことで、分散処理シス
テムの管理機能を失うことなく運用可能とすることを目
的としている。
【0008】また、管理装置が被管理装置から受けとる
情報と、被管理装置が保持する情報との時間的なずれを
なくし、管理装置が適正な処理を被管理装置に与えるこ
とを目的としている。
情報と、被管理装置が保持する情報との時間的なずれを
なくし、管理装置が適正な処理を被管理装置に与えるこ
とを目的としている。
【0009】さらに、分散型の管理装置によって管理を
行なう場合においては、分散する管理装置間で同期した
管理情報を保持させる機構を持つことにより、的確で効
率的な運用を可能にすることを目的としている。
行なう場合においては、分散する管理装置間で同期した
管理情報を保持させる機構を持つことにより、的確で効
率的な運用を可能にすることを目的としている。
【0010】そして、管理装置が収集する情報の詳細度
を、適切なタイミングで切替える機構を持つことによ
り、業務アプリケーションと分散システム管理が競合す
る通信や管理装置の処理を変更し、分散システム管理の
負荷を適切な量に抑制し、業務アプリケーションのスル
ープットを向上させることを目的としている。
を、適切なタイミングで切替える機構を持つことによ
り、業務アプリケーションと分散システム管理が競合す
る通信や管理装置の処理を変更し、分散システム管理の
負荷を適切な量に抑制し、業務アプリケーションのスル
ープットを向上させることを目的としている。
【0011】
【課題を解決するための手段】この発明による分散シス
テム管理方式は、被管理アプリケーションが、代替動作
が可能な他の計算機の情報を保持する代替システム管理
手段と、この代替システム管理手段に保持された情報に
基づき代替動作の候補となる各計算機の負荷情報を入手
し評価して依頼先を決定する代替動作依頼先決定手段
と、他の被管理アプリケーションからの依頼に基づき代
替動作を行なう代替処理手段とを備えたものである。
テム管理方式は、被管理アプリケーションが、代替動作
が可能な他の計算機の情報を保持する代替システム管理
手段と、この代替システム管理手段に保持された情報に
基づき代替動作の候補となる各計算機の負荷情報を入手
し評価して依頼先を決定する代替動作依頼先決定手段
と、他の被管理アプリケーションからの依頼に基づき代
替動作を行なう代替処理手段とを備えたものである。
【0012】この発明による分散システム管理方式は、
管理アプリケーションが被管理アプリケーションから計
算機の負荷情報を入手しタスクの配分先を決定し分配す
る負荷分配手段を備え、被管理アプリケーションが、計
算機の稼動状況を調べて管理アプリケーションに報告す
ると共に管理アプリケーションからタスク配分決定の通
知を受けるまで稼動状況をロックする管理対象モニタ制
御手段を備えたものである。
管理アプリケーションが被管理アプリケーションから計
算機の負荷情報を入手しタスクの配分先を決定し分配す
る負荷分配手段を備え、被管理アプリケーションが、計
算機の稼動状況を調べて管理アプリケーションに報告す
ると共に管理アプリケーションからタスク配分決定の通
知を受けるまで稼動状況をロックする管理対象モニタ制
御手段を備えたものである。
【0013】この発明による分散システム管理方式は、
被管理アプリケーションが、他の被管理アプリケーショ
ンから計算機の負荷状況を入手しタスクの配分先を決定
し分配する負荷分配手段と、計算機の稼動状況を調べて
他の被管理アプリケーションに報告すると共に他の被管
理アプリケーションからタスク配分決定の通知を受ける
まで稼動状況をロックする管理対象モニタ制御手段とを
備えたものである。
被管理アプリケーションが、他の被管理アプリケーショ
ンから計算機の負荷状況を入手しタスクの配分先を決定
し分配する負荷分配手段と、計算機の稼動状況を調べて
他の被管理アプリケーションに報告すると共に他の被管
理アプリケーションからタスク配分決定の通知を受ける
まで稼動状況をロックする管理対象モニタ制御手段とを
備えたものである。
【0014】この発明による分配システム管理方式は、
被管理アプリケーションが、収集すべき管理情報の内容
を定義した管理情報定義と、計算機の通信トラフィック
を監視するトラフィック監視手段とを備え、通信トラフ
ィックの量に応じて管理情報の内容を変更するようにし
たものである。
被管理アプリケーションが、収集すべき管理情報の内容
を定義した管理情報定義と、計算機の通信トラフィック
を監視するトラフィック監視手段とを備え、通信トラフ
ィックの量に応じて管理情報の内容を変更するようにし
たものである。
【0015】この発明による分散システム管理方法は、
被管理アプリケーションが、代替処理を行なうタスクと
計算機を調べ、代替処理が可能な計算機の他の被管理ア
プリケーションより代替処理をするための情報を入手
し、その情報を評価して代替動作の依頼先を決定し、タ
スクの代替動作を依頼する。
被管理アプリケーションが、代替処理を行なうタスクと
計算機を調べ、代替処理が可能な計算機の他の被管理ア
プリケーションより代替処理をするための情報を入手
し、その情報を評価して代替動作の依頼先を決定し、タ
スクの代替動作を依頼する。
【0016】この発明による分散システム管理方法は、
管理アプリケーションが被管理アプリケーションに稼動
状況を問い合わせ、被管理アプリケーションが稼動状況
を調べて管理アプリケーションに通知すると共に稼動状
況をロックし、管理アプリケーションが被管理アプリケ
ーションからの稼動状況を評価して負荷を割り当てる計
算機を決定して通知し、通知を受けた被管理アプリケー
ションが管理アプリケーションに負荷割り当てを受けた
ことを通知し、管理アプリケーションが稼動状況を問い
合わせた被管理アプリケーションに負荷の割り当てが終
了したことを通知し、通知を受けた被管理アプリケーシ
ョンが稼動状況のロックを解除する。
管理アプリケーションが被管理アプリケーションに稼動
状況を問い合わせ、被管理アプリケーションが稼動状況
を調べて管理アプリケーションに通知すると共に稼動状
況をロックし、管理アプリケーションが被管理アプリケ
ーションからの稼動状況を評価して負荷を割り当てる計
算機を決定して通知し、通知を受けた被管理アプリケー
ションが管理アプリケーションに負荷割り当てを受けた
ことを通知し、管理アプリケーションが稼動状況を問い
合わせた被管理アプリケーションに負荷の割り当てが終
了したことを通知し、通知を受けた被管理アプリケーシ
ョンが稼動状況のロックを解除する。
【0017】この発明による分散システム管理方法は、
依頼元の被管理アプリケーションが代替処理が可能な計
算機の依頼先候補の被管理アプリケーションに稼動状況
を問い合わせ、依頼先候補の被管理アプリケーションが
稼動状況を調べて依頼元の管理アプリケーションに通知
すると共に稼動状況をロックし、依頼元の被管理アプリ
ケーションが依頼先候補の被管理アプリケーションから
の稼動状況を評価して負荷を割り当てる計算機を決定し
て通知し、通知を受けた依頼先の被管理アプリケーショ
ンが依頼元の被管理アプリケーションに負荷割り当てを
受けたことを通知し、依頼元の被管理アプリケーション
が稼動状況を問い合わせた依頼先候補の被管理アプリケ
ーションに負荷の割り当てが終了したことを通知し、通
知を受けた被管理アプリケーションが稼動状況のロック
を解除する。
依頼元の被管理アプリケーションが代替処理が可能な計
算機の依頼先候補の被管理アプリケーションに稼動状況
を問い合わせ、依頼先候補の被管理アプリケーションが
稼動状況を調べて依頼元の管理アプリケーションに通知
すると共に稼動状況をロックし、依頼元の被管理アプリ
ケーションが依頼先候補の被管理アプリケーションから
の稼動状況を評価して負荷を割り当てる計算機を決定し
て通知し、通知を受けた依頼先の被管理アプリケーショ
ンが依頼元の被管理アプリケーションに負荷割り当てを
受けたことを通知し、依頼元の被管理アプリケーション
が稼動状況を問い合わせた依頼先候補の被管理アプリケ
ーションに負荷の割り当てが終了したことを通知し、通
知を受けた被管理アプリケーションが稼動状況のロック
を解除する。
【0018】この発明による分散システム管理方法は、
被管理アプリケーションが、収集すべき管理情報の内容
を定義した管理情報定義と、この管理情報定義の内容を
変更する管理情報量変更手順と、通信トラフィックの量
に応じて実行される管理情報量変更手順との関係を記述
した管理情報量調整表とを備え、通信トラフィックを監
視してその変動を検出し、管理情報量調整表を検索し通
信トラフィックの変動に対応した管理情報量変更手順を
決定し、決定した管理情報量変更手順により管理情報定
義の内容を変更する。
被管理アプリケーションが、収集すべき管理情報の内容
を定義した管理情報定義と、この管理情報定義の内容を
変更する管理情報量変更手順と、通信トラフィックの量
に応じて実行される管理情報量変更手順との関係を記述
した管理情報量調整表とを備え、通信トラフィックを監
視してその変動を検出し、管理情報量調整表を検索し通
信トラフィックの変動に対応した管理情報量変更手順を
決定し、決定した管理情報量変更手順により管理情報定
義の内容を変更する。
【0019】
【作用】この発明による分散システム管理方式は、被管
理アプリケーションが、代替動作が可能な他の計算機の
情報を保持し、この情報に基づき代替動作の候補となる
各計算機の負荷情報を入手し評価して依頼先を決定する
ことにより、管理アプリケーションに代わって負荷を分
配する。
理アプリケーションが、代替動作が可能な他の計算機の
情報を保持し、この情報に基づき代替動作の候補となる
各計算機の負荷情報を入手し評価して依頼先を決定する
ことにより、管理アプリケーションに代わって負荷を分
配する。
【0020】この発明による分散システム管理方式は、
管理アプリケーションが被管理アプリケーションから計
算機の負荷情報を入手しタスクの配分先を決定して分配
し、被管理アプリケーションが、計算機の稼動状況を調
べて管理アプリケーションに報告すると共に管理アプリ
ケーションからタスク配分決定の通知を受けるまで稼動
状況をロックすることにより、各計算機の情報の変更が
同期をとって行なわれる。
管理アプリケーションが被管理アプリケーションから計
算機の負荷情報を入手しタスクの配分先を決定して分配
し、被管理アプリケーションが、計算機の稼動状況を調
べて管理アプリケーションに報告すると共に管理アプリ
ケーションからタスク配分決定の通知を受けるまで稼動
状況をロックすることにより、各計算機の情報の変更が
同期をとって行なわれる。
【0021】この発明による分散システム管理方式は、
被管理アプリケーションが、他の被管理アプリケーショ
ンから計算機の負荷状況を入手しタスクの配分先を決定
して分配し、他の被管理アプリケーションが計算機の稼
動状況を調べて報告すると共にタスク配分決定の通知を
受けるまで稼動状況をロックすることにより、被管理ア
プリケーションが管理アプリケーションに代わって負荷
を分配し、各計算機の情報の変更が同期をとって行なわ
れる。
被管理アプリケーションが、他の被管理アプリケーショ
ンから計算機の負荷状況を入手しタスクの配分先を決定
して分配し、他の被管理アプリケーションが計算機の稼
動状況を調べて報告すると共にタスク配分決定の通知を
受けるまで稼動状況をロックすることにより、被管理ア
プリケーションが管理アプリケーションに代わって負荷
を分配し、各計算機の情報の変更が同期をとって行なわ
れる。
【0022】この発明による分配システム管理方式は、
被管理アプリケーションが計算機の通信トラフィックを
監視し、通信トラフィックの量に応じて収集すべき管理
情報の内容を変更することにより、負荷に対応して管理
情報の収集を調整する。
被管理アプリケーションが計算機の通信トラフィックを
監視し、通信トラフィックの量に応じて収集すべき管理
情報の内容を変更することにより、負荷に対応して管理
情報の収集を調整する。
【0023】この発明による分散システム管理方法は、
被管理アプリケーションが、代替処理を行なうタスクと
計算機を調べ、代替処理が可能な計算機の他の被管理ア
プリケーションより代替処理をするための情報を入手
し、その情報を評価して代替動作の依頼先を決定し、タ
スクの代替動作を依頼することにより、被管理アプリケ
ーションが管理アプリケーションの代わりに負荷を分配
する。
被管理アプリケーションが、代替処理を行なうタスクと
計算機を調べ、代替処理が可能な計算機の他の被管理ア
プリケーションより代替処理をするための情報を入手
し、その情報を評価して代替動作の依頼先を決定し、タ
スクの代替動作を依頼することにより、被管理アプリケ
ーションが管理アプリケーションの代わりに負荷を分配
する。
【0024】この発明による分散システム管理方法は、
管理アプリケーションが被管理アプリケーションに稼動
状況を問い合わせ、被管理アプリケーションが稼動状況
を調べて管理アプリケーションに通知すると共に稼動状
況をロックし、管理アプリケーションが被管理アプリケ
ーションからの稼動状況を評価して負荷を割り当てる計
算機を決定してから、被管理アプリケーションが稼動状
況のロックを解除することにより、各計算機の情報の変
更が同期をとって行なわれる。
管理アプリケーションが被管理アプリケーションに稼動
状況を問い合わせ、被管理アプリケーションが稼動状況
を調べて管理アプリケーションに通知すると共に稼動状
況をロックし、管理アプリケーションが被管理アプリケ
ーションからの稼動状況を評価して負荷を割り当てる計
算機を決定してから、被管理アプリケーションが稼動状
況のロックを解除することにより、各計算機の情報の変
更が同期をとって行なわれる。
【0025】この発明による分散システム管理方法は、
依頼元の被管理アプリケーションが代替処理が可能な計
算機の依頼先候補の被管理アプリケーションに稼動状況
を問い合わせ、依頼先候補の被管理アプリケーションが
稼動状況を調べて依頼元の管理アプリケーションに通知
すると共に稼動状況をロックし、依頼元の被管理アプリ
ケーションが依頼先候補の被管理アプリケーションから
の稼動状況を評価して負荷を割り当てる計算機を決定し
てから、被管理アプリケーションが稼動状況のロックを
解除することにより、被管理アプリケーションが管理ア
プリケーションに代わって負荷を分配し、各計算機の情
報の変更が同期をとって行なわれる。
依頼元の被管理アプリケーションが代替処理が可能な計
算機の依頼先候補の被管理アプリケーションに稼動状況
を問い合わせ、依頼先候補の被管理アプリケーションが
稼動状況を調べて依頼元の管理アプリケーションに通知
すると共に稼動状況をロックし、依頼元の被管理アプリ
ケーションが依頼先候補の被管理アプリケーションから
の稼動状況を評価して負荷を割り当てる計算機を決定し
てから、被管理アプリケーションが稼動状況のロックを
解除することにより、被管理アプリケーションが管理ア
プリケーションに代わって負荷を分配し、各計算機の情
報の変更が同期をとって行なわれる。
【0026】この発明による分散システム管理方法は、
被管理アプリケーションが、通信トラフィックを監視し
てその変動を検出し、管理情報量調整表を検索し通信ト
ラフィックの変動に対応した管理情報量変更手順を決定
し、決定した管理情報量変更手順により管理情報定義の
内容を変更することにより、負荷に対応して管理情報の
収集を調整する。
被管理アプリケーションが、通信トラフィックを監視し
てその変動を検出し、管理情報量調整表を検索し通信ト
ラフィックの変動に対応した管理情報量変更手順を決定
し、決定した管理情報量変更手順により管理情報定義の
内容を変更することにより、負荷に対応して管理情報の
収集を調整する。
【0027】
実施例1.図1は、実施例1における分散システム管理
装置の全体図を示す。図において、101はネットワー
ク400により接続され、分散システムを構成する計算
機システムである。そして計算機システム101内に備
えられた管理装置100は、管理アプリケーション11
0と管理情報通信手段300によって構成されている。
また他の計算機システム101内に備えられた被管理装
置200は、被管理アプリケーション210と管理情報
通信手段300によって構成されている。管理アプリケ
ーション110は、管理情報通信手段300によって被
管理アプリケーション210と通信を行ない、被管理装
置200が動作している計算機システム101の状態を
収集し、またその情報を基に被管理装置200に対して
計算機の状態を変更するように指示を出したりする。被
管理装置200は、管理装置100と通信を行なうと同
時に、他の被管理装置200と通信を行なうこともあ
る。
装置の全体図を示す。図において、101はネットワー
ク400により接続され、分散システムを構成する計算
機システムである。そして計算機システム101内に備
えられた管理装置100は、管理アプリケーション11
0と管理情報通信手段300によって構成されている。
また他の計算機システム101内に備えられた被管理装
置200は、被管理アプリケーション210と管理情報
通信手段300によって構成されている。管理アプリケ
ーション110は、管理情報通信手段300によって被
管理アプリケーション210と通信を行ない、被管理装
置200が動作している計算機システム101の状態を
収集し、またその情報を基に被管理装置200に対して
計算機の状態を変更するように指示を出したりする。被
管理装置200は、管理装置100と通信を行なうと同
時に、他の被管理装置200と通信を行なうこともあ
る。
【0028】図2は、実施例1における被管理アプリケ
ーション210の構成図である。被管理アプリケーショ
ン210は、通常、管理情報定義211を参照し、管理
対象モニタ制御手段212を用いて、計算機システム1
01やネットワーク400などの管理対象をモニタし、
管理データ送信手段213が管理情報通信手段300を
用いて他の計算機システム101へモニタ結果を送信す
る。ここで管理情報定義とは、被管理装置が収集すべき
情報の種類、頻度、詳細度等を定義したものである。ま
た、システム運用情報管理手段218によって、システ
ム運用情報を管理装置100の管理アプリケーション1
10からダウンロードして保持し、管理対象モニタ制御
手段212が、それを基に計算機上のタスクを運用す
る。
ーション210の構成図である。被管理アプリケーショ
ン210は、通常、管理情報定義211を参照し、管理
対象モニタ制御手段212を用いて、計算機システム1
01やネットワーク400などの管理対象をモニタし、
管理データ送信手段213が管理情報通信手段300を
用いて他の計算機システム101へモニタ結果を送信す
る。ここで管理情報定義とは、被管理装置が収集すべき
情報の種類、頻度、詳細度等を定義したものである。ま
た、システム運用情報管理手段218によって、システ
ム運用情報を管理装置100の管理アプリケーション1
10からダウンロードして保持し、管理対象モニタ制御
手段212が、それを基に計算機上のタスクを運用す
る。
【0029】更に、図2には、被管理アプリケーション
210が動作している計算機の代替動作ができる他の計
算機群の情報を、被管理アプリケーション210自身が
保持する代替システム管理手段214がある。また、被
管理アプリケーション210がその代替システム管理手
段214で保持された他の計算機群で動作する被管理ア
プリケーション210と通信するための被管理アプリケ
ーション間通信手段215がある。更に、被管理アプリ
ケーション間通信手段215によって代替動作ができる
他の計算機の状態を入手し、その情報を基に代替動作を
依頼する被管理アプリケーションを決定する代替動作依
頼先決定手段216がある。また、他の被管理アプリケ
ーション210からの依頼に応じて代替動作を行なう代
替処理手段217がある。
210が動作している計算機の代替動作ができる他の計
算機群の情報を、被管理アプリケーション210自身が
保持する代替システム管理手段214がある。また、被
管理アプリケーション210がその代替システム管理手
段214で保持された他の計算機群で動作する被管理ア
プリケーション210と通信するための被管理アプリケ
ーション間通信手段215がある。更に、被管理アプリ
ケーション間通信手段215によって代替動作ができる
他の計算機の状態を入手し、その情報を基に代替動作を
依頼する被管理アプリケーションを決定する代替動作依
頼先決定手段216がある。また、他の被管理アプリケ
ーション210からの依頼に応じて代替動作を行なう代
替処理手段217がある。
【0030】代替動作が可能な計算機群に関する情報
は、管理装置100から管理情報通信手段300を使っ
て各被管理装置200にシステム運用情報と共にダウン
ロードされてくる。図3は、代替動作が可能な計算機に
関する情報の例である。本実施例では、アプリケーショ
ンタスク「業務ABC」が計算機名「Node3」、
「Node5」、「Node9」で代替動作可能である
ことが記述されている。また、そられの計算機のアドレ
スが「131.141.51.10」、「131.14
1.51.5」、「131.141.51.15」であ
ることが記述されている。図4は、システム運用情報の
例を示す。本実施例では、アプリケーションタスク「業
務ABC」が開始時間「8:00」、終了時間「18:
00」、日付「月〜金」という運用計画等で動作するこ
とが記述されている。
は、管理装置100から管理情報通信手段300を使っ
て各被管理装置200にシステム運用情報と共にダウン
ロードされてくる。図3は、代替動作が可能な計算機に
関する情報の例である。本実施例では、アプリケーショ
ンタスク「業務ABC」が計算機名「Node3」、
「Node5」、「Node9」で代替動作可能である
ことが記述されている。また、そられの計算機のアドレ
スが「131.141.51.10」、「131.14
1.51.5」、「131.141.51.15」であ
ることが記述されている。図4は、システム運用情報の
例を示す。本実施例では、アプリケーションタスク「業
務ABC」が開始時間「8:00」、終了時間「18:
00」、日付「月〜金」という運用計画等で動作するこ
とが記述されている。
【0031】図5は、被管理アプリケーション210内
の管理対象モニタ制御手段212が計算機システム上の
アプリケーションタスクを運用する際の運用処理フロー
の例を示す。はじめに、各被管理装置200にダウンロ
ードされた運用情報に基づいて、被管理アプリケーショ
ン210内の管理対象モニタ制御手段212は計算機上
の運用タスクと運用時間を取り出す(手順501)。次
に、各情報をタイマに設定する(手順502)。そし
て、割り込み待ちに入る(手順503)。ある割り込み
が発生して、割り込み待ち(手順503)を抜けると、
終了割り込み判定に入る(手順504)。終了割り込み
であれば、処理を終了する。そうでなければ、タイマ割
り込みかどうかを判定する(手順505)。もし、タイ
マ割り込みでなければ、その他の割り込み処理(手順5
06)を行ない、割り込み待ち(手順503)に戻る。
もし、タイマ割り込みであれば、対応する運用タスクの
起動、あるいは停止処理を行なう(手順507)。続い
て、タスクの運用状態の監視(手順508)を行ない、
運用計画を維持できるかどうかを判定する(手順50
9)。もし、維持できるならば、割り込み待ちに(手順
503)に戻る。もし、維持できない(例えば、バッチ
ジョブを夜間の一定時間で完了する予定が、超過しそう
な場合)ならば、管理装置100に代替処理の依頼通知
ができるかどうか判定する(手順510)。もし、通知
可能であれば、管理装置100に代替処理の依頼を行な
い(手順511)、割り込み待ち(手順503)に戻
る。もし、管理装置100が故障中、管理アプリケーシ
ョン110との通信が不能、あるいは管理装置100が
過負荷で管理機能を遂行できない場合であれば、タスク
の代替処理を行ない(手順512)、割り込み待ち(手
順503)に戻る。
の管理対象モニタ制御手段212が計算機システム上の
アプリケーションタスクを運用する際の運用処理フロー
の例を示す。はじめに、各被管理装置200にダウンロ
ードされた運用情報に基づいて、被管理アプリケーショ
ン210内の管理対象モニタ制御手段212は計算機上
の運用タスクと運用時間を取り出す(手順501)。次
に、各情報をタイマに設定する(手順502)。そし
て、割り込み待ちに入る(手順503)。ある割り込み
が発生して、割り込み待ち(手順503)を抜けると、
終了割り込み判定に入る(手順504)。終了割り込み
であれば、処理を終了する。そうでなければ、タイマ割
り込みかどうかを判定する(手順505)。もし、タイ
マ割り込みでなければ、その他の割り込み処理(手順5
06)を行ない、割り込み待ち(手順503)に戻る。
もし、タイマ割り込みであれば、対応する運用タスクの
起動、あるいは停止処理を行なう(手順507)。続い
て、タスクの運用状態の監視(手順508)を行ない、
運用計画を維持できるかどうかを判定する(手順50
9)。もし、維持できるならば、割り込み待ちに(手順
503)に戻る。もし、維持できない(例えば、バッチ
ジョブを夜間の一定時間で完了する予定が、超過しそう
な場合)ならば、管理装置100に代替処理の依頼通知
ができるかどうか判定する(手順510)。もし、通知
可能であれば、管理装置100に代替処理の依頼を行な
い(手順511)、割り込み待ち(手順503)に戻
る。もし、管理装置100が故障中、管理アプリケーシ
ョン110との通信が不能、あるいは管理装置100が
過負荷で管理機能を遂行できない場合であれば、タスク
の代替処理を行ない(手順512)、割り込み待ち(手
順503)に戻る。
【0032】図6は、実施例1における被管理アプリケ
ーション210における代替処理のフローである。はじ
めに、被管理アプリケーション210は、代替動作を行
なわせるタスクと代替動作が可能な計算機の情報を代替
システム管理手段214から検索する(手順521)。
次に、代替動作が可能な計算機上に動作する被管理アプ
リケーション210(代替被管理アプリケーション)と
被管理アプリケーション間通信手段215によって通信
し、現在のステータスとタスクの代替動作によるスケジ
ュールの変更コスト、予測負荷上昇などのパラメータを
受信する(手順522)。代替被管理アプリケーション
210からの情報を代替動作依頼先決定手段216によ
って評価して(手順523)、代替動作の依頼先を決定
する(手順524)。決定された依頼先の代替被管理ア
プリケーション210に対し、タスクの代替動作を依頼
する(手順525)。そして、代替被管理アプリケーシ
ョン210内の代替処理手段217が代替処理を行なっ
て代替タスクが稼動を開始した時点で、自己の計算機の
タスクを停止する(手順526)。最後に、代替処理を
行なわせたタスクに関する稼動情報を可能であれば管理
装置100に通知する(手順527)。
ーション210における代替処理のフローである。はじ
めに、被管理アプリケーション210は、代替動作を行
なわせるタスクと代替動作が可能な計算機の情報を代替
システム管理手段214から検索する(手順521)。
次に、代替動作が可能な計算機上に動作する被管理アプ
リケーション210(代替被管理アプリケーション)と
被管理アプリケーション間通信手段215によって通信
し、現在のステータスとタスクの代替動作によるスケジ
ュールの変更コスト、予測負荷上昇などのパラメータを
受信する(手順522)。代替被管理アプリケーション
210からの情報を代替動作依頼先決定手段216によ
って評価して(手順523)、代替動作の依頼先を決定
する(手順524)。決定された依頼先の代替被管理ア
プリケーション210に対し、タスクの代替動作を依頼
する(手順525)。そして、代替被管理アプリケーシ
ョン210内の代替処理手段217が代替処理を行なっ
て代替タスクが稼動を開始した時点で、自己の計算機の
タスクを停止する(手順526)。最後に、代替処理を
行なわせたタスクに関する稼動情報を可能であれば管理
装置100に通知する(手順527)。
【0033】上記の実施例によれば、管理装置100が
故障、過負荷、ネットワークの障害などで、タスクの代
替処理が不可能な場合でも、被管理装置200が代替計
算機の候補から適正な代替依頼先を選定して、代替処理
を行なうことが可能となる。
故障、過負荷、ネットワークの障害などで、タスクの代
替処理が不可能な場合でも、被管理装置200が代替計
算機の候補から適正な代替依頼先を選定して、代替処理
を行なうことが可能となる。
【0034】上記の実施例で、代替処理の依頼元の被管
理アプリケーション210では、依頼先のタスクの代替
処理が開始した時点で自己の計算機のタスクを停止して
いるが、依頼先の被管理アプリケーション210に代替
処理を依頼した時点で自己の計算機のタスクを停止する
場合も考えられる。また、代替動作を行なわせたタスク
の稼動情報を依頼元の被管理アプリケーション210が
管理装置100に通知することになっているが、これは
依頼先の被管理アプリケーション210が行なっても良
い。
理アプリケーション210では、依頼先のタスクの代替
処理が開始した時点で自己の計算機のタスクを停止して
いるが、依頼先の被管理アプリケーション210に代替
処理を依頼した時点で自己の計算機のタスクを停止する
場合も考えられる。また、代替動作を行なわせたタスク
の稼動情報を依頼元の被管理アプリケーション210が
管理装置100に通知することになっているが、これは
依頼先の被管理アプリケーション210が行なっても良
い。
【0035】実施例2.実施例2の分散システム管理装
置の基本構成は、実施例1の図1と同様である。図7
は、実施例2における管理アプリケーション110を示
す構成図である。管理アプリケーション110内には、
通常、被管理アプリケーション210からの管理情報を
受信する管理情報受信手段116と、管理情報を格納し
ユーザに提示するための管理情報格納・表示手段117
が存在する。さらに、この例では複数の被管理アプリケ
ーションと同期をとって通信を行なう同期通信機構11
1、同期通信を行なって複数の被管理アプリケーション
と同期をとった情報を保持する同期情報管理部112、
同期情報を評価してタスクの配分を決定する情報評価部
113、タスクの配分先を管理する負荷配分テーブル1
14、負荷配分テーブル114を基にタスクの分配を行
なう負荷分配部115からなる。
置の基本構成は、実施例1の図1と同様である。図7
は、実施例2における管理アプリケーション110を示
す構成図である。管理アプリケーション110内には、
通常、被管理アプリケーション210からの管理情報を
受信する管理情報受信手段116と、管理情報を格納し
ユーザに提示するための管理情報格納・表示手段117
が存在する。さらに、この例では複数の被管理アプリケ
ーションと同期をとって通信を行なう同期通信機構11
1、同期通信を行なって複数の被管理アプリケーション
と同期をとった情報を保持する同期情報管理部112、
同期情報を評価してタスクの配分を決定する情報評価部
113、タスクの配分先を管理する負荷配分テーブル1
14、負荷配分テーブル114を基にタスクの分配を行
なう負荷分配部115からなる。
【0036】図8は、実施例2における被管理アプリケ
ーション210を示す構成図である。被管理アプリケー
ション210内には、管理アプリケーション110と同
期を取って通信を行なうための同期通信機構219があ
る。また、被管理アプリケーション210が動作してい
る計算機の稼動状況を調べる稼動状況監視部221があ
る。これらは、管理アプリケーション110から同期通
信機構219を経由して稼動状況の問い合わせを受けつ
け、稼動状況監視部221によって稼動状況を調べて報
告する管理対象モニタ制御手段212によって制御され
ている。
ーション210を示す構成図である。被管理アプリケー
ション210内には、管理アプリケーション110と同
期を取って通信を行なうための同期通信機構219があ
る。また、被管理アプリケーション210が動作してい
る計算機の稼動状況を調べる稼動状況監視部221があ
る。これらは、管理アプリケーション110から同期通
信機構219を経由して稼動状況の問い合わせを受けつ
け、稼動状況監視部221によって稼動状況を調べて報
告する管理対象モニタ制御手段212によって制御され
ている。
【0037】図9は、管理アプリケーション110と被
管理アプリケーション210間のメッセージフローであ
る。この図に従って、両アプリケーションの処理の流れ
を説明する。管理アプリケーション110は、負荷(タ
スク)の再配分が必要になった場合、各被管理アプリケ
ーション210に対して稼動状況の問い合わせを実施す
る(手順532)。問い合わせを受けた被管理アプリケ
ーション210は、自己の稼動状況監視部221を使っ
て稼動状況を調べて(手順542)、管理アプリケーシ
ョン110に通知する(手順543)。そして、被管理
アプリケーション210は、管理アプリケーション11
0から負荷割り付け作業が完了したことを通知されるま
で、新たな負荷の依頼を受けないで、稼動状況をロック
する(手順544)。管理アプリケーション110は、
被管理アプリケーション210から稼動状況を受信(手
順533)し、その情報から情報評価部113によって
負荷を再分配する割り当てを決定し(手順534)、被
管理アプリケーション210に対して負荷割り当てを送
信する(手順535)。割り当てを受けた被管理アプリ
ケーション210は、負荷の配分処理(タスク起動な
ど)を実施し(手順545)、それが実行された時点で
負荷の配分完了の通知を管理アプリケーションに送る
(手順546)。負荷が割り付けられた被管理アプリケ
ーション210から管理アプリケーション110に正し
く負荷の実行が応答された時点で負荷の配分が完了する
(手順536)。管理アプリケーション110は負荷割
り付け作業が完了したことを、問い合わせた全ての被管
理装置210に通知する(手順537)。被管理アプリ
ケーション210は、負荷割り付け作業が完了したこと
を管理装置100から通知されると、稼動状況のロック
を解除し(手順547)、新たな負荷の依頼の受け付け
を可能な状態にする(手順548)。
管理アプリケーション210間のメッセージフローであ
る。この図に従って、両アプリケーションの処理の流れ
を説明する。管理アプリケーション110は、負荷(タ
スク)の再配分が必要になった場合、各被管理アプリケ
ーション210に対して稼動状況の問い合わせを実施す
る(手順532)。問い合わせを受けた被管理アプリケ
ーション210は、自己の稼動状況監視部221を使っ
て稼動状況を調べて(手順542)、管理アプリケーシ
ョン110に通知する(手順543)。そして、被管理
アプリケーション210は、管理アプリケーション11
0から負荷割り付け作業が完了したことを通知されるま
で、新たな負荷の依頼を受けないで、稼動状況をロック
する(手順544)。管理アプリケーション110は、
被管理アプリケーション210から稼動状況を受信(手
順533)し、その情報から情報評価部113によって
負荷を再分配する割り当てを決定し(手順534)、被
管理アプリケーション210に対して負荷割り当てを送
信する(手順535)。割り当てを受けた被管理アプリ
ケーション210は、負荷の配分処理(タスク起動な
ど)を実施し(手順545)、それが実行された時点で
負荷の配分完了の通知を管理アプリケーションに送る
(手順546)。負荷が割り付けられた被管理アプリケ
ーション210から管理アプリケーション110に正し
く負荷の実行が応答された時点で負荷の配分が完了する
(手順536)。管理アプリケーション110は負荷割
り付け作業が完了したことを、問い合わせた全ての被管
理装置210に通知する(手順537)。被管理アプリ
ケーション210は、負荷割り付け作業が完了したこと
を管理装置100から通知されると、稼動状況のロック
を解除し(手順547)、新たな負荷の依頼の受け付け
を可能な状態にする(手順548)。
【0038】管理アプリケーション110は、負荷を割
り付けようとした被管理アプリケーション210から、
負荷の実行が不可能との応答を受けると、残りの被管理
アプリケーション210からの稼動状況から、別の被管
理アプリケーション210を決定し、再割り付けを行な
う。あるいは、負荷割り付け作業の完了を全被管理装置
200に送信して、一旦作業を終了し、改めて稼動状況
問い合わせから再開することも考えられる。
り付けようとした被管理アプリケーション210から、
負荷の実行が不可能との応答を受けると、残りの被管理
アプリケーション210からの稼動状況から、別の被管
理アプリケーション210を決定し、再割り付けを行な
う。あるいは、負荷割り付け作業の完了を全被管理装置
200に送信して、一旦作業を終了し、改めて稼動状況
問い合わせから再開することも考えられる。
【0039】管理アプリケーション110は、稼動状況
の問い合わせに対して一定の時間を経過しても応答しな
い被管理アプリケーション210については、負荷の割
り付けの対象からはずすことが可能である。また、負荷
を割り付けようとした被管理アプリケーション210か
ら、負荷の実行が可能かどうかの応答が一定の時間を経
過してもない場合、不可能との応答を受けたと同等の処
理が可能である。
の問い合わせに対して一定の時間を経過しても応答しな
い被管理アプリケーション210については、負荷の割
り付けの対象からはずすことが可能である。また、負荷
を割り付けようとした被管理アプリケーション210か
ら、負荷の実行が可能かどうかの応答が一定の時間を経
過してもない場合、不可能との応答を受けたと同等の処
理が可能である。
【0040】このような管理方式にすると、被管理アプ
リケーション210が応答した稼動状況と、それに対す
る管理アプリケーション110のとった負荷配分の同期
が確実にとれることになる。即ち、被管理アプリケーシ
ョン210が応答した稼動状況が、ネットワーク400
の遅延や管理装置100の負荷の増大などで遅れた場
合、従来であれば被管理装置200の計算機の稼動状況
と、管理装置100の把握する稼動状況とが異なってし
まい、管理装置100が誤った指示を出す場合がある
が、この方式ではこの問題が改善されることになる。
リケーション210が応答した稼動状況と、それに対す
る管理アプリケーション110のとった負荷配分の同期
が確実にとれることになる。即ち、被管理アプリケーシ
ョン210が応答した稼動状況が、ネットワーク400
の遅延や管理装置100の負荷の増大などで遅れた場
合、従来であれば被管理装置200の計算機の稼動状況
と、管理装置100の把握する稼動状況とが異なってし
まい、管理装置100が誤った指示を出す場合がある
が、この方式ではこの問題が改善されることになる。
【0041】実施例3.実施例3の分散システム管理装
置の基本構成は、実施例1の図1と同様である。図10
は、実施例3における被管理アプリケーション210を
示す構成図である。この図では、被管理アプリケーショ
ン210が動作している計算機の代替動作ができる他の
計算機群の情報を、被管理装置200自身が保持する代
替システム管理手段214がある。また、被管理アプリ
ケーション210がその代替システム管理手段214で
保持された他の計算機群で動作する被管理アプリケーシ
ョン210と、同期を取って通信するための同期型被管
理アプリケーション間通信手段222がある。更に、同
期型被管理アプリケーション間通信手段222によって
代替動作ができる計算機の状態を入手し、その情報を基
に代替動作を依頼する被管理アプリケーションを決定す
る代替動作依頼先決定手段216がある。
置の基本構成は、実施例1の図1と同様である。図10
は、実施例3における被管理アプリケーション210を
示す構成図である。この図では、被管理アプリケーショ
ン210が動作している計算機の代替動作ができる他の
計算機群の情報を、被管理装置200自身が保持する代
替システム管理手段214がある。また、被管理アプリ
ケーション210がその代替システム管理手段214で
保持された他の計算機群で動作する被管理アプリケーシ
ョン210と、同期を取って通信するための同期型被管
理アプリケーション間通信手段222がある。更に、同
期型被管理アプリケーション間通信手段222によって
代替動作ができる計算機の状態を入手し、その情報を基
に代替動作を依頼する被管理アプリケーションを決定す
る代替動作依頼先決定手段216がある。
【0042】代替動作が可能な計算機群に関する情報
は、実施例1と同様に管理アプリケーション110から
管理情報通信手段300を使って、各被管理アプリケー
ション210にシステム運用情報と共にダウンロードさ
れてくる。被管理アプリケーション210が計算機シス
テム上のアプリケーションタスクを運用する際の運用処
理フローも実施例1と同様である。
は、実施例1と同様に管理アプリケーション110から
管理情報通信手段300を使って、各被管理アプリケー
ション210にシステム運用情報と共にダウンロードさ
れてくる。被管理アプリケーション210が計算機シス
テム上のアプリケーションタスクを運用する際の運用処
理フローも実施例1と同様である。
【0043】図11は、実施例3における代替処理のフ
ローであり、代替処理の依頼元と依頼先の被管理アプリ
ケーション間での情報交換のフローからなる。はじめ
に、依頼元の被管理アプリケーション210は、代替動
作を行なわせるタスクと代替動作が可能な計算機の情報
を代替システム管理手段214から検索する(手順55
2)。次に、代替動作が可能な計算機上に動作する被管
理アプリケーション(代替被管理アプリケーション)2
10との間で、同期型被管理アプリケーション間通信手
段222によって通信し、現在のステータスとタスクの
代替動作によるスケジュールの変更コスト、予測負荷上
昇などのパラメータを問い合わせる。(手順553)。
ローであり、代替処理の依頼元と依頼先の被管理アプリ
ケーション間での情報交換のフローからなる。はじめ
に、依頼元の被管理アプリケーション210は、代替動
作を行なわせるタスクと代替動作が可能な計算機の情報
を代替システム管理手段214から検索する(手順55
2)。次に、代替動作が可能な計算機上に動作する被管
理アプリケーション(代替被管理アプリケーション)2
10との間で、同期型被管理アプリケーション間通信手
段222によって通信し、現在のステータスとタスクの
代替動作によるスケジュールの変更コスト、予測負荷上
昇などのパラメータを問い合わせる。(手順553)。
【0044】ある依頼元の被管理アプリケーション21
0から、同期型被管理アプリケーション間通信手段22
2によって、現在の稼動状況の問い合わせを受けた被管
理アプリケーション210は、管理対象モニタ制御手段
212によって稼動状況を取得し(手順572)、その
問い合わせを行なった被管理アプリケーション210に
応答する(手順573)。しかも、その問い合わせを行
なった被管理アプリケーション210から代替処理を完
了したという通知を受けるまで、別の被管理アプリケー
ション210からの代替処理の受け付け(問い合わせに
対する応答)を行なわないでロックをかける(手順57
4)。
0から、同期型被管理アプリケーション間通信手段22
2によって、現在の稼動状況の問い合わせを受けた被管
理アプリケーション210は、管理対象モニタ制御手段
212によって稼動状況を取得し(手順572)、その
問い合わせを行なった被管理アプリケーション210に
応答する(手順573)。しかも、その問い合わせを行
なった被管理アプリケーション210から代替処理を完
了したという通知を受けるまで、別の被管理アプリケー
ション210からの代替処理の受け付け(問い合わせに
対する応答)を行なわないでロックをかける(手順57
4)。
【0045】問い合わせを出した被管理アプリケーショ
ン210は、稼動状況を受信すると(手順554)、そ
の情報を代替動作依頼先決定手段216によって評価し
て、代替動作の依頼先を決定する(手順555)。そし
て、決定された依頼先に対し、タスクの代替動作を依頼
する(手順556)。代替被管理アプリケーション21
0が代替の依頼を受けると、代替タスクを起動し(手順
575)、代替タスクが正しく起動するとその完了通知
を依頼元の被管理アプリケーション210に送る(手順
576)。依頼元の被管理アプリケーション210が、
依頼先から代替依頼処理が完了した通知を受けると代替
依頼処理を完了し(手順557)、問い合わせを行なっ
た全ての被管理アプリケーション210に対して、代替
処理が完了したことを通知する(手順558)。そし
て、代替処理の完了を通知された被管理アプリケーショ
ンは、稼動状況のロックを解除し(手順577)、代替
処理依頼可能状態となる(手順578)。また、依頼元
の被管理アプリケーション210は、代替タスクを停止
し(手順559)、最後に代替動作を行なわせたタスク
に関する稼動情報を可能であれば管理アプリケーション
110に通知する(手順560)。
ン210は、稼動状況を受信すると(手順554)、そ
の情報を代替動作依頼先決定手段216によって評価し
て、代替動作の依頼先を決定する(手順555)。そし
て、決定された依頼先に対し、タスクの代替動作を依頼
する(手順556)。代替被管理アプリケーション21
0が代替の依頼を受けると、代替タスクを起動し(手順
575)、代替タスクが正しく起動するとその完了通知
を依頼元の被管理アプリケーション210に送る(手順
576)。依頼元の被管理アプリケーション210が、
依頼先から代替依頼処理が完了した通知を受けると代替
依頼処理を完了し(手順557)、問い合わせを行なっ
た全ての被管理アプリケーション210に対して、代替
処理が完了したことを通知する(手順558)。そし
て、代替処理の完了を通知された被管理アプリケーショ
ンは、稼動状況のロックを解除し(手順577)、代替
処理依頼可能状態となる(手順578)。また、依頼元
の被管理アプリケーション210は、代替タスクを停止
し(手順559)、最後に代替動作を行なわせたタスク
に関する稼動情報を可能であれば管理アプリケーション
110に通知する(手順560)。
【0046】上記の実施例によれば、被管理アプリケー
ション210間の通信が通信トラフィックの増加によっ
て遅延し、代替処理の依頼元の被管理アプリケーション
210と依頼先の被管理アプリケーション210の間
で、稼動状況に関する情報に違いが発生して、誤った依
頼先に代替処理を依頼することをなくすことができる。
ション210間の通信が通信トラフィックの増加によっ
て遅延し、代替処理の依頼元の被管理アプリケーション
210と依頼先の被管理アプリケーション210の間
で、稼動状況に関する情報に違いが発生して、誤った依
頼先に代替処理を依頼することをなくすことができる。
【0047】実施例4.実施例4の分散システム管理装
置の基本構成は、実施例1の図1と同様である。図12
は、実施例4における被管理アプリケーション210を
示す構成図である。被管理アプリケーション210は、
通常、管理情報定義211を参照し、管理対象モニタ制
御手段212を用いて、計算機システムやネットワーク
などの管理対象をモニタし、管理データ送信手段213
が管理情報通信手段300を用いてモニタ結果を送信す
る。また、この例を被管理アプリケーション210に
は、被管理アプリケーション210が動作する計算機シ
ステム101の通信トラフィックを監視するトラフィッ
ク監視部223と、管理情報定義211の内容を変更す
る管理情報量変更手順224と、通信トラフィックの量
に応じて実行される管理情報量変更手順224との関係
を記述した管理情報量調整表225と、管理情報量調整
表225を解釈して実行する管理情報量調整表解釈手段
226から構成されている。
置の基本構成は、実施例1の図1と同様である。図12
は、実施例4における被管理アプリケーション210を
示す構成図である。被管理アプリケーション210は、
通常、管理情報定義211を参照し、管理対象モニタ制
御手段212を用いて、計算機システムやネットワーク
などの管理対象をモニタし、管理データ送信手段213
が管理情報通信手段300を用いてモニタ結果を送信す
る。また、この例を被管理アプリケーション210に
は、被管理アプリケーション210が動作する計算機シ
ステム101の通信トラフィックを監視するトラフィッ
ク監視部223と、管理情報定義211の内容を変更す
る管理情報量変更手順224と、通信トラフィックの量
に応じて実行される管理情報量変更手順224との関係
を記述した管理情報量調整表225と、管理情報量調整
表225を解釈して実行する管理情報量調整表解釈手段
226から構成されている。
【0048】被管理アプリケーション210内の管理情
報量調整表解釈手段226の動作手順を図13に示す。
管理情報量調整表解釈手段226は、通信トラフィック
をトラフィック監視部223によって監視している(手
順581)。通信トラフィックが変動した場合(手順5
82)、管理情報量調整表解釈手段226は、通信トラ
フィックと管理情報量変更手順224とを対応付けた管
理情報量調整表225を検索し(手順583)、対応す
る管理情報量変更手順224を実行し、管理情報定義2
11を変更する(手順584)。
報量調整表解釈手段226の動作手順を図13に示す。
管理情報量調整表解釈手段226は、通信トラフィック
をトラフィック監視部223によって監視している(手
順581)。通信トラフィックが変動した場合(手順5
82)、管理情報量調整表解釈手段226は、通信トラ
フィックと管理情報量変更手順224とを対応付けた管
理情報量調整表225を検索し(手順583)、対応す
る管理情報量変更手順224を実行し、管理情報定義2
11を変更する(手順584)。
【0049】図14に、管理情報定義211の例、図1
5に、管理情報量調整表225の例を示す。例えば、ト
ラフィック監視部223が、管理情報量調整表解釈手段
226に対して、通信トラフィックが100パケット/
secから500パケット/secになったと通知した
場合、管理情報量調整表解釈手段226は、管理情報量
調整表225から、管理情報定義211を変更する手順
を起動する。この場合、CPUの稼動率の通知頻度を1
0秒あたり1回となっているものを30秒当たり1回に
変更する。また、プロセスの生成状況の通知を30秒当
たり1回となっているものを60秒当たり1回に変更す
る。このように管理情報定義211を変更することで、
被管理アプリケーション210から管理アプリケーショ
ン110に送信される管理情報の量は、CPU稼動率に
ついては1/3に、プロセスの生成状況に関する管理情
報の量は1/2に減少する。従って、緊急度の低い管理
情報の通信を減らすことによって、より緊急度の高い業
務アプリケーションの通信トラフィックを圧迫すること
を自動的に回避し、スループットの向上が見込まれる。
5に、管理情報量調整表225の例を示す。例えば、ト
ラフィック監視部223が、管理情報量調整表解釈手段
226に対して、通信トラフィックが100パケット/
secから500パケット/secになったと通知した
場合、管理情報量調整表解釈手段226は、管理情報量
調整表225から、管理情報定義211を変更する手順
を起動する。この場合、CPUの稼動率の通知頻度を1
0秒あたり1回となっているものを30秒当たり1回に
変更する。また、プロセスの生成状況の通知を30秒当
たり1回となっているものを60秒当たり1回に変更す
る。このように管理情報定義211を変更することで、
被管理アプリケーション210から管理アプリケーショ
ン110に送信される管理情報の量は、CPU稼動率に
ついては1/3に、プロセスの生成状況に関する管理情
報の量は1/2に減少する。従って、緊急度の低い管理
情報の通信を減らすことによって、より緊急度の高い業
務アプリケーションの通信トラフィックを圧迫すること
を自動的に回避し、スループットの向上が見込まれる。
【0050】また、上記の例は管理アプリケーション1
10と被管理アプリケーション210間の通信と、業務
アプリケーションの通信との干渉を回避するものである
が、管理アプリケーション110が、オペレーティング
システムの状態をモニタして管理アプリケーション11
0に通知する場合、オペレーティングシステムのモニタ
と、実際の業務アプリケーションの干渉が発生する。こ
のような場合においても、オペレーティングシステムの
状態をモニタするモニタプログラムは、CPUの稼動率
が高まった場合、自動的にモニタ頻度を下げて、モニタ
プログラムによるCPU使用率を下げる動作を行なうよ
うに設定すれば良い。
10と被管理アプリケーション210間の通信と、業務
アプリケーションの通信との干渉を回避するものである
が、管理アプリケーション110が、オペレーティング
システムの状態をモニタして管理アプリケーション11
0に通知する場合、オペレーティングシステムのモニタ
と、実際の業務アプリケーションの干渉が発生する。こ
のような場合においても、オペレーティングシステムの
状態をモニタするモニタプログラムは、CPUの稼動率
が高まった場合、自動的にモニタ頻度を下げて、モニタ
プログラムによるCPU使用率を下げる動作を行なうよ
うに設定すれば良い。
【0051】
【発明の効果】以上のようにこの発明によれば、被管理
アプリケーションが、代替動作が可能な他の計算機の情
報を保持し、この情報に基づき代替動作の候補となる各
計算機の負荷情報を入手し評価して依頼先を決定するこ
とにより、管理アプリケーションに代わって負荷を分配
することができ、管理アプリケーションを有した計算機
が障害で停止している際にも継続して運用が可能とな
る。
アプリケーションが、代替動作が可能な他の計算機の情
報を保持し、この情報に基づき代替動作の候補となる各
計算機の負荷情報を入手し評価して依頼先を決定するこ
とにより、管理アプリケーションに代わって負荷を分配
することができ、管理アプリケーションを有した計算機
が障害で停止している際にも継続して運用が可能とな
る。
【0052】またこの発明によれば、管理アプリケーシ
ョンが被管理アプリケーションから計算機の負荷情報を
入手しタスクの配分先を決定して分配し、被管理アプリ
ケーションが、計算機の稼動状況を調べて管理アプリケ
ーションに報告すると共に管理アプリケーションからタ
スク配分決定の通知を受けるまで稼動状況をロックする
ことにより、各計算機の情報の変更が同期をとって行な
うことができ、負荷の適正な分配が可能となる。
ョンが被管理アプリケーションから計算機の負荷情報を
入手しタスクの配分先を決定して分配し、被管理アプリ
ケーションが、計算機の稼動状況を調べて管理アプリケ
ーションに報告すると共に管理アプリケーションからタ
スク配分決定の通知を受けるまで稼動状況をロックする
ことにより、各計算機の情報の変更が同期をとって行な
うことができ、負荷の適正な分配が可能となる。
【0053】さらにこの発明によれば、被管理アプリケ
ーションが、他の被管理アプリケーションから計算機の
負荷状況を入手しタスクの配分先を決定して分配し、他
の被管理アプリケーションが計算機の稼動状況を調べて
報告すると共にタスク配分決定の通知を受けるまで稼動
状況をロックすることにより、被管理アプリケーション
が管理アプリケーションに代わって負荷を分配でき、管
理アプリケーションを有した計算機が障害で停止してい
る際にも継続して運用が可能となる共に、各計算機の情
報の変更が同期をとって行なうことができ、負荷の適正
な分配が可能となる。
ーションが、他の被管理アプリケーションから計算機の
負荷状況を入手しタスクの配分先を決定して分配し、他
の被管理アプリケーションが計算機の稼動状況を調べて
報告すると共にタスク配分決定の通知を受けるまで稼動
状況をロックすることにより、被管理アプリケーション
が管理アプリケーションに代わって負荷を分配でき、管
理アプリケーションを有した計算機が障害で停止してい
る際にも継続して運用が可能となる共に、各計算機の情
報の変更が同期をとって行なうことができ、負荷の適正
な分配が可能となる。
【0054】そしてこの発明によれば、被管理アプリケ
ーションが計算機の通信トラフィックを監視し、通信ト
ラフィックの量に応じて収集すべき管理情報の内容を変
更することにより、負荷に対応して管理情報の収集を調
整することが可能となる。即ち、ネットワークや計算機
の負荷が小さい間は、そのモニタ結果をトリガとして管
理情報の項目や頻度は多めに設定され、詳細な管理情報
の収集を行なうことができる。また、これらの負荷が増
大した場合、管理情報の項目や頻度は少なめに設定さ
れ、業務アプリケーションに与える分散システム管理の
負荷の影響を抑制し、スループットを落とす割合を減少
させる効果がある。
ーションが計算機の通信トラフィックを監視し、通信ト
ラフィックの量に応じて収集すべき管理情報の内容を変
更することにより、負荷に対応して管理情報の収集を調
整することが可能となる。即ち、ネットワークや計算機
の負荷が小さい間は、そのモニタ結果をトリガとして管
理情報の項目や頻度は多めに設定され、詳細な管理情報
の収集を行なうことができる。また、これらの負荷が増
大した場合、管理情報の項目や頻度は少なめに設定さ
れ、業務アプリケーションに与える分散システム管理の
負荷の影響を抑制し、スループットを落とす割合を減少
させる効果がある。
【0055】以上のようにこの発明によれば、被管理ア
プリケーションが、代替処理を行なうタスクと計算機を
調べ、代替処理が可能な計算機の他の被管理アプリケー
ションより代替処理をするための情報を入手し、その情
報を評価して代替動作の依頼先を決定し、タスクの代替
動作を依頼することにより、被管理アプリケーションが
管理アプリケーションの代わりに負荷を分配することが
でき、管理アプリケーションを有した計算機が障害で停
止している際にも継続して運用が可能となる。
プリケーションが、代替処理を行なうタスクと計算機を
調べ、代替処理が可能な計算機の他の被管理アプリケー
ションより代替処理をするための情報を入手し、その情
報を評価して代替動作の依頼先を決定し、タスクの代替
動作を依頼することにより、被管理アプリケーションが
管理アプリケーションの代わりに負荷を分配することが
でき、管理アプリケーションを有した計算機が障害で停
止している際にも継続して運用が可能となる。
【0056】またこの発明によれば、管理アプリケーシ
ョンが被管理アプリケーションに稼動状況を問い合わ
せ、被管理アプリケーションが稼動状況を調べて管理ア
プリケーションに通知すると共に稼動状況をロックし、
管理アプリケーションが被管理アプリケーションからの
稼動状況を評価して負荷を割り当てる計算機を決定して
から、被管理アプリケーションが稼動状況のロックを解
除することにより、各計算機の情報の変更が同期をとっ
て行なうことができ、負荷の適正な分配が可能となる。
ョンが被管理アプリケーションに稼動状況を問い合わ
せ、被管理アプリケーションが稼動状況を調べて管理ア
プリケーションに通知すると共に稼動状況をロックし、
管理アプリケーションが被管理アプリケーションからの
稼動状況を評価して負荷を割り当てる計算機を決定して
から、被管理アプリケーションが稼動状況のロックを解
除することにより、各計算機の情報の変更が同期をとっ
て行なうことができ、負荷の適正な分配が可能となる。
【0057】さらにこの発明によれば、依頼元の被管理
アプリケーションが代替処理が可能な計算機の依頼先候
補の被管理アプリケーションに稼動状況を問い合わせ、
依頼先候補の被管理アプリケーションが稼動状況を調べ
て依頼元の管理アプリケーションに通知すると共に稼動
状況をロックし、依頼元の被管理アプリケーションが依
頼先候補の被管理アプリケーションからの稼動状況を評
価して負荷を割り当てる計算機を決定してから、被管理
アプリケーションが稼動状況のロックを解除することに
より、被管理アプリケーションが管理アプリケーション
に代わって負荷を分配でき、管理アプリケーションを有
した計算機が障害で停止している際にも継続して運用が
可能となると共に、各計算機の情報の変更が同期をとっ
て行なうことができ、負荷の適正な分配が可能となる。
アプリケーションが代替処理が可能な計算機の依頼先候
補の被管理アプリケーションに稼動状況を問い合わせ、
依頼先候補の被管理アプリケーションが稼動状況を調べ
て依頼元の管理アプリケーションに通知すると共に稼動
状況をロックし、依頼元の被管理アプリケーションが依
頼先候補の被管理アプリケーションからの稼動状況を評
価して負荷を割り当てる計算機を決定してから、被管理
アプリケーションが稼動状況のロックを解除することに
より、被管理アプリケーションが管理アプリケーション
に代わって負荷を分配でき、管理アプリケーションを有
した計算機が障害で停止している際にも継続して運用が
可能となると共に、各計算機の情報の変更が同期をとっ
て行なうことができ、負荷の適正な分配が可能となる。
【0058】そしてこの発明によれば、被管理アプリケ
ーションが、通信トラフィックを監視してその変動を検
出し、管理情報量調整表を検索し通信トラフィックの変
動に対応した管理情報量変更手順を決定し、決定した管
理情報量変更手順により管理情報定義の内容を変更する
ことにより、負荷に対応して管理情報の収集を調整する
ことが可能となる。即ち、ネットワークや計算機の負荷
が小さい間は、そのモニタ結果をトリガとして管理情報
の項目や頻度は多めに設定され、詳細な管理情報の収集
を行なうことができる。また、これらの負荷が増大した
場合、管理情報の項目や頻度は少なめに設定され、業務
アプリケーションに与える分散システム管理の負荷の影
響を抑制し、スループットを落とす割合を減少させる効
果がある。
ーションが、通信トラフィックを監視してその変動を検
出し、管理情報量調整表を検索し通信トラフィックの変
動に対応した管理情報量変更手順を決定し、決定した管
理情報量変更手順により管理情報定義の内容を変更する
ことにより、負荷に対応して管理情報の収集を調整する
ことが可能となる。即ち、ネットワークや計算機の負荷
が小さい間は、そのモニタ結果をトリガとして管理情報
の項目や頻度は多めに設定され、詳細な管理情報の収集
を行なうことができる。また、これらの負荷が増大した
場合、管理情報の項目や頻度は少なめに設定され、業務
アプリケーションに与える分散システム管理の負荷の影
響を抑制し、スループットを落とす割合を減少させる効
果がある。
【図1】 この発明の実施例1のシステム管理方式の全
体を表す構成図である。
体を表す構成図である。
【図2】 この発明の実施例1の被管理アプリケーショ
ンの内部構成を示す。
ンの内部構成を示す。
【図3】 この発明の実施例1の被管理アプリケーショ
ンが管理する代替可能な計算機の情報の例である。
ンが管理する代替可能な計算機の情報の例である。
【図4】 この発明の実施例1のシステム運用情報の例
である。
である。
【図5】 この発明の実施例1の被管理アプリケーショ
ンが行なう計算機システムの運用処理のフローチャート
である。
ンが行なう計算機システムの運用処理のフローチャート
である。
【図6】 この発明の実施例1の被管理アプリケーショ
ンが実行する代替処理の処理フローである。
ンが実行する代替処理の処理フローである。
【図7】 この発明の実施例2の管理アプリケーション
の内部構成の例である。
の内部構成の例である。
【図8】 この発明の実施例2の被管理アプリケーショ
ンの構成例である。
ンの構成例である。
【図9】 この発明の実施例2の管理アプリケーション
と被管理アプリケーションの処理フローを示す。
と被管理アプリケーションの処理フローを示す。
【図10】 この発明の実施例3の被管理アプリケーシ
ョンの内部構成を示す。
ョンの内部構成を示す。
【図11】 この発明の実施例3の被管理アプリケーシ
ョンの代替処理のフローを示す。
ョンの代替処理のフローを示す。
【図12】 この発明の実施例4の被管理アプリケーシ
ョンの内部構成を示す。
ョンの内部構成を示す。
【図13】 この発明の実施例4の被管理アプリケーシ
ョンの処理フローを示す。
ョンの処理フローを示す。
【図14】 この発明の実施例4の被管理アプリケーシ
ョンで保持する管理情報定義の例を示す。
ョンで保持する管理情報定義の例を示す。
【図15】 この発明の実施例4の被管理アプリケーシ
ョンで保持する管理情報量調整表の例を示す。
ョンで保持する管理情報量調整表の例を示す。
【図16】 従来のシステム構成図である。
100 管理装置、101 計算機システム、110
管理アプリケーション、111 同期通信機構、112
同期情報管理部、113 情報評価部、114 負荷
配分テーブル、115 負荷分配部、116 管理情報
受信手段、117 管理情報格納・表示手段、200
被管理装置、210 被管理アプリケーション、211
管理情報定義、212 管理対象モニタ制御手段、2
13 管理データ送信手段、214 代替システム管理
手段、215 被管理アプリケーション間通信手段、2
16 代替動作依頼先決定手段、217 代替処理手
段、218 システム運用情報管理手段、219 同期
通信機構、221 稼動状況監視部、222 同期型被
管理アプリケーション間通信手段、223 トラフィッ
ク監視部、224 管理情報量変更手順、225 管理
情報量調整表、226管理情報量調整表解釈手段、30
0 管理情報通信手段、400 ネットワーク。
管理アプリケーション、111 同期通信機構、112
同期情報管理部、113 情報評価部、114 負荷
配分テーブル、115 負荷分配部、116 管理情報
受信手段、117 管理情報格納・表示手段、200
被管理装置、210 被管理アプリケーション、211
管理情報定義、212 管理対象モニタ制御手段、2
13 管理データ送信手段、214 代替システム管理
手段、215 被管理アプリケーション間通信手段、2
16 代替動作依頼先決定手段、217 代替処理手
段、218 システム運用情報管理手段、219 同期
通信機構、221 稼動状況監視部、222 同期型被
管理アプリケーション間通信手段、223 トラフィッ
ク監視部、224 管理情報量変更手順、225 管理
情報量調整表、226管理情報量調整表解釈手段、30
0 管理情報通信手段、400 ネットワーク。
Claims (8)
- 【請求項1】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有した分散システム管理方式に
おいて、上記被管理アプリケーションは、代替動作が可
能な他の計算機の情報を保持する代替システム管理手段
と、この代替システム管理手段に保持された情報に基づ
き代替動作の候補となる各計算機の負荷情報を入手し評
価して依頼先を決定する代替動作依頼先決定手段と、他
の被管理アプリケーションからの依頼に基づき代替動作
を行なう代替処理手段とを備えたことを特徴とする分散
システム管理方式。 - 【請求項2】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有した分散システム管理方式に
おいて、上記管理アプリケーションは、上記被管理アプ
リケーションから計算機の負荷情報を入手しタスクの配
分先を決定し分配する負荷分配手段を備え、上記被管理
アプリケーションは、計算機の稼動状況を調べて上記管
理アプリケーションに報告すると共に上記管理アプリケ
ーションからタスク配分決定の通知を受けるまで稼動状
況をロックする管理対象モニタ制御手段を備えたことを
特徴とする分散システム管理方式。 - 【請求項3】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有した分散システム管理方式に
おいて、上記被管理アプリケーションは、他の上記被管
理アプリケーションから計算機の負荷情報を入手しタス
クの配分先を決定し分配する負荷分配手段と、計算機の
稼動状況を調べて他の上記被管理アプリケーションに報
告すると共に他の上記被管理アプリケーションからタス
ク配分決定の通知を受けるまで稼動状況をロックする管
理対象モニタ制御手段とを備えたことを特徴とする分散
システム管理方式。 - 【請求項4】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有した分散システム管理方式に
おいて、上記被管理アプリケーションは、収集すべき管
理情報の内容を定義した管理情報定義と、上記計算機の
通信トラフィックを監視するトラフィック監視手段とを
備え、上記通信トラフィックの量に応じて上記管理情報
の内容を変更することを特徴とする分散システム管理方
式。 - 【請求項5】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有し、この被管理アプリケーシ
ョンは以下のステップにより処理を行なうことを特徴と
する分散システム管理方法。 (a)代替処理が必要となった場合、代替処理を行なう
タスクと計算機を調べる。 (b)代替処理が可能な計算機上の他の被管理アプリケ
ーションより代替処理をするための情報を入手する。 (c)上記代替動作をするための情報を評価して代替動
作の依頼先を決定する。 (d)決定した依頼先の被管理アプリケーションにタス
クの代替動作を依頼する。 - 【請求項6】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有し、以下のステップにより処
理を行なうことを特徴とする分散システム管理方法。 (a)上記管理アプリケーションは、負荷の再配分が必
要になった場合、上記被管理アプリケーションに対し稼
動状況を問い合わせる。 (b)上記被管理アプリケーションは、稼動状況を調べ
て上記管理アプリケーションに通知すると共に、上記管
理アプリケーションより負荷の再配分の終了を通知され
るまで稼動状況をロックする。 (c)上記管理アプリケーションは、上記各被管理アプ
リケーションからの稼動状況を評価し、負荷を割り当て
る計算機を決定し、負荷割り当てが決定した計算機の上
記被管理アプリケーションに通知する。 (d)負荷割り当てを受けた上記被管理アプリケーショ
ンは、上記管理アプリケーションに負荷割り当てを受け
たことを通知する。 (e)管理アプリケーションは、稼動状況を問い合わせ
た上記被管理アプリケーションに負荷の割り当てが終了
したことを通知する。 (f)上記被管理アプリケーションは、稼動状況のロッ
クを解除し新たな負荷の受付を可能にする。 - 【請求項7】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有し、この被管理アプリケーシ
ョンは以下のステップにより処理を行なうことを特徴と
する分散システム管理方法。 (a)代替処理が必要となった場合、依頼元の上記被管
理アプリケーションは、代替処理を行なうタスクと計算
機を調べ、代替処理が可能な計算機上の依頼先候補の被
管理アプリケーションに対し稼動状況を問い合わせる。 (b)依頼先候補の被管理アプリケーションは、稼動状
況を調べて上記依頼元の被管理アプリケーションに通知
すると共に、上記依頼元の被管理アプリケーションから
代替処理の終了を通知されるまで稼動状況をロックす
る。 (c)上記依頼元の被管理アプリケーションは、上記依
頼先候補の各被管理アプリケーションからの稼動状況を
評価し、負荷を割り当てる計算機を決定し、負荷割り当
てが決定した計算機の依頼先の上記被管理アプリケーシ
ョンに通知する。 (d)上記依頼先の被管理アプリケーションは、上記代
替処理のタスクを起動し、依頼処理の終了を上記依頼元
の被管理アプリケーションに通知する。 (e)上記依頼元の被管理アプリケーションは、稼動状
況を問い合わせた上記依頼先候補の被管理アプリケーシ
ョンに依頼処理の終了を通知する。 (f)上記依頼先候補の被管理アプリケーションは、稼
動状況のロックを解除し新たな代替処理の受付を可能に
する。 - 【請求項8】 ネットワークに接続された各計算機のう
ち、少なくとも1つの計算機にシステム運用情報を保持
する管理アプリケーションを有し、他の計算機に上記管
理アプリケーションの指示に基づき計算機を管理する被
管理アプリケーションを有し、この被管理アプリケーシ
ョンは、収集すべき管理情報の内容を定義した管理情報
定義と、この管理情報定義の内容を変更する管理情報量
変更手順と、通信トラフィックの量に応じて実行される
上記管理情報量変更手段との関係を記述した管理情報調
整表とを備え、以下のステップにより処理を行なうこと
を特徴とする分散システム管理方法。 (a)通信トラフィックを監視しその変動を検出する。 (b)上記管理情報量調整表を検索し上記通信トラフィ
ックの変動に対応した上記管理情報変更手順を決定す
る。 (c)決定した上記管理情報量変更手順により上記管理
情報定義の内容を変更する。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6256631A JPH08123768A (ja) | 1994-10-21 | 1994-10-21 | 分散システム管理方式及び分散システム管理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6256631A JPH08123768A (ja) | 1994-10-21 | 1994-10-21 | 分散システム管理方式及び分散システム管理方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08123768A true JPH08123768A (ja) | 1996-05-17 |
Family
ID=17295299
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6256631A Pending JPH08123768A (ja) | 1994-10-21 | 1994-10-21 | 分散システム管理方式及び分散システム管理方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08123768A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10161960A (ja) * | 1996-11-29 | 1998-06-19 | Canon Inc | モニタシステム及び制御方法及び情報処理装置 |
| JPH10312350A (ja) * | 1996-11-21 | 1998-11-24 | Internatl Business Mach Corp <Ibm> | リソース命名方法及び機構 |
| JP2007041763A (ja) * | 2005-08-02 | 2007-02-15 | Nec Corp | 管理システムおよびその管理方法 |
| JP2012511784A (ja) * | 2008-12-12 | 2012-05-24 | アマゾン テクノロジーズ インコーポレイテッド | プログラム実行状態の保存 |
| US8819106B1 (en) | 2008-12-12 | 2014-08-26 | Amazon Technologies, Inc. | Managing distributed execution of programs |
| US9329909B1 (en) | 2009-03-31 | 2016-05-03 | Amazon Technologies, Inc. | Dynamically modifying a cluster of computing nodes used for distributed execution of a program |
| US10958716B2 (en) | 2017-10-02 | 2021-03-23 | Fujitsu Limited | Distributed process management system, distributed process management method for suppressing number of messages between computers, and information processing apparatus |
-
1994
- 1994-10-21 JP JP6256631A patent/JPH08123768A/ja active Pending
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10312350A (ja) * | 1996-11-21 | 1998-11-24 | Internatl Business Mach Corp <Ibm> | リソース命名方法及び機構 |
| JPH10161960A (ja) * | 1996-11-29 | 1998-06-19 | Canon Inc | モニタシステム及び制御方法及び情報処理装置 |
| JP2007041763A (ja) * | 2005-08-02 | 2007-02-15 | Nec Corp | 管理システムおよびその管理方法 |
| US9207975B2 (en) | 2008-12-12 | 2015-12-08 | Amazon Technologies, Inc. | Managing distributed execution of programs |
| US8819106B1 (en) | 2008-12-12 | 2014-08-26 | Amazon Technologies, Inc. | Managing distributed execution of programs |
| US8935404B2 (en) | 2008-12-12 | 2015-01-13 | Amazon Technologies, Inc. | Saving program execution state |
| JP2012511784A (ja) * | 2008-12-12 | 2012-05-24 | アマゾン テクノロジーズ インコーポレイテッド | プログラム実行状態の保存 |
| US9826031B2 (en) | 2008-12-12 | 2017-11-21 | Amazon Technologies, Inc. | Managing distributed execution of programs |
| US11263084B2 (en) | 2008-12-12 | 2022-03-01 | Amazon Technologies, Inc. | Saving program execution state |
| US9329909B1 (en) | 2009-03-31 | 2016-05-03 | Amazon Technologies, Inc. | Dynamically modifying a cluster of computing nodes used for distributed execution of a program |
| US10873623B2 (en) | 2009-03-31 | 2020-12-22 | Amazon Technologies, Inc. | Dynamically modifying a cluster of computing nodes used for distributed execution of a program |
| US11425194B1 (en) | 2009-03-31 | 2022-08-23 | Amazon Technologies, Inc. | Dynamically modifying a cluster of computing nodes used for distributed execution of a program |
| US10958716B2 (en) | 2017-10-02 | 2021-03-23 | Fujitsu Limited | Distributed process management system, distributed process management method for suppressing number of messages between computers, and information processing apparatus |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5870604A (en) | Job execution processor changing method and system, for load distribution among processors | |
| US20230147352A1 (en) | On-Demand Access to Compute Resources | |
| CN1292346C (zh) | 用于在分布式计算体系结构中执行作业的系统和方法 | |
| US5522070A (en) | Computer resource distributing method and system for distributing a multiplicity of processes to a plurality of computers connected in a network | |
| US7185096B2 (en) | System and method for cluster-sensitive sticky load balancing | |
| US6591262B1 (en) | Collaborative workload management incorporating work unit attributes in resource allocation | |
| US6393455B1 (en) | Workload management method to enhance shared resource access in a multisystem environment | |
| US6230183B1 (en) | Method and apparatus for controlling the number of servers in a multisystem cluster | |
| US7773522B2 (en) | Methods, apparatus and computer programs for managing performance and resource utilization within cluster-based systems | |
| US6732139B1 (en) | Method to distribute programs using remote java objects | |
| US20190014059A1 (en) | Systems and methods for allocating computing resources in distributed computing | |
| US20030005028A1 (en) | Method and apparatus for controlling the number of servers in a hierarchical resource environment | |
| US7085831B2 (en) | Intelligent system control agent for managing jobs on a network by managing a plurality of queues on a client | |
| CN112882827B (zh) | 用于负载均衡的方法、电子设备和计算机程序产品 | |
| US8296772B2 (en) | Customer information control system workload management based upon target processors requesting work from routers | |
| CN113342508B (zh) | 一种任务调度方法及装置 | |
| US7003772B2 (en) | Policy management for distributed computing and a method for aging statistics | |
| US20030084140A1 (en) | Data relay method | |
| JPH08123768A (ja) | 分散システム管理方式及び分散システム管理方法 | |
| US7707080B2 (en) | Resource usage metering of network services | |
| JPH05216842A (ja) | 資源管理装置 | |
| Breitgand et al. | On cost-aware monitoring for self-adaptive load sharing | |
| EP2472416B1 (en) | Data query system and constructing method thereof and corresponding data query method | |
| JP2005031736A (ja) | サーバ負荷分散装置及びサーバ負荷分散方法及びクライアントサーバシステム | |
| JP3745820B2 (ja) | 自律協調情報処理装置並びに自律協調情報処理方法 |