JP3291931B2 - サービス障害復旧方法 - Google Patents

サービス障害復旧方法

Info

Publication number
JP3291931B2
JP3291931B2 JP20757194A JP20757194A JP3291931B2 JP 3291931 B2 JP3291931 B2 JP 3291931B2 JP 20757194 A JP20757194 A JP 20757194A JP 20757194 A JP20757194 A JP 20757194A JP 3291931 B2 JP3291931 B2 JP 3291931B2
Authority
JP
Japan
Prior art keywords
service
processing
abnormality
gom
substitute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20757194A
Other languages
English (en)
Other versions
JPH0877120A (ja
Inventor
博樹 田中
啓之 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP20757194A priority Critical patent/JP3291931B2/ja
Publication of JPH0877120A publication Critical patent/JPH0877120A/ja
Application granted granted Critical
Publication of JP3291931B2 publication Critical patent/JP3291931B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、オブジェクト指向ソフ
トウェアを搭載した処理装置上で動作するオブジェクト
インスタンスを単位としたサービス障害復旧方法に関す
るもので、通信サービス、計算サービスを代表とする、
コンピュータを利用するすべてのサービスに利用できる
サービス障害復旧方法に関するものである。
【0002】
【従来の技術】従来、サービスの運用管理は、処理装置
ハードウェアの障害/性能管理で実現されている。即
ち、多くのサービス処理機能を内包したサービス実行制
御装置を単位とした監視、障害復旧を行なっている。
【0003】図2に従来例のサービスの監視及び障害復
旧方法の概略を示す。図2の(a) に示すように、各サー
ビス処理ノード1には通信サービスの実行を司る主系の
サービス実行制御装置2aが実装されている。各々のサ
ービス実行制御装置2aに対応して、バックアップ用と
しての予備系サービス実行制御装置2bが同一のサービ
ス処理ノード1に設けられている。
【0004】また、各サービス処理ノード1には、主系
及び予備系のサービス実行制御装置2a,2bを監視す
る監視装置3が備えられている。監視装置3は、主系の
サービス実行制御装置2aが障害を起こした場合に、コ
ールドスタンバイ、ホットスタンバイなどの技術を用い
て予備系のサービス実行制御装置2bへの切り替え操作
を実行する。
【0005】また、図2の(b) に示すように、主系と予
備系双方のサービス実行制御装置2a,2bが同時に運
用不可能となった場合に、そのサービス処理ノード1が
サービスの提供を継続できなくなったことを通信網管理
ノード4内の通信網管理システム5に通知する。
【0006】通信網管理システム5は、サービス処理ノ
ード1内の監視装置3から通知を受けると、障害を起こ
したサービス実行制御装置2a,2bから他のサービス
処理ノード6内のサービス実行制御装置7a,7bへの
切り替えによる復旧措置を実行する。ここで、サービス
処理ノード6にも、前述と同様に主系及び予備系のサー
ビス実行制御装置7a,7bを監視する監視装置8が備
えられ、監視装置8は、主系のサービス実行制御装置7
aが障害を起こした場合に、コールドスタンバイ、ホッ
トスタンバイなどの技術を用いて予備系のサービス実行
制御装置7bへの切り替え操作を実行する。
【0007】
【発明が解決しようとする課題】しかしながら、前述し
た従来のサービス障害復旧方法では、サービス実行制御
装置2a,2b,7a,7b内で動作する個々のサービ
ス処理機能単位の監視には着目していないため、この方
法に従ってサービス実行制御装置2a,2b,7a,7
bの切り替え処理を実行すると、そのサービス実行制御
装置2a,2b,7a,7b内で動作している他の正常
なオブジェクトインスタンス(以下、OIと称する)ま
でも停止させてしまう。
【0008】従って、該サービス制御装置2a,2b,
7a,7bが複数のサービスに関わっている場合、サー
ビス制御装置2a,2b,7a,7bを切り替えること
により、本来継続して提供すべきサービスまで一時的に
停止させてしまうという問題点があった。
【0009】本発明の目的は、サービス処理機能を搭載
した装置上で動作する、サービス処理機能の構成要素と
してのOI単位で障害復旧を実現し、当該OIの異常に
よるサービス全体への影響度を最小化したサービス障害
復旧方法を提供することにある。
【0010】
【課題を解決するための手段】本発明は上記の目的を達
成するために、請求項1では、自己試験機能を有する全
てのオブジェクトインスタンス(OI)を管理する総合
オブジェクトマネージャ(GOM)と、OI間の通信処
理を管理する通信処理管理部とを備え、互いに独立して
動作するOIが、メッセージを交信し合い、依頼された
処理の一部を必要に応じてサーバOIに依頼して、OI
群全体として所望の処理機能を実現するオブジェクト指
向ソフトウェアを用いて、計算/通信サービスを実現す
るサービス処理装置におけるサービス障害復旧方法にお
いて、各OIは、自分自身及び自分自身が処理を依頼し
ているサーバOI並びに通信処理機能のそれぞれの異常
を検出したときに前記GOMに通知し、前記GOMは、
OIから自己の異常発生の申告通知を受けたときに、前
記通知された異常の内容に基づいて、該申告したOIを
消去するか或いはそのまま動作させるかを決定し、前記
申告したOIを消去するときは、負荷バランスが偏らな
いように代用OIを他のOIの中から選択するか又は新
規に作成し、OIから該OIが使用しているサーバOI
(OI S )の異常発生を申告する通知を受けたときに、
該申告されたサーバOI(OI S )及び該申告されたサ
ーバOI(OI S )が依頼された処理を行う他のサーバ
OI(OI SS )に対して順次正常性の確認処理を行い、
異常を来しているOI及び異常を来しているOI間通信
処理機能を特定し、異常を来しているOIを代用OIに
切り替える処理を実行し、通信処理障害の復旧を前記通
信処理管理部に依頼し、以後、異常を来したOIの代わ
りに前記代用OIを前記サービスで用い、サービスを継
続的に提供させるサービス障害復旧方法を提案する。
【0011】また、請求項2では、請求項1記載のサー
ビス障害復旧方法において、前記GOMは各OIに対し
て定期的に試験を要求することによりOIの動作異常を
検出するサービス障害復旧方法を提案する。
【0012】
【作用】本発明の請求項1によれば、OIの動作異常が
発生した時に、GOMによって該OIの代用となる代用
OIが自動的に他のOIの中から選択されるか又は前記
代用OIが自動的に新規に作成され、以後、異常を来し
たOIの代わりに前記代用OIが前記サービスで用いら
れ、サービスが継続的に提供される。
【0013】また、請求項2によれば、前記GOMによ
って各OIに対して定期的に試験が要求され、これによ
りOIの動作異常が検出される。
【0014】
【実施例】以下、図面に基づいて本発明の一実施例を説
明する。図1は本発明の一実施例を説明する図である。
図において、OIA は着目している処理を進行させてい
るOI、OIC はOIA に処理を依頼しているクライア
ントOI、OIS はOIC から依頼された処理を実行す
るためにOIA が必要に応じて処理を依頼しているサー
バOIをそれぞれ表す(以後、これらの略式表記を用い
る)。これらの構成は、従来例において説明したサービ
ス実行制御装置内に設けられている。
【0015】また、本実施例におけるサービスは、サー
ビス実行制御装置上で動作するサービス処理機能、或い
はその構成要素であるOI同士が規定の手順に従いメッ
セージを交信(処理を依頼)した結果として提供され
る。
【0016】ここで本実施例では、以下の機能を保持す
る総合オブジェクトマネージャ(以下、GOMと称す
る)を設けることにより、OI単位での試験/切り替え
処理を実現し、OIの異常(障害/性能低下)の迅速な
検出/復旧措置を可能とすると共に、動作異常を起こし
たOIに代えて代用OIを用いるところに特徴がある。
【0017】GOMが保持する機能としては、 ・OIから異常の通知を受けたときに、異常を起こした
OIを特定する機能 ・異常と見られるOIを代用のOIへ切り替える機能 ・OIの自己試験機能の正常性を確認するため、各OI
に自己試験を行なうように要求する機能 があり、また各OIは、OI自身、OIが現時点で処理
を依頼しているサーバOI、及び通信処理機能の異常
(障害/性能低下)の可能性を検出し、GOMに通知す
る機能を有している。さらに、GOMは、各OIの動作
正常性、負荷、配置位置などをもとに、OI間の処理依
頼の関係を適宜変更させる。このとき、GOMは必要に
応じて以下の各マネージャと協調動作する。
【0018】GOMがOIの異常に対処するために協調
動作するマネージャとしては、 ・OIを生成/消去する働きをするOI生成/消去マネ
ージャ(以下、OIRと称する) ・各OIが正常終了させた処理に関する情報を保持する
処理ログマネージャ(以下、PLMと称する) ・各OIの運用状態やOI間の処理依頼関係の情報を保
持するOIデータベース(以下、OIDBと称する)が
設けられている。
【0019】一方、OIDBは、OIの運用及び障害復
旧に必要な情報として、図3に示すように、運用中の各
OIについて以下の各項目の情報を保持している。 (1)網内で一意に認識できるOI名 (2)実行処理名(OIが保持し、実行する処理名) (3)代用となりうる(運用中の)OI名のリスト(Su
b OI List ) このリストは、OIに異常が発生したときに、それ以後
代わりに用いるOI(代用OI)を決定するときに用い
られる。 (4)OIをOIS として用いるOI名のリスト(OI
C List) このリストは、OIに異常が発生したときに、それをO
S として使用する全てのOIに対して、以後その異常
となったOIを用いないように通知するために用いられ
る。
【0020】(5)使用可/不可 これは、OIに処理の依頼ができるかできないかを記し
たもので、各OIの状態管理に用いられる。OIに異常
が発生したとき、そのOIに関するこの項目を「不可」
とすることにより、そのOIがGOMにより他のOIの
代用として割り当てられたり、動的結合機能(以下、D
BFと称する)によりそのOIに処理要求が受け渡され
ることがなくなる。従って、それ以後その異常となった
OIに起因するサービス障害を防止することができる。
【0021】DBFは、実際のメッセージの交信の発生
時に処理依頼先を決定する動的結合を実行する。この機
能は周知の分散処理の技術(ディレクトリ、トレーダー
等)で実現されうるものである。
【0022】DBFが行なう動的結合の実行手順を以下
に示す。 ・各OIから、OIS に依頼する処理名及びオブジェク
ト名を受ける。 ・OIDB内のOIS についての使用可/不可の項目を
調べる。 (a)使用可のとき 依頼された処理を実行するようにOIS に依頼する。 (b)使用不可のとき ・OIDBに依頼処理を実行できるOI名(OIS
補)のリストを要求する 任意に、あるいは各々のOIの不可レベル(次項目)
をもとに、新しい処理依頼先(OIS )を決定する。 ・DBFがOIS に処理を依頼する(このときOIS
とってのOIC は、DBFではなく処理依頼元のOIで
ある)。
【0023】(6)負荷レベル これは、ある計測時間内での、OIに依頼される単位時
間当たりの処理数、及び最多/最小処理キュー数で決ま
る値であり、一定時間毎に新しい値に変更され、OI間
の処理の負荷バランスをとるために用いられる。
【0024】OIRは、OIを配備(ノード内のプロセ
スとして生成)すると、そのOI名Sub OI Lis
t,及びOIC ListをOIDBに登録する。
【0025】OIが検出した異常の内容がそのOIから
GOMに対して通知されると、GOMはその通知内容と
各OIの運用状況を調べることにより異常箇所の決定及
び復旧措置を実行する。なお、各OIは、自らがOIS
に依頼した処理が正常に終了しなかったことを検出する
ことで、OIS または通信処理機能に障害が発生したと
判断する。
【0026】次に、OIが検出した異常別にその対処方
法を説明する。 <OIが自身の異常を検出したとき>OIが自身の異常
を検出したときの障害復旧の手順を図4乃至図6に基づ
いて説明する。このケースでは、GOMは以下の手続き
を実行する。
【0027】OIからそのOI自身の異常の通知を受け
た(図4(0) )場合(SA1)、GOMは以下の手順で
OIの切り替え手続きを実行する。
【0028】(1)OIDBが保持する情報のうち、異
常と申告されたOIに関する使用可/不可の項目を「不
可」に変更するように要求する(図4(1) )(SA
2)。これにより、異常と申告されたOIがGOMによ
り他のOIの代用として割り当てられたり、DBFによ
り異常と申告されたOIに処理要求が受け渡されること
がなくなる。
【0029】(2)通知された異常の内容(エラー種
別、サービス種別など)の項目の内容から、異常と申告
されたOIを即時に消去するか、一連のOI切り替え処
理実行後に消去するか、そのまま動作させるかを決定す
る(図4(2-1))。即時消去の場合は、GOMがこの時点
でOIRに異常と申告されたOIの消去の実行を要求す
る(図4(2-2) )。OIRは異常と申告されたOIを消
去した後に、異常と申告されたOIに関するOIDB内
の情報を消去するように要求する(図4(2-3) )(SA
3)。
【0030】この後、GOMは、異常と申告されたOI
をそのまま動作させるか否かを判定し(SA4)、異常
と申告されたOIをそのまま動作させる場合は、OIR
は、OIDBが保持する情報のうち、異常と申告された
OIに関する使用可/不可の項目を「可」にするように
要求する(図4(2-4))(SA5)。
【0031】(3)OIDBに対し、異常と申告された
OIをOIS として用いるすべてのOI名のリスト(O
C List)を要求する(図4(3) )(SA6)。
【0032】(4)OIC List 中のすべてのOI
に対し、異常と申告されたOIに対する直接の処理依頼
を全て停止し、以後指示があるまで、DBFを通して処
理をOIS に依頼するように指示する(図4(4-1) )。
DBFは、代用OI名を処理要求元にも知らせる。以
後、処理要求元OIが同一の内容の処理を依頼するとき
は、後に正式な代用OIをGOMから知らされるまで、
DBFから指定された仮の代用OIを一時的に用いる
(図4(4-2) )(SA7)。
【0033】(5)OIDBに対し、その異常と申告さ
れたOIの代用として用いることのできるOI名のリス
トを要求し(図5(5-1) )(SA8)、得られたリスト
から、代用として用いるOI(代用OI)名を決定する
(図4(5-2) )。代用OIを一つとするとOI間の負荷
(これはGOMが定期的に収集している)のバランスが
偏る場合は、代用OIを複数設定し、OIC List中
のOI単位で代用OIを割り当てる。またこのとき、異
常と申告されたOIとの配備位置関係(サービス実行制
御装置に異常が見られない場合はその装置上のOIを、
OIが動作するノードに障害が見られる場合はその近傍
のノードのサービス実行制御装置上のOIを優先的に選
択)についても考慮する(SA9,SA10)。
【0034】(6)適当な代用OIが存在しない場合、
あるいはOIの切り替えにより各々の代用OIの負荷
(代用OIに処理の実行を要求するOIC 数)が大きく
なる場合は、新規に代用OIを生成するようにOIRに
要求する(図4(6) )(SA15)。
【0035】(7)OIC List中のすべてのOIに
対し、前記(5)までのステップで決定した代用OIに
処理を依頼するように要求する(図4(7-1) )(SA1
2,SA16)。このとき、OIC List中の各OI
に対し、その各々のOIが保持している情報のうち、そ
のOIのOIS として異常と申告されたOIの名前が登
録されている全ての箇所について、その名前を代用OI
の名前に変更するように要求する(OI切り替え処
理)。これにより、OIC List中のOIは、全て異
常OIの代わりに代用OIに処理を依頼するようにな
る。
【0036】要求先OIから了承の返答をうけると、G
OMはさらに、代用OIが異常となった際にOI切り替
え処理が実行できるように、OIDB内の代用OIのO
CListの項目に、新たに代用OIのクライアント
となったOI名を追加するようにOIDBに対して要求
する(図4(7-2) )。
【0037】(8)前記(2)の時点で、切り替え処理
後に異常と申告されたOIを消去するように指定された
場合は、この時点で異常と申告されたOIの消去の実行
をOIRに要求する(図4(8-1) )。OIRは異常と申
告されたOIを消去した後にOIDB内の異常と申告さ
れたOIに関する情報を消去するように要求する(図4
(8-2) )(SA14,SA18)。
【0038】<OIがOIS の異常を検出したとき>次
に、OIがOIS の異常を検出したときの障害復旧の手
順を図7乃至図9に基づいて説明する。なお、このとき
OIからGOMへはOIS の異常という内容の通知が届
く(図7(0) )(SB1)が、このとき、後述するよう
にGOMはOIS だけでなく同時に通信処理の異常も同
時にチェックする。このケースでは、GOMは以下の手
続きを実行する。
【0039】(1)OIDBが保持する情報のうち、異
常と申告されたOIS に関する使用可/不可の項目を
「不可」に変更するように要求する(図7(1) )(SB
2)。これにより、そのOIがGOMにより他のOIの
代用として割り当てられたり、DBFによりそのOIに
処理要求が受け渡されることがなくなる。
【0040】(2)OIDBに対し、異常と申告された
OIS をOIS として用いる全てのOI名のリスト(O
C List)を要求する(図7(2) )(SB3)。
【0041】(3)OIC List中のすべてのOIに
対し、異常と申告されたOIS に対する直後の処理依頼
を全て停止し、以後指示があるまで、DBFを通して処
理をOIS に依頼するように指示する(図7(3-1) )
(SB4)。
【0042】DBFは、代用OIS 名を処理要求元にも
知らせる。以後、処理要求元のOIが同一の内容の処理
を依頼するときは、後に正式な代用OIS の名前をGO
Mまら知らされるまで、DBFから指定された仮の代用
OIS を一時的に用いる(図7(3-2) )。
【0043】(4)この時点では、通知された異常が、
OIS の異常によるものか、あるいは処理の要求時/応
答時の通信機能の障害によるものかが判別できない。そ
こでGOMは、異常と申告されたOIS に対して、自身
の試験を要求する(図7(4))(SB5)。その返答の
内容(試験結果)により、以下のような手続きが実行さ
れる。
【0044】(A)応答の内容が「正常」のとき 異常と申告されたOIS に対し、異常を申告したOIが
OIS に依頼した処理を実行中であるかを問い合わせる
(図7(4-1-1) )(SB8)。
【0045】(a)応答が「実行中」のとき GOMは、異常と申告されたOIS がさらに他のOI
(OISS)に処理を依頼しているかを異常と申告された
OIS に問い合わせる(図7(4-1-2) )(SB9)。そ
の応答内容に対応して、以下の手順を実行する。
【0046】・異常と申告されたOIS が他のOI(O
SS)に処理を依頼しているとき OISSの正常性を確認する(SB11)。OISSが異常
であれば、そのOISS及びOIS のOISSに対する異常
検出機能が異常を来しているものとみなし、OIS とO
SS双方の切り替え処理を実行する(図7(4-1-3) )
(切り替え時に、それまで仮に割り当てられていたOI
S は、正規の代用OIS に切り替えられる(図7(4-1-
4) )(SB13)。切り替え処理の手順は前の実施例
の場合と同じであるため説明を省略する)。
【0047】また、OISSが正常であれば、以降繰り返
しOISSが依頼している処理について調べ、その結果、
最終的に異常を来しているOIが判明した時点で、その
OIとそのOIのOIC の切り替え処理を実行する(S
B12)。
【0048】・異常と申告されたOIS が他のOI(O
SS) に処理を依頼していないとき 試験では検出できない異常がOIS に発生しているとみ
なし、異常と申告されたOIS の切り替え処理を実行す
る(図7(4-1-5) )(SB10)。
【0049】(b)応答が「非実行中」のとき 各ノードに配備(信頼性向上のために複数個設けてもよ
い)されているPLMに、異常を申告したOIが異常O
S に依頼した処理が登録されているかを問い合わせる
(図7(4-1-6) )(SB14)。
【0050】各OI(OIS )は、自身に依頼された処
理を終了する際に、同一ノード内に存在するPLMに処
理名、該OI名、OIC 名、処理終了時間を登録してい
る(図7(4-1-7) )。
【0051】従って、問い合わせ時にPLMに異常と申
告されたOIS が実行した処理名が登録されていれば、
該処理は既に終了しているため、応答時に(OIS と異
常申告したOIとの間の)通信処理障害が起きたものと
みなし、通信処理管理部に障害復旧を依頼する(図7(4
-1-8) )(SB15)。
【0052】また、問い合わせ時にPLMに異常と申告
されたOIS が実行した処理名が登録されていなけれ
ば、該処理の依頼が異常と申告されたOIS に届いてい
ないため、処理要求時に(異常申告したOIとOIS
の間の)通信処理障害が起きたものとみなし、通信処理
管理部に障害復旧を依頼する(図7(4-1-9) )(SB1
6)。
【0053】なお、サービス障害の原因が通信処理障害
と判定されたときは、GOMは、それまで仮の代用OI
S を用いていたOIC List中の各OIに対し、それ
以後、当初用いられていたOIS を用いるようにOIの
切り戻し処理を実行する。
【0054】(2)応答の内容が「異常」、あるいは応
答がないとき その異常と申告されたOIS の切り替え処理を実行する
(切り替え処理手続きは前ケースの内容と同じであるた
め説明を省略する)(SB7)。
【0055】以上の手続きにより、異常の検出及び復旧
が行なわれる。
【0056】前述したように、通信網のノード上に分散
配備されているOIが互いにメッセージを交信すること
によりサービスが提供される環境において、OIから異
常の通知を受けたときに代用OIへの切り替え処理を行
なう機能、及び各OIの運用情報を調べる機能を保持す
るGOMを設けることにより、OIの異常を未然に防ぐ
ようなOI間の負荷のバランス調整やOI異常時のOI
単位での切り替え処理を実現できるため、従来の方法よ
り確実にサービス全体の継続的な提供を確保することが
できる。
【0057】また、GOMに各OIを定期的に試験する
ことを要求する機能を設けることで、各々のOIの試験
機能の正常性が確保でき、従ってOIの障害発生時の確
実な障害復旧を実現できる。
【0058】
【発明の効果】以上説明したように本発明の請求項1に
よれば、通信網のノード上に分散配備されているOIが
互いにメッセージを交信することによりサービスが提供
される環境において、OIから異常の通知を受けたとき
に代用OIへの切り替え処理を行なうことにより、OI
の異常を未然に防ぐようなOI間の負荷のバランス調整
やOI異常時のOI単位での切り替え処理を実現できる
ため、従来の方法より確実にサービス全体の継続的な提
供を確保することができる。
【0059】また、請求項2によれば、上記の効果に加
えて、GOMに各OIを定期的に試験することを要求す
る機能を設けているので、各々のOIの試験機能の正常
性が確保でき、従ってOIの障害発生時の確実な障害復
旧を実現できる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を説明する図
【図2】従来のサービス実行制御装置の監視によるサー
ビス障害復旧方法を説明する図
【図3】本発明の一実施例におけるOIDBが保持する
情報を説明する図
【図4】本発明の一実施例におけるOIが自身の障害を
検出したときの障害復旧手順を説明する図
【図5】本発明の一実施例におけるOIが自身の障害を
検出した場合のGOMを用いた障害復旧処理手順を示す
フローチャート
【図6】本発明の一実施例におけるOIが自身の障害を
検出した場合のGOMを用いた障害復旧処理手順を示す
フローチャート
【図7】本発明の一実施例におけるOIがOIS の障害
を検出したときの障害復旧手順を説明する図
【図8】本発明の一実施例におけるOIがOIS の障害
を検出した場合のGOMを用いた障害復旧処理手順を示
すフローチャート
【図9】本発明の一実施例におけるOIがOIS の障害
を検出した場合のGOMを用いた障害復旧処理手順を示
すフローチャート
【符号の説明】
1…サービス処理ノード、2a…サービス実行制御装置
(主系)、2b…サービス実行制御装置(予備系)、3
…監視装置、4…通信網管理ノード、5…通信網管理シ
ステム、6…サービス処理ノード、7a…サービス実行
制御装置(主系)、7b…サービス実行制御装置(予備
系)、8…監視装置、OI…オブジェクトインスタン
ス、GOM…総合オブジェクトマネージャ、OIR…O
I生成/消去マネージャ、PLM…処理ログマネージ
ャ、OIDB…OIデータベース、。
フロントページの続き (56)参考文献 特開 平5−46572(JP,A) Coan,B.A.,Hickey, T.M.,Resource Reco very in a Distribu ted Processing Env ironment,Proc.of G LOBECOM ’92,p.604−609 島田、横山、齋藤,オブジェクト指向 分散処理環境nORの開発,電気学会研 究会資料,社団法人電気学会,1994年 2月16日,IP−94,P.11−19 (58)調査した分野(Int.Cl.7,DB名) G06F 13/00 G06F 15/16 - 15/177 H04L 12/24

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 自己試験機能を有する全てのオブジェク
    トインスタンス(OI)を管理する総合オブジェクトマ
    ネージャ(GOM)と、OI間の通信処理を管理する通
    信処理管理部とを備え、互いに独立して動作するOI
    が、メッセージを交信し合い、依頼された処理の一部を
    必要に応じてサーバOIに依頼して、OI群全体として
    所望の処理機能を実現するオブジェクト指向ソフトウェ
    アを用いて、計算/通信サービスを実現するサービス処
    理装置におけるサービス障害復旧方法において、各OIは、自分自身及び自分自身が処理を依頼している
    サーバOI並びに通信処理機能のそれぞれの異常を検出
    したときに前記GOMに通知し、 前記GOMは、 OIから自己の異常発生の申告通知を受けたときに、前
    記通知された異常の内容に基づいて、該申告したOIを
    消去するか或いはそのまま動作させるかを決定し、前記
    申告したOIを消去するときは、負荷バランスが偏らな
    いように代用OIを 他のOIの中から選択するか又は新
    規に作成し、OIから該OIが使用しているサーバOI(OI S )の
    異常発生を申告する通知を受けたときに、該申告された
    サーバOI(OI S )と該申告されたサーバOI(OI
    S )が依頼された処理を行う他のサーバOI(OI SS
    に対して順次正常性の確認処理を行い、異常を来してい
    るOI及び異常を来しているOI間通信処理機能を特定
    して、異常を来しているOIを代用OIに切り替える処
    理を実行し、通信処理障害の復旧を前記通信処理管理部
    に依頼し、 以後、異常を来したOIの代わりに前記代用OIを前記
    サービスで用い、サービスを継続的に提供させることを
    特徴とするサービス障害復旧方法。
  2. 【請求項2】 前記GOMは各OIに対して定期的に試
    験を要求することによりOIの動作異常を検出すること
    を特徴とする請求項1記載のサービス障害復旧方法。
JP20757194A 1994-08-31 1994-08-31 サービス障害復旧方法 Expired - Fee Related JP3291931B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20757194A JP3291931B2 (ja) 1994-08-31 1994-08-31 サービス障害復旧方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20757194A JP3291931B2 (ja) 1994-08-31 1994-08-31 サービス障害復旧方法

Publications (2)

Publication Number Publication Date
JPH0877120A JPH0877120A (ja) 1996-03-22
JP3291931B2 true JP3291931B2 (ja) 2002-06-17

Family

ID=16541963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20757194A Expired - Fee Related JP3291931B2 (ja) 1994-08-31 1994-08-31 サービス障害復旧方法

Country Status (1)

Country Link
JP (1) JP3291931B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647523B2 (en) 2002-06-12 2010-01-12 International Business Machines Corporation Dynamic binding and fail-over of comparable web service instances in a services grid
JP4876438B2 (ja) 2005-05-31 2012-02-15 株式会社日立製作所 コンポーネントソフトウェアの運用方法および運用基盤

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Coan,B.A.,Hickey,T.M.,Resource Recovery in a Distributed Processing Environment,Proc.of GLOBECOM ’92,p.604−609
島田、横山、齋藤,オブジェクト指向分散処理環境nORの開発,電気学会研究会資料,社団法人電気学会,1994年 2月16日,IP−94,P.11−19

Also Published As

Publication number Publication date
JPH0877120A (ja) 1996-03-22

Similar Documents

Publication Publication Date Title
JP4215384B2 (ja) 分散コンピューティング環境で複数の関係する障害を表す障害情報を参照する技法
KR100734818B1 (ko) 컴퓨팅 서비스 그리드
US7114094B2 (en) Information processing system for judging if backup at secondary site is necessary upon failover
JP3345626B2 (ja) マルチプロセッサシステムにおけるプロセッサ異常対策装置およびマルチプロセッサシステムにおけるプロセッサ異常対策方法
US8661297B2 (en) System monitoring
US7941810B2 (en) Extensible and flexible firmware architecture for reliability, availability, serviceability features
WO2004031979A2 (en) Method of solving a split-brain condition
US8347142B2 (en) Non-disruptive I/O adapter diagnostic testing
US7370101B1 (en) Automated testing of cluster data services
JPH07334436A (ja) ソフトウエア自動配布方式
JP3872412B2 (ja) 総合サービス管理システム及び方法
JP3291931B2 (ja) サービス障害復旧方法
AU2001241700B2 (en) Multiple network fault tolerance via redundant network control
CN114153668A (zh) 自动化测试方法、装置、电子设备及存储介质
US20100251029A1 (en) Implementing self-optimizing ipl diagnostic mode
JP4102592B2 (ja) 集約機能付障害情報通知システム及びマシンを集約機能付障害情報通知手段として機能させるためのプログラム
US20070271486A1 (en) Method and system to detect software faults
EP1107118A2 (en) Multiprocessor system and fault recovery method thereof
JP3291930B2 (ja) サービス処理機能監視方法及びその装置
CN111475320B (zh) 一种计算平台的高可用性检测方法、计算平台及存储介质
CN114168390A (zh) 一种基于重试机制的分布式一致性事务执行方法
US6601184B1 (en) System crash network access
CN112540771A (zh) 自动化运维方法、系统、设备和计算机可读存储介质
JPH10171735A (ja) ネットワークサービス管理方法
US8949403B1 (en) Infrastructure for maintaining cognizance of available and unavailable software components

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090329

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees