JP2002259141A - Unix(登録商標)システムにおける自動プロセスリカバリ方式 - Google Patents

Unix(登録商標)システムにおける自動プロセスリカバリ方式

Info

Publication number
JP2002259141A
JP2002259141A JP2001057317A JP2001057317A JP2002259141A JP 2002259141 A JP2002259141 A JP 2002259141A JP 2001057317 A JP2001057317 A JP 2001057317A JP 2001057317 A JP2001057317 A JP 2001057317A JP 2002259141 A JP2002259141 A JP 2002259141A
Authority
JP
Japan
Prior art keywords
apl
resident
unix
recovery method
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001057317A
Other languages
English (en)
Inventor
Takahiro Yasuda
隆博 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Communication Systems Ltd
Original Assignee
NEC Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Communication Systems Ltd filed Critical NEC Communication Systems Ltd
Priority to JP2001057317A priority Critical patent/JP2002259141A/ja
Publication of JP2002259141A publication Critical patent/JP2002259141A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】UNIXシステムにおいて、並列動作可能な各
プロセスの障害検出及び復旧を行う監視プログラムをU
NIX−OSとAPLの中間に配備し、該監視プログラ
ムによる障害検出処理とシステムのリカバリを行うこと
により、システム機能の復旧を行うことを可能とする、
UNIXシステムにおける自動プロセスリカバリ方式を
提供する。 【解決手段】UNIX−OSと複数のAPLを備えたU
NIXシステムにおいて、前記APLの常駐プロセスで
あるところの複数のAPL常駐プロセスと前記UNIX
−OSとの間に、並列動作可能な前記APL常駐プロセ
スの障害検出及び復旧を行うEOS常駐プロセスを備え
る構成とした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はUNIXシステムに
おける自動プロセスリカバリ方式に関し、特に、UNI
Xシステムにおいて、並列動作可能な各プロセスの障害
検出及び復旧を行う監視プログラムを配備し、監視プロ
グラムによる障害検出処理とリカバリを行うことによ
り、システム機能の復旧を行うことを可能とする、UN
IXシステムにおける自動プロセスリカバリ方式に関す
る。
【0002】
【従来の技術】オンラインリアルタイムシステムの保守
業務は、現在急速に集中化、無人化が進められており、
保守業務の殆どが遠隔操作により実施されている。しか
し、システムダウンなどの状態となった場合には、どう
してもシステムが設置されている現地まで保守員が出張
せざるを得なくなり、現地への到着までに時間がかかる
と、サービスの復旧までにも長時間を要してしまうこと
にもなりかねない。このため、オンラインリアルタイム
システムでは特に、システムの信頼性と安定性が求めら
れている。
【0003】従来のオンラインリアルタイムシステムで
は、システム上のプログラムの障害や異常は、障害プロ
グラムが監視しており、障害や異常が発生した場合であ
っても、障害プログラムがこれを自動復旧する構造が取
り入れられており、障害復旧への考慮がなされている。
しかしながら、汎用OS(Operating Sys
tem:オペレーティングシステム)であるUNIXを
用いてシステム開発を行う場合には、システム上のプロ
グラムの障害処理は、アプリケーションプログラム(以
下、APLと略記する)に依存するようになっており、
UNIX側からは、障害処理・復旧の機構が提供されて
いない。
【0004】UNIXは、周知のように、米国AT&T
のベル研究所が開発した基本的なコンピュータのOSで
あり、最近では、ワークステーションやサーバだけでな
く、パソコンや大型コンピュータにまで、広く普及して
いる汎用OSである。
【0005】
【発明が解決しようとする課題】上述したように、UN
IX−OSは、システム全体を総合的に監視し、システ
ム上のプログラムの障害処理や障害復旧を統合して行う
ための機構を提供していない。
【0006】本発明は、システムダウンの状態に陥るこ
とを極力防止することが前提とされるオンラインリアル
タイムシステムにおいて、UNIX−OSを使用して構
築されるシステムが、APLの問題によりシステムダウ
ンの状態となることを防止し、システムダウンによるサ
ービスの停止を極力防止するために成されたものであ
り、本発明の目的は、UNIXシステムにおいて、並列
動作可能な各プロセスの障害検出及び復旧を行う監視プ
ログラムをUNIX−OSとAPLの中間に配備し、該
監視プログラムによる障害検出処理とシステムのリカバ
リを行うことにより、システム機能の復旧を行うことを
可能とする、UNIXシステムにおける自動プロセスリ
カバリ方式を提供することにある。
【0007】
【課題を解決するための手段】本発明のUNIXシステ
ムにおける自動プロセスリカバリ方式は、UNIX−O
S(UNIX Operating System)と
複数のAPL(application progra
m)を備えたUNIXシステムにおいて、前記APLの
常駐プロセスであるところの複数のAPL常駐プロセス
と前記UNIX−OSとの間に、並列動作可能な前記A
PL常駐プロセスの障害検出及び復旧を行うEOS常駐
プロセスを備えることを特徴とする。
【0008】また、前記EOS常駐プロセスが前記AP
L常駐プロセスの監視およびリカバリのために参照する
プロセス管理テーブルを更に備えることを特徴とする。
【0009】さらに、前記プロセス管理テーブルは、前
記APL常駐プロセスを管理するための情報を定義する
プロセス管理情報を前記APL常駐プロセスと同数備え
るテーブルであることを特徴とする。
【0010】また、前記プロセス管理テーブルの各々の
前記プロセス管理情報は、該当APL常駐プロセスが生
成されるたびに付されるところの前記UNIX−OSが
管理するプロセス識別子と、該当APL常駐プロセスの
プログラムテキストの格納場所を示す情報であるところ
の起動パス情報と、該当APL常駐プロセスを生成・起
動するために必要なパラメータであるところの起動パラ
メータ情報と、該当APL常駐プロセスの再起動が必要
となった場合のリカバリの方式を示す起動指定情報と、
該当APL常駐プロセスの監視方式を示す監視指定情報
と、該当APL常駐プロセスに関連する子プロセスや下
位プロセスを示す関連プロセス情報と、該当APL常駐
プロセスが必要とするリソースに関する関連リソース情
報、などから構成されることを特徴とする。
【0011】さらに、前記プロセス管理情報に含まれる
前記起動指定情報に定義される内容は、リカバリ方式と
して個別のプロセスを再起動する個別起動か、関連する
プロセスを含めて再起動する関連プロセス起動か、シス
テム全体のプロセスを再起動する全体起動か、などであ
ることを特徴とする。
【0012】また、前記プロセス管理テーブルの前記プ
ロセス管理情報の定義内容は、各々の前記APL常駐プ
ロセスが起動される時に、各々に対応する前記APL内
にプログラムとして記述されているEOSライブラリの
呼び出しの実行により設定されるものであることを特徴
とする。
【0013】さらに、前記UNIXシステムの起動時に
は、先ず、前記UNIX−OSが起動されると、前記U
NIX−OSは次に前記EOS常駐プロセスを起動し
(ステップS1)、起動された前記EOS常駐プロセス
は、前記プロセス管理テーブルの初期化を行い(ステッ
プS2)、前記プロセス管理テーブルへの定義情報の登
録準備を完了し、次に前記EOS常駐プロセスは、各々
の前記APLが定義する常駐プロセス起動ルーチンによ
り各々の前記APL常駐プロセスの起動を行い(ステッ
プS3)、起動された各々の前記APL常駐プロセス
は、各々前記EOSライブラリを呼び出し(ステップS
4)、前記プロセス管理テーブルに自プロセスのリカバ
リ情報を登録する(ステップS5)、ことを特徴とす
る。
【0014】また、前記UNIXシステムが起動された
後には、前記EOS常駐プロセスは、周期により前記プ
ロセス管理テーブルの前記プロセス管理情報を読み出し
(ステップS6)、その周期で監視を行うべき前記AP
L常駐プロセスが存在するかを判定し、該当する前記A
PL常駐プロセスが存在する場合には、該当APL常駐
プロセスに監視イベントを発行し(ステップS7)、該
当APL常駐プロセスが存続しているか消滅しているか
の判断を行い、該当APL常駐プロセスが存続していれ
ば何も行わず、次の周期を待つことを特徴とする。
【0015】さらに、前記ステップS7の後の判断にお
いて、該当APL常駐プロセスが消滅していた場合(ス
テップS8)には、該当APL常駐プロセスが指示して
いるリカバリ方式により、該当APL常駐プロセスの再
起動を実行し(ステップS9)、該当APL常駐プロセ
スの正常運転を監視し、前記ステップS9による個別リ
カバリを実行しても、該当APL常駐プロセスの正常運
転が実現できなかった場合には、リカバリの範囲を拡大
するエスカレーションを行い(ステップS10)、前記
APL全体を再起動するようにし(ステップS11)、
前記ステップS11によるAPL全体リカバリを実行し
ても、前記UNIXシステムの全体が正常運転とならな
かった場合には、更にリカバリの範囲を拡大するエスカ
レーションを行い(ステップS12)、前記UNIX−
OSのリブートから再度実行することを行う(ステップ
S13)ことを特徴とする。
【0016】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0017】図1は、本発明のUNIXシステムにおけ
る自動プロセスリカバリ方式の一実施形態を示すブロッ
ク図である。
【0018】図1に示す本実施の形態は、UNIXシス
テム1の全体機能配置を示すものであり、UNIX−O
S(UNIX Operating System)2
と、UNIXシステム1を構成する複数のAPL(ap
plication program:アプリケーショ
ンプログラム)の常駐プロセスであるところのAPL常
駐プロセス5(5−1、5−2、5−n)とから構成さ
れ、さらに、本発明の監視プログラムであるところのE
OS常駐プロセス3と、EOS常駐プロセス3がAPL
常駐プロセス5の監視およびリカバリのために参照する
プロセス管理テーブル4とを備えている。
【0019】EOS常駐プロセス3は、システムのバッ
クグランドに常駐しているデーモンプロセスであり、定
期的にAPL常駐プロセス5を監視および管理するプロ
セスである。なお、EOSの名称は、Extended
(拡張した)なOSという意味合いから名づけたもので
ある。EOS常駐プロセス3は、UNIXシステム1の
立ち上げ時に起動され、半永久的に動作するプロセスで
あり、プロセス管理テーブル4を参照してAPL常駐プ
ロセス5を周期的に監視し、何れかのAPL常駐プロセ
ス5が障害や異常によって消滅した時点で、個々のAP
Lに応じて定められている再開処理を実現し、リカバリ
を行う。
【0020】プロセス管理テーブル4は、EOS常駐プ
ロセス3が各々のAPL及び該APLのAPL常駐プロ
セス5を監視および管理するためのリカバリ情報を定義
するテーブルである。プロセス管理テーブル4の定義内
容は、各APL常駐プロセス5が起動される時に、各A
PL内にプログラムとして記述されているEOSライブ
ラリ6の呼び出しの実行により設定されるものである。
【0021】APL常駐プロセス5内に組み込まれて呼
び出されるEOSライブラリ6は、本発明により各AP
Lに提供される関数としてのライブラリであり、EOS
ライブラリ6を実行することにより、各APLが希望す
る通りのリカバリのための情報が、プロセス管理テーブ
ル4内に定義され設定される。
【0022】次に、図2を参照して、EOS常駐プロセ
ス3が各APL常駐プロセス5を監視および管理するた
めに参照するプロセス管理テーブル4について説明す
る。
【0023】図2は、プロセス管理テーブルの一例を示
す図である。
【0024】図2において、プロセス管理テーブル4
は、APL常駐プロセス5を管理するための情報を定義
するPM(プロセス管理情報)40を、APL常駐プロ
セス5と同数備えるテーブルであり、APL常駐プロセ
ス5−1〜APL常駐プロセス5−nに対応して、PM
(プロセス管理情報)40−1〜PM(プロセス管理情
報)40−nを備えている。
【0025】そして、各々のPM(プロセス管理情報)
40の定義内容は同一の構成を有しており、PM(プロ
セス管理情報)40−mを例として説明すると、定義さ
れる情報は、該当プロセスが生成されるたびに付される
ところのUNIX−OS2が管理するプロセス識別子4
1、該当プロセスのプログラムテキストの格納場所を示
す情報であるところの起動パス情報42、該当プロセス
を生成・起動するために必要なパラメータであるところ
の起動パラメータ情報43、該当プロセスの再起動が必
要となった場合のリカバリの方式を示す起動指定情報4
4、該当プロセスの監視方式を示す監視指定情報45、
該当プロセスに関連する子プロセスや下位プロセスを示
す関連プロセス情報46、該当プロセスが必要とするリ
ソースに関する関連リソース情報47、などである。
【0026】なお、起動指定情報44の定義内容として
は、リカバリ方式として個別のプロセスを再起動する個
別起動か、関連するプロセスを含めて再起動する関連プ
ロセス起動か、システム全体のプロセスを再起動する全
体起動か、などがある。
【0027】次に、図1、図2および図3を参照して本
実施形態の動作をより詳細に説明する。
【0028】図3は、図1の本実施形態の動作を説明す
る図である。なお、図3において図1に示す構成要素に
対応するものは同一の参照数字または符号を付し、その
説明を省略する。
【0029】先ず、UNIXシステム1が起動されUN
IX−OS2が起動されると、UNIX−OS2はEO
S常駐プロセス3を起動する(ステップS1)。起動さ
れたEOS常駐プロセス3は、プロセス管理テーブル4
の初期化を行い(ステップS2)、プロセス管理テーブ
ル4への定義情報の登録準備を完了する。
【0030】EOS常駐プロセス3は、各APLが定義
する常駐プロセス起動ルーチンにより各APL常駐プロ
セス5の起動を行う(ステップS3)。
【0031】起動された各APL常駐プロセス5は、各
々EOSライブラリ6を呼び出し(ステップS4)、プ
ロセス管理テーブル4に自プロセスのリカバリ情報、す
なわち図2で示したPM(プロセス管理情報)の内の、
自プロセスのリカバリに必要とされる情報を登録する
(ステップS5)。
【0032】EOS常駐プロセス3は、周期によりプロ
セス管理テーブル4のPM(プロセス管理情報)40を
読み出し(ステップS6)、その周期で監視を行うべき
APL常駐プロセス5が存在するかを判定し、該当する
APL常駐プロセス5が存在する場合には、該当APL
常駐プロセス5に監視イベントを発行し(ステップS
7)、該当APL常駐プロセス5が存続しているか消滅
しているかの判断を行う。該当APL常駐プロセス5が
存続していれば何も行わず、次の周期を待つ。
【0033】該当APL常駐プロセス5が消滅していた
場合(ステップS8)、該当APL常駐プロセス5が指
示しているリカバリ方式(PM(プロセス管理情報)4
0内の起動指定情報44に指示されているリカバリ方
式)により、該当APL常駐プロセス5の再起動を実行
する(ステップS9)。該当APL常駐プロセス5がリ
カバリ方式を指示していなかった場合には、通常のリカ
バリ方式である個別起動を適用し、該当APL常駐プロ
セス5の再起動を実行する(ステップS9と同一)。そ
して、該当APL常駐プロセス5の正常運転を監視す
る。
【0034】ステップS9による個別リカバリを実行し
ても、該当APL常駐プロセス5の正常運転が実現でき
なかった場合には、リカバリの範囲を拡大するエスカレ
ーションを行う(ステップS10)。すなわち、リカバ
リ範囲をエスカレーションして、APL全体を再起動す
るようにする(ステップS11)。ここで、APL全体
とは、図1に示したAPL常駐プロセス5−1〜5−n
までの全てを指すものとする。
【0035】ステップS11によるAPL全体リカバリ
を実行しても、UNIXシステム1の全体が正常運転と
ならなかった場合には、更にリカバリの範囲を拡大する
エスカレーションを行う(ステップS12)。すなわ
ち、リカバリをエスカレーションして、UNIX−OS
2のリブートから再度実行することを行う(ステップS
13)。
【0036】以上、詳細に説明したように、本発明のE
OS常駐プロセス3は、その管理時間内に、APL常駐
プロセス5の何れかに異常が発生した場合、リカバリの
影響範囲を拡大してリカバリを実現することが可能とな
る。すなわち、APL常駐プロセス5の個別リカバリか
ら、APL全体のリカバリへと進み、最後にUNIX−
OS2の再起動と順次起動していくことで、自動リカバ
リの確実性を保証するものとなる。
【0037】
【発明の効果】以上説明したように、本発明のUNIX
システムにおける自動プロセスリカバリ方式は、並列動
作可能な各プロセスの障害検出及び復旧を行う監視プロ
グラム、すなわち、EOS常駐プロセスをUNIX−O
SとAPLの中間に配備し、かつ、各APLが自プロセ
スのリカバリ情報をプロセス管理テーブルに登録するE
OSライブラリを各APLに提供しているため、UNI
X−OSには具備されていない自動再開機能を実現し、
システムダウンの状態となることを極力防止することが
可能となるという効果を有している。
【0038】また、各プロセスのリカバリが成功しなか
った場合には、リカバリの範囲をエスカレーションさせ
るので、APLの障害等の問題発生時にも、その影響範
囲とリカバリ時間を最適化できるという効果を有してい
る。
【0039】さらに、システム障害発生時においても、
保守員介在によるシステムの再起動を極力防止できると
いう効果を有している。
【図面の簡単な説明】
【図1】本発明のUNIXシステムにおける自動プロセ
スリカバリ方式の一実施形態を示すブロック図である。
【図2】プロセス管理テーブルの一例を示す図である。
【図3】図1の本実施形態の動作を説明する図である。
【符号の説明】
1 UNIXシステム 2 UNIX−OS 3 EOS常駐プロセス 4 プロセス管理テーブル 5 APL常駐プロセス 6 EOSライブラリ

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 UNIX−OS(UNIX Opera
    ting System)と複数のAPL(appli
    cation program)を備えたUNIXシス
    テムにおいて、前記APLの常駐プロセスであるところ
    の複数のAPL常駐プロセスと前記UNIX−OSとの
    間に、並列動作可能な前記APL常駐プロセスの障害検
    出及び復旧を行うEOS常駐プロセスを備えることを特
    徴とするUNIXシステムにおける自動プロセスリカバ
    リ方式。
  2. 【請求項2】 前記EOS常駐プロセスが前記APL常
    駐プロセスの監視およびリカバリのために参照するプロ
    セス管理テーブルを更に備えることを特徴とする請求項
    1に記載のUNIXシステムにおける自動プロセスリカ
    バリ方式。
  3. 【請求項3】 前記プロセス管理テーブルは、前記AP
    L常駐プロセスを管理するための情報を定義するプロセ
    ス管理情報を前記APL常駐プロセスと同数備えるテー
    ブルであることを特徴とする請求項2に記載のUNIX
    システムにおける自動プロセスリカバリ方式。
  4. 【請求項4】 前記プロセス管理テーブルの各々の前記
    プロセス管理情報は、該当APL常駐プロセスが生成さ
    れるたびに付されるところの前記UNIX−OSが管理
    するプロセス識別子と、該当APL常駐プロセスのプロ
    グラムテキストの格納場所を示す情報であるところの起
    動パス情報と、該当APL常駐プロセスを生成・起動す
    るために必要なパラメータであるところの起動パラメー
    タ情報と、該当APL常駐プロセスの再起動が必要とな
    った場合のリカバリの方式を示す起動指定情報と、該当
    APL常駐プロセスの監視方式を示す監視指定情報と、
    該当APL常駐プロセスに関連する子プロセスや下位プ
    ロセスを示す関連プロセス情報と、該当APL常駐プロ
    セスが必要とするリソースに関する関連リソース情報、
    などから構成されることを特徴とする請求項3に記載の
    UNIXシステムにおける自動プロセスリカバリ方式。
  5. 【請求項5】 前記プロセス管理情報に含まれる前記起
    動指定情報に定義される内容は、リカバリ方式として個
    別のプロセスを再起動する個別起動か、関連するプロセ
    スを含めて再起動する関連プロセス起動か、システム全
    体のプロセスを再起動する全体起動か、などであること
    を特徴とする請求項4に記載のUNIXシステムにおけ
    る自動プロセスリカバリ方式。
  6. 【請求項6】 前記プロセス管理テーブルの前記プロセ
    ス管理情報の定義内容は、各々の前記APL常駐プロセ
    スが起動される時に、各々に対応する前記APL内にプ
    ログラムとして記述されているEOSライブラリの呼び
    出しの実行により設定されるものであることを特徴とす
    る請求項5に記載のUNIXシステムにおける自動プロ
    セスリカバリ方式。
  7. 【請求項7】 前記UNIXシステムの起動時には、先
    ず、前記UNIX−OSが起動されると、前記UNIX
    −OSは次に前記EOS常駐プロセスを起動し(ステッ
    プS1)、起動された前記EOS常駐プロセスは、前記
    プロセス管理テーブルの初期化を行い(ステップS
    2)、前記プロセス管理テーブルへの定義情報の登録準
    備を完了し、次に前記EOS常駐プロセスは、各々の前
    記APLが定義する常駐プロセス起動ルーチンにより各
    々の前記APL常駐プロセスの起動を行い(ステップS
    3)、起動された各々の前記APL常駐プロセスは、各
    々前記EOSライブラリを呼び出し(ステップS4)、
    前記プロセス管理テーブルに自プロセスのリカバリ情報
    を登録する(ステップS5)、ことを特徴とする請求項
    6に記載のUNIXシステムにおける自動プロセスリカ
    バリ方式。
  8. 【請求項8】 前記UNIXシステムが起動された後に
    は、前記EOS常駐プロセスは、周期により前記プロセ
    ス管理テーブルの前記プロセス管理情報を読み出し(ス
    テップS6)、その周期で監視を行うべき前記APL常
    駐プロセスが存在するかを判定し、該当する前記APL
    常駐プロセスが存在する場合には、該当APL常駐プロ
    セスに監視イベントを発行し(ステップS7)、該当A
    PL常駐プロセスが存続しているか消滅しているかの判
    断を行い、該当APL常駐プロセスが存続していれば何
    も行わず、次の周期を待つことを特徴とする請求項7に
    記載のUNIXシステムにおける自動プロセスリカバリ
    方式。
  9. 【請求項9】 前記ステップS7の後の判断において、
    該当APL常駐プロセスが消滅していた場合(ステップ
    S8)には、該当APL常駐プロセスが指示しているリ
    カバリ方式により、該当APL常駐プロセスの再起動を
    実行し(ステップS9)、該当APL常駐プロセスの正
    常運転を監視し、前記ステップS9による個別リカバリ
    を実行しても、該当APL常駐プロセスの正常運転が実
    現できなかった場合には、リカバリの範囲を拡大するエ
    スカレーションを行い(ステップS10)、前記APL
    全体を再起動するようにし(ステップS11)、前記ス
    テップS11によるAPL全体リカバリを実行しても、
    前記UNIXシステムの全体が正常運転とならなかった
    場合には、更にリカバリの範囲を拡大するエスカレーシ
    ョンを行い(ステップS12)、前記UNIX−OSの
    リブートから再度実行することを行う(ステップS1
    3)ことを特徴とする請求項8に記載のUNIXシステ
    ムにおける自動プロセスリカバリ方式。
JP2001057317A 2001-03-01 2001-03-01 Unix(登録商標)システムにおける自動プロセスリカバリ方式 Pending JP2002259141A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001057317A JP2002259141A (ja) 2001-03-01 2001-03-01 Unix(登録商標)システムにおける自動プロセスリカバリ方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001057317A JP2002259141A (ja) 2001-03-01 2001-03-01 Unix(登録商標)システムにおける自動プロセスリカバリ方式

Publications (1)

Publication Number Publication Date
JP2002259141A true JP2002259141A (ja) 2002-09-13

Family

ID=18917216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001057317A Pending JP2002259141A (ja) 2001-03-01 2001-03-01 Unix(登録商標)システムにおける自動プロセスリカバリ方式

Country Status (1)

Country Link
JP (1) JP2002259141A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134557A (ja) * 2008-12-02 2010-06-17 Nec Corp 仮想マシン運用管理システム、その運用管理方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134557A (ja) * 2008-12-02 2010-06-17 Nec Corp 仮想マシン運用管理システム、その運用管理方法、及びプログラム

Similar Documents

Publication Publication Date Title
US6859889B2 (en) Backup system and method for distributed systems
US8412984B2 (en) Debugging in a cluster processing network
CN104391777B (zh) 基于Linux操作系统的云平台及其运行监控方法和装置
CN106330523A (zh) 一种集群服务器容灾系统、方法和服务器节点
CN109286529A (zh) 一种恢复RabbitMQ网络分区的方法及系统
CN101777020A (zh) 一种用于分布式程序的容错方法和系统
CN105589756A (zh) 批处理集群系统以及方法
CN110618864A (zh) 一种中断任务恢复方法及装置
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
US7783742B2 (en) Dynamic process recovery in a distributed environment
US7366949B2 (en) Distributed software application software component recovery in an ordered sequence
US7509630B2 (en) Software component initialization in an ordered sequence
JPH10214208A (ja) ソフトウェアの異常監視方式
JP2001022709A (ja) クラスタシステム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2002259141A (ja) Unix(登録商標)システムにおける自動プロセスリカバリ方式
CN110489294B (zh) 一种基于日志实时单步调试方法和装置
JP2002149437A (ja) ソフトウェア再起動方法
US7873941B2 (en) Manager component that causes first software component to obtain information from second software component
US7406678B2 (en) Manager component resource addition and/or resource removal on behalf of distributed software application
JP2014078067A (ja) データベースシステム、データベース装置、データベースの障害回復方法およびプログラム
US8181162B2 (en) Manager component for checkpoint procedures
JPH07111685B2 (ja) システム稼動維持方式
JP3325785B2 (ja) 計算機の故障検出・回復方式
KR100832890B1 (ko) 정보통신 시스템의 프로세스 장애 감시방법 및 복구방법
JP5268820B2 (ja) 監視装置用プログラムの書き換え方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050322

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051011