JP2004246621A - 情報採取プログラム、情報採取装置および情報採取方法 - Google Patents

情報採取プログラム、情報採取装置および情報採取方法 Download PDF

Info

Publication number
JP2004246621A
JP2004246621A JP2003035631A JP2003035631A JP2004246621A JP 2004246621 A JP2004246621 A JP 2004246621A JP 2003035631 A JP2003035631 A JP 2003035631A JP 2003035631 A JP2003035631 A JP 2003035631A JP 2004246621 A JP2004246621 A JP 2004246621A
Authority
JP
Japan
Prior art keywords
node
collection
abnormality
investigation
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003035631A
Other languages
English (en)
Inventor
Mamoru Yokoyama
衛 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003035631A priority Critical patent/JP2004246621A/ja
Publication of JP2004246621A publication Critical patent/JP2004246621A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】本発明は、複数のノードから構成されるクラスタシステムにおけるノードの調査用資料を採取する情報採取プログラム、情報採取装置および情報採取方法に関し、異常発生ノードの調査用資料の採取を確実に行うと共に異常発生ノードの電源を断し共用資源の同時アクセスなどによる誤動作を防止してシステムの信頼性の向上を図ることを目的とする。
【解決手段】各ノードが他のノードの異常検出するステップと、異常を検出したときに、共用資源を参照して当該異常検出したノードが調査用資料を採取中で採取完了していない状態を検出するステップと、採取中で採取完了していない状態が検出されたときに、採取完了するのを待って当該異常検出したノードの電源断するステップとして機能させるものである。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、複数のノードから構成されるクラスタシステムにおけるノードの調査用資料を採取する情報採取プログラム、情報採取装置および情報採取方法に関するものである。
【0002】
【従来の技術】
従来のクラスタシステムは、例えば図6の(a)に示すように、クラスタを構成する各ノード1,2・・・が相互にその生死確認を専用通信路を介して行っていた。この際、専用通信路などの故障により各ノード1,2・・・間の生死確認ができなかった状態(スプリットブレインと呼ぶ)で運用を継続してしまうと、互いのノードが相手側のノードダウンと判断し最悪の場合、各ノードから共用資源を同時にアクセスしてしまう現象が発生してしまう。この結果としてファイル破壊等の問題を引き起す。これらの状態を回避するために、いずれかのノードで他のノードの異常発生を検知すると、そのノードの電源断を行うようにしていた。
【0003】
また、現用サーバと予備サーバを設けたシステムにおいて、現用サーバに障害発生したときに共用ディスクに記録されたステータス情報を参照して予備サーバが業務系製品を再起動させるようにしていた(特許文献1)。
【0004】
【特許文献1】特開平11−259326号公報の図1と〔0007〕などを参照。
【0005】
【発明が解決しようとする課題】
このため、図6の(b)に示すように、異常発生したノードで内部の調査用資料をローカルディスクに書き込んで採取開始し採取が終了しないうちに、他のノードから電源断されてしまうと採取中の調査用資料が途中で中断されてしまい調査ができなくなってしまうという問題があった。また、異常検知したノードを電源断しないと、共用資源を同時アクセスしてファイル破壊が生じてしまうことを防止できないという問題もあった。
【0006】
また、前記後者の手法では、クラスタシステムを構成するノード(現用)に異常が発生してダウンした場合に、ノード(予備)が共用ディスクから現用ノードのステータス情報を参照して該当する業務系製品を再起動して業務を引続くものであって、ダウンした現用ノードの調査用資料を確実に採取できないという問題があった。
【0007】
本発明は、これらの問題を解決するため、複数のノードから構成されるシステムにおいて、あるノードに障害発生したときに共用資源に調査用資料採取中フラグを設定して調査用資料を採取し、採取完了したときにフラグを設定し、他のノードは共用資源中のフラグを参照して調査用資料採取完了後に当該ノードの電源断あるいは所定時間経過後に当該ノードの電源断し、異常発生ノードの調査用資料の採取を確実に行うと共に異常発生ノードの電源を断し共用資源の同時アクセスなどによる誤動作を防止してシステムの信頼性の向上を図ることを目的としている。
【0008】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0009】
図1において、ノード1,2は、クラスタシステム11を構成する複数のノードであって、ここでは、障害発生時に調査用資料20を保存する対象のノードであり、異常検出手段12、電源切断指示手段16、および資料採取手段18などから構成されるものである。
【0010】
異常検出手段12は、他のノードの異常を検出するものである。
電源切断指示手段16は、異常発生して調査用資源20の採取を完了した後に、あるいは所定時間経過後に、異常発生のノードの電源を切断する指示を通知するものである。
【0011】
資料採取手段18は、ノード異常の調査用資料20を採取するものである。
共用資源21は、複数のノードが共用してアクセスするものであって、ここでは、ノードの調査用資料採取フラグ22を設定するものである。
【0012】
次に、動作を説明する。
ノードを構成する異常検出手段12が他のノードの異常を検出した時に、電源切断指示手段16が共用資源21中の調査用資料採取フラグ22を参照して当該異常検出したノードが調査用資料を採取中で採取完了していない状態を検出したときに、採取完了するのを待って当該異常検出したノードの電源断の指示を通知し、電源断させるようにしている。
【0013】
この際、採取中が検出されなかったときに、所定時間経過後に当該異常検出したノードの電源断の指示を通知するようにしている。
【0014】
また、異常発生したノードは、共用資源21中の調査用資源採取フラグ22に調査用資料の採取中を設定すると共に、当該ノードの調査用資料20をローカル資源19に書き込んで採取し、採取完了したときに採取完了を設定するようにしている。
【0015】
また、電源断したノードを、監視対象リストから削除するようにしている。
従って、複数のノードから構成されるクラスタシステムにおいて、あるノードに障害発生したときに共用資源21に調査用資料採取中フラグ22を設定して調査用資料20を採取し、採取完了したときにフラグ22を設定し、他のノードは共用資源21中のフラグ22を参照して調査用資料採取完了後に当該ノードの電源断あるいは所定時間経過後に当該ノードの電源断することにより、異常発生ノードの調査用資料の採取を確実に行うと共に異常発生ノードの電源を断し共用資源20の同時アクセスなどによる誤動作を防止してクラスタシステムの信頼性の向上を図ることが可能となる。
【0016】
【発明の実施の形態】
次に、図1から図5を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0017】
図1は、本発明のシステム構成図を示す。
図1において、ノード1,2は、クラスタシステム11を構成する複数のノードであって、ここでは、障害発生時に調査用資料20をローカル資源21に保存する対象のノードであり、異常検出手段12、タイマ監視手段13、採取完了設定手段14、アクセス機構15、電源切断指示手段16、電源機構17、資料採取手段18、およびローカル資源19などから構成されるものである。
【0018】
異常検出手段12は、監視対象リストに登録されている全てのノードのアドレスをもとに、当該アドレスのノードと通信することを所定時間毎に順次繰り返し、他のノードの異常を検出するものである。
【0019】
タイマ監視手段13は、所定時間毎に他のノードの異常監視を繰り返したり、所定時間経過しても相手ノードから応答がないときに当該ノードを異常と検出したりするときの当該所定時間を生成するものである。
【0020】
採取完了設定手段14は、ノード内の調査用資料20をローカル資源19に書き込んで採取を完了したときに、共用資源21中の調査用資料採取フラグ22に調査用資料20の採取完了を表すフラグを設定するものである(図3参照)。
【0021】
アクセス機構15は、共用資源21をアクセスするものであって、ここでは、調査用資料採取フラグ22を設定するものである。
【0022】
電源切断指示手段16は、電源切断の指示を異常発生したノードに通知し、電源切断を行わせるものである。
【0023】
電源機構17は、図示外の電源を切断するものである。
資料採取手段18は、ノード内の異常を調査するために必要な調査用資料20をローカル資源19に書き込んで採取するものである。
【0024】
調査用資料20は、ノードの異常を調査するために必要な調査用資料(異常発生時のメモリ、レジスタなどの内容)である。
【0025】
共用資源21は、複数のノードが共用する資源であって、ここでは、共用するディスク装置であり、調査用資料採取フラグ22を設定するものである。
【0026】
調査用資料採取フラグ22は、ノード毎に正常、異常発生して採取中、採取完了を設定し、他のノードに知らせるためのものである(図3参照)。
【0027】
次に、図2のフローチャートの順番に従い、図1の構成の動作を詳細に説明する。
【0028】
図2は、本発明の動作説明フローチャートを示す。
図2において、S1は、OS異常を検出したら、共用資源21に調査用資料採取中フラグ22を設定する。これは、図1の例えばノード1のOS異常などの障害が発生して当該ノード1が共用資源21中の調査用資料採取フラグ22を調査用資料採取中を表すように”1”に設定する。
【0029】
S2は、調査用資料20をローカル資源19に出力する。
S3は、調査用資料の採取が完了したら、調査用資料採取完了フラグを設定する。これは、例えばノード1が共用資源21中の調査用資源採取フラグ22を”2”(調査用資料採取完了を表す)に設定する。
【0030】
以上のS1からS3によって、障害発生(例えばOS異常)したノードで、共用資源21中の調査用資料採取フラグ22を”1”(調査用資料採取中を表す)に設定した後、調査用資料20をローカル資源19に退避を開始し、終了したときに、共用資源21中の調査用資料採取フラグ22を”2”(調査用資料採取完了を表す)に設定し、当該異常発生したノードで障害の調査用資料をローカル資源(外部記憶装置)に確実に保存することが可能となる。
【0031】
S11は、監視ノードとの通信を行う。これは、例えば図1のノード2が監視ノードのリスト中からここでは、ノード1(そのアドレス)を取り出して正常動作中かを監視するための通信を行う。
【0032】
S12は、通信異常を検出か判別する。これは、ノード2がS11で監視ノードのうちのここでは、ノード1と通信してノード1の異常が受信されたか、あるいは所定時間経過してタイムオーバとなっても応答がなく異常と判明したかを判別する。YESの場合には、ここでは、ノード1自身あるいはその通信路に異常発生と判断し、S13で他ノードの停止保証プログラム45(S21からS26、S31からS34)を起動する。そして、S11で次の監視対象のノードについて繰り返す。
【0033】
以上のS11からS13によって、監視対象のノードについて順次通信して異常検出時に、異常検出した他ノード毎に他ノードの停止保証プログラム45を起動することが可能となる。
【0034】
S21は、S13で起動された停止保証プログラム45がフラグ”1”,”2”かチェックする。これは、S13で起動された例えばノード2中で動作する停止保証プログラム45が共用資源21中の調査用資料採取フラグ22を参照して”1”(調査用資料採取中を表す)、”2”(調査用資料採取完了を表す)のいずれかと設定されているか否かを判別する。YESの場合には、S22に進む。NOの場合には、フラグが”0”で正常と設定されていると判明し、当該異常検出のノードがハングアップして共用資源21中の調査用資料採取フラグ22を”1”あるいは”2”に設定不可と判明したので、S31からS34のノード1のハングアップ時の処理を実行する。
【0035】
S22は、監視ノードのリストを更新する。これは、S21のYESで、障害発生したノード、例えば図1のノード1に異常発生と判明したので、監視ノードリスト中から当該異常発生のノード1を削除(あるいは異常発生中)と更新し、監視対象ノードから除外する。
【0036】
S23は、状態遷移する。
S24は、フラグ”2”か判別する。これは、停止保証プログラム45が、異常発生のノード、ここでは、図1のノード1の共用資源21中の調査用資料採取フラグ22が”2”(調査用資料採取完了を表す)か判別する。YESの場合には、ここでは、ノード1が調査用資料20をローカル資源19に退避し、S3でフラグを”2”に設定したと判明したので、S26で電源断のパケット送信し、異常発生したノード1の電源断を行わせる。一方、S24のNOの場合には、フラグが”1”(調査用資料採取中)であると判明したので、S25に進む。
【0037】
S25は、タイムオーバーか判別する。これは、フラグが”1”の状態が所定時間以上経過しても”2”に設定されず、ここでは、ノード1が調査用資料20をローカル資源19に退避する処理が中断して障害発生か判別する。YESの場合には、ここでは、ノード1に調査用資料20の退避中に障害発生と判明したので、S26で電源断のパケット送信し、異常発生したノード1の電源断を行わせる。一方、S25のNOの場合には、S24を繰り返す。
【0038】
以上のS21からS26によって、障害検出したノード、ここでは、ノード1が共用資源21中の調査用資料採取フラグ22を”1”に設定して調査用資料20をローカル資源19に退避中と判明したので、共用資源21中の調査用資料採取フラグ22をチェックし、”2”(調査用資料採取完了)を確認した時点で当該障害検出したノード1の電源断のパケットを送信して電源断させ、一方、共用資源21中の調査用資料採取フラグ22をチェックし、タイムオーバーとなったときは当該障害検出したノード1の調査用資料20の退避中に異常発生と判断し、障害検出したノード1の電源断のパケットを送信して電源断させる。これらにより、障害発生したノード1で確実に調査用資料20をローカル資源19に退避したことを確認し、他のノードが電電断のパケットを当該ノード1に送信して電源断させ、一方、一定時間経過しても調査用資料採取フラグ22が”1”から”2”に遷移しないときは当該障害検出したノード1の調査用資料20の退避中に障害発生と判断して電源断のパケットを送信して強制的に電源断させることが可能となる。
【0039】
図3は、本発明の調査用資料採取フラグ例を示す。調査用資料採取フラグ22は、ここでは、図示のように下記の情報を対応づけて設定するものである。
【0040】
・ノード(監視対象のノード):
・フラグ:
・設定日時:
・その他:
ここで、ノードは監視対象のノードであって、例えば一意のノード名、更に、通信のためのアドレスを持つものである。フラグは、ノードの状態を表すものであって、
0:正常
1:調査用資料採取中
2:調査用資料採取完了
の状態をそれぞれ表す。設定日時は、フラグを設定した日時(年月日時分秒など)である。
【0041】
以上のように、共用資源21中に設けた調査用資料採取フラグ22中に、監視対象の全てのノードについて、フラグ(0,1,2)のいずれかを設定することにより、全監視対象のノードの調査用資料採取の状態をいずれのノードも参照して認識し、既述した図2のS11からS13、S21からS26、S31からS34の処理を実行し、障害発生したノードが調査用資料20をローカル資源19に退避することを確実に保証することが可能となる。
【0042】
図4は、本発明の説明図を示す。
図4の(a)は、ノード1に障害発生前の状態を示す。ここでは、ノード1、2のアプリ42がOS41の制御のもとで共用資源22をそれぞれ排他的にアクセスなどしてそれぞれの業務処理をそれぞれ独立に並列に実行している。
【0043】
図4の(b)は、ノード1に障害発生後の状態を示す。このときの動作を以下に説明する。
【0044】
(1)OS異常が発生したノード1では、OS異常終了ルーチン43が共用資源21中の調査用資料採取フラグ22の当該ノード1のフラグを”0”から”1”に更新した後(図2のS1)、当該ノード1の調査用資料20をローカル資源19に書込み(退避)を開始し、完了した時点で共用資源21中の調査用資料採取フラグ22を”1”から”2”に更新し、調査用資料20の退避完了を設定する(図2のS2、S3)。
【0045】
(2)一方、ノード2では、生存監視プログラム44が専用通信路を介して監視対象のノード1と通信したがここでは、応答がなくタイムオーバーして生死確認失敗したので、ノード1の異常と判断し、停止保証プログラム45を起動する(図2のS11からS13)。起動された停止保証プログラム45は、共用資源21中の当該異常検出したノード1の調査用資料採取フラグ22を参照し、
・”0”(正常)のときは当該ノード1がハングアップしてフラグを”1”あるいは”2”に設定できなかったと判断し、一定時間の間繰り返して待機し、タイムオーバーしたときに電源断のパケットをノード1に送信して電源断させると共に監視対象のノードリストから当該ノード1を削除する。
【0046】
・”1”(調査用資料採取中)あるいは”2”(調査用資料採取完了)のときは当該ノード1が調査用資料採取を開始あるいは終了したと判明したので、監視対象リストから当該ノード1を削除た後、調査用資料採取完了を待って電源断のパケットをノード1に送信して電源断させる。一方、”1”から”2”へ所定時間経過しても遷移しないときはノード1で調査用資料20をローカル資源19に退避する処理が中断して進まないと判断し、電源断のパケットをノード1に送信して電源断させる。
【0047】
図5は、本発明の具体的回路例を示す。ここでは、
LAN(業務LAN)は、クラスタシステムを構成する複数のノード1,2・・・などを接続して相互にデータを授受して業務処理を実行させる通信路である。
【0048】
LAN(専用通信路)は、ノード1,2・・・の間で相互に通信して生死などを判定する通信路である。
【0049】
SCSIあるいはFibre Channelは、共用資源21をノード1,2・・・などが高速アクセスさせるインタフェースである。
【0050】
RSB31は、リモートサービスボードであって、ノード1の電源の投入、切断を制御するものであり、他のノードから電源断のパケットを送信して強制的に該当ノードの電源断を実行させるためのものである。
【0051】
以上の通信路(LAN(業務用LAN)、LAN(専用通信路))、SCSI(あるいはFibre Channel)などを設けて相互に通信、データアクセスし、更に、図1から図4のノード1,2内に設けた各種手段、OS,プログラムによって、既述した図2、図4で説明したように、動作するものである。
【0052】
【発明の効果】
以上説明したように、本発明によれば、複数のノードから構成されるクラスタシステムにおいて、あるノードに障害発生したときに共用資源21に調査用資料採取中フラグ22を設定して調査用資料20を採取し、採取完了したときにフラグ22を設定し、他のノードは共用資源21中のフラグ22を参照して調査用資料採取完了後に当該ノードの電源断あるいは所定時間経過後に当該ノードの電源断する構成を採用しているため、異常発生ノードの調査用資料の採取を確実に行うと共に異常発生ノードの電源を断し共用資源21の同時アクセスなどによる誤動作を防止してクラスタシステムの信頼性の向上を図ることが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャートである。
【図3】本発明の調査用資料採取フラグ例である。
【図4】本発明の説明図である。
【図5】本発明の具体的回路例である。
【図6】従来技術の説明図である。
【符号の説明】
1、2:ノード
11:クラスタシステム
12:異常検出手段
13:タイマ監視手段
14:採取完了設定手段
15:アクセス機構
16:電源切断指示手段
17:電源気候
18:資料採取手段
19:ローカル資源
20:調査用資料
21:共用資源
22:調査用資料採取フラグ
31:RSB(リモートサービスボード)
41:OS(クラスタ制御)
42:アプリ
43:OS異常終了ルーチン
44:生存監視プログラム
45:停止保証プログラム

Claims (5)

  1. 複数のノードから構成されるクラスタシステムにおけるノードの調査用資料を採取する情報採取プログラムであって、
    コンピュータに、
    各ノードが他のノードの異常検出するステップと、
    前記異常を検出したときに、共用資源を参照して当該異常検出したノードが調査用資料を採取中で採取完了していない状態を検出するステップと、
    前記採取中で採取完了していない状態が検出されたときに、採取完了するのを待って当該異常検出したノードの電源断するステップとして機能させるための情報採取プログラム。
  2. 前記採取中が検出されなかったときに、所定時間経過後に当該異常検出したノードの電源断するステップとして機能させるための請求項1に記載の情報採取プログラム。
  3. 前記異常発生したノードは、前記共用資源に調査用資料の採取中を設定すると共に当該ノードの調査用資料を記憶装置に書き込んで採取し、採取完了したときに採取完了を設定するステップとして機能させるための請求項1あるいは請求項2に記載の情報採取プログラム。
  4. 複数のノードから構成されるクラスタシステムにおけるノードの調査用資料を採取する情報採取装置であって、
    各ノードが他のノードの異常検出する手段と、
    前記異常を検出したときに、共用資源を参照して当該異常検出したノードが調査用資料を採取中で採取完了していない状態を検出する手段と、
    前記採取中で採取完了していない状態が検出されたときに、採取完了するのを待って当該異常検出したノードの電源断する手段と
    を備えたことを特徴とする情報採取装置。
  5. 複数のノードから構成されるクラスタシステムにおけるノードの調査用資料を採取する情報採取方法であって、
    各ノードが他のノードの異常検出するステップと、
    前記異常を検出したときに、共用資源を参照して当該異常検出したノードが調査用資料を採取中で採取完了していない状態を検出するステップと、
    前記採取中で採取完了していない状態が検出されたときに、採取完了するのを待って当該異常検出したノードの電源断するステップと
    を有する情報採取方法。
JP2003035631A 2003-02-13 2003-02-13 情報採取プログラム、情報採取装置および情報採取方法 Pending JP2004246621A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003035631A JP2004246621A (ja) 2003-02-13 2003-02-13 情報採取プログラム、情報採取装置および情報採取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003035631A JP2004246621A (ja) 2003-02-13 2003-02-13 情報採取プログラム、情報採取装置および情報採取方法

Publications (1)

Publication Number Publication Date
JP2004246621A true JP2004246621A (ja) 2004-09-02

Family

ID=33021001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003035631A Pending JP2004246621A (ja) 2003-02-13 2003-02-13 情報採取プログラム、情報採取装置および情報採取方法

Country Status (1)

Country Link
JP (1) JP2004246621A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304687A (ja) * 2006-05-09 2007-11-22 Hitachi Ltd クラスタ構成とその制御手段
JP2009211517A (ja) * 2008-03-05 2009-09-17 Nec Corp 仮想計算機冗長化システム
WO2013018183A1 (ja) * 2011-07-29 2013-02-07 富士通株式会社 システム制御装置、電力制御方法及び電子システム
JP2013156963A (ja) * 2012-01-31 2013-08-15 Fujitsu Ltd 制御プログラム、制御方法、情報処理装置、制御システム
JP2013232142A (ja) * 2012-05-01 2013-11-14 Hitachi Ltd 二重化装置および電源停止方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01195544A (ja) * 1988-01-29 1989-08-07 Nec Corp デュプレックス構成システムのダウン監視方式
JPH0283753A (ja) * 1988-09-21 1990-03-23 Hitachi Ltd 系切替制御方式
JPH06348528A (ja) * 1993-06-11 1994-12-22 Hitachi Ltd バックアップ切り換え制御方法
WO1999026138A1 (fr) * 1997-11-14 1999-05-27 Hitachi, Ltd. Procede de permutation dans un systeme multiplex
JPH11175488A (ja) * 1997-12-16 1999-07-02 Toshiba Corp サーバシステムおよびフェールオーバ制御方法
JPH11259326A (ja) * 1998-03-13 1999-09-24 Ntt Communication Ware Kk ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01195544A (ja) * 1988-01-29 1989-08-07 Nec Corp デュプレックス構成システムのダウン監視方式
JPH0283753A (ja) * 1988-09-21 1990-03-23 Hitachi Ltd 系切替制御方式
JPH06348528A (ja) * 1993-06-11 1994-12-22 Hitachi Ltd バックアップ切り換え制御方法
WO1999026138A1 (fr) * 1997-11-14 1999-05-27 Hitachi, Ltd. Procede de permutation dans un systeme multiplex
JPH11175488A (ja) * 1997-12-16 1999-07-02 Toshiba Corp サーバシステムおよびフェールオーバ制御方法
JPH11259326A (ja) * 1998-03-13 1999-09-24 Ntt Communication Ware Kk ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304687A (ja) * 2006-05-09 2007-11-22 Hitachi Ltd クラスタ構成とその制御手段
JP2009211517A (ja) * 2008-03-05 2009-09-17 Nec Corp 仮想計算機冗長化システム
WO2013018183A1 (ja) * 2011-07-29 2013-02-07 富士通株式会社 システム制御装置、電力制御方法及び電子システム
JP2013156963A (ja) * 2012-01-31 2013-08-15 Fujitsu Ltd 制御プログラム、制御方法、情報処理装置、制御システム
JP2013232142A (ja) * 2012-05-01 2013-11-14 Hitachi Ltd 二重化装置および電源停止方法

Similar Documents

Publication Publication Date Title
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
CN102141947B (zh) 一种对采用嵌入式操作系统的计算机应用系统中异常任务的处理方法及系统
US7716520B2 (en) Multi-CPU computer and method of restarting system
TWI337304B (en) Method for fast system recovery via degraded reboot
US20190379576A1 (en) Providing dynamic serviceability for software-defined data centers
JP6130520B2 (ja) 多重系システムおよび多重系システム管理方法
CN109614130A (zh) 一种带有试运行、自检查的云广播升级方法及系统
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
JP2010224847A (ja) 計算機システム及び設定管理方法
TW200426571A (en) Policy-based response to system errors occurring during os runtime
JP2010160660A (ja) ネットワークインタフェース、計算機システム、それらの動作方法、及びプログラム
JP6124644B2 (ja) 情報処理装置および情報処理システム
JP2004246621A (ja) 情報採取プログラム、情報採取装置および情報採取方法
JP5440073B2 (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
JP5104479B2 (ja) 情報処理装置
CN111342986A (zh) 分布式节点管理方法及装置、分布式系统、存储介质
JP2008225567A (ja) 情報処理システム
JP2001101032A (ja) 異種os間制御によるos監視方式
US20130219212A1 (en) Array management device, array management method and integrated circuit
JP2006065440A (ja) プロセス管理システム
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
JP5335150B2 (ja) 計算機装置及びプログラム
JP2010026830A (ja) システムに負荷をかけないデータバックアップ方法
JP6364773B2 (ja) 情報処理装置、情報処理システム、メモリレプリケーション方法、並びにコンピュータ・プログラム
CN111901415B (zh) 数据处理方法和系统、计算机可读存储介质及处理器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071002