JP2004302632A - コンピュータ処理方法及びその実施システム並びにその処理プログラム - Google Patents

コンピュータ処理方法及びその実施システム並びにその処理プログラム Download PDF

Info

Publication number
JP2004302632A
JP2004302632A JP2003092248A JP2003092248A JP2004302632A JP 2004302632 A JP2004302632 A JP 2004302632A JP 2003092248 A JP2003092248 A JP 2003092248A JP 2003092248 A JP2003092248 A JP 2003092248A JP 2004302632 A JP2004302632 A JP 2004302632A
Authority
JP
Japan
Prior art keywords
computer
active
standby
shared storage
access right
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003092248A
Other languages
English (en)
Other versions
JP4155399B2 (ja
Inventor
Takayuki Nakano
隆行 仲野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003092248A priority Critical patent/JP4155399B2/ja
Priority to US10/745,622 priority patent/US7032128B2/en
Publication of JP2004302632A publication Critical patent/JP2004302632A/ja
Application granted granted Critical
Publication of JP4155399B2 publication Critical patent/JP4155399B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

【課題】現用系コンピュータからの系切り替えが行えない場合であっても共用装置へのアクセス権の解放を行うことが可能な技術を提供する。
【解決手段】現用系コンピュータでの障害発生を検知した場合に現用系コンピュータから予備系コンピュータへの系切り替えを共用記憶制御手段へ指示するステップと、前記系切り替え指示を予備系コンピュータから受信した場合に、現用系コンピュータが正常に動作中であるかどうかを共用記憶制御手段から現用系コンピュータへ問い合わせるステップと、前記問い合わせの結果、現用系コンピュータが正常に動作していないことが検知された場合に、現用系コンピュータの共用手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与するステップと、前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで行われていたプログラム処理を予備系コンピュータで引き継ぐステップとを有するものである。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は現用系と予備系で共用装置を使用している場合の障害検出やその回復に関するものである。
【0002】
【従来の技術】
従来のコンピュータ処理システムでは、現用系コンピュータと予備系コンピュータとを共用ディスク装置に接続してシステムを冗長化させることにより、コンピュータシステム全体の可用性を高めたHA(High Availability)システムを提供している(例えば特許文献1参照)。
【0003】
この様なシステムでは、正常に業務プログラム処理を実行中の現用系コンピュータから予備系コンピュータへハートビート信号を送信しており、現用系コンピュータにおいて障害が発生し、現用系から予備系へのハートビート信号の送出が途絶すると、予備系コンピュータがハートビート信号の途絶により現用系での障害発生を検知し、予備系から現用系へ系切り替え指示を行う。
【0004】
現用系コンピュータは、前記系切り替え指示により共有ディスクのアクセス権を解放して系切り替え処理完了指示を予備系へ通知し、その通知を受けた予備系コンピュータは、共用ディスクのアクセス権を取得した後、新現用系として業務プログラム処理を引継いでいる。
【0005】
【特許文献1】
特開2001−014256号公報
【0006】
【発明が解決しようとする課題】
前記従来技術では、現用系側でオペレーティングシステム(OS、計算機や情報処理装置の制御プログラム)やクラスタ制御プログラムの障害が発生すると、現用系から系切り替えを行うことができなくなる為、共有ディスク制御権の解放漏れが生じるという問題がある。
【0007】
前記従来の共有されたディスク装置を持つHAシステムにおいて、現用系の障害により、予備系へ系切り替えを行う際、現用系側で使用していた共有ディスクの制御権を解放する必要がある。一般的には、クラスタ制御プログラムがこれを行うが、OSの異常停止等、コンピュータシステム全体がハングアップするような障害の場合、クラスタ制御プログラム自体も停止してしまい、必ずしもクラスタ制御プログラムによる、共有ディスクの制御権の解放が保証されるわけではない。OSやクラスタ制御プログラムに依存しない回避方法としては、特殊なハードウェアを用い、現用系の障害時に予備系側から現用系の強制リブートを実施するという方法をとれる場合もあるが、汎用的ではない。
【0008】
また前記従来技術では、ハートビート信号を送出する監視パスで障害が発生すると、現用系の障害を予備系で検知することができなくなる為、システム可用性が低下するという問題がある。
【0009】
現用系及び予備系それぞれのクラスタ制御プログラムが、お互いの稼動状況を通知する為に使用する監視パス(ハートビート信号用の通信経路)が障害となっていた場合、予備系は現用系に障害が発生した場合でも、それを検知することができないし、系切り替えの連絡を行うこともできない。この場合には、単に現用系がダウンするだけとなり、システムの可用性は大きく低下してしまう。これを改善する手段として、物理的な監視パスを用いる他に、共有ディスク上に特定のデータを読み書きすることでハートビート動作を行うという従来手法も存在するが、ディスクの読み書きの為の排他制御が必要となり、I/O時間がかかるという問題がある。また、システムを構成するマシンの台数が多くなる程この時間は大きくなる為、これもあまり現実的な解とは言えない。
【0010】
本発明の目的は上記問題を解決し、現用系コンピュータからの系切り替えが行えない場合であっても共用装置へのアクセス権の解放を行うことが可能な技術を提供することにある。
本発明の他の目的は現用系コンピュータから予備系コンピュータへのハートビート信号を送信する監視パスに障害が発生した場合でも現用系コンピュータの監視を続行することが可能な技術を提供することにある。
【0011】
【課題を解決するための手段】
本発明は、現用系コンピュータで障害が発生した場合に共用装置へのアクセス権を解放するものである。
【0012】
本発明のコンピュータ処理システムでは、現用系コンピュータにおいて障害が発生し、現用系から予備系へのハートビート信号の送出が途絶すると、予備系コンピュータは、ハートビート信号の途絶により現用系での障害発生を検知し、予備系から現用系へ系切り替え指示を行う。
【0013】
そして前記系切り替え指示に対する現用系コンピュータからの応答が受信されない場合、予備系コンピュータは、現用系コンピュータから予備系コンピュータへの系切り替えを共用記憶制御装置へ指示する。
【0014】
共用記憶制御装置は、前記系切り替え指示を予備系コンピュータから受信した場合に、現用系コンピュータが正常に動作中であるかどうかを共用記憶制御装置から現用系コンピュータへ問い合わせる。
【0015】
前記問い合わせの結果、現用系コンピュータが正常に動作していないことが検知された場合に共用記憶制御装置は、現用系コンピュータの共用装置へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与する。
【0016】
予備系コンピュータは、前記共用記憶制御装置により予備系コンピュータへアクセス権が付与されると、現用系コンピュータで行われていたプログラム処理を予備系コンピュータで引き継ぐ処理を行う。
【0017】
以上の様に本発明のコンピュータ処理システムによれば、現用系コンピュータで障害が発生した場合に共用装置へのアクセス権を解放するので、現用系コンピュータからの系切り替えが行えない場合であっても共用装置へのアクセス権の解放を行うことが可能である。
【0018】
【発明の実施の形態】
(実施形態1)
以下に現用系コンピュータで障害が発生した場合に共用ディスク装置へのアクセス権を解放する実施形態1のコンピュータ処理システムについて説明する。
【0019】
図1は本実施形態のコンピュータ処理システムの処理概要を示す図である。図1に示す様に本実施形態のコンピュータ処理システムでは、▲1▼現用系コンピュータ100(計算機や情報処理装置、その様な処理を実施するプログラムやオブジェクトでも良い)において障害が発生し、▲2▼現用系から予備系へのハートビート送出が途絶すると、▲3▼予備系コンピュータ101(計算機や情報処理装置、その様な処理を実施するプログラムやオブジェクトでも良い)がハートビート途絶により現用系の障害を検知し、▲4▼予備系から現用系に系切り替え指示を実行した際の応答が無い場合に、▲5▼予備系側から強制的な共有ディスク(共有記憶装置若しくは、その様な処理を実施するプログラムやオブジェクトでも良い)へのアクセス権の取得をディスク制御装置(記憶制御装置や、その様な処理を実施するプログラムやオブジェクトでも良い)に指示して、ディスク制御装置は、現状のディスクへのアクセス権を解放し、要求を出した系へディスクへのアクセス権を付与する。予備系コンピュータ101は、ディスクのアクセス権を取得し、予備系側が新現用系として業務を引継ぐ。
【0020】
図2は本実施形態の予備系コンピュータ101及び共用ディスク制御装置102の概略構成を示す図である。図2に示す様に本実施形態の予備系コンピュータ101は、CPU201と、メモリ202と、磁気ディスク装置203と、入力装置204と、出力装置205と、CD−ROM装置206と、通信装置207とを有している。
【0021】
CPU201は、予備系コンピュータ101全体の動作を制御する装置である。メモリ202は、予備系コンピュータ101全体の動作を制御する際にその為の各種処理プログラムやデータをロードする記憶装置である。
【0022】
磁気ディスク装置203は、前記各種処理プログラムやデータを格納しておく記憶装置である。入力装置204は、現用系の障害時に業務処理を引き継ぐ為の各種入力を行う装置である。出力装置205は、業務処理を引き継ぎに伴う各種出力を行う装置である。
【0023】
CD−ROM装置206は、前記各種処理プログラムを記録したCD−ROMの内容を読み出す装置である。通信装置207は、インターネットやイントラネット等のネットワークを介して他の処理装置との通信を行う装置である。
【0024】
また予備系コンピュータ101は、系切り替え指示処理部211と、プログラム実行処理部212とを有している。
【0025】
系切り替え指示処理部211は、現用系コンピュータ100での障害発生を検知した場合に現用系コンピュータ100から予備系コンピュータ101への系切り替えを共用ディスク制御装置102へ指示する処理部である。
【0026】
プログラム実行処理部212は、共用ディスク制御装置102により予備系コンピュータ101へアクセス権が付与された場合に、現用系コンピュータ100で行われていたプログラム処理(アプリケーションプログラムや業務プログラム、プログラムやオブジェクトが実行されて実施される処理)を引き継ぐ処理部である。
【0027】
予備系コンピュータ101を系切り替え指示処理部211及びプログラム実行処理部212として機能させる為のプログラムは、CD−ROM等の記録媒体に記録され磁気ディスク等に格納された後、メモリにロードされて実行されるものとする。なお前記プログラムを記録する記録媒体はCD−ROM以外の他の記録媒体でも良い。また前記プログラムを当該記録媒体から情報処理装置にインストールして使用しても良いし、ネットワークを通じて当該記録媒体にアクセスして前記プログラムを使用するものとしても良い。
【0028】
共用ディスク制御装置102は、CPU221と、メモリ222と、共用ディスク装置223と、入力装置224と、出力装置225と、CD−ROM装置226と、通信装置227とを有している。
【0029】
CPU221は、予備系コンピュータ101全体の動作を制御する装置である。メモリ222は、予備系コンピュータ101全体の動作を制御する際にその為の各種処理プログラムやデータをロードする記憶装置である。
【0030】
共用ディスク装置223は、前記各種処理プログラムやデータを格納しておく記憶装置である。入力装置224は、現用系の障害時に系切り替えを行う為の各種入力を行う装置である。出力装置225は、前記系切り替えに伴う各種出力を行う装置である。
【0031】
CD−ROM装置226は、前記各種処理プログラムを記録したCD−ROMの内容を読み出す装置である。通信装置227は、インターネットやイントラネット等のネットワークを介して他の処理装置との通信を行う装置である。
【0032】
また共用ディスク制御装置102は、問い合わせ処理部231と、強制解放処理部232とを有している。
【0033】
【0034】
問い合わせ処理部231は、前記系切り替え指示を予備系コンピュータ101から受信した場合に、現用系コンピュータ100が正常に動作中であるかどうかを現用系コンピュータ100へ問い合わせる処理部である。
【0035】
強制解放処理部232は、前記問い合わせの結果、現用系コンピュータ100が正常に動作していないことが検知された場合に、現用系コンピュータ100の共用ディスクへのアクセス権を解放し、予備系コンピュータ101へアクセス権を付与する処理部である。本処理部は、設定されているアクセス権に基づかないアクセス権の変更を行う処理部でもある。
【0036】
共用ディスク制御装置102を問い合わせ処理部231及び強制解放処理部232として機能させる為のプログラムは、CD−ROM等の記録媒体に記録され磁気ディスク等に格納された後、メモリにロードされて実行されるものとする。なお前記プログラムを記録する記録媒体はCD−ROM以外の他の記録媒体でも良い。また前記プログラムを当該記録媒体から情報処理装置にインストールして使用しても良いし、ネットワークを通じて当該記録媒体にアクセスして前記プログラムを使用するものとしても良い。
【0037】
図3は本実施形態の予備系コンピュータ101の処理手順を示すフローチャートである。図3に示す様にステップ301で予備系コンピュータ101の系切り替え指示処理部211は、通信装置207を介して現用系コンピュータ100からハートビート信号を受信しているかどうかを調べ、ハートビート信号の途絶(所定時間が経過してもハートビート信号を検出できない状態)、即ち現用系コンピュータ100での障害発生を検知した場合にはステップ302へ進む。
【0038】
ステップ302では、現用系コンピュータ100から予備系コンピュータ101への系切り替え指示を通信装置207経由で現用系コンピュータ100へ送信する。そしてステップ303では、前記系切り替え指示に対する処理が完了したことを示す応答を通信装置207経由で現用系コンピュータ100から受信しているかどうかを調べ、前記完了応答が無い場合にはステップ304へ進む。
【0039】
ステップ304では、現用系コンピュータ100から予備系コンピュータ101への系切り替え指示を通信装置207経由で共用ディスク制御装置102へ送信する。
【0040】
図4は本実施形態の共用ディスク制御装置102の処理手順を示すフローチャートである。図4に示す様にステップ401で共用ディスク制御装置102の問い合わせ処理部231は、現用系コンピュータ100から予備系コンピュータ101への系切り替え指示を通信装置227(若しくは、その様な処理を実施するプログラムやオブジェクトでも良い)経由で予備系コンピュータ101から受信しているかどうかを調べ、前記系切り替え指示を受信している場合にはステップ402へ進む。
【0041】
ステップ402では、現用系コンピュータ100が正常に動作中であるかどうかを通信装置227経由で現用系コンピュータ100へ問い合わせる。そしてステップ403では、前記問い合わせに対する応答を通信装置227経由で現用系コンピュータ100から受信しているかどうかを調べ、前記応答が無い場合には現用系コンピュータ100が正常に動作していないものとしてステップ404へ進む。
【0042】
ステップ404で強制解放処理部232は、共用ディスク制御装置102内に格納されているアクセス制御情報を変更することにより、現用系コンピュータ100の共用ディスクへのアクセス権を解放し、予備系コンピュータ101へアクセス権を付与する。
【0043】
そしてステップ405では、現用系コンピュータ100の共用ディスクへのアクセス権が解放され、予備系コンピュータ101へアクセス権が付与されたことを示す通知を通信装置227経由で予備系コンピュータ101へ送信する。
【0044】
図3のステップ305で予備系コンピュータ101のプログラム実行処理部212は、前記通知を通信装置207経由で共用ディスク制御装置102から受信することにより予備系コンピュータ101へ共用ディスクへのアクセス権が付与されたことを検知し、現用系コンピュータ100で行われていたプログラム処理を引き継ぐ処理を行う。
【0045】
以上説明した様に本実施形態のコンピュータ処理システムによれば、現用系コンピュータで障害が発生した場合に共用装置へのアクセス権を解放するので、現用系コンピュータからの系切り替えが行えない場合であっても共用装置へのアクセス権の解放を行うことが可能である。
【0046】
(実施形態2)
以下に現用系コンピュータから予備系コンピュータへのハートビート信号が途絶した場合に、現用系コンピュータから共用ディスク制御装置へハートビート信号を送信する実施形態2のコンピュータ処理システムについて説明する。
【0047】
図5は本実施形態のコンピュータ処理システムの処理概要を示す図である。図5に示す様に本実施形態のコンピュータ処理システムでは、▲1▼監視パス遮断によるハートビートの途絶が発生すると、▲2▼ハートビートの途絶を検知した予備系がディスクに対し現用系の監視を要求し、▲3▼予備系から要求を受けたディスクが現用系に対し、監視開始を指示してディスクを使用したハートビートが開始される。その後、▲4▼現用系にてオペレーティングシステム障害が発生し、クラスタ制御プログラムによる障害検知が不可となると、▲5▼ハートビート途絶により、共用ディスク側が現用系の障害を検知し、▲6▼現用系の障害検知により、共用ディスク側が強制的に共有ディスクのアクセス権を解放する。そして▲7▼共用ディスク側が予備系に現用系の障害を通知し、▲8▼予備系クラスタ制御プログラムが現用系の障害を検知して、▲9▼予備系が新たに現用系となるためにディスクに対してアクセス権を要求する。
【0048】
図6は本実施形態の予備系コンピュータ101及び共用ディスク制御装置102の概略構成を示す図である。図6に示す様に本実施形態の予備系コンピュータ101は、監視要求処理部601と、プログラム実行処理部602とを有している。
【0049】
監視要求処理部601は、現用系コンピュータ100が正常に動作中であることを示すハートビート信号の途絶を検知した場合に現用系コンピュータ100の監視要求を共用ディスク制御装置102へ送信する処理部である。
【0050】
プログラム実行処理部602は、共用ディスク制御装置102により予備系コンピュータ101へアクセス権が付与された場合に、現用系コンピュータ100で行われていたプログラム処理を引き継ぐ処理部である。
【0051】
予備系コンピュータ101を監視要求処理部601及びプログラム実行処理部602として機能させる為のプログラムは、CD−ROM等の記録媒体に記録され磁気ディスク等に格納された後、メモリにロードされて実行されるものとする。なお前記プログラムを記録する記録媒体はCD−ROM以外の他の記録媒体でも良い。また前記プログラムを当該記録媒体から情報処理装置にインストールして使用しても良いし、ネットワークを通じて当該記録媒体にアクセスして前記プログラムを使用するものとしても良い。
【0052】
共用ディスク制御装置102は、ハートビート送信指示処理部611と、強制解放処理部612とを有している。
ハートビート送信指示処理部611は、前記監視要求を予備系コンピュータ101から受信した場合に、前記ハートビート信号の共用ディスク制御装置102への送信を現用系コンピュータ100へ指示する処理部である。
強制解放処理部612は、前記ハートビート信号の途絶を検知した場合に、現用系コンピュータ100の共用ディスクへのアクセス権を解放し、予備系コンピュータ101へアクセス権を付与する処理部である。
【0053】
共用ディスク制御装置102をハートビート送信指示処理部611及び強制解放処理部612として機能させる為のプログラムは、CD−ROM等の記録媒体に記録され磁気ディスク等に格納された後、メモリにロードされて実行されるものとする。なお前記プログラムを記録する記録媒体はCD−ROM以外の他の記録媒体でも良い。また前記プログラムを当該記録媒体から情報処理装置にインストールして使用しても良いし、ネットワークを通じて当該記録媒体にアクセスして前記プログラムを使用するものとしても良い。
【0054】
図7は本実施形態の予備系コンピュータ101の処理手順を示すフローチャートである。図7に示す様にステップ701で予備系コンピュータ101の監視要求処理部601は、通信装置207を介して現用系コンピュータ100からハートビート信号を受信しているかどうかを調べ、ハートビート信号の途絶、即ち現用系コンピュータ100での障害発生を検知した場合にはステップ702へ進む。
ステップ702では、現用系コンピュータ100の監視要求を通信装置207経由で共用ディスク制御装置102へ送信する。
【0055】
図8は本実施形態の共用ディスク制御装置102の処理手順を示すフローチャートである。図8に示す様にステップ801で共用ディスク制御装置102のハートビート送信指示処理部611は、現用系コンピュータ100の監視要求を通信装置227経由で予備系コンピュータ101から受信しているかどうかを調べ、前記監視要求を受信している場合にはステップ802へ進む。
ステップ802では、現用系コンピュータ100が正常に動作中であることを示すハートビート信号の共用ディスク制御装置102への送信を通信装置227経由で現用系コンピュータ100へ指示する。
【0056】
本実施形態の現用系コンピュータ100は、現用系コンピュータ100が正常に動作中であることを示すハートビート信号を予備系コンピュータ101または共用ディスク制御装置102へ送信する機能を有しており、前記ハートビート信号の共用ディスク制御装置102への送信指示を受信した場合に、当該ハートビート信号の送信先を変更して共用ディスク制御装置102へ送信する処理を行うものとする。
【0057】
また本実施形態における共用ディスク制御装置102を使用したハートビートは、現用系と予備系とが排他制御された共用ディスク上で特定のデータを読み書きすることでハートビート動作を行うものでは無く、共用ディスク側が現用系からハートビート信号を受信して共用ディスク側で障害の検知を行うものであるので、ディスクの読み書きの為の排他制御によりI/O時間がかかるという問題は生じない。
【0058】
そしてステップ803では、通信装置227を介して現用系コンピュータ100からハートビート信号を受信しているかどうかを調べ、ハートビート信号の途絶、即ち現用系コンピュータ100での障害発生を検知した場合にはステップ804へ進む。
【0059】
ステップ804では、現用系コンピュータ100から予備系コンピュータ101への系切り替え指示を通信装置227経由で現用系コンピュータ100へ送信する。そしてステップ805では、前記系切り替え指示に対する処理が完了したことを示す応答を通信装置227経由で現用系コンピュータ100から受信しているかどうかを調べ、前記完了応答が無い場合にはステップ806へ進む。
【0060】
ステップ806で強制解放処理部612は、共用ディスク制御装置102内に格納されているアクセス制御情報を変更することにより、現用系コンピュータ100の共用ディスクへのアクセス権を解放し、予備系コンピュータ101へアクセス権を付与する。
【0061】
そしてステップ807では、現用系コンピュータ100の共用ディスクへのアクセス権が解放され、予備系コンピュータ101へアクセス権が付与されたことを示す通知を通信装置227経由で予備系コンピュータ101へ送信する。
【0062】
図7のステップ703で予備系コンピュータ101の監視要求処理部601は、予備系コンピュータ101へアクセス権が付与されたことを示す通知を通信装置207経由で共用ディスク制御装置102から受信しているかどうかを調べ、前記通知を受信している場合にはステップ704へ進む。
ステップ704でプログラム実行処理部602は、共用ディスク制御装置102での監視により予備系コンピュータ101へ共用ディスクへのアクセス権が付与されたことを前記通知によって検知し、現用系コンピュータ100で行われていたプログラム処理を引き継ぐ処理を行う。
【0063】
以上説明した様に本実施形態のコンピュータ処理システムによれば、現用系コンピュータから予備系コンピュータへのハートビート信号が途絶した場合に、現用系コンピュータから共用記憶制御装置へハートビート信号を送信するので、現用系コンピュータから予備系コンピュータへのハートビート信号を送信する監視パスに障害が発生した場合でも現用系コンピュータの監視を続行することが可能である。
【0064】
(実施形態3)
以下に現用系コンピュータから予備系コンピュータへのハートビート信号が途絶した場合に、現用系コンピュータからネットワーク制御装置へハートビート信号を送信する実施形態3のコンピュータ処理システムについて説明する。
【0065】
図9は本実施形態のコンピュータ処理システムの処理概要を示す図である。図9に示す様に本実施形態のコンピュータ処理システムでは、▲1▼監視パス遮断によるハートビートの途絶が発生すると、▲2▼ハートビートの途絶を検知した予備系がネットワーク制御装置900(ネットワークスイッチ、ネットワークルータ、ネットワークブリッジ、計算機、情報処理装置、若しくは、その様な処理を実施するプログラムやオブジェクトでも良い)に対して現用系の監視を要求し、▲3▼予備系から要求を受けたネットワーク機器が現用系に対し、監視開始を指示して、ネットワーク機器を使用したハートビートが開始される。その後、▲4▼現用系にてオペレーティングシステム障害が発生し、クラスタ制御プログラムによる障害検知が不可となると、▲5▼ハートビート途絶により、ネットワーク制御装置900が現用系の障害を検知し、▲6▼現用系の障害検知により、ネットワーク制御装置900が強制的な共有ディスクのアクセス権の解放を指示する。そして▲7▼ネットワーク制御装置900が予備系に現用系の障害を通知し、▲8▼予備系クラスタ制御プログラムが現用系の障害を検知して、▲9▼予備系が新たに現用系となるためにディスクに対してアクセス権を要求する。
【0066】
図10は本実施形態の予備系コンピュータ101、ネットワーク制御装置900及び共用ディスク制御装置102の概略構成を示す図である。図10に示す様に本実施形態の予備系コンピュータ101は、監視要求処理部1001と、プログラム実行処理部1002とを有している。
【0067】
監視要求処理部1001は、前記ハートビート信号の途絶を検知した場合に現用系コンピュータ100の監視要求をネットワーク制御装置900へ送信する処理部である。プログラム実行処理部1002は、共用ディスク制御装置102により予備系コンピュータ101へアクセス権が付与された場合に、現用系コンピュータ100で行われていたプログラム処理を引き継ぐ処理部である。
【0068】
予備系コンピュータ101を監視要求処理部1001及びプログラム実行処理部1002として機能させる為のプログラムは、CD−ROM等の記録媒体に記録され磁気ディスク等に格納された後、メモリにロードされて実行されるものとする。なお前記プログラムを記録する記録媒体はCD−ROM以外の他の記録媒体でも良い。また前記プログラムを当該記録媒体から情報処理装置にインストールして使用しても良いし、ネットワークを通じて当該記録媒体にアクセスして前記プログラムを使用するものとしても良い。
【0069】
ネットワーク制御装置900は、CPU1011と、メモリ1012と、共用メモリ1013と、入力装置1014と、出力装置1015と、ROM装置1016と、通信装置1017とを有している。
【0070】
CPU1011は、ネットワーク制御装置900全体の動作を制御する装置である。メモリ1012は、ネットワーク制御装置900全体の動作を制御する際にその為の各種処理プログラムやデータをロードする記憶装置である。
【0071】
共用メモリ1013は、現用系コンピュータ100から送信されたハートビート信号を格納する記憶装置である。入力装置1014は、現用系の監視する為の各種入力を行う装置である。出力装置1015は、現用系の監視に伴う各種出力を行う装置である。
【0072】
ROM装置1016は、前記各種処理プログラムを記録した不揮発性の記憶装置である。通信装置1017は、インターネットやイントラネット等のネットワークを介して他の処理装置との通信を行う装置である。
【0073】
またネットワーク制御装置900は、ハートビート送信指示処理部1021と、強制解放指示処理部1022とを有している。
ハートビート送信指示処理部1021は、前記監視要求を予備系コンピュータ101から受信した場合に、前記ハートビート信号のネットワーク制御装置900への送信を現用系コンピュータ100へ指示する処理部である。
強制解放指示処理部1022は、前記ハートビート信号の途絶を検知した場合に、現用系コンピュータ100の共用ディスクへのアクセス権の解放を共用ディスク制御装置102へ指示する処理部である。
【0074】
ネットワーク制御装置900をハートビート送信指示処理部1021及び強制解放指示処理部1022として機能させる為のプログラムは、CD−ROM等の記録媒体に記録され磁気ディスク等に格納された後、メモリにロードされて実行されるものとする。なお前記プログラムを記録する記録媒体はCD−ROM以外の他の記録媒体でも良い。また前記プログラムを当該記録媒体から情報処理装置にインストールして使用しても良いし、ネットワークを通じて当該記録媒体にアクセスして前記プログラムを使用するものとしても良い。
【0075】
共用ディスク制御装置102は強制解放処理部1031を有している。強制解放処理部1031は、前記強制解放指示をネットワーク制御装置900から受信した場合に、現用系コンピュータ100の共用ディスクへのアクセス権を解放し、予備系コンピュータ101へアクセス権を付与する処理部である。
【0076】
共用ディスク制御装置102を強制解放処理部1031として機能させる為のプログラムは、CD−ROM等の記録媒体に記録され磁気ディスク等に格納された後、メモリにロードされて実行されるものとする。なお前記プログラムを記録する記録媒体はCD−ROM以外の他の記録媒体でも良い。また前記プログラムを当該記録媒体から情報処理装置にインストールして使用しても良いし、ネットワークを通じて当該記録媒体にアクセスして前記プログラムを使用するものとしても良い。
【0077】
図11は本実施形態の予備系コンピュータ101の処理手順を示すフローチャートである。図11に示す様にステップ1101で予備系コンピュータ101の監視要求処理部1001は、通信装置207を介して現用系コンピュータ100からハートビート信号を受信しているかどうかを調べ、ハートビート信号の途絶、即ち現用系コンピュータ100での障害発生を検知した場合にはステップ1102へ進む。
ステップ1102では、現用系コンピュータ100の監視要求を通信装置207経由でネットワーク制御装置900へ送信する。
【0078】
図12は本実施形態のネットワーク制御装置900の処理手順を示すフローチャートである。図12に示す様にステップ1201でネットワーク制御装置900のハートビート送信指示処理部1021は、現用系コンピュータ100の監視要求を通信装置1017経由で予備系コンピュータ101から受信しているかどうかを調べ、前記監視要求を受信している場合にはステップ1202へ進む。
【0079】
ステップ1202では、現用系コンピュータ100が正常に動作中であることを示すハートビート信号のネットワーク制御装置900への送信を通信装置1017経由で現用系コンピュータ100へ指示する。
【0080】
本実施形態の現用系コンピュータ100は、現用系コンピュータ100が正常に動作中であることを示すハートビート信号を予備系コンピュータ101またはネットワーク制御装置900へ送信する機能を有しており、前記ハートビート信号のネットワーク制御装置900への送信指示を受信した場合に、当該ハートビート信号の送信先を変更してネットワーク制御装置900へ送信する処理を行うものとする。
【0081】
また本実施形態におけるネットワーク制御装置900を使用したハートビートは、現用系と予備系とが排他制御された共用ディスク上で特定のデータを読み書きすることでハートビート動作を行うものでは無く、ネットワーク制御装置900の共用メモリ1013上で現用系からハートビート信号を受信してネットワーク側で障害の検知を行うものであるので、ディスクの読み書きの為の排他制御によりI/O時間がかかるという問題は生じない。
【0082】
そしてステップ1203では、通信装置1017を介して現用系コンピュータ100からハートビート信号を受信しているかどうかを調べ、ハートビート信号の途絶、即ち現用系コンピュータ100での障害発生を検知した場合にはステップ1204へ進む。
【0083】
ステップ1204では、現用系コンピュータ100から予備系コンピュータ101への系切り替え指示を通信装置1017経由で現用系コンピュータ100へ送信する。そしてステップ1205では、前記系切り替え指示に対する処理が完了したことを示す応答を通信装置1017経由で現用系コンピュータ100から受信しているかどうかを調べ、前記完了応答が無い場合にはステップ1206へ進む。
【0084】
ステップ1206で強制解放指示処理部1022は、現用系コンピュータ100の共用ディスクへのアクセス権の解放を通信装置1017経由で共用ディスク制御装置102へ指示する。
【0085】
図13は本実施形態の共用ディスク制御装置102の処理手順を示すフローチャートである。図13に示す様にステップ1301で共用ディスク制御装置102の強制解放処理部1031は、現用系コンピュータ100の共用ディスクへのアクセス権の強制解放指示を通信装置227経由でネットワーク制御装置900から受信しているかどうかを調べ、前記強制解放指示を受信している場合にはステップ1302へ進む。
【0086】
ステップ1302では、共用ディスク制御装置102内に格納されているアクセス制御情報を変更することにより、現用系コンピュータ100の共用ディスクへのアクセス権を解放し、予備系コンピュータ101へアクセス権を付与する。
【0087】
そしてステップ1303では、現用系コンピュータ100の共用ディスクへのアクセス権が解放され、予備系コンピュータ101へアクセス権が付与されたことを示す通知を通信装置227経由でネットワーク制御装置900へ送信する。
【0088】
図12のステップ1207でネットワーク制御装置900の強制解放指示処理部1022は、前記通知を通信装置1017経由でネットワーク制御装置900受信し、現用系コンピュータ100の共用ディスクへのアクセス権が解放され、予備系コンピュータ101へアクセス権が付与されたことを示す通知を通信装置1017経由で予備系コンピュータ101へ送信する。
【0089】
図11のステップ1103で予備系コンピュータ101の監視要求処理部1001は、予備系コンピュータ101へアクセス権が付与されたことを示す通知を通信装置207経由でネットワーク制御装置900から受信しているかどうかを調べ、前記通知を受信している場合にはステップ1104へ進む。
【0090】
ステップ1104でプログラム実行処理部1002は、ネットワーク制御装置900での監視により予備系コンピュータ101へ共用ディスクへのアクセス権が付与されたことを検知し、現用系コンピュータ100で行われていたプログラム処理を引き継ぐ処理を行う。
【0091】
以上説明した様に本実施形態のコンピュータ処理システムによれば、現用系コンピュータから予備系コンピュータへのハートビート信号が途絶した場合に、現用系コンピュータからネットワーク制御装置へハートビート信号を送信するので、現用系コンピュータから予備系コンピュータへのハートビート信号を送信する監視パスに障害が発生した場合でも現用系コンピュータの監視を続行することが可能である。
【0092】
【発明の効果】
本発明によれば現用系コンピュータからの系切り替えが行えない場合であっても共用装置へのアクセス権の解放を行うことが可能である。
【図面の簡単な説明】
【図1】実施形態1のコンピュータ処理システムの処理概要を示す図である。
【図2】実施形態1の予備系コンピュータ101及び共用ディスク制御装置102の概略構成を示す図である。
【図3】実施形態1の予備系コンピュータ101の処理手順を示すフローチャートである。
【図4】実施形態1の共用ディスク制御装置102の処理手順を示すフローチャートである。
【図5】実施形態2のコンピュータ処理システムの処理概要を示す図である。
【図6】実施形態2の予備系コンピュータ101及び共用ディスク制御装置102の概略構成を示す図である。
【図7】実施形態2の予備系コンピュータ101の処理手順を示すフローチャートである。
【図8】実施形態2の共用ディスク制御装置102の処理手順を示すフローチャートである。
【図9】実施形態3のコンピュータ処理システムの処理概要を示す図である。
【図10】実施形態3の予備系コンピュータ101、ネットワーク制御装置900及び共用ディスク制御装置102の概略構成を示す図である。
【図11】実施形態3の予備系コンピュータ101の処理手順を示すフローチャートである。
【図12】実施形態3のネットワーク制御装置900の処理手順を示すフローチャートである。
【図13】実施形態3の共用ディスク制御装置102の処理手順を示すフローチャートである。
【符号の説明】
100…現用系コンピュータ、101…予備系コンピュータ、102…共用ディスク制御装置、201…CPU、202…メモリ、203…磁気ディスク装置、204…入力装置、205…出力装置、206…CD−ROM装置、207…通信装置、211…系切り替え指示処理部、212…プログラム実行処理部、221…CPU、222…メモリ、223…共用ディスク装置、224…入力装置、225…出力装置、226…CD−ROM装置、227…通信装置、231…問い合わせ処理部、232…強制解放処理部、601…監視要求処理部、602…プログラム実行処理部、611…ハートビート送信指示処理部、612…強制解放処理部、900…ネットワーク制御装置、1001…監視要求処理部、1002…プログラム実行処理部、1011…CPU、1012…メモリ、1013…共用メモリ、1014…入力装置、1015…出力装置、1016…ROM装置、1017…通信装置、1021…ハートビート送信指示処理部、1022…強制解放指示処理部、1031…強制解放処理部。

Claims (10)

  1. 現用系コンピュータでの障害発生を検知した場合に現用系コンピュータから予備系コンピュータへの系切り替えを共用記憶制御手段へ指示するステップと、
    前記系切り替え指示を予備系コンピュータから受信した場合に、現用系コンピュータが正常に動作中であるかどうかを共用記憶制御手段から現用系コンピュータへ問い合わせるステップと、
    前記問い合わせの結果、現用系コンピュータが正常に動作していないことが検知された場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与するステップと、
    前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を予備系コンピュータで引き継ぐステップとを有することを特徴とするコンピュータ処理方法。
  2. 現用系コンピュータが正常に動作中であることを示すハートビート信号を現用系コンピュータから予備系コンピュータへ送信するステップと、
    前記ハートビート信号が無いことを予備系コンピュータで検知した場合に現用系コンピュータの監視要求を共用記憶制御手段へ送信するステップと、
    前記監視要求を予備系コンピュータから受信した場合に、前記ハートビート信号の共用記憶制御手段への送信を現用系コンピュータへ指示するステップと、
    前記送信指示を共用記憶制御手段から受信した場合に、前記ハートビート信号を現用系コンピュータから共用記憶制御手段へ送信するステップと、
    前記ハートビート信号が無いことを共用記憶制御手段で検知した場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与するステップと、
    前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を予備系コンピュータで引き継ぐステップとを有することを特徴とするコンピュータ処理方法。
  3. 現用系コンピュータが正常に動作中であることを示すハートビート信号を現用系コンピュータから予備系コンピュータへ送信するステップと、
    前記ハートビート信号が無いことを予備系コンピュータで検知した場合に現用系コンピュータの監視要求をネットワーク制御手段へ送信するステップと、
    前記監視要求を予備系コンピュータから受信した場合に、前記ハートビート信号のネットワーク制御手段への送信を現用系コンピュータへ指示するステップと、
    前記送信指示をネットワーク制御手段から受信した場合に、前記ハートビート信号を現用系コンピュータからネットワーク制御手段へ送信するステップと、
    前記ハートビート信号が無いことをネットワーク制御手段で検知した場合に、現用系コンピュータの共用記憶手段へのアクセス権の解放をネットワーク制御手段から共用記憶制御手段へ指示するステップと、
    前記解放指示をネットワーク制御手段から受信した場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与するステップと、
    前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を予備系コンピュータで引き継ぐステップとを有することを特徴とするコンピュータ処理方法。
  4. 前記現用系コンピュータから予備系コンピュータへのハートビート信号の送信が無い場合に、現用系コンピュータから予備系コンピュータへの通信を共用記憶制御手段またはネットワーク制御手段経由で行うことを特徴とする請求項2または請求項3のいずれかに記載されたコンピュータ処理方法。
  5. 現用系コンピュータでの障害発生を検知した場合に現用系コンピュータから予備系コンピュータへの系切り替えを共用記憶制御手段へ指示する系切り替え指示処理部と、前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を引き継ぐプログラム実行処理部とを備える予備系コンピュータと、
    前記系切り替え指示を予備系コンピュータから受信した場合に、現用系コンピュータが正常に動作中であるかどうかを現用系コンピュータへ問い合わせる問い合わせ処理部と、前記問い合わせの結果、現用系コンピュータが正常に動作していないことが検知された場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与する解放処理部とを備える共用記憶制御手段とを具備することを特徴とするコンピュータ処理システム。
  6. 現用系コンピュータが正常に動作中であることを示すハートビート信号を予備系コンピュータへ送信し、前記ハートビート信号の共用記憶制御手段への送信指示を受信した場合に、当該ハートビート信号を共用記憶制御手段へ送信するハートビート送信処理部を備える現用系コンピュータと、
    前記ハートビート信号が無いことを検知した場合に現用系コンピュータの監視要求を共用記憶制御手段へ送信する監視要求処理部と、前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を引き継ぐプログラム実行処理部とを備える予備系コンピュータと、
    前記監視要求を予備系コンピュータから受信した場合に、前記ハートビート信号の共用記憶制御手段への送信を現用系コンピュータへ指示するハートビート送信指示処理部と、前記ハートビート信号が無いことを検知した場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与する解放処理部とを備える共用記憶制御手段とを具備することを特徴とするコンピュータ処理システム。
  7. 現用系コンピュータが正常に動作中であることを示すハートビート信号を予備系コンピュータへ送信し、前記ハートビート信号のネットワーク制御手段への送信指示を受信した場合に、当該ハートビート信号をネットワーク制御手段へ送信するハートビート送信処理部を備える現用系コンピュータと、
    前記ハートビート信号が無いことを検知した場合に現用系コンピュータの監視要求をネットワーク制御手段へ送信する監視要求処理部と、共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を引き継ぐプログラム実行処理部とを備える予備系コンピュータと、
    前記監視要求を予備系コンピュータから受信した場合に、前記ハートビート信号のネットワーク制御手段への送信を現用系コンピュータへ指示するハートビート送信指示処理部と、前記ハートビート信号が無いことを検知した場合に、現用系コンピュータの共用記憶手段へのアクセス権の解放を共用記憶制御手段へ指示する解放指示処理部とを備えるネットワーク制御手段と、
    前記解放指示をネットワーク制御手段から受信した場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与する解放処理部を備える共用記憶制御手段とを具備することを特徴とするコンピュータ処理システム。
  8. 現用系コンピュータでの障害発生を検知した場合に現用系コンピュータから予備系コンピュータへの系切り替えを共用記憶制御手段へ指示する系切り替え指示処理部と、前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を引き継ぐプログラム実行処理部とを備える予備系コンピュータと、
    前記系切り替え指示を予備系コンピュータから受信した場合に、現用系コンピュータが正常に動作中であるかどうかを現用系コンピュータへ問い合わせる問い合わせ処理部と、前記問い合わせの結果、現用系コンピュータが正常に動作していないことが検知された場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与する解放処理部とを備える共用記憶制御手段としてコンピュータを機能させることを特徴とするプログラム。
  9. 現用系コンピュータが正常に動作中であることを示すハートビート信号を予備系コンピュータへ送信し、前記ハートビート信号の共用記憶制御手段への送信指示を受信した場合に、当該ハートビート信号を共用記憶制御手段へ送信するハートビート送信処理部を備える現用系コンピュータと、
    前記ハートビート信号が無いことを検知した場合に現用系コンピュータの監視要求を共用記憶制御手段へ送信する監視要求処理部と、前記共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を引き継ぐプログラム実行処理部とを備える予備系コンピュータと、
    前記監視要求を予備系コンピュータから受信した場合に、前記ハートビート信号の共用記憶制御手段への送信を現用系コンピュータへ指示するハートビート送信指示処理部と、前記ハートビート信号が無いことを検知した場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与する解放処理部とを備える共用記憶制御手段としてコンピュータを機能させることを特徴とするプログラム。
  10. 現用系コンピュータが正常に動作中であることを示すハートビート信号を予備系コンピュータへ送信し、前記ハートビート信号のネットワーク制御手段への送信指示を受信した場合に、当該ハートビート信号をネットワーク制御手段へ送信するハートビート送信処理部を備える現用系コンピュータと、
    前記ハートビート信号が無いことを検知した場合に現用系コンピュータの監視要求をネットワーク制御手段へ送信する監視要求処理部と、共用記憶制御手段により予備系コンピュータへアクセス権が付与された場合に、現用系コンピュータで実行されていた処理を引き継ぐプログラム実行処理部とを備える予備系コンピュータと、
    前記監視要求を予備系コンピュータから受信した場合に、前記ハートビート信号のネットワーク制御手段への送信を現用系コンピュータへ指示するハートビート送信指示処理部と、前記ハートビート信号が無いことを検知した場合に、現用系コンピュータの共用記憶手段へのアクセス権の解放を共用記憶制御手段へ指示する解放指示処理部とを備えるネットワーク制御手段と、
    前記解放指示をネットワーク制御手段から受信した場合に、現用系コンピュータの共用記憶手段へのアクセス権を解放し、前記予備系コンピュータへアクセス権を付与する解放処理部を備える共用記憶制御手段としてコンピュータを機能させることを特徴とするプログラム。
JP2003092248A 2003-03-28 2003-03-28 コンピュータ処理方法及びその実施システム並びにその処理プログラム Expired - Fee Related JP4155399B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003092248A JP4155399B2 (ja) 2003-03-28 2003-03-28 コンピュータ処理方法及びその実施システム並びにその処理プログラム
US10/745,622 US7032128B2 (en) 2003-03-28 2003-12-29 Method for managing computer, apparatus for managing computer, and computer readable medium storing program for managing computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003092248A JP4155399B2 (ja) 2003-03-28 2003-03-28 コンピュータ処理方法及びその実施システム並びにその処理プログラム

Publications (2)

Publication Number Publication Date
JP2004302632A true JP2004302632A (ja) 2004-10-28
JP4155399B2 JP4155399B2 (ja) 2008-09-24

Family

ID=33127309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003092248A Expired - Fee Related JP4155399B2 (ja) 2003-03-28 2003-03-28 コンピュータ処理方法及びその実施システム並びにその処理プログラム

Country Status (2)

Country Link
US (1) US7032128B2 (ja)
JP (1) JP4155399B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282326A (ja) * 2009-06-03 2010-12-16 Nec Corp 情報処理システム、情報処理システムの障害対応機構、及び情報処理システムの障害対応方法
JP2013092956A (ja) * 2011-10-27 2013-05-16 Hitachi Ltd 計算機システムおよび計算機システムの情報保存方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7739543B1 (en) * 2003-04-23 2010-06-15 Netapp, Inc. System and method for transport-level failover for loosely coupled iSCSI target devices
US7251743B2 (en) * 2003-11-20 2007-07-31 International Business Machines Corporation Method, system, and program for transmitting input/output requests from a primary controller to a secondary controller
JP4404751B2 (ja) * 2004-11-16 2010-01-27 富士通株式会社 情報処理システム,ストレージ装置,ストレージ制御プログラム,及びストレージ制御プログラムを記録したコンピュータ読取可能な記録媒体
JP4117684B2 (ja) * 2004-12-20 2008-07-16 日本電気株式会社 フォルトトレラント・二重化コンピュータシステムとその制御方法
JP2006189963A (ja) * 2004-12-28 2006-07-20 Hitachi Ltd ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム
US7519851B2 (en) * 2005-02-08 2009-04-14 Hitachi, Ltd. Apparatus for replicating volumes between heterogenous storage systems
JP4414961B2 (ja) * 2005-12-13 2010-02-17 株式会社日立製作所 管理サーバによる管理方法、管理サーバ、計算機システムおよび管理プログラム
WO2007077585A1 (en) * 2005-12-30 2007-07-12 Elettrodata S.P.A. Computer system comprising at least two servers and method of operation
JP4839841B2 (ja) * 2006-01-04 2011-12-21 株式会社日立製作所 スナップショット再起動方法
CN102270160B (zh) * 2010-06-03 2016-09-07 纬创资通股份有限公司 数据写入方法与计算机系统
US20140164641A1 (en) * 2012-12-11 2014-06-12 The Hong Kong University Of Science And Technology Congestion control for data center traffic
US10169175B2 (en) * 2015-04-30 2019-01-01 Ge Aviation Systems Llc Providing failover control on a control system
US9665163B2 (en) * 2015-05-06 2017-05-30 Vmware, Inc. Distributed power management with partial suspend mode for distributed storage systems
US9645636B2 (en) 2015-05-06 2017-05-09 Vmware, Inc. Centralized power management with partial suspend mode for distributed storage systems
US10868754B2 (en) * 2016-01-27 2020-12-15 Nebbiolo Technologies Inc. High availability input/output management nodes
WO2017165701A1 (en) 2016-03-25 2017-09-28 Nebbiolo Technologies, Inc. Fog Computing Facilitated Flexible Factory
US10798063B2 (en) 2016-10-21 2020-10-06 Nebbiolo Technologies, Inc. Enterprise grade security for integrating multiple domains with a public cloud
US10979368B2 (en) 2017-08-02 2021-04-13 Nebbiolo Technologies, Inc. Architecture for converged industrial control and real time applications

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544077A (en) 1994-01-19 1996-08-06 International Business Machines Corporation High availability data processing system and method using finite state machines
US5696895A (en) 1995-05-19 1997-12-09 Compaq Computer Corporation Fault tolerant multiple network servers
US5675723A (en) * 1995-05-19 1997-10-07 Compaq Computer Corporation Multi-server fault tolerance using in-band signalling
KR100323255B1 (ko) * 1996-06-20 2002-03-08 아끼구사 나오유끼 업무인계시스템
JP2830857B2 (ja) 1996-09-09 1998-12-02 三菱電機株式会社 データストレージシステム及びデータストレージ管理方法
JP3537281B2 (ja) 1997-01-17 2004-06-14 株式会社日立製作所 共有ディスク型多重系システム
US6438705B1 (en) * 1999-01-29 2002-08-20 International Business Machines Corporation Method and apparatus for building and managing multi-clustered computer systems
US6532494B1 (en) * 1999-05-28 2003-03-11 Oracle International Corporation Closed-loop node membership monitor for network clusters
JP2001014256A (ja) 1999-06-30 2001-01-19 Mitsubishi Electric Corp 共有ディスク装置を有する計算機システム
US6625750B1 (en) 1999-11-16 2003-09-23 Emc Corporation Hardware and software failover services for a file server
US6662219B1 (en) * 1999-12-15 2003-12-09 Microsoft Corporation System for determining at subgroup of nodes relative weight to represent cluster by obtaining exclusive possession of quorum resource
US6594786B1 (en) * 2000-01-31 2003-07-15 Hewlett-Packard Development Company, Lp Fault tolerant high availability meter
US6804703B1 (en) * 2000-06-22 2004-10-12 International Business Machines Corporation System and method for establishing persistent reserves to nonvolatile storage in a clustered computer environment
DE10030329C1 (de) * 2000-06-27 2002-01-24 Siemens Ag Redundantes Steuerungssystem sowie Steuerrechner und Peripherieeinheit für ein derartiges Steuerungssystem
US6728896B1 (en) 2000-08-31 2004-04-27 Unisys Corporation Failover method of a simulated operating system in a clustered computing environment
US6715098B2 (en) * 2001-02-23 2004-03-30 Falconstor, Inc. System and method for fibrechannel fail-over through port spoofing
US6748550B2 (en) 2001-06-07 2004-06-08 International Business Machines Corporation Apparatus and method for building metadata using a heartbeat of a clustered system
US6874103B2 (en) 2001-11-13 2005-03-29 Hewlett-Packard Development Company, L.P. Adapter-based recovery server option
JP4107083B2 (ja) 2002-12-27 2008-06-25 株式会社日立製作所 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282326A (ja) * 2009-06-03 2010-12-16 Nec Corp 情報処理システム、情報処理システムの障害対応機構、及び情報処理システムの障害対応方法
JP2013092956A (ja) * 2011-10-27 2013-05-16 Hitachi Ltd 計算機システムおよび計算機システムの情報保存方法

Also Published As

Publication number Publication date
US20040205388A1 (en) 2004-10-14
JP4155399B2 (ja) 2008-09-24
US7032128B2 (en) 2006-04-18

Similar Documents

Publication Publication Date Title
JP4155399B2 (ja) コンピュータ処理方法及びその実施システム並びにその処理プログラム
US7418627B2 (en) Cluster system wherein failover reset signals are sent from nodes according to their priority
US9582373B2 (en) Methods and systems to hot-swap a virtual machine
KR920003497B1 (ko) 억세스 손실 처리용 시스템 및 그 보호방법
US7467322B2 (en) Failover method in a cluster computer system
KR20030067712A (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
JP2005148922A (ja) フェイルオーバクラスタシステム及びフェイルオーバクラスタシステムを用いたプログラムのインストール方法
JP6130520B2 (ja) 多重系システムおよび多重系システム管理方法
JP2005242404A (ja) コンピュータシステムの系切替方法
JP5287974B2 (ja) 演算処理システム、再同期方法、およびファームプログラム
JP2011076344A (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
JP2008250427A (ja) 情報処理システムに用いられるバージョンアップ装置及び該装置を備えた情報処理システム並びに情報処理システムをバージョンアップするためのプログラム
JP4439235B2 (ja) 動作試験装置および動作試験方法
JP2004102852A (ja) ホットスタンバイ計算機システム
JP6109404B2 (ja) 計算機装置及び計算機機構
JP2008204011A (ja) マルチスレッドシステム、スレッド動作異常検知方法
JP5791524B2 (ja) Os動作装置及びos動作プログラム
JPH0728544A (ja) コンピュータシステム
JPH0534877B2 (ja)
JP2012003302A (ja) ゲストos制御システム
JPH0764811A (ja) コンピュータバックアップシステム
JP2004005113A (ja) 複数の実計算機上で動作する仮想計算機システム及びその制御方法
WO2017114170A1 (zh) 实时计算任务控制方法、装置及应用其的实时计算系统
JP2022152921A (ja) コントローラ及び制御方法
JPH06266478A (ja) 計算機システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080701

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees