JP2000227839A - クラスタシステム及びその障害回復方法 - Google Patents

クラスタシステム及びその障害回復方法

Info

Publication number
JP2000227839A
JP2000227839A JP11028102A JP2810299A JP2000227839A JP 2000227839 A JP2000227839 A JP 2000227839A JP 11028102 A JP11028102 A JP 11028102A JP 2810299 A JP2810299 A JP 2810299A JP 2000227839 A JP2000227839 A JP 2000227839A
Authority
JP
Japan
Prior art keywords
power supply
shared disk
disk
power
shared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP11028102A
Other languages
English (en)
Inventor
Toshio Matsumoto
利夫 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP11028102A priority Critical patent/JP2000227839A/ja
Publication of JP2000227839A publication Critical patent/JP2000227839A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Power Sources (AREA)

Abstract

(57)【要約】 【課題】 共有ディスクが故障して障害が発生したと
き、その障害ディスクを独立にON/OFFできるよう
にすることにより、他で使っているディスクに影響を与
えることなく、しかも多くの人手と時間をかけることな
く容易にかつ短時間で、障害ディスクを復旧させて処理
再開を実現することができる。 【解決手段】 クラスタシステムは、共有ディスク7a
〜7nに電源を供給する電源供給手段9と、電源供給手
段9と共有ディスク7a〜7nの間に配置され、かつ電
源供給手段9から供給された電源を共有ディスク7a〜
7nに対して投入・切断する電源供給開閉手段12と、
共有ディスク7a〜7nに障害が発生したときに、電源
供給開閉手段12に対して電源の投入・切断を指示する
クラスタマネージャ2a〜2nとを有するように構成す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、クラスタシステム
及びその障害回復方法に係り、詳しくは、共有ディスク
が故障して障害が発生したとき、その障害ディスクを独
立にON/OFFできるようにすることにより、他で使
っているディスクに影響を与えることなく、しかも多く
の人手と時間をかけることなく容易にかつ短時間で、障
害ディスクを復旧させて処理再開を実現することができ
るクラスタシステム及びその障害回復方法に関する。
【0002】
【従来の技術】図7は従来の一般的なクラスタシステム
の構成を示す図である。図7において、101a〜10
1nはクラスタマネージャ102a〜102nをそれぞ
れ有する複数個のノードであり、ノード101a〜10
1nには、OSなどを格納するローカルディスク103
a〜103nがそれぞれ接続されている。104は各ク
ラスタマネージャ102a〜102nを繋ぐノード間通
信路であり、105a〜105nはLAN106を介し
てノード101a〜101nに接続された複数個のクラ
イアントである。
【0003】107a〜107nはSCSIバス108
を介してノード101a〜101nに接続されるととも
に、各ノード101a〜101nから共有して使われる
プログラム、データなどが格納された共有ディスクであ
る。共有ディスク107a〜107nのうちのどれかの
ディスクに障害が発生すると、その障害ディスクを切り
離すため、その障害ディスクに関連する処理が行えなく
なってしまう。このため、障害ディスクをシステムから
切り離し、新しいディスクに交換した後にバックアップ
してあったデータからデータ復旧を行い、システムに再
び組み込んでいた。
【0004】次に、デバイス(ディスク)に障害が発生
したときに、そのデバイスを独立にON/OFFさせる
ことにより、障害デバイスを復旧させる情報処理装置に
ついては、例えば特開平4−333908号公報で報告
されたものが挙げられる。以下に、図面を参照して説明
する。
【0005】図8は従来の情報処理装置の構成を示す図
である。図8において、201a〜201nは複数のデ
バイスであり、202は複数のデバイス201a〜20
1nを制御するデバイス制御手段であり、203は各デ
バイス201a〜201nに電源を供給する電源供給手
段である。204a〜204nはデバイス201a〜2
01nの電源供給路にそれぞれ挿入された電源供給路開
閉手段であり、205は指定されたデバイス201a〜
201nの電源供給路に挿入の電源供給路開閉手段20
4a〜204nを開閉制御するデバイス初期化手段であ
る。
【0006】206はデバイス201a〜201nの障
害発生を検知する障害発生検知手段であり、207は障
害の発生が検知されたデバイス201a〜201nを初
期化の対象として指定する初期化デバイス指定手段であ
る。この従来の情報処理装置では、単一ノードを対象に
したときだけを考慮したものであり、故障した場合は、
電源供給開閉手段204a〜204nにより、独立に電
源を供給しているラインをOFFした後、ONして使え
るようになったときに使用する。
【0007】
【発明が解決しようとする課題】上記した図7に示す従
来のクラスタシステムでは、共有ディスクアクセス障害
発生時には他のノードからアクセスできれば、他のノー
ドに処理をテイクオーバするが、他のノードからもアク
セスできないことが多く、その場合、障害共有ディスク
をシステムから切離し、外部に通知してCEが障害復旧
処置を行っていたので、処理再開までに多くの人手と時
間がかかってしまうとう問題があった。
【0008】次に、上記した図8に示す従来の情報処理
装置では、単一ノードを対象にしたときだけを考慮した
ものであるが、クラスタシステムにおける共有ディスク
においては、従来の単一ノードのシステムとは異なり、
複数のノードからディスクが共有されており、あるノー
ドからのアクセス障害発生時にディスクの電源OFF/
ONをする場合は、同時に利用している他のノードの処
理に関しても考慮しなければならない。このため、単純
にディスクの電源OFF/ONを行う上記した従来の単
一ノードのやりかたでは、クラスタシステムに単純に適
用できないという問題があった。
【0009】そこで、本発明は、共有ディスクが故障し
て障害が発生したとき、その障害ディスクを独立にON
/OFFできるようにすることにより、他で使っている
ディスクに影響を与えることなく、しかも多くの人手と
時間をかけることなく容易にかつ短時間で、障害ディス
クを復旧させて処理再開を実現することができるクラス
タシステム及びその障害回復方法を提供することを目的
とする。
【0010】
【課題を解決するための手段】本発明に係るクラスタシ
ステムは、複数のノードから共有してアクセスする共有
ディスクを有するクラスタシステムにおいて、共有ディ
スクに電源を供給する電源供給手段と、電源供給手段と
共有ディスクの間に配置され、かつ電源供給手段から供
給された電源を共有ディスクに対して投入・切断する電
源供給開閉手段と、共有ディスクに障害が発生したとき
に、電源供給開閉手段に対して電源の投入・切断を指示
する電源供給制御手段とを有することを特徴とするもの
である。
【0011】上記クラスタシステムにおいて、電源供給
制御手段は、クラスタシステムを制御するクラスタマネ
ージャであることを特徴とするものである。
【0012】上記クラスタマネージャは、電源供給開閉
手段に接続されたノード間通信路を経由して電源供給開
閉手段に指示を行うことを特徴とするものである。
【0013】本発明に係るクラスタシステムは、複数の
ノードから共有してアクセスする共有ディスクを有する
クラスタシステムにおいて、各ノードとネットワーク接
続された共有ディスクと、共有ディスクに電源を供給す
る電源供給手段と、電源供給手段から供給された電源を
共有ディスクに対して投入・切断する電源供給開閉手段
とを有するディスクサブシステムと、共有ディスクに障
害が発生したときに、ネットワーク経由で電源供給開閉
手段に対して電源の投入・切断を指示するクラスタマネ
ージャとを有することを特徴とするものである。
【0014】本発明に係るクラスタシステムの障害回復
方法は、ノードから共有ディスクにアクセスしてその共
有ディスクに障害が発生した時に、障害が発生した障害
共有ディスクに関連する処理のシャットダウンを行うス
テップと、障害共有ディスクを使用している他のノード
の障害共有ディスクに関連する処理のシャットダウンを
行うステップと、電源供給制御手段から電源供給開閉手
段に対して電源の切断・投入を指示するステップと、電
源供給制御手段からの電源切断指示に基づいて、電源供
給開閉手段が障害共有ディスクの電源の切断を行うステ
ップと、電源供給制御手段からの電源投入指示に基づい
て、電源供給開閉手段が障害共有ディスクの電源の投入
を行うステップと、各ノードにおいて障害共有ディスク
に関連する障害発生前の処理を再起動するステップとを
含むことを特徴とするものである。
【0015】本発明に係るクラスタシステムの障害回復
方法は、ノードから共有ディスクにアクセスしてその共
有ディスクに障害が発生した時に、他のノードが障害が
発生した障害共有ディスクを使用していないかをチェッ
クするステップと、他のノードが障害共有ディスクを使
用していない場合のみに、障害共有ディスクに関連する
処理のシャットダウンを行うステップと、電源供給制御
手段から電源供給開閉手段に対して電源の切断・投入を
指示するステップと、電源供給制御手段からの電源切断
指示に基づいて、電源供給開閉手段が障害共有ディスク
の電源の切断を行うステップと、電源供給制御手段から
の電源投入指示に基づいて、電源供給開閉手段が障害共
有ディスクの電源の投入を行うステップと、各ノードに
おいて障害共有ディスクに関連する障害発生前の処理を
再起動するステップとを含むことを特徴とするものであ
る。
【0016】
【発明の実施の形態】以下に、本発明の実施の形態を図
面を参照して説明する。 実施の形態1.図1は本発明に係る実施の形態1のクラ
スタシステムの構成を示す図である。図1において、1
a〜1nはクラスタシステムを制御するクラスタマネー
ジャ2a〜2nをそれぞれ有する複数個のノードであ
り、ノード1a〜1nには、OSやそのノード1a〜1
nでしか使用しないS/Wやデータなどを格納するロー
カルディスク3a〜3nがそれぞれ接続されている。ま
た、ノード1a〜1nには、図示しないプロセッサ、メ
モリなども配置されている。4は各クラスタマネージャ
2a〜2nを繋ぐノード間通信路であり、5a〜5nは
LAN6を介してノード1a〜1nに接続された複数個
のクライアントである。
【0017】7a〜7nはSCSIバス8を介してノー
ド1a〜1nに接続されるとともに、各ノード1a〜1
nから共有して使われるプログラム、データ(データベ
ーステーブルなど)などが格納された共有ディスクであ
り、9は共有ディスク7a〜7nに電源を供給する電源
供給手段である。12は電源供給手段9と共有ディスク
7a〜7n間に配置され、電源供給手段9から供給され
た電源を各共有ディスク7a〜7nに対して独立に投入
・切断する電源供給開閉手段である。なお、ここでは、
SCSIバスを介して共有ディスク7a〜7nとノード
1a〜1nを接続するように構成したが、SCSIでな
くファイバチャネルやIEEE1394など他のI/F
で接続するように構成してもよい。
【0018】電源供給開閉手段12は、電源供給手段9
と共有ディスク7a〜7n間のラインを開閉する開閉ス
イッチ10a〜10nと、共有ディスク7a〜7nに障
害が発生したときに、クラスタマネージャ2a〜2nか
らの切断・投入指示を基に、開閉スイッチ10a〜10
nの開閉を制御する制御F/W11とから構成される。
制御F/W11は、クラスタマネージャ2a〜2nによ
り制御される。
【0019】各クラスタマネージャ2a〜2n間を繋ぐ
ノード間通信路4は、電源供給開閉手段12にも接続さ
れている。クラスタマネージャ2a〜2n間を繋ぐノー
ド間通信路4を電源供給開閉手段12に直接接続せず、
他のI/Fを介して接続するように構成してもよい。共
有ディスク7a〜7nのいずれかに障害が発生したとき
に、クラスタマネージャ2a〜2nは、ノード間通信路
4を介して電源供給開閉手段12に対して電源の投入・
切断の指示を行う。電源供給開閉手段12の制御S/W
11は、クラスタマネージャ2a〜2nからの指示にし
たがって、開閉スイッチ10a〜10nを制御して共有
ディスク7a〜7nへの電源の投入・切断を行う。
【0020】各ノード1a〜1nは、SCSI I/F
などを介して共有ディスク7a〜7nにアクセスする。
どれかのノード1a〜1nが故障したり、共有ディスク
アクセスが不能となった場合は、そのノード1a〜1n
で実行していたアプリケーションを他のノード1a〜1
nにテークオーバし、処理を引継ぐ。各ノード1a〜1
nで実行しているアプリケーションの管理やテイクオー
バ処理は、クラスタマネージャ2a〜2nが行う。クラ
スタマネージャ2a〜2nは、各ノード1a〜1nで動
作するS/Wであり(専用H/WとS/Wを組み合わせ
て構成してもよい)、互いに連携してクラスタシステム
全体の制御を行う。
【0021】次に、図2、3は図1に示すクラスタシス
テムの障害復旧処理フローを示すフローチャートであ
る。例えば、あるノード1bがある共有ディスク7bに
アクセスしようとしたときに、その共有ディスク7bが
アクセスできないと、そのノード1bのOSは、そのデ
ィスクエラーを障害としてクラスタマネージャ2bに上
げる(ステップS1)。
【0022】ノード1bのクラスタマネージャ2bは、
SCSIバスリセット等では復旧しないことをOS経由
で把握した場合、障害が発生した障害共有ディスク7b
上に格納されているアプリケーションで実行中のもの及
び障害共有ディスク7b上のデータを使用しているアプ
リケーションに関して、アプリケーション実行管理S/
Wに対して指示してシャットダウンを行う(ステップS
2)。シャットダウンは、電源復旧のための処理ではな
く、S/W的な整合性を整えるためのシステム終了処理
である。
【0023】シャットダウン実行後、ノード1bのクラ
スタマネージャ2bは、他のノード上で動作しているア
プリケーションについても障害共有ディスク7bを使用
しているものは他のクラスタマネージャに指示してシャ
ットダウンを行う(ステップS3、S4)。例えば、障
害共有ディスク7b上のDBテーブルをアクセスして処
理を行っている当該アクセス不能ノード及び他のノード
のDBアプリケーションをシャットダウンする。
【0024】その後、ノード1bのクラスタマネージャ
2bは、クラスタマネージャ間で問合わせを行って全て
のシャットダウン実行完了をチェックして、完了してい
ると判断すると(ステップS5)、ノード間通信路4を
介して電源供給開閉手段12に障害共有ディスク7bの
みの電源OFF/ON指示を出す(ステップS6)。電
源供給開閉手段12の制御F/W11は、クラスタマネ
ージャ2bからの電源OFF/ON指示要求にしたがっ
て、開閉スイッチ10bを制御して、障害共有ディスク
7bに対して電源供給手段9からの電源をOFFにし、
一定時間後に、共有ディスク7bに対して電源供給手段
9からの電源をONにする(ステップS7)。
【0025】次に、ノード1bのクラスタマネージャ2
bは、OS経由で障害が発生していた共有ディスク7b
に対してディスクアクセスを行い、ディスクアクセスを
チェックして、正常であると判断すると(ステップS
8)、ノード1bでシャットダウンされた処理を再起動
する(ステップS9)。 そして、ノード1bのクラス
タマネージャ2bは、他のノードに対しても再起動させ
るように他のクラスタマネージャに指示し、他のノード
のシャットダウンされた処理の再起動を行わせ(ステッ
プS10)、処理を終了する。
【0026】一方、ノード1bのクラスタマネージャ2
bは、OS経由で障害が発生していた共有ディスク7b
に対してディスクアクセスを行い、ディスクアクセスを
チェックして、異常であると判断すると(ステップS
8)、前述した電源OFF/ON処理を所定の回数試み
て、それでも復旧しない場合(ステップS11)、外部
へ障害ディスク7bの復旧不能を通知して(ステップS
12)、障害ディスク7bをシステムから切り離し、処
理を終了する。
【0027】このように、本実施の形態では、共有ディ
スク7bに障害が発生したときに、クラスタマネージャ
2bにより、電源供給開閉手段12に接続されたノード
間通信路4を経由して電源供給開閉手段12に対して電
源の投入・切断を指示するように構成したため、共有デ
ィスク7bが故障して障害が発生したとき、その障害デ
ィスク7bを独立にON/OFF(OFF後、ON)す
ることができる。このため、他で使っているディスクに
影響を与えることなく、しかも多くの人手と時間をかけ
ることなく容易にかつ短時間で、障害ディスク7bを復
旧させて処理再開を実現することができる。
【0028】本実施の形態では、ノード1bから共有デ
ィスク7bにアクセスしてその共有ディスク7bに障害
が発生した時に、障害が発生した障害共有ディスク7b
に関連する処理のシャットダウンを行い、次いで、障害
共有ディスク7bを使用している他のノードの障害共有
ディスク7bに関連する処理のシャットダウンを行い、
次いで、クラスタマネージャ2bから電源供給開閉手段
12に対して電源の投入・切断を指示し、クラスタマネ
ージャ2bからの電源切断指示に基づいて、電源供給開
閉手段12が障害共有ディスク7bの電源の切断を行
い、次いで、障害共有ディスク7bの電源の投入を行
い、次いで、各ノードにおいて障害共有ディスク7bに
関連する障害発生前の処理を再起動するように構成した
ため、共有ディスク7bが故障して障害が発生したと
き、その障害ディスク7bを独立にON/OFF(OF
F後、ON)することができる。このため、他で使って
いるディスクに影響を与えることなく、しかも多くの人
手と時間をかけることなく容易にかつ短時間で、障害デ
ィスク7bを復旧させて処理再開を実現することができ
る。
【0029】次に、図5、6は図1に示すクラスタシス
テムの別の障害復旧処理フローを示すフローチャートで
ある。例えば、あるノード1aがある共有ディスク7a
にアクセスしようとしたときに、その共有ディスク7a
がアクセスできないと、その共有ディスク7aのOS
は、そのディスクエラーを障害としてクラスタマネージ
ャ2aに上げる(ステップS21)。
【0030】ノード1aのクラスタマネージャ2aは、
SCSIバスリセット等では復旧しないことをOS経由
で把握した場合、障害が発生した障害共有ディスク7a
上に格納されているアプリケーションで実行中のもの及
び障害共有ディスク7a上のデータを使用しているアプ
リケーションに関して、アプリケーション実行管理S/
Wに対して指示してシャットダウンを行う(ステップS
22)。シャットダウンは、電源復旧のための処理では
なく、S/W的な整合性を整えるためのシステム終了処
理である。
【0031】シャットダウン実行後、ノード1aのクラ
スタマネージャ2aは、ノード1a以外の他のノードの
クラスタマネージャに対して、障害が発生した共有ディ
スク7a関連の処理を実行しているかを問い合わせる
(ステップS23)。ノード1aのクラスタマネージャ
2aは、ノード1a以外の他のノードが障害共有ディス
ク7a関連の処理を実行しているかをチェックして(ス
テップS24)、実行しているノードがないと判断した
場合、ノード間通信路4を介して電源供給開閉手段12
に障害共有ディスク7aのみの電源OFF/ON指示を
出す(ステップS25)。
【0032】電源供給開閉手段12の制御F/Wは、ク
ラスタマネージャ2aからの電源OFF/ON指示要求
にしたがって、開閉スイッチ10aを制御することによ
り、障害共有ディスク7aに対して電源供給手段9から
の電源をOFFにし、一定時間後に、共有ディスク7a
に対して電源供給手段9からの電源をONにする(ステ
ップS26)。
【0033】次に、ノード1aのクラスタマネージャ2
aは、OS経由で障害が発生していた共有ディスク7a
に対してディスクアクセスを行い、ディスクアクセスを
チェックして、正常であると判断すると(ステップS2
7)、ノード1aでシャットダウンされた処理を再起動
して(ステップS28)、処理を終了する。
【0034】一方、ノード1aのクラスタマネージャ2
aは、ノード1a以外の他のノードが障害共有ディスク
7a関連の処理を実行しているかをチェックして、実行
しているノードがあると判断した場合(ステップS2
4)、あるいは、障害が発生していた共有ディスク7a
に対してディスクアクセスを行い、ディスクアクセスを
チェックして、異常であると判断し(ステップS2
7)、前述した電源OFF/ON処理を所定の回数試み
て、それでも復旧しない場合(ステップS29)、ステ
ップS30へ進む。
【0035】ノード1aのクラスタマネージャ2aは、
ノード1a以外の他のノードから障害共有ディスク7a
にアクセスできるかを問い合わせて、アクセスできると
判断した場合(ステップS30)、他のノードに処理を
テイクオーバして(ステップS31)、処理を終了す
る。
【0036】一方、ノード1aのクラスタマネージャ2
aは、ノード1a以外の他のノードから障害共有ディス
ク7aにアクセスできるかを問い合わせて、アクセスで
きないと判断した場合(ステップS30)、外部へ障害
共有ディスク7aの復旧不能を通知して(ステップS3
2)、障害共有ディスク7aをシステムから切離し処理
を終了する。
【0037】このように、本実施の形態では、ノード1
aからの共有ディスク7aへのアクセスに障害が発生し
たときに、クラスタマネージャ2aにより、他のノード
での共有ディスク7aの使用状況を確認し使用していな
い場合のみ、電源OFF/ONを行うように構成したた
め、他のノードでの正常処理に影響を与えない障害回復
が行うことができる。また、他のノードから共有ディス
ク7aにアクセス可能であれば、そのノードへ処理をテ
イクオーバさせるようにしたので、システムの可用性が
より高まる。
【0038】実施の形態2.図4は本発明に係る実施の
形態2のクラスタシステムの構成を示す図である。図4
において、図1と同一符号は同一または相当部分を示
し、共有ディスク7a〜7nは、各ノード1a〜1nと
LAN6によりネットワーク接続されており、各ノード
1a〜1nから共有して使われるプログラム、データ
(データベーステーブルなど)などが格納されている。
【0039】21a〜21nはディスクサブシステムで
あり、このディスクサブシステム21a〜21nは、各
ノード1a〜1nからLAN6を経由してネットワーク
アクセス可能な共有ディスク7a〜7nと、共有ディス
ク7a〜7nに電源を供給する電源供給手段9a〜9n
と、電源供給手段9a〜9nから供給された電源を共有
ディスク7a〜7nに対して投入・切断するネットワー
クアクセス可能な電源供給開閉手段12a〜12nとか
ら構成される。
【0040】電源供給開閉手段12a〜12nは、実施
の形態1と同様、電源供給手段9a〜9nと共有ディス
ク7a〜7n間のラインを開閉する開閉スイッチと、共
有ディスク7a〜7nのいずれかに障害が発生したとき
に、クラスタマネージャ2a〜2nからの指示を基に、
開閉スイッチの開閉を制御する制御F/Wとから構成さ
れる。制御F/Wは、クラスタマネージャ2a〜2nに
より制御される。
【0041】各クラスタマネージャ2a〜2nは、LA
N6を経由してディスクサブシステム21a〜21nに
アクセス可能なっている。共有ディスク7a〜7nのい
ずれかに障害が発生したときに、クラスタマネージャ2
a〜2nは、LAN6を介してディスクサブシステム2
1a〜21nの電源供給開閉手段12a〜12nに対し
て電源の投入・切断の指示を行う。電源供給開閉手段1
2a〜12nの制御S/Wは、クラスタマネージャ2a
〜2nからの指示にしたがって、開閉スイッチを制御し
て共有ディスク7a〜7nへの電源の投入・切断を行
う。
【0042】各ノード1a〜1nは、LAN6を経由し
て共有ディスク7a〜7nにアクセスする。どれかのノ
ード1a〜1nが故障したり、共有ディスクアクセスが
不能となった場合は、そのノード1a〜1nで実行して
いたアプリケーションを他のノード1a〜1nにテイク
オーバし処理を継続する。各ノード1a〜1nで実行し
ているアプリケーションの管理やテイクオーバ処理は、
クラスタマネージャ2a〜2nが行う。クラスタマネー
ジャ2a〜2nは、各ノード1a〜1nで動作するS/
Wであり(専用H/WとS/Wを組み合わせて構成して
もよい)、互いに連携してクラスタシステム全体の制御
を行う。
【0043】このような構成にした場合も、クラスタマ
ネージャ2a〜2nは、LAN6を経由して故障の発生
した共有ディスクを有するディスクサブシステムの電源
供給開閉手段に対して当該故障ディスクのみの電源ON
/OFFを行わしめ、他のディスクサブシステムに影響
を与えることなく障害復旧を試みることができる。
【0044】
【発明の効果】本発明によれば、共有ディスクに障害が
発生したときに、電源供給制御手段により、電源供給開
閉手段に対して電源の投入・切断を指示するように構成
することにより、共有ディスクが故障して障害が発生し
たとき、その障害ディスクを独立にON/OFF(OF
F後、ON)することができるため、他で使っているデ
ィスクの影響を受けることなく、しかも多くの人手と時
間をかけることなく容易にかつ短時間で、障害ディスク
を復旧させて処理再開を実現することができるという効
果がある。
【0045】本発明によれば、電源供給制御手段をクラ
スタシステムを制御するクラスタマネージャで構成する
ことにより、上記効果を効率よく得ることができる。
【0046】本発明によれば、クラスタマネージャによ
り、電源供給開閉手段に接続されたノード間通信路を経
由して電源供給開閉手段に指示を行うように構成するこ
とにより、上記効果を効率よく得ることができる。
【0047】本発明によれば、共有ディスクに障害が発
生したときに、クラスタマネージャにより、ネットワー
ク経由で電源供給開閉手段に対して電源の投入・切断を
指示するように構成することにより、共有ディスクが故
障して障害が発生したとき、その障害ディスクを独立に
ON/OFF(OFF後、ON)することができるた
め、他で使っているディスクに影響を与えることなく、
しかも多くの人手と時間をかけることなく容易にかつ短
時間で、障害ディスクを復旧させて処理再開を実現する
ことができるという効果がある。
【0048】本発明に係るクラスタシステムの障害回復
方法は、ノードから共有ディスクにアクセスしてその共
有ディスクに障害が発生した時に、障害が発生した障害
共有ディスクに関連する処理のシャットダウンを行い、
次いで、障害共有ディスクを使用している他のノードの
障害共有ディスクに関連する処理のシャットダウンを行
い、次いで、電源供給制御手段から電源供給開閉手段に
対して電源の投入・切断を指示し、電源供給制御手段か
らの電源切断指示に基づいて、電源供給開閉手段が障害
共有ディスクの電源の切断を行い、次いで、障害共有デ
ィスクの電源の投入を行い、次いで、各ノードにおいて
障害共有ディスクに関連する障害発生前の処理を再起動
するように構成することにより、共有ディスクが故障し
て障害が発生したとき、その障害ディスクを独立にON
/OFF(OFF後、ON)することができるため、他
で使っているディスクに影響を与えることなく、しかも
多くの人手と時間をかけることなく容易にかつ短時間
で、障害ディスクを復旧させて処理再開を実現すること
ができるという効果がある。
【0049】本発明に係るクラスタシステムの障害回復
方法は、ノードから共有ディスクにアクセスしてその共
有ディスクに障害が発生した時に、他のノードが障害が
発生した障害共有ディスクを使用していないかをチェッ
クして、他のノードが障害共有ディスクを使用していな
い場合のみに、障害共有ディスクに関連する処理のシャ
ットダウンを行い、次いで、電源供給制御手段から電源
供給開閉手段に対して電源の投入・切断を指示し、次い
で、電源供給制御手段からの電源切断指示に基づいて、
電源供給開閉手段が障害共有ディスクの電源の切断を行
い、次いで、障害共有ディスクの電源の投入を行い、次
いで、各ノードにおいて障害共有ディスクに関連する障
害発生前の処理を再起動するように構成することによ
り、他のノードでの正常処理に影響を与えない障害回復
を行うことができるという効果がある。
【図面の簡単な説明】
【図1】 本発明に係る実施の形態1のクラスタシステ
ムの構成を示す図である。
【図2】 図1に示すクラスタシステムの障害復旧処理
フローを示すフローチャートである。
【図3】 図1に示すクラスタシステムの障害復旧処理
フローを示すフローチャートである。
【図4】 本発明に係る実施の形態2のクラスタシステ
ムの構成を示す図である。
【図5】 図4に示すクラスタシステムの障害復旧処理
フローを示すフローチャートである。
【図6】 図4に示すクラスタシステムの障害復旧処理
フローを示すフローチャートである。
【図7】 従来の一般的なクラスタシステムの構成を示
す図である。
【図8】 従来のON/OFF可能な情報処理装置の構
成を示す図である。
【符号の説明】
1a〜1n ノード、2a〜2n クラスタマネージ
ャ、3a〜3n ローカルディスク、4 ノード間通信
路、5a〜5n クライアント、6 LAN、7a〜7
n 共有ディスク、8 SCSIバス、9、9a〜9n
電源供給手段、10a〜10n 開閉スイッチ、11
制御F/W、12、12a〜12n 電源供給開閉手
段。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数のノードから共有してアクセスする
    共有ディスクを有するクラスタシステムにおいて、 共有ディスクに電源を供給する電源供給手段と、 電源供給手段と共有ディスクの間に配置され、かつ電源
    供給手段から供給された電源を共有ディスクに対して投
    入・切断する電源供給開閉手段と、ム。
  2. 【請求項2】 請求項1に記載のクラスタシステムにお
    いて、電源供給制御手段はクラスタシステムを制御する
    クラスタマネージャであることを特徴とするクラスタシ
    ステム。
  3. 【請求項3】 請求項1乃至2に記載のクラスタシステ
    ムにおいて、電源供給開閉手段に接続されたノード間通
    信路を有し、クラスタマネージャはノード間通信路を経
    由して電源供給開閉手段に指示を行うことを特徴とする
    クラスタシステム。
  4. 【請求項4】 複数のノードから共有してアクセスする
    共有ディスクを有するクラスタシステムにおいて、 各ノードとネットワーク接続された共有ディスクと、共
    有ディスクに電源を供給する電源供給手段と、電源供給
    手段から供給された電源を共有ディスクに対して投入・
    切断する電源供給開閉手段とを有するディスクサブシス
    テムと、 共有ディスクに障害が発生したときに、ネットワーク経
    由で電源供給開閉手段に対して電源の投入・切断を指示
    するクラスタマネージャとを有することを特徴とするク
    ラスタシステム。
  5. 【請求項5】 ノードから共有ディスクにアクセスして
    その共有ディスクに障害が発生した時に、障害が発生し
    た障害共有ディスクに関連する処理のシャットダウンを
    行うステップと、 障害共有ディスクを使用している他のノードの障害共有
    ディスクに関連する処理のシャットダウンを行うステッ
    プと、 電源供給制御手段から電源供給開閉手段に対して電源の
    切断・投入を指示するステップと、 電源供給制御手段からの電源切断指示に基づいて、電源
    供給開閉手段が障害共有ディスクの電源の切断を行うス
    テップと、 電源供給制御手段からの電源投入指示に基づいて、電源
    供給開閉手段が障害共有ディスクの電源の投入を行うス
    テップと、 各ノードにおいて障害共有ディスクに関連する障害発生
    前の処理を再起動するステップとを含むことを特徴とす
    るクラスタシステムの障害回復方法。
  6. 【請求項6】 ノードから共有ディスクにアクセスして
    その共有ディスクに障害が発生した時に、他のノードが
    障害が発生した障害共有ディスクを使用していないかを
    チェックするステップと、 他のノードが障害共有ディスクを使用していない場合の
    みに、障害共有ディスクに関連する処理のシャットダウ
    ンを行うステップと、 電源供給制御手段から電源供給開閉手段に対して電源の
    切断・投入を指示するステップと、 電源供給制御手段からの電源切断指示に基づいて、電源
    供給開閉手段が障害共有ディスクの電源の切断を行うス
    テップと、 電源供給制御手段からの電源投入指示に基づいて、電源
    供給開閉手段が障害共有ディスクの電源の投入を行うス
    テップと、 各ノードにおいて障害共有ディスクに関連する障害発生
    前の処理を再起動するステップとを含むことを特徴とす
    るクラスタシステムの障害回復方法。
JP11028102A 1999-02-05 1999-02-05 クラスタシステム及びその障害回復方法 Abandoned JP2000227839A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11028102A JP2000227839A (ja) 1999-02-05 1999-02-05 クラスタシステム及びその障害回復方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11028102A JP2000227839A (ja) 1999-02-05 1999-02-05 クラスタシステム及びその障害回復方法

Publications (1)

Publication Number Publication Date
JP2000227839A true JP2000227839A (ja) 2000-08-15

Family

ID=12239451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11028102A Abandoned JP2000227839A (ja) 1999-02-05 1999-02-05 クラスタシステム及びその障害回復方法

Country Status (1)

Country Link
JP (1) JP2000227839A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052547A (ja) * 2006-08-25 2008-03-06 Hitachi Ltd 記憶制御装置及び記憶制御装置の障害回復方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052547A (ja) * 2006-08-25 2008-03-06 Hitachi Ltd 記憶制御装置及び記憶制御装置の障害回復方法
US8312321B2 (en) 2006-08-25 2012-11-13 Hitachi, Ltd. Storage control apparatus and failure recovery method for storage control apparatus

Similar Documents

Publication Publication Date Title
EP2053780B1 (en) A distributed master and standby managing method and system based on the network element
US20070234332A1 (en) Firmware update in an information handling system employing redundant management modules
JP2001184145A (ja) 情報処理装置等のリモート電源管理システム
JPH11345219A (ja) アプリケ―ション実現方法及びアプリケ―ション実現装置
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
US20080301489A1 (en) Multi-agent hot-standby system and failover method for the same
JPH05108392A (ja) データ処理システム
JP2009265805A (ja) フェイルオーバ方法、プログラム、フェイルオーバ装置およびフェイルオーバシステム
US6618819B1 (en) Sparing system and method to accommodate equipment failures in critical systems
JP5056504B2 (ja) 制御装置、情報処理システム、情報処理システムの制御方法および情報処理システムの制御プログラム
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
US7437445B1 (en) System and methods for host naming in a managed information environment
JPH11224207A (ja) マルチクラスタシステムを構成する計算機
JP5285044B2 (ja) クラスタシステム復旧方法及びサーバ及びプログラム
JP2000227839A (ja) クラスタシステム及びその障害回復方法
JP3771162B2 (ja) 保守管理方法、保守管理システム、情報処理システムおよびコンピュータプログラム
JPH08235132A (ja) マルチサーバシステムのホットスタンバイ制御方法
JP2009075710A (ja) 冗長化システム
JP5277228B2 (ja) クラスタシステム復旧方法、サーバ及びソフトウェア
JPH0683657A (ja) サービスプロセッサの切り換え方式
JP2000066913A (ja) 任意プロセッサのプログラム・データ無中断更新システム
JP2002229740A (ja) 管理用インタフェースを用いた高可用性ストレージシステム、同システムに用いられるホストコンピュータ、及び同コンピュータにより実行されるドライバプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP3144346B2 (ja) 通信処理装置の予備切り替えシステム
JP5439736B2 (ja) コンピュータ管理システム、コンピュータシステムの管理方法、及びコンピュータシステムの管理プログラム
JP5277229B2 (ja) クラスタシステム復旧方法、サーバ及びソフトウェア

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040623

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20081202