JP2000099360A - 2重系システム - Google Patents

2重系システム

Info

Publication number
JP2000099360A
JP2000099360A JP10269226A JP26922698A JP2000099360A JP 2000099360 A JP2000099360 A JP 2000099360A JP 10269226 A JP10269226 A JP 10269226A JP 26922698 A JP26922698 A JP 26922698A JP 2000099360 A JP2000099360 A JP 2000099360A
Authority
JP
Japan
Prior art keywords
node
standby
business
disk
switched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10269226A
Other languages
English (en)
Inventor
Toshio Matsumoto
利夫 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP10269226A priority Critical patent/JP2000099360A/ja
Publication of JP2000099360A publication Critical patent/JP2000099360A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】 業務系ノードに障害が発生したときに業務系
ノードの処理を共有データだけでなくOS環境を含めて
待機系ノードに容易に引継ぐことができる。 【解決手段】 業務系ノード1と待機系ノード20との
2つのノードからなる22重系システムにおいて、業務
系ノード1が使用する業務系用共有ディスク33と、待
機系ノード20が使用する待機系用共有ディスク34
と、業務系ノード1からのアクセスのみを業務系用共有
ディスク33に対して通過させる系切替え装置31と、
待機系ノード20からのアクセスのみを待機系用共有デ
ィスク34に対して通過させる系切替え装置32とを設
けて構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、2重系システムに
係り、詳しくは、クラスタシステムの中で2つのノード
を扱っている2重系システムに適用することができ、特
に、業務系ノードに障害が発生したときに業務系ノード
の処理を共有データだけでなくOS環境を含めて待機系
ノードに容易に引継ぐことができる2重系システムに関
するものである。
【0002】
【従来の技術】図2は従来の2重系システムの構成を示
すブロック図である。図2において、101は業務系ノ
ード、111は業務系ノード101のシステム制御装置
(クラスタマネージャ)、112は業務系ノード101
のCPU、113、114は業務系ノード101のSC
SIコントローラ、115は業務系ノード101のOS
が格納されたOSディスクである。
【0003】120は待機系ノード、121は待機系ノ
ード120のシステム制御装置(クラスタマネージ
ャ)、122は待機系ノード120のCPU、123、
124は待機系ノード120のSCSIコントローラ、
125は待機系ノード120のOSが格納されたOSデ
ィスク、130は業務系ノード101と待機系ノード1
20の共有データが格納された共有データディスクであ
る。ここで、共有データとは、各ノードから共有して使
われるOS以外のアプリケーションやアプリケーション
で使用するデータのとことである。
【0004】業務系ノード101のSCSIコントロー
ラ113は、業務系ノード101のOSディスク115
と接続されたOSディスク115用のSCSIコントロ
ーラであり、業務系ノード101のSCSIコントロー
ラ114は、共有データディスク130と接続された共
有データディスク130用のSCSIコントローラであ
る。
【0005】待機系ノード120のSCSIコントロー
ラ123は、待機系ノード120のOSディスク125
と接続されたOSディスク125用のSCSIコントロ
ーラであり、待機系ノード120のSCSIコントロー
ラ124は、共有データディスク130と接続された共
有データディスク130用のSCSIコントローラであ
る。
【0006】従来の2重系システムでは、業務系ノード
101と待機系ノード120の各系毎にローカルディス
クのOSディスク115とOSディスク125それぞれ
に各ノードで専用に使用するOSをそれぞれ保持してお
き、業務系ノード101と待機系ノード120で共通に
使うデータを共有データディスク130に格納してい
る。
【0007】従来の2重系システムでは、業務系ノード
101に障害が発生したときに業務系ノード101の処
理を待機系ノード120に引継ぐ場合、共有データディ
スク130に格納されている共有データのみを引継いで
いた。
【0008】
【発明が解決しようとする課題】上記したような従来の
2重系システムでは、業務系ノード101に障害が発生
したときに業務系ノード101の処理を待機系ノード1
20に引継ぐ場合、共有データディスク130に格納さ
れている共有データのみしか引継ぐことができなかった
ため、障害発生の際の系切り替え時にそれまで業務系ノ
ード101で使用していたOSをそのまま、障害発生前
に待機系ノード120として使用していた新しい業務系
ノードに引継いで使用することができないという問題が
あった。
【0009】例えば、Window NTでは、OSの
中のレジストリと呼ばれるファイルにシステム設定やア
プリケーションの一部設定情報が格納されるが、これを
引継いで使用することができないため、全く同じ環境で
処理を継続することができなかった。同じ環境にするに
は、人手で設定を合わせる必要があり、これはノードが
共有メモリ上のデータを引継ぐホットスタンバイ型の2
重系でも同じである。すなわち、処理途中の共有メモリ
上の揮発性データは引継げるが、ディスクに格納された
不揮発性のOS、及びそのレジストリはテイクオーバす
るノード101、120間で互いに引継ぐことができな
かった。
【0010】従来、片方の業務系ノード101が動作し
ているときに片方の待機系ノード120が例えばバッチ
処理を行っていたとき、OSは分かれているからよい
が、同じデータを同じ共有データディスク130から使
用しているときに、待機系ノード120のバッチ処理で
ディスクをハングしてしまうと、同じバスを介して同じ
共有データディスク130にアクセスしているため、業
務系ノード101が停止してしまうという問題があっ
た。
【0011】そこで、本発明は、上記課題を解決するた
めになされたもので、業務系ノードに障害が発生したと
きに業務系ノードの処理を共有データだけでなくOS環
境を含めて待機系ノードに容易に引継ぐことができるほ
か、業務系ノードと待機系ノードを同時に処理している
ときに、待機系ノード側でディスクをハングしてしまっ
ても業務系ノードを停止させることなく、正常に動作さ
せることができる2重系システムを提供することを目的
とする。
【0012】
【課題を解決するための手段】請求項1記載の発明は、
業務系ノードと待機系ノードとの2つのノードからなる
2重系システムにおいて、業務系ノードが使用する業務
系用ディスクと、待機系ノードが使用する待機系用ディ
スクと、業務系ノードからのアクセスのみを業務系用デ
ィスクに対して通過させる第1の系切替え装置と、待機
系ノードからのアクセスのみを待機系用ディスクに対し
て通過させる第2の系切替え装置とを設けたことを特徴
とするものである。
【0013】請求項2記載の発明は、請求項1に記載の
二重系システムにおいて、業務系/待機系ノードが、業
務系ノードに障害が発生した場合、第1、第2の系切替
え装置に対してEnable信号をinactiveにし、業務
系ノードと待機系ノードの役割を入れ替えて業務系ノー
ドを待機系ノードに切り替えるとともに、待機系ノード
を業務系ノードに切り替えた後、待機系ノードから切り
替えられた業務系ノードに対して第1の系切替え装置の
Enable信号をactiveにするとともに、業務系ノー
ドから切り替えられた待機系ノードに対して第2の系切
替え装置のEnable信号をactiveにすることを特徴
とするものである。
【0014】請求項3記載の発明は、請求項1乃至2に
記載の二重系システムにおいて、業務系、待機系ノード
の各ノードが、複数のI/Oコントローラを有し、業務
系用ディスクに接続するI/Oコントローラと待機系用
ディスクに接続するI/Oコントローラとを別に割り当
てたことを特徴とするものである。
【0015】請求項4記載の発明は、請求項1乃至3に
記載の二重系システムにおいて、第1、第2の系切替え
装置が、2重系システムを制御するクラスタマネージャ
が制御を行うことを特徴とするものである。
【0016】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。 実施の形態1 図1は本発明に係る実施の形態1の2重系システムの構
成を示すブロック図である。図1において、1は業務系
ノード、11は業務系ノード1のシステム制御装置(ク
ラスタマネージャ)、12は業務系ノード1のCPU、
13、14は業務系ノード1のSCSIコントローラで
ある。
【0017】20は待機系ノード、21は待機系ノード
20のシステム制御装置(クラスタマネージャ)、22
は待機系ノード20のCPU、23、24は待機系ノー
ド20のSCSIコントローラ、31は業務系ノード1
のSCSIコントローラ14と待機系ノード20のSC
SIコントローラ24と接続された系切替え装置であ
る。
【0018】32は業務系ノード1のSCSIコントロ
ーラ13と待機系ノード20のSCSIコントローラ2
3と接続された系切替え装置、33は系切替え装置31
と接続され、かつ業務系用OS、データが格納された業
務系用共有ディスク、34は系切替え装置32と接続さ
れ、かつ待機系用OS、データが格納された待機系用共
有ディスクである。
【0019】本実施の形態は、2つのノード1、20か
らなるクラスタシステム、即ち2重系システムを構成し
ている。この2重系システムは、業務系ノード1と待機
系ノード20の2つのノードから構成され、業務系ノー
ド1には、2つのSCSIコントローラ13、14が配
置され、待機系ノード20には、2つのSCSIコント
ローラ23、24が配置されている。
【0020】この2重系システムは、業務系ノード1と
待機系ノード20共、それぞれ2つのSCSIコントロ
ーラが配置されており、共有ディスクとして業務系ノー
ド1で使用するOS、データが格納された業務系用共有
ディスク33を有しており、共有ディスクとして待機系
ノード20で使用するOS、データが格納された待機系
用共有ディスク34を有する。
【0021】業務系ノード1のSCSIコントローラ1
3は、待機系用共有ディスク34に接続された系切替え
装置32と接続された系切替え装置32用のSCSIコ
ントローラであり、業務系ノード1のSCSIコントロ
ーラ14は、業務系用共有ディスク33に接続された系
切替え装置31と接続された系切替え装置31用のSC
SIコントローラである。
【0022】待機系ノード20のSCSIコントローラ
23は、待機系用共有ディスク34に接続された系切替
え装置32と接続された系切替え装置32用のSCSI
コントローラであり、待機系ノード20のSCSIコン
トローラ24は、業務系用共有ディスク33に接続され
た系切替え装置31と接続された系切替え装置31用の
SCSIコントローラである。
【0023】業務系ノード1では、クラスタマネージャ
となるシステム制御装置11が、業務系用共有ディスク
33が接続された系切替え装置31に対してEnabl
e信号をactiveにし、待機系用共有ディスク34が接続
された系切替え装置32に対してEnable信号をin
activeにする。
【0024】待機系ノード20では、クラスタマネージ
ャとなるシステム制御装置21が、業務系用共有ディス
ク33が接続された系切り替え装置31に対してEna
ble信号をinactiveにし、待機系用共有ディスク34
が接続された系切り替え装置32に対してEnable
信号をactiveにする。
【0025】業務系用共有ディスク33が接続された系
切り替え装置31は、業務系ノード1からのアクセスの
みを受付け、待機系ノード20からのアクセスには応答
しない。業務系ノード1は、業務系ノード1を起動する
時にディスクのサーチを実行すると、業務系用共有ディ
スク33に対しては正常にアクセスできるが、一方、待
機系用共有ディスク34に対しては応答せずディスクが
存在しないように見える。
【0026】このため、業務系ノード1は、OSが業務
系用共有ディスク33だけに存在しているとみなされ、
ここから起動する。これとは逆に待機系における起動に
おいては、待機系ノード20は、OSが待機系用共有デ
ィスク34にしか存在しないように見えるため、ここか
ら起動する。
【0027】このように、本実施の形態では、業務系ノ
ード1が使用する業務系用共有ディスク33と、待機系
ノード20が使用する待機系用共有ディスク34と、業
務系ノード1からのアクセスのみを業務系用共有ディス
ク33に対して通過させる系切替え装置31と、待機系
ノード20からのアクセスのみを待機系用共有ディスク
34に対して通過させる系切替え装置32とを設けて構
成したため、OSとデータディスクに関して業務系用共
有ディスク33と待機系用共有ディスク34という具合
に業務系ノード1と待機系ノード20で分離することが
できる。
【0028】このため、業務系ノード1と待機系ノード
20間で互いに影響を及ぼすことなく、業務系ノード1
から系切替え装置31を介して業務系用共有ディスク3
3に対してアクセスすることができると同時に、待機系
ノード20から系切替え装置32を介して待機系用共有
ディスク34に対してアクセスすることができ、業務系
ノード1と待機系ノード20で同時に処理を行うことが
できる。例えば、業務系ノード1では通常の業務処理を
行い、待機系ノード20ではバッチ処理や開発業務など
を行うことできる。
【0029】また、本実施の形態では、例えば、待機系
ノード20で開発のデバッグを実施しているときに、S
/Wのバグにより誤ってSCSIバスをハングアップさ
せてしまうようなことがあっても、業務系ノード1では
このSCSIバスを使用せずに別のSCSIバスを使用
しているため、業務系ノード1に対しては何の影響も与
えずに済ませることができ、業務系ノード1を停止させ
ることなく、正常に動作させることができる。
【0030】次に、業務系ノード1で処理しているとき
に業務系ノード1にディスク障害などの障害が発生した
場合、システム制御装置11、21は、まず、業務系ノ
ード1のシャットダウンを実行し、待機系ノード20が
起動していれば、待機系ノード20のシャットダウンも
実行する。業務系ノード1と待機系ノード20の両系共
シャットダウンが完了すると、システム制御装置11、
21は、各系切り替え装置31、32に対するEnab
le信号をinactiveにするように指示する。
【0031】次に、システム制御装置11、21はテイ
クオーバを実行し、業務系ノード1と待機系ノード20
の役割の入れ替えて業務系ノード1を待機系ノードに切
り替えるとともに、待機系ノード20を業務系ノードに
切り替える。システム制御装置11、21は、待機系ノ
ード20から切り替えられた業務系ノードに対して切替
え装置31のEnable信号をactiveにするととも
に、業務系ノード1から切り替えられた待機系ノードに
対して切替え装置32のEnable信号をactiveにす
る。
【0032】待機系ノード20から切り替えられた新し
い業務系ノードで起動を行うと、業務系用共有ディスク
33からOSが起動され、この結果、OSレジストリ設
定やDLL(ダイナミックリンクライブラリ)等のファ
イルのバージョンが障害発生前と同じ環境で処理を再開
する。
【0033】このように、本実施の形態では、業務系ノ
ード1に障害が発生した場合、系切替え装置31、32
に対してEnable信号をinactiveにし、業務系ノー
ド1と待機系ノード20の役割を入れ替えて業務系ノー
ド1を待機系ノードに切り替えるとともに、待機系ノー
ド20を業務系ノードに切り替えた後、待機系ノード2
0から切り替えられた業務系ノードに対して系切替え装
置31のEnable信号をactiveにするとともに、業
務系ノード1から切り替えられた待機系ノードに対して
系切替え装置32のEnable信号をactiveにするよ
うに構成したため、業務系ノード1に障害が発生したと
きに業務系ノード1の処理を共有データだけでなくOS
環境を含めて待機系ノード20に容易に引継がせること
ができる。なお、障害が発生した業務系ノード1は、H
/W等を診断し修理して復旧すると、待機系の処理を行
う。
【0034】また、本実施の形態では、業務系用共有デ
ィスク33に接続するSCSIコントローラ14、24
と待機系用共有ディスク34に接続するSCSIコント
ローラ13、23とを別に割り当てて構成したため、パ
スを2つに分けたため、制御を容易に行うことができ、
障害が発生したときに、波及を抑えることができる。例
えば、待機系ノード20が開発中のプログラムのバグで
ハングしたときでも、業務系ノード1が正常に動作して
いたのに悪影響を与えないようにできる。
【0035】また、本実施の形態では、2重系システム
を制御するシステム制御装置11、21のクラスタマネ
ージャにより、系切替え装置3132を制御するように
構成したため、全体の切り替えやアプリケーションの動
作などをクラスタマネージャで制御することができ、整
合性を取り易くすることができる。なお、本実施の形態
では、ディスクとの接続インターフェースとしてSCS
Iの場合を説明したが、ファイバーチャネル等の他のイ
ンターフェースで構成してもよい。
【0036】
【発明の効果】請求項1記載の発明によれば、業務系ノ
ードが使用する業務系用ディスクと、待機系ノードが使
用する待機系用ディスクと、業務系ノードからのアクセ
スのみを業務系用ディスクに対して通過させる第1の系
切替え装置と、待機系ノードからのアクセスのみを待機
系用ディスクに対して通過させる第2の系切替え装置と
を設けて構成することにより、OSとデータディスクに
関して業務系用ディスクと待機系用ディスクという具合
に業務系ノードと待機系ノードで分離することができる
ため、業務系ノードと待機系ノード間で互いに影響を及
ぼすことなく、業務系ノードから第1の系切替え装置を
介して業務系用ディスクに対してアクセスすることがで
きると同時に、待機系ノードから第2の系切替え装置を
介して待機系用ディスクに対してアクセスすることがで
き、業務系ノードと待機系ノードで同時に処理を行うこ
とができ、例えば、業務系ノードでは通常の業務処理を
行い、待機系ノードではバッチ処理や開発業務などを行
うことができるという効果がある。
【0037】請求項2記載の発明によれば、業務系/待
機系ノードにより、業務系ノードに障害が発生した場
合、第1、第2の系切替え装置に対してEnable信
号をinactiveにし、業務系ノードと待機系ノードの役割
を入れ替えて業務系ノードを待機系ノードに切り替える
とともに、待機系ノードを業務系ノードに切り替えた
後、待機系ノードから切り替えられた業務系ノードに対
して第1の系切替え装置のEnable信号をactiveに
するとともに、業務系ノードから切り替えられた待機系
ノードに対して第2の系切替え装置のEnable信号
をactiveにするように構成することにより、業務系ノー
ドに障害が発生したときに業務系ノードの処理を共有デ
ータだけでなくOS環境を含めて待機系ノードに容易に
引継がせることができるという効果がある。
【0038】請求項3記載の発明によれば、業務系用デ
ィスクに接続するI/Oコントローラと待機系用ディス
クに接続するI/Oコントローラとを別に割り当てて構
成することにより、パスを2つに分けたため、制御を容
易に行うことができ、障害が発生したときに、波及を抑
えることができるという効果がある。
【0039】請求項4記載の発明によれば、2重系シス
テムを制御するクラスタマネージャにより、第1、第2
の系切替え装置を制御するように構成することにより、
全体の切り替えやアプリケーションの動作などをクラス
タマネージャで制御することができるため、整合性を取
り易いという効果がある。
【図面の簡単な説明】
【図1】 本発明に係る実施の形態1の2重系システム
の構成を示すブロック図である。
【図2】 従来の2重系システムの構成を示すブロック
図である。
【符号の説明】
1 業務系ノード、11、21 システム制御装置、1
2、22 CPU、13、14、23、24 SCSI
コントローラ、20 待機系ノード、31、32 系切
替え装置、33 業務系用共有ディスク、34 待機系
用共有ディスク。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 業務系ノードと待機系ノードとの2つの
    ノードからなる2重系システムにおいて、業務系ノード
    が使用する業務系用ディスクと、待機系ノードが使用す
    る待機系用ディスクと、業務系ノードからのアクセスの
    みを業務系用ディスクに対して通過させる第1の系切替
    え装置と、待機系ノードからのアクセスのみを待機系用
    ディスクに対して通過させる第2の系切替え装置とを設
    けたことを特徴とする2重系システム。
  2. 【請求項2】 請求項1に記載の二重系システムにおい
    て、業務系/待機系ノードは、業務系ノードに障害が発
    生した場合、第1、第2の系切替え装置に対してEna
    ble信号をinactiveにし、業務系ノードと待機系ノー
    ドの役割を入れ替えて業務系ノードを待機系ノードに切
    り替えるとともに、待機系ノードを業務系ノードに切り
    替えた後、待機系ノードから切り替えられた業務系ノー
    ドに対して第1の系切替え装置のEnable信号をac
    tiveにするとともに、業務系ノードから切り替えられた
    待機系ノードに対して第2の系切替え装置のEnabl
    e信号をactiveにすることを特徴とする2重系システ
    ム。
  3. 【請求項3】 請求項1乃至2に記載の二重系システム
    において、業務系、待機系ノードの各ノードは、複数の
    I/Oコントローラを有し、業務系用ディスクに接続す
    るI/Oコントローラと待機系用ディスクに接続するI
    /Oコントローラとを別に割り当てたことを特徴とする
    2重系システム。
  4. 【請求項4】 請求項1乃至3に記載の二重系システム
    において、第1、第2の系切替え装置は、2重系システ
    ムを制御するクラスタマネージャが制御を行うことを特
    徴とする2重系システム。
JP10269226A 1998-09-24 1998-09-24 2重系システム Pending JP2000099360A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10269226A JP2000099360A (ja) 1998-09-24 1998-09-24 2重系システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10269226A JP2000099360A (ja) 1998-09-24 1998-09-24 2重系システム

Publications (1)

Publication Number Publication Date
JP2000099360A true JP2000099360A (ja) 2000-04-07

Family

ID=17469428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10269226A Pending JP2000099360A (ja) 1998-09-24 1998-09-24 2重系システム

Country Status (1)

Country Link
JP (1) JP2000099360A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013508839A (ja) * 2009-10-26 2013-03-07 インターナショナル・ビジネス・マシーンズ・コーポレーション ノード故障の対処
US8549221B2 (en) 2004-11-29 2013-10-01 Fujitsu Limited RAID management apparatus, RAID management method, and computer product

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8549221B2 (en) 2004-11-29 2013-10-01 Fujitsu Limited RAID management apparatus, RAID management method, and computer product
JP2013508839A (ja) * 2009-10-26 2013-03-07 インターナショナル・ビジネス・マシーンズ・コーポレーション ノード故障の対処

Similar Documents

Publication Publication Date Title
US8312319B2 (en) Failover method through disk takeover and computer system having failover function
US6698017B1 (en) Software migration on an active processing element
US8010827B2 (en) Method and computer system for failover
JP4359609B2 (ja) 計算機システム、システムソフトウェア更新方法及び第1サーバ装置
JPH0831047B2 (ja) 論理区画式データ処理装置における区画間制御のための装置及び方法
CN110874261B (zh) 可用性系统、方法和存储有程序的存储介质
JPH05233162A (ja) データ退避方式および保守機能を備えたデータ処理システム
US11119872B1 (en) Log management for a multi-node data processing system
JP2000099360A (ja) 2重系システム
JPH08235132A (ja) マルチサーバシステムのホットスタンバイ制御方法
JP2002049509A (ja) データ処理システム
JP2002024048A (ja) 高可用性システム
JP2001154896A (ja) 計算機およびそのファイル更新方法
JPH05314075A (ja) オンラインコンピュータ装置
JP5353378B2 (ja) Haクラスタシステムおよびそのクラスタリング方法
JPH09288590A (ja) 仮想計算機システム
JPH0264845A (ja) 主制御部多重化電子計算機
JP2762453B2 (ja) 入出力構成変更方法
JPH11265292A (ja) Iplにおける代替パスおよび二重化によるロードボリュームi/o制御管理方式
JP2001352567A (ja) 構内交換機
JPH04337849A (ja) メモリ・ダンプ方法
JPH0380734A (ja) 通信処理装置
JPH10116262A (ja) 並列計算機、プロセッサ要素ネットワーク、および並列計算機用プログラムを記録した記録媒体
JPS63245736A (ja) 排他制御コントロ−ラ引き継ぎ方式
JP2000057116A (ja) 複合計算機システム運転制御方式

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040622