JP2005025289A - Data protecting program and method in external storage device shared by plural computer - Google Patents

Data protecting program and method in external storage device shared by plural computer Download PDF

Info

Publication number
JP2005025289A
JP2005025289A JP2003187225A JP2003187225A JP2005025289A JP 2005025289 A JP2005025289 A JP 2005025289A JP 2003187225 A JP2003187225 A JP 2003187225A JP 2003187225 A JP2003187225 A JP 2003187225A JP 2005025289 A JP2005025289 A JP 2005025289A
Authority
JP
Japan
Prior art keywords
computer
storage device
external storage
access
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003187225A
Other languages
Japanese (ja)
Inventor
Masaharu Arai
雅晴 新井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003187225A priority Critical patent/JP2005025289A/en
Publication of JP2005025289A publication Critical patent/JP2005025289A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system for protecting data resources in order to prevent the competition of processing requests under the exclusive control of an external storage device when the interconnect of a communication path breaks down between a plurality of computers equipped with a shared external storage device. <P>SOLUTION: This system is configured so that an external storage device can be shared by a plurality of computers, and that those respective computers can be communicatively connected through a communication path. This method for protecting data resources is characterized to temporarily inhibit access to the external device by using exclusive control set in the external storage device when the computer group configuring this system is divided into two or more computer groups due to the failure of the communication path, and to arbitrate requests from the plurality of computer groups, and to decide the computer group which continues the operation of business by a certain method, and to newly permit access to the computer group which continues the operation. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、複数の計算機(以下、ノードと表現)で外部記憶装置を共有する構成のシステム(以下、クラスタシステムと表現)において、各ノードから共有ディスクにアクセスする場合の排他制御技術に関する。
【0002】
【従来の技術】
クラスタシステムにおける各ノード上で、外部記憶装置内の共有のデータにアクセスして動作するプログラム(以下、「データ利用プログラム」と呼ぶ)は、データに対して、複数のノードから同時にアクセスされることを想定していないため、各ノードのデータ利用プログラムから外部記憶装置用のデータを同時に更新すると、データ破壊が発生する恐れがある。
【0003】
これを防ぐためには、各ノードでデータ利用プログラムからデータをアクセスする前に、データのアクセスが可能かどうかを調べ、アクセスしている間は、他のノードからのアクセスを拒否する排他制御の機構が必要となる。
従来、複数ノード間の排他制御を調停し、共有ディスクのデータを保護する方式として、外部記憶装置のディスクに情報を記載し調停するクォーラムディスク方式(例えば、非特許文献1)や、複数ノード間のプライベートな通信路を使用し互いに通信して調停するプライベートLAN(Local Area Network)による方式(例えば、特許文献1)が存在し、各ノードにインストールされた排他制御プログラムによって調停が行われていた。
【0004】
【非特許文献1】
ウインドウズ2000ワールド、2001年2月号、p.25〜26
【0005】
【特許文献1】
特開平7−306837号公報(第2〜3頁)
【0006】
【発明が解決しようとする課題】
しかしながら、上記クォーラムディスク方式の場合は、クォーラムディスク自体が故障してしまうと、外部記憶装置の共有ディスクの資源自体は問題がないにも関わらず、共有するデータ資源を利用できない状況となってしまう。
また、上記ノード間通信の形式を採用する従来システムにおいては、プライベートLAN(ノード間通信路)が故障すると複数ノード間の調停ができなくなる。プライベートLANを介した通信が行えずに分断されている状態(スプリットブレイン)となり、業務の処理要求が競合しないように調停することができない。したがって、処理要求が競合しないように運用を継続させるノードを選択し、競合する他のノードは強制的に停止させる必要がある。
【0007】
すなわち、強制停止の機能がない場合、あるいは有っても故障している場合、業務を再開してしまうとデータ破壊を引き起こす。このため、クラスタシステム全体として、ノード間の調停が出きず業務が停止することになる。
上記の問題を解決するため、本発明では、クラスタシステムの各ノード間の通信路の故障によってスプリットブレインの状態が発生した場合において、外部記憶装置内の排他制御を使用して、処理要求が競合しないように共有のデータ資源を保護する技術を提供することを目的としている。
【0008】
【課題を解決するための手段】
第一の発明は、互いに通信路で接続された複数の計算機間で共有する外部記憶装置に排他制御機構を備えたクラスタシステムにおいて、前記通信路の故障によってシステムを構成する計算機群が2つ以上の計算機群に分断された場合に、外部記憶装置の共有データを保護するデータ保護プログラムであって、前記外部記憶装置内に設けられた排他制御を使用して、一旦外部記憶装置へのアクセスを禁止するアクセス禁止ステップと、分断された複数の計算機群からの処理要求を調停し、予め定義されたル−ルに基づいて業務の運用を続行する計算機群を決定する運用決定ステップと、前記計算機に対し運用続行のためのアクセス権をあらためて許可するアクセス解放ステップとを計算機に実行させるデータ保護プログラムに関する。
【0009】
すなわち、第一の発明によれば、複数の計算機間を接続する通信路が切断する障害が生じたときに、計算機から発行されるアクセス禁止命令を、外部記憶装置内の排他制御部において受信して、全ての計算機に対し、一旦アクセスを禁止した上で、運用決定部が、計算機群からの業務続行の処理要求を受けて調停し、定義された設定ルールにしたがって運用を続行すべき計算機群が決定されるため、スプリットブレイン状態で通信路が分断されたままの計算機群において、誤って、複数の計算機からの同時アクセスがあっても、外部記憶装置に保持している共有するデータ資源の破壊を防止することができる。
【0010】
第二の発明は、業務を続行する計算機群を決定する前記運用決定ステップは、複数の計算機群からの要求のうち、最も早く要求した計算機群で業務を続行することを特徴とする上記第一の発明に記載のデータ保護プログラムに関する。
すなわち、第二の発明によれば、運用決定部が、共有ディスクへのアクセスを最も早く処理要求を出した計算機群に決定するため、何はともあれ緊急性を重視した業務の復旧への対応が可能となる。
【0011】
第三の発明は、業務を続行する計算機群を決定する前記運用決定ステップは、複数の計算機群からの要求に、それぞれの計算機群の計算機の数をパラメタとして付加し、計算機の数が最も大きい計算機群で業務を続行することを特徴とする上記第一の発明に記載のデータ保護プログラムに関する。
すなわち、第三の発明によれば、運用決定部が、分断された各計算機群の数をパラメタとして決定することになるため、計算機群の数に比例したボリューム重視の観点からの判定となり、多数の計算機を抱えるクラスタを優先させ、スケーラビリティ(並列度)に重点をおいた解決となる。
【0012】
第四の発明は、業務を続行する計算機群を決定する前記運用決定ステップは、それぞれの計算機で実行されている業務には、業務の運用開始時点で優先度を付加しておき、業務を続行する計算機群を決定する際、複数の計算機群からの要求に、運用中の業務の優先度の総和をパラメタとして付加し、優先度の総和が最も大きい計算機群で業務を続行することを特徴とする上記第一の発明に記載のデータ保護プログラムに関する。
【0013】
すなわち、第四の発明によれば、運用決定部が、決定要素として各計算機が運用している業務の優先度をパラメータとして付加されて優先度の最も大きな計算機群を決定することで、業務の重要性の観点が加味されての判定となり、緊急かつ影響度の大きい業務が加味され、ユーザにより大きな便宜を与える。
【0014】
【発明の実施の形態】
以下、図面にもとづいて本発明の実施形態を説明する。
図1は、本発明の基本システム構成を示す。本システムでは、2つの計算機が1つの外部記憶装置を共有する例で示している。システムは、計算機(ノード)1a、1bと外部記憶装置2で構成され、計算機(ノード)同士は、各ノードの状態を相互に監視し、異常が発生した場合の切り換えなどの制御用としてプライベートLAN(LAN:Local Area Network、内部通信路)5で接続され、計算機(ノード)1a、1bと外部記憶装置2間は、ストレージ用ネットワーク(SAN:Storage Area Network) 6環境となっている。
【0015】
計算機(ノード)1a、1bは、各種業務アプリケーション等、共有ディスク4を利用するデータ利用プログラム10a、10bおよび各計算機から外部記憶装置2にアクセスするI/Oアクセス制御部21a、21bを有するクラスタ制御部20a、20bとを備える。
また、外部記憶装置2内の制御装置3は、ファームウェア30を有し、ファームウェア30内の排他制御部40が、I/O(Input/Output)アクセスの禁止/解放の機能を有している。また、排他制御部40は、アクセス禁止部41、運用決定部42、およびアクセス解放部43で構成される。
【0016】
外部記憶装置2内のファームウェア30におけるI/O解放要求を調停する機能では、2つ以上の計算機(ノード)1a、1bから発行されたI/O解放要求については、一定のルールに基づき一つの要求のみを受け付ける。
なお、外部記憶装置2内の制御装置3は、コンピュータであり、予め内蔵されたプログラムがコンピュータ上で実行され、排他制御部40のアクセス禁止部41、運用決定部42、およびアクセス解放部43の各処理が実現される。そして、当該プログラムは、フロッピーディスク、コンパクトディスク、CD−ROM等のコンピュータ読取可能な記録媒体に記録され、図には示していないが、内蔵あるいは、外部接続された媒体読取装置にセットしインストールすることによって実行可能な状態としてもよい。
【0017】
図2は、本発明の実施の形態になるクラスタシステムの構成を示す。図2以降において、計算機はノードと表現し、複数のノードと外部記憶装置2との通信路の接続状態を模式的に示している。各ノードは、とくに図示していないが、図1の各計算機と同様の構成要素、すなわち、データ利用プログラム、クラスタ制御部、I/Oアクセス制御部を有している。
【0018】
クラスタシステムは、5つのノード1a〜1eで構成された例で示しており、図1と同様に、外部記憶装置2は、I/Oへのアクセス禁止/解放機構を有している。ノード1a〜1eは、プライベートLAN5により相互接続されており、外部記憶装置2へはストレージ用ネットワーク6を経由して接続されている。
プライベートLAN5において、何らかの原因によるノード間通信の不能が検知され、ノード間通信が分断されたスプリットブレイン状態になった場合、各ノード1a〜1eは、I/Oアクセス禁止要求を外部記憶装置2に対して発行する。外部記憶装置2は、I/Oアクセス禁止要求を受けて、全てのノード1a〜1eからのアクセスを禁止状態とする。
【0019】
スプリットブレインの結果、ノード1a〜1eは2つ以上のノード群に分断される。この時、分断されたノード群のそれぞれにおいて、クラスタ制御部が、全てのノード1a〜1eからのアクセスを禁止するよう外部記憶装置2に対して要求する。
その後、各ノードのクラスタ制御部は、分断されたノード群の中で通信し合うことにより、代表ノードを一つ選ぶ。クラスタシステム全体から見ると、代表ノードは分断されたノード群の数だけ選ばれる。代表ノードは、自分の属するノード群を構成するノードについて、I/Oを解放するように外部記憶装置2に対して要求する。そして、外部記憶装置2上のファームウェア30内の排他制御部40では、後述するが、予めいくつかのI/Oへのアクセスルールを設定しておき、その設定ルールにしたがって、アクセス解放要求に対する処理が行われる。
【0020】
例えば、以下の設定ルールが考えられる。
1)複数の代表ノードからのI/O解放要求のうち、最初の要求のみを受け付け、他の要求はエラーとする。
2)I/O解放要求のノード数の情報を付加して発行するようにして、ノード数の最も大きい要求のみを受け付け、他の要求をエラーとする。
3)それぞれのノード群で実行されているデータ利用プログラムに予め与えられている優先度の総和を付加して発行するようにして、優先度の総和が最も大きい要求を受付け、他の要求をエラーとする。
などのアクセスルールが適用される。
【0021】
また、これらの他に、上記優先度とノードの重みを組み合わせた設定ルールとすることも可能である。
以上により、複数に分断されたノード群の中の一つのノード群だけが外部記憶装置2に対してアクセスできるようになり、保留となっていた業務が再開できることになる。
【0022】
なお、この時点で、ノードのデータ利用プログラムが、停止状態であれば、業務再開のためにクラスタ制御部がデータ利用プログラムを起動する。
図3は、本発明の実施の形態になるノード間のプライベートLANに分断が生じたときのクラスタの状態を示す。本図では、プライベートLAN5の一部故障により、スプリットブレインが発生した状態を示しており、ノード群〔1a−1c〕とノード群〔1d−1e〕の間が分断されている例を示している。
【0023】
図4は、本発明の実施の形態になるプライベートLANに分断が発生したときの自ノードから見た相手ノードの状態を示す。図は、自ノードから見て相手ノードとの通信が途絶えて不明状態となったノードをLEFTと記載し、正常に通信できるノードをUPと記載して、相互の通信状態を表したものである。
図5は、本発明の実施の形態になる共有ディスクへのアクセスを復旧させた場合の自ノードに対する相手ノードの状態を示す。各ノードのクラスタ制御部は、図4におけるLEFT状態を検知した時点で、外部記憶装置2のファームウェア30に対して全てのノード1a〜1eからのI/Oへのアクセスを抑止するI/Oアクセス禁止命令を発行する。
【0024】
実施例のスプレットブレインの状態では、ノード群〔1a−1c〕とノード群〔1d−1e〕の二つのノード群に分断されている。その後、分断されたそれぞれのノード群の中で、各ノードのクラスタ制御部は、互いに通信し合うことで代表ノードを一つ選び、その代表ノードが、自分の属するノード群を構成するノードについてのI/O解放要求を外部記憶装置2に対して要求することになる。
【0025】
本実施例では、ノード群〔1a−1c〕の代表ノード、例えば、ノード1aのクラスタ制御部が、外部記憶装置2のファームウエア30に向けて、ノード1a、1b、1cに対するI/Oアクセス解放命令を発行し、この際、ノード数「3」をパラメタとして渡す。
一方、他のノード群〔1d−1e〕の代表ノードにおいても、例えば、ノード1dのクラスタ制御部からノード1d、1eに対するI/Oアクセス解放要求がノード数パラメタ「2」と共に発行される。
【0026】
これらのI/Oアクセス解放要求を受けて、ファームウェア上の排他制御部40は、発行された各群の代表ノードからのI/Oアクセス解放要求のうち、例えば、ノード数の大きい方を成功させ、それ以外の要求をエラーにする処理を行う。これにより、ノード群〔1a−1c〕のI/Oアクセスを復旧させることができる。
【0027】
図6は、本発明の実施の形態になる外部記憶装置へ送信されるノードデータの構造例を示す。本実施例では、故障前のクラスタを構成するノード数を考慮した例で示す。
本クラスタシステムの各ノードは、故障時に、予め保持したノードデータを外部記憶装置2に渡す。図に示すように、外部記憶装置2に送信するノードデータは、以下のようなa、b、c、d、およびeの各フィールドで構成される。
a:I/Oアクセス禁止あるいは解放命令。
b:本データの送信元のノードID(識別子)。例えば、node1aのような文字列で表現。
c:フィールドbにおけるIDを持つノードが、通信可能なノード。例えば、node1a、node1b、node1cなど。
d:フィールドbにおけるIDを持つノードが、クラスタを構成していた元のノード数。
e:ユーザの業務情報を0/1で表現。bで定義されたノードで、ユーザ業務が動作しているか否かを示す。また、重みを設定することも可能。
【0028】
図7は、本発明の実施の形態になるノード群からの要求に対するアクセス優先ルールを示す。設定ルールとして、以下の3つの定義例を示している。
ルール1:ノードの送信データの内、複数のノードからのフィールドaのI/Oアクセス禁止/解放命令を参照し、アクセス時間のより早いノード1にアクセスの解放を決定。
【0029】
ルール2:ノード送信データの内、フィールドa、c、およびdを参照し、cの数/dの数(>=0.5)の値の大きさによって決定。
ルール3:フィールドa、c、d、およびeを参照し、(cの数+cのノードにおけるeの総和)/(dの数+全ノードのeの総和)の値の大きさで決定。
以上、どのルールを適用するかは予め設定される。
【0030】
図8は、本発明の実施の形態になる障害時の共有ディスクにおける処理のフローチャートを示す。
クラスタシステムの各ノード間を接続するインタコネクト5が分断されたときに、まず、外部記憶装置2の排他制御部40のアクセス禁止部41が、ステップS11において、ノード1側のI/Oアクセス制御部からのアクセス禁止命令を受信して、ステップS12で、全てのノードに対し、一旦共有ディスク4へのアクセスを禁止する。
【0031】
つぎに、ステップS13において、運用決定部42が、分断したノード群の代表ノードからアクセスの解放要求を受信し、ステップS14において、予め設定した設定ルール条件への合致を判定し、図7のアクセス優先度の定義ルールに、送信されたノードデータを適用して、条件が合致したアクセス解放要求のノード群を決定し、ステップS15において、図5の内部テーブルに示すように、決定したアクセス解放要求のノード群に属するノードについてはUP、それ以外はDOWNとの値を設定される。その結果として、当該ノード群での業務の続行が再開される。
【0032】
一方、ステップS14で、設定ルールに合致しないときには、ステップS16において、ノードからのアクセスは拒否される。
以上、これまでの実施例では、本発明のデータ保護プログラムは、外部記憶装置側に適用した場合で記述してきたが、勿論、計算機(ノード)側に適用して同様の効果を持たせることも可能である。
【0033】
(付記1) 互いに通信路で接続された複数の計算機間で共有する外部記憶装置に排他制御機構を備えたクラスタシステムにおいて、前記通信路の故障によってシステムを構成する計算機群が2つ以上の計算機群に分断された場合に、外部記憶装置の共有データを保護するデータ保護プログラムであって、
前記外部記憶装置内に設けられた排他制御を使用して、一旦外部記憶装置へのアクセスを禁止するアクセス禁止ステップと、
分断された複数の計算機群からの処理要求を調停し、予め定義されたル−ルに基づいて業務の運用を続行する計算機群を決定する運用決定ステップと、
前記計算機に対し運用続行のためのアクセス権をあらためて許可するアクセス解放ステップと
を計算機に実行させるデータ保護プログラム。
【0034】
(付記2) 業務を続行する計算機群を決定する前記運用決定ステップは、複数の計算機群からの要求のうち、最も早く要求した計算機群で業務を続行することを特徴とする付記1に記載のデータ保護プログラム。
(付記3) 業務を続行する計算機群を決定する前記運用決定ステップは、複数の計算機群からの要求に、それぞれの計算機群の計算機の数をパラメタとして付加し、計算機の数が最も大きい計算機群で業務を続行することを特徴とする付記1に記載のデータ保護プログラム。
【0035】
(付記4) 業務を続行する計算機群を決定する前記運用決定ステップは、それぞれの計算機で実行されている業務には、業務の運用開始時点で優先度を付加しておき、業務を続行する計算機群を決定する際、複数の計算機群からの要求に、運用中の業務の優先度の総和をパラメタとして付加し、優先度の総和が最も大きい計算機群で業務を続行することを特徴とする付記1に記載のデータ保護プログラム。
【0036】
(付記5) 互いに通信路で接続された複数の計算機間で共有する外部記憶装置に排他制御機構を備えたクラスタシステムにおいて、前記通信路の故障によってシステムを構成する計算機群が2つ以上の計算機群に分断された場合に、外部記憶装置の共有データを保護するデータ保護方法であって、
前記外部記憶装置内に設けられた排他制御を使用して、一旦外部記憶装置へのアクセスを禁止するアクセス禁止ステップと、
分断された複数の計算機群からの処理要求を調停し、予め定義されたル−ルに基づいて業務の運用を続行する計算機群を決定する運用決定ステップと、
前記計算機に対し運用続行のためのアクセス権をあらためて許可するアクセス解放ステップと
を有することを特徴とするデータ保護方法。
【0037】
(付記6) 互いに通信路で接続された複数の計算機間で共有する外部記憶装置に排他制御機構を備えたクラスタシステムにおいて、前記通信路の故障によってシステムを構成する計算機群が2つ以上の計算機群に分断された場合に、外部記憶装置の共有データを保護するデータ保護装置であって、
前記外部記憶装置内に設けられた排他制御を使用して、一旦外部記憶装置へのアクセスを禁止するアクセス禁止部と、
分断された複数の計算機群からの処理要求を調停し、予め定義されたル−ルに基づいて業務の運用を続行する計算機群を決定する運用決定部と、
前記計算機に対し運用続行のためのアクセス権をあらためて許可するアクセス解放部と
を有することを特徴とするデータ保護装置。
【0038】
(付記7) 互いに通信路で接続された複数の計算機間で共有する外部記憶装置に排他制御機構を備えたクラスタシステムにおいて、前記通信路の故障によってシステムを構成する計算機群が2つ以上の計算機群に分断された場合に、外部記憶装置の共有データを保護するデータ保護プログラムを記録した記録媒体であって、
前記外部記憶装置内に設けられた排他制御を使用して、一旦外部記憶装置へのアクセスを禁止するアクセス禁止ステップと、
分断された複数の計算機群からの処理要求を調停し、予め定義されたル−ルに基づいて業務の運用を続行する計算機群を決定する運用決定ステップと、
前記計算機に対し運用続行のためのアクセス権をあらためて許可するアクセス解放ステップと
を計算機に実行させるデータ保護プログラムを記録したコンピュータ読取可能な記録媒体。
【0039】
【発明の効果】
以上、説明してきたように、本発明では、複数の計算機(ノード)間を接続する通信路が切断する障害が生じたときに、計算機(ノード)から発行されるアクセス禁止命令を、外部記憶装置内の排他制御部において受信して、全ての計算機(ノード)に対し、一旦アクセスを禁止した上で、運用決定部が、計算機群からの業務続行の処理要求を受けて調停し、定義された設定ルールにしたがって運用を続行すべき計算機群が決定される。
【0040】
このため、スプリットブレイン状態で通信路が分断されたままの計算機群において、誤って、複数の計算機(ノード)からへの同時アクセスがあっても、排他制御することで、外部記憶装置に保持している共有するデータ資源を同時に利用させることはなく、データ破壊を防止することができる。
【図面の簡単な説明】
【図1】本発明になる基本システム構成を示す図である。
【図2】本発明の実施の形態になるクラスタシステムの構成を示す図である。
【図3】本発明の実施の形態になるノード間のプライベートLANに分断が生じたときのクラスタの状態を示す図である。
【図4】本発明の実施の形態になる分断が発生したときの自ノードから見た相手ノードの状態を示す図である。
【図5】本発明の実施の形態になる共有ディスクへのアクセスを復旧させた場合の自ノードに対する相手ノードの状態を示す図である。
【図6】本発明の実施の形態になる外部記憶装置へ送信されるノードデータの構造例を示す図である。
【図7】本発明の実施の形態になるノード群からの要求に対するアクセス優先ルールを示す図である。
【図8】本発明の実施の形態になる障害時の共有ディスクにおける処理のフローチャートを示す図である。
【符号の説明】
1a、1b・・・1e 計算機(ノード)
2 外部記憶装置
3 制御装置
4 共有ディスク
5 プライベートLAN
6 ストレージ用ネットワーク
10a、10b データ利用プログラム
20a、20b クラスタ制御部
21a、21b I/Oアクセス制御部
30 ファームウエア
40 排他制御部
41 アクセス禁止部
42 運用決定部
43 アクセス解放部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an exclusive control technique when a shared disk is accessed from each node in a system (hereinafter referred to as a cluster system) configured to share an external storage device among a plurality of computers (hereinafter referred to as nodes).
[0002]
[Prior art]
A program that operates by accessing shared data in an external storage device on each node in a cluster system (hereinafter referred to as a “data utilization program”) must be accessed simultaneously from multiple nodes. Therefore, if the data for the external storage device is simultaneously updated from the data use program of each node, there is a risk of data destruction.
[0003]
To prevent this, an exclusive control mechanism that checks whether data can be accessed before accessing data from the data usage program at each node and denies access from other nodes while the data is being accessed. Is required.
Conventionally, as a method of arbitrating exclusive control between multiple nodes and protecting data on a shared disk, a quorum disk method (for example, Non-Patent Document 1) that records and arbitrates information on a disk of an external storage device, or between multiple nodes There is a private LAN (Local Area Network) method (for example, Patent Document 1) that uses a private communication path to communicate with each other and arbitrate, and arbitration is performed by an exclusive control program installed in each node. .
[0004]
[Non-Patent Document 1]
Windows 2000 World, February 2001, p. 25-26
[0005]
[Patent Document 1]
JP-A-7-306837 (pages 2 and 3)
[0006]
[Problems to be solved by the invention]
However, in the case of the quorum disk method described above, if the quorum disk itself fails, the shared disk resource itself of the external storage device has no problem, but the shared data resource cannot be used. .
Further, in a conventional system that employs the above-described inter-node communication format, arbitration between a plurality of nodes becomes impossible if a private LAN (inter-node communication path) fails. Communication via the private LAN cannot be performed and the state is divided (split brain), and arbitration cannot be performed so that business processing requests do not compete. Therefore, it is necessary to select a node to continue operation so that processing requests do not compete, and forcibly stop other competing nodes.
[0007]
In other words, if there is no forced stop function, or if there is a failure, resuming the operation causes data destruction. For this reason, as a whole cluster system, arbitration between nodes does not occur, and the business is stopped.
In order to solve the above problem, in the present invention, when a split brain state occurs due to a failure of a communication path between nodes in a cluster system, processing requests compete using exclusive control in the external storage device. It aims to provide a technology that protects shared data resources.
[0008]
[Means for Solving the Problems]
According to a first aspect of the present invention, there is provided a cluster system including an exclusive control mechanism in an external storage device shared between a plurality of computers connected to each other via a communication path, wherein two or more computers are included in the system due to the communication path failure. A data protection program for protecting shared data in an external storage device when it is divided into a group of computers using the exclusive control provided in the external storage device to temporarily access the external storage device An access prohibiting step to be prohibited, an operation determining step for arbitrating processing requests from a plurality of divided computer groups, and determining a computer group for continuing business operations based on a predefined rule; and The present invention relates to a data protection program for causing a computer to execute an access release step for renewing an access right to continue operation.
[0009]
That is, according to the first invention, when a failure occurs that disconnects a communication path connecting a plurality of computers, the exclusive control unit in the external storage device receives an access prohibition instruction issued from the computer. The computer group to which access should be prohibited for all computers and the operation decision unit should arbitrate in response to the processing request for business continuation from the computer group and continue operation according to the defined setting rules. Therefore, in the group of computers whose communication paths are divided in the split brain state, even if there is an accidental simultaneous access from multiple computers, the shared data resources held in the external storage device Destruction can be prevented.
[0010]
According to a second aspect of the present invention, in the operation determining step for determining a computer group to continue business, the business is continued with the computer group that has been requested earliest among requests from a plurality of computer groups. The present invention relates to a data protection program described in the invention.
That is, according to the second invention, since the operation determining unit determines the computer group that has issued the processing request earliest to access the shared disk, anyway, it is possible to cope with the recovery of the business with an emphasis on urgency. It becomes possible.
[0011]
In the third aspect of the invention, the operation determining step for determining a computer group to continue the operation adds the number of computers of each computer group as a parameter to a request from a plurality of computer groups, and the number of computers is the largest. The present invention relates to the data protection program according to the first invention, wherein the business is continued in a computer group.
That is, according to the third invention, since the operation determining unit determines the number of divided computer groups as a parameter, the determination is made from the viewpoint of emphasizing the volume in proportion to the number of computer groups. Priority will be given to clusters with multiple computers, and the solution will be focused on scalability.
[0012]
According to a fourth aspect of the present invention, in the operation determining step for determining a computer group to continue the business, a priority is added to the business being executed on each computer at the time of starting the business operation, and the business is continued. When deciding which computer group to use, the total priority of tasks in operation is added as a parameter to requests from multiple computer groups, and the business continues with the computer group with the highest total priority. The present invention relates to the data protection program described in the first invention.
[0013]
That is, according to the fourth invention, the operation determining unit adds the priority of the operation operated by each computer as a determination element as a parameter and determines the computer group having the highest priority, thereby Judgment is made taking into account the importance, and urgent and high-impact work is taken into account, giving the user greater convenience.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 shows the basic system configuration of the present invention. This system shows an example in which two computers share one external storage device. The system is composed of computers (nodes) 1a and 1b and an external storage device 2. The computers (nodes) mutually monitor the status of each node, and use a private LAN for control such as switching when an abnormality occurs. (LAN: Local Area Network, internal communication path) 5, and between the computers (nodes) 1 a, 1 b and the external storage device 2, there is a storage network (SAN: 6 Storage Area Network) environment.
[0015]
The computers (nodes) 1a and 1b have cluster control including data utilization programs 10a and 10b that use the shared disk 4, such as various business applications, and I / O access control units 21a and 21b that access the external storage device 2 from each computer. Parts 20a and 20b.
The control device 3 in the external storage device 2 has firmware 30, and the exclusive control unit 40 in the firmware 30 has a function of prohibiting / releasing I / O (Input / Output) access. The exclusive control unit 40 includes an access prohibition unit 41, an operation determination unit 42, and an access release unit 43.
[0016]
In the function of arbitrating the I / O release request in the firmware 30 in the external storage device 2, the I / O release request issued from two or more computers (nodes) 1a and 1b is one based on a certain rule. Accept requests only.
Note that the control device 3 in the external storage device 2 is a computer, and a preinstalled program is executed on the computer, and the access prohibition unit 41, the operation determination unit 42, and the access release unit 43 of the exclusive control unit 40 are executed. Each processing is realized. The program is recorded on a computer-readable recording medium such as a floppy disk, a compact disk, or a CD-ROM. Although not shown in the figure, the program is installed in a built-in or externally connected medium reader. It is good also as an executable state.
[0017]
FIG. 2 shows a configuration of a cluster system according to the embodiment of the present invention. In FIG. 2 and subsequent figures, the computer is expressed as a node, and the connection state of the communication path between the plurality of nodes and the external storage device 2 is schematically shown. Although not shown in particular, each node has the same components as each computer in FIG. 1, that is, a data use program, a cluster control unit, and an I / O access control unit.
[0018]
The cluster system is shown as an example composed of five nodes 1a to 1e. Similarly to FIG. 1, the external storage device 2 has an I / O access prohibition / release mechanism. The nodes 1a to 1e are interconnected by a private LAN 5, and are connected to the external storage device 2 via a storage network 6.
In the private LAN 5, when the inability to communicate between nodes due to some cause is detected and the split brain state is established in which the communication between the nodes is divided, each of the nodes 1a to 1e sends an I / O access prohibition request to the external storage device 2. To issue. In response to the I / O access prohibition request, the external storage device 2 prohibits access from all the nodes 1a to 1e.
[0019]
As a result of the split brain, the nodes 1a to 1e are divided into two or more node groups. At this time, in each of the divided node groups, the cluster control unit requests the external storage device 2 to prohibit access from all the nodes 1a to 1e.
Thereafter, the cluster control unit of each node selects one representative node by communicating with each other in the divided node group. From the viewpoint of the entire cluster system, representative nodes are selected by the number of divided node groups. The representative node requests the external storage device 2 to release I / O for the nodes constituting the node group to which the representative node belongs. As will be described later, in the exclusive control unit 40 in the firmware 30 on the external storage device 2, access rules for some I / Os are set in advance, and processing for access release requests is performed according to the setting rules. Is done.
[0020]
For example, the following setting rule can be considered.
1) Of the I / O release requests from a plurality of representative nodes, only the first request is accepted, and the other requests are errors.
2) The information on the number of nodes in the I / O release request is added and issued so that only the request having the largest number of nodes is accepted and other requests are regarded as errors.
3) By adding the priority sum given in advance to the data utilization program executed in each node group and issuing it, the request with the highest priority sum is accepted, and other requests are in error. And
Access rules such as are applied.
[0021]
In addition to these, a setting rule in which the priority and the node weight are combined may be used.
As described above, only one node group among the plurality of divided node groups can access the external storage device 2, and the suspended work can be resumed.
[0022]
At this point, if the data utilization program of the node is in a stopped state, the cluster control unit activates the data utilization program in order to resume the business.
FIG. 3 shows the state of the cluster when the private LAN between nodes according to the embodiment of the present invention is divided. This figure shows a state where a split brain has occurred due to a partial failure of the private LAN 5, and shows an example in which the node group [1a-1c] and the node group [1d-1e] are divided. .
[0023]
FIG. 4 shows the state of the counterpart node as seen from the local node when a fragmentation occurs in the private LAN according to the embodiment of the present invention. In the figure, a node in which communication with the counterpart node is lost due to the disconnection from the own node is described as LEFT, a node capable of normal communication is described as UP, and the mutual communication state is represented. .
FIG. 5 shows the state of the counterpart node relative to the own node when the access to the shared disk according to the embodiment of the present invention is restored. When the cluster control unit of each node detects the LEFT state in FIG. 4, the I / O access that suppresses access to the I / O from all the nodes 1 a to 1 e for the firmware 30 of the external storage device 2. Issue a prohibition order.
[0024]
In the state of the spread brain of the embodiment, the node group is divided into two node groups, a node group [1a-1c] and a node group [1d-1e]. After that, among each divided node group, the cluster control unit of each node selects one representative node by communicating with each other, and the representative node selects the node constituting the node group to which it belongs. An I / O release request is issued to the external storage device 2.
[0025]
In this embodiment, the representative node of the node group [1a-1c], for example, the cluster control unit of the node 1a releases the I / O access to the nodes 1a, 1b, 1c toward the firmware 30 of the external storage device 2. An instruction is issued, and at this time, the number of nodes “3” is passed as a parameter.
On the other hand, also in the representative nodes of the other node group [1d-1e], for example, an I / O access release request for the nodes 1d and 1e is issued from the cluster control unit of the node 1d together with the node number parameter “2”.
[0026]
Upon receiving these I / O access release requests, the exclusive control unit 40 on the firmware makes the issued I / O access release requests from the representative nodes of each group succeed, for example, the one with the larger number of nodes. , Process to make other requests an error. Thereby, the I / O access of the node group [1a-1c] can be restored.
[0027]
FIG. 6 shows an example of the structure of node data transmitted to the external storage device according to the embodiment of the present invention. In this embodiment, an example in which the number of nodes constituting the cluster before the failure is taken into consideration is shown.
Each node of the cluster system passes node data stored in advance to the external storage device 2 at the time of failure. As shown in the figure, the node data transmitted to the external storage device 2 is composed of the following fields a, b, c, d, and e.
a: I / O access prohibition or release instruction.
b: Node ID (identifier) of the transmission source of this data. For example, it is expressed by a character string such as node1a.
c: A node with which the node having the ID in the field b can communicate. For example, node1a, node1b, node1c, etc.
d: The number of original nodes in which the node having the ID in the field b constitutes the cluster.
e: Represent user's business information in 0/1. Indicates whether or not a user job is operating on the node defined in b. It is also possible to set the weight.
[0028]
FIG. 7 shows an access priority rule for a request from a node group according to the embodiment of the present invention. The following three definition examples are shown as setting rules.
Rule 1: With reference to the I / O access prohibition / release command of field a from a plurality of nodes in the transmission data of the node, the node 1 whose access time is earlier is determined to release the access.
[0029]
Rule 2: Refers to the fields a, c, and d in the node transmission data, and is determined by the size of the number of c / number of d (> = 0.5).
Rule 3: Refers to fields a, c, d, and e, and is determined by the magnitude of the value of (number of c + total of e in nodes of c) / (number of d + total of e of all nodes).
As described above, which rule is applied is set in advance.
[0030]
FIG. 8 shows a flowchart of processing in the shared disk at the time of failure according to the embodiment of the present invention.
When the interconnect 5 connecting the nodes of the cluster system is disconnected, first, the access prohibition unit 41 of the exclusive control unit 40 of the external storage device 2 performs I / O access control on the node 1 side in step S11. In step S12, access to the shared disk 4 is temporarily prohibited for all nodes.
[0031]
Next, in step S13, the operation determining unit 42 receives an access release request from the representative node of the divided node group. In step S14, the operation determining unit 42 determines that the preset setting rule condition is met, and the access shown in FIG. By applying the transmitted node data to the priority definition rule, the node group of the access release request that matches the condition is determined. In step S15, as shown in the internal table of FIG. 5, the determined access release request is determined. The value belonging to the node group of UP is set to UP, and the value other than that is set to DOWN. As a result, the continuation of business in the node group is resumed.
[0032]
On the other hand, if the setting rule is not met in step S14, access from the node is denied in step S16.
As described above, in the embodiments so far, the data protection program of the present invention has been described as applied to the external storage device side, but of course, it may be applied to the computer (node) side to have the same effect. Is possible.
[0033]
(Appendix 1) In a cluster system in which an external storage device shared by a plurality of computers connected to each other via a communication path is provided with an exclusive control mechanism, the computer group constituting the system due to a failure in the communication path includes two or more computers A data protection program for protecting shared data in an external storage device when divided into groups,
An access prohibiting step for temporarily prohibiting access to the external storage device using exclusive control provided in the external storage device;
An operation determination step for arbitrating processing requests from a plurality of divided computer groups and determining a computer group for continuing the operation of the business based on a predefined rule;
A data protection program for causing a computer to execute an access release step for renewing an access right for continuing operation to the computer.
[0034]
(Additional remark 2) The said operation determination step which determines the computer group which continues business performs the business by the computer group requested | required earliest among the requests from several computer groups, The additional description 1 characterized by the above-mentioned. Data protection program.
(Additional remark 3) The said operation determination step which determines the computer group which continues business adds the number of computers of each computer group to the request | requirement from several computer groups as a parameter, and the computer group with the largest number of computers The data protection program according to appendix 1, wherein the business is continued at
[0035]
(Supplementary Note 4) In the operation determination step for determining a computer group to continue the business, a priority is added to the business being executed on each computer at the time of starting the business operation, and the computer to continue the business. Addendum characterized in that when determining a group, the sum of the priorities of the tasks in operation is added as a parameter to requests from multiple computer groups, and the task is continued on the computer group with the highest sum of priorities. The data protection program according to 1.
[0036]
(Supplementary Note 5) In a cluster system in which an exclusive control mechanism is provided in an external storage device shared between a plurality of computers connected to each other via a communication path, the computer group constituting the system due to a failure in the communication path includes two or more computers A data protection method for protecting shared data in an external storage device when divided into groups,
An access prohibiting step for temporarily prohibiting access to the external storage device using exclusive control provided in the external storage device;
An operation determination step for arbitrating processing requests from a plurality of divided computer groups and determining a computer group for continuing the operation of the business based on a predefined rule;
An access release step of re-permitting an access right for continuing operation to the computer.
[0037]
(Supplementary Note 6) In a cluster system in which an external storage device shared by a plurality of computers connected to each other via a communication path is provided with an exclusive control mechanism, the computer group constituting the system due to a failure in the communication path includes two or more computers A data protection device that protects shared data in an external storage device when divided into groups,
Using the exclusive control provided in the external storage device, an access prohibition unit that temporarily prohibits access to the external storage device;
An operation determining unit that arbitrates processing requests from a plurality of divided computer groups and determines a computer group to continue the operation of the business based on a predefined rule;
A data protection apparatus, comprising: an access release unit that re-permits an access right for continuing operation to the computer.
[0038]
(Supplementary note 7) In a cluster system having an exclusive control mechanism in an external storage device shared between a plurality of computers connected to each other via a communication path, the computer group constituting the system due to a failure in the communication path includes two or more computers A recording medium recording a data protection program for protecting shared data of an external storage device when divided into groups,
An access prohibiting step for temporarily prohibiting access to the external storage device using exclusive control provided in the external storage device;
An operation determination step for arbitrating processing requests from a plurality of divided computer groups and determining a computer group for continuing the operation of the business based on a predefined rule;
A computer-readable recording medium having recorded thereon a data protection program for causing the computer to execute an access release step for re-permitting an access right for continuing operation to the computer.
[0039]
【The invention's effect】
As described above, according to the present invention, an access prohibition instruction issued from a computer (node) is issued to an external storage device when a failure occurs in which a communication path connecting a plurality of computers (nodes) is disconnected. Defined by the exclusive control unit in the system, once access to all computers (nodes) is prohibited, the operation decision unit arbitrates in response to the processing request for business continuation from the computer group and is defined. A computer group to continue operation is determined according to the setting rule.
[0040]
For this reason, even in the case of simultaneous access to multiple computers (nodes) by mistake in a computer group in which the communication path is divided in the split brain state, it is retained in the external storage device by exclusive control. The shared data resources are not used at the same time, and data destruction can be prevented.
[Brief description of the drawings]
FIG. 1 is a diagram showing a basic system configuration according to the present invention.
FIG. 2 is a diagram showing a configuration of a cluster system according to the embodiment of the present invention.
FIG. 3 is a diagram showing a state of a cluster when a division occurs in a private LAN between nodes according to an embodiment of the present invention.
FIG. 4 is a diagram showing a state of a counterpart node viewed from the own node when a division according to an embodiment of the present invention occurs.
FIG. 5 is a diagram showing a state of a counterpart node with respect to the own node when access to a shared disk according to an embodiment of the present invention is restored;
FIG. 6 is a diagram showing a structure example of node data transmitted to the external storage device according to the embodiment of the present invention.
FIG. 7 is a diagram illustrating an access priority rule for a request from a node group according to the embodiment of this invention.
FIG. 8 is a diagram showing a flowchart of processing in the shared disk at the time of failure according to the embodiment of the present invention;
[Explanation of symbols]
1a, 1b ... 1e Computer (node)
2 External storage device 3 Control device 4 Shared disk 5 Private LAN
6 Storage network 10a, 10b Data utilization program 20a, 20b Cluster control unit 21a, 21b I / O access control unit 30 Firmware 40 Exclusive control unit 41 Access prohibition unit 42 Operation decision unit 43 Access release unit

Claims (5)

互いに通信路で接続された複数の計算機間で共有する外部記憶装置に排他制御機構を備えたクラスタシステムにおいて、前記通信路の故障によってシステムを構成する計算機群が2つ以上の計算機群に分断された場合に、外部記憶装置の共有データを保護するデータ保護プログラムであって、
前記外部記憶装置内に設けられた排他制御を使用して、一旦外部記憶装置へのアクセスを禁止するアクセス禁止ステップと、
分断された複数の計算機群からの処理要求を調停し、予め定義されたル−ルに基づいて業務の運用を続行する計算機群を決定する運用決定ステップと、
前記計算機に対し運用続行のためのアクセス権をあらためて許可するアクセス解放ステップと
を計算機に実行させるデータ保護プログラム。
In a cluster system having an exclusive control mechanism in an external storage device shared between a plurality of computers connected to each other via a communication channel, the computer group constituting the system is divided into two or more computer groups due to the failure of the communication channel. A data protection program for protecting the shared data of the external storage device,
An access prohibiting step for temporarily prohibiting access to the external storage device using exclusive control provided in the external storage device;
An operation determination step for arbitrating processing requests from a plurality of divided computer groups and determining a computer group for continuing the operation of the business based on a predefined rule;
A data protection program for causing a computer to execute an access release step for renewing an access right for continuing operation to the computer.
業務を続行する計算機群を決定する前記運用決定ステップは、複数の計算機群からの要求のうち、最も早く要求した計算機群で業務を続行することを特徴とする請求項1に記載のデータ保護プログラム。2. The data protection program according to claim 1, wherein the operation determining step of determining a computer group to continue the business continues the business with the computer group that has requested the earliest among requests from a plurality of computer groups. . 業務を続行する計算機群を決定する前記運用決定ステップは、複数の計算機群からの要求に、それぞれの計算機群の計算機の数をパラメタとして付加し、計算機の数が最も大きい計算機群で業務を続行することを特徴とする請求項1に記載のデータ保護プログラム。In the operation determining step for determining the computer group to continue the operation, the number of computers in each computer group is added as a parameter to the request from the plurality of computer groups, and the operation is continued in the computer group having the largest number of computers. The data protection program according to claim 1, wherein: 業務を続行する計算機群を決定する前記運用決定ステップは、それぞれの計算機で実行されている業務には、業務の運用開始時点で優先度を付加しておき、業務を続行する計算機群を決定する際、複数の計算機群からの要求に、運用中の業務の優先度の総和をパラメタとして付加し、優先度の総和が最も大きい計算機群で業務を続行することを特徴とする請求項1に記載のデータ保護プログラム。In the operation determining step for determining a computer group to continue the business, a priority is added to the business being executed on each computer at the time of starting the business operation, and the computer group to continue the business is determined. 2. The process according to claim 1, wherein a total sum of priorities of operations in operation is added as a parameter to requests from a plurality of computer groups, and the business is continued with a computer group having the largest sum of priorities. Data protection program. 互いに通信路で接続された複数の計算機間で共有する外部記憶装置に排他制御機構を備えたクラスタシステムにおいて、前記通信路の故障によってシステムを構成する計算機群が2つ以上の計算機群に分断された場合に、外部記憶装置の共有データを保護するデータ保護方法であって、
前記外部記憶装置内に設けられた排他制御を使用して、一旦外部記憶装置へのアクセスを禁止するアクセス禁止ステップと、
分断された複数の計算機群からの処理要求を調停し、予め定義されたル−ルに基づいて業務の運用を続行する計算機群を決定する運用決定ステップと、
前記計算機に対し運用続行のためのアクセス権をあらためて許可するアクセス解放ステップと
を有することを特徴とするデータ保護方法。
In a cluster system having an exclusive control mechanism in an external storage device shared between a plurality of computers connected to each other via a communication channel, the computer group constituting the system is divided into two or more computer groups due to the failure of the communication channel. A data protection method for protecting the shared data of the external storage device,
An access prohibiting step for temporarily prohibiting access to the external storage device using exclusive control provided in the external storage device;
An operation determination step for arbitrating processing requests from a plurality of divided computer groups and determining a computer group for continuing the operation of the business based on a predefined rule;
An access release step of re-permitting an access right for continuing operation to the computer.
JP2003187225A 2003-06-30 2003-06-30 Data protecting program and method in external storage device shared by plural computer Pending JP2005025289A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003187225A JP2005025289A (en) 2003-06-30 2003-06-30 Data protecting program and method in external storage device shared by plural computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003187225A JP2005025289A (en) 2003-06-30 2003-06-30 Data protecting program and method in external storage device shared by plural computer

Publications (1)

Publication Number Publication Date
JP2005025289A true JP2005025289A (en) 2005-01-27

Family

ID=34186143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003187225A Pending JP2005025289A (en) 2003-06-30 2003-06-30 Data protecting program and method in external storage device shared by plural computer

Country Status (1)

Country Link
JP (1) JP2005025289A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011186609A (en) * 2010-03-05 2011-09-22 Nippon Telegr & Teleph Corp <Ntt> Highly available system, server, method for maintaining high availability, and program
JP2014106862A (en) * 2012-11-29 2014-06-09 Taiyo Nippon Sanso Corp Redundant system and redundancy method
JP2015057692A (en) * 2013-09-16 2015-03-26 アクシス アーベー Consensus loss in distributed control system
JP2015215754A (en) * 2014-05-09 2015-12-03 日本電信電話株式会社 CLUSTER SYSTEM AND Split-BrainSyndrome GENERATION PREVENTION METHOD

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011186609A (en) * 2010-03-05 2011-09-22 Nippon Telegr & Teleph Corp <Ntt> Highly available system, server, method for maintaining high availability, and program
JP2014106862A (en) * 2012-11-29 2014-06-09 Taiyo Nippon Sanso Corp Redundant system and redundancy method
JP2015057692A (en) * 2013-09-16 2015-03-26 アクシス アーベー Consensus loss in distributed control system
KR101809994B1 (en) * 2013-09-16 2017-12-18 엑시스 에이비 Consensus loss in distributed control systems
JP2015215754A (en) * 2014-05-09 2015-12-03 日本電信電話株式会社 CLUSTER SYSTEM AND Split-BrainSyndrome GENERATION PREVENTION METHOD

Similar Documents

Publication Publication Date Title
US10235077B2 (en) Resource arbitration for shared-write access via persistent reservation
EP2350849B1 (en) Resource arbitration for shared-write access via persistent reservation
JP4506594B2 (en) Redundant path control method
US6112263A (en) Method for multiple independent processes controlling access to I/O devices in a computer system
US6675268B1 (en) Method and apparatus for handling transfers of data volumes between controllers in a storage environment having multiple paths to the data volumes
JP4492084B2 (en) Storage path control method
US7619965B2 (en) Storage network management server, storage network managing method, storage network managing program, and storage network management system
US7984133B2 (en) Computer and access control method in a computer
JP2009025965A (en) Computer system and method for autonomously changing succession destination in fail-over
JP2006285810A (en) Cluster configuration computer system and system reset method therefor
JP4175083B2 (en) Storage device management computer and program
JP2005025289A (en) Data protecting program and method in external storage device shared by plural computer
JP4568021B2 (en) Computer system that operates the command multiple number monitoring control system
WO2019223445A1 (en) Hard disk read-write control method and apparatus, electronic device and storage medium
US7636822B2 (en) Method of checking the topology of remote copy
JPH11353292A (en) Cluster system and its fail over control method
JP5810051B2 (en) Network system and configuration definition setting method in network system
JP6005668B2 (en) Computer system and logical storage area management method
JP2006302191A (en) Database management system and access control method
JP2005331999A (en) Method for control of input/output from/to external storage device
JP2006048557A (en) System for adding server using duplex writing magnetic disk device
Guide FICON

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060525

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080724

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080909