JPH103396A - 二重化制御障害復旧方式 - Google Patents

二重化制御障害復旧方式

Info

Publication number
JPH103396A
JPH103396A JP8153639A JP15363996A JPH103396A JP H103396 A JPH103396 A JP H103396A JP 8153639 A JP8153639 A JP 8153639A JP 15363996 A JP15363996 A JP 15363996A JP H103396 A JPH103396 A JP H103396A
Authority
JP
Japan
Prior art keywords
volume
failure
fault
input
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8153639A
Other languages
English (en)
Inventor
Mitsuhiro Yamada
光広 山田
Masaya Kazeto
正哉 風戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
NEC Corp
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solution Innovators Ltd filed Critical NEC Corp
Priority to JP8153639A priority Critical patent/JPH103396A/ja
Publication of JPH103396A publication Critical patent/JPH103396A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 二重化ボリュームに対して障害が発生した場
合に、人手の介入なしで障害範囲に応じた復旧を行うこ
とで、二重化片系閉塞の時間を極力無くし、両系正常な
状態を維持すること。 【解決手段】 二重化制御下のボリューム1に対して、
定期的に入出力を行い障害発生を監視する二重化監視入
出力手段4と、障害情報3を取得して入出力を行い、入
出力で障害が発生した場合の制御を行う入出力制御手段
5と、障害箇所の範囲を限定して障害箇所の使用制限を
障害情報3に登録依頼する障害領域限定手段6と、障害
領域交換手段7と、正常系から障害系にデータを複写し
てその間の利用者の入出力と複写の入出力との同期制御
を行う二重化複写手段8と、障害情報管理手段9と、を
有することを特徴とする二重化制御障害復旧方式。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、二重化ボリューム
に対しての障害検出及び障害範囲に応じた復旧方式に関
する。
【0002】
【従来の技術】特開平5−189168号公報を、従来
の技術として説明する。
【0003】従来の二重化ボリューム制御では、障害の
検出を利用者の入出力によって検出し、障害が発生した
箇所の復旧を自動的に行い、正常な二重化状態に回復す
る。障害箇所がボリューム障害であった場合は、障害が
存在するボリュームを閉塞として操作員が代替ボリュー
ムの組み込み要求及び複写の要求を行うことで正常な二
重化状態に回復する。
【0004】以下に障害検出から復旧までの一例を記述
する。
【0005】利用者の入出力エラーが発生することを契
機に障害検出処理が動作し自動復旧処理を起動する。自
動復旧処理は障害箇所が回復可能か判断し、回復不可能
と判断した場合は、代替領域を同一ボリューム内から取
得して割り当てデータの複写を行う。代替領域の取得に
失敗した場合は、ボリューム障害(閉塞)として障害情
報に登録して、入出力をそのボリュームには行わないよ
うに制御する。操作員は二重化ボリュームが閉塞となっ
たら、代替ボリュームを探して障害ボリュームとの交換
とデータの複写を行うサービスプログラムを実行するこ
とで復旧を行う。
【0006】
【発明が解決しようとする課題】第1の問題点は、ボリ
ュームの閉塞が行われてから復旧が開始されるまでの時
間が大幅に必要となり、片系障害の時間が長引き、信頼
性の低下につながっていた。
【0007】その理由は、ボリューム閉塞になると操作
員が復旧を行うまで閉塞のままであったためである。
【0008】第2の問題点は、操作ミス等による二次障
害の危険性もあった。
【0009】その理由は、操作員が復旧の開始を行って
いたためである。
【0010】第3の問題点は、障害の発生で利用者の業
務が停止する恐れがあった。
【0011】その理由は、障害の存在に利用者の入出力
が行われるまで気づかなかったためである。
【0012】[目的]本発明の目的は、二重化ボリュー
ムに対して障害が発生した場合に、人手の介入なしで障
害範囲に応じた復旧を行うことで、二重化片系閉塞の時
間を極力無くし、両系正常な状態を維持することを目的
とする。
【0013】
【課題を解決するための手段】本発明は、上述した課題
を解決するための手段として、定期的に二重化ボリュー
ムに入出力を行い障害発生を監視する障害監視入出力手
段と、障害箇所の範囲の限定を行い障害範囲に応じた復
旧処理を起動する障害範囲限定手段と、ボリューム障害
でない場合は代替領域との交換を行い、ボリューム障害
の場合は空きボリュームを検索し障害ボリュームと交換
を行う代替領域交換手段と、障害箇所の交換終了後起動
され正常なデータを交換した領域あるいはボリュームに
複写するデータ複写手段と、複写の入出力と利用者の入
出力を平行して行うための入出力同期制御手段と、障害
情報の管理を行う障害情報管理手段を備えていて、全て
自動的に動作することを特徴とする。
【0014】[作用]本発明によれば、二重化ボリュー
ムに定期的に入出力を行い、障害が発生した場合に障害
範囲の限定を行い、ボリューム障害であったら空きボリ
ュームの検索を行って障害ボリュームと交換し、ボリュ
ーム障害でない場合は代替領域を割り当て、正常なボリ
ュームから利用者の入出力を停止せずにデータを複写し
て、正常な二重化状態に自動復旧することにより、ま
ず、ボリューム閉塞になると操作員が復旧を行うまで閉
塞のままであるということがなくなるため、ボリューム
の閉塞が行われてから復旧が開始されるまでの時間が大
幅に短縮され、片系障害の時間が短縮され、信頼性が向
上する。
【0015】また、操作員が復旧の開始を行うことがな
いため、操作ミス等による二次障害の発生がなくなる。
【0016】また、障害の存在に利用者の入出力が行わ
れるまで気づかないということがなくなるため、障害の
発生で利用者の業務が停止することがなくなる。
【0017】
【発明の実施の形態】次に、本発明の実施の形態につい
て、図1を参照して詳細に説明する。
【0018】正系ボリュームと副系ボリュームで構成さ
れている二重化ボリューム1と、システム内のボリュー
ムで未使用である空きボリューム2と、二重化ボリュー
ム1の障害情報を記憶する障害情報3と、二重化ボリュ
ーム1の障害の早期検出を行うため二重化ボリューム1
に監視用の入出力を定期的に行う二重化監視入出力手段
4と、二重化ボリューム1の障害情報の登録依頼を受け
たら障害情報3に指定された情報を登録する障害情報登
録処理91と二重化ボリューム1の障害情報の削除依頼
を受けたら障害情報3から指定された情報を削除する障
害情報削除処理92と二重化ボリューム1の障害情報の
参照依頼を受けたら障害情報3から指定されたボリュー
ムの情報を返却する障害情報参照処理93を有する障害
情報管理手段9と、二重化ボリューム1に対する入出力
を障害情報3の情報を参照して両系正常なら入力はどち
らか一方に出力は両系に行い、片系に障害が存在したら
入出力は正常な系にだけ行うように制御を行う入出力制
御と、入出力エラーとなった場合に障害回復処理を起動
する入出力エラー制御処理52を有する入出力制御手段
5と、入出力エラー制御処理52により起動され障害箇
所の検査および代替領域の有無を調査して障害箇所を限
定する障害箇所限定処理61と限定した障害範囲を障害
情報3に登録依頼する障害情報登録依頼処理62を有す
る障害領域限定手段6と、障害の範囲がボリューム全体
に及ぶものであった時に空きボリューム2を検索して障
害ボリュームとの交換を行う空きボリューム検索/交換
処理71と障害が一部の範囲に限定されたものであった
時にそのボリューム内から代替領域を割り当てる代替領
域取得処理72を有する障害領域交換手段7と、交換し
た領域あるいはボリュームに正常なボリュームからデー
タを複写するデータ複写処理82と利用者の入出力と複
写の入出力とを平行して実行することを可能にするため
の制御を行う複写同期制御処理81とデータの複写が正
常に終了した時に障害情報管理手段9に障害情報3から
二重化ボリューム1の情報の削除を依頼する障害情報削
除依頼処理83を有する二重化複写手段8とで構成され
ている。
【0019】以下に障害発生から二重化正常状態に復旧
するまでの動作を説明する。
【0020】二重化監視入出力手段4で二重化ボリュー
ム1に定期的に入力を行う。
【0021】二重化ボリューム1で入出力エラーが発生
すると入出力制御処理51から入出力エラー制御処理5
2に制御が移行して障害箇所限定処理61を起動する。
【0022】起動された障害箇所限定処理61は障害箇
所へのテスト入力と代替領域の有無を確認して障害範囲
を限定して、障害情報登録依頼処理62で障害情報3へ
の登録を依頼して、ボリューム障害の場合は空きボリュ
ーム検索/交換処理71を起動して、ボリュームの一部
の障害の場合は代替領域取得処理72を起動する。
【0023】障害情報の登録依頼がされると障害情報登
録処理91が動作して障害情報3に指定された情報を登
録する。入出力制御処理51では二重化ボリューム1に
入出力を行う時は、障害情報3から二重化ボリューム1
の情報を参照して、ボリューム障害の場合は、正常なボ
リュームにだけ入出力を行い、ボリュームの一部の障害
であった場合は、入出力の箇所と一致したら正常なボリ
ュームにだけ入出力を行い、障害の箇所と入出力の箇所
が一致しなかったら両系に入出力を行う。
【0024】空きボリューム検索/交換処理71が起動
されたらシステム内のファイルが作成されていない空き
ボリューム2を検索して障害ボリュームとの交換を行
い、障害ボリュームの切り離しを行う。
【0025】代替領域取得処理72が起動されたら障害
が発生したボリューム内から代替領域を取得して障害領
域との交換を行う。代替領域の取得に失敗した場合は、
ボリューム障害の登録を、障害情報登録処理91に依頼
して空きボリューム検索/交換処理71を起動する。
【0026】空きボリューム検索/交換処理71と代替
領域取得処理72が終了したら起動されるデータ複写処
理82は正常なボリュームから空きボリューム検索/交
換処理71で交換したボリュームあるいは代替領域取得
処理72で交換した領域へのデータの複写を行う。
【0027】複写の入出力と利用者の入出力を平行して
実行するために複写同期制御処理81で制御を行う。デ
ータ複写処理82が正常終了したら二重化ボリューム1
の障害情報の削除依頼を障害情報削除依頼処理83が行
う。
【0028】障害情報の削除依頼がされたら障害情報削
除処理92が動作して障害情報3から指定された情報を
削除する。これにより入出力制御処理51では二重化ボ
リュームの両系に入出力を行う。
【0029】以上のような動作で、障害監視の為の入出
力を定期的に行い、障害が発生したら障害の範囲によっ
て代替領域あるいは空きボリュームとの交換を行い、利
用者の入出力と平行してデータの複写を行って正常な二
重化ボリュームに自動的に復旧を行う。
【0030】[実施例1]本発明の実施例として、二重
化ボリュームに対して入力障害が発生して復旧が完了す
るまでの動作について、図1の構成図と図2〜図6のフ
ロー図を使用して説明する。
【0031】二重化監視入出力手段4で二重化ボリュー
ム1に対して一定時間の間をおいて入力要求を行う(図
2)。
【0032】入出力制御処理51では二重化監視入出力
手段4から入力要求を受けたら二重化ボリューム1に対
して入力を行い、入力障害が発生したら入出力エラー制
御処理52で障害アドレスを指定して障害領域限定手段
6を起動して入力障害を二重化監視入出力手段4に返却
する(図3)。
【0033】障害領域限定手段6では受け取った障害ア
ドレスの前の1レコードを入力して入力障害が発生しな
いアドレスを求め、受け取った障害アドレスの次の1レ
コードを入力して入力障害が発生しないアドレスを求
め、障害が発生したボリュームに代替領域が存在するか
確認して、代替領域が存在しない場合は媒体閉塞を障害
情報3に登録した後、障害領域交換手段7を起動する
(図4)。
【0034】障害領域交換手段7では、障害情報3から
二重化ボリューム1の障害情報を取得して媒体閉塞の場
合はシステム内のボリュームで未使用のボリュームを検
索して障害が発生したボリュームとの交換を行い、障害
が発生したボリュームの切り離しを行った後に、ボリュ
ーム全体の複写を指定してデータ複写処理82を起動す
る(図5)。
【0035】データ複写処理82では1回の入出力を行
うアドレスを主記憶のテーブル上に記憶して正常なボリ
ュームからデータを入力して交換したボリュームにデー
タを複写して指定された複写範囲が終了するまでデータ
の複写を繰り返して複写が終了したら障害情報3から復
旧した障害情報を削除する(図6)。
【0036】これにより正常に二重化状態に復旧され
る。
【0037】[実施例2]図7は、実施例2の構成を示
す図であり本実施例の構成は、実施例1の構成と、ほぼ
同じであるが、二重化状態の表示を行ない、利用者に、
状態の把握を容易にした点で異なる。
【0038】図7において、本実施例の構成は、正系ボ
リューム11と副系ボリューム12で構成されている二
重化ボリューム10と、空きボリューム20と障害情報
を格納しているボリューム30と操作員に二重化情報を
知らせるための表示装置40で構成されているシステム
と、定期的に二重化ボリューム10にI/Oを発行し障
害発生を監視する二重化監視I/O処理101と二重化
ボリューム10で利用者I/Oの障害が発生した場合の
検出を行う二重化I/Oエラー制御処理102を有する
二重化I/Oエラー検出処理100と、障害箇所の範囲
を限定する障害箇所摘出処理201と障害箇所がボリュ
ーム障害の時に空きボリューム20を検索する空きボリ
ューム検索処理202と空きボリューム20と障害ボリ
ュームを交換する空きボリューム組み込み処理203と
障害箇所がボリューム障害以外の時に代替領域を取得す
る代替領域取得処理204と障害箇所の使用制限を障害
情報に登録依頼する障害情報登録依頼処理205を有す
る障害箇所代替処理200と、正常系から障害系にデー
タを複写するデータ複写処理301と利用者I/Oと複
写I/Oとの同期制御を行う複写同期制御処理302と
データ複写終了後障害情報の削除を依頼する障害情報削
除依頼処理303を有する二重化複写処理300と、指
定された障害情報をボリューム30に登録する障害情報
登録処理401と指定された障害情報を削除する障害情
報削除処理402と指定された障害情報を返却する障害
情報返却処理403を有する障害情報管理処理400
と、障害情報返却処理403から障害情報を取得しI/
Oを発行する系を決定するI/O制御処理500と、表
示装置40に二重化状態の変化を表示する二重化状態表
示処理600を有する二重化制御処理で構成されてい
る。
【0039】本実施例の動作も、ほぼ実施例1と同じで
あり、同様の効果として、障害を検出した場合に障害箇
所の限定を行い、障害箇所に応じた閉塞及び自動復旧を
起動することで故障時間の短縮、復旧時間の短縮を図る
ことができ、人手介入の必要がないため、操作ミスによ
る2次障害も防ぐことができる。
【0040】また、定期的にI/Oを発行し、障害発生
を監視することで障害の早期検出、及び障害検出後の自
動複写を行うことで利用者I/OでのI/Oエラー発生
率を減らすことができ、利用者業務の停止を防ぐことが
できる。
【0041】更に、本実施例では、二重化状態表示処理
と表示装置を備えたことにより、障害時や、正常時の二
重化状態が、利用者にわかりやすく、利用者の対応が容
易になる。
【0042】
【発明の効果】第1の効果は、故障時間の短縮、復旧時
間の短縮を図ることができる。
【0043】その理由は、障害を検出した場合に障害範
囲の限定を行い、ボリューム障害ならボリューム全体の
復旧行い、部分障害なら部分的な復旧を行うため、障害
箇所が小さければ復旧時間も短縮される。また、ボリュ
ーム障害の場合も自動的に他ボリュームへの復旧を行う
ため故障時間の短縮を図ることができる。
【0044】第2の効果は、人手介入の必要がないため
操作ミスによる二次障害も防ぐことができる。
【0045】その理由は、障害を検出した場合にすべて
自動的に動作するからである。
【0046】第3の効果は、障害の早期検出を行うこと
で利用者入出力での入出力エラー発生率を減らすことが
でき、利用者業務の停止を防ぐことができる。
【0047】その理由は、定期的に入出力を発行し、障
害発生を監視することができるからである。
【0048】第4の効果は、障害時の状態を含む二重化
状態の変化が、利用者にわかりやすく、対応が容易にな
る。
【0049】その理由は、表示手段により、二重化状態
の変化を監視することができるからである。
【図面の簡単な説明】
【図1】本発明の実施例1の構成図である。
【図2】入出力制御手段の実施例1での動作を示す図で
ある。
【図3】二重化監視入出力手段の実施例1での動作を示
す図である。
【図4】障害領域限定手段の実施例1での動作を示す図
である。
【図5】障害領域交換手段の実施例1での動作を示す図
である。
【図6】二重化複写手段の実施例1での動作を示す図で
ある。
【図7】本発明の実施例2の構成図である。
【符号の説明】
1 二重化ボリューム 2 空きボリューム 3 障害情報 4 二重化監視入出力手段 5 入出力制御手段 51 入出力制御処理 52 入出力エラー制御処理 6 障害領域限定手段 61 障害箇所限定処理 62 障害情報登録依頼処理 7 障害領域交換手段 71 空きボリューム検索/交換処理 72 代替領域取得処理 8 二重化複写手段 81 複写同期制御処理 82 データ複写処理 83 障害情報削除依頼処理 9 障害情報管理手段 91 障害情報登録処理 92 障害情報削除処理 93 障害情報参照処理

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 二重化制御下のボリュームに対して、定
    期的に二重化ボリュームに入出力を行い障害発生を監視
    する二重化監視入出力手段と、 障害情報を取得し入出力を行う系を決定して入出力を行
    い、入出力で障害が発生した場合の制御を行う入出力制
    御手段と、 障害箇所の範囲を限定して障害箇所の使用制限を障害情
    報に登録依頼する障害領域限定手段と、 障害箇所の範囲に応じた領域の交換を行う障害領域交換
    手段と、 正常系から障害系にデータを複写してその間の利用者の
    入出力と複写の入出力との同期制御を行う二重化複写手
    段と、 指定された障害情報の登録、参照、削除を行う障害情報
    管理手段と、を有することを特徴とする二重化制御障害
    復旧方式。
  2. 【請求項2】 システム内のボリュームで未使用である
    空きボリュームを備え、障害の範囲がボリューム全体に
    及ぶものであった時に、上記空きボリュームを検索し
    て、前記障害ボリュームとの交換を行う、空きボリュー
    ム検索/交換処理を有することを特徴とする請求項1記
    載の二重化制御障害復旧方式。
  3. 【請求項3】 二重化状態の表示を行なう手段を有する
    ことを特徴とする請求項1又は2記載の二重化制御障害
    復旧方式。
JP8153639A 1996-06-14 1996-06-14 二重化制御障害復旧方式 Pending JPH103396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8153639A JPH103396A (ja) 1996-06-14 1996-06-14 二重化制御障害復旧方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8153639A JPH103396A (ja) 1996-06-14 1996-06-14 二重化制御障害復旧方式

Publications (1)

Publication Number Publication Date
JPH103396A true JPH103396A (ja) 1998-01-06

Family

ID=15566923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8153639A Pending JPH103396A (ja) 1996-06-14 1996-06-14 二重化制御障害復旧方式

Country Status (1)

Country Link
JP (1) JPH103396A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127217A (ja) * 2004-10-29 2006-05-18 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
JP2006259976A (ja) * 2005-03-16 2006-09-28 Hitachi Ltd ストレージ・エリア・ネットワークにおけるストレージセッション管理システム
JP2008225753A (ja) * 2007-03-12 2008-09-25 Hitachi Ltd 計算機システム、アクセス制御方法及び管理計算機
JP2009217768A (ja) * 2008-03-13 2009-09-24 Nec Corp データベースにおけるパーティション障害管理方法およびシステム
JP2021174357A (ja) * 2020-04-28 2021-11-01 Necプラットフォームズ株式会社 ストレージ装置、ストレージ装置の処理方法、及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127217A (ja) * 2004-10-29 2006-05-18 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
JP2006259976A (ja) * 2005-03-16 2006-09-28 Hitachi Ltd ストレージ・エリア・ネットワークにおけるストレージセッション管理システム
JP4588500B2 (ja) * 2005-03-16 2010-12-01 株式会社日立製作所 ストレージ・エリア・ネットワークにおけるストレージセッション管理システム
US7949882B2 (en) 2005-03-16 2011-05-24 Hitachi, Ltd. Storage session management system in storage area network
JP2008225753A (ja) * 2007-03-12 2008-09-25 Hitachi Ltd 計算機システム、アクセス制御方法及び管理計算機
JP2009217768A (ja) * 2008-03-13 2009-09-24 Nec Corp データベースにおけるパーティション障害管理方法およびシステム
JP2021174357A (ja) * 2020-04-28 2021-11-01 Necプラットフォームズ株式会社 ストレージ装置、ストレージ装置の処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP4796854B2 (ja) 差分リモートコピーにおける中間ボリュームのデータ溢れ対策
EP1764693B1 (en) Data restoring apparatus using journal data and identification information
JP3992427B2 (ja) ファイルシステム
JP4108074B2 (ja) 多重リモートストレージでのデータ同期
JP4321705B2 (ja) スナップショットの取得を制御するための装置及び記憶システム
US7996611B2 (en) Backup data management system and backup data management method
US7254684B2 (en) Data duplication control method
US8060478B2 (en) Storage system and method of changing monitoring condition thereof
JP2005537530A (ja) 仮想記憶装置
JP2007206759A (ja) ストレージシステム
JP2010128644A (ja) 障害復旧方法、プログラムおよび管理サーバ
JP4490745B2 (ja) ホットスタンバイシステム
JP2006185108A (ja) ストレージシステムのデータを管理する管理計算機及びデータ管理方法
JPH103396A (ja) 二重化制御障害復旧方式
US7194675B2 (en) Backup method, backup system, disk controller and backup program
US7107485B2 (en) Method, apparatus, and computer readable medium for managing multiple system
JP4294692B2 (ja) 情報処理システム
US20080222374A1 (en) Computer system, management computer, storage system and volume management method
JP2021174392A (ja) リモートコピーシステム及びリモートコピー管理方法
JPH05189168A (ja) 障害トラック自動復旧方式
JP2002259184A (ja) 監視制御システム、及び監視制御システムのデータ整合方法
KR20000038085A (ko) 비동기 전송 방식 교환기에서 대기측 로딩 후 상태 불일치 복구방법
JPH09204319A (ja) オンラインデータ復旧システム