JPH07239799A - 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム - Google Patents

遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム

Info

Publication number
JPH07239799A
JPH07239799A JP6301109A JP30110994A JPH07239799A JP H07239799 A JPH07239799 A JP H07239799A JP 6301109 A JP6301109 A JP 6301109A JP 30110994 A JP30110994 A JP 30110994A JP H07239799 A JPH07239799 A JP H07239799A
Authority
JP
Japan
Prior art keywords
primary
write
data
remote data
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6301109A
Other languages
English (en)
Inventor
Robert F Kern
ロバート・フレデリック・カーン
William F Micka
ウィリアム・フランク・ミッカ
Claus W Mikkelsen
クラウス・ウィリアム・ミッケルセン
Michael A Paulsen
マイケル・アロイシウス・ポールソン
Robert Wesley Shomler
ロバート・ウェズリー・ショムラー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH07239799A publication Critical patent/JPH07239799A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2064Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/70Masking faults in memories by using spares or by reconfiguring
    • G11C29/74Masking faults in memories by using spares or by reconfiguring using duplex memories, i.e. using dual copies

Abstract

(57)【要約】 【目的】 二次側が一次側から離れた位置に配置され、
同期的に記憶域ベースのリアルタイム災害復旧を行う遠
隔データ・シャドーイング・システムを提供する。 【構成】 一次側のエラー回復プログラムは、エラー回
復手順を実行し、二重対の障害が発生したことを一次側
と二次側の両方に通知するために、そこで実行中のアプ
リケーションを静止する。このエラー回復プログラムは
二重対の障害の原因を判別し、エラー回復が正常に行わ
れた場合は、二重モードが再開される。エラー回復プロ
グラムがエラー回復を正常に実行できない場合は、一次
側での書込み更新がさらに禁止され、一次側と二次側両
方のオペレータに対してエラー・メッセージが送信され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、一般的には、災害復旧
技法に関し、より具体的には、直接アクセス記憶装置
(DASD)データのリアルタイム遠隔コピーのための
システムに関する。
【0002】
【従来の技術】データ処理に関連して、効率よくアクセ
スし、修正および再格納できる大量のデータ(またはレ
コード)を格納するためには、一般に、データ処理シス
テムが必要である。データ記憶域は、効率よくしかも費
用効果の高いデータ記憶を行うために、通常、複数のレ
ベルに、すなわち、階層状態に分かれている。第一のレ
ベル、すなわち、最高レベルのデータ記憶域は、通常は
ダイナミックまたはスタティック・ランダム・アクセス
・メモリ(DRAMまたはSRAM)である電子メモリ
を含む。電子メモリは、ナノ秒単位でこのようなバイト
数のデータにアクセスすることによってそれぞれの回路
に数百万バイトのデータを格納できる、半導体集積回路
の形態をとる。アクセスが完全に電子的に行われるた
め、このような電子メモリは最高速のデータ・アクセス
を提供する。
【0003】第二レベルのデータ記憶域は、通常、直接
アクセス記憶装置(DASD)を含む。DASD記憶域
は、磁気ディスクまたは光ディスクなどを含む可能性が
あり、これらのディスクは、データのビットを構成する
「1」と「0」を表す磁気的または光学的に変質させた
マイクロメートル規模のスポットとしてビット単位のデ
ータをディスク表面に格納する。磁気DASDは、残留
磁気材料で被覆した1枚または複数枚のディスクを含
む。これらのディスクは、保護環境内に回転式に取り付
けられている。各ディスクは、多くの同心トラックまた
は間隔が詰まった円に分割されている。データは、各ト
ラックに沿って1ビットずつ順次格納される。ヘッド・
ディスク・アセンブリ(HDA)として知られているア
クセス機構は、一般に、1つまたは複数の読取り書込み
ヘッドを含み、ディスクが回転して読取り書込みヘッド
を通過する際にディスクの表面にデータを転送したりデ
ィスクの表面からデータを転送するためにトラック間を
移動できるよう、各DASDに設けられている。通常、
ミリ秒単位(電子メモリより低速の単位)でこのような
データにアクセスすることによって、DASDはギガバ
イト規模のデータを格納できる。所望のデータ記憶位置
にディスクおよびHDAを物理的に配置する必要がある
ため、DASDに格納されたデータへのアクセス速度は
低下する。
【0004】第三またはそれ以下のレベルのデータ記憶
域は、テープまたはテープとDASDライブラリを含
む。このレベルの記憶域では、必要なデータ記憶媒体を
選択して装填するのにロボットが必要になるため、ライ
ブラリ内のデータへのアクセス速度はさらに低下する。
利点は、テラバイト規模のデータ記憶など、データ記憶
容量が非常に大きい割に費用が低減される点である。テ
ープ記憶装置は、バックアップ目的で使用されることが
多い。すなわち、階層の第二レベルに格納されたデータ
は、磁気テープで安全に保管するために複製される。テ
ープまたはライブラリに格納したデータへのアクセス速
度は、現在、秒単位である。
【0005】データの紛失は、企業にとって破滅的なも
のになる恐れがあるので、多くの企業ではバックアップ
のデータ・コピーを用意することが必須になっている。
一次記憶レベルで紛失したデータの復旧に要する時間
も、復旧に関して考慮すべき重要な項目である。テープ
またはライブラリでのバックアップ速度の改善策として
は、二重コピーが挙げられる。二重コピーの例として
は、追加のDASDにデータが書き込まれるように追加
のDASDを用意する方法がある(ミラーリングと呼ば
れる場合もある)。この場合、一次DASDで障害が発
生しても、データを得るために二次DASDを頼りにす
ることができる。この方法の欠点は、必要なDASDの
数が二倍になることである。
【0006】記憶装置を二重に設ける必要性を克服する
もう1つのデータ・バックアップ方法としては、低価格
装置の冗長アレイ(RAID)構成にデータを書き込む
方法がある。この方法では、多くのDASDにデータを
割り当てるようにデータが書き込まれる。1つのDAS
Dで障害が発生しても、残りのデータとエラー修正手順
を使用すれば、紛失したデータを復旧できる。現在で
は、数種類のRAID構成が使用できる。
【0007】一般に、記憶装置または記憶媒体で障害が
発生した場合のデータの復旧には、上記のバックアップ
方法で十分である。このようなバックアップ方法では、
二次データは一次データのミラーになる、つまり、二次
データは一次データと同じボリューム通し番号(VOL
SER)とDASDアドレスを持つので、これらの方法
は装置障害の場合だけ有用である。しかし、ミラーリン
グされた二次データを使用しても、システム障害の復旧
は行えない。このため、地震、火災、爆発、台風など、
システム全体またはシステム使用現場を破壊する災害が
発生した場合にデータを復旧するには、さらに保護が必
要である。つまり、災害復旧のためには、一次データか
ら離れた位置にデータの二次コピーを格納しておく必要
がある。災害保護を行う既知の方法としては、毎日また
は毎週、テープにデータをバックアップする方法があ
る。この場合、車両でテープを収集し、通常、一次デー
タ位置から数キロメートル離れた安全な保管区域にテー
プを移送する。このバックアップ計画には、バックアッ
プ・データを検索するのに何日もかかると同時に、数時
間分または数日分のデータが失われ、最悪の場合、同じ
災害によって保管場所も破壊されてしまう恐れがあると
いう問題がある。多少改善されたバックアップ方法とし
ては、毎晩、バックアップ場所にデータを転送する方法
が考えられる。この方法では、より離れた遠隔地にデー
タを格納することができる。しかし、この場合も、二重
コピー方法と同様、バックアップが連続して行われるわ
けではないので、次のバックアップまでにデータの一部
が失われる可能性がある。このため、一部のユーザにと
っては受け入れられないほど、相当なデータ量が失われ
る恐れがある。
【0008】さらに最近導入されたデータ災害復旧方法
としては、遠隔方式だけでなく、連続方式でもデータが
バックアップされる、遠隔二重コピーがある。あるホス
ト・プロセッサから別のホスト・プロセッサへ、または
ある記憶制御装置から別の記憶制御装置へ、あるいはこ
れらを組み合わせた方法で二重データを送信するには、
このプロセスを実現するために相当な量の制御データが
必要になる。しかし、オーバヘッドが高いために、二次
側が一次側の処理に遅れないようにする能力が妨げられ
る可能性があり、このため、災害が発生した場合に二次
側が一次側を復旧する能力が脅かされる。
【0009】したがって、最小限の制御データを使用し
て、一次処理側のデータと一致するデータのリアルタイ
ム更新を行う方法および装置を提供することが望まれて
いる。この方法および装置は、復旧される特定のアプリ
ケーション・データから独立して、つまり、特定のアプ
リケーション・データをベースとするのではなく、汎用
記憶媒体をベースとして機能する。
【0010】
【発明が解決しようとする課題】本発明の目的は、一次
側で行った書込み更新を二次側にシャドーイング(shad
owing)するための改良された設計および方法を提供す
ることにある。
【0011】
【課題を解決するための手段】本発明の第一の実施例に
よれば、遠隔データ・シャドーイングを提供するための
方法は、一次記憶サブシステムに連結された一次プロセ
ッサを有する一次側を含み、一次プロセッサは、一次記
憶サブシステムへの入出力書込み更新の原因となる少な
くとも1つのアプリケーションを実行する。さらに一次
プロセッサは、そこで実行される入出力エラー回復プロ
グラム(入出力ERP)を有する。二次側は、二次記憶
サブシステムに連結された二次プロセッサを含み、二次
側は書込み更新を同期的にシャドーイングし、二次記憶
サブシステムは入出力ERPと通信する。本方法は、一
次記憶サブシステムから二次記憶サブシステムへ書込み
更新を送信することと、一次記憶サブシステムと二次記
憶サブシステムとの間に二重対が確立しているかどうか
を判別することを含む。二重対の障害は、一次記憶サブ
システムから一次プロセッサに報告される。一次プロセ
ッサは、二重対の障害が発生したときに少なくとも1つ
のアプリケーションから入出力ERPに制御権を移転
し、入出力ERPは二重対の障害の原因を判別し、二重
対障害発生メッセージを二次記憶サブシステムに送信す
る。
【0012】本発明の他の実施例では、遠隔データ二重
化システムは一次側と二次側を含み、二次側は、データ
・バックアップのために一次側から書込み更新を受け取
る。二次側は、一次側を使用不能にする災害が発生した
場合に二次側がリアルタイム・データ可用性を提供でき
るように一次側から十分離れた位置に配置される。一次
側の一次プロセッサは、書込み入出力更新の原因となる
少なくとも1つのアプリケーションを実行し、一次記憶
サブシステムは、書込み入出力更新を受け取って格納す
るためにそれに接続されている。二次プロセッサは、二
次側に配置され、データ・リンクによって一次プロセッ
サに連結される。同じく二次側に位置する二次記憶サブ
システムは、二次プロセッサに連結され、さらに通信リ
ンクを介して一次記憶サブシステムに連結され、二次記
憶サブシステムは、受け取った順に書込み入出力更新が
二次記憶サブシステムに書き込まれるような、書込み入
出力更新のバックアップ用の記憶域ベースの二重対を提
供する。一次プロセッサの入出力およびエラー回復は、
二重対の障害が発生した場合にエラー回復を行うために
二次記憶サブシステムに連結される。
【0013】本発明の上記およびその他の目的、特徴、
および利点は、添付図面に図示する本発明の実施例に関
する以下の詳細な説明から明らかになるだろう。
【0014】
【実施例】一般的なデータ処理システムは、データを計
算して操作し、データ機能記憶管理サブシステム/多重
仮想記憶システム(DFSMS/MVS)ソフトウェア
などを実行するために、IBMシステム/360または
IBMシステム/370プロセッサなどのホスト・プロ
セッサの形態をとり、少なくとも1台のIBM 399
0記憶制御装置がそれに接続され、その記憶制御装置
が、メモリ制御装置と、それに組み込まれた1つまたは
複数のタイプのキャッシュ・メモリとを含む場合があ
る。さらに記憶制御装置は、IBM 3380または3
390 DASDなどの1群の直接アクセス記憶装置
(DASD)に接続されている。ホスト・プロセッサが
実質的な計算能力を提供するのに対し、記憶制御装置
は、大規模データベースを効率よく転送し、ステージ
(stage)/デステージ(destage)し、変換し、全般的
にアクセスするのに必要な諸機能を提供する。
【0015】一般的なデータ処理システムの災害復旧保
護では、一次DASDに格納した一次データを二次側ま
たは遠隔地でバックアップする必要がある。一次側と二
次側との距離は、ユーザが受け入れられる危険のレベル
によって決まり、数キロメートルから数千キロメートル
の範囲が可能である。二次側または遠隔地は、バックア
ップ・データ・コピーを提供するだけでなく、一次シス
テムが使用不能になった場合に一次システムの処理を引
き継ぐのに十分なシステム情報を持っていなければなら
ない。その理由は、主に、単一の記憶制御装置では一次
側と二次側に設けた一次および二次DASDストリング
の両方にデータを書き込めないためである。むしろ、一
次記憶制御装置に接続された一次DASDストリングに
は一次データが格納されるのに対し、二次記憶制御装置
に接続された二次DASDストリングには二次データが
格納されるのである。
【0016】二次側は、一次側から十分離れている必要
があるだけでなく、一次データをリアルタイムでバック
アップできなくてはならない。二次側は、一次データが
更新されたときに、最小限の遅延で一次データをバック
アップする必要がある。しかも、二次側は、一次側で実
行され、データまたは更新を生成するアプリケーション
・プログラム(たとえば、IMSやDB2)を考慮せず
に、一次データをバックアップしなければならない。二
次側に要求される難しい課題は、二次データの順序が整
合していなければならないことである。つまり、二次デ
ータは一次データと同じ順序でコピーされなければなら
ず(順序整合性)、これはシステムについてかなり考慮
を要する問題である。順序整合性は、それぞれが1つの
データ処理システム内の複数のDASDを制御する記憶
制御装置が複数存在するためにさらに複雑になってい
る。順序整合性がないと、一次データと一致しない二次
データが生成され、その結果、災害復旧が崩壊する恐れ
がある。
【0017】遠隔データの二重化は、同期と非同期の2
つの一般的なカテゴリに分けられる。同期遠隔コピーで
は、一次データを二次側に送り、一次DASDの入出力
操作を終了する(一次ホストにチャネル終了(CE)と
装置終了(DE)を出力する)前にこのようなデータの
受取りを確認する必要がある。このため、同期コピーで
は、二次側の確認を待っている間に一次DASDの入出
力応答時間が遅くなる。一次側の入出力応答遅延は、一
次システムと二次システムとの距離に比例して長くなる
(これは遠隔距離を数十キロメートル規模に制限する要
素である)。しかし、同期コピーは、システム・オーバ
ヘッドを比較的小さくして、順序が整合したデータを二
次側に提供する。
【0018】非同期遠隔コピーでは、二次側でデータが
確認される前に一次DASDの入出力操作が完了する
(一次ホストにチャネル終了(CE)と装置終了(D
E)を出力する)ため、一次側のアプリケーション・シ
ステムのパフォーマンスが向上する。このため、一次D
ASDの入出力応答時間は二次側までの距離に依存せ
ず、一次側から数千キロメートル離れた遠隔地に二次側
を設けることもできる。しかし、二次側で受け取ったデ
ータの順序が一次側の更新順序と一致しなくなる場合が
多いので、データの順序整合性を確保するのに必要なシ
ステム・オーバヘッドが増加する。したがって、一次側
で障害が発生すると、一次側と二次側との間で転送中の
データが一部紛失する恐れがある。
【0019】同期データ・シャドーイング 災害復旧のための同期リアルタイム遠隔コピーでは、コ
ピーされた複数のDASDボリュームが1つのセットを
形成する必要がある。さらに、このようなセットを形成
するには、各セットを構成するこれらのボリュームとそ
れに対応する一次側の同等物(VOLSER)を識別す
るために十分な量のシステム情報を二次側に提供する必
要がある。重要なのは、二次側が一次側と「二重対(du
plex pair)」を形成するので、1つまたは複数のボリ
ュームがこのセットと同期していない、つまり、「二重
対の障害」が発生したときに二次側がそれを認識しなけ
ればならない点である。代替経路が再試行される間に一
次DASDの入出力が遅延するため、非同期遠隔コピー
より同期遠隔コピーの方が、接続障害を認識しやすい。
一次側は、二次側用の更新を待ち行列に入れる間、一次
側が続行できるようにコピーを中止または中断すること
ができ、一次側は、二次側が同期していないことを示す
ためにこのような更新にマークを付ける。二次側がいつ
でも災害復旧に使用できるようにするため、二次側が一
次側と同期しなくなる原因になりそうな例外条件を認識
することが必要である。エラー条件や復旧処置によっ
て、二次側が一次側と一致しなくなってはならない。
【0020】しかし、二次DASDが存在しアクセス可
能である状態で、二次側と一次側の接続を維持しても、
内容の同期は確保されない。いくつかの理由から、二次
側は一次側との同期性を失う場合もある。二重対が形成
されたときに二次側は当初同期しておらず、初期データ
・コピーが完了したときに同期に達する。一次側が二次
側に更新済みデータを書き込めない場合、一次側は二重
対を解除することもある。この場合、一次側は、更新ア
プリケーションが続行できるように、二重対が中断され
た状況で一次DASDに更新内容を書き込む。このた
め、二重対が復元されるまで、一次側は露出状態で、つ
まり、現行の災害保護コピーを使わずに実行を続ける。
二重対が復元されても、二次側は直ちに同期状態になる
わけではない。この時点で保留状態の更新を適用した後
で、二次側は同期状態に戻る。一次側は、該当ボリュー
ムに関する中止コマンドを一次DASDに出すことによ
って、二次側の同期を喪失させることもできる。この中
止コマンドが終了し、二重対が再確立され、保留状態の
更新がコピーされると、二次側は一次側と再同期する。
また、オンライン保守でも、同期を喪失させることがで
きる。
【0021】二次ボリュームが一次ボリュームと同期し
ていない場合、二次ボリュームは、二次システムの復旧
と一次側アプリケーションの再開に使用することができ
ない。二次側の非同期ボリュームは非同期ボリュームと
して識別されなければならず、二次側の復旧引継ぎ手順
は、アプリケーション・アクセスを否定する(そのボリ
ュームを強制的にオフラインにするか、そのVOLSE
Rを変更する)ために非同期ボリュームを識別する必要
がある。一次側ホストがアクセス不能になった場合に一
次側を復旧するために、二次側が呼び出されることがあ
る。このため、二次側では、すべてのボリュームの同期
状態に関するすべての関連情報が必要である。二次記憶
サブシステム、すなわち、二次記憶制御装置とDASD
は、一次側で検出された例外によって一次側が同期を解
除する原因となるすべての条件を判別できるわけではな
い。たとえば、二次側が把握していない一次入出力経路
またはリンクの障害のために一次側が二次側の対等機能
にアクセスできない場合、一次側は二重対を解除するこ
とがある。この場合、二次側が同期状態を示すのに対
し、一次側は、二重対が解除されたことを示す。
【0022】非同期二重対ボリュームが存在すること
を、外部通信によって二次側に通知することができる。
これは、ユーザ・システム管理機能を使用することで認
識できる。一次側の入出力操作はチャネル終了/装置終
了/装置チェック(CE/DE/UC)状況で終了し、
センス・データがエラーの特徴を示す。このような形式
の入出力構成の場合、エラー回復プログラム(ERP)
がエラーを処理し、入出力の完了を一次側アプリケーシ
ョンに通知する前に二次プロセッサに適切なメッセージ
を送る。この場合、ERPの二重対中止メッセージを認
識し、その情報を二次側で確保するのは、ユーザの責任
である。一次側の代わりに動作可能になるよう二次側が
頼りにされている場合は、始動手順によって二次DAS
Dが二次ホストにオンライン接続され、アプリケーショ
ンの割振りのために非同期ボリュームがオンライン接続
されていないことを確認するために、二次DASDサブ
システムに格納された同期状況が検索される。この同期
状況をすべてのERP二重対中止メッセージと組み合わ
せると、二次側の非同期ボリューム全体を示すピクチャ
が得られる。
【0023】ここで図1を参照して説明すると、同図に
は、一次側14と二次側15を有し、二次側15が一次
側14から20キロメートル離れている、災害復旧シス
テム10が示されている。一次側14は、そこで実行さ
れているアプリケーションと、システム入出力およびエ
ラー回復プログラム2(以下、入出力ERP2という)
とを有するホスト・プロセッサまたは一次プロセッサ1
を含む。一次プロセッサ1は、DFSMS/MVSオペ
レーティング・ソフトウェアを実行するIBMエンター
プライズ・システム/9000(ES/9000)など
でもよく、さらにそこで複数のアプリケーション・プロ
グラムを実行することもできる。一次プロセッサ1に
は、IBM 3990−6型記憶制御装置などの一次記
憶制御装置3がチャネル12を介して接続されている。
当技術分野で既知の通り、複数のこのような一次記憶制
御装置3を1台の一次プロセッサ1に接続するか、ある
いは複数の一次プロセッサ1を複数の一次記憶制御装置
3に接続することができる。一次記憶制御装置3には、
IBM 3390 DASDなどの一次DASD4が接
続されている。複数の一次DASD4を一次記憶制御装
置3に接続することができる。一次記憶制御装置3と、
これに接続された一次DASD4によって、一次記憶サ
ブシステムが形成される。また、一次記憶制御装置3と
一次DASD4は、単一の一体型ユニットであってもよ
い。
【0024】二次側15は、チャネル13を介してIB
M 3990−3型などの二次記憶制御装置6に接続さ
れたIBM ES/9000などの二次プロセッサ5を
含む。二次記憶制御装置6には、さらにDASD7が接
続されている。一次プロセッサ1は、チャネル・リンク
またはT1/T3電話回線リンクなどの少なくとも1つ
のホスト間通信リンク11によって二次プロセッサ5に
接続されている。一次プロセッサ1は、複数のエンター
プライズ・システム接続(ESCON)リンク9などに
よって二次記憶制御装置6との直接接続を確保すること
もできる。その結果、入出力ERP2は、必要であれ
ば、二次記憶制御装置6と通信可能になる。一次記憶制
御装置3は、複数のESCONリンクなどの複数の対等
通信リンク8を介して二次記憶制御装置6と通信する。
【0025】一次プロセッサ1で実行されるアプリケー
ション・プログラムによって書込み入出力操作が実行さ
れると、入出力操作が正常に完了したことを示すハード
ウェア状況としてチャネル終了/装置終了(CE/D
E)が出力される。入出力操作が正常に完了すると、一
次プロセッサ1のオペレーティング・システム・ソフト
ウェアは、そのアプリケーションに書込み入出力成功の
マークを付け、それにより、アプリケーション・プログ
ラムは、最初または前の書込み入出力操作の正常終了に
依存する可能性のある次の書込み入出力操作に移行でき
るようになる。これに対して、書込み入出力操作が不成
功に終わった場合は、チャネル終了/装置終了/装置チ
ェック(以下、CE/DE/UCという)という入出力
状況が一次プロセッサ1のオペレーティング・システム
・ソフトウェアに出力される。装置チェックを出力した
後、入出力ERP2は、制御権を引き継ぎ、失敗した書
込み入出力操作の特徴に関する具体的なセンス情報を一
次記憶制御装置3から入手する。あるボリュームに固有
のエラーが発生した場合は、そのエラーに関連する固有
の状況が入出力ERP2に出力される。その後、入出力
ERP2は、一次記憶制御装置3と二次記憶制御装置6
との間、または最悪の場合は、一次プロセッサ1と二次
プロセッサ5との間のデータ保全性を維持するために、
新たな対等通信同期エラー回復を実行することができ
る。
【0026】図2および図3を参照して説明すると、同
図にはエラー回復手順が示されている。図2のステップ
201は、一次プロセッサ1で実行されるアプリケーシ
ョン・プログラムが一次記憶制御装置3にデータ更新を
送信することを含む。ステップ203では、そのデータ
更新が一次DASD4に書き込まれ、そのデータ更新が
二次記憶制御装置6にシャドーイングされる。ステップ
205では、二重対の状況がチェックされ、一次側と二
次側が同期しているかどうかが判別される。二重対の状
況が同期状態になっている場合、ステップ207でデー
タ更新が二次DASD7に書き込まれ、一次プロセッサ
1での処理は、そこで実行されるアプリケーション・プ
ログラムを介して続行される。
【0027】二重対が「障害発生」状態になっている場
合、ステップ209で一次記憶制御装置3は、二重対で
中断または障害が発生していることを一次プロセッサ1
に通知する。二重対は、通信リンク8による一次記憶制
御装置3と二次記憶制御装置6との通信障害によって
「障害発生」状態になる場合がある。あるいは、二重対
は、一次サブシステムまたは二次サブシステムいずれか
のエラーによって「障害発生」状態になる場合もある。
障害が通信リンク8で発生している場合、一次記憶制御
装置3は、二次記憶制御装置6に直接、障害を連絡する
ことができない。そこで、一次記憶制御装置3は、ステ
ップ211で入出力状況としてCE/DE/UCを一次
プロセッサ1に返す。入出力ERP2は、アプリケーシ
ョン・プログラムを静止させ、書込み入出力操作を要求
するアプリケーションに制御権を返す前に、エラー回復
とデータ保全性のためにステップ213で一次プロセッ
サ1の制御権を引き継ぐ。
【0028】図3は、入出力ERP2が実行する諸ステ
ップを表している。ステップ221で入出力ERP2は
一次記憶制御装置3にセンス入出力を出す。センス入出
力操作は、入出力エラーの原因を記述する情報を返す。
すなわち、このデータ記述情報は、具体的なエラーに関
して記憶制御装置または二重対の操作に固有のものにな
る。一次記憶制御装置3と二次記憶制御装置6との間の
対等通信リンク8で障害が発生したことがデータ記述情
報によって示された場合、ステップ223で入出力ER
P2は、一次記憶制御装置3および二次記憶制御装置6
に対して、関係ボリュームを障害発生同期遠隔コピー状
態に入れるように指示する記憶制御装置レベル入出力操
作を出す。この二次記憶制御装置6は、複数のESCO
Nリンク9またはホスト間通信リンク11を介して入出
力ERP2から関係ボリュームの状態を受け取ることが
できる。その結果、二重対操作の現在の状況は、一次プ
ロセッサ1で実行されるアプリケーションとともに、一
次プロセッサ1および二次プロセッサ5の両方で維持さ
れる。コンソール18および19は、それぞれ一次プロ
セッサ1および二次プロセッサ5からの情報をやりとり
するために設けられ、入出力ERPは、両方のコンソー
ル18および19に状況情報を通知する。
【0029】一次記憶制御装置3および二次記憶制御装
置6への障害発生同期遠隔コピー入出力操作が正常に完
了すると、ステップ225でデータ保全性が維持されて
いる。このため、二次側15で復旧を試みると、二次記
憶制御装置6は、「障害発生同期遠隔コピー」というマ
ークを付けたボリュームを、データ回復手段(ボリュー
ム上のそのデータの状態を判別するための従来のデータ
ベース・ログまたはジャーナル)によってそのボリュー
ムのデータとその同期グループ内の他のデータとの同期
が取られるまで使用できないものとして識別する。
【0030】ステップ227では、障害発生同期遠隔コ
ピーの状況更新について一次記憶制御装置3と二次記憶
制御装置6で行われた入出力操作の正常終了を入出力E
RP2が受け取ったかどうかを判別するテストが行われ
る。正常終了すると、入出力ERP2は、ステップ22
9で一次プロセッサ1に制御権を返す。正常終了してい
ない場合は、ステップ231で次のレベルの復旧通知が
行われる。この通知には、障害発生ボリュームと、一次
記憶制御装置3または二次記憶制御装置6のいずれかの
そのボリュームの状況が正しくない可能性があること
を、コンソール18を介してオペレータに通知すること
が含まれる。この通知は、そこで具体的なボリューム状
況を示すために、コンソール19または共用DASDデ
ータ・セットを介して二次側15にシャドーイングされ
る。
【0031】ステップ233で、エラー・ログ記録デー
タ・セットが更新される。この更新は、一次DASD4
または他の記憶場所のいずれかに書き込まれ、二次側1
5にシャドーイングされる。このエラー回復処置が完了
すると、入出力ERP2はステップ235で、障害発生
書込み入出力操作に関する「永続エラー」回復を一次側
アプリケーションに実行させるために、一次側アプリケ
ーションの書込み入出力操作に「永続エラー」を通知す
る。エラーが修正されると、ボリューム状態は、まず保
留状態(変更データの再コピー)に回復し、次に全二重
に回復することができる。その後、二重対が再確立され
ると、データを二次DASD7に再適用することができ
る。
【0032】二重対を確立する場合、顧客の要求に応じ
て、ボリュームをCRITICALと識別することがで
きる。CRITICALボリュームの場合、ある操作の
結果、二重対の障害が発生すると、実際のエラー箇所と
は無関係に、一次ボリュームの永続エラー障害が報告さ
れる。CRIT=Yの場合、障害発生対の一次DASD
406に書き込もうとするその後のすべての試みは、永
続エラーを受け取ることになり、対をなす二次ボリュー
ムにシャドーイングできないデータは、その一次ボリュ
ームに一切書き込まれなくなる。このため、必要であれ
ば、一次側アプリケーションの処置および入出力データ
操作との完全同期が可能になる。
【0033】その結果、本明細書に記載する災害復旧シ
ステム10では、入出力命令(チャネル・コマンド・ワ
ード(CCW))を有する一次ホスト処理エラー回復手
順によって、二重対から障害発生二重対へ一次および二
次同期遠隔コピー・ボリュームの状況を変更できるよう
な外部同期遠隔コピーを取り入れ、それにより、複数タ
イプの一次および二次サブシステム・エラーの場合にデ
ータ保全性を維持する。アプリケーション・ベースのバ
ックアップではなく、データ更新がリアルタイムで複写
される記憶域ベースのバックアップが設けられている。
また、災害復旧システム10は、(1)一次および二次
記憶制御装置ボリューム状況更新、(2)オペレータ・
メッセージまたはエラー・ログ記録共通データ・セット
を介して具体的なボリューム更新状況に関して一次およ
び二次ホスト・プロセッサが通知すること、および
(3)CRITICALボリューム識別などの、複数レ
ベルの一次/二次状況更新を試み、ボリューム対が障害
発生二重対になる場合は、一次ボリュームへのその後の
更新を防止することができる。このため、リアルタイム
の完全エラー災害復旧が達成される。
【0034】非同期データ・シャドーイング 非同期遠隔データ・シャドーイングは、1回の災害で一
次側と二次側の両方が崩壊してしまう確率を低減するた
めに一次側と二次側との距離をさらに大きくする必要が
ある場合、または一次側アプリケーションのパフォーマ
ンスへの影響を最小限に抑える必要がある場合に使用す
る。一次側と二次側との距離は、現在では地球全体また
はそれ以上に延長できるが、複数の一次サブシステムの
背後にある複数のDASDボリュームにわたる書込み更
新を複数の二次サブシステムに同期させることは、さら
に複雑である。二次記憶サブシステム上でシャドーイン
グするために、一次データ・ムーバを介して一次記憶制
御装置から二次データ・ムーバへレコード書込み更新を
発送することができるが、両者間でやりとりされる制御
データの量は、最小限でなければならず、同時に、複数
の記憶制御装置に隠れている複数のDASDボリューム
にわたる一次システムの場合と同様、複数の記憶制御装
置にわたる二次システム上でレコード書込み更新の順序
を正確に再構築できるものでなければならない。
【0035】図4は、一次側421と遠隔側または二次
側431とを含む非同期災害復旧システム400を示し
ている。一次側421は、DFSMS/MVSホスト・
ソフトウェアを実行するIBM ES/9000などの
一次プロセッサ401を含む。一次プロセッサ401
は、IMSおよびDBSアプリケーションなどのアプリ
ケーション・プログラム402および403と、一次デ
ータ・ムーバ(PDM)404をさらに含む。一次プロ
セッサ401には、そこで実行されるすべてのアプリケ
ーション(402、403)に共通の基準を提供するた
めに、共通シスプレックス・クロック(sysplex cloc
k)407が設けられ、すべてのシステム・クロックま
たは時間源(図示せず)がシスプレックス・クロック4
07に同期し、すべての時間依存プロセスが相互に正し
いタイミングで動作するようになっている。たとえば、
一次記憶制御装置405は、単一の一次記憶制御装置4
06への2回の連続する書込み入出力操作が同じタイム
・スタンプ値を示さないように、複数のレコード書込み
更新時間を確実に区別するのに適した解像度に同期して
いる。シスプレックス・クロック407の解像度(正確
さではない)は重要である。PDM404は、シスプレ
ックス・クロック407に接続された状態で図示されて
いるが、書込み入出力操作がそこで発生するわけではな
いので、シスプレックス・クロック407に同期させる
必要はない。また、一次プロセッサ401が単一の時間
基準(たとえば、単一のマルチプロセッサES/900
0システム)を有する場合には、シスプレックス・クロ
ック407は不要である。
【0036】一次プロセッサ401には、IBM 39
90−6型記憶制御装置などの複数の一次記憶制御装置
405が光ファイバ・チャネルなどの複数のチャネルを
介して接続されている。また、各一次記憶制御装置40
5には、IBM 3390DASDなどの複数の一次D
ASD406からなる少なくとも1つのストリングが接
続されている。一次記憶制御装置405と一次DASD
406によって、一次記憶サブシステムが形成される。
各記憶制御装置405と一次DASD406は、個別の
ユニットである必要はなく、両者を組み合わせて単一の
ドロワにしてもよい。
【0037】一次側421から数千キロメートル離れた
位置に配置される二次側431は、一次側421と同様
に、そこで動作する二次データ・ムーバ(SDM)41
4を有する二次プロセッサ411を含む。二次プロセッ
サ411には、当技術分野で既知の通り、光ファイバ・
チャネルなどのチャネルを介して複数の二次記憶制御装
置415が接続されている。記憶制御装置415には、
複数の二次DASD416と1つの制御情報DASD4
17(複数も可)が接続されている。記憶制御装置41
5とDASD416および417によって、二次記憶サ
ブシステムが構成される。
【0038】一次側421は、通信リンク408を介し
て二次側431と通信する。より具体的には、一次プロ
セッサ401は、仮想記憶通信アクセス方式(VTA
M)通信リンク408などの通信プロトコルによって、
二次プロセッサ411にデータと制御情報を転送する。
この通信リンク408は、電話(T1、T3回線)、無
線、無線/電話、マイクロ波、衛星などの複数の適当な
通信方式によって実現できる。
【0039】非同期データ・シャドーイング・システム
400は、一次DASD406へのすべてのデータ書込
みの順序が保持され、二次DASD416に適用される
(すべての一次記憶サブシステムにわたるデータ書込み
順序を保持する)ように、一次記憶制御装置405から
制御データを収集する機能を含む。二次側431に送ら
れるデータおよび制御情報は、データ保全性を保持する
のに一次側421の存在が不要になるほど、十分なもの
でなければならない。
【0040】アプリケーション402、403は、デー
タまたはレコード更新を生成するが、このレコード更新
は、一次記憶制御装置405によって収集され、PDM
404によって読み取られる。それぞれの一次記憶制御
装置405は、非同期遠隔データ・シャドーイング・セ
ッションのためにそれぞれのレコード更新をグループ化
し、非特定一次DASD406のREAD要求を介して
PDM404にこれらのレコード更新を提供する。一次
記憶制御装置405からPDM404へのレコード更新
の転送は、START入出力操作の回数を最小限にしな
がら、各一次記憶制御装置405と一次プロセッサ40
1との間で転送されるデータの量を最大にするように、
PDM404によって制御され、最適化される。PDM
404は、非特定READ間の時間間隔を変えること
で、一次記憶制御装置とホストとのこの最適化だけでな
く、二次DASD416用のレコード更新の通用期間も
制御することができる。
【0041】データ保全性を維持しながら、PDM40
4がレコード更新を収集し、そのレコード更新をSDM
414に送信するには、すべての一次記憶サブシステム
において二次DASD416に対して行われる一次DA
SD406のレコードWRITEシーケンスを再構築す
るのに十分な制御データとともに、特定の期間の間、適
切な複数の時間間隔でレコード更新を送信する必要があ
る。一次DASD406のレコードWRITEシーケン
スの再構築は、自己記述レコードをPDM404からS
DM414に渡すことによって達成される。SDM41
4は、所与の時間間隔分のレコードが紛失しているかど
うか、または不完全になっているかどうかを判別するた
めに、その自己記述レコードを検査する。
【0042】図5および図6は、接頭部ヘッダ500
(図5)と、一次記憶制御装置405によって生成され
たレコード・セット情報600(図6)とを含む、各自
己記述レコードごとにPDM404が作成するジャーナ
ル・レコード形式を示している。各自己記述レコード
は、それぞれの時間間隔の時間順に二次DASD416
に適用できるように、それぞれの時間間隔ごとにさらに
SDM414によってジャーナル処理される。
【0043】ここで図5を参照して説明すると、各レコ
ード・セットの先頭に挿入される接頭部ヘッダ500
は、接頭部ヘッダ500と、各レコード・セットごとに
SDM414に送信される実際の一次レコード・セット
情報600との長さの合計を記述するための総データ長
501を含む。操作タイム・スタンプ502は、PDM
404が現在処理している操作セットの開始時間を示す
タイム・スタンプである。この操作タイム・スタンプ5
02は、1組の一次記憶制御装置405に対してREA
D RECORD SET機能を実行する際に(シスプ
レックス・クロック407に応じて)PDM404によ
って生成される。一次DASD406の書込みの入出力
時間610(図6)は、各一次記憶制御装置405のR
EAD RECORD SETごとに固有のものであ
る。操作タイム・スタンプ502は、すべての記憶制御
装置で共通のものである。READ RECORD S
ETコマンドは、PDM404によって出されるが、以
下の条件のいずれかの場合に予測できる。 (1)一次記憶制御装置405の所定のしきい値に基づ
く、その一次記憶制御装置のアテンション割込み (2)所定の時間間隔に基づく、一次プロセッサ401
のタイマ割込み (3)レコード・セット情報が、使用可能であるがまだ
読み取られていない未解決のレコード・セットに関する
追加情報を示す場合 条件(2)では、タイマ間隔を使用して、低レベル活動
の期間中に二次システム431がどの程度遅れて実行す
るかを制御する。条件(3)は、PDM404が一次記
憶制御装置405の活動に遅れないようにするためにさ
らに活動を駆動する処理間隔中に、PDM404がすべ
てのレコード・セットを待ち行列処理しなかった場合に
発生する。
【0044】時間間隔グループ番号503は、現行レコ
ード・セット(整合性グループのうちの所与の時間間隔
グループについてすべての一次記憶制御装置405にわ
たるレコードのセット)が属す時間間隔(操作タイム・
スタンプ502とレコード読取り時間507によって境
界が示される)を識別するためにPDM404が出力す
る。グループ内順序番号504は、所与の時間間隔グル
ープ503内の各レコード・セットごとに一次記憶制御
装置405用のアプリケーションWRITE入出力の順
序を(PDM404に対して)識別するためにハードウ
ェアが提供するIDである。一次SSID(補助記憶域
ID)505は、各レコード・セットごとに一次記憶制
御装置405の特定の一次記憶制御装置を明確に識別す
るものである。二次ターゲット・ボリューム506は、
パフォーマンス上の考慮事項に応じて、PDM404ま
たはSDM414のいずれかによって割り当てられる。
レコード読取り時間507は、すべての一次記憶制御装
置405に共通の操作タイム・スタンプを提供し、現行
間隔のレコード・セットの終了時間を示す。
【0045】次に図6を参照して説明すると、レコード
・セット情報600は、一次記憶制御装置405によっ
て生成され、PDM404によって収集される。更新固
有情報601〜610は、レコード更新が行われた実際
の一次DASD406を含む各レコードの一次装置ユニ
ット・アドレス601を含む。シリンダ番号/ヘッド番
号(CCHH)602は、各レコード更新ごとの一次D
ASD406上の位置を示す。一次記憶制御装置のセッ
ションIDである一次SSID603は、一次SSID
505と同じものである。状況フラグ604は、特定の
データ・レコード620が後に続くかどうかに関する状
況情報を提供する。順序番号605および630は、レ
コード・セット全体(PDM404に転送されたすべて
のデータ)が読み取られたかどうかを示すために各レコ
ードに番号を1つずつ割り当てる。一次DASD書込み
入出力タイプ606は、各レコードについて行われた書
込み操作のタイプを識別する操作標識である。この操作
標識は、更新書込み、フォーマット書込み、部分トラッ
ク・レコード・フォロー、完全トラック・データ・フォ
ロー、消去コマンド実行、または全書込み実行を含む。
検索引数607は、最初に読み取られたレコード・セッ
ト・データ・レコード620に関する初期位置決め情報
を示す。セクタ番号608は、レコードが更新されたセ
クタを識別する。カウント・フィールド609は、後続
の特定のレコード・データ・フィールド620の数を記
述する。一次DASD406の書込み更新が行われたホ
スト・アプリケーション時間は、更新時間610に記録
される。特定のレコード・データ620は、各レコード
更新ごとのカウント/キー/データ(CKD)フィール
ドを提供する。最後に、順序番号630は、読み取られ
たレコード・セット全体がPDM404に転送されたか
どうかを示すために順序番号605と比較される。
【0046】一次DASD406でレコード更新が書き
込まれたのと同じ順序でSDM414がそのレコード更
新をコピーできるように、ソフトウェア・グループが呼
び出した整合性グループで更新レコードが処理される。
整合性グループを作成するのに使用する情報(すべての
記憶制御装置405から収集したすべてのレコード・セ
ットにわたる)は、操作タイム・スタンプ502、時間
間隔グループ番号503、グループ内順序番号504、
一次制御装置SSID505、レコード読取り時間50
7、一次装置アドレス601、一次SSID603、お
よび状況フラグ604を含む。1つの時間間隔グループ
用のすべてのレコードがSDM414側で各記憶制御装
置405ごとに受け取られたかどうかを判別するのに使
用する情報は、時間間隔グループ番号503、グループ
内順序番号504、物理制御装置ID505、および一
次SSID603を含む。完全復旧可能な一次DASD
406のレコード更新と同等に二次DASD416上に
レコード更新を配置するのに必要な情報は、二次ターゲ
ット・ボリューム506、CCHH602、一次DAS
D書込み入出力タイプ606、検索引数607、セクタ
番号608、カウント609、更新時間610、および
特定のレコード・データ620を含む。
【0047】図7および図8は、復旧時間とジャーナル
転送時間を単純化した現行ジャーナル内容を記述するた
めの状態テーブル700とマスタ・ジャーナル800を
それぞれ示す。状態テーブル700は、PDM404ま
たはSDM414のいずれかが収集した構成情報を提供
し、一次記憶制御装置のセッションID(SSID番
号)およびその制御装置でのボリュームと、対応する二
次記憶制御装置のセッションIDおよび対応するボリュ
ームとを含む。このため、構成情報は、どの一次ボリュ
ーム710または一次DASDエクステントが二次ボリ
ューム711または二次DASDエクステントにマッピ
ングされるかを追跡する。状態テーブル700まで単純
に拡張して部分ボリューム・エクステント712(CC
HHからCCHHまで)を示す場合、部分ボリューム遠
隔コピーは、ここに記載するのと同じ非同期遠隔コピー
方法を使用して達成できるが、完全ボリュームの場合よ
り細分性(トラックまたはエクステント)はより細かく
なる。
【0048】マスタ・ジャーナル800は、整合性グル
ープ番号、ジャーナル・ボリューム上の位置、および操
作タイム・スタンプを含む。また、マスタ・ジャーナル
800は、整合性グループにグループ化した特定のレコ
ード更新を維持する。状態テーブル700とマスタ・ジ
ャーナル800は、災害復旧をサポートするため、一次
システム410がもはや存在しないスタンドアロン環境
で動作できなければならない。
【0049】制御項目全体が正しく書き込まれるように
するため、タイム・スタンプ制御は各マスタ・ジャーナ
ル800の前後に置かれる。このタイム・スタンプ制御
は、さらに二次DASD417に書き込まれる。制御要
素は二重項目(1)および(2)を含み、次に示す例の
ように一方の項目が必ず現行項目になる。 (1)タイム・スタンプ制御|制御情報|タイム・スタ
ンプ制御 (2)タイム・スタンプ制御|制御情報|タイム・スタ
ンプ制御 いかなる時点でも、(1)または(2)のいずれかの項
目が現行または有効項目になるが、有効項目は前後に等
しいタイム・スタンプ制御を持つ項目である。災害復旧
では、制御情報を得るために、最新のタイム・スタンプ
を持つ有効項目を使用する。この制御情報は、状態情報
(記憶制御装置、装置、および適用される整合性グルー
プに関する環境情報)とともに、二次記憶制御装置41
5にどのレコード更新が適用されたかを判別するのに使
用する。
【0050】整合性グループ 所定の時間間隔の間にすべての一次記憶制御装置405
にわたるすべての読取りレコード・セットが二次側43
1で受け取られると、SDM414は、受け取った制御
情報を解釈し、レコード更新が最初に一次DASD40
6上で書き込まれたのと同じ順序でそのレコード更新が
適用されるように、受け取った読取りレコード・セット
をレコード更新・グループとして二次DASD416に
適用する。このため、一次側アプリケーションの順序
(データ保全性)整合性はすべて二次側431で維持さ
れる。このプロセスは、以下、整合性グループの形成と
呼ぶ。整合性グループの形成は、次のような仮定に基づ
いて行われる。(A)独立しているアプリケーション書
込みが制御装置の順序命令に違反しない場合は、どのよ
うな順序でもアプリケーション書込みを実行できる。
(B)従属しているアプリケーション書込みは、タイム
・スタンプの順に実行しなければならないため、アプリ
ケーションは、書込み番号1から制御装置終了、装置終
了を受け取る前に従属書込み番号2を実行することがで
きない。(C)第二の書込みは必ず(1)遅いタイム・
スタンプを持つ第一の書込みと同じレコード・セット整
合性グループに入るか、(2)後続のレコード・セット
整合性グループに入る。
【0051】図9を参照して説明すると、同図には、記
憶制御装置SSID1、SSID2、およびSSID3
など(記憶制御装置はいくつでも含めることができる
が、この例では明解にするため3つ使用する)に関する
整合性グループの形成例(整合性グループは一次側42
1または二次側431のいずれにも形成できるはずであ
る)が示されている。時間間隔T1、T2、およびT3
は昇順に発生するものと想定する。時間間隔T1の操作
タイム・スタンプ502は、記憶制御装置SSID1、
SSID2、およびSSID3について設定されてい
る。PDM404は、時間間隔T1〜T3の間に記憶制
御装置SSID1、2、および3からレコード・セット
・データを入手する。時間間隔T1のSSID1、2、
および3に関するレコード・セットは、時間間隔グルー
プ1であるG1(時間間隔グループ番号503)に割り
当てられる。グループ内順序番号504は、SSID
1、2、および3のそれぞれについて示され、この場
合、SSID1は11:59、12:00、および1
2:01に3つの更新を持ち、SSID2は12:00
および12:02に2つの更新を持ち、SSID3は1
1:58、11:59、および12:02に3つの更新
を持つ。時間間隔T2およびT3のレコード・セットは
列挙されているが、簡略化のため、更新時間の例は示さ
れていない。
【0052】ここで、二次側431で受け取った制御情
報およびレコード更新に基づいて、整合性グループNを
生成することができる。時間間隔グループ番号1のレコ
ード更新が時間間隔グループ番号2のレコード更新より
遅くならないようにするため、記憶制御装置SSID
1、2、および3のそれぞれの最後のレコード更新の最
も早い読取りレコード・セット時間と等しい、最小時間
が設定される。この例では、最小時間は12:01にな
る。最小時間と等しいかそれ以上の読取りレコード・セ
ット時間を有するレコード更新はすべて整合性グループ
N+1に含まれる。1つのボリュームに対する2つのレ
コード更新時間が等しい場合、シスプレックス・クロッ
ク407の十分な解像度が与えられる可能性はほとんど
ないが、時間間隔グループN内の早い順序番号を持つレ
コード更新は、整合性グループN用のそのグループとと
もに保管される。ここで、レコード更新は、読取りレコ
ード・セット時間に基づいて順序づけされる。複数のレ
コード更新の時間が等しい場合、小さい順序番号を持つ
レコード更新は、大きい順序番号を持つレコード更新の
前に置かれる。これに対して、複数のレコード更新のタ
イム・スタンプが等しいが、ボリュームが異なる場合
は、そのレコード更新が同じ整合性グループに保管され
ている限り、任意の順序にすることができる。
【0053】一次記憶制御装置405が、指定の時間間
隔の間に読取りレコード・セットへの応答を完了しなか
った場合、その一次記憶制御装置405が完了するま
で、整合性グループを形成することはできない。一次記
憶制御装置405がその操作を完了しなかった場合は、
未着割込みのために、システムの未着割込みハンドラが
制御権を受け取り、操作が終了する。これに対して、一
次記憶制御装置405が適切な時間に操作を完了した場
合は、入出力が完了に至り、通常操作が続行される。整
合性グループの形成では、一次記憶制御装置405に対
する書込み操作にタイム・スタンプが付けられると予想
される。しかし、プログラムによっては、タイム・スタ
ンプが付けられずに書込みが生成されるものもある。こ
の場合、一次記憶制御装置405は、タイム・スタンプ
としてゼロを返す。整合性グループの形成は、データが
読み取られたタイム・スタンプに基づいて、タイム・ス
タンプを持たないこれらのレコードの境界を示すことが
できる。整合性グループの時間別にレコード更新の境界
を容易に示せないほど、タイム・スタンプを持たないレ
コード更新が一定の時間間隔の間に多数発生した場合、
二重ボリュームが同期していないというエラーが発生す
る可能性がある。
【0054】図10および図11は、整合性グループを
形成する方法を示す流れ図である。図10を参照して説
明すると、このプロセスは、ステップ1000から始ま
り、一次側421が、行うべき遠隔データ・シャドーイ
ングを確立する。ステップ1010では、シスプレック
ス・クロック407を同期クロック(図4)として使用
して、すべてのアプリケーション入出力操作にタイム・
スタンプが付けられる。PDM404は、ステップ10
20で各一次記憶制御装置405との遠隔データ・シャ
ドーイング・セッションを開始するが、このステップ
は、データまたはレコードがシャドーイングされる一次
ボリュームの識別を含む。ステップ1030では、各ア
プリケーションWRITE入出力操作(図6を参照)ご
とに一次記憶制御装置405によってレコード・セット
情報600がトラッピングされる。
【0055】ステップ1040は、前述の通り、アテン
ション・メッセージを含むプロンプト、所定のタイミン
グ間隔、または読取りレコード数増加の通知に応じて、
PDM404が、捕捉したレコード・セット情報600
を各一次記憶制御装置405から読み取ることを含む。
ステップ1050でPDM404がレコード・セットの
読取りを開始すると、PDM404は、各レコード・セ
ットの前に特定のジャーナル・レコード(ジャーナル・
レコードは、接頭部ヘッダ500と、レコード・セット
情報600を含む)を作成するための接頭部ヘッダ50
0(図5を参照)を付ける。このジャーナル・レコード
には、二次側431(または一次側421)で整合性グ
ループを形成するのに必要な制御情報(およびレコー
ド)が含まれる。
【0056】ステップ1060では、PDM404が通
信リンク408を介して(整合性グループがそこで形成
される場合は、同じデータ・ムーバ・システム内で)S
DM414に生成したジャーナル・レコードを送信す
る。SDM414は、ステップ1070で状態テーブル
700を使用し、データ・シャドーイング・セッション
用に確立した各時間間隔グループおよび一次記憶制御装
置405ごとに、受け取ったレコード更新をグループ番
号別および順序番号別に収集する。ステップ1080で
SDM414は、ジャーナル・レコードを検査し、各時
間間隔グループごとにすべてのレコード情報を受け取っ
たかどうかを判別する。ジャーナル・レコードが不完全
な場合は、ステップ1085によって、SDM414は
PDM404に必要なレコード・セットを再送信するよ
う通知する。PDM404が正しく再送信できない場合
は、二重ボリューム対に障害が発生している。ジャーナ
ル・レコードが完全な場合は、SDM414による整合
性グループの形成を含むステップ1090が実行され
る。
【0057】図11を参照すると、同図には、整合性グ
ループを形成するためのステップ1090(図10)を
表すステップ1100〜1160が示されている。整合
性グループの形成は、ステップ1100から始まるが、
このステップでは、各ソフトウェア整合性グループが二
次DASD417(図4)上のSDM414ジャーナル
・ログ("hardened")に書き込まれる。ステップ111
0は、時間間隔グループが完全かどうかを判別するテス
トを実行する。すなわち、各一時記憶制御装置405
は、少なくとも1つの読取りレコード・セット・バッフ
ァを提示したか、レコード・セット・バッファ内にこの
ようなレコード更新が置かれていないという確認をPD
M404から受け取らなければならず、しかもデータ
(またはヌル)を持つすべての読取りレコード・セット
・バッファがSDM414によって受け取られていなけ
ればならない。時間間隔グループが不完全な場合は、ス
テップ1110は、必要なデータが受け取られるまで、
一次記憶制御装置405からのレコード・セットの読取
りを再試行する。エラーが発生した場合は、特定の1つ
または複数の二重ボリューム対に障害が発生している可
能性がある。完全な時間間隔グループを受け取ると、ス
テップ1120は、第一の整合性グループ・ジャーナル
・レコードを判別する。この第一(または現行)の整合
性グループ・ジャーナル・レコードとは、最も早い操作
タイム・スタンプ502と、同じ操作タイム・スタンプ
502を持つすべてのレコードの最も早い更新時間61
0とを含むレコードである。
【0058】ステップ1130は、現行整合性グループ
・ジャーナル・レコードに含まれるレコードを検査し
て、どのレコードがそこに最後に含めるレコードかを判
別する(一部のレコードは除去され、次の整合性グルー
プ・ジャーナル・レコードに含まれる)。現行整合性グ
ループ・ジャーナル・レコードの最後のレコードは、各
一次記憶制御装置405ごとに最大更新時間のうちの最
小更新時間(最小時間)として判別される(つまり、各
一次記憶制御装置405の最後の更新が比較され、これ
らのうちの最も早いものだけが現行整合性グループ・ジ
ャーナル・レコードに残る)。
【0059】現行整合性グループ・ジャーナル・レコー
ドに残っているこれらのレコード更新は、ステップ11
40で、更新時間610とグループ内順序番号504に
応じて順序付けされる。レコード更新を持たない一次記
憶制御装置405は、整合性グループに関与しない。ス
テップ1150では、現行整合性グループの残っている
レコード更新(最小時間より遅い更新時間を持つもの)
が、次の整合性グループに渡される。それぞれのグルー
プ内順序番号504は、空バッファで終わり、その操作
時間間隔の間にすべての読取りレコード・セットが読み
取られたことを示すはずである。空バッファがない場合
は、現行ソフトウェア整合性グループ内の最後のレコー
ドを定義するステップ1120を、レコード読取り時間
507および更新時間610と併せ使用して、一次記憶
制御装置405におけるアプリケーションWRITE入
出力操作の正しい順序を決定することができる。
【0060】ステップ1160は、完全災害復旧の制約
の下で特定の書込み更新が二次DASD416に適用さ
れる、遠隔データ・シャドーイング・プロセスのバック
エンドを表している。二次DASD416に更新内容を
書き込む際に入出力エラーが発生するか、または二次側
431全体が停止し、最初期設定された場合は、書込み
プロセスに入っていた整合性グループ全体を最初から再
適用することができる。このため、どの二次DASD4
16の入出力が行われたか、どの入出力が行われなかっ
たか、どの入出力が処理中かなどを追跡せずに、遠隔シ
ャドーイングを行うことができる。
【0061】二次入出力書込み ステップ1160の重要な構成要素は、二次側431が
一次側421から後れをとらないように、PDM414
によってレコードが二次DASD416に効率よく書き
込まれることである。必要な効率は、主に、様々な二次
DASD416への複数の入出力操作を同時に実行する
ことによって達成される。二次DASD416を一度に
1つずつ連続して書き込むと、二次側431は一次側4
21からかなり遅れてしまう恐れがある。単一チャネル
・コマンド・ワード(CCW)連鎖を介して単一の二次
装置宛ての整合性グループごとにレコードを書き込め
ば、二次側431ではさらに高い効率が得られる。それ
ぞれの単一CCW連鎖内では、そこで行われる各二次D
ASD416のデータ・トラックへの入出力操作が一次
ボリュームでの発生順に維持されている限り、その入出
力操作をさらに最適化することができる。
【0062】特定の整合性グループ用の二次入出力操作
を単一CCW連鎖内で最適化する場合、一部は一次書込
み入出力操作のパターンに基づいて行われ、一部は二次
DASD416の物理特性に基づいて行われる。最適化
は、二次DASD416がカウント/キー/データ(C
KD)か、拡張カウント/キー/データ(ECKD)
か、固定ブロック方式(FBA)かなどに応じて、多少
変化する可能性がある。その結果、所与の時間間隔の間
に1つの一次DASD406に対して行われる複数のW
RITE入出力(m)は、1つの二次DASD416の
ボリュームに対する単一のSTART入出力操作に削減
することができる。このように二次記憶制御装置415
に対するSTART入出力の回数をm:1に最適化する
と、二次DASD416は後れをとらずに済み、それに
より、一次側421のレコード更新をもっと精密にシャ
ドーイングすることができる。
【0063】正常な遠隔データ・シャドーイングとそれ
による二次入出力の最適化の重要点は、一貫性のあるコ
ピーを復旧に使用できるように、二次DASD416に
対して同時に行う複数の入出力操作のいずれかで発生す
る回復不能エラーを最小限にすることである。所与の二
次書込みで失敗すると、その後の従属書込みが条件付け
書込みを伴わずに記録される恐れがある(たとえば、実
際にはデータベース用の実際の更新書込みが失敗に終わ
っているのにデータベース・レコードが更新されたこと
を示すログ項目は、二次DASD416のコピーの順序
整合性に違反する)。
【0064】その更新失敗が復旧されるまで、失敗した
二次DASD416のコピーはアプリケーションの復旧
に使用できなくなる。失敗した更新は、SDM414に
よってPDM404から現行コピーを要求することで修
正できるはずである。その間に二次データ・コピーは不
整合になり、そのため、PDM404が現行更新で応答
し、それ以前の他のすべての更新がPDM404によっ
て処理されるまで使用できなくなる。通常、失敗した更
新の復旧に要する時間は、十分な災害復旧保護のために
受け入れられないほど長い非復旧ウィンドウを示す。
【0065】効果的な二次側431の入出力最適化は、
所与の整合性グループについて書き込まれるデータ・レ
コード・セットを検査し、ECKD方式などの二次DA
SD416の特定の方式の規則に基づいて連鎖を構築す
ることで実現される。ここに開示する最適化技法は、入
出力エラーが発生した場合に整合性グループを適用する
際に、CCW連鎖を再実行できるように、または、二次
初期プログラム・ロード(IPL)復旧の場合に、デー
タを紛失せずに整合性グループ全体を再適用できるよう
に、入出力エラーからの復旧を単純化するものである。
【0066】図12は、ECKD方式用のすべてのWR
ITE入出力の組合せに対応するCCW連鎖を構築する
ための完全整合性グループ復旧(FCGR)の規則を要
約して示すもので、ここではCCHHRレコード形式が
使用される(シリンダ番号、ヘッド番号、レコード番
号)。図12は、1つの整合性グループの範囲内でDA
SDトラックに対して行われるWRITE入出力操作の
可能な組合せをそれぞれ検査することによって作成され
る。図12のFCGR規則(図14および図15に記載
する)は、整合性グループを適用する際のエラーについ
て完全復旧を行うためにデータ配置(二次DASD41
6の入出力書込みCCW連鎖)を管理する場合に従うも
のである。図12に示すFCGR規則は、新しいWRI
TE入出力操作が追加されるたびに適切に拡張されるこ
とになる。これらの規則は、二次側431のハードウェ
アまたはソフトウェアで実現することができる。FCG
R規則は、同一DASDトラック分析に対するREAD
レコード・セットを、一次DASD406のWRITE
入出力タイプ、検索引数、およびカウント・フィールド
とキー・フィールドの検査に還元するので好都合であ
る。
【0067】図12に示すように整合性グループの書込
み操作を検査せずにDASDトラックが書き込まれる
と、前に書き込まれたデータ・レコードの再書込みがで
きなくなる可能性がある。たとえば、以下の内容の連鎖
があると想定する。 レコード5へのWRITE UPDATE レコード1へのFORMAT WRITE この場合、レコード1とレコード5は同じDASDトラ
ックに存在し、レコード1がレコード5の前に置かれ
る。レコード5はUPDATE WRITE CCWに
よって更新されるが、FORMAT WRITE入出力
CCWは、トラックの残りを消去してレコード1を更新
するため、レコード5は削除される。この連鎖を再実行
しなければならない場合、レコード5の先頭に配置する
LOCATERECORD CCWが位置決めポイント
を持たなくなる(レコード5が存在しなくなる)ため、
この連鎖は先頭から完全に回復することができない。一
次側421ですでに書込み操作が正常に行われているの
で、データの整合性と保全性を維持するには、二次DA
SD416上の整合性グループ全体をいつでも適用でき
ることが必要である。
【0068】図16のステップ1410〜1470は、
図11のステップ1160によって表され、図12に定
義されるFCGR規則を使用するプロセスの詳細を示す
ものである。ステップ1410でSDM414は、現行
整合性グループの各種レコードを2つのカテゴリに分割
する。第一のカテゴリは、同じ二次DASDボリューム
向けの入出力命令を含み、第二のカテゴリは、第一のカ
テゴリに含まれるレコードのうち、同じCCHH向けの
レコードの入出力命令を含む(すなわち、同じDASD
トラックに更新されるレコード)。
【0069】現行整合性グループのレコードのカテゴリ
分類後、ステップ1420では、トラック上のデータ配
置を識別し、トラック/レコードのアドレス指定を行う
ために、アプリケーションのWRITE入出力およびS
DM414のWRITE入出力を二次DASD416の
方式、たとえば、ECKD方式のFCGR規則(図12
を参照)に適合させる。SDM414は、ステップ14
30で、同じボリュームに対する二次DASDのWRI
TE入出力操作を単一入出力CCW連鎖にグループ分け
する。ステップ1440は、実際の二次DASD416
の書込み用の検索引数と特定のレコード・データ(CK
Dフィールド)に応じて、それぞれの二次DASD41
6のヘッド・ディスク・アセンブリ(HDA)を移動さ
せることを含む。
【0070】ステップ1450では、後続の書込み操作
によって、前の書込み操作またはDASD検索引数(こ
こで消去されるレコードでの分割など)を無効にするか
どうかを判別するために図12のFCGR規則を使用し
て、第二のカテゴリ(通常、レコードを受け取るトラッ
クごとに1つずつ、複数の第二のカテゴリが存在する)
を構成するレコードについてREAD SET BUF
FERS1と2を比較する。FCGR規則に従うと、エ
ラーが発生した場合に、一次側421からレコード更新
を再度受け取らなくても、SDM414は整合性グルー
プ全体を再書込みできるようになる。SDM414が現
行整合性グループを二次DASD416に適用した後、
ステップ1460では、状態テーブル(図7)とマスタ
・ジャーナル(図8)を更新する。
【0071】ステップ1470は、次の整合性グループ
(現行整合性グループになるもの)を獲得して、処理を
ステップ1410に戻すので、遠隔コピー・プロセスは
リアルタイムで続行される。一次側421から二次側4
31への通信が終了した場合、遠隔コピー・プロセスは
停止する。この通信は、ボリューム対がPDM404に
よってプロセスから削除された場合、一次側が破壊され
た場合(災害が発生した場合)、規則的な運転停止が行
われた場合、または二次側431で特定の引継ぎ処置が
行われた場合に終了することがある。二次側431でジ
ャーナル処理された整合性グループは、引継ぎ操作中に
二次DASD416に適用することができる。一次側4
21が捕捉したデータのうち、SDM414によって完
全に受け取られていないデータだけが紛失する。
【0072】要約すると、これまで同期および非同期遠
隔データ二重化システムについて説明してきた。同期遠
隔データ二重化システムは、記憶域ベースのリアルタイ
ム災害復旧機能を提供するが、この遠隔データ二重化シ
ステムは一次側と二次側を含む。二次側は、データ・シ
ャドーイングのために一次側から書込み入出力更新を同
期的に受け取るが、災害によって一次側が使用不能にな
った場合に二次側がリアルタイムのデータ可用性を提供
できるように、二次側は一次側から数千キロメートル離
れた位置に配置される。一次側の一次プロセッサは複数
のアプリケーションをサポートし、この複数のアプリケ
ーションによって書込み入出力更新が行われる。複数の
一次記憶制御装置がこの書込み入出力更新を受け取り、
書込み入出力更新が複数の一次記憶装置に書き込まれる
ようにする。二次側の二次プロセッサは、データ・リン
クによって一次プロセッサに連結され、二次側の複数の
二次記憶制御装置は、二次プロセッサに連結され、さら
に複数の光ファイバ・リンクを介して複数の一次記憶制
御装置に連結されているため、複数の二次記憶制御装置
は、書込み入出力更新をシャドーイングするために記憶
域ベースの二重対を提供する。複数の二次記憶装置は、
複数の一次記憶制御装置から受け取った順に複数の二次
記憶制御装置から書込み入出力更新を受け取る。
【0073】一次プロセッサ内の入出力エラー回復プロ
グラムは、複数の二次記憶制御装置と通信し、二重対の
障害が発生した場合は、この入出力エラー回復プログラ
ムが前記複数のアプリケーションから制御権を引き継
ぎ、エラー回復を行いながら、障害が発生した二重対の
特徴に関して一次プロセッサと複数の二次記憶制御装置
に二重対障害発生メッセージを出力する。入出力エラー
回復プログラムは、エラー回復が失敗に終わった場合に
一次および二次プロセッサに状況を出力しながら、さら
に入出力書込み更新が行われるのを防止する。
【0074】特に本発明の実施例に関連して本発明を図
示し説明してきたが、当業者は、本発明の精神および範
囲を逸脱せずに形態および詳細の様々な変更が可能であ
ることに留意されたい。たとえば、一次プロセッサと二
次プロセッサとの間、および一次記憶制御装置と二次記
憶制御装置との間の通信リンクは変更可能である。ま
た、同期遠隔二重化モードの一次側と二次側を分離する
距離は、本発明の教示から逸脱せずに今後の本発明の実
施例における改良型の通信リンクによってさらに延長す
ることができる。
【0075】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0076】(1)一次側が一次記憶サブシステムに連
結された一次プロセッサを含み、前記一次プロセッサが
一次記憶サブシステムへの入出力書込み更新の原因とな
る少なくとも1つのアプリケーションをそこで実行し、
前記一次プロセッサがそこで実行される入出力エラー回
復プログラム(入出力ERP)をさらに有し、二次側が
二次記憶サブシステムに連結された二次プロセッサを含
み、前記二次側が入出力書込み更新を同期的にシャドー
イングし、前記二次記憶サブシステムが入出力ERPと
通信する、遠隔データ・シャドーイングを提供する方法
において、前記方法が、(a)前記一次記憶サブシステ
ムから前記二次記憶サブシステムに入出力書込み更新を
送るステップと、(b)前記一次および二次記憶サブシ
ステム間に二重対が確立されているかどうかを判別する
ステップと、(c)一次記憶サブシステムから一次プロ
セッサに障害が発生した二重対を報告するステップと、
(d)二重対の障害が発生した場合に、少なくとも1つ
のアプリケーションから入出力ERPに一次プロセッサ
の制御権を移転するステップと、(e)二重対の障害の
原因を判別するステップと、(f)入出力ERPから二
次記憶サブシステムに二重対障害発生メッセージを送る
ステップとを含む方法。 (2)二重対の状況が設定されるか回復された場合に前
記一次記憶サブシステムが更新の書込みを続行すること
を特徴とする、上記(1)に記載の遠隔データ・シャド
ーイングを提供する方法。 (3)障害が発生した二重対を報告する際に前記一次記
憶サブシステムが前記一次プロセッサに入出力状況とし
てチャネル終了/装置終了/装置チェックを報告するこ
とがステップ(c)に含まれることを特徴とする、上記
(2)に記載の遠隔データ・シャドーイングを提供する
方法。 (4)入出力ERPが一次記憶サブシステムにセンス入
出力を出すことがステップ(d)に含まれることを特徴
とする、上記(3)に記載の遠隔データ・シャドーイン
グを提供する方法。 (5)二重対の障害が発生した場合に入出力ERPによ
るエラー回復を実行し、二次側でデータ保全性を維持す
るためのステップ(g)をさらに含むことを特徴とす
る、上記(4)に記載の遠隔データ・シャドーイングを
提供する方法。 (6)エラー回復が正常に完了した後で入出力ERPか
ら少なくとも1つのアプリケーションに制御権を返すた
めのステップ(h)をさらに含むことを特徴とする、上
記(5)に記載の遠隔データ・シャドーイングを提供す
る方法。 (7)エラー回復が正常に完了できなかった場合に入出
力ERPを介して二次側に障害発生同期遠隔コピー・メ
ッセージを送るためのステップ(i)をさらに含むこと
を特徴とする、上記(6)に記載の遠隔データ・シャド
ーイングを提供する方法。 (8)ステップ(i)によって、一次記憶サブシステム
への後続の入出力書込みがさらに防止されることを特徴
とする、上記(7)に記載の遠隔データ・シャドーイン
グを提供する方法。 (9)一次プロセッサと二次プロセッサとの間でエラー
回復のための通信が行われることを特徴とする、上記
(5)に記載の遠隔データ・シャドーイングを提供する
方法。 (10)一次記憶サブシステムと二次記憶サブシステム
との間でエラー回復のための通信が行われることを特徴
とする、上記(5)に記載の遠隔データ・シャドーイン
グを提供する方法。 (11)一次側と二次側を有し、データ・バックアップ
のために二次側が一次側から書込み更新を受け取り、一
次側を使用不能にする災害が発生した場合に、二次側が
リアルタイムのデータ可用性を提供できるように、二次
側が一次側から十分離れた位置に配置される遠隔データ
二重化システムにおいて、遠隔データ二重化システム
が、書込み入出力更新を生成する少なくとも1つのアプ
リケーションを実行する、一次側の一次プロセッサと、
書込み入出力更新を受け取って格納するための一次記憶
サブシステムと、データ・リンクによって一次プロセッ
サに連結される、二次側の二次プロセッサと、二次プロ
セッサに連結され、通信リンクを介してさらに一次記憶
サブシステムに連結され、書込み入出力更新のバックア
ップのために記憶域ベースの二重対を提供し、受け取っ
たときの特定の同期順に書込み入出力更新が書き込まれ
る、二次側の二次記憶サブシステムと、一次プロセッサ
内にあって、二次記憶サブシステムに連結され、二重対
の障害が発生した場合にエラー回復を行うためのエラー
回復手段とを含む遠隔データ二重化システム。 (12)エラー回復手段が、一次プロセッサと二次側の
両方に二重対障害発生モードを報告することを特徴とす
る、上記(11)に記載の遠隔データ二重化システム。 (13)エラー回復手段が、二重対の障害の原因を判別
しながら、一次プロセッサで実行中のアプリケーション
を静止することを特徴とする、上記(11)に記載の遠
隔データ二重化システム。 (14)エラー回復手段が、一次記憶サブシステムにセ
ンス入出力を出すことを特徴とする、上記(13)に記
載の遠隔データ二重化システム。 (15)エラー回復手段がエラー回復を完了し、二重モ
ードが再確立された後、エラー回復手段が一次プロセッ
サで実行中のアプリケーションに制御権を返すことを特
徴とする、上記(14)に記載の遠隔データ二重化シス
テム。 (16)エラー回復手段がエラー回復を正常に完了でき
ない場合に、エラー回復手段が一次記憶サブシステムの
書込み入出力更新をさらに防止することを特徴とする、
上記(15)に記載の遠隔データ二重化システム。 (17)一次プロセッサに連結され、エラー回復手段か
らエラー・メッセージを受け取るための一次コンソール
と、二次プロセッサに連結され、エラー回復手段からエ
ラー・メッセージを受け取るための二次コンソールとを
さらに含むことを特徴とする、上記(11)に記載の遠
隔データ二重化システム。 (18)一次および二次記憶サブシステムがそれぞれ複
数の記憶制御装置を含むことを特徴とする、上記(1
1)に記載の遠隔データ二重化システム。 (19)通信リンクが、複数のエンタープライズ・シス
テム接続(ESCON)リンクを含むことを特徴とす
る、上記(18)に記載の遠隔データ二重化システム。 (20)一次側と二次側を有し、データ・シャドーイン
グのために二次側が一次側から書込み入出力更新を同期
的に受け取り、一次側が使用不能になった場合に、二次
側がリアルタイムのデータ可用性を提供できるように、
二次側が一次側から十分離れた位置に配置される、記憶
域ベースのリアルタイム災害復旧機能を提供する遠隔デ
ータ二重化システムにおいて、該遠隔データ二重化シス
テムが、書込み入出力更新を生成する複数のアプリケー
ションを実行する、一次側の一次プロセッサと、書込み
入出力更新を受け取るための複数の一次記憶制御装置
と、書込み入出力更新を格納するための複数の一次記憶
装置と、データ・リンクによって一次プロセッサに連結
される、二次側の二次プロセッサと、二次プロセッサに
連結され、さらに複数の光ファイバ・リンクを介して複
数の一次記憶制御装置に連結され、書込み入出力更新を
シャドーイングするために記憶域ベースの二重対を提供
し、書込み入出力更新が生成された順に提供される、二
次側の複数の二次記憶制御装置と、複数の二次記憶制御
装置に連結され、そこに書込み入出力更新を格納するた
めの複数の二次記憶装置と、一次プロセッサ内にあっ
て、複数の二次記憶制御装置に連結され、二重対の障害
が発生した場合に前記複数のアプリケーションから制御
権を引き継ぎ、エラー回復を行いながら、二重対の障害
の特徴に関して一次プロセッサおよび複数の二次記憶制
御装置に二重対障害発生メッセージを出力し、エラー回
復が失敗に終わった場合にさらに入出力更新を防止し、
一次および二次プロセッサに状況を出力するためのエラ
ー回復手段とを含む遠隔データ二重化システム。
【0077】
【発明の効果】本発明の実施により、一次側で行った書
込み更新を二次側にシャドーイングするための改良され
た設計および方法を提供することができる。
【図面の簡単な説明】
【図1】同期遠隔データ・シャドーイング機能を有する
災害復旧システムのブロック図である。
【図2】図1の災害復旧システムにより同期遠隔コピー
を提供する方法を示す流れ図である。
【図3】入出力エラー回復プログラム(入出力ERP)
操作の方法を示す流れ図である。
【図4】非同期遠隔データ・シャドーイング機能を有す
る災害復旧システムのブロック図である。
【図5】図4の一次側からの読取りレコード・セットの
前に付く接頭部ヘッダを示すデータ形式図である。
【図6】読取りレコード・セットを構成する各種フィー
ルドを示すデータ形式図である。
【図7】ボリューム構成情報を識別する状態テーブルで
ある。
【図8】図4の二次側が使用するマスタ・ジャーナルで
ある。
【図9】整合性グループを形成するためのシーケンス例
である。
【図10】整合性グループを形成するために情報および
読取りレコード・セットを収集する方法を示す流れ図で
ある。
【図11】整合性グループを形成する方法を示す流れ図
である。
【図12】DASDトラックに対する所与の入出力操作
シーケンスの場合のECKD方式装置用の完全整合性グ
ループ復旧規則アプリケーションを示すテーブルであ
る。
【図13】図12のテーブルで使用する規則の説明の構
成を示す図である。
【図14】図12のテーブルで使用する規則の説明の一
部である。
【図15】図12のテーブルで使用する規則の説明の一
部である。
【図16】完全整合性グループ復旧機能を持つ二次側に
読取りレコード・セット・コピーを書き込む方法の流れ
図である。
【符号の説明】
1 一次プロセッサ 2 入出力ERP 3 一次記憶制御装置 4 一次DASD 5 二次プロセッサ 6 二次記憶制御装置 7 二次DASD 8 対等通信リンク 9 エンタープライズ・システム接続(ESCON)リ
ンク 10 災害復旧システム 11 ホスト間通信リンク 12 チャネル 13 チャネル 14 一次側 15 二次側
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ウィリアム・フランク・ミッカ アメリカ合衆国85718 アリゾナ州ツーソ ン イースト・ラエスパルダ 3921 (72)発明者 クラウス・ウィリアム・ミッケルセン アメリカ合衆国95120 カリフォルニア州 サンノゼ シーナリー・コート・ドライブ 6557 (72)発明者 マイケル・アロイシウス・ポールソン アメリカ合衆国95037 カリフォルニア州 モーガン・ヒル ホウィッパーウィル・ド ライブ2901 (72)発明者 ロバート・ウェズリー・ショムラー アメリカ合衆国95037 カリフォルニア州 モーガン・ヒル ピエドモント・コート 17015

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】一次側が一次記憶サブシステムに連結され
    た一次プロセッサを含み、前記一次プロセッサが一次記
    憶サブシステムへの入出力書込み更新の原因となる少な
    くとも1つのアプリケーションをそこで実行し、前記一
    次プロセッサがそこで実行される入出力エラー回復プロ
    グラム(入出力ERP)をさらに有し、二次側が二次記
    憶サブシステムに連結された二次プロセッサを含み、前
    記二次側が入出力書込み更新を同期的にシャドーイング
    し、前記二次記憶サブシステムが入出力ERPと通信す
    る、遠隔データ・シャドーイングを提供する方法におい
    て、前記方法が、 (a)前記一次記憶サブシステムから前記二次記憶サブ
    システムに入出力書込み更新を送るステップと、 (b)前記一次および二次記憶サブシステム間に二重対
    が確立されているかどうかを判別するステップと、 (c)一次記憶サブシステムから一次プロセッサに障害
    が発生した二重対を報告するステップと、 (d)二重対の障害が発生した場合に、少なくとも1つ
    のアプリケーションから入出力ERPに一次プロセッサ
    の制御権を移転するステップと、 (e)二重対の障害の原因を判別するステップと、 (f)入出力ERPから二次記憶サブシステムに二重対
    障害発生メッセージを送るステップとを含む方法。
  2. 【請求項2】二重対の状況が設定されるか回復された場
    合に前記一次記憶サブシステムが更新の書込みを続行す
    ることを特徴とする、請求項1に記載の遠隔データ・シ
    ャドーイングを提供する方法。
  3. 【請求項3】障害が発生した二重対を報告する際に前記
    一次記憶サブシステムが前記一次プロセッサに入出力状
    況としてチャネル終了/装置終了/装置チェックを報告
    することがステップ(c)に含まれることを特徴とす
    る、請求項2に記載の遠隔データ・シャドーイングを提
    供する方法。
  4. 【請求項4】入出力ERPが一次記憶サブシステムにセ
    ンス入出力を出すことがステップ(d)に含まれること
    を特徴とする、請求項3に記載の遠隔データ・シャドー
    イングを提供する方法。
  5. 【請求項5】二重対の障害が発生した場合に入出力ER
    Pによるエラー回復を実行し、二次側でデータ保全性を
    維持するためのステップ(g)をさらに含むことを特徴
    とする、請求項4に記載の遠隔データ・シャドーイング
    を提供する方法。
  6. 【請求項6】エラー回復が正常に完了した後で入出力E
    RPから少なくとも1つのアプリケーションに制御権を
    返すためのステップ(h)をさらに含むことを特徴とす
    る、請求項5に記載の遠隔データ・シャドーイングを提
    供する方法。
  7. 【請求項7】エラー回復が正常に完了できなかった場合
    に入出力ERPを介して二次側に障害発生同期遠隔コピ
    ー・メッセージを送るためのステップ(i)をさらに含
    むことを特徴とする、請求項6に記載の遠隔データ・シ
    ャドーイングを提供する方法。
  8. 【請求項8】ステップ(i)によって、一次記憶サブシ
    ステムへの後続の入出力書込みがさらに防止されること
    を特徴とする、請求項7に記載の遠隔データ・シャドー
    イングを提供する方法。
  9. 【請求項9】一次プロセッサと二次プロセッサとの間で
    エラー回復のための通信が行われることを特徴とする、
    請求項5に記載の遠隔データ・シャドーイングを提供す
    る方法。
  10. 【請求項10】一次記憶サブシステムと二次記憶サブシ
    ステムとの間でエラー回復のための通信が行われること
    を特徴とする、請求項5に記載の遠隔データ・シャドー
    イングを提供する方法。
  11. 【請求項11】一次側と二次側を有し、データ・バック
    アップのために二次側が一次側から書込み更新を受け取
    り、一次側を使用不能にする災害が発生した場合に、二
    次側がリアルタイムのデータ可用性を提供できるよう
    に、二次側が一次側から十分離れた位置に配置される遠
    隔データ二重化システムにおいて、遠隔データ二重化シ
    ステムが、 書込み入出力更新を生成する少なくとも1つのアプリケ
    ーションを実行する、一次側の一次プロセッサと、 書込み入出力更新を受け取って格納するための一次記憶
    サブシステムと、 データ・リンクによって一次プロセッサに連結される、
    二次側の二次プロセッサと、 二次プロセッサに連結され、通信リンクを介してさらに
    一次記憶サブシステムに連結され、書込み入出力更新の
    バックアップのために記憶域ベースの二重対を提供し、
    受け取ったときの特定の同期順に書込み入出力更新が書
    き込まれる、二次側の二次記憶サブシステムと、 一次プロセッサ内にあって、二次記憶サブシステムに連
    結され、二重対の障害が発生した場合にエラー回復を行
    うためのエラー回復手段とを含む遠隔データ二重化シス
    テム。
  12. 【請求項12】エラー回復手段が、一次プロセッサと二
    次側の両方に二重対障害発生モードを報告することを特
    徴とする、請求項11に記載の遠隔データ二重化システ
    ム。
  13. 【請求項13】エラー回復手段が、二重対の障害の原因
    を判別しながら、一次プロセッサで実行中のアプリケー
    ションを静止することを特徴とする、請求項11に記載
    の遠隔データ二重化システム。
  14. 【請求項14】エラー回復手段が、一次記憶サブシステ
    ムにセンス入出力を出すことを特徴とする、請求項13
    に記載の遠隔データ二重化システム。
  15. 【請求項15】エラー回復手段がエラー回復を完了し、
    二重モードが再確立された後、エラー回復手段が一次プ
    ロセッサで実行中のアプリケーションに制御権を返すこ
    とを特徴とする、請求項14に記載の遠隔データ二重化
    システム。
  16. 【請求項16】エラー回復手段がエラー回復を正常に完
    了できない場合に、エラー回復手段が一次記憶サブシス
    テムの書込み入出力更新をさらに防止することを特徴と
    する、請求項15に記載の遠隔データ二重化システム。
  17. 【請求項17】一次プロセッサに連結され、エラー回復
    手段からエラー・メッセージを受け取るための一次コン
    ソールと、 二次プロセッサに連結され、エラー回復手段からエラー
    ・メッセージを受け取るための二次コンソールとをさら
    に含むことを特徴とする、請求項11に記載の遠隔デー
    タ二重化システム。
  18. 【請求項18】一次および二次記憶サブシステムがそれ
    ぞれ複数の記憶制御装置を含むことを特徴とする、請求
    項11に記載の遠隔データ二重化システム。
  19. 【請求項19】通信リンクが、複数のエンタープライズ
    ・システム接続(ESCON)リンクを含むことを特徴
    とする、請求項18に記載の遠隔データ二重化システ
    ム。
  20. 【請求項20】一次側と二次側を有し、データ・シャド
    ーイングのために二次側が一次側から書込み入出力更新
    を同期的に受け取り、一次側が使用不能になった場合
    に、二次側がリアルタイムのデータ可用性を提供できる
    ように、二次側が一次側から十分離れた位置に配置され
    る、記憶域ベースのリアルタイム災害復旧機能を提供す
    る遠隔データ二重化システムにおいて、該遠隔データ二
    重化システムが、 書込み入出力更新を生成する複数のアプリケーションを
    実行する、一次側の一次プロセッサと、 書込み入出力更新を受け取るための複数の一次記憶制御
    装置と、 書込み入出力更新を格納するための複数の一次記憶装置
    と、 データ・リンクによって一次プロセッサに連結される、
    二次側の二次プロセッサと、 二次プロセッサに連結され、さらに複数の光ファイバ・
    リンクを介して複数の一次記憶制御装置に連結され、書
    込み入出力更新をシャドーイングするために記憶域ベー
    スの二重対を提供し、書込み入出力更新が生成された順
    に提供される、二次側の複数の二次記憶制御装置と、 複数の二次記憶制御装置に連結され、そこに書込み入出
    力更新を格納するための複数の二次記憶装置と、 一次プロセッサ内にあって、複数の二次記憶制御装置に
    連結され、二重対の障害が発生した場合に前記複数のア
    プリケーションから制御権を引き継ぎ、エラー回復を行
    いながら、二重対の障害の特徴に関して一次プロセッサ
    および複数の二次記憶制御装置に二重対障害発生メッセ
    ージを出力し、エラー回復が失敗に終わった場合にさら
    に入出力更新を防止し、一次および二次プロセッサに状
    況を出力するためのエラー回復手段とを含む遠隔データ
    二重化システム。
JP6301109A 1994-02-22 1994-12-05 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム Pending JPH07239799A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US199448 1994-02-22
US08/199,448 US5615329A (en) 1994-02-22 1994-02-22 Remote data duplexing

Publications (1)

Publication Number Publication Date
JPH07239799A true JPH07239799A (ja) 1995-09-12

Family

ID=22737546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6301109A Pending JPH07239799A (ja) 1994-02-22 1994-12-05 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム

Country Status (4)

Country Link
US (1) US5615329A (ja)
EP (1) EP0671686B1 (ja)
JP (1) JPH07239799A (ja)
DE (1) DE69502125T2 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099277A (ja) * 1998-09-18 2000-04-07 Fujitsu Ltd ファイルユニット間のリモート転送方法
JP2004078993A (ja) * 2003-10-31 2004-03-11 Hitachi Ltd 複合計算機システムおよび複合i/oシステム
JP2004164657A (ja) * 2003-12-08 2004-06-10 Hitachi Ltd 複合計算機システムおよび複合i/oシステム
JP2004519754A (ja) * 2000-09-06 2004-07-02 ユニシス コーポレイシヨン データの整合性を保証するための方法および装置
US6845435B2 (en) * 1999-12-16 2005-01-18 Hitachi, Ltd. Data backup in presence of pending hazard
JP2007048319A (ja) * 2006-11-09 2007-02-22 Hitachi Ltd 複合計算機システムおよび複合i/oシステム
JP2007513424A (ja) * 2003-12-01 2007-05-24 イーエムシー コーポレイション 複数の記憶装置に対する仮想の順序付けられた書き込み
US7398364B2 (en) 2005-02-25 2008-07-08 Hitachi, Ltd. Switching method of data replication mode
JP2009532789A (ja) * 2006-04-06 2009-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション ストレージ・サブシステム全体にわたる整合的な更新のための方法、システム、およびコンピュータ・プログラム
JP2010524105A (ja) * 2007-04-11 2010-07-15 インターナショナル・ビジネス・マシーンズ・コーポレーション データ・ストレージ・システムによって処理されたデータを識別するための方法及びシステム
JP2011164750A (ja) * 2010-02-05 2011-08-25 Fujitsu Ltd ストレージ装置、ストレージ装置制御プログラムおよびストレージ装置制御方法
US8914596B2 (en) 2003-12-01 2014-12-16 Emc Corporation Virtual ordered writes for multiple storage devices
JP2015142344A (ja) * 2014-01-30 2015-08-03 日本電気株式会社 通信システム、制御装置、通信ノード、制御情報の設定方法及びプログラム

Families Citing this family (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544347A (en) * 1990-09-24 1996-08-06 Emc Corporation Data storage system controlled remote data mirroring with respectively maintained data indices
US5680580A (en) * 1995-02-28 1997-10-21 International Business Machines Corporation Remote copy system for setting request interconnect bit in each adapter within storage controller and initiating request connect frame in response to the setting bit
JPH0926892A (ja) * 1995-04-27 1997-01-28 Tandem Comput Inc 遠隔的に複製されかつ動的に再構成可能なメモリを有するコンピュータシステム
US5720029A (en) * 1995-07-25 1998-02-17 International Business Machines Corporation Asynchronously shadowing record updates in a remote copy session using track arrays
US5961656A (en) * 1995-10-31 1999-10-05 Sun Microsystems, Inc. Method and apparatus for testing memory devices under load
US5870537A (en) * 1996-03-13 1999-02-09 International Business Machines Corporation Concurrent switch to shadowed device for storage controller and device errors
US6304980B1 (en) 1996-03-13 2001-10-16 International Business Machines Corporation Peer-to-peer backup system with failure-triggered device switching honoring reservation of primary device
US5892969A (en) * 1996-03-15 1999-04-06 Adaptec, Inc. Method for concurrently executing a configured string of concurrent I/O command blocks within a chain to perform a raid 5 I/O operation
US6052797A (en) * 1996-05-28 2000-04-18 Emc Corporation Remotely mirrored data storage system with a count indicative of data consistency
US6044444A (en) * 1996-05-28 2000-03-28 Emc Corporation Remote data mirroring having preselection of automatic recovery or intervention required when a disruption is detected
US5781912A (en) * 1996-12-19 1998-07-14 Oracle Corporation Recoverable data replication between source site and destination site without distributed transactions
US6038677A (en) * 1997-03-31 2000-03-14 International Business Machines Corporation Automatic resource group formation and maintenance in a high availability cluster configuration
US6578120B1 (en) * 1997-06-24 2003-06-10 International Business Machines Corporation Synchronization and resynchronization of loosely-coupled copy operations between a primary and a remote secondary DASD volume under concurrent updating
US6571324B1 (en) * 1997-06-26 2003-05-27 Hewlett-Packard Development Company, L.P. Warmswap of failed memory modules and data reconstruction in a mirrored writeback cache system
US6070251A (en) * 1997-06-26 2000-05-30 Sun Microsystems, Inc. Method and apparatus for high availability and caching data storage devices
US6988176B2 (en) * 1997-09-12 2006-01-17 Hitachi, Ltd. Method and apparatus for data duplexing in storage unit system
US6665781B2 (en) * 2000-10-17 2003-12-16 Hitachi, Ltd. Method and apparatus for data duplexing in storage unit system
JP3414218B2 (ja) 1997-09-12 2003-06-09 株式会社日立製作所 記憶制御装置
US6128630A (en) * 1997-12-18 2000-10-03 International Business Machines Corporation Journal space release for log-structured storage systems
US6105078A (en) * 1997-12-18 2000-08-15 International Business Machines Corporation Extended remote copying system for reporting both active and idle conditions wherein the idle condition indicates no updates to the system for a predetermined time period
US6035347A (en) * 1997-12-19 2000-03-07 International Business Machines Corporation Secure store implementation on common platform storage subsystem (CPSS) by storing write data in non-volatile buffer
US6052758A (en) * 1997-12-22 2000-04-18 International Business Machines Corporation Interface error detection and isolation in a direct access storage device DASD system
US6073221A (en) * 1998-01-05 2000-06-06 International Business Machines Corporation Synchronization of shared data stores through use of non-empty track copy procedure
JPH11242566A (ja) * 1998-02-26 1999-09-07 Hitachi Ltd 多重化データ記憶システム
US6065018A (en) * 1998-03-04 2000-05-16 International Business Machines Corporation Synchronizing recovery log having time stamp to a remote site for disaster recovery of a primary database having related hierarchial and relational databases
US6289357B1 (en) * 1998-04-24 2001-09-11 Platinum Technology Ip, Inc. Method of automatically synchronizing mirrored database objects
US6178521B1 (en) * 1998-05-22 2001-01-23 Compaq Computer Corporation Method and apparatus for disaster tolerant computer system using cascaded storage controllers
DE19831773A1 (de) * 1998-07-15 2000-01-20 Axel Pfeiffer Verfahren und System zur Datensicherung
US6237008B1 (en) 1998-07-20 2001-05-22 International Business Machines Corporation System and method for enabling pair-pair remote copy storage volumes to mirror data in another storage volume
US6253295B1 (en) 1998-07-20 2001-06-26 International Business Machines Corporation System and method for enabling pair-pair remote copy storage volumes to mirror data in another pair of storage volumes
US6260124B1 (en) 1998-08-13 2001-07-10 International Business Machines Corporation System and method for dynamically resynchronizing backup data
US6327644B1 (en) 1998-08-18 2001-12-04 International Business Machines Corporation Method and system for managing data in cache
US6381677B1 (en) 1998-08-19 2002-04-30 International Business Machines Corporation Method and system for staging data into cache
US6141731A (en) * 1998-08-19 2000-10-31 International Business Machines Corporation Method and system for managing data in cache using multiple data structures
US6308284B1 (en) * 1998-08-28 2001-10-23 Emc Corporation Method and apparatus for maintaining data coherency
US6301643B1 (en) 1998-09-03 2001-10-09 International Business Machines Corporation Multi-environment data consistency
US6336194B1 (en) * 1998-10-29 2002-01-01 International Business Machines Corporation Program products for repositioning an input/output device without knowledge of current positioning of the device
US6339799B1 (en) 1998-10-29 2002-01-15 International Business Machines Corporation Method of repositioning an I/O device to a predetermined position to retry a program without knowledge of which part of the program caused the retry
US6343335B1 (en) 1998-10-29 2002-01-29 International Business Machines Corporation System for repositioning an I/O device to a predetermined position to retry a program without knowledge of which part of the program caused the retry
US6351792B1 (en) 1999-02-02 2002-02-26 Storage Technology Corporation Selective remote storage copy system and methods
US6751714B2 (en) 1999-02-02 2004-06-15 Storage Technology Corporation Systems and methods for relocation of compressed data tracks
US6513097B1 (en) * 1999-03-03 2003-01-28 International Business Machines Corporation Method and system for maintaining information about modified data in cache in a storage system for use during a system failure
DE60044409D1 (de) 1999-03-19 2010-07-01 Hitachi Ltd System um Daten zu duplizieren
JP2000305856A (ja) 1999-04-26 2000-11-02 Hitachi Ltd ディスクサブシステム及びこれらの統合システム
US6539462B1 (en) 1999-07-12 2003-03-25 Hitachi Data Systems Corporation Remote data copy using a prospective suspend command
US6463501B1 (en) 1999-10-21 2002-10-08 International Business Machines Corporation Method, system and program for maintaining data consistency among updates across groups of storage areas using update times
EP1229435A4 (en) * 1999-10-22 2008-08-06 Hitachi Ltd MEMORY ZONE NETWORK SYSTEM
US6938256B2 (en) * 2000-01-18 2005-08-30 Galactic Computing Corporation System for balance distribution of requests across multiple servers using dynamic metrics
US6477628B1 (en) 2000-01-28 2002-11-05 International Business Machines Corporation Backup copy achieving improved efficiency by waiting until rewind/unload command for bulk data copy
JP4434407B2 (ja) * 2000-01-28 2010-03-17 株式会社日立製作所 サブシステム及びこれらの統合システム
US6499112B1 (en) * 2000-03-28 2002-12-24 Storage Technology Corporation Automatic stand alone recovery for peer to peer remote copy (PPRC) operations
JP4044717B2 (ja) 2000-03-31 2008-02-06 株式会社日立製作所 記憶サブシステムのデータ二重化方法及びデータ二重化システム
US6484187B1 (en) 2000-04-28 2002-11-19 International Business Machines Corporation Coordinating remote copy status changes across multiple logical sessions to maintain consistency
JP3705731B2 (ja) * 2000-06-05 2005-10-12 富士通株式会社 入出力制御装置
US6859824B1 (en) 2000-06-30 2005-02-22 Hitachi, Ltd. Storage system connected to a data network with data integrity
US6816905B1 (en) 2000-11-10 2004-11-09 Galactic Computing Corporation Bvi/Bc Method and system for providing dynamic hosted service management across disparate accounts/sites
US7844513B2 (en) 2000-07-17 2010-11-30 Galactic Computing Corporation Bvi/Bc Method and system for operating a commissioned e-commerce service prover
US8538843B2 (en) 2000-07-17 2013-09-17 Galactic Computing Corporation Bvi/Bc Method and system for operating an E-commerce service provider
US6823336B1 (en) 2000-09-26 2004-11-23 Emc Corporation Data storage system and method for uninterrupted read-only access to a consistent dataset by one host processor concurrent with read-write access by another host processor
US7310743B1 (en) * 2001-06-12 2007-12-18 Emc Corporation Data recovery method and apparatus
US6742138B1 (en) * 2001-06-12 2004-05-25 Emc Corporation Data recovery method and apparatus
GB0118665D0 (en) 2001-07-31 2001-09-19 Hewlett Packard Co Remote monitoring of computer devices
US6667022B2 (en) * 2001-08-14 2003-12-23 General Electric Co. Process for separating synthesis gas into fuel cell quality hydrogen and sequestration ready carbon dioxide
EP1249744A1 (de) * 2001-08-23 2002-10-16 Siemens Aktiengesellschaft Verfahren zum Herstellen konsistenter Speicherinhalte in redundanten Systemen
US6910098B2 (en) * 2001-10-16 2005-06-21 Emc Corporation Method and apparatus for maintaining data coherency
JP2003223287A (ja) * 2001-11-22 2003-08-08 Toshiba Corp 記憶装置、この記憶装置のバックアップ方法及びプログラム
JP2003167683A (ja) * 2001-11-30 2003-06-13 Hitachi Ltd 情報記憶システム及びその制御方法
US6910153B2 (en) * 2002-01-03 2005-06-21 International Business Machines Corporation Method and system for recovery from a coupling facility failure without preallocating space
US7546364B2 (en) * 2002-05-16 2009-06-09 Emc Corporation Replication of remote copy data for internet protocol (IP) transmission
US7315960B2 (en) * 2002-05-31 2008-01-01 Hitachi, Ltd. Storage area network system
US7546482B2 (en) * 2002-10-28 2009-06-09 Emc Corporation Method and apparatus for monitoring the storage of data in a computer system
FI20022297A (fi) * 2002-12-31 2004-07-01 Nokia Corp Menetelmä muistikomponenttien sisältöjen vertailemiseksi
US7089446B2 (en) * 2003-01-09 2006-08-08 International Business Machines Corporation Method, system, and article of manufacture for creating a consistent copy
US7024584B2 (en) 2003-01-09 2006-04-04 International Business Machines Corporation Method, system, and article of manufacture for maintaining data integrity
US7003706B2 (en) * 2003-05-27 2006-02-21 International Business Machines Corporation Method, system, and program for improved device blocking and suspension
US7047390B2 (en) * 2003-06-17 2006-05-16 International Business Machines Corporation Method, system, and program for managing a relationship between one target volume and one source volume
US7043665B2 (en) 2003-06-18 2006-05-09 International Business Machines Corporation Method, system, and program for handling a failover to a remote storage location
US7467168B2 (en) * 2003-06-18 2008-12-16 International Business Machines Corporation Method for mirroring data at storage locations
US7567991B2 (en) * 2003-06-25 2009-07-28 Emc Corporation Replication of snapshot using a file system copy differential
US7275177B2 (en) * 2003-06-25 2007-09-25 Emc Corporation Data recovery with internet protocol replication with or without full resync
JP2005062928A (ja) * 2003-08-11 2005-03-10 Hitachi Ltd 複数のサイトにリモートコピーを行うシステム
US7127636B2 (en) * 2003-09-08 2006-10-24 International Business Machines Corporation Autonomic recovery of PPRC errors detected by PPRC peer
US20050071380A1 (en) * 2003-09-29 2005-03-31 Micka William F. Apparatus and method to coordinate multiple data storage and retrieval systems
US7133986B2 (en) * 2003-09-29 2006-11-07 International Business Machines Corporation Method, system, and program for forming a consistency group
US7133983B2 (en) 2003-09-29 2006-11-07 International Business Machines Corporation Method, system, and program for asynchronous copy
JP4307202B2 (ja) * 2003-09-29 2009-08-05 株式会社日立製作所 記憶システム及び記憶制御装置
JP4319017B2 (ja) * 2003-12-02 2009-08-26 株式会社日立製作所 ストレージシステムの制御方法、ストレージシステム、及び記憶装置
JP3977803B2 (ja) 2003-12-17 2007-09-19 株式会社日立製作所 バックアップシステム及び方法並びにプログラム
US7415628B2 (en) * 2004-01-09 2008-08-19 International Business Machines Corporation Restricting the execution of copy services commands
US7206911B2 (en) * 2004-02-25 2007-04-17 International Business Machines Corporation Method, system, and program for a system architecture for an arbitrary number of backup components
US7475099B2 (en) * 2004-02-25 2009-01-06 International Business Machines Corporation Predictive algorithm for load balancing data transfers across components
US7857701B2 (en) 2004-03-12 2010-12-28 Microsoft Corporation Silent sign-in for offline games
JP4382602B2 (ja) * 2004-04-23 2009-12-16 株式会社日立製作所 リモートコピーシステム
US7254685B1 (en) * 2004-06-15 2007-08-07 Emc Corporation Method for maintaining high performance while preserving relative write I/O ordering for a semi-synchronous remote replication solution
JP4477950B2 (ja) 2004-07-07 2010-06-09 株式会社日立製作所 リモートコピーシステム及び記憶装置システム
JP4915775B2 (ja) 2006-03-28 2012-04-11 株式会社日立製作所 ストレージシステム及びストレージシステムのリモートコピー制御方法
US7330861B2 (en) 2004-09-10 2008-02-12 Hitachi, Ltd. Remote copying system and method of controlling remote copying
US7647357B2 (en) * 2004-11-12 2010-01-12 International Business Machines Corporation Data transfer management in consistency group formation
US20060212744A1 (en) * 2005-03-15 2006-09-21 International Business Machines Corporation Methods, systems, and storage medium for data recovery
JP4699091B2 (ja) * 2005-05-31 2011-06-08 株式会社日立製作所 ディザスタリカバリ方法およびシステム
US7933987B2 (en) * 2005-09-30 2011-04-26 Lockheed Martin Corporation Application of virtual servers to high availability and disaster recovery solutions
US7660955B2 (en) * 2005-12-01 2010-02-09 International Business Machines Corporation Node polling in consistency group formation
US7571292B2 (en) 2006-03-21 2009-08-04 International Business Machines Corporation Producing tertiary instant virtual copies without volume suspension
TWI307035B (en) * 2006-04-10 2009-03-01 Ind Tech Res Inst Method and system for backing up remote mirror data on internet
JP2008250695A (ja) * 2007-03-30 2008-10-16 Nec Corp ディスクアレイコントローラ及びこれを備えたディスクアレイシステム
JP4475598B2 (ja) * 2007-06-26 2010-06-09 株式会社日立製作所 ストレージシステム及びストレージシステムの制御方法
JP4480756B2 (ja) * 2007-12-05 2010-06-16 富士通株式会社 ストレージ管理装置、ストレージシステム制御装置、ストレージ管理プログラム、データ記憶システムおよびデータ記憶方法
US8484503B2 (en) * 2010-08-18 2013-07-09 International Business Machines Corporation Disaster recovery replication throttling in deduplication systems
US9015519B2 (en) * 2012-01-31 2015-04-21 Symantec Corporation Method and system for cluster wide adaptive I/O scheduling by a multipathing driver
US20130339784A1 (en) * 2012-06-15 2013-12-19 International Business Machines Corporation Error recovery in redundant storage systems
US9304902B2 (en) 2013-03-15 2016-04-05 Saratoga Speed, Inc. Network storage system using flash storage
US9578599B2 (en) * 2013-04-25 2017-02-21 Honeywell International Inc. System and method for optimizing battery life in wireless multi-hop communication systems
US10313236B1 (en) 2013-12-31 2019-06-04 Sanmina Corporation Method of flow based services for flash storage
US9608936B1 (en) 2014-07-03 2017-03-28 Sanmina Corporation Network system with offload services for flash storage
JP6185668B2 (ja) * 2014-07-25 2017-08-23 株式会社日立製作所 ストレージ装置
US9672180B1 (en) * 2014-08-06 2017-06-06 Sanmina Corporation Cache memory management system and method
US9715428B1 (en) 2014-09-24 2017-07-25 Sanmina Corporation System and method for cache data recovery
US9471409B2 (en) * 2015-01-24 2016-10-18 International Business Machines Corporation Processing of PDSE extended sharing violations among sysplexes with a shared DASD
US10585764B2 (en) * 2017-10-02 2020-03-10 International Business Machines Corporation Data storage system comprising primary and secondary storage systems
US11100135B2 (en) 2018-07-18 2021-08-24 EMC IP Holding Company LLC Synchronous replication in a storage system
US10802935B2 (en) * 2018-07-23 2020-10-13 EMC IP Holding Company LLC Method to support synchronous replication failover
US11604590B2 (en) * 2018-09-06 2023-03-14 International Business Machines Corporation Metadata track entry sorting in a data storage system
US11068191B2 (en) 2019-01-23 2021-07-20 EMC IP Holding Company LLC Adaptive replication modes in a storage system
US11334455B2 (en) * 2019-09-28 2022-05-17 Atlassian Pty Ltd. Systems and methods for repairing a data store of a mirror node

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5680896A (en) * 1979-12-03 1981-07-02 Fujitsu Ltd Main memory device information recovery system
JPS58175064A (ja) * 1982-04-07 1983-10-14 Fujitsu Ltd 多重化ボリユ−ム処理方式
JPH02284247A (ja) * 1989-04-26 1990-11-21 Hitachi Ltd 共用メモリのアクセス切り替え方式およびそれを用いた制御システム
JPH03241441A (ja) * 1990-02-20 1991-10-28 Nec Corp ローカルファイルデュプレックス装置
JPH04299435A (ja) * 1991-03-27 1992-10-22 Nec Corp データベース等価方式
JPH05204739A (ja) * 1992-01-29 1993-08-13 Nec Corp 重複型分散データベースの同期方式
JPH05235912A (ja) * 1992-02-21 1993-09-10 Fujitsu Ltd 二重化処理装置
JPH05334161A (ja) * 1992-05-28 1993-12-17 Matsushita Electric Ind Co Ltd マルチサーバシステム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3623014A (en) * 1969-08-25 1971-11-23 Control Data Corp Computer communications system
US4701845A (en) * 1984-10-25 1987-10-20 Unisys Corporation User interface processor for computer network with maintenance and programmable interrupt capability
US5051887A (en) * 1987-08-25 1991-09-24 International Business Machines Corporation Maintaining duplex-paired storage devices during gap processing using of a dual copy function
US4958273A (en) * 1987-08-26 1990-09-18 International Business Machines Corporation Multiprocessor system architecture with high availability
US5155845A (en) * 1990-06-15 1992-10-13 Storage Technology Corporation Data storage system for providing redundant copies of data on different disk drives
US5212784A (en) * 1990-10-22 1993-05-18 Delphi Data, A Division Of Sparks Industries, Inc. Automated concurrent data backup system
US5241668A (en) * 1992-04-20 1993-08-31 International Business Machines Corporation Method and system for automated termination and resumption in a time zero backup copy process
US5241670A (en) * 1992-04-20 1993-08-31 International Business Machines Corporation Method and system for automated backup copy ordering in a time zero backup copy session
US5241669A (en) * 1992-04-20 1993-08-31 International Business Machines Corporation Method and system for sidefile status polling in a time zero backup copy process
US5530855A (en) * 1992-10-13 1996-06-25 International Business Machines Corporation Replicating a database by the sequential application of hierarchically sorted log records
US5446871A (en) * 1993-03-23 1995-08-29 International Business Machines Corporation Method and arrangement for multi-system remote data duplexing and recovery
US5491788A (en) * 1993-09-10 1996-02-13 Compaq Computer Corp. Method of booting a multiprocessor computer where execution is transferring from a first processor to a second processor based on the first processor having had a critical error
US5504861A (en) * 1994-02-22 1996-04-02 International Business Machines Corporation Remote data duplexing

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5680896A (en) * 1979-12-03 1981-07-02 Fujitsu Ltd Main memory device information recovery system
JPS58175064A (ja) * 1982-04-07 1983-10-14 Fujitsu Ltd 多重化ボリユ−ム処理方式
JPH02284247A (ja) * 1989-04-26 1990-11-21 Hitachi Ltd 共用メモリのアクセス切り替え方式およびそれを用いた制御システム
JPH03241441A (ja) * 1990-02-20 1991-10-28 Nec Corp ローカルファイルデュプレックス装置
JPH04299435A (ja) * 1991-03-27 1992-10-22 Nec Corp データベース等価方式
JPH05204739A (ja) * 1992-01-29 1993-08-13 Nec Corp 重複型分散データベースの同期方式
JPH05235912A (ja) * 1992-02-21 1993-09-10 Fujitsu Ltd 二重化処理装置
JPH05334161A (ja) * 1992-05-28 1993-12-17 Matsushita Electric Ind Co Ltd マルチサーバシステム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099277A (ja) * 1998-09-18 2000-04-07 Fujitsu Ltd ファイルユニット間のリモート転送方法
US6845435B2 (en) * 1999-12-16 2005-01-18 Hitachi, Ltd. Data backup in presence of pending hazard
JP2004519754A (ja) * 2000-09-06 2004-07-02 ユニシス コーポレイシヨン データの整合性を保証するための方法および装置
JP2004078993A (ja) * 2003-10-31 2004-03-11 Hitachi Ltd 複合計算機システムおよび複合i/oシステム
JP2007513424A (ja) * 2003-12-01 2007-05-24 イーエムシー コーポレイション 複数の記憶装置に対する仮想の順序付けられた書き込み
US8914596B2 (en) 2003-12-01 2014-12-16 Emc Corporation Virtual ordered writes for multiple storage devices
JP2004164657A (ja) * 2003-12-08 2004-06-10 Hitachi Ltd 複合計算機システムおよび複合i/oシステム
US7398364B2 (en) 2005-02-25 2008-07-08 Hitachi, Ltd. Switching method of data replication mode
JP2009532789A (ja) * 2006-04-06 2009-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション ストレージ・サブシステム全体にわたる整合的な更新のための方法、システム、およびコンピュータ・プログラム
JP2007048319A (ja) * 2006-11-09 2007-02-22 Hitachi Ltd 複合計算機システムおよび複合i/oシステム
JP2010524105A (ja) * 2007-04-11 2010-07-15 インターナショナル・ビジネス・マシーンズ・コーポレーション データ・ストレージ・システムによって処理されたデータを識別するための方法及びシステム
JP2011164750A (ja) * 2010-02-05 2011-08-25 Fujitsu Ltd ストレージ装置、ストレージ装置制御プログラムおよびストレージ装置制御方法
JP2015142344A (ja) * 2014-01-30 2015-08-03 日本電気株式会社 通信システム、制御装置、通信ノード、制御情報の設定方法及びプログラム

Also Published As

Publication number Publication date
US5615329A (en) 1997-03-25
DE69502125D1 (de) 1998-05-28
DE69502125T2 (de) 1998-11-19
EP0671686A1 (en) 1995-09-13
EP0671686B1 (en) 1998-04-22

Similar Documents

Publication Publication Date Title
JP3149325B2 (ja) 災害復旧機能を提供するために整合性グループを形成する方法および関連するシステム
JPH07239799A (ja) 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム
US5504861A (en) Remote data duplexing
US5682513A (en) Cache queue entry linking for DASD record updates
JP3655963B2 (ja) 記憶制御装置、それを含むデータ記憶システムおよび二重ペア抑止方法
US5592618A (en) Remote copy secondary data copy validation-audit function
US6304980B1 (en) Peer-to-peer backup system with failure-triggered device switching honoring reservation of primary device
US5720029A (en) Asynchronously shadowing record updates in a remote copy session using track arrays
US5870537A (en) Concurrent switch to shadowed device for storage controller and device errors
EP0902923B1 (en) Method for independent and simultaneous access to a common data set
US7188222B2 (en) Method, system, and program for mirroring data among storage sites
US7577788B2 (en) Disk array apparatus and disk array apparatus control method
US7278049B2 (en) Method, system, and program for recovery from a failure in an asynchronous data copying system
US6463501B1 (en) Method, system and program for maintaining data consistency among updates across groups of storage areas using update times
JP3776982B2 (ja) 分散記憶コントローラのためのソフトウエア指示されたマイクロコード状態保管システム
US7225307B2 (en) Apparatus, system, and method for synchronizing an asynchronous mirror volume using a synchronous mirror volume
US7516356B2 (en) Method for transmitting input/output requests from a first controller to a second controller
EP0566964B1 (en) Method and system for sidefile status polling in a time zero backup copy process
JP2002149499A (ja) データの完全性を備えるリモートコピーシステム
US7647357B2 (en) Data transfer management in consistency group formation
JPH10326220A (ja) ファイルシステムおよびファイル管理方法
JPH1115604A (ja) データ多重化方法
JP4898609B2 (ja) ストレージ装置、データ回復方法及び計算機システム
JP2021174392A (ja) リモートコピーシステム及びリモートコピー管理方法