JP2005202532A - 複数コピーグループの一括サスペンド方法およびシステム - Google Patents

複数コピーグループの一括サスペンド方法およびシステム Download PDF

Info

Publication number
JP2005202532A
JP2005202532A JP2004006212A JP2004006212A JP2005202532A JP 2005202532 A JP2005202532 A JP 2005202532A JP 2004006212 A JP2004006212 A JP 2004006212A JP 2004006212 A JP2004006212 A JP 2004006212A JP 2005202532 A JP2005202532 A JP 2005202532A
Authority
JP
Japan
Prior art keywords
suspend
time
batch
copy
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004006212A
Other languages
English (en)
Inventor
Yutaka Yoshida
豊 吉田
Makoto Uchikado
内角  真
Yoshio Omura
宜生 大村
Takeyuki Imazu
剛行 今津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004006212A priority Critical patent/JP2005202532A/ja
Publication of JP2005202532A publication Critical patent/JP2005202532A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Power Sources (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】
一括サスペンドを行う処理では、データの入力順序の一貫性を保証できる単位は、ロジカルボリュームのペアの集合としてのコピーグループであった。サスペンド予約時刻がコマンド投入時刻に近すぎると、処理中に予約時刻を経過し、サスペンド失敗となる。
【解決手段】
コピーグループコンテナに対してサスペンド予約時刻を指定してサスペンド指示をホスト装置から出す。データの入力順序の一貫性を保証する時刻であるC/T時刻を、それぞれのコピーグループ単位でサスペンド予約時刻と比較することで一括サスペンドの成功/失敗を検知する。全てのC/T時刻がサスペンド予約時刻と一致すれば成功、それ以外であれば失敗とする。
【選択図】 図1

Description

本発明は、ディスク記憶装置間の非同期データ転送によるリモートコピーの作成および現用とリモートそれぞれのディスク記憶装置に格納された記憶内容の同期制御に関する。
近年、ハードウェアの処理性能の飛躍的向上やネットワークの高速化等が、従来は困難であった大量のデータを扱う業務のコンピュータシステム化を可能にしつつある。データ量の増大と相まって、データの保全が重要な課題となっている。要件として、業務を止めることなく大切なデータを安全に保護すること、そして万一災害が発生した場合にも回復までにかかる時間を短縮することがある。
このような要件を満たすための技術のひとつに、複数のサーバと大型ディスクアレイ装置を用いて構成するHA(High Availability:高可用性)クラスタがある。HAクラスタ構成では、地震等の災害に備えて遠隔地にあるデータセンターでデータを2重化する。即ち、あるサイトに設置した大型ディスクアレイ装置のボリューム(ここではローカルボリューム或いは正ボリュームと呼ぶ)に格納されるデータを、遠隔地に設置した大型ディスクアレイ装置のボリューム(ここではリモートボリューム或いは副ボリュームと呼ぶ)にも格納する。このため、通常は、大型ディスクアレイ装置間を接続してホスト装置からの書込みデータを大型ディスクアレイ装置間で転送する方法を用いる。遠隔地にデータを転送してボリュームの複製を作成することをリモートコピーと言う。
大型ディスクアレイ装置間でデータを転送する方式には、大別すると同期転送方式と非同期転送方式の2種類がある。同期転送方式はデータを転送する度にそのデータの受領を示す情報を転送元が受け取る方式であり、比較的近距離でのデータの転送に適する。一方、非同期転送方式は受領応答を受けないままデータを一方的に転送するもので、遠距離でのデータの転送に適する。
特開2003−99306号公報で、一般的なHAクラスタでのリモートコピーについて論じている。
リモートコピーをバックアップの目的で使用するために、正ボリュームと副ボリュームが作るボリュームペアを複数まとめたグループに対して、ハードウェアの機能として、複数コピーペア間でのデータの一貫性を保証する機能がある。このグループをC/Tグループ(Consistency Timeグループ)と呼ぶ。C/Tグループ単位でのリモートコピーは、ボリュームペアの形成、ペア状態のサスペンド(二重書きを停止し、正ボリュームにだけ書込みが行われるようにすること)、ペア状態の回復、ペア状態の削除等のグループ操作機能からなる。C/Tはデータの入力順序の一貫性を保証できる時刻を表し、通常は最近処理したレコードのタイムスタンプに相当する。
ペア状態のサスペンドを行うと副ボリュームへの書込みは停止し、副ボリュームのC/T時刻が凍結される。サスペンド中の正ボリュームに対する書込みは、サイドキャッシュファイルに保存され、ペア状態回復時に副ボリュームに反映する。そのため、正ボリュームのC/T時刻も副ボリュームのC/T時刻と一致して凍結される。
複数コピーペア間でのデータ一貫性を維持することによって、副側のコピーグループ内のファイルを計画的なサスペンド直前の状態や障害発生直前の状態で保全することができる。これによってコピーグループ単位のファイル回復処理時間を短縮できる。
特開2003−99306号公報
本発明ではコピーを行うボリュームペアの集合をコピーグループと呼び、I/Oの順序を保証する必要があるコピーグループをC/Tグループと定義する。
一般に、コピーグループを用いたリモートコピーについて、ハードウェアの仕組としてC/Tグループ単位の同期をとったサスペンドをハードウェアが保証している。
しかし、従来、複数のコピーグループに対して同期を取って一括サスペンドを行う処理には、いくつかの制約があった。
まず、データの入力順序の一貫性を保証することができる単位は、ロジカルボリュームのペアの単純な集合としてのコピーグループであった。
次に、サスペンド予約時刻がコマンド投入時刻に近すぎると、サスペンドのコマンドがDKC(ディスク制御装置)に到達する前にサスペンド予約時刻を経過してしまい、コマンドの実行を中止してサスペンド失敗となる可能性があるため、ある程度余裕を持って時刻を指定する必要があった。
また、コピーグループ内のボリュームペア数が多い場合に、一部のペアしかサスペンドしないでタイムアウトする可能性があった。
本発明の目的は、まずリモートコピーを行う過程で実行するペア状態のサスペンド処理において、データの入力順序の一貫性を保証できる単位を複数のコピーグループに拡張することである。加えて、時刻指定一括サスペンドが失敗した場合に、リトライすることで一括サスペンドを成功させることである。
上記の目的を達成するために以下のような手段を用いる。
本発明ではコピーグループの概念を拡張し、各グループごとのデータの一貫性を保証する従来のコピーグループの集合をコピーグループコンテナと呼ぶ。
本発明では、コピーグループは、ハードウェアの機能としてデータの入力順序の一貫性を保証できる単位であるC/Tグループに対してソフトウェアによる管理機能を付加したものと考える。
複数のC/Tグループ(ここではコピーグループ)を同期して一括でサスペンドするために、本発明で定義したコピーグループコンテナに対してサスペンド予約時刻を指定したサスペンド指示をホスト装置から出力する。
サスペンド予約時刻を経過して初めてのI/Oを発行するタイミングで、コピーグループ毎のサスペンド処理を開始する。サスペンド処理が終了した時刻をそれぞれのコピーグループのサスペンド終了時刻として記録する。
サスペンド処理はサスペンド予約時刻を過ぎて始まり、終了する時刻はコピーグループ間で概ね一致しないが、データの一貫性に着目すればサスペンド予約時刻を経過して初めてのI/O以降は正副ボリュームに対してデータの書込みを行わないため、データの入力順序の一貫性を保証する時刻であるC/T時刻はサスペンド予約時刻と一致する。
コピーグループ単位でC/T時刻をサスペンド予約時刻と比較することで一括サスペンドの成功/失敗を検知する。全てのC/T時刻がサスペンド予約時刻と一致すれば成功、ひとつでも一致しないコピーグループがあれば失敗とする。
失敗した場合はコピーグループ単位で一旦サスペンドを解除し、確実にC/T時刻を一致してサスペンド可能なサスペンド予約時刻を計算して再設定し、一括サスペンドを再実行する。
再実行可能な回数は上限を設けて、上限に達した場合はエラーとして終了する。
本発明によれば、ハードウェアの機能としてC/Tグループの単位でしか不可能であったサスペンドが、ソフトウェアの機能を用いて、複数のC/Tグループ間で同期をとってサスペンドすることができる。
また、何らかの理由で正常にサスペンドできなかった場合も、ほとんど確実にサスペンドが成功する時刻を指定し直してサスペンドを再実行することができる。
以下、本発明の実施例を、図面を用いて詳細に説明する。
図1は本発明の計算機システムの全体構成を示す論理ブロック図である。
ホスト装置101aは正側のホスト装置であり、ホスト装置101bと101cは副側のホスト装置である。それぞれのホスト装置では、コピー制御機能102とAPP機能(アプリケーション機能)103の2つのソフトウェアが動作する。本発明では、一括サスペンド指示を出す正側のホスト装置は、図1のように1台であることを前提とする。
104a、104b、104cはそれぞれ正側DKC(ディスク制御装置)であり、104dと104eは副側DKCである。DKCはディスクアレイを制御する装置であり、ホスト装置からのI/Oや各種命令に基づいてロジカルボリュームに対する入出力動作を行う。
105a、105b、105dは、IDが00のC/Tグループ群であり、合せて106aのコピーグループAを構成している。同等に、105cと105eは、IDが16のC/Tグループ群であり、合せて106bのコピーグループBを構成している。
105fはIDが01〜15のC/Tグループ群であり、同じ正側DKCI104aに属していてもコピーグループA106aには属さない。よって、コピーグループコンテナ107としてデータの一貫性を保証する場合には対象外となるC/Tグループである。
即ち、コピーグループコンテナ107としてデータの入力順序の一貫性を保証する対象になるのはコピーグループA106aとコピーグループB106bに属するC/Tグループのみである。
C/Tグループの中には、例えば108のようなロジカルボリュームがあり、正側DKCに属するロジカルボリュームと副側DKCに属するロジカルボリュームでペアを構成する。ペア109aは、正側DKCI(104a)と副側DKCI(104d)に属するロジカルボリューム同士のペアである。ペア109bは、正側DKCII(104b)と副側DKCI(104d)に属するロジカルボリューム同士のペアである。同様に、ペア109cは、正側DKCIII(104c)と副側DKCII(104e)に属するロジカルボリューム同士のペアである。図1の例ではそれぞれのペアはロジカルボリュームが1対1でペアを構成し、ペア間で重複するロジカルボリュームがない構成を想定している。よって、ペア109a、109b、109cは全て3ペアずつの構成である。
110aはコピーグループA106aがデータの一貫性を保証してサスペンドし、C/T時刻がTであることを示している。同様に、110bはコピーグループB106bのC/T時刻がTであることを示している。
111のように一括サスペンドの予約時刻TとC/T時刻T及びTが一致すれば一括サスペンドは成功とし、ひとつでも一致しなければ失敗となる。
次に、コピー制御機能102の構成を、図11の論理ブロック図を用いて説明する。
コピー制御機能102は、各ホスト装置の中で動作するソフトウェアである。
図11の中の例えば直線1101のような線は、制御信号やデータの流れを示す。
コピー制御機能102の下位機能として、投入されたコマンドを解釈してリモートコピーを実現する各種処理を制御するコマンド解釈機能1102と、実際の処理を受け持つコピー実行機能1103がある。
コピー実行機能1103の中には、コピーグループ及びコピーグループコンテナを管理するコピーグループ/コピーグループコンテナ管理機能1104が有り、後述するコピーグループコンテナ及びコピーグループ管理テーブル1105、サスペンド処理状態テーブル1106、DKC別コマンド受理状態テーブル1107の3つのテーブルを管理している。
図2は、図1の構成で一括サスペンドを行い、1回で成功した場合のタイムチャートである。
タイムチャートの横軸201は時間軸であり、ホスト装置101a、正側DKCI(104a)、正側DKCII(104b)、正側DKCIII(104c)、副側DKCI(104d)、副側DKCI(104e)それぞれの時間軸上で相互に作用する信号や処理を各種矢印で表現する。
時刻T202はサスペンドコマンド投入時刻を表し、一括サスペンド予約時刻T203をコマンドのオプションとして指定してコマンドを投入する。投入したコマンドはコマンド伝播線204で示すように正側DKCに伝播して行く。菱形で表現した時点が、コマンドが到達した時刻である。正側DKCII(104b)へは、ハードウェアの機能によって同一のC/Tグループに属する正側DKCである正側DKCI(104a)を経由してコマンドが伝播する。
正側DKCは、コマンドが到達すると一点鎖線の矢印で表現した受理メッセージ205をホスト装置101aに対して送信する。
ホスト装置101aが、一括サスペンド予約時刻T203を経過する前に全ての正側DKCからDKC側でのコマンドの受信時刻を含むコマンド受理メッセージ205を受信できたため、時刻T203からそれぞれのコピーグループがサスペンド処理を開始する。ただし、実際の動作は、時刻T203を過ぎて初めてのI/Oがホスト装置101aから正側DKCに対して出された時刻にサスペンド処理を開始する。コピーグループA106aはWR(3)208aのI/Oによってサスペンド処理を開始し、コピーグループB106bはWR(4)208bのI/Oによってサスペンド処理を開始する。どちらもI/Oを副側に反映せず、サイドキャッシュファイル210にデータを格納する。
なお、一括サスペンド予約時刻T203を経過した後で全ての正側DKCからDKC側でのコマンドの受信時刻を含むコマンド受理メッセージ205を受信した場合、コマンドの受信時刻を見て処理を続行することもでき、失敗とみなしてサスペンド処理の再実行を行うこともできる。
それぞれのコピーグループでサスペンド処理が終了したら、サスペンド終了通知211をホスト装置101aに送信する。それぞれのコピーグループがサスペンド処理を終了した時刻はホスト装置101aにサスペンド終了通知211が届いた時刻T(i=A,B)となり、コピーグループA106aのサスペンド処理終了時刻はT212a、コピーグループB106bのサスペンド処理終了時刻はT212bとなる。しかし、図2の場合はそれぞれのC/T時刻は一括サスペンド予約時刻T203と一致する。
全てのサスペンド終了通知211をホスト装置101aが受信したら、コピーグループコンテナ107の一括サスペンド処理が終了する。
WR(1)206はコマンド投入以前のI/Oであり、正側のロジカルボリュームのデータを副側のロジカルボリュームにコピーする。WR(2)207のI/Oは、正側DKCIII(104c)に到達した時刻は一括サスペンド予約時刻T203を過ぎているが、I/Oをホスト装置101aから発行した時刻が時刻T203以前であるため、サスペンド開始の契機となるI/Oとはみなさないでコピー処理を行う。なお、WR(2)207のようなI/Oにはホスト装置から出力されたときの時間が含まれているため、DKC側では、この時刻と一括サスペンド予約時刻T203とを比較することにより副側のロジカルボリュームへのデータのコピーの可否を判定できる。
WR(5)209は、サスペンド処理が正常終了した後のI/Oのため、I/Oを副側に反映せずサイドキャッシュファイル210に格納する。
サイドキャッシュファイル210に格納したI/Oは、ペア状態の再開処理時に各ロジカルボリュームに反映してペア状態に移行する。
図3は、図1の構成で一括サスペンドを行い、失敗した場合のタイムチャートである。
タイムチャートの横軸201、ホスト装置101a、正側DKCI(104a)、正側DKCII(104b)、正側DKCIII(104c)、副側DKCI(104d)、副側DKCI(104e)、時刻T202、一括サスペンド予約時刻T203、WR(1)206、WR(2)207は図2と同様である。
WR(3)301は、ホスト装置101aから送信を開始した時刻が一括サスペンド予約時刻T203を過ぎているにも関らず、I/Oが正側DKCIII(104c)に到着した際にはまだコマンドが到着及び受理されていないため、コピー処理303のように普通に副側へ反映されてしまう。この時点でC/T時刻は一括サスペンド予約時刻T203ではなく、WR(3)301がホスト装置101aから送信を開始した時刻になってしまう。
その後、サスペンドコマンド伝播線302のようにして、コマンドが正側DKCIII(104c)に大幅に遅れて到着し、コマンド受理通知304によってホスト装置101aへコマンド到着時刻が通知され、サスペンドの失敗をホスト装置が検知する。TERR305がサスペンド失敗検知時刻となる。なお、図2のWR(4)、(5)のように一括サスペンド予約時刻T203を過ぎて出力されたI/Oがサスペンドコマンド到着後にDKC側に到着した場合、サスペンド処理は行われない。
上記の図2及び3の説明から、サスペンドコマンドが一括サスペンド予約時刻T203後にDKC側に到達し、その到達時刻以前に、予約時刻T以降にホスト装置101aから送信されたI/OがDKC側に到達した場合、サスペンド処理は失敗とみなされる。
コピーグループコンテナを構成するコピーグループのうちたったひとつでもサスペンドの失敗を検知したら、一括サスペンド処理は失敗となる。
本発明では、成功するまで特定の回数を上限として一括サスペンド処理の再実行を試みる。その際、一括サスペンド予約時刻T203を、一括サスペンド処理をほとんど確実に成功できるであろう時刻に自動設定してコマンドを再投入する。
図4は、新たに自動設定する一括サスペンド再予約時刻TS2401の根拠となるタイムチャートである。
タイムチャートの横軸201、ホスト装置101a、正側DKCI(104a)、正側DKCII(104b)、正側DKCIII(104c)、副側DKCI(104d)、副側DKCI(104e)、時刻T202、一括サスペンド予約時刻T203は図2と同様である。
コピーグループA106aに属する正側DKCへのサスペンドコマンド伝播線402に従ってコマンドが到着する時刻403は、一括サスペンド予約時刻T203よりも以前の時刻であるため、コピーグループA106aは成功裏にサスペンドを終了すると想定する。
それに対してコピーグループB106bは、正側DKCIII(104c)にサスペンドコマンド伝播線302に従って時刻404にコマンドが到着する。時刻404は一括サスペンド予約時刻T203以後の時刻であるため、コピーグループB106bはサスペンド処理を失敗する。
コマンド受理通知304によってサスペンドコマンドが大幅に遅れて到着したことを検知したホスト装置101aは、全ての正側DKCからの通知が出揃ったタイミングで失敗を検知し、サスペンドコマンドの再実行の準備を開始する。
失敗の検知からサスペンドコマンド再投入までの所要時間TLOSS405は、各コピーグループのサスペンド成功/失敗を全て検知しサスペンドが成功したコピーグループのサスペンド状態を解除して、一括サスペンド再予約時刻TS2401を算出するために費やされた時間である。
時刻TX2406は、一括サスペンド再予約時刻TS2401を指定して一括サスペンドコマンドを再投入する時刻であるが、時刻TX2406から時刻TS2401までの時間には以下の時間要素を含む。
即ち、各コピーグループがコマンド投入からサスペンド処理終了をホスト装置に通知するまでに要した時間とコマンド投入からサスペンド失敗をホスト装置に通知するまでに要した時間の最長時間に安全係数NSC409を乗じた時間要素407。そして、さらに安全のために確保する冗長時間TRDD408である。
安全係数NSC409と冗長時間TRDD408はユーザが指定する。また、それぞれ最適値を決める方法として図8のフローチャートに示すように、今まで指定した値を履歴として保持し、最大値をデフォルト値として自動設定する機能を使用しても良い。
まず、安全係数がユーザから指定されたかどうかを判定する(ステップ801)。
指定されていれば、その値を使用する(ステップ802)。指定されていなければ、履歴の中の最大値を使用する(ステップ803)。初期値は1.0である。
安全係数の指定された値が履歴の中の最大値よりも大きいかどうか判定する(ステップ804)。
最大値よりも大きい値が指定された場合は、安全係数の履歴の最大値を更新する(ステップ805)。
次に、冗長時間がユーザから指定されたかどうかを判定する(ステップ806)。
指定されていれば、その値を使用する(ステップ807)。指定されていなければ、履歴の中の最大値を使用する(ステップ808)。初期値は0.0である。
冗長時間の指定された値が履歴の中の最大値よりも大きいかどうか判定する(ステップ809)。
最大値よりも大きい値が指定された場合は、冗長時間の履歴の最大値を更新する(ステップ810)。
一括サスペンド再予約時刻TS2401を算出する一般式を図12の数1に示す。数1の中でiはコピーグループを識別する添字であり、便宜上具体的な値はA、B、C、・・・とする。
第一項max T1201は、各コピーグループ単位で行うサスペンド終了通知が終了する時刻とサスペンド失敗通知が終了する時刻の中で最遅の時刻を表す。例えば図3の場合は、それぞれのコピーグループがサスペンド処理を開始する前にサスペンド処理の失敗を検知する場合のためTERR305が該当する可能性が非常に高い。
第2項のTLOSS405を加えたmax T + TLOSS406は、一括サスペンドコマンド再投入時刻TX2406と等しい。第3項は前述の時間要素407であり、第4項は冗長時間TRDD408である。
max T1201と時間要素407に関しては、サスペンドコマンドの受理後にホスト装置から送信される初めてのI/Oが長時間に渡って出ないコピーグループが存在した場合は共に値が大きくなるため、一括サスペンド再予約時刻TS2401が不必要に遅延することが予想できる。
これはサスペンドコマンドの再実行が確実に成功する確率を可能な限り高くするため、必要な冗長性である。ただし、サスペンド処理を開始してから終了するまでの時間が運用に耐えない程の長時間である場合は、適当な時間でサスペンド処理を打ち切ってタイムアウトとする。
次に、図5のフローチャートを用いて、ホスト装置が行う処理を説明する。
ホスト装置から一括サスペンド予約時刻を指定してサスペンドコマンドを投入する(ステップ501)。
コマンドが各コピーグループに属する正側DKCに到着すると、コマンドを受理した正側DKCは到着時刻をコマンド受理通知としてホスト装置に送信する。
ホスト装置は、各DKCからのコマンド受理通知を待つ(ステップ502)。
コマンド受理通知が届いたら、図7に示すDKC別コマンド受理状態テーブルを更新し(ステップ503)、図6に示すサスペンド処理状態テーブルを更新する(ステップ504)。
当該コピーグループのコマンド受理通知が全部出揃うまでステップ502〜504を繰返す(ステップ505)。一括サスペンド再予約時刻TS2401が設定されるまでの間,新たなI/Oは、図2のWR(3)〜(5)のように、データはコピーされずにサイドキャッシュに保持される。
図6のサスペンド処理状態テーブルは、コピーグループID601、コマンド投入時刻T602、サスペンド予約時刻T603、サスペンド終了時刻T604、正側DKC番号605、コマンド受理通知受信DKC606、サスペンド成功/失敗通知607、リトライカウント608で構成する。
図7のDKC別コマンド受理状態テーブルは、コピーグループID601、DKC番号701、サスペンドコマンド受理時刻702、受理状態フラグ703で構成する。
サスペンドコマンドを再実行している時の各テーブルの内容は、リトライカウント608が異なるだけでほとんどは再設定した値が入っている。例えば、コマンド投入時刻T602には一括サスペンドコマンド再投入時刻TX2406が入っており、サスペンド予約時刻T603には一括サスペンド再予約時刻TS2401が入っている。
当該コピーグループのコマンド受理通知が全部出揃ったら、その中にひとつでも受理異常の通知が含まれているか調べる(ステップ506)。即ち、DKC別コマンド受理状態テーブルの受理状態フラグ703が異常となっているか調べ、異常であれば一括サスペンドが失敗したこととしてステップ509へ進む。
受理異常の通知がひとつもなければ、各DKCからサスペンド結果通知が出揃うのを待つ(ステップ507)。
サスペンド結果通知が全て成功であれば、一括サスペンドは成功として終了する(ステップ508)。ひとつでもサスペンド結果通知に失敗が含まれていれば、一括サスペンドが失敗したこととしてステップ509へ進む。
ステップ509ではサスペンドの失敗状態を判定し、致命的な失敗で再実行しても正常処理に戻ることができない場合は、その旨のエラーメッセージを表示して終了する(ステップ510)。致命的な失敗としては、例えば、DKCのサイドキャッシュが満杯で再実行ができない場合、時期を逸してアプリケーション(AP)としては再設定しても意味がない場合などがある。
再実行すれば回復できそうな失敗の場合は、サスペンド処理状態テーブルのリトライカウント608を調べてリトライの回数を判定して上限の回数に達していなければ再実行を続行し(ステップ511)、上限を超えていればその旨のエラーメッセージを表示して終了する(ステップ510)。
一括サスペンドコマンドを再実行する場合は、エラーメッセージを表示(ステップ512)してサスペンド状態にあるペアがあればこの状態を解除する(ステップ513)。
数1によって、再指定するサスペンド予約時刻を計算する(ステップ514)。
サスペンド処理状態テーブルのリトライカウント608を1増やす(ステップ515)。
計算したサスペンド予約時刻を指定して一括サスペンドコマンドを再実行する(ステップ501)。
図9に、図1で示したコピーグループコンテナ107の中にコピーグループがいくつか存在する構成を管理するためのテーブル構成の例を示す。
コピーグループの集合としてコピーグループコンテナを扱う構成の場合、コピーグループコンテナID901の中に存在するコピーグループを、コピーグループID902としてテーブルに登録する。それぞれのコピーグループが下位要素として持っているロジカルボリュームのペアは、コピーグループ単位の所属ペア903としてテーブルに登録する。
コピーグループ単位の状態は、コピーグループステータス904として参照できる。
図10にサスペンドコマンドの実行例を示す。
READY1001はコマンドプロンプトである。
SUSPENDコマンドの第一引数1002は、コピーグループコンテナ名である。
第2引数ATTIME1003でサスペンド予約時刻を指定している。第3引数NSC1004で、安全係数を指定している。第4引数TRDD1005で冗長時間を指定している。
第5引数RTYMAX1006は、サスペンドコマンドのリトライ回数の上限値である。
コマンドを投入すると、現在時刻1007とサスペンド予約時刻1008を表示して、サスペンド実行待ち1009になる。
サスペンド予約時刻を過ぎてサスペンドが始まると、現在時刻1010を表示してコピーグループ毎にサスペンドの処理経過1011を表示する。この例では、CopyGroup2がサスペンドに失敗して、エラーメッセージ1012を表示した。
これで一括サスペンドの失敗を検知した状態となり、ユーザに即時サスペンドかリトライかを選択させるメニュー1013を表示する。
「2」を入力してリトライ1014を選択すると、サスペンド予約時刻を計算して現在時刻と計算結果1015を表示する。
それで良ければOKと入力してEnterキーを押下するが、妥当でない場合はこの例のように予約時刻1016を再入力する。
これでサスペンドコマンドが再投入されてサスペンド実行待ち1009になる。
以下、ステップ1010以下の処理を繰返す。
以上に述べた本発明の処理方法を実行するためのプログラムを計算機で読み取り可能な記憶媒体に格納し,このプログラムをメモリに読み込んで実行することもできる。
本発明の計算機システムの全体構成を示す論理ブロック図である。 図1の構成で一括サスペンドを行い、成功した場合のタイムチャートである。 図1の構成で一括サスペンドを行い、失敗した場合のタイムチャートである。 一括サスペンド再予約時刻の算出方法を説明するタイムチャートである。 ホスト装置のコピー制御機能が行う処理を説明するフローチャートである。 サスペンドの処理状態を保持するテーブル構造を説明する表である。 DKC別にコマンド受理状態を保持するテーブル構造を説明する表である。 安全係数と冗長時間の指定値の扱いを説明するフローチャートである。 コピーグループコンテナの管理を行うためのテーブル構造を説明する表である。 サスペンドコマンドの実行例を表す図である。 コピー制御機能の構成を示す論理ブロック図である。 一括サスペンド再実行時に指定するサスペンド予約時刻を算出する式である。
符号の説明
101a 正側のホスト装置
101b 副側のホスト装置
101c 副側のホスト装置
102 コピー制御機能
103 APP機能(アプリケーション機能)
104a 正側DKC(ディスク制御装置)
104b 正側DKC(ディスク制御装置)
104c 正側DKC(ディスク制御装置)
104d 副側DKC(ディスク制御装置)
104e 副側DKC(ディスク制御装置)
105a IDが00のC/Tグループ群
105b IDが00のC/Tグループ群
105c IDが16のC/Tグループ群
105d IDが00のC/Tグループ群
105e IDが16のC/Tグループ群
105f IDが01〜15のC/Tグループ群
106a コピーグループA
106b コピーグループB
107 コピーグループコンテナ
108 ロジカルボリューム
109a ロジカルボリュームのペア
109b ロジカルボリュームのペア
109c ロジカルボリュームのペア
110a コピーグループAのC/T時刻T
110b コピーグループBのC/T時刻T
111 サスペンド成功/失敗の条件

Claims (10)

  1. ローカルサイトに設けられたディスクアレイ装置と、リモートサイトに設けられ、前記ローカルサイトのデータをコピーするディスクアレイ装置とに接続された計算機システムは、
    前記ローカルサイトのディスクアレイ装置に設けられたロジカルボリュームに記憶されるデータを、前記リモートサイトのディスクアレイ装置に設けられたロジカルボリュームにコピーする手段、
    前記コピー手段の前提となるロジカルボリュームのペア状態を、ホスト装置からの要求の中で指定する予約時刻にサスペンドする手段、
    データの入力順序の一貫性を保証できる単位としてペアの集合であるC/Tグループを管理する手段、
    前記C/Tグループの集合であるコピーグループコンテナにおける各グループのサスペンド終了の有無を判定して管理する手段、
    前記コピーグループコンテナ単位でペア状態の時刻指定一括サスペンドを行う手段とを有することを特徴とする計算機システム。
  2. 前記計算機システムは、さらに、各コピーグループのC/T時刻をサスペンド予約時刻と比較して時刻指定一括サスペンドの成功/失敗を検出する手段を有することを特徴とする請求項1記載の計算機システム。
  3. 一括サスペンドを失敗した場合に、コピーグループコンテナ単位の一括サスペンドを成功裏に実行するに充分な処理時間を計算する手段と、計算した結果をユーザに提示する手段を有することを特徴とする請求項2記載の計算機システム。
  4. 一括サスペンドを失敗した場合に、コピーグループコンテナ単位の一括サスペンドを成功裏に実行するに充分な処理時間を計算する手段と、前記計算結果に基づいて一括サスペンドを再実行する手段を有することを特徴とする請求項2記載の計算機システム。
  5. 前記の処理時間をサスペンドを開始する予約時刻として指定して一括サスペンド処理を特定の回数を上限として再実行する手段と、開始時刻の予約をコマンドのオプションとして選択できる手段とを有することを特徴とする請求項3記載もしくは請求項4記載の計算機システム。
  6. サスペンドを失敗してサスペンド予約時刻を計算する際の安全係数と冗長時間とコマンド再実行を許す回数の上限値を定めたリトライ回数を指定する手段とを有することを特徴とする請求項5記載の計算機システム。
  7. 一括サスペンドを失敗した場合に、即時サスペンドもしくは一括サスペンドの再実行をユーザインターフェースで選択する手段を含むことを特徴とする請求項6記載の計算機システム。
  8. ローカルサイトに設けられたディスクアレイ装置と、リモートサイトに設けられ、前記ローカルサイトのデータをコピーするディスクアレイ装置とに接続された計算機システムにおける複数コピーグループの一括サスペンド方法は、
    前記ローカルサイトのディスクアレイ装置に設けられたロジカルボリュームと、前記ロジカルボリュームに記憶されたデータをコピーする、前記リモートサイトのディスクアレイ装置に設けられたロジカルボリュームとで、データの入力順序の一貫性を保証できる単位としてのペアであるコピーグループを複数構成し、
    前記リモートサイトへの二重書きを停止し、前記ローカルサイトへの書込みだけを行うサスペンド処理の予約時刻の設定コマンドを前記ローカルサイトへ送信し、
    前記ローカルサイトへのI/O送信時刻と、前記予約時刻と、前記予約時刻の前記ローカルサイトへの到達時刻とに基づいて、前記サスペンド処理が成功したかどうかを前記コピーグループのそれぞれについて判定し、
    前記コピーグループのいずれもが前記サスペンド処理を成功していれば、複数コピーグループの一括サスペンドが成功したと判定することを特徴とする複数コピーグループの一括サスペンド方法。
  9. 前記複数コピーグループの一括サスペンドが失敗した場合、遅延時刻に基づいて前記予約時刻を再設定することを特徴とする請求項8記載の複数コピーグループの一括サスペンド方法。
  10. 前記コピーグループのそれぞれにおいて、前記設定コマンドが前記予約時刻後に前記ローカルサイトに到達し、前記コマンドの到達時刻以前に、前記予約時刻以降に送信されたI/Oが前記ローカルサイトに到達した場合、前記サスペンド処理は失敗と判定することを特徴とする請求項8記載の複数コピーグループの一括サスペンド方法。
JP2004006212A 2004-01-14 2004-01-14 複数コピーグループの一括サスペンド方法およびシステム Pending JP2005202532A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004006212A JP2005202532A (ja) 2004-01-14 2004-01-14 複数コピーグループの一括サスペンド方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004006212A JP2005202532A (ja) 2004-01-14 2004-01-14 複数コピーグループの一括サスペンド方法およびシステム

Publications (1)

Publication Number Publication Date
JP2005202532A true JP2005202532A (ja) 2005-07-28

Family

ID=34820244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004006212A Pending JP2005202532A (ja) 2004-01-14 2004-01-14 複数コピーグループの一括サスペンド方法およびシステム

Country Status (1)

Country Link
JP (1) JP2005202532A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047892A (ja) * 2005-08-08 2007-02-22 Hitachi Ltd 計算機システム及び計算機システムの状態管理方法
JP2007328785A (ja) * 2006-06-08 2007-12-20 Internatl Business Mach Corp <Ibm> 複数の仮想化リモート・ミラーリング・セッション整合性グループを作成および管理するためのシステムおよび方法
JP2008209966A (ja) * 2007-02-23 2008-09-11 Hitachi Ltd 一以上のセカンダリストレージシステムで複数のバックアップを取得するバックアップ制御方法
JP2009531755A (ja) * 2006-03-31 2009-09-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 複製およびプロビジョニング管理でのボリューム・コンテナの使用
CN112232584A (zh) * 2020-10-28 2021-01-15 中冶南方工程技术有限公司 一种钢铁企业大宗原燃料汽车取样组批方法和系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047892A (ja) * 2005-08-08 2007-02-22 Hitachi Ltd 計算機システム及び計算機システムの状態管理方法
US8055863B2 (en) 2005-08-08 2011-11-08 Hitachi, Ltd. Computer system and method of managing status thereof
US8332602B2 (en) 2005-08-08 2012-12-11 Hitachi, Ltd. Computer system and method of managing status thereof
US8589649B2 (en) 2005-08-08 2013-11-19 Hitachi, Ltd. Computer system and method of notifying error information of the computer system
JP2009531755A (ja) * 2006-03-31 2009-09-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 複製およびプロビジョニング管理でのボリューム・コンテナの使用
JP2007328785A (ja) * 2006-06-08 2007-12-20 Internatl Business Mach Corp <Ibm> 複数の仮想化リモート・ミラーリング・セッション整合性グループを作成および管理するためのシステムおよび方法
JP2008209966A (ja) * 2007-02-23 2008-09-11 Hitachi Ltd 一以上のセカンダリストレージシステムで複数のバックアップを取得するバックアップ制御方法
CN112232584A (zh) * 2020-10-28 2021-01-15 中冶南方工程技术有限公司 一种钢铁企业大宗原燃料汽车取样组批方法和系统
CN112232584B (zh) * 2020-10-28 2023-11-24 中冶南方工程技术有限公司 一种钢铁企业大宗原燃料汽车取样组批方法和系统

Similar Documents

Publication Publication Date Title
US8468314B2 (en) Storage system, storage apparatus, and remote copy method for storage apparatus in middle of plural storage apparatuses
US7139932B2 (en) Data synchronization of multiple remote storage after remote copy suspension
JP4833734B2 (ja) データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法
US8954645B2 (en) Storage writes in a mirrored virtual machine system
US6789178B2 (en) Remote data copy using a prospective suspend command
US6304980B1 (en) Peer-to-peer backup system with failure-triggered device switching honoring reservation of primary device
EP1250649B1 (en) Crash recovery without complete remirror
US6745303B2 (en) Data synchronization of multiple remote storage
US7293194B2 (en) Method and device for switching database access part from for-standby to currently in use
JP4382602B2 (ja) リモートコピーシステム
JP5286212B2 (ja) ストレージクラスタ環境でのリモートコピー制御方法及びシステム
JP2006285919A (ja) 計算機システム、計算機及びリモートコピー処理方法
JP2003248605A (ja) ストレージシステム、主記憶システム、副記憶システム、及びそのデータ複写方法
JP4508798B2 (ja) ストレージリモートコピー方式
JP2004303122A (ja) データ転送制御システム
JP2005309793A (ja) データ処理システム
JP4214832B2 (ja) 記憶装置システム
JP2003099306A (ja) 計算機システムおよび計算機システムにおけるバックアップ方法
JP2005202532A (ja) 複数コピーグループの一括サスペンド方法およびシステム
JP2004272318A (ja) 系切り替えシステムおよびその処理方法並びにその処理プログラム
JP4452494B2 (ja) 複数リモートストレージでのリモートコピー停止後のデータ同期化方式
JP4721057B2 (ja) データ管理システム,データ管理方法及びデータ管理用プログラム
JPH1185594A (ja) リモートコピー用情報処理システム
JP4193754B2 (ja) データ二重化方法とプログラム
JP2004272884A5 (ja)

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060424