JP2007264946A - ストレージシステム及びストレージシステムのリモートコピー制御方法 - Google Patents

ストレージシステム及びストレージシステムのリモートコピー制御方法 Download PDF

Info

Publication number
JP2007264946A
JP2007264946A JP2006087983A JP2006087983A JP2007264946A JP 2007264946 A JP2007264946 A JP 2007264946A JP 2006087983 A JP2006087983 A JP 2006087983A JP 2006087983 A JP2006087983 A JP 2006087983A JP 2007264946 A JP2007264946 A JP 2007264946A
Authority
JP
Japan
Prior art keywords
update
storage control
volume
control device
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006087983A
Other languages
English (en)
Other versions
JP4915775B2 (ja
Inventor
Takashi Arakawa
敬史 荒川
Kenta Futase
健太 二瀬
Akira Deguchi
彰 出口
Katsuhiro Okumoto
勝博 奥元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006087983A priority Critical patent/JP4915775B2/ja
Priority to US11/546,782 priority patent/US7330861B2/en
Priority to US11/603,088 priority patent/US7945750B2/en
Priority to EP07251248A priority patent/EP1840747A1/en
Priority to CNB2007100915477A priority patent/CN100559351C/zh
Publication of JP2007264946A publication Critical patent/JP2007264946A/ja
Priority to US13/109,386 priority patent/US8200928B2/en
Application granted granted Critical
Publication of JP4915775B2 publication Critical patent/JP4915775B2/ja
Priority to US13/489,624 priority patent/US8347053B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2064Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/855Details of asynchronous mirroring using a journal to transfer not-yet-mirrored changes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】本発明のストレージシステムは、複数のリモートコピーがそれぞれ非同期で実行される場合でも、ボリューム間の記憶内容を整合させる。
【解決手段】複数の正記憶制御装置1と複数の副記憶制御装置2とが複数の経路で接続されており、各第1ボリューム1Aと各第2ボリューム2Aとの間で、それぞれ非同期のリモートコピーが実施される。正記憶制御装置1から副記憶制御装置2に転送されたライトデータD1は、ライトデータ記憶部2Bに保管される。ライト時刻やシーケンシャル番号を含む更新順序情報D2は、更新順序情報管理部2Dで管理される。更新制御部3は、各更新順序情報管理部2Dから更新順序情報D2を収集し、各第2ボリューム2Aを更新可能な時点を決定して、各更新部2Cに通知する。これにより、各第2ボリューム2Aの記憶内容は、更新可能時点までそれぞれ更新される。
【選択図】図1

Description

本発明は、ストレージシステム及びストレージシステムのリモートコピー制御方法に関する。
近年のコンピュータシステムでは、使用されるデータの容量が増大し、データの更新頻度も高くなっている。従って、このデータをどのようにバックアップするか、障害発生時にどれだけ迅速に正常稼働状態に復旧できるかが、ストレージ技術における重要課題となっている。
これに対する一つの解決策として、例えば、互いに離間する正サイトと副サイトに、記憶制御装置をそれぞれ複数台ずつ設置し、正サイトの各記憶制御装置(正記憶制御装置)と副サイトの各記憶制御装置(副記憶制御装置)とを転送パスでそれぞれ接続し、両サイトで管理されているデータを同期させる技術も提案されている(特許文献1)。この従来技術では、正の記憶制御装置で更新されたデータを、ホストコンピュータ(以下、「ホスト」)を経由せずに、副記憶制御装置に転送してコピーさせるという、いわゆるリモートコピー技術を使用する。
正記憶制御装置と副記憶制御装置との間でデータを整合させる技術として、ライト時刻を用いるものも提案されている(特許文献2)。この従来技術では、正ホストからライトデータを受領した正記憶制御装置は、ライトデータの受領後直ちに、ライトデータの受領完了を正ホストに報告する。正ホストは、正記憶制御装置からの報告を受領した後、正記憶制御装置からライトデータのコピーを読み出す。この読み出されたライトデータには、正ホストからライト要求が発行された時刻(ライト時刻)が付与されている。正ホストは、読み出したライトデータ及びライト時刻を副ホストに転送する。副ホストは、各ライトデータに付与されたライト時刻を参照して、ライト時刻順に、ライトデータを副記憶制御装置に書き込む。これにより、正記憶制御装置に記憶されるデータと副記憶制御装置に記憶されるデータとの整合性を維持する。
特開2004−13367号公報 欧州特許第0671686号明細書
上記従来技術では、正ホスト及び副ホストが、データの転送や反映処理(ライト時刻順にデータをボリュームに書き込む処理)を常時行うため、各ホストの負荷が大きい。各ホストは常時起動している必要があり、また、上述のデータ転送処理や反映処理を実行するためのソフトウェアを常時動作させる必要がある。
また、複数の正記憶制御装置と複数の副記憶制御装置との間にそれぞれリモートコピー経路を設定し、複数のリモートコピーを同時に並列処理する場合、ある時点において、各副記憶制御装置の受領するライトデータは、それぞれ異なる。リモートコピー処理は、正ホストからライト要求を受領したタイミングとは異なる別のタイミングで行われる非同期処理である。従って、複数のリモートコピー処理は、それぞれ異なる任意のタイミングで実行される。この結果、一方の副記憶制御装置では受信済みのライトデータであっても、他方の副記憶制御装置では未だ受信されていないという事態が生じる。
このように、正サイトと副サイトの間で、複数のリモートコピー処理を同時に実行させる場合、各リモートコピー処理の進捗状況がそれぞれ相違するため、データの整合性を維持するのが難しい。
本発明は、上記問題点に鑑みてなされたもので、その目的は、複数の記憶制御装置間でそれぞれデータの転送及び更新が行われる場合に、データの整合性を維持できるようにしたストレージシステム及びストレージシステムのリモートコピー制御方法を提供することにある。本発明の他の目的は、複数の記憶制御装置間でそれぞれリモートコピーが行われる場合において、障害が検出されたときには、各記憶制御装置間のデータの整合性を維持しながら、サスペンドを行うことができるようにしたストレージシステム及びストレージシステムのリモートコピー制御方法を提供することにある。本発明の更なる目的は、後述する実施の形態の記載から明らかになるであろう。
上記課題を解決すべく、本発明に従うストレージシステムは、複数の記憶制御装置間でデータをコピーさせるストレージシステムであって、複数の第1記憶制御装置と、これら各第1記憶制御装置にそれぞれ接続される複数の第2記憶制御装置とを備え、各第1記憶制御装置は、上位装置により入出力されるデータを記憶するための第1論理ボリュームと、上位装置による第1論理ボリュームへのデータ更新を、更新データと該更新データの更新順序を指示するための更新順序情報とを対応付けて第2記憶制御装置に送信することにより通知する更新通知部と、をそれぞれ備えている。各第2記憶制御装置は、互いに接続されており、かつ、第1論理ボリュームに対応付けられ、第1論理ボリュームに記憶されるデータのコピーが記憶される第2論理ボリュームと、更新通知部から受信した更新データを記憶する更新データ記憶部と、更新通知部から受信した更新順序情報を管理する更新順序情報管理部と、更新順序情報に基づいて、更新データ記憶部に記憶された更新データを第2論理ボリュームに順番に書き込むことにより、第2論理ボリュームに記憶されるデータを更新させる更新部と、をそれぞれ備えている。さらに、所定の通知を受けた場合には、各更新順序情報管理部から各更新順序情報をそれぞれ収集して、これら収集された各更新順序情報に基づいて各第2論理ボリュームを更新可能な時点を決定し、この決定された更新可能時点を各更新部にそれぞれ通知することにより、各更新部によって各第2論理ボリュームに記憶されるデータを更新可能時点までそれぞれ更新させる更新制御部を備えているストレージシステム。
本発明の一態様では、各更新部は、第1論理ボリュームにおける更新順序と同一の順序で、通知された更新可能時点まで、第2論理ボリュームに記憶されるデータを更新させるようになっている。
本発明の一態様では、所定の通知は、複数の第2論理ボリュームからなるボリュームグループの登録指示である。
本発明の一態様では、所定の通知は、サスペンド要因の検出通知である。
本発明の一態様では、所定の通知は、サスペンド要因の検出通知であり、更新制御部は、サスペンド要因の検出通知を受けた場合に、各更新順序情報管理部からそれぞれ収集される各更新順序情報に基づいて各第2論理ボリュームを更新可能な時点を決定し、この決定された更新可能時点を各更新部にそれぞれ通知することにより、各更新部によって各第2論理ボリュームに記憶されるデータを更新可能時点までそれぞれ更新させ、各第2記憶制御装置は、各第2論理ボリュームのうちサスペンド要因の検出通知に関わる第2論理ボリュームについて、第1論理ボリュームのデータのコピーを記憶させるコピー処理を停止させる。
本発明の一態様では、サスペンド要因は、障害が検出された場合である。
本発明の一態様では、各第1記憶制御装置内では、1つまたは複数の第1論理ボリュームによって第1ボリュームグループがそれぞれ形成されており、各第2記憶制御装置内では、1つまたは複数の第2論理ボリュームによって第2ボリュームグループがそれぞれ形成されており、各第1ボリュームグループと各第2ボリュームグループとが対応付けられており、更新制御部は、第2ボリュームグループ毎に更新可能時点をそれぞれ決定し、この決定された更新可能時点を第2ボリュームグループに関する各更新部にそれぞれ通知するようになっている。
本発明の一態様では、複数の第2ボリュームグループから少なくとも1つ以上の拡張ボリュームグループが形成されており、更新制御部は、拡張グループ毎に更新可能時点を決定し、この決定された更新可能時点を拡張グループに属する各第2ボリュームグループにそれぞれ通知する。
本発明の一態様では、更新制御部は、第2論理ボリュームを少なくとも1つ以上含むボリュームグループの形成が指示された場合に、このボリュームグループについて更新可能時点を決定し、この決定された更新可能時点をボリュームグループに属する第2論理ボリュームに関する更新部にそれぞれ通知する。
本発明の一態様では、更新制御部は、各第2記憶制御装置に受信されて各更新順序情報管理部によりそれぞれ管理されている最新の各更新順序情報のうち、最も古い更新順序情報に基づいて、更新可能時点を決定する。
本発明の一態様では、更新順序情報には、上位装置による更新要求の発行時刻が含まれている。
本発明の一態様では、更新順序情報には、上位装置による更新要求の発行時刻及び更新要求の発行順序が含まれている。
本発明の一態様では、更新制御部は、サスペンド要因が検出された場合に更新可能時点を決定して、この決定された更新可能時点及び更新停止の要求を各更新部にそれぞれ通知し、各更新部は、各第2論理ボリュームに記憶されるデータを更新可能時点までそれぞれ更新させた後、各第2論理ボリュームへの更新を停止させる。
本発明の一態様では、各第1記憶制御装置から各第2記憶制御装置に更新データ及び更新順序情報を転送することができない障害の発生が検出された場合に、サスペンド要因の検出であると判断される。
本発明の一態様では、更新制御部は、各第2論理ボリュームのうち障害に係る所定の第2論理ボリュームについてのみ、更新可能時点を決定して、この決定された更新可能時点及び更新停止の要求を所定の第2論理ボリュームに係る更新部に通知する。
本発明の一態様では、更新制御部は、各第2記憶制御装置の少なくともいずれか1つに設けられている。
本発明の他の観点に従うストレージシステムのリモートコピー制御方法は、複数の第1記憶制御装置と該各第1記憶制御装置にそれぞれ接続される複数の第2記憶制御装置とを備えたストレージシステムにおいて、各第1記憶制御装置から各第2記憶制御装置へデータをそれぞれ転送してコピーさせるリモートコピー制御方法であって、各第1記憶制御装置がそれぞれ備える第1論理ボリュームと各第2記憶制御装置がそれぞれ備える第2論理ボリュームとを対応付けることにより、リモートコピーのペアを形成するステップと、上位装置から第1論理ボリュームに対する更新要求を受信するステップと、更新要求に係る更新データを第1論理ボリュームに書き込んで、第1論理ボリュームに記憶されるデータを更新させるステップと、更新データと該更新データの更新順序を指示するための更新順序情報とを対応付けて、各第1記憶制御装置から各第2記憶制御装置に転送させるステップと、更新順序情報に基づいて、第2論理ボリュームに更新データを順番に書き込み、第2論理ボリュームに記憶されるデータを更新させるステップと、各第2記憶制御装置から各更新順序情報をそれぞれ収集するステップと、所定の通知を受けた場合に、収集された各更新順序情報に基づいて、各第2論理ボリュームを更新可能な時点を決定するステップと、決定された更新可能時点を各第2記憶制御装置にそれぞれ通知し、各第2論理ボリュームに記憶されているデータを更新可能時点までそれぞれ更新させる同期ステップと、を実行する。
さらに、各第1記憶制御装置から各第2記憶制御装置への更新データ及び更新順序情報を転送することができない障害が検出された場合に、各更新順序情報に基づいて更新可能時点を決定し、この決定された更新可能時点及びリモートコピーの停止要求を各第2記憶制御装置にそれぞれ通知し、各第2論理ボリュームに記憶されるデータを更新可能時点までそれぞれ更新させてから、各第1論理ボリュームから各第2論理ボリュームへのリモートコピー処理を停止させるステップを実行することもできる。
本発明のさらに別の観点に従うストレージシステムは、複数の記憶制御装置間でデータをコピーさせるストレージシステムであって、第1サイト及び第2サイトを備え、第1サイトは、それぞれ複数の第1論理ボリュームを有する複数の第1記憶制御装置と、各第1記憶制御装置に接続され、各第1論理ボリュームにデータを入出力する上位装置と、を備えており、第2サイトは、それぞれ複数の第2論理ボリュームを有し、互いに接続された複数の第2記憶制御装置を備えており、各第1論理ボリュームは少なくとも1つ以上の第1ボリュームグループを構成しており、各第2論理ボリュームは少なくとも1つ以上の第2ボリュームグループを構成しており、第1ボリュームグループに属する各第1論理ボリュームと第2ボリュームグループに属する第2論理ボリュームとが、リモートコピーのペアとして対応付けられており、各第1記憶制御装置は、上位装置による各第1論理ボリュームへのデータ更新を、更新データと該更新データの更新順序を指示するための更新順序情報とを対応付けて各第2記憶制御装置に送信することにより通知する更新通知部と、リモートコピーの作動を停止させるためのサスペンド要求を各第2記憶制御装置に通知するサスペンド要求通知部と、をそれぞれ備えており、各第2記憶制御装置は、更新通知部から受信した更新データを記憶する更新データ記憶部と、更新通知部から受信した更新順序情報を管理する更新順序情報管理部と、更新順序情報に基づいて、更新データ記憶部に記憶された更新データを第2論理ボリュームに順番に書き込むことにより、第2論理ボリュームに記憶されるデータを更新させる更新部と、をそれぞれ備えている。さらに、各第2記憶制御装置のうち所定の第2記憶制御装置は、各第2記憶制御装置による各第2論理ボリュームの更新処理を同期させるための更新制御部を備えており、更新制御部は、所定の通知を受けた場合に、各更新順序情報管理部から各更新順序情報をそれぞれ収集して、これら収集された各更新順序情報に基づいて各第2論理ボリュームを更新可能な時点を決定し、この決定された更新可能時点を各更新部にそれぞれ通知することにより、各更新部によって各第2論理ボリュームに記憶されるデータを更新可能時点までそれぞれ更新させるようになっている。
なお、本発明は、以下の通り、例えば、リモートコピーシステムの制御方法として表現することも可能である。即ち、複数の記憶装置システム間でデータを複写するリモートコピーシステムの制御方法であって、リモートコピーシステムは、計算機からデータが入出力される複数の第1記憶装置システムと、第1記憶装置システムの各々に接続される複数の第2記憶装置システムとを有し、各第1記憶装置システムは、入出力されるデータが格納される第1論理ボリュームを有し、各第2記憶装置システムは、第1論理ボリュームに格納されるデータの複製が格納される第2論理ボリュームを有し、第2記憶装置システムのうち少なくとも1つはマスタ処理部を有し、登録指示をうけて第2記憶装置システムに反映処理変更指示を行うステップと、変更指示をうけて反映可能時刻に基づく反映処理を行うステップと、各第2記憶装置システムから到着済み時刻を収集して、反映可能時刻を決定するステップと、第2記憶装置システムに反映可能時刻を通知するステップと、第2記憶装置システムが第1記憶システムから転送されたライトデータについて、通知された反映可能時刻までのライトデータを第2論理ボリュームに格納するステップを含む、リモートコピーシステムの制御方法。
また、本発明は、リモートコピーシステムとして表現することもできる。即ち、複数の記憶装置システム間でデータを複写するリモートコピーシステムであって、計算機からデータが入出力される複数の第1記憶装置システムと、第1記憶装置システムの各々に接続される複数の第2記憶装置システムとを有し、各第1記憶装置システムは、入出力されるデータが格納される第1論理ボリュームを有し、各第2記憶装置システムは、第1論理ボリュームに格納されるデータの複製が格納される第2論理ボリュームを有し、第2記憶装置システムのうち少なくとも1つはマスタ処理部を有し、マスタ処理部は登録指示をうけて第2記憶装置システムに反映処理変更指示を行い、変更指示をうけて第2記憶装置システムは反映可能時刻に基づく反映処理を行い、マスタ処理部は各第2記憶装置システムから到着済み時刻を収集して、反映可能時刻を決定し、第2記憶装置システムに通知し、第2記憶装置システムは第1記憶システムから転送されたライトデータについて、通知された反映可能時刻までのライトデータを第2論理ボリュームに格納するリモートコピーシステム。
本発明の各手段、各部、各ステップの少なくとも一部は、コンピュータプログラムによって実行可能な場合がある。そして、このコンピュータプログラムは、各種記録媒体に固定された状態で配布したり、あるいは、通信媒体を介して送信することができる。
以下、図面に基づき、本発明の実施形態を説明する。図1は、本発明の全体概念を模式的に示す説明図である。本実施形態のストレージシステムは、互いに離間する正サイト及び副サイトを備えている。例えば、災害等に備えて、正サイトと副サイトとは、それぞれ別々の地域に配置されている。正サイトと副サイトとは、例えば、専用線やWAN(Wide Area Netwrok)等の通信回線で、双方向通信可能に接続されている。
正サイトには、正ホストH1及び複数の正記憶制御装置1が設けられており、副サイトには、副ホストH2及び複数の副記憶制御装置2が設けられている。各正記憶制御装置1は、それぞれ第1ボリューム1A及びライトデータ転送部1Bを備える。
各副記憶制御装置2は、第2ボリューム2Aと、ライトデータ記憶部2Bと、更新部2C及び更新順序情報管理部2Dを備える。さらに、少なくとも1つの副記憶制御装置2は、上記の構成2A〜2Dに加えて、更新制御部3を備えている。
なお、説明の便宜上、図1では、それぞれ1つずつのホストH1,H2と、2つずつの記憶制御装置1,2を示す。しかし、これに限らず、各サイトに、より多くのホストや記憶制御装置を配置することができる。
ユーザは、通常の場合、正サイトを用いて、各種の業務処理等を行う。業務処理としては、例えば、受発注処理、在庫管理処理、顧客管理処理、電子メール管理処理、ドキュメント管理処理等を挙げることができる。ユーザは、正ホストH1を介して、各正記憶制御装置1にアクセスし、第1ボリューム1Aにデータを書き込んだり、あるいは、第1ボリューム1Aに記憶されているデータを読み出して利用する。
正サイトの中で、ユーザの使用するデータ(ユーザデータ)をバックアップすることもできる。例えば、通常時において使用される第1ボリューム1Aの記憶内容を、テープデバイスやディスクデバイス等のバックアップ装置に保存しておくことにより、ユーザデータを保護することができる。また、作成後に所定時間が経過して、利用価値の低下した旧データを、第1ボリューム1Aからバックアップ装置に移し替えることにより、第1ボリューム1Aの空き容量を確保し、ストレージシステムの運用コストを低減させることもできる。
正サイトの中でユーザデータを保護している場合でも、大規模な災害等によって、正サイトの運用に支障を生じる可能性がある。この場合、正サイトが復旧するまでの長い期間、ユーザの業務処理が停止することになる。そこで、正サイトから適当な距離だけ離れた場所に、副サイトが設置される。副サイトには、万が一に備えて、正サイトで管理されているユーザデータと同一のデータが記憶される。このような物理的に離れた複数の拠点でユーザデータをそれぞれ管理し、万が一の災害に備えるシステムは、ディザスタリカバリシステムと呼ばれる。
正サイトの第1ボリューム1Aの記憶内容をテープデバイス等にバックアップし、このテープデバイスを副サイトに搬入し、第2ボリューム2Aの記憶内容を更新させることも考えられる。しかし、このような方法では、正サイトと副サイトとの記憶内容を一致させるまでに時間がかかり、手間も大きい。
そこで、正サイトと副サイトを通信回線で接続し、第1ボリューム1Aのデータが更新された場合には、新たに書き込まれたライトデータ(更新データ)D1を副サイトに転送して、第2ボリューム2Aのデータを更新させる。それぞれ異なる記憶制御装置間でデータを転送してコピーさせる技術を、リモートコピーと呼ぶ。
正サイトに設置されている複数の正記憶制御装置1は、副サイトに設置されている複数の副記憶制御装置2と、それぞれ別々の通信経路を介して接続されている。各ライトデータ転送部2Bは、正ホストH1によって第1ボリューム1A内のデータが更新されると、ライトデータD1及び更新順序情報D2を副記憶制御装置2に転送する。
更新順序情報D2とは、更新の順序を指示するための情報であり、例えば、正ホストH1がライトデータの書込みを要求した時刻(ライト時刻)やシーケンシャル番号等を含めることができる。更新順序情報D2は、正ボリュームである第1ボリューム1Aの更新内容を副ボリュームである第2ボリューム2Aに正しく反映させるための情報である。
副記憶制御装置2は、正記憶制御装置1からライトデータD1及び更新順序情報D2を受信すると、ライトデータD1をライトデータ記憶部2Bに記憶させる。更新順序情報D2は、更新順序情報管理部2Dによって管理される。更新部2Cは、更新順序情報D2に基づいて、ライトデータ記憶部2Bに記憶されたライトデータD1を読出し、更新された順番に従って、第2ボリューム2Aのデータを書き換える。
各正記憶制御装置1内の各第1ボリューム1Aは、互いに関連するデータ、または同一のデータをそれぞれ記憶している。一方の第1ボリューム1Aは、一方の第2ボリューム2Aに対応付けられて、リモートコピーのペアを形成する。他方の第1ボリューム1Aは、他方の第2ボリュームに対応付けられて、別のリモートコピーのペアを形成する。各第1ボリューム1Aのデータは互いに関連等するので、各第2ボリューム2Aのデータも整合している必要がある。
リモートコピーは、各正記憶制御装置1によって、それぞれ任意のタイミングで実行される。正ホストH1からライト要求が発行された場合、各正記憶制御装置1は、ライトデータD1を受信した時点で、ライト要求の処理が完了した旨を正ホストH1に通知し、その後、別のタイミングでライトデータD1を副記憶制御装置2に転送する。
なお、副記憶制御装置2が主導してリモートコピーを行う構成も可能である。この場合、例えば、副記憶制御装置2は、正記憶制御装置1に定期的に問合せすることにより、更新の有無を確認し、正記憶制御装置1からライトデータD1を読み出す。
このように、ライト要求の発行とリモートコピーの実行とは、それぞれ別々のタイミングで実行される。従って、正ホストH1から同一時刻に発行されたライト要求であっても、一方の副記憶制御装置2にはライトデータが到着しているが、他方の副記憶制御装置2にはライトデータが到着していないことがあり得る。
そこで、本実施形態のストレージシステムでは、複数の副記憶制御装置2のうち、所定の副記憶制御装置に更新制御部3を設けている。更新制御部3は、各副記憶制御装置2のリモートコピーの進捗状況を同期させるためのものである。
更新制御部3は、例えば、更新順序情報収集部3Aと、更新可能時点決定部3B及び更新指示部3Cとを備えて構成される。更新順序情報収集部3Aは、各更新順序情報管理部2Dから最新の更新順序情報D2をそれぞれ収集するものである。更新可能時点決定部3Bは、収集された最新の更新順序情報のうち、最も古い更新順序情報に示されたライト時刻を、更新可能時点として選択するものである。更新指示部3Cは、各更新部2Cに対して、更新可能時点までのライトデータ更新を許可するものである。
説明の便宜上、ここでは、例えば、一方の副記憶制御装置2には、ライト要求発行時刻(ライト時刻)N1aのライトデータD1(N1a)と、同N2aのライトデータD1(N2a)及び同N3aのライトデータD1(N3a)がそれぞれ到着しているとする。他方の副記憶制御装置2には、ライト要求発行時刻N1b及び同N2bのライトデータD1(N1b),D1(N2b)だけがそれぞれ到着しているものとする。ここで、ライトデータの到着順序で、符号”N”に数値”1”や”2”を添えているが、N1aとN1b、N2aとN2bは、それぞれ異なる時刻である。ライト時刻N1→N2→N3の順で、時間が経過するものとする。
各正記憶制御装置1がホストH1からライト要求を受領する時刻は、区々のため、各副記憶制御装置2が受信するライトデータD1のライト時刻は、偶然一致する場合もあるが、基本的にそれぞれ異なっている。
一方の副記憶制御装置2で管理されている最新の更新順序情報は、N3aに係る情報D2(N3a)であり、他方の副記憶制御装置2で管理されている最新の更新順序情報は、N2bに係る情報D2(N2b)である。更新順序情報D2(N3a)と更新順序情報D2(N2b)とを比較すると、D2(N2b)の方が時間的に前である。
そこで、更新可能時点決定部3Bは、最新の更新順序情報D2(N3a),D2(N2b)のうち、最も古い更新順序情報D2(N2b)に示された時刻N2bを、更新可能時点として決定する。更新可能時点とは、その時点(今の例ではN2b)まで、ライトデータの更新が許可される時点である。つまり、更新可能時点は、各副記憶制御装置2の記憶内容を同期させることができる時期を示している。
更新指示部3Cは、決定された更新可能時点を各副記憶制御装置2の更新部2Cにそれぞれ通知する。この通知を受領した各更新部2Cは、ライトデータ記憶部2Bに記憶されているライトデータD1を読み出し、更新の順番に従って、第2ボリューム2Aに書き込んでいく。
上記の例では、各更新部2Cは、ライト時刻N1のライトデータD1(N1)を第2ボリューム2Aに書き込んだ後、ライト時刻N2のライトデータD1(N2)を第2ボリューム2Aに書き込む。一方の副記憶制御装置2は、ライト時刻N3のライトデータD1(N3)も入手しているが、このライトデータD1(N3)は、第2ボリューム2Aに書き込まれない。ライトデータD1(N3)は、更新可能時点N2の後に到着しており、第2ボリューム2Aへの書込みが許可されていないためである。これにより、各第2ボリューム2Aの記憶内容は、ライト時刻N2の時点で一致する。
時間が経過して、他方の副記憶制御装置2にライトデータD1(N3)が到着した場合は、新たな更新可能時点としてN3が選択され、各第2ボリューム2Aの内容がライト時刻N3で一致する。
本実施形態は、上述のように構成されるので、以下の効果を奏する。本実施形態では、複数の経路を介してリモートコピーをそれぞれ行う場合において、各経路のリモートコピーを受信側(副記憶制御装置側)で同期させるための更新制御部3を設ける。従って、各更新順序情報管理部2Dから各更新順序情報D2をそれぞれ収集し、収集された各更新順序情報D2に基づいて各第2ボリューム2Aを更新可能な時点を決定し、各第2ボリューム2Aの記憶内容を更新可能時点までそれぞれ更新させることができる。
この結果、各ホストH1,H2の処理負荷を増大させることなく、記憶制御装置2間でデータを整合させることができる。即ち、いわゆるホストフリーで、複数のリモートコピー処理の結果を同期させることができ、使い勝手や信頼性が向上する。そして、正サイトで障害が生じて副サイトにフェイルオーバされた場合に、整合性を有するデータを用いてユーザの業務処理を継続して実行させることができ、ストレージシステムの信頼性を高めることができる。以下、本実施形態を詳細に説明する。
図2は、本実施例によるストレージシステムの全体構成を示す説明図である。このストレージシステムは、例えば、正サイトPs及び副サイトSsと、各サイトPs,Ssを管理するための管理サーバ43を備えている。
正サイトPsは、少なくとも1つ以上の正ホスト31と、複数の正記憶制御装置10と、各正記憶制御装置10を管理する管理端末41とを備えることができる。同様に、副サイトSsは、少なくとも1つ以上の副ホスト32と、複数の副記憶制御装置20と、管理端末42とを備えることができる。ここで、図1との対応関係を述べると、正ホスト31,副ホスト32は、図1中の正ホストH1,副ホストH2にそれぞれ対応する。正記憶制御装置10は図1中の正記憶制御装置1に、副記憶制御装置20は図1中の副記憶制御装置2にそれぞれ対応する。正ボリューム530Aは図1中の第1ボリューム1Aに、副ボリューム530Bは図1中の第2ボリューム2Aに、それぞれ対応する。
まず、正サイトPsの接続構成を説明する。正ホスト31は、SAN(Storage Area Network)等のデータ入出力用経路CN11を介して、各正記憶制御装置10とそれぞれ接続されている。正ホスト31と各正記憶制御装置10とは、直接的に接続することもできるし、ファイバチャネルスイッチ等の中継装置を介して接続することもできる。
各管理端末41は、それぞれに接続された正記憶制御装置10の状態を管理したり、構成変更を指示するためのものである。各正記憶制御装置10は、管理端末41を介して、管理用ネットワークCN14にそれぞれ接続されている。管理用ネットワークCN14は、例えば、LAN(Local Area Network)やWANのようなネットワークとして構成される。なお、管理端末41を介さずに、正記憶制御装置10を管理用ネットワークCN14に直接的に接続することもできる。
副サイトSsも正サイトPsと同様に、副ホスト32は、SAN等のデータ入出力用経路CN11を介して、各副記憶制御装置20にそれぞれ接続されている。各副記憶制御装置20は、管理端末42を介して、管理用ネットワークCN14にそれぞれ接続されている。さらに、各副記憶制御装置20は、ファイバチャネル等の更新制御用経路CN13を介して、互いに接続されている。
各サイトPs,Ss間のネットワーク構成を説明する。各サイトPs,Ssは、管理用ネットワークCN14を介して接続されている。各正記憶制御装置10と各副記憶制御装置20とは、SAN等のリモートコピー用経路CN12を介してそれぞれ接続されている。各正記憶制御装置10内の正ボリューム530Aと各副記憶制御装置20内の副ボリューム530Bとは、それぞれリモートコピーのペアを形成している。
詳細は後述するが、正ボリューム530Aの記憶内容は、初期コピーによって、コピーペアを形成する副ボリューム530Bにも記憶される。そして、正ボリューム530Aでデータ更新が行われた場合、このデータ更新に関する情報は、副ボリューム530Bにも転送される。副ボリューム530Bの記憶内容が更新されることにより、正ボリューム530Aの記憶内容と一致する。
厳密には、正ホスト31からのライト要求を正記憶制御装置10が処理するタイミングと、このライト要求に応じてリモートコピー処理を開始するタイミングとは同期していないため、正ボリューム530Aと副ボリューム530Bの記憶内容が完全に一致する期間は少ない。しかし、正ボリューム530Aに対するデータ更新は、多少の時間遅れの後で、副ボリューム530Bにも反映される。従って、正ホスト31がライト要求の発行を停止した後、時間の経過によって、正ボリューム530Aと副ボリューム530Bの記憶内容は、やがて一致する。
なお、副サイトSsは、正サイトのバックアップ専用として設けてもよいし、副サイト独自の業務処理を行うこともできる。即ち、副ホスト32は、リモートコピーに使用されていない別のボリュームを用いて、別の業務処理を行うこともできる。この場合、副サイトSsで独自に実行される業務処理を、正サイトPsがバックアップできるように構成してもよい。
副サイトSsに設けられている複数の副記憶制御装置20のうち、いずれか所定の1台は、マスタ副記憶制御装置20(M)として使用される。このマスタ副記憶制御装置20(M)は、リモートコピーに係る全ての副記憶制御装置20のリモートコピーの進捗状況を一元的に管理する。
管理サーバ43は、管理用ネットワークCN14を介して、正ホスト31及び副ホスト32と、各正記憶制御装置10及び各副記憶制御装置20とにそれぞれ接続されている。管理サーバ43は、各ホスト31,32や各記憶制御装置10,20の状態を管理等するものである。
なお、正記憶制御装置10と副記憶制御装置20とは、一対一で接続される必要はなく、N台の正記憶制御装置10がM台の副記憶制御装置に接続される構成でもよい。即ち、後述のように、リモートコピーのコピー元(ソース側)とコピー先(ディステネーション側)との間で、論理ボリュームが対応していればよく、各記憶制御装置10,20に設けられるボリューム530A,530Bの数は同数である必要はない。
また、副ホスト32と正記憶制御装置10とを別のデータ入出力用のネットワークで接続する構成でもよい。このような構成の場合、正ホスト31に障害が発生したときに、副ホスト32は、正ボリューム530Aに直接アクセスして、正ホスト31が行っていた処理を引き継ぐことができる。
図3は、ストレージシステムのハードウェア構成の一部を示す説明図である。図3には、副サイトSsの構成の一部が示されている。副サイトSsと正サイトPsとは、同一のハードウェア構成を備えることができるため、正サイトPs側の説明は省略する。
副ホスト32は、例えば、サーバマシンやメインフレームマシン等のようなコンピュータ装置である。副ホスト32は、例えば、プロセッサ301と、メモリ302と、データ入出力用のインターフェース(以下「I/F」)303と、管理用のI/F304とを備えて構成することができる。
プロセッサ301は、メモリ302に記憶された各種プログラムを読み込んで実行することにより、所定の機能を実現する。各種プログラムとしては、図4と共に後述する管理部312,OS(Operating System)322,アプリケーションプログラム(APP)332を挙げることができる。
副ホスト32は、各データ入出力用I/F303から各データ入出力用経路CN11を介して、各副記憶制御装置20にそれぞれ接続されている。また、管理用I/F304は、管理用ネットワークCN14に接続されている。
副記憶制御装置20のハードウェア構成を説明する。副記憶制御装置20は、コントローラ510と記憶部520とに大別可能である。コントローラ510と記憶部520とは、同一筐体内に設けてもよいし、それぞれ別々の筐体に設けることもできる。
コントローラ510は、副記憶制御装置20の動作を制御するものである。コントローラ510は、例えば、複数のチャネルアダプタ(以下、CHA)511と、複数のディスクアダプタ(以下、DKA)512と、キャッシュメモリ513と、共有メモリ514と、接続制御部515,516と、SVP517とを備えて構成可能である。
各CHA511は、副ホスト32や各記憶制御装置10,20との間のデータ転送を制御するもので、複数の通信ポート511Aを備えている。図3に示す例では、1つのCHA511は、副ホスト32との通信に使用される。他の1つのCHA511は、副記憶制御装置20との通信に接続される。さらに別の1つのCHA511は、正記憶制御装置10との通信に使用される。なお、上述のように、CHA511に代えて、副記憶制御装置20間をLAN用のI/Fで接続する構成でもよい。
各DKA512は、各ディスクドライブ521との間のデータ通信を制御する。各DKA512と各ディスクドライブ521とは、接続制御部516を介して接続されており、ファイバチャネルプロトコルに従ってブロック単位のデータ転送を行う。各DKA512は、ディスクドライブ521の状態を随時監視しており、この監視結果は、内部ネットワークを介して、SVP517に送信される。各CHA511及び各DKA512をそれぞれ別々の制御回路基板として構成することもできるし、一つの制御回路基板にCHA機能及びDKA機能をそれぞれ設けることもできる。なお、各ディスクドライブ521と各DKA512とは、複数の通信経路を介してそれぞれ接続されている。いずれか一方の通信経路に障害が生じた場合でも、各DKA512は、他方の通信経路を介して、各ディスクドライブ521にアクセス可能である。さらに、各DKA512のいずれかに障害が生じた場合でも、正常なDKA512を介して各ディスクドライブ521にアクセスすることができる。
キャッシュメモリ513は、正記憶制御装置10から転送されてきたライトデータや副ホスト32から受信したライトデータ等を記憶する。キャッシュメモリ513は、例えば、不揮発メモリから構成可能であるが、揮発メモリから構成することもできる。キャッシュメモリ513が揮発メモリから構成される場合、キャッシュメモリ513はバッテリによってバックアップされる。
共有メモリ(あるいは制御メモリ)514には、副記憶制御装置20の作動を制御するための各種制御情報や管理情報等が記憶される。共有メモリ514は、例えば、不揮発メモリから構成される。制御情報等は、複数の共有メモリ514によって多重管理することができる。
なお、キャッシュメモリ513と共有メモリ514とを別々のメモリ回路基板として構成してもよいし、一つのメモリ回路基板内にキャッシュメモリ513及び共有メモリ514を実装してもよい。また、キャッシュメモリの一部を制御情報を格納するための制御領域として使用し、他の部分をデータを記憶するためのキャッシュ領域として使用する構成でもよい。
接続制御部515は、各CHA511と、各DKA512と、キャッシュメモリ513と、共有メモリ514とをそれぞれ接続するものである。接続制御部515により、全てのCHA511,DKA512は、キャッシュメモリ513及び共有メモリ514にそれぞれアクセス可能である。接続制御部515は、例えば、クロスバスイッチ等として構成される。
SVP517は、例えば、LAN等の内部ネットワークを介して、各CHA511にそれぞれ接続されている。SVP517は、各CHA511及び各DKA512の状態や、キャッシュメモリ513の使用状況等を取得可能である。SVP517は、管理端末42を介して管理用ネットワークCN14に接続されている。
以上のように、コントローラ510は、複数種類の基板(CHA511,DKA512等)をコントローラ筐体に実装することにより、構成することができる。これに限らず、単一の制御基板上に、上述した各機能(副ホスト32との通信機能、ディスクドライブ521との通信機能、データ処理機能等)を実装する構成でもよい。この場合、複数の制御基板を設けて冗長構成とするのが、信頼性向上の観点からは好ましい。
記憶部520の構成を説明する。記憶部520は、複数のディスクドライブ521を備えている。ディスクドライブ521としては、例えば、ハードディスクドライブ、半導体メモリドライブ、光ディスクドライブ、光磁気ディスクドライブ、磁気テープドライブ等の種々の記憶デバイスを用いることができる。また、ハードディスクドライブを使用する場合、例えば、FC(Fibre Channel)ディスク、SATA(Serial AT Attachment)ディスク、SCSI(Small Computer System Interface)ディスクのように、種々の種類のハードディスクドライブを利用可能である。また、記憶部520内に、異なる種類の記憶デバイスを混在させることもできる。
RAIDレベル等によっても相違するが、所定数のディスクドライブ521によってRAIDグループ(パリティグループ)が構成される。例えば、3個のデータディスクと1個のパリティディスクとから、RAID5の構成を得ることができる(3D+1P)。
RAIDグループは、冗長化された物理的な記憶領域であり、物理的な記憶デバイスと呼ぶこともできる。RAIDグループの提供する物理的な記憶領域上に、論理的な記憶デバイスである論理ボリューム530Bを1つまたは複数設定することができる。以下の説明では、論理ボリュームをLU(Lugical Unit)と略す場合がある。ジャーナルボリューム531Bは、論理ボリューム530Bと同様に論理的な記憶デバイスとして構成される。ジャーナルボリューム531Bには、正記憶制御装置10から転送されてきたライトデータ等を記憶させることができる。
正ホスト31及び正記憶制御装置10は、副ホスト32及び副記憶制御装置20と同様のハードウェア構成を備えることができるため、説明を省略する。但し、正ホスト31と副ホスト32、正記憶制御装置10と副記憶制御装置20とは、それぞれ同一のハードウェア構成を備えている必要はない。例えば、正記憶制御装置10として最新型の記憶制御装置を用い、副記憶制御装置20として旧型の記憶制御装置を用いる場合のように、正サイトPsと副サイトSsとで、その物理的な構成が異なる場合もある。
なお、正記憶制御装置10のジャーナルボリューム531Aは、正記憶制御装置10と副記憶制御装置20との間の転送がリンク障害(パス障害)等で一時的にできなくなった場合に、未転送データを蓄えておくために使用可能である。この場合、リンク障害から回復した後、ジャーナルボリューム531Aに蓄積された未転送データは、副記憶制御装置20に転送される。このように正側のジャーナルボリューム531Aを用いることにより、リンク障害への耐性を向上させることができる。
図4は、ストレージシステムのソフトウェア構成を示す説明図である。正ホスト31は、通常運用に使用されるコンピュータ装置であり、副ホスト32は、障害の発生等に備えて待機しているコンピュータ装置である。正ホスト31では、例えば、管理部311と、OS321と、アプリケーションプログラム(図中「APP」と略記)331が、それぞれ動作している。同様に、副ホスト32でも、管理部312と、OS322及びアプリケーションプログラム332がそれぞれ動作している。アプリケーションプログラム331,332には、例えば、データベース管理システム(DBMS)等のソフトウェアも含まれる。管理部311,312は、後述のように、リモートコピーを行うグループにボリュームを登録等する処理や、サスペンド処理の指示等を行うものである。
正記憶制御装置10のコントローラ510は、ライトデータ受領部110と、ライトデータ転送部120と、マーカ作成部130とをそれぞれ実現する。ライトデータ受領部110は、正ホスト31から送信されたライト要求やライトデータを受信するための機能である。ライトデータ転送部120は、コピー先の副記憶制御装置20に、ライトデータ等を転送するための機能である。マーカ作成部130は、サスペンド処理を制御するための制御情報を副記憶制御装置20に送信する機能である。これらの各機能110,120,130は、例えば、CHA511内のプロセッサが所定のプログラムを読み込んで実行することにより、それぞれ実現される。
正記憶制御装置10の共有メモリ514には、例えば、ボリュームグループ管理情報T11と、相手方ボリューム情報T12と、ライトデータ管理情報T13と、最新ライト時刻管理情報T14と、差分ビットマップT15とを記憶させることができる。これらの制御用の情報については、さらに後述する。
正記憶制御装置10のキャッシュメモリ513には、正ホスト31から受信したライトデータが記憶される。なお、ライトデータの記憶用デバイスとして、ジャーナルボリューム531Aを用いてもよい。ジャーナルボリューム531Aにライトデータを記憶させることにより、キャッシュメモリ513の使用率を低減させることができ、多量のライトデータを記憶することができる。なお、ジャーナルボリューム531Aのサイズは、予め設定された固定値としてもよいし、その時々の必要に応じて設定することもできる。
副記憶制御装置20の構成を説明する。副記憶制御装置20のコントローラ510は、ライトデータ受領部210と、ライトデータ反映部220と、マスタ処理部230とをそれぞれ実現する。ライトデータ受領部210は、正記憶制御装置10から送信されたライトデータ等を受信するための機能である。ライトデータ反映部220は、正記憶制御装置10から受信したライトデータを順番通りに副ボリューム530Bに書き込むための機能である。
マスタ処理部230は、複数の副記憶制御装置20のうち、いずれか1つの副記憶制御装置20で作動する。マスタ処理部230は、リモートコピーを行う各副記憶制御装置20のライトデータ反映部220の動作を制御するための機能である。マスタ処理部230は、更新制御用経路CN13を介して、他の副記憶制御装置20内のライトデータ反映部220に所定の指示を与えることができる。なお、マスタ処理部230を、各副記憶制御装置20に予めそれぞれ実装しておき、いずれか1つのマスタ処理部230のみを起動させる構成でもよい。
副記憶制御装置20の共有メモリ514には、例えば、ボリュームグループ管理情報T21と、相手方ボリューム情報T22と、ライトデータ管理情報T23と、到着済みライト時刻管理情報T24と、反映可能ライト時刻管理情報T25と、マスタ情報T26と、拡張グループ管理情報T27と、マスタ時刻情報T28と、差分ビットマップT29とがそれぞれ記憶されている。
なお、差分ビットマップT29,T15は、ボリューム530B,530Aの更新状態をそれぞれ管理するためのものである。例えば、差分ビットマップT29,T15は、ボリュームの各ブロックに対応するビットデータの列から構成され、更新されたブロックには更新フラグとしてのビット「1」がセットされる。従って、差分ビットマップT29,T15を用いることにより、ボリュームのどの箇所が更新されたか否かを判断することができる。
ここで、本実施例のストレージシステムは、正ボリューム530A及び副ボリューム530Bをそれぞれグループ化することにより、グループ単位でリモートコピーを行うことができるようになっている。どのボリュームからグループを構成するか等は、ユーザが適宜設定することができる。このグループ設定は、例えば、ホスト31,32または管理端末41,42あるいは管理サーバ43から行うことができる。
図5は、論理ボリュームグループの概念を示す説明図である。本実施例では、ボリューム530A,530B間の関係をグループ化している。図5中、リモートコピーのペアを形成するボリューム530A,530B同士を波線で接続して示す。正ボリューム530Aはコピー元であり、副ボリューム530Bはコピー先である。
1つまたは複数の正ボリューム530Aによって、ボリュームグループ540Aが形成されている。同様に、1つまたは複数の副ボリューム530Bによって、ボリュームグループ540Bが形成されている。ソース側のボリュームグループ(正ボリュームグループ)540Aとディステネーション側のボリュームグループ(副ボリュームグループ)540Bとが対応付けられており、各グループ540A,540Bを構成するボリューム530A,530B間でリモートコピーがそれぞれ行われるようになっている。また、後述のように、副ボリュームグループ540Bの単位で、リモートコピーの反映処理が制御されるようになっている。
ライトデータの転送やライトデータのボリューム530Bへの書込み処理(反映処理)等を行うために必要となるコンピュータリソースは、各ボリュームグループ540A,540B毎にそれぞれ割り当てられている。
もしも仮に、各ボリューム530A,530B毎に、リモートコピーをそれぞれ管理したり、個別にリソースを割り当てたりする場合は、管理対象が多くなり、管理作業が煩雑化する。また、処理対象が多くなるため、処理に必要なリソースが増大する可能性もあり、各記憶制御装置10,20の負荷が増大する。
一方、正記憶制御装置10,副記憶制御装置20の全体をそれぞれ一つの管理単位とすると、各ボリューム530A,530Bの特質に応じた管理を行うのが難しい。アプリケーションプログラム331の種類や業務処理の種類等に応じて、ボリューム530A,530Bに要求される性能は、それぞれ異なる。
例えば、あるアプリケーションプログラム331は、より高性能で高信頼性を有するボリュームを要求し、別のアプリケーションプログラム331は、低価格なボリュームを要求する。従って、各ボリューム530A,530Bを、その特質(例えば、ディスクドライブ521の種別やボリュームサイズ等)に応じてグループ化し、それぞれのボリュームグループ540A,540B毎にリモートコピーを管理する方が好ましい。
従って、本実施例のように、ボリュームをグループ化して管理することにより、ユーザは、ボリュームグループ540A,540B毎にリモートコピーの構成や条件等を設定することができ、利便性が向上する。
さらに、本実施例では、各副ボリュームグループ540Bの中から任意の副ボリュームグループ540Bを選択して、拡張グループ550を構成可能としている。拡張グループ550は、筐体をまたいで構成することができる。つまり、1つの副記憶制御装置20内の副ボリュームグループ540Bと、別の1つの副記憶制御装置20内の副ボリュームグループ540Bとから、1つの拡張グループ550を構成することができる。図5中では、拡張グループ550を1つだけ示しているが、ユーザは、複数の拡張グループ550を設定することができる。
ある拡張グループ550に属している各副ボリュームグループ540Bは、それぞれ互いに別の副記憶制御装置20内に存在している場合でも、リモートコピーの進捗状況が同期するように制御される。即ち、後述のように、リモートコピーが停止された状態(サスペンド状態)において、拡張グループ550にそれぞれ属する複数の副ボリュームグループ540B間では、所定の時刻(反映可能ライト時刻)までライトデータがそれぞれ反映されて、データの整合性が維持されるようになっている。
次に、リモートコピーを制御するための各種情報について説明する。まず、図6は、ボリュームグループ管理情報T11(T21)及び相手方ボリューム情報T12(T22)の一例を示す説明図である。
ボリュームグループ管理情報T11(T21)は、図5に示したボリュームグループ540A,540Bを管理するための情報である。正記憶制御装置10に記憶されるボリュームグループ管理情報T11は、正記憶制御装置10側に設けられる正ボリュームグループ540Aの構成を管理する。副記憶制御装置20に記憶されるボリュームグループ管理情報T21は、副記憶制御装置20側に設けられる副ボリュームグループ540Bの構成を管理する。
各ボリュームグループ管理情報T11,T21は、同一の構造を備えている。そこで、以下、ボリュームグループ管理情報T11を中心に説明する。但し、構造自体は共通であっても、各項目に設定される値はそれぞれ異なる場合がある。
ボリュームグループ管理情報T11は、例えば、ボリュームグループIDと、シーケンシャル番号と、ボリューム数と、ボリュームIDと、相手方記憶制御装置IDと、相手方グループID及び未転送シーケンシャル番号を対応付けることにより、構成される。
ボリュームグループIDは、ボリュームグループを特定するための識別情報である。正側のボリュームグループ管理情報T11では、ボリュームグループIDに、正ボリュームグループ540Aを特定するための識別情報が設定される。副側のボリュームグループ管理情報T21では、ボリュームグループIDに、副ボリュームグループ540Bを特定するための識別情報が設定される。
シーケンシャル番号は、ボリュームグループIDで特定されるボリュームグループに属するボリュームへのライトデータの発行順序や発行数を管理する情報である。シーケンシャル番号は、ボリュームへのライトデータについて連続的に与えられる。初期値を”0”とすると、ライトデータが一回発行されるたびに、シーケンシャル番号の値も1つずつ増加するようになっている。
ボリューム数は、ボリュームグループIDで特定されるボリュームグループに属するボリュームの総数を示す情報である。
ボリュームIDは、ボリュームグループIDで特定されるボリュームグループに属する1つまたは複数のボリュームを、それぞれ一意に特定するための識別情報である。そのボリュームグループに属する全てのボリュームのボリュームIDがボリュームグループ管理情報T11にそれぞれ登録される。
相手方記憶制御装置IDは、ボリュームグループIDで特定されるボリュームグループとリモートコピーのペアを形成する相手方ボリュームグループを有する記憶制御装置を特定するための識別情報である。相手方記憶制御装置IDには、例えば、各記憶制御装置に予め設定されているシリアル番号等を用いることができる。正側のボリュームグループ管理情報T11では、相手方記憶制御装置IDとして、副記憶制御装置20のシリアル番号が設定される。副側のボリュームグループ管理情報T21では、正記憶制御装置10のシリアル番号が設定される。
相手方グループIDは、ボリュームグループIDで特定されるボリュームグループとリモートコピーのペアを形成するボリュームグループを特定するための識別情報である。正側のボリュームグループ管理情報T11では、相手方グループIDとして、副ボリュームグループ540Bを特定するための識別情報が設定される。副側のボリュームグループ管理情報T21では、相手方グループIDとして、正ボリュームグループ540Aを特定するための識別情報が設定される。
未転送シーケンシャル番号は、後述するライトデータの転送処理で用いられる情報であり、転送が必要となるライトデータの最小のシーケンシャル番号を示す。なお、未転送シーケンシャル番号は、正記憶制御装置10でのみ使用され、副記憶制御装置20では使用されない。従って、ボリュームグループ管理情報T21では、未転送シーケンシャル番号は使用されない。
図6の下側には、相手方ボリューム情報T12(T22)が示されている。正記憶制御装置10で使用される相手方ボリューム情報T12(正側の相手方ボリューム情報)と、副記憶制御装置20で使用される相手方ボリューム情報T22(副側の相手方ボリューム情報)とは、同一の構造を備えている。そこで、正側の相手方ボリューム情報T12を中心に説明する。
相手方ボリューム情報T12には、リモートコピーのペア関係が定義されている。相手方ボリューム情報T12は、例えば、ボリュームIDと、相手方記憶制御装置IDと、相手方ボリュームIDとを対応付けることにより、構成される。
ボリュームIDには、コピー元となる正ボリューム530Aを特定するための情報が設定される。相手方記憶制御装置IDには、ボリュームIDで特定される正ボリューム530Aとコピーペアを形成する副ボリューム530Bを有する副記憶制御装置20を特定するための情報が設定される。
相手方ボリュームIDには、ボリュームIDで特定される正ボリューム530Aとコピーペアを形成する副ボリューム530Bを特定するための情報が設定される。
副側の相手方ボリューム情報T22の場合、ボリュームIDには副ボリューム530Bを特定するための情報が、相手方記憶制御装置IDには正記憶制御装置10を特定するための情報が、相手方ボリュームIDには正ボリューム530Aを特定するための情報が、それぞれ設定される。
図7には、ライトデータ管理情報T13(T23)及び最新ライト時刻管理情報T14がそれぞれ示されている。正側のライトデータ管理情報T13と副側のライトデータ管理情報T23とは、同一の構造を備えている。そこで、正側のライトデータ管理情報T13を中心に説明する。
ライトデータ管理情報T13は、コピー元である正ボリューム530Aに書き込まれたライトデータを管理するための情報である。ライトデータ管理情報T13は、例えば、正ボリュームグループ540A毎に、それぞれリスト形式で作成され、管理される。
1つのライトデータ管理情報T13は、例えば、ボリュームIDと、ライトアドレスと、ライトデータ長と、ライトデータポインタと、シーケンシャル番号と、ライト時刻と、マーカ属性ビット及びマーカ種別とを対応付けることにより、構成される。
ボリュームIDには、正ボリューム530Aを特定するための情報が設定される。ライトアドレスは、特定された正ボリュームにおいて、ライトデータが書き込まれる先頭アドレスを示す。ライトデータ長は、ライトデータのサイズである。ライトデータポインタは、キャッシュメモリ513に記憶されているライトデータの先頭アドレスである。
正記憶制御装置10は、正ホスト31から受信したライトデータをキャッシュメモリ513に記憶させた時点で、正ホスト31に書込み完了を通知する。その後、正記憶制御装置10は、適当なタイミングで、キャッシュメモリ513に保存しておいたライトデータを、正ボリューム530Aに書き込む。従って、ライトデータは、最初にキャッシュメモリ513に記憶され、次に、正ボリューム530Aに記憶される。このため、ライトデータ管理情報T13には、ライトデータポインタが含まれている。
なお、正ボリューム530Aに書き込まれる前のライトデータのステータスは、「ダーティ」である。正ボリューム530Aに書き込まれた後のライトデータのステータスは、「クリーン」となる。キャッシュメモリ513上のライトデータがクリーンステータスに変化した場合、ライトデータが記憶されているキャッシュ領域は、他のライトデータを記憶するために再使用することができる。
シーケンシャル番号は、ボリュームIDで特定される正ボリューム530Aに書き込まれるライトデータについて連続的に付与される番号である。ライト時刻は、正ホスト31がライトデータの書込みを要求した時刻である。即ち、このライト時刻は、特定された正ボリューム530Aに対して、正ホスト31からライト要求が発行された時刻を示す。
マーカ属性ビットは、リモートコピーを制御するための特殊なライトデータ(以下、この制御用のライトデータを「マーカ」と呼ぶ)であるか、それとも通常のライトデータであるかを識別するための情報である。詳細は後述するが、通常のライトデータの場合、マーカ属性ビットには”0”が設定される。マーカの場合は、マーカ属性ビットに”1”が設定される。
マーカ種別は、マーカの種類を特定するための情報である。詳細は後述するが、マーカ種別として、例えば、”フラッシュサスペンド”、”パージサスペンド”、”スワップサスペンド”等を挙げることができる。
図7の下側には、最新ライト時刻管理情報T14が示されている。最新ライト時刻管理情報T14は、各リモートコピーにおいて、正ボリューム530Aに書込みが要求された最新のライトデータのライト時刻を管理するものである。従って、最新ライト時刻管理情報T14は、各正ボリューム530A毎にそれぞれ用意される。最新ライト時刻管理情報T14は、例えば、正ボリュームグループ540Aを特定するためのグループIDと、最新ライト時刻とを対応付けることにより、構成される。
図8には、拡張グループ管理情報T27及びマスタ情報T26が示されている。拡張グループ管理情報T27から説明する。拡張グループ管理情報T27は、複数の各副記憶制御装置20間にまたがって形成可能な拡張グループ550を管理する情報である。拡張グループ管理情報T27は、各拡張グループ550毎にそれぞれ用意される。
拡張グループ管理情報T27は、例えば、拡張グループIDと、ボリュームグループ数と、記憶制御装置IDと、ボリュームグループIDとを対応付けることにより、構成することができる。
拡張グループIDは、拡張グループ550を特定するための識別情報である。ボリュームグループ数は、特定された拡張グループ550に含まれる副ボリュームグループ540Bの数を示す。記憶制御装置IDは、その拡張グループ550に含まれる副ボリュームグループ540Bが存在する副記憶制御装置20を特定するための識別情報である。ボリュームグループIDは、その拡張グループ550に含まれる副ボリュームグループ540Bを特定するための識別情報である。
図8の下側には、マスタ情報T26が示されている。マスタ情報T26は、マスタ処理部230を特定するための情報である。マスタ処理部230は、後述のように、リモートコピーの同期等について、各副記憶制御装置20に所定の指示を与える。従って、各副記憶制御装置20は、どこから所定の指示を受けるのかを示す情報として、マスタ情報T26をそれぞれ保持している。
マスタ情報T26は、例えば、ボリュームグループIDと、拡張グループID及びマスタ記憶制御装置IDを対応付けることにより、構成される。ボリュームグループIDは、副ボリュームグループ540Bを特定するための識別情報である。拡張グループIDは、その特定された副ボリュームグループ540Bが属している拡張グループ550を特定するあめの識別情報である。マスタ記憶制御装置IDは、その特定された副ボリュームグループ540Bに所定の指示を発行するためのマスタ処理部230を有する副記憶制御装置20を特定するための識別情報である。
本実施例では、1つのマスタ処理部230によって、各副記憶制御装置20におけるリモートコピーの進捗状況を調停する構成となっている。これに代えて、例えば、それぞれ異なる副記憶制御装置20にマスタ処理部230をそれぞれ設け、各マスタ処理部230がそれぞれ別々の拡張グループ550を担当する構成でもよい。
図9には、到着済みライト時刻管理情報T24とマスタ時刻情報T28及び反映可能ライト時刻管理情報T25が、それぞれ示されている。
到着済みライト時刻管理情報T24は、副記憶制御装置20に到着した最新のライトデータのライト時刻を管理するための情報である。到着済みライト時刻管理情報T24は、例えば、ボリュームグループIDと、到着済みライト時刻と、マーカ種別及びマーカ時刻を対応付けることにより、構成される。
ボリュームグループIDは、副ボリュームグループ540Bを特定するための識別情報である。到着済みライト時刻には、その特定された副ボリュームグループ540Bに関する到着済みのライトデータのうち、最新のライトデータのライト時刻が記録される。到着済みライト時刻の初期値は”0”である。マーカ種別は、ライトデータ受領部210により検出されたマーカの種別を示す情報であり、初期値は無効値である。マーカ時刻は、マーカに付与されている時刻であり、初期値は”0”である。
マスタ時刻情報T28は、マスタ処理部230により使用される情報である。マスタ時刻情報T28は、例えば、拡張グループIDと、記憶制御装置IDと、ボリュームグループIDと、到着済みライト時刻と、マ−カ種別及びマーカ時刻とを対応付けることにより、構成される。
拡張グループIDは、拡張グループ550を特定するための識別情報である。記憶制御装置IDは、その特定された拡張グループ550に属する副ボリュームグループ540Bを有する副記憶制御装置20を特定するための識別情報である。ボリュームグループIDは、その特定された拡張グループ550に属する副ボリュームグループ540Bを特定するための識別情報である。到着済みライト時刻は、その副ボリュームグループ540Bについて到着済みのライトデータのうち、最新のライトデータのライト時刻を示す。到着済みライト時刻の初期値は”0”である。各副記憶制御装置20は、副ボリュームグループ540Bに到着した最新のライトデータのライト時刻を、マスタ処理部230にそれぞれ通知する。マーカ種別は、マーカの種別を示す情報であり、初期値は無効値である。マーカ時刻は、マーカに付与されている時刻であり、初期値は0である。
反映可能ライト時刻管理情報T25は、各副ボリュームグループ540B毎に、反映可能なライト時刻をそれぞれ管理するための情報である。反映可能ライト時刻とは、その副ボリュームグループ540Bに属する各副ボリューム530Bに反映させることができるライトデータの範囲を特定する情報である。反映可能ライト時刻は、「更新可能時点」に対応する。
反映可能ライト時刻として示された時点まで、副ボリューム530Bにライトデータを順番に書き込むことができる。ライト時刻N1,N2,N3,N4の4個のライトデータがある場合を例に挙げる。ライト時刻N4が最新のライト時刻であるとする。もしも、マスタ処理部230が反映可能ライト時刻としてN3を選択した場合、ライトデータ反映部220は、ライト時刻N1のライトデータを副ボリューム530Bに書込み、次に、ライト時刻N3のライトデータを副ボリューム530Bに書込み、最後に、ライト時刻N3のライトデータを副ボリューム530Bに書き込むことができる。
反映可能ライト時刻管理情報T25は、例えば、ボリュームグループIDと、反映可能ライト時刻及びマーカ種別を対応付けることにより、構成される。ボリュームグループIDは、副ボリュームグループ540Bを特定するための識別情報である。反映可能ライト時刻は上述の通りであり、その初期値は”0”である。マーカ種別は、マーカの種別を示し、初期値は無効値である。
図10は、ライト要求の処理を示すフローチャートである。このライト要求処理は、正記憶制御装置10のコントローラ510(詳しくは、ライトデータ受領部110)によって実行される。説明の便宜上、動作の主体を正記憶制御装置10とする。しかし、実際には、コントローラ510内の1つまたは複数のプロセッサが、所定のプログラムに従って動作することにより、ライト要求が処理される。なお、以下の各フローチャートも同様であるが、各フローチャートは、本発明の理解及び実施に必要な程度に、各処理の内容を示しており、実際のプログラムとは相違する。また、以下の説明では、ステップを「S」と略記する。
正記憶制御装置10は、正ボリューム530Aを書込み対象とするライト要求を、正ホスト31から受信する(S11)。このライト要求には、正ホスト31によってライト時刻が付与されている。
正記憶制御装置10は、正ホスト31から受信したライトデータを、キャッシュメモリ513に記憶させる(S12)。正記憶制御装置10は、ボリュームグループ管理情報T11を参照し、既に記憶されているシーケンシャル番号を1つ増加させて、新たなシーケンシャル番号(図中「SEQ番号」と略記)を取得する(S13)。
正記憶制御装置10は、その取得したシーケンシャル番号及びライト時刻を、正ホスト31から受信したライトデータに関連付けることにより、ライトデータ管理情報T13を生成する(S14)。このライトデータ管理情報T13には、上述の通り、ライトデータの書込み先として指定された正ボリューム530AのボリュームIDや、ライトアドレス等も設定される。
正記憶制御装置10は、最新ライト時刻管理情報T14に、S11で受信したライト要求に示されているライト時刻を記憶させる(S15)。そして、正記憶制御装置10は、ライト要求の処理が完了した旨を正ホスト31に通知する(S16)。
つまり、正記憶制御装置10は、ライトデータを正ボリューム530Aに実際に書き込むよりも前に、ライトデータの書込みが完了した旨を正ホスト31に報告する。正ホスト31への書込み完了を報告した後で、正ボリューム530Aへの書込みや副ボリューム530Bへの転送を行うため、正記憶制御装置10の応答性能を高めることができる。また、これにより、正サイトPsと副サイトSsとが遠く離れている場合でも、両サイト間の伝播時間による遅れを正ホスト31に認識させることなく、速やかにライト要求処理を行うことができる。従って、上述した非同期処理は、正サイトPsと副サイトSsとの距離が離れているディザスタリカバリシステムに好適である。
最後に、正記憶制御装置10は、適当なタイミングで、キャッシュメモリ513に記憶されたライトデータを、正ボリューム530Aを構成する各ディスクドライブ521に書き込む(S17)。ディスクドライブ521への書込み方法は、正ボリューム530AのRAID構成に依存する。もしも、正ボリューム530AがRAID1に設定されている場合、正ディスクドライブ及び副ディスクドライブの両方に、同一のライトデータがそれぞれ書き込まれる。もしも、正ボリューム530AがRAID5等のようなパリティデータを用いる構成に設定されている場合、新たなパリティデータを算出した後で、ライトデータ及びパリティデータが所定のディスクドライブ521にそれぞれ書き込まれる。
図11は、正記憶制御装置10から副記憶制御装置20へライトデータを転送して、副ボリューム530Bにコピーさせるための処理を示すフローチャートである。この処理は、ライトデータ転送処理またはリモートコピー処理と呼ぶことができる。
図11に示す処理は、正記憶制御装置10のライトデータ転送部120と、副記憶制御装置20のライトデータ受領部210によって実行される。より詳しくは、上述のように、各記憶制御装置10,20の有する1つまたは複数のプロセッサが、所定のプログラムを実行することにより、図11に示す処理が実現される。
まず、正記憶制御装置10は、ボリュームグループ管理情報T11に記憶されている未転送シーケンシャル番号を参照し、副記憶制御装置20への転送が必要なライトデータを特定する。そして、正記憶制御装置10は、ライトデータ管理情報T13,ボリュームグループ管理情報T11及び相手方ボリューム情報T12をそれぞれ参照することにより、ライトデータ関連情報を生成する(S21)。
ライトデータ関連情報とは、転送先(コピー先)の副記憶制御装置20において、ライトデータを管理するために必要な諸情報を含んだ情報である。ライトデータ関連情報は、ライトアドレスと、ライトデータ長と、シーケンシャル番号と、ライト時刻と、マーカ属性ビット及びマーカ種別を含んでいる。これらライトアドレスやシーケンシャル番号等は、ライトデータ管理情報T13からそれぞれ取得される。ライトデータ関連情報には、ライトデータの転送先を特定するための情報も含まれている。ライトデータの転送先を特定するための情報とは、相手方ボリューム情報T12から取得される相手方記憶制御装置ID及び相手方ボリュームIDである。さらに、ライトデータ関連情報には、ボリュームグループ管理情報T11から取得される相手方ボリュームグループIDも含まれる。
そして、正記憶制御装置10は、キャッシュメモリ513に記憶されているライトデータと、S22で作成したライトデータ関連情報とを対応付けて、副記憶制御装置20に転送する(S22)。
副記憶制御装置20は、正記憶制御装置10からライトデータ及びライトデータ関連情報を受信すると(S23)、ライトデータを副記憶制御装置20内のキャッシュメモリ513に記憶させる(S24)。
副記憶制御装置20は、正記憶制御装置10から受信したライトデータ関連情報に基づいて、ライトデータ管理情報T23を生成する(S25)。そして、副記憶制御装置20は、S23で受信したライトデータに設定されているシーケンシャル番号に抜けがないかを判定する(S26)。
シーケンシャル番号が連続している場合(S26:YES)、副記憶制御装置20は、S23で受信した最新のライトデータのライト時刻と、到着済みライト時刻管理情報T24に記憶されている到着済みライト時刻とを比較し、到着済みライト時刻の方がS23で受信したライトデータのライト時刻よりも前であるか否かを判定する(S27)。S26とS27の判定ステップは、入れ替えることもできる。
S23で受信したライトデータのライト時刻よりも、到着済みライト時刻管理情報T24に記憶されている到着済みライト時刻の方が古い場合(S27:YES)、副記憶制御装置20は、到着済みライト時刻管理情報T24に登録されている到着済みライト時刻を、S23で受信したライトデータのライト時刻で置き換える(S28)。副記憶制御装置20は、ライトデータの受信が完了した旨を、正記憶制御装置10に報告する(S29)。
正記憶制御装置10は、副記憶制御装置20からの完了報告を受信すると、ボリュームグループ管理情報T11内の未転送シーケンシャル番号を更新する(S30)。副記憶制御装置20へのライトデータ転送が完了した場合、この転送されたライトデータを既に正ボリューム530Aに書込み済みであるならば、正記憶制御装置10は、キャッシュメモリ513に記憶されているライトデータを破棄することができる。正ボリューム530Aへの書込み用とは別に、副記憶制御装置20への転送用にライトデータを保持している場合は、副記憶制御装置20からの完了報告を受信後に、この転送用のライトデータを破棄することができる。
なお、図11に示す処理では、正記憶制御装置10から副記憶制御装置20にライトデータ等を送信する構成になっている(S22)。これに代えて、副記憶制御装置20から正記憶制御装置10に、ライトデータの転送要求を発行し、この転送要求に応じて、正記憶制御装置10が副記憶制御装置20にライトデータ等を送信する構成でもよい。このように、副記憶制御装置20からの転送要求に応じて、正記憶制御装置10から副記憶制御装置20にライトデータ等を送信する構成にした場合、副記憶制御装置20の状況に応じて、ライトデータの転送処理を行うことができる。即ち、例えば、副記憶制御装置20におけるライトデータの処理状況、負荷量、ライトデータの蓄積量(キャッシュメモリ513の使用率)等に応じて、正記憶制御装置10から副記憶制御装置20にライトデータ等を転送することができる。
また、図11に示す処理では、副記憶制御装置20は、ライトデータをキャッシュメモリ513に保存するものとして述べた(S24)。これに代えて、副記憶制御装置20がジャーナルボリューム531Bを有する場合、ジャーナルボリューム531Bにライトデータを記憶させるように構成してもよい。一般に、ジャーナルボリューム531Bの方がキャッシュメモリ513よりも大容量に形成することができるため、より多くのライトデータを蓄積することができる。ジャーナルボリューム531Bを用いる場合、キャッシュメモリ513は、副ボリューム530B及びジャーナルボリューム531Bのキャッシュ領域として使用される。
同様に、正記憶制御装置10においても、ジャーナルボリューム531Aをキャッシュ領域として使用することができる。
なお、ジャーナルボリューム531Bのボリュームサイズは、可変に設定することもできる。例えば、最初のうちは、ジャーナルボリューム531Bのサイズを小さく設定しておき、正記憶制御装置10からのライトデータ転送量が増大した場合には、このライトデータ転送量の増大に応じて、ジャーナルボリューム531Bのサイズを拡張する構成でもよい。
図12は、各副記憶制御装置20でそれぞれ実行されるリモートコピーの反映処理と、複数の反映処理を同期させるための調停処理を示すフローチャートである。本実施例では、この調停処理によって、各副ボリューム530B間のデータの整合性を保証する。マスタ処理部230は、いずれか1つの副記憶制御装置20上で作動している。マスタ処理部230の作動している副記憶制御装置20をマスタ副記憶制御装置と、マスタ処理部230からの指示を受ける他の副記憶制御装置20をスレーブ副記憶制御装置と、図中では示している。
マスタ処理部230は、拡張グループ550に属している各副ボリュームグループ540Bのそれぞれについて、到着済みライト時刻管理情報T24に記憶されている最新の到着済みライト時刻を問い合わせる(S41)。マスタ処理部230は、更新制御用経路CN13を介して、各副記憶制御装置20のコントローラ510に、最新の到着済みライト時刻をそれぞれ問い合わせる。
各副記憶制御装置20は、マスタ処理部230からの問合せを受信すると、到着済みライト時刻管理情報T24を参照し(S42)、そこに記憶されている到着済みライト時刻をマスタ処理部230に送信する(S43)。
マスタ処理部230は、各副記憶制御装置20から受信した到着済みライト時刻を、マスタ時刻情報T28にそれぞれ記録する(S44)。マスタ処理部230は、マスタ時刻情報T28に記録された各到着済みライト時刻を比較することにより、その中で最も古い到着済みライト時刻を1つ検出する(S45)。この検出された最古の到着済みライト時刻が、反映可能ライト時刻として選択される。そして、マスタ処理部230は、反映可能ライト時刻までに到着したライトデータの副ボリューム530Bへの書込みを、各副記憶制御装置20にそれぞれ許可する(S46)。
各副記憶制御装置20は、マスタ処理部230から通知された反映可能ライト時刻を、反映可能ライト時刻管理情報T25に記憶させる(S47)。S41〜S47の調停処理を1サイクルとして、マスタ処理部230は、この調停処理を、定期的にまたは不定期に、繰り返す。
上述のように、調停処理では、マスタ処理部230の動作する副記憶制御装置(マスタ副記憶制御装置)と他の副記憶制御装置20との間で、更新制御用経路CN13を介して、指示や応答が交換される。従って、これら指示及び応答の交換状態を監視することにより、各副記憶制御装置20や更新制御用経路CN13に障害が生じた否かを検出することもできる。例えば、マスタ処理部230からの指示に対して、一定期間内に、他の副記憶制御装置20から応答が無い場合は、障害の発生と推定することができる。
図13は、副記憶制御装置20における副ボリューム530Bへのライトデータ反映処理を示すフローチャートである。反映処理とは、正記憶制御装置10から受信したライトデータを副ボリューム530Bに書き込むことにより、副ボリューム530Bの内容を更新させる処理である。ライトデータ反映部220は、各副ボリュームグループ540B毎に反映処理をそれぞれ行う。以下、動作の主体を副記憶制御装置20として述べる。
副記憶制御装置20は、ある副ボリュームグループ540Bに属する副ボリューム530Bについて、ライトデータ管理情報T23を参照し(S51)、ライト時刻順及びシーケンシャル番号順に、ライトデータ管理情報を選択する(S52)。これにより、到着済みのライトデータを副ボリューム530Bに格納する順序が定められる。
副記憶制御装置20は、その副ボリュームグループ540Bのマスタ情報T26を参照し(S53)、その副ボリュームグループ540Bが拡張グループ550に属しているか否かを判定する(S54)。即ち、副記憶制御装置20は、その副ボリュームグループ540Bについて、マスタ情報T26が設定されているか否かを判定する。
副ボリュームグループ540Bが拡張グループ550に属している場合(S54:YES)、その副ボリュームグループ540Bは、同期反映処理の対象となっている。そこで、副記憶制御装置20は、S52で選択したライトデータのライト時刻と反映可能ライト時刻管理情報T25に記憶されている反映可能ライト時刻とを比較する。副記憶制御装置20は、選択したライトデータのライト時刻が反映可能ライト時刻よりも前の場合、その選択したライトデータを副ボリューム530Bに書き込む(S56)。即ち、副記憶制御装置20は、書込み対象のライトデータについてライトデータ管理情報T23を参照し、ライトアドレス及びライトデータ長を特定し、副ボリューム530Bの所定の場所にライトデータを記憶させる。
これに対し、副ボリュームグループ540Bが拡張グループ550に属していない場合(S54:NO)、副記憶制御装置20は、S55をスキップしてS56に移り、書込み対象のライトデータを副ボリューム530Bに書き込む。副ボリュームグループ540Bが拡張グループ550に属していない場合、その副ボリュームグループ540Bは、同期反映処理の対象外だからである。
上述したS51〜S56の反映処理を1サイクルとして、副記憶制御装置20は、各副ボリューム530B毎に、反映処理をそれぞれ行う。これにより、副記憶制御装置20は、拡張グループ550に属している副ボリュームグループ540Bについて、反映可能ライト時刻までに受信したライトデータを、ライト時刻順及びシーケンシャル番号順に、副ボリューム530Bに書き込むことができる。
ここで、ライト時刻と反映可能ライト時刻とを比較し、反映可能ライト時刻までのライトデータを、ライト時刻順及びシーケンシャル番号順に、副ボリューム530Bに書き込ませる動作を、以下の説明では、「指示による反映処理モード」と呼ぶ。これに対し、到着済みの全てのライトデータを、ライト時刻順及びシーケンシャル番号順に、副ボリューム530Bに書き込ませる動作を、「自動反映処理モード」と呼ぶ。「指示による反映処理モード」では、拡張グループ550に属する各副ボリューム530Bの更新時期が、マスタ処理部230から許可された時刻(反映可能ライト時刻)にそれぞれ一致するため、「同期反映処理モード」と呼ぶこともできる。また、例えば、「自動反映処理モード」を第1反映処理モードと、「指示による反映処理モード」を第2反映処理モードと、それぞれ呼ぶこともできる。
このように、「指示による反映処理モード」の場合、拡張グループ550に属する各副ボリューム530Bには、マスタ処理部230から指示された反映可能ライト時刻まで、ライトデータが反映される。
従って、データの転送タイミングやデータ転送経路上のバッファリングが非同期に動作する複数のリモートコピーが並列して行われる場合でも、副ボリューム530Bの記憶内容に整合性を持たせることができる。
これにより、例えば、もしも正記憶制御装置10等に障害が生じ、あるライトデータが副ボリューム530Bに到着しなかった場合でも、この未着のライトデータよりも後に発行されたライトデータは、副ボリューム530Bへの反映が許可されない。従って、拡張グループ550に属する各副ボリューム530Bでは、更新の順序が変わったり、一部のライトデータが抜けたりすることがなく、整合性が確保される。従って、副ホスト32は、整合性の確保されている副ボリューム530Bを用いて、正ホスト31の業務処理を引き継ぐことができ、信頼性の高いフェイルオーバを実現することができる。
図14は、拡張グループ550に副ボリュームグループ540Bを登録するための処理を示すフローチャートである。上述のように、副ボリュームグループ540Bが拡張グループ550に登録された場合、その副ボリュームグループ540Bに属する副ボリューム530Bには、「指示による反映処理モード」が適用される。
まず、副ホスト32の管理部312(以下、副ホスト32)は、マスタ処理部230が動作しているマスタ副記憶制御装置20に、拡張グループ550への副ボリュームグループ540Bの登録を要求する(S61)。この登録要求には、例えば、登録先となる拡張グループ550の拡張グループIDと、その拡張グループ550に登録を希望する副ボリュームグループ540Bを示すボリュームグループIDと、その副ボリュームグループ540Bが設けられている副記憶制御装置20の記憶制御装置IDとが含まれている。
マスタ処理部230は、副ホスト32からの登録要求を受信すると、指定された副ボリュームグループ540Bを有する副記憶制御装置20に、指定された副ボリュームグループ540Bの拡張グループ550への登録を要求する(S62)。マスタ処理部230から発行される要求には、例えば、副ホスト32から指定されたボリュームグループID及び拡張グループIDとが含まれる。
マスタ処理部230からの要求を受信した副記憶制御装置20は、マスタ情報T26を設定する(S63)。即ち、登録対象の副ボリュームグループ540Bを有する副記憶制御装置20は、指定されたボリュームグループIDに対応するマスタ情報T26に、指定された拡張グループID及びマスタ処理部230を有する副記憶制御装置20の記憶制御装置IDを、それぞれ設定する(S63)。
マスタ情報T26を設定した副記憶制御装置20は、拡張グループ550に登録された副ボリュームグループ540Bの処理モードを、「自動反映処理モード」から「指示による反映処理モード」に変更する(S64)。処理モードを変更した副記憶制御装置20は、マスタ副記憶制御装置20に、登録処理が完了した旨を報告する(S65)。
マスタ副記憶制御装置20は、拡張グループ管理情報T27を参照し(S66)、S63でマスタ情報T26に設定された拡張グループIDが、拡張グループ管理情報T27に登録されているか否かを判定する(S67)。
その拡張グループIDが拡張グループ管理情報T27に登録されていない場合は(S67:NO)、その拡張グループIDへの最初の副ボリュームグループ540Bの登録であることを意味する。そこで、マスタ副記憶制御装置20は、拡張グループ管理情報T27に、新しい拡張グループIDと、副記憶制御装置20の記憶制御装置IDと、副ボリュームグループ540BのボリュームグループIDと、をそれぞれ設定する(S68)。また、「ボリュームグループ数」には”1”が設定される。
続いて、マスタ副記憶制御装置20は、その新設された拡張グループ550に属する副ボリュームグループ540Bについて、上述の調停処理を実行させる(S69)。即ち、拡張グループ550が新たに設定された場合(S67:NO)、マスタ副記憶制御装置20は、その拡張グループ550に属する各副ボリューム530Bの記憶内容を整合させる。
これに対し、S63でマスタ情報T26に設定された拡張グループIDが、拡張グループ管理情報T27に登録済みの場合(S67:YES)、マスタ副記憶制御装置20は、その拡張グループIDに関する内容を更新する(S70)。即ち、マスタ副記憶制御装置20は、追加された副ボリュームグループ540BのボリュームグループIDと、追加された副ボリュームグループ540Bを有する副記憶制御装置20の記憶制御装置IDとを、拡張グループ管理情報T27にそれぞれ設定する。また、マスタ副記憶制御装置20は、「ボリュームグループ数」を1つ増加させる。
マスタ副記憶制御装置20は、拡張グループ管理情報T27の設定変更を完了した後、副ホスト32に、副ボリュームグループ540Bの拡張グループ550への登録が完了した旨を報告する(S71)。これにより、副ホスト32は、拡張グループ550への登録が完了したことを確認する。なお、説明の便宜上、図14では、マスタ副記憶制御装置20は、調停処理(S69)の後で、副ホスト32に設定完了を報告するかのように示しているが、拡張グループ管理情報T27の設定後に(S68)、設定完了を報告する構成でもよい。
図15は、拡張グループ550から副ボリュームグループ540Bを削除するための処理を示すフローチャートである。
副ホスト32は、マスタ副記憶制御装置20に、拡張グループ550から副ボリュームグループ540Bの削除を要求する(S81)。この削除要求には、例えば、削除対象の副ボリュームグループ540BのボリュームグループIDと、削除対象の副ボリュームグループ540Bを有する副記憶制御装置20の記憶制御装置IDと、削除対象の副ボリュームグループ540Bが属している拡張グループ550の拡張グループIDとが、含まれている。
マスタ副記憶制御装置20は、副ホスト32からの削除要求を受信すると、記憶制御装置IDで特定された副記憶制御装置20に、副ボリュームグループ540Bの拡張グループ550からの削除を要求する(S82)。この削除要求には、例えば、削除対象の副ボリューム530BのボリュームグループIDと、拡張グループ550の拡張グループIDとが含まれる。
マスタ副記憶制御装置20からの削除要求を受信した副記憶制御装置20は、指定された副ボリュームグループ540Bに関連付けられているマスタ情報T26を、初期化する(S83)。続いて、この副記憶制御装置20は、拡張グループ550への登録が解除された副ボリュームグループ540Bの処理モードを、「指示による反映処理モード」から「自動反映モード」に変更する(S84)。処理モードを変更した副記憶制御装置20は、マスタ副記憶制御装置20に、拡張グループ550からの削除が完了した旨を報告する(S85)。
マスタ副記憶制御装置20は、S85で発行された完了報告を受信すると、拡張グループ管理情報T27を参照し(S86)、副ボリュームグループ540Bの削除された拡張グループ550に設定されている「ボリュームグループ数」が”1”であるか否かを判定する(S87)。
その拡張グループ550の「ボリュームグループ数」が”2”以上の場合(S87:NO)、マスタ副記憶制御装置20は、「ボリュームグループ数」の値を1だけ減少させ、また、削除された副ボリュームグループ540BのボリュームグループIDを拡張グループ管理情報T27から消去する(S88)。
副ボリュームグループ540Bの削除された拡張グループ550に設定されている「ボリュームグループ数」が”1”の場合(S87:YES)、マスタ副記憶制御装置20は、その拡張グループ550に関する拡張グループ管理情報T27を初期化する(S90)。その拡張グループ550には、1つも副ボリュームグループ540Bが登録されていないためである。そして、マスタ副記憶制御装置20は、調停処理を停止する(S91)。
マスタ副記憶制御装置20は、拡張グループ550から副ボリュームグループ540Bの削除を完了した旨を、副ホスト32に通知する(S89)。これにより、副ホスト32は、拡張グループ550から副ボリュームグループ540Bの削除が完了したことを確認する(S92)。
ここで、拡張グループ550に属する各副ボリュームグループ540Bについて、記憶内容の整合性が確保される条件について考察する。まず、最初に、形成コピー(初期コピー)に関する条件を検討する。
形成コピーとは、リモートコピーの開始時点において、正ボリューム530Aと副ボリューム530Bとの差分を一致させるためのコピーである。形成コピーでは、相違箇所のデータを、正ボリューム530Aから副ボリューム530Bにコピーさせる。
形成コピーは、上述のライトデータのリモートコピーと並行して行うことができる。即ち、正ボリューム530Aと副ボリューム530Bとの差分を解消させつつ、正ホスト31から正ボリューム530Aに新たに書き込まれたライトデータを、副ボリューム530Bに転送してコピーさせることができる。
しかし、形成コピーによって、正ボリューム530Aから副ボリューム530Bに送信されるデータは、正ボリューム530Aに書き込み済みのデータであり、ライト時刻(正ホスト31によるライト要求の発行時刻)が付与されていない。従って、形成コピーの実行中は、ライトデータの書込み順序(反映順序)を副記憶制御装置20側で把握することができないため、データの整合性を確保することができない。
この場合、正副ボリューム間のデータの整合性は、形成コピーの完了時点で、確保されることになる。例えば、形成コピー中の副ボリューム530Bの状態を「Duplex Pending状態」、形成コピー完了後の副ボリューム530Bの状態を「Duplex状態」と表現するならば、「Duplex Pending状態」から「Duplex状態」になった時点で、データの整合性が確保される。
但し、形成コピーの完了した副ボリュームグループ540Bを拡張グループ550に登録した場合は、図15中のS69で述べたように、拡張グループ550へ登録された時点から、調停処理が実行される。
従って、副ボリュームグループ540Bを拡張グループ550に登録した時点では、その拡張グループ550に属する各副ボリュームグループ540B内の各副ボリューム530Bは、それぞれ記憶内容が相違しうる。即ち、同一の拡張グループ550に属する場合でも、各副ボリューム530Bの記憶内容が時間的にずれている可能性がある。
このような「ずれ」は、リモートコピー処理の遅れている副ボリュームグループ540Bが、リモートコピー処理の先行している他の副ボリュームグループ540Bに追いつくまでの間、継続する。よって、この場合は、下記の式(1)が成立したときに、データの整合性が確保される。
反映可能ライト時刻≧拡張グループに登録された副ボリュームグループの到着済みライト時刻・・・(式1)
つまり、式1は、拡張グループ550について指示される反映可能ライト時刻が、拡張グループ550に登録された副ボリュームグループ540Bの最新の到着済みライト時刻と同じかそれよりも後であることを示す。
そこで、副記憶制御装置20は、式(1)の条件が満たされたか否かを監視し、式(1)の条件が満たされるまでの間、拡張グループ550に登録される副ボリューム530Bの状態を「Duplex Pending状態(形成コピー中)」として扱う。
即ち、副記憶制御装置20は、拡張グループ550へ登録される副ボリュームグループ540Bの副ボリューム530Bが、実際には形成コピーを完了している場合(Duplex状態)でも、式(1)の条件が満たされない期間は、その副ボリューム530Bの状態を「Duplex Pending状態」として扱い、式(1)の条件が満たされた場合に「Duplex状態」とする。これにより、上述の形成コピーに関する条件と合わせて、「Duplex Pending状態」の場合は整合性が確保されておらず、「Duplex状態」の場合は整合性が確保されていると知ることができる。リモートコピーのペアを形成する副記憶制御装置20及び正記憶制御装置10は、データの整合性が確保されているか否かの情報を、例えば、正ホスト31,副ホスト32,管理サーバ43等に提供することができる。
本実施例は上述のように構成されるため、複数のリモートコピーが非同期で実行されている場合でも、複数の副ボリューム530Bの記憶内容を所定の単一時刻(反映可能ライト時刻)の記憶内容に統一させることができる。これにより、それぞれ異なるリモートコピーが適用される複数のボリューム530B間の整合性を維持することができ、使い勝手及び信頼性を向上させることができる。
次に、リモートコピーを停止させる処理について説明する。リモートコピーを停止させる処理は、サスペンド処理とも呼ばれる。リモートコピーを行うシステムでは、リモートコピーの停止させたい場合が存在する。例えば、ストレージシステムの各機器をメンテナンスする場合や、ストレージシステムの構成を変更等する場合である。このような場合、リモートコピーを停止させる必要がある。
本実施例では、上述のように、各副記憶制御装置20が連携して、リモートコピー処理の実行を協調動作させている。従って、各副記憶制御装置20が連携してサスペンド処理を行う必要がある。
ここで、サスペンド処理には、コピー停止の指示元(サスペンド指示元)や、サスペンド処理に関する仕様(例えば、処理時間や処理結果の仕様)等によって、幾つかの種類が存在する。サスペンド指示元としては、正ホスト31と副ホスト32がある。サスペンド処理に関する仕様には、「フラッシュ」,「パージ」及び「スワップ」等がある。以下、各サスペンドの種類をそれぞれ説明する。
図16は、正ホスト31からフラッシュサスペンドを要求された場合のフラッシュサスペンド処理を示すフローチャートである。
正ホスト31の管理部311(以下、正ホスト31)は、サスペンド種別として「フラッシュ」を指定したサスペンド要求を、正記憶制御装置10に発行する(S101)。このサスペンド要求には、例えば、サスペンド種別及びサスペンド要求の発行時刻がそれぞれ含まれる。このサスペンド要求は、正ホスト31からデータ入出力用経路CN11を介して、サスペンド対象の拡張グループ550に対応する正ボリューム530Aを有する正記憶制御装置10に送信される。
正記憶制御装置10のマーカ作成部130は、マーカを作成して、サスペンド対象の副ボリュームグループ540Bを有する副記憶制御装置20に送信する(S102)。即ち、マーカ作成部130は、ボリュームグループ管理情報T21を参照して新たなシーケンシャル番号を1つ取得して、マーカとして使用されるライトデータ管理情報を生成する。マーカ作成部130は、マーカ属性ビットをオンに設定し、マーカ種別に「フラッシュサスペンド」を設定する。上述のように、マーカ属性ビットは、当該ライトデータがマーカであることを示すビットであり、通常のライトデータではオフに設定されるが、マーカの場合はオンに設定される。また、マーカ内のライト時刻には、正ホスト31がサスペンド要求を発行した時刻が記録される。
マーカ作成部130は、ライトデータ受領部110と同様に、前回の値を1だけ増加させた新たなシーケンシャル番号を取得してマーカに設定すると共に、この新たに取得されたシーケンシャル番号をボリュームグループ管理情報T11に記録する。マーカは、ライトデータ管理情報と同様に構成されて副記憶制御装置20に送信される。しかし、マーカは、リモートコピーの動作を制御するための制御情報であるから、副ボリューム530Bに書き込まれることはない。
正記憶制御装置10は、マーカの作成後に、サスペンド対象の正ボリューム530Aに関するライトデータ管理情報の新規生成を中止し(S103)、これ以後の正ホスト31による更新を、差分ビットマップT15によって管理する(S104)。即ち、正記憶制御装置10は、リモートコピーが再開されるまでの間、リモートコピーが停止される正ボリューム530Aへの新たなライト要求を差分ビットマップT15で管理する。
サスペンド対象の副ボリュームグループ540Bを有する副記憶制御装置20は、正記憶制御装置10からのマーカを受信すると(S105)、ライトデータ受領部210によってライトデータ管理情報T23を作成させる(S106)。マーカに基づいて作成されるライトデータ管理情報T23には、ライト時刻(サスペンド要求発行時刻)やマーカ属性ビット及びマーカ種別がそれぞれ記録される。
ライトデータ受領部210は、サスペンド対象の副ボリュームグループ540Bに関する到着済みライト時刻管理情報T24について、到着済みライト時刻を更新し、また、マーカ種別及びマーカ時刻をそれぞれ記録する(S107)。到着済みライト時刻は、フラッシュサスペンド要求に設定されたライト時刻で記録される。
上述のように、調停処理では、マスタ処理部230は、各副記憶制御装置20から最新の到着済みライト時刻を収集する(図12のS41〜S44)。サスペンド要求のマーカを受信した副記憶制御装置20は、マスタ処理部230から到着済みライト時刻の問い合わせを受けると、到着済みライト時刻管理情報T24に記録されているライト時刻に加えて、マーカ種別及びマーカ時刻をマスタ処理部230に通知する(S108)。
マスタ処理部230は、副記憶制御装置20から受信したライト時刻やマーカ種別等をマスタ時刻情報T28に記録する(S109)。マスタ処理部230は、上述のように、各副記憶制御装置20から収集した到着済みライト時刻を比較し、最古の到着済み時刻を反映可能ライト時刻として選択する。マスタ処理部230は、選択された反映可能ライト時刻及びマーカ種別を、各副記憶制御装置20にそれぞれ通知する(S110)。
各副記憶制御装置20は、マスタ処理部230から反映可能ライト時刻及びマーカ種別を受信すると、これらの反映可能ライト時刻及びマーカ種別を反映可能ライト時刻管理情報T25に記録する(S111)。
各副記憶制御装置20は、サスペンド対象の副ボリューム530Bに、反映可能ライト時刻までの各ライトデータを書き込み(S112)、反映可能ライト時刻よりも後のライトデータについては副ボリューム530Bに書き込まずに、差分ビットマップT29で管理する(S113)。即ち、副記憶制御装置20は、フラッシュサスペンドが要求された場合、反映可能ライト時刻までのライトデータを副ボリューム530Bに反映させるが、反映可能ライト時刻よりも後のライトデータについては、副ボリューム530Bに書き込まず、副ボリューム530Bの更新箇所を差分ビットマップT29で管理する。差分ビットマップを用いる差分管理方法は、例えば、特開2004−13367号公報に開示されている。
そして、各副記憶制御装置20は、サスペンド対象に指定された副ボリュームグループ540B内の各副ボリューム530Bについて、その状態を「サスペンド状態」に変更し(S114)、副ボリューム530Bの状態変更が完了した旨を正記憶制御装置10に通知する(S115)。この状態変更通知は、リモートコピー用経路CN12を介して、副記憶制御装置20から正記憶制御装置10に送信される。
正記憶制御装置10は、副記憶制御装置20から前記状態変更通知を受信すると、正ボリューム530Aの状態を「サスペンド状態」に変更する(S116)。正記憶制御装置10は、サスペンド処理が完了した旨を正ホスト31に通知する(S117)。これにより、正ホスト31は、リモートコピーが停止したことを確認する(S118)。
このようなフラッシュサスペンドを行うことにより、フラッシュサスペンド要求の発行時刻以前に更新された各ライトデータを、調停処理の対象となっている各副ボリューム530Bにそれぞれ反映させた後で、リモートコピーを停止させることができる。フラッシュサスペンド要求の発行後のライトデータは、差分管理される。従って、データの整合性を維持したままで、リモートコピーを停止させることができる。
例えば、正ホスト31が、ライト要求の発行を停止してから、フラッシュサスペンド要求を発行する場合、正ボリューム530Aの記憶内容と副ボリューム530Bの記憶内容とを一致させた状態でサスペンド処理を完了することができる。
図17は、副ホスト32からフラッシュサスペンド要求を発行する場合の処理を示すフローチャートである。副ホスト32は、常時は使用されず、正サイトPsに障害の生じた場合に使用されるスタンバイ系のホストである。この副ホスト32からもフラッシュサスペンドを要求することができる。
副ホスト32の管理部312は、データ入出力用経路CN11を介して、所定の副記憶制御装置20にフラッシュサスペンド要求を発行する(S121)。所定の副記憶制御装置20とは、サスペンド対象の拡張グループ550に属するいずれかの副ボリュームグループ540Bを有する副記憶制御装置20である。ここで、副ホスト32は、正ホスト31の使用する時刻情報(基準タイマ)を利用できないため、S121で発行されるフラッシュサスペンド要求には、サスペンド要求の発行時刻は含まれていない。
副ホスト32からのサスペンド要求を受信した副記憶制御装置20は、リモートコピー用経路CN12を介して、サスペンド要求を正記憶制御装置10に通知する(S122)。正記憶制御装置10のマーカ作成部130は、図16と共に述べた正ホスト31からのサスペンド要求に対する処理と同様にマーカを作成し、作成したマーカを副記憶制御装置20に通知する(S123)。但し、図16に示すマーカ作成ステップとは異なり、マーカに含まれるライト時刻には、最新ライト時刻管理情報T14に記録されているライト時刻が使用される。
以下、図16に示す処理と同様に、正記憶制御装置10は、新たなライトデータ管理情報の生成を中止し(S124)、以後の正ホスト31からの更新を差分ビットマップT15で管理する(S125)。そして、副ボリューム530Bが「サスペンド状態」に変更された旨を副記憶制御装置20から受信すると、正記憶制御装置10は、正ボリューム530Aを「サスペンド状態」に変更する(S126)。正記憶制御装置10は、副ホスト32に、サスペンド処理の完了を通知する(S127)。この通知により、副ホスト32は、サスペンド処理の完了を確認する(S128)。
このように、正ホスト31からフラッシュサスペンド要求を発行できない場合でも、正記憶制御装置10で管理されている最新のライト時刻を用いて、副ホスト32からフラッシュサスペンドを要求することができる。これにより、最新のライト時刻以前の各ライトデータを副ボリューム530Bに反映させてから、リモートコピーを停止させることができる。
図18は、パージサスペンド処理を示すフローチャートである。パージサスペンド処理とは、フラッシュサスペンド処理と同様に、整合性を保持してコピーを停止させる処理である。しかし、パージサスペンド処理では、サスペンド要求の発行以前に行われた正ボリューム530Aへの更新について、このライトデータの副ボリューム530Bへの更新を待たずしてコピー停止を完了させる点で、フラッシュサスペンドと異なる。
正ホスト31の管理部311は、サスペンド種別として「パージ」を指定したサスペンド要求を、データ入出力用経路CN11を介して、所定の正記憶制御装置10に発行する(S131)。ここで、所定の正記憶制御装置10とは、サスペンド対象の拡張グループ550に対応する正ボリュームグループ540Aを有する正記憶制御装置10のいずれかである。
このパージサスペンド要求を受信した正記憶制御装置10は、リモートコピー用経路CN12を介して、副記憶制御装置20に、パージサスペンド要求を受領した旨を通知する(S132)。
なお、副記憶制御装置20から正記憶制御装置10へのライトデータの転送要求(ライトデータのリード要求)に応じて、正記憶制御装置10がライトデータを副記憶制御装置20に転送する構成も考えられる。この場合、正記憶制御装置10が、副記憶制御装置20からの転送要求を拒絶することにより、パージサスペンド要求の受領を副記憶制御装置20に通知する構成でもよい。または、正記憶制御装置10から副記憶制御装置20への前記転送要求の戻り値を用いて、パージサスペンド要求の受領を副記憶制御装置20に通知する構成でもよい。
パージサスペンド要求の受領を副記憶制御装置20に通知すると、正記憶制御装置10は、正ボリュームグループ540Aに関する新たなライトデータ管理情報の生成を停止する(S133)。このライトデータ管理情報の生成停止は、リモートコピーが再開されるまで継続する。正記憶制御装置10は、これ以後に、正ホスト31から受領したライト要求について、正ボリューム530Aの更新箇所を差分ビットマップT15によって管理する(S134)。
パージサスペンド要求の受領が通知された副記憶制御装置20のライトデータ受領部210は、到着済みライト時刻管理情報T24のマーカ種別に「パージサスペンド」を設定し、また、到着済みライト時刻管理情報T24の到着済みライト時刻をマーカ時刻で更新する(S135)。
以後、上述したフラッシュサスペンド処理と同様のステップが実行される(S136〜S146)。即ち、マスタ処理部230は、到着済みライト時刻と共にマーカ種別及びマーカ時刻も副記憶制御装置20から収集し(S136,S137)、最も過去の到着済みライト時刻を反映可能ライト時刻として決定する。マスタ処理部230は、反映可能ライト時刻及びマーカ種別を各副記憶制御装置20に通知する(S138)。
各副記憶制御装置20は、反映可能ライト時刻管理情報T25を更新し(S139)、反映可能ライト時刻までの各ライトデータを副ボリューム530Bにそれぞれ反映させる(S140)。各副記憶制御装置20は、反映可能ライト時刻よりも後のライトデータについては、副ボリューム530Bに反映させず、差分ビットマップT29によって管理する(S141)。
そして、副記憶制御装置20は、副ボリューム530Bを「サスペンド状態」に変更し(S142)、この状態変更をリモートコピー用経路CN12を介して、正記憶制御装置10に通知する(S143)。
正記憶制御装置10は、副記憶制御装置20から副ボリューム530Bの状態変更が通知されると、正ボリューム530Aを「サスペンド状態」に変更し(S144)、正ホスト31にパージサスペンド処理の完了を報告する(S145)。これにより、正ホスト31は、パージサスペンド処理の完了を確認する(S146)。
このようなパージサスペンド処理を行うことにより、単一時刻(反映可能ライト時刻)までの各ライトデータを、拡張グループ550に属している各副ボリュームグループ540Bの副ボリューム530Bにそれぞれ反映させることができる。そして、前記単一時刻より後のライトデータは、副ボリューム530Bに反映せずに、コピー処理を停止させることができる。即ちデータの整合性を保持して、リモートコピーを停止させることができる。
なお、マスタ処理部230が、S138で、マーカ種別(パージサスペンド)及び反映可能ライト時刻を副記憶制御装置20に通知するまでの間、パージサスペンド要求受領の通知を受けた副ボリュームグループ540B以外の他の副ボリュームグループ540Bで、到着済みライト時刻が更新されてしまう可能性がある。
従って、マスタ処理部230が各副記憶制御装置20に反映可能ライト時刻をそれぞれ通知する際に、マスタ処理部230に障害等が発生して、一部の副記憶制御装置20に反映可能ライト時刻及びマーカ種別を通知できなかった場合、復旧後に調停処理を行うだけでは、統一された単一時刻でのコピー停止を実現できない可能性がある。
そこで、本実施例では、S132において、マスタ処理部230がパージサスペンドのマーカ種別を検出した時点で、マスタ処理部230は、調停処理対象の全副記憶制御装置20のライトデータ転送停止を指示する。この指示を受けた副記憶制御装置20は、ライトデータ転送を一旦停止する処理を行う。これにより、マスタ処理部230の障害によって、一部の副記憶制御装置20へ反映可能ライト時刻及びマーカ種別を通知できなかった場合でも、マスタ処理部230の復旧後に調停処理をするだけで、統一された単一時刻でリモートコピー処理を停止させることができる。
なお、上述のように、副記憶制御装置20から正記憶制御装置10にライトデータの転送を要求する構成の場合、副記憶制御装置20から正記憶制御装置へのライトデータ転送要求の発行を停止させることにより、正記憶制御装置10から副記憶制御装置20へのライトデータの転送を停止させることができる。
また、図18に示す処理では、パージサスペンド要求受領の通知を受けた副ボリュームグループ540Bであっても、マスタ処理部230から反映可能ライト時刻及びマーカ種別の通知を受けるまでは(S138)、反映処理の停止及び差分管理が行われない(S140,S141)。これに代えて、パージサスペンド要求受領の通知を正記憶制御装置10から受領した時点で(S132)、反映処理の停止及び差分管理を行うことにより、パージサスペンド処理を短縮することもできる。
図19は、副ホスト32からパージサスペンドを要求する場合の処理を示すフローチャートである。副ホスト32の管理部312は、サスペンド種別として「パージ」を指定したサスペンド要求を、データ入出力用経路CN11を介して、所定の副記憶制御装置20に通知する(S151)。所定の副記憶制御装置20とは、サスペンド対象の拡張グループ550に属する副ボリュームグループ540Bを有する副記憶制御装置20のいずれか1つである。
パージサスペンド要求を受信した副記憶制御装置20は、このサスペンド要求を、リモートコピー用経路CN12を介して、正記憶制御装置10に通知する(S152)。サスペンド要求の通知を受信した正記憶制御装置10は、副記憶制御装置20に、リモートコピー用経路CN12を介して、パージサスペンド要求の受領を通知する(S153)。
続いて、正記憶制御装置10は、正ボリュームグループ540Aへのライト要求に関するライトデータ管理情報の作成を停止し(S154)、これ以降に正ホスト31から受領したライト要求については、正ボリューム530Aの更新箇所を差分ビットマップT15で管理する(S155)。
以後の処理は、正ホスト31から発行されたパージサスペンド要求に関するステップと同様のステップが実行される。正記憶制御装置10は、副ボリューム530Bが「サスペンド状態」に変更された旨の通知を副記憶制御装置20から受信すると、正ボリューム530Aを「サスペンド状態」に変更する(S168)。正記憶制御装置10は、副ホスト32に、サスペンド処理が完了した旨を報告する(S169)。これにより、副ホスト32は、パージサスペンド処理が完了したことを確認する(S170)。
このように、副ホスト32から発行されるパージサスペンド要求の場合でも、単一時刻以前のライトデータを、拡張グループ550に属している各副ボリュームグループ540Bの各副ボリューム530Bにそれぞれ反映させて、前記単一時刻より後のライトデータを副ボリューム530Bに反映せずに、コピー処理を停止させることができる。即ち、データの整合性を保持して、リモートコピーを停止させることができる。
次に、副ホスト32からの指示に基づいて、スワップサスペンドを行わせる場合の処理を説明する。スワップサスペンド要求は、スタンバイ系の副ホスト32を使用する際に、副記憶制御装置20の副ボリューム530Bに格納されているデータを使用可能にするために発行される。即ち、障害等で停止した正サイトPsから副サイトSsに業務処理を受け継ぐ際に、副ホスト32はスワップサスペンド要求を発行する。
副ホスト32を使用する場合、通常の運用に使用される正ホスト31を使用できないことも考えられる。そこで、正ホスト31を使用せずにサスペンド処理を行わせる。また、正ホスト31の業務処理を副ホスト32に引き継がせるために、正記憶制御装置10が受領しているライトデータを、各副ボリューム530Bに全て反映させる。即ち、正ホスト31がライト要求の発行を停止している間に、後述のスワップサスペンド処理を行う場合は、サスペンド対象の拡張グループ550に対応する正ボリュームグループ540Aについて、正記憶制御装置10がそれまでに受領したライトデータを、副記憶制御装置20の副ボリュームグループ540Bの各副ボリューム530Bに全て反映させる。
スワップサスペンド処理としては、以下に述べる3つの種類を挙げることができる。そこで、第1のスワップサスペンド処理から第3のスワップサスペンド処理まで、順番にそれぞれ説明する。
図20は、第1のスワップサスペンド処理を示すフローチャートである。副ホスト32の管理部312は、所定の正ボリュームグループ540Aに関する最新のライト時刻を正記憶制御装置10からそれぞれ収集し、収集した各ライト時刻の中から最も新しいライト時刻(時間的に最も進んだライト時刻)を1つ取得する(S161)。
所定の正ボリュームグループ540Aとは、サスペンド対象の拡張グループ550にソースとして対応するボリュームグループ540Aである。また、副ホスト32は、複数の経路を介して、正記憶制御装置10から最新のライト時刻を収集できる。第1の収集経路として、副ホスト32は、副サイトSs内のデータ入出力用経路CN11と副記憶制御装置20及びリモートコピー用経路CN12を介して、各正記憶制御装置10から最新のライト時刻を収集できる。また、第2の収集経路として、副ホスト32は、管理用ネットワークCN14と正ホスト31及び正サイトPs内のデータ入出力用経路CN11を介して、正記憶制御装置10から最新のライト時刻を収集可能である。
副ホスト32は、所定の副記憶制御装置20に、スワップサスペンドを要求する(S162)。所定の副記憶制御装置20とは、サスペンド対象の拡張グループ550に属する副ボリュームグループ540Bを有するいずれか1つの副記憶制御装置20である。S162で発行されるスワップサスペンド要求には、S161で取得された最新のライト時刻が含まれており、サスペンド種別には「スワップ」が設定されている。このスワップサスペンド要求は、副サイトSs内のデータ入出力用経路CN11を介して、前記所定の副記憶制御装置20に送信される。
スワップサスペンド要求を受信した副記憶制御装置20は、リモートコピー用経路CN12を介して、スワップサスペンド要求を正記憶制御装置10に通知する(S163)。スワップサスペンド要求を受信した正記憶制御装置10のマーカ作成部130は、前記サスペンド要求に設定されている最新のライト時刻と、最新ライト時刻管理情報T14に記録されているライト時刻とを比較して、最新ライト時刻管理情報T14に記録されるライト時刻を更新させる(S164)。即ち、マーカ作成部130は、スワップサスペンド要求に設定されているライト時刻と、最新ライト時刻管理情報T14に記録されているライト時刻とのうち、いずれか新しい方のライト時刻を選択し、この選択したライト時刻で、最新ライト時刻管理情報T14のライト時刻を更新する。
そして、マーカ作成部130は、上述した副ホスト32から発行されたフラッシュサスペンド要求の場合の処理と同様にマーカを作成し、作成したマーカを副記憶制御装置20に送信する(S165)。即ち、マーカ作成部130は、S164で選択されたライト時刻をマーカに設定する。このマーカに設定されるマーカ種別は、「スワップサスペンド」である。
以後の処理は、上述の正ホスト31から発行されたフラッシュサスペンド要求に対する処理と同様である(S166〜S170)。即ち、正記憶制御装置10は、正ボリューム530Aに関するライトデータ管理情報の生成を停止し(S166)、差分ビットマップT15による差分管理を開始する(S167)。そして、正記憶制御装置10は、副ボリューム530Bが「サスペンド状態」に変更された旨の通知を副記憶制御装置20から受信すると、正ボリューム530Aを「サスペンド状態」に変更し(S168)、スワップサスペンドの完了を副ホスト32に通知する(S169)。これにより、副ホスト32は、スワップサスペンド処理の完了を確認する(S170)。
図21は、第2のスワップサスペンド処理を示すフローチャートである。副ホスト32の管理部312は、サスペンド種別として「スワップ」を指定したサスペンド要求を、所定の副記憶制御装置20に発行する(S181)。上記同様に、所定の副記憶制御装置20とは、サスペンド対象の拡張グループ550に属する副ボリュームグループ540Bを有する副記憶制御装置20のうちいずれか1つの副記憶制御装置である。また、副ホスト32は、正ホスト31が使用している時計を利用することができないため、スワップサスペンド要求には、その発行時刻が設定されない。
スワップサスペンド要求を受領した副記憶制御装置20は、サスペンド対象の副ボリュームグループ540Bに関する到着済みライト時刻管理情報T24内のマーカ種別に「スワップサスペンド要求受領」を設定する(S182)。
調停処理のために、マスタ処理部230が副記憶制御装置20に到着済みライト時刻を問い合わせた場合、スワップサスペンド要求を受領した副記憶制御装置20は、到着済みライト時刻とマーカ種別及びマーカ時刻を、マスタ処理部230にそれぞれ通知する(S183)。マスタ処理部230は、サスペンド対象の拡張グループ550に関係する各副記憶制御装置20に、スワップサスペンド要求をそれぞれ通知する(S184)。
マスタ処理部230からスワップサスペンド要求を通知された副記憶制御装置20は、正記憶制御装置10に、スワップサスペンド要求を通知する(S185)。スワップサスペンド要求を受信した正記憶制御装置10のマーカ作成部130は、上述の副ホスト32からのフラッシュサスペンド要求に対する処理と同様に、マーカを作成する。このマーカは、副記憶制御装置20に送信される(S186)。
即ち、マーカ作成部130は、最新ライト時刻管理情報T14に記録されているライト時刻をマーカに設定し、マーカ種別に「スワップサスペンド」を設定する。ここで、正記憶制御装置10は、マーカ作成時点では、正ボリュームグループ540Aに関するライトデータ管理情報の作成を停止させず、また、差分ビットマップT15による差分管理も行わない。
正記憶制御装置10からスワップサスペンドを要求するマーカを受信した副記憶制御装置20は(S187)、再びマスタ処理部230から到着済みライト時刻の問合せを受ける。副記憶制御装置20は、到着済みライト時刻、マーカ種別及びマーカ時刻を、マスタ処理部230に通知する(S188)。
マスタ処理部230は、副記憶制御装置20から受信した到着済みライト時刻とマーカ種別及びマーカ時刻を、マスタ時刻情報T28にそれぞれ記録する(S189)。マスタ処理部230は、サスペンド対象の拡張グループ550に属する全ての副ボリュームグループ540Bについて、マスタ時刻情報T28のマーカ種別に「スワップサスペンド」が設定され、かつ、マーカ時刻が設定されると、各副ボリュームグループ540Bのマーカ時刻を比較し、最も新しいマーカ時刻を1つ検出する(S190)。
マスタ処理部230は、マスタ時刻情報T28を用いて到着済みライト時刻を比較し、この中で最も過去の到着済みライト時刻を求める。ここで、求めた到着済みライト時刻よりもS190で検出された最新のマーカ時刻の方が、過去であるか、または同じである場合、マスタ処理部230は、前記検出されたマーカ時刻を反映可能ライト時刻として選択する(S191)。マスタ処理部230は、この反映可能ライト時刻及びマーカ種別(スワップサスペンド)を、各副記憶制御装置20に通知する(S192)。
以後の処理は、上述のフラッシュサスペンド要求の処理と同様である(S193〜S199)。即ち、反映可能ライト時刻及びマーカ種別の前記通知を受けた副記憶制御装置20は、反映可能ライト時刻管理情報T25の反映可能ライト時刻を更新し(S193)、反映可能ライト時刻までのライトデータを副ボリューム530Bに反映させる(S194)。
そして、副記憶制御装置20は、反映可能ライト時刻よりも後のライトデータについては、副ボリューム530Bに書き込まず、差分ビットマップT29によって管理する(S195)。そして、副記憶制御装置20は、副ボリューム530Bを「サスペンド状態(リード/ライト共に可能)」に変更する(S196)。
副記憶制御装置20は、副ボリューム530Bの状態変更を、リモートコピー用経路CN12を介して、正記憶制御装置10に通知する(S197)。この通知を受けた正記憶制御装置10は、正ボリュームグループ540Aに関するライトデータ管理情報の作成を停止し(S198)、これ以降に生じたライト要求については、差分ビットマップT15で管理する(S199)。
図22は、第3のスワップサスペンド処理を示すフローチャートである。
副ホスト32の管理部312は、サスペンド種別として「スワップ」を設定したサスペンド要求を、データ入出力用経路CN11を介して、サスペンド対象の拡張グループ550に属する副ボリュームグループ540Bを有する副記憶制御装置20のいずれか1つに発行する(S201)。但し、副ホスト32は、スワップサスペンド要求に、発行時刻を設定しない。
副ホスト32からのサスペンド要求を受領した副記憶制御装置20は、副ボリュームグループ540Bに関する到着済みライト時刻管理情報T24のマーカ種別に「スワップサスペンド要求受領」を設定する(S202)。副記憶制御装置20は、マスタ処理部230から到着済みライト時刻の問い合わせを受けた場合、到着済みライト時刻とマーカ種別及びマーカ時刻をマスタ処理部230に通知する(S203)。
マスタ処理部230は、サスペンド対象の拡張グループ550に関係する各副記憶制御装置20に、スワップサスペンド要求を通知する(S204)。このサスペンド要求を受信した副記憶制御装置20は、コピー元である正ボリュームグループ540Aについて、未転送のライトデータが存在しているか否かを、正記憶制御装置10に問い合わせる(S205)。この問合せは、定期的にまたは不定期に行うことができる。
副記憶制御装置20は、正ボリュームグループ540Aの未転送シーケンシャル番号等に基づいて未転送または未到着のライトデータが存在していないことを検出した時点で、副ボリュームグループ540Bについての到着済みライト時刻管理情報T24の到着済みライト時刻をマーカ時刻に記録し、マーカ種別に「スワップサスペンド」を設定する(S206)。
上記同様に、調停処理において、これらの到着済みライト時刻及びマーカ種別等は、マスタ処理部230に通知される(S207)。マスタ処理部230は、到着済みライト時刻を反映可能ライト時刻として選択し(S208)、反映可能ライト時刻及びマーカ種別を各副記憶制御装置20に通知する(S209)。
この通知を受けた副記憶制御装置20は、反映可能ライト時刻管理情報T25を更新し(S210)、前記同様の処理を行う(S211〜S214)。
即ち、副記憶制御装置20は、反映可能ライト時刻までのライトデータを副ボリューム530Bに順番に書込む(S211)。副記憶制御装置20は、反映可能ライト時刻より後のライトデータを副ボリューム530Bに書き込まず、差分ビットマップT29で更新箇所を管理する(S212)。
さらに、副記憶制御装置20は、副ボリューム530Bを「サスペンド状態(リード/ライト共に可能)」に変更し(S213)、この状態変更を正記憶制御装置10に通知する(S214)。
副ボリューム530Bの状態変更通知を受信した正記憶制御装置10は、正ボリュームグループ540Aについてのライト要求に対するライトデータ管理情報の作成を停止する(S215)。正記憶制御装置10は、ライトデータ管理情報の作成を停止した後に受領したライト要求については、正ボリューム530Aの更新箇所を、差分ビットマップT15で管理する(S216)。
上記のように処理することによって、サスペンド対象の拡張グループ550に対応する正ボリュームグループ540Aについて、正記憶制御装置10がそれまでに受領した全てのライトデータを、副ボリュームグループ540Bの副ボリューム530Bに全て反映させて、リモートコピー処理を停止させることができる。このサスペンド処理に、正ホスト31は使用されない。
なお、上述した各サスペンド処理では、副記憶制御装置20からマスタ処理部230へのマーカに関する情報の報告や、マスタ処理部230から副記憶制御装置20への通知は調停処理とと共に行うものとして述べた。しかし、これに限らず、マーカに関する報告やマスタ処理部230から副記憶制御装置20への通知を、調停処理とは別の独立した通信で行う構成でもよい。
また、上記の各サスペンド処理において、サスペンド要求のパラメータとして、拡張グループIDを明示的に指定することにより、サスペンド対象の拡張グループ550を指定することもできるし、または、拡張グループ550に属する副ボリュームグループ540Bまたは副ボリューム530Bのいずれかを指定することにより、これらが属する拡張グループ550に対してサスペンド処理が引き起こされる構成でもよい。
次に、図23は、障害等のサスペンド要因を自動的に検出してサスペンド処理を行う場合の処理を示すフローチャートである。
上述の各種サスペンド処理は、正ホスト31または副ホスト32のいずれかから発行されたサスペンド要求に基づいて、実行される。しかし、各ホスト31,32からの明示の指示に基づく場合以外に、他の要因で、サスペンド処理を行う必要もある。
例えば、リモートコピー用経路CN12等の障害により、リモートコピー処理を継続できない場合は、自動的にサスペンド処理を行う必要がある。また、上述した第3のスワップサスペンド処理において、未転送または未到着のライトデータが存在していないことを、一定時間(この時間は、ユーザが設定可能である)内に検出できなかった場合、やはり、自動的にリモートコピー処理を停止させる必要がある。
そこで、図23の処理では、サスペンド要因を検出した場合に、自動的にサスペンド処理を実行させる。まず、正記憶制御装置10または副記憶制御装置20のいずれかでサスペンド要因が検出される。正記憶制御装置10がサスペンド要因を検出した場合(S221:YES)、リモートコピー用経路CN12を介して、サスペンド要因の検出が副記憶制御装置20に通知される(S222)。
サスペンド要因を通知する方法は、正ホスト31から発行されたパージサスペンド要求についての処理におけるサスペンド要求受領の通知方法と同様である。サスペンド要因を検出した副記憶制御装置20、または、サスペンド要因の通知を受けた副記憶制御装置20は、到着済みライト時刻管理情報T24内のマーカ種別に「障害サスペンド」(または、スワップサスペンドの処理中であれば「スワップサスペンド」)を設定する。また、副記憶制御装置20は、到着済みライト時刻管理情報T24に記録されている到着済みライト時刻を、マーカ時刻に記録する(S223)。
以後の処理は、上述のパージサスペンド処理と同様である(S224〜S235)。即ち、マスタ処理部230は、到着済みライト時刻とマーカ種別及びマーカ時刻を副記憶制御装置20から収集する(S224,S225)。マスタ処理部230は、最も過去の到着済みライト時刻を反映可能ライト時刻として決定し、反映可能ライト時刻及びマーカ種別を各副記憶制御装置20にそれぞれ通知する(S226)。
副記憶制御装置20は、反映可能ライト時刻管理情報T25内の反映可能ライト時刻を更新する(S227)。そして、副記憶制御装置20は、反映可能ライト時刻までのライトデータを順番に副ボリューム530Bに書込む(S228)。副記憶制御装置20は、反映可能ライト時刻より後のライトデータを副ボリューム530Bに書き込まず、差分ビットマップT29で差分を管理する(S229)。
副記憶制御装置20は、副ボリューム530Bを「サスペンド状態」に変更する(S230)。但し、スワップサスペンドの場合は、副記憶制御装置20は、副ボリューム530Bを「サスペンド状態(リード/ライト共に可能)」に変更する。この副ボリューム530Bの状態変更は、正記憶制御装置10に通知される。(S231)。
正記憶制御装置10は、副ボリューム530Bの状態変更通知を受信した場合、正ボリューム530Aに関するライトデータ管理情報の作成を停止し(S232)、以後に発行されるライト要求を差分ビットマップT15で管理する(S233)。そして、正記憶制御装置10は、正ボリューム530Aを「サスペンド状態」に変更し(S234)、サスペンド処理の完了を外部に通知する(S235)。
上記の処理により、単一時刻以前に各副記憶制御装置20に到着している各ライトデータを、拡張グループ550に属している各副ボリュームグループ540Bの副ボリューム530Bにそれぞれ反映させて、前記単一時刻より後のライトデータを反映させずに、リモートコピー処理を停止させることができる。即ち、整合性を保持してサスペンドすることができる。
なお、サスペンド状態から回復させる場合、必要ならば、サスペンド要因を取り除き、各副ボリュームグループ540Bについてリモートコピーの再開を指示する。リモートコピー再開の指示により、形成コピー処理が行われ、前記副ボリュームグループ540Bに属している副ボリューム530Bの状態が回復する。
なお、上述した自動サスペンド処理では、拡張グループ550に属している全ての副ボリュームグループ540Bの副ボリューム530Bについて、リモートコピー処理を停止している。これに代えて、障害によりリモートコピー処理を継続できない副ボリュームグループ540Bまたは副ボリューム530Bについてのみ、リモートコピー処理を停止する構成でもよい。この場合、リモートコピー処理を継続可能な他の副ボリュームグループ540Bについては、リモートコピーを続行することも可能である。これは例えば、マスタ処理部230が、障害発生に係る副ボリュームグループ540Bについてのみ、マーカ種別の通知を行い、以降の調停処理の対象から、障害発生に係る副ボリュームグループ540Bを除外することにより実現可能である。このように処理することによって、正常な他の副ボリュームグループ540Bではリモートコピーを継続させることができ、差分ビットマップT29の使用量を削減することができる。この結果、リモートコピー処理を再開するときの形成コピーの量及び形成コピーに要する時間を削減できる。
また、上述の自動サスペンド処理では、マスタ処理部230と副記憶制御装置20との間の通知や指示において、マーカ種別を通知内容や指示内容として用いる。これに代えて、例えば「サスペンド処理指示」等の別種の通知や指示を用いてもよい。
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、各実施例を適宜組み合わせることができる。
また、正ホスト31に管理部311を、副ホスト32に管理部312を、それぞれ設ける場合を述べたが、これに限らず、正記憶制御装置10,副記憶制御装置20や管理端末41,42、管理サーバ43に管理部を設ける構成でもよい。
また、マスタ処理部230は、いずれか1つの副記憶制御装置20に設ける場合を説明したが、これに限らず、例えば、各ホスト31,32、正記憶制御装置10、管理端末42,管理サーバ43等に、調停処理を行うためのマスタ処理部を設けてもよい。さらに、各副記憶制御装置20にそれぞれマスタ処理部を予め設けておき、いずれか1つまたは複数のマスタ処理部を自動的にまたは手動操作で選択して起動させる構成でもよい。
また、ライト要求時に正ホスト31がライトデータに付与するライト時刻を用いて、反映の順序を制御する場合を述べたが、これに代えて、シーケンシャル番号のみで反映順序を制御することも可能である。例えば、各記憶制御装置10,20が、ライトデータやサスペンド要求を受領するたびに、抜けのない連続した番号を設定することにより、ライトデータ同士の先後関係を把握できる。番号は、正サイトPs及び副サイトSsにおいて、共通に使用される連続番号であればよい。
さらに、各記憶制御装置10,20は、それぞれディスクドライブ521を内蔵する場合を述べたが、これに限らず、外部の記憶資源を利用する構成でもよい。即ち、正記憶制御装置10,副記憶制御装置20の少なくともいずれか一方は、自分自身の筐体の外部に存在する記憶デバイスを、あたかも自分自身の内蔵記憶デバイスであるかのように利用することもできる。例えば、仮想的な中間デバイスを記憶制御装置10,20内に設け、この中間記憶デバイスに、外部の別の筐体内に設けられている論理ボリュームをマッピングすることにより、外部の記憶デバイスを自己の内蔵記憶デバイスであるかのようにして利用することができる。
本発明の全体概念を示す説明図である。 実施形態のストレージシステムの全体を示す説明図である。 ホスト及び記憶制御装置のハードウェア構成を示す説明図である。 ホスト及び各記憶制御装置のソフトウェア構成を示す説明図である。 複数の論理ボリュームをグループ化してリモートコピーを行う様子を模式的に示す説明図である。 ボリュームグループ管理情報及び相手方ボリューム情報の構成を示す説明図である。 ライトデータ管理情報及び最新ライト時刻管理情報の構成を示す説明図である。 拡張グループ管理情報及びマスタ情報の構成を示す説明図である。 到着済みライト時刻管理情報とマスタ時刻情報及び反映可能ライト時刻管理情報の構成を示す説明図である。 ライト要求の処理方法を示すフローチャートである。 リモートコピー処理(ライトデータ転送処理)を示すフローチャートである。 各副ボリュームの反映時期を制御するための調停処理を示すフローチャートである。 副ボリュームにライトデータを書き込んで反映させるための処理を示すフローチャートである。 調停処理の対象となる拡張グループにボリュームを登録するための処理を示すフローチャートである。 拡張グループからボリュームを削除するための処理を示すフローチャートである。 第2実施例に係るストレージシステムで実行されるフラッシュサスペンド処理を示すフローチャートである。 副ホストからの指示によってフラッシュサスペンド処理を実行させる場合のフローチャートである。 第3実施例に係るストレージシステムで実行されるパージサスペンド処理を示すフローチャートである。 副ホストからの指示によってパージサスペンド処理を実行させる場合のフローチャートである。 第4実施例に係るストレージシステムで実行される第1スワップサスペンド処理を示すフローチャートである。 第2スワップサスペンド処理を示すフローチャートである。 第3スワップサスペンド処理を示すフローチャートである。 障害等のサスペンド要因を検出した場合に自動的に実行されるサスペンド処理を示すフローチャートである。
符号の説明
1…正記憶制御装置、1A…第1ボリューム、1B…ライトデータ転送部、2…副記憶制御装置、2A…第2ボリューム、2B…ライトデータ記憶部、2C…更新部、2D…更新順序情報管理部、3…更新制御部、3A…更新順序情報収集部、3B…更新可能時点決定部、3C…更新指示部、D1…ライトデータ、D2…更新順序情報、H1…正ホスト、H2…副ホスト、10…正記憶制御装置、20…副記憶制御装置、31…正ホスト、32…副ホスト、41,42…管理端末、43…管理サーバ、CN11…データ入出力用経路、CN12…リモートコピー用経路、CN13…更新制御用経路、CN14…管理用ネットワーク、Ps…正サイト、Ss…副サイト、
110…ライトデータ受領部、120…ライトデータ転送部、130…マーカ作成部、210…ライトデータ受領部、220…ライトデータ反映部、230…マスタ処理部、311,312…管理部、321,322…オペレーティングシステム(OS)、331,332…アプリケーションプログラム、510…コントローラ、511…チャネルアダプタ(CHA)、512…ディスクアダプタ(DKA)、513…キャッシュメモリ、514…共有メモリ、515,516…接続部、517…サービスプロセッサ(SVP)、521…ディスクドライブ、530A…正ボリューム、530B…副ボリューム、531A,531B…ジャーナルボリューム、540…副ボリュームグループ、540A…正ボリュームグループ、540B…副ボリュームグループ、550…拡張グループ、T11…ボリュームグループ管理情報、T12…相手方ボリューム情報、T13…ライトデータ管理情報、T14…最新ライト時刻管理情報、T15…差分ビットマップ、T21…ボリュームグループ管理情報、T21…ボリュームグループ管理情報、T22…相手方ボリューム情報、T23…ライトデータ管理情報、T24…到着済みライト時刻管理情報、T25…反映可能ライト時刻管理情報、T26…マスタ情報、T27…拡張グループ管理情報、T28…マスタ時刻情報、T29…差分ビットマップ

Claims (19)

  1. 複数の記憶制御装置間でデータをコピーさせるストレージシステムであって、
    複数の第1記憶制御装置と、これら各第1記憶制御装置にそれぞれ接続される複数の第2記憶制御装置とを備え、
    前記各第1記憶制御装置は、
    上位装置により入出力されるデータを記憶するための第1論理ボリュームと、
    前記上位装置による前記第1論理ボリュームへのデータ更新を、更新データと該更新データの更新順序を指示するための更新順序情報とを対応付けて前記第2記憶制御装置に送信することにより通知する更新通知部と、
    をそれぞれ備えており、
    前記各第2記憶制御装置は、互いに接続されており、かつ、
    前記第1論理ボリュームに対応付けられ、前記第1論理ボリュームに記憶されるデータのコピーが記憶される第2論理ボリュームと、
    前記更新通知部から受信した前記更新データを記憶する更新データ記憶部と、
    前記更新通知部から受信した前記更新順序情報を管理する更新順序情報管理部と、
    前記更新順序情報に基づいて、前記更新データ記憶部に記憶された前記更新データを前記第2論理ボリュームに順番に書き込むことにより、前記第2論理ボリュームに記憶されるデータを更新させる更新部と、
    をそれぞれ備えており、
    さらに、所定の通知を受けた場合には、前記各更新順序情報管理部から前記各更新順序情報をそれぞれ収集して、これら収集された各更新順序情報に基づいて前記各第2論理ボリュームを更新可能な時点を決定し、この決定された更新可能時点を前記各更新部にそれぞれ通知することにより、前記各更新部によって前記各第2論理ボリュームに記憶されるデータを前記更新可能時点までそれぞれ更新させる更新制御部を備えているストレージシステム。
  2. 前記各更新部は、前記第1論理ボリュームにおける更新順序と同一の順序で、前記通知された更新可能時点まで、前記第2論理ボリュームに記憶されるデータを更新させる請求項1に記載のストレージシステム。
  3. 前記所定の通知は、複数の前記第2論理ボリュームからなるボリュームグループの登録指示である請求項1に記載のストレージシステム。
  4. 前記所定の通知は、サスペンド要因の検出通知である請求項1に記載のストレージシステム。
  5. 前記所定の通知は、サスペンド要因の検出通知であり、
    前記更新制御部は、前記サスペンド要因の検出通知を受けた場合に、前記各更新順序情報管理部からそれぞれ収集される前記各更新順序情報に基づいて前記各第2論理ボリュームを更新可能な時点を決定し、この決定された更新可能時点を前記各更新部にそれぞれ通知することにより、前記各更新部によって前記各第2論理ボリュームに記憶されるデータを前記更新可能時点までそれぞれ更新させ、
    前記各第2記憶制御装置は、前記各第2論理ボリュームのうち前記サスペンド要因の検出通知に関わる第2論理ボリュームについて、前記第1論理ボリュームのデータのコピーを記憶させるコピー処理を停止させる請求項1に記載のストレージシステム。
  6. 前記サスペンド要因は、障害が検出された場合である請求項4または請求項5のいずれかに記載のストレージシステム。
  7. 前記各第1記憶制御装置内では、1つまたは複数の前記第1論理ボリュームによって第1ボリュームグループがそれぞれ形成されており、
    前記各第2記憶制御装置内では、1つまたは複数の前記第2論理ボリュームによって第2ボリュームグループがそれぞれ形成されており、
    前記各第1ボリュームグループと前記各第2ボリュームグループとが対応付けられており、
    前記更新制御部は、前記第2ボリュームグループ毎に前記更新可能時点をそれぞれ決定し、この決定された更新可能時点を前記第2ボリュームグループに関する前記各更新部にそれぞれ通知する請求項1に記載のストレージシステム。
  8. 前記複数の第2ボリュームグループから少なくとも1つ以上の拡張ボリュームグループが形成されており、
    前記更新制御部は、前記拡張グループ毎に前記更新可能時点を決定し、この決定された更新可能時点を前記拡張グループに属する前記各第2ボリュームグループにそれぞれ通知する請求項7に記載のストレージシステム。
  9. 前記更新制御部は、前記第2論理ボリュームを少なくとも1つ以上含むボリュームグループの形成が指示された場合に、このボリュームグループについて前記更新可能時点を決定し、この決定された更新可能時点を前記ボリュームグループに属する前記第2論理ボリュームに関する前記更新部にそれぞれ通知する請求項1に記載のストレージシステム。
  10. 前記更新制御部は、前記各第2記憶制御装置に受信されて前記各更新順序情報管理部によりそれぞれ管理されている最新の前記各更新順序情報のうち、最も古い前記更新順序情報に基づいて、前記更新可能時点を決定する請求項1に記載のストレージシステム。
  11. 前記更新順序情報には、前記上位装置による更新要求の発行時刻が含まれている請求項1に記載のストレージシステム。
  12. 前記更新順序情報には、前記上位装置による更新要求の発行時刻及び前記更新要求の発行順序が含まれている請求項1に記載のストレージシステム。
  13. 前記更新制御部は、サスペンド要因が検出された場合に前記更新可能時点を決定して、この決定された更新可能時点及び更新停止の要求を前記各更新部にそれぞれ通知し、
    前記各更新部は、前記各第2論理ボリュームに記憶されるデータを前記更新可能時点までそれぞれ更新させた後、前記各第2論理ボリュームへの更新を停止させる請求項1に記載のストレージシステム。
  14. 前記各第1記憶制御装置から前記各第2記憶制御装置に前記更新データ及び前記更新順序情報を転送することができない障害の発生が検出された場合に、前記サスペンド要因の検出であると判断される請求項13に記載のストレージシステム。
  15. 前記更新制御部は、前記各第2論理ボリュームのうち前記障害に係る所定の第2論理ボリュームについてのみ、前記更新可能時点を決定して、この決定された更新可能時点及び更新停止の要求を前記所定の第2論理ボリュームに係る前記更新部に通知する請求項14に記載のストレージシステム。
  16. 前記更新制御部は、前記各第2記憶制御装置の少なくともいずれか1つに設けられている請求項1に記載のストレージシステム。
  17. 複数の第1記憶制御装置と該各第1記憶制御装置にそれぞれ接続される複数の第2記憶制御装置とを備えたストレージシステムにおいて、前記各第1記憶制御装置から前記各第2記憶制御装置へデータをそれぞれ転送してコピーさせるリモートコピー制御方法であって、
    前記各第1記憶制御装置がそれぞれ備える第1論理ボリュームと前記各第2記憶制御装置がそれぞれ備える第2論理ボリュームとを対応付けることにより、リモートコピーのペアを形成するステップと、
    上位装置から前記第1論理ボリュームに対する更新要求を受信するステップと、
    前記更新要求に係る更新データを前記第1論理ボリュームに書き込んで、前記第1論理ボリュームに記憶されるデータを更新させるステップと、
    前記更新データと該更新データの更新順序を指示するための更新順序情報とを対応付けて、前記各第1記憶制御装置から前記各第2記憶制御装置に転送させるステップと、
    前記更新順序情報に基づいて、前記第2論理ボリュームに前記更新データを順番に書き込み、前記第2論理ボリュームに記憶されるデータを更新させるステップと、
    前記各第2記憶制御装置から前記各更新順序情報をそれぞれ収集するステップと、
    所定の通知を受けた場合に、前記収集された各更新順序情報に基づいて、前記各第2論理ボリュームを更新可能な時点を決定するステップと、
    前記決定された更新可能時点を前記各第2記憶制御装置にそれぞれ通知し、前記各第2論理ボリュームに記憶されているデータを前記更新可能時点までそれぞれ更新させる同期ステップと、
    を実行するストレージシステムのリモートコピー制御方法。
  18. さらに、前記各第1記憶制御装置から前記各第2記憶制御装置への前記更新データ及び前記更新順序情報を転送することができない障害が検出された場合に、前記各更新順序情報に基づいて前記更新可能時点を決定し、この決定された更新可能時点及びリモートコピーの停止要求を前記各第2記憶制御装置にそれぞれ通知し、前記各第2論理ボリュームに記憶されるデータを前記更新可能時点までそれぞれ更新させてから、前記各第1論理ボリュームから前記各第2論理ボリュームへのリモートコピー処理を停止させるステップを実行する請求項17に記載のストレージシステムのリモートコピー制御方法。
  19. 複数の記憶制御装置間でデータをコピーさせるストレージシステムであって、
    第1サイト及び第2サイトを備え、
    前記第1サイトは、
    それぞれ複数の第1論理ボリュームを有する複数の第1記憶制御装置と、
    前記各第1記憶制御装置に接続され、前記各第1論理ボリュームにデータを入出力する上位装置と、を備えており、
    前記第2サイトは、
    それぞれ複数の第2論理ボリュームを有し、互いに接続された複数の第2記憶制御装置を備えており、
    前記各第1論理ボリュームは少なくとも1つ以上の第1ボリュームグループを構成しており、前記各第2論理ボリュームは少なくとも1つ以上の第2ボリュームグループを構成しており、前記第1ボリュームグループに属する前記各第1論理ボリュームと前記第2ボリュームグループに属する前記第2論理ボリュームとが、リモートコピーのペアとして対応付けられており、
    前記各第1記憶制御装置は、
    前記上位装置による前記各第1論理ボリュームへのデータ更新を、更新データと該更新データの更新順序を指示するための更新順序情報とを対応付けて前記各第2記憶制御装置に送信することにより通知する更新通知部と、
    前記リモートコピーの作動を停止させるためのサスペンド要求を前記各第2記憶制御装置に通知するサスペンド要求通知部と、
    をそれぞれ備えており、
    前記各第2記憶制御装置は、
    前記更新通知部から受信した前記更新データを記憶する更新データ記憶部と、
    前記更新通知部から受信した前記更新順序情報を管理する更新順序情報管理部と、
    前記更新順序情報に基づいて、前記更新データ記憶部に記憶された前記更新データを前記第2論理ボリュームに順番に書き込むことにより、前記第2論理ボリュームに記憶されるデータを更新させる更新部と、
    をそれぞれ備えており、
    さらに、前記各第2記憶制御装置のうち所定の第2記憶制御装置は、前記各第2記憶制御装置による前記各第2論理ボリュームの更新処理を同期させるための更新制御部を備えており、
    前記更新制御部は、所定の通知を受けた場合に、前記各更新順序情報管理部から前記各更新順序情報をそれぞれ収集して、これら収集された各更新順序情報に基づいて前記各第2論理ボリュームを更新可能な時点を決定し、この決定された更新可能時点を前記各更新部にそれぞれ通知することにより、前記各更新部によって前記各第2論理ボリュームに記憶されるデータを前記更新可能時点までそれぞれ更新させるストレージシステム。
JP2006087983A 2004-09-10 2006-03-28 ストレージシステム及びストレージシステムのリモートコピー制御方法 Expired - Fee Related JP4915775B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2006087983A JP4915775B2 (ja) 2006-03-28 2006-03-28 ストレージシステム及びストレージシステムのリモートコピー制御方法
US11/546,782 US7330861B2 (en) 2004-09-10 2006-10-11 Remote copying system and method of controlling remote copying
US11/603,088 US7945750B2 (en) 2006-03-28 2006-11-22 Storage system and remote copy control method for storage system
EP07251248A EP1840747A1 (en) 2006-03-28 2007-03-23 Remote copying system and method of controlling remote copying
CNB2007100915477A CN100559351C (zh) 2006-03-28 2007-03-27 远程复制系统以及远程复制控制方法
US13/109,386 US8200928B2 (en) 2006-03-28 2011-05-17 Storage system and remote copy control method for storage system
US13/489,624 US8347053B2 (en) 2006-03-28 2012-06-06 Storage system and remote copy control method for storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006087983A JP4915775B2 (ja) 2006-03-28 2006-03-28 ストレージシステム及びストレージシステムのリモートコピー制御方法

Publications (2)

Publication Number Publication Date
JP2007264946A true JP2007264946A (ja) 2007-10-11
JP4915775B2 JP4915775B2 (ja) 2012-04-11

Family

ID=38560819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006087983A Expired - Fee Related JP4915775B2 (ja) 2004-09-10 2006-03-28 ストレージシステム及びストレージシステムのリモートコピー制御方法

Country Status (3)

Country Link
US (3) US7945750B2 (ja)
JP (1) JP4915775B2 (ja)
CN (1) CN100559351C (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026940A (ja) * 2008-07-23 2010-02-04 Hitachi Ltd リモートコピーシステム、及びリモートサイトの省電力化方法
JP2010102463A (ja) * 2008-10-23 2010-05-06 Hitachi Ltd ジャーナルを利用したリモートコピーを行う計算機システム
US9075772B2 (en) 2010-06-18 2015-07-07 Fujitsu Limited Storage apparatus, controller and storage apparatus control method
WO2015173859A1 (ja) * 2014-05-12 2015-11-19 株式会社日立製作所 ストレージシステム及びその制御方法
WO2016194096A1 (ja) * 2015-06-01 2016-12-08 株式会社日立製作所 計算機システム及び計算機システムの管理方法
US10459813B2 (en) 2016-11-01 2019-10-29 Fujitsu Limited System and device for synchronizing data in a plurality of devices
JP2021182309A (ja) * 2020-05-20 2021-11-25 株式会社日立製作所 クラウドサーバ、ストレージシステム、及び計算機システム
JP2022049408A (ja) * 2020-09-16 2022-03-29 株式会社富士通エフサス 情報処理システム、情報処理方法および情報処理プログラム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070234118A1 (en) * 2006-03-30 2007-10-04 Sardella Steven D Managing communications paths
US9223787B2 (en) * 2008-09-26 2015-12-29 Apple Inc. Systems and methods for sideband communication between device and host to minimize file corruption
JP4990322B2 (ja) * 2009-05-13 2012-08-01 株式会社日立製作所 データ移動管理装置及び情報処理システム
US10496608B2 (en) * 2009-10-28 2019-12-03 Sandisk Il Ltd. Synchronizing changes in a file system which are initiated by a storage device and a host device
US8825603B2 (en) * 2010-05-19 2014-09-02 International Business Machines Corporation Ordering volumes and tracks for data transfer based on usage characteristics
US8266102B2 (en) 2010-05-26 2012-09-11 International Business Machines Corporation Synchronization of sequential access storage components with backup catalog
EP2624142B1 (en) * 2010-09-29 2020-03-18 Fujitsu Limited Relay system, relay device, and control method and control program for relay device
JP5703860B2 (ja) * 2011-03-09 2015-04-22 日本電気株式会社 フォールトトレラントシステム、メモリ制御方法、及びプログラム
WO2013046273A1 (en) * 2011-09-29 2013-04-04 Hitachi, Ltd. Reservation of volumes having a copy pair relationship
JP5853819B2 (ja) * 2012-03-29 2016-02-09 富士通株式会社 制御プログラム、制御方法、記憶制御装置および情報処理システム
US9230000B1 (en) * 2012-06-04 2016-01-05 Google Inc. Pipelining Paxos state machines
US9075529B2 (en) * 2013-01-04 2015-07-07 International Business Machines Corporation Cloud based data migration and replication
US9063997B2 (en) 2013-02-12 2015-06-23 International Business Machines Corporation Asynchronous pausing of the formation of consistency groups
KR101567134B1 (ko) * 2013-03-29 2015-11-09 이화여자대학교 산학협력단 비휘발성 메모리에 기반하여 저널링 기능을 통합한 버퍼 캐시 장치, 저널링 파일 시스템 및 저널링 방법
GB2527828A (en) * 2014-07-03 2016-01-06 Ibm Copy-on-read process in disaster recovery
WO2016024994A1 (en) * 2014-08-15 2016-02-18 Hitachi, Ltd. Method and apparatus to virtualize remote copy pair in three data center configuration
US9575856B2 (en) 2014-08-29 2017-02-21 Vmware, Inc. Preventing migration of a virtual machine from affecting disaster recovery of replica
WO2016153497A1 (en) * 2015-03-25 2016-09-29 Hitachi, Ltd. Method and apparatus for remote copy between enterprise storage and commodity hardware based software storage
US10057365B1 (en) * 2015-06-24 2018-08-21 Amazon Technologies, Inc. Asynchronous provision of resource status data
US10275509B2 (en) * 2015-10-22 2019-04-30 Maxta, Inc. Replica checkpointing without quiescing
US10552389B2 (en) * 2017-04-28 2020-02-04 Oath Inc. Object and sequence number management
US11249671B2 (en) * 2017-04-28 2022-02-15 Netapp, Inc. Methods for improved data replication across hybrid cloud volumes using data tagging and devices thereof
US11842224B1 (en) 2017-09-01 2023-12-12 Amazon Technologies, Inc. Synchronous and asynchronous responses to data requests from remote devices
US11086559B2 (en) * 2017-09-05 2021-08-10 International Business Machines Corporation Cloud based store and restore with copy services
US10489081B2 (en) * 2017-12-15 2019-11-26 International Business Machines Corporation Reducing coordination times in asynchronous data replication environments
US10802931B1 (en) * 2018-11-21 2020-10-13 Amazon Technologies, Inc. Management of shadowing for devices
CN109753389A (zh) * 2019-01-03 2019-05-14 Oppo广东移动通信有限公司 保证数据一致性的方法、装置、存储介质及服务器
US11055017B1 (en) 2020-01-27 2021-07-06 International Business Machines Corporation Throttling a point-in-time snapshot copy operation within a data consistency application
US11853585B2 (en) 2020-01-27 2023-12-26 International Business Machines Corporation Performing a point-in-time snapshot copy operation within a data consistency application
CN111522880B (zh) * 2020-04-24 2023-08-08 桂林电子科技大学 一种基于mysql数据库集群的提升数据读写性能的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189570A (ja) * 2000-12-20 2002-07-05 Hitachi Ltd 記憶システムの二重化方法および記憶システム
JP2006039976A (ja) * 2004-07-28 2006-02-09 Hitachi Ltd リモートコピーシステム

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2829091B2 (ja) * 1990-04-19 1998-11-25 株式会社東芝 データ処理システム
US5544347A (en) * 1990-09-24 1996-08-06 Emc Corporation Data storage system controlled remote data mirroring with respectively maintained data indices
GB2264798A (en) * 1992-03-04 1993-09-08 Hitachi Ltd High speed access control
JPH06149485A (ja) 1992-11-06 1994-05-27 Fujitsu Ltd データ完結性保証処理方法
KR0128271B1 (ko) 1994-02-22 1998-04-15 윌리암 티. 엘리스 재해회복을 위한 일관성 그룹 형성방법 및 레코드갱싱의 섀도잉 방법, 주시스템, 원격데이타 섀도잉 시스템과 비동기 원격데이타 복제 시스템
US5615329A (en) 1994-02-22 1997-03-25 International Business Machines Corporation Remote data duplexing
JP2894676B2 (ja) 1994-03-21 1999-05-24 インターナショナル・ビジネス・マシーンズ・コーポレイション 非同期式遠隔コピー・システム及び非同期式遠隔コピー方法
US5623599A (en) * 1994-07-29 1997-04-22 International Business Machines Corporation Method and apparatus for processing a synchronizing marker for an asynchronous remote data copy
US6092066A (en) * 1996-05-31 2000-07-18 Emc Corporation Method and apparatus for independent operation of a remote data facility
US5996054A (en) * 1996-09-12 1999-11-30 Veritas Software Corp. Efficient virtualized mapping space for log device data storage system
US6665781B2 (en) * 2000-10-17 2003-12-16 Hitachi, Ltd. Method and apparatus for data duplexing in storage unit system
JP3414218B2 (ja) 1997-09-12 2003-06-09 株式会社日立製作所 記憶制御装置
US6157991A (en) * 1998-04-01 2000-12-05 Emc Corporation Method and apparatus for asynchronously updating a mirror of a source device
US6260124B1 (en) * 1998-08-13 2001-07-10 International Business Machines Corporation System and method for dynamically resynchronizing backup data
US6353878B1 (en) * 1998-08-13 2002-03-05 Emc Corporation Remote control of backup media in a secondary storage subsystem through access to a primary storage subsystem
US6366987B1 (en) * 1998-08-13 2002-04-02 Emc Corporation Computer data storage physical backup and logical restore
JP4689137B2 (ja) * 2001-08-08 2011-05-25 株式会社日立製作所 リモートコピー制御方法、及びストレージシステム
JP2000137638A (ja) * 1998-10-29 2000-05-16 Hitachi Ltd 情報記憶システム
US6209002B1 (en) * 1999-02-17 2001-03-27 Emc Corporation Method and apparatus for cascading data through redundant data storage units
US6513097B1 (en) * 1999-03-03 2003-01-28 International Business Machines Corporation Method and system for maintaining information about modified data in cache in a storage system for use during a system failure
US6493796B1 (en) 1999-09-01 2002-12-10 Emc Corporation Method and apparatus for maintaining consistency of data stored in a group of mirroring devices
US6463501B1 (en) * 1999-10-21 2002-10-08 International Business Machines Corporation Method, system and program for maintaining data consistency among updates across groups of storage areas using update times
US6401178B1 (en) * 1999-12-23 2002-06-04 Emc Corporatiion Data processing method and apparatus for enabling independent access to replicated data
JP4115060B2 (ja) * 2000-02-02 2008-07-09 株式会社日立製作所 情報処理システムのデータ復旧方法及びディスクサブシステム
JP4044717B2 (ja) * 2000-03-31 2008-02-06 株式会社日立製作所 記憶サブシステムのデータ二重化方法及びデータ二重化システム
US6718447B2 (en) * 2001-06-28 2004-04-06 Hewlett-Packard Development Company, L.P. Method and system for providing logically consistent logical unit backup snapshots within one or more data storage devices
US20030050930A1 (en) * 2001-09-12 2003-03-13 Malcolm Mosher Method and apparatus for lockstep data replication
JP2003167683A (ja) * 2001-11-30 2003-06-13 Hitachi Ltd 情報記憶システム及びその制御方法
US7139932B2 (en) * 2002-01-03 2006-11-21 Hitachi, Ltd. Data synchronization of multiple remote storage after remote copy suspension
JP4170056B2 (ja) * 2002-03-29 2008-10-22 株式会社日立製作所 複製ボリューム間でのバックアップ・リストア管理方法およびこの方法に用いる記憶制御装置
JP2004013367A (ja) 2002-06-05 2004-01-15 Hitachi Ltd データ記憶サブシステム
US7103727B2 (en) * 2002-07-30 2006-09-05 Hitachi, Ltd. Storage system for multi-site remote copy
US7089448B2 (en) * 2002-09-18 2006-08-08 Netezza Corporation Disk mirror architecture for database appliance
EP1447774B1 (en) 2003-02-13 2018-03-07 ATI Technologies Inc. Method and apparatus for sampling on a non-power-of-two pixel grid
US7051176B2 (en) * 2003-03-25 2006-05-23 Emc Corporation Reading data provided to a remote storage device
US6898685B2 (en) * 2003-03-25 2005-05-24 Emc Corporation Ordering data writes from a local storage device to a remote storage device
US7114033B2 (en) * 2003-03-25 2006-09-26 Emc Corporation Handling data writes copied from a remote data storage device
US7380082B2 (en) * 2003-03-25 2008-05-27 Emc Corporation Reading virtual ordered writes at local storage device
JP4060235B2 (ja) 2003-05-22 2008-03-12 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の制御方法
US20040250030A1 (en) * 2003-06-06 2004-12-09 Minwen Ji Data redundancy using portal and host computer
US7165187B2 (en) * 2003-06-06 2007-01-16 Hewlett-Packard Development Company, L.P. Batch based distributed data redundancy
US7287137B2 (en) * 2003-06-06 2007-10-23 Hewlett-Packard Development Company, L.P. Batched, asynchronous data redundancy technique
US7120825B2 (en) * 2003-06-06 2006-10-10 Hewlett-Packard Development Company, L.P. Adaptive batch sizing for asynchronous data redundancy
JP4124348B2 (ja) * 2003-06-27 2008-07-23 株式会社日立製作所 記憶システム
US8214588B2 (en) * 2003-11-05 2012-07-03 International Business Machines Corporation Parallel asynchronous order-preserving transaction processing
JP4419460B2 (ja) * 2003-08-04 2010-02-24 株式会社日立製作所 リモートコピーシステム
US7133986B2 (en) 2003-09-29 2006-11-07 International Business Machines Corporation Method, system, and program for forming a consistency group
US20050091415A1 (en) * 2003-09-30 2005-04-28 Robert Armitano Technique for identification of information based on protocol markers
US7228456B2 (en) * 2003-12-01 2007-06-05 Emc Corporation Data recovery for virtual ordered writes for multiple storage devices
US7054883B2 (en) * 2003-12-01 2006-05-30 Emc Corporation Virtual ordered writes for multiple storage devices
JP4425728B2 (ja) 2003-12-03 2010-03-03 株式会社日立製作所 リモートコピーシステム
US7085788B2 (en) 2003-12-03 2006-08-01 Hitachi, Ltd. Remote copy system configured to receive both a write request including a write time and a write request not including a write time.
JP4434857B2 (ja) 2003-12-04 2010-03-17 株式会社日立製作所 リモートコピーシステム及びシステム
US7383483B2 (en) * 2003-12-11 2008-06-03 International Business Machines Corporation Data transfer error checking
US20050188454A1 (en) 2004-02-27 2005-09-01 Perfecteau Llp Flush Valve Toilet
US7228396B2 (en) * 2004-03-08 2007-06-05 Emc Corporation Switching between virtual ordered writes mode and synchronous or semi-synchronous RDF transfer mode
JP4377790B2 (ja) 2004-09-30 2009-12-02 株式会社日立製作所 リモートコピーシステムおよびリモートコピー方法
JP4728031B2 (ja) * 2005-04-15 2011-07-20 株式会社日立製作所 リモートコピーペアの移行を行うシステム
JP4916420B2 (ja) * 2007-11-16 2012-04-11 株式会社日立製作所 ストレージシステム及びリモートコピー制御方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189570A (ja) * 2000-12-20 2002-07-05 Hitachi Ltd 記憶システムの二重化方法および記憶システム
JP2006039976A (ja) * 2004-07-28 2006-02-09 Hitachi Ltd リモートコピーシステム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026940A (ja) * 2008-07-23 2010-02-04 Hitachi Ltd リモートコピーシステム、及びリモートサイトの省電力化方法
JP2010102463A (ja) * 2008-10-23 2010-05-06 Hitachi Ltd ジャーナルを利用したリモートコピーを行う計算機システム
US9075772B2 (en) 2010-06-18 2015-07-07 Fujitsu Limited Storage apparatus, controller and storage apparatus control method
WO2015173859A1 (ja) * 2014-05-12 2015-11-19 株式会社日立製作所 ストレージシステム及びその制御方法
US9563383B2 (en) 2014-05-12 2017-02-07 Hitachi, Ltd. Storage system with primary and secondary data storage groups and control method thereof
WO2016194096A1 (ja) * 2015-06-01 2016-12-08 株式会社日立製作所 計算機システム及び計算機システムの管理方法
US10459813B2 (en) 2016-11-01 2019-10-29 Fujitsu Limited System and device for synchronizing data in a plurality of devices
JP2021182309A (ja) * 2020-05-20 2021-11-25 株式会社日立製作所 クラウドサーバ、ストレージシステム、及び計算機システム
JP7118108B2 (ja) 2020-05-20 2022-08-15 株式会社日立製作所 クラウドサーバ、ストレージシステム、及び計算機システム
JP2022049408A (ja) * 2020-09-16 2022-03-29 株式会社富士通エフサス 情報処理システム、情報処理方法および情報処理プログラム
JP7220689B2 (ja) 2020-09-16 2023-02-10 株式会社富士通エフサス 情報処理システム、情報処理方法および情報処理プログラム

Also Published As

Publication number Publication date
JP4915775B2 (ja) 2012-04-11
US20070233981A1 (en) 2007-10-04
US8200928B2 (en) 2012-06-12
CN100559351C (zh) 2009-11-11
US8347053B2 (en) 2013-01-01
CN101046759A (zh) 2007-10-03
US20120246429A1 (en) 2012-09-27
US7945750B2 (en) 2011-05-17
US20110219189A1 (en) 2011-09-08

Similar Documents

Publication Publication Date Title
JP4915775B2 (ja) ストレージシステム及びストレージシステムのリモートコピー制御方法
JP4477950B2 (ja) リモートコピーシステム及び記憶装置システム
JP4651913B2 (ja) 記憶装置システム
US7421550B2 (en) Storage system and storage system management method
US7865767B2 (en) Storage system and method for copying data to plurality of sites
US8452933B2 (en) Storage system and remote copy recovery method
CN101755257B (zh) 管理在不同的网络上将写入从首要存储器拷贝到次要存储器
JP5286212B2 (ja) ストレージクラスタ環境でのリモートコピー制御方法及びシステム
CN105739924A (zh) 基于缓存集群的缓存方法和系统
JPH07239799A (ja) 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム
US11573737B2 (en) Method and apparatus for performing disk management of all flash array server
JP6136629B2 (ja) ストレージ制御装置,ストレージシステム,および制御プログラム
US11579983B2 (en) Snapshot performance optimizations
US11307944B2 (en) Automated failover for asynchronous remote copy
JP6230707B2 (ja) ストレージシステム
JP4898609B2 (ja) ストレージ装置、データ回復方法及び計算機システム
US11256586B2 (en) Remote copy system and remote copy management method
JP2006155658A (ja) 記憶装置システム
JP2019191801A (ja) ストレージシステムおよび制御装置
JP4685079B2 (ja) 記憶装置システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120118

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4915775

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees