JP2021033782A

JP2021033782A - リモートコピーシステム

Info

Publication number: JP2021033782A
Application number: JP2019154963A
Authority: JP
Inventors: 里山　愛; Ai Satoyama; 愛里山; 彰出口; Akira Deguchi
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-08-27
Filing date: 2019-08-27
Publication date: 2021-03-01
Also published as: CN112445652A; US11308122B2; US20210064638A1; CN112445652B

Abstract

【課題】正サイトに障害が発生した際に早期にかつ確実に副サイトにおいて運用環境を再現することを可能にする。【解決手段】リモートコピーシステムの第一のストレージシステム２００Ａはデータボリューム１５０Ａ、ジャーナルボリューム１６０Ａ及びストレージコントローラ１０１Ａを有し、ストレージコントローラ１０１Ａは、第一のサーバシステム２０１Ａからオペレーションを受信したら、このオペレーションに基づき、オペレーションによる更新内容をジャーナルボリューム１６０Ａに格納する作業、またはオペレーションを受信したらこのオペレーションを実行する作業のいずれかを実行する。【選択図】図２

Description

本発明は、リモートコピーシステムに関する。

ディザスタリカバリ（Disaster Recovery（ＤＲ））の自動化の需要が高まってきている。ＤＲでは、地震や火災といった災害が発生した場合のデータロストに備えて、複数のサイトに配置された複数ストレージシステム間でデータを多重化して保持するリモートコピー機能、及び、当機能を用いたストレージシステムの運用が知られている。

正サイトの災害発生時には、サーバシステム及びストレージシステム双方の業務を副サイトへ交替する運用を行う。リモートコピー機能は、長距離の離れたサイト間では、サーバシステムからの書込み応答まで時間がかかってしまうことから、サーバシステムからの書き込みコマンドへの完了応答後にストレージシステムがデータをコピー先のストレージシステムに転送する、非同期リモートコピーを用いることが一般的である。

特許文献１には、元データの更新に関する履歴を表す情報であるジャーナルを用いて非同期リモートコピーを行う技術が開示されている。

正サイトのコピー元ストレージシステムでは、書込みコマンドを受領するとデータ書込み用のボリュームへデータを、ジャーナルボリュームへジャーナルデータを書込み、サーバシステムに応答を返す。リモートサイトのコピー先ストレージシステムでは、書込みコマンドとは非同期にコピー元ストレージシステムのジャーナルボリュームからジャーナルデータを読出し、自身のジャーナルボリュームに格納する。そして、コピー先ストレージシステムは、格納したジャーナルデータに基づいて、コピー先のデータ書込み用ボリュームにコピーしたデータを復元する。

コピー元ストレージシステムに障害が発生した場合、コピー元ストレージシステムへのＩ／Ｏを停止し、コピー元ストレージシステムと同じ運用環境をコピー先ストレージシステムで再現処理が完了した後、Ｉ／Ｏを再開し業務を継続することができる。

米国特許出願公開第２００５／００３３８２７号明細書

前記障害が発生した時にＩ／Ｏを停止することは性能低下を引き起こす。Ｉ／Ｏを停止せずに、コピー元ストレージシステムと同じ運用環境をコピー先ストレージシステムに再現したい。さらに、サーバシステムで稼動するアプリケーションプログラム（ＡＰ）はストレージシステムの構成を意識することなく、障害後時コピー先ストレージシステムへフェイルオーバ（Failover（Ｆ．Ｏ．））後、直ちに業務を継続したい。Ｆ．Ｏ．時、コピー先ストレージシステムに未転送のジャーナルがある場合、それらのジャーナルが反映される前の少し前の時点での状態であることをＡＰが認識してコピー先ストレージシステムにて運用を継続したい。

一方、コピー元ストレージシステムでは、ボリュームオペレーションによりボリュームに対して、機能（例えば重複排除や圧縮）を実施するか否かや、ＬＤＥＶＧｕｒａｄ（ボリュームを読み取り専用またはアクセス不可にする設定）などのＱｏＳの設定を行う。ＱｏＳ設定もコピー先ストレージシステムに引き継ぎ運用環境を再現する。

本発明は上記の課題に鑑みてなされたもので、正サイトに障害が発生した際に早期にかつ確実に副サイトにおいて運用環境を再現することが可能なリモートコピーシステムを提供することにある。

上記課題を解決すべく、本発明の一つの観点に従うリモートコピーシステムは、第一のサーバシステム及びこの第一のサーバシステムに接続された第一のストレージシステムからなる正サイトと、第二のサーバシステム及びこの第二のサーバシステムに接続された第二のストレージシステムからなる副サイトとを有する。

第一のサーバシステム及び第二のサーバシステムはクラスタリングされ、第一のストレージシステム及び第二のストレージシステムにより仮想ストレージシステムが構築され、第一のストレージシステムがコピー元で第二のストレージシステムがコピー先として非同期リモートコピーされるように構成され、第一及び第二のストレージシステムは非同期リモートコピーの相手先である第二または第一のストレージシステムの障害を検知するように構成されている。

第一のストレージシステムはデータボリューム、ジャーナルボリューム及びストレージコントローラを有し、ストレージコントローラは、第一のサーバシステムからオペレーションを受信したら、オペレーションに基づき、オペレーションによる更新内容をジャーナルボリュームに格納する作業、またはオペレーションを受信したらこのオペレーションを実行する作業のいずれかを実行する。

本発明によれば、正サイトに障害が発生した際に早期にかつ確実に副サイトにおいて運用環境を再現することが可能なリモートコピーシステムを実現することができる。

実施例１に係るリモートコピーシステムの物理構成を示す図である。実施例１に係るリモートコピーシステムの論理構成を示す図である。実施例１に係るリモートコピーシステムのストレージコントローラのメモリの構成の一例を示す図である。実施例１に係るリモートコピーシステムのＶＯＬ管理テーブルの一例を示す図である。実施例１に係るリモートコピーシステムのＶＯＬマッピング管理テーブルの一例を示す図である。実施例１に係るリモートコピーシステムのペアＶＯＬ管理テーブルの一例を示す図である。実施例１に係るリモートコピーシステムのジャーナルテーブルの一例を示す図である。実施例１に係るリモートコピーシステムのオペレーション反映方法テーブルの一例を示す図である。実施例１に係るリモートコピーシステムの設定時の動作の一例を説明するためのフローチャートである。実施例１に係るリモートコピーシステムのジャーナル処理の一例を説明するためのフローチャートである。実施例１に係るリモートコピーシステムのフェイルオーバ処理の一例を説明するためのフローチャートである。実施例２に係るリモートコピーシステムにおける反映方法選択処理の一例を示すフローチャートである。

以下、本発明の実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。

以下の説明において、「インターフェース部」は、１以上のインターフェースでよい。この１以上のインターフェースは、１以上の同種の通信インターフェースデバイス（例えば１以上のＮＩＣ（Network Interface Card））であってもよいし、２以上の異種の通信インターフェースデバイス（例えばＮＩＣとＨＢＡ（Host Bus Adapter））であってもよい。

また、以下の説明において、「メモリ部」は、１以上のメモリであり、典型的には主記憶デバイスでよい。メモリ部における少なくとも１つのメモリは、揮発性メモリであってもよいし不揮発性メモリであってもよい。

また、以下の説明において、「ＰＤＥＶ部」は、１以上のＰＤＥＶであり、典型的には補助記憶デバイスでよい。「ＰＤＥＶ」は、物理的な記憶デバイス（Physical storage DEVice）を意味し、典型的には、不揮発性の記憶デバイス、例えばＨＤＤ（Hard Disk Drive）又はＳＳＤ（Solid State Drive）である。もしくは、フラッシュパッケージでもよい。

フラッシュパッケージは不揮発性記憶媒体を含む記憶デバイスである。フラッシュパッケージの構成例としては、コントローラと、計算機システムからのライトデータを記憶するための記憶媒体であるフラッシュメモリを有する。コントローラは、ドライブＩ／Ｆ、プロセッサ、メモリ、フラッシュＩ／Ｆを有する論理回路を有し、これらは内部ネットワークを介して相互接続されている。

また、以下の説明において、「記憶部」は、メモリ部とＰＤＥＶ部の少なくとも１つ（典型的には少なくともメモリ部）である。

また、以下の説明において、「プロセッサ部」は、１以上のプロセッサである。少なくとも１つのプロセッサは、典型的には、ＣＰＵ（Central Processing Unit）のようなマイクロプロセッサであるが、ＧＰＵ（Graphics Processing Unit）のような他種のプロセッサでもよい。少なくとも１つのプロセッサは、シングルコアでもよいしマルチコアでもよい。

また、少なくとも１つのプロセッサは、処理の一部又は全部を行うハードウェア回路（例えばＦＰＧＡ（Field-Programmable Gate Array）又はＡＳＩＣ（Application Specific Integrated Circuit））といった広義のプロセッサでもよい。

また、以下の説明において、「ｘｘｘテーブル」といった表現により、入力に対して出力が得られる情報を説明することがあるが、この情報は、どのような構造のデータでもよいし、入力に対する出力を発生するニューラルネットワークのような学習モデルでもよい。従って、「ｘｘｘテーブル」を「ｘｘｘ情報」と言うことができる。

また、以下の説明において、各テーブルの構成は一例であり、１つのテーブルは、２以上のテーブルに分割されてもよいし、２以上のテーブルの全部又は一部が１つのテーブルであってもよい。

また、以下の説明において、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ部によって実行されることで、定められた処理を、適宜に記憶部及び／又はインターフェース部などを用いながら行うため、処理の主語が、プロセッサ部（或いは、そのプロセッサ部を有するコントローラのようなデバイス）とされてもよい。

プログラムは、計算機のような装置にインストールされてもよいし、例えば、プログラム配布サーバ又は計算機が読み取り可能な（例えば非一時的な）記録媒体にあってもよい。また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

また、以下の説明において、「計算機システム」は、１以上の物理的な計算機を含んだシステムである。物理的な計算機は、汎用計算機でも専用計算機でもよい。物理的な計算機は、Ｉ／Ｏ（Input/Output）要求を発行する計算機（例えばホスト計算機やサーバシステムと呼ぶ）として機能してもよいし、Ｉ／Ｏ要求に応答してデータのＩ／Ｏを行う計算機（例えばストレージ装置）として機能してもよい。

すなわち、計算機システムは、Ｉ／Ｏ要求を発行する１以上のサーバシステム、及び、Ｉ／Ｏ要求に応答してデータのＩ／Ｏを行う１以上のストレージ装置であるストレージシステムのうちの少なくとも１つでよい。少なくとも１つの物理的な計算機において、１以上の仮想的な計算機（例えばＶＭ（Virtual Machine））が実行されてもよい。仮想的な計算機は、Ｉ／Ｏ要求を発行する計算機でもよいし、Ｉ／Ｏ要求に応答してデータのＩ／Ｏを行う計算機でもよい。

また、計算機システムは、１以上（典型的には複数）の物理的なノード装置で構成された分散システムでよい。物理的なノード装置は、物理的な計算機である。

また、物理的な計算機（例えばノード装置）が所定のソフトウェアを実行することにより、その物理的な計算機、又は、その物理的な計算機を含んだ計算機システムに、ＳＤｘ（Software-Defined anything）が構築されてもよい。ＳＤｘとしては、例えば、ＳＤＳ（Software Defined Storage）又はＳＤＤＣ（Software-defined Datacenter）が採用されてもよい。

例えば、ストレージ機能を有するソフトウェアが物理的な汎用の計算機で実行されることにより、ＳＤＳとしてのストレージシステムが構築されてもよい。

また、少なくとも１つの物理的な計算機（例えばストレージ装置）が、サーバシステムとしての１以上の仮想的な計算機と、ストレージシステムのストレージコントローラ（典型的には、Ｉ／Ｏ要求に応答してデータをＰＤＥＶ部に対して入出力する装置）としての仮想的な計算機とが実行されてもよい。

言い換えれば、このような少なくとも１つの物理的な計算機は、サーバシステムの少なくとも一部としての機能と、ストレージシステムの少なくとも一部としての機能の両方を有してもよい。

また、計算機システム（典型的にはストレージシステム）は、冗長構成グループを有してよい。冗長構成は、Erasure Coding、ＲＡＩＮ（Redundant Array of Independent Nodes）及びノード間ミラーリングのように複数のノード装置での構成でもよいし、ＰＤＥＶ部の少なくとも一部としての１以上のＲＡＩＤ（Redundant Array of Independent (or Inexpensive) Disks）グループのように単一の計算機（例えばノード装置）での構成でもよい。

また、以下の説明において、種々の対象の識別情報として、識別番号が使用されるが、識別番号以外の種類の識別情報（例えば、英字や符号を含んだ識別子）が採用されてもよい。

また、以下の説明において、同種の要素を区別しないで説明する場合には、参照符号（又は、参照符号のうちの共通符号）を使用し、同種の要素を区別して説明する場合は、要素の識別番号（又は参照符号）を使用することがある。

本実施形態のリモートコピーシステムは、一例として次のような構成を有する。

ＨＡ構成として、非同期リモートコピー構成を組む。正サイト側で受けたＩ／Ｏ、および、正サイト側のボリュームに対するＱｏＳ設定を行うボリュームオペレーションを正サイトのジャーナルボリュームに記録し、ジャーナルを副サイトへ転送することで、副サイト側でＩ／Ｏおよび前記ＱｏＳ設定を再現できる。

更なる構成として、以下の構成がある。ジャーナルが副サイトへ未転送のまま障害が発生した場合、未転送のジャーナルで示された内容は副サイトでは再現できない。ジャーナルにはＱｏＳ設定のボリュームオペレーションも記録される。しかし、前記ＱｏＳ設定はＩ／Ｏと異なり順序性を保証しなくてもよいものである。このことから、ＱｏＳ設定のボリュームオペレーションは、正サイトで要求を受けたらジャーナルに登録せずに副サイトにも要求を出してもよい。このようにすることで、ＱｏＳ設定のボリュームオペレーションは、ジャーナル化する方法よりも早くに副サイトに反映できる。

このように、ライト要求かＱｏＳ設定かのボリュームのオペレーションによって、副サイトへの反映方法を選択するために、オペレーション毎に副サイトへの反映方法を事前に決めておく処理を行う。

オペレーションを受信したら、オペレーションの種類を判定し、前記決定した方法に基づき副サイトへの反映方法を選択する。

以下、図面を参照して、実施例１を説明する。

＜システム構成＞
図１は、実施例１に係るリモートコピーシステム１の物理構成を示す図、図２は実施例１に係るリモートコピーシステム１の論理構成を示す図である。

地震などの災害への対策としてディザスタリカバリ（ＤＲ）の重要性が高まっている。リモートコピーはストレージシステムの高可用性（ＨＡ（High Availability））を実現する構成の一つである。

ストレージシステム２００はリモートコピー構成を構築するため、２つ以上のサイト、例えば、プライマリサイト（正サイト）１００Ａ、セカンダリサイト１００Ｂ（副サイト）がある。以下、説明を分かりやすくするため、プライマリサイト１００Ａが有する要素の参照符号は、親番号と子符号「Ａ」の組合せであり、セカンダリサイト１００Ｂが有する要素の参照符号は、親番号と子符号「Ｂ」の組合せである。また、プライマリサイト１００Ａとセカンダリサイト１００Ｂを区別する必要がないときは、参照符号を親番号のみとする。

リモートコピー構成のプライマリサイトとセカンダリサイトでは、同一機種のストレージシステムにて構築する場合が多いが、今回は障害発生時にフェイルオーバして処理を継続できるシステムの提供が目的であり、リモートコピー構成を組むそのことを目的とせずその手段のひとつとしてリモートコピー機能を使用しているため、リモートコピー構成を組むストレージシステムの機種をそろえることは発明の本質では無い。

リモートコピーによるデータ複製のコピー元となるプライマリサイト１００Ａ側のストレージシステム２００Ａが有するデータボリューム２２２Ａ（図２参照）を、以下「ＰＶＯＬ（プライマリボリューム、正ボリューム）」といい、ＰＶＯＬに格納されるデータの複製先となるセカンダリ側のストレージシステム２００Ｂが有するデータボリューム（図２において図略）を、以下「ＳＶＯＬ（セカンダリボリューム、セカンダリ側（Ｓ）ボリューム）」ということにする。複製データの格納元をプライマリサイト又は正サイト又はローカルサイトと呼び、複製を格納する先をセカンダリサイト又は副サイト又はリモートサイトと呼ぶ。

リモートコピー機能は、サーバシステムからの書き込みコマンドと同期してストレージシステムがデータをコピー先のストレージシステムに転送する「同期リモートコピー」と、サーバシステムからの書き込みコマンドへの完了応答後にストレージシステムがデータをコピー先のストレージシステムに転送する「非同期リモートコピー」の二種類に大別される。

どちらのリモートコピー機能を用いる場合でも、正サイトの災害発生時には、サーバシステム及びストレージ装置の双方の業務を副サイトへ交替する。これにより、サイトに災害が発生した場合でもデータ喪失や業務停止を最小化することができる。

また、同期リモートコピーはコピー元とコピー先のデータが常に同期されている利点がある一方、サーバシステムからの書込みの応答まで時間がかかってしまうため、長距離のサイトの間では非同期リモートコピーを用いることが一般的である。さらに、ストレージシステムがフラッシュ媒体を搭載することもあり、フラッシュ媒体の高性能を生かすためにも非同期リモートコピーを用いる。

以降は非同期リモートコピー機能を採用した説明とする。

ＨＡの別の方法として、ボリューム単位にリモートコピー構成を組む方法もある。ここでは、ストレージシステム２００単位にコピー元およびコピー先を決定する方法で説明する。

ストレージシステム２００は、図１に示すようにストレージコントローラ１０１を有する。ストレージコントローラ１０１は、プロセッサ２１１を含むコントローラの一例である。ストレージコントローラ１０１は、仮想ストレージシステム機能、非同期リモートコピー機能、障害検出やフェイルオーバを処理する障害管理機能を有する。

ストレージシステム２００は、複数（又は１つ）の物理的記憶デバイスであるＰＤＥＶ２２０と、ＰＤＥＶ２２０に接続されたストレージコントローラ１０１とを有する。

ストレージコントローラ１０１は、Ｉ／Ｆ２１４と、Ｉ／Ｆ２１５と、Ｉ／Ｆ２１３と、メモリ２１２と、それらに接続されたプロセッサ２１１とを有する。Ｉ／Ｆ２１４、Ｉ／Ｆ２１６、及びＩ／Ｆ２１３が、インターフェース部の一例である。メモリ２１２が、記憶部の一例である。プロセッサ２１１が、プロセッサ部の一例である。

Ｉ／Ｆ２１４は、サーバシステム２０１とストレージコントローラ１０１との間のデータのやり取りを仲介する通信インターフェースデバイスである。Ｉ／Ｆ２１４に、ＦＣ（Fibre Channel）ネットワーク２０３を介して、サーバシステム２０１が接続される。

サーバシステム２０１は、ストレージコントローラ１０１に対して、Ｉ／Ｏ先（例えばＬＵＮ（Logical Unit Number）のような論理ボリューム番号や、ＬＢＡ（Logical Block Address）のような論理アドレス）を指定したＩ／Ｏ要求（ライト要求又はリード要求）を送信する。サーバシステム２０１は、例えば、入力デバイス、出力デバイス、ＣＰＵ（Central Processing Unit）、メモリ、ディスクアダプタ、ネットワークアダプタ、及び、記憶デバイスを備える（図示なし）。なお、各サーバシステム２０１では、ユーザが使用するアプリケーションプログラム（ＡＰ）２０２（図２参照）や、ストレージコントローラ１０１とのインターフェース制御をおこなうストレージシステム制御プログラムもサーバシステム２０１が有するＣＰＵにて実行される。

Ｉ／Ｆ２１６は、ストレージシステム２００Ａとストレージシステム２００Ｂとの間でＨＡ構成をつくるためのやり取りを仲介する通信インターフェースデバイスである。ＨＡ構成は非同期リモートコピーを使用する為、リモートコピー用Ｉ／Ｆでもよい。Ｉ／Ｆ２１６は、ストレージシステム間ネットワーク２０６を介して他のストレージシステム２００に接続される。ストレージシステム間ネットワーク２０６は、ディザスタリカバリの観点から公衆回線などのグローバルネットワークであることが多いが、ストレージシステム同士が同じ部屋の中、同じビルの中、近隣ビルの中にある場合などはローカルネットワークであってもよい。ただし、このようなネットワークの形態によって本発明が限定されるものではない。

Ｉ／Ｆ２１３は、複数のＰＤＥＶ２２０とストレージコントローラ１０１の間のデータのやり取りを仲介する通信インターフェースデバイスである。Ｉ／Ｆ２１３には、複数のＰＤＥＶ２２０が接続される。

メモリ２１２は、プロセッサ２１１が実行するプログラムと、プロセッサ２１１が使用するデータを記憶する。プロセッサ２１１は、メモリ２１２に格納されているプログラムを実行する。例えば、メモリ２１２及びプロセッサ２１１の組が二重化されている。

ＰＤＥＶ２２０は、複数の記憶デバイスによって構成される。記憶デバイスは、例えばハードディスクドライブで構成され、主としてユーザデータを格納する。記憶デバイスとしては、フラッシュメモリなどの半導体メモリからなるドライブでもよい。記憶デバイスは、ＲＡＩＤ構成に基づいてＲＡＩＤグループを構成する。

ＰＤＥＶ２２０には、ＲＡＩＤグループに基づいて一つ以上の論理記憶領域（論理ボリューム）２２１、２２２（図２参照）が作成される。論理ボリュームは、ＰＤＥＶ２２０が有する物理的な記憶領域と関連付けられる。これらの論理ボリュームはユーザの指定によりＰＶＯＬ１５０ＡやＳＶＯＬ１５０Ｂ等のデータボリュームとジャーナルを格納するボリュームのジャーナルボリューム１６０として使用される。

ボリューム１５０および１６０はボリューム容量と実際の容量が一致するいわゆるＬＤＥＶでも、プールからページ（記憶領域の単位）を割当てるシンプロビジョニングボリュームでもよい。また、全てのボリュームは図示しない他のストレージシステムの備える記憶媒体に基づいて構成されてもよい。この場合、当該ボリュームにサーバシステムからアクセスされた場合には、アクセスをされたストレージシステムは記憶媒体を備える他のストレージシステムと通信を行いサーバシステムに応答する。

なお、ストレージシステム２００は、ストレージ装置、あるいはストレージサブシステムと言うこともできる。

Ｑｕｏｒｕｍ２５０は、ストレージシステム２００Ａ、ストレージシステム２００Ｂ以外の装置で、例えばストレージシステム２００に置かれる記憶領域である。前記ＨＡ構成のストレージシステム２００Ａとストレージシステム２００Ｂ間で通信不可となった場合に、前記ＨＡ構成のストレージシステム２００Ａとストレージシステム２００Ｂのうち、継続稼動させるものと停止させるものを決定する機能を提供する。

例えば、ストレージシステム２００Ａとストレージシステム２００Ｂはそれぞれのストレージシステムの状態やそれぞれのストレージシステムから見た他方のストレージシステムへの通信状態をＱｕｏｒｕｍ２５０に書き込む。互いのストレージシステムはＱｕｏｒｕｍ２５０を定期的またはＩ/Ｏの応答に同期して参照し、Ｑｕｏｒｕｍ２５０に書き込まれた情報に基づいて継続稼動させるものと停止させるものを決定する。

ネットワーク２０３及びネットワーク２０７は、ストレージネットワークでもよい。ストレージネットワークを介してサーバシステム２０１Ａ（サーバシステム２０１Ｂ）とストレージシステム２００Ａ（ストレージシステム２００Ｂ）間でデータを送受信する。ストレージシステム２００はストレージネットワークを介して互いに通信する。

図２に示すように、ストレージシステム２００Ａ及びストレージシステム２００Ｂはサーバシステム２０１Ａ及びサーバシステム２０１Ｂに対して仮想ストレージシステム１１０を提供している。

ストレージシステム２００Ａのボリュームであるボリューム１５０Ａおよびストレージシステム２００Ｂのボリュームであるボリューム１５０Ｂは同一のデータが格納され、サーバシステム２０１に対して同じ識別子（例えばＩＤ）を示し、仮想ストレージシステム１１０の一つの仮想ボリューム１１１として提供されている。

仮想ストレージシステム１１０の識別子、（例えば、製造番号（Ｓ／Ｎ））は、ＸＸＸである。一方、ストレージシステム２００Ａ、ストレージシステム２００Ｂ、それぞれ、製造番号ＡＡＡ、製造番号ＢＢＢを有している。サーバシステム２０１は、仮想ストレージシステム１１０を、ターゲットポート１０２Ａ、ターゲットポート１０２Ｂを含む、製造番号ＸＸＸのストレージシステムと認識する。

ボリューム１５０Ａ、１５０ＢはＨＡボリュームペアを構成し、一つの仮想ボリューム１１１を構成する。ボリューム１５０Ａ、１５０ＢのＩＤは、それぞれ、１０：００、３０：００である。一方、仮想ボリューム１１１のＩＤは、２０：００である。

サーバシステム２０１は、仮想ストレージシステム１１０から仮想ボリューム１１１を提供され、ＶＯＬＩＤが２０：００のボリュームと認識する。ストレージシステム２００Ａは通常業務を実施する正サイト（正常系）であり、ストレージシステム２００Ｂは正サイトに障害が起こったときに業務を引き続き実施するために正サイトのデータ状態を再現する副サイト（待機系、スタンバイサイト）である。サーバシステム２０１は、ターゲットポート１０２Ａ、１０２Ｂのいずれを介しても、仮想ボリューム１１１にアクセスすることができる。サーバシステム２０１Ａは、ターゲットポート１０２Ａのみを介して仮想ボリューム１１１にアクセスし、サーバシステム２０１Ｂは、ターゲットポート１０２Ｂのみを介して仮想ボリューム１１１にアクセスする。

サーバシステム２０１Ａとサーバシステム２０１Ｂはクラスタリングソフトウェアによって連携して一つのシステムとして運用する。これにより、サーバシステム２０１Ａに障害に発生しても、サーバシステム２０１Ｂで業務を継続できる。

なお、図１、図２には記載しないが、リモートコピーシステム１に管理装置を設けてもよい。管理装置は、ストレージシステム２００の記憶領域の構成を管理し、例えば、入力デバイス、出力デバイス、ＣＰＵ、メモリ、ネットワークアダプタ、及び、記憶デバイスを有する。Ｑｕｏｒｕｍ２５０が管理装置を担ってもよい。

図３は、実施例１に係るリモートコピーシステム１のストレージコントローラ１０１のメモリ２１２の構成の一例を示す図であり、より詳細には、メモリ２１２の構成と、メモリ２１２内のプログラム及び管理情報との例を示す図である。

メモリ２１２は、ローカルメモリ４０１、キャッシュメモリ４０２、及び共有メモリ４０４というメモリ領域を含む。これらのメモリ領域のうちの少なくとも１つは、独立したメモリであってもよい。ローカルメモリ４０１は、このローカルメモリ４０１を含むメモリ２１２と同一組に属するプロセッサ２１１により使用される。

ローカルメモリ４０１には、リードライトプログラム４１１、リモートコピー制御プログラム４１２、ジャーナル管理プログラム４１３、障害管理プログラム４１４、オペレーション反映方法決定プログラム４１５、及び、反映方法選択プログラム４１６が格納される。これらのプログラムについては後述する。また、他、図示していないプログラムも共有メモリ４０４に格納される。

キャッシュメモリ４０２には、ＰＤＥＶ２２０に対してライト又はリードされるデータセットが一時的に格納される。

共有メモリ４０４は、この共有メモリ４０４を含むメモリ２１２と同一組に属するプロセッサ２１１、及び異なる組に属するプロセッサ２１１の両方により使用される。共有メモリ４０４には、管理情報が格納される。

管理情報は、ＶＯＬ管理テーブル４２１、ＶＯＬマッピング管理テーブル４２２、ペアＶＯＬ管理テーブル４２３、ジャーナルテーブル４２４、オペレーション反映方法テーブル４２５を含む。ボリュームをＶＯＬと表記する。

＜管理情報＞
次に、管理情報である各テーブルの構成例を説明する。

図４は、実施例１に係るリモートコピーシステム１のＶＯＬ管理テーブル４２１の一例を示す図である。

ＶＯＬ管理テーブル４２１は、ＶＯＬに関する情報を保持する。例えば、ＶＯＬ管理テーブル４２１は、ＶＯＬ毎にエントリを有する。各エントリは、ＶＯＬＩＤ８０１、ＶＯＬ容量８０２、及び、ペアＩＤ８０３といった情報を格納する。以下、１つのＶＯＬ（「対象ＶＯＬ」と呼ぶ）を例に取って説明する。

ＶＯＬＩＤ８０１は、対象ＶＯＬの番号（識別番号）の情報である。ＶＯＬ容量８０２は、対象ＶＯＬの容量の情報であり、いわゆるボリュームサイズを示す。ペアＩＤ８０３はＶＯＬＩＤ８０１とＨＡ構成を組んでいるペア情報であり、ペアＶＯＬ管理テーブル４２３のペアＩＤを示す。

ＶＯＬ管理テーブル４２１は、その他、図示していないが、ボリュームの属性（Ｉ／Ｏを行うボリュームかジャーナルボリュームか）、ボリュームを構成する物理ハードディスク番号群や、その物理ハードディスクからボリュームを構成するＲＡＩＤレベルや、ＬＵ番号、物理ポート番号などの情報を管理する。

図５は、実施例１に係るリモートコピーシステム１のＶＯＬマッピング管理テーブル４２２の一例を示す図である。

ＶＯＬマッピング管理テーブル４２２は、ストレージシステム２００が有するボリュームの実構成情報と仮想構成情報とを関連付ける。具体的には、ＶＯＬマッピング管理テーブル４２２は、ＶＯＬＩＤ７０１、仮想ＶＯＬＩＤ７０２、仮想ストレージシステムＩＤ（例として製品番号）７０３、ＨＡフラグ７０４を有する。

各エントリは、ボリュームが対応付けられている仮想ＶＯＬＩＤ、当該仮想ボリュームを提供する仮想ストレージシステムＩＤ、及び、当該ボリュームがＨＡボリュームペアを構成するか否かを示している。ＨＡフラグの値がＯＮのとき、当該ボリュームは、他のボリュームとＨＡボリュームペアを構成する。ここでは、全ボリュームがＨＡ構成をとるため全てＯＮである。ＨＡ構成はリモートコピー構成である。

図６は、実施例１に係るリモートコピーシステム１のペアＶＯＬ管理テーブル４２３の一例を示す図である。

ペアＶＯＬ管理テーブル４２３は、リモートコピーペアを管理する情報である。ペアＶＯＬ管理テーブル４２３は、少なくともストレージシステム２００Ａ側に格納される。ここではストレージシステム２００に格納する。

ＰＶＯＬＩＤは、リモートコピーのコピー元であるボリュームを示す。ＳＶＯＬは、リモートコピーのコピー先であるボリュームを示す。

ペアＶＯＬ管理テーブル４２３には、リモートコピーペアを識別するペアＩＤ９０１、リモートコピーデータの複製元であるＰＶＯＬ情報として、ＰＶＯＬのストレージシステムＩＤ９０２とＰＶＯＬＩＤ９０３とジャーナルを格納するためのジャーナルＶＯＬＩＤ９０４、リモートコピーデータの複製先であるＳＶＯＬ情報として、ＳＶＯＬのストレージシステムＩＤ９０５と、ＳＶＯＬＩＤ９０６、ジャーナルを格納するためのジャーナルＶＯＬＩＤ９０７、およびペア状態９０８が含まれる。

ストレージシステムＩＤ９０２とストレージシステムＩＤ９０４は、当該ボリュームが存在する各ストレージシステム２００の識別子、例えば、製造番号（Ｓ／Ｎ）である。

ＰＶＯＬＩＤ９０３とジャーナルＶＯＬＩＤ９０４、および、ＳＶＯＬＩＤ９０５とジャーナルＶＯＬＩＤ９０７は、各ストレージシステム２００の中での当該ボリュームの識別子である。これらの各ＩＤにより、当該ボリュームが一意に決まることになる。

ペア状態９０６は、複製状態を示す、ペアの一方のボリュームから他方のボリュームにデータをコピーしている状態「ＣＯＰＹ」、ペアである二つのボリュームが同期している状態「ＰＡＩＲ」、ペアである二つのボリュームが非同期の状態「ＳＵＳＰＥＮＤ」のうち、いずれかを表わすものである。

図７は、実施例１に係るリモートコピーシステム１のジャーナルテーブル４２４の一例を示す図である。

ジャーナルとは、元データの更新に関する履歴を表す情報である。ジャーナルは、データのコピーであるデータ部分と、データの管理情報とから構成される。管理情報はＰＶＯＬ１５０Ａで行われたデータ更新の情報を持ち、例えば、ＶＯＬＩＤ１００１、開始ＬＢＡ１００２、ブロック数１００３、シーケンス番号１００４、時刻１００５、データ１００６、オペレーション１００７を挙げることができる。

ＶＯＬＩＤ１００１は、ＰＶＯＬ１５０Ａを特定するための情報である。開始ＬＢＡ１００２は、ＰＶＯＬ１５０Ａに書き込まれるライトデータの先頭を示す論理ブロックアドレスである。ブロック数１００３は、ライトデータのデータサイズを示す情報である。シーケンス番号１００４は、ジャーナルデータに連番で設定される識別番号である。時刻１００５は、ライト要求が発行された時刻である。データ１００６は、データ本体が格納されている位置（アドレス）を示すポインタ情報である。オペレーション１００７は、ライト要求以外の要求、例えば、ＱｏＳ設定およびスナップショット取得を処理する要求（コマンドなど）があった場合に格納する。ライト要求の場合はオペレーション１００７にライト要求を格納してもよいが、原則この情報は使用しない。ボリュームに対する設定等の要求があったらオペレーション１００７に登録し、ライト要求以外の場合は、開始ＬＢＡ１００２及びブロック数１００３、データ１００６は使用しない。

図８は、実施例１に係るリモートコピーシステム１のオペレーション反映方法テーブル４２５の一例を示す図である。

オペレーションの種類５０１は、正サイト側が受信するボリュームに対する処理要求で、ライト要求やＱｏＳ設定やスナップショットなどがある。実行者５０２は前記オペレーションの要求元であり、サーバシステム２０１のＡＰ２０２またはストレージ管理者である。ストレージ管理者は管理装置やリモートコピーシステム１に接続した端末等の機器を介して要求を出す。副サイト再現方法５０３は、前記オペレーションを副サイトに再現する際の再現方法を選択し登録する。

副サイト再現方法５０３は、例えば、方法１は要求を受けたら副サイトにも要求を送信する方法、方法２はジャーナル化して副サイトに再現する方法である。

図９は、実施例１に係るリモートコピーシステム１の設定時の動作の一例を説明するためのフローチャートである。

サーバシステム２０１Ａとサーバシステム２０１Ｂは、クラスタリングソフトウェアによって連携する（Ｓ１０１０）。クラスタリングソフトウェアによって連携された複数のサーバシステム２０１は一つのシステムとして運用される。

正サイト１００Ａ側のサーバシステム２０１Ａは正常系で通常業務を行い、副サイト１００Ｂ側のサーバシステム２０１Ｂは待機系でスタンバイし、正常系が稼動している間はＩ／Ｏは受け付けない。正常系のサーバシステム２０１Ａが障害により稼動できなくなったら、サーバシステム２０１Ｂにフェイルオーバし、サーバシステム２０１Ｂが正常系となり、ＡＰ２０２Ａの替わりにＡＰ２０２Ｂが処理を継続して行う。このため、正サイト１００Ａと副サイト１００Ｂのストレージシステム２００内に格納されるデータ及びボリュームへのＱｏＳ設定等を一致させる必要がある。

そこで、正サイト１００Ａのストレージシステム２００Ａと、副サイト１００Ｂのストレージシステム２００Ｂとを、ストレージシステム間ネットワーク２０６を介して接続し、リモートコピーを構成する。

リモートコピー制御プログラム４１２は、ストレージシステム２００Ａ内のボリュームをリモートコピーの正ボリューム（ＰＶＯＬ）１５０Ａとし、ストレージシステム２００Ｂ内のボリュームをリモートコピーの副ボリューム（ＳＶＯＬ）１５０Ｂとでリモートコピーのペアを形成する。

例えば、サーバシステム２０１、あるいは、ストレージシステム２００に設置された保守端末（あるいは、管理装置）が持つＧＵＩ（Graphical User Interface）等からストレージシステム２００にペア生成コマンドを発行し、データ複製のコピー元となるストレージシステム２００Ａが有するＰＶＯＬ１５０Ａと、ＰＶＯＬ１５０Ａに格納されるデータの複製先となるストレージシステム２００Ｂが有するＳＶＯＬ１５０Ｂとを、ペアとして関連付ける（Ｓ１０１２）。ペアを生成したらペアＶＯＬ管理テーブル４２３に登録する。

ここでは、従来のリモートコピー構成を設定して構築する必要はなく、ストレージシステム２００間のオペレーションとデータの転送をリモートコピーのジャーナル転送技術で行いたい。ペアを作成することで後述の仮想ボリュームに割り当てる。仮想ストレージシステムを構築して仮想ボリュームに２つのストレージシステム２００のボリュームを割当てることでペアとして登録してもよい。正サイト１００Ａと副サイト１００Ｂのハードウェア構成やハードウェア性能及び数は同じであってもよいし、異なるところがあってもよい。

さらに、各々のサイトのジャーナル管理プログラム４１３を用いて、ＰＶＯＬ１５０ＡおよびＳＶＯＬ１５０Ｂのペアに対応するジャーナルを格納するジャーナルボリュームを割り当て、ペアＶＯＬ管理テーブル４２３に登録する。これにより、データとＩ／Ｏやボリュームに対するコマンド等の操作の順序どおりに副サイト側であるコピー先ストレージシステム２００Ｂに正サイト側のコピー元ストレージシステム２００Ａのデータ及びを反映できる。

次に、仮想ストレージシステム１１０を設定する（Ｓ１０１４）。設定の方法は図２を参照して既に説明したとおりである。

仮想ストレージシステム１１０の仮想ボリューム１１１に、前記作成したペアの、正サイトのストレージシステム２００ＡのＰＶＯＬ１５０Ａと、副サイトのストレージシステム２００ＢのＳＶＯＬ１５０Ｂの両方をマッピングし、ＶＯＬマッピング管理テーブル４２２に登録する（Ｓ１０１６）

これにより、サーバシステム２０１Ａに障害に発生しても、サーバシステム２０１Ｂにフェイルオーバして業務を継続できる。

サーバシステム２０１Ａ及びサーバシステム２０１Ｂは一つの仮想ボリューム１１１にリード／ライト指示を送信し、実際にはボリューム１５０Ａに前記指示が送信される。

図１０は、実施例１に係るリモートコピーシステム１のジャーナル処理の一例を説明するためのフローチャートである。

図９により、リモートコピー技術及び仮想ストレージシステム技術を使ったＨＡ構成を構築したシステムでは、通常運用時、正サイト１００Ａのストレージシステム２００Ａへの要求を受け付ける。

ストレージシステム２００Ａのリードライトプログラム４１１は、サーバシステム２０１Ａからリモートコピー元ボリュームＰＶＯＬ１５０Ａへのライト要求を受信すると（Ｓ１１１０）、前記ライト要求に従って、受信したデータを指定されたＰＶＯＬ１５０Ａのアドレスに書き込む処理を実施する。ライト要求を実施すると、ジャーナル管理プログラム４１３Ａは、実施したライト要求のジャーナルを作成する。ライト要求の対象となったボリュームのＶＯＬＩＤをＶＯＬ管理テーブル４２１から参照し、ライト要求に示されるライト対象位置を開始ＬＢＡ１００２及びブロック数１００３に、それぞれ登録する。ライト要求を受信した時刻を時刻１００５に登録する。

ライトデータはジャーナル用に複製して別途ジャーナル専用エリアの記憶領域に格納し、前記記憶領域へのアドレスをデータ１００６に登録する。以上のように作成したジャーナルはジャーナルテーブル４２４に登録され、ジャーナルテーブル４２４はジャーナルボリューム１６０Ａに格納する（Ｓ１１１２）。

ここで、ジャーナル管理プログラム４１３は、ストレージシステム２００Ａの共有メモリ４０４上に格納されているＶＯＬ管理テーブル４２１とペアＶＯＬ管理テーブル４２３とジャーナルテーブル４２４を参照し、ジャーナル格納先を決定し、ジャーナルテーブル４２４の最新シーケンス番号１００４の次の番号をシーケンス番号として取得し、新規ジャーナルを作成し、ジャーナルボリューム１６０Ａ内のジャーナルテーブル４２４に追加する。

ストレージシステム２００Ａは、ストレージシステム２００Ａへの書き込みが完了した時点で、サーバシステム２０１Ａへの書き込み完了応答を行う。ストレージシステム２００Ａからストレージシステム２００Ｂへのジャーナルの転送は、ライト要求とは非同期に行われる。

ストレージシステム２００Ｂは、一定周期ごと等、所定のタイミングで、ストレージシステム２００Ａのジャーナルの情報を取得する。ストレージシステム２００Ｂにおいて、ジャーナル管理プログラム４１３Ｂは、ストレージシステム２００Ａから、ジャーナル作成状況に関する情報を取得するための要求を、ストレージシステム２００Ａに送信する（Ｓ１１１４）。ジャーナル作成状況に関する情報は、例えば、ジャーナルボリューム内のジャーナルの容量、ジャーナルの一番古い時刻等である。

ジャーナル管理プログラム４１３Ａは、前記要求に従ってジャーナル作成状況に関する情報をストレージシステム２００Ｂに転送する（Ｓ１１１５）。ジャーナル管理プログラム４１３Ｂは、この取得した情報を利用してジャーナル転送要求を作成する。

次に、ストレージシステム２００Ａからストレージシステム２００Ｂにジャーナルを転送する処理について説明する。

ストレージシステム２００Ｂにおいて、ＧＵＩを介したユーザからの指示の入力あるいは予め定められたスケジュールに従って、ジャーナル転送指示が発生すると、ジャーナル管理プログラム４１３Ｂは、ストレージシステム２００Ａに対し、ジャーナル転送要求を出す（Ｓ１１１６）。スケジュールは、例えば、ストレージシステム２００Ａで一定量のジャーナルがジャーナルボリューム１６０Ａに格納されたときや、一定期間ごと等である。

ジャーナル転送要求には、コピーすべきジャーナル（複数でも良い）、そのジャーナルが格納されているジャーナルボリューム１６０Ａ、そのジャーナルボリュームを有するストレージシステム２００Ａを指定する情報、および、コピーしたジャーナルが格納されるジャーナルボリューム１６０Ｂを指定する情報が含まれている。ジャーナル管理プログラム４１３Ｂは、共有メモリ４０４上のＶＯＬ管理テーブル４２１やペアＶＯＬ管理テーブル４２３から取得した情報から、ジャーナル転送要求を作成する。

ジャーナル転送要求を受けたジャーナル管理プログラム４１３Ｂは、ジャーナル転送要求で指定されたジャーナルに対するリードコマンドをストレージシステム２００Ａに対して発行する（Ｓ１１１８）。

このリードコマンドを受けたストレージシステム２００Ａのジャーナル管理プログラム４１３Ａは、リードコマンドで指定されたジャーナルをストレージシステム２００Ｂに送信する（Ｓ１１２０）。ジャーナルを受信したストレージシステム２００Ｂのジャーナル管理プログラム４１３Ｂは、ジャーナル転送要求で指定されたジャーナルボリューム１６０Ｂに、受信したジャーナルを格納する（Ｓ１１２１）。

その後、ストレージシステム２００Ｂのジャーナル管理プログラム４１３Ｂは、ジャーナル反映要求を発行する（Ｓ１１２２）。ジャーナル反映要求を受けたジャーナル管理プログラム４１３Ｂは、ジャーナルボリューム１６０Ｂのジャーナルのシーケンス番号に従って、ジャーナルデータをＳＶＯＬ１５０Ｂに書込むことで、ＳＶＯＬ１５０ＢにＰＶＯＬ１５０Ａのデータの反映をおこなう（Ｓ１１２４）。

その後、反映に用いられたジャーナルが格納されていた領域をパージする（Ｓ１１２５）。これにより、その領域は、新たなジャーナルの格納に利用されることができる。従来のジャーナルはライト要求だけであったため、スナップショットを取得する場合は、ストレージシステム２００Ａとストレージシステム２００ＢへのＩ／Ｏを停止し、ストレージ管理者がストレージシステム２００Ａとストレージシステム２００Ｂとに同時にスナップショット指示を出していた。ジャーナルにスナップショット取得のオペレーションを入れることで、スナップショット取得を自動化できる。

また、ジャーナル管理プログラム４１３Ｂは、ＳＶＯＬ１５０Ｂにデータが反映されたジャーナルのシーケンス番号を、ストレージシステム２００Ａのジャーナル管理プログラム４１３Ａに通知する。これにより、ジャーナル管理プログラム４１３Ａは、ＳＶＯＬ１５０Ｂに反映されたジャーナルが格納されていた、ストレージシステム２００Ａのジャーナルボリューム１６０Ａの領域を解放する（Ｓ１１２６）。この領域は、新たなジャーナルの格納に利用することができる。なお、ジャーナルのパージを、通知の受領後すぐにおこなう必要はない。ジャーナルのパージを定期的におこなっても良いし、ユーザからの指示に従ってパージしても良い。

以上のジャーナル処理によれば、ＰＶＯＬ１５０ＡからＳＶＯＬ１５０Ｂへの非同期リモートコピーを行うことができる。リモートコピー技術により、遠隔地のストレージシステム同士でのオペレーションの順序を守ることが実現できる。

前記では、前述のジャーナル処理のようにストレージシステム２００Ａがストレージシステム２００Ｂからのリードコマンドを待つ方法で説明したが、ストレージシステム２００Ａからストレージシステム２００Ｂに対してデータを書き込むライトコマンドを発行することにより、ジャーナルの転送を行ってもよい。
ストレージシステム２００Ｂは、ストレージシステム２００Ａから転送されたジャーナルのデータをジャーナルに格納されたＳＶＯＬ情報に対応するＳＶＯＬ１５０Ｂの対応箇所に更新する。

実施例はライト要求について説明したが、ストレージシステム２００ＡのボリュームにＱｏＳ設定の要求等が来た場合も同様にジャーナルに登録して実行する。例えば、ストレージシステム２００Ａがスナップショット作成したら、ジャーナルテーブル４２４のオペレーション１００７にスナップショット作成を登録し、ストレージシステム２００Ｂがジャーナルを読み出し、スナップショット作成の検出に応じてＳＶＯＬ１５０Ｂのスナップショットを作成する。

図１１は、実施例１に係るリモートコピーシステム１のフェイルオーバ処理の一例を説明するためのフローチャートである。

ストレージシステム２００とＱｕｏｒｕｍ２５０間で死活確認処理を定期的に実行する。

前述のとおり、Ｑｕｏｒｕｍ２５０は、正サイトのストレージシステム２００Ａ、副サイトのストレージシステム２００Ｂ以外のストレージシステム２００に置かれる記憶領域である。ストレージシステム２００Ａとストレージシステム２００Ｂは、それぞれのストレージシステムの状態やそれぞれのストレージシステムから見た他方のストレージシステムへの通信状態をＱｕｏｒｕｍ２５０に書き込む。

例として、ストレージシステム２００Ｂがストレージシステム２００Ａの死活状態を監視する処理を説明する。ストレージシステム２００Ａの障害管理プログラム４１４Ａは定期的またはＩ／Ｏの応答に同期して、Ｑｕｏｒｕｍ２５０の所定ビットに１を設定する（Ｓ１２１０）。障害管理プログラム４１４Ｂは、予め決めた時間間隔で定期的に、Ｑｕｏｒｕｍ２５０内の前記所定ビットに１が設定されているか判定する（Ｓ１２２０）。所定ビットに基づいて継続稼動させるものと停止させるものを決定する。

Ｑｕｏｒｕｍ２５０の所定ビットの値を確認した時に、所定ビットが１に設定されていた場合、ストレージシステム２００Ａが正常に動作していることが確認できる。確認したら、障害管理プログラム４１４Ｂは、Ｑｕｏｒｕｍ２５０の所定ビットを０（ゼロ）にリセットする。ストレージシステム２００Ａが正常に動作していれば定期的に自身でまたビットを１にする。それを監視するためである。Ｓ１２１０へ戻り、定期的にＱｕｏｒｕｍ２５０の所定ビットを参照する。

これに対し、Ｑｕｏｒｕｍ２５０の所定ビットの値を確認した時に、所定ビットが０（ゼロ）に設定されていた場合、ストレージシステム２００Ａに障害が発生しているために所定ビットをリセットできなくなっていると判定することができる。障害管理プログラム４１４Ｂは、ストレージシステム２００Ａに障害が発生したことを検知する。Ｓ１２３０の処理へ進む。

障害を検出したら、ストレージシステム２００Ａをリセットさせるためのリセット指示を発行する。Ｑｕｏｒｕｍ２５０に発行させてもよい。ストレージシステム２００Ａは障害によってはリセット指示を受けつけられない可能性もある。可能な場合だけ、ストレージシステム２００Ａはリセット指示を受信すると、Ｑｕｏｒｕｍ２５０にリセット完了を応答した後、リセット処理を実行する。

ストレージシステム２００Ｂはストレージシステム２００Ａが障害であることを検知したため、サーバシステム２０１ＢのＡＰ２０２Ｂに対して再起動を指示する（Ｓ１２３０）。クラスタリングソフトウェアはＡＰ２０２Ｂを正常系として動作し、フェイルオーバ処理を開始する。以降ＡＰ２０２Ｂからストレージシステム２００Ｂへアクセスに切り替わる。

ストレージシステム２００Ｂは障害ストレージシステム２００Ａが担当していた論理ボリュームへの要求をＡＰ２０２Ｂから受信する（Ｓ１２４０）。ＡＰ２０２が認識している論理ボリュームは仮想ボリューム１１１であるため仮想ボリューム１１１へのアクセスは変わらず、仮想ボリューム１１１にＳＶＯＬ１５０Ｂをマッピングして処理を継続して行う。即ち、同じ識別子（ＩＤ）をもつ仮想ボリューム１１１をフェイルオーバのペアであるにストレージシステム２００Ａとストレージシステム２００Ｂに同時に提供していて、正常時にはストレージシステム２００Ａを、障害時にはストレージシステム２００Ｂにアクセスする。

フェイルオーバしたら、ジャーナルが実行完了している時点を復元時点として、前記復元時点のストレージシステム２００Ｂをサーバシステム２０１Ｂに提供する。ＡＰ２０２Ｂは復元時点のストレージシステム２００Ｂを認識し処理を継続する。障害の旧正サイトから未転送のジャーナルの分は再現できない。最新状態より少し過去の状態にて業務を続けることができる。

このように構成される本実施例によれば、サーバシステム２０１のＡＰ２０２にストレージシステム２００の構成を意識させずに、ボリュームオペレーションも含めてコピー先ストレージシステム２００に運用環境を反映しＦ．Ｏ．することができる。

また、本実施例によれば、正サイトに障害が発生し、正サイトから副サイトへ未転送のジャーナルが存在した場合でも、副サイトへフェイルオーバし、ボリュームへのＱｏＳ設定を含め副サイトでの運用環境を再現でき、業務を継続できるResurrectableなリモートコピーシステム１を提供できる。

また、本実施例のリモートコピーシステム１は高可用性を示し得る。ＡＰ２０２にも負荷をかけずに、ＡＰ２０２とストレージ管理者で認識するストレージの構成情報と同じ構成を正副サイトに実現できる。従来、ストレージシステム２００内の障害が起こった場合、障害状況を調査しフェイルオーバするには専門の知識をもつ管理者及び技術者の操作が必要であったが、本実施例により、クラスタリングソフトとＱｕｏｒｕｍ２５０と連携して自動フェイルオーバを実現できる。障害からの復旧を容易化、迅速化できる。ジャーナルを利用することでＩ／Ｏ単位にコピー処理を行えるため、ＲＰＯ（ＲｅｃｏｖｅｒｙＰｏｉｎｔＯｂｊｅｃｔｉｖｅ）が小さい。専門知識をもつ技術者が必要なくなる。

なお、Ｑｕｏｒｕｍ２５０自身が管理装置として、ストレージシステム２００の状況を管理し、いずれかのストレージシステム２００内での障害発生を検知した場合、障害発生元ストレージシステムに対してリセット指示を出し、フェイルオーバ先のストレージシステム２００に対してフェイルオーバ指示を発行してもよい。

障害によっては応答できない場合は、タイムオーバによりフェイルオーバ処理を開始するか決定してもよい。

ストレージシステム２００Ａはペアを形成する相手のストレージシステム２００Ｂとハードビート通信を行うことで相手ストレージシステムが正常に稼動しているかを監視する経路を持ってもよい。

前述のとおり、ストレージシステム２００Ａに更新があると、前記更新内容をジャーナルに登録し、前記ジャーナルは更新時刻順に前記更新内容を管理し、前記ジャーナルをストレージシステム２００Ａからストレージシステム２００Ｂ転送する。ストレージシステム２００Ｂは、受け取ったジャーナルの更新時刻順にストレージシステム２００Ｂに再現する。これは、ライト要求は、要求時刻順に処理を実施しないと、データが異なる場合があるためである。

例えば、同一ボリュームの同一アドレスに、ライト要求が２回、データＸとデータＹの順にライトが要求された場合、最初にライトされたデータＸに上書きされて最後にライト要求されたデータＹが最終的に格納されるが、順番を入れ替えてライト処理を実行すると、データＹに上書きされてデータＸが最終的に格納される。

このように、ライト処理においては、処理された順番を遵守して実行することが重要であり、順番を遵守しなければ副サイト側で正サイトのデータが再現できない。ライト要求に関しては、ジャーナル化して、更新順序を管理することが必要である。

一方、ボリュームに対するＱｏＳ設定のボリュームオペレーションにおいては、ライト要求などの他の処理との実行順序が異なっても結果が変わらないため、実行順序による影響は無い。更に言えば、実行順序を遵守する必要はなく、正サイトでボリュームオペレーションが行われたら、直ちに副サイトへボリュームオペレーション指示を出してもよい。従って、ジャーナルで管理しなくてもよい。

正サイトで要求を受けたら直ちに副サイトへ指示することで、ジャーナルを介して副サイトに再現していたときより、早いタイミングで副サイト側に再現することが可能であり、障害が発生した時にも、ボリュームオペレーションを副サイトに引き継げる可能性が高くなる。

図１２は、実施例２に係るリモートコピーシステムにおける反映方法選択処理の一例を示すフローチャートである。

図１２を参照して、本実施例である、オペレーションによりジャーナル化するか、ジャーナル化せずに副サイト側にオペレーションを転送するかを選択する方法を説明する。

正サイトで受けたオペレーション（ライト要求を含む）のうち、どれをジャーナルで管理すべきかを決定するための、図８のオペレーション反映方法テーブル４２５を作成する（Ｓ１１）。これは、リモートコピーシステム１の初期設定時点で作成してよい。

まず、正サイト側が受信するボリュームに対する処理要求全てをオペレーションの種類５０１に登録する。オペレーションには、ライト要求やＱｏＳ設定やスナップショットがある。各オペレーションをストレージシステム２００に対して指示できる要求元を実行者５０２に登録する。実行者はサーバシステム２０１のＡＰ２０２またはストレージ管理者がある。同じオペレーションに複数の実行者がある場合は、エントリを分けて登録する。オペレーションと実行者の組み合わせに対して、オペレーションの実行順序を保証すべきものか否かを判断し、副サイトで再現する方法を登録する。

オペレーション反映方法テーブル４２５を作成する方法は、例えば、システム管理者やユーザが手動で入力してもよい。入力を支援するツールを設けてもよい。過去にオペレーションを実行した実績から判断して自動作成してもよい。ＡＩを使って、マニュアル等の情報を取り出して自動で作成する方法でもよい。

サーバシステム２０１からオペレーションを受信する（Ｓ１２）と、オペレーション反映方法テーブル４２５を参照して、受信したオペレーションの種類５０１の副サイト再現方法５０３を判定する（Ｓ１３）。副サイト再現方法５０３が方法１の場合は、ジャーナル化する（Ｓ１５）。副サイト再現方法５０３が方法２の場合は、ジャーナル化せずに副サイトにオペレーション指示を送る（Ｓ１４）。

このように構成される本実施例によれば、サーバシステム２０１からオペレーションを受信したら、このオペレーションに基づき、オペレーションによる更新内容をジャーナルボリューム１６０に格納する作業、またはオペレーションを受信したらこのオペレーションを実行する作業のいずれかを実行している。

従って、本実施例によれば、正サイトに障害が発生した際に早期にかつ確実に副サイトにおいて運用環境を再現することが可能となる。

なお、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、ハードディスク、ＳＳＤ（Solid State Drive）、光ディスク、光磁気ディスク、ＣＤ−Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｊａｖａ（登録商標）等の広範囲のプログラム又はスクリプト言語で実装できる。

上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

１…リモートコピーシステム１００Ａ…正サイト１００Ｂ…副サイト１０１、１０１Ａ、１０１Ｂ…ストレージコントローラ１１０…仮想ストレージシステム１１１…仮想ボリューム１５０、１５０Ａ、１５０Ｂ…ボリューム１６０、１６０Ａ、１６０Ｂ…ジャーナルボリューム２００…ストレージシステム２００Ａ…第一のストレージシステム２００Ｂ…第二のストレージシステム２０１…サーバシステム２０１Ａ…第一のサーバシステム２０１Ｂ…第二のサーバシステム

Claims

第一のサーバシステム及びこの第一のサーバシステムに接続された第一のストレージシステムからなる正サイトと、
第二のサーバシステム及びこの第二のサーバシステムに接続された第二のストレージシステムからなる副サイトと
を有し、
前記第一のサーバシステム及び前記第二のサーバシステムはクラスタリングされ、
前記第一のストレージシステム及び前記第二のストレージシステムにより仮想ストレージシステムが構築され、
前記第一のストレージシステムがコピー元で前記第二のストレージシステムがコピー先として非同期リモートコピーされるように構成され、
前記第一及び第二のストレージシステムは非同期リモートコピーの相手先である前記第二または第一のストレージシステムの障害を検知するように構成されたリモートコピーシステムであって、
前記第一のストレージシステムはデータボリューム、ジャーナルボリューム及びストレージコントローラを有し、
前記ストレージコントローラは、前記第一のサーバシステムからオペレーションを受信したら、前記オペレーションに基づき、前記オペレーションによる更新内容を前記ジャーナルボリュームに格納する作業、または前記オペレーションを受信したらこのオペレーションを実行する作業のいずれかを実行する
ことを特徴とするリモートコピーシステム。
前記ストレージコントローラは、前記正サイトにフェイルオーバが発生した後に、前記ジャーナルボリュームに格納された前記更新内容を前記第二のサーバシステムに反映させることを特徴とする請求項１に記載のリモートコピーシステム。
前記ストレージコントローラは、前記オペレーションの種類に基づいていずれの作業を実行するかを決定することを特徴とする請求項２に記載のリモートコピーシステム。
前記ストレージコントローラは、前記オペレーションの種類に基づいて、前記ジャーナルボリュームに格納された前記更新内容を前記第二のサーバシステムに反映する方法を選択することを特徴とする請求項３に記載のリモートコピーシステム。
前記ストレージコントローラは、前記オペレーションの要求元にも基づいて、前記ジャーナルボリュームに格納された前記更新内容を前記第二のサーバシステムに反映する方法を選択することを特徴とする請求項４に記載のリモートコピーシステム。
前記ストレージコントローラは前記オペレーションの種類、前記オペレーションの前記要求元及び前記更新内容の反映方法との対応関係が記述されたテーブルを有し、このテーブルの内容に基づいて前記更新内容の前記反映方法を選択することを特徴とする請求項５に記載のリモートコピーシステム。
前記ストレージコントローラは、前記第一のサーバシステムから前記オペレーションを受信したら、前記オペレーションによる更新内容を前記ジャーナルボリュームに格納する作業を必ず実行することを特徴とする請求項１に記載のリモートコピーシステム。