WO2019026222A1

WO2019026222A1 - ストレージシステム及びデータ転送制御方法

Info

Publication number: WO2019026222A1
Application number: PCT/JP2017/028171
Authority: WO
Inventors: 彰義土谷; 敬一松澤; 光雄早坂; 山本　彰
Original assignee: 株式会社日立製作所
Priority date: 2017-08-03
Filing date: 2017-08-03
Publication date: 2019-02-07
Also published as: US10936243B2; US20200073584A1

Abstract

第２の拠点内の第２のストレージ装置が、第１のホストからのライト要求に従い更新された第１の要素に関する更新通知を、第１の拠点内の第１のストレージ装置から受信した場合、当該更新通知を基に特定された第２の要素について、当該第２の要素に対応した第１の要素のデータが最新データであると管理する。第１のストレージ装置は、複数の第１の要素を含むことが可能な第１のボリュームを提供する。第２のストレージ装置は、複数の第１の要素に対応した複数の第２の要素を含むことが可能な第２のボリュームを提供する。第２のストレージ装置が、第２のホストからリード要求を受けた場合、リード元第２要素（当該リード要求から特定された第２の要素）に対応した第１の要素のデータが最新データであるか否かを判断する。当該判断結果が真の場合、第２のストレージ装置が、最新データを第１のストレージ装置から取得して第２のホストに返す。

Description

ストレージシステム及びデータ転送制御方法

　本発明は、概して、拠点間（ストレージ装置間）のデータ転送に関する。

　計算機システムの用途として、ＩｏＴ（Internet of Things）等の技術により得られたデータであって拠点内のストレージ装置に格納されたデータを分析し、分析結果をフィードバックすることで、業務を最適化する用途が知られている。このような用途においては、複数の拠点のデータを中央のデータセンタで横断的に分析するために、中央データセンタによって各拠点のデータを参照可能としなければならない。なお、「拠点」は、「第１の拠点」の一例であり、「中央データセンタ」は、「第２の拠点」の一例である。ここで言う「拠点」とは（第１及び第２の拠点のいずれも）、データセンタ又はネットワークセグメントのような計算機システムが設置された拠点を言う。各拠点の計算機システムは、ストレージ装置を含む。

　中央データセンタが各拠点のデータを参照するため、各拠点のストレージ装置がデータを中央データセンタに転送する。例えば、特許文献１は、第１の拠点に対し行われたデータの更新を第２の拠点に非同期に転送することで、第１の拠点のデータを第２の拠点に複製する技術を開示している。この技術を前述の分散拠点－中央データセンタ間に適用する場合、全ての更新データが中央データセンタに転送される。特許文献１の技術では、分析に一部のデータしか要しない場合でも全更新データの転送が必要となる。このため、各拠点の全データを中央データセンタに転送完了するまで分析を開始することができず、業務への分析結果の活用が遅れるという問題がある。これに加え、各拠点と中央データセンタとの間のネットワークの帯域を過剰に消費するという問題もある。

　一方、全データのコピー完了を必要とせず、第１の拠点のデータを第２の拠点からアクセス可能とする技術として、例えば、特許文献２が開示する技術がある。特許文献２によれば、複数のストレージ装置において、アクセス要求を受けたストレージ装置が、その要求に従うアクセス対象のデータを保有していない場合、アクセス要求を外部のストレージ装置に転送することで、外部ストレージからアクセス対象のデータを取得する。この処理は、ボリューム単位の処理のため、単一のボリュームに格納されているデータは全て転送対象となる。そのため、データの一部を中央データセンタに残すと言った細かい粒度の管理を行うことができない。この結果、中央データセンタで実行される分析処理が、遠隔の拠点のデータにアクセスすると、分析処理のデータアクセスは拠点間のデータコピーを伴うこととなり、分析処理の性能低下を引き起こす。

　なお、データコピーに関し、更に、特許文献３及び４に開示の技術も知られている。

US7,275,177 US6,269,431 US8,984,248 US8,856,073

　従って、本発明が解決しようとする課題は、第２の拠点において複数の第１の拠点で格納されているデータをアクセス対象（例えば分析対象）とする場合、第２の拠点でのアクセス性能の低下を抑えつつ、各第１の拠点から第２の拠点へのデータコピー完了を待たずに各第１の拠点のデータへのアクセスを可能とするとともに、第１の拠点と第２の拠点との間のネットワークの帯域の消費を抑えることである。

　第１の拠点に第１のストレージ装置が存在する。第２の拠点に第２のストレージ装置が存在する。第２のストレージ装置は、第１のストレージ装置とネットワークを介して接続されたストレージ装置である。

　第１のストレージ装置が、それぞれがボリューム領域又はデータセットである複数の第１の要素を含むことが可能な第１のボリュームを提供する。第２のストレージ装置が、それぞれがボリューム領域又はデータセットであり複数の第１の要素に対応した複数の第２の要素を含むことが可能な第２のボリュームを提供する。

　第１のストレージ装置が、第１のホストからのライト要求に従い更新された第１の要素のＩＤを含む更新通知を前記第２のストレージ装置に送信する。第２のストレージ装置が、更新通知を受信した場合、当該更新通知から特定された第１の要素に対応した第２の要素について、当該第２の要素に対応した第１の要素のデータが最新データであると管理する。

　第２のストレージ装置が、第２のホストからリード要求を受けた場合、当該リード要求から特定された第２の要素であるリード元第２要素に対応した第１の要素のデータが最新データであるか否かを判断する。当該判断結果が真の場合、第２のストレージ装置が、最新データの取得要求を第１のストレージ装置に送信する。当該取得要求に応答して第１のストレージ装置から取得された最新データを、第２のストレージ装置が、リード元第２要素のデータとし、且つ、当該最新データを第２のホストに返す。

　第１の拠点内の全データを第２の拠点にコピーされることを待つことなく、第２のホストが、第１の拠点内のデータを参照することができる。この参照により第１の拠点から第２の拠点に取得されたデータは第２の拠点に格納されるため、以後利用可能であり、結果として、以後の第２の拠点でのアクセス性能の低下を抑えることが期待できる。また、第１の拠点から第２の拠点へ転送するデータの量を削減することで、ネットワーク帯域の消費を削減することができる。

図１は、実施例１の概要を示す模式図である。図２は、実施例１における計算機システムの構成図である。図３は、実施例１におけるコアコントローラ中のメモリに格納されたプログラム及びテーブルを示す図である。図４は、実施例１におけるスナップショット取得動作の概要を示す図である。図５は、実施例１におけるスナップショット管理テーブルの構成図である。図６は、実施例１におけるＬＵ管理テーブルの構成図である。図７は、実施例１における更新ビットマップテーブルの構成図である。図８は、実施例１におけるＬＵマッピング管理テーブルの構成図である。図９は、実施例１におけるコピー状態管理テーブルの構成図である。図１０は、実施例１における更新通知処理のフロー図である。図１１は、実施例１におけるコアリード処理のフロー図である。図１２は、実施例２における計算機システムの構成図である。図１３は、実施例２におけるファイルコントローラ中のメモリに格納されたプログラム及びテーブルを示す図である。図１４は、実施例２における第１検索テーブルの構成図である。図１５は、実施例２における第２検索テーブルの構成図である。図１６は、実施例２におけるオブジェクトコントローラ中のメモリに格納されたプログラム及びテーブルを示す図である。図１７は、実施例２におけるオブジェクト管理テーブルの構成図である。図１８は、実施例２におけるスタブデータテーブルの構成図である。図１９は、実施例２におけるスタブ作成処理のフロー図である。図２０は、実施例２におけるオブジェクリード処理のフロー図である。図２１は、実施例２におけるデータコピー処理のフロー図である。図２２は、実施例３における計算機システムの構成図である。図２３は、実施例４における計算機システムの構成図である。図２４は、実施例４における移行用スタブデータテーブルの構成図である。図２５は、実施例４におけるデータ要求元管理テーブルの構成図である。図２６は、実施例４における移行先リード処理のフロー図である。図２７は、実施例５の概要を示す模式図である。図２８は、実施例５におけるＬＵマッピング管理テーブルの構成図である。図２９は、実施例５におけるライト処理のフロー図である。図３０は、実施例６の概要を示す模式図である。図３１は、実施例６におけるコアリード処理のフロー図である。

　以下の説明では、「インタフェース部」は、ユーザインタフェース部と、通信インタフェース部とのうちの少なくとも１つを含んでよい。ユーザインタフェース部は、１以上のＩ／Ｏデバイス（例えば入力デバイス（例えばキーボード及びポインティングデバイス）と出力デバイス（例えば表示デバイス））と表示用計算機とのうちの少なくとも１つのＩ／Ｏデバイスを含んでよい。通信インタフェース部は、１以上の通信インタフェースデバイスを含んでよい。１以上の通信インタフェースデバイスは、１以上の同種の通信インタフェースデバイス（例えば１以上のNIC（Network Interface Card））であってもよいし２以上の異種の通信インタフェースデバイス（例えばNICとHBA（Host Bus Adapter））であってもよい。

　また、以下の説明では、「メモリ部」は、１以上のメモリを含む。少なくとも１つのメモリは、揮発性メモリであってもよいし不揮発性メモリであってもよい。メモリ部は、主に、プロセッサ部による処理の際に使用される。

　また、以下の説明では、「プロセッサ部」は、１以上のプロセッサを含む。少なくとも１つのプロセッサは、典型的には、ＣＰＵ（Central Processing Unit）のようなマイクロプロセッサである。１以上のプロセッサの各々は、シングルコアでもよいしマルチコアでもよい。プロセッサ部は、処理の一部または全部を行うハードウェア回路（例えばパリティ計算用の回路）を含んでもよい。

　また、以下の説明では、「ｘｘｘテーブル」といった表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「ｘｘｘテーブル」を「ｘｘｘ情報」と言うことができる。また、以下の説明において、各テーブルの構成は一例であり、１つのテーブルは、２以上のテーブルに分割されてもよいし、２以上のテーブルの全部又は一部が１つのテーブルであってもよい。

　また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ部によって実行されることで、定められた処理を、適宜にメモリ部及び／又はインタフェース部等を用いながら行うため、処理の主語が、プロセッサ部（或いは、そのプロセッサ部を有する装置又はシステム）とされてもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な（例えば非一時的な）記録媒体であってもよい。また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

　また、以下の説明では、「分散拠点」は、第１の拠点の一例である。「中央データセンタ」は、第２の拠点の一例である。

　また、以下の説明では、「ストレージシステム」は、１以上の第１の拠点がそれぞれ有する１以上の第１のストレージ装置と、１以上の第１の拠点に対する第２の拠点が有する第２のストレージ装置とを含む。各ストレージ装置は、１以上のストレージマシンで構成される。少なくとも１つのストレージマシンは、汎用的な物理計算機であってもよいし、２以上の記憶デバイスを有するディスクアレイ装置でもよい。また、少なくとも１つのストレージマシンが、仮想的なストレージマシンであってもよいし、ＳＤｘ（Software-Defined anything）を実行してもよい。ＳＤｘとしては、例えば、ＳＤＳ（Software Defined Storage）（仮想的なストレージ装置の一例）又はＳＤＤＣ（Software-defined Datacenter）を採用することができる。例えば、ストレージ装置としてのＳＤＳと、ホスト計算機としての仮想的な計算機とが、同一拠点における計算機システム上で実行されてもよい。

　また、以下の説明では、「ボリューム」は、論理ボリュームの略であり、論理的な記憶領域である。ボリュームは、実体的なボリューム（ＲＶＯＬ）であってもよいし、仮想的なボリューム（ＶＶＯＬ）であってもよい。「ＲＶＯＬ」は、そのＲＶＯＬを提供するストレージシステムが有する物理的な記憶資源（例えば、一以上の物理ドライブ）に基づくボリュームでよい。「ＶＶＯＬ」は、複数の仮想領域（仮想的な記憶領域）で構成されており容量仮想化技術（典型的にはThin Provisioning）に従うボリュームでよい。

　図１は、実施例１の概要を示す模式図である。

　計算機システム２００は、１又は複数の分散拠点２６０（第１の拠点の一例）と、１つの中央データセンタ２１０（第２の拠点の一例）とを有する。以下、１つの分散拠点２６０を例に取る。

　分散拠点２６０には、ホスト計算機（以下、ホスト）２８０と、ストレージ装置（以下、エッジストレージ）１５０とが存在する。ホスト２８０は、第１のホストの一例である。エッジストレージ１５０は、第１のストレージ装置の一例である。中央データセンタ２１０には、分析用ホスト計算機（以下、分析用ホスト）２３０と、ストレージ装置（以下、コアストレージ）１２０とが存在する。分析用ホスト２３０は、第２のホストの一例であり、分析のために使用されるホストである。コアストレージ１２０は、第２のストレージ装置の一例である。ストレージシステムは、エッジストレージ１５０とコアストレージ１２０とを含む。

　分散拠点２６０において、エッジストレージ１５０が、ホスト２８０にボリューム１５１（第１のボリュームの一例）を提供する。エッジストレージ１５０は、ホスト２８０から、ボリューム１５１を指定したアクセス要求（ライト要求又はリード要求）を受信する。例えば、エッジストレージ１５０は、ホスト２８０から、ボリューム１５１を指定したライト要求を受信した場合、そのライト要求に従うライト対象のデータを、ボリューム１５１に書き込む。ボリューム１５１は、複数のボリューム領域で構成される。ライト対象データが、ライト先の１以上のボリューム領域に書き込まれる。本実施例では、ボリューム１５１は、ＶＶＯＬ（Thin Provisioningに従うボリューム）であり、ボリューム領域は、ページである。なお、ボリューム領域は、ボリューム内の要素の一例である。

　同様に、中央データセンタ２１０において、コアストレージ１２０が、分析用ホスト２３０にボリューム１２１（第２のボリュームの一例）を提供する。コアストレージ１２０は、分析用ホスト２３０から、ボリューム１２１を指定したアクセス要求を受信する。例えば、コアストレージ１２０は、分析用ホスト２３０から、ボリューム１２１を指定したリード要求を受信した場合、そのリード要求に従うリード対象のデータを、ボリューム１２１から読み出し、読み出したデータを分析用ホスト２３０に返す。ボリューム１２１は、複数のボリューム領域で構成される。リード対象データが、リード元の１以上のボリューム領域から読み出される。本実施例では、ボリューム１２１は、ＶＶＯＬ（Thin Provisioningに従うボリューム）であり、ボリューム領域は、ページである。

　エッジストレージ１５０が、更新ビットマップテーブル３４０を管理する。更新ビットマップテーブル３４０は、ページ毎の更新の有無（ボリュームペアを構成するボリューム間の差分）を管理するためのテーブルである。例えば、更新ビットマップテーブル３４０は、ボリューム１５１のページ毎にページＩＤ及び更新フラグを有する。各ページについて、ページＩＤ及び更新フラグは以下の通りである。
・ページＩＤは、ページのＩＤである。
・更新フラグは、当該ページの更新の有無を示すフラグ（ビット））である。

　更新フラグ“OFF”のページに対してデータが書き込まれた場合、エッジストレージ１５０は、当該更新フラグを“OFF”から“ON”に更新する。

　コアストレージ１２０が、コピー状態管理テーブル３７０を管理する。コピー状態管理テーブル３７０は、ボリューム１２１のページ毎にデータ取得対象か否か（エッジストレージ１５０における対応するページに最新データがあるか否か）を管理する。例えば、コピー状態管理テーブル３７０は、ボリューム１２１のページ毎にページＩＤ、更新フラグ及び未コピーフラグを有する。各ページについて、ページＩＤ、更新フラグ及び未コピーフラグは以下の通りである。
・ページＩＤは、ページのＩＤである。
・更新フラグ（第１の情報要素の一例）は、エッジストレージ１５０からコアストレージ１２０への前回データコピー以降に当該ページに対応したページのＩＤを含んだ更新通知を受けたか否かを示すフラグである。
・未コピーフラグ（第２の情報要素の一例）は、ボリューム１２１が作成（提供）されて以降に、エッジストレージ１５０からコアストレージ１２０の当該ページにデータが未コピーであるか否かを示すフラグである。

　コピー状態管理テーブル３７０に関し、各ページについて、更新フラグ及び未コピーフラグの少なくとも１つが“ON”の場合、当該ページは、データ取得対象である。更新フラグ及び未コピーフラグが“OFF”の場合、当該ページは、データ取得対象ではない。すなわち、「最新データ」は、最近更新されたデータ、又は、更新されたか否かに関わらず一度もコピー（取得）されていないデータである。

　エッジストレージ１５０が、ボリューム１５１を指定したライト要求をホスト２８０から受信した場合（Ｓ１）、ライト先ページ（ライト要求が指定するアドレスに属するページ）にデータを書き込む。また、エッジストレージ１５０が、ライト先ページに対応した更新フラグ（更新ビットマップテーブル３４０における更新フラグ）が“OFF”であれば“ON”に更新し、ライト先ページのページＩＤを含んだ更新通知をコアストレージ１２０に送信する（Ｓ２）。つまり、エッジストレージ１５０は、ページが更新された場合、更新されたページをコアストレージ１２０に通知する。更新通知を受けたコアストレージ１２０は、更新通知内のページＩＤに対応した更新フラグが“OFF”であれば“ON”に更新する。つまり、コアストレージ１２０は、コピー元のボリューム１５１で、通知されたページに更新が生じたことを記録する。

　コアストレージ１２０は、更新通知から、エッジストレージ１５０において更新されたページを知ることができるが、更新通知を受けた時点では、当該ページ内のデータを取得しないでよい。分析のためのリード要求に従うリード対象のデータとならない場合、当該データの取得に伴うデータ転送が無駄になるからである。

　コアストレージ１２０が、ボリューム１２１を指定したリード要求を分析用ホスト２３０から受信した場合（Ｓ３）、リード元ページ（リード要求で指定されたアドレスが属するページ）がデータ取得対象か否かを判断する。

　この判断結果が真の場合、コアストレージ１２０が、リード元ページに対応するコピー元ページ（リード元ページに対応する、ボリューム１５１内のページ）からデータをコピーし（取得し）（Ｓ４）、コピーしたデータを、Ｓ３で受信したリード要求に対する応答として、分析用ホスト２３０に返す。また、コアストレージ１２０が、リード元ページに対応した更新フラグ及び未コピーフラグにいずれについても“ON”であれば“OFF”に更新する。また、エッジストレージ１５０が、取得されたデータを格納するページ（リード元ページに対応する、ボリューム１５１内のページ）について、更新ビットマップテーブル３４０における更新フラグを“OFF”にしてよい。

　この判断結果が偽の場合、コアストレージ１２０が、リード元ページからデータを読み出し、読み出したデータを分析用ホスト２３０に返す。

　以下、実施例１を詳細に説明する。

　図２は、計算機システム２００の構成図である。

　計算機システム２００は、中央データセンタ２１０と１乃至複数の分散拠点２６０で構成される。中央データセンタ２１０及び分散拠点２６０は、広域ネットワーク２５０（例えばＷＡＮ（Wide Area Network）又はインターネット）により互いに接続される。なお、広域ネットワーク２５０は、内部ネットワークでもよい。エッジストレージ１５０は、１以上の記憶媒体２９５と、１以上の記憶媒体２９５に対する入出力を制御するコントローラ（以下、エッジコントローラ）２９０とを有する。コアストレージ１２０は、１以上の記憶媒体２４５と、１以上の記憶媒体２４５に対する入出力を制御するコントローラ（以下、コアコントローラ）２４０とを有する。エッジコントローラ２９０は、第１のコントローラの一例である。コアコントローラ２４０は、第２のコントローラの一例である。

　中央データセンタ２１０内は、広域ネットワーク２５０と接続された内部ネットワーク２２０を介し、コアコントローラ２４０及び１乃至複数の分析用ホスト２３０が接続されている。コアコントローラ２４０は、分析用ホスト２３０が参照するデータを格納又は提供する装置である。分析用ホスト２３０は、コアコントローラ２４０が格納するデータ、及びコアコントローラ２４０が透過的に（分析用ホスト２３０が、データの所在がエッジストレージ１５０にあることを認識することなく）アクセス可能としているエッジストレージ１５０中のデータにアクセスし、加工又は分析を行う計算機である。

　このコアコントローラ２４０は、各分散拠点２６０にあるエッジストレージ１５０が格納するデータを分析用ホスト２３０に透過的にアクセス可能とする機能を備える。コアコントローラ２４０は、ＣＰＵ２４１、メモリ２４２、ネットワークインタフェース２４３及びストレージインタフェース２４４を備え、それらは互いに内部で接続されている。ＣＰＵ２４１は、プロセッサ部の一例であり、メモリ２４２に格納されたプログラムの記載に従い、コアコントローラ２４０の構成要素を制御する。メモリ２４２は、メモリ部の一例であり、複数のプログラムやテーブルを格納し、ディスクキャッシュを有する。ネットワークインタフェース２４３及びストレージインタフェース２４４は、インタフェース部の一例である。コアコントローラ２４０は、ネットワークインタフェース２４３を介し内部ネットワーク２２０を通じて分析用ホスト２３０によるアクセス要求を処理したり、広域ネットワーク２５０を通じてエッジコントローラ２９０と通信したりする。ネットワークインタフェース２４３を介した通信プロトコルには、Ethernet（登録商標）、Fibre Channel、ＳＣＳＩ（Small Computer System Interface）等が利用可能である。また、コアストレージコントローラ２４０は、ストレージインタフェース２４４を介し記憶媒体２４５に対するデータの読み書きを行う。記憶媒体２４５としては、磁気ディスク、光ディスク、NAND Flash、不揮発メモリ等が利用可能である。また、他のストレージコントローラを階層的に用いることもできる。ストレージインタフェース２４４と記憶媒体２４５間の通信プロトコルには、ＳＣＳＩ、ＳＡＳ（Serial Attached SCSI）、ＡＴＡ（Advanced Technology Attachment）、ＮＶＭｅ（Non-Volatile Memory express）等を利用できる。本実施例は、ここで挙げた通信プロトコルや記憶媒体に限定することなく、一般的な計算機で利用可能な通信プロトコルや記憶媒体に対し適用可能である。

　分散拠点２６０内は、広域ネットワーク２５０と接続された内部ネットワーク２７０を介し、エッジスコントローラ２９０及び１乃至複数のホスト計２８０が接続されている。エッジコントローラ２９０は、ホスト２８０が生成するデータを格納する装置である。ホスト２８０は、当該ホスト２８０が生成及び取得するデータをエッジストレージ１５０に格納する。

　エッジコントローラ２９０は、ＣＰＵ２９１、メモリ２９２、ネットワークインタフェース２９３及びストレージインタフェース２９４を備え、それらは互いに内部で接続されている。ＣＰＵ２９１は、プロセッサ部の一例であり、メモリ２９２に格納されたプログラムの記載に従い、エッジコントローラ２９０の構成要素を制御する。メモリ２９２は、メモリ部の一例であり、複数のプログラムやテーブルを格納し、ディスクキャッシュを有する。ネットワークインタフェース２９３及びストレージインタフェース２９４は、インタフェース部の一例である。エッジコントローラ２９０は、ネットワークインタフェース２９３を介し内部ネットワーク２７０を通じてホスト２８０によるアクセス要求を受け付けたり、広域ネットワーク２５０を通じてコアコントローラ２４０と通信したりする。また、エッジコントローラ２９０は、ストレージインタフェース２９４を介し記憶媒体２９５に対するデータの読み書きを行う。エッジストレージコントローラ２９０の各通信プロトコルや記憶媒体２９５には、コアストレージコントローラ２４０同等のものを利用可能である。

　図３は、コアコントローラ２４０中のメモリ２４２及びエッジコントローラ２９０中のメモリ２９２に格納されている各種プログラム及びテーブルを示す図である。以下、両メモリ２４２及び２９２を総称して「メモリ３００」と記載する。メモリ３００中のプログラム及びテーブルのうち一部要素はメモリ２４２及び２９２のいずれかにしか存在しないものもあるが、そのような要素は個別に記載する。特に断りのない場合、各要素はメモリ２４２及び２９２の両方に含まれる。

　入出力制御プログラム３１０は、コアコントローラ２４０又はエッジコントローラ２９０が分析用ホスト２３０又はホスト２８０からのアクセス要求を受信した場合に、必要に応じてリモートコピープログラム３５０による拠点間データ転送処理を行った上で、記憶媒体２４５又は２９５のデータの読み書きを行い、その結果を分析用ホスト２３０又はホスト２８０に返すプログラムである。入出力制御プログラム３１０は、分析用ホスト２３０やホスト２８０に可視なボリュームの管理単位であるＬＵ（Logical Unit）を構成及び管理する。ＬＵは、記憶媒体２４５又は２９５の領域を分割又は連結することで生成される。ＬＵは、ボリュームと同義でよい。また、入出力制御プログラム３１０は、領域の複製、ＲＡＩＤ（Redundant Array of Independent (or Inexpensive) Disks）、Erasure Codingなどの冗長化機構を伴うこともできる。入出力制御プログラム３１０は、ＬＵのスナップショットの作成及び管理を行う機能を備える。

　ＬＵ管理テーブル３２０は、ＬＵの構成情報を格納する。スナップショット管理テーブル３３０は、ＬＵのスナップショットの構成情報を格納する。更新ビットマップテーブル３４０は、ＣｏＷ（Copy on Write）を用いたスナップショット管理に必要なビットマップ情報を拠点間でやりとりする場合に一時的に格納される。リモートコピープログラム３５０は、ネットワークインタフェース２４３又は２９３及び広域ネットワーク２５０を介しコアコントローラ２４０とエッジコントローラ２９０とで通信し、データの送受信を行うプログラムである。

　ＬＵマッピングテーブル３６０は、コアコントローラ２４０のみが保持するテーブルであり、コアコントローラ２４０が管理するＬＵと、エッジコントローラ２９０が管理するＬＵの対応付けを管理するテーブルである。

　コピー状態管理テーブル３７０は、コアコントローラ２４０のみが保持するテーブルである。コピー状態管理テーブル３７０は、ＬＵの各領域について、エッジコントローラ２４０からデータ取得が必要か否かを示す。

　メモリ３００のうち、これら各種プログラム・テーブルを格納した領域以外の全部又は一部である余剰領域は、記憶媒体２４５又は２９５のディスクキャッシュ３８０として用いることができる。

　図４は、コアコントローラ２４０及びエッジコントローラ２９０の各々のスナップショット取得の動作の概要を示す図である。以下、例としてコアコントローラ２４０を例に取る。

　分析用ホスト２３０のアクセス先のＬＵが、Ｐ－ｖｏｌ（Primary Volume）４２０である。Ｐ－ｖｏｌのスナップショットが、Ｓ－ｖｏｌ（Snapshot Volume）４４１である。Ｓ－ｖｏｌ４４１は、世代毎に存在する。世代間の差分を管理するためのＬＵが、Ｄ－ｖｏｌ（Differential Volume）４３０である。Ｐ－ｖｏｌ４２０及びＤ－ｖｏｌ４３０は、１以上の記憶媒体２４５上に構築されたプール４００に格納される（又は関連付けられる）。Ｓ－ｖｏｌ４４１は、Ｐ－ｖｏｌ４２０とＤ－ｖｏｌ４３０から構成される仮想的なボリュームであり、記憶媒体２４５上にＳ－ｖｏｌそのものが格納されるわけではない。また、Ｓ－ｖｏｌ４４１は、スナップショット世代毎に存在するため、Ｐ－ｖｏｌに対し、複数作成可能である。

　Ｐ－ｖｏｌ４２０、Ｄ－ｖｏｌ４３０、Ｓ－ｖｏｌ４４１はそれぞれ固定長のボリューム領域（ページ４１１）単位で管理される。各Ｓ－ｖｏｌ４４１中の各ページ４１１は、Ｐ－ｖｏｌ４２０中の同じ位置のページ４１１またはＤ－ｖｏｌ４３０中のページ４１１に対応付けられる。コアコントローラ２４０は、分析用ホスト２３０から、Ｓ－ｖｏｌ４４１を指定したアクセス要求を受信した場合、そのアクセス要求を、そのアクセス要求で指定されたアクセス先ページに対応する、Ｐ－ｖｏｌ４２０又はＤ－ｖｏｌ４３０中のページ、へのアクセス要求と見なす。この対応関係は、コアコントローラ２４０内のスナップショット管理テーブル３３０により管理される。また、Ｐ－ｖｏｌ内のページを「Ｐ－ｖｏｌページ」、Ｄ－ｖｏｌ内のページを「Ｄ－ｖｏｌページ」、及び、Ｓ－ｖｏｌ内のページを「Ｓ－ｖｏｌページ」とそれぞれ呼ぶことができる。

　プール４００は、例えば、１以上の記憶媒体２４５に基づく複数の実領域を含んでいてよい。各実領域は、論理的な記憶領域である。複数の実領域のうちの一部の実領域が、Ｄ－ｖｏｌ４３０を構成する複数のＤ－ｖｏｌページでもよい。また、実領域は、ＶＶＯＬであるＰ－ｖｏｌのＰ－ｖｏｌページに割り当てられてもよい。また、実領域は、Ｄ－ｖｏｌもＶＶＯＬである場合、Ｄ－ｖｏｌページに割り当てられてもよい。

　図５は、スナップショット管理テーブル３３０の構成図である。

　スナップショット管理テーブル３３０は、Ｐ－ｖｏｌ４２０に相当するＬＵ毎に存在する。スナップショット管理テーブル３３０は、Ｐ－ｖｏｌページのＩＤとスナップショットの世代番号とにより、Ｓ－ｖｏｌページの参照先として、対応するＰ－ｖｏｌページ又はＤ－ｖｏｌページを特定することができる。スナップショット管理テーブル３３０は、Ｐ－ｖｏｌ内のページ毎に、エントリを有する。各エントリが、ページＩＤ４５１、ＣｏＷフラグ４５２及び参照先ページＩＤ４５３といった情報を格納する。以下、１つのＰ－ｖｏｌページを例に取る（図５の説明で「対象ページ」と言う）。

　ページＩＤ４５１は、対象ページを一意に示す識別子である。ボリュームを構成するページ群に先頭から連番が付与されてもよいし、ハッシュ値等が用いられてもよい。図の例は、Ｐ－ｖｏｌのページＩＤ４５１として０から始まる連番が付与されている。ＣｏＷフラグ４５２は、対象ページについてＣｏＷ（対象ページがライト先とされた場合に対象ページ内のデータを退避すること）が必要か否かを示す。“ON”は、ＣｏＷが必要を意味する。参照先ページＩＤ４５３は、スナップショット世代毎に、対象ページに対応したＳ－ｖｏｌページの参照先ページのページＩＤである。具体的には、“－１”は、同じ位置のＰ－ｖｏｌページのＩＤ、すなわち、対象ページのページＩＤを示している。“－１”以外の値は、Ｄ－ｖｏｌページのＩＤを示している。

　世代数が多い場合、参照先ページＩＤ４５３“－１”の格納の有無の判断のため、スナップショット管理テーブル３３０を１行分全て探索する必要がある。この処理を高速化するため、コアコントローラ２４０は、事前に参照先ページＩＤ４５３“－１”の有無を求めておき、当該有無に応じてＣｏＷフラグ４５２の値を準備しておいてもよい。

　Ｐ－ｖｏｌページが一つでもＳ－ｖｏｌから参照されている（すなわち、スナップショット管理テーブル３３０に参照先ページＩＤ４５３“－１”が一つでも格納されている）場合、Ｐ－ｖｏｌ中のデータはスナップショットと共有されている状態である。この状態で、Ｐ－ｖｏｌページ若しくはＰ－ｖｏｌページを参照するＳ－ｖｏｌページに対しデータの更新が行われた場合、コアコントローラ２４０は、ＣｏＷを用いたデータの退避を行う。

　Ｃｏｗフラグ４５２“ON”に対応したＰ－ｖｏｌページが更新対象（ライト先）の場合、コアコントローラ２４０は、下記を行う。
・更新対象のＰ－ｖｏｌページ中のデータを空きＤ－ｖｏｌページにコピーする。
・Ｐ－ｖｏｌページを参照している全てのＳ－ｖｏｌページの参照先ページＩＤをコピー先Ｄ－ｖｏｌページのページＩＤに振り替える。
・更新対象のＰ－ｖｏｌページ中のデータを更新する。
・Ｃｏｗフラグ４５２を“OFF”に変更する。

　Ｃｏｗフラグ４５２“OFF”に対応したＰ－ｖｏｌページが更新対象の場合、コアコントローラ２４０は、下記を行う。
・更新対象のＰ－ｖｏｌページ中のデータを更新する。

　Ｓ－ｖｏｌページが更新対象であり、更新対象のＳ－ｖｏｌページの参照先ページがＰ－ｖｏｌページの場合、コアコントローラ２４０は、下記を行う。
・更新対象のＳ－ｖｏｌページの参照先Ｐ－ｖｏｌページ中のデータを空きＤ－ｖｏｌページにコピーする。
・更新対象のＳ－ｖｏｌページの参照先ページＩＤをコピー先Ｄ－ｖｏｌページのページＩＤに振り替える。
・コピー先Ｄ－ｖｏｌ中のデータを更新する。

　このようにして、Ｐ－ｖｏｌ又はＳ－ｖｏｌの更新は、他のＰ－ｖｏｌ又は世代のＳ－ｖｏｌのデータに影響を与えずに行うことができる。

　スナップショットを作成する場合、コアコントローラ２４０は、新たな世代番号を関連付けたＳ－ｖｏｌを作成し、スナップショット管理テーブル３３０中に、当該世代の参照先情報を格納できるようにする。その際、スナップショットを作成した瞬間は、Ｐ－ｖｏｌとＳ－ｖｏｌの内容は等しいため、コアコントローラ２４０は、当該Ｓ－ｖｏｌの全Ｓ－ｖｏｌページの参照先ページＩＤ４５３を“－１”とし、且つ、当該Ｐ－ｖｏｌの全Ｐ－ｖｏｌページのＣｏＷフラグ４５２を“ON”にする。

　図６は、ＬＵ管理テーブル３２０の構成図である。

　ＬＵ管理テーブル３２０は、コアコントローラ２４０及びエッジコントローラ２９０の各々において、コントローラ毎に１つ存在する。ＬＵ管理テーブル３２０は、ＬＵ毎にエントリを持つ。ここで言うＬＵには、Ｐ－ｖｏｌ、Ｄ－ｖｏｌ及びＳ－ｖｏｌのいずれも該当する。各エントリが、ＬＵＮ５２１及びサイズ５２２といった情報を格納する。以下、１つのＬＵを例に取る（図６の説明で「対象ＬＵ」と言う）。

　ＬＵＮ５２１は、対象ＬＵのＩＤの一例であるＬＵＮ（Logical Unit Number）である。サイズ５２２は、対象ＬＵのサイズ（容量）を示す。

　図７は、更新ビットマップテーブル３４０の構成図である。

　更新ビットマップテーブル３４０は、エッジコントローラ２９０とコアコントローラ２４０間でＬＵを構成する各ページの更新の有無を示す情報をやり取りするために一時的に生成されるテーブルである。更新ビットマップテーブル３４０は、ボリュームペア（ＬＵペア）毎に存在する。ここで言うボリュームペアは、分析用ホスト２３０により参照され得るボリューム（コアストレージ１２０が提供するボリューム）と、ホスト２８０により更新され得るボリューム（エッジストレージ１５０が提供するボリューム）とのペアである。更新ビットマップテーブル３４０は、ボリュームのページ毎にエントリを持つ。各エントリは、ページＩＤ５４１及び更新フラグ５４２といった情報を格納する。以下、１つのページを例に取る（図７の説明で「対象ページ」と言う）。

　ページＩＤ５４１は、対象ページのページＩＤである。更新フラグ５４２は、対象ページの更新の有無を示すフラグ（ビット））である。

　なお、対象ページについて、ページＩＤ５４１及び更新フラグ５４２に代えて、同等の内容を含む別のデータ構造が用いられてもよい。例えば、更新フラグをセットされたページＩＤのみをリストとして列挙したデータ構造や、ビットマップをRun Length等のアルゴリズムでデータ量を削減したデータ構造が適用できる。

　更新ビットマップテーブル３４０は、例えば、最新世代ｎのボリューム（エッジストレージ１５０内のボリューム）と、前回更新通知を送信したときの世代（例えばスナップショット世代（ｎ－１））のボリュームとの差分（更新されたページのＩＤ）を示すテーブルでよい。更新通知は、更新ビットマップテーブル３４０を含んでよい。

　図８は、ＬＵマッピング管理テーブル３６０の構成図である。

　ＬＵマッピング管理テーブル３６０は、コアコントローラ２４０が格納するテーブルである。ＬＵマッピング管理テーブル３６０は、コアストレージ１２０内のＬＵ毎にエントリを持つ。各エントリは、ＬＵＮ５６１、コピー元ストレージ５６２、コピー元ＬＵＮ５６３及びコピー元世代番号５６４といった情報を格納する。以下、１つのＬＵを例に取る（図８の説明で「対象ＬＵ」と言う）。

　ＬＵＮ５６１は、対象ＬＵのＬＵＮである。コピー元ストレージ５６２は、対象ＬＵのコピー元ＬＵ（対象ＬＵとペアを構成するＬＵ）を有するエッジストレージ１２０のＩＤ（例えばアドレス）である。コピー元ＬＵＮ５６３は、対象ＬＵのコピー元ＬＵのＬＵＮである。

　コピー元世代番号５６４は、対象ＬＵのコピー元ＬＵに関連付いた世代の番号を示す。“０”は、コピー元ＬＵがＰ－ｖｏｌであることを意味し、“０”より大きい番号は、コピー元ＬＵがＳ－ｖｏｌであることを意味してもよい。

　コピー元ストレージ５６２、コピー元ＬＵＮ５６３及びコピー元世代番号５６４から、分散拠点２６０中のエッジコントローラ２９０及び当該エッジコントローラ２９０が管理するＬＵ（世代）を一意に識別することができる。コピー元ストレージ５６２として、例えばＴＰＣ／ＩＰにおけるＩＰアドレスやホスト名、Fibre ChannelにおけるＷＷＮ（World Wide Name）、ｉＳＣＳＩにおけるQualified Name等が利用可能である。

　図９は、コピー状態管理テーブル３７０の構成図である。

　コピー状態管理テーブル３７０は、コアコントローラ２４０が格納するテーブルである。コピー状態管理テーブル３７０は、ボリュームペアを構成するＬＵ毎に存在する。コピー状態管理テーブル３７０は、ページ毎に、エントリを持つ。各エントリは、ページＩＤ５７１、更新フラグ５７２及び未コピーフラグ５７３といった情報を格納する。以下、１つのページを例に取る（図９の説明で「対象ページ」と言う）。

　ページＩＤ５７１は、対象のページを一意に特定するＩＤである。

　更新フラグ５７２は、対象ページについて、エッジコントローラ２９０からコアコントローラ２４０への前回データコピー以降、エッジコントローラ２９０からコアコントローラ２４０へ対象ページの更新が通知されたか否かを示す。

　未コピーフラグ５７３は、本テーブル３７０に対応するＬＵがコアコントローラ２４０により作成されて以降、エッジコントローラ２９０からコアコントローラ２４０へ対象ページにデータが未コピーであるか否かを示す。

　図１０は、更新通知処理のフロー図である。

　更新通知処理は、エッジコントローラ２９０においてスナップショットが作成される契機で開始される。

　エッジコントローラ２９０は、下記２つのスナップショットの世代番号を入力として受け取る。
・今回作成したスナップショット。
・前回更新ビットマップテーブル３４０をコアコントローラ２４０に送信した際に送信した世代番号５６４に相当するスナップショット。

　エッジコントローラ２９０は、出力として、上記の２つのスナップショット間における各ページの更新の有無を示す更新ビットマップテーブル３４０を、コアコントローラ２４０に送信する。

　更新通知処理の詳細の手順は、例えば下記の通りである。

　エッジコントローラ２９０は、スナップショット管理テーブル３３０を基に、更新ビットマップテーブル３４０を生成する（ステップ６１０）。この更新ビットマップテーブル３４０は、入力で与えられた２つの世代番号のスナップショット間で各ページに更新が生じたか否かを示す。各ページの更新の有無は、例えばスナップショット管理テーブル３３０の両世代の参照先ページの不一致を持って更新有りと判断できる。エッジコントローラ２９０は、生成した更新ビットマップテーブル３４０に、生成したスナップショット（Ｓ－ｖｏｌ）のＬＵＮと、入力のうち新しい方の世代番号とを関連付け、ＬＵＮ及び世代番号が関連付けられた更新ビットマップテーブル３４０を、コアコントローラ２４０に広域ネットワーク２５０を介し送信する（ステップ６２０）。

　コアコントローラ２４０は、エッジコントローラ２９０より更新ビットマップテーブル３４０（及びＬＵＮ及び世代番号）を受信すると（ステップ６３０）、コピー状態管理テーブル３７０の更新を始める。コアコントローラ２４０は、ＬＵマッピング管理テーブル３６０を参照し、送信元のエッジコントローラ２９０及び送信されたＬＵＮと合致するコピー元ストレージ５６２及びコピー元ＬＵＮ５６３を含む該当エントリを検索し、その該当エントリにおけるＬＵＮ５６１を特定する。コアコントローラ２４０は、更新ビットマップテーブル３４０中の各ページに対応するエントリを参照し、特定したＬＵＮ５６１に対応するコピー状態管理テーブル３７０においてページＩＤ５７１が一致するエントリの更新フラグ５７２を更新ビットマップテーブル３４０中の更新フラグ５４２で上書きする（ステップ６４０）。すべてのページに対し上書き処理を完了すると、コアコントローラ２４０は、受信した世代番号を、上記該当エントリ（ＬＵマッピング管理テーブル３６０内のエントリ）のコピー元世代番号５６４に上書きする（ステップ６５０）

　図１１は、コアコントローラ２４０が分析用ホスト２３０よりＬＵに対するリード要求を受信したときに開始されるコアリード処理のフロー図である。

　コアコントローラ２４０は、リード要求で指定されたリード対象のＬＵ及びページに対応するコピー状態管理テーブル３７０におけるエントリを参照する（ステップ７１０）。参照したエントリにおいて、未コピーフラグ５７３若しくは更新フラグ５７２の少なくとも片方が“ON”の場合、当該ＬＵのリード対象データは、エッジコントローラ２９０から取得する必要がある。この場合、コアコントローラ２４０は、ＬＵマッピング管理テーブル３６０を参照して、リード対象のＬＵに対応するコピー元ストレージ５６２、コピー元ＬＵ５６３及びコピー元世代番号５６４を特定し、コピー元エッジコントローラ２９０に、当該ＬＵ及びスナップショットに対するデータの取得要求を送信する（ステップ７２０）。そして、コアコントローラ２４０は、その取得要求に応答してコピー元エッジコントローラ２９０から取得したデータを、リード対象のＬＵにライトする。この動作により、リード対象ＬＵとそれのコピー元ＬＵの当該ページの内容は一致するため、コアコントローラ２４０は、コピー状態管理テーブル３７０における更新フラグ５７２及び未コピーフラグ５７３を共に“OFF”とする。その後、コアコントローラ２４０は、リード対象のＬＵ内のデータ（エッジコントローラ２９０から取得され格納されたデータ）をリードし、リード要求元の分析用ホスト２３０に返す（ステップ７３０）。

　本実施例により、分析用ホスト２３０がエッジストレージ１５０内のデータに透過的にアクセスできるようになる。このため、エッジストレージ１５０が格納するデータのコピー完了をまたず、コアコントローラ２４０から、エッジストレージ１５０が格納するデータへアクセスが可能となる。また、参照の際、対象のデータが格納されたページのみ広域ネットワーク２５０を通じて転送され、参照しないデータは転送されない。これにより、広域ネットワーク２５０の転送量を抑え転送時間を短縮するとともに、コアコントローラ２４０がエッジコントローラ２９０からコピーする（取得する）データの量（コアコントローラ２４０の複製量）を削減することができる。更に、エッジコントローラ２９０からコアコントローラ２４０へコピーしたデータをコアストレージ１２０内のＬＵに保存することで、その後のアクセスでは、エッジコントローラ２９０からのデータコピーが不要となり、アクセス性能の低下を抑えることができる。

　本実施例では、エッジコントローラ２９０からコアコントローラ２４０へのデータのコピーは、分析用ホスト２３０からリード要求を受け当該リード要求で指定されたページがデータ取得対象のページである場合に行われるが、この契機に加えて、リード要求の受信とは非同期的に行われてもよい。この場合、分析用ホスト２３０が初めてリード元とするページに対し非同期コピーが完了している場合、そのページに既に最新データが格納されているため、広域ネットワーク２５０を介したデータの取得が不要でリード応答時間を高速化できることが期待できる。

　また、本実施例では、コアコントローラ２４０がＬＵマッピング管理テーブル３６０とコピー状態管理テーブル３７０を格納していれば、分析用ホスト２３０は、コアコントローラ２４０を介してエッジストレージ１５０が格納するデータを参照可能である。実際にエッジストレージ１５０が保持する全データがコアコントローラ２４０にコピーされるのを待つ必要がないため、コアストレージ１２０を新規にエッジストレージ１５０と接続した場合や、エッジストレージ１５０に大量のデータが生成された場合でも、即座に分析用ホスト２３０がエッジストレージ１５０のデータを参照することが期待できる。

　実施例２を説明する。以下、実施例１との相違点を主に説明し、実施例１との共通点については説明を簡略又は省略する。

　エッジストレージ及びコアストレージのうちの少なくとも１つとしては、実施例１で示したＬＵＮとアドレス（例えばＬＢＡ（Logical Block Address））を指定したアクセス要求を受信し当該要求に従うデータにアクセスする装置に代えて、ファイルやオブジェクトといったデータセット単位でアクセスする装置が採用されてよい。特に、各拠点にファイルストレージを配置し、このファイルストレージに格納されたデータを、クラウドストレージなどのオブジェクト単位でのデータアクセスを提供するストレージシステムへデータをコピーする形態がとられることがある。実施例２では、そのような形態が採用されている。なお、「データセット」とは、アプリケーションプログラムのようなプログラムから見た１つの論理的な電子データの塊であり、例えば、レコード、ファイル、オブジェクト、キーバリューペア及びタプルのうちのいずれでもよい。また、実施例２において、ファイル、ディレクトリ及びオブジェクトのようなデータセットは、ボリューム内の要素の一例である。

　図１２は、実施例２における計算機システム８００の構成図である。

　中央データセンタ８１０（第２の拠点の一例）内は、広域ネットワーク８５０と接続された内部ネットワーク８２０を介し、オブジェクトストレージ８０２（第２のストレージ装置の一例）及び１乃至複数の分析用ホスト８３０（第２のホストの一例）が接続されている。また、ファイルゲートウェイ８３１が接続されていてもよい。オブジェクトストレージ８４０は、分析用ホスト８３０が参照するデータをオブジェクト単位で格納及び提供する装置である。オブジェクトストレージ８０２が、１以上の記憶媒体８４８とその１以上の記憶媒体８４８に対する入出力を制御するコントローラ（以下、オブジェクトコントローラ）８４０とを有する。分析用ホスト８３０は、オブジェクトストレージ８０２が格納するデータ、及びオブジェクトコントローラ８４０が透過的にアクセス可能としている分散拠点８６０のファイルストレージ８０１中のデータにアクセスし、加工又は分析を行う計算機である。なお、分析用ホスト８３０がオブジェクト単位でのデータアクセス機能を有しない場合、別途ファイル単位でのデータアクセスとオブジェクト単位でのデータアクセスを変換するファイルゲートウェイ８３１を用いて間接的にオブジェクトストレージ８４０が格納するデータにアクセスしてもよい。以後、分析用ホスト８３０がオブジェクトストレージ８４０内のデータにアクセスするとは、ファイルゲートウェイ８３１を介した間接的なアクセスする場合も含める。ファイルストレージ８０１からディレクトリ階層構造がオブジェクトストレージ８０２に格納されると、オブジェクトストレージ８０２において階層構造は維持されないが、ファイルゲートウェイ８３１は、その階層構造を表す情報を保持する。つまり、ファイルゲートウェイ８３１は、オブジェクトストレージ８０２内のオブジェクトの階層構造を管理する。ファイルゲートウェイ８３１は、例えば、パス名（ファイル名）を指定した要求（問合せ）に応答して、そのパス名に対応するオブジェクトＩＤを返すことができる。

　オブジェクトコントローラ８４０は、各分散拠点８６０（第１の拠点の一例）にあるファイルストレージ８９０（第１のストレージ装置の一例）が格納するデータを分析用ホスト８３０に透過的にアクセス可能とする機能を備える。オブジェクトコントローラ８４０（第２のコントローラの一例）は、ＣＰＵ８４１、メモリ８４２、ネットワークインタフェース８４３及びストレージインタフェース８４４を備え、それらは互いに内部で接続されている。ＣＰＵ８４１は、メモリ８４２に格納されたプログラムの記載に従い、オブジェクトコントローラ８４０の構成要素を制御する。メモリ８４２は、複数のプログラムやテーブルを格納し、ディスクキャッシュを有する。オブジェクトコントローラ８４０は、ネットワークインタフェース８４３を介し内部ネットワーク８２０を通じて分析用ホスト８３０によるアクセス要求を処理したり、広域ネットワーク８５０を通じてファイルストレージ８９０と通信したりする。また、オブジェクトコントローラ８４０は、ストレージインタフェース８４４を介し記憶媒体８４５に対するデータの読み書きを行い、記憶媒体８４５内にオブジェクトデータ８４６、オブジェクト管理テーブル８４７、スタブデータ８４８、を格納する。これらのデータは記憶媒体８４５の領域をそのままパーティションやＬＶＭ（Logical Volume Management）等の機能で区切って格納してもよいし、記憶媒体８４５上にファイルシステムを構築し、それぞれファイル単位で格納してもよい。ネットワークインタフェース８４３を介した通信プロトコルには、ＨＴＴＰ（Hypertext Transfer Protocol）を利用したＲＥＳＴ（Representational State Transfer）プロトコルや、ネットワークインタフェース２４３及びストレージインタフェース２４４のプロトコルを利用できる。また。ストレージインタフェース８４４と記憶媒体８４５間の通信プロトコルは、ストレージインタフェース２４４のプロトコルを利用できる。

　ファイルストレージ８０１が、１以上の記憶媒体８９５とその１以上の記憶媒体８９５に対する入出力を制御するコントローラ（以下、ファイルコントローラ）８９０とを有する。ファイルコントローラ８９０（第１のコントローラの一例）は、ＣＰＵ８９１、メモリ８９２、ネットワークインタフェース８９３及びストレージインタフェース８９４を備え、それらは互いに内部で接続されている。ＣＰＵ８９１は、メモリ８９２に格納されたプログラムの記載に従い、ファイルコントローラ８９０の構成要素を制御する。メモリ８９２は、複数のプログラムやテーブルを格納し、ページキャッシュを有する。ファイルコントローラ８９０は、ネットワークインタフェース８９３を介し内部ネットワーク８７０を通じてホスト８８０によるアクセス要求を受け付けたり、広域ネットワーク８５０を通じて中央データセンタ８１０内のオブジェクトストレージ８４０と通信したりする。また、ファイルコントローラ８９０は、ストレージインタフェース８９４を介し記憶媒体８９５に対するデータの読み書きを行い、記憶媒体８９５上にファイルシステム８９６を構築する。ファイルコントローラ８９０の各通信プロトコルには、ＮＦＳ（Network File System）やＳＭＢ（Server Message Block）をはじめ、オブジェクトストレージ８４０同等のものを利用可能である。また、ストレージインタフェース８９４と記憶媒体８９５間の通信プロトコルは、ストレージインタフェース２４４のプロトコルを利用できる。

　ファイルシステム８９６が、第１のボリュームの一例である。オブジェクトデータ８４６やスタブデータ８４８が格納される領域が、第２のボリュームの一例である。

　なお、各分散拠点８６０内のストレージ装置は、ファイルストレージに代えてオブジェクトストレージであってもよい。中央データセンタ８１０内のストレージ装置は、オブジェクトストレージに代えてファイルストレージでもよい。また、分散拠点８６０及び中央データセンタ８１０の一方がファイル又はディレクトリであり他方がオブジェクトであることは、散拠点８６０が格納するデータセットの種類と中央データセンタ８１０が格納するデータセットの種類とが異なっていることの一例である。データセットの種類が異なっていると、データセットのＩＤの構成が異なり、そのため、データセットのＩＤの対応関係を、例えば図１４に示すようなテーブルを用いて管理する必要がある（後述するように、図１５に示すようなテーブルが更にあると好ましい）。

　図１３は、ファイルコントローラ８９０中のメモリ８９２に格納されている各種プログラム及びテーブルを示す図である。

　メモリ８９２は、ファイルシステムプログラム９１１、データ転送プログラム９１２、第１検索テーブル９１３、第２検索テーブル９１４及びオブジェクトストレージ情報９１５を格納する。メモリ８９２は、ページキャッシュ９１６を有する。ページキャッシュ９１６は、メモリ８９２のうちの余剰領域（各種プログラム及びテーブルを格納した領域以外の領域の少なくとも一部）でよい。

　ファイルシステムプログラム９１１は、記憶媒体８９６上にファイルシステムを構築し、ディレクトリやファイル単位でのデータアクセスやデータ格納を実現するプログラムである。また、ファイルシステムプログラム９１１は、内部ネットワーク８７０を介したファイルアクセス要求（ホスト８８０によるディレクトリ又はファイルへのアクセス要求）への応答も行う。ネットワークを介したファイルアクセス要求のプロトコルには、先に述べたとおり、ＮＦＳ（Network File System）、ＳＭＢ（Server Message Block）、ＡＦＰ（Apple Filing Protocol）等が利用できる。

　データ転送プログラム９１２は、中央データセンタ８１０にあるオブジェクトストレージ８４０とのデータ送受信を行うプログラムである。

　図１４は、第１検索テーブル９１３の構成図である。

　第１検索テーブル９１３は、ファイルシステム上のディレクトリ又はファイルとオブジェクトストレージ８４０内のオブジェクトとの対応関係を示すテーブルであって、ファイルパス名からオブジェクトＩＤを検索するためのテーブルである。第１検索テーブル９１３は、ディレクトリ又はファイル毎にエントリを有する。各エントリは、パス名９２１、タイプ９２２及びオブジェクトＩＤ９２３といった情報を格納する。以下、１つのデータセット（ディレクトリ又はファイル）を例に取る（図１４の説明で「対象データセット」と言う）。

　パス名９２１は、対象データセットへのパス名を示す。パス名９２１は、対象データセットのＩＤの一例でよい。タイプ９２２は、対象データセットのタイプ（“／”（ルートディレクトリ）、“ディレクトリ”又は“ファイル”）を示す。オブジェクトＩＤ９２３は、対象データセットに対応したオブジェクトを一意に特定するＩＤである。

　第１検索テーブル９１４を利用することにより、ファイル又はディレクトリに対応したオブジェクトＩＤを含んだ更新通知を送信することが可能である。第１検索テーブル９１３は、パス名９２１に関しハッシュ値等のインデックスを保持することで、パス名９２１からエントリを高速に検索可能な形で管理される。

　図１５は、第２検索テーブル９１４の構成図である。

　第２検索テーブル９１４は、オブジェクトとディレクトリ又はファイルとの対応関係を示すテーブルであって、オブジェクトＩＤからパス名を検索するためのテーブルである。第２検索テーブル９１４は、オブジェクト毎にエントリを有する。各エントリは、オブジェクトＩＤ９３１及びパス名９３２といった情報を格納する。以下、１つのオブジェクトを例に取る（図１５の説明で「対象オブジェクト」と言う）。

　オブジェクトＩＤ９３１は、対象オブジェクトのＩＤである。パス名９３２は、対象オブジェクトに対応したデータセットへのパス名を示す、

　第２検索テーブル９１４を利用することにより、オブジェクトＩＤを指定した取得要求に応答して当該オブジェクトＩＤに対応したファイル又はディレクトリを高速に特定することが可能である。オブジェクトＩＤ９３１に関しハッシュ値等のインデックスを保持することで、オブジェクトＩＤ９３１からエントリを高速に検索可能な形で管理される。

　第１検索テーブル９１３と第２検索テーブル９１４は同内容を含むテーブルであるため、パス名とオブジェクトＩＤの両方で高速にエントリを検索可能であるならば、１つのテーブルで兼用してもよい。

　図１６は、オブジェクトコントローラ８４０中のメモリ８４２に格納されている各種プログラム及びテーブルを示す図である。

　メモリ８４２は、オブジェクト制御プログラム１０１１、オブジェクト管理テーブル１０１２及びスタブデータテーブル１０１３を格納する。メモリ８４２は、ディスクキャッシュ１０１４を有する。ディスクキャッシュ１０１４は、メモリ８４２のうちの余剰領域（各種プログラム及びテーブルを格納した領域以外の領域の少なくとも一部）でよい。

　オブジェクト制御プログラム１０１１は、オブジェクト単位でのデータ入出力を行い、且つ、分析用ホスト８３０からのアクセス要求に応答するプログラムである。オブジェクトストレージ８４０は、オブジェクトを全て一律に管理するのではなく、複数のバケットと呼ぶ単位で分類することもできる。その場合、分析用ホスト８３０はバケットＩＤとオブジェクトＩＤの対でアクセス対象を特定する。

　図１７は、オブジェクト管理テーブル１０１２の構成図である。

　オブジェクト管理テーブル１０１２は、オブジェクト制御プログラム１０１１が管理するオブジェクトの情報を示すテーブルである。オブジェクト管理テーブル１０１２は、オブジェクト毎にエントリを有する。各エントリが、オブジェクトＩＤ１０２１、更新フラグ１０２２、スタブフラグ（未コピーフラグと同等）１０２３、サイズ１０２４及び保存先１０２５といった情報を格納する。以下、１つのオブジェクトを例に取る（図１７の説明で「対象オブジェクト」と言う）。オブジェクトがその他の属性（例えば、オブジェクトの作成日時、所有者、アクセス権等の属性）を持つ場合、オブジェクト管理テーブル１０１２は、対応する列を有してもよい。

　オブジェクトＩＤ１０２１は、対象オブジェクトのＩＤである。

　更新フラグ１０２２は、ファイルストレージ８０１からオブジェクトストレージ８０２への対象オブジェクトの前回データコピー以降、ファイルコントローラ８９０からオブジェクトコントローラ８４０へ対象オブジェクトのＩＤを含んだ更新通知が送信されたか否かを示す。

　スタブフラグ１０２３は、ＬＵ（オブジェクト格納空間）を作成して以降、ファイルストレージ８０１からオブジェクトストレージ８０２に対象オブジェクトが未コピーであるか否か（対象オブジェクトに代えてそのスタブが存在するか否か）を示す。

　保存先１０２５は、対象オブジェクトのデータの格納位置（記憶媒体８４５における位置）を示す。保存先１０２５としては、ファイルシステムのパス名やＬＵ上のＬＢＡ等が格納される。

　オブジェクト管理テーブル１０１２はバケット毎に存在してもよいし、１つのオブジェクト管理テーブル１０１２上にバケットＩＤの列を加え、バケットＩＤとオブジェクトＩＤの対でオブジェクト管理テーブル１０１２上のエントリ（行）を特定可能としてもよい。

　図１８は、スタブデータテーブル１０３１の構成図である。

　スタブデータテーブル１０３１は、オブジェクト毎にエントリを有する。各エントリが、バケットＩＤ１０３１、オブジェクトＩＤ１０３２及びデータ取得先１０３３といった情報を格納する。以下、１つのオブジェクトを例に取る（図１８の説明で「対象オブジェクト」と言う）。

　バケットＩＤ１０３１は、対象オブジェクトを格納するバケットのＩＤである。オブジェクトＩＤ１０３２は、対象オブジェクトのＩＤである。データ取得先１０３３は、対象オブジェクトに対応したデータセットが格納されている位置（ファイルストレージ８０１上の位置）を示す。データ取得先１０３３は、例えば、ファイルストレージ８０１の識別子と、ファイルストレージ８０１上のファイル共有名との組合せ等で表現される。

　スタブデータテーブル１０３１は、オブジェクトとデータ取得先との対応関係を示すものであれば、図に示す以外の形式でもよい。例えばバケット内の全オブジェクトが同一のデータ取得先に対応付けられるのであれば、オブジェクトＩＤ１０３２の列は不要である。スタブデータテーブル１０１３により、分析用ホスト８３０のアクセス時に、テータ取得先１０３３が示すファイルストレージ８９０より、透過的にデータを取得可能とする。

　図１９は、スタブ作成処理のフロー図である。

　スタブ作成処理は、ファイルストレージ８０１が自身の保持するファイル又はディレクトリに対応するスタブデータをオブジェクトストレージ８０２に登録する際に実行される処理である。例えば、ファイルストレージ８０１に新規ファイルが追加された場合にスタブ作成処理が実行されたり、一定期間毎（例えば１日毎）に当該期間（例えば１日）の間に作成されたファイル群（１以上のファイル）について一括してスタブ作成処理が実行されたりしてもよい。以下、スタブ作成処理は１つのデータセット（ファイル又はディレクトリ）を対象とするが（図１９において「対象データセット」）、ファイルコントローラ８９０はスタブ作成処理を複数並列又は直列に実行することで複数のファイル又はディレクトリに対するスタブ作成を完了することもできる。

　ファイルコントローラ８９０は、対象データセットについて、オブジェクトコントローラ８４０で格納される際のオブジェクトＩＤを確定する（ステップ１１１０）。オブジェクトＩＤは一意性が保持されるのであればファイルコントローラ８９０が生成してもよいし、オブジェクトコントローラ８４０が生成してもよい。ファイルコントローラ８９０は、確定したオブジェクトＩＤを取得すると、第１検索テーブル９１３に、対象データセットに対応するパス名９２１、タイプ９２３及びオブジェクトＩＤ９２４を格納したエントリを追加する（ステップ１１２０）。同様に、ファイルコントローラ８９０は、第２検索テーブル９１４に、対象データセットに対応するパス名９３１及びオブジェクトＩＤ９３２を格納したエントリを追加する（ステップ１１３０）。続けて、ファイルコントローラ８９０は、確定したオブジェクトＩＤとオブジェクトの属性（サイズなど）とを関連付けたスタブ作成要求（オブジェクトのスタブを作成することの要求）を、オブジェクトコントローラ８４０に送信する（ステップ１１４０）。

　オブジェクトコントローラ８４０は、ファイルコントローラ８９０によるスタブ作成要求を受信すると、当該スタブ作成要求に応答して、対応するスタブデータテーブル１０３１のエントリを作成する（ステップ１１５０）。ステップ１１５０で作成されたエントリにおいて、スタブ作成要求に関連付けられているオブジェクトＩＤ１０２１が格納される。

　続けて、オブジェクトコントローラ８４０は、オブジェクト管理テーブル１０１２のエントリを作成する（ステップ１１６０）。ステップ１１６０で作成されたエントリには、ファイルコントローラ８９０によるスタブ作成要求に関連付けられているオブジェクトＩＤ１０２１及びサイズ１０２４が格納される。また、ステップ１１６０で作成されたエントリにおいて、更新フラグ１０２２は“OFF”とされ、スタブフラグ１０２３は“ON”とされる。

　このようにして、オブジェクトコントローラ８４０は、ファイルコントローラ８９０からのスタブ作成要求に応答として、当該スタブ作成要求で指定されているオブジェクトのスタブであって分析用ホスト８３０から認識されるスタブを作成する。

　図２０は、分析用ホスト８３０又はファイルゲートウェイ８３１からオブジェクトコントローラ８４０がオブジェクトの取得要求を受けた場合に行われるオブジェクトリード処理のフロー図である。

　オブジェクトストレージ８４０は、オブジェクトの取得要求を受信すると、当該取得要求に含まれるオブジェクトＩＤを用いてオブジェクト管理テーブル１０１２を参照し、対象オブジェクト（当該取得要求に含まれるオブジェクトＩＤから特定されるオブジェクト）の更新フラグ１０２２及びスタブフラグ１０２３の少なくとも１つが“ON”か否かを判断する（ステップ１２１０）。例えば、更新フラグ１０２２が“ON”は、ファルストレージ８０１上で対象オブジェクトに対応したファイル又はディレクトリの更新が行われたために、ファイルコントローラ８９０から更新通知を受けたことを意味する。この通知の方法は、ファイルコントローラ８９０からオブジェクトコントローラ８４０に対し、更新したオブジェクトＩＤの一覧を送信する方法が考えられる。この送信を受け、オブジェクトコントローラ８４０は、リストに含まれる各オブジェクトＩＤについて、オブジェクト管理テーブル１０１２中の当該オブジェクトＩＤに対応する更新フラグを“ON”にする。また、スタブフラグ１０２３が“ON”は、オブジェクトデータ８４６に対応するファイル又はディレクトリのデータを保持していないことを意味する。よって、更新フラグ１０２２及びスタブフラグ１０２３の少なくとも１つが“ON”の場合、当該オブジェクトのデータをファルストレージ８０１から取得する必要があることを意味する。その場合、オブジェクトコントローラ８４０は、データコピー処理（図２１）を開始し、オブジェクトデータ８４６がファイルシステム８９６におけるファイル又はディレクトリのデータと一致した状態とするようにする（ステップ１２２０）。その後、オブジェクトコントローラ８４０は、対象オブジェクトのデータ８４６をリードし、リードしたデータを、オブジェクトの取得要求の送信元に返す（ステップ１２３０）。

　図２１は、データコピー処理のフロー図である。データコピー処理は、オブジェクトリード処理中に実行されてもよいし、オブジェクトコントローラ８４０が他の処理を行っている際にバックグラウンドで行われてもよい。

　オブジェクトコントローラ８４０は、スタブデータテーブル１０１３を参照し、対象オブジェクト（処理対象のオブジェクト）のオブジェクトＩＤと対象オブジェクトが格納されているバケットのバケットＩＤとを用いて、対応するデータ取得先１０３３を特定する（ステップ１３０５）。オブジェクトコントローラ８４０は、ステップ１３０５で取得したデータ取得先１０３３のファイルコントローラ８９０に対し、オブジェクトＩＤを引数として関連付けた取得要求を送信する（ステップ１３１０）。

　当該取得要求を受信したファイルコントローラ８９０は、引数のオブジェクトＩＤを基に、第２検索テーブル９１４を用いて、対象オブジェクトに対応するファイル又はディレクトリのパス名９３２を特定し（ステップ１３１５）、特定したパス名９３２に従うファイル又はディレクトリのデータをファイルシステム８９６から読み込む（ステップ１３２０）。パス名９３２が示す先がディレクトリである場合、ファイルコントローラ８９０は、ディレクトリ内に格納されたすべての子データセット（各ファイル及びサブディレクトリ）に対し、スタブ作成処理を行う（ステップ１３２５、１３３０）。つまり、当該ディレクトリ内の全てのデータセットの各々のスタブがファイルシステム上に作成される。結果として、オブジェクトストレージ８０２が持つオブジェクトを用いて、ファイルストレージ８０１においてネームスペース（階層構造）を復元することができる。

　その後、ファイルコントローラ８９０は、パス名に対応するファイル又はディレクトリのデータ（ディレクトリの場合、“データ”とは、ディレクトリ内に格納されたファイル及びサブディレクトリの情報として、ファイル名及びサブディレクトリ名（パス名）と対応するオブジェクトＩＤとの対のリストを意味する）をオブジェクトストレージ８４０に返す（ステップ１３３５）。

　オブジェクトコントローラ８４０は、ファイルコントローラ８９０からの応答を受信すると、受信したデータをオブジェクトデータ８４６として書き込む（ステップ１３４０）。続けて、オブジェクトコントローラ８４０は、オブジェクト管理テーブル１０１２の更新フラグ１０２２とスタブフラグ１０２３を“OFF”にする（ステップ１３４５）。

　本実施例により、分析用ホスト８３０が分散拠点のファイルストレージ８０１が格納するデータに透過的にアクセスできるようになる。これにより、ファイルストレージ８０１からオブジェクトストレージ８０２へのデータコピーの完了をまたず、分析用ホスト８３０からファイルストレージ８０１のデータを参照可能となる。また、参照の際、対象のデータが格納されたオブジェクトのみ分散拠点８６０と中央データセンタ８１０間で広域ネットワーク８５０を通じて転送され、参照しないオブジェクトは転送されない。これにより、広域ネットワーク８５０の転送量を抑え転送時間を短縮するとともに、オブジェクトストレージ８０２がファイルストレージ８０１からコピーするデータの量（オブジェクトストレージ８０２の複製量）を削減することができる。

　また、本実施例では、オブジェクトコントローラ８４０が、ディレクトリに対応するオブジェクトのリード要求を受けると、ディレクトリ内のファイル及びサブディレクトリのスタブデータを構築する。よって、オブジェクトコントローラ８４０は、ルートディレクトリに対応するスタブデータのみ格納した状態であれば、分析用ホスト８３０やファイルゲートウェイ８３１からのデータ取得要求に対し、パスの構成要素を再帰的にスタブ化及びデータコピー処理を行える。そのため、オブジェクトストレージ８０２を新規にファイルストレージ８０１と接続した場合や、ファイルストレージ８０１に大量のファイル（及びディレクトリ）が生成された場合でも、ファイルストレージ８０１のデータをオブジェクトストレージ８０２にコピーするのを待つことなく即座に分析用ホスト８３０やファイルゲートウェイ８３１がファイルストレージ８０１のファイル又はディレクトリを参照することが期待できる。

　実施例３を説明する。以下、実施例１との相違点を主に説明し、実施例１との共通点については説明を簡略又は省略する。

　計算機システムにおいては、旧ストレージ装置から、新規購入したストレージ装置へデータを移行することがある。本実施例では、ＬＵＮとアドレス（例えばＬＢＡ）を指定したアクセス要求を処理するストレージシステムが、このようなデータ移行の際中であっても、実施例１と同様の効果を実現する。

　図２２は、実施例３における計算機システム１４００の構成図である。

　計算機システム１４００は、中央データセンタ２１０と１乃至複数の分散拠点１４６０で構成される。中央データセンタ２１０及び分散拠点１４６０は広域ネットワーク２５０により互いに接続される。中央データセンタ２１０は実施例１と同等の構成を取る。分散拠点１４６０は実施例１における分散拠点２６０とほぼ同等の構成を取るが、エッジコントローラとして、移行元エッジコントローラ（移行元エッジストレージ１４０１のエッジコントローラ）１４１０及び移行先エッジコントローラ（移行先エッジストレージ１４０２のエッジコントローラ）１４２０とがある。移行元エッジストレージ１４０１の一例が、旧ストレージ装置である。移行先エッジストレージ１４０２の一例が、新ストレージ装置である。

　移行元エッジコントローラ１４１０及び移行先エッジコントローラ１４２０は、互いに内部ネットワーク２７０を介し通信可能である。移行元エッジストレージ１４０１が格納しているデータやＬＵ構成を移行先エッジストレージ１４０２に移行中であるものとする。コントローラ１４１０及び１４２０間のデータ移行については、特許文献３に示す方式が適用可能である。特許文献３に示す方式によるデータ移行を用いると、移行元エッジコントローラ１４１０から移行先エッジコントローラ１４２０へのデータ移行が未完の状態においても、ホスト２８０が移行先エッジストレージ１４０２を介して移行元エッジストレージ１４０１のデータを透過的に参照できる。

　図１１のコアリード処理のステップ７２０の処理を、移行元エッジコントローラ１４１０から移行先エッジコントローラ１４２０へのデータ移行に適用することができる。コアコントローラ２４０が保持するＬＵマッピング管理テーブル５６２におけるコピー元ストレージ５３２及びコピー元ＬＵＮ５６３は、移行先エッジコントローラ１４２０上のＬＵを参照するように設定しておく。その場合、コアコントローラ２４０のデータ取得要求は、移行先エッジコントローラ１４２０に送信される。移行先エッジコントローラ１４２０は、ホスト２８０に、移行元エッジストレージ１４０１のデータを透過的に参照する機能を備えている。同様に、移行先エッジコントローラ１４２０は、コアコントローラ２４０からのデータ取得要求に対し、移行元エッジストレージ１４０１のデータを透過的に参照する機能を適用することで、移行元エッジストレージ１４０１にあるデータを取得することができる。

　本実施例によれば、分散拠点１４６０においてエッジストレージ１４０１及び１４０２間のデータ移行を実施している最中であっても、中央データセンタ２１０内の分析用ホスト２３０は、移行元エッジストレージ１４０１及び移行先エッジストレージ１４０２間のデータの所在を問わず、コアコントローラ２４０を介し分散拠点１４６０内のデータを参照することができる。

　なお、本実施例において、移行元エッジストレージ１４０１は、分散拠点１４６０の外に存在していてもよい。移行元エッジストレージ１４０１は、第３のストレージ装置の一例である。移行元エッジストレージ１４０１から移行先エッジストレージ１４０２にデータを移行している最中において、移行先エッジストレージ１４０２が、取得要求をコアストレージ１２０から受信した場合、当該取得要求に従う取得対象の最新データが移行先エッジストレージ１４０２に移行済みか否かを判断する。当該判断の結果が真の場合、移行先エッジストレージ１４０２が、当該最新データをコアストレージ１２０に返す。当該判断の結果が偽の場合、移行先エッジストレージ１４０２が、当該最新データを移行元エッジストレージ１４０１から取得してコアストレージ１２０に返す。

　実施例４を説明する。以下、実施例２との相違点を主に説明し、実施例２との共通点については説明を簡略又は省略する。

　本実施例は、分析拠点においてファイルストレージ間でデータ移行の際中である場合の実施例である。

　図２３は、実施例４における計算機システム１５００の構成図である。

　計算機システム１５００は、中央データセンタ８１０と１乃至複数の分散拠点１５６０で構成される。中央データセンタ８１０及び分散拠点１５６０は広域ネットワーク８５０により互いに接続される。中央データセンタ８１０は実施例２と同等の構成を取る。分散拠点１５６０は実施例２における分散拠点８６０とほぼ同等の構成を取るが、ファイルストレージとして、移行元ファイルストレージ１５０１及び移行先ファイルストレージ１５０２とが存在する。移行元ファイルストレージ１５０１は、コントローラ（以下、移行元ファイルコントローラ）１５１０を含む。移行先ファイルストレージ１５０２は、コントローラ（以下、移行先ファイルコントローラ）１５２０を含む。

　移行元ファイルコントローラ１５１０及び移行先ファイルコントローラ１５２０は、互いに内部ネットワーク８７０を介し通信可能である。移行元ファイルコントローラ１５１０からファイルやディレクトリを移行先ファイルコントローラ１５２０に移行中であるとする。ファイルコントローラ１５１０及び１５２０間のデータ移行については、特許文献４に示す方式が適用可能である。特許文献４に示す方式によるデータ移行を用いると、移行元ファイルコントローラ１５１０から移行先ファイルコントローラ１５２０へのデータ移行が未完の状態においても、ホスト８８０が移行先ファイルストレージ１５０２を介して移行元ファイルストレージ１５０１のデータを透過的に参照できる。

　移行先ファイルコントローラ１５２０は、実施例２におけるテーブルに加え、図２４に示す移行用スタブデータテーブル１６００及び図２５に示すデータ要求元管理テーブル１６５０をメモリ中に格納する

　図２４は、移行用スタブデータテーブル１６００の構成図である。

　移行用スタブデータテーブル１６００は、移行元ファイルストレージ１５０１上のファイル又はディレクトリと移行先ファイルストレージ１５０２上のファイル又はディレクトリとの対応関係を示す。移行用スタブデータテーブル１６００は、移行先ファイルストレージ１５０２上のデータセット（ファイル、ディレクトリ若しくはスタブ）毎にエントリを有する。各エントリは、ファイルパス１６０１、データ移行元１６０２、ファイルパス１６０３及びスタブフラグ１６０４といった情報を格納する。以下、１つのデータセットを例に取る（図２４の説明で「対象データセット」と言う）。

　ファイルパス１６０１は、対象データセットのパス名を示す。データ移行元１６０２は、対象データセットの移行元データセットを格納する移行元ファイルストレージ１５０１を一意に識別する識別子を示す。ファイルパス１６０３は、対象データセットの移行元データセットのパス名（移行元ファイルストレージ１５０１上におけるファイルパス）を示す。スタブフラグ１６０４は、対象データセットの複製データを移行先ファイルストレージ１５０２自身のファイルシステムに格納しているか否かを示す。なお、スタブフラグ１６０４は、第１検索テーブル９１３に含まれてもよい。

　図２５は、データ要求元管理テーブル１６５０の構成図である。

　データ要求元管理テーブル１６５０は、ホスト８８０又はオブジェクトストレージ８４０が移行先ファイルストレージ１５０２にファイルアクセス要求を送信する際、移行先ファイルストレージ１５０２が応答を返すまで一時的にメモリ上に格納するテーブルである。データ要求元管理テーブル１６５０は、ファイルアクセス要求毎にエントリを有する。各エントリは、要求先ファイルのパス名１６５１と、ファイルアクセス要求の送信元の識別子を示す要求元１６５２といった情報を格納する。識別子として、例えばＩＰアドレス、ＷＷＮ、ホスト名等が利用できる。

　図２６は、移行先リード処理のフロー図である。

　移行先リード処理は、ホスト８８０又はオブジェクトストレージ８４０から移行先ファイルコントローラ１５２０がファイルリード要求を受信した場合に移行先ファイルコントローラ１５２０により実行される。または、移行先リード処理は、データコピー処理においてステップ１３２０として実行される。

　移行先ファイルコントローラ１５２０は、ファイルリード要求を受信すると、移行用スタブデータテーブル１６００から、当該リード要求に対応したファイルパス１６０１に対応するスタブフラグ１６０４を参照する（ステップ１７０５）。

　参照したスタブフラグ１６０４が“OFF”の場合、移行先ファイルコントローラ１５２０は、移行先ファイルストレージ１５０２のファイルシステム上に移行元ファイルストレージ１５０１と同じデータが格納されているため、移行先ファイルストレージ１５０２のファイルシステム上のデータを要求元に返す（ステップ１７４５）。

　参照したスタブフラグが“ON”の場合、移行先ファイルコントローラ１５２０は、移行先ファイルストレージ１５０２のファイルシステム上に移行元ファイルストレージ１５１０と同じデータが格納されていないため、移行元ファイルストレージ１５１０にデータ取得要求を送信する。そのため、移行先ファイルコントローラ１５２０は、移行用スタブデータテーブル１６００中のデータ移行元１６０２及び移行元ファイルパス１６０３を参照し、リード対象ファイル（ファイルリード要求で指定されたファイル）に対応する移行元ファイルストレージ１５１０及び移行元ファイルストレージ１５１０中のファイルを特定する（ステップ１７１０）。続けて、移行先ファイルコントローラ１５２０は、リード対象ファイルに対応した要求先ファイル１６５１及びファイル要求元１６５２をデータ要求元管理テーブル１６５０に登録する（ステップ１７１５）。そして、移行先ファイルコントローラ１５２０は、移行元ファイルストレージ１５１０から、リード対象ファイルに対応したファイル（若しくはディレクトリ）のデータを取得する（ステップ１７２０）。続けて、移行先ファイルコントローラ１５２０は、ステップ１７１５で登録したデータ要求元管理テーブル１６５０の要求元１６５２を参照し、要求元が分散拠点１５６０外部にあるオブジェクトストレージ８０２か否かを判断する（ステップ１７２５）。

　要求元がオブジェクトストレージ８０２である場合、移行先ファイルコントローラ１５２０は、ステップ１７２０で取得した移行元ファイルストレージ１５０１のデータをそのまま（移行先ファイルストレージ１５０２のファイルシステムに格納すること無しに）要求元に返す（ステップ１７３０）。

　要求元がオブジェクトストレージ８０２ではない場合、移行先ファイルコントローラ１５２０は、ステップ１７２０で取得した移行元ファイルストレージ１５０１のデータを一旦移行先ファイルストレージ１５０２のファイルストレージに書き込み（ステップ１７３５）、移行用スタブデータテーブル１６００上のスタブフラグ１６０４を“OFF”にする（ステップ１７４０）。その上で、移行先ファイルコントローラ１５２０は、ファイルシステムに書き込んだデータを要求元に返す（ステップ１７４５）。ステップ１７４５では、移行先ファイルコントローラ１５２０は、ステップ１７３０同様、ステップ１７２０で取得した移行元ファイルストレージ１５０１のデータをそのまま返してもよい。その場合、ファイルシステムへのアクセス回数を削減することができる。

　本実施例によれば、分散拠点１５６０においてファイルストレージ１５０１及び１５０２間のデータ移行を実施している最中であっても、分析用ホスト８３０は、移行元ファイルストレージ１５０２及び移行元ファイルストレージ１５０１間のデータの所在を問わず、オブジェクトストレージ８０２を介し分散拠点１５６０内のデータを参照することができる。さらに、移行先ファイルコントローラ１５２０は、ファイルの要求元が分散拠点１５６０内かオブジェクトストレージ８０２かを認識して、移行元ファイルストレージ１５１０から取得したデータを自身のファイルシステムに書き込むか否かを判断する。これにより、オブジェクトストレージ８０２からの要求に対しては移行元ファイルストレージ１５０１から取得したデータを自身のファイルシステムに書かないように制御することで、オブジェクトストレージ８４０からの要求に応答して移行先ファイルコントローラ１５２０が実行するアクセス（入出力）の回数を削減し、オブジェクトストレージ８０２からの要求がホスト８８０のアクセス性能へ及ぼす影響を抑えることが期待できる。

　なお、本実施例において、移行元ファイルストレージ１５０１は、分散拠点１５６０の外に存在していてもよい。移行元ファイルストレージ１５０１は、第３のストレージ装置の一例である。

　実施例５を説明する。以下、実施例１との相違点を主に説明し、実施例１との共通点については説明を簡略又は省略する。なお、実施例５の説明は、主に実施例１との対比で行われるが、実施例５の説明において、「エッジストレージ」及び「エッジコントローラ」は、「ファイルストレージ」及び「ファイルコントローラ」と読み替えることができる。また、「コアストレージ」及び「コアコントローラ」は、「オブジェクトストレージ」及び「オブジェクトコントローラ」と読み替えることができる。

　実施例１（及び実施例２乃至実施例４）では、分析用ホスト２３０がデータにアクセスした際、オンデマンドでデータをエッジストレージ１５０からコアスコントローラ２４０がデータをコピー（取得）する。このため、分析用ホスト２３０が短時間に大量のデータにアクセスしたとき、これらのデータの更新フラグが“ON”であった場合、この延長で大容量のデータをエッジストレージ１５０からコアストレージ１２０へコピーすることが発生し得る。各分散拠点２６０と中央データセンタ２１０間のネットワーク帯域が狭い場合、データコピーに長時間を要し、分析用ホスト２３０で実行する分析処理の性能が低下する懸念がある。

　そこで、本実施例では、これを防ぐため、エッジストレージ１５０で更新されたデータをコアストレージ１２０へ直ちにコピーすることで、各分散拠点２６０と中央データセンタ２１０間で、一度に大容量のデータがコピーされることを抑えることができる。このとき、分析用ホスト２３０で分析処理を実行する直前に、コアコントローラ２４０でスナップショットを作成することにより、分析用ホスト２３０のデータアクセスと、エッジストレージ１５０からコアストレージ１２０へのデータコピーとが衝突して分析用ホスト２３０がアクセスするデータの一貫性を喪失することを防ぐことができる。

　図２７は、実施例５の概要を示す模式図である。

　エッジコントローラ２９０はボリューム１８９１のスナップショットを作成しない。ボリューム１８９１（第１のボリュームの一例）の更新が行われた場合、エッジコントローラ２４０は、差分データ（更新前ボリュームと更新後ボリュームとの差分としてデータ）をコアコントローラ２４０に送る。コアコントローラ２４０は、受信した差分データをコピー用ボリューム１８２２（第３のボリュームの一例）に格納し、そのボリューム１８２２のスナップショットとして参照用ボリューム１８２１（第２のボリュームの一例）を作成する。分析用ホスト２３０は、参照用ボリューム１８２１を参照し、分析を行う。

　本実施例におけるＬＵマッピング管理テーブルはエッジコントローラ２９０中のメモリ２９２に格納されている。また、ＬＵマッピング管理テーブルは、実施例１のＬＵマッピング管理テーブル３６０と異なる構成を持つ。

　図２８は、本実施例におけるＬＵマッピング管理テーブル１９００の構成図である。

　ＬＵマッピング管理テーブル１９００は、エッジストレージ１５０が保持するＬＵ毎にエントリを持つ。各エントリは、ＬＵＮ１９０１、コピー先ストレージ１９０２及びコピー先ＬＵＮ１９０３といった情報を格納する。以下、１つのＬＵを例に取る（図２８の説明で「対象ＬＵ」と言う）。

　ＬＵＮ１９０１は、対象ＬＵのＬＵＮである。コピー先ストレージ１９０２は、コピー先のコアストレージ１２０を一意に示す識別子である。コピー先ＬＵＮ１９０３は、コピー先のコピー用ボリューム１８２２のＬＵＮである。コピー先のコアストレージ１５０を一意に示す識別子には、ＩＰアドレスやＷＷＮが利用できる。

　本実施例では、コアストレージコントローラ２４０中のメモリ２４２及びエッジストレージコントローラ２９０中のメモリ２９２に格納されるプログラムの動作及びテーブル種別が実施例１と異なる。本実施例では、スナップショット管理テーブル３３０はコアストレージコントローラ２４０中のメモリ２４２に格納され、ＬＵマッピング管理テーブル１９００は前述のとおりエッジストレージコントローラ２９０に格納される。また、コピー状態管理テーブル３７０はメモリ２４２及びメモリ２９２のいずれも要しない。

　図２９は、ホスト２８０からエッジコントローラ２９０がライト要求を受信した場合にエッジコントローラ２９０により開始されるライト処理のフロー図である。

　エッジコントローラ２９０は、ライト要求に従うデータを自身が管理するボリューム（ライト要求で指定されているボリューム）に書き込む（ステップ２０１０）。次に、エッジコントローラ２９０は、ライト先ボリュームのＬＵＮを基に、ＬＵマッピング管理テーブル１９００を参照し、対応するコピー先ストレージ１９０２とコピー先ＬＵＮ１９０３を特定する（ステップ２０２０）。続けて、エッジコントローラ２９０は、特定したコピー先ストレージ１９０２に対応するコアコントローラ２４０に、特定したＬＵＮと、書込み先アドレス（例えばライト要求で指定されたアドレス）、書込みサイズ（ライト対象データのサイズ）、ライト対象データ（ライト要求に従うデータ）とが関連付けられたライト要求を送信する（ステップ２０３０）。

　コアコントローラ２４０は、そのライト要求を受信すると、そのライト要求に関連付いたＬＵＮに対応するコピー用ボリューム１８２２のうちの、そのライト要求に関連付いたアドレスが属する領域に、ライト対象データを書き込む（ステップ２０４０）。

　なお、ステップ２０２０、２０３０及び２０４０は、ホスト２８０にライト要求に対する応答を返す前に実施されてもよいし、その応答の後に実施されてもよい。

　コアコントローラ２４０は、エッジコントローラ２９０の挙動とは関係なく、任意のタイミングでスナップショットを作成できる。例えば、一定時間毎にスナップショットを作成するなどの運用が考えられる。逆に、エッジコントローラ２９０やホスト２８０の動作と連動してスナップショットをコアコントローラ２４０が作成してもよい。例えば、ホスト２８０が一連のデータを書き込む際、ホスト２８０とコアコントローラ２４０で通信を行い、データの整合性が取れた状態を通知し、その契機で実施する、などの動作が考えられる。

　実施例６を説明する。以下、実施例１及び５との相違点を主に説明し、実施例１及び５との共通点については説明を簡略又は省略する。なお、実施例６の説明は、主に実施例１及び５との対比で行われるが、実施例６の説明において、「エッジストレージ」及び「エッジコントローラ」は、「ファイルストレージ」及び「ファイルコントローラ」と読み替えることができる。また、「コアストレージ」及び「コアコントローラ」は、「オブジェクトストレージ」及び「オブジェクトコントローラ」と読み替えることができる。

　図３０は、実施例６の概要を示す模式図である。

　実施例６では、コアコントローラ２４０が、実施例１（及び実施例２乃至４）のようなオンデマンド型データコピー（分析用ホスト１３０からのリード要求に応答してデータを分散拠点１４０からコピーすること）と、実施例５のようなバックグラウンド型データコピー（分析用ホスト１３０からのリード要求の有無に関係無くデータを分散拠点１４０からコピーすること）とを併用又は切り替える。つまり、オンデマンド型データコピーとバックグラウンド型データコピーの両方が同時期に行われてもよいし、それらのコピーの一方が採用されている期間は他方が採用されないでもよい。

　以下が、１つの具体例である。

　参照用ボリューム２８２１は、第２のボリュームの一例であり、仮想的なボリュームであるとする。参照用ボリューム２８２１のページの参照先は、コピー用ボリューム２８２２内のページであることもあれば、上述したＤ－ｖｏｌ内のページであることもあってもよい。

　また、エッジコントローラ２９０は、実施例１と同様、ホスト１６０からライト要求を受けた場合、ライト先ページのＩＤを含んだ更新通知をコアコントローラ２４０に送信するようになっている。結果として、更新ビットマップテーブル３４０の更新がコピー状態管理テーブル３７０に反映されるようになっている。エッジコントローラ２９０が、ボリューム２８９１（第１のボリュームの一例）を提供する。

　コアコントローラ２４０は、参照用ボリューム２８２１について、新規ページアクセス回数を管理している。「新規ページ」とは、参照用ボリューム２８２１が分析用ホスト１３０に提供されてから初めてアクセス先（リード元又はライト先）とされたページである。

　コアコントローラ２４０は、参照用ボリューム２８２１の新規ページにアクセスされる都度に、新規ページアクセス回数を更新（例えばインクリメント）する。

　コアコントローラ２４０は、新規ページアクセス回数を、定期的に０（ゼロ）にリセットする。リセットの契機は、例えば，分析処理の実行スケジュールに合わせた「分析処理の実行前」であってもよいし、所定周期毎であってもよい。

　新規ページアクセス回数が０ということは、分析処理に必要なデータはすべてエッジストレージ１５０から取得済ということになる。この状態は、参照用ボリューム２８２１に十分にデータが格納されているとみなす条件である格納状態条件に適合した状態である。格納状態条件の一例が、新規ページアクセス回数が所定回数以下（例えば０）である。格納状態条件の別の一例は、参照用ボリューム２８２１の使用率が所定使用率以上である。参照用ボリューム２８２１の使用率とは、参照用ボリューム２８２１の容量に対する、参照用ボリューム２８２１に格納されているデータ（参照先が存在するページ）の量の割合である。

　コアコントローラ２４０は、定期的に又は不定期的に、格納状態条件が満たされているか否かを判断する（Ｓ３１）。

　＜格納状態条件が満たされていない場合（例えば、新規ページアクセス回数が１以上の場合）＞

　コアコントローラ２４０は、バックグラウンド型データコピーを開始せず、オンデマンド型データコピーを採用している状態を維持する（Ｓ３２）。つまり、コアコントローラ２４０は、分析用ホスト１３０からリード要求を受け（Ｓ２１）、コアリード処理を行う。

　すなわち、コアコントローラ２４０は、そのリード要求で指定されたＬＵに対応するコピー状態管理テーブル３７０を参照し（図３１：ステップ２１１０）、リード元ページ（リード要求で指定されたアドレスに属するページ）に対応するエントリを特定する。

　特定したエントリ内の未コピーフラグ５７３“ON”の場合（つまり、リード元ページが新規ページの場合）、コアコントローラ２４０は、新規ページアクセス回数をインクリメントし（図３０：Ｓ２２、図３１：ステップ２１３０）、リード対象データの取得要求をエッジストレージ１５０に送信する（図３１：ステップ２１５０）。これにより、コアコントローラ２４０は、リード対象データをエッジストレージ１５０から取得する（図３０：Ｓ２３）。コアコントローラ２４０は、取得したリード対象データをリード元ページに格納し（例えば、リード元ページに割り当てた空きＤ－ｖｏｌページに格納し）、そのリード対象データを当該ページから読み出して分析用ホスト１３０に返す。この後、コアコントローラは、コピー状態管理テーブル３７０における当該ページの更新フラグ５７２及び未コピーフラグ５７３を共に“OFF”にする。

　特定したエントリ内の更新フラグ５７２“ON”の場合（すなわち、未コピーフラグがONであることに起因するコピーが実行されて以降、エッジストレージで当該ページが更新され、かつその更新がエッジコントローラからコアコントローラに通知されたものの、いまだ最新データが取得されていない場合）、コアコントローラ２４０は、リード対象データの取得要求をエッジストレージ１５０に送信する（図３１：ステップ２１５０）。コアコントローラ２４０は、取得したリード対象データをリード元ページに格納し（例えば、リード元ページに新たに割り当てた空きＤ－ｖｏｌページ又は割当て済のＤ－ｖｏｌページに格納し）、そのリード対象データを当該ページから読み出して分析用ホスト１３０に返す。この後、コアコントローラは、コピー状態管理テーブル３７０における当該ページの更新フラグ５７２を“OFF”にする。

　＜格納状態条件が満たされている場合（例えば、新規ページアクセス回数が０の場合）＞

　コアコントローラ２４０は、バックグラウンド型データコピーを開始する（図３０：Ｓ３３）。つまり、コアコントローラ２４０は、エッジストレージ１５０において更新されたデータがあることを検知した場合（更新フラグ５７２“ON”に対応したページがある場合）、当該データをエッジストレージ１５０からコピー用ボリューム２８２２（第３のボリュームの一例）にコピーする（Ｓ３４）。

　実施例６では、オンデマンド型データコピーとバックグラウンド型データコピーとが自動で切り帰られるが、管理者等の手動により切り替えられてもよい。例えば、コアストレージ２４０は、参照用ボリューム２８２１の格納状態に関する情報（例えば新規ページアクセス回数）を管理システム（ストレージシステムを管理するシステム）に通知し、当該情報を見た管理者の指示を管理システムから受けて、バックグラウンド型データコピーを開始するか否かを決定してもよい。コアコントローラ２４０は、バックグラウンド型データコピーの開始後、リード元ページに対応した更新フラグ５７２が“ON”であるか否かに関わらずオンデマンド型データコピーを行わないでもよいし、リード元ページに対応した更新フラグ５７２が“ON”の場合はオンデマンド型データコピーも行ってもよい。

　実施例６によれば、実施例１（及び実施例２乃至４）の効果と実施例５の効果の両方の効果を奏することが期待できる。

　以上、本発明の幾つかの実施例を説明したが、本発明は、これらの実施例に限定されるものでなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。

　例えば、コアコントローラ２４０（又はオブジェクトコントローラ８４０）は、分析用ホストからのリード要求を受けたとき、前回更新通知を発行して以降に更新されたページ（又はデータセット）を示す更新通知をエッジコントローラ２９０（又はファイルコントローラ８９０）に要求し、当該要求に応答して受けた更新通知（例えば更新ビットマップテーブル３４０）を基に、コピー状態管理テーブル３７０（又はオブジェクト管理テーブル１０１２）を更新してもよい。

２００：計算機システム

Claims

　第１の拠点に存在する第１のストレージ装置と、
　第２の拠点に存在するストレージ装置であって、前記第１のストレージ装置とネットワークを介して接続されたストレージ装置である第２のストレージ装置と
を有し、
　前記第１のストレージ装置が、それぞれがボリューム領域又はデータセットである複数の第１の要素を含むことが可能な第１のボリュームを提供し、
　前記第２のストレージ装置が、それぞれがボリューム領域又はデータセットであり複数の第１の要素に対応した複数の第２の要素を含むことが可能な第２のボリュームを提供し、
　前記第１のストレージ装置が、第１のホストからのライト要求に従い更新された第１の要素に関する更新通知を前記第２のストレージ装置に送信し、
　前記第２のストレージ装置が、前記更新通知を受信した場合、当該更新通知を基に特定された第２の要素について、当該第２の要素に対応した第１の要素のデータが最新データであると管理し、
　前記第２のストレージ装置が、第２のホストからリード要求を受けた場合、
　　（Ａ）当該リード要求から特定された第２の要素であるリード元第２要素に対応した第１の要素のデータが最新データであるか否かを判断し、
　　（Ｂ）（Ａ）の判断結果が真の場合、前記最新データの取得要求を前記第１のストレージ装置に送信し、
　　（Ｃ）当該取得要求に応答して前記第１のストレージ装置から取得された最新データを、前記リード元第２要素のデータとし、且つ、当該最新データを前記第２のホストに返す、
ストレージシステム。
　各第１の要素及び各第２の要素は、いずれも、ボリューム領域であり、
　前記更新通知は、最新世代の前記第１のボリュームと、更新通知が前回送信されたときの世代の前記第１のボリュームとの差分に相当する第１の要素のＩＤを含む、
請求項１記載のストレージシステム。
　各第１の要素及び各第２の要素は、いずれも、ボリューム領域であり、
　前記第２のストレージ装置が、コピー管理情報を有し、
　前記コピー管理情報は、第２の要素毎に、
　　前記第１のストレージ装置から前記第２のストレージ装置への前回データコピー以降に当該第２の要素に対応した第１の要素のＩＤを含む更新通知を受けたか否かを示す第１の情報要素と、
　　前記第２のボリュームが作成されて以降に、前記第１のストレージ装置から当該第２の要素に対してデータが未コピーであるか否かを示す第２の情報要素と
を含み、
　前記リード元第２要素に対応した第１及び第２の情報要素のうちの少なくとも１つが肯定的な値であれば、（Ａ）の判断結果が真である、
請求項１記載のストレージシステム。
　前記第２のストレージ装置が、前記更新通知を受信した場合、当該更新通知から特定された第１の要素に対応した第２の要素についての第１の情報要素の値を、肯定的な値に更新する、
請求項３記載のストレージシステム。
　前記第２のストレージ装置は、前記第１のストレージ装置が前記第１のホストから前記ライト要求を受信した場合に当該ライト要求に従い更新された第１の要素に関する前記更新通知を受信する、
請求項１記載のストレージシステム。
　各第１の要素及び各第２の要素は、いずれも、データセットであり、
　前記第１のストレージ装置が、前記第２のストレージ装置に、データセットのスタブを作成することの要求であるスタブ作成要求を送信し、
　前記第２のストレージ装置は、前記第１のストレージ装置からの前記スタブ作成要求に応答として、当該スタブ作成要求で指定されているデータセットのスタブであって前記第２のホストから認識されるスタブを作成し、
　前記リード要求は、前記作成されたスタブを指定したリード要求であり、
　前記取得要求は、前記スタブに対応したデータセットの取得要求である、
請求項１記載のストレージシステム。
　前記第２のストレージ装置が、コピー管理情報を有し、
　前記コピー管理情報は、第２の要素毎に、
　　前記第１のストレージ装置から前記第２のストレージ装置への前回データコピー以降に当該第２の要素に対応した第１の要素のＩＤを含む更新通知を受けたか否かを示す第１の情報要素と、
　　前記第１のストレージ装置から当該第２の要素としてのデータセットがコピーされたことに代えて当該データセットのスタブか存在するか否かを示す第２の情報要素と
を含み、
　前記リード元第２要素に対応した第１及び第２の情報要素のうちの少なくとも１つが肯定的な値であれば、（Ａ）の判断結果が真である、
請求項６記載のストレージシステム。
　第１の要素であるデータセットの種類と、第２の要素であるデータセットの種類とが異なっており、
　前記第１のストレージ装置が、
　　第１の要素のＩＤと第２の要素のＩＤとの対応関係を示す第１の検索用情報と、
　　第２の要素のＩＤと第１の要素のＩＤとの対応関係を示す第２の検索用情報と
を有し、
　前記第１のストレージ装置が、当該更新された第１の要素のＩＤに対応した第２の要素のＩＤを前記第１の検索用情報から特定し、
　前記更新通知は、前記特定された第２の要素のＩＤを含む更新通知であり、
　前記取得要求は、第２の要素のＩＤとして前記スタブのＩＤであるスタブＩＤを含み、
　前記第１のストレージ装置が、
　　（Ｆ）当該取得要求内のスタブＩＤに対応した第１の要素のＩＤを前記第２の検索用情報から特定し、
　　（Ｇ）（Ｆ）で特定したＩＤに対応した第１の要素としてのデータセットを前記第２のストレージ装置に返す、
請求項６記載のストレージシステム。
　各第１の要素は、ファイル又はディレクトリであり、
　各第２の要素は、オブジェクト又はそのスタブであり、
　前記第１のストレージ装置は、（Ｆ）で特定したＩＤに対応した第１の要素としてのデータセットがディレクトリの場合、
　　（Ｈ）当該ディレクトリに格納されている全てのデータセットの各々のスタブを前記第１のボリュームに作成する、
請求項８記載のストレージシステム。
　第３のストレージ装置から前記第１のストレージ装置にデータを移行している最中において、前記第１のストレージ装置が、前記取得要求を前記第２のストレージ装置から受信した場合、
　　当該取得要求に従う取得対象の最新データが前記第１のストレージ装置に移行済みか否かを判断し、
　　当該判断の結果が真の場合、当該最新データを前記第２のストレージ装置に返し、
　　当該判断の結果が偽の場合、当該最新データを前記第３のストレージ装置から取得して前記第２のストレージ装置に返す、
請求項１記載のストレージシステム。
　各第１の要素及び各第２の要素は、いずれも、データセットであり、
　前記取得対象として前記第１のストレージ装置に存在する対象がデータセットのスタブの場合、前記判断の結果が偽である、
請求項１０記載のストレージシステム。
　前記第３のストレージ装置から前記第１のストレージ装置にデータを移行している最中において受信した要求の要求元が、前記第２のストレージ装置であるか前記第１のホストであるかを判断し、
　前記要求元が前記第２のストレージ装置の場合、前記受信した要求は前記取得要求であり、前記第１のストレージ装置は、前記第３のストレージ装置から取得したデータを、前記第１のボリュームに格納すること無しに、前記第２のストレージ装置に返し、
　前記要求元が前記第１のホストの場合、前記受信した要求はリード要求であり、前記第１のストレージ装置は、当該リード要求に従うデータであり前記第３のストレージ装置から取得したデータを、前記第１のボリュームに格納して、前記第１のホストに返す、
請求項１０記載のストレージシステム。
　前記第２のストレージ装置は、第３のボリュームを更に有し、
　前記第２のストレージ装置は、
　　前記第２のボリュームに十分にデータが格納されているとみなす条件である格納状態条件が満たされているか否かを判断し、
　　当該判断の結果が偽の場合、前記第２のホストからのリード要求に応答して当該リード要求から特定された第２の要素に対応した第１の要素のデータが最新データであれば当該最新データを前記第１のストレージ装置から取得することであるオンデマンド型データコピーを採用している状態を維持し、
　　当該判断の結果が真の場合、前記第２のホストからのリード要求の有無に関わらずデータを前記第１のストレージ装置から前記第３のボリュームに取得することであるバックグラウンド型データコピーを開始する、
請求項１記載のストレージシステム。
　前記格納状態条件が満たされているとは、前記第２のストレージ装置に新規にアクセスされる第２の要素の数が所定数未満であることである、
請求項１３記載のストレージシステム。
　第２のストレージ装置が、第１のホストからのライト要求に従い更新された第１の要素に関する更新通知を、第１のストレージ装置から受信し、
　　前記第１のストレージ装置は、それぞれがボリューム領域又はデータセットである複数の第１の要素を含むことが可能な第１のボリュームを提供し、第１の拠点にある装置であり、
　　前記第２のストレージ装置は、それぞれがボリューム領域又はデータセットであり複数の第１の要素に対応した複数の第２の要素を含むことが可能な第２のボリュームを提供し、第２の拠点にある装置であり、
　前記第２のストレージ装置が、前記更新通知を受信した場合、当該更新通知を基に特定された第２の要素について、当該第２の要素に対応した第１の要素のデータが最新データであると管理し、
　前記第２のストレージ装置が、第２のホストからリード要求を受けた場合、
　　（Ａ）当該リード要求から特定された第２の要素であるリード元第２要素に対応した第１の要素のデータが最新データであるか否かを判断し、
　　（Ｂ）（Ａ）の判断結果が真の場合、前記最新データの取得要求を前記第１のストレージ装置に送信し、
　　（Ｃ）当該取得要求に応答して前記第１のストレージ装置から取得された最新データを、前記リード元第２要素のデータとし、且つ、当該最新データを前記第２のホストに返す、
データ転送制御方法。