WO2016185573A1

WO2016185573A1 - 重複排除ストレージにおけるボリュームバックアップ・リストア方法

Info

Publication number: WO2016185573A1
Application number: PCT/JP2015/064401
Authority: WO
Inventors: 高岡　伸光; 智大川口
Original assignee: 株式会社日立製作所
Priority date: 2015-05-20
Filing date: 2015-05-20
Publication date: 2016-11-24

Abstract

第１のストレージは、複数の論理ブロックに分割して管理し、複数の論理ブロックに各々格納されるデータの重複関係を重複管理情報として管理し、複数のボリュームのうちの二以上のボリュームをグループとして管理する。第１のストレージは、重複管理情報に基づいて、グループ内のあるボリュームについて、複数の論理ブロックごとに、グループに属する他のボリューム内の論理ブロックとの重複関係を示す重複情報を作成してバックアップサーバに送信する。バックアップサーバは、重複情報を参照し、グループに属するボリューム内の第１の論理ブロックと重複する第２の論理ブロックを特定し、第１の論理ブロックに対応するデータが第２のストレージへ送信済みである場合には、第２の論理ブロックに対応するデータを第２のストレージへ送信しない。

Description

重複排除ストレージにおけるボリュームバックアップ・リストア方法

　本発明は、データストレージシステム(以下ストレージ)において、重複排除が適用されたボリュームを効率的に複製する技術に関する。

　企業情報システムではデータが年々増加しており、システムの管理・調達コストを増大させている。このため、重複排除技術等のデータ量削減技術が進展している。また、データを災害等による消失から保護するため、データのバックアップが行なわれている。重複排除技術を導入するシステムでは、データのバックアップに伴うデータ転送量削減のため、重複排除済みの状態のデータをバックアップすることが求められる。

　特許文献1には、ストレージコントローラが、配下のストレージのすべてのデータセグメントの配置と重複関係を管理する。あるストレージから別のストレージへデータセグメントをコピーするとき、コピー先ストレージに同一データが有れば送らず、重複関係のみ更新するデータ複製方法が開示されている。

　特許文献2には、ストレージコントローラからバックアップ用ストレージコントローラへバックアップのためデータを送信するとき、送信済みデータセグメントのフィンガープリント値(FP)を記憶しておき、次回以降のバックアップで、データが送信済みかをFPを使って判定し、送信済みであれば再送信しない方法が開示されている。

WO 2010/015648 US 2011/0167221

　上記特許文献に記載のいずれの方法も、重複排除済みデータを送信するためにストレージ固有の方法を用いる。例えば特許文献1に記載の方法では、データと配下のストレージの関係はすべてコントローラで管理され、配下のストレージにおけるデータのレイアウトはコントローラにより制御されており、元のデータのレイアウトとは異なっている。このため、配下のストレージのバックアップデータに対し、標準的なI/Oインタフェースでコントローラを介さずにアクセスしても、元のデータを取り出すことができない。また、特許文献2に記載の方法では、バックアップデータはFPとデータの関係としてバックアップ先ストレージに格納される。このため、バックアップストレージにコントローラを介さずにアクセスしても、元のデータを得ることはできない。すなわち、いずれの方法も、バックアップデータをリストアするために、バックアップデータを作成したコントローラを介さなければならない。このことは、災害等によりコントローラが故障した場合に、復旧時間を増大させることになる。これを回避するため、これらのコントローラの管理下にあるデータに対し、標準的なI/Oインタフェースを使ってバックアップデータを作成しようとする場合、標準的なI/Oインタフェースではデータの重複関係を判定できず、バックアップデータ作成に係るデータ転送量を増大させる。よって、特定の重複排除技術、コピー技術によらない、標準的なI/Oインタフェースをベースとするバックアップ・リストアシステムにおいて、バックアップおよびリストアに係るデータ転送量を削減し、尚且つバックアップデータもまた標準的なI/Oインタフェースで読み出すことができるバックアップ・リストア方法が望まれる。

　本願において開示される発明の代表的な一例を示せば以下のとおりである。

　すなわち、第１のストレージ、第２のストレージ、及び、バックアップサーバを含む計算機システムにおいて、第１のストレージは、ホストに提供する複数のボリュームの各々を、複数の論理ブロックに分割して管理し、複数の論理ブロックの間の重複関係を重複管理情報として管理し、複数のボリュームのうちの一以上のボリュームをグループとして管理し、重複管理情報に基づいて、グループ内のあるボリュームについて、複数の論理ブロックごとに、グループに属する他のボリューム内の論理ブロックとの重複関係を示す重複情報を作成してバックアップサーバに送信する。

　バックアップサーバは、重複情報を参照し、グループに属するボリューム内の第１の論理ブロックと重複する第２の論理ブロックを特定し、第１の論理ブロックに対応するデータが第２のストレージへ送信済みである場合には、第２の論理ブロックに対応するデータを第２のストレージへ送信しない。

　本発明によれば、特定の重複排除技術、コピー技術によらない、標準的なI/Oインタフェースをベースとするバックアップ・リストアシステムにおいて、データ転送量を削減でき,かつ標準的なI/Oインタフェースによりバックアップデータをリストア可能なバックアップ・リストアが可能となる。

本発明の第一の実施例の概要を説明する図である。本発明の第一の実施例に係るボリュームとプールの構成を説明する図である。本発明の第一の実施例に係るマッピングテーブルを説明する図である。本発明の第一の実施例に係る重複管理テーブルを説明する図である。本発明の第一の実施例に係る重複情報を説明する図である。本発明の第一の実施例に係る計算機システムを説明する図である。本発明の第一の実施例に係る構成情報を説明する図である。本発明の第一の実施例に係るI/O処理の流れを説明する図である。本発明の第一の実施例に係る重複排除処理の流れを説明する図である。本発明の第一の実施例に係るバックアップ処理の流れを説明する図である。本発明の第一の実施例に係るグループ情報を説明する図である。本発明の第一の実施例に係るデータ転送処理の流れを説明する図である。本発明の第一の実施例に係る重複情報出力処理の流れを説明する図である。本発明の第一の実施例に係るリストア処理の流れを説明する図である。本発明の第二の実施例に係る計算機システムを説明する図である。本発明の第三の実施例に係る計算機システムを説明する図である。本発明の第四の実施例に係る計算機システムを説明する図である。本発明の第四の実施例に係るジャーナルボリュームを説明する図である。

　以下、図面を用い、本発明の第一の実施の形態を説明する。

　図1は、本発明の第一の実施の形態に係る計算機システム100の概要を説明する図である。

　計算機システム100は、ストレージ1、バックアップサーバ2、バックアップストレージ3を含む。これらは、図示しないローカルエリアネットワーク(LAN)、ストレージエリアネットワーク(SAN)、インターネット通信網などのネットワークにより、相互に通信可能に接続されている。

　他に、計算機システム100は、ストレージ1を業務データの格納に利用する複数のホスト計算機 (図示せず)を含む。ホスト計算機は、同じくネットワークによりストレージ１と通信可能に接続されている。

　ストレージ1には、ボリューム14x、14a、14b、14cが構成されている。これらのボリューム(以下、指示番号14で総称)は、ホスト計算機がSCSI規格に定義されるロジカルユニット(LU)として認識可能な仮想的な記憶領域である。また、ストレージ1には、プール15が構成されている。プール15は、ストレージ1が内蔵する複数のハードディスクドライブ(HDD)、ソリッドステートドライブ (SSD) (図示せず。以下、これらのドライブ装置を単にドライブと呼ぶ)等の記憶領域をRAID(Redundant Array of Independent (or Inexpensive) Disks)技術等により統合してなる記憶領域である。計算機システム100は、ホスト計算機に対して仮想的な記憶領域である仮想ボリューム（ボリューム14x、14a、14b、14cに相当）を提供し、ホスト計算機から実際にデータの書き込みが発生する際に必要な容量を割り当てる、いわゆる容量仮想化技術(Thin Provisioning Technology)を採用している。プール15の記憶領域には、512バイトを単位として連続的なアドレスが割り当てられている。以降、プール15の記憶領域のアドレスを物理アドレスと呼ぶ。また、物理アドレスの定義域を物理アドレス空間と呼ぶ。ボリューム14の仮想的な記憶領域も、またアドレスにより識別される。以降、ボリューム14のアドレスを論理アドレス、その定義域を論理アドレス空間と呼ぶ。ストレージ1は、論理アドレスを固定の大きさ(例えば8KB)のブロックに区切り識別する。論理アドレスのブロックを論理ブロックと呼ぶ。ホスト計算機がボリューム14のある論理ブロックにデータを書き込むように要求すると、ストレージ1は、当該論理ブロックに物理アドレスの特定の範囲を割り当て、その物理アドレスにより指示されるプール15の記憶領域に、データを書き込む。論理ブロックへの物理アドレスの割り当ては、物理アドレス順になされる。例えば、ある論理ブロックに物理アドレス範囲の0から15 (物理アドレスは、512バイトと単位とするから、8192バイトを割り当てたことになる) を割り当てたとき、次に割り当てるときには物理アドレス16から割り当てる。

　ストレージ1は、論理ブロックと物理アドレスの割り当ての関係をマッピングテーブル126により管理する。マッピングテーブル126は、ストレージ1のメモリ(図示せず)に保持されている。

　またストレージ1は、重複排除機能を有する。ストレージ１が重複排除処理を実行すると、ビット配列として同じデータを保持する論理ブロックに、同じ物理アドレス範囲が割り当てられる。以降、このように重複排除処理の実行後に、同じ物理アドレス範囲を割り当てられた論理ブロックを、重複状態にある論理ブロック、あるいは単に論理ブロックが重複していると表現することがある。

　論理ブロックと物理アドレス範囲の割り当て、およびマッピングテーブル126を、それぞれ図2および図3を参照して説明する。

　図2は、ストレージ1のボリューム14の内、代表してボリューム14aと14bの論理ブロック、およびプール15の物理アドレス範囲の割り当ての関係を示している。

　ボリューム14aには、論理ブロック141と142が含まれている。これらはそれぞれ、論理ブロック番号000、001により識別される (論理ブロック番号002以降の論理ブロックも当然あるが、図2では省略している)。また、ボリューム14bには、論理ブロック143, 144, 145が含まれている。これらはそれぞれ、論理ブロック番号000, 001, 002により識別される (ここでも、論理ブロック番号003以降の論理ブロックの記載を省略している)。

　プール15には、物理アドレス範囲151、152、153、154、155がある。これらはそれぞれ、8KBのアドレス範囲であり、先頭の物理アドレスはそれぞれ1000、1010、2000、2020、3000である。以降、物理アドレス範囲をその先頭アドレスで識別することとする。

　図2では、論理ブロックに対する物理アドレス範囲の割り当ての関係を、これらを結ぶ線分で表現している。例えば、ボリュームAの論理ブロック番号000に対しては、物理アドレス範囲1000が割り当てられている。

　ボリュームAの論理ブロック番号001とボリュームBの論理ブロック番号001は、共に物理アドレス範囲1010を割り当てられている。これは、ボリュームAの論理ブロック番号001とボリュームBの論理ブロック番号001が同じデータを保持する論理ブロックであり、重複排除処理により物理アドレス範囲を共有する状態とされたことを示している。ここで、ボリュームBの論理ブロック001に対するホスト計算機からのライト要求があった場合には、ストレージ1は例えば物理アドレス範囲3000を新たに当該論理ブロックに割り当て、データを格納する。これにより、ボリュームAの論理ブロック番号001のデータが書き変わることがない。

　図3は、マッピングテーブル126の構造を説明する図である。図3には(a)と(b)の二つのテーブルが描かれているが、それぞれマッピングテーブル126のある時点での状態を示している。

　マッピングテーブル126は、論理的には二次元の表構造で表されるが、木構造等、よく知られたデータ構造により実施することができる。

　マッピングテーブル126の各行は、それぞれ、ストレージ1のすべての論理ボリューム14の論理ブロックに対応し、対応する論理ブロックに関する情報を保持している。各行はボリューム番号1261、ブロック番号1262、プールアドレス1263、FPラベル1264、更新ありフラグ1265の各フィールドからなる。

　ボリューム番号1261フィールドには、対応する論理ブロックのボリューム番号を記録する。ブロック番号1262には、対応する論理ブロックのブロック番号を記録する。プールアドレス1263には、対応する論理ブロックへ割り当てられている物理アドレス空間の先頭アドレスを記録する。FPラベルには、対応する論理ブロックが保持するデータを特徴付けるフィンガープリント値 (後述) を記録する。更新ありフラグ1265は、対応する論理ブロックに対するホスト計算機からの更新要求があったか否かを記録する。

　フィンガープリント値とは、MD5やSHA1等のハッシュ関数をデータに適用して得られる値である。フィンガープリント値は、重複排除処理において、同一データを高速に検索するために使用される。

　例えば、図3の(a)に示したマッピングテーブル126の第一行目には、ボリューム14a (ボリューム番号A)の論理ブロック141 (ブロック番号000)に関する情報を記録する。これを見ると、ボリューム番号Aの論理ブロック番号000の論理ブロックは、物理アドレス1000からの物理アドレス範囲が割り当てられていることがわかる。

　次にボリュームAのブロック番号001のレコードと、ボリュームBのブロック番号001のレコードを参照すると、いずれも物理アドレス1010からの物理アドレス範囲が割り当てられていることがわかる。これらは、図2に示した関係を記述している。

　図3 の(b)に示した図は、マッピングテーブル126の図3の(a)の時点の後、ボリュームB、ブロック番号00１のエントリについて、プールアドレス1263と更新ありフラグ1265の各フィールドを、それぞれ3000、1に更新した時点の様子を示している。なお、図3の(b)の図では、ボリュームBのブロック番号001以外のエントリは、図3の(a)と内容は同じであるため記載を省略している。

　マッピングテーブル126には、ボリューム番号A、Bのボリュームのほかに、ボリューム番号C、Xのボリュームに関する情報も保持している。

　再び図1に戻り、ストレージ1は重複管理テーブル127を内蔵のメモリ(図示せず)に保持している。重複管理テーブル127は、重複排除処理において、重複するデータを検索し、記録しておくためのデータ構造である。図4を参照し、重複管理テーブル127を説明する。

　重複管理テーブル127は、論理的には二次元の表構造で表されるが、木構造やハッシュテーブル等知られたデータ構造により実施することができる。特に、後述の重複排除処理や重複情報出力処理で、フィンガープリント値に基づき検索する処理が必要となるため、フィンガープリント値を保持するFPラベルフィールド1271をキーとするハッシュテーブルや木構造での実施が好ましい。

　重複管理テーブル127の各レコードは、ひとつのフィンガープリント値に対応する。フィンガープリント値はFPラベルフィールド1271に記録されている。重複ブロックリストフィールド1272には、このフィンガープリント値が算出された論理ブロックの識別情報がリストとして記録されている。論理ブロックの識別情報は、ボリューム番号と論理ブロック番号の組でなる。図4では、論理ブロックの識別情報を”()”を使って表現している。例えば、”(A, 000)”は、ボリューム番号Aの論理ブロック番号000で指示される論理ブロックを表す。なお、図4において、重複ブロックリスト1272内の記号”[]”は、データが同一である論理ブロックのグループを表現するためにここで使用している。すなわち、重複ブロックリスト1272は、単なるリストではなく、論理ブロックの識別情報のリストをさらにグループ化して管理するデータ構造を取る。このようなデータ構造が様々な方法で実施可能であることは当業者には自明である。異なるデータから、同一のフィンガープリント値が算出される場合がある。フィンガープリント値が同じでもデータが異なる論理ブロックを区別するため、重複ブロックリスト1272ではこのようなデータ構造を取っている。

　FPラベルがFF00のレコードを参照すると、重複ブロックリストには(A, 001), (B, 001), (X, 100)が記録されている。これは、論理ブロック(A, 001), (B, 001), (X, 001)が同一のデータを保持する論理ブロックであることを示している。この関係は、図3で示したマッピングテーブル126を参照することでも確認できる。

　再び図1へ説明を戻す。バックアップサーバ2は、ストレージ1のボリューム14を、ユーザの指示に従いバックアップストレージ3へ複製する機能を有する計算機である。バックアップサーバ2は、ユーザインタフェース(図示なし)を備えており、計算機システム100のユーザが、このユーザインタフェースを介して、バックアップ対象ボリュームの指定等様々な指示ができるようになっている。

　バックアップストレージ3は、ストレージ1のボリューム14の複製を保持するストレージである。ストレージ1と同様に、バックアップストレージ3には1以上のドライブが内蔵されており、これらのドライブの記憶容量から論理的なボリューム34a, 34b, 34cが構成できるようになっている。バックアップストレージ3は、重複排除機能を必ずしも必要としないし、ストレージ1と同等機能を有するストレージでなくてもよい。

　バックアップサーバ2におけるバックアップ処理の流れを、図1中の記号S1～S5を使い説明する。S1～S5は、バックアップサーバ2における処理ステップを表す。ここで、ユーザからバックアップ対象としてボリューム14a, 14b, 14cが、バックアップサーバ2に対して指示されたものとする。以降、バックアップが指示されたボリューム14a, 14b, 14cをバックアップする一連の処理を、バックアップラウンドと呼ぶ。

　ステップS1において、バックアップサーバ2は、ストレージ1に対して、バックアップ対象とするボリューム14a, 14b, 14cからなるグループ(以下、バックアップグループ)を定義するように指示する。すると、ストレージ1は、ボリューム14a, 14b, 14cをバックアップ対象ボリュームとして認識し、このグループ情報をメモリに記録する。ここで、バックアップ対象のボリューム14a, 14b, 14cおよび14xは、共通のプール15を記憶領域とし、重複排除処理によって一部の論理アドレスに対して同一の記憶領域が割り当てられているボリュームであることに留意されたい。

　バックアップグループにボリューム14a, 14b, 14cを含むことは、計算機システム100のユーザがバックアップサーバ2に接続された管理端末 (図示せず) を操作してバックアップサーバ2に指示することができる。バックアップサーバ2は、このユーザの指示に従い、ストレージ1に対してバックアップグループの作成を指示する。このとき、計算機システム100のユーザは、ボリューム14a、14b、14cが共通のプール15から記録領域が割り当てられ重複排除されたボリュームであることを、上記バックアップサーバ2の管理端末もしくはストレージ1の管理端末に表示される情報から予め知ることができる。あるいは、ユーザはそのようなボリュームの属性情報について全く認識せずに、単にバックアップが必要と考えるボリュームとしてボリューム14a, 14b, 14cを選択することもある。この場合も、バックアップサーバ2はストレージ1に対してユーザの指示に基づくグループ定義の指示を行う。ただし、この場合は、指示されるボリュームが必ずしもプールを同じくするとは限られない。この場合は、ストレージ1は、指示されたボリュームを更にその記憶領域提供元プールによってグループ化してもよい。

　ステップS2において、バックアップ対象のボリュームのひとつであるボリューム14aを選択し、このボリュームの完全なバックアップをバックアップストレージ3のボリューム34aに作成する。このとき、バックアップサーバ2がボリューム14aからデータを順次読み出してボリューム34aへ書き込む。ストレージ1からバックアップストレージ3へのデータ転送方法としては、他にバックアップサーバ2の指示により、ストレージ1が主体となってボリューム14aをボリューム34aへ複製する方法、もしくはバックアップストレージ3がボリューム14aからデータを読み出しボリューム34aへ書き込む方法等を使ってもよい。

　ボリューム14aの複製完了後、ステップS3において、バックアップサーバ2は、ストレージ1に対して、ボリューム14bの重複情報を出力するように要求する。すると、ストレージ1は、ボリューム14bの重複情報として重複情報60を構成し、バックアップサーバ2へ送信する。

　次に、重複情報60の内容を、図5を使って説明する。

　重複情報60は、二次元の表構造で表現されるデータ構造を取る。各レコードは、ボリューム14bの論理ブロックに対応し、その情報を保持している。

　各レコードは、ブロック番号61、重複関連情報62の各フィールドを保持する。ブロック番号61には、対応する論理ブロックの論理ブロック番号が記録される。重複関連情報62には、対応する論理ブロックが他の論理ブロックと重複しているとき、その重複している他の論理ブロックの識別情報を記録する。図5では、マッピングテーブル126と同じ表現方法により論理ブロックの識別情報を表現する。なお、レコードに対応する論理ブロックと重複する論理ブロックが複数ある場合には、それらの複数の論理ブロック識別情報が重複関連情報62に記録される。ここで、重複関連情報には、ステップS1で定義したグループに含まれないボリュームに関する情報を含まない。したがって、重複情報60には、ボリューム14xに係る情報を含んでいない。

　再び図1の説明に戻る。ステップS4において、バックアップサーバ2は、ボリューム14bのデータをバックアップストレージ3のボリューム34bへ複製する処理を行う。ここで、バックアップサーバ2は、ボリューム14bの各論理ブロックにつき、複製が必要か田舎を重複情報60を使って判定しつつ、必要な論理ブロックのみを複製する。具体的には、次のいずれかの条件を満たす論理ブロックを、複製が必要な論理ブロックと判定する。
(1)　重複関連情報62に、論理ブロック識別情報が記録されていない。すなわち、この論理ブロックは、重複状態でない論理ブロックか、ステップS1で定義したグループに含まないボリュームの何れかの論理ブロックと重複する論理ブロックである (このような論理ブロックを、非重複ブロックと呼ぶ)。
(2)　重複関連情報62に、論理ブロック識別情報が記録されており、それらの識別情報で指示されるいずれの論理ブロックも、このバックアップラウンドにおける現時点でバックアップストレージ3へ複製されていない。

　例えば、ボリューム14bの論理ブロック000について判定するとき、この論理ブロックはボリュームC (ボリューム14c) の論理ブロック010と重複しているが、ボリュームCの論理ブロック010はこの時点では複製されていないから、複製が必要と判定する。一方、ボリューム14bの論理ブロック001について判定するとき、この論理ブロックはボリュームA (ボリューム14a)の論理ブロック001と重複しているが、ボリュームAは、ステップS2で複製済みだから、複製不要と判定する。ボリューム14bの論理ブロック002および003は、重複関連情報62に重複している他の論理ブロック識別情報が記録されていないから、複製要と判定する。

　この判定条件に基づけば、ステップS1で定義したバックアップグループ内で、互いに重複状態にある論理ブロックは、そのデータが一度だけバックアップストレージ3へ複製されることになり、データ転送量の削減が達成される。

　ボリューム14bのすべての論理ブロックについて、ステップS4の処理を終えた後、バックアップサーバ2は、ステップS5において、バックアップストレージ3に対し、複製を行なわなかった論理ブロックについて、重複情報60に基づき、ボリューム34a (A’)から複製するように指示する。この指示には、例えばSCSI標準で定義されているXCOPYコマンドや、バックアップストレージ3に固有のコマンドを使用することができる。ステップS5は、通常、ステップS4の直後に実行されるが、ステップS4の終了後、任意のタイミングで実行されてもよい。また、もしバックアップストレージ3がこのようなボリューム間の複製機能を提供していないなら、ステップS5を省略してもよい。その後、バックアップサーバ2は、重複情報60をボリューム14bのバックアップ情報として、バックアップサーバ2の二次記憶領域 (図示なし) に記録する。

　ボリューム14cについても、上記ボリューム14bと同様にステップS3～S5に従い複製を処理する。

　ここで、ステップS3で説明した重複情報60は、SCSI標準で定義される語彙または概念(厳密には“論理ブロック”はSCSI標準の語彙ではないが、SCSI標準のLBAの範囲として解釈できる)で構成されることに注意されたい。また、ステップS3において、バックアップサーバ2からストレージ1へ重複情報60を出力する要求には、SCSI標準のコマンドを拡張する形式で実現可能である点に注意されたい。言うまでもなく、ボリュームに対するデータの読み出しや書き込みは標準的なコマンドが定義されている。重複情報60は、特定の重複排除機能によらず共通的な形式を取ることができる。以上を鑑みれば、本発明は、特定のベンダに依存した、特定の重複排除技術やボリュームコピー技術によらず、実施可能であるといえる。

　以上が、本実施形態の概要である。以降、図面を参照しながら、本実施形態を詳細に説明する。

　図6は、本実施形態の計算機システム100の構成を説明する図である。

　図1で説明したように、計算機システム100は、ストレージ1、バックアップサーバ2、バックアップストレージ3を含み、これらがネットワーク4で相互に通信可能に接続されている。また、ネットワーク4には、1以上のホスト計算機5が接続されており、ストレージ1のボリューム14をLUとしてアクセスできるようになっている。ネットワーク4は、単一のネットワークとは限られず、複数の独立したLAN、SAN等の組み合わせであってもよい。

　ストレージ1は、CPU 11、メモリ12、複数のドライブ13を含む。ドライブ13は、それぞれストレージ1内部で適切な識別情報が割り当てられている。図6におけるD00、D08はドライブ13のストレージ1内部での識別情報を表している。ストレージ1は、D00、D08で識別されるドライブ13以外にも、D01、D02、D03、D04、D05、D06、D07で識別されるドライブ13を備えているが、図6では記載を省略する。ストレージ１は、複数のドライブ13によって提供される物理的な記憶領域に基づいて、図2に示すプール15を構成している。

　ストレージ1は、複数のCPU 11を備えてもよい。

　ストレージ1は、I/O処理部121、構成管理部122、重複情報出力部123、重複排除処理部124の各処理部が格納されている。これら処理部は、メモリ12に格納され、CPU 11により解釈、実行可能なソフトウェアにより実現されるが、便宜上メモリ12内部に描かれている。なお、これらの処理部の一部または全部は、ハードウェアとして実現されていてもよい。各処理部の処理内容については、以降で詳細に説明する。

　メモリ12にはまた、構成情報125、マッピングテーブル126、重複管理テーブル127、グループ情報128が格納される。このうち、マッピングテーブル126、重複管理テーブル127については、上記およびそれぞれ図3、図4で説明済みである。構成情報125、グループ情報128については、以降で詳細に説明する。

　バックアップサーバ2は、CPU 21、メモリ22、二次記憶23を含んでいる。

　バックアップサーバ2は、バックアップ実行部221、リストア実行部222、転送データ判定部223、データ転送部224の各処理部を備えている。これらの処理部は、メモリ22に格納され、CPU 21により解釈、実行可能なソフトウェアにより実現されるが、便宜上メモリ22の内部に描かれている。なお、これらの処理部の一部または全部は、ハードウェアとして実現されていてもよい。

　二次記憶23は、ハードディスクドライブ、SSD等の記憶媒体である。二次記憶23には、バックアップサーバ2が動作する上で必要な情報、例えば上述の重複情報60が格納される。また、二次記憶23に代えて、ストレージ1、バックアップストレージ3、もしくは図示しないストレージ装置や他のサーバが提供する記憶領域を利用することができる。

　バックアップストレージ3は、CPU 31、メモリ32、複数のドライブ331を備えている。ドライブ331は、ボリューム34a、34b、34c等を構成するための記憶領域として使用される。ボリューム34a、34b、34cは、ホスト計算機5、バックアップサーバ21、ストレージ1等の上位装置からSCSI標準のロジカルユニットとして認識可能になっており、I/O処理部321が動作することで、上位装置によるデータのライトやリードを受け付けられるようになっている。構成情報322は、ボリューム34a、34b、34cを構成するための内部的な管理情報である。また、バックアップストレージ3は、ボリュームの作成や削除、その他の管理、保守操作をするための様々な処理部 (図示なし) を備えている。バックアップストレージ3については詳述を避けるが、このようなストレージを構成可能であることは当業者には自明である。

　ホスト計算機5は、業務アプリケーションなどのソフトウェアを動作させるための計算機である。ホスト計算機5は、これらソフトウェアの動作に必要なデータを、ストレージ1のボリューム14へ格納する。

　図7は、構成情報125の内容を説明する図である。

　構成情報125は、構成情報(ボリューム)125aと、構成情報(プール)125bからなる。

　構成情報(ボリューム)125aは、二次元の表構造のデータである。構成情報(ボリューム)125aの各レコードは、それぞれボリューム14のひとつに対応し、対応するボリュームに関する情報を保持する。各レコードは、ボリューム番号1251、プール番号1252、サイズ1253の各フィールドを含む。

　ボリューム番号1251には、対応するボリュームのボリューム番号を記録する。プール番号1252は、ボリュームが構成されているプールのプール番号が記録する。サイズ1253には、対応するボリュームのサイズを記録する。

　例えば、構成情報(ボリューム)125aの第一番目のレコードを参照すると、ボリューム番号1251にはAと記録されているから、このレコードはボリューム番号Aで識別されるボリューム14aに対応することが分かる。また、プール番号1252にはYと記録されているから、このボリューム14aは、プール番号Yで識別されるプール15 (本実施形態では、プール15にプール番号Yを割り当てる) であることが分かる。また、サイズ1253には、200GB(ギガバイト)と記録されているから、ボリューム14aのサイズは200ギガバイトであることが分かる。

　構成情報(プール) 125bは、二次元データである。構成情報(プール)125bの各レコードは、ストレージ1に構成されたプールのひとつに対応する。なお、本実施形態では、プール15だけが構成されており、構成情報(プール)125bには唯一のプールであるプール15の情報のみが保持されている。

　各レコードは、プール番号1255、ドライブ1256の各フィールドを含む。その他、プール固有の情報を保持するためのフィールド (例えばRAIDレベル1257)を備えてもよい。

　プール番号1255は、レコードに対応するプールのプール番号を記録する。ドライブ1256には、プールの記憶領域を構成するために使用されるドライブ13の識別情報を記録する。

　例えば、構成情報(プール) 125bを参照すれば、プール15のプール番号がYであり、プール15は識別番号D00～D07で識別される8台のドライブから構成されることが分かる。

　なお、本実施形態では、プール15は、RAID技術により8台のドライブから構成される記憶領域を構成し、この記憶領域に対して定義される連続的な物理アドレスから、ドライブ上のアドレスを、RAID技術に従い演算で求めることができるようになっている。これにより、ストレージ1の各処理部は、プール15の任意の物理アドレスに対するデータの読み出しや書き込みができるようになっている。ストレージ1は、このようなプール15へのI/Oのための処理部を備えているが、当業者には自明であるため詳細を省く。

　図8を用い、ストレージ1のI/O処理部121の処理の流れを説明する。I/O処理部121は、ホスト計算機5、バックアップサーバ2からのボリューム14に対するI/Oリクエストを処理する処理部である。なお、以降の説明において、ストレージ1のCPU 11の働きにより処理が行われる場合、便宜的に、処理部を主語として説明する場合がある。

　I/O処理部121は、ステップS100から処理を開始する。

　ステップSP101において、I/O処理部121は、ホスト計算機5からのI/Oリクエストを受領する。以下、説明の便宜上、I/Oリクエストにはリード、ライト等のコマンド種別と、コマンドのオペランドであるデータおよびその他のパラメータを含むものとしているが、発明の適用範囲を限定するものではない。

　ステップSP102において、I/O処理部121は、コマンドの種別を判定し、コマンドがリードコマンドであればステップSP103へ進み、ライトであればステップSP106へ進む。なお、リード、ライト以外のI/Oリクエストを受領した場合は、コマンドに応じた図示しない適切な処理が実行される。

　リードコマンドの場合、I/Oリクエストには対象のボリュームを指定する情報、論理アドレス、要求サイズがパラメータとして含まれる。

　ステップSP103において、I/O処理部121は、パラメータからボリューム、論理ブロック番号を特定し、マッピングテーブル126を参照し、対応する物理アドレス範囲(プール15上)を特定する。詳細を省くが、I/Oリクエストに含まれるパラメータからボリュームおよび論理ブロック番号を求める仕組みは、当業者には自明である。

　ステップSP104において、I/O処理部121は、物理アドレス範囲のデータをプール15から読み出す。実際には、物理アドレス範囲に対応するドライブ上の記憶領域からデータが読み出されることになる。

　ステップSP105において、I/O処理部121は、読み出したデータを要求元へ応答する。

　I/Oリクエストがライトである場合、ステップSP106からの処理を実行する。

　ステップSP106において、I/O処理部121は、プール15から要求されたデータを記録するために十分な物理アドレス範囲を、指定された論理ブロックに割り当てる。

　ステップSP107において、I/O処理部121は、割り当てた物理アドレス範囲に対応するドライブに、要求されたデータを記録する。

　ステップSP108において、I/O処理部121は、マッピングテーブル126に、論理ブロックと新しく割り当てた物理アドレス範囲の対応を記録する。

　ステップSP109において、I/O処理部121は、要求元へ処理完了を通知する。

　ライトの処理の具体的な動作を、図2および図3を参照して説明する。

　今、ボリューム14b (ボリューム番号B) の論理ブロック144 (論理ブロック番号001)に対し、ライトが要求されたとする。このとき、I/O処理部121は、プール15の物理アドレス範囲を割り当てる。ここでは、例えば物理アドレス範囲155 (アドレス3000)を割り当てたとする (ステップSP106)。次に、I/O処理部は、物理アドレス範囲155に対応するドライブに、要求されたデータを記録する (ステップSP107)。次に、I/O処理部121は、マッピングテーブル126の、ボリューム番号B、ブロック番号001に対応するレコードのプールアドレスフィールド1263に (1010が記録済み)、割り当てた物理アドレス範囲の先頭アドレスである3000を記録する。なお、FPラベル1264は、ここでは更新しない。また、更新ありフラグ1265に、論理ブロックへのライトがあったことを示す情報として、”1”を記録しておく。この結果、マッピングテーブル126は、図3の(a)の状態から、図3の(b)の状態となる。

　図9は、重複排除処理部124における重複排除処理の流れを説明する図である。重複排除処理部124は、定期的に重複排除処理を実行する。

　重複排除処理は、SP201より開始する。

　ステップSP202において、重複排除処理部124は、重複排除処理の対象とするボリュームと、そのボリュームの論理ブロックの範囲を選択する。例えば、ボリュームとしてはボリューム番号を昇順に毎回一つ、論理ブロック範囲としてはボリュームの全体を選択する。

　ステップSP203において、重複排除対象の論理ブロック範囲に含まれる一つの論理ブロック番号を選択する。例えば、初回の処理では、論理ブロック範囲の先頭の論理ブロック番号を選択し、後続の処理ではその次の論理ブロック番号を選択する。

　ステップSP204において、マッピングテーブル126から、選択した論理ブロック番号に対応するエントリを取得する。

　ステップSP205において、重複管理テーブル127より、古いエントリを削除する。古いエントリとは、前回の重複排除処理で重複管理テーブル127に登録したエントリを言う。具体的には、まずステップSP204で取得したマッピングテーブル126エントリから、FPラベル1264の値を得る。次に、このFPラベル1264の値を用いて、重複管理テーブル127を検索する。検索の結果得られた重複ブロックリスト1272から、処理対象のボリューム番号と論理ブロック番号の組を削除する。

　ステップSP206において、マッピングテーブル126から取得した物理アドレスに基づき、プール15からデータを取得する。

　ステップSP207において、取得したデータのフィンガープリント値を算出する。

　ステップSP208において、算出したフィンガープリント値に基づき、重複管理テーブル127を検索し、対応するエントリを取得する。

　ステップSP209において、重複管理テーブル127に対応するエントリがあれば、ステップSP210の処理へ進む。そうでなければ、ステップSP213の処理へ進む。

　ステップSP210において、重複管理テーブル127の対応するエントリの重複ブロックリスト1272を取得し、このリストに記録されている論理ブロックにつき、プール15からデータを取得する。リストに複数の論理ブロック識別情報のグループが含まれている場合、各グループにつき一つの論理ブロックを選択し、そのデータをプール15から取得する。データの取得において、ステップSP206と同様に、論理ブロックに対応するマッピングテーブル126のエントリを参照することで、物理アドレスを特定し、その物理アドレスからデータを取得する。

　ステップSP211において、ステップSP206とステップSP210で取得したデータを比較する。一致する場合、ステップSP212へ進み、一致しない場合は、ステップSP213へ進む。

　一致する場合は、論理ブロックは重複しているということになる。この場合は、ステップSP212において、マッピングテーブル126の処理対象の論理ブロックのエントリを、重複と判定された他方の論理ブロックの物理アドレスへ変更する。

　ステップSP213において、処理対象の論理ブロックに対応するマッピングテーブル126のFPラベル1264を、ステップSP207で算出した値へ更新する。

　ステップSP214において、ステップSP208で検索の結果得られた重複管理テーブル127の重複ブロックリスト1272に、処理対象の論理ブロックの識別情報を追加する。もし、ステップSP211の判定で、重複データであった場合は、重複している他方の論理ブロックと同じグループに、処理対象の論理ブロックの識別情報を追加する。そうでなければ、独立したグループとして追加する。またもし、重複管理テーブル127に、算出したフィンガープリント値に対応するエントリがなければ、エントリを追加する。

　ステップSP215において、ステップSP202で選択した論理ブロック範囲のすべてを処理したかどうかを判定する。未処理の論理ブロックがあれば、論理ブロックを論理ブロック番号の昇順に選択し(ステップSP203)、ステップSP204以降の処理を繰り返す。すべての論理ブロックの処理を終えると、重複排除処理は終了となる(ステップSP216)。

　今、重複排除処理部124が、ボリューム14b (ボリューム番号B) の論理ブロック番号000-002を、重複排除処理の対象として選択したとする(ステップSP202)。まず、論理ブロック番号001の論理ブロックが処理対象ブロックとして選択され(ステップSP203)、図３に示すマッピングテーブル126から、ボリューム番号1261が”B”でブロック番号1262が”000”のエントリが取得される(ステップSP204)。そして、重複排除処理部124は、ステップSP204で取得したエントリから、FPラベル1264として古いフィンガープリント値（図示しない）を取得し、図５に示す重複管理テーブル127から該当するFPラベル1271の古いエントリ（図示しない）を削除する(ステップSP205)。

　続いて、重複排除処理部124は、マッピングテーブル126に基づいて、ボリューム番号”B”、論理ブロック番号”000”に相当するデータをプール15から取得し(ステップSP206)、フィンガープリント値を算出する(ステップSP207)。

　ここで、算出したフィンガープリント値”FFFF”に基づいて、重複管理テーブル127を検索した結果(ステップSP208)、対応するエントリとして、FPラベル1271に”FFFF”、重複ブロックリスト1272に”[(C, 010)]”が、既に登録されていたとする。この場合、ステップSP209の判定で肯定的の結果となり、SP210に進んで、重複排除処理部124は、ボリューム番号”C”の論理ブロック番号”010”の論理ブロックに対応するデータをプール15から取得する。そして、重複排除処理部124は、ステップSP206とステップSP210で取得したデータを比較し、データが一致していることを判定したとする(ステップSP211)。この場合、重複排除処理部124は、マッピングテーブル126において、ボリューム番号”B”、論理ブロック番号”000”のエントリのプールアドレス1263を、重複と判定されたボリューム番号”C”、論理ブロック番号”010”の論理ブロックに対応するプールアドレス1263へと変更する(ステップSP212)。また、重複排除処理部124は、マッピングテーブル126において、ボリューム番号”B”、論理ブロック番号”000”のエントリのFPラベル1264を、ステップSP207にて算出したフィンガープリント値”FFFF”に更新する(ステップSP213)。

　次に重複排除処理部124は、重複管理テーブル127のFPラベル1271”FFFF”のエントリに対し、重複ブロックリスト1272欄へ、”[(C, 010)]”のグループのメンバとして(B, 000]を追加する(ステップSP214)。なお、重複排除処理部124は、重複排除処理の対象として選択された、未処理の論理ブロック番号”001”￥及び”002”についても、同様に重複排除処理を実行する(ステップSP215)。以上、ストレージ1における重複排除処理について説明した。なお、ここまでに説明した重複排除処理は一例に過ぎず、本発明は様々な重複排除処理に対して適用可能である。

　また、本実施例では、重複排除処理は、ライト処理と非同期に実行されるポストプロセスによる処理として説明したが、ライト処理と同期して実行されるインラインによる処理としても実現可能である。

　以降、バックアップサーバ2におけるバックアップ処理について説明する。

　図10は、バックアップサーバ2のバックアップ実行部221におけるバックアップ処理について説明する図である。図10を参照し、バックアップ処理について説明する。

　バックアップ処理は、ユーザの指示により、あるいはユーザが予め設定しておいたスケジュールに従い実行される。

　バックアップ実行部221のバックアップ処理は、ステップSP401より開始する。

　ステップSP402において、バックアップ実行部221は、バックアップグループの定義をストレージ1に指示する。これは、図1に示したステップS1に相当する処理である。

　バックアップグループの定義の指示により、ストレージ1はグループ情報128を更新する。図11に、グループ情報128の一例を示す。

　グループ情報128の各レコードはバックアップグループに対応し、対応するバックアップグループの情報を保持する。各レコードは、グループ番号1281、ボリュームリスト1282の各フィールドからなる。

　グループ番号1281は、バックアップグループに割り当てられた一意な識別番号である。ボリュームリスト1282は、バックアップグループを構成するボリュームを保持するリストである。

　今、バックアップ実行部221は、ボリューム番号A, B, C (ボリューム14a, 14b, 14c)からなるバックアップグループG000の作成を、ストレージ1へ指示したとする。ストレージ1は、この指示を受け、図11のグループ情報128の第一行目に示したレコードを構成する。このレコードに示すように、ストレージ1は、グループ番号1281にはG000を記録し、ボリュームリスト1282にはA, B, Cを記録する。

　図10の説明に戻る。ステップSP403において、バックアップ実行部221は、バックアップグループに含まれるボリュームの一つを先頭ボリュームとして選択し、この先頭ボリュームをフルバックアップによりバックアップストレージ3に複製する。なお、先頭ボリュームの選択方法の一例として、バックアップグループに含まれるボリューム（図１に示すボリューム番号A, B, C）のうち、重複論理ブロックを最も多く含むボリュームを選択してもよい。また、ホスト計算機5への性能影響を考慮し、低アクセス頻度のボリュームを選択してもよい。また、ストレージ1内部のキャッシュヒット率を考慮し、一定のアクセス頻度のボリュームを選択してもよい。バックアップサーバ2は、ボリューム選択の根拠とする各種パラメータを、ストレージ１から取得するようにしてもよい。また、先頭ボリュームは、バックアップグループに含まれるボリュームから任意に選択したボリュームであってもよい。ここで、フルバックアップとは、ボリュームのすべての論理ブロックを順次読み出し、論理ブロック番号を変えずにバックアップストレージ3へ複製するバックアップ方式を言う。ステップSP403は、図1に示したステップS1に相当する。例えば、今ボリューム番号Aのボリューム14aをフルバックアップしたとする。

　ステップSP404において、バックアップ実行部221は、バックアップグループに含まれるバックアップ処理されていないボリュームを一つ選択する。例えば、ボリューム番号Aのボリューム14aはバックアップ済みだから、ボリューム番号で昇順のボリューム14b (ボリューム番号B)を選択する。

　ステップSP405おいて、バックアップ実行部221は、選択したボリュームにつき、重複排除済みを考慮したバックアップとして、データ転送処理を行う。データ転送処理は、バックアップサーバ2のデータ転送部224により行われる。データ転送部224におけるデータ転送処理の詳細については、後に図12を参照して説明する。なお、ステップSP405の処理には、図1のステップS3、S4、S5の処理が含まれる。

　ステップSP406において、バックアップ実行部221は、バックアップグループのすべてのボリュームについて処理済かどうかを判定する。処理済みでないボリュームがあればそのボリュームを選択し (ステップSP404)、ステップSP405の処理を実行する。

　すべて処理済みであれば、バックアップ処理を終了する (ステップSP407)。

　図12は、データ転送部224の処理の流れを説明する図である。

　図10で説明した、バックアップ実行部221のステップSP405において、データ転送部224によるデータ転送処理が実行される。

　データ転送処理部224は、図10のステップSP404で選択したボリュームを対象に、ステップSP501より処理を開始する。ここでは、ボリューム14b (ボリューム番号B)を処理対象とする場合を例に説明する。

　ステップSP502において、データ転送部224は、ストレージ1に対して、ボリューム14bの重複情報60の出力を指示する。この指示を受け、ストレージ1は、図1の重複情報60を、データ転送部224へ送信する。このステップSP502は、図1のステップS3に相当する処理である。重複情報60については、図5を用いて説明した。ストレージ1が、重複情報60を生成する処理については、図13を用いて後述する。

　ステップSP504からSP507までは、ボリュームを構成する論理ブロックを逐次処理するループ処理となっている。初回の実行では、ボリュームの先頭の論理ブロックが選択され (ステップSP503)、次回以降は論理ブロックが、論理ブロックの昇順に選択される (ステップSP508)。

　ステップSP504とステップSP505は、選択した論理ブロックを転送する必要があるか否かを判定するステップである。これらのステップは合わせて、図1のステップS4に相当する。

　まずステップSP504において、データ転送部224は、重複情報60に基づき、処理対象の論理ブロックが重複する論理ブロックか否かを判定する。ここで、処理対象の論理ブロックが重複するブロックでなければステップSP506へ進み、その論理ブロックのデータをバックアップストレージ3へ送信する。そうでなければ、次のステップSP505へ進む。

　ステップSP505において、データ転送部224は、選択した論理ブロックが重複するブロックである場合、その重複する他方の論理ブロックが、このバックアップラウンドでバックアップストレージ3に送信済みかどうかを判定する。この判定方法については前述のとおりである。もし、処理対象の論理ブロックが同じボリュームの論理ブロックと重複している場合は、重複する他方の論理ブロックのブロック番号が、処理対象の論理ブロックのブロック番号よりも小さい場合に、転送不要と判断するようにしてもよい。なぜなら、当該重複状態の論理ブロックは、論理ブロックの昇順にバックアップストレージ3に送信することによって、既に送信済みだからである。

　もし送信済みでなければ、ステップSP506へ進み、処理対象の論理ブロックのデータを取得し、バックアップストレージ3へ送信する。

　ステップSP507において、データ転送部224は、処理対象の論理ブロック範囲に含まれるすべての論理ブロックについて処理したかどうかを判定する。未処理の論理ブロックがあれば、ステップSP508にて次の論理ブロックを選択し、ステップSP504からの処理を行う。そうでなければ、ステップSP509の処理へ進む。

　ステップSP509において、データ転送部224は、ステップSP504～SP507の一連の処理で、送信しなかった論理ブロックにつき、バックアップストレージ3内のローカルコピー機能を使って、データを複製する。この処理は、図1のステップS5に相当する。例えば、重複情報60において、ブロック番号001は(A, 001)が重複関連情報62に記録されているから、この論理ブロック番号001の論理ブロックは、バックアップストレージ3へ複製されていない。そこで、データ転送部224は、バックアップストレージ3に対して、バックアップストレージ3内のボリューム34a (ボリューム14aの複製先である) の論理ブロック番号001の論理ブロックを、ボリューム34b (ボリューム34bの複製先である) の論理ブロック番号001の論理ブロックへ複製するように指示する。バックアップストレージ3は、この指示を受け、データの複製を行なう。

　この結果、ボリューム34bは、ホスト計算機5などの外部装置から、ボリューム14bと同じデータが記録されているボリュームとしてアクセスできる。

　なお、バックアップストレージ3が、ローカルコピー機能を備えない場合は、このような処理を行わないようにしてもよい。また、ローカルコピー機能には、SCSI標準のXCOPYに限られず、様々な方法を使うことができる。

　ステップSP510において、データ転送部224は、ストレージ1から取得した重複情報60を、二次記憶23へ格納し、処理を終了する (ステップSP511)
　図13は、ストレージ1の重複情報出力部123による重複情報出力処理について、処理の流れを説明する図である。

　重複情報出力処理は、ステップSP301より開始される。

　ステップSP302において、重複情報出力部123は、処理対象とするボリュームの識別情報を受領し、ボリューム番号を特定する。ボリュームの識別情報にはSCSI標準のターゲットID、ロジカルユニット番号等、直接にボリューム番号を示すものでなくてもよく、ホスト計算機5またはバックアップサーバ2など上位の装置での識別情報であってもよい。この場合も、適切な構成情報をストレージ1に備えさせることでボリューム番号を特定できることは当業者には自明である。ここで、説明のためボリューム番号Bが特定されたものとする。

　ステップSP303において、重複情報出力部123は、メモリ12上に、初期化された空の重複情報60を構成する。

　ステップSP304において、重複情報出力部123は、グループ情報128を参照し、指定されたボリュームのグループを特定し、さらにそのグループを構成する他のボリュームを特定する。例えば、処理対象ボリュームのボリューム番号がBの場合は、グループ番号G000および、グループを構成する他のボリュームとして、ボリューム番号A, B, Cを特定する。

　ステップSP305において、重複情報出力部123は、処理対象のボリュームの先頭のブロック番号を選択する。ボリューム番号Bの先頭ブロック番号として、例えば000を選択する。

　ステップSP306において、重複情報出力部123は、マッピングテーブル126より、選択したブロック番号のFPラベル1246のフィンガープリント値を取得する。

　ステップSP307において、重複情報出力部123は、ステップSP306で取得したFPラベルのフィンガープリント値をキーとし、重複管理テーブル127を検索する。検索の結果、重複管理テーブル127の対応する重複ブロックリストフィールド1272を得る。

　例えば、ボリューム14bの論理ブロック番号”000”については、ステップSP306の処理により、フィンガープリント値”FFFF”を得る。次に、ステップSP307の処理により、重複ブロックリストとして、[(B, 000), (C, 010)]を得る。同様に、論理ブロック番号”001”については、重複ブロックリストとして、[(A, 010), (B, 001), (X, 100)]を得る。

　ステップSP308において、重複情報出力部123は、得られた重複ブロックリストの内、同一バックアップグループに含まれるボリューム以外のボリュームの論理ブロック識別情報を除外する。例えば、上の[(B, 000), (C, 010)]の場合、ボリューム番号B, Cのボリュームは、共に同一バックアップグループに含まれるから、いずれも除外しない。一方、[(A, 010), (B, 001), (X, 100)]の場合、ボリューム番号Xのボリュームはバックアップグループに含まれないから、(X, 100)を除外し [(A, 010), (B, 001)]を得る。なお、ここで、処理対象の論理ブロックの論理ブロック識別情報も除外することとし、結果的に、それぞれ(C, 010), (A, 010)を得る。

　ステップSP309において、重複情報出力部123は、ステップSP308で得た情報を、ステップSP303で作成したメモリ上の重複情報60へ追加する。

　ステップSP310において、重複情報出力部123は、すべての論理ブロックについて処理したかどうかを判定し、未処理のブロックがあれば昇順に次の論理ブロック番号を選択し、ステップSP307からの処理を実行する。そうでなければ、ステップSP312の処理へ進む。

　ステップSP312において、重複情報出力部123は、すべての論理ブロックについて処理終了後、結果として得られるメモリ上の重複情報60を、要求元 (バックアップサーバ3) へ送信し、処理を終了する (ステップSP313)。

　次に、バックアップしたボリュームをリストアする際の処理について説明する。リストア処理は、バックアップ処理により得たボリューム毎の重複情報60を使い、バックアップストレージ3からストレージ1へ、効率的にボリュームの複製を作成する。概略的な処理の流れは、図10で示したバックアップ処理とほぼ同じとなる。リストア処理は、バックアップサーバ2のリストア実行部222により行なわれる。

　図14は、本実施形態におけるリストア実行部222の処理の流れを説明する図である。

　リストア処理は、ステップSP601より開始する。

　ステップSP602において、リストア実行部222は、リストア対象のボリュームを、バックアップストレージ3のボリューム34から選択する。どのボリュームを選択するかはユーザの指示による。ここでは、ボリューム34bと34cを選択したものとして説明する。

　ステップSP603において、リストア実行部222は、選択したボリュームの一つを先頭ボリュームとして、このボリュームをフルリストアする。なお、どのボリュームを先頭ボリュームとするかはユーザがバックアップサーバ2に対して指示するようにしてもよい。また、バックアップ処理の際にフルバックアップしたボリュームを先頭ボリュームとして選択してもよい。また、任意に選択したボリュームを先頭ボリュームとしてもよい。ここで、フルリストアとは、フルバックアップと同様に、ボリュームのすべての論理ブロックを順次読み出し、論理ブロック番号を変えずにストレージ1へ複製するリストア方式を言う。ここで、今ボリューム34bを先頭ボリュームとして選択し、フルリストアするものとする。

　なお、もしバックアップストレージ3がローカルコピー機能を持たず、ボリューム34bにバックアップされていない論理ブロックがあったとする。この場合は、上述のフルリストアを行なうことはできないが、代わりに、ボリューム34b (ボリューム14b) の重複情報60を参照してバックアップされていない論理ブロックを特定し、その論理ブロックの重複データを格納するボリュームからデータを読み出し、そのデータをコピーする。

　ステップSP604において、リストア実行部222は、リストア対象の別のボリュームを選択する。例えば、ボリューム34cを選択する。

　ステップSP605において、リストア実行部222は、選択したボリュームを対象に、重複排除済みを考慮したリストアとして、データ転送処理を行なう。ここで、データ転送処理は、バックアップ処理と同様に、データ転送部224により実行される。バックアップ処理との違いは、図12ステップSP502において、重複情報60をストレージ1から取得することに代えて、二次記憶23から取得する点、データ転送の方向を、バックアップストレージ3から読み出し、ストレージ1への送信とする点、SP510において、重複情報60の保存が必ずしも必要ない点である。また、重複情報60は、ストレージ1におけるボリューム14の識別情報が記録されているから、これらをバックアップストレージ3におけるボリューム34に読み替える。

　以上説明したとおり、第一の実施形態では、バックアップサーバ2は標準的なI/Oインタフェースを用いて重複排除済みボリュームをバックアップするが、バックアップデータ作成においては、重複データを2回以上転送しないため、データ転送量が削減されている。また、作成されたバックアップデータは、標準的なI/Oインタフェースを用いてアクセスできる。

　なお、以上で説明した一連のボリュームバックアップ処理は、データ一貫性維持の観点から、重複排除処理直後に静止化されたボリューム (すなわち、ホスト計算機5からのライト要求がない状態のボリューム) に対して実施することが好ましいが、マッピングテーブル126や重複管理テーブル127を適切に複製し、複製したテーブルを使うことでも、データの一貫性を保てる。

　以下、第二の実施例について説明する。第二の実施例は、第一の実施例のように、ストレージ1からバックアップストレージ3へボリュームの複製を作る際、重複排除済みボリュームを考慮しデータ転送量を削減する。だだし、第一の実施例と異なり、第二の実施例ではバックアップサーバ2を使わず、代わりにストレージ1が主体となってボリュームの複製を作成する。

　図15を参照し、第二の実施例による計算機システム101における、ボリュームの複製方法を説明する。

　計算機システム101は、ストレージ1、バックアップストレージ3および、これらを通信可能に接続するためのネットワーク (図示せず)、および当該ネットワークに接続され、ストレージ1およびバックアップストレージ3と通信可能な複数のホスト計算機 (図示せず) からなる。実施例1におけるバックアップサーバ2は必須としない。

　図15では省略するが、実施例1と同様に、ストレージ1は、図6に示したCPU 11、メモリ12、I/O処理部121、構成管理部122、重複情報出力部123、重複排除処理部124の各処理部を備えている。また、構成情報125、マッピングテーブル126、重複管理テーブル127、グループ情報128を備えている。またこれらから構成される重複排除機能を備えている。

　さらにストレージ1は、実施例1で示したバックアップサーバ2のように、ストレージ1内部に構成されたボリュームを、バックアップサーバ3へ複製する機能を備えている。このような、ストレージ1が主体となり、ボリュームをストレージ1とは異なるストレージへ複製する機能は、リモートコピー機能、リモートレプリケーション機能、ディザスタリカバリー機能などの名称で広く知られている。以下、本実施形態においても、このボリューム複製機能をリモートコピー機能と呼ぶこととする。ストレージ1のリモートコピー機能において、一連のボリューム複製処理を行う処理部を、リモートコピー処理部 (指示番号129) と呼ぶこととする。リモートコピー処理部129は、ストレージ1のCPU 11により解釈・実行されるソフトウェアとして実施されてもよいし、ストレージ1に内蔵するハードウェアとして実施されてもよい。

　一般に、リモートコピー機能は双方向性があることが好ましい。すなわち、バックアップストレージ3もまたリモートコピー機能を有する構成が一般的である。ただし、本実施形態では、バックアップストレージ3がリモートコピー機能を必ずしも有しない。

　記号S1a、S2a、S3a、S4a、S5aは、リモートコピー機能の処理ステップを示している。以下、これらの記号を使い、リモートコピー処理部129の処理の流れについて説明する。ここで、ストレージ1において、ボリューム14aはボリューム34a、ボリューム14bはボリューム34b、ボリューム14cはボリューム34cへそれぞれ複製する構成が、予め設定されているとする。このような、ストレージ1のボリューム14と、バックアップストレージ3のボリューム34の間の、複製元、複製先の関係をボリュームペアまたは単にペアと呼ぶ。なお、以下の説明において、実施例1と類似する点については適宜実施例1を参照する。

　ステップS1aにおいて、リモートコピー処理部129は、複製対象のボリュームからなるグループを定義する。このグループは、ユーザによって指示されるものであってもよい。この場合、ストレージ1を管理するための管理端末 (図示せず) を使うことで、ユーザはグループを指示できる。

　グループを構成する別の方法として、ユーザは、ボリュームが同一プールから構成されているかどうかを気にすることなく、単に複数のボリュームを指定することとしてもよい。この場合、リモートコピー処理部129は、指定されたボリュームをそのプールでグループ化し、グループを構成する。

　グループを構成する更に別の方法として、ユーザは、一貫性グループを指定することとしてもよい。一貫性グループとは、ボリュームペアのグループであり、ユーザにより予めストレージ1に設定されている。一貫性グループに含まれるペアは、同じ時刻でデータ複製の中止や再開をすることができる。一貫性グループが指定された場合、リモートコピー処理部129は、一貫性グループに含まれるペアから、ストレージ1のボリュームを特定し、これらのボリュームを構成するプールを特定し、同一プールで構成されることを条件にボリュームをグループ化する。

　構成したグループの情報は、グループ情報128に記録される。

　ステップS2aにおいて、リモートコピー処理部129は、グループの一つのボリューム (例えばボリューム14a) を先頭ボリュームとし、このボリュームをフルバックアップ対象として複製し、バックアップストレージ3のボリューム (例えばボリューム34a) として作成する。

　ステップS3aにおいて、リモートコピー処理部129は、次の複製処理対象ボリュームとしてボリューム14bを選択する。この選択したボリューム14bに対し、重複情報60をメモリ12に作成する。ここで、重複情報60の生成処理は、図12を用いて説明した重複情報出力部123と同じであるが、本実施形態では、重複情報60をバックアップサーバ2へ送信することに代えて、重複情報60をメモリ12上に作成する。

　ステップS4aにおいて、リモートコピー処理部129は、重複情報60に基づき、ボリューム14bをボリューム34bへ複製する。この複製処理は、図12を用いて説明したデータ転送部224の処理内容と基本的には同じである。相違点のみを以下に述べる。

　ステップSP502において、重複情報60を、ステップS3a (図14) で作成したメモリ22上の重複情報60とする。

　ステップSP506において、データ転送処理の主体が、ストレージ1のリモートコピー処理部129である。

　ステップSP510において、重複情報60を、保存しなくてもよい。

　図15に戻り、ステップS5aにおいて、リモートコピー処理部129は、バックアップストレージ3に対し、未複製の論理ブロックを、複製済みのボリュームの論理ブロックからコピーするように、指示する。この処理は、図12で説明したステップSP509と同様に処理できる。

　以上が、第二の実施形態である。本実施形態により、重複排除済みボリュームを効率的にバックアップストレージへ複製するリモートコピー機能が実現できる。

　次に、第三の実施例について説明する。第三の実施例は、第二の実施例と同様に、重複排除済みボリュームをストレージ1が主体となって効率的にリモートコピーする。

　図16は、第三の実施例における計算機システム102を説明する図である。

　第三の実施例では、ボリューム14x (ボリューム番号X) の過去のある時点での内容が、バックアップストレージ3にボリューム34xとして複製済みである点が、第二の実施例とは異なる。ボリューム14xは、ボリューム14a, 14b, 14cと同様に、プール15から構成されている。マッピングテーブル126、重複管理テーブル127は、それぞれ図3、図4に示したように、ボリューム14xに関する情報を含んでいる。

　第三の実施例におけるリモートコピー処理部129の処理の流れを、記号S1b, S1.1b, S4b,S5bを使い説明する。これらの記号は、処理ステップを表している。

　第三の実施例では、ボリューム14aはボリューム34a、ボリューム14bはボリューム34b、ボリューム14cはボリューム34c、ボリューム14xはボリューム34xへそれぞれ複製する構成が、ストレージ1に予めなされているとする。また、前述のように、ボリューム34xは、ボリューム14xの過去のある時点での複製である。

　ステップS1bにおいて、リモートコピー処理部129は、ユーザの指示に従い、ボリューム14a, 14b, 14cからなるグループを構成する。なお、グループの構成方法に様々な方法を取ることができることは、第二の実施例の説明のとおりである。

　ステップS1.1bにおいて、リモートコピー処理部129は、ボリューム34xが、ボリューム14xの過去のある時点での複製であることを特定し、ボリューム14xが、ボリューム34xの時点から更新された箇所を特定し、更新情報61を構成する。この処理について、以下に詳細に示す。

　まず、リモートコピー処理部129は、構成情報(ボリューム)125aを参照し、複製対象のボリューム14a, 14b, 14cを構成するプール15のプール番号を特定する。次に、このプール番号のプールから構成される他ボリュームを特定する。これにより、ボリューム14xが見つかる。

　次に、ストレージ1は、ペア構成情報により、ボリューム14xが、バックアップストレージ3のボリューム34xとペアの関係にあることを認識する。

　ところで、リモートコピー機能においては、コピー処理の効率化のため、バックアップストレージ3側のボリューム複製に対する、ストレージ1側のボリュームの更新箇所を管理することが広く行なわれている。実際、リモートコピーによる複製を作成した後、ホスト計算機5からライト要求が複製元のボリュームにあった場合は、ライト要求の対象の論理アドレスを、ビットマップデータ構造等を使いメモリ22に記録しておくことができる。そこで、上述の更新情報61は、例えばこのビットマップをメモリ22内に複製したものとする。このビットマップを参照することで、ボリューム14aとボリューム34aの各論理アドレスについて、二つのボリューム間で同じデータを記録しているか、ボリューム14aに新しいデータが記録されているかを特定できる。

　ステップS3bにおいて、リモートコピー処理部129は、ボリューム14aに対する重複情報60をメモリ22に生成する。この処理は、基本的には、実施例2のステップS3bと同じである。異なる点は、ステップS1.1bで特定したボリューム14xがグループに含まれると仮定し、ボリューム14xの情報を排除しない点である。これにより、重複情報60には、ボリューム14xの論理ブロックとの重複も記録されることになる。

　ステップS4bにおいて、リモートコピー処理部129は、実施例2のステップS4aと同様に、ボリューム14aの部分的な複製をボリューム34aに構成する。ただし、実施例2とは異なり、複製が必要か否かの判定には、ボリューム34xの利用が考慮される。すなわち、複製が必要と判定する具体的な条件は以下のとおりである。
(1)　処理対象の論理ブロックが、重複する論理ブロックでない。または
(2)　処理対象の論理ブロックが、重複する論理ブロックであるが、このバックアップラウンドの現時点までに送信された論理ブロックと重複していなく、かつ、重複論理ブロックがボリューム14xに格納されている場合には、当該論理ブロックが、ボリューム34xの作成後に更新されている。

　この条件により、ボリューム34xに複製済みの論理ブロックと重複する論理ブロックが転送されないこととなり、より効率的な複製が可能となる。

　ステップS5bにおいて、リモートコピー処理部129は、実施例2のステップS5aと同様に、未複製の論理ブロックを、複製済みのボリュームの論理ブロックからコピーするように、指示する。ここで、実施例2での処理に加え、ステップS5bでは、ボリューム14xと重複する論理ブロックで、複製しなかった論理ブロックについては、ボリューム34xからコピーするように指示する。

　以上の処理により、複製済みボリュームがバックアップストレージ3に格納済みの場合には、さらに効率的なリモートコピーが可能である。

　次に、別の非同期リモートコピー方式における本発明の実施形態を説明する。

　図17は、本発明の第四の実施形態における計算機システム103を説明する図である。実施例2と同様にストレージ1のボリューム14が、バックアップストレージ3のボリューム34へ複製される構成となっているが、ボリューム複製の方式が実施例2とは異なる。本実施形態におけるボリュームの複製は、ジャーナルボリューム16および副ジャーナルボリューム36を介して行なわれる。ジャーナルボリューム16および副ジャーナルボリューム36は、それぞれストレージ1およびバックアップストレージ3の複数のドライブ13および33から構成される論理的な記憶領域である。なお、実施例4では、ボリューム14a、14b、34a、34bのほかにもボリュームが構成されていてもよいが、図17では記載を省略している。

　ジャーナルボリューム16および副ジャーナルボリューム36を介したリモートコピーの方式について、まず簡単に説明する。

　ジャーナルボリューム16には、バックアップストレージ3のコピー先ボリュームに対するデータ格納を、ジャーナルというコマンド形式で記録する。ジャーナルは、例えば、”ボリューム14aのアドレス000に、データ1234を記録する”といった意味に解釈される。ジャーナルは時系列順に、ジャーナルボリューム16に記録される。バックアップストレージ3は、ジャーナルボリューム16に記録されたジャーナルを、時系列順に読み出し、副ジャーナルボリューム36へ格納する。その後、バックアップストレージ3は、副ジャーナルボリューム36からジャーナルを時系列順に読み出し、ジャーナルを解釈し、解釈に従ってボリューム34を更新する。

　ストレージ1は、ボリューム14aをバックアップストレージ3へ複製する場合、ボリューム14aの全データを論理アドレス順に読み出し、ジャーナルの形式でジャーナルボリューム16へ格納する。すると、ジャーナルはバックアップストレージ3により読み出され、上述に従い、最終的にはボリューム34aにボリューム14aの複製が作られる。

　ボリューム14にホスト計算機5からのライト要求がある場合、ライト要求によるデータがボリューム14に格納された上で、ジャーナルボリューム16にも記録される。

　本実施例におけるリモートコピー処理の流れを、記号S2c, S3c, S4cを使って説明する。これらの記号は、処理の流れを示す。

　ステップS2cにおいて、リモートコピー処理部129は、ボリューム14aの先頭の論理ブロックから順に、データをジャーナルボリューム16へ記録する。ジャーナルボリューム16の構成を、図18を参照して説明する。

　ジャーナルボリューム16は、ボリューム14等と同様に、論理アドレスを使用してランダムアクセス可能な論理的な記憶領域であり、複数のドライブ13をRAID技術等により組み合わせて構成されている。リモートコピー処理部129は、ジャーナルボリューム16の先頭から順に、バックアップストレージ3へ複製すべきデータを記録していく(矢印17)。このとき、ジャーナルボリューム16への記録形式として、指示番号160, 161, 162, 163に示すようなジャーナルを用いる。ジャーナルは、複数の属性情報からなる。例えば、ジャーナル160を参照すると、ジャーナルの属性情報として、ボリューム番号1601、論理ブロック番号1602、コマンド1603、データ1604、データの格納順序に関する情報を少なくとも含む。ボリューム番号1601は、複製元ボリュームのボリューム番号、論理ブロック番号1602は複製元論理ブロックの論理ブロック番号、データ1604は、複製元論理ブロックに格納されているデータ (図18ではビット配列として表現) である。コマンド1603には”WR”と記録されているが、これは、ボリューム番号1601、論理ブロック番号1602で指示されるボリュームに、データ1604に記録されたデータが格納済みであることを示し、したがって、ボリューム14aの複製先であるボリューム34aにも、この状態を復元しなければならないことを示す。

　一方、ジャーナル163を参照すると、そのコマンド1633には”DUP”と記録され、データ1634には、ボリューム14aの論理ブロック001を示す識別情報”(A, 001)”が記録されている。これは、ボリューム番号 1631、論理ブロック番号 1632の各属性で指示される論理ブロック (B, 001) が、論理ブロック (A, 001)と重複していることを示し、したがって、バックアップストレージ3は、ボリューム34bの論理ブロック001を、ボリューム34aの論理ブロック001のデータで復元しなければならないことを示す。

　ジャーナルは、コマンドの種類に応じてサイズを変えることとする。例えば、コマンドが”WR”の場合には、論理ブロック全体を収容可能なサイズ(論理ブロックを8キロバイトとするならば、8キロバイト + その他の属性のサイズ) とし、コマンドが”DUP”の場合には、より小さいサイズ (例えば、論理ブロック識別情報を16バイトとするならば、16バイト+その他の属性のサイズ)とする。これによって、重複する論理ブロックについてはデータ転送量を削減することができる。

　バックアップストレージ3は、ジャーナルボリューム16から時系列でジャーナルを読み出し、副ジャーナルボリューム36へ同じ順で記録する (矢印37)。バックアップストレージ3は、副ジャーナルボリューム36へ複製されたこれらのジャーナルを逐次解釈し、その結果をボリューム34へ反映していく。バックアップストレージ3におけるこの一連の処理は、リモートコピー処理部329により実行される。

　図17に戻る。ステップS3cにおいて、ストレージ1は、ボリューム14bに対する重複情報60を、メモリ22上に構成する。重複情報60は、図5に示したものと同じである。

　ステップS4cにおいて、リモートコピー処理部129は、ボリューム14bの論理ブロックを、論理ブロックの番号の昇順に、ジャーナルボリューム16へ記録していく。ここで、リモートコピー処理部129は、重複情報60を参照し、以下の条件に一致する論理ブロックについては、図17のジャーナル160に例示した”WR”コマンドではなく、ジャーナル163に例示した”DUP”コマンドのジャーナルとする。
(1)　重複した論理ブロックである。かつ
(2)　重複する他方の論理ブロックが、このバックアップラウンドの現時点までに、ジャーナルボリューム16に”WR”コマンドとともに記録されている。かつ
(3)　重複する他方の論理ブロックが、このバックアップラウンドの現時点までに、ホスト計算機5からのライト要求により更新されていない。

　上記条件に一致する場合は、ジャーナルのデータ属性 (例えば、1634) には、重複する他方の論理ブロック番号を記録する。

　(3)の判定には、例えば実施例3で示したビットマップデータ構造を用いた更新情報を使うことができる。

　以上、第四の実施形態によれば、ジャーナルボリュームを介したリモートコピー処理においても、重複排除済みボリュームを考慮した効率的なデータ転送が可能である。

　以上、様々な実施形態について述べたが、本発明は、バックアップストレージにテープ装置を用いることでも実施できる。本発明は、重複排除機能を備えたストレージを含む計算機システムに適用可能である。

　1：ストレージ
　2：バックアップサーバ
　3：バックアップストレージ
　4：ネットワーク
　5：ホスト計算機

Claims

　第１のストレージ、第２のストレージ、及び、バックアップサーバを含む計算機システムであって、
　前記第１のストレージは、ホストに提供する複数のボリュームの各々を、複数の論理ブロックに分割して管理し、
　前記第１のストレージは、前記複数の論理ブロックに各々格納されるデータの重複関係を重複管理情報として管理し、
　前記第１のストレージは、前記複数のボリュームのうちの二以上のボリュームをグループとして管理し、
　前記第１のストレージは、前記重複管理情報に基づいて、前記グループに属する一のボリュームについて、前記複数の論理ブロックごとに、前記グループに属する他のボリューム内の論理ブロックに格納されるデータとの重複関係を示す重複情報を作成して前記バックアップサーバに送信し、
　前記バックアップサーバは、前記重複情報を参照し、前記グループに属するボリューム内の第１の論理ブロックと重複する第２の論理ブロックを特定し、当該第１の論理ブロックに対応するデータが前記第２のストレージへ送信済みである場合には、当該第２の論理ブロックに対応するデータを前記第２のストレージへ送信しないことを特徴とする、計算機システム。
　前記バックアップサーバは、前記第２のストレージへ送信しないと判定した前記第２の論理ブロックに対応するデータについて、前記第２のストレージに格納されている前記第１の論理ブロックに対応するデータを複製して格納することを前記第２のストレージに対して指示することを特徴とする、
　請求項１に記載の計算機システム。
　前記第１のストレージは、一以上の記憶媒体により構成される物理記憶領域をプールとして管理し、当該プールに構成される複数の物理ブロックのうちの一の物理ブロックを、前記複数の論理ブロックのいずれかに動的に割当てることを特徴とする、
　請求項１に記載の計算機システム。
　前記バックアップサーバは、前記グループに属する第１のボリュームに格納されたデータを、前記第２のストレージに複製し、
　前記バックアップサーバは、前記重複情報を参照し、前記グループに属する第２のボリューム内の前記第２の論理ブロックが、前記第１のボリューム内の前記第１の論理ブロックと重複することを特定し、当該第２の論理ブロックに対応するデータを前記第２のストレージへ送信しないことを特徴とする、
　請求項１に記載の計算機システム。
　前記バックアップサーバは、前記第２のストレージに複製された、前記グループに対応する複数のボリュームのうちあるボリュームを選択して、当該ボリュームに格納されたデータを前記第１のストレージにリストアし、
　前記バックアップサーバは、リストアの際、前記重複情報を参照し、前記第１のストレージにリストアしたボリュームに含まれる第３の論理ブロックが、前記グループに対応して前記第２のストレージ内で作成された他のボリューム内の第４の論理ブロックと重複することを特定し、当該第４の論理ブロックに対応するデータを前記第１のストレージへ送信しないことを特徴とする、
　請求項１に記載の計算機システム。
　第１及び第２のストレージ含む計算機システムであって、
　前記第１のストレージは、ホストに提供する複数のボリュームの各々を、複数の論理ブロックに分割して管理し、
　前記第１のストレージは、前記複数の論理ブロックに各々格納されるデータの重複関係を重複管理情報として管理し、
　前記第１のストレージは、前記複数のボリュームのうちの二以上のボリュームをグループとして管理し、
　前記第１のストレージは、前記重複管理情報に基づいて、前記グループ内のあるボリュームについて、前記複数の論理ブロックごとに、前記グループに属する他のボリューム内の論理ブロックとの重複関係を示す重複情報を管理し、
　前記第１のストレージは、前記重複情報を参照し、前記グループに属するボリューム内の第１の論理ブロックと重複する第２の論理ブロックを特定し、当該第１の論理ブロックに対応するデータが前記第２のストレージへ送信済みである場合には、当該第２の論理ブロックに対応するデータを前記第２のストレージへ送信しないことを特徴とする、計算機システム。
　前記第１のストレージは、前記グループに属するボリュームである第３のボリュームを備え、
　前記第２のストレージは、前記第３のボリュームのある時点での複製である第４のボリュームを備え、
　前記第１のストレージは、前期複数の論理ブロックごとの前記重複情報を参照し、前記第２の論理ブロックに重複する前記第１の論理ブロックが前記第３のボリュームに含まれ、当該第２の論理ブロックが第４のボリュームへ複製された時刻から更新されていない場合に、第２の論理ブロックを第二のストレージへ送信しないとさらに判定する、
　請求項６記載の計算機システム。
　前記第２のストレージは、前記第１のストレージが前記第２のストレージへ送信しないと判定した前記第２の論理ブロックに対応するデータについて、当該第２のストレージに格納されている前記第１の論理ブロックに対応するデータを複製して格納することを特徴とする、
　請求項６に記載の計算機システム。
前記第１のストレージは、一以上の記憶媒体により構成される物理記憶領域をプールとして管理し、当該プールに構成される複数の物理ブロックのうちの一の物理ブロックを、前記複数の論理ブロックのいずれかに動的に割当てることを特徴とする、
　請求項６に記載の計算機システム。
前記第１のストレージは、前記グループに属する第１のボリュームに格納されたデータを、前記第２のストレージに複製し、
　前記第１のストレージは、前記重複情報を参照し、前記グループに属する第２のボリューム内の前記第２の論理ブロックが、前記第１のボリューム内の前記第１の論理ブロックと重複することを特定し、当該第２の論理ブロックに対応するデータを前記第２のストレージへ送信しないことを特徴とする、
　請求項８に記載の計算機システム。
　前記第２のストレージは、前記第２のストレージに複製された、前記グループに対応する複数のボリュームのうちあるボリュームを選択して、当該ボリュームに格納されたデータを前記第１のストレージにリストアし、
　前記第２のストレージは、リストアの際、前記重複情報を参照し、前記第１のストレージにリストアしたボリュームに含まれる第３の論理ブロックが、前記グループに対応して前記第２のストレージ内で作成された他のボリューム内の第４の論理ブロックと重複することを特定し、当該第４の論理ブロックに対応するデータを前記第１のストレージへ送信しないことを特徴とする、
　請求項６に記載の計算機システム。
　複数の第１のボリュームとジャーナルボリュームを備える第１のストレージと、
　複数の第２のボリュームと副ジャーナルボリュームを備える第２のストレージとを少なくとも含む計算機システムであって、
　前記第２のストレージは、前記ジャーナルボリュームからジャーナルを時系列にしたがって読み出して前記副ジャーナルボリュームへ格納し、前記副ジャーナルボリュームからジャーナルを時系列にしたがって読み出して、ジャーナルに含まれるコマンドに従って前記第２のボリュームにデータを記録し、
　前記第１のストレージは、ホストに提供する複数のボリュームの各々を、複数の論理ブロックに分割して管理し、
　前記第１のストレージは、前記複数の論理ブロックに各々格納されるデータの重複関係を重複管理情報として管理し、
　前記第１のストレージは、前記重複管理情報に基づいて、前記複数のボリュームについて、前記複数の論理ブロックごとに、他のボリューム内の論理ブロックとの重複関係を示す重複情報を管理し、
　前記第１のストレージは、前記論理ブロックごとの前記重複情報を参照し、第１の論理ブロックと重複する第２の論理ブロックを特定し、前記第２の論理ブロックに関して前記ジャーナルボリュームに復元を指示するコマンドとデータからなる第１のジャーナルを記録している場合であって、第１のジャーナルを記録した時刻から前記第２の論理ブロックに更新がない場合、前記第１の論理ブロックに関して前記第２の論理ブロックからの複製を指示するコマンドを含むジャーナルを前記ジャーナルボリュームに記録することを特徴とする、計算機システム。