JP2023001471A - ストレージシステム、計算機システム及び制御方法 - Google Patents

ストレージシステム、計算機システム及び制御方法 Download PDF

Info

Publication number
JP2023001471A
JP2023001471A JP2021102223A JP2021102223A JP2023001471A JP 2023001471 A JP2023001471 A JP 2023001471A JP 2021102223 A JP2021102223 A JP 2021102223A JP 2021102223 A JP2021102223 A JP 2021102223A JP 2023001471 A JP2023001471 A JP 2023001471A
Authority
JP
Japan
Prior art keywords
snapshot
storage system
data
snapshots
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021102223A
Other languages
English (en)
Inventor
貴記 松下
Takaki Matsushita
彰 出口
Akira Deguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2021102223A priority Critical patent/JP2023001471A/ja
Priority to CN202210121047.8A priority patent/CN115576481A/zh
Priority to US17/692,964 priority patent/US11836110B2/en
Publication of JP2023001471A publication Critical patent/JP2023001471A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/128Details of file system snapshots on the file-level, e.g. snapshot creation, administration, deletion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/188Virtual file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ストレージシステム間のデータ転送量を削減することを目的とする。【解決手段】ネットワークを介して他のストレージシステムに接続されるストレージシステムであって、メモリと、前記メモリに記憶されるプログラムを実行するプロセッサと、記憶デバイスと、を備え、前記プログラムの実行により前記プロセッサは、仮想ボリュームを提供し、前記仮想ボリュームについて異なるタイミングで複数のスナップショットを生成し、前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを前記記憶デバイスに保持させ、前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記他のストレージシステムに送信して保持させることを特徴とする。【選択図】図1

Description

本発明は、ストレージシステム、計算機システム及び制御方法に関する。
大規模なデータを扱う計算機システムは、ホスト計算機とは別個に設けられた大容量のストレージシステム(例えばクラウドストレージ)を用いてデータを管理している。クラウドストレージの活用形態の一つとして、顧客のデータセンタ(以後、オンプレミスと呼ぶ)に配置されているストレージがクラウドストレージへのデータの格納を制御するものがある。すなわち、ホスト計算機はクラウドストレージを意識しない。
特許文献1には、「オンプレミスのストレージ装置の容量の節約と、オンプレミスのストレージ装置の高アクセス性能と、オンプレミスのリソースに障害があったとき、クラウド上のデータを用いて、高速かつ正確に業務を再開することとを実現する。」、「プロセッサは、仮想ボリュームである第一ボリュームを提供し、第一ボリュームと、他のストレージシステムにより提供される第二ボリュームとのコピーペアを設定する。第一ボリュームへのライトデータは、コピーペアに基づいて、ネットワークを介して第二ボリュームへ転送される。プロセッサは、第二ボリュームへ書き込まれるデータの一部をメモリへ書き込み、メモリへ書き込まれたデータを記憶デバイスへ書き込む。」との記載がある。
特開2018-129074号公報
オンプレミスのボリュームのスナップショットを、オンプレミスではなくクラウドストレージに保持させることとすれば、オンプレミスの容量の節約が実現できる。しかし、スナップショットをクラウドストレージにアップロードするにも、また、リストア時にスナップショットをクラウドストレージからダウンロードするにも、大量のデータ転送を行う必要が生じ、回線コストの増大とRTO(Recovery Time Objective)の悪化を招く。
そこで、本発明では、ストレージシステム間のデータ転送量を削減することを目的とする。
上記目的を達成するために、代表的な本発明のストレージシステムの一つは、ネットワークを介して他のストレージシステムに接続されるストレージシステムであって、メモリと、前記メモリに記憶されるプログラムを実行するプロセッサと、記憶デバイスと、を備え、前記プログラムの実行により前記プロセッサは、仮想ボリュームを提供し、前記仮想ボリュームについて異なるタイミングで複数のスナップショットを生成し、前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを前記記憶デバイスに保持させ、前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記他のストレージシステムに送信して保持させることを特徴とする。
また、代表的な本発明の計算機システムの一つは、第一ストレージシステムと、ネットワークを介して前記第一ストレージシステムに接続される第二ストレージシステムと、を備え、前記第一ストレージシステムは、仮想ボリュームを提供し、前記仮想ボリュームについて異なるタイミングで複数のスナップショットを生成し、前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを保持し、前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記第二ストレージシステムに送信して保持させることを特徴とする。
また、代表的な本発明の制御方法の一つは、ネットワークを介して第二ストレージシステムに接続される第一ストレージシステムの制御方法であって、仮想ボリュームを提供するステップと、前記仮想ボリュームについて異なるタイミングで複数のスナップショットを生成するステップと、前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを第一ストレージシステムに保持させるステップと、前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記第二ストレージシステムに送信して保持させるステップとを含むことを特徴とする。
本発明によれば、ストレージシステム間のデータ転送量を削減することができる。上記した以外の課題、構成及び効果は以下の実施の形態の説明により明らかにされる。
実施例1に係る差分転送の説明図。 実施例1に係るリストアの説明図。 実施例1に係る計算機システムの構成図。 ストレージシステムの構成図。 メモリが記憶するデータの説明図。 バックアップスケジュールの設定画面の説明図。 リストア実行画面の説明図。 スケジュール情報テーブルの具体例。 プールテーブルの具体例。 仮想ボリュームマッピングテーブルの具体例。 スナップショットマッピングテーブルの具体例。 スナップショットペア管理テーブルの具体例。 差分ビットマップの具体例。 バックアップスケジュールプログラムの処理手順を示すフローチャート。 スナップショット取得処理の処理手順を示すフローチャート。 基底スナップショット更新処理の詳細を示すフローチャート。 差分取得処理の詳細を示すフローチャート。 差分データアップロード処理の詳細を示すフローチャート。 スナップショット削除処理の詳細を示すフローチャート。 スナップショットリストア処理の処理手順を示すフローチャート。 差分データダウンロード処理の詳細を示すフローチャート。 実施例2に係る計算機システムの構成図。 実施例2に係るリストアの説明図。 実施例2の差分データアップロード処理の詳細を示すフローチャート。 実施例2に係るスナップショットリストア処理の処理手順を示すフローチャート。 差分マージデータダウンロード処理の詳細を示すフローチャート。 クラウドにおける差分データマージ処理の詳細を示すフローチャート。 変形例に係るストレージシステムの構成図。 変形例に係るメモリが記憶するデータの説明図。
以下、実施例を図面を用いて説明する。
以下の説明では、「×××テーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「×××テーブル」を「×××情報」と呼ぶことができる。また、以下の説明において、各テーブルの構成は一例であり、1つのテーブルは、2以上のテーブルに分割されてもよいし、2以上のテーブルの全部又は一部が1つのテーブルであってもよい。
また、以下の説明では、要素の識別情報として、IDが使用されるが、それに代えて又は加えて他種の識別情報が使用されてもよい。
また、以下の説明では、同種の要素を区別しないで説明する場合には、参照符号又は参照符号における共通番号を使用し、同種の要素を区別して説明する場合は、その要素の参照符号を使用又は参照符号に代えてその要素に割り振られたIDを使用することがある。
また、以下の説明では、I/O(Input/Output)要求は、ライト要求又はリード要求であり、アクセス要求と呼ばれてもよい。
また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び/又はインターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主語がプロセッサとされてもよい。プログラムを主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理又はシステムとしてもよい。また、プロセッサは、処理の一部または全部を行うハードウェア回路を含んでもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサ(例えばCPU)と記憶資源を含み、記憶資源はさらに配布プログラムと配布対象であるプログラムとを記憶してよい。そして、プログラム配布サーバのプロセッサが配布プログラムを実行することで、プログラム配布サーバのプロセッサは配布対象のプログラムを他の計算機に配布してよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
実施例1に開示する計算機システムは、第一ストレージシステムと第二ストレージシステムを有する。
第一ストレージシステムは、顧客のデータセンタに設置されたオンプレミスのストレージシステムであり、ホストコンピュータに対してボリュームを提供し、ホストコンピュータのアクセス要求を処理する。第一ストレージシステムがホストコンピュータに提供するボリュームを、プロダクションボリューム(Production Volume)という。プロダクションボリュームは、物理的な記憶デバイスを利用して生成された仮想ボリュームである。
第二ストレージシステムは、クラウドストレージであり、プロダクションボリュームのスナップショットを保持するために用いられる。
プロダクションボリュームのスナップショットを定期的に生成する場合に、スナップショットに係るデータを全てオンプレミスで管理すると、オンプレミスの記憶デバイスに多くの容量が必要となる。一方、スナップショットに係るデータを全てクラウドで管理すると、オンプレミスとクラウドとの間で大量のデータ転送が必要となる。
そこで、実施例1に係る計算機システムは、基準となる基底スナップショットをオンプレミスの記憶デバイスに保持させ、基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データをクラウドストレージに転送して保持させる。このため、オンプレミスで要求される容量を抑えつつ、ストレージ間のデータ転送量を削減することができる。
図1は、実施例1に係る差分転送の説明図である。図1では、時刻t0から時刻t6に次の各処理が行われる。
時刻(t0)には、オンプレミスのストレージシステムが、プロダクションボリュームから基底スナップショットを取得し、オンプレミスで保持している。この基底スナップショットを、基底スナップショットSS(t0)とする。時刻t0では、プロダクションボリュームにはデータA0とデータB0が格納されており、基底スナップショットSS(t0)にはデータA0とデータB0が含まれる。
時刻(t1)には、プロダクションボリュームのデータA0はデータA1に更新されている。この時点で、オンプレミスのストレージシステムがプロダクションボリュームからスナップショットSS(t1)を取得し、オンプレミスで保持する。したがって、オンプレミスには基底スナップショットSS(t0)とスナップショットSS(t1)が保持されており、スナップショットSS(t1)には、データA1とデータB0が含まれる。
時刻(t2)には、プロダクションボリュームのデータA1はデータA2に更新されている。この時点で、オンプレミスのストレージシステムがプロダクションボリュームからスナップショットSS(S2)を取得し、オンプレミスで保持する。したがって、オンプレミスには基底スナップショットSS(t0)、スナップショットSS(t1)及びスナップショットSS(t2)が保持されており、スナップショットSS(t2)には、データA2とデータB0が含まれる。
時刻(t3)には、プロダクションボリュームのデータB0はデータB1に更新されている。この時点で、オンプレミスのストレージシステムがプロダクションボリュームからスナップショットSS(S3)を取得し、オンプレミスで保持する。したがって、オンプレミスには基底スナップショットSS(t0)、スナップショットSS(t1)、スナップショットSS(t2)及びスナップショットSS(t3)が保持されており、スナップショットSS(t3)には、データA2とデータB1が含まれる。
時刻(t4)において、オンプレミスのストレージシステムは、基底スナップショットSS(t0)とスナップショットSS(t1)との差分を取得し、オブジェクト(t1)としてクラウドに転送する。このため、オブジェクト(t1)には、データA1が含まれることになる。
時刻(t5)において、オンプレミスのストレージシステムは、差分転送済みの最新のスナップショットSS(t1)とスナップショットSS(t2)との差分を取得し、オブジェクト(t2)としてクラウドに転送する。このため、オブジェクト(t2)には、データA2が含まれることになる。
時刻(t6)において、オンプレミスのストレージシステムは、差分転送済みの最新のスナップショットSS(t2)と基底スナップショットSS(t0)を残し、スナップショットSS(t1)を削除する。スナップショットを削除する場合には、スナップショットに含まれていたデータA1を記憶デバイスから削除するが、スナップショットの履歴情報は残される。このように、実体としてのデータを持たず、履歴情報のみが残されたスナップショットを便宜上、スタブという。
図2は、実施例1に係るリストアの説明図である。図2では、時刻t10から時刻t16に次の各処理が行われる。
時刻(t10)には、プロダクションボリュームのデータに異常が発生している。具体的には、プロダクションボリュームがマルウェアに感染し、既存のデータが暗号化されてデータXとデータYに置き換えられている。
時刻(t11)において、オンプレミスのストレージシステムは、プロダクションボリュームからスナップショットSS(t11)を取得し、オンプレミスで保持する。したがって、オンプレミスには基底スナップショットSS(t0)とスナップショットSS(t11)が保持されており、スナップショットSS(t1)には、データXとデータYが含まれる。
時刻(t12)において、オンプレミスのストレージシステムは、プロダクションボリュームからマルウェアを駆除する。
時刻(t13)において、オンプレミスのストレージシステムは、基底スナップショットSS(t0)をプロダクションボリュームに書き戻す。この結果、プロダクションボリュームには、データA0とデータB0が含まれることになる。
時刻(t14)において、オンプレミスのストレージシステムは、クラウドからオブジェクト(t1)の差分転送を受け、プロダクションボリュームに反映させる。この結果、プロダクションボリュームには、データA1とデータB0が含まれることになる。
時刻(t15)において、オンプレミスのストレージシステムは、クラウドからオブジェクト(t2)の差分転送を受け、プロダクションボリュームに反映させる。この結果、プロダクションボリュームには、データA2とデータB0が含まれることになる。
時刻(t16)において、オンプレミスのストレージシステムは、クラウドからオブジェクト(t3)の差分転送を受け、プロダクションボリュームに反映させる。この結果、プロダクションボリュームには、データA2とデータB1が含まれることになる。
このように、オンプレミスで保持していた基底スナップショットを書き戻した後、複数の差分データを時系列に沿って適用することで、プロダクションボリュームのリストアを行うことができる。
図3は、実施例1に係る計算機システムの構成図である。
本実施例の計算機システムは、オンプレミス100と、クラウド200とを含む。
オンプレミス100は、ストレージシステム103と、当該ストレージシステムにデータを保存するホストコンピュータ101とを含む。ホストコンピュータ101は、アプリケーション102を実行し、当該アプリケーション102で使用されるデータがストレージシステム103に格納される。ホストコンピュータ101とストレージシステム103はネットワーク111で接続されている。ストレージシステム103は、ストレージ装置と呼ばれることがある。
クラウド200は、1又は複数のオブジェクトストレージ201を提供する。
ストレージシステム300とオブジェクトストレージ201は、ネットワーク300を介して接続されている。
ストレージシステム103は、物理記憶デバイスを用いて、仮想ボリューム104と容量プール107を形成する。容量プール107は、ストレージシステム103に搭載されているHDD(Hard Disk Drive)などの物理記憶デバイスに対応付けられ、物理的な容量を有する。
仮想ボリューム104は、ホストコンピュータ101からアクセス可能に提供される記憶領域である。ホストコンピュータ101は、仮想ボリューム104を、通常のボリュームと同等に扱うことができる。
ストレージシステム103は、ホストコンピュータ101から仮想ボリューム104へのライト要求を受け付けた時、容量プール107から領域を確保し、ライト要求に示されたアドレスと関連付ける。ライトデータ自体は、容量プールに格納される。本実施例で、仮想ボリューム104にデータを格納するとは、仮想ボリューム104のデータとしてストレージシステム103内のキャッシュにデータを格納すること、または、仮想ボリューム104に対応する容量プール107にデータを格納することを意味する。なお、物理記憶デバイスを、記憶デバイスと呼ぶことがある。
ストレージシステム103は、複数の物理記憶デバイスの物理記憶領域からプールボリューム108を作成する。容量プール107は、一つ以上のプールボリューム108を含む。プールボリューム108には、仮想ボリューム104への割当単位となる物理記憶領域であるページ109が含まれる。ページ109の容量は、例えば、数KB~数十MBである。
仮想ボリューム104内の仮想記憶領域に対して、データの書き込みがあると、ストレージシステム103は、その仮想記憶領域に対して、プールボリューム108内のページ109を割当てる。すなわち、仮想ボリューム104の使用されていない領域については、ページ109が割り当てられていない。
ストレージシステム103は、定期的にプロダクションボリュームである仮想ボリューム104のスナップショットを作成する。スナップショットのデータも、プールボリューム108に保持されている。
図3では、仮想ボリューム104はデータA2とデータB1を含み、基底スナップショットSS(t0)はデータA0とデータB0を含む。
また、スナップショットSS(t2)はデータA2とデータB0を含み、スナップショットSS(t3)はデータA2とデータB1を含む。
ここで、仮想ボリューム104のデータA2と、スナップショットSS(t3)のデータA2とは、プールボリューム108における同一のページが割り当てられた状態である。このように、プールボリューム108や複数のスナップショットにおいて、同一のデータには同一のページが割り当てられるため、データの重複によりプールボリューム108の容量が消費されることはない。
言い換えれば、ストレージシステム103は、スナップショットを生成した後、ライト要求により仮想ボリューム104のデータ更新が発生した場合には、更新先の仮想記憶領域に新たなページを割り当てることで、スナップショットのデータを保護しつつ、仮想ボリューム104のデータ更新を実現する。そして、スナップショットをスタブ化したならば、そのスナップショットにのみ使用されていたページは解放される。
図4は、ストレージシステム103の構成図である。
ストレージシステム103は、1又は複数のコントローラ409と、1又は複数の物理記憶デバイス408とを有する。物理記憶デバイス408としては、SSD(Solid State Drive)など、任意のデバイスを用いることができる。
コントローラ409は、フロントエンドIF402、外部転送用IF403、マネジメントIF404、プロセッサ405、メモリ406、バックエンドIF407を有し、これらをバス410で接続している。
フロントエンドIF402は、ネットワーク111を介してホストコンピュータ101と接続するインタフェースである。
外部転送用IF403は、ネットワーク300を介してクラウド200と接続するインタフェースである。
マネジメントIF404は、ネットワーク401を介して管理用コンピュータ400と接続するインタフェースである。
バックエンドIF407は、ストレージシステム103内の物理記憶デバイス408と接続するインタフェースである。
プロセッサ405は、メモリ406に記憶されるプログラムを実行することで各種機能を実現する。例えば、プロセッサ405は、ホストコンピュータ101に仮想ボリュームを提供する。また、プロセッサ405は、仮想ボリュームについて異なるタイミングで複数のスナップショットを生成し、複数のスナップショットのうち基準となるスナップショットである基底スナップショットを物理記憶デバイス408に保持させ、基底スナップショットと当該基底スナップショット以降に生成したスナップショットとの差分を示す差分データを他のストレージシステムであるクラウド200に送信して保持させる。
図5は、メモリ406が記憶するデータの説明図である。
メモリ406は、例えば、1以上のメモリデバイスにより構成され、制御情報を記憶する制御情報部520と、プログラムを記憶するプログラム部530と、データをキャッシュするキャッシュメモリの一例としてのキャッシュ部540とを有する。なお、キャッシュ部540を、キャッシュやキャッシュメモリと呼ぶことがある。
メモリ406の制御情報部520には、スケジュール情報テーブル500、プールテーブル501、仮想ボリュームマッピングテーブル502、スナップショットマッピングテーブル503、スナップショットペア管理テーブル504及び差分ビットマップ505が格納される。
スケジュール情報テーブル500は、バックアップのスケジュール設定情報(スナップショットの取得周期や保護期間)を保持するテーブルである。
プールテーブル501は、プール内のページから仮想ボリュームまたはスナップショットの論理アドレスへのポインタ情報を保持するアドレスマッピングテーブルである。
仮想ボリュームマッピングテーブル502は、仮想ボリュームの論理アドレスからのプール内ページへのポインタ情報を保持するアドレスマッピングテーブルである。
スナップショットマッピングテーブル503は、スナップショットの論理アドレスからのプール内ページ、又はクラウドオブジェクトへのポインタ情報を保持するアドレスマッピングテーブルである。
スナップショットペア管理テーブル504は、ボリューム毎に1以上のスナップショットペアを管理するテーブルである。
差分ビットマップ505は、スナップショット毎に直前の世代との差分位置を管理するビットマップテーブルである。
メモリ406のプログラム部530には、バックアップスケジュールプログラム506、スナップショット取得プログラム507、スナップショットリストアプログラム508、差分取得プログラム509、差分データアップロードプログラム510、差分データダウンロードプログラム511及びスナップショット削除プログラム512が格納されている。
バックアップスケジュールプログラム506は、スケジュール設定情報に基づき、バックアップ処理及びスナップショット削除処理を実行するプログラムである。
スナップショット取得プログラム507は、スナップショットを取得するプログラムである。
スナップショットリストアプログラム508は、スナップショットからプロダクションボリュームへデータ復元(リストア)を実行するプログラムである。
差分取得プログラム509は、直前の世代のスナップショットとの差分位置を取得するプログラムである。
差分データアップロードプログラム510は、差分データ群をストレージ装置からクラウドオブジェクトストレージへアップロードするプログラムである。
差分データダウンロードプログラム511は、クラウドオブジェクトストレージから、差分データ群をストレージ装置へダウンロードするプログラムである。
スナップショット削除プログラム512は、スナップショットを削除するプログラムである。
図6は、バックアップスケジュールの設定画面の説明図である。設定画面におけるボリュームID601は、バックアップスケジュールを設定する仮想ボリュームを特定する識別情報である。
初回スナップショット取得時刻602は、対象の仮想ボリュームについて、最初にスナップショットを取得する時刻を指定する入力欄である。
取得周期603は、スナップショットを取得する周期を指定する入力欄である。
保護期間604は、スナップショットの保護期間を指定する入力欄である。
クラウドバックアップ指定欄605は、クラウドストレージに差分データを転送するかを指定する入力欄である。クラウドバックアップ指定欄605を「Enable」に指定すれば、基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分をクラウドに転送して保持させることができる。クラウドバックアップ指定欄605を「Disable」に指定すれば、スナップショットはすべてストレージシステム103で保持される。
クラウドバックアップ指定欄605を「Enable」に指定した場合には、装置内スナップショット保持数指定欄606と基底スナップショット作成閾値指定欄607に対する入力が可能になる。
装置内スナップショット保持数指定欄606は、基底スナップショット以外にどれだけのスナップショットをストレージシステム103に保持するかを指定する入力欄であり、スナップショットが指定された数を超えた場合に、古いスナップショットからクラウドに転送する。
基底スナップショット作成閾値指定欄607は、基底スナップショットを更新する条件を指定する入力欄であり、基底スナップショットとの差分データの合計がこの閾値を超えた場合に、基底スナップショットの更新を行う。
なお、クラウドバックアップ「Enable」でも取得周期と保護期間によっては、装置内スナップショット保持数に到達せずに保護期間が経過し、装置内で削除される、すなわちクラウドバックアップが動作しないケースがある。
例えば、取得周期120分、保護期間24時間であれば、クラウドバックアップせずに装置内スナップショット12個で運用可能である。
また、基底スナップショット作成閾値によっては、装置内スナップショット保持数に到達していないにもかかわらず、基底スナップショットの更新によって、装置内から古いスナップショットが削除されるケースがある。
図7は、リストア実行画面の説明図である。リストアの実行画面におけるボリュームID701は、リストアする仮想ボリュームを特定する識別情報である。
選択欄702は、リスト表示されたスナップショットのうち、どのスナップショットの状態にリストアするかを指定するチェックボックスである。
スナップショットID703は、スナップショットの識別情報であり、取得時刻704は当該スナップショットを取得した時刻を示す。
属性705は、当該スナップショットの属性を示し、「基底」、「クラウド」、「通常」などの値を取る。属性705が「基底」であれば、当該スナップショットは基底スナップショットである。属性705が「クラウド」であれば、当該スナップショットはクラウドに転送済みである。属性705が「通常」であれば、当該スナップショットはクラウドに転送されておらず、オンプレミスに全てのデータが存在する。
図8は、スケジュール情報テーブル500の具体例である。スケジュール情報テーブル500は、各仮想ボリュームついてバックアップスケジュールを管理するテーブルであり、ボリュームID800、初回スナップショット取得時刻801、取得周期802、保護期間803、クラウドバックアップ804、装置内スナップショット保持数805及び基底スナップショット作成閾値806の項目を有する。これらの項目は、図6に示した設定画面で入力された値を保持する。
図9は、プールテーブル501の具体例である。プールテーブル501は、ページナンバー900、プールボリュームID901、スタートアドレス902、ステータス903、割当先仮想ボリュームID/スナップショットID904、割当先アドレス905の項目を有する。
これらのうち、ステータス903は、割当済(Allocated)であるか、未割当(Free)であるかを示す。そして、割当済である場合に割当先仮想ボリュームID/スナップショットID904及び割当先アドレス905により、割当先が特定される。なお、割当先は、仮想ボリュームの場合もスナップショットの場合もある。
図10は、仮想ボリュームマッピングテーブル502の具体例である。仮想ボリュームマッピングテーブル502は、仮想ボリュームID1000、スタートアドレス1001、ステータス1002、参照先アドレス1003の項目を有する。
ステータス1002は、割当済(Allocated)である未割当(Free)であるかを示す。
参照先アドレス1003は、ステータス1002が割当済である場合に、プールページナンバーによって特定される。
図11は、スナップショットマッピングテーブル503の具体例である。スナップショットマッピングテーブル503は、スナップショットID1100、スタートアドレス1101、ステータス1102及び参照先アドレス1103の項目を有する。
ステータス1102は、割当済(Allocated)である未割当(Free)であるかを示す。
参照先アドレス1103は、ステータス1102が割当済である場合に、プールページナンバー又はクラウドオブジェクトによって特定される。
図12は、スナップショットペア管理テーブル504の具体例である。スナップショットペア管理テーブル504は、ボリュームID1200、スナップショットID1201、スナップショット取得時刻1202及び属性1203の項目を有する。
図12では、ボリュームID「0」の仮想ボリュームについて、時刻「t0」~時刻「t5」のスナップショットが取得された状態を示している。
時刻「t0」に取得されたスナップショットID「0」の属性は「基底」である。
時刻「t1」に取得されたスナップショットID「1」の属性は「クラウド」である。
時刻「t2」に取得されたスナップショットID「2」の属性は「クラウド」である。
時刻「t3」に取得されたスナップショットID「3」の属性は「クラウド」である。
時刻「t4」に取得されたスナップショットID「4」の属性は「通常」である。
時刻「t5」に取得されたスナップショットID「5」の属性は「通常」である。
図13は、差分ビットマップ505の具体例である。差分ビットマップ505は、スナップショットID1300、スタートアドレス1301及び差分ビット1302の項目を有する。
差分ビット1302は、「1」で直前に取得されたスナップショットとの差分があることを示し、「0」で直前に取得されたスナップショットとの差分がないことを示す。
図14は、バックアップスケジュールプログラムの処理手順を示すフローチャートである。バックアップスケジュールプログラム506は、まず、スケジュール情報テーブル500を参照し(ステップ1400)、現在時刻がスナップショット取得時刻を超過しているかを判定する(ステップ1401)。
現在時刻がスナップショット取得時刻を超過しているならば(ステップ1401;Yes)、スナップショット取得処理を開始させる(ステップ1402)。スナップショット取得処理の後、もしくは現在時刻がスナップショット取得時刻を超過していない場合(ステップ1401;No)、バックアップスケジュールプログラム506は、クラウドバックアップが「Enable」であるか否かを判定する(ステップ1403)。
クラウドバックアップが「Enable」ならば(ステップ1403;Yes)、基底スナップショット更新処理を開始させる(ステップ1404)。基底スナップショット更新処理の後、バックアップスケジュールプログラム506は、装置内のスナップショット数が装置内保持スナップショット数を超過しているか否かを判定する(ステップ1405)。
装置内のスナップショット数が装置内保持スナップショット数を超過しているならば(ステップ1405;Yes)、バックアップスケジュールプログラム506は、超過分のスナップショットを全てアップロード済みであるか否かを判定する(ステップ1406)。
超過分のスナップショットを全てアップロード済みでなければ(ステップ1406;No)、差分データアップロード処理を開始する(ステップ1407)。ステップ1407の後、ステップ1406に戻る。
クライドバックアップ「Disable」の場合(ステップ1403;No)、装置内のスナップショット数が装置内保持スナップショット数以下である場合(ステップ1405;No)、超過分のスナップショットを全てアップロード済みである場合(ステップ1406;Yes)、ステップ1408に移行する。
ステップ1408では、バックアップスケジュールプログラム506は、スナップショットペア管理テーブル504を参照する。そして、基底スナップショットより古い、もしくは保護期間超過(現在時刻-取得時間 ≧ 保護期間)のスナップショットがあるか否かを判定する(ステップ1409)。判定の結果、該当するスナップショットが無ければ(ステップ1409;No)、処理を終了する。一方、該当するスナップショットがあるならば(ステップ1409;Yes)、スナップショット削除処理を実行し(ステップ1410)、ステップ1408に戻る。
図15は、スナップショット取得処理の処理手順を示すフローチャートである。スナップショット取得プログラム507は、スナップショット取得処理が開始されると、指定ボリュームにキャッシュダーティデータがあるか否かを判定する(ステップ1500)。
指定ボリュームにキャッシュダーティデータがあるならば(ステップ1500;Yes)、スナップショット取得プログラム507は、ページを割り当ててプールテーブルを更新し(ステップ1501)、指定ボリュームのキャッシュダーティデータのデステージを行い(ステップ1502)、仮想ボリュームマッピングテーブルを更新する(ステップ1503)。
ステップ1503の後、若しくは指定ボリュームにキャッシュダーティデータが無い場合(ステップ1500;No)、スナップショット取得プログラム507は、対象ボリュームの仮想ボリュームマッピングテーブル502をスナップショットマッピングテーブル503にコピーする(ステップ1504)。その後、スナップショットペア管理テーブル504を更新して(ステップ1505)、処理を終了する。
図16は、基底スナップショット更新処理の詳細を示すフローチャートである。バックアップスケジュールプログラム506は、基底スナップショット更新処理が開始されると、直前に取得したスナップショットが初回のスナップショットであったか否かを判定する(ステップ1601)。
直前に取得したスナップショットが初回のスナップショットでない場合(ステップ1601;No)、スナップショット取得プログラム507は、差分量合計をゼロに初期化する(ステップ1602)。
ステップ1602の後、スナップショット取得プログラム507は、最新の基底スナップショットより新しい全てのスナップショットについて差分取得処理が済んでいるかを判定する(ステップ1603)。最新の基底スナップショットより新しい全てのスナップショットについて差分取得処理が済んでいるならば(ステップ1603;Yes)、そのまま処理を終了する。一方、未処理のスナップショットが残っていれば(ステップ1603;No)、差分取得処理を実行し(ステップ1604)、差分値合計に差分量を加算する(ステップ1605)。ステップ1605の後、ステップ1603に戻る。
ステップ1605の後、バックアップスケジュールプログラム506は、差分量合計が基底スナップショット作成閾値以上であるか否かを判定する(ステップ1606)。判定の結果、差分量合計が基底スナップショット作成閾値に満たない場合には(ステップ1606;No)、ステップS1603に戻る。
差分量合計が基底スナップショット作成閾値以上である場合(ステップ1606;Yes)、もしくは直前に取得したスナップショットが初回スナップショットである場合(ステップ1601;Yes)、バックアップスケジュールプログラム506は、スナップショットペア管理テーブル504を更新して基底スナップショットを設定し(ステップ1607)、処理を終了する。
図17は、差分取得処理の詳細を示すフローチャートである。差分取得プログラム509は、差分取得処理が開始されると、スナップショットマッピングテーブル503を用い、対象スナップショットと一世代前のスナップショットの同一論理アドレスの参照先アドレスを比較する(ステップ1700)。
比較の結果、参照先アドレスが異なるならば(ステップ1701;Yes)、差分取得プログラム509は、差分ビットマップ505の対象論理アドレスの差分ビットを「1」に更新する(ステップ1702)。
ステップ1702の後、若しくは参照先アドレスが同一である場合(ステップ1701;No)、差分取得プログラム509は、全ての論理アドレスについて比較が完了したか否かを判定する(ステップ1703)。
比較が完了していない論理アドレスが残っているならば(ステップ1703;No)、ステップ1700に戻る。全ての論理アドレスについて比較が完了したならば(ステップ1703;Yes)。差分取得プログラム509は、差分量を算出して(ステップ1704)、処理を終了する。差分量の算出は差分ビットマップの差分ビットが1になった数を用いて行えばよい。
図18は、差分データアップロード処理の詳細を示すフローチャートである。差分データアップロードプログラム510は、差分データアップロード処理が開始されると、アップロード対象のスナップショットを特定する(ステップ1800)。なお、アップロード対象のスナップショットが複数存在するならば、古いものから特定する。
ステップ1800の後、差分データアップロードプログラム510は、差分ビットが「1」のアドレスの全データを転送バッファにリードする(ステップ1801)。そして、転送バッファのデータをクラウドにアップロードし(ステップ1802)、スナップショットマッピングテーブル503の参照先アドレスをアップロード先に更新し(ステップ1803)、処理を終了する。参照先アドレスをアップロード先へ更新した結果、全てのスナップショットから参照されなくなったデータは、オンプレミスで使用されることのない無効化されたデータとなる。このように無効化されたデータは解放可能であり、解放によりオンプレミスの容量が節約できる。
図19は、スナップショット削除処理の詳細を示すフローチャートである。スナップショット削除プログラム512は、スナップショット削除処理が開始されると、スナップショットペア管理テーブル504を更新し、削除対象のスナップショットのエントリを削除する(ステップ1900)。
ステップ1900の後、スナップショット取得プログラム507は、差分ビットマップを削除し(ステップ1901)、指定スナップショットの属性がクラウドであるか否かを判定する(ステップ1902)。
指定スナップショットの属性がクラウドであるならば(ステップ1902;Yes)、当該スナップショットのアップロード先オブジェクトを削除して(ステップ1904)、処理を終了する。
指定スナップショットの属性がクラウドでなければ(ステップ1902:No)、スナップショット削除プログラム512は、対応するスナップショットマッピングテーブル503を削除して(ステップS1903)、処理を終了する。
図20は、スナップショットリストア処理の処理手順を示すフローチャートである。スナップショットリストアプログラム508は、まず、リストア先ボリュームのキャッシュ領域をパージする(ステップ2000)。その後、スナップショットペア管理テーブル504を参照し、リストア元スナップショットの属性がクラウドであるか否かを判定する(ステップ2001)。
リストア元スナップショットの属性がクラウドでなければ(ステップ2001;No)、リストア元スナップショットのマッピングテーブルをリストア先ボリュームのマッピングテーブルにコピーする書き戻しを行って(ステップ2007)、処理を終了する。
リストア元スナップショットの属性がクラウドであるならば(ステップ2001;Yes)、スナップショットリストアプログラム508は、基底スナップショットについてスナップショットリストア処理を実行する(ステップ2002)。基底スナップショットについてステップ2000とステップ2001を実行すると、ステップ2001の判定結果はNoとなるため、ステップ2007を行って終了することになる。
基底スナップショットについてのリストア処理(ステップ2002)を終えた後、スナップショットリストアプログラム508は、スナップショットペア管理テーブル504を参照して、前回のリストアより1世代新しいクラウド属性スナップショットを特定する(ステップ2003)。
スナップショットリストアプログラム508は、特定したクラウド属性スナップショットについて差分データダウンロード処理を実行し(ステップ2004)、前回ダウンロード済のクラウド属性スナップショットは今回のリストア対象であるか否かを判定する(ステップ2005)。
前回ダウンロード済のクラウド属性スナップショットが今回のリストア対象でない場合(ステップ2005;No)、すなわち、今回リストアすべきスナップショットまで到達していない場合、ステップ2003に戻り、次の世代のクラウド属性スナップショットを特定する。
前回ダウンロード済のクラウド属性スナップショットが今回のリストア対象である場合(ステップ2005;Yes)、すなわち、今回リストアすべきスナップショットまで到達した場合、スナップショットリストアプログラム508は、リストア用テンポラリマッピングテーブルの参照先アドレスが有効なエントリのみをリストア先ボリュームのマッピングテーブルにコピーすることで反映し(ステップ2006)、スナップリストア処理を終了する。
図21は、差分データダウンロード処理の詳細を示すフローチャートである。差分データダウンロードプログラム511は、差分データダウンロード処理が開始されると、スナップショットマッピングテーブル503から対象のクラウド属性のスナップショットを特定する(ステップ2100)。そして、クラウドへダウンロード要求し、受信バッファに差分データを受信する(ステップ2101)。
ステップ2101の後、差分データダウンロードプログラム511は、対象スナップショットの差分ビットマップを参照し、未処理でビットオン(差分ビット「1」)のアドレスがあるか否かを判定する(ステップ2102)。
未処理でビットオンのアドレスがあるならば(ステップ2102;Yes)、差分データダウンロードプログラム511は、受信バッファのデータをページ単位に分割し、デステージする(ステップ2103)。その後、差分データダウンロードプログラム511は、リストア用テンポラリマッピングテーブルを更新することで、差分ビットオンの論理アドレスをデステージ先アドレスに更新し(ステップ2104)、ステップ2102に戻る。
未処理でビットオンのアドレスが無ければ(ステップ2102;No)、処理を終了する。
実施例1では、オンプレミスのストレージシステムが、クラウドに保持させた複数の差分データを取得し、オンプレミスで時系列に沿って適用してリストアを行う構成について説明を行った。本実施例2では、クラウドのストレージシステムが複数の差分データを統合して差分マージデータを生成し、オンプレミスのストレージシステムが差分マージデータを取得して適用する構成について説明する。
図22は、実施例2に係る計算機システムの構成図である。
本実施例の計算機システムは、仮想ストレージで構成されたリカバリーボリューム202を有する点が実施例1と異なる。
本実施例では、クラウド200のオブジェクトストレージ201が格納する複数の差分データは、リカバリーボリューム202上で統合され、その結果得られた差分マージデータがオンプレミスのストレージシステム103に送信される。
その他の構成及び動作については実施例1と同様であるので、同一の構成要素には同一の符号を付して説明を省略する。
図23は、実施例2に係るリストアの説明図である。時刻(t10)から時刻(t13)までの処理については、実施例1と同様であるので説明を省略する。
実施例2の時刻(t14)では、クラウドにおいて、オブジェクトを統合するマージ処理を行う。この結果、クラウドのリカバリーボリュームには、データA2とデータB1が含まれることになる。
時刻(t15)において、オンプレミスのストレージシステムは、統合により得られた差分マージデータの差分転送を受け、プロダクションボリュームに反映させる。この結果、プロダクションボリュームには、データA2とデータB1が含まれることになる。
このように、オンプレミスで保持していた基底スナップショットを書き戻した後、クラウドで統合された差分マージデータを適用することで、プロダクションボリュームのリストアを行うことができる。
実施例1の図2と比較すると、データA1からデータA2への変更がクラウドで反映されてからオンプレミスに送られているため、クラウドからオンプレミスにデータA1を送らない分転送量が抑えられることになる。
図24は、実施例2の差分データアップロード処理の詳細を示すフローチャートである。差分データアップロードプログラム510は、差分データアップロード処理が開始されると、アップロード対象のスナップショットを特定する(ステップ2400)。なお、アップロード対象のスナップショットが複数存在するならば、古いものから特定する。
ステップ2400の後、差分データアップロードプログラム510は、差分ビットが「1」のアドレスの全データを転送バッファにリードする(ステップ2401)。そして、転送バッファのデータをクラウドにアップロードし(ステップ2402)、対象スナップショットの差分ビットマップ505をクラウドにアップロードする(ステップ2403)。クラウドで差分データのマージをする際に必要となるからである。その後、差分データアップロードプログラム510は、スナップショットマッピングテーブル503の参照先アドレスをアップロード先に更新し(ステップ2404)、処理を終了する。
図25は、実施例2に係るスナップショットリストア処理の処理手順を示すフローチャートである。図25は、図20に示したステップ2003~ステップ2005に代えて、ステップ2500の差分マージデータダウンロード処理を行う。その他の処理は、図20と同様である。
具体的には、ステップ2500~ステップ2501がステップ2000~ステップ2001に対応し、ステップ2505がステップ2007に対応し、ステップ2504がステップ2006に対応する。
図26は、差分マージデータダウンロード処理の詳細を示すフローチャートである。差分データダウンロードプログラム511は、差分マージデータダウンロード処理が開始されると、スナップショットマッピングテーブル503から対象のクラウド属性のスナップショットを特定し(ステップ2600)、クラウドへダウンロード要求する(ステップ2601)。クラウドでは、後述する差分データマージ処理を実行し、差分マージデータをオンプレミスに送信する。
差分データダウンロードプログラム511は、受信バッファに差分マージデータを受信し(ステップ2602)、差分ビットマップをマージする(ステップ2603)。差分ビットマップのマージでは、リストアに必要な差分ビットマップ群に対して、ビットの論理和を取る処理が行われる。
ステップ2603の後、差分データダウンロードプログラム511は、対象スナップショットの差分ビットマップを参照し、未処理でビットオン(差分ビット「1」)のアドレスがあるか否かを判定する(ステップ2604)。
未処理でビットオンのアドレスがあるならば(ステップ2604;Yes)、差分データダウンロードプログラム511は、受信バッファのデータをページ単位に分割し、デステージする(ステップ2605)。その後、差分データダウンロードプログラム511は、リストア用テンポラリマッピングテーブルを更新することで、差分ビットオンの論理アドレスをデステージ先アドレスに更新し(ステップ2606)、ステップ2604に戻る。
未処理でビットオンのアドレスが無ければ(ステップ2604;No)、処理を終了する。
図27は、クラウドにおける差分データマージ処理の詳細を示すフローチャートである。クラウドの仮想ストレージシステムは、オンプレミスからダウンロード要求を受信し(ステップ2700)、リカバリー用のボリュームを作成する(ステップ2701)。
ステップ2701の後、仮想ストレージシステムは、リストアに必要な差分データオブジェクト群を古い方から選択する(ステップ2702)。仮想ストレージシステムは、差分ビットマップを参照し、差分ビットオンのアドレスの差分データをリカバリーボリュームの同一アドレスに転送して(ステップ2703)、リカバリーボリュームのマッピングテーブルを更新する(ステップ2704)。
ステップ2704の後、仮想ストレージシステムは、リストア対象の差分データオブジェクトであるか否か、すなわち、今回リストアすべきスナップショットまで到達しているか否かを判定する(ステップ2705)。
リストア対象の差分データオブジェクトでない場合(ステップ2705;No)、ステップ2702に戻る。
リストア対象の差分データオブジェクトである場合(ステップ2705;Yes)、仮想ストレージシステムは、リカバリーボリュームのマッピングテーブルを参照し、参照先アドレスが有効なデータを転送用バッファにリードする(ステップ2706)。そして、転送用バッファにリードしたデータを差分マージデータとして転送し(ステップ2707)、処理を終了する。
次に、システム構成の変形例について説明する。
図28は、変形例に係るストレージシステム103の構成図である。図28に示した構成では、外部転送用IF403に代えて、スマートNIC(Network Interface Controller )411を設けている点が図4と異なる。
スマートNIC411は、その内部にポート412、プロセッサ413及びメモリ414を有している。
メモリ414は、図29に示すように、差分取得プログラム2900、差分データアップロードプログラム2901及び差分データダウンロードプログラム2902を記憶する。
プロセッサ413はこれらのプログラムを実行することで、差分データの通信に係る処理を行う。このため、プロセッサ405は、差分データの通信に係る処理を行う必要がなく、仮想ボリュームに対する読み書きを処理すればよい。
その他の構成及び動作については図4と同様であるので、同一の構成要素に同一の符号を付して説明を省略する。
上述してきたように、開示のストレージシステム103は、ネットワークを介して他のストレージシステムであるクラウド200に接続されるストレージシステムであって、メモリ406(又は414)と、前記メモリに記憶されるプログラムを実行するプロセッサ405(又は413)と、記憶デバイスとしての物理記憶デバイス408と、を備え、前記プログラムの実行により前記プロセッサは、仮想ボリューム104を提供し、前記仮想ボリューム104について異なるタイミングで複数のスナップショットを生成し、前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを前記記憶デバイスに保持させ、前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記他のストレージシステムに送信して保持させる。
かかる構成及び動作により、ストレージシステム103は、ストレージシステム間のデータ転送量を削減することができる。
また、前記プロセッサは、前記仮想ボリュームのリストアを行う場合に、前記基底スナップショットを前記仮想ボリュームに書き戻した後、前記他のストレージシステムから取得した前記差分データを前記仮想ボリュームに反映する処理を行う。
このため、リストア時にも差分データのみを転送すればよく、転送量を削減できる。
また、前記プロセッサは、前記他のストレージシステムに転送した最新のスナップショットを前記記憶デバイスに保持させ、前記基底スナップショットと前記最新のスナップショットとの間に生成した他のスナップショットのデータを無効化する。
このため、オンプレミスの容量を抑えることができる。
また、前記プロセッサは、所定の条件が満たされた場合に、前記基底スナップショットを更新する。
このため、差分データの蓄積によるオンプレミスのデータ量増大を抑えることができる。
また、実施例1に開示したように、前記プロセッサは、前記異なるタイミングで生成された複数のスナップショットに対応する複数の差分データを、時系列に沿って適用することで前記リストアを行うことができる。
また、実施例2に開示したように、前記プロセッサは、前記異なるタイミングで生成された複数のスナップショットに対応する複数の差分データを統合した差分マージデータを前記他のストレージシステムから受信し、前記基底スナップショットを書き戻した前記仮想ボリュームに前記差分マージデータを反映させて前記リストアを行うことができる。
また、変形例に開示したように、前記プロセッサとして、前記仮想ボリュームに対する読み書きを処理する第1のプロセッサと、前記差分データの通信に係る処理を行う第2のプロセッサとを備えることで、プロセッサの負荷を分散してもよい。
なお、本発明は上記の実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、かかる構成の削除に限らず、構成の置き換えや追加も可能である。
100:オンプレミス、101:ホストコンピュータ、102:アプリケーション、103:ストレージシステム、104:仮想ボリューム、107:容量プール、108:プールボリューム、109:ページ、111:ネットワーク、120:取得周期、200:クラウド、201:オブジェクトストレージ、202:リカバリーボリューム、300:ネットワーク、400:管理用コンピュータ、401:ネットワーク、405:プロセッサ、406:メモリ、408:物理記憶デバイス、409:コントローラ、410:バス、412:ポート、413:プロセッサ、414:メモリ、500:スケジュール情報テーブル、501:プールテーブル、502:仮想ボリュームマッピングテーブル、503:スナップショットマッピングテーブル、504:スナップショットペア管理テーブル、505:差分ビットマップ、506:バックアップスケジュールプログラム、507:スナップショット取得プログラム、508:スナップショットリストアプログラム、509:差分取得プログラム、510:差分データアップロードプログラム、511:差分データダウンロードプログラム、520:制御情報部、530:プログラム部、540:キャッシュ部、602:初回スナップショット取得時刻、603:取得周期、604:保護期間、2900:差分取得プログラム、2901:差分データアップロードプログラム、2902:差分データダウンロードプログラム

Claims (11)

  1. ネットワークを介して他のストレージシステムに接続されるストレージシステムであって、
    メモリと、前記メモリに記憶されるプログラムを実行するプロセッサと、記憶デバイスと、を備え、
    前記プログラムの実行により前記プロセッサは、
    仮想ボリュームを提供し、
    前記仮想ボリュームについて異なるタイミングで複数のスナップショットを生成し、
    前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを前記記憶デバイスに保持させ、
    前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記他のストレージシステムに送信して保持させる
    ことを特徴とするストレージシステム。
  2. 前記プロセッサは、前記仮想ボリュームのリストアを行う場合に、前記基底スナップショットを前記仮想ボリュームに書き戻した後、前記他のストレージシステムから取得した前記差分データを前記仮想ボリュームに反映する処理を行うことを特徴とする請求項1に記載のストレージシステム。
  3. 前記プロセッサは、前記他のストレージシステムに転送した最新のスナップショットを前記記憶デバイスに保持させ、前記基底スナップショットと前記最新のスナップショットとの間に生成した他のスナップショットのデータを無効化することを特徴とする請求項1に記載のストレージシステム。
  4. 前記プロセッサは、所定の条件が満たされた場合に、前記基底スナップショットを更新することを特徴とする請求項1に記載のストレージシステム。
  5. 前記プロセッサは、前記異なるタイミングで生成された複数のスナップショットに対応する複数の差分データを、時系列に沿って適用することで前記リストアを行うことを特徴とする請求項2に記載のストレージシステム。
  6. 前記プロセッサは、前記異なるタイミングで生成された複数のスナップショットに対応する複数の差分データを統合した差分マージデータを前記他のストレージシステムから受信し、前記基底スナップショットを書き戻した前記仮想ボリュームに前記差分マージデータを反映させて前記リストアを行うことを特徴とする請求項2に記載のストレージシステム。
  7. 前記プロセッサとして、前記仮想ボリュームに対する読み書きを処理する第1のプロセッサと、前記差分データの通信に係る処理を行う第2のプロセッサとを備えることを特徴とする請求項1に記載のストレージシステム。
  8. 第一ストレージシステムと、
    ネットワークを介して前記第一ストレージシステムに接続される第二ストレージシステムと、
    を備え、
    前記第一ストレージシステムは、
    仮想ボリュームを提供し、
    前記仮想ボリュームについて異なるタイミングで複数のスナップショットを生成し、
    前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを保持し、
    前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記第二ストレージシステムに送信して保持させる
    ことを特徴とする計算機システム。
  9. 前記第二ストレージシステムは、複数のスナップショットに対応する複数の差分データを保持し、前記仮想ボリュームのリストアを行う場合に、前記複数の差分データを前記第一ストレージシステムに送信し、
    前記第一ストレージシステムは、前記基底スナップショットを前記仮想ボリュームに書き戻した後、前記第二ストレージシステムから受信した複数の差分データを時系列に沿って適用することで前記リストアを行うことを特徴とする請求項8に記載の計算機システム。
  10. 前記第二ストレージシステムは、複数のスナップショットに対応する複数の差分データを保持し、前記仮想ボリュームのリストアを行う場合に、前記複数の差分データを統合した差分マージデータを前記第一ストレージシステムに送信し、
    前記第一ストレージシステムは、前記基底スナップショットを前記仮想ボリュームに書き戻した後、前記差分マージデータを反映させて前記リストアを行うことを特徴とする請求項8に記載の計算機システム。
  11. ネットワークを介して第二ストレージシステムに接続される第一ストレージシステムの制御方法であって、
    仮想ボリュームを提供するステップと、
    前記仮想ボリュームについて異なるタイミングで複数のスナップショットを生成するステップと、
    前記複数のスナップショットのうち基準となるスナップショットである基底スナップショットを第一ストレージシステムに保持させるステップと、
    前記基底スナップショットより後に生成されたスナップショットと当該スナップショットの直前に生成されたスナップショットとの差分を示す差分データを前記第二ストレージシステムに送信して保持させるステップと
    を含むことを特徴とする制御方法。
JP2021102223A 2021-06-21 2021-06-21 ストレージシステム、計算機システム及び制御方法 Pending JP2023001471A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021102223A JP2023001471A (ja) 2021-06-21 2021-06-21 ストレージシステム、計算機システム及び制御方法
CN202210121047.8A CN115576481A (zh) 2021-06-21 2022-02-09 存储系统、计算机系统和控制方法
US17/692,964 US11836110B2 (en) 2021-06-21 2022-03-11 Storage system, computer system, and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021102223A JP2023001471A (ja) 2021-06-21 2021-06-21 ストレージシステム、計算機システム及び制御方法

Publications (1)

Publication Number Publication Date
JP2023001471A true JP2023001471A (ja) 2023-01-06

Family

ID=84489138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021102223A Pending JP2023001471A (ja) 2021-06-21 2021-06-21 ストレージシステム、計算機システム及び制御方法

Country Status (3)

Country Link
US (1) US11836110B2 (ja)
JP (1) JP2023001471A (ja)
CN (1) CN115576481A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009146389A (ja) * 2007-11-22 2009-07-02 Hitachi Ltd バックアップシステム及び方法
JP2013011919A (ja) * 2009-09-17 2013-01-17 Hitachi Ltd ストレージ装置及びそのスナップショット制御方法
JP2014006845A (ja) * 2012-06-27 2014-01-16 Fujitsu Ltd 管理方法,管理装置および管理プログラム
WO2017081747A1 (ja) * 2015-11-10 2017-05-18 株式会社日立製作所 分散ストレージシステム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6651075B1 (en) * 2000-02-16 2003-11-18 Microsoft Corporation Support for multiple temporal snapshots of same volume
US6665815B1 (en) * 2000-06-22 2003-12-16 Hewlett-Packard Development Company, L.P. Physical incremental backup using snapshots
US6993539B2 (en) * 2002-03-19 2006-01-31 Network Appliance, Inc. System and method for determining changes in two snapshots and for transmitting changes to destination snapshot
JP2006209636A (ja) * 2005-01-31 2006-08-10 Hitachi Ltd スナップショット維持方法
US8285953B2 (en) 2007-10-24 2012-10-09 Hitachi, Ltd. Storage system group
JP6811739B2 (ja) 2018-03-29 2021-01-13 株式会社日立製作所 ストレージシステム、およびストレージシステムの制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009146389A (ja) * 2007-11-22 2009-07-02 Hitachi Ltd バックアップシステム及び方法
JP2013011919A (ja) * 2009-09-17 2013-01-17 Hitachi Ltd ストレージ装置及びそのスナップショット制御方法
JP2014006845A (ja) * 2012-06-27 2014-01-16 Fujitsu Ltd 管理方法,管理装置および管理プログラム
WO2017081747A1 (ja) * 2015-11-10 2017-05-18 株式会社日立製作所 分散ストレージシステム

Also Published As

Publication number Publication date
CN115576481A (zh) 2023-01-06
US11836110B2 (en) 2023-12-05
US20220405237A1 (en) 2022-12-22

Similar Documents

Publication Publication Date Title
US20210303407A1 (en) Management of volume snapshots in a data storage system
US20210157523A1 (en) Storage system
US8805902B2 (en) Managing snapshot storage pools
US10346075B2 (en) Distributed storage system and control method for distributed storage system
JPWO2018029820A1 (ja) 計算機システム
US20230127166A1 (en) Methods and systems for power failure resistance for a distributed storage system
US20230273899A1 (en) Data migration in a distributive file system
WO2020016650A2 (en) Storing a point in time coherently for a distributed storage system
WO2020002986A2 (en) Implementing coherency and page cache support in a distributed way for files
JP2023001471A (ja) ストレージシステム、計算機システム及び制御方法
US11074003B2 (en) Storage system and restoration method
US11269550B2 (en) Storage system and history information management method
US20210232466A1 (en) Storage system and restore control method
WO2018055686A1 (ja) 情報処理システム
US8935488B2 (en) Storage system and storage control method
US11966590B2 (en) Persistent memory with cache coherent interconnect interface
US11748259B2 (en) System and method to conserve device lifetime for snapshot generation
US20240176520A1 (en) Storage system and storage control method
US11531474B1 (en) Storage system and data replication method in storage system
US11755249B2 (en) Storage system including storage nodes to determine cache allocations to implement cache control
CN116662217A (zh) 持久性存储器装置及应用持久性存储器装置的方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230921

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240313

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240325