JP2015079409A - 階層管理下の論理ボリュームのスナップショットの作成及び管理 - Google Patents

階層管理下の論理ボリュームのスナップショットの作成及び管理 Download PDF

Info

Publication number
JP2015079409A
JP2015079409A JP2013216977A JP2013216977A JP2015079409A JP 2015079409 A JP2015079409 A JP 2015079409A JP 2013216977 A JP2013216977 A JP 2013216977A JP 2013216977 A JP2013216977 A JP 2013216977A JP 2015079409 A JP2015079409 A JP 2015079409A
Authority
JP
Japan
Prior art keywords
logical volume
storage
snapshot
metadata
level storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013216977A
Other languages
English (en)
Inventor
毅 能田
Takeshi Noda
毅 能田
勝喜 香取
Katsuki Katori
勝喜 香取
耕一 増田
Koichi Masuda
耕一 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2013216977A priority Critical patent/JP2015079409A/ja
Priority to US14/488,548 priority patent/US9665436B2/en
Priority to US14/516,815 priority patent/US20150113239A1/en
Publication of JP2015079409A publication Critical patent/JP2015079409A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/068Hybrid storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0685Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ストレージ・システムにおいて、階層管理されている論理ボリュームのスナップショットの作成及び管理をおこなう。【解決手段】本発明の方法は、論理ボリュームのスナップショットの作成指示を受けて、スナップショットを管理するための管理テーブルを準備し、論理ボリュームの保管状態を検出し、論理ボリュームが、第1レベルのストレージからより下位層の2レベルのストレージへマイグレーションされている場合、論理ボリュームを第2レベルのストレージから第1レベルのストレージへリコールすることなく、管理テーブルを更新することを含み、その更新後の管理テーブルは、スナップショットの作成が必要であること、論理ボリュームはマイグレーションされていること、および第2レベルのストレージにおける論理ボリュームの保管先を示すメタデータを含む。【選択図】図4

Description

本発明は、ストレージ・システムに関し、より具体的には、ストレージ・システムにおいて階層管理されている論理ボリュームのスナップショットの作成及び管理をおこなうための方法に関する。
ストレージ・システムにおいて、上位層となる比較的高速なHDD等のストレージと、下位層となる比較的低速なテープドライブ等のストレージとを用いてデータ(ファイル)を階層管理することが行われている。また、ストレージ・システムにおいて、複数の物理ボリュームからなるボリューム・グループを論理的に区分化した論理ボリュームを用いた論理ボリューム管理(LVM)も行われている。
こうしたストレージ管理が存在する場合も含めて、各種ストレージサブシステム、ファイルシステム、アプリケーション等が提供するコピーサービスの中で、ある瞬間(以降、その瞬間をTime 0と呼ぶ)におけるデータのイメージを保存する手法として、スナップショット(Snapshot)やフラッシュコピー(Flash Copy)と呼ばれる技術がある。この技術の詳細な仕組みは、各ハードウェアあるいはソフトウェアによって異なるものの、その原理は文字通りTime 0におけるファイル(データ)が保存されている場所のポインタ情報を保存し、そのポインタ情報を使用して、元のファイルとTime 0に作成したイメージの管理を行うものである。なお、本明細書中では、以降フラッシュコピーの機能を含めて(同義として)、スナップショットという名前を用いて説明する。
既存のスナップショットは単純にTime 0において、ディスク上に存在するファイルにおいてのみ有効であり、対象となるファイルがディスク上に存在しない場合にはスナップショットが作成できない。すなわち、単一階層であるディスク上のみでのスナップショットでは、ディスク上に有効なデータが存在する場合にはポインタ情報を作成し、そのポインタ情報を用いてスナップショットの作成および管理が可能であるが、ディスク上にデータがない場合には、そもそもスナップショットの作成はできない。
しかし、上述したファイルがディスクと物理テープ等を用いて階層管理されている場合、ディスク上に有効なデータが存在しない場合でも物理テープ上には有効なデータが存在する場合がある。また、データを階層移動してディスク上から削除される場合もある。こうした場合を含めて、ファイルが階層管理されている場合に、従来のスナップショット機能を実現するための単純なポインタ情報のみではスナップショットの作成及び管理を行うことは困難である。
特許文献1は、ファイルがディスクと物理テープ等を用いて階層管理されている場合において、各ソース・ファイル毎のiノードと、各ソース・ファイルのスナップショット・ファイル毎のiノードとを用いて、スナップショット・ファイルを含むファイル管理の方法を開示する。しかし、特許文献1に記載の方法は、ディスク上に有効なデータが存在しないが物理テープ上には有効なデータが存在するような場合におけるスナップショットの作成及び管理の方法を開示するものではない。
国際公開第2009/019128号(特表2010−536079号公報)
したがって、本発明の目的は、ディスク上に有効なデータが存在しないが物理テープ上には有効なデータが存在する場合を含めて、階層管理されている論理ボリュームのスナップショットの作成及び管理を行う方法を提供することである。
本発明は、ストレージ・システムにおいて、階層管理されている論理ボリュームのスナップショットの作成及び管理をおこなう方法を提供する。そのストレージ・システムは、第1レベルのストレージと、第1レベルよりも下位の第2レベルのストレージとを含む。その方法は、
(a)論理ボリュームのスナップショットの作成指示を受け取るステップと、
(b)スナップショットを管理するための管理テーブルを準備するステップであって、管理テーブルは、スナップショットの作成の状態を示す第1のメタデータと、論理ボリュームの保管状態を示す第2のメタデータと、論理ボリュームの保管先を示す第3のメタデータとを含む、ステップと、
(c)論理ボリュームの保管状態を検出するステップと、
(d)論理ボリュームが、第1レベルのストレージから第2レベルのストレージへマイグレーションされている場合、論理ボリュームを第2レベルのストレージから第1レベルのストレージへリコールすることなく、管理テーブルを更新するステップであって、第1のメタデータはスナップショットの作成が必要であることを示し、第2のメタデータはマイグレーションされていることを示し、第3のメタデータは第2レベルのストレージにおける論理ボリュームの保管先を示すステップと、を含む。
本発明によれば、スナップショットを管理するための管理テーブルを更新し利用することにより、論理ボリュームが第1レベルのストレージから第2レベルのストレージへマイグレーションされている場合に、その論理ボリュームを第2レベルのストレージから第1レベルのストレージへ直ちにリコールすることなく、階層管理されている論理ボリュームのスナップショットの作成及び管理を行うことができる。
本発明の一態様では、論理ボリュームまたはスナップショットへのアクセスが要求された場合に、
(e)論理ボリュームのリコールを実行するステップと、
(f)第1レベルのストレージにリコールされた論理ボリュームからスナップショットを作成するステップと、
(g)管理テーブルを更新するステップであって、第1のメタデータはスナップショットが作成済みであることを示し、第2のメタデータは論理ボリュームがプリマイグレーションされていることを示し、第3のメタデータは第2レベルのストレージにおける論理ボリュームの保管先を示す、ステップと、をさらに含む。
本発明の一態様によれば、論理ボリュームまたはスナップショットへのアクセスが要求された場合に、実際にそのスナップショットを作成し、管理テーブルを更新し利用することにより、そのアクセス要求に対応すると共にその後のスナップショットの管理を適切におこなうことができる。
本発明の一態様では、論理ボリュームの上書きまたは論理ボリュームの削除が要求された場合、
(h)管理テーブルを更新するステップであって、第1のメタデータはスナップショットの作成が不要であることを示し、第2のメタデータは論理ボリュームがマイグレーションされていることを示し、第3のメタデータは第2レベルのストレージにおける論理ボリュームの保管先を示す、ステップをさらに含む。
本発明の一態様によれば、先にスナップショットの作成の指示があった論理ボリュームの上書きまたはその論理ボリュームの削除が要求された場合に、そのスナップショットの作成を不要にすると共に、第2レベルのストレージにおける論理ボリュームの保管先を維持することにより、その保管先の論理ボリューム及びそのスナップショットの作成/管理をおこなうことができる。
本発明の一態様では、スナップショットの上書きが要求された場合、
(i)管理テーブルを更新するステップであって、第1のメタデータはスナップショットの作成が不要であることを示し、第2のメタデータは論理ボリュームが第1レベルのストレージに存在することを示し、第3のメタデータは削除されたことを示す、ステップをさらに含む。
本発明の一態様では、スナップショットの削除が要求された場合、
(j)管理テーブルを更新するステップであって、第1のメタデータは削除されたことを示し、第2のメタデータは削除されたことを示し、第3のメタデータは削除されたことを示す、ステップをさらに含む。
本発明の方法が実行されるストレージ・システムの構成例を示す図である。 データの保管状態例を示す図である。 図2の状態においてスナップショットを作成したイメージ図である。 本発明の方法のフローを示す図である。 図4のステップS2において準備される管理テーブルの例を示す図である。 更新後の管理テーブルを示す図である。 更新後の管理テーブルを示す図である。 更新後の管理テーブルを示す図である。 更新後の管理テーブルを示す図である。 更新後の管理テーブルを示す図である。 更新後の管理テーブルを示す図である。 更新後の管理テーブルを示す図である。
図面を参照しながら本発明の実施の形態を説明する。図1は、本発明の方法が実行されるストレージ・システムの構成例を示す図である。ストレージ・システム10は、ホスト20に通信可能に接続する第1のストレージ101と第2のストレージ102を含む。図1の構成は、階層管理に必要となる最小の構成を示したものであって、ストレージ・システム10は、複数のホスト(サーバ)に接続可能であり、かつ複数の第1のストレージ101及び第2のストレージ102を含むことができる。なお、ストレージ・システム10とホスト20を含む構成を1つの全体的なシステム1(例えば、データシステム、データ管理システム等)として、あるいはその一部として捉えることができる。
一実施形態としては、ストレージ・システム10の第1のストレージ101が上位層となるディスク(以下、ディスクキャッシュ、あるいはHDDとも呼ぶ場合がある)含むストレージであり、第2のストレージ102が下位層となる物理テープ(テーブドライブ)を含むストレージである場合を例示することができる。なお、第1及び第2のストレージの構成(組み合わせ)としては、階層化ができるのであれば任意の組み合わせが可能であって、ディスクと物理テープの組み合わせに限定されるものではない。以下の説明では、出願人であるIBM(登録商標)社が提供するバーチャル・テープ・サーバーTS7700(以下、単にTS7700と呼ぶ)を例にとり説明をおこなう。TS7700では、図1のストレージ・システム10において例示されるディスクキャッシュと物理テープを含む形態を最小構成として含むことができる。
図2は、TS7700におけるデータの保管状態を示す。ホスト20から書き込まれたデータは、論理ボリューム30という単位でディスクキャッシュ101に書かれる。論理ボリューム30は、上述したように、複数の物理ボリュームからなるボリューム・グループを論理的に区分化したものである。ホスト20は、論理ボリューム30に対してマウントコマンドを発行し、論理ボリューム30の読み書きを行う。その後、ホスト20はリワインド・アンロードとデマウントを行ってアクセスを完了する。アクセス完了後、ユーザーが各論理ボリューム30ごとに設定したポリシーを元に、ディスクキャッシュ101から物理テープ102にデータが移行されて階層管理される。
図2に例示されるように、TS7700の内部に存在するデータ40は、以下の3つの保管状態を取り得る。
A:ディスクキャッシュ101にのみ存在
B:ディスクキャッシュ101と物理テープ102の両方に存在
C:物理テープ102にのみ存在
また、保管状態がAからBへ移行することを“プリマイグレーション”と呼び、BからCへ移行することを“マイグレーション”と呼び、CからBへ移行することを“リコール”と呼ぶ。
TS7700ではディスクキャッシュ上のデータはGPFS(General Parallel File System、登録商標)を介して読み書きしている。GPFSではファイルシステムレベル、ファイル単体レベルのスナップショット機能を提供している。以降、本明細書中ではスナップショットの元になる論理ボリュームを元データ、Time 0に作成された論理ボリュームのイメージをスナップショットと呼び説明を行う。
図3に、図2で示した保管状態A、B、Cのデータそれぞれに対して、GPFSが提供する機能を使用したTime 0のスナップショットを作成した場合のイメージを示す。図3において、破線のブロック50がデータ40に対するスナップショットを示している。A、Bの保管状態に関しては、ディスクキャッシュ101上にデータ40が存在するので、正しくTime 0のスナップショット50を作成することが可能である。
一方、Cの場合に関してはディスクキャッシュ101上にデータが存在しないために、たとえ物理テープ102上に正しい(最新の)データ40が存在していても、GPFSによるスナップショットは作成できない。そのため、保管状態Cのデータに対してTime 0のスナップショット50を作成するには、事前に物理テープ上にあるデータをリコールし、ディスクキャッシュ101上に書き出す作業を行わなければいけない。
しかし、TS7700では最大200万の論理ボリュームを定義することが可能であり、マイグレーションされている論理ボリュームが大量にある場合には、全てをリコールするのに長時間かかるため、Time 0自体を定義することが不可能である。また、限られたディスクキャッシュ容量においては、一度に全てのボリュームのリコールができない場合も起こり得る。したがって、事前に物理テープ上にあるデータをリコールする方法は、不適切であり現実的に不可能である。これが、本発明が以下に詳細に説明する方法によって解決する具体的な問題の所在である。
図4を参照しながら本発明の階層管理されている論理ボリュームのスナップショットの作成及び管理を行うための方法のフローについて説明する。図4のフローは、例えば図1の構成において、ストレージ・システム10内のコンピュータ(コントローラ)が実行するソフトウェアにより実施される。
ステップS1において、ホスト等から論理ボリュームのスナップショットの作成指示を受け取る。具体的には、例えば、ユーザーがホストを通して、もしくは管理インターフェースを通してストレージ・システムに指示を与えることができる。ステップS2において、スナップショットを管理するための管理テーブルを準備する。具体的には、例えば、スナップショット用のDB2(登録商標)テーブルを準備(複製)する。ここで、DB2テーブルとは、リレーショナルデータベースとして、TS7700において定義されるDB2用のテーブルを意味する。DB2テーブルは、以下に説明するスナップショットを管理するための各種メタデータを含む。
図5は、ステップS2において準備される管理テーブル(DB2テーブル)の一例である。管理テーブルにおいて、1行〜3行のLVOL_TOK、LVOL、LVOL_TO_PVOLは、それぞれ元データ(論理ボリューム)についての下記のメタデータ情報を含む。また、4行〜6行のLVOL_TOK_SNAP、LVOL_SNAP、LVOL_TO_PVOL_SNAPは、スナップショットについての下記のメタデータ情報を含む。
(a)LVOL_TOK:
各論理ボリュームの状態(最新のデータが存在するかどうか等)を保持する。ディスク、もしくは物理テープのどちらにデータが存在するかに関わらず、ユーザーが論理ボリュームを定義した時点でエントリーが作成される。
(b)LVOL:
各論理ボリュームのデータがディスク、もしくは物理テープ上にあるかどうか(マイグレーション/プリマイグレーションされているかどうか)等を保持する。LVOL_TOKと同様に、ディスク、もしくは物理テープのどちらにデータが存在するかに関わらず、ユーザーが論理ボリュームを定義した時点でエントリーが作成される。
(c)LVOL_TO_PVOL:
各論理ボリュームがプリマイグレーション、もしくはマイグレーションされている場合に、その論理ボリュームがどの物理テープ上にあるあるかどうか等を保持する。論理ボリュームが物理テープにプリマイグレーションされた時点でエントリーが作成される。
図5の例は、既にマイグレーションされた(migrated)状態にある、すなわち物理テープにのみ存在する論理ボリューム(元データ)についての管理テーブルを示している。そのため、2行目のLVOLが“migrated”を示し、3行目のLVOL_TO_PVOLがマイグレーションされた論理ボリューム(元データ)の保管先の物理ボリュームPVOLXを示している。1行目のLVOL_TOKは、初期状態として“スナップショット(Snap)が作成不要であることを示している。4行〜6行のLVOL_TOK_SNAP、LVOL_SNAP、LVOL_TO_PVOL_SNAPは、初期状態として“存在しない(NA)”を示している。
図4に戻って、ステップS3において、論理ボリューム(元データ)の保管状態を検出する。具体的には、図2で示したA、B、Cのいずれの状態にあるのかを検出する。ステップS4において、論理ボリューム(元データ)がマイグレーションされているか否かを判定する。この判定がYesの場合、ディスクキャッシュ上にデータが存在しないために、スナップショットの作成をGPFSに指示しても、実際のスナップショットは作成されずに、Time 0のイメージを作成できない。そのため、スナップショットを直ちに作成するための処理を行うことなく、ステップS5において、管理テーブルの更新を行う。
図6に更新後の管理テーブルを示す。LVOL_TOKと、LVOL_TOK_SNAPの現在のスナップショットの状態を示すフィールドに、元データがリコールされた段階で、各論理ボリューム単位で再度スナップショットの作成が必要なことを示す“Snap作成必要”を記録する。そして、LVOL_SNAPにもLVOLと同じようにマイグレーションされていることを示す“migrated”を記録し、さらに、LVOL_TO_PVOL_SNAPには、マイグレーションされている元データの物理ボリュームPVOLXが記録される。
ステップS4の判定がNoの場合、すなわちディスクキャッシュ上に元データが存在する場合、ステップS5において、図3のA、Bのケースで例示したように、その元データからTime 0でのスナップショットを作成する。そして、ステップS5に進み、管理テーブルの更新を行う。図7にスナップショット作成後に更新された管理テーブルを示す。図7の管理テーブルにおいて、“cached”はディスクキャッシュ101上に元データが存在する図2のAの保管状態を意味し、“pre-migrated”はディスクキャッシュ101と物理テープ102の両方に存在する図2のBの保管状態を意味する。
ここまでで、TS7700が管理している全ての論理ボリュームに対するTime 0のスナップショット作成作業は完了する。しかし、実際にはTime 0のスナップショットイメージは、上述したマイグレーションされている論理ボリュームに対しては作成されていない。そこで、本発明では、スナップショット作成作業完了後、以下のいずれかの事象が発生した場合に、マイグレーションされている論理ボリュームへのスナップショット作成及び管理を個別に行う。例えば、一実施形態として、GPFSでは“mmcrsnapshot”コマンドにより、管理しているファイルシステム下の全てのデータに対して一括してスナップショット作成を行うことができる。一方、個別のファイルに対するスナップショットは、“mmclone”コマンドにより作成が可能である。
(A)元データ、もしくはスナップショットに対してアクセス(論理ボリュームの読み出し、追記)が発生した場合
(A1)TS7700では、ホストはディスクキャッシュ上に存在するファイルに対してのみアクセスが可能なために、マイグレーションされている元データに対してアクセスが来た場合には、データのリコールが行われる。同様に、スナップショットに対してアクセスが来た場合においても、LVOL_TO_PVOL_SNAPに書かれている物理テープからリコールを行う
(A2)元データのリコールが完了した時点でホストからのアクセスが可能となるが、この時点で元データ毎にスナップショットを作成する。
(A3)その後、管理テーブルの更新を行う。図8に更新後の管理テーブルを示す。LVOL_TOKとLVOL_TOK_SNAPは、“Snap作成必要”から“Snap作成済み”に変更され、LVOLとLVOL_SNAPは、プリマイグレーション状態になったこと(“pre-migrated”)に変更される。
(B)元ファイルの上書き:Write From BOT(Beginning of Tape)が発生した場合
この場合、管理テーブルの以下の更新を行う。すなわち、LVOL_TOKは“Snap作成不要”と変更、LVOLはディスク上にデータが存在すること(“cached”)をアップデートし、さらにLVOL_TO_PVOLを削除(NA)にする必要がある。しかし、スナップショットのLVOL_TO_PVOL_SNAPにはまだエントリーが残っているために、物理テープ上に存在している元ファイルの論理ボリュームの無効化は行わない。この場合、スナップショットの作成を行う必要はなくなり、元ファイルとスナップショットは独立した二つのファイルとして、今後のアクセスを提供する。図9に更新後の管理テーブルを示す。
(C)元ファイルの削除が発生した場合
この場合、管理テーブルにおいて、LVOL_TOK、LVOL及びLVOL_TO_PVOLの削除を伴う更新をおこなう。LVOL_TOK_SNAP、LVOL_SNAP及びLVOL_TO_PVOL_SNAPの状態は、上記の(B)のケースと同様である。図10に更新後の管理テーブルを示す。
実際に例えばGPFS上等でのスナップショットの作成が行われる前に、以下のいずれかの事象が発生した場合には、スナップショットの作成は不要になる。
(D)スナップショットの上書き(Write
From BOT)が発生した場合
この場合、元ファイルからスナップショットを作成する必要はなくなるために、リコールなどは行わず、管理テーブルの以下の更新を行う。すなわち、LVOL_TOKとLVOL_TOK_SNAPは、“snap作成必要”から“snap作成不要”に変更し、LVOL_SNAPは、ディスク上にデータが存在すること(“cached”)をアップデートし、さらにLVOL_TO_PVOL_SNAPは削除(NA)にする。図11に更新後の管理テーブルを示す。
(E)スナップショットの削除が発生した場合
この場合、管理テーブルの以下の更新を行う。すなわち、LVOL_TOK_SNAP、 LVOL_SNAP及びLVOL_TO_PVOL_SNAPは削除(NA)にされ、LVOL_TOKは、Snap作成必要”から“Snap作成不要”に変更する。図12に更新後の管理テーブルを示す。
以上のように、LVOL_TOKとLVOL_TOK_SNAPに新たに追加される“現在のスナップショットの状態”を示すフィールドが取りうる値としては、“Snap作成不要”、“Snap作成必要”及び“Snap作成済み”の3つとなる。そして、“Snap作成不要”の論理ボリューム、スナップショットは、それぞれを独立の論理ボリュームとして扱われることになる。
本発明の実施形態について、図を参照しながら説明をした。しかし、本発明はこれらの実施形態に限られるものではない。上述した実施形態では、ディスクと物理テープの間で階層管理を実現している場合を例にとり説明したが、本発明はこれに限られず、一般的に異なる層での階層管理をしているシステム全般に適応可能である。上位のディスク装置上で既存のスナップショット機能を適用し、下位のディスク装置に移行されたデータの状態をメタデータとして記録しておくことで、同様の仕組みを利用することができる。また、3つ以上の階層を使用している場合でも同様の手法でスナップショットの管理が可能である。
1 全体的なシステム
10 ストレージ・システム
20 ホスト、複数のホスト(サーバー)
30 論理ボリューム
40 データ
50 スナップショット
101 第1のストレージ(HDD等)
102 第2のストレージ(テープドライブ等)

Claims (10)

  1. ストレージ・システムにおいて、階層管理されている論理ボリュームのスナップショットの作成及び管理をおこなう方法であって、前記ストレージ・システムは、第1レベルのストレージと、前記第1レベルよりも下位の第2レベルのストレージとを含み、
    論理ボリュームのスナップショットの作成指示を受け取るステップと、
    前記スナップショットを管理するための管理テーブルを準備するステップであって、前記管理テーブルは、前記スナップショットの作成の状態を示す第1のメタデータと、前記論理ボリュームの保管状態を示す第2のメタデータと、前記論理ボリュームの保管先を示す第3のメタデータとを含む、前記準備するステップと、
    前記論理ボリュームの保管状態を検出するステップと、
    前記論理ボリュームが、前記第1レベルのストレージから前記第2レベルのストレージへマイグレーションされている場合、前記論理ボリュームを前記第2レベルのストレージから前記第1レベルのストレージへリコールすることなく、前記管理テーブルを更新するステップであって、前記第1のメタデータは前記スナップショットの作成が必要であることを示し、前記第2のメタデータは前記マイグレーションされていることを示し、前記第3のメタデータは前記第2レベルのストレージにおける前記論理ボリュームの保管先を示す、前記更新するステップと、を含む方法。
  2. 前記論理ボリュームまたは前記スナップショットへのアクセスが要求された場合、
    前記論理ボリュームの前記リコールを実行するステップと、
    前記第1レベルのストレージにリコールされた前記論理ボリュームから前記スナップショットを作成するステップと、
    前記管理テーブルを更新するステップであって、前記第1のメタデータは前記スナップショットが作成済みであることを示し、前記第2のメタデータは前記論理ボリュームがプリマイグレーションされていることを示し、前記第3のメタデータは前記第2レベルのストレージにおける前記論理ボリュームの保管先を示す、前記更新するステップと、をさらに含む、請求項1に記載の方法。
  3. 前記論理ボリュームの上書きまたは前記論理ボリュームの削除が要求された場合、
    前記管理テーブルを更新するステップであって、前記第1のメタデータは前記スナップショットの作成が不要であることを示し、前記第2のメタデータは前記論理ボリュームがマイグレーションされていることを示し、前記第3のメタデータは前記第2レベルのストレージにおける前記論理ボリュームの保管先を示す、前記更新するステップをさらに含む、請求項1に記載の方法。
  4. 前記スナップショットの上書きが要求された場合、
    前記管理テーブルを更新するステップであって、前記第1のメタデータは前記スナップショットの作成が不要であることを示し、前記第2のメタデータは前記論理ボリュームが前記第1レベルのストレージに存在することを示し、前記第3のメタデータは削除されたことを示す、前記更新するステップをさらに含む、請求項1に記載の方法。
  5. 前記スナップショットの削除が要求された場合、
    前記管理テーブルを更新するステップであって、前記第1のメタデータは削除されたことを示し、前記第2のメタデータは削除されたことを示し、前記第3のメタデータは削除されたことを示す、前記更新するステップをさらに含む、請求項1に記載の方法。
  6. 前記論理ボリュームが、前記第1レベルのストレージに保管されている場合、または前記第1レベルのストレージと前記第2レベルのストレージの両方に保管されている場合、
    前記第1レベルのストレージの前記論理ボリュームから前記スナップショットを作成するステップと、
    前記管理テーブルを更新するステップであって、前記第1のメタデータは前記スナップショットの作成済みであることを示し、前記第2のメタデータは、前記論理ボリュームが、前記第1レベルのストレージに保管されていること、または前記第1レベルのストレージと前記第2レベルのストレージの両方に保管されていることを示し、前記第3のメタデータは、前記第2レベルのストレージに前記論理ボリュームの保管先が無いこと、または前記第2レベルのストレージにおける前記論理ボリュームの保管先を示す、前記更新するステップと、をさらに含む、請求項1〜5のいずれか一項に記載の方法。
  7. 前記第1レベルのストレージはHDDを含み、前記第2レベルのストレージはテープドライブを含む、請求項1〜6のいずれか一項に記載の方法。
  8. 請求項1〜6のいずれか一項の方法の各ステップをコンピュータに実行させるためのコンピュータ・プログラム。
  9. 請求項1〜6のいずれか一項の方法の各ステップをコンピュータに実行させる、ストレージ・システム。
  10. 請求項9に記載のストレージ・システムに通信可能に接続された、ホストまたは複数のホストをさらに含み、
    論理ボリュームのスナップショットの作成指示を与える、システム。
JP2013216977A 2013-10-18 2013-10-18 階層管理下の論理ボリュームのスナップショットの作成及び管理 Pending JP2015079409A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013216977A JP2015079409A (ja) 2013-10-18 2013-10-18 階層管理下の論理ボリュームのスナップショットの作成及び管理
US14/488,548 US9665436B2 (en) 2013-10-18 2014-09-17 Creation and management of logical volume snapshots under hierarchical storage system
US14/516,815 US20150113239A1 (en) 2013-10-18 2014-10-17 Creation and Management of Logical Volume Snapshots Under Hierarchical Storage System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013216977A JP2015079409A (ja) 2013-10-18 2013-10-18 階層管理下の論理ボリュームのスナップショットの作成及び管理

Publications (1)

Publication Number Publication Date
JP2015079409A true JP2015079409A (ja) 2015-04-23

Family

ID=52827235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013216977A Pending JP2015079409A (ja) 2013-10-18 2013-10-18 階層管理下の論理ボリュームのスナップショットの作成及び管理

Country Status (2)

Country Link
US (2) US9665436B2 (ja)
JP (1) JP2015079409A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9053216B1 (en) 2013-08-09 2015-06-09 Datto, Inc. CPU register assisted virtual machine screenshot capture timing apparatuses, methods and systems
US9594636B2 (en) 2014-05-30 2017-03-14 Datto, Inc. Management of data replication and storage apparatuses, methods and systems
US10235098B1 (en) * 2017-01-10 2019-03-19 Pavilion Data Systems, Inc. Writable clones with minimal overhead
US11531488B2 (en) * 2017-08-07 2022-12-20 Kaseya Limited Copy-on-write systems and methods
US11392543B2 (en) * 2019-10-24 2022-07-19 EMC IP Holding Company, LLC System and method for optimizing capacity and performance for sparse snapshots
US11687417B2 (en) * 2021-10-19 2023-06-27 Spectra Logic Corporation Secondary storage protection

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226711B1 (en) * 1998-06-09 2001-05-01 International Business Machines Corporation Method, apparatus and frame format to prevent data loss in a removable media library system due to incorrect configuration of devices
US6816941B1 (en) * 2000-10-23 2004-11-09 International Business Machines Corporation Method and system for efficiently importing/exporting removable storage volumes between virtual storage systems
US6978353B2 (en) * 2002-10-18 2005-12-20 Sun Microsystems, Inc. Low overhead snapshot in a storage array using a tree-of-slabs metadata
JP4987307B2 (ja) * 2005-03-25 2012-07-25 株式会社日立製作所 ストレージシステム
US8055864B2 (en) 2007-08-06 2011-11-08 International Business Machines Corporation Efficient hierarchical storage management of a file system with snapshots
JP5156518B2 (ja) * 2008-07-23 2013-03-06 株式会社日立製作所 記憶制御装置及び方法
WO2013005245A1 (en) * 2011-07-01 2013-01-10 Hitachi, Ltd. Storage system and controlling method of the same
US8527722B1 (en) * 2012-04-24 2013-09-03 Hitachi, Ltd. Selecting a snapshot method based on cache memory consumption

Also Published As

Publication number Publication date
US20150113238A1 (en) 2015-04-23
US9665436B2 (en) 2017-05-30
US20150113239A1 (en) 2015-04-23

Similar Documents

Publication Publication Date Title
US10698773B2 (en) Replicating a source data set to a target data store
US8615534B2 (en) Migration of metadata and storage management of data in a first storage environment to a second storage environment
US9165015B2 (en) Scalable and user friendly file virtualization for hierarchical storage
US11327924B2 (en) Archiving data sets in a volume in a primary storage in a volume image copy of the volume in a secondary storage
US10169165B2 (en) Restoring data
US9558079B2 (en) Flash copy for disaster recovery (DR) testing
US8555025B2 (en) Selective device access control
US11182373B2 (en) Updating change information for current copy relationships when establishing a new copy relationship having overlapping data with the current copy relationships
US9665436B2 (en) Creation and management of logical volume snapshots under hierarchical storage system
US9465543B2 (en) Fine-grained data reorganization in tiered storage architectures
US9898370B2 (en) Flash copy for disaster recovery (DR) testing
WO2012164627A1 (en) Information storage system, snapshot acquisition method, and data storage medium
US20220413973A1 (en) Data storage volume recovery management
US11662954B1 (en) Duplicating tape media within a tape storage system based on copy tape database
US11194760B1 (en) Fast object snapshot via background processing