JP4394467B2 - ストレージシステム、サーバ装置及び先行コピーデータ生成方法 - Google Patents

ストレージシステム、サーバ装置及び先行コピーデータ生成方法 Download PDF

Info

Publication number
JP4394467B2
JP4394467B2 JP2004021104A JP2004021104A JP4394467B2 JP 4394467 B2 JP4394467 B2 JP 4394467B2 JP 2004021104 A JP2004021104 A JP 2004021104A JP 2004021104 A JP2004021104 A JP 2004021104A JP 4394467 B2 JP4394467 B2 JP 4394467B2
Authority
JP
Japan
Prior art keywords
data
volume
snapshot
block
differential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004021104A
Other languages
English (en)
Other versions
JP2005215940A (ja
Inventor
隆裕 中野
純一 原
剛 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004021104A priority Critical patent/JP4394467B2/ja
Priority to US10/808,921 priority patent/US7266654B2/en
Publication of JP2005215940A publication Critical patent/JP2005215940A/ja
Application granted granted Critical
Publication of JP4394467B2 publication Critical patent/JP4394467B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

本発明は、ストレージを利用するコンピュータシステムにおけるボリュームイメージのスナップショット機能を有するストレージシステムに関し、特に、スナップショットを記憶する差分ボリュームを先行コピー領域として活用する技術に関する。
情報化社会において、情報を蓄積するストレージ・システムの重要な役割の一つに、データ保護がある。データ保護のもっとも一般的な方法は、テープをはじめとするバックアップ・メディアにストレージ上のデータを保存するバックアップである。バックアップは、故障や障害、或いは、操作ミスなどによって、万が一、運用中のストレージ上のデータを失なったとしても、バックアップを復元することで、保存した時点のデータに回復する事を可能にし、被害を最小限に抑えることができる。
しかし、ストレージの大容量化に伴い、バックアップに要する時間が問題となってきている。さらに、データの更新頻度が高い用途では、一度バックアップを作成しても、すぐにバックアップとの差が拡大し、万が一の際、被害が増大してしまうため、頻繁にバックアップを作成することが必要となってきている。また、操作ミスなどによるファイル紛失や、ファイルの内容を過去の状態と比較したい場合などに備えて、定期的なバックアップを容易に参照可能にしたいという要求がある。
このような用途に応える機能として、スナップショット機能が注目されている。スナップショット機能は、スナップショットを取得した瞬間の運用中のストレージ上のデータイメージを維持すると共に、運用中のストレージとは別の手段によってアクセス可能にする機能である。スナップショットは、取得時点で、ストレージ上のデータ全体のコピー完了を待つことなく利用可能にすることにより、テープバックアップで問題となっていたバックアップ時間を極小化する。
このスナップショットを維持するため、スナップショット時のデータを保存する保存記憶領域を利用する方法がある(例えば、特許文献1参照。)。
これによれば、運用ボリュームのスナップショットを取得すると、それ以降に発生する未更新ブロックの更新時に、当該ブロックの旧データを、保存記憶領域にコピーするとともに、スナップショットを提供する仮想ボリュームを生成する。仮想ボリュームからの読み出しは、読み出すアドレスのブロックが、保存記憶領域にコピー済であれば、そのブロックを返す。保存記憶領域にコピーがなければ、運用ボリュームに変更が生じていないため、運用ボリュームの同じアドレスのブロックを返す。
この技術によれば、スナップショット取得時点での運用ボリュームの全てのデータを別のボリュームに保存しておく場合と比較して、少ない記憶容量でスナップショット取得時点での運用ボリュームのイメージを維持することができる。
米国特許第5649152号明細書
スナップショットを用いたストレージの運用形態は、多様である。例えば、日々、スナップショットを生成し、1ヶ月維持する運用形態や、1時間に1回スナップショットを生成し、24時間以内は1時間毎のスナップショットを、1週間以内は1日毎のスナップショットをそれぞれ維持する運用形態がある。このように複数のスナップショットを維持すると、保存記憶領域の容量が増大する問題がある。
本発明は、元のボリュームやファイルシステムのブロック配置に影響を与えず、少ない記憶容量によって、複数の任意の時点のスナップショットを維持できるようにすることを目的とする。
本発明は、一つ以上のCPUと、メモリと、一つ以上のネットワークI/Fと、一つ以上のストレージI/Fとを有するサーバ装置と、前記サーバ装置がデータの読み書きを行う運用ボリュームと、差分データを記憶する差分ボリュームとが設けられ、前記ストレージI/Fに接続された一つ以上のディスク装置と、を備えるストレージシステムにおいて、前記サーバ装置は、前記サーバ装置に対して送られたファイルのアクセス要求に応じて前記ディスク装置にアクセスするファイルサーバ部と、前記運用ボリュームへデータが書き込まれる際に、当該データが書き込まれる領域に記憶されたデータを前記差分ボリュームに複製して前記差分データを生成し、当該データが書き込まれる前記運用ボリュームの領域の位置情報と前記差分データを記憶するための領域の位置情報とを対応付ける差分ブロック管理情報を前記メモリに記録することによって前記差分データの生成を制御するデータ保護部と、前記ファイルサーバ部及び前記データ保護部からの要求に応じてスナップショット管理部にアクセス処理を発行するファイルシステム処理部と、前記差分ボリュームを管理し、前記生成された差分データを維持するスナップショット管理部と、を有し、前記スナップショット管理部は、前記運用ボリュームから読み出された又は前記運用ボリュームへ書き込まれるデータを複製して、先行コピーデータを生成し、前記運用ボリュームからデータが読み出される際又は前記運用ボリュームへデータが書き込まれる際に、前記運用ボリュームから読み出された又は前記運用ボリュームへ書き込まれるデータが記憶されていた前記運用ボリュームの領域の位置情報と前記先行コピーデータを記憶するために使用される前記差分ボリュームの領域の位置情報とを対応付ける情報を前記差分ブロック管理情報として前記メモリに記録することによって、前記先行コピーデータを記憶するための先行コピー領域を前記差分ボリュームに設け、前記生成された先行コピーデータを前記先行コピー領域に格納し、前記運用ボリュームへデータが書き込まれる際に、前記差分ブロック管理情報を参照して、当該データが書き込まれる領域に記憶されているデータが既に前記差分ボリュームに記憶されているか否かを判定し、当該領域に記憶されているデータが前記差分ボリュームに記憶されていないと判定された場合、当該領域に記憶されているデータを前記差分ボリュームに複写することによって前記差分データを生成し、当該領域に記憶されているデータが前記差分ボリュームに前記先行コピーデータとして記憶されていると判定された場合、当該先行コピーデータが差分データであることを示す情報を前記差分ブロック管理情報に設定し、前記運用ボリュームへデータが書き込まれる際に、前記差分ブロック管理情報を参照して、前記差分ボリュームに空き領域がないと判定された場合、前記差分ボリューム内に設けられた前記先行コピー領域について、前記スナップショット管理情報に記録され、前記先行コピー領域に対応付けられた前記運用ボリュームの領域の位置情報を破棄することによって、前記先行コピー領域を空き領域に変更して、前記差分データを記憶するために利用する。
本発明によると、スナップショットの対象となる運用ボリュームに対して一つの差分ボリュームを用意することにより、少ない記憶容量によって、複数のスナップショットを維持、提供することができる。
以下、本発明の実施の形態を図面を参照して説明する。
図1は、本発明の第1の実施の形態のストレージシステムの構成を示すブロック図である。
サーバ装置101は、ネットワークインターフェース112を介して接続されたクライアント131、132に対してファイル共有サービスを提供する。
サーバ装置101は、一つ以上のCPU111、一つ以上のネットワークインターフェース112、一つ以上のストレージインターフェース113、及びメモリ114を備える。
ネットワークインターフェース112は、クライアント131、132との間でTCP/IPプロトコルによって信号(コマンド、データ)を送受信する。
ストレージインターフェース113は、ディスク装置115、116との間でSCSI(Small Computer System Interface)に基づく信号(コマンド、データ)を送受信する。このストレージインターフェース113にはディスク装置115、116及びバックアップ装置117が接続されている。
メモリ114には、ファイルサーバプログラム121、データ保護プログラム122、ファイルシステム処理プログラム123及びスナップショット管理プログラム124が記憶されており、CPU111がこれらのプログラムを呼び出して実行することによって、各種の処理が行われる。
ファイルサーバプログラム121は、クライアント131、132からのデータアクセス要求に応じて、ファイルシステム処理プログラム123に対してファイルやディレクトリの読み出し処理若しくは書き込み処理を実行するように要求し、その実行結果を要求元であるクライアント131、132に返送する。
データ保護プログラム122は、スナップショット管理プログラム124にスナップショットの生成や、削除を要求したり、指定したファイルに対してファイルシステム処理プログラム123にファイルの読み出し要求を発行して、読み出したデータをバックアップ装置117に書き込み、データの複製(バックアップ)を作成する。
ファイルシステム処理プログラム123は、ファイルサーバプログラム121や、データ保護プログラム122が発行するファイルやディレクトリの読み出し処理及び書き込み処理の要求に応じて、ファイルやディレクトリを格納しているボリューム(ディスク装置115、116上に特定の用途のために確保された領域)、並びに、アクセスするブロックの位置及びサイズを指定し、データの読み出し処理や、書き込み処理をスナップショット管理プログラム124に対して発行する。
スナップショット管理プログラム124は、データ保護プログラムからスナップショットの生成要求を受信すると、ディスク装置115の運用ボリュームに対するスナップショットを生成する。このスナップショットの生成処理は、スナップショット管理プログラム124が、後述するスナップショット管理テーブル211を用いて、運用ボリューム115及び差分ボリューム116に記憶されたデータを、スナップショットの生成要求の受信時に運用ボリューム115に格納されていたデータにアクセス可能となるように管理し、生成した運用ボリューム115のスナップショットを提供するための仮想ボリュームをアクセス可能にする。
ここで仮想ボリュームとは、一又は複数のディスク装置内の記憶領域からなる仮想的なボリュームであって、実際には運用ボリューム115内の一部ブロックと差分ボリューム内の一部ブロックから構成されている。
スナップショット管理プログラム124は、ファイルシステムなどが格納されるボリューム(運用ボリューム115)に加え、差分データ、すなわちスナップショットの維持に必要な差分データを格納するボリューム(差分ボリューム)を管理し、ファイルシステム123の要求に応じたデータ入出力処理、スナップショットを維持する処理、及び、スナップショットを利用可能にする処理を行う。
具体的には、スナップショット管理プログラム124は、スナップショットの生成要求を受信すると、まず後述するスナップショット管理テーブル211に新しい仮想ボリュームの識別情報を登録する。この仮想ボリュームのブロックは、最初はスナップショット管理テーブル211によって、運用ボリューム115のブロックと一対一で対応付けられている。しかし、その後運用ボリューム115内のデータが更新される際には、スナップショット管理プログラム124は、後述するように運用ボリューム115内の更新前のデータを差分ボリュームに複写し、この複写後に運用ボリューム115の記憶内容を更新する。そして、スナップショット管理プログラム124は、更に、データが更新された運用ボリューム115内のブロックに対応する仮想ボリューム内のブロックを、スナップショット生成要求を受信した時点で運用ボリューム115に格納されていたデータ(即ち更新前のデータ)が格納されている差分ボリューム上のブロックと対応付けるようスナップショット管理テーブル211を更新する。
ファイルシステム処理プログラム123が仮想ボリュームに対するアクセス要求をスナップショット管理プログラム124に発行すると、スナップショット管理プログラム124はスナップショット管理テーブル211を参照して、仮想ボリュームのブロックと対応付けられている運用ボリューム115のブロック又は差分ボリュームのブロックにアクセスする。従って、ファイルシステム処理プログラム123は、仮想ボリュームにアクセスすることによって、スナップショットが生成要求が発行された時点での運用ボリューム115内の情報が利用できるため、サーバ装置101はファイルシステムのスナップショットイメージを提供することが可能になる。
なお、これらの処理に関しては後に詳述する。
本実施例では、ディスク装置115にファイルシステムを格納している運用ボリュームを、ディスク装置116に差分データ(スナップショットの維持に必要な差分データ等)を格納する差分ボリュームを割り当てている。
ディスク装置115、116は、それぞれ独立した物理ディスクドライブを用いてもよいし、物理的に一つのディスクドライブを論理区画によって分割し、各論理区画をディスク装置115、116としてもよい。また、複数のディスク装置から構成され一つのディスクとして論理的に設定された論理ディスク装置をディスク装置115、116としてもよい。さらに、論理ディスクを構成する複数の物理ディスクドライブによってRAID装置を構成してもよい。
バックアップ装置117は、ディスク装置115、116に記憶されているデータの複製を記憶する装置である。本実施の形態では、バックアップ装置117はサーバ装置101のストレージインターフェース113に接続されているが、ネットワークインターフェース112を介してサーバ装置に接続されているクライアント131等に設けられたストレージインターフェースに接続してもよい。
図2は、第1の実施の形態のスナップショット管理プログラム124の構成を示すブロック図である。
スナップショット管理プログラム124には、ファイルシステム処理プログラム123が発行する処理要求に応じて呼び出される書き込み処理サブプログラム201及び読み出し処理サブプログラム202、並びに、データ保護プログラム122が発行する処理要求に応じて呼び出されるスナップショット生成サブプログラム203及びスナップショット削除サブプログラム204が含まれる。また、これらの各サブプログラムが実行される際に利用される情報として、スナップショット管理テーブル211と、差分ブロック管理テーブル212がメモリ114内に格納されている。
スナップショット管理テーブル211(詳細は図3参照)には、スナップショットを維持し、スナップショットを利用可能にするために保持されるデータが記憶される。差分ブロック管理テーブル212(詳細は図4参照)には、差分ボリューム116のブロック使用状況を管理するデータが記憶される。
図3は、第1の実施の形態のスナップショット管理テーブル211の詳細を示す説明図である。
スナップショット管理テーブル211の列311には、運用ボリューム115のブロックアドレスが登録されており、列311の最初の行(第1行)には運用ボリューム115の1番目のブロックアドレス0番が割り当てられ、第2行には運用ボリューム115のブロックアドレス1番が割り当てられ、以下順に運用ボリューム115のブロックアドレスが割り当てられ、最後の行である第m行には運用ボリューム115のブロックアドレス(m−1)番が割り当てられる。
列312は、Cowビットマップであり、これについては後述する。
列313以降の列には、仮想ボリュームの各ブロックアドレスに対応するデータの格納位置が登録される。例えば、列313にはスナップショット番号1のデータの格納位置が登録される(この場合、スナップショット番号と仮想ボリュームの番号は同一である。例えば、スナップショット番号1には仮想ボリューム1が対応している)。
列313の第1行には仮想ボリューム1のブロックアドレス0番に対応するデータが格納されている記憶領域を識別する情報が記録され、以降順番に、第2行目には仮想ボリューム1のブロックアドレス1番、第3行目にはブロックアドレス2番・・・に対応するデータの格納位置が記録される。
より具体的には、列313の第1行に仮想ボリューム1のブロックアドレス0番のデータの格納位置として記録されている0番は、差分ボリューム116のブロックアドレス0番に対応している。
スナップショット管理プログラム124がスナップショット生成要求を受信した後に、運用ボリューム115のブロックアドレス0番のデータが更新されるとき、スナップショット管理プログラム124は、運用ボリューム115のブロックアドレス0番に格納されている更新前のデータを、差分ボリューム116のブロックアドレス0番に書き込み、その後に運用ボリューム115のブロックアドレス0番のデータを更新する。スナップショットへのアクセスを提供するためには、スナップショット生成要求を受信した際に運用ボリューム115に格納されていたデータをディスク装置内のいずれかの記憶領域に保存しておくことが必要だからである。
このように、スナップショット管理テーブル211において仮想ボリューム1のブロックアドレス0番と差分ボリューム116のブロックアドレス0番を対応づけておく。スナップショット管理プログラム124は、仮想ボリューム1の第1行のブロックアドレス0番(すなわち、差分ボリューム116のブロックアドレス0番に)アクセスすることによって、運用ボリューム115のブロックアドレス0番の更新前のデータが得られる。
このように、スナップショット管理プログラム124は、仮想ボリューム1のブロックアドレス0番に対するアクセス要求があった場合には、スナップショット管理テーブル211を参照することによって、差分ボリューム116のブロックアドレス0番をアクセスすることができる。この結果、スナップショット管理プログラム124は、ファイルシステム処理プログラム123に対して、運用ボリューム115のブロックアドレス0番の更新前のデータ(即ちスナップショット生成要求を受信した時点で運用ボリューム115のブロックアドレス0番に格納されていたデータ)が仮想ボリューム1のブロックアドレス0番に書き込まれているのと同様の状態で、仮想ボリューム1に対するアクセス環境を提供することができる。
同様に、列313の第2行に、仮想ボリューム1のブロックアドレスのデータの格納位置として記録されている1番は、差分ボリューム116のブロックアドレス1番に対応している。スナップショット生成要求受信後に運用ボリューム115のブロックアドレス1番のデータが更新されるとき、スナップショット管理プログラム124は、運用ボリューム115のブロックアドレス1番に格納されている更新前のデータを、差分ボリューム116のブロックアドレス1番に書き込み、その後に運用ボリューム115のブロックアドレス1番のデータを更新する。このように、スナップショット管理テーブル211において仮想ボリューム1のブロックアドレス1番と差分ボリューム116のブロックアドレス1番を対応づけておく。スナップショット管理プログラム124は、ファイルシステム処理プログラム123に対して、運用ボリューム115のブロックアドレス1番の更新前のデータが仮想ボリューム1のブロックアドレス1番に仮想的に書き込まれているのと同様の状態で、仮想ボリューム1に対するアクセスを提供することができる。
列313の第3行〜第m行には、仮想ボリューム1のブロックアドレス2番から(m−1)番のデータに対応する格納位置情報として「なし」が記録されている。この「なし」とは運用ボリューム115の対応するブロックアドレスを示している。従って、仮想ボリューム1のブロックアドレス2番〜(m−1)番については、それぞれ運用ボリューム115のブロックアドレス2番〜(m−1)番が対応する。すなわち、「なし」は、最後にスナップショット生成要求を受信した後、運用ボリューム115の当該ブロックは更新(書き替え)がされていないことを示す。
従って、スナップショット管理プログラム124は、仮想ボリューム1のブロックアドレス0番のデータと、仮想ボリューム1のブロックアドレス1番のデータと、運用ボリューム115のブロックアドレス2〜(m−1)番のデータとによって、運用ボリューム115のブロックアドレス0番及び1番のデータが更新される前の時点における運用ボリューム115のスナップショットイメージ(仮想ボリューム1)を提供することが可能になる。
列314には仮想ボリューム2のデータの格納位置が登録される。
スナップショット管理プログラム124は、スナップショット生成要求を受信する毎に、生成要求受信時におけるスナップショットを取得すべく新たな仮想ボリュームをスナップショット管理テーブルに登録する。仮想ボリューム2はスナップショット番号1のスナップショット(仮想ボリューム1に対応)が生成された後に再びスナップショット生成要求を受信した際、スナップショット管理プログラム124によって作成されるスナップショット番号2のスナップショットに対応する仮想ボリュームである。
列314の第1行に仮想ボリューム2のブロックアドレス0番のデータ格納位置として記録されている0番は、差分ボリューム116のブロックアドレス0番に対応している。
2番目のスナップショット生成要求の受信後に運用ボリューム115のブロックアドレス0番のデータが更新されるとき、スナップショット管理プログラム124は、前述したように運用ボリューム115のブロックアドレス0番に格納されている更新前のデータを、差分ボリューム116のブロックアドレス0番に複写し、その後に運用ボリューム115のブロックアドレス0番のデータを更新する。すると、仮想ボリューム1及び仮想ボリューム2のブロックアドレス0番に対応するデータは、差分ボリューム116のブロックアドレス0番に格納されたこととなるから、仮想ボリューム1及び仮想ボリューム2のブロックアドレス0番は共に、差分ボリューム116のブロックアドレス0番と対応付けられるよう、スナップショット管理プログラム124がスナップショット管理テーブルを書き換える。
列314の第2行に仮想ボリューム2のブロックアドレス1番のデータの格納位置として記録されている2番は、差分ボリューム116のブロックアドレス2番に対応している。これは、2番目のスナップショット生成要求受信後、運用ボリューム115のブロックアドレス1番のデータが更新されたことを示している。すなわち、2番目のスナップショット生成要求を受信した後に生じた運用ボリューム115のブロックアドレス1番のデータ更新に際しては、更新前のデータは差分ボリューム116のブロックアドレス2番に複写されている。これは、差分ボリューム116の1番に複写すると、仮想ボリューム1のブロックアドレス1番と対応付けられているデータが変更され、1番目のスナップショットデータが壊れてしまうからである。
列314の第3行から第m行に、仮想ボリューム2のブロックアドレス2番から第(m−1)番のデータの格納位置として「なし」が記録されている。この「なし」は、前述したように、仮想ボリュームの当該ブロックアドレスが、運用ボリューム115の対応するブロックアドレスに対応付けられていることを示す。
仮想ボリュームnについての説明は、上記仮想ボリューム1、2についての説明と同様なので、省略する。
列312は、Cowビットマップであり、そのビット数は仮想ボリュームの数と同じである。図3に示す場合では、仮想ボリュームの数はnであるので、Cowビットマップはnビットを有する。Cowビットマップの第1ビットは仮想ボリューム1に対応し、第2ビットは仮想ボリューム2に対応し、以後同様にして、第nビットは仮想ボリュームnに対応する。仮想ボリュームの第k行のブロックアドレスに更新の登録がある場合(すなわち、差分ボリューム116のブロックアドレスが記録されている場合)には、第k行のCowビットマップ中の、この仮想ボリュームに対応するビットを「0」とする。また、この仮想ボリュームの第k行のブロックアドレスに更新の登録がない場合(すなわち、「なし」が記録されている場合)には、第k行のCowビットマップ中の、この仮想ボリュームに対応するビットを「1」とする。
図3に示すスナップショット管理テーブル211では、各仮想ボリュームの第1行のブロックアドレス0番には「0」が割り当てられているので、第1行のCowビットマップの各ビットは全て「0」になる。また、各仮想ボリュームの第m行のブロックアドレス(m−1)番には「なし」が割り当てられているので、第m行のCowビットマップの各ビットは全て1になる。
なお、図3に示すスナップショット管理テーブル211では、運用ボリューム115のサイズをmブロック、スナップショットの最大数をnとしている。例えば、ブロックサイズを512バイト、運用ボリューム115のサイズを128ギガバイト、スナップショットの最大数を64とすると、m=250000000、n=64となる。なお、ブロックサイズや運用ボリューム115のサイズ、スナップショットの最大数は、本発明の効果に影響しないため、任意に設定してよい。
図3に示すスナップショット管理テーブル211では、第1行(301)は、311列が運用ボリューム115のブロックアドレス0番を示す。312列がCoWビットマップが00…0であることを示す。313列、314列、・・・315列の「0」が、スナップショット1、2、・・・n番に対応する仮想ボリューム1、2、・・・nのブロックアドレス0番の内容(すなわち、各仮想ボリュームに対応するスナップショットの生成要求発行時に、運用ボリューム115のブロックアドレス0番に格納されていたデータ)が、差分ボリューム116のブロックアドレス0番に格納されていることを示す。
第2行(302)は、311列が運用ボリューム115のブロックアドレス1番を示す。312列がCoWビットマップが00…1であることを示す。313列の「1」が、スナップショット1番に対応する仮想ボリューム1のブロックアドレス1番の内容が差分ボリューム116のブロックアドレス1番に格納されていることを示す。314列の「2」が、スナップショット2番に対応する仮想ボリューム2のブロックアドレス1番の内容が差分ボリューム116のブロックアドレス2番に格納されていることを示す。315列の「なし」が、スナップショットn番に対応する仮想ボリュームnのブロックアドレス1番の内容が運用ボリューム115のブロックアドレス1番に格納されていることを示す。
仮想ボリュームnのブロックアドレス1番に「なし」が割り当てられていることは、仮想ボリュームnのブロックアドレス1番の内容が、運用ボリューム115のブロックアドレス1番に格納されいること、及び、仮想ボリュームnに対応するn番目のスナップショットの生成要求を受信した後、運用ボリューム115のブロックアドレス1番のデータが更新されていないことを示している。
第3行(303)は、311列が運用ボリューム115のブロックアドレス2番を示す。312列がCoWビットマップが11…1であることを示す。313列、314列、・・・315列が、スナップショット1、2、・・・n番に対応する仮想ボリューム1、2、・・・nのブロックアドレス2番の内容が、運用ボリューム115のブロックアドレス2番に格納されていること(すなわち、運用ボリューム115の更新されていないこと)を示す。
第m行(304)は、311列が運用ボリューム115のブロックアドレス(m−1)番を示す。312列がCoWビットマップが11…1であることを示す。313列、314列、・・・315列が、スナップショット1、2、・・・n番に対応する仮想ボリューム1、2、nのブロックアドレス(m−1)番の内容が、運用ボリューム115のブロックアドレス(m−1)番に格納されていること(すなわち、運用ボリューム115の更新(書き替え)が行われていないこと)を示す。
換言すると、312列の各エントリに示されているCoWビットマップは、少なくともスナップショットの最大数を示すnビットを備える記憶領域であり、各ビットがスナップショットの番号と対応し、スナップショットを維持し始めてからの更新の有無を示す。図3に示す場合、「0」は更新あり、「1」は更新なしを示す。
このCoWビットマップは、書き込み処理サブプログラム201が運用ボリューム115にブロックデータを書き込む際に参照され、データを書き込むアドレスの更新前のデータを差分ボリューム116に複写するか否かを決定するために利用される。このCoWビットマップによって、データ書き込み毎に、どのスナップショットの仮想ボリュームのブロックアドレスを書き換えるかを知るために、スナップショット管理テーブルをたどる必要がなくなり、データの書き込み速度を向上させることができる。
図4は、第1の実施の形態の差分ブロック管理テーブル212の詳細を示す説明図である。
差分ブロック管理テーブル212は、差分ボリューム116のブロックの使用状況を管理するため、差分ボリューム116に設けられたブロック各々に対して、ブロックアドレス411と所有ビットマップ412及び先行コピー領域アドレス413との対応を示す。
所有ビットマップ412列の各エントリに示されている所有ビットマップは、少なくともスナップショットの最大数を示すnビットを備える記憶領域であり、各ビットがスナップショットの番号と対応している。各ビットは、対応するスナップショットデータにアクセスするための仮想ボリュームを構成するブロックとして、対応する差分ボリューム116上のブロックが参照されるか否か(「1」は参照あり、「0」は参照なし)を示す。
書き込み処理サブプログラム201が、運用ボリューム115への書き込みに伴い、差分ボリューム116に運用ボリューム115のブロックデータを複写する際に、そのブロックを参照するスナップショット番号に対応する所有ビットマップ内のビットを1に更新する。また、差分ボリューム116から空きブロックを得る際には、所有ビットマップの全てのビットが0のブロックを選択する。
また、スナップショット削除サブプログラム204がスナップショットを削除する際、削除されるスナップショットに対応する仮想ボリュームを構成している全てのブロックについて、削除されるスナップショットに対応する所有ビットマップ内のビットを「0」に更新する。
先行コピー領域アドレス413列には、当該差分ボリューム116のブロックが先行コピー領域として使用されているか否かを示している。
より具体的に図4に示す差分ブロック管理テーブル212の内容を説明すると、第1行(401)には、差分ボリューム116のブロックアドレス0番の所有ビットマップとして「11…1」が登録されており、これは、差分ボリューム116のブロックアドレス0番のブロックが、全てのスナップショットにおいて使用されていることを示している。これは、スナップショット管理テーブル211(図3)の第1行(301)に規定されるように、スナップショット1、2、・・・n番に対応する仮想ボリューム1、2、・・・nのブロックアドレス0番の内容が、差分ボリューム116のブロックアドレス0番に格納されていることに対応している。
また、第1行(401)の先行コピー領域アドレス413が「なし」であることは、差分ボリューム116のブロックアドレス0番のブロックが、先行コピー領域として使用されていないことを示している。
第2行(402)には、差分ボリューム116のブロックアドレス1番の所有ビットマップとして「10…0」が登録されており、これは、差分ボリューム116のブロックアドレス1番のブロックが、所有ビットマップの第1ビットに対応するスナップショット1番において使用されている(すなわち、仮想ボリューム1を構成している)が、他のスナップショットにおいては使用されていないことを示している。これは、スナップショット管理テーブル211(図3)の第2行(302)に規定されるように、スナップショット1番に対応する仮想ボリューム1のブロックアドレス1番の内容が、差分ボリューム116のブロックアドレス1番に格納されていることに対応している。また、先行コピー領域アドレス413が「なし」であることは、差分ボリューム116のブロックアドレス1番のブロックが、先行コピー領域として使用されていないことを示している。
第3行(403)には、差分ボリューム116のブロックアドレス2番の所有ビットマップとして「01…0」が登録されている。これは、差分ボリューム116のブロックアドレス2番のブロックが、所有ビットマップの第2ビットに対応するスナップショット2番において使用されている(すなわち、仮想ボリューム2を構成している)ことを示している。これは、スナップショット管理テーブル211(図3)の第2行(302)に規定されるように、スナップショット2番に対応する仮想ボリューム2のブロックアドレス1番の内容が、差分ボリューム116のブロックアドレス2番に格納されていることに対応している。また、先行コピー領域アドレス413が「なし」であることから、差分ボリューム116のブロックアドレス2番のブロックが、先行コピー領域として使用されていないことを示している。
第4行(404)には、差分ボリューム116のブロックアドレス3番の所有ビットマップとして「00…0」が登録されている。これは、差分ボリューム116のブロックアドレス3番のブロックのいずれのスナップショットからも参照されず、使用されていないことを示している。また、先行コピー領域アドレス413が「2」であることから、差分ボリューム116のアドレス3番ブロックは、運用ボリューム115のブロックアドレス2の先行コピー領域として使用されていることを示している。
以後、第(p−1)行(406)まで同様に設定される。
すなわち、所有ビットマップ412の少なくとも一つのビットが「1」であれば、差分ボリューム116の当該ブロックはスナップショットに利用されている。また、所有ビットマップ412の全てのビットが「0」で、かつ先行コピー領域アドレス413が登録されていれば、差分ボリューム116のそのブロックは先行コピー領域として利用されている先行コピーデータ格納ブロックである。さらに、所有ビットマップ412の全てのビットが「0」で、かつ先行コピー領域アドレス413が登録されていなければ、差分ボリューム116のそのブロックはスナップショット、先行コピー領域のいずれにも利用されていない空きブロックである。
以下、スナップショット管理プログラム124の各サブプログラムの処理フローに関して説明する。
図5は、第1の実施の形態のスナップショット管理プログラム124の書き込み処理サブプログラム201による処理を示すフローチャートである。
書き込み処理では、まず、スナップショット管理テーブル211を参照して、書き込み処理の対象となっているブロックアドレス311列に対応するCoWビットマップ列312の全てのビットが「0」であるか否かを判定する(501)。
全ビットが「0」であれば、該ブロックのデータは、最後のスナップショット生成要求が発行された後、更新が行われており、既にこのブロックについては全ての仮想ボリュームが差分ボリューム116と対応づけられていることとなる。従って、CoWビットマップの全てのビットが「0」であれば、更新前のデータを差分ボリューム116に複写する必要はないので、ステップ507に進み、ファイルシステム処理プログラム123から指定された運用ボリューム(主ボリューム)115のブロックにデータを書き込む。
一方、少なくとも一つのビットが「1」であれば、書き込み処理によって更新されてしまう運用ボリューム115上のデータを参照しているスナップショット(仮想ボリューム)が存在するので、CoWを実行するためにステップ502に進む。
ステップ502では、差分ブロック管理テーブル212(図4)の先行コピー領域アドレス欄413を参照して、運用ボリューム115の書き込み処理の対象となっているブロックのブロックアドレスが、差分ブロック管理テーブル212の先行コピー領域アドレス欄413に登録されているか否かを判定する。これによって、運用ボリューム115の書き込み対象ブロックのデータが既に差分ボリューム116に先行コピー済みか否かを判定する(502)。
差分ブロック管理テーブル212に、書き込み対象のブロックのブロックアドレスが登録されていれば、書き込み対象ブロックに格納されているデータは既に差分ボリューム116に記憶されている。従って、書き込み対象ブロックに格納されている更新前のデータを差分ボリューム116に複写する必要はなく、当該データが格納されている(先行コピーされている)差分ボリューム116内のブロックと、仮想ボリュームとを対応付けるだけでよい。このために、書き込み処理サブプログラム201は、まず、差分ブロック管理テーブル212を参照して、書き込み対象ブロックのブロックアドレスと対応付けて登録されている差分ボリューム116のブロックアドレス411取得して、メモリ114に一時的に書き込む(511)。このアドレスは、後述するステップ505において、仮想ボリューム内の書き込み対象ブロックに対応するアドレスとして利用される。
その後、ステップ504に進む。この処理によって、既に差分ボリューム116に先行コピーされていたデータを仮想ボリュームのデータ、すなわちスナップショットデータとして利用することができる。
一方、書き込み対象ブロックのブロックアドレスが差分ブロック管理テーブル212の先行コピー領域アドレス欄に登録されていなければ、差分ブロック管理テーブル212(図4)を参照して、差分ボリューム116に空きブロックがあるか否かを判定する(503a)。その結果、差分ボリューム116に空きブロックがなければ、差分ボリューム116のブロックから先行コピーデータ格納ブロック(所有ビットマップ412の全てのビットが「0」で、かつ、先行コピー領域アドレス413が登録されているブロック)を探し、差分ブロック管理テーブル212内の当該先行コピー領域(先行コピーデータ格納ブロック)のアドレス413(図4)の記憶内容を破棄して(先行コピー領域アドレスを「なし」に変更して)、差分ボリューム116のうち先行コピー領域として使用されている先行コピー領域ブロックを空きブロックに変更して(503b)、ステップ503cに進む。一方、差分ボリューム116に空きブロックがあれば、ステップ503bの処理をすることなく、ステップ503cに進む。
次に、書き込みを行う運用ボリューム115のブロックに格納されている更新前のデータを差分ボリューム116の空きブロックに複写する(503c)。この503a〜503cの処理によって、差分ボリューム116に空きブロックを確保し、運用ボリューム115に格納されている更新前のデータを当該空きブロックに複写する(差分ボリューム116に空きがなかった場合,先行コピー領域として使用されている領域にデータを複写してスナップショット領域とする)。
そして、ステップ503cにてデータの複写先となった差分ボリューム116内のブロックのアドレスに対応する差分ブロック管理テーブル212の所有ビットマップ412列に、ステップ501にて参照したCoWビットマップの値を格納する。また、この差分ボリューム116内のブロックのアドレスに対応する先行コピー領域アドレス413を「なし」に設定する(504)。
そして、スナップショット管理テーブル211に登録されている仮想ボリュームのうち、ステップ502において参照したCoWビットマップ中の「1」の値を有するビットに対応する仮想ボリュームを特定する。そして特定された仮想ボリューム内の書き込み対象ブロックに対応するブロックが、ステップ503においてデータの複写先となった差分ボリューム116と対応するように、スナップショット管理テーブル211を更新する(505)。すなわち、スナップショット管理テーブル211内の特定された仮想ボリュームに対応する列の、書き込み対象ブロックアドレスに対応する行に、ステップ503においてデータの複写先となった差分ボリューム116のブロックのアドレスを登録する。また、ステップ511において取得した先行コピー領域のアドレスをスナップショットの差分データのアドレスとして登録する。
次に、ステップ501において参照したCoWビットマップの全ビットの値を「0」に更新する(506)。
すなわち、ステップS506までの処理によって、差分ボリューム116内の空き領域をスナップショットデータとしたり、差分ボリューム116内の先行コピー領域をスナップショットデータとする。
その後、指定されたブロックアドレスが示す運用ボリューム115のブロックに、指定されたデータを書き込む(507)。
そして、ステップ502の処理と同様に、差分ブロック管理テーブル212(図4)の先行コピー領域アドレス欄413を参照して、データを書き込んだブロックが先行コピー済みのブロックであるか否かを判定する(509)。
当該ブロックの先行コピーデータが差分ボリューム116内に存在すれば、ステップ507で運用ボリューム115に書き込んだものと同じデータを、当該のブロックの先行コピー領域として利用されている差分ボリューム116のブロックに書き込み(512)、書き込み処理サブプログラム201を終了する(510)。この処理によって、先行コピー領域の内容を最新に保つことができる。
一方、当該ブロックの先行コピーデータが差分ボリューム116内に存在しなければ、ステップ512の処理を行うことなく、書き込み処理サブプログラム201による処理を終了する(510)。
図6は、第1の実施の形態のスナップショット管理プログラム124の読み出し処理サブプログラム202による処理を示すフローチャートである。
読み出し処理では、まず、ファイルシステム処理プログラム123から指定された読み出し対象のボリュームが、運用ボリューム115であるか、仮想ボリュームであるかによって、スナップショットからの読み出しであるか否かを判定する(601)。
その結果、ファイルシステム処理プログラム123から受信した読み出し要求が運用ボリューム115に対するものであれば、スナップショットに対する読み出し要求ではないと判定し、運用ボリューム115の、ファイルシステム処理プログラム123によって指定されたブロックアドレスからデータを読み出す(603)。
一方、ファイルシステム処理プログラム123から受信した読み出し要求が仮想ボリュームに対するものであれば、スナップショットに対する読み出し要求であると判定して、ステップ602に進む。そして、さらに、スナップショット管理テーブル211(図3)を用いて、読み出し対象の仮想ボリュームの、ファイルシステム処理プログラム123によって指定されたブロックアドレスに対応する値を参照し、その値が「なし」であるか否かを判定する(602)。
その結果、当該仮想ボリュームのブロックアドレスに対応する値が「なし」であれば、読み出し対象のスナップショットに対応する仮想ボリュームの、読み出し対象のブロックのデータは、差分ボリューム116には記憶されていないので、運用ボリューム115の指定されたブロックアドレスからデータを読み出す(603)。
一方、ステップ602で参照したブロックアドレスの値が「なし」でなければ、読み出し対象の仮想ボリュームのブロックアドレスは、差分ボリューム116内のブロックアドレスと対応付けられている。すなわち、読み出し対象の仮想ボリュームのブロックアドレスのデータは、差分ボリューム116に記憶されている。そこで、ステップ602にて参照した差分ボリューム116のブロックアドレスからデータを読み出す(611)。
その後、読み出したブロックデータをファイルシステム処理プログラム123に返送して、読み出し処理サブプログラム202による処理を終了する(604)。
図7は、スナップショット管理プログラム124のスナップショット生成サブプログラム203による処理を示すフローチャートである。
第1の実施の形態のスナップショット管理プログラム124のスナップショット生成サブプログラム203では、データ保護プログラムからスナップショットの生成要求を受信すると、スナップショット管理テーブル211(図3)に新たに仮想ボリュームを登録する。そして、スナップショット管理テーブル211に記録されている全てのCoWビットマップ312の、新たに生成されるスナップショットに対応して新たに登録された仮想ボリュームに対応するビットを「1」に設定し、新たに生成されるスナップショットに対応する仮想ボリュームのブロックアドレスを全て「なし」に設定する(701)。
その後、スナップショット生成の対象として指定された運用ボリューム115の領域から読み出したデータを差分ボリューム116に書き込んで、指定された領域に記憶されたデータを運用ボリューム115から差分ボリューム116に複写する。そして、差分ブロック管理テーブル212(図4)の先行コピー領域として使用されることになったブロックのブロックアドレス欄に先行コピー領域アドレスを書き込む(702)。
その後、スナップショット生成サブプログラム203による処理を終了する(703)。
なお、前述したステップ701では、スナップショット管理テーブル211に登録されている全てのCoWビットマップ312の、新たに作成された仮想ボリュームに対応するビットの値を「1」と設定している。しかし、運用ボリューム115上に未使用ブロックが存在する場合、この未使用ブロックに対応する仮想ボリューム内のブロックも未使用ブロックとなる。このとき、新たに作成された仮想ボリューム内に存在する未使用ブロックには、CoWビットマップの未使用ブロック以外のブロックにのみ、新たに作成された仮想ボリュームに対応するビットを「1」と設定するように構成してもよい。ここで、未使用ブロックとは、データ(ファイルやディレクトリ等)の格納のために割り当てられていないブロックで、今後ファイルやディレクトリを新規作成したり、サイズを拡張したりする際に、データを格納するために用意しているブロックである。
未使用ブロックに対する書込み要求が発行され、未使用ブロックに格納されているデータが更新されても、ファイルシステムのスナップショットは未使用ブロックのデータを参照することがないため、当該データの更新はファイルシステムのスナップショットには影響を与えない。従って、スナップショット生成後に未使用部分が更新された場合、スナップショット生成の際に未使用ブロックに対するCoWビットが「0」になっていると差分ボリューム116に更新前のデータが複写されず、未使用ブロック内のデータ更新がスナップショットに反映され、スナップショット生成時と内容が変化してしまう。しかし、当該スナップショットを用いたファイルシステムでは、ファイルシステム内のファイルやディレクトリの内容には影響がない。従って、スナップショットを生成する際、未使用ブロックに対するCoWビットを「0」にしておけば、差分の発生量を削減することが可能となる。
図8は、第1の実施の形態のスナップショット管理プログラム124のスナップショット削除サブプログラム204による処理を示すフローチャートである。
データ保護プログラム122からスナップショットの削除要求を受信すると、スナップショット管理テーブル211(図3)に記憶されている全てのCoWビットマップ312について、削除要求で指定される削除対象のスナップショット(仮想ボリューム)に対応するビットを「0」に更新する(801)。
さらに、スナップショット管理テーブル211の、削除対象のスナップショットに対応する仮想ボリュームのブロックと対応付けられている差分ボリューム116上のブロック(例えば、削除対象のスナップショットに対応する仮想ボリュームが、仮想ボリューム2であれば、314列に登録されているブロックアドレスが示すブロック)について、差分ブロック管理テーブル212の所有ビットマップ412内の削除対象のスナップショットに対応する仮想ボリュームに対するビットを「0」に更新する(802)。
その後、削除対象スナップショットに対応する仮想ボリュームの登録をスナップショット管理テーブルから削除して、スナップショット削除サブプログラム204による処理を終了する(803)。
以上説明したように、本発明の第1の実施の形態では、運用ボリューム115のデータを予め差分ボリューム116に先行コピーデータとして格納し、差分ボリューム116の当該ブロックを先行コピー領域とし、当該データが書き込まれた時点でその先行コピーデータを複写済データとして利用するので、CoWが生じる頻度を低減することができ、ディスク装置に対するアクセス性能を向上させることができる。
また、第1の実施の形態のスナップショット生成処理(図7)によると、スナップショット生成の際に運用ボリューム115の指定された領域から読み出したデータを、差分ボリューム116の空き領域に格納し、その先行コピー領域のアドレスを記録するので、当該領域に対するアクセスに先行して先行コピーデータを作成することによって、CoWが生じる頻度を低減することができ、ディスク装置に対するアクセス性能を向上させることができる。
すなわち、従来技術のスナップショットでは、運用ボリューム115に書き込む際に、(1)管理テーブルの情報を読み出し、(2)運用ボリューム115上の旧データを読み出し、(3)差分ボリューム上の旧データを書き込み、(4)管理テーブルの情報を更新し、(5)運用ボリューム115上に正規の書き込み実行するという処理を逐次実行しなければならない。このため、コピー・オン・ライトの対象となっている領域に書き込みを行うと、その処理は、読み出し処理と、書き込み処理とがそれぞれ2回必要となる。
また、スナップショット取得時点で、その後更新される可能性が高い領域を差分ボリューム上に複写し、コピー・オン・ライト済とすることによって、コピー・オン・ライトの対象となる領域を減少させることができ、前述した2回ずつの読み出し処理、書き込み処理が必要となる領域を低減し、オーバヘッド発生を低減している。しかし、複写したデータの分、差分ボリューム116の容量を消費する。また、結果的に更新がされなかったブロックの複写は無駄になる。
本発明は、コピー・オン・ライト・スナップショットにおいて用いられる差分ボリューム116に格納された先行コピーデータのうち利用されていない領域に、スナップショットの差分データを格納するので、差分ボリューム116の容量を有効に利用することができ、結果的に更新がされなかったブロックへの複写の利用機会を高めることができる。
次に、本発明の第1の実施の形態の変形例について説明する。
図9は、第1の実施の形態の変形例としてのスナップショット生成サブプログラム203aによるスナップショット生成処理を示すフローチャートである。
図9に示すスナップショット生成処理203aでは、前述したスナップショット生成処理(図10)と、スナップショット生成時に運用ボリューム115から読み出されてキャッシュメモリに記憶されているデータを差分ボリューム116に書き込んで先行コピーデータとして利用する点で異なる。
このスナップショット生成サブプログラム203aでは、データ保護プログラムからスナップショットの生成要求を受信すると、スナップショット管理テーブル211(図3)に新たに仮想ボリュームを登録する。そして、スナップショット管理テーブル211に記録されている全てのCoWビットマップ312の、新たに生成されるスナップショットに対応して新たに登録された仮想ボリュームに対応するビットを「1」に設定し、新たに生成されるスナップショットに対応する仮想ボリュームのブロックアドレスを全て「なし」に設定する(701)。
その後、メモリ114に設けられたキャッシュメモリに記憶されている運用ボリューム115のキャッシュデータを差分ボリューム116の空き領域に書き込む。そして、差分ブロック管理テーブル212(図4)の先行コピー領域として使用されることになったブロックのブロックアドレス欄に先行コピー領域アドレスを書き込む(1201)。
その後、スナップショット生成サブプログラム203bによる処理を終了する(702)。
このように、第3の実施の形態のスナップショット生成サブプログラム203b(図9)によると、スナップショット生成の際に指定された運用ボリューム115から読み出したデータや、運用ボリューム115に書き込んだデータは、ホスト101のメモリ114に設けられたキャッシュメモリ(後述する第二の実施の形態では、ストレージ装置のメモリ914に設けられたキャッシュメモリ)に、キャッシュデータとして記憶されている。よって、このキャッシュメモリに記憶されたデータを、差分ボリューム116の空き領域に格納し、その先行コピー領域アドレスを記録するので、差分ボリューム116に先行コピーデータとして記憶するデータをディスク装置から再度読み出す必要がなくなる。また、キャッシュメモリに記憶されているデータは頻繁にアクセスがされるデータであることが多いことから、先行コピーを行う領域を予め設定することなく、適切に選択することができる。
図10は、第1の実施の形態のさらなる変形例としてのスナップショット生成サブプログラム203bによるスナップショット生成処理を示すフローチャートである。
図10に示すスナップショット生成処理203bでは、前述したスナップショット生成処理203(図7)と、スナップショット生成時に先行コピーをしない点で異なる。
このスナップショット生成サブプログラム203bでは、データ保護プログラムからスナップショットの生成要求を受信すると、スナップショット管理テーブル211(図3)に新たに仮想ボリュームを登録する。そして、スナップショット管理テーブル211に記録されている全てのCoWビットマップ312の、新たに生成されるスナップショットに対応して新たに登録された仮想ボリュームに対応するビットを「1」に設定し、新たに生成されるスナップショットに対応する仮想ボリュームのブロックアドレスを全て「なし」に設定する(701)。
その後、スナップショット生成サブプログラム203bによる処理を終了する(703)。
このスナップショット生成サブプログラム203bは、スナップショット生成時に先行コピーデータを作成しないものであるが、後述する読み出し処理サブプログラム202a(図11)、書き込み処理サブプログラム201a、201b(図12、図13)と共に用いられ、これらの読み出し処理サブプログラム202a又は書き込み処理サブプログラム201a、201bによって先行コピー領域にデータが記憶される。
図11は、第1の実施の形態の変形例としての読み出し処理サブプログラム202aによる処理を示すフローチャートである。
図11に示す読み出し処理202aでは、前述した第1の実施の形態の読み出し処理(図6)と、運用ボリューム115から読み出したデータを差分ボリューム116の空きブロックに書き込んで先行コピーをする点で異なる。
この読み出し処理202aでは、まず、ファイルシステム処理プログラム123から指定された読み出し対象のボリュームが、運用ボリューム115であるか、仮想ボリュームであるかによって、スナップショットからの読み出しであるか否かを判定する(601)。
その結果、ファイルシステム処理プログラム123から受信した読み出し要求が運用ボリューム115に対するものであれば、スナップショットに対する読み出し要求ではないと判定し、運用ボリューム115の、ファイルシステム処理プログラム123によって指定されたブロックアドレスからデータを読み出す(603)。
一方、ファイルシステム処理プログラム123から受信した読み出し要求が仮想ボリュームに対するものであれば、スナップショットに対する読み出し要求であると判定して、ステップ602に進む。そして、さらに、スナップショット管理テーブル211(図3)を用いて、読み出し対象の仮想ボリュームの、ファイルシステム処理プログラム123によって指定されたブロックアドレスに対応する値を参照し、その値が「なし」であるか否かを判定する(602)。
その結果、当該仮想ボリュームのブロックアドレスに対応する値が「なし」であれば、読み出し対象のスナップショットに対応する仮想ボリュームの、読み出し対象のブロックのデータは、差分ボリューム116には記憶されていないので、運用ボリューム115の指定されたブロックアドレスからデータを読み出す(603)。
一方、ステップ602で参照したブロックアドレスの値が「なし」でなければ、読み出し対象の仮想ボリュームのブロックアドレスは、差分ボリューム116内のブロックアドレスと対応付けられている。すなわち、読み出し対象の仮想ボリュームのブロックアドレスのデータは、差分ボリューム116に記憶されている。そこで、ステップ602にて参照した差分ボリューム116のブロックアドレスからデータを読み出す(611)。
その後、差分ブロック管理テーブル212(図4)を参照して、スナップショット及び先行コピー領域のいずれにも利用されていない差分ボリューム116の空きブロックがあるか否かを判定する(1001)。その結果、差分ボリューム116に空きブロックがあれば、運用ボリューム115の指定されたブロックアドレスからデータを当該空きブロックに書き込む。そして、新たに先行コピー領域として使用されることになったブロックの先行コピー領域アドレス欄(図4の413)に先行コピー領域のアドレスを書き込む(1002)。このステップ1001〜1002の処理によって、運用ボリューム115から読み出されるデータが先行コピーされていなければ、先行コピーデータとして記憶することができる。
そして、読み出したブロックデータをクライアント131、132に返送して、読み出し処理サブプログラム202aによる処理を終了する(604)。
このように、図11に示す読み出し処理によると、運用ボリューム115から読み出したデータを差分ボリューム116の空き領域に格納し、その空き領域のアドレスを先行コピー領域アドレスとして記録する。すなわち、運用ボリューム115のコピー・オン・ライト対象の領域はデータ参照後書き込む可能性があることから、このデータを先行コピーしておくことによって、CoWが生じる頻度を低減することができ、ディスク装置に対するアクセス性能を向上させることができる。
図12は、第1実施の形態の変形例としての書き込み処理サブプログラム201aによる処理を示すフローチャートである。
図12に示す書き込み処理201aでは、前述した第1の実施の形態の書き込み処理(図5)と、運用ボリューム115に書き込むデータを空きブロックに書き込んで先行コピーする点で異なる。
書き込み処理サブプログラム201aでは、前述した第1の実施の形態と同様に、ステップ501〜506及び511のコピー・オン・ライト時の処理、並びに、ステップ507、509、512のコピー・オン・ライトが行われない場合の処理が実行される。なお、前述した第1の実施の形態の書き込み処理(図5)と同じ処理には同じ符号を付し、その詳細な説明は省略する。
図12に示す書き込み処理では、前述した第1の実施の形態と同様に、ステップ501にて、書き込み処理の対象となっているブロックアドレス311列に対応するCoWビットマップ列312の全てのビットが「0」であるか否かを判定し、全ビットが「0」であれば、最後のスナップショット生成要求が発行された後、データが更新されており、更新前のデータを差分ボリューム116に複写する必要がないので、ステップ507に進む。
ステップ507では、指定されたブロックアドレスが示す運用ボリューム115のブロックに、指定されたデータを書き込む。
その後、ステップ502の処理と同様に、差分ブロック管理テーブル212(図4)の先行コピー領域アドレス欄413を参照して、データを書き込んだブロックが先行コピー済みのブロックであるか否かを判定する(509)。
当該ブロックの先行コピーデータが差分ボリューム116内に存在すれば、ステップ507で運用ボリューム115に書き込んだものと同じデータを、当該のブロックの先行コピーデータが格納されている差分ボリューム116のブロックに書き込み(512)、書き込み処理サブプログラム201を終了する(510)。
一方、当該のブロックの先行コピーデータが差分ボリューム116内に存在しなければ、差分ブロック管理テーブル212(図4)を参照して、スナップショット及び先行コピー領域のいずれにも利用されていない差分ボリューム116の空きブロックがあるか否かを判定する(1301)。その結果、差分ボリューム116に空きブロックがあれば、指定されたブロックアドレスが示す運用ボリューム115のブロックに書き込まれるデータを、当該空きブロックに書き込む。そして、新たに先行コピー領域として使用されることになったブロックの先行コピー領域アドレス欄(図4の413)に先行コピー領域アドレスを書き込む(1302)。
その後、書き込み処理サブプログラム201aによる処理を終了する(510)。
このように、書き込み処理201aによると、運用ボリューム115のコピー・オン・ライト済(コピー・オン・ライトの対象外)の領域に書き込まれるデータを、前記差分ボリューム116の空き領域に格納し、その先行コピー領域アドレスを記録するので、ディスク装置に対する局所的な書き込みが多い場合であっても、次に取得されるスナップショットにおいてCoWが生じる頻度を低減することができ、ディスク装置に対するアクセス性能を向上させることができる。また、運用ボリューム115からデータを読み出すことなく先行コピーを行うことができるので、先行コピーを高速に行うことができる。
図13は、第1の実施の形態の変形例としての書き込み処理サブプログラム201bによる処理を示すフローチャートである。
図13に示す書き込み処理201bでは、前述した第1の実施の形態の書き込み処理(図5)と、運用ボリューム115のコピー・オン・ライト処理を実行する領域と隣接する領域から読み出されたデータを空きブロックに書き込んで先行コピーする点で異なる。具体的には、第1の実施の形態の書き込み処理(図5)のステップ503cに代わり、隣接ブロックも複写する処理が行われる(1401)。
ステップ1401では、次に、指定されたブロックアドレスが示す運用ボリューム115のブロックから読み出したデータを差分ボリューム116の空きブロックに書き込む。そして、運用ボリューム115の指定されたブロックアドレスに隣接するブロックからもデータを読み出して、該読み出したデータを差分ボリューム116の空きブロックに書き込む。そして、運用ボリューム115の指定されたブロックアドレスに隣接するブロックから読み出したデータを差分ボリューム116の空きブロックに書き込む。そして、新たに先行コピー領域として使用されることになったブロックの先行コピー領域アドレス欄(図4の413)に先行コピー領域アドレスを書き込む。
その後、第1の実施の形態の書き込み処理(図5)と同様にステップ504以後の処理が行われる。
このように、書き込み処理201bによると、運用ボリューム115のコピー・オン・ライト処理を実行する領域に隣接する領域から読み出されたデータを、差分ボリューム116の空き領域に格納し、その先行コピー領域アドレスを記録する。すなわち、運用ボリューム115からデータを読み出したブロックに隣接するブロックからはデータが読み出される可能性が高いので、当該隣接ブロックからデータを読み出して先行コピーしておくことによって、CoWが生じる頻度を低減することができ、ディスク装置に対するアクセス性能を向上させることができる。
なお、図11〜図13に示す処理のいずれによっても、差分ボリューム116が先行コピー領域として使用され、先行コピーデータが記憶されるので、図11〜図13に示す処理の一つ又は任意の組み合わせによって、差分ボリューム116が先行コピー領域として使用され、先行コピーデータが記憶される。
次に、本発明の第2の実施の形態について説明する。第2の実施の形態は図14に示すハードウェアを備える他、第2の実施の形態で行われる処理は前述した第1の実施の形態と同じである。第2の実施の形態において、前述した第1の実施の形態と同じ機能をする構成には同じ符号を付し、その詳細な説明は省略する。
図14に、本発明の第2の実施の形態のストレージシステムの構成を示すブロック図である。
第2の実施の形態のストレージシステムは、複数のクライアントが接続されたサーバ装置101a、101bと、サーバ装置が必要とするデータを記憶するストレージ装置901と、ストレージ装置901に記憶されているデータの複製を記憶する装置バックアップ装置117とが、FCスイッチ等で構成されるSAN(Storage Area Network)931によって接続されて構成される。
サーバ装置101aは、ネットワークインターフェース112を介して接続されたクライアント131、132に対してファイル共有サービスを提供する。
サーバ装置101aは、一つ以上のCPU111、一つ以上のネットワークインターフェース112、一つ以上のFC(Fibre Channel)インターフェース921、及びメモリ114を備える。なお、サーバ装置101bはバックアップ用に設けられたもので、サーバ装置101aと同様の構成を有するので、その詳細な説明は省略する。
FCインターフェース921は、SAN(Storage Area Network)931に対してファイバチャネル(Fibre Channel)プロトコルによる信号(コマンド、データ)を送受信し、ストレージ装置901に対する操作を可能にする。
メモリ114には、ファイルサーバプログラム121、データ保護プログラム122及びファイルシステム処理プログラム123が記憶されており、CPU111がこれらのプログラムを呼び出して実行することによって、各種の処理が行われる。
ストレージ装置901は、一つ以上のCPU911、一つ以上のFCインターフェース912、一つ以上のディスクアレイコントローラ913、メモリ914、及び一つ以上のディスク装置915を備える。
ディスクアレイコントローラ913は、ディスク装置915との間で所定のインターフェース(例えば、SCSI)に基づく信号(コマンド、データ)を送受信する。
ディスク装置915には、複数の論理的なディスク装置から構成される論理ユニット916、917、918が設けられている。
メモリ914には、スナップショット管理プログラム124が記憶されており、CPU911がこれらのプログラムを呼び出して実行することによって、各種の処理が行われる。
スナップショット管理プログラム924は、例えば、論理ユニット916に運用ボリュームを、論理ユニット917に差分ボリュームを割り当てることにより、第1の実施の形態と同様に、スナップショットを利用する仮想ボリュームを提供することができる。この仮想ボリュームを仮想的な論理ユニットとして利用可能にすることで、SAN931上の各装置がスナップショットを利用することが可能になる。また、スナップショット管理プログラム924をストレージ装置901に備えるので、ストレージ装置内でスナップショットを実現することができる。その他、スナップショット管理プログラム924は、前述したスナップショット管理プログラム124と同様の機能を提供する。
なお、サーバ装置101aが、この仮想的な論理ユニットを利用することで、本発明の第1の実施の形態と同様に、データ保護プログラム122を実行することができる。
さらに、サーバ装置101bもSAN931を経由して、ストレージ装置901が提供する仮想的な論理ユニットを利用することができる。これによって、バックアップ用のサーバ装置101bは、ストレージ装置901が提供する仮想的な論理ユニットの内容、即ちスナップショットイメージをSAN931に接続したバックアップ装置117aに保存することができる。
本発明の第1の実施の形態のストレージシステムの構成を示すブロック図である。 第1の実施の形態のスナップショット管理プログラム124の構成を示すブロック図である。 第1の実施の形態のスナップショット管理テーブル211の詳細を示す説明図である。 第1の実施の形態の差分ブロック管理テーブル212の詳細を示す説明図である。 第1の実施の形態の書き込み処理サブプログラム201による処理を示すフローチャートである。 第1の実施の形態の読み出し処理サブプログラム202による処理を示すフローチャートである。 第1の実施の形態のスナップショット生成サブプログラム203による処理を示すフローチャートである。 第1の実施の形態のスナップショット削除サブプログラム204による処理を示すフローチャートである。 第1の実施の形態の変形例のスナップショット生成サブプログラム203aによる処理を示すフローチャートである。 第1の実施の形態の変形例のスナップショット生成サブプログラム203bによる処理を示すフローチャートである。 第1の実施の形態の変形例の読み出し処理サブプログラム202aによる処理を示すフローチャートである。 第1の実施の形態の変形例の書き込み処理サブプログラム201aによる処理を示すフローチャートである。 第1の実施の形態の変形例の書き込み処理サブプログラム201bによる処理を示すフローチャートである。 本発明の第2の実施の形態のストレージシステムの構成を示すブロック図である。
符号の説明
101 サーバ装置
111 CPU
112 ネットワークインターフェース
113 ストレージインターフェース
114 メモリ
115 ディスク装置1(運用ボリューム)
116 ディスク装置2(差分ボリューム)
117 バックアップ装置
121 ファイルサーバプログラム
122 データ保護プログラム
123 ファイルシステム処理プログラム
124 スナップショット管理プログラム
131 クライアント
132 クライアント
201 書き込み処理サブプログラム
202 読み出し処理サブプログラム
203 スナップショット生成サブプログラム
204 スナップショット削除サブプログラム
211 スナップショット管理テーブル
212 差分ブロック管理テーブル
901 ストレージ装置
931 SAN

Claims (1)

  1. 一つ以上のCPUと、メモリと、一つ以上のネットワークI/Fと、一つ以上のストレージI/Fとを有するサーバ装置と、
    前記サーバ装置がデータの読み書きを行う運用ボリュームと、差分データを記憶する差分ボリュームとが設けられ、前記ストレージI/Fに接続された一つ以上のディスク装置と、を備えるストレージシステムにおいて、
    前記サーバ装置は、
    前記サーバ装置に対して送られたファイルのアクセス要求に応じて前記ディスク装置にアクセスするファイルサーバ部と、
    前記運用ボリュームへデータが書き込まれる際に、当該データが書き込まれる領域に記憶されたデータを前記差分ボリュームに複製して前記差分データを生成し、当該データが書き込まれる前記運用ボリュームの領域の位置情報と前記差分データを記憶するための領域の位置情報とを対応付ける差分ブロック管理情報を前記メモリに記録することによって前記差分データの生成を制御するデータ保護部と、
    前記ファイルサーバ部及び前記データ保護部からの要求に応じてスナップショット管理部にアクセス処理を発行するファイルシステム処理部と、
    前記差分ボリュームを管理し、前記生成された差分データを維持するスナップショット管理部と、を有し、
    前記スナップショット管理部は、
    前記運用ボリュームから読み出された又は前記運用ボリュームへ書き込まれるデータを複製して、先行コピーデータを生成し、
    前記運用ボリュームからデータが読み出される際又は前記運用ボリュームへデータが書き込まれる際に、前記運用ボリュームから読み出された又は前記運用ボリュームへ書き込まれるデータが記憶されていた前記運用ボリュームの領域の位置情報と前記先行コピーデータを記憶するために使用される前記差分ボリュームの領域の位置情報とを対応付ける情報を前記差分ブロック管理情報として前記メモリに記録することによって、前記先行コピーデータを記憶するための先行コピー領域を前記差分ボリュームに設け、
    前記生成された先行コピーデータを前記先行コピー領域に格納し、
    前記運用ボリュームへデータが書き込まれる際に、前記差分ブロック管理情報を参照して、当該データが書き込まれる領域に記憶されているデータが既に前記差分ボリュームに記憶されているか否かを判定し、
    当該領域に記憶されているデータが前記差分ボリュームに記憶されていないと判定された場合、当該領域に記憶されているデータを前記差分ボリュームに複写することによって前記差分データを生成し、
    当該領域に記憶されているデータが前記差分ボリュームに前記先行コピーデータとして記憶されていると判定された場合、当該先行コピーデータが差分データであることを示す情報を前記差分ブロック管理情報に設定し、
    前記運用ボリュームへデータが書き込まれる際に、前記差分ブロック管理情報を参照して、前記差分ボリュームに空き領域がないと判定された場合、前記差分ボリューム内に設けられた前記先行コピー領域について、前記スナップショット管理情報に記録され、前記先行コピー領域に対応付けられた前記運用ボリュームの領域の位置情報を破棄することによって、前記先行コピー領域を空き領域に変更して、前記差分データを記憶するために利用することを特徴とするストレージシステム。
JP2004021104A 2003-03-18 2004-01-29 ストレージシステム、サーバ装置及び先行コピーデータ生成方法 Expired - Fee Related JP4394467B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004021104A JP4394467B2 (ja) 2004-01-29 2004-01-29 ストレージシステム、サーバ装置及び先行コピーデータ生成方法
US10/808,921 US7266654B2 (en) 2003-03-18 2004-03-24 Storage system, server apparatus, and method for creating a plurality of snapshots

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004021104A JP4394467B2 (ja) 2004-01-29 2004-01-29 ストレージシステム、サーバ装置及び先行コピーデータ生成方法

Publications (2)

Publication Number Publication Date
JP2005215940A JP2005215940A (ja) 2005-08-11
JP4394467B2 true JP4394467B2 (ja) 2010-01-06

Family

ID=34904845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004021104A Expired - Fee Related JP4394467B2 (ja) 2003-03-18 2004-01-29 ストレージシステム、サーバ装置及び先行コピーデータ生成方法

Country Status (1)

Country Link
JP (1) JP4394467B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4800031B2 (ja) * 2005-12-28 2011-10-26 株式会社日立製作所 ストレージシステム及びスナップショット管理方法
JP4920979B2 (ja) * 2006-01-25 2012-04-18 株式会社日立製作所 ストレージ装置及びその制御方法
JP4884041B2 (ja) * 2006-03-15 2012-02-22 株式会社日立製作所 自動拡張可能なボリュームに対して最適なi/oコマンドを発行するストレージシステム及びその制御方法
JP5037881B2 (ja) * 2006-04-18 2012-10-03 株式会社日立製作所 ストレージシステム及びその制御方法
JP4902403B2 (ja) 2006-10-30 2012-03-21 株式会社日立製作所 情報システム及びデータ転送方法
JP5244332B2 (ja) 2006-10-30 2013-07-24 株式会社日立製作所 情報システム、データ転送方法及びデータ保護方法
JP5057366B2 (ja) 2006-10-30 2012-10-24 株式会社日立製作所 情報システム及び情報システムのデータ転送方法
JP4898615B2 (ja) 2007-09-20 2012-03-21 キヤノン株式会社 情報処理装置および符号化方法
US8935488B2 (en) * 2012-01-26 2015-01-13 Hitachi, Ltd. Storage system and storage control method

Also Published As

Publication number Publication date
JP2005215940A (ja) 2005-08-11

Similar Documents

Publication Publication Date Title
JP4292882B2 (ja) 複数のスナップショット維持方法及びサーバ装置及びストレージ装置
JP4550541B2 (ja) ストレージシステム
US7266654B2 (en) Storage system, server apparatus, and method for creating a plurality of snapshots
US6341341B1 (en) System and method for disk control with snapshot feature including read-write snapshot half
JP4199993B2 (ja) スナップショット取得方法
JP4809040B2 (ja) ストレージ装置及びスナップショットのリストア方法
US7287045B2 (en) Backup method, storage system, and program for backup
US7593973B2 (en) Method and apparatus for transferring snapshot data
JP4741371B2 (ja) システム、サーバ装置及びスナップショットの形式変換方法
US8204858B2 (en) Snapshot reset method and apparatus
US7461201B2 (en) Storage control method and system for performing backup and/or restoration
JP3641183B2 (ja) Raidデータ記憶システムにおける瞬時バックアップを提供する方法及びシステム
US20060047926A1 (en) Managing multiple snapshot copies of data
WO2011033692A1 (ja) ストレージ装置及びそのスナップショット制御方法
JP2005031716A (ja) データバックアップの方法及び装置
JP2003280964A (ja) スナップショット取得方法、ストレージシステム及びディスク装置
JP2006146904A (ja) ストレージシステムでオブジェクトレベルのスナップショットを生成するシステムと方法
KR20100045974A (ko) 스냅샷을 제공하는 파일 시스템에 대한 계층적 저장 관리
US8140886B2 (en) Apparatus, system, and method for virtual storage access method volume data set recovery
US6629203B1 (en) Alternating shadow directories in pairs of storage spaces for data storage
JP4394467B2 (ja) ストレージシステム、サーバ装置及び先行コピーデータ生成方法
JP2006011811A (ja) 記憶制御システム及び記憶制御方法
US20050223180A1 (en) Accelerating the execution of I/O operations in a storage system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091006

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091015

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131023

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees