JP2024079042A

JP2024079042A - ストレージシステム及び記憶制御方法

Info

Publication number: JP2024079042A
Application number: JP2022191738A
Authority: JP
Inventors: 一樹松上; 朋宏吉原; 尚長尾
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2022-11-30
Filing date: 2022-11-30
Publication date: 2024-06-11
Also published as: US20240176707A1

Abstract

【課題】同一のＰＶＯＬについてＳＶＯＬ（スナップショット）の数が増えてもＰＶＯＬ及びＳＶＯＬの性能低下を回避する。【解決手段】ＰＶＯＬと当該ＰＶＯＬについての一つ以上のＳＶＯＬとのグループであるスナップショットグループについてのＤＳＶＯＬは、スナップショットグループのいずれかのＶＯＬが格納先であるデータと、当該データのメタ情報とが格納されるデータ格納領域であり、当該メタ情報は、当該データのスナップショットグループにおける位置のアドレスである参照元アドレスと、データのＤＳＶＯＬにおける位置のアドレスである参照先アドレスとのアドレスマッピングを含んだ情報である。ストレージシステムは、プロセッサは、前記スナップショットグループに対するＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）負荷が閾値を超えた場合に、スナップショットグループについてのＤＳＶＯＬの数を増やす。【選択図】図１

Description

本発明は、概して、ストレージシステムの記憶制御に関する。

ストレージシステムの機能の一つとして、スナップショット機能が知られている。例えば、高頻度にバックアップを取り障害発生から速やかに復旧することが可能なスナップショット機能のニーズがある。

スナップショット機能に関し、例えば特許文献１に開示の技術が知られている。特許文献１は、ＲｏＷ（ＲｅｄｉｒｅｃｔｏｎＷｒｉｔｅ）方式のスナップショット機能に関する技術を開示しており、具体的には、スナップショットの操作性能とＩ／Ｏ性能を両立するための技術を開示している。ＲｏＷ方式は、データを追い書きする方式である。追い書きとは、ストレージシステムにデータをライトする際、ライト前に格納されていたデータを上書きせず、新規領域にライト対象データを格納し、新規領域に格納したデータを参照するようにメタ情報を書き換えるデータ格納方式のことである。

米国特許第１０，９６３，４８５号明細書

以下、ＰＶＯＬ（ＰｒｉｍａｒｙＶｏｌｕｍｅ）についてＲｏＷ方式により作成された複製ボリュームを、便宜上、ＳＶＯＬ（ＳｅｃｏｎｄａｒｙＶｏｌｕｍｅ）と呼ぶ。ＳＶＯＬは、ＰＶＯＬのスナップショットである。

特許文献１に開示の技術によれば、データのメタ情報やデータそれ自体が格納されるデータ格納領域であるＤＳＶＯＬ（ＤａｔａＳｔｏｒｅＶｏｌｕｍｅ）があり、ＰＶＯＬ及びＳＶＯＬが、同じＤＳＶＯＬを共有する。このため、ＰＶＯＬに対してＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）が行われてもＳＶＯＬに対してＩ／Ｏが行われても同じＤＳＶＯＬにＩ／Ｏが行われることになる。結果として、ＤＳＶＯＬにＩ／Ｏが集中して、ＰＶＯＬ及びＳＶＯＬの性能が低下するおそれがある。同一のＰＶＯＬについてＳＶＯＬ（スナップショット）が増えると、ＰＶＯＬ及びＳＶＯＬの性能が低下する可能性が高まる。

ストレージシステムが、ＰＶＯＬと当該ＰＶＯＬについての一つ以上のＳＶＯＬとのグループであるスナップショットグループに対するＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）負荷が閾値を超えたか否かを判定する。この判定結果が真の場合に、ストレージシステムが、当該スナップショットグループについてのＤＳＶＯＬの数を増やす。

本発明によれば、同一のＰＶＯＬについてＳＶＯＬ（スナップショット）の数が増えてもＰＶＯＬ及びＳＶＯＬの性能低下を回避することが期待できる。前述した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

実施形態に係るストレージシステムの概要の説明図。ストレージシステムの構成例の説明図。メモリ領域の構成例の説明図。ＶＯＬ管理テーブルの構成の説明図。性能管理テーブルの構成の説明図。マッピング管理テーブルの構成の説明図。論物変換テーブルの構成の説明図。空き検索テーブルの構成の説明図。割当て管理テーブルの構成の説明図。プール割当て管理テーブルの構成の説明図。ドライブ割当て管理テーブルの構成の説明図。記憶階層の一例の説明図。リード処理の流れを示すフローチャート。ライト処理の流れを示すフローチャート。デステージ処理の流れを示すフローチャート。ＤＳＶＯＬ拡張処理の流れを示すフローチャート。変形例に係るストレージシステムの概要の説明図。

以下の説明では、「インターフェース装置」は、一つ以上のインターフェースデバイスでよい。当該一つ以上のインターフェースデバイスは、下記のうちの少なくとも一つでよい。
・一つ以上のＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）インターフェースデバイス。Ｉ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）インターフェースデバイスは、Ｉ／Ｏデバイスと遠隔の表示用計算機とのうちの少なくとも一つに対するインターフェースデバイスである。表示用計算機に対するＩ／Ｏインターフェースデバイスは、通信インターフェースデバイスでよい。少なくとも一つのＩ／Ｏデバイスは、ユーザインターフェースデバイス、例えば、キーボード及びポインティングデバイスのような入力デバイスと、表示デバイスのような出力デバイスとのうちのいずれでもよい。
・一つ以上の通信インターフェースデバイス。一つ以上の通信インターフェースデバイスは、一つ以上の同種の通信インターフェースデバイス（例えば一つ以上のＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ））であってもよいし二つ以上の異種の通信インターフェースデバイス（例えばＮＩＣとＨＢＡ（ＨｏｓｔＢｕｓＡｄａｐｔｅｒ））であってもよい。

また、以下の説明では、「メモリ」は、一つ以上の記憶デバイスの一例である一つ以上のメモリデバイスであり、典型的には主記憶デバイスでよい。メモリにおける少なくとも一つのメモリデバイスは、揮発性メモリデバイスであってもよいし不揮発性メモリデバイスであってもよい。

また、以下の説明では、「永続記憶装置」は、一つ以上の記憶デバイスの一例である一つ以上の永続記憶デバイスでよい。永続記憶デバイスは、典型的には、不揮発性の記憶デバイス（例えば補助記憶デバイス）でよく、具体的には、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、ＮＶＭＥ（Ｎｏｎ－ＶｏｌａｔｉｌｅＭｅｍｏｒｙＥｘｐｒｅｓｓ）ドライブ、又は、ＳＣＭ（ＳｔｏｒａｇｅＣｌａｓｓＭｅｍｏｒｙ）でよい。

また、以下の説明では、「記憶装置」は、メモリと永続記憶装置の少なくともメモリでよい。

また、以下の説明では、「プロセッサ」は、一つ以上のプロセッサデバイスでよい。少なくとも一つのプロセッサデバイスは、典型的には、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）のようなマイクロプロセッサデバイスでよいが、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）のような他種のプロセッサデバイスでもよい。少なくとも一つのプロセッサデバイスは、シングルコアでもよいしマルチコアでもよい。少なくとも一つのプロセッサデバイスは、プロセッサコアでもよい。少なくとも一つのプロセッサデバイスは、処理の一部又は全部を行うハードウェア記述言語によりゲートアレイの集合体である回路（例えばＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、ＣＰＬＤ（ＣｏｍｐｌｅｘＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）又はＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ））といった広義のプロセッサデバイスでもよい。

また、以下の説明では、「ｘｘｘテーブル」といった表現にて、入力に対して出力が得られる情報を説明することがあるが、当該情報は、どのような構造のデータでもよいし（例えば、構造化データでもよいし非構造化データでもよいし）、入力に対する出力を発生するニューラルネットワーク、遺伝的アルゴリズムやランダムフォレストに代表されるような学習モデルでもよい。従って、「ｘｘｘテーブル」を「ｘｘｘ情報」と言うことができる。また、以下の説明において、各テーブルの構成は一例であり、一つのテーブルは、二つ以上のテーブルに分割されてもよいし、二つ以上のテーブルの全部又は一部が一つのテーブルであってもよい。

また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサによって実行されることで、定められた処理を、適宜に記憶装置及び／又はインターフェース装置を用いながら行うため、処理の主語が、プロセッサ（或いは、そのプロセッサを有する装置又はシステム）とされてもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読み取り可能な記録媒体（例えば非一時的な記録媒体）であってもよい。また、以下の説明において、二つ以上のプログラムが一つのプログラムとして実現されてもよいし、一つのプログラムが二つ以上のプログラムとして実現されてもよい。

また、以下の説明では、「ＶＯＬ」は、論理ボリュームの略であり、論理的な記憶領域でよい。ＶＯＬは、実体的なＶＯＬ（ＲＶＯＬ）であってもよいし、仮想的なＶＯＬ（ＶＶＯＬ）であってもよい。「ＲＶＯＬ」は、そのＲＶＯＬを提供するストレージシステムが有する物理的な記憶資源（例えば、一つ以上のＲＡＩＤグループ）に基づくＶＯＬでよい。「ＶＶＯＬ」は、外部接続ＶＯＬ（ＥＶＯＬ）と、容量拡張ＶＯＬ（ＴＰＶＯＬ）と、スナップショットＶＯＬ（ＳＳＶＯＬ）とのうちのいずれでもよい。ＥＶＯＬは、外部のストレージシステムの記憶空間（例えばＶＯＬ）に基づいておりストレージ仮想化技術に従うＶＯＬでよい。ＴＰＶＯＬは、複数の仮想領域（仮想的な記憶領域）で構成されており容量仮想化技術（典型的にはＴｈｉｎＰｒｏｖｉｓｉｏｎｉｎｇ）に従うＶＯＬでよい。ＳＳＶＯＬは、オリジナルのＶＯＬのスナップショットとして提供されるＶＯＬでよい。ＳＳＶＯＬは、ＲＶＯＬであってもよい。典型的には、ＳＳＶＯＬは、オリジナルのＶＯＬをプライマリＶＯＬ（ＰＶＯＬ）としてセカンダリのＶＯＬに位置づけられる。「プール」は、論理的な記憶領域（例えば複数のプールＶＯＬの集合）であり、用途ごとに用意されてよい。例えば、プールとして、ＴＰプールと、スナップショットプールとのうちの少なくとも１種類があってよい。ＴＰプールは、複数の実領域（実体的な記憶領域）で構成された記憶領域でよい。ストレージシステムが、ホストシステムから受信したライト要求が指定するアドレスが属する仮想領域（ＴＰＶＯＬの仮想領域）に実領域が割り当てられていない場合、その仮想領域（ライト先仮想領域）にＴＰプールから実領域を割り当てる（ライト先仮想領域に他の実領域が割り当て済であっても実領域が新たにライト先仮想領域に割り当てられてもよい）。ストレージシステムは、割り当てられた実領域に、そのライト要求に付随するライト対象データを書き込んでよい。スナップショットプールは、ＰＶＯＬから退避されたデータが格納される記憶領域でよい。一つのプールが、ＴＰプールとしてもスナップショットプールとしても使用されてもよい。「プールＶＯＬ」は、プールの構成要素となるＶＯＬでよい。プールＶＯＬは、ＲＶＯＬであってもよいしＥＶＯＬであってもよい。

また、「ストレージシステム」は、複数の永続記憶デバイス（又は、複数の永続記憶デバイスを有する装置）に対するデータのＩ／Ｏを行うコントローラを備えたシステムでもよいし、一つ以上の物理的な計算機を含んだシステムでよい。後者のシステムは、例えば、一つ以上の物理的な計算機の各々が所定のソフトウェアを実行することにより、当該一つ以上の物理的な計算機がＳＤｘ（Ｓｏｆｔｗａｒｅ－Ｄｅｆｉｎｅｄａｎｙｔｈｉｎｇ）として構築されてもよい。ＳＤｘとしては、例えば、ＳＤＳ（Ｓｏｆｔｗａｒｅ－ＤｅｆｉｎｅｄＳｔｏｒａｇｅ）又はＳＤＤＣ（Ｓｏｆｔｗａｒｅ－ＤｅｆｉｎｅｄＤａｔａＣｅｎｔｅｒ）を採用することができる。

また、以下の説明では、要素の識別情報の一例としてＩＤが採用されるが、識別情報は、名前等、要素を識別可能な情報であればよい。

また、以下の説明では、同種の要素を区別しないで説明する場合には、参照符号のうちの共通符号を使用し、同種の要素を区別して説明する場合には、参照符号を使用することがある。例えば、複数のストレージコントローラを区別しない場合には、「ストレージコントローラ２２」と記載し、各ストレージコントローラを区別する場合には、「ストレージコントローラ２２－１」、「ストレージコントローラ２２－２」のように記載する。

以下、本発明の実施形態を図面に基づいて説明する。
［実施形態１］

図１は、実施形態１に係るストレージシステムの概要を示す。

ストレージシステム１１は、ＰＶＯＬ１０００ＰのスナップショットであるＳＶＯＬ１０００Ｓを作成するプロセッサ２４を有する。プロセッサ２４は、ＲｏＷ方式により、ＰＶＯＬ１０００ＰのＳＶＯＬ１０００Ｓを作成する。

ＰＶＯＬ１０００ＰとＰＶＯＬ１０００Ｐについての一つ以上のＳＶＯＬ１０００ＳとのグループであるスナップショットグループについてのＤＳＶＯＬ１０００Ｄは、スナップショットグループのいずれかのＶＯＬが格納先であるデータと、当該データのメタ情報とが格納されるデータ格納領域である。当該メタ情報は、当該データのスナップショットグループにおける位置のアドレスである参照元アドレスと、データのＤＳＶＯＬにおける位置のアドレスである参照先アドレスとのアドレスマッピングを含んだ情報である。

プロセッサ２４は、スナップショットグループのうちのいずれかのＶＯＬに対しデータを更新するためのライト要求の処理であるライト処理において、当該データのメタ情報を更新するＩ／Ｏを、当該メタ情報を格納しているＤＳＶＯＬ１０００Ｄに対し行うようになっている。

プロセッサ２４は、スナップショットグループに対するＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）負荷が閾値を超えたか否かを判定する。この判定結果が真の場合に（負荷が閾値を超えたと判定された場合に）、プロセッサ２４は、スナップショットグループについてのＤＳＶＯＬ１０００Ｄの数を増やす。これにより、スナップショットグループに対するＩ／Ｏ負荷が、増えたＤＳＶＯＬ１０００Ｄを含む複数のＤＳＶＯＬ１０００Ｄに分散することが期待され、故に、ＰＶＯＬ１０００ＤについてＳＶＯＬ１０００Ｓの数が増えてもスナップショットグループにおける各ＶＯＬ１０００の性能低下を回避することが期待できる。なお、本実施形態において、スナップショットグループについてＤＳＶＯＬ１０００Ｄの数を増やすことを、本実施形態において、「ＤＳＶＯＬ拡張」と言う。ＤＳＶＯＬ拡張の一例は、次の通りである。

データＡがＰＶＯＬ１０００Ｐに格納されているとする。ＰＶＯＬ１０００Ｐを含むスナップショットグループについてのＤＳＶＯＬ１０００ＤはＤＳＶＯＬ１０００Ｄ１のみであるとする。このため、データＡが、ＤＳＶＯＬ１０００Ｄ１に格納されていて、また、プール１００３に格納されている。データＡのメタ情報では、参照元アドレスは、ＰＶＯＬ１０００Ｐにおける位置（データＡの位置）のアドレスであり、参照先アドレスは、ＤＳＶＯＬ１０００Ｄ１における位置（データＡの位置）のアドレスである。また、ストレージシステム１１は、参照先アドレス（ＤＳＶＯＬ１０００Ｄ１における位置（データＡの位置）のアドレス）と、プール１００３における位置（データＡの位置）のアドレスとのマッピングを管理する。

この状態のＰＶＯＬ１０００ＰのスナップショットとしてＳＶＯＬ１０００Ｓが作成されたとする。そして、ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００Ｓに対するＩ／Ｏ負荷が増加し、結果として、Ｉ／Ｏ負荷が閾値を超えたとする。このため、プロセッサ２４は、スナップショットグループについてのＤＳＶＯＬ１０００Ｄを２つ増やし、結果として、スナップショットグループについてのＤＳＶＯＬ１０００ＤがＤＳＶＯＬ１０００Ｄ１～１０００Ｄ３になったとする。

プロセッサ２４は、スナップショットグループについての複数のＤＳＶＯＬ１０００Ｄに格納されているデータの量を平準化する。これにより、スナップショットグループが格納先とされている複数のデータ及びメタ情報が複数のＤＳＶＯＬ１０００Ｄに分散するため、スナップショットグループに対するＩ／Ｏ負荷が、複数のＤＳＶＯＬ１０００Ｄに分散し、以って、スナップショットグループにおける各ＶＯＬ１０００の性能低下を回避することが期待できる。

平準化は、例えば、次のように実現されてもよい。すなわち、スナップショットグループのうちのいずれかのＶＯＬ１０００に対するライト要求の処理において、プロセッサ２４は、複数のＤＳＶＯＬ１０００Ｄに格納されているデータの量が平準化されるよう、当該ライト要求に付随のデータであるライト対象データの格納先のＤＳＶＯＬ１０００Ｄを選択し、当該選択されたＤＳＶＯＬ１０００Ｄに、当該ライト対象データを格納する。これにより、ＶＯＬ１０００Ｐ又は１０００Ｓに対するライト要求の処理の都度に、データが複数のＤＳＶＯＬ１０００Ｄに分散されることが期待される。例えば、ＰＶＯＬ１０００Ｐを指定したライト要求であって新規データＢのライト要求をプロセッサ２４が処理する場合、プロセッサ２４は、新たなライト対象データＢの格納先としてＤＳＶＯＬ１０００Ｄ２を選択し、新たなライト対象データＢをＤＳＶＯＬ１０００Ｄ２に格納する。その後、例えば、ＳＶＯＬ１０００Ｓを指定したライト要求であって新規データＣのライト要求をプロセッサ２４が処理する場合、プロセッサ２４は、新たなライト対象データＣの格納先としてＤＳＶＯＬ１０００Ｄ３を選択し、新たなライト対象データＣをＤＳＶＯＬ１０００Ｄ３に格納する。結果として、データＡ、Ｂ及びＣが複数のＤＳＶＯＬ１０００Ｄ１～１０００Ｄ３に分散することになる。なお、ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００Ｓの各々について、「新規データ」とは、当該ＶＯＬ１０００について未だライト対象とされていないデータでよく、「更新後データ」とは、当該ＶＯＬ１０００について既にライト対象とされ書込み済のデータの更新後データでよい。

平準化は、例えば、上述の方法に代えて又は加えて、次のように実現されてもよい。すなわち、平準化は、ＤＳＶＯＬ１０００Ｄ間のデータの移動を含み、プロセッサ２４は、ＤＳＶＯＬ１０００Ｄ間のデータの移動を含む平準化を、スナップショットグループのうちのいずれかのＶＯＬに対するＩ／Ｏ要求（ライト要求又はリード要求）の処理と非同期に行う。これにより、Ｉ／Ｏ要求の処理性能を平準化のために低下させること無しに、平準化を実現することが期待できる。

以下、本実施形態を詳細に説明する。

図２は、ストレージシステム１１の構成を示す。

ストレージシステム１１は、一つ以上のストレージコントローラ２２と、一つ以上のストレージコントローラ２２に接続された種々のドライブ２９とを有する。

ストレージコントローラ２２は、ホスト計算機３０とネットワーク３１（例えばインターネット又はＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ））を介して通信するＦＥ＿Ｉ／Ｆ（フロントエンドインターフェースデバイス）２３、ストレージシステム間での通信を行うためのストレージＩ／Ｆ（ストレージインターフェースデバイス）２８、ストレージシステム１１全体を制御するプロセッサ２４、プロセッサ２４で使用されるプログラム及び情報を格納するメモリ２５、ドライブ２９との通信を行うＢＥ＿Ｉ／Ｆ（バックエンドインターフェースデバイス）２７、及びそれらをつなぐ内部ネットワーク２６を備える。ＦＥ＿Ｉ／Ｆ２３、ＢＥ＿Ｉ／Ｆ２７及びストレージＩ／Ｆ２８が、インターフェース装置の一例である。ドライブ２９は、不揮発性のデータ記憶媒体を有する装置であり、永続記憶デバイスの一例である。

メモリ２５は、プログラムを管理するプログラム領域２０１、データの転送及びコピーの時の一時的な保存領域であるバッファ領域２０２、種々のテーブルを格納するテーブル管理領域２０３、及び、ホスト計算機３０からのライト対象データ（ライト要求に応答して書き込まれるデータ）及びドライブ２９からのリード対象データ（リード要求に応答して読み出されたデータ）を一時的に格納するキャッシュ領域２０４を有する。

ストレージコントローラ２２は、ＶＯＬ１０００を指定したＩ／Ｏ要求をホスト計算機３０から受信し、当該Ｉ／Ｏ要求に従いデータのＩ／Ｏを行う。ホスト計算機３０は、Ｉ／Ｏ要求の送信元の一例である。Ｉ／Ｏ要求の送信元は、ホスト計算機３０以外の要素でもよく、例えば、ストレージシステム１１の中又は外で実行されるアプリケーションプログラムでもよい。

本実施形態では、ＤＳＶＯＬ１０００Ｄは、メモリ２５（例えばキャッシュ領域２０４）に基づくＶＯＬであるが、それに代えて、外部接続ＶＯＬ（ＥＶＯＬ）のような他種のＶＯＬでもよい。

図３は、メモリ領域の構成を示す。

メモリ２５上のキャッシュ領域２０４は、ライト対象データやリード対象データを一時的に格納するデータ格納領域２１３を有する。

テーブル管理領域２０３は、ＶＯＬ１０００に関する情報を保持するＶＯＬ管理テーブル２０５、スナップショットグループのＩ／Ｏ性能に関する情報を保持する性能管理テーブル２０６、スナップショットグループにおける論理アドレスとＤＳＶＯＬ１０００Ｄにおける論理アドレスとの対応関係を表す情報を保持するマッピング管理テーブル２０７、論理アドレスに対する物理アドレスを管理する論物変換テーブル２０８、ＤＳＶＯＬ１００Ｄの空きに関する情報を保持する空き検索テーブル２０９、ＤＳＶＯＬ１００Ｄの論理アドレスの割当てに関する情報を保持する割当て管理テーブル２１０、プールに関する情報を保持するプール割当て管理テーブル２１１、及び、ドライブ割当てに関する情報を保持するドライブ割当て管理テーブル２１２を格納する。

図４は、ＶＯＬ管理テーブル２０５の構成を示す。なお、以下の説明では、説明の冗長を避けるため、ＶＯＬＩＤが“ｎ”であるＶＯＬ１０００を、「ＶＯＬｎ」と言うことがある。また、スナップショットグループＩＤが“ｍ”であるスナップショットグループを「スナップショットグループｍ」と言うことがある。

ＶＯＬ管理テーブル２０５は、ＶＯＬ１０００毎にエントリを有する。エントリは、ＶＯＬＩＤ４１、ＶＯＬ属性４２、ＶＯＬ容量４３、物理アドレス範囲４４、スナップショットグループＩＤ４５、ルートＶＯＬＩＤ４６、世代＃４７、プールＩＤ４８及びＤＳＶＯＬＩＤ４９といった情報を有する。

ＶＯＬＩＤ４１は、ＶＯＬ１０００のＩＤを表す。ＶＯＬ属性４２は、ＶＯＬ１０００の属性を表す。ＶＯＬ容量４３は、ＶＯＬ１０００の容量を表す。物理アドレス範囲４４は、ＤＳＶＯＬ１０００Ｄについて有効な情報であり、当該ＤＳＶＯＬ１０００Ｄに対応の物理アドレスの範囲（プール１００３のうち当該ＤＳＶＯＬ１０００Ｄに割り当てられた領域のアドレス範囲）を表す。スナップショットグループＩＤ４５は、ＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００Ｓについて有効な情報であり、当該ＰＶＯＬ１０００Ｐ又は当該ＳＶＯＬ１０００Ｓが属するスナップショットグループのＩＤを表す。

ルートＶＯＬＩＤ４６は、ＶＯＬ１０００のルートＶＯＬのＩＤを表す。「ルートＶＯＬ」は、ＶＯＬのセットにおけるルートのＶＯＬを意味する。具体的には、ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００Ｓの各々について、ルートＶＯＬは、当該ＶＯＬ１０００を含むスナップショットグループにおけるＰＶＯＬ１０００Ｐである。ＤＳＶＯＬ１０００Ｄについて、ルートＶＯＬは、当該ＤＳＶＯＬ１０００Ｄの割当先（接続先）のスナップショットグループにおけるＰＶＯＬ１０００Ｐである。

世代＃４７は、ＶＯＬ１０００（ＤＳＶＯＬ１０００Ｄを除く）の世代の番号を表す。古い世代番号であるほどＶＯＬ１０００の世代は古い。例えば、スナップショットグループ０において、ＳＶＯＬ１の世代が最も古く、ＳＶＯＬ２の世代が２番目に古い。ＰＶＯＬ１について更にＳＶＯＬ１０００Ｓが作成されると、更に作成されたＳＶＯＬ１０００Ｓの世代＃４７は“０ｘ０００３”となり、ＰＶＯＬ１の世代＃４７は“０ｘ０００４”にインクリメントされる。

プールＩＤ４８は、ＶＯＬ１０００に割り当てられているプール１００３のＩＤを表す。図４が示す例によれば、ストレージシステム１１に二つ以上のプール１００３が存在する。プール１００３は一つでもよい。

ＤＳＶＯＬＩＤ４９は、ＶＯＬ１０００に割り当てられている一つ又は複数のＤＳＶＯＬ１０００Ｄの各々のＩＤを表す。図４が示す通り、ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００Ｓについては、ＤＳＶＯＬ１０００Ｄは、スナップショットグループに対して割り当てられる。また、図４が示す例によれば、スナップショットグループ１に割り当てられているＤＳＶＯＬ１０００ＤはＤＳＶＯＬ８のみであるが、スナップショットグループ２には複数のＤＳＶＯＬ１０００Ｄ（ＤＳＶＯＬ９，１０，・・・，ｋ）が割り当てられている。

図５は、性能管理テーブル２０６の構成を示す。

性能管理テーブル２０６は、スナップショットグループ毎にエントリを有する。エントリは、スナップショットグループＩＤ５１、ＶＯＬ別流入量５２、合計流入量５３、期待流入量５４及びＤＳＶＯＬ数５５といった情報を有する。

スナップショットグループＩＤ５１は、スナップショットグループのＩＤを表す。ＶＯＬ別流入量５２は、スナップショットグループにおけるＶＯＬ１０００別の流入量を表す。なお、「流入量」とは、Ｉ／Ｏ負荷の一例であり、単位時間当たりに書き込まれるデータの量である。Ｉ／Ｏ負荷として、流入量に代えて又は加えて、他種のＩ／Ｏ負荷、例えば、流出量（単位時間当たりに読み出されるデータの量）、ライト頻度（単位時間当たりのライト要求の数）、及び、リード頻度（単位時間当たりのリード要求の数）のうち、少なくともライト頻度が採用されてもよい。

合計流入量５３は、スナップショットグループにおける全ＶＯＬ１０００の流入量の合計を表す。

期待流入量５４は、Ｉ／Ｏ負荷閾値の一例であり、合計流入量５３の閾値である。ＤＳＶＯＬ数５５は、スナップショットグループに割り当てられているＤＳＶＯＬ１０００Ｄの数を表す。ＤＳＶＯＬ数５５に基づいて期待流入量５４が定まり、例えば、期待流入量５４は、ＤＳＶＯＬ１０００Ｄの性能（流入量）とＤＳＶＯＬ数５５との積と同じかそれよりも低い値である。

図６は、マッピング管理テーブル２０７の構成を示す。

マッピング管理テーブル２０７は、アドレスマッピング毎にエントリを有する。アドレスマッピングは、スナップショットグループにおける位置の論理アドレスと、ＤＳＶＯＬ１０００Ｄにおける位置の論理アドレスとのマッピングである。エントリは、参照元ＶＯＬＩＤ６１、参照元アドレス６２、参照先ＶＯＬＩＤ６３、参照先アドレス６４及び世代＃６５といった情報を有する。ＤＳＶＯＬ１０００Ｄに格納されるデータのメタ情報が、当該データのアドレスマッピングを表す情報（マッピング管理テーブル２０７におけるエントリが有する情報）を含む。

参照元ＶＯＬＩＤ６１は、スナップショットグループにおける位置を有するＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００ＳのＩＤを表す。参照元アドレス６２は、参照元ＶＯＬＩＤ６１から同定されるＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００Ｓにおける位置の論理アドレスを表す。参照元ＶＯＬＩＤ６１と参照元アドレス６２とのセットが、スナップショットグループにおける位置の論理アドレスを表す。

参照先ＶＯＬＩＤ６３は、ＤＳＶＯＬ１０００ＤのＩＤを表す。参照先アドレス６４は、参照先ＶＯＬＩＤ６３から同定されるＤＳＶＯＬ１０００Ｄにおける位置の論理アドレスを表す。参照先ＶＯＬＩＤ６３と参照先アドレス６４とのセットが、ＤＳＶＯＬ１０００Ｄにおける位置の論理アドレスを表す。

世代＃６５は、参照元ＶＯＬＩＤ６１から同定されるＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００Ｓの世代の番号を表す。世代＃６５は、当該ＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００Ｓに対応の世代＃４７と同じ情報である。

図７は、論物変換テーブル２０８の構成を示す。

論物変換テーブル２０８は、ＤＳＶＯＬ１０００Ｄに格納されたデータ毎にエントリを有する。エントリは、ＶＯＬＩＤ７１、論理アドレス７２、プールＩＤ７３及び物理アドレス７４といった情報を有する。

ＶＯＬＩＤ７１は、データが格納されているＤＳＶＯＬ１０００ＤのＩＤを表す。論理アドレス７２は、ＤＳＶＯＬ１０００Ｄにおけるデータの位置の論理アドレスを表す。プールＩＤ７３は、データが格納されているプール１００３のＩＤを表す。物理アドレス７４は、プール１００３におけるデータの位置の物理アドレスを表す。

図８は、空き検索テーブル２０９の構成を示す。

空き検索テーブル２０９は、ＤＳＶＯＬ１０００Ｄ毎にエントリを有する。エントリは、ＶＯＬＩＤ８１、空き容量８２及び空き検索ポインタ８３といった情報を有する。

ＶＯＬＩＤ８１は、ＤＳＶＯＬ１０００ＤのＩＤを表す。空き容量８２は、ＤＳＶＯＬ１０００Ｄにおける空き容量を表す。空き検索ポインタ８３は、空き容量に該当する領域の先頭の論理アドレスを表す。

本実施形態では、空き検索ポインタ８３は、最初、ＤＳＶＯＬ１０００Ｄのデータ領域（例えば、メタ情報が格納される領域であるメタ領域以外の領域）の先頭を指しており、領域が確保され当該領域にデータが格納される都度に、更新される。また、ＤＳＶＯＬ１０００Ｄに、データの更新後データが格納された場合、更新前のデータは不要なデータとなる。ＤＳＶＯＬ１０００Ｄのガベージコレクションにより、不要なデータが削除されて空き領域が生まれ、空き領域に最新のデータ（新規データや更新後データ）が移り、当該データのメタ情報（マッピング管理テーブル２０７におけるエントリ）が更新されてよい。つまり、結果として、ＤＳＶＯＬ１０００Ｄにおいて空き容量が増え、且つ、当該空き容量を持つ領域は連続した空き領域となってよい。

図９は、割当て管理テーブル２１０の構成を示す。

割当て管理テーブル２１０は、ＤＳＶＯＬ１０００Ｄにおける領域毎にエントリを有する。エントリは、ＶＯＬＩＤ９１、論理アドレス９２及び割当て有無９３といった情報を有する。

ＶＯＬＩＤ９１は、ＤＳＶＯＬ１０００ＤのＩＤを表す。論理アドレス９２は、ＤＳＶＯＬ１０００Ｄにおける領域の論理アドレスを表す。割当て有無９３は、領域が割当て済か否かを表す。“割当て無し”に対応の領域が、空き領域である。

図１０は、プール割当て管理テーブル２１１の構成を示す。

プール割当て管理テーブル２１１は、プール１００３毎にエントリを有する。エントリは、プールＩＤ１０１、プール容量１０２、プール空き容量１０３及びＲＡＩＤグループＩＤ１０４といった情報を有する。

プールＩＤ１０１は、プール１００３のＩＤを表す。プール容量１０２は、プール１００３の容量を表す。プール空き容量１０３は、プール１００３の容量のうちの空き容量を表す。空き容量の少なくとも一部の容量が、ＤＳＶＯＬ１０００Ｄの容量として割当て可能である。ＲＡＩＤグループＩＤ１０４は、プール１００３の基になっている一つ以上のＲＡＩＤグループの各々のＩＤを表す。

図１１は、ドライブ割当て管理テーブル２１２の構成を示す。

ドライブ割当て管理テーブル２１２は、ＲＡＩＤグループ毎にエントリを有する。エントリは、ＲＡＩＤグループＩＤ１１１、ＲＡＩＤレベル１１２、ドライブＩＤ１１３、ドライブ種別１１４、容量１１５及び使用容量１１６といった情報を有する。

ＲＡＩＤグループＩＤ１１１は、ＲＡＩＤグループのＩＤを表す。ＲＡＩＤレベル１１２は、ＲＡＩＤグループのＲＡＩＤレベルを表す。ドライブＩＤ１１３は、ＲＡＩＤグループを構成する一つ以上のドライブの各々のＩＤを表す。ドライブ種別１１４は、ＲＡＩＤグループを構成するドライブの種別（例えばＨＤＤかＳＳＤか）を表す。容量１１５は、ＲＡＩＤグループの容量を表す。使用容量１１６は、ＲＡＩＤグループの容量のうちの使用されている容量を表す。

図１２は、記憶階層の一例を示す。

ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００Ｓがホスト計算機３０に提供される。ホスト計算機３０からのライト要求では、ＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００Ｓが指定され得る。ライト要求に付随するライト対象データが、ＤＳＶＯＬ１０００Ｄに格納され、プール１００３に格納される。

図８の例では、プール１００３は、ＲＡＩＤグループ１００４のアドレス空間１００５が割り当てられた論理的な記憶空間である。プール１００３からアドレス空間１００５への割当ては、ドライブ割当管理テーブル２１２を基に管理される。ＲＡＩＤグループ１００４のＲＡＩＤレベルは、ＲＡＩＤ５（３Ｄ＋１Ｐ）である。ＰＶＯＬ１０００Ｐが書込み先とされたデータＡ及びＢと、ＳＶＯＬ１０００Ｓが書込み先とされたデータＣが、異なる三つのドライブに書き込まれ、データＡ～Ｃに基づくパリティＰが、データＡ～Ｃの書込み先の三つのドライブとは別のドライブに書き込まれる。

ＤＳＶＯＬ１０００Ｄには、データ（例えばデータＡ）に代えて又は加えて当該データの圧縮後のデータが格納されてもよい。また、複数のＤＳＶＯＬ１０００Ｄに格納されたデータの重複排除がされてもよく、プール１００３に格納されたデータのアドレスに、複数のＤＳＶＯＬ１０００Ｄにおける複数の位置のアドレスがマッピングされてもよい。

以下、本実施形態で行われる処理の例を説明する。なお、以下に説明する処理は、プロセッサ２４がプログラム領域２０１に格納されているコンピュータプログラムを実行することにより行われる。また、以下の説明では、ＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００Ｓにおける位置（領域）のアドレスを「ＶＯＬアドレス」と言い、ＤＳＶＯＬ１０００Ｄにおける位置（領域）のアドレスを「ＤＳＶＯＬアドレス」と言う。

図１３は、リード処理の流れを示す。

リード処理は、ホスト計算機３０からネットワーク３１を介してストレージシステム１１がリード要求を受けた場合に開始する。リード要求では、例えば、ＶＯＬＩＤ（ＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００ＳのＩＤ）、ＶＯＬアドレス（論理アドレス）、及びデータサイズが指定される。

プロセッサ２４は、リード要求で指定されているＶＯＬアドレスの排他を確保する（Ｓ１３０１）。なお、当該ＶＯＬアドレスの排他が別のＩ／Ｏ要求のために既に確保されている場合、プロセッサ２４は、一定の時間待ってから、Ｓ１３０１を行ってよい。また、当該排他の確保は、当該指定されたＶＯＬアドレスを参照元アドレスとして含んだアドレスマッピングを表すメタ情報の排他を確保することを含んでもよい。

プロセッサ２４は、排他が確保されたＶＯＬアドレスについてリード対象データがキャッシュ領域２０４に存在するか否かを判定する（Ｓ１３０２）。Ｓ１３０２の判定結果が真の場合（Ｓ１３０２：Ｙｅｓ）、処理がＳ１３０７に進む。

Ｓ１３０２の判定結果が偽の場合（Ｓ１３０２：Ｎｏ）、プロセッサ２４は、マッピング管理テーブル２０７を参照し（Ｓ１３０３）、指定されたＶＯＬアドレスに対応の参照先ＶＯＬＩＤ６３及び参照先アドレス６４を特定し、参照先ＶＯＬＩＤ６３及び参照先アドレス６４（つまりＤＳＶＯＬアドレス）の排他を確保する（Ｓ１３０４）。当該排他の確保は、当該指定されたＶＯＬアドレスを参照元アドレスとして含んだアドレスマッピングを表すメタ情報の排他を確保することを含んでもよい。プロセッサ２４は、排他が確保されたＤＳＶＯＬアドレスについてリード対象データがキャッシュ領域２０４に存在するか否かを判定する（Ｓ１３０５）。Ｓ１３０５の判定結果が真の場合（Ｓ１３０５：Ｙｅｓ）、処理がＳ１３０７に進む。

Ｓ１３０５の判定結果が偽の場合（Ｓ１３０５：Ｎｏ）、プロセッサ２４は、論物変換テーブル２０８を参照する（Ｓ１３０６）。

Ｓ１３０２：Ｙｅｓ、Ｓ１３０５：Ｙｅｓ、又は、Ｓ１３０６の後、プロセッサ２４は、リード対象データを読み出し、当該リード対象データをホスト計算機３０に転送する（Ｓ１３０７）。Ｓ１３０２：Ｙｅｓ又はＳ１３０５：Ｙｅｓの後のＳ１３０７では、リード対象データは、キャッシュ領域２０４から読み出される。Ｓ１３０６の後のＳ１３０７では、リード対象データは、排他が確保されたＤＳＶＯＬアドレスに対応の物理アドレスの領域（プール１００３における領域）から読み出される。

Ｓ１３０７の後、プロセッサ２４は、ＶＯＬアドレスの排他（Ｓ１３０１で確保された排他）を解除する（Ｓ１３０８）。Ｓ１３０８が、Ｓ１３０４経由の処理の場合、解除対象の排他は、ＶＯＬアドレスの排他に加えてＤＳＶＯＬアドレスの排他（Ｓ１３０４で確保された排他）である。

図１４は、ライト処理の流れを示す。

ライト処理は、ホスト計算機３０からストレージシステム１１がライト要求を受信した場合に開始する。ライト要求では、例えば、ＶＯＬＩＤ（ＰＶＯＬ１０００Ｐ又はＳＶＯＬ１０００ＳのＩＤ）、ＶＯＬアドレス（論理アドレス）、及びデータサイズが指定される。

プロセッサ２４は、ライト要求で指定されているＶＯＬアドレスの排他を確保する（Ｓ１４０１）。なお、当該ＶＯＬアドレスの排他が別のＩ／Ｏ要求のために既に確保されている場合、プロセッサ２４は、一定の時間待ってから、Ｓ１４０１を行ってよい。また、当該排他の確保は、当該指定されたＶＯＬアドレスを参照元アドレスとして含んだアドレスマッピングを表すメタ情報の排他を確保することを含んでもよい。

プロセッサ２４は、ＶＯＬアドレスの排他を確保した場合、ホスト計算機３０に対してライト処理の準備ができたことを示す「Ｒｅａｄｙ」を応答する（Ｓ１４０２）。プロセッサ２４は、「Ｒｅａｄｙ」を受け取ったホスト計算機３０から、ライト対象データを受け、ライト対象データをキャッシュ領域２０４に転送（格納）する（Ｓ１４０３）。その後、プロセッサ２４は、ＶＯＬアドレスの排他（Ｓ１４０１で確保された排他）を解除する（Ｓ１４０４）。

プロセッサ２４は、デステージが必要か否かを判定する（Ｓ１４０５）。ここで言う「デステージ」は、スナップショットグループ（ＰＶＯＬ１０００Ｐ及び／又はＳＶＯＬ１０００Ｓ）からＤＳＶＯＬ１０００Ｄへのキャッシュ領域２０４上のデータ格納先の遷移を意味する。なお、「デステージ」は、ＤＳＶＯＬ１０００Ｄについてのダーティデータ（ドライブ２９に格納されていないデータ）をキャッシュ領域２０４からドライブ２９に格納することを含んでもよい。また、キャッシュ領域２０４におけるダーティデータのうちドライブ２９への格納対象は、一定時間Ｉ／Ｏ対象とされていないデータが優先されてよい。

Ｓ１４０５の判定結果が真の場合（Ｓ１４０５：Ｙｅｓ）、プロセッサ２４は、デステージ処理を行う（Ｓ１４０６）。Ｓ１４０５の判定結果が偽の場合（Ｓ１４０５：Ｎｏ）、プロセッサ２４は、非同期デステージ処理要求（Ｉ／Ｏ処理（ライト処理及びリード処理）と非同期にデステージ処理を行うことの要求）を発行する（Ｓ１４０７）。

Ｓ１４０６又はＳ１４０７の後、プロセッサ２４は、ホスト計算機３０に対してライト完了を応答する（Ｓ１４０８）。

Ｓ１４０５の詳細の一例に関する説明は、次の通りである。すなわち、Ｓ１４０５では、下記（ｘ）及び（ｙ）のうちの少なくとも一つの判定結果が真であることが、デステージが必要か否かの判定の結果が真になることでよい。
（ｘ）キャッシュ領域２０４上のダーティデータのデータ量が所定のデータ量以上か否かの判定。
（ｙ）キャッシュヒット率が所定のキャッシュヒット率未満であり、且つ、プロセッサ稼働率が所定のプロセッサ稼働率以上か否かの判定。

（ｘ）の判定結果が真であることがデステージ要との判定である場合、キャッシュ領域２０４に新たに格納可能なダーティデータの量が増え、以って、Ｉ／Ｏ性能の向上が期待できる。なお、「キャッシュ領域２０４上のダーティデータのデータ量」は、例えば、キャッシュ領域２０４上のダーティデータのうち、ライト要求で指定されたＶＯＬ１０００を含むスナップショットグループのダーティデータのデータ量でもよい。

（ｙ）の判定結果が真であることがデステージ要との判定である場合、キャッシュヒット率とプロセッサ稼働率の少なくとも一方の改善が期待される。

図１５は、デステージ処理の流れを示す。

デステージ処理は、図１４に示したライト処理のＳ１４０６で行われるか、或いは、Ｓ１４０７で発行された非同期デステージ処理要求に応答して行われる。

プロセッサ２４は、ＶＯＬアドレスの排他を確保する（Ｓ１５０１）。ここで確保されるＶＯＬアドレスは、一つ以上のスナップショットグループにおける各ＶＯＬ１０００のＶＯＬアドレスのうちＤＳＶＯＬ１０００Ｄに未格納の一つ以上のデータに対応の一つ以上のＶＯＬアドレスである。以下、説明の簡単のために、一つのスナップショットグループを例に取る。

プロセッサ２４は、性能管理テーブル２０６を参照し（Ｓ１５０２）、排他が確保されたＶＯＬアドレスとそのＶＯＬアドレスに対応のデータとに基づき、スナップショットグループのＶＯＬ別流入量５２及び合計流入量５３を更新する（Ｓ１５０３）。

プロセッサ２４は、ＤＳＶＯＬ拡張が必要か否かを判定する（Ｓ１５０４）。Ｓ１５０４の判定結果が真の場合（Ｓ１５０４：Ｙｅｓ）、プロセッサ２４は、ＤＳＶＯＬ拡張処理要求（ＤＳＶＯＬの拡張処理を行うことの要求）を発行する（Ｓ１５０５）。

Ｓ１５０４の判定結果が偽の場合（Ｓ１５０４：Ｎｏ）、又は、Ｓ１５０５の後、プロセッサ２４は、マッピング管理テーブル２０７を参照する（Ｓ１５０６）。

Ｓ１５０１で排他が確保されたＶＯＬアドレスに対応のデータが新規データの場合（Ｓ１５０７：Ｙｅｓ）、プロセッサ２４は、新規格納領域割当てを行う（Ｓ１５０９）。Ｓ１５０９では、例えば、プロセッサ２４は、スナップショットグループに対応のＤＳＶＯＬ１０００ＤをＶＯＬ管理テーブル２０５から選択し、選択されたＤＳＶＯＬ１０００Ｄの空き領域を空き検索テーブル２０９から特定し、特定された空き領域を当該ＶＯＬアドレスに割り当て、当該ＤＳＶＯＬ１０００Ｄの空き容量８２及び空き検索ポインタ８３を更新する。

Ｓ１５０１で排他が確保されたＶＯＬアドレスに対応のデータが更新後データの場合（Ｓ１５０７：Ｎｏ）、プロセッサ２４は、分散割当てが必要か否かを判定する（Ｓ１５０８）。Ｓ１５０８の判定結果が真の場合（Ｓ１５０８：Ｙｅｓ）、プロセッサ２４は、Ｓ１５０９を行う。このＳ１５０９では、更新前データが格納されているＤＳＶＯＬ１０００Ｄとは別のＤＳＶＯＬ１０００Ｄから、更新後データの格納先となる空き領域が特定される。

Ｓ１５０８の判定結果が偽の場合（Ｓ１５０８：Ｎｏ）、又は、Ｓ１５０９の後、プロセッサ２４は、ＤＳＶＯＬアドレスの排他を確保する（Ｓ１５１０）。Ｓ１５１０で排他が確保されるＤＳＶＯＬアドレスは、下記のうちのいずれかである。
・Ｓ１５０９で特定された空き領域のＤＳＶＯＬアドレス。
・更新前データのＤＳＶＯＬアドレスが属するＤＳＶＯＬ１０００Ｄについて空き検索テーブル２０９に基づき特定された空き領域のＤＳＶＯＬアドレス。

プロセッサ２４は、Ｓ１５１０の後、キャッシュ転送を行う（Ｓ１５１１）。Ｓ１５１１では、プロセッサ２４は、Ｓ１５０１で排他が確保されたＶＯＬアドレスのデータ（キャッシュ領域２０４におけるデータ）を、Ｓ１５１０で排他が確保されたＤＳＶＯＬアドレスの領域に転送する。つまり、スナップショットグループにおけるＶＯＬ１０００からＤＳＶＯＬ１０００Ｄへのデステージが行われる。なお、Ｓ１５１１では、プロセッサ２４が、ＤＳＶＯＬ１０００Ｄに転送されたデータをドライブ２９（プール１００３）に格納し、結果として、当該データが、ダーティデータからクリーンデータ（ドライブ２９に格納済のデータ）とされてよい。

また、プロセッサ２４は、Ｓ１５１１の後、マッピング情報更新を行う（Ｓ１５１２）。Ｓ１５１２では、プロセッサ２４は、Ｓ１５０１で排他が確保されたＶＯＬアドレスに対応の参照先ＶＯＬＩＤ６３及び参照先アドレス６４を、Ｓ１５１０で排他が確保されたＤＳＶＯＬアドレスを有するＤＳＶＯＬ１０００ＤのＩＤと、当該ＤＳＶＯＬアドレスとを表す情報に更新する。また、Ｓ１５１２では、プロセッサ２４は、Ｓ１５０１で排他が確保されたＶＯＬアドレスを参照元アドレスとして含んだアドレスマッピングを表すメタ情報（ＤＳＶＯＬ１０００Ｄにおけるメタ情報）を、当該参照元アドレスの参照先アドレスが、Ｓ１５１０で排他が確保されたＤＳＶＯＬアドレスとなるよう更新してよい。

Ｓ１５１１及びＳ１５１２の後、プロセッサ２４は、ＶＯＬアドレスの排他（Ｓ１５０１で確保された排他）と、ＤＳＶＯＬアドレスの排他（Ｓ１５１０で確保された排他）とを解除する（Ｓ１５１３）。また、プロセッサ２４は、Ｓ１５０７：Ｎｏ経由の場合、ＤＳＶＯＬ１０００Ｄにおける旧格納領域（更新前データの格納領域）を解放する（Ｓ１５１４）。解放された旧格納領域分の容量は、直ちに空き容量とされてもよいし、ガベージコレクションを経て空き容量とされてもよい。

Ｓ１５０４の詳細の一例に関する説明は、例えば次の通りである。すなわち、スナップショットグループに割り当てられているＤＳＶＯＬ１０００ＤのＩ／Ｏ性能（例えばデータ格納速度）は、当該スナップショットグループ内の全ＶＯＬに分けられる。そのため、スナップショットグループの合計流入量５３が当該スナップショットグループの期待流入量５４よりも多い場合、プロセッサ２４は、Ｓ１５０４において、ＤＳＶＯＬ拡張が必要と判定する。

なお、スナップショットグループについて、期待流入量５４は、当該スナップショットグループに割り当てられている全ＤＳＶＯＬ１０００ＤのＩ／Ｏ性能の合計（例えば、ＤＳＶＯＬ１０００Ｄ単体のＩ／Ｏ性能（例えば期待流入量）と、ＤＳＶＯＬ１０００Ｄの数との積）でもよいし、当該合計より小さい値でもよい。このため、適切なＤＳＶＯＬ拡張要否判定が期待される。また、スナップショットグループについて、期待流入量は、当該スナップショットグループに割り当てられたＤＳＶＯＬ毎に用意されていて、ＤＳＶＯＬ拡張の要否判定は、各ＤＳＶＯＬについて、当該ＤＳＶＯＬの流入量が当該ＤＳＶＯＬの期待流入量を超えているか否かの第１の判定でもよい。当該判定に代えて又は加えて、ＤＳＶＯＬ拡張の要否判定は、スナップショットグループに割り当てられている全ＤＳＶＯＬのうちのＮ以上のＤＳＶＯＬの各々について（Ｎは自然数）、当該ＤＳＶＯＬの流入量（Ｉ／Ｏ負荷の一例）が当該ＤＳＶＯＬの期待流入量（期待されるＩ／Ｏ性能の一例）を超えているか否かの第２の判定でもよい。第１の判定と第２の判定のいずれか又は両方の判定の結果が真の場合、ＤＳＶＯＬ拡張が必要との判定がされてよい。このような判定の結果としてＤＳＶＯＬ拡張がされるので、無駄にＤＳＶＯＬを増やすことと、ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００ＳのＩ／Ｏ性能低下を回避することとの両立が期待される。

また、スナップショットグループ内でＤＳＶＯＬのＩ／Ｏ性能が分けられるため、特定のＶＯＬに多くのＩ／Ｏが発生する（Ｉ／Ｏの偏りが発生する）と、当該ＶＯＬのＩ／Ｏ性能が低下する。そこで、Ｉ／ＯのＱｏＳ管理によって特定のＶＯＬにＩ／Ｏが偏ることを避けることで、ＶＯＬ間のＩ／Ｏ性能を均質化することが期待される。

また、ＤＳＶＯＬ拡張の要否判定は、スナップショットグループに割り当てられているＤＳＶＯＬ１０００Ｄの空き容量が、ＤＳＶＯＬ１０００の容量の所定割合未満であるか否かの判定を含んでもよい。この判定の結果が真の場合に、ＤＳＶＯＬ拡張の必要があると判定されてよい。

Ｓ１５０８の詳細の一例に関する説明は、例えば次の通りである。すなわち、複数のＤＳＶＯＬが割当てられたスナップショットグループについて、特定のＤＳＶＯＬ１０００Ｄにデータが偏っている場合、当該特定のＤＳＶＯＬ１０００Ｄに更新ライト（更新後データの書込み）が集中して性能ネックが生じ得る。そこで、本実施形態では、割り当てられた複数のＤＳＶＯＬに均等にデータが分散配置されるよう、プロセッサ２４は、スナップショットグループに割り当てられた各ＤＳＶＯＬ１０００Ｄに格納されたデータ量（別の言い方をすれば、当該ＤＳＶＯＬ１０００Ｄについて割当て有無９３が“割当て済み”となっている論理アドレスの領域の総記憶容量である割当て量）を、当該スナップショットグループに割り当てられた他のＤＳＶＯＬ１０００Ｄに格納されたデータ量と比較する。プロセッサ２４は、ライト対象データ（新規データや更新後データ）（及びそのメタ情報）を、データ量の最も少ないＤＳＶＯＬ１０００Ｄに格納する。このような平準化は、例えば、スナップショットグループに割り当てられているＸ（Ｘは２以上の整数）のＤＳＶＯＬ１０００Ｄに格納されているデータの量がＹの場合、各ＤＳＶＯＬ１０００Ｄに格納されるデータの量がＹ／Ｘとなるようにされる。すなわち、平準化では、例えば、スナップショットグループに割り当てられているＤＳＶＯＬ１０００Ｄの数と、スナップショットグループに割り当てられている全ＤＳＶＯＬ１０００Ｄに格納されている有効なデータ（新規データ及び更新後データ）の総量とに基づき、各ＤＳＶＯＬ１０００Ｄに格納されるデータの量が決定される。

なお、分散割当ての要否の判定結果が繰り返し切り替わってしまうことを避けるため、各ＤＳＶＯＬ１０００Ｄに格納されるデータの量には、一定のマージンが設けられてよい。一例として、次の平準化が採用されてよい。すなわち、スナップショットグループに割り当てられているＤＳＶＯＬ１０００Ｄの数が４であり、偏りの許容条件が±２％であり、新規ライト（新規データの書込み）無しに７３ＧＢのアドレス範囲が更新された場合、下記が採用されてよい。
分散前：１００ＧＢ，０ＧＢ，０ＧＢ，０ＧＢ合計１００ＧＢ
分散後：２７ＧＢ，２５ＧＢ，２４ＧＢ，２４ＧＢ合計１００ＧＢ

Ｉ／Ｏ要求の処理（例えばライト要求の処理）とは非同期の処理によってデータの再配置（平準化）が行われてよい。例えば、プロセッサ２４は、ＤＳＶＯＬ１０００Ｄ内のアドレス順（昇順）に決まったデータ量のデータをＤＳＶＯＬ１０００Ｄ間で移動することを周期的に行ってもよいし、ストレージシステム１１の稼働率が低い時間帯に平準化のためのＤＳＶＯＬ１０００Ｄ間のデータ移動を行ってもよい。

図１６は、ＤＳＶＯＬ拡張処理の流れを示す。

ＤＳＶＯＬ拡張処理は、Ｓ１５０５で発行されたＤＳＶＯＬ拡張処理要求に応答して行われる。

プロセッサ２４は、性能管理テーブル２０６を参照し（Ｓ１６０１）、スナップショットグループに対応のＤＳＶＯＬ数５５が目標数未満か否かを判定する（Ｓ１６０２）。Ｓ１６０２の判定結果が真の場合（Ｓ１６０２：Ｙｅｓ）、プロセッサ２４は、当該スナップショットグループについてＤＳＶＯＬ１０００Ｄを新たに作成する（Ｓ１６０３）。つまり、ＤＳＶＯＬ１０００Ｄが増える。新たに作成されるＤＳＶＯＬ１０００Ｄの数は、元のＤＳＶＯＬ数と目標数との差分以上の数である。例えば、元のＤＳＶＯＬ数が１で、目標数が３の場合、新たに二つかそれよりも多くのＤＳＶＯＬ１０００Ｄが作成される。

Ｓ１６０２の判定結果が偽の場合（Ｓ１６０２：Ｎｏ）、プロセッサ２４は、性能管理テーブル２０６（例えば、期待流入量５４及びＤＳＶＯＬ数５５）を更新する（Ｓ１６０４）。また、プロセッサ２４は、ＶＯＬ管理テーブル２０５（例えば、スナップショットグループにおける各ＶＯＬのＤＳＶＯＬＩＤ４９）を更新する（Ｓ１６０５）。

Ｓ１６０２の詳細に関する一例は、次の通りである。すなわち、「目標数」は、図１５のＳ１５０４の判定において拡張不要になるＤＳＶＯＬ数を意味する。例えば、ＤＳＶＯＬ数をＫ（Ｋは２以上の整数）にすることで合計流入量５３が期待流入量５４以下となるならば（言い換えれば、ＤＳＶＯＬ数がＫ未満であると合計流入量５３が期待流入量５４を超えたままならば）、Ｋが、目標数である。プロセッサ２４は、Ｓ１６０３において、ＤＳＶＯＬ数５５と目標数との差分に基づき、新たに増やすＤＳＶＯＬ１０００Ｄの数を決定し、決定された数分のＤＳＶＯＬ１０００Ｄを作成する。これにより、適切な数のＤＳＶＯＬ１０００Ｄを増やすことができる。

なお、図５に例示の１番目のエントリによれば、合計流入量５３“２１０ＭＢ／ｓ”に対し、ＤＳＶＯＬ数５５“１”に従う期待流入量５４は“１５０ＭＢ／ｓ”であるので、Ｓ１５０４で拡張不要になるＤＳＶＯＬ数は２（流入量２１０ＭＢ／ｓに対し期待流入量３００ＭＢ／ｓ）である。このため、新たに一つのＤＳＶＯＬ１０００Ｄが作成される。このＤＳＶＯＬ１０００Ｄには未だデータが格納されていない。故に、分散割当て（平準化）のために、Ｓ１５０９（新たに割り当てられる領域のソースとなるＤＳＶＯＬ）が、新たに作成された一つのＤＳＶＯＬに集中してしまう。一つのＤＳＶＯＬ１０００Ｄの期待流入量は１５０ＭＢ／ｓであるため、２１０ＭＢ／ｓものライトを一つのＤＳＶＯＬ１０００Ｄで受けきることはできない。それを避ける方法として、新たに作成された一つのＤＳＶＯＬ１０００Ｄを含む二つのＤＳＶＯＬ１０００Ｄに均等にデータを格納する方法が考えられる。しかし、それでは、ＤＳＶＯＬ１０００Ｄ間でデータが均等にならない。

そこで、新たに作成されるＤＳＶＯＬの数は、現在のＤＳＶＯＬ数と目標数Ｋとの差分より多い数とされる。例えば、新たに作成されるＤＳＶＯＬの数は、現在のＤＳＶＯＬ数と目標数Ｋとの差分と、現在のＤＳＶＯＬ数とに基づき決定されてよい。具体的には、例えば、Ｐ（新たに作成されるＤＳＶＯＬの数）は、Ｃ（現在のＤＳＶＯＬ数）とＫ（目標数）との差分ＤのＬ倍（Ｌの値は１以上の値）であり、Ｌの値が、Ｃに基づき決定されてよい。例えば、Ｃ＝１、Ｋ＝２、Ｄ＝１の場合、Ｌ＝４とされ、故に、Ｐ＝Ｄ＊Ｌ＝１＊４＝４とされてよい。また、例えば、Ｃ＝４、Ｋ＝６、Ｄ＝２の場合、Ｌ＝４（又は８）とされ、故に、Ｐ＝Ｄ＊Ｌ＝２＊４（又は８）＝８（又は１６）とされてよい。増やされるＤＳＶＯＬの数は、スナップショットグループについてのいずれのＤＳＶＯＬ１０００Ｄについても流入量が当該ＤＳＶＯＬの期待流入量以下とすることを維持することが期待される数である。

また、プロセッサ２４は、Ｓ１５０８に関し、一部のデータの格納先を、拡張前（既存）のＤＳＶＯＬ１０００Ｄとしてもよい。つまり、プロセッサ２４は、割り当てられる領域（論理アドレス）のソースの一部（例えばｘ％）を、拡張前のＤＳＶＯＬ１０００Ｄとし、割り当てられる領域（論理アドレス）のソースの残り（例えば（１００－ｘ）％）を、新たに作成されたＤＳＶＯＬ１０００Ｄとしてもよい。つまり、スナップショットグループについてＤＳＶＯＬ１０００Ｄの数を増やした後、プロセッサ２４は、拡張前のＤＳＶＯＬ１０００Ｄ（ＤＳＶＯＬ１０００Ｄの数を増やす前に存在するＤＳＶＯＬ１０００Ｄ）を格納先とするデータの量と、拡張されたＤＳＶＯＬ１０００Ｄ（新たに増えたＤＳＶＯＬ１０００Ｄ）を格納先とするデータの量を制御してよい（この制御は、一つのＤＳＶＯＬに対する流入量が当該一つのＤＳＶＯＬの期待流入量以下に維持するための制御でよい）。これにより、ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００ＳのＩ／Ｏ性能の低下を回避することと、ＤＳＶＯＬ１０００Ｄに基づく資源を節約することとの両立が期待できる。なお、このように、拡張前のＤＳＶＯＬ１０００Ｄと拡張された（新たに作成された）ＤＳＶＯＬ１０００Ｄとで割当て量（割り当てられる領域の容量）がプロセッサ２４により配分されることは、ＤＳＶＯＬ１０００Ｄに基づく資源の制約（例えばメモリ２５の容量）又はその他の理由によりスナップショットグループについてのＤＳＶＯＬ数に上限があるケースについて行われてもよい。これにより、限られた資源の中で、ＰＶＯＬ１０００Ｐ及びＳＶＯＬ１０００ＳのＩ／Ｏ性能の低下を回避することが期待できる。

以上、一実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。

例えば、複数のストレージコントローラ２２は、複数のストレージノード（例えば複数の汎用計算機）で構成されたストレージシステムにおける複数のストレージノードであってもよい。

また、図１７に示すように、複数のＤＳＶＯＬ１０００Ｄの各々について、当該ＤＳＶＯＬ１０００Ｄのオーナ権（Ｉ／Ｏ権）が、複数のストレージコントローラ２２のいずれかに割り当てられてよい。各ストレージコントローラ２２は、当該ストレージコントローラ２２がＩ／Ｏ権を有するＤＳＶＯＬ１０００Ｄに対してＩ／Ｏを行うことができるが、当該ストレージコントローラ２２がＩ／Ｏ権を有しないＤＳＶＯＬ１０００Ｄに対してＩ／Ｏを行うことができないでよい。つまり、複数のＤＳＶＯＬ１０００ＤのＩ／Ｏ権が複数のストレージコントローラ２２に分散しており、故に、ストレージコントローラ２２の負荷分散が期待される。例えば、ＤＳＶＯＬ１０００Ｄ２に格納するＩ／Ｏ権を有しているストレージコントローラ２２はストレージコントローラ２２－２であるため、ストレージコントローラ２２－１は、データＢをストレージコントローラ２２－２に転送し、ストレージコントローラ２２－２が、データＢをＤＳＶＯＬ１０００Ｄ２に格納する。いずれのＤＳＶＯＬのＩ／Ｏ権をいずれのストレージコントローラ２２が有しているかを表す情報は、例えばＶＯＬ管理テーブル２０５に格納されていてよく、各ストレージコントローラ２２が保持していてよい。なお、ＤＳＶＯＬ１０００ＤのＩ／Ｏ権は、当該ＤＳＶＯＬ１０００Ｄが新たに作成された際に、複数のＤＳＶＯＬ１０００ＤのＩ／Ｏ権が複数のストレージコントローラ２２で均等になるよう、いずれかのストレージコントローラ２２に決定されてよい。

１１：ストレージシステム

Claims

ＰＶＯＬ（ＰｒｉｍａｒｙＶｏｌｕｍｅ）のスナップショットであるＳＶＯＬ（ＳｅｃｏｎｄａｒｙＶｏｌｕｍｅ）を作成するプロセッサを有するストレージシステムであって、
前記ＰＶＯＬと当該ＰＶＯＬについての一つ以上のＳＶＯＬとのグループであるスナップショットグループについてのＤＳＶＯＬ（ＤａｔａＳｔｏｒｅＶｏｌｕｍｅ）は、前記スナップショットグループのいずれかのＶＯＬ（Ｖｏｌｕｍｅ）が格納先であるデータと、当該データのメタ情報とが格納されるデータ格納領域であり、当該メタ情報は、当該データの前記スナップショットグループにおける位置のアドレスである参照元アドレスと、前記データのＤＳＶＯＬにおける位置のアドレスである参照先アドレスとのアドレスマッピングを含んだ情報であり、
前記プロセッサは、前記スナップショットグループのうちのいずれかのＶＯＬに対しデータを更新するためのライト要求の処理であるライト処理において、当該データのメタ情報を更新するＩ／Ｏを、当該メタ情報を格納しているＤＳＶＯＬに対し行うようになっており、
前記プロセッサは、
前記スナップショットグループに対するＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）負荷が閾値を超えたか否かを判定し、
当該判定の結果が真の場合に、前記スナップショットグループについてのＤＳＶＯＬの数を増やす、
ストレージシステム。
前記プロセッサは、前記スナップショットグループについての複数のＤＳＶＯＬに格納されているデータの量を平準化する、
請求項１に記載のストレージシステム。
前記スナップショットグループのうちのいずれかのＶＯＬに対するライト要求の処理において、前記プロセッサは、前記複数のＤＳＶＯＬに格納されているデータの量が平準化されるよう、当該ライト要求に付随のデータであるライト対象データの格納先のＤＳＶＯＬを選択し、当該選択されたＤＳＶＯＬに、当該ライト対象データを格納する、
請求項２に記載のストレージシステム。
前記複数のＤＳＶＯＬに格納されているデータの量の平準化は、ＤＳＶＯＬ間のデータの移動を含み、
前記プロセッサは、前記平準化を、前記スナップショットグループのうちのいずれかのＶＯＬに対するＩ／Ｏ要求の処理と非同期に行う、
請求項２に記載のストレージシステム。
前記スナップショットグループについてＤＳＶＯＬの数を増やした後、前記プロセッサは、ＤＳＶＯＬの数を増やす前に存在するＤＳＶＯＬを格納先とするデータの量と、新たに増えたＤＳＶＯＬを格納先とするデータの量を制御する、
請求項１に記載のストレージシステム。
前記スナップショットグループについてのＤＳＶＯＬ数に上限がある場合に、前記プロセッサは、ＤＳＶＯＬの数を増やす前に存在するＤＳＶＯＬを格納先とするデータの量と、新たに増えたＤＳＶＯＬを格納先とするデータの量を制御する、
請求項５に記載のストレージシステム。
前記スナップショットグループに対するＩ／Ｏ負荷が前記閾値を超えた場合とは、下記のうちのいずれか又は両方に該当することである、
・前記スナップショットグループにおける全ＶＯＬに対するＩ／Ｏ負荷の合計が、前記スナップショットグループについて定められたＩ／Ｏ負荷閾値を超えること、
・前記スナップショットグループに割り当てられている全ＤＳＶＯＬのうちのＮ以上のＤＳＶＯＬの各々について（Ｎは自然数）、当該ＤＳＶＯＬのＩ／Ｏ負荷が当該ＤＳＶＯＬの期待されるＩ／Ｏ性能を超えていること、
請求項１に記載のストレージシステム。
前記スナップショットグループについて定められたＩ／Ｏ負荷閾値は、一つのＤＳＶＯＬに期待されるＩ／Ｏ性能と、前記スナップショットグループに割り当てられているＤＳＶＯＬの数である現在のＤＳＶＯＬ数との積、又は当該積よりも小さい値である、
請求項７に記載のストレージシステム。
前記プロセッサは、前記スナップショットグループについての現在のＤＳＶＯＬ数と目標数との差分に基づき、新たに増やすＤＳＶＯＬの数を決定し、
現在のＤＳＶＯＬ数は、前記スナップショットグループに割り当てられているＤＳＶＯＬの数であり、
前記目標数は、前記スナップショットグループに対するＩ／Ｏ負荷が前記閾値以下となる場合のＤＳＶＯＬ数である、
請求項１に記載のストレージシステム。
新たに増やされるＤＳＶＯＬの数は、前記差分と、前記現在のＤＳＶＯＬ数とに基づく数であり、前記差分よりも多い数である、
請求項９に記載のストレージシステム。
新たに増やされるＤＳＶＯＬの数は、前記スナップショットグループについてのいずれのＤＳＶＯＬについてもＩ／Ｏ負荷が当該ＤＳＶＯＬの期待されるＩ／Ｏ性能以下とすることを維持することが期待される数である、
請求項１０に記載のストレージシステム。
複数のストレージコントローラを備え、
前記複数のストレージコントローラの各々が、前記プロセッサを有し、
前記複数のストレージコントローラに、前記スナップショットグループについての複数のＤＳＶＯＬのＩ／Ｏ権が分散しており、
前記複数のストレージコントローラの各々は、
当該ストレージコントローラがＩ／Ｏ権を持つＤＳＶＯＬに対し、データを格納し、
データの格納先となるＤＳＶＯＬのＩ／Ｏ権を有していない場合、当該Ｉ／Ｏ権を有するストレージコントローラに当該データを転送する、
請求項１に記載のストレージシステム。
ＰＶＯＬ（ＰｒｉｍａｒｙＶｏｌｕｍｅ）のスナップショットであるＳＶＯＬ（ＳｅｃｏｎｄａｒｙＶｏｌｕｍｅ）を作成するストレージシステムの記憶制御方法であって、
前記ＰＶＯＬと当該ＰＶＯＬについての一つ以上のＳＶＯＬとのグループであるスナップショットグループについてのＤＳＶＯＬ（ＤａｔａＳｔｏｒｅＶｏｌｕｍｅ）は、前記スナップショットグループのいずれかのＶＯＬ（Ｖｏｌｕｍｅ）が格納先であるデータと、当該データのメタ情報とが格納されるデータ格納領域であり、当該メタ情報は、当該データの前記スナップショットグループにおける位置のアドレスである参照元アドレスと、前記データのＤＳＶＯＬにおける位置のアドレスである参照先アドレスとのアドレスマッピングを含んだ情報であり、
前記ストレージシステムは、前記スナップショットグループのうちのいずれかのＶＯＬに対しデータを更新するためのライト要求の処理であるライト処理において、当該データのメタ情報を更新するＩ／Ｏを、当該メタ情報を格納しているＤＳＶＯＬに対し行うようになっており、
前記記憶制御方法は、
前記スナップショットグループに対するＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）負荷が閾値を超えたか否かを判定し、
当該判定の結果が真の場合に、前記スナップショットグループについてのＤＳＶＯＬの数を増やす、
記憶制御方法。