JP2018159999A

JP2018159999A - ストレージシステム

Info

Publication number: JP2018159999A
Application number: JP2017055640A
Authority: JP
Inventors: ジェームズ俊介レイノルズ; Shunsuke Reynolds James
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2017-03-22
Filing date: 2017-03-22
Publication date: 2018-10-11
Anticipated expiration: 2037-03-22
Also published as: US20180276236A1; JP6337982B1

Abstract

【課題】重複排除を行ってデータを格納するストレージシステムにおいて、リストアの高速化を図ること。
【解決手段】本発明のストレージシステムは、重複排除ストレージ装置と、ファイルの格納状況を表すファイルテーブルに基づいてファイルの読み出しを行う複数の読み出し装置と、を備え、ファイルを特定するファイル特定情報と、当該ファイルを構成する分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部と、ファイルテーブルに基づいて、複数のファイルがグループを形成するようファイルテーブルを変更するファイルテーブル変更部と、を備える。
【選択図】図１０

Description

本発明は、ストレージシステムにかかり、特に、重複記憶排除機能を有するストレージ装置に対するデータ記憶を制御するストレージシステムに対する。

近年、コンピュータの発達及び普及に伴い、種々の情報がデジタルデータ化されている。このようなデジタルデータを保存しておく装置として、磁気テープや磁気ディスクなどの記憶装置がある。そして、保存すべきデータは日々増大し、膨大な量となるため、大容量なストレージシステムが必要となっている。また、記憶装置に費やすコストを削減しつつ、信頼性も必要とされる。これに加えて、後にデータを容易に取り出すことが可能であることも必要である。その結果、自動的に記憶容量や性能の増大を実現できると共に、重複記憶を排除して記憶コストを削減し、さらには、冗長性の高いストレージシステムが望まれている。

このような状況に応じて、近年では、特許文献１に示すように、コンテンツアドレスストレージシステムが開発されている。このコンテンツアドレスストレージシステムは、データを分散して複数の記憶装置に記憶すると共に、このデータの内容に応じて特定される固有のコンテンツアドレスによって、当該データを格納した格納位置が特定される。また、コンテンツアドレスストレージシステムの中には、所定のデータを複数のフラグメントに分割すると共に、冗長データとなるフラグメントをさらに付加して、これら複数のフラグメントをそれぞれ複数の記憶装置にそれぞれ格納する、というものもある。

そして、上述したようなコンテンツアドレスストレージシステムでは、後に、コンテンツアドレスを指定することにより、当該コンテンツアドレスにて特定される格納位置に格納されているデータつまりフラグメントを読み出し、複数のフラグメントから分割前の所定のデータを復元することができる。

また、上記コンテンツアドレスは、データの内容に応じて固有となるよう生成される値、例えばデータのハッシュ値、に基づいて生成される。このため、重複データであれば同じ格納位置のデータを参照することで、同一内容のデータを取得することができる。従って、重複データを別々に格納する必要がなく、重複記録を排除して、データ容量の削減を図ることができる。

特に、上述したような重複排除ストレージシステムでは、ファイルなど書き込み対象となるデータを所定容量の複数のブロックデータに分割して圧縮し、記憶装置に書き込む。このように、ファイルを分割したブロックデータ単位で重複記憶を排除することで、重複率が増大し、データ容量の削減を図っている。

ここで、多くの組織では、機器故障、誤操作、災害などによるデータロスが起こっても事業が継続できるよう、業務上のデータをバックアップするための専用のバックアップシステムを用意している。一般に、バックアップデータは重複率が高いため、バックアップシステムに上述したような重複排除ストレージ装置が利用される。

このような状況において、複雑なＩＴ（Information Technology）システムをもつ組織では、多数のバックアップサーバを統一的に管理して多数の業務用サーバのバックアップを行うことが求められる。一方、データロスの際にも事業を中断せずに継続するためには、短期間で高速にバックアップデータをリストアすることが求められる。ここで、バックアップに重複排除ストレージ装置を用いたストレージシステムの構成の一例を、図１乃至図２を参照して説明する。

図１に示すストレージシステムは、バックアップ対象のデータを持つ１つ以上の業務用サーバ１０と、バックアップ処理を実行する１つ以上のバックアップサーバ２０と、バックアップを管理するバックアップ管理サーバ３０と、バックアップデータが格納される重複排除ストレージ装置４０と、を備えている。このとき、全ての業務用サーバ１０は、全てのバックアップサーバ２０にネットワークを介して接続されており、また、全てのバックアップサーバ２０は、重複排除ストレージ装置４０にネットワークを介して接続されている。また、バックアップ管理サーバ３０が、各業務用サーバ１０、バックアップサーバ２０、重複排除ストレージ装置４０に接続されている。

図２に、上述した各装置が備える構成要素を示す。業務用サーバ１０は、１つ以上のバックアップ対象ファイル１１を持つ。

バックアップサーバ２０は、業務用サーバ１０（または重複排除ストレージ装置４０）からファイルを読み出し、書き込むためのファイル読み出し／書き込み部２２を持つ。また、バックアップサーバ２０は、業務用サーバ１０のどのファイルをバックアップ／リストアすべきかを規定するとともに、ファイル読み出し／書き込み部２２を使用して、ファイルの重複排除ストレージ装置４０へのバックアップまたは業務用サーバ１０へのリストアを実現するバックアップジョブ２１を持つ。

さらに、バックアップサーバ２０は、チャンク分割／結合部２４、ストレージ連携重複排除部２５、チャンク保持領域２６、を有するクライアント側重複排除モジュール２３を備える。チャンク分割／結合部２４は、読み出したバックアップ対象ファイルをチャンク（重複排除のデータ単位）に分割し、ストレージ連携重複排除部２５を使用して、既に重複排除ストレージ装置４０に記憶されていないチャンクを判別する。そして、ストレージ連携重複排除部２５は、新しいチャンクのみ重複排除ストレージ装置４０に書き込み、既に記憶されているチャンクは、重複排除ストレージ装置４０に格納されているチャンクを参照させる。また、チャンク保持領域２６は、リストアを高速化する目的で、分割したチャンクの一部をキャッシュのようにして保持する。

バックアップ管理サーバ３０は、バックアップジョブ設定部３１を有し、各バックアップサーバ２０のバックアップジョブ２１を設定する。そして、バックアップ管理サーバ３０は、バックアップ／リストア実行部３２を有し、各バックアップサーバ２０のバックアップジョブ２１の実行を制御する。

重複排除ストレージ装置４０は、業務用サーバ１０のバックアップ対象ファイル１１のデータを最終的に格納するストレージ領域４２を有する。そして、重複排除ストレージ装置４０は、書き込んだデータを重複排除する機能（データのチャンクへの分割やチャンクとファイルの対応関係の管理など）を有する重複排除部４１を備える。

上述した構成のストレージシステムにおいては、業務システム環境つまり全ての業務用サーバ１０のバックアップを行う際、バックアップ管理サーバ３０の制御のもと、あらかじめ設定された各バックアップジョブに則って、それぞれの業務用サーバ１０のバックアップ対象ファイルがそれぞれのバックアップサーバ２０にて読み出される。なお、バックアップジョブは、一般に、バックアップの高速性などバックアップ時の都合に基づいて設定される。

バックアップサーバ２０では、チャンク分割／結合部２４がバックアップ対象ファイルをチャンクに分割し、ストレージ連携重複排除部２５が重複排除ストレージ装置４０にチャンクが既に存在するかどうかを確認する。そして、ストレージ連携重複排除部２５は、重複排除ストレージ装置４０内に存在しないチャンクのデータを、当該ストレージ装置４０に書き込む。一方、既に存在する場合は、データの代わりにチャンクのハッシュ値を送り、重複排除ストレージ装置４０では既に存在するデータを参照することで、チャンクのデータが書き込まれたとみなす。このバックアップの際に、バックアップサーバ３０は、読み出したバックアップ対象ファイルを構成するチャンクの一部を、自身のチャンク保持領域２６に格納する。

一方、業務用サーバ１０に障害があった場合には、バックアップストレージからリストアが必要となる。この際、バックアップ管理サーバ３０の制御のもと、リストア対象の業務用サーバ１０のファイルをバックアップしたバックアップサーバ２０により、リストア対象の業務用サーバ１０のファイルが重複排除ストレージ装置４０から読み出され、業務用サーバ１０に書き込むことでリストアが行われる。

このリストア処理において、バックアップサーバ２０が重複排除ストレージ装置４０からデータを読み出す際には、チャンク単位でデータが読み出され、チャンク分割／結合部２４によりファイルが作られ、業務用サーバ１０にリストアされる。なお、ある業務用サーバ１０のリストア対象ファイルは、バックアップジョブに設定されているバックアップ対象ファイルと同様であり、同じバックアップサーバ２０が同じファイルのバックアップおよびリストアを担当する。

さらに、重複排除ストレージ装置４０からチャンクを読み出す際には、チャンク保持領域２６を確認し、既にチャンクがチャンク保持領域２６に格納されている場合には、重複排除ストレージ装置４０から読み出すのではなく、直接、チャンク保持領域２６のデータを使用して読み出す。チャンクを重複排除ストレージ装置４０ではなくチャンク保持領域２６から読み出すことにより、重複排除ストレージ装置４０からの読み出しデータ量を低減させ、リストア時間を短縮することができる。

特開２００５−２３５１７１号公報特開２０１１−１９８３２１号公報

しかしながら、一般的に全ての業務用サーバ１０に含まれるバックアップ対象ファイルのデータ総量に対して、全てのバックアップサーバ２０のチャンク保持領域２６の容量は非常に小さい。このため、上述したリストア方法では、データ転送量の削減やリストア時間の短縮の効果が小さくなってしまい、さらなるリストアの高速化を図ることができない。

また、バックアップの際には、バックアップジョブがバックアップ処理の高速性／容易性に基づいて設定されることがあるが、そのようなバックアップジョブにより、リストアには最適ではない設定となる場合がある。例えば、特許文献２では、バックアップ状況記録を記憶しておき、かかる記録に基づいてリストアを行っている場合がある。このように、バックアップの設定をそのままリストアに用いる場合には、例えば、複数の業務用サーバのデータが１つのバックアップサーバ２０からバックアップ及びリストアされることや、１つのファイルが複数のバックアップサーバ２０からリストアされることもあり得る。すると、バックアップサーバ２０の効率的な利用を図ることができず、リストアのさらなる高速化を図ることができない、という問題が生じる。

このため、本発明の目的は、上述した課題である、重複排除を行ってデータを格納するストレージシステムにおいて、データの読み取りやリストアの高速化を図ることができない、ことを解決することにある。

本発明の一形態であるストレージシステムは、
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置と、
前記重複排除ストレージ装置への前記ファイルの格納状況を表すファイルテーブルに基づいて、前記重複排除ストレージ装置から前記ファイルの読み出しを行う複数の読み出し装置と、
を備えたストレージシステムであって、
前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成された前記ファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を備えた、
という構成をとる。

また、本発明の一形態である情報処理装置は、
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置、への前記ファイルの格納状況を表し、前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を備えた、
という構成をとる。

また、本発明の一形態であるプログラムは、
情報処理装置に、
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置、への前記ファイルの格納状況を表し、前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を実現させる、
という構成をとる。

また、本発明の一形態である情報処理方法は、
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置と、
前記重複排除ストレージ装置への前記ファイルの格納状況を表すファイルテーブルに基づいて、前記重複排除ストレージ装置から前記ファイルの読み出しを行う複数の読み出し装置と、
を備えたストレージシステムによる情報処理方法であって、
前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成された前記ファイルテーブルを取得し、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更する、
という構成をとる。

本発明は、以上のように構成されることにより、重複排除を行ってデータを格納するストレージシステムにおいて、データの読み出しやリストアの高速化を図ることができる。

本発明の実施形態１におけるストレージシステム全体の構成を示すブロック図である。本発明に関連するストレージシステムの構成を示すブロック図である。本発明の実施形態１におけるストレージシステムの構成を示すブロック図である。図３に開示したリストア対象ファイルテーブルに記憶されるデータの一例を示す図である。図３に開示したチャンクテーブルに記憶されるデータの一例を示す図である。図３に開示したバックアップ管理サーバによる処理の様子を説明するための図である。図３に開示したストレージシステムにおける動作を示すフローチャートである。図３に開示したストレージシステムにおける動作を示すフローチャートである。図３に開示したストレージシステムにおける動作を示すフローチャートである。本発明の実施形態２におけるストレージシステムの構成を示すブロック図である。

＜実施形態１＞
本発明の第１の実施形態を、図３乃至図９を参照して説明する。図３乃至図５は、ストレージシステムの構成を説明するための図である。図６乃至図９は、ストレージシステムの動作を説明するための図である。

［構成］
本発明におけるストレージシステムは、上述した図１と同様の構成を有する。つまり、ストレージシステムは、バックアップ対象のデータを持つ１つ以上の業務用サーバ１０と、バックアップ処理を実行する１つ以上のバックアップサーバ２０と、バックアップを管理するバックアップ管理サーバ３０と、バックアップデータが格納される重複排除ストレージ装置４０と、を備えている。なお、図１では、業務用サーバ１０が３つ、バックアップサーバ２０が３つ、バックアップ管理サーバ３０が１つ、重複排除ストレージ装置４０が１つである構成を示しているが、各サーバ・装置の数は、図１で示すものに限定されない。

図３に、本実施形態におけるストレージシステムが備える各サーバ・装置が備える構成要素を示す。ストレージシステムは、基本的には、上述した図２と同様の構成を有し、これに加え、いくつかの追加構成を備える。

業務用サーバ１０は、１つ以上のバックアップ対象ファイル１１を持つ。

さらに、バックアップサーバ２０は、チャンク分割／結合部２４、ストレージ連携重複排除部２５、チャンク保持領域２６、を有するクライアント側重複排除モジュール２３を備える。チャンク分割／結合部２４は、読み出したバックアップ対象ファイルをチャンク（重複排除のデータ単位：分割データ）に分割し、ストレージ連携重複排除部２５を使用して、既に重複排除ストレージ装置４０に記憶されていないチャンクを判別する。そして、ストレージ連携重複排除部２５は、新しいチャンクのみ重複排除ストレージ装置４０に書き込み、既に記憶されているチャンクは、重複排除ストレージ装置４０に格納されているチャンクを参照させる。また、チャンク保持領域２６は、分割したチャンクの一部を、リストアを高速化する目的で、キャッシュのようにして保持する。

また、バックアップサーバ２０は、チャンク分割／結合部２４により、ファイルを読み出したり、業務用サーバ１０にリストアする際に、チャンク単位でデータを読み出してファイルを作成する読み出し装置として機能する。このとき、バックアップサーバ２０は、後述するように、自身に記憶されたリストア対象ファイルテーブル（ファイルテーブル）を参照して行う。

上記構成に加え、本実施形態におけるバックアップサーバ２０は、リストア対象ファイルテーブル２７と、チャンクテーブル２８と、を有する。なお、リストア対象ファイルテーブル２７とチャンクテーブル２８とは、それぞれ各バックアップサーバ２０が有している。

上記リストア対象ファイルテーブル２７（ファイルテーブル）は、バックアップの際に、各リストア対象ファイルのエントリを追加し、当該ファイルの管理する情報が記憶される。例えば、リストア対象ファイルテーブル２７は、図４に示すように、各リストア対象ファイルについて、「リストア先」と、「パス／ファイル名」と、チャンクの「ハッシュ値」と、チャンクのファイル内における「オフセット」と、が関連付けられている。

上記「リストア先」は、ファイルのバックアップ元でありリストア先となる業務用サーバ１０（リストア先装置）を示す情報である。「パス／ファイル名」は、リストア対象ファイルのパスとファイル名を示し、リストア対象ファイルを特定するファイル特定情報のである。「ハッシュ値」は、ファイルを構成する全てのチャンクのハッシュ値であり、チャンクの内容に応じて算出され、チャンクを特定する分割データ特定情報となる。「オフセット」は、ファイル内におけるチャンクの位置を表す情報である。なお、一般に、１つのファイルは多数のチャンクから構成される。

そして、リストア対象ファイルテーブル２７は、バックアップサーバ２０において、リストアを行う際に参照される。つまり、バックアップサーバ２０は、リストア対象ファイルテーブル２７に基づいて、チャンク分割／結合部２４によりチャンク単位でデータを読み出してファイルを作成することで、業務用サーバ１０にリストアする。なお、リストア対象ファイルテーブル２７は、後述するように、バックアップ管理サーバ３０によって変更されうる。

また、上記チャンクテーブル２８は、上述したバックアップの際に、各チャンクの情報が記憶される。例えば、チャンクテーブル２８は、図５に示すように、各チャンクの「ハッシュ値」、「チャンク保持対象（Ｙｅｓ，Ｎｏ）」、「重複回数」の情報を含む。「チャンク保持対象」は、テーブルを記憶しているバックアップサーバ２０がそのチャンクを保持対象とするかどうかを表す情報である。「重複回数」は、テーブルを記憶しているバックアップサーバ２０が扱うデータ（リストア対象ファイルテーブル２７内の全ファイル）の中での重複回数を表す情報である。

また、本実施形態におけるバックアップ管理サーバ３０は、リストア対象ファイル最適化部３３を備える。リストア対象ファイル最適化部３３は、全てのバックアップサーバ２０から、リストア対象ファイルテーブル２７およびチャンクテーブル２８の情報を取得するファイルテーブル取得部として機能する。

また、リストア対象ファイル最適化部３３は、収集したリストア対象ファイルテーブル２７を変更するファイルテーブル変更部として機能する。リストア対象ファイル最適化部３３は、例えば、「ハッシュ値」が同一であるチャンクに関連付けられた複数のファイル、つまり、同一のチャンクを含む複数のファイル、を同一のグループに含め、当該同一のグループを１つのリストア対象ファイルテーブルに含めるよう、リストア対象ファイルテーブルを変更する。このとき、同一のチャンクを含む複数のファイルのグループに、当該複数のファイルをそれぞれ構成する他のチャンクと同一のチャンクを含む他のファイルも含め、当該グループを１つのリストア対象ファイルテーブルに含めるよう変更する。なお、リストア対象ファイルテーブルの変更については、動作説明時に詳述する。

なお、リストア対象ファイル最適化部３３は、必ずしもチャンクの「ハッシュ値」が同一であるかによってファイルをグループ分けすることに限定されない。例えば、チャンクが共通の特徴を有する複数のファイルを同一のグループに含めるなど、他の方法によって、複数のファイルを同一のグループに含め、当該グループを１つのリストア対象ファイルテーブルに含めるよう変更してもよい。

また、リストア対象ファイル最適化部３３は、上述したリストア対象ファイルテーブル２７の変更と併せて、チャンクテーブル２８の変更も行う。つまり、上述したリストア対象ファイルテーブル２７の変更により、バックアップサーバ２０が管理するファイルが変更されるため、それに対応してチャンクの「チャンク保持対象」や「重複回数」の情報を変更する。

また、リストア対象ファイル最適化部３３は、変更したリストア対象ファイルテーブル２７及びチャンクテーブル２８を、それぞれ各バックアップサーバ２０に送信して更新する。

そして、上記バックアップサーバ２０は、リストアなどの際に、チャンク分割／結合部２４により、上述したように更新されたリストア対象ファイルテーブルに基づいて、重複排除ストレージ装置４０及びチャンク保持領域２６から、チャンク単位でデータを読み出してファイルを作成する。なお、チャンク保持領域２６には、更新されたリストア対象ファイルテーブルに基づいて更新されたチャンクテーブル２８を参照して、チャンクが格納される。例えば、チャンク保持領域２６には、バックアップサーバ２０が割り当てられたリストア対象ファイルテーブルに含まれる同一グループに含められた複数のファイルに共通するチャンクが格納される。このとき、特に、チャンク保持領域２６には、ファイル間で重複する回数が多いチャンクが優先して格納される。

なお、上述したバックアップサーバ２０、バックアップ管理サーバ３０、重複排除ストレージ装置４０が有する各部は、各サーバ・装置が装備する演算装置にプログラムが組み込まれることで構築される。

［動作］
次に、上述した構成のストレージシステムの動作を、図６乃至図９を参照して説明する。図６は、バックアップ管理サーバによるリストア対象ファイルテーブルの変更処理の様子を示す図である。図７乃至図９は、ストレージシステムの動作を示すフローチャートである。なお、以下では、ストレージシステムによる、バックアップ処理、リストア対象の更新処理、リストア時の処理、について説明する。

＜バックアップ処理＞
まず、全業務用サーバ１０のデータ（全てのバックアップ対象ファイル１１）をバックアップする際の処理を、図７のフローチャートを参照して説明する。

最初に、バックアップ管理サーバ３０が、各バックアップサーバ２０にバックアップの実行開始の指示を送る（ステップＡ１）。

続いて、バックアップ管理サーバ３０からバックアップの実行を指示されたバックアップサーバ２０は、バックアップジョブにおいて指示されたバックアップ対象が設定されている場合、設定されているバックアップ対象ファイル１１をバックアップする（ステップＡ２）。この例では、全ての業務用サーバ１０の全てのバックアップ対象ファイル１１をバックアップする。

ファイルのバックアップを行うためには（ステップＡ３）、まず、バックアップサーバ２０がバックアップ対象ファイル１１を業務用サーバ１０から読み出す（ステップＡ４）。次に、チャンク分割／結合部２４が、バックアップ対象ファイル１１をチャンクに分割する（ステップＡ５）。このとき、チャンクへの分割は、一定バイト数ごとの分割、またはデータのビット列のハッシュ値が特定の条件に当てまる箇所で分割する、などの方法で行う。

続いて、チャンクに分割した後に、バックアップサーバ２０が処理しているファイルのエントリを、当該バックアップサーバ２０が保持しているリストア対象ファイルテーブル２７に追加する。例えば、図４に示すように、ファイルが置かれている業務用サーバ、ファイル名／パス、ファイルを構成する全てのチャンクのハッシュ値とオフセットの情報を、リストア対象ファイルテーブル２７に記録する。また、チャンクテーブル２８に、バックアップサーバ２０にて処理した各チャンクのハッシュ値と、バックアップサーバ２０が処理した今回のバックアップにおいて同じチャンクが現れた回数、を記録する（ステップＡ６）。

次に、バックアップサーバ２０は、ストレージ連携重複排除部２５を使用して、重複排除ストレージ装置４０に対して、チャンクが既に重複排除ストレージ装置４０に格納されているかどうかを問合せて判定する（ステップＡ７）。重複排除ストレージ装置４０にチャンクが格納されていない場合は、チャンクのデータを重複排除ストレージ装置４０に書き込み、既にチャンクが格納されている場合は、チャンクを表すハッシュ値のみを重複排除ストレージ装置４０に送る（ステップＡ８）。つまり、既にチャンクが格納されている場合は、重複排除ストレージ装置４０に記憶されているチャンクを、当該チャンクのハッシュ値に基づくコンテンツアドレスで参照することで、当該チャンクの重複記憶を排除する。

バックアップサーバ２０から重複排除ストレージ装置４０にファイルを書き込んだ後、バックアップサーバ２０のチャンク保持領域２６に、チャンク分割処理の際に作られたチャンクを格納する（ステップＡ９）。このとき、一般に、１回のバックアップで生成されるチャンクの合計データ量はチャンク保持領域の容量よりも大きいため、LRUなどの法則に従い、チャンク保持領域２６に保持するチャンクを選択する。

＜リストア対象の更新処理＞
次に、バックアップ後の各バックアップサーバ２０のリストア対象の更新処理を、図８のフローチャートを参照して説明する。

バックアップが完了後、まず、バックアップ管理サーバ３０が、全てのバックアップサーバ２０に格納されているリストア対象ファイルテーブル２７およびチャンクテーブル２８の情報を、バックアップ管理サーバ３０にコピーする（ステップＢ１）。これにより、前回のバックアップにおいて生成された全てのリストア対象ファイルとチャンクの情報がバックアップ管理サーバ３０に収集される。

次に、全てのリストア対象ファイルテーブル２７のファイルとチャンクの情報より、同一のチャンクを含むファイルを調べて、これら重複するチャンクを含むファイルをまとめたグループ（またはクラスタ）を作成する（ステップＢ２）。また、同一チャンクを含まない２つのファイルであっても、どちらも同じ第３のファイルのチャンクと共有する場合には、これらを同じグループに含める。つまり、重複するチャンクを含むことにより同一グループに含められたファイルのうち、少なくとも１つとチャンクを共通する他のファイルも、この同一グループに含めることとする。

グループ作成の一例を、図６を参照して説明する。まず、ファイルF1がチャンクc1,c2,c3から、ファイルF2がチャンクc1,c4から、ファイルF3がチャンクc3,c5,c6から、ファイルF4がチャンクc7,c8から、ファイルF5がチャンクc7,c9,...から構成されていることとする。この場合、ファイルF1とファイルF2はどちらもチャンクc1を含むため、同じグループG1に含まれる。また、ファイルF1とファイルF3はどちらもチャンクc3を含むため、同じグループG1に含まれる。したがって、ファイルF2とファイルF3は同一のチャンクをもたないが、ファイルF1、F2、F3は全て同じグループG1に含める。一方で、ファイルF4とファイルF5は、どちらもチャンクc7を含むが、グループG1のファイルとは同一のチャンクを持たない。このため、ファイルF4、F5は、グループG1とは異なるグループG2に含める。

上述した処理により、重複部分を持ったファイルから構成されるファイルのグループが多数作成される。また、他のファイルと重複するチャンクを持たない、グループに含まれないファイルも多数残ることとなる。

次に、上述したグループ生成に伴い、バックアップ管理サーバ３０内で、それぞれのバックアップサーバ２０のリストア対象ファイルテーブルおよびチャンクテーブルの内容に変更を加え、更新された新しいリストア対象ファイルテーブルおよびチャンクテーブルを作成する（ステップＢ３）。この時、各バックアップサーバ２０のリストア対象ファイルテーブルにファイルを含める（リストアをアサインする）にあたって、以下のポリシーに従う。

・ポリシー１
ステップＢ２で作成した、同一グループに含まれるファイルは、同一のバックアップサーバ２０にリストをアサインする。つまり、１つのグループは、１つのリストア対象ファイルテーブルに含めて、１つのバックアップサーバ２０に割り当てられるようにする。このとき、複数のグループが、各バックアップサーバ２０に均等に分散して割り当てられるようにもする。このときさらに、グループに含まれるファイルの総容量がバックアップサーバ２０間で概ね均等となるように、ファイルのリストアをアサインする。

・ポリシー２
また、各業務用サーバ１０のデータが、各バックアップサーバ２０に均等に割り当てられるように、ファイルのリストアをアサインする。つまり、リストアの際にいずれの業務用サーバ１０を選んでも、その業務用サーバ１０のファイルが、全てのバックアップサーバ１２に均等に分散されるように、リストアがアサインされている。このとき、例えば、各業務用サーバ１０のデータの容量やファイル数が、全てのバックアップサーバ２０に均等に分散されるように、リストアがアサインされる。

上記ポリシーに従い、各バックアップサーバ２０に割り当てられるリストア対象ファイルテーブルを更新すると、当該リストア対象ファイルテーブルの内容に対応するよう、各バックアップサーバ２０に割り当てられるチャンクテーブルを更新する。このとき、割り当てられたバックアップサーバ２０でチャンクが重複する回数を更新し、チャンクテーブルの中で、重複回数の高いチャンクから優先的に、チャンク保持対象に「Ｙｅｓ」をマークする。このマークがついているチャンクは、割り当てられたバックアップサーバ２０内のチャンク保持領域２６に格納されることを示す

次に、バックアップ管理サーバ３０において更新した、各バックアップサーバ２０に割り当てられるリストア対象ファイルテーブルおよびチャンクテーブルの情報を、各バックアップサーバ２０にコピーする。これにより、古いテーブルを新しいテーブルの情報に更新する（ステップＢ４）。

最後に、各バックアップサーバ２０は、更新された新しいチャンクテーブルにおいてチャンク保持対象となっているチャンクを、重複排除ストレージ装置４０から読み出し、チャンク保持領域２６に格納する（ステップＢ５）。

＜リストア処理＞
次に、いずれかの業務用サーバ１０のリストアを実施する際の処理を、図９のフローチャートを参照して説明する。

最初に、バックアップ管理サーバ３０が全てのバックアップサーバ２０にリストア対象の業務用サーバ１０のリストアの実行を指示する（ステップＣ１）。リストア実行の指示を受け、各バックアップサーバ２０は、自身が記憶している割り当てられたリストア対象ファイルテーブルのファイルのうち、リストア対象の業務用サーバ１０の全てのファイルのリストアを行う（ステップＣ２）。

そして、リストアする各ファイルについて、まず、リストア対象ファイルテーブルに記載されている構成チャンクがチャンク保持領域２６に含まれているかどうかを確認する（ステップＣ４）。チャンク保持領域２６に含まれないファイルは重複排除ストレージ装置４０から読み出し（ステップＣ５）、チャンク保持領域２６に含まれるチャンクと結合して、リストア対象ファイルを生成する（ステップＣ６）。最後に、バックアップサーバ２０で生成したリストア対象ファイルをリストア対象の業務用サーバ１０に書き出してリストアを完了する（ステップＣ７）。

以上のように、本発明のストレージシステムによると、上述したようにリストア対象ファイルテーブルを変更しているため、リストア時やファイル読み出し時に以下のような効果を奏する。

まず、同一グループに含まれるファイルは重複するチャンクをもつファイルであるため、同一バックアップサーバ２０にアサインし、かつ重複するチャンクを優先的にチャンク保持領域２６に含めることにより、１つのバックアップサーバ２０で高速にファイル作成を行うことができる。また、チャンク保持領域２６においてチャンクの重複排除が効率的に行われ、１つのチャンク分の容量で複数のファイルにチャンクを提供することができる。

例えば、上述した例では、ファイルF1がチャンクc1、c2、c3から、ファイルF2がチャンクc1、c4から構成されており、これらを同一グループに含めた場合を示している。このとき、ファイルF1とファイルF2それぞれに含まれるチャンクの合計数は５つであるが、チャンクc1は共通しているため、同一のバックアップサーバ２０でファイル作成を行うことで、チャンクc1、c2、c3、c4の４つのチャンクを保持すれば、両方のファイルを構成する全てのチャンクを読み出すことができる。このため、チャンクの読み出し効率が向上し、リストアを効率よく高速に行うことができる。また、同一のチャンク保持領域２６に複数のファイルに重複するチャンクを優先的に格納することで、チャンク保持領域２６の容量効率が高くなり、リストア時のチャンクのキャッシュとしての効果が高まる。

また、上述したように作成した複数のグループをバックアップサーバ２０間で均等に配置することで、チャンク保持領域２６の容量効率向上の効果が、全てのバックアップサーバ２０のチャンク保持領域に等しく適用される。また、リストアの負荷をバックアップサーバ２０間で分散させることができる。

また、各業務用サーバ１０のファイルが各バックアップサーバ２０間で均等に分散されてバックアップが行われるため、各バックアップサーバ２０間でリストアの負荷を分散させることができる。また、リストア対象の業務用サーバ１０と各バックアップサーバ２０の間のネットワーク帯域が特定箇所に集中することを抑制し、全ての帯域を活用することができるため、リストア時の転送速度を高めることができる。

なお、上記では、リストア対象ファイルテーブルやチャンクテーブルの変更をバックアップ管理サーバ３０が行っている場合を例示したが、かかる処理を行う機能は、バックアップサーバ２０や重複排除ストレージ装置４０、あるいは、他のサーバに装備してもよい。また、各バックアップサーバ２０が保持するリストア対象ファイルテーブルやチャンクテーブルは、テーブルが割り当てられるバックアップサーバ２０を特定して、重複排除ストレージ装置４０や他のサーバに記憶してもよい。

＜実施形態２＞
次に、本発明の第２の実施形態を、図１０を参照して説明する。図１０は、実施形態２におけるストレージシステムの構成を示すブロック図である。なお、本実施形態におけるストレージシステムは、実施形態１で説明したストレージシステムの構成の概略を示している。

図１０に示すように、本実施形態おけるストレージシステムは、
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の分割データを参照することによって重複記憶を排除する重複排除ストレージ装置１００と、
重複排除ストレージ装置１００へのファイルの格納状況を表すファイルテーブルに基づいて、重複排除ストレージ装置１００からファイルの読み出しを行う複数の読み出し装置１１０と、
を備える。

そして、ストレージシステムは、
ファイルを特定するファイル特定情報と、当該ファイルを構成する分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部１２０と、
ファイルテーブルに基づいて、複数のファイルがグループを形成するようファイルテーブルを変更するファイルテーブル変更部１３０と、
を備える。

上記構成によると、ファイルを構成する分割データが重複排除されている重複排除ストレージ装置１００において、ファイルと分割データとの関係から、複数のファイルがグループを形成するようファイルテーブルが変更される。そして、変更されたファイルテーブルのグループに基づいて、読み出し装置が分割データを読み出してファイルを生成することで、効率よくファイルを読み出すことができ、読み出しやリストアの高速化を図ることができる。

＜付記＞
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明におけるストレージシステム、情報処理装置、プログラム、情報処理方法の構成の概略を説明する。但し、本発明は、以下の構成に限定されない。

（付記１）
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置と、
前記重複排除ストレージ装置への前記ファイルの格納状況を表すファイルテーブルに基づいて、前記重複排除ストレージ装置から前記ファイルの読み出しを行う複数の読み出し装置と、
を備えたストレージシステムであって、
前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成された前記ファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を備えたストレージシステム。

（付記２）
付記１に記載のストレージシステムであって、
前記ファイルテーブル変更部は、前記ファイルに含まれる前記分割データが共通の特徴を有する複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
ストレージシステム。

（付記３）
付記１又は２に記載のストレージシステムであって、
前記ファイルテーブル変更部は、前記ファイルに関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
ストレージシステム。

（付記４）
付記３に記載のストレージシステムであって、
前記ファイルテーブル変更部は、関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを含む前記グループに、当該グループに含められた複数の前記ファイルをそれぞれ構成する少なくとも１の前記分割データの前記分割データ特定情報が同一である他の前記ファイルも含めるよう前記ファイルテーブルを変更する、
ストレージシステム。

（付記５）
付記１乃至４のいずれかに記載のストレージシステムであって、
複数の前記読み出し装置は、それぞれ前記ファイルテーブルが割り当てられており、当該割り当てられたファイルテーブルに基づいて前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、
前記ファイルテーブル変更部は、前記グループが１つの前記ファイルテーブルに含まれるよう当該ファイルテーブルを変更する、
ストレージシステム。

（付記６）
付記５に記載のストレージシステムであって、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記グループが分散して含められるよう前記ファイルテーブルを変更する、
ストレージシステム。

（付記７）
付記５又は６に記載のストレージシステムであって、
複数の前記読み出し装置は、それぞれ前記分割データを格納する分割データ保持領域を備えると共に、当該分割データ保持領域及び前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、さらに、変更した前記ファイルテーブルに基づいて、同一グループに含められた複数の前記ファイルに共通する前記分割データを、前記分割データ保持領域に格納する、
ストレージシステム。

（付記８）
付記１乃至７のいずれかに記載のストレージシステムであって、
前記ファイルテーブルは、前記ファイルのリストア先となるリストア先装置の情報を含み、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記リストア先装置が分散して含められるよう前記ファイルテーブルを変更する、
ストレージシステム。

（付記９）
付記１乃至８のいずれかに記載のストレージシステムであって、
前記読み出し装置は、前記ファイルを格納するサーバから当該ファイルを前記重複排除ストレージ装置に重複記憶を排除してバックアップすると共に、当該バックアップを行った前記ファイルの格納状況を表す前記ファイルテーブルを生成し、
さらに、前記読み出し装置は、変更された前記ファイルテーブルに基づいて、前記重複排除ストレージ装置に格納された前記ファイルを読み出して前記サーバにリストアする、
ストレージシステム。

（付記１０）
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置、への前記ファイルの格納状況を表し、前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を備えた情報処理装置。

（付記１０．１）
付記１０に記載の情報処理装置であって、
前記ファイルテーブル変更部は、前記ファイルに含まれる前記分割データが共通の特徴を有する複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
情報処理装置。

（付記１０．２）
付記１０又は１０．１に記載の情報処理装置であって、
前記ファイルテーブル変更部は、前記ファイルに関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
情報処理装置。

（付記１０．３）
付記１０．２に記載の情報処理装置であって、
前記ファイルテーブル変更部は、関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを含む前記グループに、当該グループに含められた複数の前記ファイルをそれぞれ構成する少なくとも１の前記分割データの前記分割データ特定情報が同一である他の前記ファイルも含めるよう前記ファイルテーブルを変更する、
情報処理装置。

（付記１０．４）
付記１０乃至１０．３のいずれかに記載の情報処理装置であって、
前記ファイルテーブルは、複数の読み出し装置にそれぞれ割り当てられており、当該読み出し装置は、割り当てられた前記ファイルテーブルに基づいて前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、
前記ファイルテーブル変更部は、前記グループが１つの前記ファイルテーブルに含まれるよう当該ファイルテーブルを変更する、
情報処理装置。

（付記１０．５）
付記１０．４に記載の情報処理装置であって、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記グループが分散して含められるよう前記ファイルテーブルを変更する、
情報処理装置。

（付記１０．６）
付記１０乃至１０．５のいずれかに記載の情報処理装置であって、
前記ファイルテーブルは、前記ファイルのリストア先となるリストア先装置の情報を含み、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記リストア先装置が分散して含められるよう前記ファイルテーブルを変更する、
情報処理装置。

（付記１１）
情報処理装置に、
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置、への前記ファイルの格納状況を表し、前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を実現させるためのプログラム。

（付記１１．１）
付記１１に記載のプログラムであって、
前記ファイルテーブル変更部は、前記ファイルに含まれる前記分割データが共通の特徴を有する複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
プログラム。

（付記１１．２）
付記１１又は１１．１に記載のプログラムであって、
前記ファイルテーブル変更部は、前記ファイルに関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
プログラム。

（付記１１．３）
付記１１．２に記載のプログラムであって、
前記ファイルテーブル変更部は、関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを含む前記グループに、当該グループに含められた複数の前記ファイルをそれぞれ構成する少なくとも１の前記分割データの前記分割データ特定情報が同一である他の前記ファイルも含めるよう前記ファイルテーブルを変更する、
プログラム。

（付記１１．４）
付記１１乃至１１．３のいずれかに記載のプログラムであって、
前記ファイルテーブルは、複数の読み出し装置にそれぞれ割り当てられており、当該読み出し装置は、割り当てられた前記ファイルテーブルに基づいて前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、
前記ファイルテーブル変更部は、前記グループが１つの前記ファイルテーブルに含まれるよう当該ファイルテーブルを変更する、
プログラム。

（付記１１．５）
付記１１．４に記載のプログラムであって、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記グループが分散して含められるよう前記ファイルテーブルを変更する、
プログラム。

（付記１１．６）
付記１１乃至１１．５のいずれかに記載のプログラムであって、
前記ファイルテーブルは、前記ファイルのリストア先となるリストア先装置の情報を含み、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記リストア先装置が分散して含められるよう前記ファイルテーブルを変更する、
プログラム。

（付記１２）
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置と、
前記重複排除ストレージ装置への前記ファイルの格納状況を表すファイルテーブルに基づいて、前記重複排除ストレージ装置から前記ファイルの読み出しを行う複数の読み出し装置と、
を備えたストレージシステムによる情報処理方法であって、
前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成された前記ファイルテーブルを取得し、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更する、
情報処理方法。

（付記１３）
付記１２に記載の情報処理方法であって、
前記ファイルに含まれる前記分割データが共通の特徴を有する複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
情報処理方法。

（付記１４）
付記１２又は１３に記載の情報処理方法であって、
前記ファイルに関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
情報処理方法。

（付記１５）
付記１４に記載の情報処理方法であって、
関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを含む前記グループに、当該グループに含められた複数の前記ファイルをそれぞれ構成する少なくとも１の前記分割データの前記分割データ特定情報が同一である他の前記ファイルも含めるよう前記ファイルテーブルを変更する、
情報処理方法。

（付記１６）
付記１２乃至１５のいずれかに記載の情報処理方法であって、
複数の前記読み出し装置は、それぞれ前記ファイルテーブルが割り当てられており、当該割り当てられたファイルテーブルに基づいて前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、
前記グループが１つの前記ファイルテーブルに含まれるよう当該ファイルテーブルを変更する、
情報処理方法。

（付記１７）
付記１６に記載の情報処理方法であって、
複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記グループが分散して含められるよう前記ファイルテーブルを変更する、
情報処理方法。

（付記１８）
付記１５又は１６に記載の情報処理方法であって、
複数の前記読み出し装置は、それぞれ前記分割データを格納する分割データ保持領域を備えると共に、当該分割データ保持領域及び前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、さらに、変更された前記ファイルテーブルに基づいて、同一グループに含められた複数の前記ファイルに共通する前記分割データを、前記分割データ保持領域に格納する、
情報処理方法。

（付記１９）
付記１２乃至１８のいずれかに記載の情報処理方法であって、
前記ファイルテーブルは、前記ファイルのリストア先となるリストア先装置の情報を含み、
複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記リストア先装置が分散して含められるよう前記ファイルテーブルを変更する、
情報処理方法。

なお、上述したプログラムは、記憶装置に記憶されていたり、コンピュータが読み取り可能な記録媒体に記録されている。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。

以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。

１０業務用サーバ
１１バックアップ対象ファイル
２０バックアップサーバ
２１バックアップジョブ
２２ファイル読み出し／書き込み部
２３クライアント側重複排除モジュール
２４チャンク分割／結合部
２５ストレージ連携重複排除部
２６チャンク保持領域
２７リストア対象ファイルテーブル
２８チャンクテーブル
３０バックアップ管理サーバ
３１バックアップジョブ設定部
３２バックアップ／リストア実行部
３３リストア対象ファイル最適化部
４０重複排除ストレージ装置
４１重複排除部
４２ストレージ領域
１００重複排除ストレージ装置
１１０読み出し装置
１２０ファイルテーブル取得部
１３０ファイルテーブル変更部

Claims

ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置と、
前記重複排除ストレージ装置への前記ファイルの格納状況を表すファイルテーブルに基づいて、前記重複排除ストレージ装置から前記ファイルの読み出しを行う複数の読み出し装置と、
を備えたストレージシステムであって、
前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成された前記ファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を備えたストレージシステム。
請求項１に記載のストレージシステムであって、
前記ファイルテーブル変更部は、前記ファイルに含まれる前記分割データが共通の特徴を有する複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
ストレージシステム。
請求項１又は２に記載のストレージシステムであって、
前記ファイルテーブル変更部は、前記ファイルに関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
ストレージシステム。
請求項３に記載のストレージシステムであって、
前記ファイルテーブル変更部は、関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを含む前記グループに、当該グループに含められた複数の前記ファイルをそれぞれ構成する少なくとも１の前記分割データの前記分割データ特定情報が同一である他の前記ファイルも含めるよう前記ファイルテーブルを変更する、
ストレージシステム。
請求項１乃至４のいずれかに記載のストレージシステムであって、
複数の前記読み出し装置は、それぞれ前記ファイルテーブルが割り当てられており、当該割り当てられたファイルテーブルに基づいて前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、
前記ファイルテーブル変更部は、前記グループが１つの前記ファイルテーブルに含まれるよう当該ファイルテーブルを変更する、
ストレージシステム。
請求項５に記載のストレージシステムであって、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記グループが分散して含められるよう前記ファイルテーブルを変更する、
ストレージシステム。
請求項５又は６に記載のストレージシステムであって、
複数の前記読み出し装置は、それぞれ前記分割データを格納する分割データ保持領域を備えると共に、当該分割データ保持領域及び前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、
前記ファイルテーブル変更部は、変更した前記ファイルテーブルに基づいて、同一グループに含められた複数の前記ファイルに共通する前記分割データを、前記分割データ保持領域に格納する、
ストレージシステム。
請求項１乃至７のいずれかに記載のストレージシステムであって、
前記ファイルテーブルは、前記ファイルのリストア先となるリストア先装置の情報を含み、
前記ファイルテーブル変更部は、複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記リストア先装置が分散して含められるよう前記ファイルテーブルを変更する、
ストレージシステム。
請求項１乃至８のいずれかに記載のストレージシステムであって、
前記読み出し装置は、前記ファイルを格納するサーバから当該ファイルを前記重複排除ストレージ装置に重複記憶を排除してバックアップすると共に、当該バックアップを行った前記ファイルの格納状況を表す前記ファイルテーブルを生成し、
さらに、前記読み出し装置は、変更された前記ファイルテーブルに基づいて、前記重複排除ストレージ装置に格納された前記ファイルを読み出して前記サーバにリストアする、
ストレージシステム。
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置、への前記ファイルの格納状況を表し、前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を備えた情報処理装置。
情報処理装置に、
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置、への前記ファイルの格納状況を表し、前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成されたファイルテーブルを取得するファイルテーブル取得部と、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更するファイルテーブル変更部と、
を実現させるためのプログラム。
ファイルを複数に分割した分割データを記憶すると共に、既に記憶されている同一内容の前記分割データを参照することによって重複記憶を排除する重複排除ストレージ装置と、
前記重複排除ストレージ装置への前記ファイルの格納状況を表すファイルテーブルに基づいて、前記重複排除ストレージ装置から前記ファイルの読み出しを行う複数の読み出し装置と、
を備えたストレージシステムによる情報処理方法であって、
前記ファイルを特定するファイル特定情報と、当該ファイルを構成する前記分割データを特定する分割データ特定情報と、が関連付けられて構成された前記ファイルテーブルを取得し、
前記ファイルテーブルに基づいて、複数の前記ファイルがグループを形成するよう前記ファイルテーブルを変更する、
情報処理方法。
請求項１２に記載の情報処理方法であって、
前記ファイルに含まれる前記分割データが共通の特徴を有する複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
情報処理方法。
請求項１２又は１３に記載の情報処理方法であって、
前記ファイルに関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを同一の前記グループに含めるよう前記ファイルテーブルを変更する、
情報処理方法。
請求項１４に記載の情報処理方法であって、
関連付けられた少なくとも１つの前記分割データ特定情報が同一である複数の前記ファイルを含む前記グループに、当該グループに含められた複数の前記ファイルをそれぞれ構成する少なくとも１の前記分割データの前記分割データ特定情報が同一である他の前記ファイルも含めるよう前記ファイルテーブルを変更する、
情報処理方法。
請求項１２乃至１５のいずれかに記載の情報処理方法であって、
複数の前記読み出し装置は、それぞれ前記ファイルテーブルが割り当てられており、当該割り当てられたファイルテーブルに基づいて前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、
前記グループが１つの前記ファイルテーブルに含まれるよう当該ファイルテーブルを変更する、
情報処理方法。
請求項１６に記載の情報処理方法であって、
複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記グループが分散して含められるよう前記ファイルテーブルを変更する、
情報処理方法。
請求項１５又は１６に記載の情報処理方法であって、
複数の前記読み出し装置は、それぞれ前記分割データを格納する分割データ保持領域を備えると共に、当該分割データ保持領域及び前記重複排除ストレージ装置から前記ファイルの読み出しを行うよう構成されており、さらに、変更された前記ファイルテーブルに基づいて、同一グループに含められた複数の前記ファイルに共通する前記分割データを、前記分割データ保持領域に格納する、
情報処理方法。
請求項１２乃至１８のいずれかに記載の情報処理方法であって、
前記ファイルテーブルは、前記ファイルのリストア先となるリストア先装置の情報を含み、
複数の前記読み出し装置にそれぞれ割り当てられた複数の前記ファイルテーブルに対して、前記リストア先装置が分散して含められるよう前記ファイルテーブルを変更する、
情報処理方法。