WO2010086922A1

WO2010086922A1 - ストレージシステム

Info

Publication number: WO2010086922A1
Application number: PCT/JP2009/003962
Authority: WO
Inventors: 田島由理
Original assignee: 日本電気株式会社
Priority date: 2009-01-27
Filing date: 2009-08-20
Publication date: 2010-08-05
Also published as: US20110271050A1; US8683121B2; CN102282545A; EP2393010A1; EP2393010A4; JP5391705B2; CN102282545B; JP2010176181A

Abstract

　複数の記憶手段と、これら複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段と、を備え、上記データ処理手段は、記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、上記各フラグメントデータを分散して上記各記憶手段に記憶する分散記憶制御手段と、を備え、上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータを、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する。

Description

ストレージシステム

　本発明は、ストレージシステムにかかり、特に、データを分散して複数の記憶装置に記憶するストレージシステムに関する。

　近年、コンピュータの発達及び普及に伴い、種々の情報がデジタルデータ化されている。このようなデジタルデータを保存しておく装置として、磁気テープや磁気ディスクなどの記憶装置がある。そして、保存すべきデータは日々増大し、膨大な量となるため、大容量なストレージシステムが必要となっている。また、記憶装置に費やすコストを削減しつつ、信頼性も必要とされる。これに加えて、後にデータを容易に取り出すことが可能であることも必要である。その結果、自動的に記憶容量や性能の増大を実現できると共に、重複記憶を排除して記憶コストを削減し、さらには、冗長性の高いストレージシステムが望まれている。

　このような状況に応じて、近年では、特許文献１に示すように、コンテンツアドレスストレージシステムが開発されている。このコンテンツアドレスストレージシステムは、データを分散して複数の記憶装置に記憶すると共に、このデータの内容に応じて特定される固有のコンテンツアドレスによって、当該データを格納した格納位置が特定される。具体的に、コンテンツアドレスストレージシステムでは、所定のデータを複数のフラグメントに分割すると共に、冗長データとなるフラグメントをさらに付加して、これら複数のフラグメントをそれぞれ複数の記憶装置にそれぞれ格納している。

　そして、後に、コンテンツアドレスを指定することにより、当該コンテンツアドレスにて特定される格納位置に格納されているデータつまりフラグメントを読み出し、複数のフラグメントから分割前の所定のデータを復元することができる。

　また、上記コンテンツアドレスは、データの内容に応じて固有となるよう生成される。このため、重複データであれば同じ格納位置のデータを参照することで、同一内容のデータを取得することができる。従って、重複データを別々に格納する必要がなく、重複記録を排除し、データ容量の削減を図ることができる。

特開２００５－２３５１７１号公報

　しかしながら、コンテンツアドレスストレージシステムでは、上述したように、所定のデータを複数のフラグメントに分割して、複数の記憶装置にそれぞれ格納している。このため、所定のデータを読み出す際には、当該データを分割した各フラグメントの格納位置をそれぞれ特定してアクセスする必要がある。すると、アクセスする格納位置を特定する処理に時間がかかり、読み出し効率が低下する、という問題が生じる。

　このため、本発明の目的は、上述した課題である、冗長性を維持しつつ、高速にデータを読み出すことが可能な高性能のストレージシステムを提供することにある。

　かかる目的を達成するため本発明の一形態であるストレージシステムは、
　複数の記憶手段と、これら複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段と、を備える。
　そして、上記データ処理手段は、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
　上記各フラグメントデータを分散して上記各記憶手段に記憶する分散記憶制御手段と、を備える。
　さらに、上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータを、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
という構成を採る。

　また、本発明の他の形態であるプログラムは、
　複数の記憶手段を備えた情報処理装置に、
　上記複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段を実現するプログラムである。
　そして、上記データ処理手段は、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
　上記各フラグメントデータを分散して上記各記憶手段に記憶する分散記憶制御手段と、を備える。
　さらに、上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータを、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
という構成を採る。

　また、本発明の他の形態であるデータ処理方法は、
　複数の記憶手段を備えた情報処理装置が、
　上記複数の記憶手段に対してデータを記憶し、上記記憶手段に記憶されているデータを読み出す。
　そして、上記情報処理装置は、上記複数の記憶手段に対してデータを記憶するときに、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成し、
　上記各フラグメントデータを分散して上記各記憶手段に記憶する。
　さらに、上記情報処理装置は、上記各フラグメントデータを上記各記憶手段に記憶するときに、上記データセットを構成する上記各フラグメントデータを、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
という構成を採る。

　本発明は、以上のように構成されることにより、冗長性を維持しつつ、高速にデータを読み出すことが可能な高性能のストレージシステムを実現することができる。

本発明の実施形態１におけるストレージシステムを含むシステム全体の構成を示すブロック図である。本発明の実施形態１におけるストレージシステムの構成の概略を示すブロック図である。本発明の実施形態１におけるストレージシステムの構成を示す機能ブロック図である。図３に開示したストレージシステムにおけるデータ記憶処理の様子を説明するための説明図である。図３に開示したストレージシステムにおけるデータ記憶処理の様子を説明するための説明図である。図３に開示したストレージシステムにおけるデータ読み出し処理の様子を説明するための説明図である。図４に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図４に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図３に開示したストレージシステムの動作を示すフローチャートである。本発明の実施形態２におけるストレージシステムの構成を示す機能ブロック図である。図１０に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図１０に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図１０に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図１０に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図１０に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図１０に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。図１０に開示したストレージシステムの動作を示すフローチャートである。本発明の実施形態３におけるストレージシステムの構成を示す機能ブロック図である。

　＜実施形態１＞
　本発明の第１の実施形態を、図１乃至図９を参照して説明する。図１は、システム全体の構成を示すブロック図である。図２は、ストレージシステムの概略を示すブロック図であり、図３は、構成を示す機能ブロック図である。図４乃至図６は、ストレージシステムの動作を説明するための説明図である。図７乃至図８は、ストレージシステムにおけるデータの格納状態を示す図である。図９は、ストレージシステムの動作を示すフローチャートである。

　ここで、本実施形態は、後述する実施形態３にて開示するストレージシステムの具体的な一例を示すものである。そして、以下では、ストレージシステムが、複数台のサーバコンピュータが接続されて構成されている場合を説明する。但し、本発明におけるストレージシステムは、複数台のコンピュータにて構成されることに限定されず、１台のコンピュータで構成されていてもよい。

　［構成］
　図１に示すように、本発明におけるストレージシステム１０は、ネットワークＮを介してバックアップ処理を制御するバックアップシステム１１に接続している。そして、バックアップシステム１１は、ネットワークＮを介して接続されたバックアップ対象装置１２に格納されているバックアップ対象データ（記憶対象データ）を取得し、ストレージシステム１０に対して記憶するよう要求する。これにより、ストレージシステム１０は、記憶要求されたバックアップ対象データをバックアップ用に記憶する。

　そして、図２に示すように、本実施形態におけるストレージシステム１０は、複数のサーバコンピュータが接続されて構成を採っている。具体的に、ストレージシステム１０は、ストレージシステム１０自体における記憶再生動作を制御するサーバコンピュータであるアクセラレータノード１０Ａと、データを格納する記憶装置を備えたサーバコンピュータであるストレージノード１０Ｂと、を備えている。なお、アクセラレータノード１０Ａの数とストレージノード１０Ｂの数は、図２に示したものに限定されず、さらに多くの各ノード１０Ａ，１０Ｂが接続されて構成されていてもよい。

　さらに、本実施形態におけるストレージシステム１０は、データを分割及び冗長化し、分散して複数の記憶装置に記憶すると共に、このデータの内容に応じて特定される固有のコンテンツアドレスによって、当該データを格納した格納位置を特定するコンテンツアドレスストレージシステムである。具体的な構成については詳述する。

　また、以下では、ストレージシステム１０が１つのシステムであるとして、当該ストレージシステム１０が備えている構成及び機能を説明する。つまり、以下に説明するストレージシステム１０が有する構成及び機能は、アクセラレータノード１０Ａあるいはストレージノード１０Ｂのいずれに備えられていてもよい。なお、ストレージシステム１０は、図２に示すように、必ずしもアクセラレータノード１０Ａとストレージノード１０Ｂとを備えていることに限定されず、いかなる構成であってもよい。また、ストレージシステム１０は、コンテンツアドレスストレージシステムであることにも限定されない。

　図３に、ストレージシステム１０の構成を示す。この図に示すように、ストレージシステム１０は、データを記憶するデータ記憶装置３０と、当該データ記憶装置３０に対するデータの記憶及び読み出し動作を制御するデータ処理装置２０と、を備えている。なお、実際には、データ処理装置２０は、図２に示したアクセラレータノード１０Ａ及びストレージノード１０Ｂが備えているＣＰＵ（Central Processing Unit）などの複数の演算装置にて構成されている。また、記憶装置３０は、図２に示したアクセラレータノード１０Ａ及びストレージノード１０Ｂが備えているハードディスクなどの記憶装置にて構成されている。

　そして、図３に示すように、上記データ処理装置２０は、プログラムが組み込まれることにより構築された、ブロック生成部２１と、重複チェック部２２と、フラグメント生成部２３と、分散記憶制御部２４と、格納位置管理部２５と、を備えている。また、データ記憶装置３０は、バックアップ対象データを格納する複数の記憶装置３１と、格納したデータの位置を記憶する格納位置情報記憶部３２と、を備えている。以下、各構成について詳述する。同時に、上記各構成によるデータの処理の様子を、図４乃至図８を参照して説明する。なお、上記プログラムは、例えば、ＣＤ－ＲＯＭなどの記憶媒体に格納された状態でストレージシステム１０に提供される。あるいは、上記プログラムは、ネットワーク上の他のサーバコンピュータの記憶装置に記憶され、当該他のサーバコンピュータからネットワークを介してストレージシステム１０に提供されてもよい。

　まず、上記ブロック生成部２１は、図５の矢印Ｙ１に示すようにバックアップ対象データＡの入力を受けると、図４及び図５の矢印Ｙ２に示すように、当該バックアップ対象データＡを、所定容量（例えば、６４ＫＢ）のブロックデータＤに分割する。そして、このブロックデータＤのデータ内容に基づいて、当該データ内容を代表する固有のハッシュ値Ｈ（内容識別情報）を算出する（矢印Ｙ３）。なお、ハッシュ値Ｈは、例えば、予め設定されたハッシュ関数を用いて、ブロックデータＤのデータ内容に基づいて算出する。なお、このブロック生成部２１による処理は、アクセラレータノード１０Ａにて実行される。

　また、上記重複チェック部２２（重複チェック手段）は、バックアップ対象データＡのブロックデータＤのハッシュ値Ｈを用いて、当該ブロックデータＤが既に記憶装置３１に格納されているか否かを調べる。具体的には、まず、既に格納されているブロックデータＤは、そのハッシュ値Ｈと格納位置を表すコンテンツアドレスＣＡが、関連付けられてＭＦＩ（Ｍａｉｎ　Ｆｒａｇｍｅｎｔ　Ｉｎｄｅｘ）ファイルに登録されている。従って、重複チェック部２２は、格納前に算出したブロックデータＤのハッシュ値ＨがＭＦＩファイル内に存在している場合には、既に同一内容のブロックデータＤが格納されていると判断できる（図５の矢印Ｙ４）。この場合には、格納前のブロックデータＤのハッシュ値Ｈと一致したＭＦＩファイル内のハッシュ値Ｈに関連付けられているコンテンツアドレスＣＡを、当該ＭＦＩファイルから取得する。そして、このコンテンツアドレスＣＡを、記憶要求にかかるブロックデータＤのコンテンツアドレスＣＡとして返却する。これにより、このコンテンツアドレスＣＡにて参照される既に格納されているデータが、記憶要求されたブロックデータＤとして使用されることとなり、当該記憶要求にかかるブロックデータＤは記憶する必要がなくなる。

　なお、ストレージノード１０Ｂが複数存在する場合には、ブロックデータＤから上述したように算出したハッシュ値Ｈに基づいて、Write Initiator（WI）と呼ばれる、データ格納時の初期処理（後述する、圧縮処理やフラグメント化処理）を担当する１つのストレージノードが決定される。

　また、上記フラグメント生成部２３（データセット生成手段）は、上述したように重複チェック部２２にてまだ記憶されていないと判断されたブロックデータＤを、圧縮して、図５の矢印Ｙ５に示すように、複数の所定の容量のフラグメントデータに分割する。例えば、図４の符号Ｄ１～Ｄ９に示すように、９つのフラグメントデータ（分割データ４１）に分割する。さらに、フラグメント生成部２３は、分割したフラグメントデータのうちいくつかが欠けた場合であっても、元となるブロックデータを復元可能なよう冗長データを生成し、上記分割したフラグメントデータ４１に追加する。例えば、図４の符号Ｄ１０～Ｄ１２に示すように、３つのフラグメントデータ（冗長データ４２）を付加する。これにより、９つの分割データ４１と、３つの冗長データとにより構成される１２個のフラグメントデータからなるデータセット４０を生成する。なお、上記フラグメント生成部２３による処理は、上述したＷＩと呼ばれる１つのストレージノードによって実行される。

　また、上記分散記憶制御部２４（分散記憶制御手段）は、上記フラグメント生成部２３にて生成されたデータセットを構成する各フラグメントデータを、記憶装置３１に形成された各記憶領域に、それぞれ分散して格納する。例えば、図４に示すように、１２個のフラグメントデータＤ１～Ｄ１２を生成した場合には、１２個の記憶装置３１にそれぞれ形成したデータ格納ファイルＦ１～Ｆ１２（データ格納領域）に、各フラグメントデータＤ１～Ｄ１２を１つずつそれぞれ格納する（図６の矢印Ｙ６参照）。

　このとき、分散記憶制御部２４は、各データ格納ファイルＦ１～Ｆ１２内においてそれぞれ同一位置に、１つのデータセット４０を構成する各フラグメントデータＤ１～Ｄ１２をそれぞれ格納する。例えば、図７に示すように、各データ格納ファイルＦ１～Ｆ１２の先頭位置を基準とした同一位置に、全てのフラグメントデータＤ１～Ｄ１２を格納する。なお、図７の例では、図の上端をファイルの先頭としている。

　具体的に、分散記憶制御部２４は、各データ格納ファイルＦ１～Ｆ１２に対する格納位置を予め設定することなく、当該各データ格納ファイルＦ１～Ｆ１２に格納されているデータの次に空いている格納位置に、それぞれフラグメントデータＤ１～Ｄ１２を格納する。例えば、図８に示す例では、各データ格納ファイルＦ１～Ｆ１２の網掛け部分までそれぞれデータが既に格納されているが、その次の領域に、各フラグメントデータＤ１～Ｄ１２を格納して、データセット４０の格納位置が揃うようにする。また、特に、分散記憶制御手段２５は、一のデータセット４０を構成する各フラグメントデータＤ１～Ｄ１２を、同一のタイミングで各データ格納ファイルＦ１～Ｆ１２に格納する。

　さらに、分散記憶制御部２４は、データセット４０を構成する各フラグメントデータＤ１～Ｄ１２に、同一のデータセット４０を構成していることを識別するために、同一の識別情報（WriteRecordSeqNum）を付与して、各データ格納ファイルＦ１～Ｆ１２にそれぞれ格納する。そして、分散記憶制御部２４は、ストレージシステム１０のリソースが空いているときなど任意のタイミングで、上記識別情報を調べることで、同一のデータセット４０を構成している各フラグメントデータが、各データ格納ファイルＦ１～Ｆ１２内の同一の格納位置に格納されているか、ということを調べることができる。従って、分散記憶制御部２４は、各データ格納ファイルＦ１～Ｆ１２内の同一の格納位置に格納されている各フラグメントデータが、全て同一の識別情報（WriteRecordSeqNum）を含んでいなければ、当該各フラグメントデータが同一の格納位置に格納されるよう当該格納位置を修正して、データを再格納する。

　なお、上記では、分散記憶制御部２４が、データ格納ファイルといった論理的な各記憶領域内における同一位置に、データセット４０を構成する各フラグメントデータＤ１～Ｄ１２を格納することを説明したが、複数の各記憶装置３１内において物理的に同一位置に格納してもよい。

　また、上記格納位置管理部２４（格納位置情報管理手段）は、上述したように記憶装置３１に格納したフラグメントデータＤ１～Ｄ１２の格納位置、つまり、当該フラグメントデータＤ１～Ｄ１２にて復元されるブロックデータＤの格納位置を表す、コンテンツアドレスＣＡを生成して管理する。具体的には、格納したブロックデータＤの内容に基づいて算出したハッシュ値Ｈの一部（ショートハッシュ）（例えば、ハッシュ値Ｈの先頭８Ｂ（バイト））と、論理格納位置を表す情報と、を組み合わせて、コンテンツアドレスＣＡを生成する。そして、このコンテンツアドレスＣＡを、ストレージシステム１０内のファイルシステム、つまり、アクセラレータノード１０Ａに返却する（図５の矢印Ｙ７）。すると、アクセラレータノード１０Ａは、バックアップ対象データのファイル名などの識別情報と、コンテンツアドレスＣＡとを関連付けてファイルシステムで管理しておく。

　また、上記格納位置管理部２５は、ブロックデータＤのコンテンツアドレスＣＡと、当該ブロックデータＤのハッシュ値Ｈと、を関連付けて、各ストレージノード１０ＢがＭＦＩファイルにて管理する。このように、上記コンテンツアドレスＣＡは、ファイルを特定する情報やハッシュ値Ｈなどと関連付けられて、アクセラレータノード１０Ａやストレージノード１０Ｂの記憶装置３０に格納される（格納位置情報記憶部３２）。

　さらに、上記格納位置管理部２５は、上述したように格納したバックアップ対象データを読み出す制御を行う。例えば、ストレージシステム１０に対して、特定のファイルを指定して読み出し要求があると（図６の矢印Ｙ１１参照）、まず、ファイルシステムに基づいて、読み出し要求にかかるファイルに対応するハッシュ値の一部であるショートハッシュと論理位置の情報からなるコンテンツアドレスＣＡを指定する（図６の矢印Ｙ１２参照）。そして、格納位置管理部２５は、コンテンツアドレスＣＡがＭＦＩファイルに登録されているか否かを調べる（図６の矢印１３参照）。登録されていなければ、要求されたデータは格納されていないため、エラーを返却する。

　一方、読み出し要求にかかるコンテンツアドレスＣＡが登録されている場合には、上記コンテンツアドレスＣＡにて指定される格納位置を特定し、この特定された格納位置に格納されている各フラグメントデータを、読み出し要求されたデータとして読み出す（図６の矢印Ｙ１４参照）。このとき、各フラグメントが格納されているデータ格納ファイルＦ１～Ｆ１２と、当該データ格納ファイルのうち１つのフラグメントデータの格納位置が分かれば、同一の格納位置から他のフラグメントデータの格納位置を特定することができる。

　そして、格納位置管理部２６は、読み出し要求に応じて読み出した各フラグメントデータからブロックデータＤを復元する（図６の矢印Ｙ１５参照）。さらに、格納位置管理部２５は、復元したブロックデータＤを複数連結し、ファイルＡなどの一群のデータに復元して、読み出し制御を行っているアクセラレータノード１０Ａに返却する（図６の矢印Ｙ１６参照）。

　［動作］
　次に、上述したストレージシステムの動作を、図９のフローチャートを参照して説明する。

　はじめに、ストレージシステム１０が、所定のバックアップ対象装置１２からバックアップシステム１１を介してバックアップ対象データを受け、当該バックアップ対象データを記憶装置３１に記憶する動作（データ記憶工程）について説明する。

　まず、ストレージシステム１０、つまり、アクセラレータノード１０Ａは、バックアップ対象データＡを、所定容量（例えば、６４ＫＢ）のブロックデータＤに分割する（ステップＳ１）。そして、このブロックデータＤのデータ内容に基づいて、当該データ内容を代表する固有のハッシュ値Ｈ（内容識別情報）を算出する（ステップＳ２）。そして、このハッシュ値Ｈが、ＭＦＩファイルに登録されているか否かを調べる。

　このとき、登録されている場合には、当該データブロックＤのハッシュ値ＨにＭＦＩファイル内で関連付けられているコンテンツアドレスＣＡを、このデータブロックＤの格納位置として、ファイルシステムに返却する。つまり、バックアップ対象データと同一のデータが既に記憶されているため、この既に記憶されている同一のデータを用いて、バックアップ対象データを記憶したこととする。従って、後にこのバックアップ対象データを読み出す際には、ファイルシステムが上記コンテンツアドレスＣＡが表す格納位置のデータを読み出すことで、同一のデータを読み出すことができる。

　一方、ブロックデータＤのハッシュ値がＭＦＩファイルに登録されていなかった場合、つまり、ブロックデータＤと同一のデータが記憶装置３１に記憶されていなかった場合には、当該ブロックデータＤを記憶する処理に進む。このとき、まず、上述したように算出したハッシュ値の一部に基づいて、実際にデータを格納するストレージノード１０Ｂを特定し、また、そのうちの１つのストレージノード１０Ｂを、以下に説明するようブロックデータＤに対する記憶前処理を実行するWrite Initiator（WI）として決定する。

　続いて、上述したようにＷＩとして決定されたストレージノード１０Ｂは、ブロックデータＤを圧縮した後に、例えば、９つのフラグメントデータに分割する（ステップＳ３）。また、この分割データがいくつかが欠けた場合であっても、上記ブロックデータＤを復元できるよう、上記フラグメントデータに冗長データを例えば３つ付加する。そして、９つの分割データと３つの冗長データとにより構成される１２個とのフラグメントデータによるデータセットを生成する（ステップＳ４、データセット生成工程）。

　続いて、ＷＩとして決定されたストレージノード１０Ｂは、上記各フラグメントにデータセットを識別するためのＩＤを付与する（ステップＳ５）。つまり、一のブロックデータＤから分割されて生成されたデータセットを構成する各フラグメントデータには、全て同一のＩＤが付与される。そして、ストレージノード１０Ｂは、当該ストレージノード１０Ｂが装備している記憶装置３１や、他のストレージノード１０Ｂが装備している記憶装置３１内に、データの記憶先となる複数のデータ格納ファイルＦ１～Ｆ１２が存在するか確認し、各データ格納ファイルＦ１～Ｆ１２に、各フラグメントデータＤ１～Ｄ１２を格納する（ステップＳ６、分散記憶制御工程）。このとき、１つのフラグメントデータを１つのデータ格納ファイルに格納する。

　そして、上述した分散記憶の際には、ストレージノード１０Ｂは、各データ格納ファイルＦ１～Ｆ１２内における同一位置に、１つのデータセット４０を構成する各フラグメントデータＤ１～Ｄ１２をそれぞれ格納する。例えば、図７に示すように、各データ格納ファイルＦ１～Ｆ１２の先頭を基準とした同一位置に、全てのフラグメントデータＤ１～Ｄ１２を格納する。

　具体的な処理として、ストレージノード１０Ｂは、１つのデータセット４０の構成する各フラグメントデータＤ１～Ｄ１２を、同一のタイミングで各データ格納ファイルＦ１～Ｆ１２にそれぞれ格納する。そして、このとき、各データ格納ファイルＦ１～Ｆ１２に対する格納位置を予め設定することなく、当該各データ格納ファイルＦ１～Ｆ１２に格納されているデータの次に空いている格納位置に、それぞれフラグメントデータＤ１～Ｄ１２を格納する（ステップＳ６）。例えば、図８に示す例では、各データ格納ファイルＦ１～Ｆ１２の網掛け部分までそれぞれデータが既に格納されているが、その次の領域に、各フラグメントデータＤ１～Ｄ１２を格納して、データセット４０の位置が揃うようにする。

　そして、ストレージノード１０Ｂは、格納したブロックデータＤの内容に基づいて算出したハッシュ値Ｈの一部（先頭８Ｂ）と、論理格納位置を表す情報と、を組み合わせて、記憶装置３１に格納したフラグメントデータＤ１～Ｄ１２の格納位置を表す、コンテンツアドレスＣＡを生成する。そして、ストレージノード１０Ｂは、このコンテンツアドレスＣＡを、アクセラレータノード１０Ａに返却する。すると、アクセラレータノード１０Ａでは、返却されたコンテンツアドレスＣＡを、実際に記憶したバックアップ対象データのファイル名などと関連付けて、ファイルシステムにて管理する。

　また、ストレージノード１０Ｂは、上記生成したブロックデータＤのコンテンツアドレスＣＡと、当該ブロックデータＤのハッシュ値Ｈと、を関連付けて、各ストレージノード１０ＢがＭＦＩファイルにて管理する。このハッシュ値ＨとコンテンツアドレスＣＡとを管理するＭＦＩファイルは、上述したように、新たにバックアップ対象データを格納する際に、すでに同一内容のデータが格納されているか否かを確認するために用いられる。

　ここで、上述した各フラグメントデータＤ１～Ｄ１２を各データ格納ファイルＦ１～Ｆ１２に格納する際、つまり、ＷＩとして決定されたストレージノード１０Ｂから、他の各ストレージノード１０Ｂにフラグメントデータを格納する際には、当該ストレージノード１０Ｂ間で通信がダウンしたり、通信遅延が発生する場合が生じうる。その場合には、１つのデータセット４０の構成する全てのフラグメントデータＤ１～Ｄ１２が、各データ格納ファイルＦ１～Ｆ１２内の同一位置に格納されない事態が生じうる。このような事態を想定して、ストレージシステム１０では、リソースが空いているなど任意のタイミングで、すでに記憶されている各フラグメントデータＤ１～Ｄ１２に含まれるデータセット毎の識別情報（WriteRecordSeqNum）を参照して、一つのデータセット４０の構成する全てのフラグメントデータＤ１～Ｄ１２が、各データ格納ファイルＦ１～Ｆ１２内の同一位置に格納されるよう、再格納処理を行う。

　次に、ストレージシステム１０が、バックアップシステム１１を介してデータの読み出し要求を受け、記憶装置３１からデータを読み出す動作（データ読み出し工程）について説明する。

　ストレージシステム１０に読み出し要求があると、まず、アクセラレータノード１０Ａが読み出し要求にかかるファイルに対応するショートハッシュと論理位置の情報からなるコンテンツアドレスＣＡを指定する。そして、このコンテンツアドレスＣＡを受けたストレージノード１０Ｂは、当該コンテンツアドレスＣＡがＭＦＩファイルに登録されているか否かを調べ、登録されていなければ、要求されたデータは格納されていないため、エラーを返却する。

　一方、登録されている場合には、上記コンテンツアドレスＣＡに基づいて、読み出し要求にかかるデータを構成する各フラグメントデータの格納位置を特定する。このとき、各フラグメントが格納されているデータ格納ファイルＦ１～Ｆ１２と、当該データ格納ファイルのうち１つのフラグメントデータの格納位置が分かれば、同一の格納位置から他のフラグメントデータの格納位置を特定することができる。

　そして、ストレージノード１０Ｂは、読み出し要求に応じて読み出した各フラグメントデータからブロックデータＤを復元する。さらに、ストレージノード１０Ｂは、復元したブロックデータＤを複数連結し、ファイルＡなどの一群のデータに復元して、読み出し制御を行っているアクセラレータノード１０Ａに返却する。

　なお、仮に、記憶装置３１の障害により、１つのデータセットを構成する１２個のフラグメントデータのうち３つのフラグメントデータを読み取ることができなかった場合であっても、上述した３つの冗長データを付加している場合であれば、元のブロックデータを復元することができる。特に、１２個のフラグメントデータをそれぞれ異なる記憶装置３１（ディスク）に格納した場合には、３つの記憶装置３１の同時障害までは対応可能である。

　以上により、本実施形態におけるストレージシステム１０によると、記憶したデータを読み出す際に、当該データを構成するデータセットのうち１つのフラグメントデータの格納位置を特定することで、他のフラグメントデータの格納位置も容易に特定することができる。従って、データ読み出し時に、データセットを構成する全てのフラグメントの位置を特定する必要がなく、高速にデータを読み出すことができる。その結果、冗長性を維持しつつ、高速にデータを読み出すことが可能な高性能のストレージシステムを実現することができる。

　＜実施形態２＞
　次に、本発明の第２の実施形態を、図１０乃至図１７を参照して説明する。図１０は、ストレージシステムの構成を示す機能ブロック図である。図１１乃至図１６は、ストレージシステムの動作を説明するための説明図である。図１７は、ストレージシステムの動作を示すフローチャートである。

　［構成］
　図１０に示すように、本実施形態におけるストレージシステム１０は、上述した実施形態１におけるものとほぼ同様の構成を採っている。そして、本実施形態では、さらに、データ処理装置２０にプログラムが組み込まれることによって構築された、ストリームＩＤ付与部２６を備えている。また、これに伴い、分散記憶制御部２４などの構成が異なっている。以下、主に実施形態１と異なる点について詳述する。なお、上記プログラムは、ＣＤ－ＲＯＭなどの記憶媒体にてストレージシステム１０に提供されたり、他のサーバコンピュータからネットワークを介してストレージシステム１０に提供される。

　まず、上記ストリームＩＤ付与部２６（識別情報付与手段）は、バックアップ対象データＡの入力を受けると、一群のデータである当該バックアップ対象データＡを区別する識別情報であるストリームＩＤを付与する。例えば、バックアップ対象データＡに対してストリームＩＤ＝ＳＴ１を付与し、バックアップ対象データＢ（図示せず）に対してストリームＩＤ＝ＳＴ２を付与する。

　なお、ストリームＩＤは、バックアップ対象データを区別するのみならず、当該バックアップ対象データＡの出力元であるバックアップ対象装置１２を区別する情報であってもよい。つまり、ストリームＩＤ付与部２１は、所定のルールによりまとめられたバックアップ対象データ毎に、異なるストリームＩＤを付与する。

　また、上記ブロック生成部２１は、上述した実施形態１のものと同様に、バックアップ対象データＡを、所定容量（例えば、６４ＫＢ）のブロックデータＤに分割し、このブロックデータＤのデータ内容に基づくハッシュ値Ｈを算出する。そして、上記ブロック生成部２１は、バックアップ対象データＡをブロックデータＤに分割する際に、上述したようにバックアップ対象データＡに付与したストリームＩＤを、各ブロックデータＤにも引き継いで付与する。なお、上記ストリームＩＤ付与部２１は、上述したように、バックアップ対象データＡに対してストリームＩＤを付与することに限定されない。例えば、ブロック生成部２２にてバックアップ対象データＡをブロックデータＤに分割する際に、当該ブロックデータＤ毎にバックアップ対象データＡを識別する同一のストリームＩＤを付与してもよい。

　なお、上記重複チェック部２２は上述した実施形態１とほぼ同じ構成であるため、説明は省略する。また、上記フラグメント生成部２３は、上述同様に、ブロックデータＤを分割した分割データと、冗長データと、により構成される１２個のフラグメントデータからなるデータセット４０を生成する。

　そして、上記フラグメント生成部２３は、さらに、生成した全てのフラグメントデータＤ１～Ｄ１２に、当該フラグメントデータの元となるブロックデータＤ、つまり、フラグメントデータＤ１～Ｄ１２から復元されるブロックデータＤに付与されたストリームＩＤを、それぞれ付与する。

　また、上記分散記憶制御部２４は、上述した実施形態１と同様に、基本的には、記憶装置３１内に形成された各データ格納ファイルＦ１～Ｆ１２内における同一位置に、１つのデータセット４０を構成する各フラグメントデータＤ１～Ｄ１２を格納する。

　ここで、上述したように、フラグメントデータを格納した場合には、同時に複数のバックアップ対象データの記憶要求があると、図１１に示すように、各データ格納ファイルＦ１～Ｆ１２に、ストリームＩＤ（ＳＴ１，ＳＴ２，ＳＴ３）が異なる各データセットを構成する各フラグメントデータが交互に格納される事態が生じうる。なお、図１１では、ストリームＩＤが同一のデータセットを、同一の模様にて図示している。

　このため、本実施形態における分散記憶制御部２４では、各データ格納ファイルＦ１～Ｆ１２に格納する前に、各フラグメントデータＤ１～Ｄ１２をストリームＩＤ毎に区別して異なるバッファメモリに一旦格納する。そして、その後、バッファメモリ内のフラグメントデータＤ１～Ｄ１２を各データ格納ファイルＦ１～Ｆ１２に格納する。その具体例を、図１２乃至図１６を参照して説明する。

　まず、分散記憶制御部２４は、各データ格納ファイルＦ１～Ｆ１２毎に、それぞれストリームＩＤ毎のバッファメモリを設定する。例えば、３つのストリームＩＤ（ＳＴ１，ＳＴ２，ＳＴ３）に対応するバッファメモリＢＦ１，ＢＦ２，ＢＦ３を設定する場合には、図１２に示すように、１つのデータ格納ファイルＦ１に対して３つのバッファメモリＢＦ１，ＢＦ２，ＢＦ３を設定し、これを１２セット設定する。

　そして、分散記憶制御部２４は、フラグメントデータＤ１～Ｄ１２に含まれているストリームＩＤに対応するバッファメモリＢＦ１，ＢＦ２，ＢＦ３に、当該各フラグメントデータＤ１～Ｄ１２をそれぞれ格納する。例えば、図１２に示す例では、元となるブロックデータＤ（バックアップ対象データＡ）のデータセット４０がストリームＩＤ＝ＳＴ１であるとする。この場合には、データセット４０を構成する各フラグメントデータＤ１～Ｄ１２を、それぞれ後に格納先となる各データ格納ファイルＦ１～Ｆ１２にそれぞれ設定されたストリームＩＤ＝ＳＴ１の各バッファメモリＢＦ１に格納する。つまり、フラグメントデータＤ１をデータ格納ファイルＦ１のバッファメモリＢＦ１に格納し、フラグメントデータＤ２をデータ格納ファイルＦ２のバッファメモリＢＦ２に格納し、同様に、全てのデータ格納ファイルのバッファメモリに対してフラグメントデータを格納する。このとき、各フラグメントデータＤ１～Ｄ１２を、各バッファメモリＢＦ１～ＢＦ３内に既に格納されているデータの次に空いている格納領域に、全てを同時のタイミングで格納する。

　これにより、各バッファメモリＢＦ１～ＢＦ３内には、対応するストリームＩＤのフラグメントデータが連続して位置して格納される。また、このとき、同一のデータセットを構成する各フラグメントデータＤ１～Ｄ１２は、各バッファメモリＢＦ１～ＢＦ３内において同一の位置に格納される。例えば、図１２に示すように、データセット４０のフラグメントデータＤ１，Ｄ２を各バッファメモリＢＦ１に格納した場合には、図１３に示すように、当該バッファメモリＢＦ１のそれぞれ同一の位置である最後の格納位置に格納される。このように、各フラグメントデータをストリームＩＤ毎に振り分けて、当該ストリームＩＤに対応する各バッファメモリに格納していくことで、全てのデータ記憶ファイルＦ１～Ｆ１２にそれぞれ対応する特定のストリームＩＤの各バッファメモリが、どのタイミングにおいても全て同一の容量となる。例えば、図１３の例では、各バッファメモリＢＦ１は全ての同じ容量であり、その他のバッファメモリＢＦ２，ＢＦ３も、対応するストリームＩＤ毎に、全て同じ容量である。

　そして、分散記憶制御部２４は、上記各バッファメモリＢＦ１～ＢＦ３の容量が所定容量、例えば、満杯となったタイミングで、そのバッファメモリＢＦ１～ＢＦ３内の全てのフラグメントデータを、データ格納ファイルＦ１～Ｆ１２に格納する。例えば、図１３の例では、ストリームＩＤ＝ＳＴ１の全てのバッファメモリＢＦ１が同時に満杯となるため、当該各バッファメモリＢＦ１内のフラグメントデータを同一のタイミングで各データ格納ファイルＦ１～Ｆ１２に格納する。このとき、分散記憶制御部２４は、各データ格納ファイルＦ１～Ｆ１２に格納されているデータの次に空いている格納位置に、それぞれフラグメントデータＤ１～Ｄ１２を格納する。例えば、図１４に示す例では、各データ格納ファイルＦ１～Ｆ１２が空の状態である場合に、当該各データ格納ファイルＦ１～Ｆ１２の先頭からフラグメントデータを格納した様子を示している。

　すると、図１４に示すように、各データ格納ファイルＦ１～Ｆ１２では、同一のデータセット４０を構成する各フラグメントデータＤ１～Ｄ１２の格納位置が揃うよう格納される。このとき、さらに、同じストリームＩＤが付与されたデータセットが連続して格納されることとなる。なお、図１５には、その後、さらに別のストリームＩＤ（ＳＴ２）に対応するバッファメモリＢＦ２が満杯となり、当該バッファメモリＢＦ２内のフラグメントデータが、データ格納ファイルＦ１～Ｆ１２に格納されたときの様子を示している。

　また、本実施形態における分散記憶制御部２４は、上述したようにフラグメントデータをデータ格納ファイルに格納する時のみならず、さらに、すでに格納されたフラグメントデータに対しても、同一のストリームＩＤのフラグメントデータが連続して配置されるよう、事後的に格納位置を変更する機能も有する。例えば、ストレージシステム１０自体のリソースが所定値以上空いているときに、各データ格納ファイルＦ１～Ｆ１２に格納されているフラグメントデータを、ストリームＩＤが同一のものが連続するよう格納位置を移動する。具体的には、図１１に示すように、各データ格納ファイルＦ１～Ｆ１２の同一の格納位置（横一列）に格納されている全てのフラグメントデータの格納位置を、当該各フラグメントデータにて構成されるデータセット４０ごと、変更することができる。これにより、図１１に示すように、ストリームＩＤが異なるデータセットが交互に格納された状態から、図１６に示すように、同一のストリームＩＤ（ＳＴ１，ＳＴ２，ＳＴ３）のものが連続する格納状態にすることができる。なお、分散記憶制御装置２４が有するその他の機能は、上記実施形態１とほぼ同じである。

　ここで、上記では、フラグメント生成部２３にて、ブロックデータＤを分割してデータセット４０を生成する際に、当該データセット４０を構成する各フラグメントデータＤ１～Ｄ１２にそれぞれ同一のストリームＩＤを付与したが、必ずしも各フラグメントデータＤ１～Ｄ１２に付与する必要はない。例えば、ブロックデータＤから生成したデータセット４０を構成する各フラグメントデータＦ１～Ｆ１２を、当該ブロックデータＤに付与されたストリームＩＤに対応するデータバッファＢＦ１～ＢＦ３に格納することで、ストリームＩＤ毎にフラグメントデータを連続させて格納することができる。そして、その後は、同じデータセット４０を構成する各フラグメントデータＤ１～Ｄ１２は、各バッファメモリＢＦ１～ＢＦ３内及びデータ格納ファイルＦ１～Ｆ１２内で同一の格納位置に格納されているため、当該同一の格納位置にある全てのフラグメントデータの格納位置をまとめて変更することで、データセット毎の格納位置の変更が可能となる。

　また、上記格納位置管理部２５は、上述した実施形態２と同様に、データの格納位置をコンテンツアドレスＣＡで管理する。なお、その説明は省略する。

　［動作］
　次に、上述したストレージシステムの動作を、図１７のフローチャートを参照して説明する。

　ここで、以下では、ストレージシステム１０が、所定のバックアップ対象装置１２からバックアップシステム１１を介してバックアップ対象データを受け、当該バックアップ対象データを記憶装置３１に記憶する動作（データ記憶工程）について説明する。なお、上述した実施形態と同様の動作については、説明を省略する。

　まず、ストレージシステム１０、つまり、アクセラレータノード１０Ａは、バックアップ対象データＡの入力を受けると、一群のデータである当該バックアップ対象データＡを区別する識別情報であるストリームＩＤを付与する（ステップＳ１１、識別情報付与工程）。

　そして、アクセラレータノード１０Ａは、バックアップ対象データＡを、所定容量（例えば、６４ＫＢ）のブロックデータＤに分割する（ステップＳ１２）。そして、このブロックデータＤのデータ内容に基づいて、当該データ内容を代表する固有のハッシュ値Ｈ（内容識別情報）を算出する（ステップＳ１３）。そして、このハッシュ値Ｈが、ＭＦＩファイルに登録されているか否かを調べる。登録されている場合には、当該データブロックＤのハッシュ値ＨにＭＦＩファイル内で関連付けられているコンテンツアドレスＣＡを、このデータブロックＤの格納位置として、ファイルシステムに返却する。一方、ブロックデータＤのハッシュ値がＭＦＩファイルに登録されていなかった場合には、当該ブロックデータＤを記憶する処理を行う。

　なお、上述したようにバックアップ対象データＡをブロックデータＤに分割する際には、上述したようにバックアップ対象データＡに付与したストリームＩＤを、各ブロックデータＤにも引き継いで付与する。

　続いて、ストレージノード１０Ｂは、ブロックデータＤを圧縮した後に、例えば、９つのフラグメントデータに分割し（ステップＳ１４）、上記フラグメントデータに冗長データを例えば３つ付加する。そして、９つの分割データと３つの冗長データとにより構成される１２個のフラグメントデータによるデータセットを生成する（ステップＳ１５、データセット生成工程）。続いて、ストレージノード１０Ｂは、上記各フラグメントにデータセットを識別するためのＩＤを付与する（ステップＳ１６）。

　そして、ストレージノード１０Ｂは、各データ格納ファイルＦ１～Ｆ１２毎に、それぞれストリームＩＤ毎のバッファメモリを設定する。そして、フラグメントデータＤ１～Ｄ１２に含まれているストリームＩＤに対応するバッファメモリＢＦ１，ＢＦ２，ＢＦ３に、当該各フラグメントデータＤ１～Ｄ１２をそれぞれ格納する（ステップＳ１７）。このとき、各フラグメントデータＤ１～Ｄ１２を、各バッファメモリＢＦ１～ＢＦ３内に既に格納されているデータの次に空いている格納領域に、全て同時のタイミングで格納する。

　これにより、各バッファメモリＢＦ１～ＢＦ３内には、対応するストリームＩＤのフラグメントデータが連続して位置して格納される。また、このとき、同一のデータセットを構成する各フラグメントデータＤ１～Ｄ１２は、各バッファメモリＢＦ１～ＢＦ３内において同一の格納位置に格納される。

　その後、上記各バッファメモリＢＦ１～ＢＦ３の容量が所定容量、例えば、満杯となったタイミングで（ステップＳ１８でＹｅｓ）、そのバッファメモリＢＦ１～ＢＦ３内のフラグメントデータを、データ格納ファイルＦ１～Ｆ１２に格納する（ステップＳ１９、分散記憶制御工程）。このとき、各データ格納ファイルＦ１～Ｆ１２に格納されているデータの次に空いている格納位置に、それぞれフラグメントデータＤ１～Ｄ１２を格納する。なお、バッファメモリからデータ格納ファイルにフラグメントデータを格納するタイミングは、必ずしも上記タイミングに限定されない。例えば、ある基準時間から設定された時間が経過したタイミングで実行してもよい。

　これにより、ストレージノード１０Ｂは、各データ格納ファイルＦ１～Ｆ１２内において同一位置に、１つのデータセット４０を構成する全てのフラグメントデータＤ１～Ｄ１２を格納することができる。さらに、各データ格納ファイルＦ１～Ｆ１２内には、同一のストリームＩＤのデータが連続して格納されることとなる。

　また、ストレージノード１０Ｂは、上記生成したブロックデータＤのコンテンツアドレスＣＡと、当該ブロックデータＤのハッシュ値Ｈと、を関連付けて、ＭＦＩファイルにて管理する。このハッシュ値ＨとコンテンツアドレスＣＡとを管理するＭＦＩファイルは、上述したように、新たにバックアップ対象データを格納する際に、すでに同一内容のデータが格納されているか否かを確認するために用いられる。

　その後、例えば、ストレージシステム１０自体のリソースが所定値以上空いているときなどの任意のタイミングで（ステップＳ２０でＹｅｓ）、すでに格納されたフラグメントデータに対して、同一のストリームＩＤのフラグメントデータが連続して配置されるよう、事後的に格納位置を変更する処理を実行する（ステップＳ２１）。この処理は、各データ格納ファイルＦ１～Ｆ１２の同一の格納位置に格納されている各フラグメントデータ内のストリームＩＤを調べ、なるべく多くの同じストリームＩＤのフラグメントデータつまりデータセットの格納位置が連続するよう、当該フラグメントデータの格納位置を変更する。

　以上により、本実施形態におけるストレージシステム１０によると、記憶したデータを読み出す際に、当該データを構成するデータセットのうち１つのフラグメントデータの格納位置を特定することで、他のフラグメントデータの格納位置も容易に特定することができる。また、一群のデータを構成する複数の記憶対象データが連続して記憶されるため、関連する内容のデータがまとまって記憶されることとなる。従って、ストレージシステムが記憶したデータを読み出す際に、関連するデータをまとめて読み出すことが可能となる。その結果、データ読み出し速度及び効率の向上を図ることができ、ストレージシステムの性能の向上を図ることができる。

　＜実施形態３＞
　本発明の第３の実施形態を、図１８を参照して説明する。図１８は、ストレージシステムの構成を示す機能ブロック図である。なお、本実施形態では、ストレージシステムの概略を説明する。

　図１８に示すように、本実施形態におけるストレージシステム１は、
　複数の記憶手段５と、これら複数の記憶手段５に対してデータを記憶すると共に当該記憶手段５に記憶されているデータを読み出すデータ処理手段２と、を備えている。

　そして、上記データ処理手段２は、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段３と、
　上記各フラグメントデータを分散して上記各記憶手段に記憶する分散記憶制御手段４と、を備える。

　さらに、上記分散記憶制御手段４は、上記データセットを構成する上記各フラグメントデータを、上記各記憶手段５に形成された各記憶領域内の同一位置にそれぞれ格納する、
という構成を採る。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記各記憶手段に生成された各ファイルのデータ格納領域の先頭を基準とした同一位置に、上記データセットを構成する上記各フラグメントデータをそれぞれ格納する、
という構成を採る。

　上記発明によると、まず、ストレージシステムは、上位ホストからのデータ記憶要求により記憶対象データを受け付ける。そして、記憶対象データを複数の分割データに分割すると共に、当該記憶対象データを復元するための冗長データを生成し、これら分割データと冗長データとである複数のフラグメントデータから成るデータセットを生成する。続いて、ストレージシステムは、１つのデータセットを構成する各フラグメントデータを各記憶手段に分散して記憶する。このとき、ストレージシステムは、一のデータセットを構成する各フラグメントデータを、各記憶手段内に形成された各記憶領域内、例えば、各ファイルのデータ格納領域の先頭から同一位置に格納する。

　これにより、ストレージシステムが記憶したデータを読み出す際には、当該データを構成するデータセットのうち１つのフラグメントデータの格納位置を特定することで、他のフラグメントデータの格納位置も容易に特定することができる。従って、データ読み出し時に、データセットを構成する全てのフラグメントの位置を特定する必要がなく、高速にデータを読み出すことができる。その結果、冗長性を維持しつつ、高速にデータを読み出すことが可能な高性能のストレージシステムを実現することができる。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記各記憶手段に生成された各ファイルに既に格納されているデータの次に空いている格納位置に、上記データセットを構成する上記各フラグメントデータをそれぞれ格納する、
という構成を採る。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータを、同一のタイミングで上記各記憶手段にそれぞれ格納する、
という構成を採る。

　上述したように、分散記憶制御手段にて各フラグメントデータを各記憶手段内にそれぞれ格納することで、簡易な処理にてデータセットを構成する各フラグメントデータを同一位置にそれぞれ格納することができる。従って、データ記憶処理も高速化することができる。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータに、当該データセットを識別するための同一の識別情報をそれぞれ付与して、当該データセットを構成する上記各フラグメントデータを上記各記憶手段にそれぞれ格納する、
という構成を採る。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータが上記各記憶手段に形成された上記各記憶領域内のそれぞれ同一位置に格納されているか否かを、当該各フラグメントデータに付与された上記識別情報に基づいて調べ、当該各フラグメントデータが上記各記憶領域内の同一位置に格納されていない場合に、上記データセットを構成する上記各フラグメントデータが上記各記憶領域内の同一位置にそれぞれ格納されるよう当該各フラグメントデータの格納位置を変更する、
という構成を採る。

　これにより、データセットを構成する各フラグメントデータには、同一の識別情報が付与されて複数の記憶手段に格納される。従って、既に記憶されているフラグメントデータに付与されている識別情報を調べることで、一のデータセットを構成する各フラグメントデータが各記憶手段の同一位置に格納されているか否かを判別できる。そして、各フラグメントデータに含まれる識別情報に基づいて、各記憶手段に格納された当該フラグメントデータの格納位置を変更することができる。その結果、上述同様に、一のデータセットを構成する各フラグメントデータを、各記憶手段内に形成された記憶領域内においてそれぞれ同一位置に格納することができ、高速にデータを読み出すことが可能となる。

　また、上記ストレージシステムでは、
　上記データ処理手段は、上記分散記憶制御手段にて上記各記憶手段に格納した上記記憶対象データの格納位置を表す格納位置情報を生成して管理する格納位置情報管理手段を備え、
　この格納位置情報管理手段は、データの読み出し要求時に特定された当該データの上記格納位置情報に基づいて、当該格納位置情報にて表される上記各記憶手段内の格納位置に格納されたデータを読み出す、
という構成を採る。

　また、上記ストレージシステムでは、
　上記データ処理手段は、上記記憶対象データの内容に固有の内容識別情報を生成すると共に、上記各記憶手段に既に格納されている記憶対象データの内容に固有の内容識別情報と比較して、上記各記憶手段に同一内容の上記記憶対象データが記憶されているか否かを調べる重複チェック手段を備え、
　当該重複チェック手段は、上記記憶対象データと同一内容のデータが既に上記各記憶手段に記憶されている場合に、当該記憶対象データを上記各記憶手段に格納せず、当該記憶対象データの格納位置情報として上記同一内容のデータの格納位置情報を用いる、
という構成を採る。

　これにより、記憶対象データの内容に基づいて当該データの格納した位置を表す格納位置情報を特定するコンテンツアドレスストレージシステムに、上述した構成を適用することができる。従って、既に記憶されているデータと同一内容の記憶対象データを重複して記憶することを抑制することができ、データ記憶使用量を低減でき、システム自体の低コスト化を図ることができる。

　また、上記ストレージシステムでは、
　さらに、上記データ処理手段が、記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与手段を備えている。
　そして、上記分散記憶制御手段は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、という構成を採る。

　これにより、記憶手段には、一群のデータを構成する複数の記憶対象データが連続して記憶されるため、関連する内容のデータがまとまって記憶されることとなる。従って、ストレージシステムが記憶したデータを読み出す際に、関連するデータをまとめて読み出すことが可能となる。その結果、データ読み出し速度及び効率の向上を図ることができ、ストレージシステムの性能の向上を図ることができる。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記記憶手段に格納される前であって、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、バッファメモリ内の格納位置が連続するよう格納し、当該バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記識別番号毎にそれぞれ異なる上記バッファメモリに格納し、当該識別番号毎にそれぞれ設けられた上記各バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記バッファメモリの容量が所定容量に達したタイミングで、当該バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。

　これにより、ストレージシステムは、一旦、バッファメモリに、一群のデータが連続するよう格納し、その後、記憶手段に格納する。従って、関連する内容のデータをまとめて格納する処理が簡易となり、ストレージシステムの性能の向上を図ることができる。

　また、上記ストレージシステムでは、
　上記分散記憶制御手段は、上記各記憶手段に既に格納されている、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に再格納する、
という構成を採る。

　これにより、ストレージシステムは、すでに記憶手段に格納したデータであっても、後に、一群のデータを構成する記憶対象データが連続するよう再格納する。従って、その後のデータ読み出し速度及び効率の向上を図ることができる。

　また、上記ストレージシステムでは、
　上記データセット生成手段は、上記識別情報付与手段にて上記一群のデータに付与された上記識別情報を、当該一群のデータに含まれる複数の上記記憶対象データに対応する上記データセットを構成する上記各フラグメントデータに含める、
という構成を採る。

　これにより、各記憶領域に格納する各フラグメントデータが、どの一群のデータに属しているものであるかを容易に把握することができる。従って、各フラグメントデータに含まれる識別情報に基づいて、一群のデータに含まれる記憶対象データを連続して格納する処理を容易に実行することができる。

　また、上述したストレージシステムは、情報処理装置（システム）に、プログラムが組み込まれることで実現できる。
　具体的に、本発明の他の形態であるプログラムは、
　複数の記憶手段を備えた情報処理装置に、
　上記複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段を実現させるプログラムである。

　そして、上記データ処理手段は、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
　上記各フラグメントデータを分散して上記各記憶手段に記憶する分散記憶制御手段と、を備える。

　さらに、上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータを、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
という構成を採る。

　また、上記プログラムでは、
　上記分散記憶制御手段は、上記各記憶手段に生成された各ファイルのデータ格納領域の先頭を基準とした同一位置に、上記データセットを構成する上記各フラグメントデータをそれぞれ格納する、
という構成を採る。

　また、上述したストレージシステムが作動することにより実行される、本発明の他の形態であるデータ処理方法は、
　複数の記憶手段を備えた情報処理装置が、
　上記複数の記憶手段に対してデータを記憶し、上記記憶手段に記憶されているデータを読み出す。

　そして、上記情報処理装置は、
　上記複数の記憶手段に対してデータを記憶するときに、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成し、
　上記各フラグメントデータを分散して上記各記憶手段に記憶する。

　さらに、上記情報処理装置は、上記各フラグメントデータを上記各記憶手段に記憶するときに、上記データセットを構成する上記各フラグメントデータを、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
という構成を採る。

　また、上記データ処理方法では、
　上記各フラグメントデータを上記各記憶手段に記憶するときに、上記各記憶手段に生成された各ファイルのデータ格納領域の先頭を基準とした同一位置に、上記データセットを構成する上記各フラグメントデータをそれぞれ格納する、
という構成を採る。

　上述した構成を有する、プログラム、又は、データ処理方法、の発明であっても、上記ストレージシステムと同様の作用を有するために、上述した本発明の目的を達成することができる。

　以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。

　なお、本発明は、日本国にて２００９年１月２７日に特許出願された特願２００９－０１５２６１の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。

　本発明は、複数のコンピュータを接続して構成されるストレージシステムに利用することができ、産業上の利用可能性を有する。

１　ストレージシステム
２　データ処理手段
３　識別情報付与手段
４　データセット生成手段
５　分散記憶制御手段
６　記憶手段
１０　ストレージシステム
１０Ａ　アクセラレータノード
１０Ｂ　ストレージノード
１１　バックアップシステム
１２　バックアップ対象装置
２０　データ処理装置
２１　ブロック生成部
２２　重複チェック部
２３　フラグメント生成部
２４　分散記憶制御部
２５　格納位置管理部
２６　ストリームＩＤ付与部
３０　データ記憶装置
３１　記憶装置
３２　格納位置記憶部
４０　データセット
４１　分割データ
４２　冗長データ
Ａ　バックアップ対象データ
ＢＦ１，ＢＦ２，ＢＦ３　バッファメモリ
ＣＡ　コンテンツアドレス
Ｄ　ブロックデータ
Ｄ１～Ｄ１２　フラグメントデータ
Ｆ１～Ｆ１２　データ格納ファイル
Ｈ　ハッシュ値

Claims

　複数の記憶手段と、これら複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段と、を備え、
　前記データ処理手段は、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、前記分割データと前記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
　前記各フラグメントデータを分散して前記各記憶手段に記憶する分散記憶制御手段と、を備え、
　前記分散記憶制御手段は、前記データセットを構成する前記各フラグメントデータを、前記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
ストレージシステム。
　請求項１に記載のストレージシステムであって、
　前記分散記憶制御手段は、前記各記憶手段に生成された各ファイルのデータ格納領域の先頭を基準とした同一位置に、前記データセットを構成する前記各フラグメントデータをそれぞれ格納する、
ストレージシステム。
　請求項１又は２に記載のストレージシステムであって、
　前記分散記憶制御手段は、前記各記憶手段に生成された各ファイルに既に格納されているデータの次に空いている格納位置に、前記データセットを構成する前記各フラグメントデータをそれぞれ格納する、
ストレージシステム。
　請求項１乃至３のいずれか一項に記載のストレージシステムであって、
　前記分散記憶制御手段は、前記データセットを構成する前記各フラグメントデータを、同一のタイミングで前記各記憶手段にそれぞれ格納する、
ストレージシステム。
　請求項１乃至４のいずれか一項に記載のストレージシステムであって、
　前記分散記憶制御手段は、前記データセットを構成する前記各フラグメントデータに、当該データセットを識別するための同一の識別情報をそれぞれ付与して、当該データセットを構成する前記各フラグメントデータを前記各記憶手段にそれぞれ格納する、
ストレージシステム。
　請求項５に記載のストレージシステムであって、
　前記分散記憶制御手段は、前記データセットを構成する前記各フラグメントデータが前記各記憶手段に形成された前記各記憶領域内のそれぞれ同一位置に格納されているか否かを、当該各フラグメントデータに付与された前記識別情報に基づいて調べ、当該各フラグメントデータが前記各記憶領域内の同一位置に格納されていない場合に、前記データセットを構成する前記各フラグメントデータが前記各記憶領域内の同一位置にそれぞれ格納されるよう当該各フラグメントデータの格納位置を変更する、
ストレージシステム。
　請求項１乃至６のいずれか一項に記載のストレージシステムであって、
　前記データ処理手段は、前記分散記憶制御手段にて前記各記憶手段に格納した前記記憶対象データの格納位置を表す格納位置情報を生成して管理する格納位置情報管理手段を備え、
　この格納位置情報管理手段は、データの読み出し要求時に特定された当該データの前記格納位置情報に基づいて、当該格納位置情報にて表される前記各記憶手段内の格納位置に格納されたデータを読み出す、
ストレージシステム。
　請求項７に記載のストレージシステムであって、
　前記データ処理手段は、前記記憶対象データの内容に固有の内容識別情報を生成すると共に、前記各記憶手段に既に格納されている記憶対象データの内容に固有の内容識別情報と比較して、前記各記憶手段に同一内容の前記記憶対象データが記憶されているか否かを調べる重複チェック手段を備え、
　当該重複チェック手段は、前記記憶対象データと同一内容のデータが既に前記各記憶手段に記憶されている場合に、当該記憶対象データを前記各記憶手段に格納せず、当該記憶対象データの格納位置情報として前記同一内容のデータの格納位置情報を用いる、
ストレージシステム。
　複数の記憶手段を備えた情報処理装置に、
　前記複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段を実現すると共に、
　前記データ処理手段は、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、前記分割データと前記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
　前記各フラグメントデータを分散して前記各記憶手段に記憶する分散記憶制御手段と、を備え、
　前記分散記憶制御手段は、前記データセットを構成する前記各フラグメントデータを、前記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
プログラム。
　請求項９に記載のプログラムであって、
　前記分散記憶制御手段は、前記各記憶手段に生成された各ファイルのデータ格納領域の先頭を基準とした同一位置に、前記データセットを構成する前記各フラグメントデータをそれぞれ格納する、
プログラム。
　複数の記憶手段を備えた情報処理装置が、
　前記複数の記憶手段に対してデータを記憶し、前記記憶手段に記憶されているデータを読み出すと共に、
　前記複数の記憶手段に対してデータを記憶するときに、
　記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、前記分割データと前記冗長データとである複数のフラグメントデータからなるデータセットを生成し、
　前記各フラグメントデータを分散して前記各記憶手段に記憶し、
　前記各フラグメントデータを前記各記憶手段に記憶するときに、前記データセットを構成する前記各フラグメントデータを、前記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納する、
データ処理方法。
　請求項１１に記載のデータ処理方法であって、
　前記各フラグメントデータを前記各記憶手段に記憶するときに、前記各記憶手段に生成された各ファイルのデータ格納領域の先頭を基準とした同一位置に、前記データセットを構成する前記各フラグメントデータをそれぞれ格納する、
データ処理方法。