JP2013174984A - ストレージシステム - Google Patents

ストレージシステム Download PDF

Info

Publication number
JP2013174984A
JP2013174984A JP2012038143A JP2012038143A JP2013174984A JP 2013174984 A JP2013174984 A JP 2013174984A JP 2012038143 A JP2012038143 A JP 2012038143A JP 2012038143 A JP2012038143 A JP 2012038143A JP 2013174984 A JP2013174984 A JP 2013174984A
Authority
JP
Japan
Prior art keywords
data
storage
fragment
stored
constituting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012038143A
Other languages
English (en)
Other versions
JP5891842B2 (ja
Inventor
Sumudu Dematapitiya
スムドゥ デマタピティヤ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012038143A priority Critical patent/JP5891842B2/ja
Publication of JP2013174984A publication Critical patent/JP2013174984A/ja
Application granted granted Critical
Publication of JP5891842B2 publication Critical patent/JP5891842B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】記録したデータの信頼性の向上を図るストレージシステムを提供すること。
【解決手段】本発明のストレージシステムは、複数の記憶手段と、記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータを生成して、当該複数のフラグメントデータを複数の記憶手段に分散して記憶する分散記憶処理手段と、障害が発生した記憶手段に記憶されていた記憶対象データを構成するフラグメントデータを再生成するデータ再生成手段と、を備える。そして、上記データ再生手段は、記憶対象データを構成するフラグメントデータのうちの冗長データの数に基づく優先順位にて、他のフラグメントデータに基づいて障害が発生した記憶手段に記憶されていた記憶対象データを構成するフラグメントデータの再生成を行う。
【選択図】図16

Description

本発明は、ストレージシステムにかかり、特に、データを分散して複数の記憶装置に記憶するストレージシステムに関する。
近年、コンピュータの発達及び普及に伴い、種々の情報がデジタルデータ化されている。このようなデジタルデータを保存しておく装置として、磁気テープや磁気ディスクなどの記憶装置がある。そして、保存すべきデータは日々増大し、膨大な量となるため、大容量なストレージシステムが必要となっている。また、記憶装置に費やすコストを削減しつつ、信頼性も必要とされる。これに加えて、後にデータを容易に取り出すことが可能であることも必要である。その結果、自動的に記憶容量や性能の増大を実現できると共に、重複記憶を排除して記憶コストを削減し、さらには、冗長性の高いストレージシステムが望まれている。
このような状況に応じて、近年では、特許文献1に示すように、コンテンツアドレスストレージシステムが開発されている。このコンテンツアドレスストレージシステムは、データを分散して複数の記憶装置に記憶すると共に、このデータの内容に応じて特定される固有のコンテンツアドレスによって、当該データを格納した格納位置が特定される。
具体的に、コンテンツアドレスストレージシステムでは、所定のデータを分割したブロックデータを複数のフラグメントデータにさらに分割すると共に、冗長データ(パリティデータ)となるフラグメントデータを付加して、これら複数のフラグメントデータを複数の記憶装置に分散して格納している。そして、後に、コンテンツアドレスを指定することにより、当該コンテンツアドレスにて特定される格納位置に格納されているデータつまりフラグメントデータを読み出し、複数のフラグメントデータから分割前の所定のデータを復元することができる。
また、上記コンテンツアドレスは、データの内容に応じて固有となるよう生成される。このため、重複データであれば同じ格納位置のデータを参照することで、同一内容のデータを取得することができる。従って、重複データを別々に格納する必要がなく、重複記録を排除し、データ容量の削減を図ることができる。
ここで、上述した各フラグメントデータには、当該フラグメントデータの元となるブロックデータの情報を含むメタデータが関連付けられて記憶される。例えば、メタデータには、各フラグメントデータを格納するコンポーネント構成情報、パリティ設定などの制御情報が含まれ、同一のブロックデータに所属する各フラグメントデータのメタデータは同一内容となる。そして、各ストレージノードに、フラグメントデータおよびメタデータの保存先をディスクやノードの状態を意識せずに格納するため、コンポーネントと呼ばれる論理的な容器をn個予め用意する。コンポーネントは複数のディスクにまたがった配置が可能であり、一つのブロックデータを構成するフラグメントデータは、それぞれ各コンポーネントに一つしか保存されない特徴がある。コンポーネントの各ノードに対する配置およびディスクに対する配置は、システムによって自律的に行われる。また、データ書き込みの際、既に保存済みブロックデータと同じ内容のブロックデータが書き込まれた場合には、重複排除され、同じフラグメントデータは二回書き込まれない、こととなる。
そして、上記のようなストレージシステムにおいて、データを記憶するストレージノードに障害が生じ、当該ストレージノードがシステムから切り離された場合には、そのストレージノード上のコンポーネントは他のストレージノード上で再生成される。つまり、上述したストレージシステムでは、所定のデータを複数のフラグメントデータに分割すると共に、冗長データとなるフラグメントデータをさらに付加しているため、このうち所定のフラグメントを失ったとしても、他のフラグメントからデータを復元することができる。なお、ストレージノード内のディスクやコンポーネントに障害が生じた場合も同様である。
ここで、特許文献2に開示された、ストレージノードに障害が発生した場合における当該ストレージノードに記憶されていたデータの再生成処理について、図1及び図2を参照して説明する。
まず、図1の上側に示すように、複数のストレージノード401〜404を装備したストレージシステム300において、各ストレージノード401等にそれぞれ形成された各コンポートネント1〜12に、記憶対象データであるブロックデータを分割すると共に冗長データを付加したフラグメントデータが分散して格納されている。このような状態において、所定のストレージノードに障害が生じたとすると、直ちに残りのストレージノードに保存されているフラグメントデータから、失われたフラグメントデータを再生成する処理が開始される。
具体的に、再生成処理では、まず、図1の下側に示すように、障害が生じたストレージノード404に形成されていたデータを格納するコンポーネント10,11,12を、作動しているストレージノード401〜403に再生成する。そして、図2の上側に示すように、作動しているストレージノード401〜403に記憶されているフラグメントデータ1〜9を読み込み、かかるフラグメントデータ1〜9から当該フラグメントデータの元となるブロックデータDを再生成し、そのデータDを再度分割することで失ったフラグメントデータを再生成する。その後、図2の下側に示すように、再生成したフラグメントデータを新たに生成したコンポーネント10,11,12内、つまり、作動している各ストレージノード401〜403に分散して格納する。なお、この一連の処理が完了するまで一部のデータはアクセス不可能である。
特開2005−235171号公報 特開2011−154428号公報
一方で、上述したストレージシステムにおいては、ファイルシステム毎に冗長データであるパリティの数を自由に設定可能である。すると、同一コンポーネント内に異なる数のパリティを持ったデータが混在することとなるため、同一の物理ディスク上にも異なるパリティのデータが保存される。すると、複数のストレージノードにて構成されたストレージシステムにおいて、あるノード/ディスクに障害が発生した場合、フラグメントデータの一部を失うこととなるが、障害が発生したノード/ディスクの数と、設定されたパリティの数とによっては、残りのフラグメントデータからデータを再生成できない、という問題が生じる。例えば、パリティの数がx個であるデータが記憶されていた場合に、x個のノードに障害が生じたとしても、かかる場合にはデータ再生成が可能である。ところが、かかるデータの再生成が完了しない状態で多重にノード/ディスク障害が発生することによりさらにy個のフラグメントが読めなくなった場合、パリティの数がx個から(x+y−1)個までのデータが再生成不可能な状態(データロス)となってしまう。
以上のように、上述したストレージシステムでは、ノードの障害によって記憶したデータが消失する可能性も生じ、信頼性が低下する、という問題がある。
このため、本発明の目的は、上述した課題である、重複記録排除機能を有するストレージシステムにおける、記録したデータの信頼性の低下という問題を解決する、ことにある。
本発明の一形態であるストレージシステムは、
複数の記憶手段と、
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータを生成して、当該複数のフラグメントデータを前記複数の記憶手段に分散して記憶する分散記憶処理手段と、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段と、を備え、
前記データ再生手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
という構成をとる。
また、本発明の他の形態である情報処理装置は、
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータが分散して記憶される複数の記憶手段のうち少なくとも1つを備えた情報処理装置であって、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段を備え、
前記データ再生手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
という構成をとる。
また、本発明の他の形態であるプログラムは、
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータが分散して記憶される複数の記憶手段のうち少なくとも1つを備えた情報処理装置に、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段を実現させると共に、
前記データ再生手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
ことを実現させるためのプログラムである。
また、本発明の他の形態である情報処理方法は、
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータを生成して、当該複数のフラグメントデータを複数の記憶手段に分散して記憶すると共に、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成する際に、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
という構成をとる。
本発明は、以上のように構成されるため、重複記録排除機能を有するストレージシステムにおいて、記録したデータの信頼性の向上を図ることができる。
本発明に関連するストレージシステムの動作を示す図である。 本発明に関連するストレージシステムの動作を示す図である。 本発明の実施形態1におけるシステム全体の構成を示すブロック図である。 図3に開示したストレージシステムの構成の概略を示すブロック図である。 図4に開示したストレージシステムの構成を示すブロック図である。 図5に開示したストレージシステムの動作を説明するための説明図である。 図5に開示したストレージシステムの動作を説明するための説明図である。 図5に開示したストレージシステムの動作を説明するための説明図である。 図5に開示したストレージシステムの動作を説明するための説明図である。 図5に開示したストレージシステムの動作を説明するための説明図である。 図5に開示したストレージシステムの動作を説明するための説明図である。 図5に開示したストレージシステムの動作を説明するための説明図である。 図6に開示したストレージシステムの動作を示すフローチャートである。 図6に開示したストレージシステムの動作を示すフローチャートである。 図6に開示したストレージシステムの動作を示すフローチャートである。 本発明の付記1におけるストレージシステムの構成を示すブロック図である。
<実施形態1>
本発明の第1の実施形態を、図3乃至図15を参照して説明する。図3は、システム全体の構成を示すブロック図である。図4は、ストレージシステムの概略を示すブロック図であり、図5は、ストレージシステムの詳細な構成を示すブロック図である。図6乃至図12は、ストレージシステムの動作を説明するための説明図であり、図13乃至図15は、ストレージシステムの動作を示すフローチャートである。
ここで、本実施形態では、ストレージシステムが、複数台のサーバコンピュータが接続されて構成されている場合を説明する。但し、本発明におけるストレージシステムは、複数台のコンピュータにて構成されることに限定されず、1台のコンピュータ(情報処理装置)で構成されていてもよい。
図3に示すように、本発明におけるストレージシステム10は、ネットワークNを介してバックアップ処理を制御するバックアップシステム11に接続している。そして、バックアップシステム11は、ネットワークNを介して接続されたバックアップ対象装置12に格納されているバックアップ対象データを取得し、ストレージシステム10に対して記憶するよう要求する。これにより、ストレージシステム10は、記憶要求されたバックアップ対象データをバックアップ用に記憶する。なお、本実施形態におけるストレージシステム10は、バックアップ対象データを記憶する場合を例示して説明するが、それは一例であって、いかなるデータを記憶してもよい。
そして、図4に示すように、本実施形態におけるストレージシステム10は、複数のサーバコンピュータが接続されて構成を採っている。具体的に、ストレージシステム10は、ストレージシステム10自体における記憶再生動作を制御するサーバコンピュータであるアクセラレータノード20と、データを格納する記憶装置(記憶手段)を備えたサーバコンピュータであるストレージノード30と、を備えている。なお、アクセラレータノード20の数とストレージノード30の数は、図3に示したものに限定されず、さらに多くの各ノード20,30が接続されて構成されていてもよい。
さらに、本実施形態におけるストレージシステム10は、データを分割及び冗長化し、分散して複数の記憶装置に記憶すると共に、記憶するデータの内容に応じて設定される固有のコンテンツアドレスによって、当該データを格納した格納位置を特定するコンテンツアドレスストレージシステムである。このコンテンツアドレスストレージシステムについては、後に詳述する。
図5に、ストレージシステム10の構成を示す。この図に示すように、まず、ストレージシステム10を構成するアクセラレータノード20は、装備されたCPU(Central Processing Unit)などの演算装置にプログラムが組み込まれることによって構成された、ファイルシステムサービス21と、ブロック分割処理部22と、重複排除処理部23と、分散処理部24と、を備えている。なお、上述した機能の全部または一部は、ストレージシステム10を構成するストレージノード30に装備されていてもよい。以下、ストレージシステム10の各構成について詳述すると共に、その動作を図13乃至図15のフローチャートを参照して説明する。
上記ファイルシステムサービス21は、バックアップ対象装置12から送信されるバックアップ対象となるデータの入力を受け、当該データをストレージノード30に格納する動作を制御するファイルシステムとして機能するものである。このとき、ファイルシステムサービス21は、例えば、図8を参照して後述するように、バックアップ対象装置12の種類に応じて複数存在し(ファイルシステム1,2,3等)、それぞれデータ(ブロックデータ(記憶対象データ))に対して異なる数の冗長データ(パリティデータ)を付加する。
上記ブロック分割処理部22と、重複排除処理部23と、分散処理部24とは、具体的に、バックアップ対象となるデータをストレージノード30に分散記憶したり、当該ストレージノード30に記憶されているデータを読み出す処理を行う。ここで、上記各処理部22,23,24による分散記憶処理の一例を図6及び図7に示す。
まず、ストレージシステム10は、バックアップ対象データであるデータAの入力を受けると(図6、図7の矢印Y1、図13のステップS1)、ブロック分割処理部22にて、図7の矢印Y2に示すように、当該データAを所定容量(例えば、64KB)のブロックデータD(記憶対象データ)に分割する(図13のステップS2)。そして、このブロックデータDのデータ内容に基づいて、当該データ内容を代表する固有のハッシュ値Hを算出する(図7の矢印Y3)。例えば、ハッシュ値Hは、予め設定されたハッシュ関数を用いて、ブロックデータDのデータ内容から算出する。
続いて、ストレージシステム10は、重複排除処理部23にて、同じ内容のブロックデータDの重複記録を排除するために、ブロックデータDのハッシュ値Hを用いて、重複排除処理を行う(図13のステップS3)。具体的には、まず、既に格納されているブロックデータDは、後述するように、当該ブロックデータDのハッシュ値Hと格納位置を表すコンテンツアドレスCAとが関連付けられて登録されているため、算出したブロックデータDのハッシュ値Hが既に存在している場合には、既に同一内容のブロックデータDが格納されていると判断できる(図13のステップS4でYes)。この場合には、格納前のブロックデータDのハッシュ値Hと一致した登録されているハッシュ値Hに関連付けられているコンテンツアドレスCAを取得する。そして、このコンテンツアドレスCAを、書き込み要求されたブロックデータDのコンテンツアドレスCAとして参照する。これにより、このコンテンツアドレスCAにて参照される既に格納されているデータが、書き込み要求されたブロックデータDとして使用されることとなり、当該書き込み要求にかかるブロックデータDを記憶する必要がなくなる。
なお、上述したように、既に記憶されているブロックデータDのコンテンツアドレスCAを参照することにより行う書き込み処理は、ストレージノード30のデータ保存処理部34により行われる。そして、コンテンツアドレスCAを参照することによる書き込み処理が終了すると、バックアップシステム11やバックアップ対象装置12といった上位装置に対して書き込み処理が終了したことを表す「ACK」信号を返却する(図13のステップS10)。なお、ストレージノード30のデータ保存処理部34によるその後の処理ついては後述する。
また、書き込み要求にかかるブロックデータDがまだ記憶されていないと判断された場合には、ストレージシステム10は、分散処理部24にて、かかるブロックデータDを格納する処理を行う(図13のステップS5,S6,S7,S8)。具体的には、まず、ブロックデータDを複数の所定の容量のフラグメントデータ(分割データ)に分割する。例えば、図6の符号D1〜D9に示すように、9つのフラグメントデータ(分割データ41)に分割する。さらに、ストレージシステム10は、分割したフラグメントデータのうちいくつかが欠けた場合であっても、元となるブロックデータDを復元可能なよう冗長データを生成し、上記分割したフラグメントデータ41に追加する。例えば、図6の符号D10〜D12に示すように、3つのフラグメントデータ(冗長データ42)を追加する。これにより、9つの分割データ41と、3つの冗長データ42とにより構成される12個のフラグメントデータからなるデータセット40を生成する(図7の矢印Y4)。
そして、上述したように生成された各フラグメントデータは、分散処理部24及び後述するストレージノード30のデータ保存処理部34にて、後述する各ストレージノード30に形成された各コンポーネントCに分散記憶される。例えば、図6に示すように、12個のフラグメントデータD1〜D12を生成した場合には、ストレージノード30に形成されたデータ格納領域である各コンポーネントCに、各フラグメントデータD1〜D12を1つずつそれぞれ格納する(図7の矢印Y5参照)。以上のように、上述したアクセラレータノード20が装備する各処理部22,23,24とストレージノードが装備するデータ保存処理部34とは、協働して、バックアップ対象データを分割したブロックデータから、これをさらに分割した複数のフラグメントデータ(冗長データを含む)を生成し、複数の記憶装置に分散して記憶する分散記憶処理手段として機能する。
なお、上述した分散記憶処理の際には、各フラグメントデータD1〜D12に加えて、当該各フラグメントデータにそれぞれ関連する情報を含むメタデータも各コンポーネントCに記憶する。かかる処理については、ストレージノード30のデータ保存処理部34の機能説明時に説明する。
ここで、上述したようにフラグメントデータが格納されると、ストレージノード30にて、当該フラグメントデータD1〜D12の格納位置、つまり、当該フラグメントデータD1〜D12にて復元されるブロックデータDの格納位置を表すコンテンツアドレスCAが生成される。このとき、コンテンツアドレスCAは、例えば、格納したブロックデータDの内容に基づいて算出したハッシュ値Hの一部(ショートハッシュ)(例えば、ハッシュ値Hの先頭8B(バイト))と、論理格納位置を表す情報と、を組み合わせて、生成される。そして、このコンテンツアドレスCAは、ストレージシステム10内のファイルシステムを管理するアクセラレータノード20にて、バックアップ対象データのファイル名などの識別情報と、コンテンツアドレスCAとが関連付けられて、ファイルシステムで管理される。
そして、ストレージシステム10では、ファイルの読み出し要求を受けると、要求されたファイルに対応するコンテンツアドレスCAにて指定される格納位置を特定し、この特定された格納位置に格納されている各フラグメントデータを、読み出し要求されたデータとして読み出すことができる。以上のように、ストレージシステム10は、データを読み書きする機能を有する。
次に、ストレージノード30の構成について説明する。なお、本実施形態では、ストレージノード30は複数装備されているが、それぞれストレージノード30の構成は同一であるため、そのうち1つのストレージノード30の構成について説明する。
図5に示すように、ストレージノード30は、装備されたCPU(Central Processing Unit)などの演算装置にプログラムが組み込まれることによって構成された、ノード・ディスク障害検出器31と、データ再生成制御機32と、再生成処理機33と、データ保存処理部34と、を備えている。また、ストレージノード30は、記憶装置(記憶手段)である複数のディスク35を備えている。以下、各構成について詳述する。
上記データ保存処理部34(分散記憶処理手段)は、上述したように、アクセラレータノード20にてバックアップ対象データが複数に分割されたブロックデータ(記憶対象データ)がさらに分割され冗長データが付加されて生成されたフラグメントデータを、複数のストレージノード30に装備された複数のディスク35に構成された各コンポーネントCに分散して記憶する。このとき、データ保存処理部34は、各フラグメントデータに、当該フラグメントデータに関連する情報を含むメタデータを関連付けて、同一のコンポートネントCに記憶する。なお、上述したように、コンテンツアドレスCAを参照することによる書き込み処理が終了すると、バックアップシステム11やバックアップ対象装置12といった上位装置に対して書き込み処理が終了したことを表す「ACK」信号を返却する(図13のステップS9)。
上記メタデータには、まず、フラグメントデータの元となるブロックデータが所属するコンポーネントの構成を表すコンポーネント構成情報を含む。例えば、1つのデータセット40を構成する各フラグメントデータの各メタデータには、当該同一のデータセット40を構成するフラグメントデータが格納されたコンポートネントCを特定するコンポーネント構成情報を含んでいる。また、メタデータには、ブロックデータからフラグメントデータが生成される際に付加された冗長データの数を表すパリティ数を含む。例えば、図8に示すファイルシステム1で生成されるフラグメントデータのデータセットには斜線で示すフラグメントデータが1つ付加されるが、この場合に各フラグメントデータのメタデータは、「1」のパリティ数を含んでいる。同様に、図8に示すファイルシステム2で生成されるフラグメントデータのメタデータは、「3」のパリティ数を含んでおり、図8に示すファイルシステム3で生成されるフラグメントデータのメタデータは、「11」のパリティ数を含んでいる。
さらに、上記メタデータには、フラグメントデータの元となるブロックデータが、同一のデータ内容であるとして判断された他のブロックデータとして参照されている数を表す被参照数を含む。例えば、図9の例では、「ファイル1」が「ブロック1」と「ブロック2」のブロックデータで構成されており、「ファイル2」が「ブロック1」と「ブロック3」のブロックデータで構成されている、ことを表していることとする。この場合には、「ファイル1」は「ブロック1」と「ブロック2」の格納位置を参照する各コンテンツアドレス「CA1」,「CA2」を参照して格納され、「ファイル2」は「ブロック1」と「ブロック3」の格納位置を参照する各コンテンツアドレス「CA1」,「CA3」を参照して格納される。すると、実際に格納されているブロックデータである「ブロック1」は、「ファイル1」と「ファイル2」から参照されているため、被参照数が「2」となる。このため、「ブロック1」のブロックデータを構成する各フラグメントデータの各メタデータは、「2」の被参照数を含むこととなる。同様に、「ブロック2」,「ブロック3」は、被参照数が「1」となり、当該各ブロックデータを構成する各フラグメントデータの各メタデータは、「1」の被参照数を含むこととなる。
以上のように、各フラグメントデータに関連付けられる各メタデータには、当該フラグメントデータにて構成されるブロックデータのコンポーネント構成情報、パリティ数、被参照数が含まれている。そして、1つのブロックデータから生成される各フラグメントデータに関連付けられる各メタデータは、全て同じ内容となる。
ここで、上述したメタデータは、データ保存処理部34にて任意のタイミングで更新される。つまり、メタデータに含まれる被参照数は、ブロックデータが格納される度に変更される場合があるため、コンポーネントCに格納されたメタデータ内の被参照数を更新する処理を行う。具体的に、データ保存処理部34は、上述したように、新たに格納するブロックデータが既にストレージノード30に記憶されている場合には、既に記憶されているブロックデータのコンテンツアドレスCAを新たに格納するブロックデータとして参照させて書き込み処理を行うが、かかる書き込み処理が完了した後に(図13のステップS10)、当該書き込み処理とは非同期で、参照されたブロックデータのメタデータ内の被参照数を更新する(図13のステップS11)。なお、メタデータ内の被参照数の更新処理は、上述したように書き込み処理完了後に非同期で行われることに限定されず、いかなるタイミングで実行されてもよい。
上記ノード・ディスク障害検出器31(データ再生手段)は、ストレージシステム10内を常時監視し、ストレージノード30やディスク35の障害を検出する(図14のステップS21)。そして、ノード・ディスク障害検出器31は、ストレージノード30やディスク35の障害を検出すると、障害が発生したストレージノード30やディスク35を特定し、かかる障害によって紛失したと思われるコンポーネントのリストを生成して、データ再生成制御器32に渡す。例えば、図10に示すように、ストレージシステム10を構成するストレージノード30のうち、コンポーネントC2,C8,C11が構成されているストレージノード30に装備されたディスク2に障害が発生したとする。この場合には、ディスク2に形成されたコンポーネントC11が紛失したことを特定して、かかるコンポーネントC11の情報をデータ再生成制御器32に渡す。なお、紛失したコンポーネントの特定は、例えば、ストレージノード30やストレージシステム10内には、予めコンポーネントがどのストレージノードのどのディスクに形成されているかを表す情報が記憶されており、かかる情報を参照して行う。あるいは、紛失したコンポーネントの特定は、障害が発生していない他のストレージノード30に格納されているメタデータに含まれるコンポーネント構成情報を参照して行ってもよく、その他の方法で行ってもよい。
上記データ再生成制御器32(データ再生手段)は、ノード・ディスク障害検出器31から渡された情報と、現在のコンポーネントの配置構成から、リカバリするコンポーネントのリストと、当該コンポートネントの配置(ディスク)の仮候補を算出する(図14のステップS22)。例えば、障害が発生したディスク35を備える同一のストレージノード30内の他のディスク35に、障害により消失したコンポーネントをリカバリするよう算出する。また、データ再生成制御器32は、他のストレージノード30に設けられたデータ再生成制御器32と通信し、上述した仮候補の中からリカバリするコンポーネントの最終構成を決定し、他のストレージノード30のデータ再生成制御器32に通知する(図14のステップS23)。例えば、全てのストレージノード30のデータ再生成制御器32が算出した仮候補から多数決で最終構成を決定する。ここで、図12の例では、コンポーネントC2に障害が発生した場合に、同一のストレージノード30内に新たなコンポーネントC2’をリカバリすると決定したとする。
さらに、データ再生成制御器32は、障害が発生したコンポーネントに格納されていたフラグメントデータが複数存在する場合に、リカバリするフラグメントデータの優先順位を決定する(図14のステップS24)。このとき、障害が発生したコンポーネントに格納されていたフラグメントデータにて構成されるブロックデータのパリティ数つまり冗長データの数が小さい順に、リカバリを行うよう決定する。例えば、障害が発生したコンポーネントに格納されていたブロックデータを構成するフラグメントデータは、他の障害が発生していないコンポーネントにも格納されているため、当該障害が発生していないコンポートネントに格納されているフラグメントデータのメタデータ内のパリティ数を参照して、障害が発生したコンポーネントに格納されていたブロックデータのパリティ数を特定する。そして、データ再生成制御器32は、決定したコンポーネントをリカバリする構成とパリティ数に基づく優先順位を、再生成処理器33に通知する(図14のステップS25)。
なお、データ再生成制御器32は、具体的には、コンポーネントの障害によりブロックデータを構成するフラグメントデータ数のうち失ったフラグメントデータ数に応じて、リカバリの優先順位を決定する。例えば、コンポーネントの障害により、x個のフラグメントデータを失った場合には、そのパリティ数が、x,x+1,X+2,・・・の順番で優先的にリカバリが行われるよう、優先順位を決定する。
ここで、図11を参照して、リカバリするブロックデータの優先順位を、パリティ数の小さい順で決定することについて詳述する。例えば、図11(A)に示すように、一つのコンポーネントC内にパリティ数が異なる各ブロックデータから生成されたフラグメントデータF(及びこれに対応するメタデータM)が記憶されていることとする。このとき、1つのブロックデータを構成する各フラグメントデータFは、1つのコンポーネントCにつき1つのみ格納されるよう分散されていることとする。また、符号P1で示すフラグメントデータFはパリティ数が「1」であり、符号P2で示すフラグメントデータFはパリティ数が「2」であり、符号P3で示すフラグメントデータFはパリティ数が「3」であるとする。
上記の場合、1つのコンポートネントCに障害が発生した場合には、当該コンポーネントC内のフラグメントFを失うこととなるが、パリティ数が「1」のフラグメントデータFにて構成されるブロックデータは、これ以上フラグメントFを失うとリカバリすることができない。つまり、コンポーネントC内のフラグメントFをリカバリしている間に、他のコンポーネントCに障害が生じると、データの再生成が不可能となってしまう。このため、パリティ数が少ないものほど優先して迅速にリカバリすることが望ましく、このような理由から、パリティ数の小さい順からフラグメントデータFをリカバリすることとしている。なお、図11(B)は、1つのディスク35内に異なったパリティ数のフラグメントデータF(及びこれに対応するメタデータ)が格納されている場合を示しているが、この場合も同様に、ディスク35に障害が生じてフラグメントデータFが消失した場合には、当該フラグメントデータFにて構成されるブロックデータのパリティ数が小さい順にリカバリを行う。
上記データ再生成器33(データ再生手段)は、データ再生成制御部32からコンポーネントをリカバリする構成とパリティ数に基づく優先順位を受信する(図15のステップS31)。そして、データ再生成器33は、受信した構成通りにコンポーネントCを再生成して、当該コンポーネントCに格納されていたメタデータをまずはリカバリする(図15のステップS32)。例えば、障害が生じていない他のコンポーネントCに格納されているメタデータをコピーすることで、再生成したコンポーネントC内にメタデータを再生成する。なお、図10の例では、ストレージノード30のディスク2に障害が生じてコンポーネントC11内のデータが消失した場合には、まず矢印Y11に示すように、同一のストレージノード30内の他のディスク3にコンポーネントC11を再生成する。その後、矢印Y12に示すように、他のストレージノード内のメタデータを、再生成したコンポーネントC11内にコピーして再生成する。
続いて、データ再生成器33は、データ再生成制御部32から通知されたパリティ数の優先順位にて、再生成したコンポーネントC内のメタデータを参照し、障害が発生していない他のコンポーネントC内のフラグメントデータから、障害により消失したフラグメントデータを再生成する。このとき、同一のパリティ数のフラグメントデータが複数存在する場合には、当該フラグメントデータにて構成されるブロックデータの被参照数が大きい順に、リカバリする(図15のステップS33〜S37)。例えば、パリティ数が「1」のリカバリすべきフラグメントデータが複数存在する場合には、当該フラグメントデータのメタデータから被参照数を抽出する。そして、パリティ数が「1」のリカバリすべきフラグメントデータのうち、被参照数が大きい順にリカバリするフラグメントデータを選定して、リカバリする(図12の矢印Y21参照)。その後は、パリティ数が「1」のリカバリすべきフラグメントデータを全てリカバリすると、続いて、パリティ数が「2」のフラグメントデータを被参照数が大きい順にリカバリする(図12の矢印Y22参照)。
このように、被参照数が大きい順にフラグメントデータをリカバリすることとした理由は、被参照数が大きいブロックデータほど、多くのファイルを構成しているデータであるため、消失したときの影響度が大きいためである。つまり、コンポーネントC内のフラグメントFをリカバリしている間に他のフラグメントデータが消失することによりリカバリ不可能となると、被参照数が大きいフラグメントデータほどストレージシステムの信頼性に大きな影響を与えてしまう。このため、被参照数が大きいものほど優先して迅速にリカバリすることとしている。
ここで、上述したようにフラグメントデータのリカバリを行う優先順位を決定するパリティ値や被参照数は、フラグメントデータが所属するメタデータとしてストレージノード30側が保持している情報である。従って、ストレージノード30側で単独でリカバリ処理が可能であり、ストレージシステム10にアクセスしている側に及ぼす影響を抑制することができる。
なお、上記では、メタデータの更新をデータの書き込み処理終了後に非同期で行うことを説明したが、これは、書き込み処理毎にブロックデータの被参照数は常に変更されるため、重要なフラグメントデータほど優先してリカバリされるよう、迅速に設定するためである。例えば、ブロックデータの被参照数をチェックして参照されていないブロックデータの記憶領域を解放する領域解放処理が、任意のタイミングで実行される場合があるが、かかる領域解放処理が長期間実行されない場合には、重要なフラグメントデータが優先してリカバリされない場合が生じる。かかる場合と比較して、本発明は有効である。但し、データの書き込み処理終了に同期してメタデータの更新が行われると、ストレージシステム全体の性能劣化の問題も生じるため、本発明では、書き込み処理の終了後に当該書き込み処理とは非同期でメタデータを更新するようにしている。例えば、書き込み処理終了後に、ストレージシステム全体やストレージノードの負荷に予め設定された余裕がある場合にメタデータの更新を実行するようにしてもよく、非同期に更新する条件設定は任意である。
<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明におけるストレージシステム(図16参照)、情報処理装置、プログラム、情報処理方法の構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
(付記1)
複数の記憶手段110と、
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータを生成して、当該複数のフラグメントデータを前記複数の記憶手段に分散して記憶する分散記憶処理手段101と、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段102と、を備え、
前記データ再生手段102は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
ストレージシステム100。
(付記2)
付記1に記載のストレージシステムであって、
前記分散記憶処理手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を表すパリティ数を、当該フラグメントデータに関連付けて記憶し、
前記データ再生成手段は、障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記パリティ数に基づいて、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を特定し、当該冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
ストレージシステム。
(付記3)
付記2に記載のストレージシステムであって、
前記データ再生成手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数が少ない順に、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
ストレージシステム。
(付記4)
付記3に記載のストレージシステムであって、
前記分散記憶処理手段は、前記複数の記憶手段に既に記憶されている前記記憶対象データとデータ内容が予め設定された基準により同一であると判断された他の記憶対象データを前記複数の記憶手段に記憶する場合に、当該他の記憶対象データとして既に記憶されている前記記憶対象データを参照させ、
前記データ再生成手段は、再生成の対象となる前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数が同一である場合に、前記記憶対象データが前記他の記憶対象データとして参照されている数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
ストレージシステム。
(付記5)
付記4に記載のストレージシステムであって、
前記分散記憶処理手段は、前記記憶対象データが前記他の記憶対象データとして参照されている数を表す被参照数を、前記記憶対象データを構成する前記フラグメントデータに関連付けて記憶し、
前記データ再生成手段は、再生成の対象となる前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数が同一である場合に、障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記被参照数に基づいて、前記記憶対象データが参照されている数を特定し、当該参照されている数が大きい順に、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
ストレージシステム。
(付記6)
付記5に記載のストレージシステムであって、
前記分散記憶処理手段は、前記他の記憶対象データを既に記憶されている前記記憶対象データを参照することにより当該他の記憶対象データの書き込み処理が終了した後に、既に記憶されている前記記憶対象データに関連付けられている前記被参照数を更新する、
ストレージシステム。
(付記7)
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータが分散して記憶される複数の記憶手段のうち少なくとも1つを備えた情報処理装置であって、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段を備え、
前記データ再生手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
情報処理装置。
(付記8)
付記7に記載の情報処理装置であって、
前記記憶手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を表すパリティ数を、当該フラグメントデータに関連付けて記憶しており、
前記データ再生成手段は、障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記パリティ数に基づいて、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を特定し、当該冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
情報処理装置。
(付記9)
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータが分散して記憶される複数の記憶手段のうち少なくとも1つを備えた情報処理装置に、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段を実現させると共に、
前記データ再生手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
ことを実現させるためのプログラム。
(付記10)
付記9に記載のプログラムであって、
前記記憶手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を表すパリティ数を、当該フラグメントデータに関連付け記憶しており、
前記データ再生成手段は、障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記パリティ数に基づいて、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を特定し、当該冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
プログラム。
(付記11)
記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータを生成して、当該複数のフラグメントデータを複数の記憶手段に分散して記憶すると共に、
障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成する際に、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
情報処理方法。
(付記12)
付記11に記載の情報処理方法であって、
前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を表すパリティ数を、当該フラグメントデータに関連付けて前記複数の記憶手段に分散して記憶し、
障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記パリティ数に基づいて、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を特定し、当該冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
情報処理方法。
なお、上述したプログラムは、記憶装置に記憶されていたり、コンピュータが読み取り可能な記録媒体に記録されている。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。
以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。
10 ストレージシステム
11 バックアップシステム
12 バックアップ対象装置
20 アクセラレータノード
21 ファイルシステムサービス
22 ブロック分割処理部
23 重複排除処理部
24 分散処理部
30 ストレージノード
31 ノード・ディスク障害検出部
32 データ再生成制御器
33 再生成処理器
34 データ保存処理部
35 ディスク

Claims (10)

  1. 複数の記憶手段と、
    記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータを生成して、当該複数のフラグメントデータを前記複数の記憶手段に分散して記憶する分散記憶処理手段と、
    障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段と、を備え、
    前記データ再生手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    ストレージシステム。
  2. 請求項1に記載のストレージシステムであって、
    前記分散記憶処理手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を表すパリティ数を、当該フラグメントデータに関連付けて記憶し、
    前記データ再生成手段は、障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記パリティ数に基づいて、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を特定し、当該冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    ストレージシステム。
  3. 請求項2に記載のストレージシステムであって、
    前記データ再生成手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数が少ない順に、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    ストレージシステム。
  4. 請求項3に記載のストレージシステムであって、
    前記分散記憶処理手段は、前記複数の記憶手段に既に記憶されている前記記憶対象データとデータ内容が予め設定された基準により同一であると判断された他の記憶対象データを前記複数の記憶手段に記憶する場合に、当該他の記憶対象データとして既に記憶されている前記記憶対象データを参照させ、
    前記データ再生成手段は、再生成の対象となる前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数が同一である場合に、前記記憶対象データが前記他の記憶対象データとして参照されている数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    ストレージシステム。
  5. 請求項4に記載のストレージシステムであって、
    前記分散記憶処理手段は、前記記憶対象データが前記他の記憶対象データとして参照されている数を表す被参照数を、前記記憶対象データを構成する前記フラグメントデータに関連付けて記憶し、
    前記データ再生成手段は、再生成の対象となる前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数が同一である場合に、障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記被参照数に基づいて、前記記憶対象データが参照されている数を特定し、当該参照されている数が大きい順に、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    ストレージシステム。
  6. 請求項5に記載のストレージシステムであって、
    前記分散記憶処理手段は、前記他の記憶対象データを既に記憶されている前記記憶対象データを参照することにより当該他の記憶対象データの書き込み処理が終了した後に、既に記憶されている前記記憶対象データに関連付けられている前記被参照数を更新する、
    ストレージシステム。
  7. 記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータが分散して記憶される複数の記憶手段のうち少なくとも1つを備えた情報処理装置に、
    障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成するデータ再生成手段を実現させると共に、
    前記データ再生手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    ことを実現させるためのプログラム。
  8. 請求項7に記載のプログラムであって、
    前記記憶手段は、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を表すパリティ数を、当該フラグメントデータに関連付け記憶しており、
    前記データ再生成手段は、障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記パリティ数に基づいて、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を特定し、当該冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    プログラム。
  9. 記憶対象データを複数に分割した分割データ及び当該記憶対象データを復元するための冗長データからなる複数のフラグメントデータを生成して、当該複数のフラグメントデータを複数の記憶手段に分散して記憶すると共に、
    障害が発生した前記記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータを、障害が発生していない他の前記記憶手段に記憶されている前記記憶対象データを構成する他の前記フラグメントデータに基づいて再生成する際に、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    情報処理方法。
  10. 請求項9に記載の情報処理方法であって、
    前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を表すパリティ数を、当該フラグメントデータに関連付けて前記複数の記憶手段に分散して記憶し、
    障害が発生していない前記他の記憶手段に記憶されている前記記憶対象データを構成する前記他のフラグメントデータに関連付けられている前記パリティ数に基づいて、前記記憶対象データを構成する前記フラグメントデータのうちの前記冗長データの数を特定し、当該冗長データの数に基づく優先順位にて、前記他のフラグメントデータに基づいて前記障害が発生した記憶手段に記憶されていた前記記憶対象データを構成する前記フラグメントデータの再生成を行う、
    情報処理方法。
JP2012038143A 2012-02-24 2012-02-24 ストレージシステム Expired - Fee Related JP5891842B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012038143A JP5891842B2 (ja) 2012-02-24 2012-02-24 ストレージシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012038143A JP5891842B2 (ja) 2012-02-24 2012-02-24 ストレージシステム

Publications (2)

Publication Number Publication Date
JP2013174984A true JP2013174984A (ja) 2013-09-05
JP5891842B2 JP5891842B2 (ja) 2016-03-23

Family

ID=49267844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012038143A Expired - Fee Related JP5891842B2 (ja) 2012-02-24 2012-02-24 ストレージシステム

Country Status (1)

Country Link
JP (1) JP5891842B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016185542A1 (ja) * 2015-05-18 2016-11-24 株式会社日立製作所 計算機システム、アクセラレータ及びデータベースの処理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001147785A (ja) * 1999-10-29 2001-05-29 Hewlett Packard Co <Hp> データを管理する方法
US20060218433A1 (en) * 2005-03-22 2006-09-28 Williams Jeffrey L Method, apparatus and program storage device for providing intelligent rebuild order selection
WO2009157086A1 (ja) * 2008-06-27 2009-12-30 富士通株式会社 Raid装置並びにその制御装置および制御方法
JP2010224845A (ja) * 2009-03-24 2010-10-07 Nec Corp ストレージ装置
JP2011520182A (ja) * 2008-04-17 2011-07-14 エヌイーシー ラボラトリーズ アメリカ インク 分散データストレージシステムの信頼性の動的定量化と改善
JP2011154428A (ja) * 2010-01-26 2011-08-11 Nec Corp ストレージシステム
JP2011154702A (ja) * 1997-12-24 2011-08-11 Avid Technology Inc コンピュータ・システムおよび多数の記憶装置および多数のアプリケーション間でスケーラブルにかつ信頼性高く多数の高帯域データ・ストリームを転送するプロセス

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011154702A (ja) * 1997-12-24 2011-08-11 Avid Technology Inc コンピュータ・システムおよび多数の記憶装置および多数のアプリケーション間でスケーラブルにかつ信頼性高く多数の高帯域データ・ストリームを転送するプロセス
JP2001147785A (ja) * 1999-10-29 2001-05-29 Hewlett Packard Co <Hp> データを管理する方法
US20060218433A1 (en) * 2005-03-22 2006-09-28 Williams Jeffrey L Method, apparatus and program storage device for providing intelligent rebuild order selection
JP2011520182A (ja) * 2008-04-17 2011-07-14 エヌイーシー ラボラトリーズ アメリカ インク 分散データストレージシステムの信頼性の動的定量化と改善
WO2009157086A1 (ja) * 2008-06-27 2009-12-30 富士通株式会社 Raid装置並びにその制御装置および制御方法
JP2010224845A (ja) * 2009-03-24 2010-10-07 Nec Corp ストレージ装置
JP2011154428A (ja) * 2010-01-26 2011-08-11 Nec Corp ストレージシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016185542A1 (ja) * 2015-05-18 2016-11-24 株式会社日立製作所 計算機システム、アクセラレータ及びデータベースの処理方法
JPWO2016185542A1 (ja) * 2015-05-18 2017-08-31 株式会社日立製作所 計算機システム、アクセラレータ及びデータベースの処理方法

Also Published As

Publication number Publication date
JP5891842B2 (ja) 2016-03-23

Similar Documents

Publication Publication Date Title
JP5637552B2 (ja) ストレージシステム
WO2017119091A1 (ja) 分散型ストレージシステム、データ格納方法、およびソフトウェアプログラム
US10303570B2 (en) Method and apparatus for managing data recovery of distributed storage system
JP6525491B2 (ja) ファイルをチャンク単位で分散処理するシステムおよび方法
US8930663B2 (en) Handling enclosure unavailability in a storage system
WO2010097849A1 (ja) ストレージシステム
WO2012075845A1 (zh) 分布式文件系统
US8862844B2 (en) Backup apparatus, backup method and computer-readable recording medium in or on which backup program is recorded
US10503620B1 (en) Parity log with delta bitmap
JP2006331076A (ja) データ記憶システム及び記憶方法
JP5556192B2 (ja) ストレージシステム
JP5517224B2 (ja) ストレージ装置
JP5365236B2 (ja) ストレージシステム
JP6269120B2 (ja) ストレージシステム
JP5929326B2 (ja) ストレージシステム
JP5660617B2 (ja) ストレージ装置
JP5891842B2 (ja) ストレージシステム
US10664346B2 (en) Parity log with by-pass
CN115826876A (zh) 数据写入方法、系统、存储硬盘、电子设备及存储介质
JP5998517B2 (ja) ストレージシステム
JP2021105964A (ja) 情報処理方法
JP6343952B2 (ja) ストレージシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160208

R150 Certificate of patent or registration of utility model

Ref document number: 5891842

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees