JP6705255B2 - 制御装置、制御方法及びプログラム、および、ストレージシステム - Google Patents

制御装置、制御方法及びプログラム、および、ストレージシステム Download PDF

Info

Publication number
JP6705255B2
JP6705255B2 JP2016068533A JP2016068533A JP6705255B2 JP 6705255 B2 JP6705255 B2 JP 6705255B2 JP 2016068533 A JP2016068533 A JP 2016068533A JP 2016068533 A JP2016068533 A JP 2016068533A JP 6705255 B2 JP6705255 B2 JP 6705255B2
Authority
JP
Japan
Prior art keywords
storage
storage nodes
fragment
storage node
control device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016068533A
Other languages
English (en)
Other versions
JP2017182442A (ja
Inventor
恒夫 高林
恒夫 高林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2016068533A priority Critical patent/JP6705255B2/ja
Publication of JP2017182442A publication Critical patent/JP2017182442A/ja
Application granted granted Critical
Publication of JP6705255B2 publication Critical patent/JP6705255B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Detection And Correction Of Errors (AREA)

Description

本発明は、制御装置等に関し、特に、データを分散して複数のストレージノードに格納するストレージ制御に関する。
コンピュータの発達及び普及に伴い、種々の情報がデジタルデータ化される中で大容量、かつ、高信頼のストレージシステムが必要とされている。
特許文献1には、ストレージ障害によるデータ損失を防ぐためにデータブロックを複数のストレージに分散配置するRAID(Redundant Arrays of Inexpensive Disks)ストレージが記載されている。
また、特許文献2には、RAIDストレージより強固な信頼性を実現する技術として、データブロックを分割し、冗長コードを付加したフラグメントを複数のストレージノードへ分散して格納するストレージシステムが記載されている。
図9は、フラグメントの生成と、ストレージノードへの分散を説明する説明図である。図9に示すように、データブロック30が分割された分割データ31に、データブロック30を復元するためのパリティデータ32が加えられた複数のフラグメント33が生成される。生成されたフラグメント33は、複数のストレージノード20に分散して格納される。データブロックをn個に分割した分割データとp個のパリティデータを含む(n+p)個のフラグメントが、複数のストレージノードに分散して書込まれる冗長性が確保される。
ストレージシステムは、複数のストレージノード20のフラグメント33を読込み、分割前のデータブロック30を復元する。このとき(n+p)個のフラグメントではなく、n個のフラグメントによってデータブロックが復元できる。
特表2010−503941号公報 特開2013−174984号公報
図10は、ストレージシステムの障害時におけるフラグメントの書込みを示す説明図である。フラグメントF1〜F12が格納された複数のストレージノード20のうち、あるストレージノードに障害が発生し、フラグメントF4、F5、F6が使用できないとする。障害が発生したストレージノード(以下、障害ストレージノードという)に格納されていたフラグメントF4、F5、F6は、障害ストレージノード21以外の複数のストレージノード20からフラグメントを読込んで再生成される。そして再生成されたフラグメントF4、F5、F6は、障害ストレージノード21以外の複数のストレージノード20に分散して格納される。これによりストレージノード20のデータの冗長性が回復する。
図10に示す例では、データの冗長性を回復させる際、再生成したフラグメントが複数のストレージノード20に分散して書込まれる。このため、再生成されたフラグメントを格納するストレージノードの負荷が大きくなり、ストレージシステムの性能が低下する。
また、障害ストレージノード21が復旧した後に、復旧したストレージノードに再生成されたフラグメントをコピーバックする際も、複数のストレージノード20に格納された再生成されたフラグメントへの読込みが発生し、ストレージノードの負荷が大きくなる。
本発明の目的は、複数のストレージノードに格納されたデータの冗長性の回復に伴うストレージノードの負荷を低減することが可能な制御装置等を提供することにある。
本発明の制御装置の一態様は、データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムの制御装置であって、
前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、前記他のストレージノードのうち所定数のストレージノードに、前記再生成されたフラグメントを書込むデータ処理部を備える。
本発明の制御方法の一態様は、データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムの制御方法であって、前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、前記他のストレージノードのうち所定数のストレージノードに、前記再生成されたフラグメントを書込む。
本発明のプログラムの一態様は、データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムを制御するプログラムであって、前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、前記他のストレージノードのうち所定数のストレージノードに、前記再生成されたフラグメントを書込む、ことをコンピュータに実行させる。
本発明のストレージシステムの一態様は、複数のストレージノードと、
データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを前記複数のストレージノードに分散して格納させる制御装置を備えるストレージシステムであって、前記制御装置は、前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、前記他のストレージノードのうち所定数のストレージノードに、前記再生成されたフラグメントを書込むデータ処理部を備える。
本発明は、複数のストレージノードに格納されたデータの冗長性の回復に伴うストレージノードの負荷を低減する。
第1の実施形態の制御装置と当該制御装置を用いたストレージシステムの構成を示すブロック図である。 第1の実施形態の制御装置の動作を示すフローチャートである。 第1の実施形態の制御装置によるストレージノードの障害時におけるフラグメントの書込みを示す説明図である。 第2の実施形態の制御装置の構成を示すブロック図である。 第2の実施形態の制御装置の動作を示すフローチャートである。 リカバリ部によるリカバリ処理の一例を示すフローチャートである。 リードライト制御部によるデータブロックの復元処理の一例を示すフローチャートである。 第1、第2の実施形態の制御装置をコンピュータ装置で実現したハードウエア構成を示す図である。 フラグメントの生成と、ストレージノードへの分散を説明する説明図である。 関連技術のストレージノードの障害時におけるフラグメントの書込みを示す説明図である。
(第1の実施形態)
第1の実施形態の制御装置と、当該制御装置を用いたストレージシステムについて、図面を用いて説明する。図1は、第1の実施形態の制御装置と当該制御装置を用いたストレージシステムの構成を示すブロック図である。図1に示すように、ストレージシステムは、制御装置10と、制御装置10に接続された複数のストレージノード20を備える。
制御装置10は、データブロックが分割された分割データ及びデータブロックを復元するためのパリティデータを含む複数のフラグメントを複数のストレージノード20に分散して格納する格納機能を有する。例えば、制御装置10は、n個の分割データとp個のパリティデータを含む(n+p)個のフラグメントを複数のストレージノード20に分散して、格納する。制御装置10は、複数のストレージノード20に格納された各フラグメントのうちn個のフラグメントを読込むことで分割前のデータブロックを復元する復元機能を有する。なお、上記の格納機能および復元機能は、以下に説明するデータ処理部11が実行してもよい。
制御装置10は、データ処理部11を備える。データ処理部11は、ストレージシステムのストレージノード20に障害が発生した際に、ストレージノードに格納されたデータの冗長性を回復させる機能を有する。
データ処理部11は、複数のストレージノード20のうち障害が発生した障害ストレージノードに格納されたフラグメントを、残りのストレージノード20に格納されたフラグメントを用いて再生成する。さらに、データ処理部11は、残りのストレージノード20の中の特定のストレージノードに、再生成されたフラグメントを書込む。特定のストレージノードは、残りのストレージノード20の中から任意で選択された1つのストレージノードである。
データ処理部11が、再生成されたフラグメントの書込みを特定のストレージノードに集中させることで、再生成されたフラグメントが書込まれるストレージノード20の数が減ることなる。結果、特定のストレージノード以外の複数のストレージノード20に対する、書込みの負荷が低減される。
また、障害が発生したストレージノードが復旧した後、特定のストレージノードから復旧したストレージノードに再生成されたフラグメントを移動させる。このとき、第1の実施形態によれば、特定のストレージノードと復旧したストレージノード間で再生成されたフラグメントを移動させればよく、再生成されたフラグメントの移動によって使用されるストレージノード20の数も減ることになる。この結果、特定のストレージノード以外の複数のストレージノード20の負荷がより低減される。
第1の実施形態の制御装置の動作について図面を用いて説明する。図2は、第1の実施形態の制御装置の動作を示すフローチャートである。制御装置10のデータ処理部11は、複数のストレージノード20のうち障害が発生した障害ストレージノードに格納されていたフラグメントを、残りのストレージノード20に格納されたフラグメントを用いて再生成する(ステップS1)。データ処理部11は、残りのストレージノード20のうち特定のストレージノードに、再生成されたフラグメントを書込む(ストレージS2)。
図3は、第1の実施形態による障害時におけるストレージノードへのフラグメントの書込みを示す説明図である。図3に示すように、フラグメントF1〜F12が格納された複数のストレージノード20のうち、あるストレージノードに障害が発生し、フラグメントF4、F5、F6が使用できないとする。第1の実施形態の制御装置10において、障害が発生したストレージノード(以下、障害ストレージノードともいう)に格納されていたフラグメントF4、F5、F6は、障害ストレージノード21以外の残りのストレージノード20のうち、特定のストレージノード22に集中して書込まれる。これにより、複数のストレージノードに分散されたデータの冗長性が回復する。
データの冗長性を回復させるリカバリ処理の際、再生成したフラグメントがストレージノード20に分散して書込まれる。
(第1の実施形態の効果)
第1の実施形態の制御装置によれば、複数のストレージノードに格納されたデータの冗長性の回復に伴うストレージノードの負荷を低減することができる。その理由は、制御装置のデータ処理部が、複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、他のストレージノードのうち特定のストレージノードに、再生成されたフラグメントを書込むからである。
第1の実施形態の制御装置を用いるストレージシステムは、ストレージノードの負荷を低減されることで、ストレージシステムの性能の低下を防ぐことができる。
(第2の実施形態)
第2の実施形態は、第1の実施形態の制御装置の構成を具体化した一例である。第2の実施形態の制御装置10は、第1の実施形態と同様に複数のストレージノード20と接続されてストレージシステムを構成する。
図4は、第2の実施形態の制御装置の構成を示すブロック図である。図4に示すように、第2の実施形態の制御装置10のデータ処理部11は、リードライト制御部12と、障害検出部13と、リカバリ部14と、再編成部15を備える。
制御装置10のリードライト制御部12は、データブロックが分割された分割データ及びデータブロックを復元するためのパリティデータを含む複数のフラグメントを複数のストレージノード20に分散して格納する。さらに、リードライト制御部12は、ストレージノード20に格納されたフラグメントを読込み、データブロックを復元する。
また、リードライト制御部12は、リカバリ処理中の特定のストレージノードがある場合、特定のストレージノード以外のストレージノード20からフラグメントを読込む。
障害検出部13は、障害ストレージノード21を検出する。障害検出部13は、障害ストレージノードを検出した場合、リカバリ部14にリカバリ処理を指示する。あるいは、障害ストレージノード21の復旧を検知して再編成部15に通知する。
制御装置10のリカバリ部14は、障害ストレージノード21以外の複数のストレージノード20からフラグメントを読込み、障害ストレージノード21に格納されていたフラグメントを再生成し、再生成されたフラグメントを特定のストレージノードに集中させて書込む。
制御装置10の再編成部15は、特定のストレージノードに格納された再生成されたフラグメントを、復旧したストレージノードに移動する。
次に、第2の実施形態の制御装置の動作について、図面を用いて説明する。図5は、第2の実施形態の制御装置の動作を示すフローチャートである。以下に説明する第2の実施形態の制御装置の動作は、ストレージノード20の障害の発生から正常化までを示している。
制御装置10の障害検出部13は、複数のストレージノード20の状態を確認し(ステップS21)し、新たな障害ストレージノード21を検出すると(ステップS22のYes)、リカバリ部14にリカバリ処理を指示する。また、障害検出部13は、検出した障害ストレージノード21のノード識別子と、複数のストレージノード20から選択されたリカバリ処理の用いる特定のストレージノードのノード識別子を取得してリカバリ部14に通知する。ノード識別子は、例えば、複数のストレージノードに付与されたノード番号である。
図6にリカバリ部14におけるリカバリ処理の一例を示すフローチャートである。図6に示すように、制御装置10のリカバリ部14は、受付けたノード識別子で障害ストレージノードを認識し、複数のストレージノード20のうち障害ストレージノード21以外の複数のストレージノード20からフラグメントを読込む(ステップS31)。
リカバリ部14は、読込んだフラグメントに基づいて、障害ストレージノード21に格納されたフラグメントを再生成する(ステップS32)。例えば、リカバリ部14は、読込んだフラグメントを用いてデータブロックを復元し、復元したデータブロックとパリティデータを用いて複数のフラグメントを再生成する。そして、リカバリ部14は、リードライト制御部12が複数のストレージノード20に分散したフラグメントの配置情報に基づいて、再生成した複数のフラグメントの中から障害ストレージノード21に格納されたフラグメントを特定する。
リカバリ部14は、受付けたノード識別子で特定のストレージノードを認識し、障害ストレージノードの再生成されたフラグメントを特定のストレージノードに書込む(ステップS33)。
障害検出部13は、障害ストレージノードの復旧を検出すると(ステップS24のYes)、再編成部15に特定のストレージノードに格納された再生成されたフラグメントを復旧したストレージノードへ移動させる、フラグメント再編成を指示する。このとき、障害検出部13は、復旧したストレージノードのノード識別子および特定のストレージノードのノード識別子を、再編成部15に通知する。
再編成部15は、受付けたノード識別子に基づいて、特定のストレージノードに格納された再生成されたフラグメントを復旧したストレージノードに移動する(ステップS25)。再編成部15のフラグメント再編成により、障害が発生したストレージノードは、障害発生前のフラグメント状態となり正常化される。移動が完了した後、再編成部15は、リードライト制御部12に障害が発生したストレージノードの正常化を通知する(ステップS26)。
このように、データの冗長性を回復させるリカバリ処理時に、再生成されたフラグメントを特定のストレージノードに集中して書込むことにより、特定のストレージノード以外の複数のストレージノードの負荷を低減することができる。
(変形例)
なお、制御装置10が複数のストレージノード20に格納されたフラグメントを読込んでデータブロックを復元する際、リードレスポンスの観点から、負荷が高くなっているストレージノードのフラグメントを読込むことは好ましくない。
このため、第2の実施形態の制御装置では、データブロックの復元処理において、リカバリ処理中の特定のストレージノード以外のストレージノードからフラグメントを読込む。
図7は、リードライト制御部によるデータブロックの復元処理の一例を示すフローチャートである。制御装置10のリードライト制御部12は、複数のストレージノード20の中に特定のストレージノードがあるか確認する。特定のストレージノードが無ければ(ステップS41のNo)、ストレージノード20からデータブロックの復元に必要な数のフラグメントを読込む(ステップS42)。リードライト制御部12は、読込んだフラグメントからデータブロックを復元する(ステップS43)。
一方、特定のストレージノードがある場合(ステップS41のYes)リードライト制御部12は、特定のストレージノード以外のストレージノード20からデータブロックの復元に必要な数のフラグメントを優先的に読込み(ステップS44)。リードライト制御部12は、読込んだフラグメントからデータブロックを復元する(ステップS43)。
(第2の実施形態の効果)
第2の実施形態の制御装置によれば、複数のストレージノードに格納されたデータの冗長性の回復に伴うストレージノードの負荷を低減することができる。その理由は、制御装置のデータ処理部が、複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、他のストレージノードのうち特定のストレージノードに、再生成されたフラグメントを書込むからである。
上記制御装置を用いるストレージシステムは、ストレージノードの負荷が低減され、システム性能の低下を防ぐことができる。
また、フラグメントを読込んでデータブロックを復元する際、リードレスポンス性能が低下するのを防ぐことができる。その理由は、リードライト制御部12が、データブロックの復元の際に、特定のストレージノード以外のストレージノードからフラグメントを読込むからである。
(その他)
上記の第1、第2の実施形態において、再生成されたフラグメントを書込む特定のストレージノードが1つの例で説明したが、これに限られない。すなわち、複数のストレージノードから障害ストレージノードを除いた残りのストレージノードのうち、再生成されたフラグメントを書込まないストレージノードが少なくとも1つあれば、フラグメントの書込みによるストレージノードの負荷を低減することができる。
このように、再生成されたフラグメントを書込むストレージノードの所定数は、1つ以上、複数のストレージノードから障害ストレージノードを除いた残りのストレージノードのうち、再生成されたフラグメントを書込まないストレージノードが1つとなる数以下であればよい。
上記の第1、第2の実施形態の制御装置10は、ストレージシステムにおけるアクセラレータノードとも呼ばれる。第1、第2の実施形態の制御装置10は、放送又は動画配信のように再生のリアルタイム性が重要となるストレージシステムに適用可能である。
(ハードウエア構成)
図8は、第1、第2の実施形態の制御装置をコンピュータ装置で実現したハードウエア構成を示す図である。第1、第2の実施形態において、制御装置10の各構成要素は、機能単位のブロックを示している。制御装置の各構成要素の一部又は全部は、例えば、図8に示すような情報処理装置60とプログラムとの任意の組み合わせにより実現される。情報処理装置60は、一例として、以下のような構成を含む。
CPU(Central Processing Unit)61、
ROM(Read Only Memory)62、
RAM(Ramdom Access Memory)63、
RAM63にロードされるプログラム64、
プログラム64を格納する記憶装置65、
記録媒体66の読み書きを行うドライブ装置67、
通信ネットワーク69と接続する通信インターフェース68、
データの入出力を行う入出力インターフェース70、
各構成要素を接続するバス71
制御装置10の各構成要素は、これらの機能を実現するプログラム64をCPU61が取得して実行することで実現される。各構成要素の機能を実現するプログラム64は、例えば、予め記憶装置65又はRAM63に格納されており、必要に応じてCPU61が読み出す。なお、プログラム64は、通信ネットワーク69を介してCPU61に供給されてもよいし、予め記録媒体66に格納されており、ドライブ装置67が当該プログラムを読み出してCPU61に供給してもよい。
制御装置10の実現方法には、様々な変形例がある。例えば、制御装置10は、各構成要素にそれぞれ別個の情報処理装置60とプログラムとの任意の組み合わせにより実現されてもよい。また、制御装置10が備える複数の構成要素が、一つの情報処理装置60とプログラムとの任意の組み合わせにより実現されてもよい。
また、制御装置10の各構成要素の一部又は全部は、その他の汎用または専用の回路、プロセッサ等やこれらの組み合わせによって実現される。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。また、情報処理装置60の代わりにFPGA(Field−Programmable Gate Array)のようなプログラマブルロジックデバイスを用いてもよい。
さらに、制御装置10の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
また、制御装置10の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
上記の実施形態の一部又は全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムの制御装置であって、
前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、前記他のストレージノードのうち所定数のストレージノードに、前記再生成されたフラグメントを書込むデータ処理部を備える、
制御装置。
(付記2)
前記データ処理部は、前記一のストレージノードの復旧後、前記所定数のストレージノードに格納された前記再生成されたフラグメントを前記一のストレージノードに移動させる、
付記1に記載の制御装置。
(付記3)
前記データ処理部は、前記複数のストレージノードの中に前記所定数のストレージノードがある場合、前記所定数のストレージノード以外の前記他のストレージノードから前記データブロックを復元するためのフラグメントを優先的に読込み、前記読込んだフラグメントから前記データブロックを復元する、
付記1又は2に記載の制御装置。
(付記4)
前記所定数は、1つ以上、前記複数のストレージノードから前記障害ストレージノードを除いた残りのストレージノードのうち、前記再生成されたフラグメントを書込まないストレージノードが1つとなる数以下である、
付記1から3のいずれか1つに記載の制御装置。
(付記5)
複数のストレージノードと、
データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを前記複数のストレージノードに分散して格納させる制御装置を備えるストレージシステムであって、
制御装置は、前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納された前記フラグメントを用いて再生成し、前記他のストレージノードのうち所定数のストレージノードに、再生成された前記フラグメントを書込むデータ処理部を備える、
ストレージシステム。
(付記6)
付記5に記載の制御装置がアクセラレータノードである、ストレージシステム。
(付記7)
前記データ処理部は、前記一のストレージノードの復旧後、前記所定数のストレージノードに格納された前記再生成されたフラグメントを前記一のストレージノードに移動させる、
付記5又は6に記載のストレージシステム。
(付記8)
前記データ処理部は、前記複数のストレージノードの中に前記所定数のストレージノードがある場合、前記所定数のストレージノード以外の前記他のストレージノードから前記データブロックを復元するためのフラグメントを優先的に読込み、前記読込んだフラグメントから前記データブロックを復元する、
付記5、6又は7に記載のストレージシステム。
(付記9)
付記5、6又は7に記載のストレージシステム。
(付記10)
データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムの制御方法であって、
前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、
前記他のストレージノードのうち所定数のストレージノードに、前記再生成されたフラグメントを書込む、
制御方法。
(付記11)
前記一のストレージノードの復旧後、前記所定数のストレージノードに格納された前記再生成されたフラグメントを前記一のストレージノードに移動させる、
付記10に記載の制御方法。
(付記12)
前記複数のストレージノードの中に前記所定数のストレージノードがある場合、前記所定数のストレージノード以外の前記他のストレージノードから前記データブロックを復元するためのフラグメントを優先的に読込み、前記読込んだフラグメントから前記データブロックを復元する、
付記10又は11に記載の制御方法。
(付記13)
前記所定数は、1つ以上、前記複数のストレージノードから前記障害ストレージノードを除いた残りのストレージノードのうち、前記再生成されたフラグメントを書込まないストレージノードが1つとなる数以下である、
付記10から12のいずれか1つに記載の制御方法。
(付記14)
データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムを制御するプログラムであって、
前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、
前記他のストレージノードのうち所定数のストレージノードに、前記再生成されたフラグメントを書込む、
ことをコンピュータに実行させるプログラム。
(付記15)
前記一のストレージノードの復旧後、前記所定数のストレージノードに格納された前記再生成されたフラグメントを前記一のストレージノードに移動させる、
付記14に記載のプログラム。
(付記16)
前記複数のストレージノードの中に前記所定数のストレージノードがある場合、前記所定数のストレージノード以外の前記他のストレージノードから前記データブロックを復元するためのフラグメントを優先的に読込み、前記読込んだフラグメントから前記データブロックを復元する、
付記14又は15に記載のプログラム。
(付記17)
前記所定数は、1つ以上、前記複数のストレージノードから前記障害ストレージノードを除いた残りのストレージノードのうち、前記再生成されたフラグメントを書込まないストレージノードが1つとなる数以下である、
付記14から16のいずれか1つに記載のプログラム。
10 制御装置
11 データ処理部
12 リードライト制御部
13 障害検出部
14 リカバリ部
15 再編成部
20 ストレージノード
21 障害ストレージノード
22 特定のストレージノード
30 データブロック
31 分割データ
32 パリティデータ
33 フラグメント
60 情報処理装置
61 CPU
62 ROM(Read Only Memory)
63 RAM
64 プログラム
65 記憶装置
66 記録媒体
67 ドライブ装置
68 通信インターフェース
69 通信ネットワーク
70 入出力インターフェース
71 バス

Claims (7)

  1. データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムの制御装置であって、
    前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、前記他のストレージノードのうち1つのストレージノードに、前記再生成されたフラグメントを書込むデータ処理手段を備える、
    制御装置。
  2. 前記データ処理手段は、前記一のストレージノードの復旧後、前記1つのストレージノードに格納された前記再生成されたフラグメントを前記一のストレージノードに移動させる、
    請求項1に記載の制御装置。
  3. 前記データ処理手段は、前記複数のストレージノードの中に前記1つのストレージノードがある場合、前記1つのストレージノード以外の前記他のストレージノードから前記データブロックを復元するためのフラグメントを優先的に読込み、前記読込んだフラグメントから前記データブロックを復元する、
    請求項1又は2に記載の制御装置。
  4. 複数のストレージノードと、
    データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを前記複数のストレージノードに分散して格納させる制御装置を備えるストレージシステムであって、
    制御装置は、前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納された前記フラグメントを用いて再生成し、前記他のストレージノードのうち1つのストレージノードに、再生成された前記フラグメントを書込むデータ処理手段を備える、
    ストレージシステム。
  5. 請求項に記載の制御装置がアクセラレータノードである、ストレージシステム。
  6. データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムの制御方法であって、
    前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、
    前記他のストレージノードのうち1つのストレージノードに、前記再生成されたフラグメントを書込む、
    制御方法。
  7. データブロックが分割された分割データ及び前記データブロックを復元するためのパリティデータを含む複数のフラグメントを、複数のストレージノードに分散して格納するストレージシステムを制御するプログラムであって、
    前記複数のストレージノードのうち障害が発生した一のストレージノードに格納されたフラグメントを、他のストレージノードに格納されたフラグメントを用いて再生成し、
    前記他のストレージノードのうち1つのストレージノードに、前記再生成されたフラグメントを書込む、
    ことをコンピュータに実行させるプログラム。
JP2016068533A 2016-03-30 2016-03-30 制御装置、制御方法及びプログラム、および、ストレージシステム Active JP6705255B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016068533A JP6705255B2 (ja) 2016-03-30 2016-03-30 制御装置、制御方法及びプログラム、および、ストレージシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016068533A JP6705255B2 (ja) 2016-03-30 2016-03-30 制御装置、制御方法及びプログラム、および、ストレージシステム

Publications (2)

Publication Number Publication Date
JP2017182442A JP2017182442A (ja) 2017-10-05
JP6705255B2 true JP6705255B2 (ja) 2020-06-03

Family

ID=60008489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016068533A Active JP6705255B2 (ja) 2016-03-30 2016-03-30 制御装置、制御方法及びプログラム、および、ストレージシステム

Country Status (1)

Country Link
JP (1) JP6705255B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5556192B2 (ja) * 2010-01-26 2014-07-23 日本電気株式会社 ストレージシステム
JP5891842B2 (ja) * 2012-02-24 2016-03-23 日本電気株式会社 ストレージシステム
WO2014016860A1 (en) * 2012-07-23 2014-01-30 Hitachi, Ltd. Raid storage system and rebuild process

Also Published As

Publication number Publication date
JP2017182442A (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
US9715436B2 (en) System and method for managing raid storage system having a hot spare drive
US8392752B2 (en) Selective recovery and aggregation technique for two storage apparatuses of a raid
US7809979B2 (en) Storage control apparatus and method
CN106776130B (zh) 一种日志恢复方法、存储装置和存储节点
US7698592B2 (en) Apparatus and method for controlling raid array rebuild
US7694171B2 (en) Raid5 error recovery logic
US9378092B2 (en) Storage control apparatus and storage control method
CN115705262A (zh) 一种内存故障恢复方法、系统以及内存
JP2011154428A (ja) ストレージシステム
JP2009217408A (ja) データ格納装置のデータ復旧方法及びその装置並びにディスクアレイシステムのデータ復旧方法及びその装置
US20190354433A1 (en) Parity log with by-pass
JP6705255B2 (ja) 制御装置、制御方法及びプログラム、および、ストレージシステム
JP2008217395A (ja) ディスクアレイ装置
JP6707939B2 (ja) 制御装置、ストレージ装置、制御方法及びプログラム
WO2021043246A1 (zh) 数据读取方法及装置
US9798473B2 (en) Storage volume device and method for increasing write speed for data streams while providing data protection
US10809940B1 (en) Multilevel resiliency
US10423506B1 (en) Fast rebuild using layered RAID
JP6734305B2 (ja) ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラム
CN114385412A (zh) 存储管理方法、设备和计算机程序产品
JP5891842B2 (ja) ストレージシステム
JP2014041523A (ja) データ管理装置、及び、データ管理方法
JP4831093B2 (ja) ディスクアレイシステム、ディスクアレイ制御方法およびディスクアレイ制御プログラム
US20240053920A1 (en) Memory System and Method for Use In the Memory System
JP6605786B2 (ja) 冗長化記憶制御装置、冗長化記憶制御方法、及び冗長化記憶制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200414

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200427

R150 Certificate of patent or registration of utility model

Ref document number: 6705255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150