JP5217967B2 - 故障ノード切り離し処理プログラム、故障ノード切り離し方法及びストレージシステム - Google Patents
故障ノード切り離し処理プログラム、故障ノード切り離し方法及びストレージシステム Download PDFInfo
- Publication number
- JP5217967B2 JP5217967B2 JP2008304198A JP2008304198A JP5217967B2 JP 5217967 B2 JP5217967 B2 JP 5217967B2 JP 2008304198 A JP2008304198 A JP 2008304198A JP 2008304198 A JP2008304198 A JP 2008304198A JP 5217967 B2 JP5217967 B2 JP 5217967B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- slice
- access
- failure
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2069—Management of state, configuration or failover
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
リカバリ処理では、以下の処理が実行される。
(2)故障ノードの切り離し
(3)欠損したセカンダリスライスの再割り当てとミラーライトの再開
(4)再割り当てしたスライスへのデータコピー
なお、故障ノードの切り離しでは、故障ノードにセカンダリスライスがある場合、セカンダリスライスを欠損したセグメントのプライマリスライスを有するストレージノードからのミラーライトを停止する。また、故障ノードにプライマリスライスがある場合、プライマリを欠損したセグメントのセカンダリスライスをプライマリスライスに変更し、ミラーライトを停止する。
ここで、セグメントに対するアクセス処理について説明する。図12は、アクセス処理の動作シーケンスを示した図である。
図1は、発明の概要を示した図である。ストレージノード10は、ネットワークを介して接続する他のストレージノード20,30と、アクセスノード60と、制御ノード70と、を有するストレージシステムに組み込まれる。
アクセスノード60は、仮想的な論理ボリュームと、実データ記憶領域とを対応付けた管理情報に基づいて、ストレージノード10,20,30が管理する実データ記憶領域にアクセス要求を行う。
ストレージノード10,20,30は、互いに定期的にハートビートを送出している。ここで、ストレージノード20が故障したとする。ストレージノード20が故障すると、ハートビートが途絶え、故障ノード検出手段14によって故障ノードとして検出される。このとき、ストレージノード10,30は、ともにストレージノード20を故障ノード候補として検出し、ブロードキャストで通知する。ストレージノード10は、ストレージノード30から、故障ノード候補としてストレージノード20を検出したことが通知される。故障ノード確定手段15は、ストレージノード30からの通知と、故障ノード検出手段14の検出した故障ノード候補とが一致するので、ストレージノード20を故障ノードとして確定する。故障ノード切り離し手段16は、メタデータを調べ、故障ノードとして確定されたストレージノード20がミラー先のスライスとなっているスライスを抽出する。抽出されたときは、このスライスをシングルプライマリスライスに変更し、メタデータを更新する。これにより、故障ノードが管理するスライスが切り離され、アクセスノード60からのアクセスが可能となる。変更前はプライマリスライスであれば、故障発生時リード要求は可であるがライト要求は不可となる。シングルプライマリスライスとしたことで、欠損したセカンダリスライスへのミラーリングが停止される。このため、アクセスノード60からのライト要求を正常に完了することができる。変更前はセカンダリスライスであれば、故障発生時、リード要求もライト要求も不可になる。シングルプライマリスライスとしたことで、欠損したプライマリスライスの代わりにプライマリスライスとなり、ミラーリングを停止される。このため、アクセスノード60からのリード要求及びライト要求を正常に完了することができる。
マルチノードストレージは、ネットワーク500を介して、複数のディスクノード100,200,300,400と、アクセスノード600、制御ノード700及び管理ノード800が接続されている。
図3は、ディスクノードのハードウェア構成例を示す図である。ディスクノード100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス106を介してRAM(Random Access Memory)102、HDD103、通信インタフェース104及びHDDインタフェース105が接続されている。
図4は、論理ディスクとディスクとの関係の一例を示した図である。
図5は、メタデータの一例を示した図である。(A)は、ディスクノードDP1のメタデータ、(B)は、ディスクノードDP2のメタデータの例である。なお、図5は、ディスクノードDP1及びディスクノードDP2のスライスには、図4に示したセグメントが割り当てられている。
例えば、1行目のノードID「DP1」、スライスID「SL1」によって識別されるスライス[L1−P1]1101は、状態が「P(プライマリスライス)」であり、論理ディスク「L1」、アドレス「A1」によって識別されるセグメント[L1−A1]1001が割り当てられていることを表している。また、ミラー先には、ディスクノード「DP3」とスライスID「SL2」によって識別されるディスク310のスライス[L1−S1]3102が割り当てられていることを表している。2行目も同様である。
通常時のブロードキャスト5010は、ハートビート送出に発行される。「発信元ID」には、ハートビートを送出したディスクノードのIDが設定される。また、ハートビート送出時、「故障ノードID」は、「なし(NULL)」になる。ブロードキャスト5010を受信したときは、故障ノード検出手段14において、「発信元ID」に設定されるディスクノードは故障していないと判定される。
図7は、故障ノード切り離し処理の動作シーケンスを示した図である。
ここで、各ディスクノードが更新する前のメタデータを有するアクセスノード600が、ディスクノードDP3(300)のプライマリスライスに指定されるスライス[L1−P3]3101に格納されるデータへアクセス要求を行ったとする。このアクセス要求は、ディスクノードDP3(300)が故障しているためエラーとなり、アクセスノード600は、メタデータをディスクノードに要求する。例えば、ディスクノードDP4(400)に対して、[L1−P3]に関するメタデータ照会6017を行う。ディスクノードDP4(400)は、このメタデータを持っていないので、ブロードキャストでメタデータ照会6018を行う。これは、ディスクノードDP1(100)及びディスクノードDP2(200)で受け取ることができる。このうち、[L1−P3]に関するメタデータを持っているディスクノードDP2(200)が更新されたメタデータ6019をブロードキャストで返す。これを受け取ったディスクノードDP4(400)が更新されたメタデータ6020をアクセスノード600に返し、アクセスノード600のメタデータが更新される。以降、アクセスノード600は、取得されたメタデータに基づいて、ディスクノードDP2(200)へアクセス要求を行う。
ディスクノードDP1のメタデータ1200は、ディスクノードDP3(300)の切り離し処理が行われる前のメタデータを示している。ここでは、スライス「SL1」はプライマリスライス(P)であり、ミラー先にはディスクノードDP3が指定されている。また、スライス「SL2」は、セカンダリスライス(S)であり、ミラー元にはディスクノードDP2が指定されている。
ディスクノードDP2のメタデータ2200は、ディスクノードDP3(300)の切り離し処理が行われる前のメタデータを示している。ここでは、スライス「SL1」はプライマリスライス(P)であり、ミラー先にはディスクノードDP1が指定されている。また、スライス「SL2」は、セカンダリスライス(S)であり、ミラー元にはディスクノードDP3が指定されている。
図10は、故障ノードの検出と切り離し処理の手順を示したフローチャートである。
[ステップS04] 他のディスクノードが送信した故障ノードのIDを通知するブロードキャストを受信する。所定の数のディスクノードから故障ノードのIDを通知するブロードキャストを受信するまで待つ。所定の数は、任意の数であり、故障ノードと自ノードを除く、他のディスクノードすべてとすることもできる。
検出された故障ノードのIDを取得し、処理が開始される。
[ステップS62] このスライスの「状態」をチェックし、セグメントが割り当てられているかどうかを判定する。割り当てられている(状態=PまたはS)ときは、処理をステップS63に進める。割り当てられていない(状態=F)ときは、処理をステップS68に進める。
[ステップS64] ステップS63における照合の結果、ミラーのノードIDが故障ノードのIDと一致していれば、処理をステップS65に進め、ミラーのノードの切り離し処理を行う。一致していないときは、処理をステップS68に進める。
以上の処理手順が実行されることにより、ディスクノードが故障したことにより欠損したセグメントのプライマリスライスまたはセカンダリスライスを切り離し、正常なスライスをシングルプライマリスライスにすることができる。これにより、シングルプライマリをアクセス先として、アクセスノードからのアクセスを継続させることができる。
(付記1) データを複数のストレージ装置に分散して格納するストレージシステムにて、前記ストレージ装置の実データ記憶領域を管理するコンピュータが故障したとき、前記コンピュータを切り離す故障ノード切り離し処理プログラムにおいて、
前記コンピュータを、
仮想的な論理ボリュームを分割したセグメントに対し、前記ストレージ装置の実データ記憶領域を前記セグメントの単位で分割したスライスを、アクセスノードからのアクセス先として前記セグメントのデータを格納するプライマリスライス、または、前記プライマリスライスのデータをミラーリングして格納するセカンダリスライスとして割り当て、前記セグメントと、前記セグメントに割り当てられた前記プライマリスライス及び前記セカンダリスライスと、を対応付けた管理情報を記憶手段に格納し、前記管理情報に基づいて前記アクセスノードからのアクセス要求を処理するアクセス処理手段、
他の前記ストレージ装置の実記憶領域を管理する他のコンピュータが正常動作中に所定の周期で送信する生存信号を監視し、一定期間前記生存信号が検出されなかった前記他のコンピュータを故障ノードとして検出する故障ノード検出手段、
前記故障ノードと前記管理情報を照合し、管理対象の前記スライスが前記故障ノードの管理する前記スライスに対応付けられていたときは、管理対象の前記スライスを前記アクセスノードのアクセス先であって前記ミラーリングが停止されるシングルプライマリスライスに設定し、前記故障ノードを切り離す故障ノード切り離し手段、
として機能させることを特徴とする故障ノード切り離し処理プログラム。
前記アクセス処理手段による前記アクセス処理が実行可能状態にあるときは、前記所定の周期で、前記生存信号を前記他のコンピュータに向けてブロードキャストで送信する生存信号送出手段、
として機能させることを特徴とする付記1記載の故障ノード切り離し処理プログラム。
前記故障ノード検出手段によって検出された前記故障ノードを故障ノード候補とし、前記故障ノード候補の通知を前記他のコンピュータに向けて送信するとともに、前記他のコンピュータから前記故障ノード候補の通知を受信し、前記通知より抽出された故障ノード候補と、自身が検出した前記故障ノード候補とを照合し、一致しているときのみ前記故障ノード候補を前記故障ノードとして確定させる故障ノード確定手段、
として機能させることを特徴とする付記1記載の故障ノード切り離し処理プログラム。
アクセス処理手段が、仮想的な論理ボリュームを分割したセグメントに対し、前記ストレージ装置の実データ記憶領域を前記セグメントの単位で分割したスライスを、アクセスノードからのアクセス先として前記セグメントのデータを格納するプライマリスライス、または、前記プライマリスライスのデータをミラーリングして格納するセカンダリスライスとして割り当て、前記セグメントと、前記セグメントに割り当てられた前記プライマリスライス及び前記セカンダリスライスと、を対応付けた管理情報を記憶手段に格納し、前記管理情報に基づいて前記アクセスノードからのアクセス要求を処理する手順と、
故障ノード検出手段が、他の前記ストレージ装置の実記憶領域を管理する他のコンピュータが正常動作中に所定の周期で送信する生存信号を監視し、一定期間前記生存信号が検出されなかった前記他のコンピュータを故障ノードとして検出する手順と、
故障ノード切り離し手段が、前記故障ノードと前記管理情報を照合し、管理対象の前記スライスが前記故障ノードの管理する前記スライスに対応付けられていたときは、管理対象の前記スライスを前記アクセスノードのアクセス先であって前記ミラーリングが停止されるシングルプライマリスライスに設定し、前記故障ノードを切り離す手順と、
を有することを特徴とする故障ノード切り離し方法。
仮想的な論理ボリュームを分割したセグメントに対し、前記ストレージ装置の実データ記憶領域を前記セグメントの単位で分割したスライスを、アクセスノードからのアクセス先として前記セグメントのデータを格納するプライマリスライス、または、前記プライマリスライスのデータをミラーリングして格納するセカンダリスライスとして割り当て、前記セグメントと、前記セグメントに割り当てられた前記プライマリスライス及び前記セカンダリスライスと、を対応付けた管理情報が格納される記憶手段と、前記管理情報に基づいて前記アクセスノードからのアクセス要求を処理するアクセス処理手段と、他の前記ストレージ装置の実記憶領域を管理する他のコンピュータが正常動作中に所定の周期で送信する生存信号を監視し、一定期間前記生存信号が検出されなかった前記他のコンピュータを故障ノードとして検出する故障ノード検出手段と、前記故障ノードと前記管理情報を照合し、管理対象の前記スライスが前記故障ノードの管理する前記スライスに対応付けられていたときは、管理対象の前記スライスを前記アクセスノードのアクセス先であって前記ミラーリングが停止されるシングルプライマリスライスに設定し、前記故障ノードを切り離す故障ノード切り離し手段と、を備えた複数のストレージノードと、
前記ストレージノードから前記管理情報を取得し、前記管理情報に基づいてアクセス先の前記ストレージノードを特定し、特定された前記ストレージノードに対しアクセス要求を行う前記アクセスノードと、
を有することを特徴とするストレージシステム。
11 ストレージ
11a デバイス情報
11b メタデータ
11c スライス
12 通信手段
13 ハートビート送出手段
14 故障ノード検出手段
15 故障ノード確定手段
16 故障ノード切り離し手段
17 アクセス処理手段
Claims (5)
- データを複数のストレージ装置に分散して格納するストレージシステムにて、前記ストレージ装置の実データ記憶領域を管理するコンピュータが故障したとき、前記コンピュータを切り離す故障ノード切り離し処理プログラムにおいて、
前記コンピュータを、
仮想的な論理ボリュームを分割したセグメントに対し、前記ストレージ装置の実データ記憶領域を前記セグメントの単位で分割したスライスを、アクセスノードからのアクセス先として前記セグメントのデータを格納するプライマリスライス、または、前記プライマリスライスのデータをミラーリングして格納するセカンダリスライスとして割り当て、前記セグメントと、前記セグメントに割り当てられた前記プライマリスライス及び前記セカンダリスライスと、を対応付けた管理情報を記憶手段に格納し、前記管理情報に基づいて前記アクセスノードからのアクセス要求を処理するアクセス処理手段、
他の前記ストレージ装置の実記憶領域を管理する他のコンピュータが正常動作中に所定の周期で送信する生存信号を監視し、一定期間前記生存信号が検出されなかった前記他のコンピュータを故障ノードとして検出する故障ノード検出手段、
前記故障ノードと前記管理情報を照合し、管理対象の前記スライスが前記故障ノードの管理する前記スライスに対応付けられていたときは、管理対象の前記スライスを前記アクセスノードのアクセス先であって前記ミラーリングが停止されるシングルプライマリスライスに設定し、前記故障ノードを切り離す故障ノード切り離し手段、
として機能させるとともに、
前記アクセス処理手段は、
前記アクセスノードからプライマリスライスへのライト要求に対して、セカンダリスライスへのミラーリングを実行してから前記プライマリスライスが格納するデータを更新し、
前記アクセスノードからシングルプライマリスライスへのライト要求に対して、前記故障ノードへのミラーリングを停止して前記シングルプライマリスライスが格納するデータを更新する、
ことを特徴とする故障ノード切り離し処理プログラム。 - 前記コンピュータを、
前記故障ノード検出手段によって検出された前記故障ノードを故障ノード候補とし、前記故障ノード候補の通知を前記他のコンピュータに向けて送信するとともに、前記他のコンピュータから前記故障ノード候補の通知を受信し、前記通知より抽出された故障ノード候補と、自身が検出した前記故障ノード候補とを照合し、一致しているときのみ前記故障ノード候補を前記故障ノードとして確定させる故障ノード確定手段、
として機能させることを特徴とする請求項1記載の故障ノード切り離し処理プログラム。 - 前記アクセス処理手段は、前記アクセスノードから前記セグメントを指定して要求される指定セグメントに対応する管理情報の読み出し要求を受けたときは、前記記憶手段に格納される前記管理情報から前記指定セグメントに対応する管理情報を検索し、検索されたときは該指定セグメントに対応する管理情報を前記アクセスノードに送信し、検索されなかったときは前記指定セグメントに対応する管理情報の読み出し要求を前記他のコンピュータに向けて送信し、該指定セグメントに対応する管理情報を有する前記他のコンピュータから取得された前記指定セグメントに対応する管理情報を前記アクセスノードに送信する、ことを特徴とする請求項1記載の故障ノード切り離し処理プログラム。
- データを複数のストレージ装置に分散して格納するストレージシステムにて、前記ストレージ装置の実データ記憶領域を管理するコンピュータが故障したとき、前記コンピュータを切り離す故障ノード切り離し方法において、
アクセス処理手段が、仮想的な論理ボリュームを分割したセグメントに対し、前記ストレージ装置の実データ記憶領域を前記セグメントの単位で分割したスライスを、アクセスノードからのアクセス先として前記セグメントのデータを格納するプライマリスライス、または、前記プライマリスライスのデータをミラーリングして格納するセカンダリスライスとして割り当て、前記セグメントと、前記セグメントに割り当てられた前記プライマリスライス及び前記セカンダリスライスと、を対応付けた管理情報を記憶手段に格納し、前記管理情報に基づいて前記アクセスノードからのアクセス要求を処理する手順と、
故障ノード検出手段が、他の前記ストレージ装置の実記憶領域を管理する他のコンピュータが正常動作中に所定の周期で送信する生存信号を監視し、一定期間前記生存信号が検出されなかった前記他のコンピュータを故障ノードとして検出する手順と、
故障ノード切り離し手段が、前記故障ノードと前記管理情報を照合し、管理対象の前記スライスが前記故障ノードの管理する前記スライスに対応付けられていたときは、管理対象の前記スライスを前記アクセスノードのアクセス先であって前記ミラーリングが停止されるシングルプライマリスライスに設定し、前記故障ノードを切り離す手順と、
を有し、
前記アクセス要求を処理する手順は、
前記アクセスノードからプライマリスライスへのライト要求に対して、セカンダリスライスへのミラーリングを実行してから前記プライマリスライスが格納するデータを更新する手順と、
前記アクセスノードからシングルプライマリスライスへのライト要求に対して、前記故障ノードへのミラーリングを停止して前記シングルプライマリスライスが格納するデータを更新する手順と、
を有することを特徴とする故障ノード切り離し方法。 - データを複数のストレージ装置に分散して格納するストレージシステムにおいて、
仮想的な論理ボリュームを分割したセグメントに対し、前記ストレージ装置の実データ記憶領域を前記セグメントの単位で分割したスライスを、アクセスノードからのアクセス先として前記セグメントのデータを格納するプライマリスライス、または、前記プライマリスライスのデータをミラーリングして格納するセカンダリスライスとして割り当て、前記セグメントと、前記セグメントに割り当てられた前記プライマリスライス及び前記セカンダリスライスと、を対応付けた管理情報が格納される記憶手段と、前記管理情報に基づいて前記アクセスノードからのアクセス要求を処理するアクセス処理手段と、他の前記ストレージ装置の実記憶領域を管理する他のコンピュータが正常動作中に所定の周期で送信する生存信号を監視し、一定期間前記生存信号が検出されなかった前記他のコンピュータを故障ノードとして検出する故障ノード検出手段と、前記故障ノードと前記管理情報を照合し、管理対象の前記スライスが前記故障ノードの管理する前記スライスに対応付けられていたときは、管理対象の前記スライスを前記アクセスノードのアクセス先であって前記ミラーリングが停止されるシングルプライマリスライスに設定し、前記故障ノードを切り離す故障ノード切り離し手段と、を備え、前記アクセス処理手段は、前記アクセスノードからプライマリスライスへのライト要求に対して、セカンダリスライスへのミラーリングを実行してから前記プライマリスライスが格納するデータを更新し、前記アクセスノードからシングルプライマリスライスへのライト要求に対して、前記故障ノードへのミラーリングを停止して前記シングルプライマリスライスが格納するデータを更新する、複数のストレージノードと、
前記ストレージノードから前記管理情報を取得し、前記管理情報に基づいてアクセス先の前記ストレージノードを特定し、特定された前記ストレージノードに対しアクセス要求を行う前記アクセスノードと、
を有することを特徴とするストレージシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008304198A JP5217967B2 (ja) | 2008-11-28 | 2008-11-28 | 故障ノード切り離し処理プログラム、故障ノード切り離し方法及びストレージシステム |
US12/569,219 US20100138687A1 (en) | 2008-11-28 | 2009-09-29 | Recording medium storing failure isolation processing program, failure node isolation method, and storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008304198A JP5217967B2 (ja) | 2008-11-28 | 2008-11-28 | 故障ノード切り離し処理プログラム、故障ノード切り離し方法及びストレージシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010128886A JP2010128886A (ja) | 2010-06-10 |
JP5217967B2 true JP5217967B2 (ja) | 2013-06-19 |
Family
ID=42223873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008304198A Expired - Fee Related JP5217967B2 (ja) | 2008-11-28 | 2008-11-28 | 故障ノード切り離し処理プログラム、故障ノード切り離し方法及びストレージシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20100138687A1 (ja) |
JP (1) | JP5217967B2 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8626871B2 (en) * | 2010-05-19 | 2014-01-07 | Cleversafe, Inc. | Accessing a global vault in multiple dispersed storage networks |
US8812916B2 (en) * | 2011-06-02 | 2014-08-19 | International Business Machines Corporation | Failure data management for a distributed computer system |
US9152458B1 (en) * | 2012-08-30 | 2015-10-06 | Google Inc. | Mirrored stateful workers |
US8850108B1 (en) * | 2014-06-04 | 2014-09-30 | Pure Storage, Inc. | Storage cluster |
US10574754B1 (en) | 2014-06-04 | 2020-02-25 | Pure Storage, Inc. | Multi-chassis array with multi-level load balancing |
US9213485B1 (en) | 2014-06-04 | 2015-12-15 | Pure Storage, Inc. | Storage system architecture |
US11652884B2 (en) | 2014-06-04 | 2023-05-16 | Pure Storage, Inc. | Customized hash algorithms |
US10853311B1 (en) | 2014-07-03 | 2020-12-01 | Pure Storage, Inc. | Administration through files in a storage system |
JP6398417B2 (ja) * | 2014-07-22 | 2018-10-03 | 富士通株式会社 | ストレージ装置、ストレージシステム及びストレージ制御プログラム |
US10261690B1 (en) | 2016-05-03 | 2019-04-16 | Pure Storage, Inc. | Systems and methods for operating a storage system |
US11886334B2 (en) | 2016-07-26 | 2024-01-30 | Pure Storage, Inc. | Optimizing spool and memory space management |
US11422719B2 (en) | 2016-09-15 | 2022-08-23 | Pure Storage, Inc. | Distributed file deletion and truncation |
US9747039B1 (en) | 2016-10-04 | 2017-08-29 | Pure Storage, Inc. | Reservations over multiple paths on NVMe over fabrics |
US10545687B1 (en) | 2017-10-31 | 2020-01-28 | Pure Storage, Inc. | Data rebuild when changing erase block sizes during drive replacement |
JP2019082897A (ja) | 2017-10-31 | 2019-05-30 | 富士通株式会社 | 情報処理装置、情報処理システム及びプログラム |
JP6668309B2 (ja) * | 2017-11-30 | 2020-03-18 | 株式会社日立製作所 | 記憶システム及びその制御方法 |
US10976948B1 (en) | 2018-01-31 | 2021-04-13 | Pure Storage, Inc. | Cluster expansion mechanism |
US11385792B2 (en) | 2018-04-27 | 2022-07-12 | Pure Storage, Inc. | High availability controller pair transitioning |
US11500570B2 (en) | 2018-09-06 | 2022-11-15 | Pure Storage, Inc. | Efficient relocation of data utilizing different programming modes |
US11416144B2 (en) | 2019-12-12 | 2022-08-16 | Pure Storage, Inc. | Dynamic use of segment or zone power loss protection in a flash device |
US11782610B2 (en) * | 2020-01-30 | 2023-10-10 | Seagate Technology Llc | Write and compare only data storage |
US11223681B2 (en) | 2020-04-10 | 2022-01-11 | Netapp, Inc. | Updating no sync technique for ensuring continuous storage service in event of degraded cluster state |
US11474986B2 (en) | 2020-04-24 | 2022-10-18 | Pure Storage, Inc. | Utilizing machine learning to streamline telemetry processing of storage media |
CN113590016A (zh) * | 2020-04-30 | 2021-11-02 | 伊姆西Ip控股有限责任公司 | 用于管理存储盘的方法、电子设备和计算机程序产品 |
CN112131077A (zh) * | 2020-09-21 | 2020-12-25 | 中国建设银行股份有限公司 | 故障节点的定位方法和定位装置、以及数据库集群系统 |
US11487455B2 (en) | 2020-12-17 | 2022-11-01 | Pure Storage, Inc. | Dynamic block allocation to optimize storage system performance |
CN114780442A (zh) * | 2022-06-22 | 2022-07-22 | 杭州悦数科技有限公司 | 分布式系统的测试方法和装置 |
CN116155594B (zh) * | 2023-02-21 | 2023-07-14 | 北京志凌海纳科技有限公司 | 一种网络异常节点的隔离方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001005739A (ja) * | 1999-06-21 | 2001-01-12 | Hitachi Ltd | データパスにおける障害部位の特定方法および装置 |
US7275100B2 (en) * | 2001-01-12 | 2007-09-25 | Hitachi, Ltd. | Failure notification method and system using remote mirroring for clustering systems |
JP4037257B2 (ja) * | 2002-12-26 | 2008-01-23 | 株式会社日立製作所 | 情報処理システムの制御方法、情報処理システム、及びプログラム |
JP4711688B2 (ja) * | 2003-05-21 | 2011-06-29 | 富士通株式会社 | ストレージシステム |
JP4296120B2 (ja) * | 2004-04-09 | 2009-07-15 | 富士通株式会社 | 冗長構成復元方法、データ管理システム及び冗長構成復元プログラム |
US7519851B2 (en) * | 2005-02-08 | 2009-04-14 | Hitachi, Ltd. | Apparatus for replicating volumes between heterogenous storage systems |
US7941602B2 (en) * | 2005-02-10 | 2011-05-10 | Xiotech Corporation | Method, apparatus and program storage device for providing geographically isolated failover using instant RAID swapping in mirrored virtual disks |
JP2007279890A (ja) * | 2006-04-04 | 2007-10-25 | Hitachi Ltd | バックアップシステム及びバックアップ方法 |
JP4459217B2 (ja) * | 2006-11-30 | 2010-04-28 | 株式会社東芝 | クラスタシステムおよびクラスタシステムのデータ復旧方法 |
WO2008136074A1 (ja) * | 2007-04-20 | 2008-11-13 | Fujitsu Limited | 2重化組み合わせ管理プログラム、2重化組み合わせ管理装置、および2重化組み合わせ管理方法 |
-
2008
- 2008-11-28 JP JP2008304198A patent/JP5217967B2/ja not_active Expired - Fee Related
-
2009
- 2009-09-29 US US12/569,219 patent/US20100138687A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2010128886A (ja) | 2010-06-10 |
US20100138687A1 (en) | 2010-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5217967B2 (ja) | 故障ノード切り離し処理プログラム、故障ノード切り離し方法及びストレージシステム | |
JP4325836B2 (ja) | 複数リモートストレージのデータ同期方式 | |
US9182918B2 (en) | Network storage systems having clustered raids for improved redundancy and load balancing | |
JP4927408B2 (ja) | 記憶システム及びそのデータ復元方法 | |
US6134673A (en) | Method for clustering software applications | |
WO2016070375A1 (zh) | 一种分布式存储复制系统和方法 | |
JP5396836B2 (ja) | データ分散制御プログラム、ストレージ管理プログラム、制御ノード、およびディスクノード | |
JP2011128917A (ja) | データ割当制御プログラム、データ割当制御方法、およびデータ割当制御装置 | |
JP2005196683A (ja) | 情報処理システム、情報処理装置、及び情報処理システムの制御方法 | |
JP5094460B2 (ja) | 計算機システム、データ一致化方法およびデータ一致化処理プログラム | |
US20040193658A1 (en) | Disaster recovery processing method and apparatus and storage unit for the same | |
JP2019219954A (ja) | クラスタストレージシステム、データ管理制御方法、データ管理制御プログラム | |
US20010056554A1 (en) | System for clustering software applications | |
EP1569120A1 (en) | Computer system for recovering data based on priority of the data | |
JP2010097385A (ja) | データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム | |
JP2004532442A (ja) | ストレージシステムにおけるフェイルオーバー処理 | |
CN104994168A (zh) | 分布式存储方法及分布式存储系统 | |
US9342418B2 (en) | Storage system, storage control device and data transfer method | |
CN106331166A (zh) | 一种存储资源的访问方法及装置 | |
WO2005010766A1 (ja) | データ格納システム | |
JP2004199682A (ja) | 高可用性クラスタにおける活性判定用通信ネットワークとしての記憶媒体の使用 | |
JP2015005037A (ja) | 情報処理装置、情報処理装置の制御プログラム、および情報処理装置の制御方法 | |
JP2006285336A (ja) | 記憶装置及びストレージシステム並びにその制御方法 | |
JP6569476B2 (ja) | ストレージ装置、ストレージシステムおよびストレージ制御プログラム | |
JP5348300B2 (ja) | データ管理プログラム、およびマルチノードストレージシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160315 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |