JP2010097385A - データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム - Google Patents
データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム Download PDFInfo
- Publication number
- JP2010097385A JP2010097385A JP2008267280A JP2008267280A JP2010097385A JP 2010097385 A JP2010097385 A JP 2010097385A JP 2008267280 A JP2008267280 A JP 2008267280A JP 2008267280 A JP2008267280 A JP 2008267280A JP 2010097385 A JP2010097385 A JP 2010097385A
- Authority
- JP
- Japan
- Prior art keywords
- slice
- storage
- node
- access
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2082—Data synchronisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2069—Management of state, configuration or failover
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2089—Redundant storage control functionality
- G06F11/2092—Techniques of failing over between control units
Abstract
【解決手段】 ストレージ装置1の動作が不調になるか、あるいは故障により、応答時間計測手段4aで計測している経過時間「T」が動作不調検出時間「T1」を超えると、動作不調検出手段4bにより、ストレージ装置1が故障中の可能性があることを示す動作不調情報が、制御ノード7に対して出力される。制御ノード7では、動作不調情報が動作不調情報記憶手段7bに格納される。その後、アクセスノード8がストレージ装置1内の先頭のスライス1aにアクセスしエラーになると、制御ノード7に対して、アクセスが失敗したことを示すアクセス関連情報を送信する。制御ノード7では、アクセス関連情報で示されるスライス1aのリカバリ指示をディスクノード5,6に対して行う。
【選択図】図1
Description
図1は、実施の形態の概要を示す図である。図1には、マルチノードストレージシステムが示されている。マルチノードストレージシステムは、ストレージ装置1〜3に格納されたデータを二重化して管理するため複数のディスクノード4〜6、制御ノード7、およびアクセスノード8を有する。
応答時間計測手段4aは、ローカルに接続されたストレージ装置1に対して検査コマンドを発行する。そして、応答時間計測手段4aは、検査コマンドの発行から検査コマンドに対する応答がストレージ装置1から返されるまでの経過時間「T」を計測する。
動作不調情報管理手段7aは、ディスクノード4〜6の1つから動作不調情報を受け取ると、動作不調情報を動作不調情報記憶手段7bに格納する。
リカバリ指示手段7cは、複数のストレージ装置1〜3のスライスをアクセス対象スライスとしてアクセス要求が出されたことを示すアクセス関連情報を受け取ると、動作不調情報記憶手段7b内の動作不調情報を参照してアクセス対象スライスが属するストレージ装置が故障中である可能性の有無を判断する。すなわち、アクセス対象スライスが属するストレージ装置に故障の可能性がある旨の動作不調情報が動作不調情報記憶手段7bに格納されていれば、故障の可能性ありと判断される。
図2は、第1の形態のマルチノードストレージシステム構成例を示す図である。本実施の形態では、ネットワーク10を介して、複数のディスクノード100,200,300、制御ノード500、アクセスノード600,700、および管理ノード30が接続されている。ディスクノード100,200,300それぞれには、ストレージ装置110,210,310が接続されている。
図4は、仮想ディスクのデータ構造を示す図である。本実施の形態では、仮想ディスク60には仮想ディスク識別子「LVOL−X」が付与されている。ネットワーク経由で接続された3台のディスクノード100,200,300には、個々のノードの識別のためにそれぞれ「SN−A」、「SN−B」、「SN−C」というノード識別子が付与されている。そして、各ディスクノード100,200,300に接続されているストレージ装置110,210,310は、ディスクノード100,200,300のノード識別子と、各ディスクノード100,200,300内でのディスクIDの組によってネットワーク10で一意に識別される。
図6は、ストレージ装置のデータ構造例を示す図である。ストレージ装置110には、スライス115a,115b,115c,・・・とは別に複数のメタデータ117a,117b,117c,・・・が格納されている。
ディスクIDの欄には、ディスクノード100に接続されているストレージ装置の識別情報(ディスクID)が設定される。本実施の形態ではディスクノード100に1台のストレージ装置110しか接続されていないが、複数のストレージ装置が接続された場合、各ストレージ装置に異なるディスクIDが設定される。
状態の欄には、スライスの状態を示す状態フラグが設定される。スライスが仮想ディスクのセグメントに割り当てられていない場合、状態フラグ「F」が設定される。仮想ディスクのセグメントのプライマリストレージに割り当てられている場合、状態フラグ「P」が設定される。仮想ディスクのセグメントのセカンダリストレージに割り当てられている場合、状態フラグ「S」が設定される。仮想ディスクのセグメントに割り当てることが決定したが、まだデータのコピーが行われていない場合、予約済を示す状態フラグ「R」が設定される。異常セグメントと判定された場合、異常であることを示す状態フラグ「B」が設定される。
セグメントIDの欄には、スライスが割り当てられたセグメントの識別情報(セグメントID)が設定される。
ペアのディスクノードIDの欄には、ペアのスライス(同じセグメントに属する別のスライス)を有するストレージ装置を管理するディスクノードの識別情報(ディスクノードID)が設定される。
タイムスタンプの欄には、セグメントへのスライスの割り当てを行った時刻(タイムスタンプ)が設定される。図中のタイムスタンプの値は、「t」に続く数が大きいほど、新しい時刻を示している。tnの「n」は自然数を示している。
図9は、ストレージ状態記憶部のデータ構造例を示す図である。ストレージ状態記憶部530には、ディスク管理テーブル531が格納されている。ディスク管理テーブル531には、ディスクノードID、ディスクID、および状態の欄が設けられている。
[ステップS12]状態の切り替えが完了すると、ストレージ状態管理部540は、切り替え完了応答をディスクノード100に送信する。
[ステップS19]ディスクノード300から制御ノード500に、メタデータの変更完了応答が送信される。
図10の説明に戻り、メタデータの更新が完了すると、スライス割り当て管理部550は、メタデータ検索部520に対してスライス再割り当ての完了を通知する。
図13は、ストレージ装置の負荷が過大となったときのスライス切り替え処理の手順を示すシーケンス図である。この例では、ディスクノード100に接続されたストレージ装置110の負荷が一時的に過大になったものとする。なお、図13のステップS31〜ステップS42の処理は、それぞれ図10のステップS11〜S22の処理と同じである。そこで、ステップS43以降の処理をステップ番号に沿って説明する。
[ステップS52]メタデータ要求を受信したディスクノード100のスライス管理部160は、メタデータ記憶部150またはストレージ装置110からメタデータを取得し、制御ノード500に送信する。他のディスクノード200,300も同様にメタデータを制御ノード500に送信する。
1.故障検出時間「T2」を長くとってもアクセスが長時間止まらない。
従来のマルチノードストレージでは誤検出を起こさず、できるだけ早くアクセスを復帰させるためにディスク装置ごとに故障検出時間を調整する必要があった。第1の実施の形態によれば、故障検出時間「T2」を大部分の装置が応答する時間(例えば1分)に設定し、動作不調検出時間「T1」を例えば1秒に設定する。故障検出時間「T2」を長く設定したことで、どのようなタイプのストレージ装置であっても、故障の誤検出をすることがなくなる。
[第2の実施の形態]
第2の実施の形態は、T2を用いずに、管理ノード30からのディスクノード切り離し指示に基づいてリカバリ処理を開始するものである。
[第3の実施の形態]
第3の実施の形態は、ディスクノードからのスライスを指定したスライス異常通知に基づいて、指定されたスライスが割り当てられていたセグメントへのスライスの再割り当てを行うものである。
メタデータ記憶部450は、図5に示したメタデータ記憶部450が記憶している情報に加え、各スライスの二重化状態を示す情報を記憶している。二重化状態を示す情報としては、二重化状態には、正常とコピー中とがある。正常は、ペアとなったスライスとの間の二重化が保たれている(格納されているデータの同一性が保たれている)状態である。コピー中は、ペアとなったスライスとの間で二重化を確立するためにデータをコピーしている状態である。
メタデータ検索部820の機能は、図5に示したメタデータ検索部520の機能と同様である。ただし、スライスの再割り当てをスライス割り当て管理部550に要求する機能は不要である。
図18は、メタデータ記憶部のデータ構造例を示す図である。メタデータ記憶部450には、メタデータテーブル451が格納されている。メタデータテーブル451には、ディスクノードID、ディスクID、スライスID、状態、仮想ディスクID、セグメントID、仮想ディスクアドレス、ペアのディスクノードID、ペアのディスクID、ペアのスライスID、タイムスタンプ、および二重化状態の欄が設けられている。メタデータテーブル451内の横方向に並べられた情報が互いに関連付けられ、メタデータを示す1つのレコードを構成している。メタデータテーブル451の二重化状態以外の各欄に設定される情報は、図7に示したメタデータテーブル151の同名の欄と同種の情報である。
[ステップS82]割り当て可否の切り替えが完了すると、ストレージ状態管理部840は、切り替え完了応答をディスクノード400に送信する。
図23は、更新後の仮想ディスクメタデータ記憶部の内容を示す図である。図23に示すように、ディスクノードID「SN−A」、ディスクID「1」、スライスID「1」で示されるスライスのメタデータは、状態が「B」に変更されている。なお、状態「B」は、対応するスライスが異常であることを示す。これにより、ストレージ装置410内のスライスの照会対象セグメント(セグメントID「1」)への割り当てが解除される。
メタデータの更新が完了したことで、メタデータ検索部820は、リカバリ対象セグメントへのメタデータ照会要求があれば、リカバリ対象セグメントのリカバリ後の状態を示すメタデータをアクセスノード600に提供可能となる。
[ステップS86]メタデータ照会部610は、制御ノード800に対してセグメントを指定したメタデータの照会要求を送信する。照会要求で指定されるセグメント(照会対象セグメント)は、エラーによりアクセスが失敗したセグメントである。
図24は、ストレージ装置の負荷が過大となったときのスライス切り替え処理の手順を示すシーケンス図である。この例では、ディスクノード400に接続されたストレージ装置410の負荷が一時的に過大になったものとする。なお、図24のステップS101〜ステップS113の処理は、それぞれ図21のステップS81〜S93の処理と同じである。そこで、ステップS114以降の処理をステップ番号に沿って説明する。
なお、第1の実施の形態では、ストレージ装置が復帰するとリカバリ処理を行ったセグメント(第1の実施の形態では「照会対象セグメント」)に割り当てられていたスライスを空き(Free)状態に変更している。他方、第3の実施の形態では、T1経過後にアクセスがあったスライスは、アクセスがあった時点で状態を「B(Bad)」に変更している。そのため、ストレージ装置が復帰しても、メタデータの変更処理は不要である。
[ステップS134]その後、アクセスノード600のスライスアクセス要求部630は、メタデータの照会が完了すると、アクセス用メタデータ記憶部620を参照してアクセス対象のスライスを管理するディスクノードを判断し、そのディスクノードへリード要求(リードリトライ)を送信する。
[ステップS135]その後、ディスクノード400のT2検出部440は、検査コマンド発行からT2が経過したことを検出する。そして、T2検出部440は、制御ノード800に対してT2経過通知を送信する。
このように、ストレージ装置内のスライス内のデータのコピー中(二重化状態が復旧していない状態)の場合、ディスクノードは、当該ストレージ装置のT1経過を検出し、当該スライスへのアクセスがあってもリード処理を継続する。すなわち、ディスクノードは、アクセス対象のスライスの状態を「B(Bad)」に変更したり、制御ノード800にスライス異常通知を送信したりしない。これにより、二重化回復のためのコピー処理が完了する前に、プライマリスライスが異常として取り扱われることを防ぐことができる。その結果、データのロストが防止される。
[ステップS155]T1/復帰検出部430は、検査コマンドの送信からT1が経過すると、T1経過通知を制御ノード800に送信する。
[ステップS161]T2検出部440は、検査コマンドが発行されてからT2が経過したか否かを判断する。具体的には、T2検出部440は、T1/復帰検出部430から検査コマンドの出力時刻を取得する。そして、T2検出部440は、現在時刻から検査コマンドの出力時刻を減算し、減算結果がT2以上であれば、T2が経過したものと判断する。T2が経過した場合、処理がステップS162に進められる。T2が経過していない場合、処理がステップS163に進められる。
[ステップS163]スライスアクセス処理部420は、ストレージ装置410に対するアクセス要求が入力されたか否かを判断する。アクセス要求が入力された場合、処理がステップS165に進められる。アクセス要求が入力されていなければ、処理がステップS164に進められる。
[ステップS169]スライスアクセス処理部420は、アクセスエラーをアクセスノード600に送信する。その後、処理がステップS170に進められる。
このようにして、リカバリ中のセグメントに割り当てられているスライスを有するストレージ装置でT1が検出され、そのスライスに対するアクセス要求があっても、スライス異常通知が行われない。その結果、複数のストレージ装置において同時にT1経過が検出された場合でも、データが消失するのを防止できる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、制御ノードやディスクノードが有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disc)などがある。
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
前記コンピュータを、
前記複数のストレージ装置のうちの1つが故障中の可能性があることを示す動作不調情報を受け取ると、前記動作不調情報を動作不調情報記憶手段に格納する動作不調情報管理手段、
前記複数のストレージ装置のスライスをアクセス対象スライスとしてアクセス要求が出されたことを示すアクセス関連情報を受け取ると、前記動作不調情報記憶手段内の前記動作不調情報を参照して前記アクセス対象スライスが属する前記ストレージ装置が故障中である可能性の有無を判断し、故障の可能性がある場合、前記アクセス対象スライス内のデータと同じ内容の冗長データを格納する前記ストレージ装置へのデータ入出力機能を有するスライス管理手段へ、前記アクセス対象スライスに格納されていたデータのリカバリ処理を指示するリカバリ指示手段、
として機能させることを特徴とするデータ管理プログラム。
複数のセグメントで構成される仮想ディスクが定義されており、異なるストレージ装置に属する2つの前記スライスが前記セグメントそれぞれに割り当てられており、前記複数のストレージ装置それぞれの前記スライスごとに設けられ、前記スライスと前記セグメントとの割り当て関係を示すメタデータを記憶する仮想ディスクメタデータ記憶手段として機能させ、
前記アクセス関連情報は、ネットワークを介して前記複数のストレージ装置にアクセスを行うアクセスノードによる前記ストレージ装置内のスライスへのアクセスが失敗したときに前記アクセスノードから送信される、アクセスに失敗したスライスが割り当てられているセグメントを照会対象セグメントとして指定した割り当て関係の照会要求であり、
前記リカバリ指示手段は、
前記仮想ディスクメタデータ記憶手段から、前記アクセス関連情報で指定された前記照会対象セグメントに割り当てられている2つの被割り当てスライスの前記メタデータを検索し、前記動作不調情報記憶手段を参照し、検索により得られた前記メタデータに基づいて前記被割り当てスライスが属する前記ストレージ装置が故障中である可能性の有無を判断するメタデータ検索手段と、
前記メタデータ検索手段が故障中の可能性があると判断された場合、故障中の可能性がある前記ストレージ装置に属する前記被割り当てスライスの前記照会対象セグメントへの割り当てを解除し、他の前記スライスを前記照会対象セグメントに新規に割り当てるスライス割り当て手段と、
を有することを特徴とする付記1記載のデータ管理プログラム。
前記メタデータ検索手段は、前記被割り当てスライスが属する前記ストレージ装置が故障中の可能性があると判断した場合、前記被割り当てスライスに代えて前記照会対象セグメントに対して新規のスライスの割り当てられるのを待ち、新規のスライスが割り当てられた後、前記照会対象セグメントに割り当てられたスライスのメタデータを前記仮想ディスクメタデータ記憶手段から取得し、前記アクセスノードに送信することを特徴とする付記6記載のデータ管理プログラム。
前記コンピュータを、
前記ストレージ装置に対して検査コマンドを発行し、前記検査コマンド発行から応答があるまでの経過時間を計測する応答時間計測手段、
前記経過時間が予め設定された動作不調検出時間に達しても応答がない場合、前記制御ノードに対して、前記ストレージ装置が故障中の可能性があることを示す動作不調情報を送信する動作不調検出手段、
前記動作不調情報を送信後に前記ストレージ装置から前記検査コマンドに対する応答が返されると、前記制御ノードに対して前記ストレージ装置の復帰を示す復帰情報を送信する復帰検出手段、
として機能させることを特徴とするストレージ装置診断プログラム。
前記経過時間が、前記動作不調検出時間よりも大きな値が予め設定された故障検出時間に達しても応答がない場合、前記制御ノードに対して前記ストレージ装置に関する故障検出情報を送信する故障検出手段、
として機能させることを特徴とする付記11記載のストレージ装置診断プログラム。
前記動作不調情報送信後、前記復帰情報または前記故障検出情報送信前に前記ストレージ装置内のスライスへのアクセスがあると、アクセス対象スライスを指定したスライス異常通知を前記制御ノードに送信するスライス異常通知手段、
として機能させることを特徴とする付記12記載のストレージ装置診断プログラム。
前記コンピュータを、
前記ストレージ装置に対して検査コマンドを発行し、前記検査コマンド発行から応答があるまでの経過時間を計測する応答時間計測手段、
前記経過時間が、予め設定された動作不調検出時間を超えた後、前記検査コマンドに対する応答取得前に前記ストレージ装置内のスライスへのアクセスがあると、アクセス対象スライスを指定したスライス異常通知を前記制御ノードに送信するスライス異常通知手段、
として機能させることを特徴とするストレージ装置診断プログラム。
記憶領域が複数のスライスに分割して管理されたストレージ装置に対して検査コマンドを発行し、前記検査コマンド発行から応答があるまでの経過時間を計測する応答時間計測手段と、
前記経過時間が予め設定された動作不調検出時間に達しても応答がない場合、制御ノードに対して前記ストレージ装置が故障中の可能性があることを示す動作不調情報を送信する動作不調検出手段と、
前記動作不調情報を送信後に前記ストレージ装置から前記検査コマンドに対する応答が返されると、前記制御ノードに対して前記ストレージ装置の復帰を示す復帰情報を送信する復帰検出手段と、
を具備する複数のディスクノードと、
前記ディスクノードの1つから前記動作不調情報を受け取ると、前記動作不調情報を動作不調情報記憶手段に格納する動作不調情報管理手段と、
前記複数のストレージ装置のスライスをアクセス対象スライスとしてアクセス要求が出されたことを示すアクセス関連情報を受け取ると、前記動作不調情報記憶手段内の前記動作不調情報を参照して前記アクセス対象スライスが属する前記ストレージ装置が故障中である可能性の有無を判断し、故障の可能性がある場合、前記アクセス対象スライス内のデータと同じ内容の冗長データを格納する前記ストレージ装置が接続された前記ディスクノードへ、前記アクセス対象スライスに格納されていたデータのリカバリ処理を指示するリカバリ指示手段と、
を具備する前記制御ノードと、
を有することを特徴とするマルチノードストレージシステム。
1a,2a,3a スライス
4〜6 ディスクノード
4a 応答時間計測手段
4b 動作不調検出手段
4c 故障検出手段
4d 復帰検出手段
5a,6a スライス管理手段
7 制御ノード
7a 動作不調情報管理手段
7b 動作不調情報記憶手段
7c リカバリ指示手段
8 アクセスノード
Claims (8)
- 記憶領域が複数のスライスに分割して管理されている複数のストレージ装置に二重化して格納されたデータの管理処理をコンピュータに実行させるデータ管理プログラムであって、
前記コンピュータを、
前記複数のストレージ装置のうちの1つが故障中の可能性があることを示す動作不調情報を受け取ると、前記動作不調情報を動作不調情報記憶手段に格納する動作不調情報管理手段、
前記複数のストレージ装置のスライスをアクセス対象スライスとしてアクセス要求が出されたことを示すアクセス関連情報を受け取ると、前記動作不調情報記憶手段内の前記動作不調情報を参照して前記アクセス対象スライスが属する前記ストレージ装置が故障中である可能性の有無を判断し、故障の可能性がある場合、前記アクセス対象スライス内のデータと同じ内容の冗長データを格納する前記ストレージ装置へのデータ入出力機能を有するスライス管理手段へ、前記アクセス対象スライスに格納されていたデータのリカバリ処理を指示するリカバリ指示手段、
として機能させることを特徴とするデータ管理プログラム。 - 前記アクセス関連情報は、ネットワークを介して前記複数のストレージ装置にアクセスを行うアクセスノードによる前記ストレージ装置内のスライスへのアクセスが失敗したときに、前記アクセスノードから送信されることを特徴とする請求項1記載のデータ管理プログラム。
- 前記リカバリ指示手段は、前記アクセスノードから前記アクセス関連情報を受け取ると、前記アクセスノードに対して前記冗長データの格納場所を通知することを特徴とする請求項2記載のデータ管理プログラム。
- 前記コンピュータを、さらに、
複数のセグメントで構成される仮想ディスクが定義されており、異なるストレージ装置に属する2つの前記スライスが前記セグメントそれぞれに割り当てられており、前記複数のストレージ装置それぞれの前記スライスごとに設けられ、前記スライスと前記セグメントとの割り当て関係を示すメタデータを記憶する仮想ディスクメタデータ記憶手段として機能させ、
前記アクセス関連情報は、ネットワークを介して前記複数のストレージ装置にアクセスを行うアクセスノードによる前記ストレージ装置内のスライスへのアクセスが失敗したときに前記アクセスノードから送信される、アクセスに失敗したスライスが割り当てられているセグメントを照会対象セグメントとして指定した割り当て関係の照会要求であり、
前記リカバリ指示手段は、
前記仮想ディスクメタデータ記憶手段から、前記アクセス関連情報で指定された前記照会対象セグメントに割り当てられている2つの被割り当てスライスの前記メタデータを検索し、前記動作不調情報記憶手段を参照し、検索により得られた前記メタデータに基づいて前記被割り当てスライスが属する前記ストレージ装置が故障中である可能性の有無を判断するメタデータ検索手段と、
前記メタデータ検索手段が故障中の可能性があると判断された場合、故障中の可能性がある前記ストレージ装置に属する前記被割り当てスライスの前記照会対象セグメントへの割り当てを解除し、他の前記スライスを前記照会対象セグメントに新規に割り当てるスライス割り当て手段と、
を有することを特徴とする請求項1記載のデータ管理プログラム。 - 前記スライス割り当て手段は、前記照会対象セグメントへの新規のスライスの割り当てが完了すると、割り当て結果に応じて前記仮想ディスクメタデータ記憶手段内のメタデータを更新し、
前記メタデータ検索手段は、前記被割り当てスライスが属する前記ストレージ装置が故障中の可能性があると判断した場合、前記被割り当てスライスに代えて前記照会対象セグメントに対して新規のスライスの割り当てられるのを待ち、新規のスライスが割り当てられた後、前記照会対象セグメントに割り当てられたスライスのメタデータを前記仮想ディスクメタデータ記憶手段から取得し、前記アクセスノードに送信することを特徴とする請求項4記載のデータ管理プログラム。 - ストレージ装置が接続されると共に、前記ストレージ装置に格納するデータの管理を行う制御ノードにネットワーク経由で接続されたコンピュータに、前記ストレージ装置の動作診断処理を実行させるストレージ装置診断プログラムであって、
前記コンピュータを、
前記ストレージ装置に対して検査コマンドを発行し、前記検査コマンド発行から応答があるまでの経過時間を計測する応答時間計測手段、
前記経過時間が予め設定された動作不調検出時間に達しても応答がない場合、前記制御ノードに対して、前記ストレージ装置が故障中の可能性があることを示す動作不調情報を送信する動作不調検出手段、
前記動作不調情報を送信後に前記ストレージ装置から前記検査コマンドに対する応答が返されると、前記制御ノードに対して前記ストレージ装置の復帰を示す復帰情報を送信する復帰検出手段、
として機能させることを特徴とするストレージ装置診断プログラム。 - ストレージ装置が接続されると共に、前記ストレージ装置に格納するデータの管理を行う制御ノードにネットワーク経由で接続されたコンピュータに、前記ストレージ装置の動作診断処理を実行させるストレージ装置診断プログラムであって、
前記コンピュータを、
前記ストレージ装置に対して検査コマンドを発行し、前記検査コマンド発行から応答があるまでの経過時間を計測する応答時間計測手段、
前記経過時間が、予め設定された動作不調検出時間を超えた後、前記検査コマンドに対する応答取得前に前記ストレージ装置内のスライスへのアクセスがあると、アクセス対象スライスを指定したスライス異常通知を前記制御ノードに送信するスライス異常通知手段、
として機能させることを特徴とするストレージ装置診断プログラム。 - データを二重化して管理するマルチノードストレージシステムであって、
記憶領域が複数のスライスに分割して管理されたストレージ装置に対して検査コマンドを発行し、前記検査コマンド発行から応答があるまでの経過時間を計測する応答時間計測手段と、
前記経過時間が予め設定された動作不調検出時間に達しても応答がない場合、制御ノードに対して前記ストレージ装置が故障中の可能性があることを示す動作不調情報を送信する動作不調検出手段と、
前記動作不調情報を送信後に前記ストレージ装置から前記検査コマンドに対する応答が返されると、前記制御ノードに対して前記ストレージ装置の復帰を示す復帰情報を送信する復帰検出手段と、
を具備する複数のディスクノードと、
前記ディスクノードの1つから前記動作不調情報を受け取ると、前記動作不調情報を動作不調情報記憶手段に格納する動作不調情報管理手段と、
前記複数のストレージ装置のスライスをアクセス対象スライスとしてアクセス要求が出されたことを示すアクセス関連情報を受け取ると、前記動作不調情報記憶手段内の前記動作不調情報を参照して前記アクセス対象スライスが属する前記ストレージ装置が故障中である可能性の有無を判断し、故障の可能性がある場合、前記アクセス対象スライス内のデータと同じ内容の冗長データを格納する前記ストレージ装置が接続された前記ディスクノードへ、前記アクセス対象スライスに格納されていたデータのリカバリ処理を指示するリカバリ指示手段と、
を具備する前記制御ノードと、
を有することを特徴とするマルチノードストレージシステム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008267280A JP2010097385A (ja) | 2008-10-16 | 2008-10-16 | データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム |
US12/585,384 US8458398B2 (en) | 2008-10-16 | 2009-09-14 | Computer-readable medium storing data management program, computer-readable medium storing storage diagnosis program, and multinode storage system |
EP09170523A EP2177984A3 (en) | 2008-10-16 | 2009-09-17 | Multinode network storage data management method and system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008267280A JP2010097385A (ja) | 2008-10-16 | 2008-10-16 | データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012197110A Division JP5348300B2 (ja) | 2012-09-07 | 2012-09-07 | データ管理プログラム、およびマルチノードストレージシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010097385A true JP2010097385A (ja) | 2010-04-30 |
Family
ID=41572410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008267280A Pending JP2010097385A (ja) | 2008-10-16 | 2008-10-16 | データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8458398B2 (ja) |
EP (1) | EP2177984A3 (ja) |
JP (1) | JP2010097385A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015208526A (ja) * | 2014-04-28 | 2015-11-24 | 日本光電工業株式会社 | 医療機器 |
US9430489B2 (en) | 2012-05-17 | 2016-08-30 | Fujitsu Limited | Computer, data storage method, and information processing system |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2673554C (en) * | 2009-07-21 | 2017-01-03 | Ibm Canada Limited - Ibm Canada Limitee | Web distributed storage system |
US9244768B2 (en) * | 2010-03-12 | 2016-01-26 | International Business Machines Corporation | Dispersed storage network file system directory |
US8751740B1 (en) | 2010-03-31 | 2014-06-10 | Emc Corporation | Systems, methods, and computer readable media for performance optimization of storage allocation to virtual logical units |
US8402106B2 (en) * | 2010-04-14 | 2013-03-19 | Red Hat, Inc. | Asynchronous future based API |
US8479046B1 (en) * | 2010-06-28 | 2013-07-02 | Emc Corporation | Systems, methods, and computer readable media for tracking pool storage space reservations |
US10157002B2 (en) * | 2010-08-26 | 2018-12-18 | International Business Machines Corporation | Migrating an encoded data slice based on an end-of-life memory level of a memory device |
US8782339B2 (en) * | 2010-10-11 | 2014-07-15 | Open Invention Network, Llc | Storage system having cross node data redundancy and method and computer readable medium for same |
US8850130B1 (en) | 2011-08-10 | 2014-09-30 | Nutanix, Inc. | Metadata for managing I/O and storage for a virtualization |
US8863124B1 (en) | 2011-08-10 | 2014-10-14 | Nutanix, Inc. | Architecture for managing I/O and storage for a virtualization environment |
US9747287B1 (en) * | 2011-08-10 | 2017-08-29 | Nutanix, Inc. | Method and system for managing metadata for a virtualization environment |
US8601473B1 (en) | 2011-08-10 | 2013-12-03 | Nutanix, Inc. | Architecture for managing I/O and storage for a virtualization environment |
US9009106B1 (en) | 2011-08-10 | 2015-04-14 | Nutanix, Inc. | Method and system for implementing writable snapshots in a virtualized storage environment |
US8549518B1 (en) | 2011-08-10 | 2013-10-01 | Nutanix, Inc. | Method and system for implementing a maintenanece service for managing I/O and storage for virtualization environment |
US9652265B1 (en) | 2011-08-10 | 2017-05-16 | Nutanix, Inc. | Architecture for managing I/O and storage for a virtualization environment with multiple hypervisor types |
US9405545B2 (en) * | 2011-12-30 | 2016-08-02 | Intel Corporation | Method and apparatus for cutting senior store latency using store prefetching |
US9772866B1 (en) | 2012-07-17 | 2017-09-26 | Nutanix, Inc. | Architecture for implementing a virtualization environment and appliance |
DE102014205121A1 (de) * | 2013-04-04 | 2014-10-09 | Schaeffler Technologies Gmbh & Co. Kg | Verfahren zur Ermittlung einer Fehlfunktion einer, einem Steuergerät zugeordneten Zeitmesseinheit |
US20180101457A1 (en) * | 2014-10-29 | 2018-04-12 | International Business Machines Corporation | Retrying failed write operations in a dispersed storage network |
US10089307B2 (en) * | 2014-12-31 | 2018-10-02 | International Business Machines Corporation | Scalable distributed data store |
US10223222B2 (en) * | 2015-12-21 | 2019-03-05 | International Business Machines Corporation | Storage system-based replication for disaster recovery in virtualized environments |
US11106369B1 (en) * | 2016-06-28 | 2021-08-31 | Amazon Technologies, Inc. | Host-accessible storage device service level indicators |
US10303562B2 (en) * | 2017-03-30 | 2019-05-28 | Entit Software Llc | Using metadata extracted from proxy files to access data stored in secondary storage |
CN110413218B (zh) * | 2018-04-28 | 2023-06-23 | 伊姆西Ip控股有限责任公司 | 用于存储系统中的故障恢复的方法、装置和计算机程序产品 |
CN113590016A (zh) * | 2020-04-30 | 2021-11-02 | 伊姆西Ip控股有限责任公司 | 用于管理存储盘的方法、电子设备和计算机程序产品 |
CN115016741B (zh) * | 2022-07-15 | 2022-10-25 | 中国长江三峡集团有限公司 | 一种智能电力电子设备数据存储和传输系统及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07129331A (ja) * | 1993-11-05 | 1995-05-19 | Fujitsu Ltd | ディスクアレイ装置 |
JPH08249133A (ja) * | 1994-12-15 | 1996-09-27 | Internatl Business Mach Corp <Ibm> | ディスク・ドライブ・アレイの故障対策の方法及びシステム |
JPH10333841A (ja) * | 1997-05-28 | 1998-12-18 | Nec Corp | ディスクアレイ装置の障害復旧装置 |
JP2002149500A (ja) * | 2000-11-08 | 2002-05-24 | Matsushita Electric Ind Co Ltd | ハードディスク装置 |
JP2003345531A (ja) * | 2002-05-24 | 2003-12-05 | Hitachi Ltd | ストレージシステム、管理サーバ、及びそのアプリケーションの管理方法 |
JP2004252692A (ja) * | 2003-02-20 | 2004-09-09 | Nec Corp | ディスクアレイ装置 |
JP2005157739A (ja) * | 2003-11-26 | 2005-06-16 | Hitachi Ltd | ディスクアレイ装置及びディスクアレイ装置の障害回避方法 |
JP2006172320A (ja) * | 2004-12-17 | 2006-06-29 | Fujitsu Ltd | データ複製制御装置 |
JP2007206931A (ja) * | 2006-02-01 | 2007-08-16 | Hitachi Ltd | 記憶システム、データ処理方法並びにストレージ装置 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05158625A (ja) | 1991-12-06 | 1993-06-25 | Hitachi Ltd | アレイ型記憶装置の障害対策方式 |
JPH06187101A (ja) | 1992-09-09 | 1994-07-08 | Hitachi Ltd | ディスクアレイ |
JP2708386B2 (ja) | 1994-03-18 | 1998-02-04 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 同時更新及び複写手順を通して重複データベースを回復させる方法及び装置 |
JPH11345095A (ja) | 1998-06-02 | 1999-12-14 | Toshiba Corp | ディスクアレイ装置およびその制御方法 |
US6408401B1 (en) * | 1998-11-13 | 2002-06-18 | Compaq Information Technologies Group, L.P. | Embedded RAM with self-test and self-repair with spare rows and columns |
JP3606797B2 (ja) | 1999-09-30 | 2005-01-05 | 富士通株式会社 | 記憶装置のデータ領域間の複写処理方法、記憶システム、及びその記憶媒体 |
US6885620B2 (en) * | 2001-01-25 | 2005-04-26 | Dphi Acquisitions, Inc. | System and method for recovering from performance errors in an optical disc drive |
JP2003316522A (ja) | 2002-04-26 | 2003-11-07 | Hitachi Ltd | 計算機システムおよび計算機システムの制御方法 |
JP4252301B2 (ja) * | 2002-12-26 | 2009-04-08 | 株式会社日立製作所 | 記憶システム及びそのデータバックアップ方法 |
JP4711688B2 (ja) * | 2003-05-21 | 2011-06-29 | 富士通株式会社 | ストレージシステム |
JP2005000468A (ja) | 2003-06-13 | 2005-01-06 | Omron Healthcare Co Ltd | 心電計、および心電計における表示方法 |
JP4317436B2 (ja) * | 2003-12-16 | 2009-08-19 | 株式会社日立製作所 | ディスクアレイシステム及びインターフェイス変換装置 |
JP2005326935A (ja) | 2004-05-12 | 2005-11-24 | Hitachi Ltd | 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法 |
JP2006285464A (ja) * | 2005-03-31 | 2006-10-19 | Hitachi Ltd | 計算機システムとストレージ及びデバイス制御方法 |
US7363457B1 (en) * | 2005-07-21 | 2008-04-22 | Sun Microsystems, Inc. | Method and system for providing virtualization data services for legacy storage devices |
JP4775843B2 (ja) * | 2005-08-10 | 2011-09-21 | 株式会社日立製作所 | ストレージシステム及び記憶制御方法 |
JP4550717B2 (ja) * | 2005-10-28 | 2010-09-22 | 富士通株式会社 | 仮想ストレージシステム制御装置、仮想ストレージシステム制御プログラム、仮想ストレージシステム制御方法 |
JP4767139B2 (ja) * | 2006-09-15 | 2011-09-07 | 富士通株式会社 | ストレージ管理プログラム、ストレージ管理装置、およびストレージ管理方法 |
JP5158625B2 (ja) | 2007-05-28 | 2013-03-06 | 株式会社アソピクス | 秘密idを格納した外部デバイスを備える暗号化メール送受信システム |
-
2008
- 2008-10-16 JP JP2008267280A patent/JP2010097385A/ja active Pending
-
2009
- 2009-09-14 US US12/585,384 patent/US8458398B2/en active Active
- 2009-09-17 EP EP09170523A patent/EP2177984A3/en not_active Withdrawn
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07129331A (ja) * | 1993-11-05 | 1995-05-19 | Fujitsu Ltd | ディスクアレイ装置 |
JPH08249133A (ja) * | 1994-12-15 | 1996-09-27 | Internatl Business Mach Corp <Ibm> | ディスク・ドライブ・アレイの故障対策の方法及びシステム |
JPH10333841A (ja) * | 1997-05-28 | 1998-12-18 | Nec Corp | ディスクアレイ装置の障害復旧装置 |
JP2002149500A (ja) * | 2000-11-08 | 2002-05-24 | Matsushita Electric Ind Co Ltd | ハードディスク装置 |
JP2003345531A (ja) * | 2002-05-24 | 2003-12-05 | Hitachi Ltd | ストレージシステム、管理サーバ、及びそのアプリケーションの管理方法 |
JP2004252692A (ja) * | 2003-02-20 | 2004-09-09 | Nec Corp | ディスクアレイ装置 |
JP2005157739A (ja) * | 2003-11-26 | 2005-06-16 | Hitachi Ltd | ディスクアレイ装置及びディスクアレイ装置の障害回避方法 |
JP2006172320A (ja) * | 2004-12-17 | 2006-06-29 | Fujitsu Ltd | データ複製制御装置 |
JP2007206931A (ja) * | 2006-02-01 | 2007-08-16 | Hitachi Ltd | 記憶システム、データ処理方法並びにストレージ装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9430489B2 (en) | 2012-05-17 | 2016-08-30 | Fujitsu Limited | Computer, data storage method, and information processing system |
JP2015208526A (ja) * | 2014-04-28 | 2015-11-24 | 日本光電工業株式会社 | 医療機器 |
Also Published As
Publication number | Publication date |
---|---|
US20100106907A1 (en) | 2010-04-29 |
EP2177984A3 (en) | 2010-05-19 |
US8458398B2 (en) | 2013-06-04 |
EP2177984A2 (en) | 2010-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010097385A (ja) | データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム | |
JP5412882B2 (ja) | 論理ボリューム構成情報提供プログラム、論理ボリューム構成情報提供方法、および論理ボリューム構成情報提供装置 | |
JP2011128917A (ja) | データ割当制御プログラム、データ割当制御方法、およびデータ割当制御装置 | |
US8271761B2 (en) | Storage system and management method thereof | |
JP4480756B2 (ja) | ストレージ管理装置、ストレージシステム制御装置、ストレージ管理プログラム、データ記憶システムおよびデータ記憶方法 | |
JP5158074B2 (ja) | ストレージ管理プログラム、ストレージ管理方法、ストレージ管理装置およびストレージシステム | |
JP5217967B2 (ja) | 故障ノード切り離し処理プログラム、故障ノード切り離し方法及びストレージシステム | |
JP5396836B2 (ja) | データ分散制御プログラム、ストレージ管理プログラム、制御ノード、およびディスクノード | |
US20070011579A1 (en) | Storage system, management server, and method of managing application thereof | |
JP6237406B2 (ja) | 情報処理装置、ストレージシステム、およびプログラム | |
JP5218284B2 (ja) | 仮想ディスク管理プログラム、ストレージ装置管理プログラム、マルチノードストレージシステム、および仮想ディスク管理方法 | |
JP6212934B2 (ja) | ストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法 | |
US11573737B2 (en) | Method and apparatus for performing disk management of all flash array server | |
JP6850771B2 (ja) | 情報処理システム、情報処理システムの管理方法及びプログラム | |
JP5348300B2 (ja) | データ管理プログラム、およびマルチノードストレージシステム | |
US20050198411A1 (en) | Commingled write cache in dual input/output adapter | |
US20160371136A1 (en) | Storage system | |
JP6569476B2 (ja) | ストレージ装置、ストレージシステムおよびストレージ制御プログラム | |
JP5640480B2 (ja) | データ管理プログラム、ストレージシステム、およびデータ管理方法 | |
TWI756007B (zh) | 用以進行全快閃記憶體陣列伺服器的高可用性管理的方法與設備 | |
CN112445652A (zh) | 远程复制系统 | |
JP5309816B2 (ja) | データ管理プログラム、データ管理装置、およびデータ管理方法 | |
JP5924117B2 (ja) | コンピュータ、データ格納方法、データ格納プログラム及び情報処理システム | |
JP2010198467A (ja) | 情報処理装置の障害復旧システム及び情報処理装置の障害復旧方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130723 |