JP4893180B2 - 記憶装置の故障回復方法、故障回復プログラムおよび制御装置 - Google Patents

記憶装置の故障回復方法、故障回復プログラムおよび制御装置 Download PDF

Info

Publication number
JP4893180B2
JP4893180B2 JP2006253338A JP2006253338A JP4893180B2 JP 4893180 B2 JP4893180 B2 JP 4893180B2 JP 2006253338 A JP2006253338 A JP 2006253338A JP 2006253338 A JP2006253338 A JP 2006253338A JP 4893180 B2 JP4893180 B2 JP 4893180B2
Authority
JP
Japan
Prior art keywords
data
storage device
combination
raid
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006253338A
Other languages
English (en)
Other versions
JP2008077222A (ja
Inventor
淳 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006253338A priority Critical patent/JP4893180B2/ja
Publication of JP2008077222A publication Critical patent/JP2008077222A/ja
Application granted granted Critical
Publication of JP4893180B2 publication Critical patent/JP4893180B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明はRAID装置の様な複数の装置を用いることで冗長性を確保している記憶装置に発生した複数の障害によるデータ消失といった致命的なトラブル時の、データ構造仕様や最新時間に着目した汎用的な記憶装置の故障回復方法、故障回復プログラムおよび制御装置に関する。
ハードディスクの大容量化が急速に進むにつれて、ハードディスクの故障時に受ける被害はますます大きくなる。このため、ハードディスクの故障によるデータ損失を防ぎ、合わせて処理性能を向上するために、RAID(Redundant Array of Inexpensive Disks)技術が用いられている。複数台のハードディスクを組み合わせて、冗長化された1台のハードディスクとして管理する技術である。この技術は、ハードディスクへのデータ配置や、データの冗長化方法により、RAID0〜RAID5の6つのレベルに分類されて定義されている。例えばRAID5構成のRAID装置では、データをブロック単位に分割し、データ用ディスクに記録する。一方、ブロック単位に分割されたデータの排他的論理和からパリティを生成して、各ディスクに分散して配置する。データ更新時には更新前のデータとパリティを読み出し、更新パリティを作成後書き込む余分な動作が必要になる。しかし、更新するパリティは、異なるディスクに配置されているため、ライト処理が多重で発行された場合でも同時に実行することができ、高い性能を実現できる。このようなRAID5構成のRAID装置では、例えばRAID装置内のデータ用ディスク装置が1台故障した場合に、故障装置のデータが次のように修復される。まずRAIDコントローラは、故障したディスク装置以外の他のディスク装置から、ブロック毎にデータを読み出す。またパリティが格納されているディスク装置からパリティを読み出す。そして、RAIDコントローラは、各ディスク装置から読み出したブロックデータおよびパリティデータをもとに、排他的論理和により故障ディスク装置のデータを復元する。このようにして、故障したディスク装置のすべてのデータを、故障したディスク装置に代えて用いられるスペアディスク装置内に修復することができる。このように、RAID5構成のRAID装置では、RAID内のディスク装置が1台故障しても、故障したディスク装置のデータを元通りに修復することができる。しかしながら、同一のRAID内で複数のディスク装置が故障する複数故障が発生した場合には、RAID装置のデータの冗長性を利用してユーザデータを修復することはできない。この場合、RAID装置全体の故障となり、使用不可となる。 また、冗長状態でも、RAIDコントローラとディスク装置間でバス系の障害が発生すると、複数のディスク装置が全て障害と判断されてしまい、いっきにデータにアクセス不能になる。このようにRAID装置が使用不可となった場合、複数台の故障したディスク装置を交換し、データをバックアップコピーしている磁気テープ装置などから、このRAID装置に対しデータをライトバックする必要がある。 しかしながら、磁気テープ装置からのライトバックは、長時間を要するため、その間システムが停止状態となる問題がある。さらにデータのバックアップを行っていない場合には、システムの復旧には膨大な時間と労力を必要とする。このため、同一RAID装置内でのディスクドライブの多重故障 により当該RAID装置が使用不可となったとしてもディスク装置故障が一過性または部分的なものであったならば、外部からの要求に応じて当該RAID装置を簡単に使用可能な状態に復旧することができるRAID装置のエラー回復方法、RAIDコントローラ及びRAID装置が提案されている(特許文献1)。
特開2002−373059号公報(第8頁段落0048−0053、図1)
この方法は、ディスク装置故障が一過性または部分的の場合に、ユーザの指定によりディスク故障直前のRAID構成に戻すことで、一時的に故障エリアにアクセスすることが、可能となる場合を想定している。多重故障発生直前のRAIDの構成情報をRAIDコントローラの不揮発性メモリまたはディスク装置に記憶しており、それをもとに回復を図っている。しかし、RAIDの構成情報を不揮発性メモリに格納している場合には、データが格納されているディスク装置と不揮発性メモリが分離された場合は、元に戻すことはできなくなる。また、装置によっては、故障発生による構成情報の変化をディスク装置に記憶する構成を有していないものもある。このような装置では、多重故障発生によるRAID装置の障害に対応できない。
本願発明は、RAID装置の構成情報を記憶する手段を持たない場合でも、RAID装置の多重障害からの回復を可能とするディスク装置のデータ回復方法、ディスク装置のデータ回復プログラム、サーバを提供することを目的とする。
本発明は、冗長構成の複数、ファイルシステム上のファイルデータを記憶する記憶装置を接続する制御装置による記憶装置の故障回復方法であって、複数台の前記記憶装置の故障が発生したときに、複数台の前記記憶装置の中の1台を閉塞状態にし、他の前記記憶装置を閉塞解除状態とする、複数台の前記記憶装置のすべての組合せを生成する組合せ生成ステップと、前記ファイルシステムが、複数台の前記記憶装置の生成された組合せ毎に読みだされた、前記ファイルシステム上のファイルデータをもとに、前記組合せのうちいずれかの組合せでファイルデータを正常に読み出しうることを確認する整合性確認ステップと、整合性が確認された前記記憶装置の組合せを閉塞解除する閉塞解除ステップと、を有する構成である。この構成により、整合性が確認された故障ディスク装置の閉塞が解除されるので、制御装置による当該ディスク装置のアクセスが可能となる。
冗長性を確保する必要性がある重要な情報記憶装置のデータが失われた場合のリカバリの仕組み、あるいは手法を提供することで、バックアップをとっていなかったとしても、データを回復できる可能性がある。
(実施例1)
図1にRAIDシステムの構成図を示す。RAIDシステム31は、サーバ21およびサーバのデータを格納するRAID装置22を有する。サーバ21は、RAID装置22を制御する制御装置である。復元制御部1を有する。復元制御部1は、故障により閉塞したディスク装置2について、閉塞解除するか否かを判断する。復元制御部1は、閉塞制御部11、整合性/時間確認部12、閉塞解除部13からなる。閉塞制御部11は、RAIDコントローラ3に対して、ディスク装置2への閉塞指示を行う。整合性/時間確認部12は、ディスク装置2から読み出したデータの整合性を確認する。又、最新時間の装置を確認する。閉塞解除部13は、データの整合性の確認または最新時間の確認により決定された回復対象のディスク装置2の閉塞を解除する指示を行う。RAID装置22は、RAIDコントローラ3と複数のディスク装置2とからなる。RAIDコントローラ3は、複数のディスク装置2に対して、サーバ21の指示によりリードライト制御を行う。ディスク装置2は、データを格納する装置である。複数の装置A〜Nよりなる。ディスク装置2が複数故障するマルチデッドをディスク装置2が1台故障するシングルデッドの状態に戻すことにより、古いバックアップデータよりも新しいデータにアクセスすることができ、あるいは、バックアップに失敗していたとしてもデータにアクセスすることができる。
ここで重要なのは、以下の二点である。第1は、障害と判断されたはずのディスク装置2を戻す、すなわち、論理的に再接続することである。第2は、障害と判断された複数のディスク装置2のうちどのディスク装置2を元に戻すかである。まず、第1の障害と判断されたはずのディスク装置2を再接続できるかについてであるが、ディスク装置2の単体障害、バス障害に着目することでこれを実現できる。すなわち、ディスク装置2の単体障害は、例えばリードエラーのように、異常状態が一定の閾値を超えた場合に、故障と判断され、論理的に接続を切り離されるが、必ずしも対象装置が壊れたことを意味しておらず、再初期化により再び使用可能なこともある。また、バス障害は、ディスク装置2の障害ではないため、バスを初期化、交換を行えば、ディスク装置2は、使用可能となる。したがって、初期化等を行うことにより、故障直前の状態に復帰することが可能となる。
第2の障害と判断された複数のディスク装置2のうちどのディスク装置2を元に戻すかについては、基本OSのファイルシステムのデータ構造を考慮して、その変化を調べることで、これを実現できる。ファイルシステムとしては、例えば、FAT(File Allocation Table)ファイルシステムである。ファイルを構成するデータの物理的な格納位置をディレクトリ、FATと呼ばれるテーブルにより管理する。ディスク媒体上は、データ領域とディレクトリ、FATを格納する領域に分割されている。さらにデータ領域は、細かい区画に分割されたクラスタに分割されて管理されている。クラスタは、複数のセクタからなり、ファイルを構成するデータが格納されている。クラスタには、ファイルを特定するための番号が付与されている。そして、各ファイルとクラスタとの関係を示すために、ファイルを構成するデータの先頭部分が格納されているクラスタ番号とファイル名、ファイルサイズ、作成年月日時分秒をディレクトリに格納している。そして、各ファイルを構成するすべてのクラスタは、FATによりクラスタ番号のリンク状態が格納されている。本実施例では、RAIDコントローラ3からサーバ21へのリードデータをサーバ21のファイルシステムのデータ格納先を示すポインタとして使用している。
図2にRAID装置の故障回復の説明図1を示す。ディスク装置2のA、B、C3台がひとつのバスに接続され、それを制御するRAIDコントローラ3があるRAID装置22(RAID4または5)をもとに説明する(図2(a)参照)。このRAID装置では、2つのディスク装置2のA,Bにデータが残りのディスク装置2のCにパリティデータが格納される。また、RAID4または5なので、データは、分散されて格納されている。ここで、ディスク装置2のCに何らかの障害が発生すると(図2(b)参照)、ディスク装置2のCが論理的に切断されると(図2(c)参照)、冗長性がなくなる。ここで、バス障害が発生しなければ残ったディスク装置2のA、Bでデータを更新し続ける。その後、ディスク装置2のBに障害が発生すると(図2(d)参照)、ディスク装置2のBが論理的に切断され(図2(e)参照)、RAIDコントローラ3から2台とも論理的に切断されるので、データの更新処理は、停止する。次にデータ構造が分散する特性から、アクセス不能になる直前の状態を仮定し(図2(f)、図2(g))、その状態にオンライン化して、実際にアクセスを行い、ファイルシステムのデータ構造から整合性異常が無いかどうかを確認する。
図3にRAID装置の故障回復の処理の流れ図1を示す。まず、サーバ21の復元制御部1は、故障した1台を閉塞にして、他をオンライン状態とする組み合わせを生成する(S1ステップ)。具体的には、ディスク装置2のA、B、CについてCを閉塞にし、A、Bをオンライン化した状態の組み合わせを生成する。またBを閉塞にし、A、Cをオンライン化した状態の組み合わせを生成する。またAを閉塞にし、B、Cをオンライン化した状態の組み合わせを生成する。次に、整合性を確認する(S2ステップ)。確認した結果、整合性あるか否かを判定する(S3ステップ)。今回は、図2(f)では整合性異常が発生せず、図2(g)では更新が続いていた装置と停止していた装置との組み合わせなので、データ整合性異常が発生する可能性がある。図示していないが、Aを閉塞にし、B、Cをオンライン化した状態の組み合わせも同様にデータ整合性異常が発生する可能性がある。この確認において、ファイルシステムのデータ構造から整合性異常が存在すれば、それはアクセス不能になる直前の状態では無いことを意味する。また、仮に、全ての組み合わせで整合性異常が存在しない場合は、全てのディスク装置2に対して同時に障害が発生したためと判断することができる。この様にして、アクセス不能になる直前の状態を仮定し、ファイルシステムのデータ構造から正当性を検証することで、アクセス不能になる直前の状態を判断し、アクセス可能な状態に一時的に戻し(S4ステップ)、業務として必要な一時的な処理を行う(図2(h)参照)。整合性がすべての組合せでとれない場合には、複合故障の状態のままとし、閉塞を解除しない(S5ステップ)。
次に、この整合性の確認方法についての説明を行う。図4に整合性の説明図1を示す。ディスク装置2であるA〜Dの4台構成のRAID4またはRAID5の例である。A〜Dの媒体上に55h、AAh、A5h、5Ahがライトされている。Dにパリティがライトされている例である。hは16進表示を意味する。従って、正常にリードすれば、55h、AAh、A5hの値がリードデータとしてサーバ21に読み込まれる(図4(a)参照)。しかし、Cに障害が発生し、シングルデッドの状態の場合(図4(b)参照)、デッドしたCの装置に対する96hのライト行為が行われることがある。この場合、結果的にパリティ部分が5Ahから69hに更新される(図4(c)参照)。Cは、デッドなので、データは、ライトできない。その後、マルチデッドがAまたはBまたはDに発生した場合、シングルデッドの状態をもとに、全クリティカル状態の組合せについて整合性をチェックする。期待するデータは、55h、AAh、96hである。図4(e)〜(i)にこれらの整合性チェックのためにデータを読み出した場合の3つのパターンを示す。 図4(e)は、4台回復させて、読み出した場合である。過去のデータ55h、AAh、A5hが読み出される。しかし、期待データとは異なる。 図4(f)は、Dを除いた3台を回復させての整合性チェックをするものである。過去のデータ55h、AAh、A5hが読み出される。しかし、期待データとは異なる。図4(g)は、Cを除いた3台を回復させての整合性チェックをするものである。55h、AAh、69hから、Cの96hが生成されるので、55h、AAh、96hが正常データとして読み出される。図4(h)は、Bを除いた3台を回復させての整合性チェックをするものである。55h、A5h、69hから、Bの99hが生成される。しかし、媒体上のデータAAhと異なるデータ99hが読み出され、55h、99h、A5hであるので異常データである。すなわち期待データとは異なる。図4(i)は、Aを除いた3台を回復させての整合性チェックをするものである。AAh、A5h、69hから、Aの66hが生成される。しかし、媒体上のデータAAhと異なるデータ66hが読み出され、66h、AAh、A5hであるので異常データである。すなわち期待データとは異なる。このように、マルチデッドが発生した場合、クリティカル状態の組合せを実施すると、過去のデータ、正常なデータ、異常なデータとしてリードされる。
次に、これらの結果が実際のファイルシステムに与える影響を説明する。図5に整合性の説明図2を示す。まず正常のファイルシステムの状態を示す。図5(a)に初期状態を示す。C¥Document¥User1¥ab.docとC¥Document¥User1¥123.xlsの2つのファイルが生成されているものとする。図5(b)にファイル更新後の状態を示す。新規作成ファイルとして、C¥Document¥User1¥de.txtを生成した例である。また、123.xlsを上書き保存した例である。新規作成のファイルde.txtは、User1 のリストに格納先データが追加され、実際にその指定された場所にファイルが作成される(b1参照)。上書き更新されたファイル123.xlsは、データ量が増えた場合は、指定された領域に入りきらないデータを別の格納先データが追加され、追加された格納先に、残りのデータが保存される(b2参照)。
図6に整合性の説明図3を示す。図6(a)に正常状態のファイルシステムを示す。正常な状態では、サーバ21の全てのファイルのリンクが正しく結合されている。復元制御部1は、複数のA〜Nからなるディスク装置2を1つディスク装置2としてファイルシステムを構築している。その結果、例えばC¥Document¥User1¥ab.docの指定する領域に図4(c)の例では、期待データ55h、AAh、96hに対応するファイルの格納先が格納されていると扱われる。シングルデッドの場合は、故障している物理的領域は、閉塞しているため、アクセスされないが、RAID4またはRAID5の構成をもとに生成されたデータが使用できるため、全てのファイルのリンクが正しく結合されている。
図6(b)に異常状態のファイルシステムを示す。マルチデッドの場合、異常データが読み出される異常な状態では、サーバ21のファイルシステムのリンクが切れる場合が発生する。例えば、図4(h)の例では、User1 のリストのab.docには、ファイルの格納先を示すディスク装置A、C、Dで構成されるディスク装置2のデータが格納されている。Cは、旧データが格納されている。一方、ディスク装置2のBは、閉塞されているため、パリティ計算で求められたデータが生成され格納されている。この結果、B、Cのデータが期待データとは異なるため、異常データとなり、リンク先異常となる。また、図4(i)の例のAが閉塞した場合も同様である。また、マルチデッドの場合、過去のデータが読み出される場合がある。図4(e)のように、全部が閉塞していない状態にした場合に、ディスク装置2のA、B、Cのデータを取得する。過去のデータと同じリンク先が形成されるが、期待データとはCの格納先に変化を生じているので、リンク先異常と判断する。また、図4(f)のように、ディスク装置2のDを閉塞した場合、ディスク装置2のA、B、Cのデータをサーバ21は、取得する。この場合、User1 のリストのab.docには、ファイルの格納先を示すディスク装置A、B、Cで構成されるディスク装置2のデータが格納されている。過去のデータと同じリンク先が形成されるが、期待データとはCの格納先に変化を生じているので、リンク先異常と判断する。また、図4(g)のように、ディスク装置2のCを閉塞した場合、ディスク装置2のA、B、Dのデータをサーバ21は取得する。この場合、User1 のリストのab.docには、ファイルの格納先を示すディスク装置2のA、B、Cのデータが格納されている。このとき、ディスク装置2のCは、閉塞されているため、パリティ計算で求められたデータが生成され格納されている。この結果、A、B、Cのデータは、期待データと同一であり、ファイルの格納先のデータに変化はない。整合性あるデータとして読み出される。リンク先は正常である。この処理をディスク装置2に格納されているすべてのファイルにおいて行う。User1のab.doc以外のファイルについて格納先に変化がない場合には、図4(g)に示す整合性ある組み合わせのA,B,Dをオンライン化することで、必要なデータを一時的に読み出すことができる。
図7にRAID装置の故障回復の説明図2を示す。FATファイルシステムのデータ構造のディレクトリのファイル更新時間を基に故障回復を行う。RAID1構成のディスク装置2のA、B2台がひとつのバスに接続され、それを制御するRAIDコントローラ3があるRAID装置22(ディスク装置2のA、B)をもとに説明する(図7(a)参照)。ここで、ディスク装置2のBに何らかの障害が発生すると(図7(b)参照)、ディスク装置2のBが論理的に切断されると(図7(c)参照)、冗長性がなくなる。2005年7月13日10時0分8秒に障害発生し、2005年7月13日10時0分10秒に論理切断したことを示す。ここで、複数障害にあたるバス障害が発生しなければ残ったディスク装置2のAでデータを更新し続ける。その後、ディスク装置2のAに障害が発生すると(図7(d)参照)、ディスク装置2のAが論理的に切断され(図7(e)参照)、サーバ21から2台とも論理的に切断されるので、データの更新処理は、停止する。2005年7月14日11時30分38秒に障害発生し、2005年7月14日11時30分40に論理切断したことを示す。
図8にRAID装置の故障回復の処理の流れ図2を示す。まず、アクセス不能になる直前の状態に再接続を行う。このため、サーバ21の復元制御部1は、論理的に切断し閉塞した装置と1つずつ再接続する(S11ステップ)。そしてアクセスを行い、FATファイルシステムのデータ構造の中のディレクトリに格納されているファイル毎の更新時間を取得し(S12ステップ)、最新の時間かを比較する。その結果、ディスク装置2のAは、2005年7月14日11時30分38秒であり(図7(f)参照)、ディスク装置2のBは、2005年7月13日10時0分8秒である(図7(g)参照)。そのため、ディスク装置2のAが最新時間の装置のため、回復させる判断をして(S13ステップ)、接続モードを閉塞からオンラインに変更する(S14ステップ、図7(h)参照)。このようにして、アクセス不能になる直前の状態をそのデータ構造の最新時間を検討することで、アクセス不能になる直前の状態を判断し、アクセス可能な状態に一時的に戻すことが可能となる。
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)冗長構成の複数の記憶装置を接続する制御装置による記憶装置の故障回復方法であって、複数台の故障が発生したときに、複数台の1台を閉塞状態にし、他の記憶装置を閉塞解除状態とする記憶装置のすべての組合せを生成する組合せ生成ステップと、生成された組合せにより、整合性を確認する整合性確認ステップと、整合性が確認された記憶装置の組合せを閉塞解除する閉塞解除ステップと、を有することを特徴とする記憶装置の故障回復方法。
(付記2)冗長構成の複数の記憶装置を接続する制御装置による記憶装置の故障回復方法であって、故障により閉塞中の記憶装置の閉塞した時の時間を取得するステップと、閉塞した時間が最新の時間の記憶装置を選択する選択ステップと、選択された記憶装置の閉塞を解除する解除ステップと、を有することを特徴とする記憶装置の故障回復方法。
(付記3)冗長構成の複数の記憶装置を接続する制御装置による記憶装置の故障回復プログラムであって、複数台の故障が発生したときに、複数台の1台を閉塞状態にし、他の記憶装置を閉塞解除状態とする記憶装置のすべての組合せを生成する組合せ生成ステップと、生成された組合せにより、整合性を確認する整合性確認ステップと、整合性が確認された記憶装置の組合せを閉塞解除する閉塞解除ステップと、をコンピュータに実行させるための記憶装置の故障回復プログラム。
(付記4)冗長構成の複数の記憶装置を接続する制御装置による記憶装置の故障回復プログラムであって、故障により閉塞中の記憶装置の閉塞した時の時間を取得するステップと、閉塞した時間が最新の時間の記憶装置を選択する選択ステップと、選択された記憶装置の閉塞を解除する解除ステップと、をコンピュータに実行させる記憶装置の故障回復プログラム。
(付記5)冗長構成の複数の記憶装置を接続する制御装置であって、複数台の故障が発生したときに、複数台の1台を閉塞状態にし、他の記憶装置を閉塞解除状態とする記憶装置のすべての組合せを生成する組合せ生成手段と、生成された組合せにより、整合性を確認する整合性確認手段と、整合性が確認された記憶装置の組合せを閉塞解除する閉塞解除手段と、を有することを特徴とする制御装置。
(付記6)冗長構成の複数の記憶装置を接続する制御装置であって、故障により閉塞中のディスク装置の閉塞した時の時間を取得する手段と、閉塞した時間が最新の時間のディスク装置を選択する選択手段と、選択されたディスク装置の閉塞を解除する解除手段と、を有することを特徴とする制御装置。
(付記7)整合性確認手段は、ファイルシステムのデータ構造を基に確認することを特徴とする付記5記載の制御装置。
RAIDシステムの構成図 RAID装置の故障回復の説明図1 RAID装置の故障回復の処理の流れ図1 整合性の説明図1 整合性の説明図2 整合性の説明図3 RAID装置の故障回復の説明図2 RAID装置の故障回復の処理の流れ図2
符号の説明
1 復元制御部
2 ディスク装置
3 RAIDコントローラ
11 閉塞制御部
12 整合性/時間確認部
13 閉塞解除部
21 サーバ
22 RAID装置
31 RAIDシステム

Claims (3)

  1. 冗長構成の複数、ファイルシステム上のファイルデータを記憶する記憶装置を接続する制御装置による記憶装置の故障回復方法であって、
    複数台の前記記憶装置の故障が発生したときに、複数台の前記記憶装置の中の1台を閉塞状態にし、他の前記記憶装置を閉塞解除状態とする、複数台の前記記憶装置のすべての組合せを生成する組合せ生成ステップと、
    前記ファイルシステムが、複数台の前記記憶装置の生成された組合せ毎に読みだされた、前記ファイルシステム上のファイルデータをもとに、前記組合せのうちいずれかの組合せでファイルデータを正常に読み出しうることを確認する整合性確認ステップと、
    整合性が確認された前記記憶装置の組合せを閉塞解除する閉塞解除ステップと、
    を有することを特徴とする記憶装置の故障回復方法。
  2. 冗長構成の複数、ファイルシステム上のファイルデータを記憶する記憶装置を接続する制御装置による記憶装置の故障回復プログラムであって、
    複数台の前記記憶装置の故障が発生したときに、複数台の前記記憶装置の中の1台を閉塞状態にし、他の前記記憶装置を閉塞解除状態とする、複数台の前記記憶装置のすべての組合せを生成する組合せ生成ステップと、
    前記ファイルシステムが、複数台の前記記憶装置の生成された組合せ毎に読みだされた、前記ファイルシステム上のファイルデータをもとに、前記組合せのうちいずれかの組合せでファイルデータを正常に読み出しうることを確認する整合性確認ステップと、
    整合性が確認された前記記憶装置の組合せを閉塞解除する閉塞解除ステップと、
    をコンピュータに実行させるための記憶装置の故障回復プログラム。
  3. 冗長構成の複数、ファイルシステム上のファイルデータを記憶する記憶装置を接続する制御装置であって、
    複数台の前記記憶装置の故障が発生したときに、複数台の前記記憶装置の中の1台を閉塞状態にし、他の前記記憶装置を閉塞解除状態とする、複数台の前記記憶装置のすべての組合せを生成する組合せ生成手段と、
    前記ファイルシステムが、複数台の前記記憶装置の生成された組合せ毎に読みだされた、前記ファイルシステム上のファイルデータをもとに、前記組合せのうちいずれかの組合せでファイルデータを正常に読み出しうることを確認する整合性確認手段と、
    整合性が確認された前記記憶装置の組合せを閉塞解除する閉塞解除手段と、
    を有することを特徴とする制御装置。
JP2006253338A 2006-09-19 2006-09-19 記憶装置の故障回復方法、故障回復プログラムおよび制御装置 Expired - Fee Related JP4893180B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006253338A JP4893180B2 (ja) 2006-09-19 2006-09-19 記憶装置の故障回復方法、故障回復プログラムおよび制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006253338A JP4893180B2 (ja) 2006-09-19 2006-09-19 記憶装置の故障回復方法、故障回復プログラムおよび制御装置

Publications (2)

Publication Number Publication Date
JP2008077222A JP2008077222A (ja) 2008-04-03
JP4893180B2 true JP4893180B2 (ja) 2012-03-07

Family

ID=39349235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006253338A Expired - Fee Related JP4893180B2 (ja) 2006-09-19 2006-09-19 記憶装置の故障回復方法、故障回復プログラムおよび制御装置

Country Status (1)

Country Link
JP (1) JP4893180B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5241342B2 (ja) * 2008-06-27 2013-07-17 株式会社アイ・オー・データ機器 周辺機器および情報処理システム

Also Published As

Publication number Publication date
JP2008077222A (ja) 2008-04-03

Similar Documents

Publication Publication Date Title
US7529965B2 (en) Program, storage control method, and storage system
US6990611B2 (en) Recovering data from arrays of storage devices after certain failures
US7565573B2 (en) Data-duplication control apparatus
JP4886209B2 (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
JP5052193B2 (ja) 記憶制御装置および記憶制御方法
CN100390745C (zh) 在处理数据时检验数据完整性的装置及方法
US9081697B2 (en) Storage control apparatus and storage control method
US20150378858A1 (en) Storage system and memory device fault recovery method
CN107870731B (zh) 独立盘冗余阵列系统的管理方法和电子设备
JP2006139478A (ja) ディスクアレイシステム
US20070234107A1 (en) Dynamic storage data protection
JPH09269871A (ja) ディスクアレイ装置におけるデータ再冗長化方式
JP5040331B2 (ja) 記憶装置、記憶装置の制御方法、及び記憶装置の制御プログラム
US20090100302A1 (en) Apparatus and method for disk read checking
JP5365236B2 (ja) ストレージシステム
JP4893180B2 (ja) 記憶装置の故障回復方法、故障回復プログラムおよび制御装置
JP4248164B2 (ja) ディスクアレイのエラー回復方法、ディスクアレイ制御装置及びディスクアレイ装置
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
JP2014119831A (ja) ストレージ装置、制御方法及び制御プログラム
WO2021043246A1 (zh) 数据读取方法及装置
JP4947062B2 (ja) 記憶装置、記録復旧方法、記録復旧プログラム
KR20030073982A (ko) 레이드 서브 시스템에서 중복 데이터의 일관성 유지 방법
JP6734305B2 (ja) ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラム
JP2002278706A (ja) ディスクアレイ装置
JP2008084168A (ja) 情報処理装置及びデータ修復方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111205

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees