JP4852118B2 - ストレージ装置及び論理ディスク管理方法 - Google Patents

ストレージ装置及び論理ディスク管理方法 Download PDF

Info

Publication number
JP4852118B2
JP4852118B2 JP2009072593A JP2009072593A JP4852118B2 JP 4852118 B2 JP4852118 B2 JP 4852118B2 JP 2009072593 A JP2009072593 A JP 2009072593A JP 2009072593 A JP2009072593 A JP 2009072593A JP 4852118 B2 JP4852118 B2 JP 4852118B2
Authority
JP
Japan
Prior art keywords
disk
failure
physical disk
failed
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009072593A
Other languages
English (en)
Other versions
JP2010224954A (ja
Inventor
邦保 清水
達也 伊藤
義光 上山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009072593A priority Critical patent/JP4852118B2/ja
Publication of JP2010224954A publication Critical patent/JP2010224954A/ja
Application granted granted Critical
Publication of JP4852118B2 publication Critical patent/JP4852118B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、タイムアウト等の一時的障害が生じた場合でも継続使用が可能なストレージ装置及び論理ディスク管理方法に関する。
従来から、ストレージ装置においては、論理ディスクを構成する物理ディスクに障害が発生した場合、その障害が発生した物理ディスクが切り離されて縮退運転が行われている。例えば、RAID構成したストレージ装置では、物理ディスクへのアクセスでタイムアウト等の一時的障害が発生すると故障とみなされる。そして、その一時的障害が発生した物理ディスクが切り離されて縮退運転が行われる。
しかしながら、一時的障害の検出により切り離された物理ディスクであっても、その後の検査により、故障が生じていない場合がある。例えば物理ディスクの電源を再投入することにより正常な状態に復帰させることができる場合がある。このような場合、実際には物理ディスクは故障していないにもかかわらず、故障として扱われることとなり、故障発生頻度が増大する問題が生じる。
そこで、一時的障害が発生した物理ディスクを一旦論理ディスクから切り離したのち、その物理ディスクの診断処理を実施し、故障が生じていなければ論理ディスクのメンバーディスクに再度組み込む方法がある(例えば、非特許文献1参照)。
特開2006−164304号公報 "フェニックス技術"、[online]、[平成20年6月19日検索]、インターネット<URL:http://www.nec.co.jp/products/istorage/words/m036.shtml>
しかしながら、上述した従来の方法でも、物理ディスクが切り離された時点から論理ディスクが再構成されるまでの間は、論理ディスクの冗長性が失われるという問題がある。
また、例えばRAID−5構成のストレージ装置においては、複数の物理ディスクの障害にまでは対応しておらず、ひとつの物理ディスクに障害が生じている間は、他の物理ディスクに障害が生じても対応することができない。
それゆえ、故障と判断された物理ディスクが切り離された時点から論理ディスクが再構成されるまでの間に別の物理ディスクに障害が発生すると、論理ディスクの運用が停止してしまい、データが失われることになる。
本発明は上記実情に鑑みてなされたものであり、タイムアウト等の一時的障害が生じた場合でも継続使用が可能なストレージ装置及び論理ディスク管理方法を提供することを目的とする。
本発明は上記課題を解決するために、論理ディスクを構成する一以上の物理ディスクとホットスペアディスクとディスクコントローラとを備え、ネットワークを介して接続されたホスト装置からの要求に応じてデータを記憶するストレージ装置であって、前記ディスクコントローラは、前記物理ディスクに生じる一時的な障害を検出する一時的障害検出手段と、前記障害を検出した場合、該一時的な障害が生じた障害発生物理ディスクに対し障害回復処理を行なう障害回復手段と、前記障害発生物理ディスクのデータを前記ホットスペアディスクに複製するデータ複製手段と、障害回復処理の開始後一定期間、前記障害発生物理ディスクを監視し、前記ホスト装置からのコマンドに対する前記障害発生物理ディスクの応答データを記録する手段と、前記記録した応答データと基準応答データとを比較し、前記障害発生物理ディスクが故障か否かを判定する故障判定手段と、前記故障判定手段により故障と判定された場合、前記障害発生物理ディスクに替えて前記ホットスペアディスクを前記論理ディスクを構成する物理ディスクとする論理ディスク再構成部とを備えたストレージ装置を提供する。
本発明によれば、タイムアウト等の一時的障害が生じた場合でも継続使用が可能なストレージ装置及び論理ディスク管理方法を提供することが可能となる。
以下、図面を参照して本発明の実施形態を説明する。
<第1の実施形態>
図1は本発明の第1の実施形態に係るストレージ装置10の構成を示す模式図である。ストレージ装置10は、論理ディスク20を構成する一以上の物理ディスク21とホットスペアディスク22とディスクコントローラ30とを備えている。また、このストレージ装置10は、SCSI(small computer system interface)やFC(Fibre Channel)などによりネットワークを介してホスト装置5と接続しており、ホスト装置5からの要求に応じてデータを記憶する2次記憶装置である。物理ディスク21は、一般的にはHDD(hard disk drive)が用いられるが、これに限らず、半導体ディスクを含めたストレージデバイスであってもよい。ホットスペアディスク22は、障害が発生した物理ディスクを代替するものである。
ディスクコントローラ30は、メモリ40とプロセッサ50とを有しており、メモリ40に格納された「論理ディスク管理プログラム」がプロセッサ50に読み込まれることにより、論理ディスク設定部51、一時的障害検出部52、障害回復部53、データ複製部54、ディスク監視部55、故障判定部56、論理ディスク再構成部57、警告データ出力部58としての機能するものである。なお、図1では各処理部51〜58をプロセッサ内部に記載しているが、これは便宜上の表現である。すなわち、各処理部51〜58は論理ディスク管理プログラムの機能の一部としてプログラムされ、そのプログラムをプロセッサ50が実行することで実現される。
メモリ40は、ディスクコントローラ30が情報処理するデータを記憶する記憶装置である。このメモリ40には、予め設定された「基準応答データ」が記憶されている。また、メモリ40には、後述するディスク監視部55により「応答データ」が書き込まれる。
なお、正常な平均レスポンスタイムはHDD機種により異なり、また、同じHDDであってもIO負荷(キューイングの深さ)により変動するので、これに対応した値が基準応答データとして用いられる。例えば、ストレージ装置10がサポートしているHDD機種毎のテーブルデータや、あらゆる機種と環境とを想定して確実に異常と判定できる値などが基準応答データとして用いられる。 論理ディスク設定部51は、一以上の物理ディスク21をまとめて論理ディスク20として設定するものである。これによりRAID(redundant array of inexpensive disks)機能が実現される。なお、論理ディスク20はRAIDの種類に応じて冗長性をもつ場合と持たない場合とがある。
一時的障害検出部52は、物理ディスク21に生じる一時的な障害を検出するものである。例えば、一時的障害検出部52は、ホスト装置5からライト要求を受けたときのタイムアウト等から一時的障害を検出する。
障害回復部53は、一時的障害検出部52が一時的障害を検出した場合、その一時的な障害が生じた物理ディスク(以下、障害発生物理ディスク21Xという)に対し障害回復処理を行なうものである。例えば、障害回復部53は、デバイスリセットや物理ディスクの電源のオフオン等により障害回復処理を行う。なお、障害回復部53が障害回復処理中は、障害発生物理ディスク21Xへのホスト装置5からのアクセスは停止され、障害回復処理が完了した時点でI/O処理が再開される。
データ複製部54は、障害発生物理ディスク21Xのデータをホットスペアディスク22に複製してミラー化するものである。ここで、データ複製部54は、ホットスペアディスク22のデータが障害発生物理ディスク21Xのミラーであるため、障害発生物理ディスク21Xからデータを全面コピーすることができる。また、データ複製部54は、論理ディスク20が冗長性をもつRAID構成である場合、図2に示すように、論理ディスク20のメンバーディスクのうち、障害発生物理ディスク21X以外のメンバーディスクからホットスペアディスク22のデータを復元することも可能である。
ディスク監視部55は、障害回復処理の開始後一定期間、障害発生物理ディスク21Xを監視するものであり、ホスト装置5からのコマンドに対する障害発生物理ディスク21Xの応答データをメモリ40に記録する機能を有している。具体的には、ディスク監視部55は、物理ディスク21に最初の一時的障害が発生したときから、ホットスペアディスク22へのデータの復元中、さらにデータの復元完了後の一定期間(例えば24時間など)、障害発生物理ディスク21XのI/Oパターンなどを記録する。
故障判定部56は、障害回復処理後に記録した応答データを、メモリ40に記憶された基準応答データと比較して、障害発生物理ディスク21Xが故障であるか否かを判定するものである。例えば、故障判定部56は、I/Oの応答遅延や、その他の物理ディスク21の異常動作から、障害発生物理ディスク21Xが故障であるか否かを判定する。
なお、ホットスペアディスク22へのデータの複製が完了した時点では、障害発生物理ディスク21Xとホットスペアディスク22とはデータがミラー化された状態で動作している。
論理ディスク再構成部57は、図3に示すように、故障判定部56により障害発生物理ディスク21Xが故障であると判定された場合、その障害発生物理ディスク21Xに替えてホットスペアディスク22を論理ディスク20のメンバーディスクとして組み込むものである。
また、論理ディスク再構成部57は、ホットスペアディスク22を論理ディスク20のメンバーディスクとして組み込んだ場合、ディスク監視部55による障害発生物理ディスク21Xに対する監視を解除し、応答データの記録を終了させる。この時点で障害発生物理ディスク21Xの故障が確定することになる。
なお、論理ディスク再構成部57は、ホットスペアディスク22へのデータの復元中、またはデータ復元後の一定期間中に、監視対象の障害発生物理ディスク21Xで一時的障害が再度検出された場合、その時点で障害発生物理ディスク21Xを論理ディスク20から切り離し、ホットスペアディスク22を論理ディスク20のメンバーディスクとして割り当てる。
障害発生物理ディスク21Xに対して異常動作が観測されなければ、図4に示すように、論理ディスク再構成部57は障害発生物理ディスク21Xで発生した障害は一時的なものであったとみなし、ディスク監視部55による監視を解除し、応答データの記録を終了させる。それから、論理ディスク再構成部57は、障害発生物理ディスク21Xとホットスペアディスク22とのミラー構成を解除する。これにより論理ディスク20は元の状態に戻る。
警告データ出力部58は、故障判定部56により障害発生物理ディスク21Xが故障であると判定された場合、警告データを出力するものである。
次に本実施形態に係るストレージ装置10の動作を図5のフローチャートを用いて説明する。ディスクコントローラ30では一時的障害検出部52が常時稼動しており、物理ディスク21に一時的障害が発生すると、そのことが一時的障害検出部52により検出される(S1−Yes)。続いて、障害回復部53により障害発生物理ディスク21Xに対する障害回復処理が実行される(S2)。障害回復処理では、デバイスリセットや電源のオンオフを実行する。
障害回復部53により障害発生物理ディスク21Xの障害回復処理が開始されると、データ複製部54により障害発生物理ディスク21Xに対してホットスペアディスク22が割り当てられる(S3)。これにより、ホットスペアディスク22が障害発生物理ディスク21Xのミラーディスクとして構成される。そして、データ複製部54により、障害発生物理ディスク21Xのデータがホットスペアディスク22に複製される。
また、障害回復部53により障害発生物理ディスク21Xの障害回復処理が開始されると、ディスク監視部55によりホスト装置5からのコマンドに対する障害発生物理ディスク21Xの応答データがメモリ40に記録される(S4)。
続いて、故障判定部56により、障害回復処理後に記録された応答データと、予めメモリ40に記憶された基準応答データとが比較されて、障害発生物理ディスク21Xが故障であるか否かが判定される(S5)。
故障判定部56により故障であると判定された場合(S5−Yes)、論理ディスク再構成部57により障害発生物理ディスク21Xに替えて、ホットスペアディスク22が論理ディスク20のメンバーディスクとして再構成される(S6)。論理ディスク20が再構成されると、障害発生物理ディスク21Xが切り離される(S7)。
一方、故障判定部56により故障であると判定されなかった場合、障害発生物理ディスク21Xが継続使用される(S5−No,S8)。なお、障害発生物理ディスク21Xとホットスペアディスク22とはミラー化されているので、障害発生物理ディスク21Xの継続使用ではなくホットスペアディスク22を論理ディスクに組み込み、障害ディスクとして判断されていたディスクをホットスペアディスクとして使用してもよい。
以上説明したように、本実施形態に係るストレージ装置10は、ディスクコントローラ30が、物理ディスク21に生じる一時的な障害を検出する一時的障害検出部52と、一時的な障害が生じた障害発生物理ディスク21Xに対し障害回復処理を行なう障害回復部53と、障害発生物理ディスク21Xのデータをホットスペアディスク22に複製するデータ複製部54とを備え、障害発生物理ディスク21Xとホットスペアディスク22をミラー化することで、タイムアウト等の一時的障害が生じた場合でも継続使用することができる。
また、ディスクコントローラ30は、障害回復処理の開始後(障害発生物理ディスク21Xとホットスペアディスク22のミラー化後)一定期間、障害発生物理ディスク21Xを監視し、ホスト装置5からのコマンドに対する障害発生物理ディスク21Xの応答データを記録するので、障害発生物理ディスク21Xが故障しているか否か、どのような故障が発生しているのかを判断するための情報を提供できる。例えば、システム管理者が、この応答データのログから障害発生物理ディスク21Xの故障原因を分析することができ、最終的に故障であるとして切り離された障害発生物理ディスク21Xの一時的障害発生までのI/Oシーケンスを再現することで、故障原因を容易に検証できるようになる。
また、障害発生物理ディスク21Xが故障であるか否かを判定する故障判定部56を具備しているので、ディスクコントローラ30は、障害回復処理後に記録した応答データを基準応答データと比較して、障害発生物理ディスク21Xを論理ディスク20から切り離すことなく、故障の有無を確認できる。結果として、故障判定作業に伴って生じる論理ディスク20の冗長性喪失の問題を回避できる。
また、故障判定部56により障害発生物理ディスク21Xが故障であると判定された場合、その障害発生物理ディスク21Xに替えてホットスペアディスク22を論理ディスク20のメンバーディスクに組み込むので、故障があると判定された場合でもストレージ装置10を継続使用することができる。
従来のストレージ装置では、図6(A)に示すように、正常状態の物理ディスク21に障害が発生すると(A1)、障害発生物理ディスク21Xを切り離し(A2)、ホットスペアディスク22をメンバーディスクとして論理ディスク20をリビルドする(A3)。この際、ホットスペアディスク22のリビルドが完了するまで(A4)、論理ディスク20の冗長性が維持できないという問題が生じていた。
これに対し、本実施形態に係るストレージ装置10は、図6(B)に示すように、正常状態の物理ディスク21に障害が発生すると(B1)、障害発生物理ディスク21Xのデータをホットスペアディスク22にコピーし(B2)、障害発生ディスク21Xとホットスペアディスク22とを一定期間ミラー動作する。そして、ミラー動作中のホスト装置5からのコマンドに対するI/Oパターン等を記録し(B3)、障害発生物理ディスク21Xが故障であるか否かを判定する(B4・B5)。それゆえ、一時的な障害が発生しただけでは障害発生物理ディスク21Xを切り離さずにホットスペアディスク22とミラー化して継続使用するので、冗長性を失わずに論理ディスク20を使用することができる。
また、ディスクコントローラ30は、故障判定部56により障害発生物理ディスク21Xが故障であると判定された場合、警告データを出力することで、障害発生物理ディスク21Xを継続使用するか、ホットスペアディスク22に切り替えるかの判断をシステム管理者に促すことが可能となる。
ディスク監視部55による監視と故障判定部56による故障判定についての変形例を示す。
(監視方法1:I/Oパターンの監視)
監視方法1では、障害発生物理ディスク21Xに対して発行された監視期間中のすべての(あるいは少なくとも直近数十秒間の)コマンドのI/Oパターンをメモリに記録する。ここで、コマンドのI/Oパターンとは、コマンド種別(CDBイメージ)・発行時刻・完了時刻・完了ステータス(センス情報)を含むものである。センス情報には、コマンドの実行に一度に失敗したがHDD内部のリトライで成功した等のエラーリカバリ情報が記録される。
また、監視方法1では、故障判定部56は、リトライで成功したコマンドの、すべての発行コマンドに占める割合が既定の閾値を超えた場合に故障が生じたと判定する。(改行なし)なお、上記判定基準での判定を行わない場合でも、別の監視方法により故障と判定された場合、I/Oパターンの情報が必要となる。例えば、障害発生物理ディスク21Xを回収して再現試験を行なう場合、一時的障害に至るまでのコマンドシーケンスを再現するためにコマンドのI/Oパターンが必要となる。そのため、以下に示す監視方法を実施する場合でも、このI/Oパターンの記録を併用することが望ましい。
(監視方法2:レスポンスタイムの監視)
監視方法2では、ホットスペアディスク22へのコピー命令またはホスト装置5からのコマンドに対する応答時間の詳細な統計をメモリに記録する。上記のI/Oパターンの記録を監視期間全体にわたって保存するだけの容量的余裕がある場合は、この情報を統計的に処理するだけで済む。
また、監視方法2では、故障判定部56は、ディスク監視部55により得られた応答時間と、あらかじめメモリ40に記憶された基準応答時間とを比較して、所定の閾値を超える比率に応じて故障が生じたか否かを判定する。例えば応答時間が1秒を超えるコマンドが10%を超えるようならば、故障が生じたと判定する。
(監視方法3:スループットの監視)
監視方法3では、ホットスペアディスク22へデータをコピーするときの障害発生物理ディスク21Xへの全面リード要求に対するリードスループットを測定する。ただし、障害発生物理ディスク21Xは、ホスト装置5からのコマンドも並行して受けているので、これによるデータの変化分の補正処理は別途実行される。
故障判定部56は、障害発生物理ディスク21Xが本来もつべきスループット性能をテーブルデータとして保持しておき、そのテーブルデータと実測値との性能差から故障であるか否かを判定する。例えば、この性能差がある程度の閾値(たとえば50%)を下回ったら故障であると判定する。
(監視方法4:SMART機能によるエラー情報の監視)
監視方法4では、HDDのSMART機能によるエラー情報を取得する。一般的なHDDではSMART機能が搭載されており、SMART機能ではそのHDD自体の内部エラーの監視を実施している。そして、このエラー情報は外部から参照できるので、ディスク監視部55がこれを取得する。なお、SMART機能により取得できるエラー情報としては、リードエラーレート・ライトエラーレート・シークエラーレート・残り交代セクタ数・スピンアップ時間・Gリスト更新頻度・装置温度等が挙げられる。ただし、スピンアップ時間は電源投入時の記録なのでディスク監視部55の監視対象外とすべきものである。
また、故障判定部56は、スピンアップ時間以外の各パラメータを定期的(例えば1分おき)に参照し、参照した各パラメータの値またはその増分が閾値を超えた場合に故障であると判定する。
(監視方法5:最初の一時的障害と同様のエラー情報の監視)
監視方法5では、一時的障害検出部52が一時的障害を検出するための判定基準と同様の判定基準(たとえばタイムアウトまたはエラー応答のためリトライしたが、リトライアウトした等)により、最初の一時的障害と同様のエラー情報が再度得られるか否かを監視する。故障判定部56は、ディスク監視部55により最初の一時的障害と同様のエラー情報が再度得られた場合に故障であると判定する。
この監視方法5であれば、一般的には発生しないような一時的障害が物理ディスク21に発生した場合、2回目の一時的障害が検出されることは非常に稀なので、故障とみなされる回数を減らすことができる。
なお、監視方法5は、監視方法1と併用し、I/Oパターンの詳細なログを採取することで、障害要因を容易に調査することができる。
<その他>
本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に構成要素を適宜組み合わせてもよい。
なお、上記実施形態に記載した手法は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)、光磁気ディスク(MO)、半導体メモリ、半導体ディスクなどの記憶媒体に格納して頒布することもできる。
また、この記憶媒体としては、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であっても良い。
また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が上記実施形態を実現するための各処理の一部を実行しても良い。
さらに、本発明における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶または一時記憶した記憶媒体も含まれる。
また、記憶媒体は1つに限らず、複数の媒体から上記実施形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であっても良い。
尚、本発明におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、上記実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であっても良い。
また、本発明におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。
本発明の第1の実施形態に係るストレージ装置10の構成を示す模式図である。 同実施形態に係るデータ複製部54の機能を説明するための模式図である。 同実施形態に係る論理ディスク再構成部57の機能を説明するための模式図である。 同実施形態に係る論理ディスク再構成部57の機能を説明するための模式図である。 同実施形態に係るストレージ装置10の動作を説明するためのフローチャートである。 同実施形態に係るストレージ装置10の効果を説明するための模式図である。
5・・・ホスト装置、10・・・ストレージ装置、20・・・論理ディスク、21・・・物理ディスク、22・・・ホットスペアディスク、30・・・ディスクコントローラ、40・・・メモリ、50・・・プロセッサ、51・・・論理ディスク設定部、52・・・一時的障害検出部、53・・・障害回復部、54・・・データ複製部、55・・・ディスク監視部、56・・・故障判定部、57・・・論理ディスク再構成部、58・・・警告データ出力部。

Claims (4)

  1. 論理ディスクを構成する一以上の物理ディスクとホットスペアディスクとディスクコントローラとを備え、ネットワークを介して接続されたホスト装置からの要求に応じてデータを記憶するストレージ装置であって、
    前記ディスクコントローラは、
    前記物理ディスクに生じる一時的な障害を検出する一時的障害検出手段と、
    前記障害を検出した場合、該一時的な障害が生じた障害発生物理ディスクに対し障害回復処理を行なう障害回復手段と、
    前記障害発生物理ディスクのデータを前記ホットスペアディスクに複製するデータ複製手段と
    障害回復処理の開始後一定期間、前記障害発生物理ディスクを監視し、前記ホスト装置からのコマンドに対する前記障害発生物理ディスクの応答データを記録する手段と、
    前記記録した応答データと基準応答データとを比較し、前記障害発生物理ディスクが故障か否かを判定する故障判定手段と、
    前記故障判定手段により故障と判定された場合、前記障害発生物理ディスクに替えて前記ホットスペアディスクを前記論理ディスクを構成する物理ディスクとする論理ディスク再構成部と
    を備えたことを特徴とするストレージ装置。
  2. 前記故障判定手段により故障と判定されない場合、前記障害発生物理ディスクが継続使用されることを特徴とする請求項1に記載のストレージ装置。
  3. 論理ディスクを構成する一以上の物理ディスクとホットスペアディスクとディスクコントローラとを備え、ネットワークを介して接続されたホスト装置からの要求に応じてデータを記憶するストレージ装置に用いられる論理ディスク管理方法であって、
    前記ディスクコントローラが、
    前記物理ディスクに生じる一時的な障害を検出した場合、該一時的な障害が生じた障害発生物理ディスクに対し障害回復処理を行なうとともに、前記障害発生物理ディスクのデータを前記ホットスペアディスクに複製
    前記障害回復処理の開始後一定期間、前記障害発生物理ディスクを監視し、前記ホスト装置からのコマンドに対する前記障害発生物理ディスクの応答データを記録し、
    前記障害回復処理後に記録した応答データを、基準応答データと比較して、前記障害発生物理ディスクが故障であるか否かを判定し、
    前記判定の結果、故障である場合、前記障害発生物理ディスクに替えて前記ホットスペアディスクを前記論理ディスクを構成する物理ディスクとする
    ことを特徴とする論理ディスク管理方法。
  4. 前記判定の結果、故障でない場合、前記ディスクコントローラが、前記障害発生物理ディスクを継続使用することを特徴とする請求項3に記載の論理ディスク管理方法。
JP2009072593A 2009-03-24 2009-03-24 ストレージ装置及び論理ディスク管理方法 Active JP4852118B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009072593A JP4852118B2 (ja) 2009-03-24 2009-03-24 ストレージ装置及び論理ディスク管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009072593A JP4852118B2 (ja) 2009-03-24 2009-03-24 ストレージ装置及び論理ディスク管理方法

Publications (2)

Publication Number Publication Date
JP2010224954A JP2010224954A (ja) 2010-10-07
JP4852118B2 true JP4852118B2 (ja) 2012-01-11

Family

ID=43042062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009072593A Active JP4852118B2 (ja) 2009-03-24 2009-03-24 ストレージ装置及び論理ディスク管理方法

Country Status (1)

Country Link
JP (1) JP4852118B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5488709B2 (ja) 2010-10-14 2014-05-14 富士通株式会社 ストレージ制御装置における基準時間設定方法
JP5652130B2 (ja) * 2010-10-29 2015-01-14 日本電気株式会社 ディスクアレイコントローラ装置及びその制御方法
CN103019614B (zh) * 2011-09-23 2015-11-25 阿里巴巴集团控股有限公司 分布式存储系统管理装置及方法
JP5884606B2 (ja) * 2012-03-30 2016-03-15 富士通株式会社 ストレージ管理方法、システム、およびプログラム
WO2014132373A1 (ja) * 2013-02-28 2014-09-04 株式会社 日立製作所 ストレージシステム及び記憶デバイス障害回復方法
JP7129148B2 (ja) * 2017-05-23 2022-09-01 株式会社アイ・オー・データ機器 外部記憶装置
US11314596B2 (en) 2018-07-20 2022-04-26 Winbond Electronics Corp. Electronic apparatus and operative method
CN110880353B (zh) * 2018-09-06 2022-06-07 华邦电子股份有限公司 电子装置及其操作方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187102A (ja) * 1992-12-17 1994-07-08 Toshiba Corp 二重化ディスク処理方式
JP3400328B2 (ja) * 1997-12-26 2003-04-28 株式会社日立製作所 データ記憶方法およびデータ記憶装置
JPH11296306A (ja) * 1998-04-08 1999-10-29 Hitachi Ltd 記憶サブシステム
JP2004118397A (ja) * 2002-09-25 2004-04-15 Nec Soft Ltd 磁気ディスク装置の障害発生予測システム
JP2004272325A (ja) * 2003-03-05 2004-09-30 Nec Software Chubu Ltd 外部記憶装置の故障予測方法およびシステム
JP2005115975A (ja) * 2003-10-02 2005-04-28 Toshiba Tec Corp 情報処理装置
JP4426262B2 (ja) * 2003-11-26 2010-03-03 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の障害回避方法
JP2006092070A (ja) * 2004-09-22 2006-04-06 Nec Corp ディスクアレイ装置及びその制御方法並びに制御プログラム
JP4723290B2 (ja) * 2005-06-06 2011-07-13 株式会社日立製作所 ディスクアレイ装置及びその制御方法
JP4947062B2 (ja) * 2007-01-25 2012-06-06 富士通株式会社 記憶装置、記録復旧方法、記録復旧プログラム
JP2009059280A (ja) * 2007-09-03 2009-03-19 Mitsubishi Electric Corp ストレージ制御方式

Also Published As

Publication number Publication date
JP2010224954A (ja) 2010-10-07

Similar Documents

Publication Publication Date Title
JP4852118B2 (ja) ストレージ装置及び論理ディスク管理方法
US7409582B2 (en) Low cost raid with seamless disk failure recovery
JP4821448B2 (ja) Raidコントローラおよびraid装置
US7565573B2 (en) Data-duplication control apparatus
CN103019885B (zh) 基于嵌入式Linux的硬盘坏道监测方法及系统
US20060117216A1 (en) Program, storage control method, and storage system
US9081697B2 (en) Storage control apparatus and storage control method
US20040103246A1 (en) Increased data availability with SMART drives
JP2005322399A (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
US20080114932A1 (en) Method, apparatus, and system for controlling data storage
US20060215456A1 (en) Disk array data protective system and method
JP4203034B2 (ja) アレイコントローラ、メディアエラー修復方法及びプログラム
US7506224B2 (en) Failure recovering method and recording apparatus
US20090177916A1 (en) Storage system, controller of storage system, control method of storage system
JP2016057876A (ja) 情報処理装置、入出力制御プログラム、及び入出力制御方法
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
JP5181795B2 (ja) Raidシステム、及びエラーセクタの修復方法
US20120011317A1 (en) Disk array apparatus and disk array control method
JP4968078B2 (ja) 故障診断装置及び故障診断方法
US20130031321A1 (en) Control apparatus, control method, and storage apparatus
JP2006260376A (ja) ストレージ装置およびメディアエラー回復方法
JP4947062B2 (ja) 記憶装置、記録復旧方法、記録復旧プログラム
US20140380090A1 (en) Storage control device and storage control method
KR20110039416A (ko) 인터럽트된 기록 복구를 위한 데이터 저장 방법, 장치 및 시스템
JP2005293119A (ja) ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111021

R150 Certificate of patent or registration of utility model

Ref document number: 4852118

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350