JP2010020840A - 磁気ディスク装置 - Google Patents

磁気ディスク装置 Download PDF

Info

Publication number
JP2010020840A
JP2010020840A JP2008180417A JP2008180417A JP2010020840A JP 2010020840 A JP2010020840 A JP 2010020840A JP 2008180417 A JP2008180417 A JP 2008180417A JP 2008180417 A JP2008180417 A JP 2008180417A JP 2010020840 A JP2010020840 A JP 2010020840A
Authority
JP
Japan
Prior art keywords
error
magnetic disk
data
disk device
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008180417A
Other languages
English (en)
Inventor
Yasuhiro Nakamura
康裕 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008180417A priority Critical patent/JP2010020840A/ja
Publication of JP2010020840A publication Critical patent/JP2010020840A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】磁気ディスク装置にエラーが発生しても、発生している問題を磁気ディスク装置自身で判断し、遅延を少なく上位装置にエラー状態を報告する磁気ディスク装置を提供する。
【解決手段】磁気ディスク装置103において、データエラーが発生した際に、エラー情報テーブル110から既に格納されているエラー情報を読み出して自己チェックを行い、連続エラー判定を行う。連続エラーと判定された場合は、これ以上リトライしても修復不可能で処理遅延を発生させる可能性が高いと判断し、通常のデータエラー応答ではなくハードエラー応答として、上位装置にデータリカバリーを行うように促す。また、処理遅延によりリセット信号が発行された場合、ウォッチドッグタイマー109を発動し、既定時間内にリセット処理開始可能かを判断する。
【選択図】図1

Description

本発明は磁気ディスク装置に関し、特にエラーを検出した場合にデータ修復を行うと共にエラー状態を判断する機能を備え、且つパフォーマンス劣化を抑えるため、命令処理遅延を最小限に留めて上位装置にエラー報告する磁気ディスク装置に関する。
従来、磁気ディスク装置では記憶データとECCデータの整合性チェックを行うECCエラー訂正機能や、読み出しエラー時に条件を様々に変化させてリトライする機能を有している。このリトライ機能を利用して読み出しに成功したデータを記録媒体に書き戻し、または別の領域へデータを退避させ、同一データを読み出した時にエラーとならないようにするデータ修復機能も一般的に有している。
さらに、高い信頼性を必要とするシステム装置では、磁気ディスク装置を複数用いてRAID構成とし、データ修復能力の向上を図っている。RAID構成では、1台の磁気ディスク装置に回復不可能なエラーが存在している場合でも、他の磁気ディスク装置から正しいデータを読み出してエラー箇所を修復できる。
万が一、1台の磁気ディスク装置が動作不能となった場合でも、磁気ディスク装置を交換後に他の磁気ディスク装置からデータ復旧するリビルド処理が行うことができる。特開平6−67815号公報(特許文献1)には、磁気ディスクから読み取ったデータを訂正した後に磁気ディスクに書き戻すデータ修復技術が記載されている。
特開平6−67815号公報
近年、磁気ディスク装置の記録密度向上により、データの読み出し、書き込みに高い制御技術が使われる反面、データ信頼性の低下、エラー要因発生時の影響範囲が大きくなることが懸念されている。この問題を対策する手段として、空き時間に磁気ディスク装置を全面読み出して、前記のデータ修復機能を用いて修復する機能が磁気ディスク装置自身やRAID構成に追加され、データ修復機能を強化している。
しかしながら、この修復機能には問題があった。上位装置からの読み出し書き込み要求と競合すると割り込み処理が入り、修復機能による読み出しを中断して上位装置からの要求を優先して実行するが、データエラーを修復中は修復完了してから要求実行するため、要求処理遅延が発生するという問題である。
処理遅延は1箇所の修復であれば問題ないレベルであるが、近年の高密度化によりエラー影響範囲が大きくなり、連続したエラーとなることが多くなっている。連続したエラー領域の修復中には上位装置からの要求が滞り処理が遅延した結果、コンピュータシステム装置全体のパフォーマンスが劣化してしまう。
また、割り込み処理の繰り返しとなり、磁気ディスク装置のハングアップを誘発する可能性が高くなると考えられる。
ハングアップによる無応答状態の改善策としては、上位装置のもつウォッチドッグタイマーで応答監視を行い、無応答時にリセットを行う方法が考えられる。しかし、上位装置はデータエラー修復によるコマンド処理遅延の無応答と、ハングアップによる無応答を区別することはできない。コマンド処理遅延状態でリセットをしても、リセット後に再度エラー修復が始まり遅延の解決にはならないという問題があった。
そこで、本発明の目的は、磁気ディスク装置にエラーが発生しても、発生している問題を磁気ディスク装置自身で判断し、遅延を少なく上位装置にエラー状態を報告する磁気ディスク装置を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
すなわち、代表的なものの概要は、ディスクコントローラが、データエラーが発生した際に、エラー情報テーブルに格納されているエラー情報を読み出し、エラー情報に基づいて、過去のデータエラーとの連続性からデータエラーが連続的に発生している連続エラーであるかを判断し、連続エラーであると判断した場合に、上位装置へハードエラーとしてエラー状態を報告するものである。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
すなわち、代表的なものによって得られる効果は、連続データエラーを検出時に自己チェックを行い処理遅延が懸念される場合、上位装置へ通常のデータエラー応答ではなく自己チェック結果を報告するため、上位装置はエラー状況に応じた対応が可能となる。これは磁気ディスク装置自身やRAID構成によるデータ修復機能の実行中にも適用され、上位装置からの読み出し書き込み要求と競合しても処理遅延を少なくすることができる。
また、リセット信号を受領した時も処理遅延とハングアップを区別して応答し、上位装置に適切な処置を促すことができる。リセット信号を受領後にウォッチドッグタイマーを発動するため、最小限の負荷で実行が可能である。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
図1により、本発明の一実施の形態に係る磁気ディスク装置を搭載したコンピュータシステムの構成について説明する。図1は本発明の一実施の形態に係る磁気ディスク装置を搭載したコンピュータシステムの構成を示す構成図である。
図1において、コンピュータシステムは、構成要素として大きくは中央処理装置であるCPU101、ディスク制御装置であるRAIDシステム102、SCSI(Small Computer System Interface)バス111、磁気ディスク装置103から構成されている。また、このコンピュータシステムは上位装置と接続され、上位装置からの処理要求などを受け付けている。
RAIDシステム102は、RAID構成を統括するRAIDコントローラ104、CPUからの処理要求をSCSIコマンドに変換するSCSIコントローラ105、磁気ディスクへ送るコマンドを管理するコマンド制御部106で構成されている。
磁気ディスク装置103は、SCSIコマンドを受領、応答するSCSIコントローラ107、磁気ディスク装置を制御するディスクコントローラ108、障害時の割り込み手段であるウォッチドッグタイマー109、磁気ディスク装置のエラー情報を格納するエラー情報テーブル110、磁気ディスク(記録媒体)206、磁気ディスク206にアクセスするための読み出しヘッド205および書き込みヘッド207から構成されている。
CPU101からの処理要求がRAIDコントローラ104に届くと、SCSIコントローラ105からSCSIコマンドとして磁気ディスク装置に発行される。コマンド制御部106は発行されるコマンド1つ1つに番号をつけ、磁気ディスク装置からの応答内容と処理時間を管理している。
磁気ディスク装置103はコマンドを受領し、ディスクコントローラ108によって処理要求を実施し、結果を応答する。エラーが発生して処理要求に応えられない場合は、エラー情報テーブル110にエラー内容を書き込み、エラー内容を応答して終了する。
磁気ディスク装置103のウォッチドッグタイマー109はディスクコントローラ108に障害が発生し、処理が止まってハングアップした時に発動し、タイマーが0になると、割り込み信号112をディスクコントローラ108へ発行する。
RAIDコントローラ104は磁気ディスク装置103からの応答をCPU101へ送出するが、エラー応答である場合はリトライを行って、CPU101からの処理要求に応えられるようにリカバリー処理を行う。
次に、図2により、本発明の一実施の形態に係る磁気ディスク装置の読み出し書き込みのデータ処理について説明する。図2は本発明の一実施の形態に係る磁気ディスク装置の読み出し書き込みのデータ処理を説明するためのブロック図であり、図1のディスクコントローラ108の制御による処理をブロック図で示している。
図2において、ディスクコントローラ108による制御は、コマンド実行制御部201、リクエスト競合部202、データスキャン制御部203、データバッファ204、エラー検出/リトライ制御部208、コマンド応答制御部209の各ブロックにより行われている。
コマンド実行制御部201で読み出し書き込み要求を受けると上位装置からの処理要求211としてリクエスト競合部202に送信される。データスキャン制御部203はデータ信頼性向上のための全面読み込みチェックを実行する自動データ修復要求212をリクエスト競合部202に定期的に送信している。
リクエスト競合部202は上位装置からの処理要求211と自動データ修復要求212を競合させ、基本的には上位装置からの処理要求211を優先して選択し、自動データ修復の実行を待たせる。
上位装置からの処理要求211がない時に自動データ修復要求212が来た場合は自動修復が選択され、自動修復機能が実行される。自動修復機能実行中に上位装置からの処理要求211が来た場合は、自動修復機能を中断して上位装置からの処理要求211が割り込みで選択されるが、実際のエラーの修復作業はデータ保全のために中断せず、全てに優先される。前記で待たされた処理は、優先される処理が終了した後に実行される。
このようにリクエスト競合部202で選択された要求は、コマンド信号213として展開され実行される。読み出しの場合は読み出しヘッド205で磁気ディスク206の指定アドレスを読み出し、データバッファ204に一時記録する。一時記録されたデータはエラー検出/リトライ制御部208でエラーチェックし、エラーが検出されなければコマンド応答制御部209にデータを送信する。
エラーが検出されたらエラーデータ訂正やリトライを試み、修復可能であれば修復データを、修復不可能であればエラー内容をコマンド応答制御部209に送信する。
書き込みの場合はデータバッファ204に一時記録されたデータを書き込みヘッド207で磁気ディスク206の指定アドレスへ書き込み、実行結果をコマンド応答制御部209へ送信する。コマンド応答制御部209は送られてきたコマンド実行結果やデータをコマンド番号ごとに上位装置に送出して、コマンド終了とする。この一連のデータ処理はディスクコントローラ108によって制御され、絶えず実行されるようになっている。
次に、図3により、本発明の一実施の形態に係る磁気ディスク装置においてエラーが検出された場合のデータ修復処理の処理フローについて説明する。図3は本発明の一実施の形態に係る磁気ディスク装置においてエラーが検出された場合のデータ修復処理の処理フローを示すフローチャートであり、読み出し処理を行う際に、エラー検出/リトライ制御部208によりエラーが検出された場合のデータ修復処理の処理フローを示している。
まず、コマンド信号213によって読み出しを実行し、データバッファ204に一時記録されたデータからエラーを検出する(ステップ301)。
ステップ301でエラーを検出した場合、リトライ処理を行い(ステップ302)、リトライ処理によって正常に読み出せたかを判定する(ステップ303)。
リトライ処理には最大リトライ回数と規定リトライ回数を設定可能とし、リトライ処理を行いステップ303で正常に読み出せなくても、最大リトライ回数に達するまではリトライ処理を繰り返す(ステップ304)。
ステップ303でリトライ処理によって正常に読み出せたら、規定リトライ回数に達しているかを判定する(ステップ305)。ステップ305で規定リトライ回数以内のリトライ処理でデータ訂正できた場合、訂正データでデータバッファ204の内容を更新し、正常応答として終了する(ステップ309)。
ステップ305で規定リトライ回数を超えていた場合、データ修復を行う(ステップ306)。
このデータ修復についての詳細は省略するが、一般的にはデータ訂正後のデータを書き込みヘッド207により読み出したアドレスへ上書きを行い、さらにベリファイを行ってデータ確認をして、次に読み出す時にエラーとならないように修復される。
また、ステップ304でリトライ処理で最大リトライ回数に達した時は、データエラーとしてエラー情報テーブル110にエラー情報を格納する(ステップ307)。この時、現在のエラー情報と過去のエラー情報を照合し、連続的にエラー発生している状態であるかを判定する(ステップ308)。
ステップ308で連続エラーと判定されない場合、通常のデータエラー応答を送出し、上位装置に装置リトライを促す(ステップ310)。
ステップ308で連続エラーと判定された場合は、これ以上リトライしても修復不可能で処理遅延を発生させる可能性が高いと判断し、ハードエラー応答として、上位装置にデータリカバリーを行うように促す(ステップ311)。
この処理フローは通常上位装置へデータエラー応答を行わない磁気ディスク装置の自動修復機能で検出されたエラーでも同様とする。ただし、通常のデータエラー応答は行わず、ステップ311でのハードエラー応答となった場合だけ応答する。
次に、図4により、本発明の一実施の形態に係る磁気ディスク装置の連続エラーを判定する処理の処理フローについて説明する。図4は本発明の一実施の形態に係る磁気ディスク装置の連続エラーを判定する処理の処理フローを示すフローチャートであり、連続とは数回のレベルではなく、今後継続的にエラーが発生し、大きな処理遅延を起こす要因があるかどうかの判定である。
まず、エラー情報テーブル110にエラー情報を格納する際に磁気ディスク装置103の全ヘッドでエラー情報の書き込みと過去のエラー情報の読み出しを行う(ステップ401)。その際、エラー情報テーブル110の書き込み/読み出し時間を監視し、リトライによるタイムアウトがないか確認する(ステップ402)。このことで、読み出しヘッド205、書き込みヘッド207が正常であるか簡易的に確認できる。
そして、エラー情報格納時に記録しておいた直近の既定ブロック数データアクセスにおける総リトライ数を閾値と照合し(ステップ403)、直近の既定時間の自動修復機能によるデータ修復回数を閾値と照合する(ステップ404)。
ここまでのステップは全て継続的な処理遅延要因がないかの確認である。
さらに、今回のデータエラーと連続エラーであるか、アドレスが連続的であるかを過去のエラー情報と照合して確認する(ステップ405)。これは一般的に読み込みが一定のブロック単位で行われるので、上位装置のリトライ方法によっては1箇所がエラーであると連続エラーになる可能性があり処理遅延を引き起こす可能性があり、それを防止するために設定する。
以上のステップで問題があればその内容を不揮発記録エリアに退避し、連続エラーと判定する(ステップ406)。
次に、図5により、本発明の一実施の形態に係る磁気ディスク装置のウォッチドッグタイマーの処理フローについて説明する。図5は本発明の一実施の形態に係る磁気ディスク装置のウォッチドッグタイマーの処理フローを示すフローチャートである。
ウォッチドッグタイマー109はディスクコントローラ108に障害が発生し、処理が止まってハングアップした時に発動させる。
具体的には、RAIDシステム102のコマンド制御部106が磁気ディスク装置からの応答を精査し、規定時間応答がないコマンドがある場合、RAIDコントローラ104に報告する。報告を受けたRAIDコントローラ104は再度同じコマンドを発行(リトライ)し、それでも応答がない場合、リセットを発行する。
このリセットを起点にウォッチドッグタイマー109はタイマーを有効とし、タイマーを初期値にセットする(ステップ501)。
その後、タイマーカウントを1ずつ減らしながら(ステップ502)、SCSIバスを監視してリセット応答があるかを確認する(ステップ503)。ここでコマンド応答遅延の原因が磁気ディスクのデータ修復であれば、問題なくディスクコントローラ108はリセット応答が可能である。ディスクコントローラ108は、リセット処理を開始する際にウォッチドッグタイマー109を無効とし、タイマーは終了する。
ディスクコントローラ108がハングアップしている場合はタイマーカウントが進み、タイマーが0となったらウォッチドッグタイマー109は割り込み信号112をディスクコントローラ108へ発行し(ステップ504)、タイムアウトが発生したことを連絡する。その後、自身でタイマーを無効とし(ステップ505)終了する。
次に、図6により、本発明の一実施の形態に係る磁気ディスク装置において実際にタイムアウトが発生した場合の処理フローについて説明する。図6は本発明の一実施の形態に係る磁気ディスク装置において実際にタイムアウトが発生した場合の処理フローを示すフローチャートである。
上述したように、タイムアウトが発生するとRAIDシステム102がリセットを発行し、ウォッチドッグタイマーが発動する(ステップ601〜ステップ603)。
ここでタイマーに対して時間内に処理開始できるかを判定する(ステップ604)。ステップ604で時間内に処理開始できずにウォッチドッグタイマー109の割り込み信号112が発生した場合、ディスクコントローラ108は内部に障害が発生していると判断し、コントローラ内部の論理リブートを行って復旧させる(ステップ605)。
そして、ステップ605での復旧後に内部リブートを行ったことをエラー情報として格納/照合し(ステップ606)、過去の内部リブート発生情報を読み出し、読み出した情報から、内部リブート回数が規定値を超えているか判定する(ステップ607)。
ステップ607で内部リブート回数が規定値を超えていなければ、内部リブートを行ったとして、上位装置へ内部リブート応答を返す(ステップ614)。
ステップ607で内部リブート回数が規定値を超えていれば、磁気ディスク装置が正常ではないと判断し、上位装置へ切り離し要求を返して、早期の磁気ディスク交換を促すようにする(ステップ615)。
本実施の形態では、RAID構成を採用しており、1台の磁気ディスク装置103を切り離してもデータ処理を継続可能である。且つ磁気ディスク装置103の交換によりデータ復旧も可能であるため、処理遅延要因となり得る磁気ディスク装置103を切り離すことは、処理遅延防止に非常に有効である。
また、ステップ604でリセット処理可能であった場合は、リセット処理を行い(ステップ608)、読み出し書き込みヘッドのチェックを行い(ステップ609)、ステップ609でのヘッドチェックがOKかを判定する(ステップ610)。
このチェックは図4に示すステップ402と同様の方法で、磁気ディスクのシステム管理エリアの所定の位置で全ヘッドに対して行う。
ステップ610でのヘッドチェックで問題が検出されれば、正常に読み出し書き込みできないと判断し、そのエラー情報を格納して(ステップ611)、上位装置へ切り離し要求を返す(ステップ615)。
ステップ611では、ヘッドが正常でないことを前提にエラー情報を格納するため、不揮発記録エリアにエラー情報を格納し、格納漏れがないようにする。
また、ステップ610でヘッドチェックで問題がなければ、リセット処理を行ったことをエラー情報として格納/照合し(ステップ612)、過去の内部リブート発生情報を読み出し、読み出した情報から、図4に示す連続エラー判定を行う(ステップ613)。
ステップ613で連続エラー判定でも問題がない場合、通常のリセット処理を実行して上位装置へリセット応答を返す(ステップ616)。
ステップ613で連続エラーと判定された場合、コマンドタイムアウトによるリセット発行の原因は連続エラーのデータ修復処理によるコマンド遅延と判断できるため、上位装置へ該当アドレス付近のリカバリー要求を返す(ステップ617)。
これにより、上位装置は当該磁気ディスクのリトライ処理から他の磁気ディスクのデータを上書きするリカバリー処理へ移ることができ、処理遅延を低減できる。
以上のように、本実施の形態では、磁気ディスク装置103自身で連続データエラーを検出時に自己チェックを行い処理遅延が懸念される場合、上位装置へ通常のデータエラー応答ではなく自己チェック結果を報告するため、上位装置はエラー状況に応じた対応が可能となる。これは磁気ディスク装置103自身やRAID構成によるデータ修復機能の実行中にも適用され、上位装置からの読み出し書き込み要求と競合しても処理遅延を少なくすることができる。
また、磁気ディスク装置103にウォッチドッグタイマー109を設け、ウォッチドッグタイマー109の動作により、リセット信号を受領した時も処理遅延とハングアップを区別して応答し、上位装置に適切な処置を促すことができる。また、リセット信号の受領後にウォッチドッグタイマー109を発動するため、最小限の負荷で実行が可能である。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
例えば、本実施の形態では、SCSI仕様で説明したが、ATA(Advanced Technology Attachment)、SATA(Serial Advanced Technology Attachment)、SAS(Serial Attached SCSI)など他の仕様でも可能である。
また、エラー状況を判定して磁気ディスク装置103が決められた応答をする仕様としたが、上位装置との整合を取るために応答を自由に設定可能としたり、一部応答しないようにしてもよい。
また、連続エラー判定は磁気ディスク装置103がもつエラー情報での閾値判定としたが、上位装置のもつエラー情報との照合によって判定してもよい。ウォッチドッグタイマー109の起点はコマンドタイムアウトによるリセットとなっているが、上位装置のもつ別のリセット手段でも実現可能である。
近年の高記録密度、論理の複雑化した磁気ディスク装置においては、データエラーやハングアップの要因は完全に取り除くことができず、リカバリーする手段は必須である。
本発明はデータエラー時に連続エラー判定を実施することでエラーリトライ処理、修復処理によるコマンド遅延を抑えることができるので、データエラーが発生してもシステムパフォーマンスを劣化させることなく修復できるため、システムパフォーマンスが必要なシステムなどに広く適用可能である。
また、ウォッチドッグタイマーによりシステムタイムアウトにも要因別に適切なリカバリーを行うことができ、磁気ディスク装置と上位装置が連携することでコンピュータシステム全体の動作率を最適化し、性能劣化を防ぎながら非常に高いデータの信頼性が得られるため、高いデータの信頼性が必要となるシステムなどにも広く適用可能である。
本発明の一実施の形態に係る磁気ディスク装置を搭載したコンピュータシステムの構成を示す構成図である。 本発明の一実施の形態に係る磁気ディスク装置の読み出し書き込みのデータ処理を説明するためのブロック図である。 本発明の一実施の形態に係る磁気ディスク装置においてエラーが検出された場合のデータ修復処理の処理フローを示すフローチャートである。 本発明の一実施の形態に係る磁気ディスク装置の連続エラーを判定する処理の処理フローを示すフローチャートである。 本発明の一実施の形態に係る磁気ディスク装置のウォッチドッグタイマーの処理フローを示すフローチャートである。 本発明の一実施の形態に係る磁気ディスク装置において実際にタイムアウトが発生した場合の処理フローを示すフローチャートである。
符号の説明
101…CPU、102…RAIDシステム、103…磁気ディスク装置、104…RAIDコントローラ、105…SCSIコントローラ(RAID側)、106…コマンド制御部、107…SCSIコントローラ(磁気ディスク装置側)、108…ディスクコントローラ、109…ウォッチドッグタイマー、110…エラー情報テーブル、201…コマンド実行制御部、202…リクエスト競合部、203…データスキャン制御部、204…データバッファ、205…読み出しヘッド、206…磁気ディスク(記録媒体)、207…書き込みヘッド、208…エラー検出/リトライ制御部、209…コマンド応答制御部。

Claims (4)

  1. ディスク制御装置を介して接続された上位装置からの処理要求に基づいて、記録媒体に対してデータの読み書き処理を行い、読み出したデータのデータエラーに対し自動修復処理を行うディスクコントローラを有する磁気ディスク装置であって、
    前記磁気ディスク装置のエラー情報を格納するエラー情報テーブルを備え、
    前記ディスクコントローラは、前記データエラーが発生した際に、前記エラー情報テーブルに格納されているエラー情報を読み出し、前記エラー情報に基づいて、過去のデータエラーとの連続性から前記データエラーが連続的に発生している連続エラーであるかを判断し、前記連続エラーであると判断した場合に、前記上位装置へハードエラーとしてエラー状態を報告することを特徴とする磁気ディスク装置。
  2. 請求項1記載の磁気ディスク装置において、
    前記ディスクコントローラは、前記エラー情報に基づいて、前記データエラーが前記連続エラーでないと判断した場合は、前記上位装置へ前記データエラーとしてエラー状態を報告することを特徴とする磁気ディスク装置。
  3. 請求項1または2記載の磁気ディスク装置において、
    前記ディスクコントローラに障害が発生し、前記ディスクコントローラがハングアップした際に、前記ディスク制御装置で発行されるリセット信号を起点に起動するウォッチドッグタイマーを備え、
    前記ウォッチドッグタイマーは、カウント値が予め設定された既定値となった際に、前記ディスクコントローラに対して、リブート処理の割り込み信号を出力することを特徴とする磁気ディスク装置。
  4. 請求項3記載の磁気ディスク装置において、
    前記ディスクコントローラは、前記割り込み信号により、前記リブート処理を行った後、前記上位装置へ前記リブート処理を行ったとしてエラー状態を報告することを特徴とする磁気ディスク装置。
JP2008180417A 2008-07-10 2008-07-10 磁気ディスク装置 Pending JP2010020840A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008180417A JP2010020840A (ja) 2008-07-10 2008-07-10 磁気ディスク装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008180417A JP2010020840A (ja) 2008-07-10 2008-07-10 磁気ディスク装置

Publications (1)

Publication Number Publication Date
JP2010020840A true JP2010020840A (ja) 2010-01-28

Family

ID=41705573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008180417A Pending JP2010020840A (ja) 2008-07-10 2008-07-10 磁気ディスク装置

Country Status (1)

Country Link
JP (1) JP2010020840A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048654A (ja) * 2010-08-30 2012-03-08 Nec Corp ディスクアレイ制御装置、ディスクアレイ制御方法及びディスクアレイ制御プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048654A (ja) * 2010-08-30 2012-03-08 Nec Corp ディスクアレイ制御装置、ディスクアレイ制御方法及びディスクアレイ制御プログラム

Similar Documents

Publication Publication Date Title
JP4886209B2 (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
US6442711B1 (en) System and method for avoiding storage failures in a storage array system
JP5078235B2 (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
US7809979B2 (en) Storage control apparatus and method
JP5887757B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
EP0784272A1 (en) Input/output controller
EP0772127A1 (en) Controller failure recovery in an external storage
US20050229033A1 (en) Disk array controller and information processing apparatus
US20060136777A1 (en) Unit, method and program for detecting imprecise data
KR20020025759A (ko) 디스크 어레이 장치, 그 장치에 대한 에러 제어 방법, 및그 방법에 대한 제어 프로그램
US20150378858A1 (en) Storage system and memory device fault recovery method
US20060015769A1 (en) Program, method and apparatus for disk array control
US9251016B2 (en) Storage system, storage control method, and storage control program
JP4984613B2 (ja) Raid装置の制御方法、raid装置、およびraid装置の制御プログラム
JP4203034B2 (ja) アレイコントローラ、メディアエラー修復方法及びプログラム
US20170090778A1 (en) Storage apparatus and control device
US7757118B2 (en) Method and system for detecting and recovering failure command
JP2010020840A (ja) 磁気ディスク装置
JP5217452B2 (ja) 情報処理装置及びシステム、並びに、記憶領域管理方法及びプログラム
JP4143040B2 (ja) ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム
JP2019125109A (ja) ストレージ装置、ストレージシステム、及びプログラム
JPH07182250A (ja) 磁気ディスクの自動交代処理方式
US20130166973A1 (en) Storage-medium diagnosis device, storage-medium diagnosis method
JPH10275060A (ja) アレイディスク制御装置
JP4844736B2 (ja) ディスクアレイシステムのデータ同期方法及びコンピュータプログラム