JP4012420B2 - 磁気ディスク装置及びディスク制御装置 - Google Patents
磁気ディスク装置及びディスク制御装置 Download PDFInfo
- Publication number
- JP4012420B2 JP4012420B2 JP2002066299A JP2002066299A JP4012420B2 JP 4012420 B2 JP4012420 B2 JP 4012420B2 JP 2002066299 A JP2002066299 A JP 2002066299A JP 2002066299 A JP2002066299 A JP 2002066299A JP 4012420 B2 JP4012420 B2 JP 4012420B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- magnetic disk
- write
- disk device
- magnetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/18—Error detection or correction; Testing, e.g. of drop-outs
- G11B20/1883—Methods for assignment of alternate areas for defective areas
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B19/00—Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
- G11B19/02—Control of operating function, e.g. switching from recording to reproducing
- G11B19/04—Arrangements for preventing, inhibiting, or warning against double recording on the same blank or against other recording or reproducing malfunctions
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/36—Monitoring, i.e. supervising the progress of recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/40—Combinations of multiple record carriers
- G11B2220/41—Flat as opposed to hierarchical combination, e.g. library of tapes or discs, CD changer, or groups of record carriers that together store one title
- G11B2220/415—Redundant array of inexpensive disks [RAID] systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Digital Magnetic Recording (AREA)
Description
【発明の属する技術分野】
本発明は、後発的に生じる磁気ディスク装置の特殊な書き込み障害の対策技術に係り、特に、磁気記録媒体にデータが書き込まれず、かつ、データが書き込まれなかったことを磁気ディスク装置自身が検出できないという障害の対策技術に関する。
【0002】
【従来の技術】
特開平5−41041「磁気ディスクライト・リード診断方式」に有るように、磁気ディスク装置にデータを書き込んだのち読み出してもとのデータと照合することによって、磁気ディスク装置の正常性を診断し検証する方法があった。
【0003】
また、複数の磁気ディスク装置を組合わせて冗長構成とすることにより、磁気ディスク装置個々の有する信頼性よりも、装置全体としての可用性を格段に高めることのできる外部記憶装置として、RAID装置が知られている("A Case for Redundant Arrays of Inexpensive Disks(RAID)"、 Patterson et al、Proc. ACM SIGMOD、June 1988)。
【0004】
【発明が解決しようとする課題】
記録と再生のためのそれぞれの専用磁気ヘッドを有する複合型磁気ヘッドを用いて、高記録密度を達成した磁気ディスク装置が主流となっている。従来は、記録再生用に1つのインダクティブヘッドを兼用していたため、異常があれば再生の際に早期に発見できた。しかし、複合型磁気ヘッドでは再生ヘッドの異常は早期に発見できても、記録ヘッドの異常は、発見が困難であった。一般に、記録ヘッドは信頼性が高く、異常の発生は稀であるが、万一の異常発生の場合であっても、記録の信頼性を確保する必要がある。
【0005】
実際には磁気記録媒体面に情報が格納されていないにもかかわらず、その磁気ディスク装置自身が障害の信号を発しないという稀で特殊な障害(以下、書込不可・不通知障害という。)が発生した場合に、磁気記録媒体には、書き込み前のデータが残る。そして、当該領域に対して読み出しが行われた場合には、磁気ディスク装置自身は、異常を意識・検出できず、残存するデータを読み出し、中央処理装置その他の上位装置に転送することとなる。従って、このような特殊な障害は、RAID装置の構成であっても排除できない。つまり、書込不可・不通知障害により失われたデータは、RAID装置構成であっても回復できないことを意味している。
【0006】
より具体的には、RAID技術におけるRAIDのクラス4、クラス5の構成では、情報を書き込む際の冗長データ(パリティ)生成手段として、更新前データ、新データ及び更新前パリティから、新パリティを生成する。
【0007】
新パリティ生成処理の基礎データとなる更新前データ及び更新前パリティにおいて、書込不可・不通知障害が発生した場合には、生成される新パリティは不正なものとなる。従って、RAID装置が、この段階で障害発生を検出し、障害のある磁気ディスク装置のデータを、他の正常な磁気ディスク装置から生成しようとすると、不正なデータを生成してしまうことになる。
【0008】
本願の発明者らは、磁気ディスク装置自身を診断する契機として書込み動作実行毎に診断する方法と、一定時間間隔で診断する方法を検討した。
【0009】
前者では、書込不可・不通知障害が発生した時点で障害を検知できるが、診断のための処理時間が必要となる。具体的には、通常の磁気ディスク装置は、書込済みのデータを読出すためには、最低、磁気ディスク媒体の1回分の回転待ち時間が必要となる。媒体の回転数が10000rpmの磁気ディスク装置の場合で、最短で6msの待ち時間の増加、書込確認処理時間の増加となる。
【0010】
後者では、書込み動作実行毎の書込確認処理時間の増加は防止できる。しかし磁気ディスク装置に対する、ある診断と次の診断との間に、書込不可・不通知障害が発生した場合には、これに起因するデータ(残存する旧データ)を、上位装置に送出してしまうという問題がある。
【0011】
本発明は、上述の特殊な障害の対策を目的とするものであって、書込不可・不通知障害が発生した場合に、書き込み不可が生じた領域を特定することにより、外部記憶装置が、バックアップデータ又はジャーナルデータから、書き込み不可となったデータを回復する。
【0012】
本発明の他の目的は、書き込み処理を含む所定の入出力処理時間の増加を抑えながら、書込不可・不通知障害の検出技術を提供することにある。
【0013】
【課題を解決するための手段】
定期的又は不定期に、磁気ヘッド診断を実施して、書き込み障害の発生を検知する。書き込み対象となった領域の履歴を管理し、書き込み不可障害が発生した領域を特定する。RAID5の冗長性を用いて、書き込み不可障害の部分のデータを回復する。
【0014】
データを読み出す際に、読み出し対象が正常な書き込み機能によって磁気記録媒体上に書き込まれたか否かを確認する手段を設ける。書き込み不可障害により旧データが上位装置へ送出されることを防止する。
【0015】
本発明によれば、書き込み障害検出のための処理時間を増加させることなく、書き込み不可障害に対応できる効果がある。
【0016】
より具体的には、1)実際に、磁気記録媒体にデータを書き込み、その書き込んだデータを読み出して、書き込む前の元のデータと照合することによって、書込不可の障害発生を検出する機能と、2)記憶領域上で書込不可が発生した障害領域を特定する機能とを磁気ディスク装置に持たせる。
【0017】
3)記録媒体上に診断に用いられる領域を確保し、定期的に診断領域に磁気ヘッドを位置付け、診断領域に診断データを書き込んだ後、そのデータを読み出して診断データと照合することにより、磁気ヘッドを検査する磁気ヘッド検査手段を有する。
【0018】
磁気ヘッド検査手段は、各磁気ヘッド毎に診断データを書き込むための領域(検査領域)を割当ててもよい。この場合において各磁気ヘッド毎の検査領域を、磁気記録媒体上で、複数の磁気ヘッドの切り替え処理分ずらして配置することにより、磁気記録媒体が1回転すれば、複数の磁気ヘッドの読み書きが行なえるようにしてもよい。
【0019】
磁気ヘッド検査手段は、診断データを書き込むための領域を割当て、診断データを書き込み後、読み出し、磁気記録媒体に欠陥がないことを確認する機能を有してもよい。
【0020】
4)上位装置から書き込み要求が発行された書き込み要求領域を記憶する書き込み領域管理手段を磁気ディスク装置に備える。書き込み領域管理手段は、記憶した書き込み要求領域数が、規定値を超えた場合に磁気ヘッドの検査を実行し、全ての磁気ヘッドが正常であった場合には、前記書き込み領域管理手段により登録した書き込み領域をクリアし、いずれかの磁気ヘッドについて障害を検出したときには、上位装置からの全ての読み出し要求、書き込み要求に対して障害を報告してもよい。
【0021】
さらに書き込み領域管理手段は、定期的に、前記磁気ヘッド検査手段に前記磁気ヘッドの書き込み機能が正常に動作しているか否かの検査を実行させ、全ての前記磁気ヘッドが正常であったときには、前記書き込み領域管理手段が記憶している前記書き込み要求領域をクリアし、いずれかの前記磁気ヘッドについて障害を検出したときには、前記上位装置からの前記書き込み要求又は前記読み出し要求に対して障害を報告するようにしても良い。
【0022】
また、上記1)の機能、又は、3)の手段を有する磁気ディスク装置により構成したRAID装置において、RAID装置のディスク制御装置は、6)ある磁気ディスク装置から書込不可の障害発生が報告されたされた場合に、その報告に係る磁気ディスク装置(障害のある磁気ディスク装置)を除く、残りの磁気ディスク装置から、障害のある磁気ディスク装置のデータを再生する手段と、7)前記データを再生する手段により再生したデータと、障害のある磁気ディスク装置が格納しているデータとを比較する手段と、8)前記比較手段により不一致となった領域を、書込不可領域として表示する手段を備える。これら手段により、書込不可の障害が発生した場合においても、書込不可となった領域を特定することを特徴とする。
【0023】
さらに、上記諸機能又は手段を有する磁気ディスク装置により構成したRAID装置であって、スペア磁気ディスク装置を備えたものにおいて、RAID装置のディスク制御装置は、9)磁気ディスク装置から書込不可の障害発生が報告されたされた場合に、その報告に係る磁気ディスク装置(障害のある磁気ディスク装置)を除く、残りの磁気ディスク装置から、障害のある磁気ディスク装置のデータを再生し前記スペア磁気ディスク装置に格納するデータ回復手段と、10)前記回復手段により回復されたデータを格納するスペア磁気ディスク装置と、障害のある磁気ディスク装置のデータとを比較する手段と、11)前記比較手段により不一致となった領域を、書込不可領域として表示する手段を備える。これら手段により、書き込み不可障害が発生した場合に書き込み不可となった領域を、スペア磁気ディスク装置との対比において、特定することを特徴とする。
【0024】
更に、12)書込不可障害が発生した際に不正データ(新規データが書込不可となったため、再生されてしまう残存する旧データ)を上位装置に送出しない機能を磁気ディスク装置に持たせる。
【0025】
つまり、磁気記録媒体上に診断に用いられる領域を確保し、この領域に診断データを書き込んだ後、そのデータを読み出して診断データと照合することにより、磁気ヘッドを検査する磁気ヘッド検査手段と、上位装置から前記情報の書き込み要求が発行された場合に、当該情報を書き込む書き込み要求領域を記憶する書き込み領域管理手段と、上位装置から前記情報の読み出し要求が発行された場合に、当該情報を読み出す読み出し要求領域の一部又は全部が、前記書き込み管理手段が記憶している前記書き込み要求領域と一致するか否かを判定する読み出し領域判定手段と、前記読み出し要求領域の一部又は全部が前記読み出し判定手段が記憶している書き込み要求領域と一致していた場合に、前記磁気ヘッドの書き込み機能が正常に動作しているか否かを検査する磁気ヘッド検査手段とを、磁気ディスク装置に備える。これら手段により、書込不可の障害により不正となるデータを、上位装置に送出することを防止できる。
【0026】
【発明の実施の形態】
図1に、本発明の第1の実施の形態を示す。
【0027】
磁気ディスク装置1000は、磁気記録媒体1010、磁気記録媒体を回転駆動するスピンドルモータ1020、磁気記録媒体上にデータを読み書きするための磁気ヘッド1030、磁気ヘッドを制御する磁気ヘッド制御部1040、上位装置とのインタフェースを制御(情報のやり取りを制御)するインタフェース制御部1080、磁気ヘッド制御部及びインタフェース制御部間に設けられ、上位装置と磁気記録媒体との間の情報の書き込み又は読み出しを制御することにより上位装置からの入出力要求を実行するリード/ライト制御部1050、これら制御部を有機的に連結し機能させるための制御プロセッサ1060、制御プロセッサ1060上で動作するプログラム、パラメータその他の制御情報を格納する制御メモリ1070から構成されている。
【0028】
本磁気ディスク装置1000には、磁気ヘッド1030の正常性を検査する磁気ヘッド検査手段1100と、上位装置からの書き込み要求に応答し、書き込み要求領域を記録する書き込み領域管理手段1110がプログラムされている。
【0029】
図2に、書き込み領域管理手段1110の処理の流れを示す。
【0030】
管理手段1110は、上位装置からの書き込み要求が発行された場合に動作する。処理2010では、上位装置からの書き込み対象領域の物理トラックアドレスを算出する。これは、本実施の形態の書き込み領域管理単位が物理トラック単位としているためである。
【0031】
処理2020では、処理2010により算出した上位装置からの書き込み要求領域が既に書き込み管理テーブル(以下、適宜、テーブルをTBLと略記する。)に登録済みかを確認する。この結果、既に書き込み領域管理TBLに登録済みであると判断された場合は、当該上位装置からの要求に対する書き込み処理を実行する。
【0032】
書き込み領域管理TBLに登録されていないと判断された場合には、処理2030にて当該書き込み領域管理TBLに空きエントリが存在するかを判定する。この判定の結果、書き込み領域管理TBLに空きエントリが存在しないと判断された場合には、磁気ヘッド診断手段1100を実施し磁気ディスク装置1000のデータ書き込み機構が正常に動作しているかを確認(処理2040)する。
【0033】
磁気ヘッド手段1100は、磁気ディスク装置1000に搭載されている全ての磁気ヘッド1030にて実際に磁気記録媒体にデータの書き込み検査を実施し、全ての磁気ヘッド1030が正常であると確認された場合には、書き込み領域管理TBLに登録されている上位装置からの書き込み要求は正常に行われたと判断し、書き込み領域管理TBLをクリアする。つまり、処理2040と処理2050により磁気ヘッド診断手段1100を実行し、書き込み領域管理TBLの空きエントリを確保する。
【0034】
処理2030にて書き込み領域管理TBLに空きエントリが存在した場合、処理2060にて上位装置からの書き込み要求領域を書き込み領域管理TBLに登録し書き込み処理を実施する。
【0035】
処理2030にて書き込み領域管理TBLに空きエントリが存在しなかった場合には、磁気ヘッド診断手段1100を実行し書き込み領域管理TBLの空きエントリを確保したのち、処理2060にて上位装置からの書き込み要求領域を書き込み領域管理TBLに登録し書き込み処理を実施する。
【0036】
磁気ヘッド診断1100の結果、書き込み不可障害が発生していると処理2050で判断された場合には、当該上位装置からの書き込み要求に対して、書き込み不可障害を報告し(処理2070)、書き込み処理を終了する。
【0037】
図3を用いて、磁気ヘッド診断手段1100の動作を説明する。
【0038】
診断手段1100は、書き込み領域管理手段1110によって又は定期的に、起動される。診断手段1100は、磁気ディスク装置1000の書き込み機構が正常に機能しているかを診断する機能で、磁気ディスク装置1000に搭載する全ての磁気ヘッド1030において、磁気記録媒体1010上の診断領域に診断データを書き込んだ後、その診断領域のデータを読み出し、正常に診断データが磁気記録媒体1010上に書き込まれたかを検査する(処理3020〜処理3060)。
【0039】
かかる検査の結果、正しく診断データが書き込まれていない、即ち、書込不可障害が発生していると判断された場合には、処理3090にて書き込み不可障害フラグを設定する。この書き込み不可障害フラグが設定されている場合には、磁気ディスク装置1000に対する全ての入出力要求に対して書き込み不可障害を報告する。
【0040】
検査の結果、全ての磁気ヘッド1030にて正しく診断データが書き込まれていると判断された場合には、処理3100にて書き込み領域管理TBLをクリアする。
【0041】
尚、診断データは、磁気ヘッド診断を実施する度にユニークな診断データを用いるように制御されている。更に本実施の形態では、磁気ヘッド診断方法として、診断データを書き込んだ後に読み出す方法を示したが、診断領域に磁気記録媒体の欠陥が発生する可能性があるため、診断領域のデータを読み出し、その後、診断データを書き込み、読み出す方法でも良い。
【0042】
加えて、磁気ヘッド診断処理時間を短縮するために、各磁気ヘッド毎の診断領域を図4のように磁気記録媒体上、磁気ヘッド切り替え処理時間分ずらして配置する。これにより、磁気記録媒体が1回転する間に複数の磁気ヘッドにて診断領域の書き込み、又は、読み出しを実施できるため、磁気ヘッド診断処理時間を短縮することができる。
【0043】
書き込み不可障害が発生した場合には、上位装置からの全ての入出力要求に対して書き込み不可障害を報告する(2070、図2)。上位装置は、本障害報告を契機に書き込み領域管理TBLの内容を磁気ディスク装置1000から読み出す。なお、磁気ディスク装置1000が上位装置に報告する書き込み不可領域は、上位装置が認識可能な論理アドレスに変換されて報告される。
【0044】
以上のように、本発明の第1の実施の形態では、磁気ディスク装置1000において書き込み不可障害が発生した場合に、上位装置に書き込み不可障害が発生したことを通知すると伴に、磁気記録媒体1010に書き込みが行われなかった領域を上位装置に報告できる。
【0045】
より具体的には図5に示すようである。磁気ヘッド診断手段1100が実行される間に、書き込みが行われた領域が書き込み領域管理TBLに、領域B、領域C、...のように格納されて行く。ここで後発的に、磁気ヘッド診断手段1100の実行により、書き込み不可障害が検出されたときには、書き込み管理TBLに登録されている領域が、書き込み不可となっている可能性がある。
【0046】
したがって、書き込み不可障害の回復手順としては、処理4010に示すように、書き込み不可となった可能性がある領域を、障害の検出された障害磁気ディスク装置から読み出し、障害磁気ディスクの代替となる正常な磁気ディスク装置にコピーする(処理4020)。その後、書き込みが行えなかった領域のデータを、ジャーナルデータその他の冗長データ部分から回復する(処理4030)。これにより障害状態からの回復ができる。
【0047】
図6を用いて、第2の実施の形態におけるシステム構成図について説明する。
【0048】
ディスク制御装置5000は、配下に磁気ディスク装置5010を接続し、上位装置(ホスト)である中央処理装置5020に接続される。
【0049】
磁気ディスク装置5010は、第1の実施の形態で示した磁気ディスク装置1000と同じであっても良いが、書き込み領域管理手段1110を備えない磁気ディスク装置であってもかまわない。
【0050】
ディスク制御装置5000は、中央処理装置5020とのインタフェースを制御するチャネルI/F制御部5030、磁気ディスク装置5010とのインタフェースを制御するディスク制御部5040を備えている。これらの制御部は、データ転送制御回路その他の制御回路と、制御回路を制御する制御プロセッサ、及び、制御プロセッサで動作するプログラムを格納するメモリ(いずれも図示せず)から構成されている。
【0051】
ディスク制御装置5000は、中央処理装置5020からの書き込みデータや、磁気ディスク装置5010からの読み出しデータを格納するキャッシュメモリ5050を備え、また各制御部間の制御情報を格納するための制御メモリ5060、及び、保守等を実施するためのサービスプロセッサ5070を備えている。
【0052】
ディスク制御部5040は、配下の複数の磁気ディスク装置5010をRAID5構成とする機能を有している。RAID5とは、中央処理装置から転送されたデータから冗長データ(本実施の形態での冗長データはパリティである。)を生成し、パリティが一つの磁気ディスク装置に固定しないように各磁気ディスク装置5010に循環的に配置する構成をいう。
【0053】
尚、本実施の形態では、スペア磁気ディスク装置5015を備えている。スペア磁気ディスク装置5015は、RAID5を構成する磁気ディスク装置の1つが障害となった場合に、代替する磁気ディスク装置である。
【0054】
スペア磁気ディスク装置5015は、1つの磁気ディスク装置に障害が発生した場合に、他の正常な磁気ディスク装置5010のデータから、その障害磁気ディスク装置に格納されたデータを回復・生成させるデータ生成手段5100と、複数の磁気ディスク装置から読み出したデータの排他的論理和(XOR:Exclusive OR)を行い、結果がゼロであるか否かを判定するデータ比較手段5110と機能的に連携している。
【0055】
サービスプロセッサ5070は、データ比較手段5110により、排他的論理和の結果がゼロでなかった領域を表示する、書き込み不可領域表示手段5120を備えている。
【0056】
磁気ディスク装置5010の1台の磁気ディスク装置において書き込み不可障害が発生した場合の動作について説明する。
【0057】
書き込み不可障害は、第1の実施の形態で説明した磁気ヘッド診断手段1100によって検出され報告される。書き込み不可障害の発生の報告を受けたディスク制御部5040は、データ比較手段5110により、書き込み不可となった領域を特定する。具体的には、前述したRAID5構成の場合、
Data1 XOR Data2 XOR Data3 = Parity1
となっている。この状態でData2に対してData2aの書き込み要求が発行された際の新パリティは、
Data1 XOR Data2a XOR Data3 = Data2 XOR Data2a XOR Parity1 = Parity1a
となる。この状態で、Data2aを磁気ディスク装置へ書き込む際に書き込み不可障害が発生すると記録媒体上には本来Data2aが書き込まれなければならないがData2のままとなる。したがって、データ比較手段によりRAID5を構成する各磁気ディスク装置からデータを読み出して排他的論理をとると
Data1 XOR Data2 XOR Data3 XOR Parity1a=
Data1 XOR Data2 XOR Data3 XOR Data1 XOR Data2a XOR Data3 = Data2 XOR Data2a
となり結果がゼロとならず、書き込み不可障害が発生した領域を特定することができる。
【0058】
データ比較手段5110により摘出した書き込み不可障害発生領域を、書き込み不可領域表示手段5120により、サービスプロセッサ5070に表示する。その後、障害が報告された磁気ディスク装置に格納されていたデータを生成するデータ生成手段5100により、生成したデータを、スペア磁気ディスク装置5015に格納する。また、サービスプロセッサ5070に表示された、書き込み不可領域のデータを、ジャーナルデータその他のデータから回復することにより、磁気ディスク装置5010で発生した書き込み不可障害を全て回復・生成することができる。
【0059】
次に第3の実施の形態について説明する。このシステム構成図は、第2の実施の形態とほぼ同じで図6のようであるが、第2の実施の形態では、データ生成手段5100がディスク制御装置5000に位置しているが、第3の実施の形態では、磁気ディスク装置5010に位置している。
【0060】
本実施の形態では、書き込み不可障害が磁気ディスク装置5010から報告された場合に、障害発生磁気ディスク装置のデータを、障害磁気ディスク装置が有するデータ生成手段5100により、スペア磁気ディスク装置5015に回復する。その後、データ比較手段5110により、スペア磁気ディスク装置5015と障害磁気ディスク装置5010の内容を比較することにより、書き込み不可障害発生領域を特定する。
【0061】
具体的には、書き込み不可障害が発生した領域を、データ生成手段5100によりデータ生成を行うと、
Data1 XOR Data3 XOR Parity1a =Data2a
となり、スペア磁気ディスク装置5015上にはData2aが回復される。
【0062】
一方、障害磁気ディスク装置上には書き込み不可障害発生前のデータData2が格納されているため、これらデータの排他的論理和をとってもゼロとならず、データ比較手段5110により、書き込み不可領域を特定することができる。
【0063】
第1から第3の実施の形態では、書き込み不可障害が発生した場合に、書き込み不可領域を特定する機能を有していた。これらの実施の形態では、書き込み不可障害が発生したデータ、即ち、書き込み前の旧データを書き込み後のデータとして上位装置に送出してしまうため、不正なデータに基づいて2次データを作成してしまう可能性がある。このため、次に示す第4の実施の形態では、書き込み不可障害が発生した場合においても、不正なデータを上位装置に送出しない機能を達成している。
【0064】
図7に、本発明の第4の実施の形態を示す。第1の実施の形態で示した磁気ディスク装置1000に、読み出しチェック手段6010を追加したものである。図8に、読み出し領域チェック手段6010の処理の流れを示す。
【0065】
読み出し領域チェック手段6010は、上位装置からの読み出し要求に応答し、処理7010(図8)により当該読み出し要求の物理トラックアドレスを算出する。次の処理7020では、処理7010により算出した上位装置からの読み出し要求領域の一部又は全部が、書き込み領域管理TBLに登録されているか否かを確認する。この結果、読み出し要求領域の一部又は全部が書き込み領域管理TBLに登録されていた場合は、磁気ヘッド診断手段1100を実行する(処理7030)。全ての磁気ヘッドの書き込み機能が正常に動作していると判断された場合には(YES、処理7040)、読み出し処理を実行する。
【0066】
一方、処理7020にて、読み出し対象領域が書き込み領域管理TBLに登録されていないと判断された場合には、そのまま読み出し処理を実行する。さらに、処理7030により磁気ヘッド診断手段により書き込み不可障害が発生していると判断された場合には、処理7050にて上位装置に書き込み不可障害の発生を報告し処理を終了する。
【0067】
図9を用いて、第4の実施の形態の動作について説明する。
【0068】
領域Aへの書き込み実施後、定期起動による磁気ヘッド診断手段1100が動作する。この磁気ヘッド診断手段1100により、磁気ディスク装置1000に搭載される全ての磁気ヘッドにおける書き込み機能が正常に動作していることが確認できると、書き込み領域管理TBLをクリアする。
【0069】
その後、現実には書き込み不可障害が発生していることに、未だ、磁気ディスク装置1000や、ディスク制御装置5000は気がついていない。すると、例えば、領域B、領域C、.....に対する書き込み要求は達成されず、現実には磁気記録媒体1010上に書かれていない。しかし書き込み領域管理TBLに、領域Bと領域Cがアクセスされたことを示す履歴情報が登録されている状態となる。つまり、現実の書き込みが正常でも異常でも、領域B、領域C、....にアクセスがあったことは、書き込み領域管理TBLに登録される。
【0070】
この後、領域Aに対する読み出し要求が行われると、読み出し領域チェック手段6010が動作することにより、読み出し対象となった領域Aは、磁気ヘッド診断手段1100により磁気ヘッドが正常であると判断された時点より前に、磁気記録媒体1010に書き込まれた領域であることが判明する。すなわち領域Aの書き込み処理を実施した磁気ヘッドは、書き込み機能が正常に動作していた時期に用いられたこととなる。このため、磁気記録媒体1010上のデータは、正しいデータであるので、そのまま読み出し処理を実行する。
【0071】
一方、領域B、領域Cへのアクセスについては、磁気ヘッド診断手段1100を実行して異常がないことを確認した後のアクセスである。磁気ヘッドに新たに異常が生じている可能性を排除できていない状態にある。従って、磁気ヘッド診断手段1100を実行して磁気ヘッドが正常か否かを確認する。この結果、書き込み不可障害が発生していることを検知した場合には、領域Cに対する読み出し要求に対して、書き込み不可障害を報告する。
【0072】
このようにして、磁気ディスク装置1000において書き込み不可障害が発生した場合には、不正なデータは上位装置に送出しない。
【0073】
また、読み出し要求に伴う読み出し領域チェック手段6010の実施、書き込み要求に伴う書き込み領域管理手段1110の実施は、磁気ヘッドのシーク動作と同時期に行われるため、磁気ディスク装置1000の入出力処理時間の増加にはならない。
【0074】
一方、磁気ヘッド診断1100の実施には、診断領域への所定のデータの書き込み、読み出しを行う必要から、最低、磁気記録媒体が2回転するに要する処理時間が費やされるので、いかなる契機で、磁気ヘッドの診断を実施するかが問題となる。
【0075】
磁気ヘッドの診断は、1)定期的に行われる場合と、2)読み出そうとするときに、読み出し対象領域が、書き込み領域管理TBLに登録されていた場合に、それぞれ行われる。
【0076】
前者では、起動周期を数秒単位とすることで、磁気ヘッドの診断処理に要する時間を隠蔽できる。後者では、通常の入出力負荷環境では、読み出し対象領域が、書き込み領域管理TBLに登録されている確率が低いため問題とならない。但し、書き込み直後に読み出しが行われるようなアクセスパターンにおいては、頻繁に磁気ヘッド診断が動作する可能性があるが、第2の実施の形態で示したような、キャッシュ付きディスク制御装置に第4の実施の形態の磁気ディスク装置を接続することにより、前述のアクセスパターンの場合であっても、ディスク制御装置上のキャッシュメモリに読み出し対象データが存在する確率が高く、実質的に磁気ディスク装置への読み出し要求が発行されないため、更に磁気ヘッド診断処理に要する時間(オーバヘッド)を少なくすることができる。
【0077】
【発明の効果】
本発明によれば、磁気記録媒体にデータが書き込めない障害であって、かつ、その障害の発生を検出できないものが磁気ディスク装置において発生した場合においても、書き込み不可障害が発生した領域を特定することができ、障害回復を確実に行うことができる。
【0078】
更に、書き込み不可障害が発生しても不正なデータの送出を抑えることができ、かつ、これらの措置を磁気ディスク装置やこれを用いたシステムの性能を低下させることなく、実現できる効果がある。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態である磁気ディスク装置1000の概略構成を示す図である。
【図2】図1の書き込み領域管理手段1110の処理を示すフローチャートである。
【図3】図1の磁気ヘッド診断手段1100の処理を示すフローチャートである。
【図4】磁気ヘッド診断手段1100の処理の高速化を行うための診断領域の配置を示す図である。
【図5】第1の実施の形態における書き込み不可障害の検出と障害回復の手順を示す図である。
【図6】第2の実施の形態におけるシステム構成を示す概略図である。
【図7】第4の実施の形態である磁気ディスク装置1000の概略構成を示す図である。
【図8】図7の読み出し領域チェック手段6010の処理を示すフローチャートである。
【図9】第4の実施の形態における書き込み不可障害の検出と障害発生の報告を説明するための図である。
【符号の説明】
1000…磁気ディスク装置、 1010…磁気記録媒体、
1020…スピンドルモータ、 1030…磁気ヘッド、
1060…制御プロセッサ、 1070…制御メモリ、
5000…ディスク制御装置、 5010…磁気ディスク装置、
5040…ディスク制御部、 5050…キャッシュメモリ。
Claims (2)
- 定期的にデータを磁気記録媒体に書き込んだ後、読み出して元のデータと照合することによって、磁気ヘッドの書き込み機能が正常に動作しているか否かを診断する磁気ヘッド診断機能を有する磁気ディスク装置を配下に複数接続し、中央処理装置から転送されてきたデータについて冗長データを生成する第1の機能と、前記中央処理装置から転送されてきた前記データ及び生成した前記冗長データを複数の前記磁気ディスク装置に格納する第2の機能とを有するディスク制御装置において、
前記磁気ヘッド診断機能によって、いずれかの前記磁気ディスク装置の異常が検出されたときに、異常が検出された前記磁気ディスク装置以外の残りの前記磁気ディスク装置に格納されているデータから、異常が検出された前記磁気ディスク装置に格納されたデータを生成するデータ生成手段と、
前記データ生成手段により生成された前記データと、異常が検出された前記磁気ディスク装置上のデータとを比較する比較手段と、
前記比較手段により不一致となったデータの格納位置を、書き込み不可領域として表示する表示手段と
を備え、
前記磁気ヘッド診断機能を有する磁気ディスク装置は、
上位装置から前記データの書き込み要求が発行された場合に、予め格納された当該データを書き込む書き込み要求領域を記憶する書込み領域管理テーブルを読み出し、前記書き込み要求のあったデータの領域が、前記書き込み領域管理テーブルに登録済みでない領域であって、前記書込み領域の数が規定値を超えた場合に、磁気ヘッドの書き込み機能が正常に動作しているか否かを診断すると共に、
前記書き込み不可領域の障害が発生した後に、前記中央処理装置からの読み出し要求に応答する場合には、全ての前記磁気ヘッドの書き込み機能が正常に動作しているか否かを判断し、全ての前記磁気ヘッドの書き込み機能が正常に動作していると判断されたときに、前記中央処理装置からの読み出し要求に応じたデータを読み出すことを特徴とするディスク制御装置。 - 請求項1記載のディスク制御装置において、
さらに配下にスペア磁気ディスク装置が接続され、
前記磁気ヘッド診断機能によって、いずれかの磁気ディスク装置の異常を検出したときには、異常が検出された前記磁気ディスク装置以外の残りの前記磁気ディスク装置に格納されているデータから、異常が検出された前記磁気ディスク装置に格納されたデータを生成し、当該生成したデータを前記スペア磁気ディスク装置に格納するデータ回復手段と、
前記データ回復手段により生成されて前記スペア磁気ディスク装置に格納された前記データと、異常が検出された前記磁気ディスク装置上のデータとを比較する比較手段とを備えることを特徴とするディスク制御装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002066299A JP4012420B2 (ja) | 2002-03-12 | 2002-03-12 | 磁気ディスク装置及びディスク制御装置 |
US10/382,804 US6970310B2 (en) | 2002-03-12 | 2003-03-06 | Disk control apparatus and its control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002066299A JP4012420B2 (ja) | 2002-03-12 | 2002-03-12 | 磁気ディスク装置及びディスク制御装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003263703A JP2003263703A (ja) | 2003-09-19 |
JP2003263703A5 JP2003263703A5 (ja) | 2005-09-02 |
JP4012420B2 true JP4012420B2 (ja) | 2007-11-21 |
Family
ID=28034893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002066299A Expired - Fee Related JP4012420B2 (ja) | 2002-03-12 | 2002-03-12 | 磁気ディスク装置及びディスク制御装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6970310B2 (ja) |
JP (1) | JP4012420B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4535665B2 (ja) * | 2002-05-20 | 2010-09-01 | 日本電気株式会社 | 情報記録装置及びその方法 |
JP2005353163A (ja) * | 2004-06-10 | 2005-12-22 | Sony Corp | 記録再生装置、記録制御方法、プログラム |
US7360112B2 (en) * | 2005-02-07 | 2008-04-15 | International Business Machines Corporation | Detection and recovery of dropped writes in storage devices |
US9047521B2 (en) | 2006-11-15 | 2015-06-02 | International Business Machines Corporation | Diagnosing a magnetic reader |
WO2008126298A1 (ja) * | 2007-03-30 | 2008-10-23 | Fujitsu Limited | 仮想ライブラリ制御プログラム、仮想ライブラリ装置および仮想ライブラリ制御方法 |
US7852596B2 (en) * | 2009-02-25 | 2010-12-14 | Western Digital Technologies, Inc. | Disk drive returning dummy data to a host when reading an unwritten data sector |
JP5268710B2 (ja) * | 2009-02-27 | 2013-08-21 | 株式会社東芝 | 半導体記憶装置 |
CN102520890B (zh) * | 2011-12-30 | 2014-10-22 | 北京天地云箱科技有限公司 | 基于gpu的rs-draid系统及存储设备数据控制方法 |
JP6287613B2 (ja) * | 2014-06-17 | 2018-03-07 | 富士通株式会社 | 制御装置、および診断制御プログラム |
CN106527983B (zh) * | 2016-11-02 | 2020-06-19 | 浙江宇视科技有限公司 | 一种数据存储方法以及磁盘阵列 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5109304A (en) | 1989-12-04 | 1992-04-28 | Maxtor Corporation | Method of apparatus for detecting defects in data apparatus such as magnetic storage apparatus |
JPH0541041A (ja) | 1991-08-05 | 1993-02-19 | Fujitsu Ltd | 磁気デイスクライト・リード診断方式 |
US5379417A (en) | 1991-11-25 | 1995-01-03 | Tandem Computers Incorporated | System and method for ensuring write data integrity in a redundant array data storage system |
US6347051B2 (en) | 1991-11-26 | 2002-02-12 | Hitachi, Ltd. | Storage device employing a flash memory |
US5581690A (en) | 1993-06-29 | 1996-12-03 | Digital Equipment Corporation | Method and apparatus for preventing the use of corrupt data in a multiple disk raid organized storage system |
JP2790134B1 (ja) | 1997-03-11 | 1998-08-27 | 日本電気株式会社 | ディスクアレイシステム |
JP3565687B2 (ja) | 1997-08-06 | 2004-09-15 | 沖電気工業株式会社 | 半導体記憶装置およびその制御方法 |
JP2001035096A (ja) | 1999-07-19 | 2001-02-09 | Hitachi Ltd | 書き込みデータのチェック方法及びこれを用いたデータ記憶装置 |
US6571310B1 (en) | 2000-04-20 | 2003-05-27 | International Business Machines Corporation | Method and apparatus for managing a heterogeneous data storage system |
WO2002027493A2 (en) * | 2000-09-28 | 2002-04-04 | Seagate Technology Llc | Enhanced short disc drive self test using historical logs |
-
2002
- 2002-03-12 JP JP2002066299A patent/JP4012420B2/ja not_active Expired - Fee Related
-
2003
- 2003-03-06 US US10/382,804 patent/US6970310B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20030174562A1 (en) | 2003-09-18 |
JP2003263703A (ja) | 2003-09-19 |
US6970310B2 (en) | 2005-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5822782A (en) | Methods and structure to maintain raid configuration information on disks of the array | |
JP5768587B2 (ja) | ストレージシステム、ストレージ制御装置およびストレージ制御方法 | |
US5878203A (en) | Recording device having alternative recording units operated in three different conditions depending on activities in maintaining diagnosis mechanism and recording sections | |
US7640452B2 (en) | Method for reconstructing data in case of two disk drives of RAID failure and system therefor | |
US5613088A (en) | Raid system including first and second read/write heads for each disk drive | |
US5835703A (en) | Apparatus and method for diagnosing disk drives in disk array device | |
JP2005322399A (ja) | 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法 | |
KR100770623B1 (ko) | 장해 검출 장치 및 장해 검출 방법 | |
KR100561495B1 (ko) | 자가치료를 위한 기계판독가능형 프로그램 기억 장치,디스크 드라이브 자가치료 방법 및 스토리지 시스템 | |
JP4012420B2 (ja) | 磁気ディスク装置及びディスク制御装置 | |
US7506224B2 (en) | Failure recovering method and recording apparatus | |
US7730370B2 (en) | Apparatus and method for disk read checking | |
JP4203034B2 (ja) | アレイコントローラ、メディアエラー修復方法及びプログラム | |
US7457990B2 (en) | Information processing apparatus and information processing recovery method | |
JP2006079219A (ja) | ディスクアレイ制御装置およびディスクアレイ制御方法 | |
JP3120753B2 (ja) | ディスクアレイ装置の障害復旧装置 | |
JP2868001B1 (ja) | ディスクアレイ装置制御方法およびディスクアレイ装置 | |
JP4143040B2 (ja) | ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム | |
JP2003263703A5 (ja) | ||
JPH07182250A (ja) | 磁気ディスクの自動交代処理方式 | |
JPH10275060A (ja) | アレイディスク制御装置 | |
JP2008084168A (ja) | 情報処理装置及びデータ修復方法 | |
JP4293648B2 (ja) | ディスク装置におけるデータ保護方法、ディスク装置、およびプログラムを記録したコンピュータに読み取り可能な記録媒体 | |
JP6966091B2 (ja) | ホットスペア制御装置、ホットスペア制御方法及びプログラム | |
JP2002123372A (ja) | キャッシュメモリ付きディスクアレイ装置及びそのエラー制御方法並びにその制御プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050301 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050301 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050301 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20060907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061005 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060908 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061023 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20061025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070302 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070907 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110914 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120914 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120914 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130914 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |