JP2006048789A - 磁気ディスク装置の故障予測方法及びこれを用いた磁気ディスク装置 - Google Patents

磁気ディスク装置の故障予測方法及びこれを用いた磁気ディスク装置 Download PDF

Info

Publication number
JP2006048789A
JP2006048789A JP2004225465A JP2004225465A JP2006048789A JP 2006048789 A JP2006048789 A JP 2006048789A JP 2004225465 A JP2004225465 A JP 2004225465A JP 2004225465 A JP2004225465 A JP 2004225465A JP 2006048789 A JP2006048789 A JP 2006048789A
Authority
JP
Japan
Prior art keywords
error
magnetic disk
index
error index
disk device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004225465A
Other languages
English (en)
Inventor
Toru Miyazaki
徹 宮崎
Akira Kojima
昭 小島
Takeshi Shikama
健 志鎌
Kunihiro Nunomura
邦弘 布村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HGST Netherlands BV
Original Assignee
Hitachi Global Storage Technologies Netherlands BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Global Storage Technologies Netherlands BV filed Critical Hitachi Global Storage Technologies Netherlands BV
Priority to JP2004225465A priority Critical patent/JP2006048789A/ja
Priority to US11/193,925 priority patent/US7369339B2/en
Priority to CN200510088506A priority patent/CN100583279C/zh
Publication of JP2006048789A publication Critical patent/JP2006048789A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • G11B19/04Arrangements for preventing, inhibiting, or warning against double recording on the same blank or against other recording or reproducing malfunctions
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1816Testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】磁気ディスク装置から上位装置に対して、故障する旨の警告を正確に送出する。
【解決手段】磁気ヘッド毎に、単位時間当たりのエラー指標を断続的、連続的に格納し、格納した複数のエラー指標を更新し新たな指標(以下、部分積分エラーレート)が、所定の条件を満たせば異常、擬似異常と診断し、上位装置へ報告する。部分積分エラーレートは一定数のエラー指標の組から、ビットエラー数の総和をアクセス数の総和で除して得る。新たな単位時間当たりのエラー指標の格納毎、監視対象の古いエラー指標を捨て、新しいエラー指標を追加し、一定数のエラー指標から、新たな部分積分エラーレートを算出する。部分積分エラーレートが、第2の所定閾値を越えて増加時は、装置異常の可能性が高く異常を上位装置に報告する。 部分積分エラーレートが第2の所定閾値を超えなければ、一時的増加であると判断、疑似異常を上位装置に報告する。
【選択図】 図3

Description

本発明は、磁気ディスク装置の診断方法に係り、特に、故障の予測機能を持つ磁気ディスク装置に関する。
24時間稼動を前提とした信頼性の高い磁気ディスク装置では、1日24時間稼動し、3年乃至5年間、無事故であることを保証するものが多い。実際の運用では、システムを年に1〜2回休止し、定期的な保守・点検が為されるのが通常である。
このような磁気ディスク装置は、個々の性能が均質であり、磁気ディスク装置の新規搭載又は保守・交換後は、数千時間を経てもビットエラー数その他のエラー現象は多くない。例えば、10ギガバイト分のデータをアクセスしても、数ビット以下のビットエラーが生じる程度である。
このため、従来技術では、一定期間、ビットエラー数その他のエラー指標を蓄積し、エラー指標の発生数がその期間内に所定の閾値を超えると上位装置に報告していた。また上位装置は予め設定された値、例えば、平均故障間隔MTBFと、その一定期間とを比較して、磁気ディスク装置の交換時期を操作者に示すことで、不具合発生の予想に代えていた。
しかし磁気ディスク装置が搭載される環境は千差万別であり、物理的には周囲温度の変化や外乱振動により、スピンドルモータやアクチュエータが異常となったり、装置内外の電磁的雑音により、磁気ヘッド自体や伝送回路系統が異常を来すこともある。かかる場合に、ある時間に集中してビットエラーが発生する。
前者の異常現象は磁気ディスク装置の故障の前兆として、無視できないにもかかわらず、従来技術では察知できなかった。
即ち、従来の診断方法では、所定の時間が経過するまでに発生したエラー指標の数をそれぞれ累積し、所定時間の経過時に、累積されたそれぞれのエラー数が所定の閾値を超えたか否かの判断を行い、超えた場合にのみ異常であると診断していた。所定時間として平均故障間隔(MTBF)が採用されていた。
このため所定時間が経過する途中で、一時的にスピンドルモータやアクチュエータの異常が生じてエラー指標のうち特定のものの数値が増加しても、所定時間経過までに累積されるエラー指標の数値全体に占める割合が僅かであるため、異常とは診断されなかった。つまり、磁気ディスク装置の性能が相当、劣化しないと交換されない状況にあった。
特開平6−214835では、周辺機器毎に、エラー要因毎に、エラーの発生回数をメモリに累積記録し、これを定期的に中央処理装置に送信することで、中央処理装置が、送信されたエラー情報と、予め保持している周辺機器毎の劣化特性、稼働時間等の要因に基づいて、永久故障発生の時期を予測する、としている。予測方法の詳細は不明である。
特開平7−248937では、装置の交換時又は前回の診断時からの使用時間を計測し、各装置毎に定められている、平均故障時間その他の規定時間以上を経過すると、自己診断プログラムを実行することで、不要な自己診断を抑制している。
特開2001-307435では、S/N比を劣化させてエラーレートを監視するというエラーテストを、転送データ量を累計し一定量毎に実施して、故障を予測する、としている。
特開平6−214835号 特開平7−248937号 特開2001−307435号
従来の磁気ディスク装置は、上位装置に対して、故障する旨の警告を正確に送出することが困難であった。
監視対象のエラー指標に対し、閾値を設定し、これを超えた場合に警告(報告)を発するという単純な診断では、誤報が頻出するか、逆に、故障を発見し損なう。
監視を頻繁に行えば、扱う情報量の増加により、磁気ディスク装置に負担が掛かり過ぎる。他方、磁気ディスク装置の転送データ量を長期間にわたり累計して自己診断を行うと、故障の予知をし損なう。
磁気ディスク装置の転送データ量を累計し、一定の転送データ量毎に、自己診断を行う従来技術では、転送データのトラフィックが時間的に分散することから、故障の時期を正確には予想できない。
本発明は、長時間、エラー指標を累積する弊害(一時的な異常や、故障に至る前兆を見逃すこと)を除去することを目的とする。本発明では、磁気ヘッド毎に、単位時間当たりのエラー指標を断続的、連続的に格納し、格納した複数のエラー指標を監視対象として、更新して行く新たな第2のエラー指標(以下、部分積分エラーレートという。)を設け、第2のエラー指標が所定の条件を満たせば異常、擬似異常と診断し、上位装置へ報告する。
好ましい実施例では、単位時間として1時間の間に、一定のアクセス数又は一定の測定時間(数十秒程度)当たりのエラー指標を単位時間に対応させて格納する。これを単位時間毎に繰り返すことで、断続的、連続的に単位時間毎のエラー指標の推移を格納する。
エラー指標としては、磁気ディスク装置のビットエラー、リードエラー、ライトエラー、シークエラー、リアサイン回数、起動回数、起動タイムオーバー数、これらの発生割合を採用する。
部分積分エラーレートは、これら一定数(複数)のエラー指標の組の内容を用いて、例えば、ビットエラー数の総和をアクセス数の総和で除して得られた値とする。
部分積分エラーレートは、エラー指標の組の増加に伴い更新される。新たな単位時間当たりのエラー指標が格納される都度、監視対象のうち古いエラー指標が捨てられ、新しいエラー指標が追加されて、一定数の新しい監視対象のエラー指標の組から、新たな部分積分エラーレートが算出される。
エラー指標を格納する記憶素子は、例えば、128単位のエラー指標の組を格納できるキャッシュメモリとし、エラー指標の組を時間的に断続的、連続的に、サイクリックに格納する。129単位目から最初に格納した1単位目の記憶素子に上書きする。
エラー指標のうちアクセス数には、単位時間のうち現実にアクセスのあった所定のアクセス数をバイト単位で格納する。好ましい実施例では、10GB(ギガバイト)を所定のアクセス数としている。また単位時間当たりに所定のアクセス数がないときは、単位時間のうち、これらより短い所定の測定時間内に現実に生じたアクセス数を、エラー指標のアクセス数とし、ビットエラーもその測定時間内に生じたものを用いる。
ビットエラーレートは、アクセスのあったデータのうち、どれだけのビットがエラーとなったかを、ビットエラーをアクセス数で除して算出し格納する。例えば、単位時間(1時間)のうちに10ギガバイトのアクセス数があり、生じたビットエラー数が5であれば、ビットエラーレートは、5ビット÷(10x10の9乗x8ビット)=6.25x10のマイナス11乗となる。
単位時間当たりビットエラーレートが確定次第、対応するテーブルに格納するとともに、エラー指標が第1の所定の閾値を超えるか否かの判定を行う。超えた場合には上位装置に報告する。
部分積分エラーレートに増加傾向があれば、つまり、第2の所定の閾値を越えるように増加したときは、磁気ディスク装置が故障に至る可能性が極めて高いので、異常であるとして上位装置に報告する。
部分積分エラーレートが更新前に比べて増加しても、第2の所定の閾値を超えなければ、部分積分エラーレートの一時的増加であると判断し、疑似異常として上位装置に報告する。
また、部分積分エラーレートが更新前に比べて減少したときは、減少前のレートから累積を開始し、更新の都度、部分積分エラーレートの累積値が、第2の閾値を越えるか判断する。超えたときは磁気ディスク装置に周期的な不具合が発生したとみなし、上位装置に周期的異常を報告する。超えないときは、累積を継続し、128単位時間分の累積を完了した時に、累積を終了し、累積値を初期値にリセットする。第2の閾値の代わりに第3の閾値を設定して、累積値を比較しても良い。
上位装置は、擬似異常の診断結果に対し、異常ではないと判断するアルゴリズムを稼動させることができる。このため誤報に対処する必要がなくなる。また上位装置は、周期的異常の診断結果に対し、磁気ディスク装置が故障には至らないものの、操作者に交換を要する旨の注意を喚起する。
部分積分エラーレートを用いることにより、一時的なビットエラーレートの増加を緩和して、誤報を防止しやすくできる。
単位時間のうち一部の時間を用いてエラー指標を格納するので、エラー指標の算出による、磁気ディスク装置本来の機能低下を防止しつつ、経時的に正確なエラー指標を格納できる。
第1の所定の閾値を越えるエラー指標を検出又は算出した場合に、上位装置へ報告し、上位装置における診断機能の判断材料を提供できる。第1の所定の閾値を超える場合にのみ、上位装置へ報告するので、上位装置が受け取る情報を精選できる。
部分積分エラーレートが、第2又は第3の所定の閾値を越えたことを検出した場合に、上位装置へその旨を報告(警告)するので、また、部分積分エラーレートの増加率を算出し、所定の閾値を越えた場合に上位装置へその旨を報告(警告)するので、従来技術では検出が困難であった、数時間のうちに不良に至る磁気ディスク装置を、磁気ディスク装置の性能を劣化することなく検出でき、致命的な故障を予測できる。
不具合の程度により、上位装置がかかる不具合に対応するための契機を与えることができる。例えば、致命的な故障を予測した場合には、磁気ディスク装置に格納されたデータを、他の磁気ディスク装置に格納し直すことで、上位装置が不具合に対応することを促すことができる。
所定の閾値を適宜、設定することで、上位装置へエラー指標を報告し蓄積し、これらのエラー指標を用いた一時的又は周期的な故障の予知又は現象の把握が行える。単位時間が1時間のときは、磁気ディスク装置の1日における環境変化による不具合の診断に便利となる。
本発明を適用した磁気ディスク装置を図4に示す。
図4は磁気ディスク装置のカバーを取り外した状態の平面図である。ガラス又はアルミを基材とする磁気ディスク媒体1は、スピンドルモータ2により回転可能にベース3に支持される。先端に磁気ヘッド4を有するキャリッジ5は他端にコイル6を設け、ボイスコイルモータ(以下、VCMという)8の磁界とコイル6に通電することで生じた磁界により、ピボット7を中心に揺動可能となるよう、ベース3に支持されている。
なお磁気ヘッド4に対する又は磁気ヘッド4からの信号は、図示しないヘッドアンプを介して、フレキシブルプリント配線FPC12により、ベース3の外部のプリント配線基板と連絡している。
プリント配線基板は、HDC(ハードディスクコントローラ)、磁気ディスク装置外部と情報の入出力を制御する、インタフェース回路その他の制御回路、マイクロプロセッサを有している。またプリント配線基板は、SRAM、キャッシュメモリその他の記憶素子も搭載している。
次に本発明で適用可能なエラー指標を図1に示す。
磁気ディスク装置に搭載される磁気ヘッド毎に、リードエラーレート2、ライトエラーレート3、シークエラーレート4、リアサイン数5、起動回数6、起動タイムオーバー回数7その他エラー指標の累積値8を、SRAM1に保存する。
リード、ライト及びシークの各エラーレート11は、アクセス数9、エラー数10から算出し、これらのエラーレートがしきい値12(第1の所定の閾値)を越えた場合に、上位装置へ報告する。
単位時間を1時間とした場合には、直近の1時間13毎に、リード、ライト及びシークの各エラー数と各アクセス数を、エラー指標として、磁気ディスク装置のSRAM1に一時保存する。この場合、単位時間として1時間の間に、一定のアクセス数(10Gバイト)又は一定の測定時間(数十秒程度)当たりのエラー指標を格納する。1の単位時間に1組のエラー指標を格納する。こうして断続的、連続的にエラー指標の組を格納する。単位時間当たりのアクセス数9、エラー数10、エラーレート11その他から成るエラー指標の1組を、図1のSRAM、左側に示す。
キャッシュ14には、直近の1時間(単位時間)におけるエラー指標の内容が、第128のテーブル20に格納される。ここで、エラー指標の内容は、リード、ライト及びシークのエラー数並びにアクセス数である。また、直近の2時間前から1時間前までの期間におけるエラー指標の内容は、第127のテーブル(図示せず)に格納されている。
同様にして、直近の126時間前から127時間までの期間におけるエラー指標の内容は、第2のテーブル19に格納されている。また直近の127時間前から128時間までの期間におけるエラー指標の内容は、第1のテーブル18に格納されている。
こうして時間の経過と共に、新たな所定のエラー指標の組18〜20が、断続的、連続的にキャッシュメモリ14へ格納されて行く。単位時間当たりのエラー指標が確定次第、対応するテーブルに格納され、エラー指標が第1の閾値を越えるか否かの判定を磁気ディスク装置が行う。超えた場合には上位装置へ報告する。
部分積分エラーレートに増加傾向があれば、つまり、第2の所定の閾値を越えるように増加したときは、磁気ディスク装置が故障に至る可能性が極めて高いので、異常であるとして上位装置に報告する。
部分積分エラーレートが更新前に比べて増加しても、第2の所定の閾値を超えなければ、部分積分エラーレートの一時的増加であると判断し、疑似異常として上位装置に報告する。
部分積分エラーレートは、これら一定数(複数)のエラー指標の組の内容を用いて、例えば、ビットエラー数の総和をアクセス数の総和で除して得られた値とする。
部分積分エラーレートは、エラー指標の組の増加に伴い更新される。新たな単位時間当たりのエラー指標が格納される都度、監視対象のうち古いエラー指標が捨てられ、新しいエラー指標が追加されて、一定数の新しい監視対象のエラー指標の組から、新たな部分積分エラーレートが算出される。
エラー指標のうちリードエラーレート15、ライトエラーレート16、シークエラーレート17は、それぞれ、単位時間内に算出し、格納する。
具体的には、リードのエラーレートについては、エラービット数をアクセスのあったデータのビット数で除して算出する。ライトエラーレート又はシークエラーレートは、それぞれ、エラー数をライト数又はシーク数で除して算出する。
単位時間は、適宜、変更が可能で、30分毎でも良いし2時間毎でも良い。またテーブルの総数も用いるメモリ容量に応じて増減できる。
なお、キャッシュ14に格納したエラー指標を、適宜、磁気ディスク媒体へ記録しても良い。より好ましくは、現実のアクセス数が多くない時間帯を、上位装置へ報告されたエラー指標から予め求めておき、この時間帯で、キャッシュ14から磁気ディスク媒体へ記録しても良い。
また第1又は第2の閾値はテーブルに格納せずとも良い。
図2は、リード動作又はライト動作において、部分積分エラーレートを、格納されたエラー指標の内容から算出することを説明するための図である。図1におけるエラー数をビットエラー数と、エラーレートをビットエラーレートとしている。このように単位時間毎に、直近の1時間前までのエラー数とアクセス数が発生し、確定して来た場合を説明する。
単位時間のうち現実のアクセス数が10GBあって、その際のビットエラー数が2000個であるときを、第1の所定の閾値として、このビットエラーレートを定める。即ち、第1の閾値は、2000ビット÷(10x10の9乗x8ビット)=2500x10のマイナス11乗となる。
図2のテーブル1からテーブル128に至るビットエラーレートが、この第1の閾値(2500x10のマイナス11乗)を超えていないか、それぞれ、テーブルの内容が確定次第、比較する。超えた場合には、その旨と、テーブルの内容その他エラー指標の全部又は一部を上位装置へ報告する。第1の閾値はこれより大きくても小さくても良く、適宜、設定可能である。
図3は、図2のエラー指標のうち、ビットエラーレートの時間推移と、部分積分エラーレートの時間推移とを示すグラフである。図2のテーブル1からテーブル128(途中省略)のビットエラーレート(縦軸は左のもの)を、丸印でプロットして示す。テーブル128でビットエラー数が60へ増加したため、ビットエラーレートは急上昇している。従来の方法では閾値が1つであり、適切な閾値を定めるのが困難であった。
部分積分エラーレートは、これら丸印のプロット例えば5個を監視対象として選び、これらのビットエラー数の総和を、アクセス数の総和で除して得られた値(縦軸は右のもの)とし、×印でプロットして示す。テーブル128を含む部分積分エラーレートは17.6x10のマイナス11乗に増加している。
部分積分エラーレートは、エラー指標の組の増加に伴い更新され、新たな単位時間当たりのエラー指標が格納される都度、監視対象のうち古いエラー指標が捨てられ、新しいエラー指標が追加されて、本実施例では5個の新しい監視対象のビットエラーから、新たな部分積分エラーレートが算出される。
このため、テーブル128のビットエラー数60が一時的な増加であった場合には、テーブル129(この例ではテーブル1に上書きされる)のビットエラー数が数ビットに戻るため、部分積分エラーレートの値は17.6x10のマイナス11乗の付近となる。
逆に、ビットエラー数が致命的な増加であれば、テーブル129のビットエラー数がテーブル128のそれと同様の60付近かこれ以上の値となり、部分積分エラーレートが顕著に増加し、第2の閾値(例えば30x10のマイナス11乗)を越えることとなる。
単純化した例を挙げて、部分積分エラーレートを説明する。図2と同様なテーブルを考える。テーブル1からテーブル127まで、一律に、ビットエラー数が5、アクセス数が10GB、ビットエラーレートが6.25x10のマイナス11乗であるとする。
テーブル128のみが、それぞれ、60、10GB、7.5x10のマイナス10乗であるとする。
10個のエラー指標の組を監視対象として選び、これらのビットエラー数の総和を、アクセス数の総和で除して、部分積分エラーレートとする。
テーブル118からテーブル127までの、連続する10組のアクセス数の総和は100GBである。これら10組のビットエラー数の総和は50であり、例えば第2の閾値に相当するビットエラー数の100を超えない。
この場合、テーブル128には、直近の単位時間(1時間)のうちに、周囲の環境の変化、一時的なスピンドルモータの振動、一時的な磁気ヘッドの読み出し能力の低下その他の不具合により、ビットエラーが60個発生している。このとき10個のエラー指標の組、テーブル119からテーブル128を監視対象とすると、アクセス数の総和100GBにつき、ビットエラーの総和は105個となり、第2の閾値を越えることとなるので、上位装置へ報告する。
長期間の累積値を監視対象とする従来の方法では、128単位時間の総和を採って、ビットエラーの総和を除していたため、100GBのアクセス数当たり100個のビットエラーに相当する第2の閾値に届かず、上位装置へ報告することは無かった。
磁気ディスク装置を用いる電子機器において、磁気ディスク装置から確度の高い故障の予報が発せられるため、電子機器の信頼性向上に役立つ。
本発明で適用可能なエラー指標の説明図である。 部分積分エラーレートを、格納されたエラー指標の内容から算出することを説明するための図である。 図2のエラー指標のうち、ビットエラーレートの時間推移と、部分積分エラーレートの時間推移とを示すグラフである。 本発明を適用した磁気ディスク装置の構成例を示す図である。
符号の説明
13……直近の単位時間におけるエラー指標、
14……磁気ディスク装置のキャッシュメモリ、
18、19、20……キャッシュに設けられたエラー指標を格納するテーブル。

Claims (8)

  1. 単位時間の開始後、終了までの間に、1の磁気ヘッドについて、一定のアクセス数毎又は一定の測定時間毎に、エラー指標を格納する第1のステップと、
    第1のステップを複数回行い、格納した一定数のエラー指標の組を対象として、第2のエラー指標を算出する第2のステップと、
    単位時間の開始後、終了までの間に、1の磁気ヘッドについて、一定のアクセス数毎又は一定の測定時間毎に、エラー指標を格納する第3のステップと、
    第2のステップで算出の根拠とした、一定数のエラー指標の組のうち、時間的に最も古い組のエラー指標を捨て、第3のステップで得られた、1の組のエラー指標を加えた一定数のエラー指標の組を対象として、第2のエラー指標を更新する第4のステップと、
    を有する磁気ディスク装置の故障予測方法。
  2. 請求項1記載の故障予測方法において、
    第1のステップで格納したエラー指標、又は、第3のステップで格納したエラー指標が、第1の閾値を越えた場合に、当該エラー指標が第1の閾値を越えたことを意味する信号を、外部に送出する磁気ディスク装置の故障予測方法。
  3. 請求項1記載の故障予測方法において、
    第2のステップで算出した第2のエラー指標、又は、第4のステップで更新した第2のエラー指標が、第2の閾値を越えた場合に、当該エラー指標が第2の閾値を越えたことを意味する信号を、外部に送出する磁気ディスク装置の故障予測方法。
  4. 請求項1記載の故障予測方法において、
    エラー指標として、ビットエラー、リードエラー、ライトエラー、シークエラー、リアサイン回数、起動回数、又は、起動タイムオーバー数のうち一部又は全部を用いた磁気ディスク装置の故障予測方法。
  5. 単位時間の開始後、終了までの間に、1の磁気ヘッドについて、一定のアクセス数毎又は一定の測定時間毎に、エラー指標を格納する第1の機能と、
    第1の機能を複数回実行し、格納した一定数のエラー指標の組を対象として、第2のエラー指標を算出する第2の機能と、
    単位時間の開始後、終了までの間に、1の磁気ヘッドについて、一定のアクセス数毎又は一定の測定時間毎に、エラー指標を格納する第3の機能と、
    第2の機能で算出の根拠とした、一定数のエラー指標の組のうち、時間的に最も古い組のエラー指標を捨て、第3の機能で得られた、1の組のエラー指標を加えた一定数のエラー指標の組を対象として、第2のエラー指標を更新する第4の機能と、を有する磁気ディスク装置。
  6. 請求項5記載の磁気ディスク装置において、
    第1の機能で格納したエラー指標、又は、第3の機能で格納したエラー指標が、第1の閾値を越えた場合に、当該エラー指標が第1の閾値を越えたことを意味する信号を、外部に送出する磁気ディスク装置。
  7. 請求項5記載の磁気ディスク装置において、
    第2の機能で算出した第2のエラー指標、又は、第4の機能で更新した第2のエラー指標が、第2の閾値を越えた場合に、当該エラー指標が第2の閾値を越えたことを意味する信号を、外部に送出する磁気ディスク装置。
  8. 請求項5記載の磁気ディスク装置において、
    エラー指標として、ビットエラー、リードエラー、ライトエラー、シークエラー、リアサイン回数、起動回数、又は、起動タイムオーバー数のうち一部又は全部を用いた磁気ディスク装置。
JP2004225465A 2004-08-02 2004-08-02 磁気ディスク装置の故障予測方法及びこれを用いた磁気ディスク装置 Pending JP2006048789A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004225465A JP2006048789A (ja) 2004-08-02 2004-08-02 磁気ディスク装置の故障予測方法及びこれを用いた磁気ディスク装置
US11/193,925 US7369339B2 (en) 2004-08-02 2005-07-28 Failure prediction method for magnetic disk devices, and a magnetic disk device using the same
CN200510088506A CN100583279C (zh) 2004-08-02 2005-08-02 磁盘装置的故障预测方法及使用该方法的磁盘装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004225465A JP2006048789A (ja) 2004-08-02 2004-08-02 磁気ディスク装置の故障予測方法及びこれを用いた磁気ディスク装置

Publications (1)

Publication Number Publication Date
JP2006048789A true JP2006048789A (ja) 2006-02-16

Family

ID=35799702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004225465A Pending JP2006048789A (ja) 2004-08-02 2004-08-02 磁気ディスク装置の故障予測方法及びこれを用いた磁気ディスク装置

Country Status (3)

Country Link
US (1) US7369339B2 (ja)
JP (1) JP2006048789A (ja)
CN (1) CN100583279C (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007335012A (ja) * 2006-06-15 2007-12-27 Fujitsu Ltd 制御装置および記憶装置
JP2007335013A (ja) * 2006-06-15 2007-12-27 Fujitsu Ltd 制御装置および記憶装置
JP2008159162A (ja) * 2006-12-25 2008-07-10 Hitachi Ltd 記録再生装置
JP2008299951A (ja) * 2007-05-31 2008-12-11 Alpine Electronics Inc 障害情報記憶装置および障害情報記憶方法
JP2009170034A (ja) * 2008-01-16 2009-07-30 Sony Corp 故障診断装置及び故障診断方法
JP2009238277A (ja) * 2008-03-26 2009-10-15 Fujitsu Ltd 記憶装置及び内部情報保存方法
JP2011081889A (ja) * 2009-10-09 2011-04-21 Toshiba Tec Corp 記憶装置、情報処理装置、及び記憶制御プログラム
CN105787242A (zh) * 2014-12-25 2016-07-20 华为技术有限公司 一种预测非易失性存储介质发生故障的方法及装置

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9719520D0 (en) * 1997-09-12 1997-11-19 Kci Medical Ltd Surgical drape and suction heads for wound treatment
JP2007122108A (ja) * 2005-10-25 2007-05-17 Hitachi Ltd セルフチェック機能を有するディスクドライブ装置を用いたストレージシステムの制御
JP2007193887A (ja) * 2006-01-18 2007-08-02 Fujitsu Ltd ディスク装置およびディスク制御方法
US20080117751A1 (en) * 2006-11-22 2008-05-22 Read Christopher J Jukebox disc deterioration testing
US8185784B2 (en) * 2008-04-28 2012-05-22 Lsi Corporation Drive health monitoring with provisions for drive probation state and drive copy rebuild
JP4627327B2 (ja) * 2008-05-23 2011-02-09 富士通株式会社 異常判定装置
CN102129397A (zh) * 2010-12-29 2011-07-20 深圳市永达电子股份有限公司 一种自适应磁盘阵列故障预测方法及系统
CN102129399B (zh) * 2011-03-23 2012-12-19 北京傲天动联技术有限公司 通信设备的故障保护装置及包括该装置的通信设备
CN102298546B (zh) * 2011-09-07 2013-06-12 深圳万兴信息科技股份有限公司 从磁盘上恢复被删除的jpg文件的方法及系统
US9055711B2 (en) * 2012-07-16 2015-06-09 HGST Netherlands B.V. System and method for maintaining data integrity on a storage medium
US8879180B2 (en) * 2012-12-12 2014-11-04 HGST Netherlands B.V. System, method and apparatus for data track usage sequence to reduce adjacent track interference effect
US9053747B1 (en) 2013-01-29 2015-06-09 Western Digitial Technologies, Inc. Disk drive calibrating failure threshold based on noise power effect on failure detection metric
US9036283B1 (en) 2014-01-22 2015-05-19 Western Digital Technologies, Inc. Data storage device with selective write to a first storage media or a second storage media
US9263088B2 (en) 2014-03-21 2016-02-16 Western Digital Technologies, Inc. Data management for a data storage device using a last resort zone
US10026420B1 (en) * 2014-11-24 2018-07-17 Seagate Technology Llc Data storage device with cold data migration
US9218849B1 (en) * 2014-11-24 2015-12-22 Seagate Technology Llc Data loss mitigation in a heat assisted magnetic recording data storage device
CN107643877B (zh) * 2016-07-22 2020-08-11 中国电信股份有限公司 磁盘故障检测方法以及装置
CN108073486B (zh) * 2017-12-28 2022-05-10 新华三大数据技术有限公司 一种硬盘故障的预测方法和装置
CN108763048B (zh) * 2018-06-05 2021-01-19 西安交通大学 一种基于粒子滤波的硬盘故障预警与可靠性评估方法
US11264056B1 (en) * 2020-10-01 2022-03-01 Seagate Technology Llc System and method for write-retry management
US11303363B1 (en) * 2020-10-12 2022-04-12 Mellanox Technologies, Ltd. Method and apparatus for symbol-error-rate (SER) based tuning of transmitters and receivers

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06214835A (ja) 1993-01-13 1994-08-05 Nec Corp 故障予防方式
JP2755159B2 (ja) 1994-03-09 1998-05-20 日本電気株式会社 情報処理装置の自己診断方式
US5914967A (en) * 1997-01-18 1999-06-22 Hitachi Computer Products (America), Inc. Method and apparatus for protecting disk drive failure
JP4077993B2 (ja) * 1999-07-30 2008-04-23 株式会社日立グローバルストレージテクノロジーズ 性能評価方法及び性能評価装置並びにこれらを用いた記録再生装置
JP2001307435A (ja) 2000-04-21 2001-11-02 Matsushita Electric Ind Co Ltd 磁気ディスク装置および同装置の故障予知診断方法並びにそのプログラムを記録した記録媒体
WO2004025650A1 (en) * 2002-09-16 2004-03-25 Seagate Technology, Inc. Predictive disc drive failure methodology
US6982842B2 (en) * 2002-09-16 2006-01-03 Seagate Technology Llc Predictive disc drive failure methodology

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007335012A (ja) * 2006-06-15 2007-12-27 Fujitsu Ltd 制御装置および記憶装置
JP2007335013A (ja) * 2006-06-15 2007-12-27 Fujitsu Ltd 制御装置および記憶装置
JP2008159162A (ja) * 2006-12-25 2008-07-10 Hitachi Ltd 記録再生装置
JP4591441B2 (ja) * 2006-12-25 2010-12-01 株式会社日立製作所 記録再生装置
US8009536B2 (en) 2006-12-25 2011-08-30 Hitachi, Ltd. Recording and reproducing apparatus
JP2008299951A (ja) * 2007-05-31 2008-12-11 Alpine Electronics Inc 障害情報記憶装置および障害情報記憶方法
JP2009170034A (ja) * 2008-01-16 2009-07-30 Sony Corp 故障診断装置及び故障診断方法
JP2009238277A (ja) * 2008-03-26 2009-10-15 Fujitsu Ltd 記憶装置及び内部情報保存方法
JP2011081889A (ja) * 2009-10-09 2011-04-21 Toshiba Tec Corp 記憶装置、情報処理装置、及び記憶制御プログラム
CN105787242A (zh) * 2014-12-25 2016-07-20 华为技术有限公司 一种预测非易失性存储介质发生故障的方法及装置
CN105787242B (zh) * 2014-12-25 2019-02-26 华为技术有限公司 一种预测非易失性存储介质发生故障的方法及装置

Also Published As

Publication number Publication date
CN1770304A (zh) 2006-05-10
US7369339B2 (en) 2008-05-06
US20060034008A1 (en) 2006-02-16
CN100583279C (zh) 2010-01-20

Similar Documents

Publication Publication Date Title
JP2006048789A (ja) 磁気ディスク装置の故障予測方法及びこれを用いた磁気ディスク装置
EP1924994B1 (en) Method and apparatus for detecting the onset of hard disk failures
US6986075B2 (en) Storage-device activation control for a high-availability storage system
CN101145372B (zh) 用于故障数据存储的非易失存储器的盘驱动器
US20100262857A1 (en) Data storage device including a failure diagnostic log
US20180060192A1 (en) Adaptive Failure Prediction Modeling for Detection of Data Storage Device Failures
JP4755510B2 (ja) データ記録装置、及び、データ記録装置のホストデータ転送のパフォーマンスを評価する方法
US20190138415A1 (en) Method and system for diagnosing remaining lifetime of storages in data center
US11237893B2 (en) Use of error correction-based metric for identifying poorly performing data storage devices
WO2007088606A1 (ja) 故障情報管理方法及び検出方法、装置並びに記憶媒体
US8234235B2 (en) Security and remote support apparatus, system and method
JP2007335012A (ja) 制御装置および記憶装置
US20060122854A1 (en) System and method for generating warranty and pricing information for data storage apparatus
US7571263B2 (en) Apparatus and method for monitoring data storage device for usage and warranty
JPH0651915A (ja) ディスク装置およびディスクアレイ管理方式
US20080010484A1 (en) Storage device, storage-device management system, and storage-device management method
JP2012038362A (ja) ハードディスク故障予兆検出方法
CN115762619A (zh) 硬盘故障预测方法、计算设备及存储介质
JP2011180673A (ja) ディスク劣化診断装置
JP2880701B2 (ja) ディスクサブシステム
US9576599B1 (en) Monitoring head wear
JP2002229867A (ja) ディスク装置の故障予知装置
JP5692577B2 (ja) 磁気ディスク装置及び自己診断方法
CN113179657A (zh) 恢复行为对于数据存储设备的预后和原位修复的用途
JP2008084505A (ja) 記憶装置、書き込み手段診断方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070710

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081216