JP5078235B2 - 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法 - Google Patents

磁気ディスク記憶装置におけるトラック・データ完全性の維持方法 Download PDF

Info

Publication number
JP5078235B2
JP5078235B2 JP2005134986A JP2005134986A JP5078235B2 JP 5078235 B2 JP5078235 B2 JP 5078235B2 JP 2005134986 A JP2005134986 A JP 2005134986A JP 2005134986 A JP2005134986 A JP 2005134986A JP 5078235 B2 JP5078235 B2 JP 5078235B2
Authority
JP
Japan
Prior art keywords
data
read
specific area
error
error condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005134986A
Other languages
English (en)
Other versions
JP2005322399A (ja
Inventor
ブライアン・ジー・ナデュウ
ブライヤン・ケー・パンナー
マーク・エヌ・ボーハン
ペーター・ジェイ・ハンター
デーモン・ジェイ・ハング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dell Products LP
Original Assignee
Dell Products LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dell Products LP filed Critical Dell Products LP
Publication of JP2005322399A publication Critical patent/JP2005322399A/ja
Application granted granted Critical
Publication of JP5078235B2 publication Critical patent/JP5078235B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • G11B19/04Arrangements for preventing, inhibiting, or warning against double recording on the same blank or against other recording or reproducing malfunctions
    • G11B19/041Detection or prevention of read or write errors
    • G11B19/045Detection or prevention of read or write errors by detecting mistracking
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1883Methods for assignment of alternate areas for defective areas
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/02Recording, reproducing, or erasing methods; Read, write or erase circuits therefor
    • G11B5/09Digital recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1816Testing
    • G11B2020/183Testing wherein at least one additional attempt is made to read or write the data when a first attempt is unsuccessful

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、記憶装置(ストレージ・デバイス)においてデータ完全性の維持を実施する方法に関する。
本出願は、2004年5月7日出願の米国特許出願第10/842,258号の優先権を主張する出願である。
現世代の磁気ディスク記憶装置は徐々に現れるデータ完全性の障害に弱い。このような障害からの回復は、最初に、従来のドライブの誤り訂正符号(ECC)処理または入力/出力(I/O)再試行操作の使用のみを必要とする。しかし、これらの障害はデータが回復不可能に至るまで徐々に悪化する。この種のデータ完全性の障害の例は、“トラック・スクイーズ”として公知である。
トラック・スクイーズは特に、高密度データ装置がサーバ用途において高負荷で使用される場合に見られる。トラック・スクイーズが発生するのは、ディスク・ドライブ上のあるトラックがまれにしか書き込みされないが、同心状に隣接するトラックの一方または両方が頻繁に書き込みされる場合である。ヘッドのアクチュエータ機構の位置合わせ許容誤差に限界があるため、隣接トラック書込みを実行するのに利用される電磁力がまれにしか書き込みされないトラック内に侵入し、影響を及ぼされるトラックの信号強度を低下させる。このため、読出し動作においてデータ・エラーが発生する。この問題の低減または回避は、ディスク表面のトラック密度を減少させるか、またはヘッドのアクチュエータおよびデータ読出しプロセスの精巧度および正確さを増加させるかによって達成できる。しかし、これらの技術にはコストがかかる。
トラック・スクイーズのようなエラーが最初に現れ始めるとき、その影響はわずかであり、従来のディスク・ドライブ・エラー回復手法(例えば読出し再試行またはドライブECC)がデータを回復できる。この場合において、上位層I/O処理すなわちアプリケーション・プログラムでは問題をエラーとして認識していないが、これらの訂正手法を実行するのに必要とされる時間に起因して性能の低下が生じている。
トラック・スクイーズのような徐々に現れるエラーが重大になるに伴い、これらエラーは、ディスク・ドライブ・エラー回復手法がこれらエラーを処理できる範囲を超えて進行する。RAID(Redundant Array of Independent Disks)のようなフォールト・トレラント・データ記憶装置の手法は、基礎をなすディスク・ドライブ内に回復不可能なエラーが存在する場合においても、データの可用性を維持するのに有効である。しかし、これは、RAIDの回復能力を超えるほどのエラーの発生がほとんどなく、エラーの発生率が十分小さい場合のみに有効である。したがって、RAIDを用いる通常の稼動では、極めて小さいエラーの発生率よりも大きいエラーの発生率を生じるあらゆるディスク・ドライブを“故障ドライブ”とみなす。
トラック・スクイーズのような障害が存在する場合においては、このような稼動のために、顧客が容認できる程度、または記憶装置システム製造者が商業的に許容できる程度をかなり超える割合で、ディスク・ドライブを“故障ドライブ”とする可能性がある。
これより、トラック・スクイーズのような徐々に現れるエラーを検出して、エラーを除去するために訂正動作を実行する手法が必要である。このような手法により、ディスク・ドライブは正常なドライブとして通常のサービスを続行できる。
本発明は、磁気ディスク・ドライブにおけるトラック・スクイーズ障害のような今にも発生しそうなデータ・エラーを検出し、さらに、データ・エラーが検出された際には、例えば影響を及ぼされたトラックに再度書き込むことによって、障害すなわち今にも発生しそうな障害を修復する。多くの場合においては、障害が検出されて、元々のデータがまだ読み出しできる場合に修復がなされる。
別の場合においては、データが該当のディスクで読み出しできないが、ディスクがRAID(Redundant Array of Independent Disks)システムの一部、または上位レベルのシステム・フォールト・トレラント手法が実装されている他のシステムの一部である場合、損失したデータはRAID層手法により回復でき、その後、回復データを用いてトラック・スクイーズ障害を修復できる。
本発明は、記憶装置システムのファームウェアとして、汎用オペレーティング・システムの構成要素として、もしくは個々のディスク・ドライブ内に実装でき、またはこれら実装の組合せを用いることもできる。
本発明はさらに、現場の顧客によって用いられる機能システムの一環として、製造時のスクリーニング工程における機能システムの一環として、または現場から返却されたユニットの解析および修理における機能システムの一環として実現される。
本発明は従来技術に勝る多くの利点を提供する。
多くの場合、記憶装置システムにおけるディスク・ドライブのコストを低減することが望まれる。この必要性は、多数の記憶ユニットから成る大規模記憶アレイにおいて特に重要である。大容量デスクトップPCシステムに用いられる技術に基づく“大衆向け商品(Commodity)”ドライブが、記憶装置のメガバイト当たり最低コストであるため、通常、最も魅力的な選択肢である。しかし、ユニット当たり最大の有効記憶密度を有する大衆向け商品ドライブは、一般に最高の信頼性を備えない理由から、記憶アレイの大部分のメーカは一般に最良の選択商品とは考えていない。例えば、トラック・スクイーズのような徐々に現れるエラーは、いずれの最新式ディスク・ドライブにおいても発生する可能性がある一方、高いトラック密度ならびにドライブ機構および電子部品のコスト制約の理由から、大衆向け商品ディスク・ドライブにおいてこのようなエラーは特に関係がある。個人的利用を目的とするPC(パーソナル・コンピュータ)においては、ドライブへの標準的なアクセスが頻繁ではないため、エラーは性能にそれほど大きな影響を与えない。しかし、前述のようなファイル・サーバ等に使用される記憶アレイにおいては、ディスク・ドライブ・エラーの発生率を極めて小さく維持して、顧客のデータ損失を避けるのみでなく、ドライブ交換のための製品サポート・コストを抑制する必要がある。
トラック・スクイーズのようなエラーが深刻になって、回復不可能なデータ損失を生じる前に、通常このようなエラーを検出することにより、本発明は顧客データをこれらエラーから保護する。さらに、根底にある障害を実際に修復する訂正動作によって、本発明はディスク・ドライブの有効寿命を制限する要因、または現場におけるディスク・ドライブの故障率の要因であるトラック・スクイーズのようなエラーを効果的に除去する。根底にある障害を修復することはまた、エラーがECCまたは読出し再試行などの通常のディスク・ドライブ回復手法によってまだ回復できる場合に発生する性能損失を修復する。これらの利点により、サーバおよびネットワーク接続ストレージ(NAS)・システムなどの高い可用性用途において、デスクトップPC技術および高い製造効率を可能にする低コストの高密度ディスク・ドライブ(“大衆向け商品”ドライブ)を利用することが経済的に実現可能となる。
さらに、本発明は従来の工業標準ディスク・ドライブの特性にのみ依存する。したがって、特殊なエラー指示、カウンタ、または非標準ドライブ・コマンドを一切必要としない。さらに、本発明は検出および修復の両方を備え、これにより、今にも発生しそうな障害を除去する。本発明は、徐々に現れるエラーが回復不可能になる時点を遅らせて根底にある障害を訂正できない読出しエラー再試行手法の単なる向上には該当しない。
本発明の前述およびその他の目的、特徴、および利点は、添付図面に示す本発明の好ましい実施形態の以下の詳細な説明で明らかになるであろう。図面では、同一参照符号は異なる図面においても同一部品を指す。図面は必ずしも縮尺通りでなく、本発明の原理を示すことに重点が置かれている。
以下に、本発明の好ましい実施形態について説明する。
図1はコンピュータ・システムを示し、このシステムは、例えばデスクトップまたはラップトップ・コンピュータなどのサーバ・システムまたはユーザ・ワークステーションである。ホストすなわちベース・コンピュータ100(付属の記憶装置(ストレージ)を除くコンピュータ・システムの中央処理装置)は、記憶装置コントローラ120を接続している。記憶装置コントローラ120は単純なディスク・コントローラであってもよく、またはRAID(Redundant Array of Independent Disks)のような高度な記憶手法を組み込んでいてもよい。コンピュータ100は相互接続110を介してコントローラ120に接続されている。相互接続110はPCI(Peripheral Component Interface)バスのようなシステム・バスであってもよく、またはファイバー・チャネルを基礎としたSAN(Storage Area Network)もしくはその他のSAN技術であってもよい。記憶装置コントローラ120はディスク・チャネル130を介して1つまたは複数のディスク・ドライブ140を接続している。ディスク・チャネルはATA(Advanced Technology Attachment)、SCSI(Small Computer System Interface)、または他のディスク・インタフェースなどの任意の適切なディスク・ドライブ・インタフェースを備える。
以下に述べる手順は、コンピュータ100、記憶装置コントローラ120、またはディスク・ドライブ140に含まれるドライブ電子機器150内に実装される。コンピュータ100に実装される際には、一般に、この実装はオペレーティング・システムの一部であるか、またはこのコンピュータ100にインストールされたデバイス・ドライバである。コンピュータ100または記憶装置コントローラ120に実装される際には、コンピュータまたは記憶装置コントローラがRAIDフォールト・トレラント手法、データ・ミラーリングまたはデータ・バックアップなどの上位システム階層機能を含む場合、図7に示す回復手順が用いられる。ディスク・ドライブ140のドライブ電子機器150内に実装される際には、他の装置、例えば記憶装置コントローラ120に実装される上位層フォールト・トレラント手法と通信しないかぎり、一般に図6に示す回復手順が適用される。
さらに、以下に述べる手順が1つの構成要素の一部および別の構成要素の一部に実装される。例えば、図2〜図5に示される検出手順がディスク・ドライブ140に実装され、一方、図7に示す回復手法が記憶装置コントローラ120に実装される。
図2〜図5は、今にも発生しそうなデータ完全性エラー(今にも発生しそうなデータ損失)を検出する手順についての4つの異なる変形例のフローチャ−トである。
これらフローチャートのそれぞれにおいて、図示する手順は、今にも発生しそうなデータ・エラーの検出を行なう検出工程に加えて、システムの他の構成要素によって要求される実際のI/O動作を実行する。この工程の目的は、多くの場合、データ損失が実際に発生する前に、データ損失が発生する恐れがあることを指示できることである。その結果、損失の恐れがあるデータは一般にはまだ読出し可能で、かつ、このデータは修復手順に利用できる。ここに示す変形例のいくつかは、検出されるエラー・クラスの共通特性に依存している。すなわち、トラック・スクイーズのような徐々に現れるエラーの初期段階は通常のエラー回復手法を用いるディスク・ドライブによって回復可能であるが、これら手法は時間を要するので、ドライブの性能を観測することによって検出可能である。なお、これら技法はすべてのディスク・ドライブに適用でき、ディスク・ドライブの任意の一般的ではない、すなわちカスタマイズされたエラー・レポート能力にも依存しない。
図2は今にも発生しそうなデータ・エラーの検出手順を示しており、この手順はエラー検出手法にI/Oタイミング変化を利用する。この手順は、工程210において、システムの他の構成要素からのデータ読出しまたは書込み動作などのI/O要求を受け取ることによって始まる。工程220において、現在の時刻が記録される。次の工程230では、I/O要求が通常の方法によって、例えばI/Oコマンドをディスク・ドライブに送ることによって実行され、これにより、データ読出しまたは書込み動作が、例えば読取り/記録ヘッドを介してディスクの磁気媒体との間で発生する。この動作が完了すると、工程240では、I/Oを実行するのに必要とされた経過時間が計算される。工程250において、複数の連続するI/O要求からの計算された経過時間の値が統計分析されて、経過時間の変化が計算される。工程260において、計算された変化が設定しきい値と比較されて、予測される変化を超えているか否かが決定される。予測される変化は、ディスク・ドライブのメーカによって提供されるデータ、または製品設計もしくはディスク・ドライブ型式の容認の一環としてなされる測定から設定されている。観測された変化が設定されたしきい値を超えている場合、工程270において、手順は今にも発生しそうなデータ損失が検出されたことを指示する。観測された変化が設定されたしきい値を超えていてもいなくても、工程280においてI/O動作は完了する。
図3は、今にも発生しそうなデータ・エラーの検出手順を示しており、この手順は検出手法にディスク・ドライブSMART(Self-Monitoring, Analysis, and Reporting Technology)(自己管理解析報告機能)カウンタを用いる。このようなSMARTカウンタは一般に、最新商品のディスク・ドライブ140によって保持され、ドライブ電子機器150および/または記憶装置コントローラ120によって読み出される。この手順は、工程210において、システムの他の構成要素からのデータ読出しまたは書込み動作などのI/O要求を受け取ることによって始まる。工程230では、I/O要求が通常の方法で実行される。これが完了すると、工程310においてSMARTカウンタが取得される。工程320において、ディスク・ヘッド・リードチャネルにおけるリード・エラーの発生率(Raw Read Error Rate)のような適切なSMARTカウンタが、設定しきい値と比較される。設定しきい値は一般に、設計によって選択され、ディスク・ドライバのメーカによって供給される。カウンタ値がしきい値を超えている場合、工程270において、手順は今にも発生しそうなデータ損失が検出されたことを指示する。カウンタ値がしきい値を超えていてもいなくても、工程280においてI/O動作は完了する。
図4は今にも発生しそうなデータ・エラーの検出手順を示しており、この手順はエラー検出手法に予測されるスループットからのずれを利用する。この手順は、工程210において、システムの他の構成要素からのI/O要求を受け取ることによって始まる。工程220において、現在の時刻が記録される。次の工程230では、I/O要求が通常の方法によって実行される。この動作が完了すると、工程240では、I/Oを実行するのに必要とされた経過時間が計算される。工程410では、ディスク・ドライブの所定のトラックまたはトラックの一部に対する複数の連続するI/Oデータ要求から計算された経過時間値が統計分析されて、平均I/Oスループットが計算される。工程420において、計算されたスループットが設定しきい値と比較されて、予測される変化を超えているか否かが決定される。予測されるスループットは、ディスク・ドライブのメーカによって提供されるデータ、または製品設計もしくはディスク・ドライブ型式の容認の一環としてなされる測定から設定されている。これに関しては、以下の図12Aおよび図12Bにおいて詳細に説明する。観測されたスループットが設定されたしきい値よりも低い場合、工程270において、手順は今にも発生しそうなデータ損失が、該当のトラックまたはトラックの一部に検出されたことを指示する。観測されたスループットが設定されたしきい値よりも低くても低くなくても、工程280においてI/O動作は完了する。
図5は今にも発生しそうなデータ・エラーの検出手順を示しており、この手順はエラー検出手法にI/OタイミングおよびI/O動作タイムアウトを利用する。この手順は、工程210において、システムの他の構成要素からI/O要求を受け取ることによって始まる。工程220において、現在の時刻が記録される。次の工程230では、I/O要求が通常の方法によって実行される。この動作が完了すると、工程240では、I/Oを実行するのに必要とされた経過時間が計算される。工程510では、この経過時間が設定しきい値と比較され、I/O動作の実行に必要とされる予測時間を超えているか否か、またはI/O動作がタイムアウトしているか否かが決定される。予測されるI/O待ち時間は、ディスク・ドライブのメーカによって提供されるデータ、または製品設計もしくはディスク・ドライブ型式の容認の一環としてなされる測定から設定されている。I/Oタイムアウトが発生している場合、または経過時間が設定しきい値を超えている場合、工程270において、手順は今にも発生しそうなデータ損失が検出されたことを指示する。I/Oタイムアウトが発生していてもいなくても、または経過時間が設定しきい値を超えていてもいなくても、工程280においてI/O動作は完了する。
図6および図7は、今にも発生しそうなデータ損失の指示に応答して訂正動作を実行する手順のフローチャートである。
これらの手順のそれぞれにおいて、訂正動作は今にも発生しそうなエラーの完全な修復に効果を発揮する。すなわち、ディスクの動作(該当のトラックまたはトラックの一部に対するディスクの動作)が、通常の性能における完全な正常動作に復元される。これによりいくつかの利点が生じる。第1に、徐々に現れるデータ完全性のエラーを、エラーが深刻になってデータの回復が不可能になる前に止められることである。第2に、前述の通り、徐々に現れるエラーによって引き起こされる一般的なディスク・ドライブ回復手法はI/O性能の実現に費用を要するが、エラーを除去することによる修復手順は、ドライバを完全な性能に復元する。“トラック・スクイーズ”エラーに適する訂正動作は、影響を及ぼされたトラックまたはトラックの一部に再度書き込む。現世代のディスク・ドライブについては一回の再度書込み動作で十分である。しかし、ここで説明する手順は一回の再度書込み動作に限定されず、ディスク・ドライブ技術が変化して変更が必要になる場合、他の回復手法(例えば、複数の再度書込み動作)を採用できる。さらに、回復手順は単一のトラックよりも大きい領域に再度書込みできる。これにより、トラック・スクイーズが複数の隣接するトラックで発生する場合、または1つのトラック上の検出可能なトラック・スクイーズがその領域の別のトラック上で近い将来のリスクがありうることを指示するほどのディスク・アクセス・パターンである場合に効果的に処理する。
図6においては、訂正手順は図2〜図5で先に示した手順のいずれかに従ってI/O要求610を実行することによって始まる。工程620では、手順は、I/O動作手順610が今にも発生しそうなデータ損失が検出されたことを指示したか否かをチェックする。検出されない場合、工程680において、I/O動作は完了する。今にも発生しそうなデータ損失が検出された場合、工程630において、I/O動作が読出し動作で、この動作が要求されたデータを正しく読み出したか否かを決定する。読み出せない場合(すなわち、I/O動作が読み出しではなかった場合、またはデータを正しく読み出せなかった場合)、工程640において、手順は読出し動作を実行する。この読出し動作640は通常のエラー回復手法に比べて拡張されており、データをディスク・ドライブから読み出しできる確率を最大化するために、例えば通常のタイムアウトよりもタイムアウトを長時間とする。工程650では、手順は、この読出し動作が正常に実行されたか否かをチェックする。正常に実行されない場合、工程660において、I/O動作が正常ではなく、訂正動作を実行できない、エラーとする。データが工程630または650のいずれかによって正常に読み出された場合、工程670において、取得したデータがディスクに戻して書き込まれる。この時点、つまり工程680において、I/O動作は完了し、正常に実行されたことになる。
図7は、ディスク・ドライブ140自体によって実行できるデータ回復手法よりも優れたデータ回復手法を含む記憶装置システムに組み込まれたI/O手順を示す。このようなデータ回復手法は、RAID、またはデータ複製もしくはデータ・バックアップなどの他の手法を含むことができる。これらデータ回復手法はさらに、上位層メモリ・データに保持された情報(例えば、RAIDメタデータ)からの要求に応じて必要なデータを復元できる手法、またはファイル・システムもしくはストレージ仮想化(論理ボリューム・マネージャ)システムの構造を制御する手法を含む。訂正手順は図2〜図5で先に示した手順のいずれかに従いI/O要求610を実行することによって始まる。工程620では、手順は、I/O動作手順610が今にも発生しそうなデータ損失が検出されたことを指示したか否かをチェックする。検出されていない場合、工程680において、I/O動作は完了する。今にも発生しそうなデータ損失が検出された場合、工程630において、I/O動作が読出し動作で、この動作が要求されたデータを正しく読み出したか否かを決定する。読み出せない場合(すなわち、I/O動作が読み出しではなかった場合、またはデータを正しく読み出せなかった場合)、工程640において、手順は読出し動作を実行する。この読出し動作640は通常のエラー回復手法に比べて拡張されており、データをディスク・ドライブから読み出しできる確率を最大化するために、例えば通常のタイムアウトよりもタイムアウトを長時間とする。工程650では、手順は、この読出し動作が正常に実行されたか否かをチェックする。正常に実行されない場合、工程700において、手順は有効な上位層データ回復手法(例えばRAID)を用いて、ディスク・ドライブからの読み出しができなかったデータを復元する。データが工程630もしくは650のいずれかにおいて正常に読み出された場合、または上位層データ再構成工程700によって正常に読み出された場合、工程710において、取得したデータがディスクに戻して書き込まれる。この時点、つまり工程680において、I/O動作は完了し、正常に実行されたことになる。
図8は、デバイス容認またはフォールト解析手順についてのフローチャートである。図示した手順は、製造ラインで用いられる納入ディスク・ドライブ・スクリーニング手順における工程の1つである。この手順はまた、欠陥の疑いのあるディスク・ドライブに適用されるフォールト解析手順における工程として用いられることもできる。
手順は、工程810において、エラー・カウンタを初期化することによって始まる。次に、工程820において、図2〜図5で示した手順のいずれかに従って読出し要求が実行される。この動作が完了すると、手順は、読出し手順820が今にも発生しそうなデータ損失を報告したか否かをチェックする。報告していた場合、工程840において、エラー・カウンタはインクリメントされ、工程850において、分かっている正常データが書き込まれて、今にも発生しそうなエラーは修復される。次の工程860では、ディスク走査が完了しているか否かをチェックする。完了していない場合、ディスク・ドライブ全体を走査することが必要であるため、手順は工程820〜850を繰り返す。走査が完了すると、工程870において、エラー・カウンタはしきい値と比較される。このしきい値は、設計または技術的方針によって、今にも発生しそうなデータ損失指示のいかなるレベルが現世代のディスク・ドライブにおける合格レベル、つまり正常であると考えられるかを決定して、これに基づいて設定されている。エラー・カウンタが設定しきい値を超えている場合、工程890において、そのディスク・ドライブは不合格とされる。エラー・カウンタが設定しきい値を超えていない場合、工程880において、そのディスク・ドライブは合格とされる。
図9〜図11は、前述の手順を、オペレーティング・システムの記憶装置サブシステム、記憶装置コントローラ、またはディスク・ドライブI/O処理サブシステムの階層化構造に組み込む方法を示す。
図9において、検出および回復手順は、記憶装置を使用するユーザすなわちアプリケーション・プログラムからのI/O要求を処理する処理経路に組み込まれる。これらI/O要求は矢印900で表される。これらI/O要求は、例えばオペレーティング・システム要求手法を介して、またはシステム・バスもしくはSANを通して伝達されるメッセージを介して、送出される。最下位の処理層930は従来のI/O処理層であり、例えばデバイス・ドライバである。層930の上の層には、今にも発生しそうなエラーを検出するエラー検出層(検出器)920があり、この層が図2〜図5に示す手順のいずれかを実装する。層920の上の層にはエラー回復層(データ書込み手段)910があり、この層は図6に示された手順(あるいは、図7の手順)を実装する。
図10において、検出および回復手順はディスク表面走査手順1000によって用いられる。この技法は、影響を及ぼされた領域が実際にユーザすなわちアプリケーション・プログラムによって参照されるときにこのような今にも発生しそうなエラーを検出することにのみ依存するのではなく、徐々に現れるエラーについてディスク・ドライブ(または全てのディスク・ドライブ)の全表面を走査するのが望ましいときに有効である。なお、両方の技法は単一のシステム内で組合せることができる。すなわち、図9の方法および図10の方法の両方は、1つのシステム内で同時に存在できる。これにより、ユーザのI/O処理の間に検出されるエラーからのリアルタイム回復と、ディスク全体またはディスク・アレイのエラーについてのバックグラウンド走査との両方を実現する。
表面走査手順1000は、例えばディスク・ドライブ全体またはディスク・ドライブ・アレイを走査する読出し要求を生成する。一般にこの手順は、アプリケーション性能に多大な影響を与えることを避けるために、システム負荷に応じるようになっている。これらI/O要求は下位層に伝えられる。最下位の処理層930は従来のI/O処理層、例えばデバイス・ドライバである。層930の上の層には、今にも発生しそうなエラーを検出するエラー検出層(検出器)920があり、この層が図2〜図5に示す手順のいずれかを実装する。層920の上の層にはエラー回復層(データ書込み手段)910があり、この層は図6に示された手順(あるいは、図7の手順)を実装する。
図11は、RAIDを実装している記憶装置システムに組み込まれた検出および回復手順の例を示す。最下位の処理層930は従来のI/O処理層であり、例えばデバイス・ドライバである。層930の上の層には、今にも発生しそうなエラーを検出するエラー検出層(検出器)920があり、この層が図2〜図5に示す手順のいずれかを実装する。層920の上の層にはRAIDサブシステム1100がある。RAIDサブシステム1100内に回復手順(データ書込み手段)1110が含まれており、図7で述べた手順を実装する。回復手順が個々のディスク・ドライブからのデータを回復できない場合には、回復手順は、RAIDの上位層の冗長手法を利用して損失データを復元する。この復元は、図7に示す通り、工程700および工程710においてエラーを訂正する。
図12A〜図12Bは、測定されたI/Oスループットがディスク・ブロック・アドレスに依存していることを示し、トラック・スクイーズのようなエラーによって影響を受けたスループットの例を示す。
グラフ1200は、正常に機能するドライブについて測定されたI/Oスループットの典型的な例である。このグラフはX軸のディスク・ブロック・アドレスに対するY軸のスループットを示す。図に示す通り、スループットは全ブロック・アドレスに対して一定ではなく、ブロック・アドレスに従って明瞭になめらかに変化している。この理由は、最新のディスク・ドライブでは、トラック当たり(すなわち、ディスクの一回転当たり)のブロック数がトラックの円周に従って変化しているからである。このため、外側(長い)トラックに近い小さいブロック番号はディスク回転当たり多数のセクタがアクセスされることになる。所定のディスク・ドライブ・モデルについては、予測されるスループットのグラフ1200は固定されており、ドライブ・メーカから提供されるデータ、またはシステム設計の間に測定されたデータもしくはドライブ型式の容認の一環として測定されたデータから知ることができる。
グラフ1210は、トラック・スクイーズのような徐々に現れるエラーによって生じるI/Oスループットの変化の例を示す。この例においては、グラフの領域1220は予測スループットよりも低く、正常でなめらかなグラフ1200の対応する領域から大きくずれている。このずれが設計で設定されたしきい値を超えると、図4で述べた手順において、今にも発生しそうなデータ損失の指示として用いられる。
本発明を好ましい実施形態により図示し、詳細に説明してきたが、当業者には、添付の特許請求の範囲の請求項に包含される本発明の範囲から逸脱することなく、形態または細部にさまざまな変更を加えるのが可能であることは理解されるであろう。
ディスク記憶装置が接続されたコンピュータ・システムを示す図である。 I/Oタイミング変化の観測に基づいて今にも発生しそうなエラーを検出する手順を示すフローチャートである。 SMARTエラー統計の観測に基づいて今にも発生しそうなエラーを検出する手順を示すフローチャートである。 連続するI/Oスループットの観測に基づいて今にも発生しそうなエラーを検出する手順を示すフローチャートである。 個々のI/Oタイミングの観測に基づいて今にも発生しそうなエラーを検出する手順を示すフローチャートである。 エラー修復手順の基本的方式を示すフローチャートである。 RAIDのような上位層冗長手法が実装されているシステムにおけるエラー修復手順を示すフローチャートである。 今にも発生しそうなエラーの検出手順に基づくディスク・ドライブ容認手順または故障解析手順における工程を示すフローチャートである。 オペレーティング・システム、記憶装置システム、またはディスク・ドライブのユーザI/O処理経路における検出および修復手順の階層化を示す図である。 オペレーティング・システム、記憶装置システム、またはディスク・ドライブの表面走査バックグラウンド手順における検出および修復手順の階層化を示す図である。 RAIDを実装しているオペレーティング・システムまたは記憶装置システムにおける検出および修復手順の階層化を示す図である。 正常動作しているディスク・ドライブについてのディスク・ドライブ・ブロック・アドレスに対するI/Oスループットの例を示すグラフである。 トラック・スクイーズによって影響を及ぼされたディスク・ドライブについてのディスク・ドライブ・ブロック・アドレスに対するI/Oスループットの例を示すグラフである。
符号の説明
920 検出器
910 データ書込み手段

Claims (48)

  1. 電磁記憶媒体の同心状に隣接するトラックにデータを記録する大容量データ記憶装置におけるエラー状態を処理する方法であって、
    上位層からの読出しI/O要求を受付ける工程と、
    前記読出しI/O要求に応答して、データを前記記憶媒体から読み出す読出しI/O動作を開始する開始工程と、
    前記読出しI/O動作を解析する解析工程と、
    前記読出しI/O動作の解析に基づいて、(a)前記読出しI/O動作が、要求されたデータを前記記憶媒体内の特定の領域から正常に読み出すことを判別する判別工程、(b)前記記憶媒体内の前記特定の領域から前記要求されたデータの前記読出しI/O動作によって実行された正常な読出しに関する性能測定値を計算する計算工程、(c)前記性能測定値をしきい値と比較する比較工程、および、(d)前記性能測定値と前記しきい値との比較の結果に基づき、前記記憶媒体内の前記特定の領域に対する、今後のトラック・スクイーズ・エラー状態を検出する検出工程と、
    前記判別工程が、前記読出しI/O動作が前記特定の領域からデータを正常に読み出したと判別した場合、前記受付けた上位層からの読出しI/O要求を正常に実行されたとして完了する工程と、
    前記判別工程が、前記読出しI/O動作が前記特定の領域からデータを正常に読み出したと判別し、かつ前記検出工程が前記特定の領域に対する今後のトラック・スクイーズ・エラー状態を検出した場合、前記特定の領域を含む少なくとも1つのトラックに、前記正常な読出しI/O動作によって取得されたデータを、再度戻して書込みを行い、前記受付けた上位層からの読出しI/O要求を正常に実行されたとして完了する、再度書込み工程とを備えた、エラー状態処理方法。
  2. 請求項1において、前記検出工程がさらに、入力/出力完了時間の変化がしきい値を超えているか否かを決定する、エラー状態処理方法。
  3. 請求項1において、前記検出工程がさらに、連続する読出しスループットが予測されるスループットよりも所定のしきい値量を超える差だけ小さいか否かを決定する、エラー状態処理方法。
  4. 請求項3において、前記予測されるスループットが、影響を及ぼされるトラックのブロック・アドレスの関数として決定されている、エラー状態処理方法。
  5. 請求項3において、前記予測されるスループットが、システム設計もしくはドライブ型式の容認の間にディスク型式について測定されたブロック・アドレスの関数として決定されている、エラー状態処理方法。
  6. 請求項1において、前記検出工程がさらに、個々のI/O要求のタイミングが予測される値よりもしきい値だけ遅いか否かを決定する、エラー状態処理方法。
  7. 請求項1において、前記検出工程がさらに、入力/出力(I/O)動作のタイムアウトが既に発生しているか否かを決定する、エラー状態処理方法。
  8. 請求項1において、前記再度書込み工程がさらに、前記特定の領域が存在するトラックを再度書き込む、エラー状態処理方法。
  9. 請求項8において、前記再度書込み工程がさらに、前記特定の領域を含む一連のトラックを再度書き込む、エラー状態処理方法。
  10. 請求項8において、前記再度書込み工程がさらに、データが回復不可能になる前に前記特定の領域からデータを読み出す、エラー状態処理方法。
  11. 請求項10において、前記再度書込み工程がさらに、前記特定の領域からデータを読み出すのに必要であれば、通常の特定された読出しタイムアウトよりも長いタイムアウトを許容する、エラー状態処理方法。
  12. 請求項8において、前記大容量記憶装置が、高可用性記憶アレイを実現するために用いられる大容量記憶装置アレイの不可欠な要素である、エラー状態処理方法。
  13. 請求項8において、前記再度書込み工程がさらに、前記特定の領域を1回再度書き込む、エラー状態処理方法。
  14. 請求項8において、前記再度書込み工程がさらに、前記特定の領域を複数回再度書き込む、エラー状態処理方法。
  15. 請求項1において、前記検出工程および前記再度書込み工程が、ディスク・ドライブがエンド・ユーザに使用されているときに、アプリケーション・プログラムの実行の間に実施される、エラー状態処理方法。
  16. 請求項1において、前記検出工程および前記再度書込み工程が、顧客から返却された故障ディスク・ドライブのフォールト解析に用いられる、エラー状態処理方法。
  17. 請求項1において、前記検出工程および前記再度書込み工程が、将来にハードウェア故障を被りそうなディスク・ドライブを検出するための予測手法として用いられる、エラー状態処理方法。
  18. 請求項1において、前記検出工程および前記再度書込み工程が、サーバ・コンピュータにおいて使用されるような汎用オペレーティング・システムに実装される、エラー状態処理方法。
  19. 請求項1において、前記検出工程および前記再度書込み工程が、記憶装置コントローラのファームウェアまたはハードウェアに実装される、エラー状態処理方法。
  20. 請求項1において、前記検出工程および前記再度書込み工程が、ローカル・コンピュータ・バスを介して接続された、コンピュータ・システム内の記憶装置コントローラに実装される、エラー状態処理方法。
  21. 請求項20において、前記ローカル・コンピュータ・バスがPCI(Peripheral Component Interconnect)バスである、エラー状態処理方法。
  22. 請求項1において、前記検出工程および前記再度書込み工程が、SAN(ストレージ・エリア・ネットワーク)に接続された記憶装置コントローラに実装される、エラー状態処理方法。
  23. 請求項1において、前記検出工程および前記再度書込み工程が、1つまたは複数のディスク・ドライブ・アセンブリ内に配置されたドライブ電子回路に実装される、エラー状態処理方法。
  24. 請求項1において、前記検出工程および前記再度書込み工程が、ホスト・コンピュータで実行する汎用オペレーティング・システム、記憶装置コントローラのファームウェア、またはディスク・ドライブ・アセンブリ内に配置されたドライブ電子回路から成るグループから選択される1つまたは複数の場所に、分散方式で実装される、エラー状態処理方法。
  25. 電磁記憶媒体の同心状に隣接するトラックにデータを記録する大容量データ記憶装置におけるエラー状態を処理する装置であって、
    上位層からの読出しI/O要求を受付ける要求受付手段と、
    前記読出しI/O要求に応答して、データを前記記憶媒体から読み出す読出しI/O動作を開始するデータ要求手段と、
    前記読出しI/O動作を解析する検出器であって、前記読出しI/O動作の解析に基づいて、
    (a)要求されたデータを前記記憶媒体内の特定の領域から正常に読み出すことを判別し、(b)前記記憶媒体内の前記特定の領域から前記要求されたデータの前記読出しI/O動作によって実行された正常な読出しに関する性能測定値を計算し、(c)前記性能測定値をしきい値と比較し、(d)前記記録媒体内の前記特定の領域に対する、今後のトラック・スクイーズ・エラー状態を検出する、検出器と、
    前記検出器が、前記読出しI/O動作が前記特定の領域からデータを正常に読み出したと判別した場合、前記受付けた上位層からの読出しI/O要求を正常に実行されたとして完了するI/O動作完了手段と、
    前記検出器が、前記読出しI/O動作が前記特定の領域からデータを正常に読み出したと判別し、かつ前記特定の領域に対する今後のトラック・スクイーズ・エラー状態を検出した場合、前記記憶媒体の前記特定の領域を含む少なくとも1つのトラックに、前記正常な読出しI/O動作によって取得されたデータを、戻して再度書込みを行い、前記受付けた上位層からの読出しI/O要求を正常に実行されたとして完了するデータ書込み手段とを備えた、エラー状態処理装置。
  26. 請求項25において、前記検出器がさらに、しきい値を超える入力/出力(I/O)完了時間の変化を決定する比較器を備えた、エラー状態処理装置。
  27. 請求項25において、前記検出器がさらに、連続する読出しスループットが予測されるスループットよりも所定のしきい値量を超える差だけ小さいか否かを決定する比較器を備えた、エラー状態処理装置。
  28. 請求項27において、前記予測されるスループットが、影響を及ぼされるトラックのブロック・アドレスの関数として決定されている、エラー状態処理装置。
  29. 請求項27において、前記予測されるスループットが、システム設計もしくはドライブ型式の容認の間にディスク型式について測定されたブロック・アドレスの関数として決定されている、エラー状態処理装置。
  30. 請求項25において、前記検出器がさらに、個々の入力/出力(I/O)要求のタイミングが予測される値よりもしきい値だけ遅いか否かを決定する比較器を備えた、エラー状態処理装置。
  31. 請求項25において、前記検出器がさらに、入力/出力(I/O)動作のタイムアウトが既に発生しているか否かを決定する比較器備えた、エラー状態処理装置。
  32. 請求項25において、前記データ書込み手段がさらに、前記特定の領域が存在するトラックを再度書き込む、エラー状態処理装置。
  33. 請求項32において、前記データ書込み手段がさらに、前記特定の領域を含む一連のトラックを再度書き込む、エラー状態処理装置。
  34. 請求項32において、さらに、データが回復不可能になる前に前記特定の領域からデータを読み出すデータ読出し手段を備えた、エラー状態処理装置。
  35. 請求項34において、前記データ読出し手段がさらに、前記特定の領域からデータを読み出すのに必要であれば、通常の特定された読出しタイムアウトよりも長いタイムアウトを許容する構成要素を備えた、エラー状態処理装置。
  36. 請求項32において、前記大容量記憶装置が、高可用性記憶アレイを実現するために用いられる大容量記憶装置アレイの不可欠な要素である、エラー状態処理装置。
  37. 請求項32において、前記データ書込み手段が前記特定の領域を少なくとも1回再度書き込む、エラー状態処理装置。
  38. 請求項32において、前記データ書込み手段がさらに、前記特定の領域を複数回再度書き込む、エラー状態処理装置。
  39. 請求項25において、前記検出器および前記データ書込み手段が、ディスク・ドライブがエンド・ユーザに使用されているときに、アプリケーション・プログラムとして少なくとも一部に実装されている、エラー状態処理装置。
  40. 請求項25において、前記検出器および前記データ書込み手段が、顧客から返却された故障ディスク・ドライブのフォールト解析に用いられる、エラー状態処理装置。
  41. 請求項25において、前記検出器および前記データ書込み手段が、将来にハードウェア故障を被りそうなディスク・ドライブを予測するのに用いられる、エラー状態処理装置。
  42. 請求項25において、前記検出器および前記データ書込み手段が、サーバ・コンピュータにおいて使用されるような汎用オペレーティング・システムに少なくとも部分的に実装される、エラー状態処理装置。
  43. 請求項25において、前記検出器および前記データ書込み手段の少なくとも一部が、記憶装置コントローラのファームウェアまたはハードウェアに実装される、エラー状態処理装置。
  44. 請求項25において、前記検出器および書込み装置の少なくとも一部が、ローカル・コンピュータ・バスを介して接続された、コンピュータ・システム内の記憶装置コントローラに実装される、エラー状態処理装置。
  45. 請求項44において、前記ローカル・コンピュータ・バスがPCI(Peripheral Component Interconnect)バスである、エラー状態処理装置。
  46. 請求項25において、前記検出器および前記データ書込み手段が、SAN(ストレージ・エリア・ネットワーク)に接続された記憶装置コントローラに実装される、エラー状態処理装置。
  47. 請求項25において、前記検出器および前記データ書込み手段の少なくとも一部が、1つまたは複数のディスク・ドライブ・アセンブリ内に配置されたドライブ電子回路に実装される、エラー状態処理装置。
  48. 請求項25において、前記検出器および前記データ書込み手段が、ホスト・コンピュータで実行する汎用オペレーティング・システム、記憶装置コントローラのファームウェア、またはディスク・ドライブ・アセンブリ内に配置されたドライブ電子回路から成るグループから選択される1つまたは複数の場所に、分散方式で実装される、エラー状態処理装置。
JP2005134986A 2004-05-07 2005-05-06 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法 Active JP5078235B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/841,258 US7475276B2 (en) 2004-05-07 2004-05-07 Method for maintaining track data integrity in magnetic disk storage devices
US10/841,258 2004-05-07

Publications (2)

Publication Number Publication Date
JP2005322399A JP2005322399A (ja) 2005-11-17
JP5078235B2 true JP5078235B2 (ja) 2012-11-21

Family

ID=34941208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005134986A Active JP5078235B2 (ja) 2004-05-07 2005-05-06 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法

Country Status (3)

Country Link
US (2) US7475276B2 (ja)
EP (1) EP1594123A3 (ja)
JP (1) JP5078235B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7490270B2 (en) * 2004-11-09 2009-02-10 Dell Products L.P. Method, system, and software for rebuilding a storage drive
JP2007242207A (ja) * 2006-03-13 2007-09-20 Fujitsu Ltd ディスク装置の媒体スキャン方法
US20070294588A1 (en) * 2006-05-09 2007-12-20 Coulson Richard L Performing a diagnostic on a block of memory associated with a correctable read error
JP2008010113A (ja) * 2006-06-30 2008-01-17 Fujitsu Ltd 磁気ディスク制御装置、磁気ディスク装置および読取り障害修復方法
US7522366B2 (en) 2006-11-30 2009-04-21 Lenovo (Singapore) Pte. Ltd. Preservation of hard drive data via preliminary detection of adjacent track interference potential
US7774539B2 (en) 2007-02-07 2010-08-10 Lenovo (Singapore) Pte. Ltd Preservation of hard drive data via dynamic band boundary definition
JP4456626B2 (ja) * 2007-09-28 2010-04-28 富士通株式会社 ディスクアレイ装置、ディスクアレイ装置制御プログラムおよびディスクアレイ装置制御方法
US8176149B2 (en) * 2008-06-30 2012-05-08 International Business Machines Corporation Ejection of storage drives in a computing network
CN102708019B (zh) * 2012-04-28 2014-12-03 华为技术有限公司 一种硬盘数据恢复方法、装置及系统
US8867161B2 (en) 2013-03-15 2014-10-21 Seagate Technology Llc Shingled magnetic recording with variable track spacing
JP6155768B2 (ja) * 2013-03-29 2017-07-05 富士通株式会社 ストレージ制御装置、ストレージ制御プログラム及びストレージ制御方法
EP3022736A1 (en) * 2013-07-15 2016-05-25 Hewlett Packard Enterprise Development LP Rebuilding drive data
US9594698B2 (en) 2013-08-13 2017-03-14 Dell Products, Lp Local keying for self-encrypting drives (SED)
US10013280B2 (en) * 2013-09-30 2018-07-03 Dell Products, Lp System and method for host-assisted background media scan (BMS)
JP6252285B2 (ja) 2014-03-24 2017-12-27 富士通株式会社 ストレージ制御装置、制御方法、及びプログラム
US10339079B2 (en) 2014-06-02 2019-07-02 Western Digital Technologies, Inc. System and method of interleaving data retrieved from first and second buffers
US9117463B1 (en) 2014-06-23 2015-08-25 Western Digital Technologies, Inc. Data storage device erasing multiple adjacent data tracks to recover from inter-track interference
US9367254B2 (en) 2014-06-27 2016-06-14 HGST Netherlands B.V. Enhanced data verify in data storage arrays
JP2017062715A (ja) * 2015-09-25 2017-03-30 富士通株式会社 ストレージ装置、制御ユニット、及び制御プログラム
US9607633B1 (en) 2016-04-06 2017-03-28 Seagate Technology Llc Shingled magnetic recording interband track pitch tuning
CN106648948B (zh) * 2016-12-28 2020-04-03 四川秘无痕科技有限责任公司 一种针对西数硬盘11号模块损坏的修复方法
US11023605B1 (en) * 2017-04-20 2021-06-01 EMC IP Holding Company LLC Data access threat detection and prevention
US10418062B2 (en) 2017-12-19 2019-09-17 International Business Machines Corporation Efficient rewrite using larger codeword sizes

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US257617A (en) * 1882-05-09 Dredging-machine
US4516165A (en) * 1982-12-27 1985-05-07 International Business Machines Corporation Error recovery procedure using selective erasure
US5166936A (en) 1990-07-20 1992-11-24 Compaq Computer Corporation Automatic hard disk bad sector remapping
US5974544A (en) 1991-12-17 1999-10-26 Dell Usa, L.P. Method and controller for defect tracking in a redundant array
JPH05257617A (ja) 1992-03-12 1993-10-08 Nec Corp 磁気ディスクサブシステム
US5379162A (en) 1993-08-19 1995-01-03 International Business Machines Corporation Customized data recovery procedures selected responsive to readback errors and transducer head and disk parameters
KR100208383B1 (ko) * 1997-06-03 1999-07-15 윤종용 하드 디스크 드라이브의 용량변환 생산방법
JP3184171B2 (ja) * 1998-02-26 2001-07-09 日本電気株式会社 ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
JPH11306695A (ja) 1998-04-27 1999-11-05 Mitsumi Electric Co Ltd 磁気記録媒体のディフェクト管理方法、およびその方法を実現するプログラムを記録した記録媒体
US6405277B1 (en) 1998-11-06 2002-06-11 International Business Machines Corporation Method and system for writing data to a magnetic storage device in a relatively cold or hot environment
US6442705B1 (en) 1999-04-26 2002-08-27 International Business Machines Corporation Method of and apparatus for improving data integrity in a disk drive system
JP2000311452A (ja) * 1999-04-28 2000-11-07 Nec Corp 磁気ディスク装置
JP2000322334A (ja) 1999-05-13 2000-11-24 Nec Soft Ltd 入出力自動性能監視システム
US6710952B1 (en) * 2000-01-19 2004-03-23 Hitachi Global Storage Technologies Netherlands, B.V. System and method for gracefully relinquishing a computer hard disk drive from imminent catastrophic failure
US6384599B1 (en) * 2000-02-01 2002-05-07 International Business Machines Corporation System, method, and program for analyzing offset track errors in a storage system
US6628471B1 (en) * 2000-06-16 2003-09-30 Seagate Technology Llc Detection and cancellation of cage frequency using the clock head in a servowriter
US6882489B1 (en) * 2000-08-15 2005-04-19 Maxtor Corporation Dynamic off-track detector
US6785084B2 (en) * 2000-10-24 2004-08-31 Seagate Technology Llc Correction of dynamic track spacing errors in storage devices
JP2004063013A (ja) * 2002-07-30 2004-02-26 Matsushita Electric Ind Co Ltd Av性能検査方法とそれを用いた磁気ディスク装置の製造方法および磁気ディスク装置
JP2004110946A (ja) * 2002-09-19 2004-04-08 Hitachi Ltd 磁気ディスク装置
JP4063694B2 (ja) * 2003-03-11 2008-03-19 株式会社日立グローバルストレージテクノロジーズ 磁気ディスク装置
SG118195A1 (en) * 2003-07-10 2006-01-27 Agency Science Tech & Res Detection of track misregistration within user data channel
JP2005116096A (ja) * 2003-10-09 2005-04-28 Toshiba Corp ディスク記憶装置及びサーボ書込み方法
US7650686B2 (en) * 2007-12-28 2010-01-26 Hitachi Global Storage Technologies Netherlands B.V. Servo track writer clockhead radius jig

Also Published As

Publication number Publication date
US8190945B2 (en) 2012-05-29
EP1594123A3 (en) 2007-08-29
JP2005322399A (ja) 2005-11-17
US20090083584A1 (en) 2009-03-26
US7475276B2 (en) 2009-01-06
US20050262400A1 (en) 2005-11-24
EP1594123A2 (en) 2005-11-09

Similar Documents

Publication Publication Date Title
JP5078235B2 (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
US7971093B1 (en) Apparatus and method to proactively address hard disk drive inefficiency and failure
Ma et al. RAIDShield: characterizing, monitoring, and proactively protecting against disk failures
US10013321B1 (en) Early raid rebuild to improve reliability
EP2778926B1 (en) Hard disk data recovery method, device and system
US8185784B2 (en) Drive health monitoring with provisions for drive probation state and drive copy rebuild
US7543178B2 (en) Low cost RAID with seamless disk failure recovery
US6886108B2 (en) Threshold adjustment following forced failure of storage device
US6922801B2 (en) Storage media scanner apparatus and method providing media predictive failure analysis and proactive media surface defect management
JP4886209B2 (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
US7761660B1 (en) Identifying suspect disks
US7631067B2 (en) Server initiated predictive failure analysis for disk drives
JP4114877B2 (ja) 不正データを検出するための装置、方法、及びプログラム
JP2006268673A (ja) 記憶制御装置及び記憶デバイスのエラー制御方法
US10795790B2 (en) Storage control apparatus, method and non-transitory computer-readable storage medium
US8782465B1 (en) Managing drive problems in data storage systems by tracking overall retry time
US20060215456A1 (en) Disk array data protective system and method
US20070036055A1 (en) Device, method and program for recovering from media error in disk array device
WO2012049760A1 (ja) ストレージ制御装置における基準時間設定方法
US7805659B2 (en) Method and data storage devices for a RAID system
JP4775843B2 (ja) ストレージシステム及び記憶制御方法
US7506224B2 (en) Failure recovering method and recording apparatus
US20060245103A1 (en) Storage device system operating based on system information, and method for controlling thereof
US20150286546A1 (en) Hard drive backup
US7174476B2 (en) Methods and structure for improved fault tolerance during initialization of a RAID logical unit

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081016

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090508

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100409

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100511

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20100909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100913

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101025

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20101112

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110927

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120828

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150907

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5078235

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250