JPH02246004A - 磁気ディスク装置の媒体障害早期検出方式 - Google Patents

磁気ディスク装置の媒体障害早期検出方式

Info

Publication number
JPH02246004A
JPH02246004A JP6721589A JP6721589A JPH02246004A JP H02246004 A JPH02246004 A JP H02246004A JP 6721589 A JP6721589 A JP 6721589A JP 6721589 A JP6721589 A JP 6721589A JP H02246004 A JPH02246004 A JP H02246004A
Authority
JP
Japan
Prior art keywords
error
magnetic disk
logging information
log analysis
physical address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6721589A
Other languages
English (en)
Inventor
Kunio Yajima
矢島 邦夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6721589A priority Critical patent/JPH02246004A/ja
Publication of JPH02246004A publication Critical patent/JPH02246004A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Digital Magnetic Recording (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔目次〕 概要 産業上の利用分野 従来の技術 発明が解決しようとする課題 課題を解決するための手段(第1図) 作用 実施例(第2図、第3図) 発明の効果 〔概要〕 磁気ディスク装置の媒体障害の早期検出方式C:関し、
使用中(二発生した媒体障害を早期(=検知することを
目的とし。
磁気ディスク装置な有するコンビーータシステム(−お
いて、ロギング情報を保持するロギング情報保持部と、
ロギング情報を分析して磁気ディスク装置のエラー情報
を収集するログ分析部と、ログ分析部・の分析結果を保
持しておくログ分析結果テーブルと、ログ分析結果テー
ブル(二記入された分析結果からコレクタブルエラーを
抽出するECCエラー分析部と、このコレクタブルエラ
ーの修正データをエラー発生箇所と同一の物理アドレス
に再度書き込む再書込処理部と、同一の物理アドレス鑑
;おいて再書込処理を行う毎口その回数を累積するEC
Cエラー箇所管理テーブルを設け。
再書込処理の回数を参照して予め定められた回数以上(
:なったとき、媒体面(二障害が発生したものと判定す
る。
〔産業上の利用分野〕 本発明は、磁気ディスク装置の媒体の障害を早期(=検
出するための方式1:係り2%(二、電子計算機関連の
磁気ディスク装置のリードエラー発生を自動的(:分析
し9分析結果に基づいて媒体面(:発生したキズな早期
(=検出する媒体障害早期検出方式(二関する。
近年、電子計算機システムの増加、または大規模化によ
り磁気ディスク装置の設置台数が非常(;増加している
。磁気ディスク装置は大量のデータを蓄積する手段とし
て非常(=優れているが1時としてハードウェアの障害
(二より磁気媒体面(:キズがつけられることがあり、
この箇所ではデータの破壊が起こることがある。データ
が破壊された場合1:は、そのデータの復元ミニ多大な
時間と労力を必要とする。このため、媒体面でのキズな
できるだけ早期に検出し、その箇所でのデータの書き込
みを防止し、或いは早期に保守することを可能とするこ
とが望まれている。
〔従来の技術〕
従来の磁気ディスク装置では、特定のトラックでリード
エラーが発生した場合(:は、オペレーティングシステ
ムの再試行処理により再リード処理を行い、エラー回復
を行りていた。そして、保守員は、O8の再試行で記録
するエラーロギング情報を解析して、媒体面のキズの発
生を判断し、それに応じて必要なメンテナンスを行って
いた。
〔発明が解決しようとする課題〕
以上(二述べたとおり、従来では、リードエラーが発生
している障害の調査のため(:は、O8の記録したエラ
ーロギング情報を人手(二よってまとめ解析して調べる
方法しかなく、シたがって、磁気ディスク装置の直接的
な障害の原因追求は困難であるという課題を有している
本発明は、このような点に鑑みてなされたものであり、
リードエラーが発生しているト、ラック(二対して自動
的に再書き込み処理を行うと共(=、その再書き込みの
結果を解析して固定的な障害のみを早期(=抽出し、保
守作業を行うための情報を提供することを目的とする。
〔課題を解決するための手段〕
第1図は1本発明の原理図である。
第1図)二おいて、8は、複数台の磁気ディスク装置8
1.82・・・シーより構成されている外部記憶装置と
しての磁気ディスク記憶システムである。
1はロギング情報保持部であり、磁気ディスク装置8の
エラーロギング情報を含む電子計算機システムの運用(
二関する情報が蓄積・保持されている。このエラーロギ
ング情報は、電子計算機システム全体の制御をつかさど
るO8+二よって収集され、記録されている。
2はログ分析部であり、ロギング情報保持部1(二保持
された情報を分析し、磁気ディスク装置のリードエラー
に関する情報を集め、かつ、それらの個々のエラー(二
つきその発生箇所、そのエラー種別、さらに必要ならば
その重要度をログ分析テーブル3として整理し、記録す
る。
4はECCエラー分析部であり、前述のログ分析結果テ
ーブル3を参照し、その中からコレクタブルエラーのみ
を選択して、そのエラーが発生した磁気ディスク装置の
媒体面の物理アドレスを求める。
5は再書き込み処理部であり、コレクタブルエラーとな
った物理アドレス(:記録されているデータを一旦メモ
リ上6二読み込んだ後に、正しいデータ6二修正し、こ
れを同一のアドレス(:再書き込みを行う。この物理ア
ドレスはECCエラー箇所管理テーブル6に記録してお
く。
以上礁:述べた一連の処理はリードエラーが発生する毎
(:行われ、その都度BCCCCニラ−管理テーブル媚
:追加書き込みがなされる。同一の物理アドレスでリー
ドエラーが発生し、再書き込み処理がなされた場合(:
は、ECCCCニラ所管理テーブル舊:はその回数、こ
の場合は、「2」が書き込まれる。
7は比較判定部であり、gccエラー箇所管理テーブル
6に記載された特定の物理アドレスでのエラーの発生が
予め決められた回数以上(二なったことを検出しアラー
ムを出し、その特定の物理アドレスの媒体面1:おいて
キズが発生していることを知らせる。
〔作用〕
本発明では、ECCCCニラ一部にて、エラー田キング
情報保持部(:保持されたエラーに対して分析を行い、
訂正可能なリードエラーのみを抽出し再書き込みを行い
、再書き込みを実施した媒体上のアドレスをテーブルに
記憶しておくので、さらに、その後に発生したFSCC
エラーを計数すること(二より、特定の物理アドレスで
訂正可能なリードエラーが集中して発生していることを
自動的(;知ることができる。
したがって、保守担当員はECCエラー箇所管理テーブ
ルを参照することζ二より、或いは比較判定部からのア
ラーム出力を見ることにより、直ちに媒体の保守作業を
実施することができる。
〔実施例〕
第2図は、この発明の一実施例であり、第2図(ト)は
実施例の機能ブロック図、第2図0はログ分析結果テー
ブルの例を示す図、第2図0はECCエラー箇所管理テ
ーブルの例を示す図である。
第2図(=おいて、第1図と同一の部分(二ついては同
一の番号を付与しているので、その部分(二ついての詳
細な説明は省略する。
第2図(ト)(=おいて、1はロギング情報保持部。
2はログ分析部、3はログ分析テーブル、4はECCエ
ラー分析部、5は再書き込み処理部、6はECCエラー
箇所管理テーブル、7は比較判定部、8は複数台の磁気
ディスク装置81.82・・・により構成されている外
部記憶装置としての磁気ディスク記憶システムであり、
これらの部分は第1図(二足した本発明の原理図と同一
である。
10はCPUであり、前述の各部分の制御を行う。11
はCPUl0を含めた電子計算機システムの動作制御の
ためのO8を示しており、メインメモリ中(二保持され
ている。12は磁気ディスク記憶システムへのインタフ
ェースであり、I!取制御部、書込制御部I:より構成
されている。
実際には、ログ分析部2.ECCエラー分析部4、再書
込処理部5.比較判定部7は前述のCPUl0を含む電
子計算機システムのメインメモリ中にプログラムとして
設けられており、エラーロギング情報保持部1.ログ分
析結果テーブル3、ECCエラー箇所管理テーブル6は
メインメモリ中も一特定のメモ領域として確保されてい
る。
エラーロギング情報保持部1へのエラー情報は。
エラーロギング情報抽出部90より抽出される。
この実施例(二おいては、エラーロギング情報抽出部9
は、08部11ζ:備えられているシステム記録(LO
ggjng)の機能を利用している。
第3図を参照してこの実施例の動作を説明する。
今、磁気ディスク装置81〜8nを使用中口リードエラ
ー等のエラーが発生すると(ステップ1)。
これはエラーロギング情報抽出部9により抽出されてエ
ラーロギング情報保持部1(=保持される(ステップ2
)。ログ分析部2はこのエラーロギフグ情報保持部1中
のエラー情報を分析し、そのエラーがコレクタプルなエ
ラーであるか(ECCエラー)、或いは回復できないエ
ラーであるか。
リライトしたとき4:回復できるようなエラーであるか
の種別、さらにそのエラーの重要度等を求める。第2図
但)は、このログ分析部2による分析の結果作成された
四グ分析結果テーブルの例であり、エラーが起きた箇所
の物理アドレス、エラー種別9重要度が示されている(
ステップ3.4)。
次いで、ECCCCニラ−分析線、ログ分析部2での分
析結果であるログ分析テーブル3を参照して、その中か
ら、訂正可能なエラー(コレクタブルエラー)のみを抽
出し、その物理アドレスを求める(ステップ5)。この
物理アドレスを−1メモリ上(=読み込みこんだ後4−
9同−物理アドレス(二修正データを再書き込みを行う
。再書き込みは再書込処理部5C:よりてインタフェー
ス12を介して行われる(ステップ6)。この時、再び
リードエラーが発生した場合(:は、この特定の物理ア
ドレスの箇所でのエラー回数1が]13CCエラー箇所
管理テーブル61=記録されることになる(ステ、プ7
)。
ECCエラー箇所管理テーブル6は2例えば第2図Oに
足すものであり、このエラー発生回数をその発生した物
理アドレスと共に記録しておくテーブルであり、必要(
:応じて物理アドレスの場所等鴫二よる緊急度を記載す
る。
以上に連べた一連の処理は、磁気ディスク装置81〜8
nにおいてエラーが検出される毎4:行われる。し、た
がって、検出されたエラーがコレクタブルエラー(EC
Cエラー)であるときには。
ECCエラー箇所管理テーブル6が新た(二書き換えら
れることになる。また、検出されたエラーが。
既l:、 以前にコレクタブルエラーを起こしたことが
ある場所と同一の物理アドレスであるときには。
ECCエラー箇所管理テーブル6の発生回数が累積更新
されること(二なる。
このBCCCC工部−箇所管理テーブル6照しつつ、特
定のアドレスでのエラー発生回数が予め決められた回数
以上(二なりた時(二、比較判定部7によりアラームを
出すようにしてもよい。
なお、エラーロギング情報保持部IC=リストアツブさ
れた種々のエラーの内、パーマネントエラーは回復でき
ないエラーであり、既に固定的なエラーを起こしている
ものと判定できるものである。
また、リトライ6:よってリードC:成功したものは。
その原因がヘッドの汚れ等4:基づくものと考えられ、
ヘッドを掃除すること等によりその原因が取り除かれ得
るものである。
〔発明の効果〕
以上述べたとおり1本発明(:よれば、使用中に生じた
訂正可能な1ビツトエラー(ECCエラー)を起こすよ
うな媒体面のキズな1通常の使用状態のままその磁気デ
ィスクの物理アドレスと共に。
早期に発見することが可能となり、効率の良い保守作業
ができることになる。
第2図は1本発明の実施例を示す図。
第3図は1本発明の実施例の動作を説明するための動作
説明図である。
1・・・ロギング情報保持部。
2・・・ログ分析部。
3・・・ログ分析結果テーブル。
4・、、 E CCエラー分析部。
5・・・再書込処理部。
6・・・ECCエラー箇所管理テーブル7・・・・比較
判定部。
8・・・磁気ディスク記憶システム。
補出願人 富士通株式会社

Claims (1)

  1. 【特許請求の範囲】 磁気ディスク装置(81〜8n)を有するコンピュータ
    システムにおいて ロギング情報を保持するロギング情報保持部(1)と、 ロギング情報を分析して磁気ディスク装置のエラー情報
    を収集するログ分析部(2)と、 ログ分析部(2)の分析結果を保持しておくログ分析結
    果テーブル(3)と、 ログ分析結果テーブル(3)に記入された分析結果から
    コレクタブルエラーを抽出するECCエラー分析部(4
    )と、 このコレクタブルエラーの修正データをエラー発生箇所
    と同一の物理アドレスに再度書き込む再書込処理部(5
    )と、 同一の物理アドレスにおいて再書込処理を行う毎にその
    回数を累積するECCエラー箇所管理テーブル(6)を
    設け、 再書込処理の回数を参照して予め定められた回数以上に
    なつたとき、媒体面に障害が発生したものと判定するよ
    うにしたことを特徴とする磁気ディスク装置の媒体障害
    早期検出方式。
JP6721589A 1989-03-18 1989-03-18 磁気ディスク装置の媒体障害早期検出方式 Pending JPH02246004A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6721589A JPH02246004A (ja) 1989-03-18 1989-03-18 磁気ディスク装置の媒体障害早期検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6721589A JPH02246004A (ja) 1989-03-18 1989-03-18 磁気ディスク装置の媒体障害早期検出方式

Publications (1)

Publication Number Publication Date
JPH02246004A true JPH02246004A (ja) 1990-10-01

Family

ID=13338466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6721589A Pending JPH02246004A (ja) 1989-03-18 1989-03-18 磁気ディスク装置の媒体障害早期検出方式

Country Status (1)

Country Link
JP (1) JPH02246004A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223996A (ja) * 2008-03-18 2009-10-01 Fujitsu Ltd 記録装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223996A (ja) * 2008-03-18 2009-10-01 Fujitsu Ltd 記録装置

Similar Documents

Publication Publication Date Title
US4549295A (en) System for identifying defective media in magnetic tape storage systems
US7627786B2 (en) Tracking error events relating to data storage drives and/or media of automated data storage library subsystems
US7522366B2 (en) Preservation of hard drive data via preliminary detection of adjacent track interference potential
US7206151B2 (en) System, method and computer program product for tape failure detection
US6842867B2 (en) System and method for identifying memory modules having a failing or defective address
US5467361A (en) Method and system for separate data and media maintenance within direct access storage devices
US7506224B2 (en) Failure recovering method and recording apparatus
CN117271190A (zh) 硬件可纠正错误处理方法及系统
JPH02246004A (ja) 磁気ディスク装置の媒体障害早期検出方式
US7500145B2 (en) Anomaly-driven software switch to capture event responses and automate recovery
KR20110039416A (ko) 인터럽트된 기록 복구를 위한 데이터 저장 방법, 장치 및 시스템
US20090271663A1 (en) Providing detailed program state information for error analysis
JP2880701B2 (ja) ディスクサブシステム
US6229743B1 (en) Method of a reassign block processing time determination test for storage device
JPH1050005A (ja) 光ディスク欠陥管理方法および装置
JPH08137764A (ja) 記憶装置のソフトエラー回復方法と固定障害検出方法
JPS6051142B2 (ja) ロギングエラ−制御方式
JP4267396B2 (ja) 異常要因記憶回路
JPH0441375B2 (ja)
JPH04123242A (ja) 書込みエラー識別方式
JPH0374422B2 (ja)
CN101206896B (zh) 写遗漏检测器和写遗漏检测方法
JPH03290877A (ja) 記憶装置の媒体エラー自動修復方法
JPH03256283A (ja) 磁気ディスク装置のヘッドクラッシュ回避方法
JPH0370871B2 (ja)