JPH0574059A - デイスク装置の診断方式 - Google Patents

デイスク装置の診断方式

Info

Publication number
JPH0574059A
JPH0574059A JP4053605A JP5360592A JPH0574059A JP H0574059 A JPH0574059 A JP H0574059A JP 4053605 A JP4053605 A JP 4053605A JP 5360592 A JP5360592 A JP 5360592A JP H0574059 A JPH0574059 A JP H0574059A
Authority
JP
Japan
Prior art keywords
diagnosis
disk
channel
read
disk device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4053605A
Other languages
English (en)
Inventor
Norihiko Oshita
典彦 尾下
Hisaharu Takeuchi
久治 竹内
Mitsuaki Nitsuta
満秋 仁田
Takayuki Umemoto
貴幸 梅本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4053605A priority Critical patent/JPH0574059A/ja
Publication of JPH0574059A publication Critical patent/JPH0574059A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 オンライン中か否かを問わずまた上位装置に
負荷を掛けずに、デイスク制御装置が独自に配下のデイ
スク媒体の欠陥を容易に摘出できるリード診断方式を提
供する。 【構成】 制御装置3内の診断制御タイマ32と診断制
御用カウンタ33により過去の一定時間のチヤネルから
の命令に関与する入出力処理頻度(入出力動作回数又は
チヤネルとの接続回数)を求め、この頻度に応じて、制
御装置3は、独自にデイスク装置6のリード診断の可否
及びリード診断対象トラツク数を決定し、入出力動作の
空き時間に独自にリード診断動作を実行する。リード診
断中、チヤネルから起動要求があつたときは、診断を終
了し、起動要求を受付ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ処理システムに
おけるデイスク装置(入出力装置)の診断方式に関し、
特にデイスク装置内のデイスク表面上即ちトラツク上の
欠陥を摘出するためのリード診断をデイスク制御装置が
独自に実行するデイスク装置の診断方式に関する。
【0002】
【従来の技術】従来のデイスク装置の診断に関しては、
たとえば特公平2−46968号公報に、チヤネルが発
行するI/O命令の集合によつて下位のデイスク装置の
診断を行う手段が提案されている。ここでは、チヤネル
装置は、配下のデイスク装置やパスに障害が発生したと
きに、デイスクの空き領域をしらべ、空き領域が見付か
つたときにそこに診断用領域を設定して、ライト及びリ
ード診断を行うことが示されている。この様にチヤネル
からの制御によつて実行されるデイスク装置の診断処理
は、障害発生時に行われることが一般的である。
【0003】
【発明が解決しようとする課題】上記従来技術では、デ
イスク装置の診断処理は、障害発生時に、チヤネル起動
によつて実行されるのが一般的であり、デイスク媒体表
面の欠陥によつて発生するエラーについては、ユーザが
長期間アクセスしないトラツク上に欠陥が存在する場合
に、それを前もつて摘出することは困難である。さら
に、オンライン中に常時診断処理を行おうとすれば、チ
ヤネル以上の部位の負荷を重くしシステムの効率を低下
させる恐れがある。
【0004】また、データ処理システムの様なコンピユ
ータシステムに於いては、24時間運転にみられるよう
な連続運転が一般的になつてきており、その外部記憶装
置であるデイスク装置の記録媒体の点検を行うための診
断専用時間を設けることが困難な状況になつている。
【0005】従つて、本発明の目的は、上記従来技術の
問題点を解決し、チヤネル以上の部位に負荷をかけるこ
となく、デイスク媒体表面上の欠陥を指摘するリード診
断を、オンライン中であつてもシステムの利用効率への
悪影響を低減しながら実行すると共に、ユーザが長時間
アクセスしないデイスク媒体表面上の欠陥の摘出を容易
にしたデイスク装置診断方式を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、本発明のデイスク装置の診断方式は、チヤネル(上
位CPUを含む)とデイスク制御装置及びデイスク装置
間の過去の一定時間における通常の入出力処理の頻度に
対応して、デイスク制御装置が独自にリード診断実行の
可否とリード診断の対象となるトラツク数を決定し、且
つ、通常の入力動作である、チヤネルからの命令に関与
する入出力動作の空き時間にデイスク制御装置が独自に
リード診断動作を実行するように構成したことを特徴と
する。
【0007】前記過去の一定時間における通常の入出力
処理の頻度としては、この一定時間中のチヤネルからの
命令に関与する入出力動作回数、またはデイスク制御装
置とチヤネルとの接続回数が用いられる。
【0008】本発明は、また、リード診断中にチヤネル
からの起動要求またはデイスク装置に対するリード診断
以外の処理の必要性を検出した場合には当該リード診断
契機を終了して必要な処理に移るように構成する。
【0009】また、デバイスアドレス毎にリード診断で
検出したエラー回数を管理しエラー回数が一定値に達す
ると当該デバイスアドレスに対するリード診断を閉塞さ
せる。
【0010】更に、ユーザが長期間アクセスしないトラ
ツクのレコード上の欠陥の摘出を容易にするために、デ
イスク制御装置が独自にデイスク装置の全デバイスアド
レスのすくなくとも全ユーザトラツクに対してリード診
断を実行し、リード診断で検出したエラー及びリード診
断の実行状況をチヤネルに又は保守用回線を介して報告
し、また、不揮発性の制御用メモリを持たないデイスク
制御装置においてはデイスク制御装置の電源投入後のリ
ード診断開始シリンダアドレスを乱数値を用いて決定す
る。
【0011】
【作用】上記構成に基づく作用に説明する。
【0012】本発明によれば、デイスク制御装置が、独
自にデイスク装置のリード診断を実行すると共に、チヤ
ネルとデイスク制御装置とデイスク装置間の通常の入出
力処理の頻度に対応してリード診断実行の可否と診断す
るトラツク数(リード診断契機1回あたりの1デバイス
アドレス内のリード診断を実行するトラツク本数で、最
大1シリンダ分の本数である)を決定し(入出力処理頻
度が高い程診断対象トラツク本数を少なくし)、且つ、
通常の入出力処理の空き時間中にリード診断を実行する
ように構成したので、オンライン中においてもチヤネル
以上の上位装置に負荷をかけることなく(ユーザからの
入出力処理頻度が高いときは、トラツク本数を少なくし
て診断を早く終らせ)しかも、システム利用効率への悪
影響を低減しながら、デイスク装置のリード診断を実現
できる。
【0013】また、デイスク制御装置が独自にリード診
断を実行することにより、ユーザが長時間アクセスしな
いトラツク上に欠陥が存在する場合にもその欠陥の摘出
が容易となる。
【0014】また、このトラツク上の欠陥は、システム
の使用時の障害(読み取りエラー)によつて始めて見付
かるのではなく、予めデイスク制御装置が独自に行うリ
ード診断によつて早期に予防的に発見することができ
る。このため、リード診断では、通常の使用時のデータ
読み取りよりも厳しいリード条件によつて、欠陥の摘出
が(そのおそれのあるものも含めて)容易により確実に
行われるようにする。
【0015】また、デイスク制御装置が独自にデイスク
装置の全デバイスアドレスの少なくとも全ユーザトラツ
クに対してリード診断を実行することにより、及びリー
ド診断で検出したエラー及びリード診断の実行状況をチ
ヤネルに報告又はインターフエースを介して報告するこ
とにより、ユーザが長期間アクセスしないトラツクのレ
コード上の欠陥の摘出をも容易にする。トラツクのレコ
ード上の欠陥は、システムのユーザの使用時の障害によ
つて初めてみつかるのではなく、予めデイスク制御装置
が独自に行うリード診断によつて早期に予防的に発見す
ることができる。このため、リード診断では、通常の使
用時のデータ読み取りよりも厳しいリード条件によつ
て、欠陥の摘出が(そのおそれのあるものも含めて)容
易に且つ確実に行われるようになる。
【0016】更に、チヤネルとデイスク制御装置とデイ
スク装置間の通常の入出力処理の頻度に対応してリード
診断実行の可否を判断してリード診断契機を発生させ、
入出力処理の頻度に応じて1回のリード診断契機でリー
ド診断するトラツク本数を決定し、デイスク制御装置が
独自に、通常の入出力処理の空き時間中にリード診断を
実行し、更にリード診断中にチヤネルからの起動要求を
検出した場合又はデイスク装置に対するリード診断以外
の処理が必要になつた場合には、当該リード診断契機を
終了してチヤネルからの起動の受付又はデイスク装置に
対する必要な処理に移るように構成しており、システム
利用効率への悪影響を低減し、オンライン中に於いても
デイスク装置のリード診断を実現できる。
【0017】また、デバイスアドレス毎に、リード診断
で検出したエラー回数を管理しエラー回数が一定値に達
すると当該デバイスアドレスに対するリード診断を閉塞
し不必要なリード診断を行わないことによつてもシステ
ム利用効率への悪影響を低減している。
【0018】また、デイスク制御装置が不揮発性の制御
用メモリを持たないデイスク制御装置で構成されている
場合、デイスク制御装置の電源投入後のリード診断開始
シリンダアドレスを乱数値を用いて決定することによ
り、全デバイスアドレス内の全トラツクをリード診断終
了する所用時間たとえば数週間程度より短い時間間隔で
の電源投入と切断の繰り返しが行われた場合において
も、特定範囲のリード診断の繰り返しを避けることがで
きるようになり、これによりユーザが長時間アクセスし
ないトラツクのレコード上の欠陥の摘出を容易にしてい
る。すなわち、不揮発性メモリを持たない即ち電源切断
により診断制御用情報が消滅するデイスク制御装置に於
いて、電源投入の度に常にシリリンダアドレス0から診
断を開始する方式としたとき、全デバイスアドレス内の
全トラツクをリード診断終了する所用時間たとえば数週
間程度より短い時間間隔での電源投入と切断の繰り返し
が行われた場合には、その都度、シリンダアドレス0か
ら電源が投入されている時間分のシリンダ数までの範囲
(若いシリンダアドレスの領域)が診断されるのみであ
り、最終シリンダアドレス近辺の診断が行われない恐れ
がある。乱数値を用いてスタートするシリンダを決定す
ることにより、ユーザ領域全体をまんべんなく診断でき
るので、その結果としてユーザが長期間アクセスしない
トラツクのレコード上の欠陥の摘出を容易にすることが
できる。
【0019】
【実施例】以下に、本発明の実施例を図面によつて説明
する。
【0020】まず、図1〜図4により本発明の第1実施
例を説明する。図1に本実施例のデータ処理システムの
構成図を示す。
【0021】図1の実施例では、データ処理システム
は、チヤネル1とデイスク制御装置3とデイスク装置6
とで構成されている。これらは線2及び線5により結合
されている。チヤネル1より上位の部位および保守用回
線については図示していない。デイスク装置6は複数の
デバイスを持つが、説明を容易にするため2個としてあ
る。デバイス60はデバイスアドレス0が割当てられ、
デバイス61はデバイスアドレス1が割当てられてい
る。
【0022】デイスク制御装置3は制御部31と診断制
御用タイマ32と診断制御用カウンタ33と診断情報メ
モリ34と保守用プロセサ35を備えている。タイマ3
2は過去の一定時間を計測するためのものである。これ
らは線36と線37と線38と線39で結合されてい
る。
【0023】制御部31はチヤネル1からの命令に関与
する通常の入出力処理及びリード診断(以下診断と記
す)を実行する。リード診断は、例えば論理的なエラー
チエツク等で行う。
【0024】診断制御用タイマ32はリード診断開始
(診断可否の判断)の契機を制御部31にあたえる。説
明を容易にするためのタイマ値を10秒とする。通常
は、数μ秒ないし数秒程度でもよい。
【0025】診断制御用カウンタ33はデイスク制御装
置3とチヤネル1との接続回数即ち当該デイスク制御装
置に対するチヤネル1からの起動回数(当該デイスク制
御装置の忙しさ)をカウントするために使用される。
【0026】診断情報メモリ34は診断制御用情報と診
断結果であるエラー情報を格納する。保守用プロセサ3
5は診断情報メモリ34に格納されている内容の中から
必要なものを編集して線4を介して保守用回線(図示せ
ず)に伝送する。
【0027】診断情報メモリ34の内容を図2に示す。
図2において、制御用情報部7は少なくとも診断するト
ラツクの数と診断するデバイスアドレスとデバイスアド
レス毎に診断を開始するトラツクのアドレスを格納す
る。これらについては後に説明する初期設定動作時に、
診断するデバイスアドレス0、診断するトラツク数は1
0、デバイスアドレス毎の診断開始トラツクアドレスは
0と設定される。これらの値は説明を容易にするための
例である。なお、このトラツク数は、リード診断契機1
回当りの1デバイスアドレス内のリード診断を実行する
トラツク数で、1リード診断契機で実行される最大トラ
ツク本数は、1シリンダ分である。即ち、1回の診断契
機により診断されるトラツクはすべて同一シリンダ上に
あるものとする。これは、1診断契機の間、ヘツドのシ
ーク動作が不要であるためである。エラー情報部8は診
断の結果発生したエラーに関する情報をエラー件数毎に
格納する。その内容は、少なくともエラーの発生したデ
バイスアドレスとトラツクアドレスと、リードエラーか
その他のハードウエアエラーかのエラー種類と、リード
エラーであるときは訂正可能エラーか訂正不可能エラー
かの区別と、訂正可能エラーであるときにはエラーの大
きさを示すエラービツト長といつたエラー内容を含む。
【0028】次に、図1及び動作フローチヤートを示す
図4により、本実施例の動作を説明する。図1において
デイスク制御装置3の動作開始時、制御部31は初期設
定動作により診断情報メモリ34に前述の初期値を設定
する。さらに診断制御用タイマ32をスタートさせる
(ステツプ401)。
【0029】初期設定動作が終了すると制御部31はチ
ヤネル1からの起動の有無を調べる(ステツプ40
2)。チヤネル1からの起動があれば診断制御用カウン
タ33の値をプラス1した後チヤネル1からの命令を受
取り必要な入出力処理を実行する(ステツプ403,4
04)。
【0030】チヤネル1からの起動がない場合は、デイ
スク装置6からの割り込みの有無を調べる(ステツプ4
05)。割り込みがあれば必要な処理を実行する(ステ
ツプ406)。
【0031】割り込みが無い場合には診断制御用タイマ
34がタイムアウトとなつているかを調べる(ステツプ
407)。タイムアウト即ち10秒以上経過していれば
診断制御用カウンタ33を調べる。診断用カウンタ33
の値が100未満であればその値に対応する診断するト
ラツク数を図2中の制御用情報部7に格納する(ステツ
プ408)。図1の診断用カウンタ33の値と診断する
トラツク数の関係としては図3に示すものが考えられる
が本実施例では説明を容易にするため診断用カウンタ3
3の値(当該デイスク制御装置に対するチヤネルからの
起動回数)が10未満の場合はトラツク数(1診断契機
当りの同じシリンダ上の診断すべきトラツク本数)は常
に10とする。診断用カウンタ33の値が100以上の
場合には診断するトラツク数を0とする。即ち、一定時
間中のチヤネルからの起動が定める値を超える場合には
たとえ空き時間であつても診断を実行しない。
【0032】診断するトラツク数を格納した後、図2の
制御用情報部7に示される診断するデバイスアドレス即
ちアドレス0のデバイスを接続する(ステツプ40
9)。
【0033】該デバイスの接続が成功すれば図2の制御
用情報部7に示される該デバイスアドレスの診断開始ト
ラツクアドレスを開始点として図2の制御用情報部7に
示される診断するトラツク数に対して上昇アドレス順に
診断を実行する(ステツプ410)。最大アドレスのト
ラツクの診断後はトラツクアドレス0にもどつて診断を
続行する。
【0034】診断中にエラーが発生した場合は必要な情
報を図2のエラー情報部8に格納する(ステツプ41
1)。図2の制御用情報部7に示される診断するトラツ
ク数に対しての診断を終了すると、次回に診断すべきデ
バイスアドレスを指示するために図2の制御用情報部7
の診断するデバイスアドレスの内容をプラス1して1と
する(ステツプ412)。内容が最大デバイスアドレス
を超える時は最小アドレスに変更する。さらに、指定さ
れたトラツク数のリード診断を終了したデバイスアドレ
ス0に対する次回のリード診断の開始トラツクアドレス
を指示するために、デバイスアドレス0に対する診断開
始トラツクアドレスの内容をプラス10する。最大トラ
ツクアドレスを超えるときは超過分から1を減算した値
に変更する。即ち最大トラツクアドレスの次はトラツク
アドレス0に対して処理を実行することに値を合致させ
ている。
【0035】続いて制御部31は診断制御用タイマ33
をリセツトし且つ再スタートさせ、さらに、同時に診断
制御用カウンタ33をリセツトする(ステツプ413,
414)。
【0036】このようにして、図1の制御部31は、指
定されるトラツク数の診断に関する処理を完了すると再
びチヤネル1からの起動の有無を調べる状態に遷移し、
以後同様の処理を繰り返しデイスク装置6の全デバイス
アドレスの全トラツクを診断する。以上が図4のフロー
チヤートの動作である。
【0037】なお、制御部31は必要であれば診断情報
メモリ34に格納されるエラー情報を編集しセンスバイ
トとしてチヤネル1に送出することもできる。
【0038】また、保守プロセサ35が診断情報メモリ
34に格納されるエラー情報を編集し、線4を通じて保
守回線(図示せず)に送出することもできる。
【0039】本実施例ではデイスク装置のトラツクをト
ラツクアドレスの上昇順に診断しているが、他の方法と
してトラツクアドレスの管理テーブルを設けて、ランダ
ムに且つ重複を排除しながら診断する方法や、ユーザか
らの(チヤネルからの)アクセス頻度の小さいトラツク
アドレスを優先させて診断する方法が考えられる。
【0040】また、本実施例では述べていないが一般的
にデイスク装置は複数のデイスク制御装置から共有され
る。その場合には診断制御用メモリを複数のデイスク制
御装置間の共有制御メモリ内に配置することにより本実
施例と同様の診断処理を行うことが考えられる。
【0041】本実施例では1回に診断するトラツク数の
決定を過去の一定時間中のチヤネルからの起動回数を基
にしているが、チヤネルとデイスク制御装置間のデータ
転送回数やデイスク装置とデイスク制御装置間の接続回
数またはデイスク転送回数を基にすることも考えられ
る。(なお、この場合チヤネル及びデータ制御装置上部
間の動作と、デイスク装置及びデイスク制御装置下部間
の動作とは、独立して行えるようになつている)。
【0042】上記実施例で、診断をするか否かの判断を
デイスク制御装置が行う代りに、デイスク装置が行うよ
うにすることもできる。
【0043】上記実施例では、リード診断をロジカルな
エラーチエツクのようなデイジタル的な方法で行つてい
るが、それに代えてリード診断を、例えば読み取り波形
レベルが一定レベル以上であるかなどアナログ的な方法
で行うこともできる。いずれの場合でも、エラーの有無
の基準を通常の使用時よりも引き上げた厳しい基準とす
ることが考えられる。
【0044】ユーザの時間帯別の使用状況が予めわかつ
ている場合には、混雑する時間帯にはリード診断自体の
頻度を零を含む値まで低下させる等、時間帯の使用状況
に応じて診断の頻度を変化させることができる。
【0045】保守回線を通じて、エラーの多発しそうな
デバイスを予めしらべ、そのようなデバイスに対するリ
ード診断の頻度を増加する等、特定のデバイスに対する
リード診断の頻度を変化させることができる。
【0046】例えばデバイスを交換したときなど、保守
回線を通じて、今までの(交換前のデバイスに対する)
診断結果の情報(ログ)を消去する。
【0047】各デイスク装置が複数のデイスク制御装置
ないし複数のチヤネルの任意の1つを経由してCPUと
接続されるマルチパス方式のデイスク装置の場合、オン
ライン中のリード診断は特定のデイスク制御装置にまか
せるようにすることができる。
【0048】エラー多発時には、それ以上リード診断を
やつても無駄となるので(ヘツドのはずれ、ケーブルの
抜けなどそのままでは回復しない故障が考えられるの
で)、一定回数以上のエラーを検出したなら、その旨の
メツセージを発行し、オンライン中のリード診断を閉塞
する。これにより、無駄な診断を長時間行わないように
する。
【0049】リード診断だけでなく、交代トラツクをア
サインしながら、オンライン中のデイスク制御装置によ
りデイスク装置のリードライト診断を実行することがで
きる。ライト診断では、トラツク全体にテスト信号をベ
タ書きして、くまなくチエツクすることができる。
【0050】次に、本発明の第2の実施例を、図5〜6
により説明する。本実施例に使用されるデータ処理シス
テムの構成は図1に示したものと同様であるので、説明
を省略する。
【0051】第2の実施例における診断情報メモリ34
の内容を図5に示す。図5において、制御用情報部7は
少なくとも診断するデバイスアドレスと診断するトラツ
ク本数(1診断契機当りのトラツク本数で、最大1シリ
ンダ分)とデバイスアドレス毎に診断開始するシリンダ
アドレスとトラツクアドレスを格納する。これらは後に
説明する初期設定動作時に、診断するデバイスアドレス
を0、デバイスアドレス毎の診断開始するシリンダアド
レスを0から最大シリンダアドレスの範囲の乱数値、当
該シリンダ内の診断開始トラツクアドレスを0と設定す
る。これらの値は説明を容易にするための例である。な
お、診断開始するシリンダアドレスは乱数値により決定
されるが説明を容易にするため0としておく。
【0052】診断ログ情報8は診断の結果発生したエラ
ーに関する情報をエラー件数毎に格納する。その内容
は、少なくともエラーの発生したデバイスアドレスとシ
リンダアドレスとトラツクアドレス、訂正可能エラーが
訂正不可能エラーかの区別と、訂正可能エラーであると
きはエラーの大きさを示すエラービツト長といつたエラ
ー内容を含む。
【0053】診断ログ情報9は少なくともデバイスアド
レス毎のエラー回数と診断したトラツク数と当該デバイ
スアドレス内の全シリンダを診断したことを示すフラグ
を格納する。これは診断状況を示すものである。
【0054】本実施例での動作の説明を容易にするた
め、まず、診断動作の概要を述べる。図1の制御部31
は、診断制御用タイマ32と診断制御用カウンタ33に
より、当該デイスク制御装置に対する一定の時間内のチ
ヤネルからの起動の頻度即ち入出力処理の頻度を検出
し、それが一定以下の頻度である場合に、1回の診断契
機を発生する。さらにこの入出力処理の頻度に応じて当
該診断契機で、診断するトラツクの本数を最小1トラツ
ク、最大1シリンダの範囲で決定する。最大1シリンダ
の範囲としたのは、その間、ヘツドのシーク動作が不要
で短時間で診断ができるためである。説明を容易にする
ため、1シリンダは15トラツクとし(一般には、1シ
リンダのトラツク数は15,30等がある)、診断制御
用タイマのタイムアウト値を10秒とする。この入出力
頻度と診断するトラツク本数との関係の例を図6に示
す。図6は一例であつて、これらの関係はシステムの環
境に応じて容易に変更できるものである。例えば、10
秒間の入出力頻度即ち診断制御用カウンタ33の値が2
56以上であれば診断するトラツク本数が0であり即ち
診断を実行しない設定となつているが、これを1とする
ことにより、いかなる入出力頻度の場合であつても1回
の診断契機で最低1トラツクは診断するというような構
成にも変更可能である。
【0055】リード診断中は、1トラツク診断終了の度
にチヤネルからの起動または、デバイスに対する診断以
外の処理が必要であるかを監視し、必要である場合は、
当該診断契機での診断を終了して必要な処理に移る。診
断以外の処理に移る必要がなければ、トラツクアドレス
を変更しながら1トラツク診断を繰り返し、1シリンダ
の最終トラツクを終了するか又は前記の診断するトラツ
ク本数を終了すると当該診断契機を終了する。
【0056】また、診断契機ごとに診断の対象とするデ
バイスアドレスを更新する。本実施例ではデバイスアド
レスが2個であり、診断契機1回おきに同一のデバイス
アドレスに対する診断が行われることになる。一般にデ
イスク制御装置が配下に複数(N台)のデバイス(デイ
スク装置)を有する場合には、1〜N回の診断契機で順
に1〜N番のデバイスの各第1のシリンダ、N+1〜2
N回の診断契機で順に1〜N番のデバイスの各第2のシ
リンダ,……のように診断を行つて行くことができる。
【0057】1回の診断契機中に前述の理由により診断
を中断した場合、または1シリンダの最終トラツクまで
終了していない場合には、当該デバイスアドレスに対す
る次回の診断契機に当該シリンダ内の未診断トラツク
(残りのトラツク)の診断を続行する。この場合、残り
のトラツクの診断が終われば終了する。即ち、1回の診
断契機でシリンダ間に跨つて診断することはしない。
【0058】次に、図1及び動作フローチヤートを示す
図7により本実施例での診断動作を説明する。
【0059】図1においてデイスク制御装置3の動作開
始時、制御部31は初期設定動作により診断情報メモリ
34に前述の初期値を設定する。さらに診断制御用タイ
マ32をスタートさせる(ステツプ701)。
【0060】初期設定動作が終了すると制御部31はチ
ヤネル1からの起動の有無を調べる(ステツプ70
2)。チヤネル1からの起動があれば診断制御用カウン
タ33の値をプラスした後チヤネル1からの命令を受取
り必要な入出力処理を実行する(ステツプ703,70
4)。
【0061】チヤネル1からの起動がない場合は、デイ
スク装置6からの割り込みの有無を調べる(ステツプ7
05)。デバイス割り込みがあればデバイスに関する必
要な処理を実行する(ステツプ706)。
【0062】デバイス割り込みが無い場合には診断制御
用タイマ32がタイムアウトとなつているかを調べる
(ステツプ707)。タイムアウト即ち10秒以上経過
していれば診断制御用カウンタ33を調べ図6の関係表
を参照する(ステツプ708)。診断制御カウンタ33
の値が、256以上であれば診断を行わず診断制御用カ
ウンタをリセツトし、診断制御用タイマ32をリセツト
して再スタートさせる(ステツプ717,718)。即
ち、一定時間中のチヤネルからの起動が定める値を超え
る場合にはたとえ空き時間であつても診断を実行しな
い。
【0063】ステツプ708で、診断制御用カウンタ3
3の値が256未満であつたときは、診断を実行するた
めに、図6の関係表にもとずき診断するトラツク本数を
決定し、図5の制御用情報部7に格納する。次に診断ロ
グ情報9に示される診断するデバイスアドレス即ち最初
はデバイスアドレス0のエラー回数を参照しこれが一定
値未満かをチエツクする(ステツプ709)。説明を容
易にするためこの値を15とする。即ち診断しようとす
るデバイスアドレスのエラー回数が15未満であればデ
ハイスを接続する(ステツプ710)。
【0064】ステツプ709でエラー回数が15以上で
あつた場合又はステツプ710でデバイスの接続が成功
しなかつた場合は当該診断契機を終了し次回の診断契機
で診断すべきデバイスアドレスを設定するため図5の制
御用情報部7の診断するデバイスアドレスを0の次即ち
1とする(ステツプ716)。
【0065】ステツプ710にてデバイスの接続が成功
すれば図5の制御用情報部7の診断するデバイスアドレ
スの診断開始シリンダアドレスとトラツクアドレスを開
始点としてトラツクの診断を実行する(ステツプ71
1)。1トラツク診断終了時には図5の診断ログ情報8
及び9の該当するデバイスアドレスに関する情報を格納
する(ステツプ712)。
【0066】1トラツクの診断が終了する度に、チヤネ
ルからの起動およびデイスク装置に対する診断以外の処
理の必要の有無を調査する(ステツプ713)。チヤネ
ルからの起動およびデイスク装置に対する診断以外の処
理の必要がない場合には当該シリンダの最終トラツクア
ドレスが終了したかをチエツクする(ステツプ71
4)。シリンダの最終トラツクアドレスが終了していな
ければ制御用情報部7の診断するトラツク本数分(ステ
ツプ708で決定した本数)を終了したかをチエツクす
る。制御用情報部7の診断するトラツク本数を終了して
いなければ診断中のシリンダ内の次のトラツクアドレス
の診断に移る(ステツプ715)。
【0067】ステツプ713または714または715
にて当該診断契機を終了した場合には、診断中であつた
デバイスアドレスについて、当該デバイスアドレスに対
する次回の診断契機に診断開始すべきシリンダアドレス
とトラツクアドレスを図5の制御用情報部7の設定す
る。1シリンダ分の全トラツクを診断終了していない場
合すなわち1シリンダの最終トラツククアドレスを診断
終了していない場合には、当該デバイスアドレスに対す
る次の診断機会に診断するシリンダアドレスは変化しな
い。トラツクアドレスのみプラス1する。1シリンダの
最終トラツクを終了していればシリンダアドレスをプラ
ス1しトラツクアドレスを0とする。このとき当該デバ
イスの最終シリンダを終了しているときは、シリンダ0
に更新する。さらに次回の診断契機で診断するデバイス
アドレスはデバイスアドレス0の次、即ち、デバイスア
ドレス1であり、図5の制御用情報部7の診断するデバ
イスアドレスを1とする(ステツプ716)。
【0068】続いて診断制御用カウンタ33をリセツト
し、診断制御用タイマのリセツトと再スタートを行いス
テツプ702に戻る(ステツプ717,718)。
【0069】以上の様にしてリード診断を繰り返す。
【0070】各デバイスアドレス内の全トラツク(全ユ
ーザトラツク)の診断が終了すると、診断ログ情報9の
全トラツク診断一巡フラグをオンしたのち、リード診断
を再び繰り返す。このフラグは、電源投入後すくなくと
も一巡は診断したことを表示している。
【0071】なお、図1の制御部31は必要であれば診
断情報メモリ34に図5の様に格納される情報を編集し
センスバイトとしてチヤネル1に送出することもでき
る。
【0072】また、保守プロセサ35が診断情報メモリ
34に格納される情報を編集し線4を介して保守回線
(図示せず)に送出することもできる。
【0073】以上、第2の実施例では、不揮発性メモリ
を持たない場合に、デイスク制御装置の電源投入と切断
の繰り返しにより特定の範囲の診断の繰り返しを避ける
ため、初期設定時の診断開始シリンダアドレスを乱数を
用いて決定しているが、診断制御用の情報が不揮発性メ
モリに格納できるデイスク制御装置、即ち、電源投入切
断を繰り返しても診断制御情報が消滅しないデイスク制
御装置であれば、シリンダアドレス0から開始してシリ
ンダアドレス上昇順に実行すればよい。なお、不揮発性
メモリを有している場合は、前回終つたシリンダが記憶
されているため、スタートを次のシリンダから行える。
【0074】上記実施例ではシリンダアドレスの上昇順
に診断しているが、他の方法としてトラツク管理テーブ
ルを設けてたとえば256シリンダ毎に且つ重複を排除
しながら診断する方法やユーザからの(チヤネルから
の)アクセス頻度の小さいトラツクアドレスを優先させ
る方法が考えられる。
【0075】また、上記実施例では述べていないが一般
的にデイスク装置は複数のデイスク制御装置から共有さ
れる。その場合には診断制御用メモリを複数のデイスク
制御装置間の共有制御メモリ内に配置することにより本
実施例と同様の診断処理を高速に効率良く行うことがで
きる。さらにこれら複数のデイスク制御装置のうち、1
つだけに診断をおこなわせるような柔軟な構成も考えら
れる。
【0076】上記実施例では診断契機の発生を過去の一
定時間中のチヤネルからの起動回数を基にしているが、
デイスク制御装置やデバイス装置が持つ付加機能や性能
に応じて、チヤネルとのデータ転送回数やデイスク装置
との接続回数またはデータ転送回数を基にすることも考
えられる。
【0077】上記実施例では診断をデイスク制御装置が
行つているが、デイスク装置自体が行う構成も考えられ
る。
【0078】上記実施例では、リード診断をロジカルな
エラーチエツクのようなデイジタル的な方法で行つてい
るが、それに代えてリード診断を、例えば読み取り波形
レベルが一定レベル以上であるかなどアナログ的な方法
で行うことも考えられる。
【0079】上記実施例では述べていないが、リード診
断時には予防保守という観点から、エラーの有無の判定
基準を通常の使用時よりも引上げた厳しい基準とするこ
とが考えられる。たとえば、アナログリード波形に対す
る振幅方向や位相方向のデータ弁別の基準を厳しい方向
に変位させる設定を行つてリード診断を実行することが
考えられる。
【0080】上記実施例では述べていないが、保守回線
を介して外部から指示することにより、診断頻度、診断
の対象となるデバイスアドレスの固定化、前述のアナロ
グリード波形に対するデータ弁別の基準の設定などを変
更して診断することも考えられる。
【0081】ユーザの時間帯別の使用状況が予めわかつ
ている場合には、入出力処理の頻度が高い時間帯にリー
ド診断自体の頻度をゼロを含む値まで低下させ、入出力
処理の頻度が低い時間帯にリード診断自体の頻度を上げ
る等、時間帯と使用状況に応じて診断の頻度を変化させ
ることが考えられる。
【0082】リード診断だけではなく、交代トラツクや
デイスク制御装置内又はデイスク装置内の不揮発性メモ
リに、診断しようとするトラツクの内容を待避してライ
ト・リード診断を実行することが考えられる。これによ
れば、トラツクの内容の待避時間、書き込み即ちライト
のための処理時間、待避してい内容をトラツクに戻す時
間が余分に必要となり、さらに交代トラツクを使用する
場合は、診断するトラツクと交代トラツクとの間のリー
ドライト機構の移動即ち、シーク動作回数が増え診断処
理時間が増大するが、トラツク全体をベタ書きしてトラ
ツク前面をくまなくリードチエツクすることがてでき、
トラツク上のレコードを書いていない領域をも予めチエ
ツクすることが可能となる。さらに診断で書き込むデー
タのパターンを変化させることにより、欠陥の検出性能
を向上させることも考えられる。以上の第2の実施例に
よれば以下の効果が得られる。
【0083】(1)デイスク制御装置が独自にデイスク
装置のリード診断を実行することにより、チヤネル以上
の部位に負荷をかけることなくリード診断を実行できる
効果がある。
【0084】(2)デイスク制御装置が独自に配下のデ
イスク装置の全デバイスアドレスの少なくとも全ユーザ
トラツクをリード診断すること及びリード診断で検出し
たエラー及びリード診断の実行状況をチヤネルに報告又
は保守インタフエースを介して報告することにより、ユ
ーザが長時間アクセスしないトラツクのレコード上り欠
陥の摘出を容易にする効果がある。
【0085】(3)チヤネルとデイスク制御装置とデイ
スク装置間の通常の入出力処理の頻度に対応してリード
診断実行の可否を判断してリード診断契機を発生させ、
入出力処理の頻度に応じて1回のリード診断契機でリー
ド診断するトラツク本数を決定し、デイスク装置が独自
に、通常の入出力処理の空き時間中にリード診断を実行
し、更にリード診断以外の処理が必要になつた場合に
は、当該リード診断契機を中断しチヤネルからの起動の
受付又はデイスク装置に対する必要な処理に移るように
構成しており、システム利用効率への悪影響を低減しな
がら、オンライン中においてもデイスク装置のリード診
断を実現できる効果がある。
【0086】また、デバイスアドレス毎に、リード診断
で検出したエラー回数を管理し、当該エラー回数が一定
値に達すると当該デバイスアドレスに対するリード診断
を閉塞し不必要なリード診断を行わないことによつても
システム利用効率への悪影響を低減する効果がある。
【0087】(4)不揮発性の制御用メモリを持たない
デイスク制御装置に於ては、デイスク制御装置の電源投
入後のリード診断開始シリンダアドレスを乱数値を用い
て決定することにより、電源の投入と切断の繰り返しに
よる特定範囲のリード診断の繰り返しを避けており、ユ
ーザが長時間アクセスしないトラツクのレコード上の欠
陥の摘出を容易にしている。
【0088】
【発明の効果】以上詳しく述べたように、本発明によれ
ば、オンライン中か否かにかかわらず、デイスク制御装
置が独自にデイスク装置のリード診断を実行するように
構成すると共に、チヤネルとデイスク制御装置とデイス
ク制御間の通常の入出力処理の頻度に対応してデイスク
制御装置が独自にリード診断実行の可否および診断する
トラツク数を決定し且つ通常の入出力処理の空き時間中
にリード診断を実行するように構成したので、オンライ
ン中においてもチヤネル以上の上位装置に負荷をかける
ことなく且つシステム利用効率への悪影響を低減しなが
らデイスク装置のリード診断を実現できるという効果が
ある。
【0089】また、デイスク制御装置が独自にリード診
断を実行することにより、ユーザが長期間アクセスしな
いトラツク上に欠陥が存在する場合にもその欠陥の摘出
が容易となるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の適用されたデータ処理シス
テムの構成図である。
【図2】図1における第1の実施例による診断情報メモ
リの内容を示す図である。
【図3】図1における第1の実施例による診断制御用カ
ウンタの値と診断するトラツク数との関係を示す図であ
る。
【図4】本発明の第1の実施例の動作を説明するフロー
チヤートである。
【図5】本発明の第2の実施例によるメモリの内容を示
す図である。
【図6】本発明の第2の実施例における診断制御用カウ
ンタの値と診断するトラツク数との関係を示す図であ
る。
【図7】本発明の第2の実施例の動作を説明するフロー
チヤートである。
【符号の説明】
1 チヤネル 3 デイスク制御装置 4 保守用回線 6 デイスク装置 31 制御部 32 診断制御用タイマ 33 診断制御用カウンタ 34 診断情報メモリ 35 保守プロセサ 61,62 デバイス(磁気デイスク装置)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 梅本 貴幸 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 チヤネルと、デイスク制御装置と、デイ
    スク装置とをもつデータ処理システムにおけるデイスク
    装置の診断方式において、オンライン中であるか否かを
    問わず、デイスク制御装置が独自にデイスク装置のリー
    ド診断動作を実行し、オンライン中に、チヤネルとデイ
    スク制御装置とデイスク装置の間の過去の一定時間の入
    出力処理の頻度に対応してデイスク制御装置が独自にリ
    ード診断実行の可否またはリード診断対象のトラツク数
    を決定し、且つ通常の入出力動作の空き時間にリード診
    断動作を実行するように構成したことを特徴とするデイ
    スク装置の診断方式。
  2. 【請求項2】 前記過去の一定時間の入出力処理の頻度
    として、この一定時間中のチヤネルからの命令に関与す
    る入出力動作回数、またはデイスク制御装置とチヤネル
    との接続回数を用いたことを特徴とする請求項1記載の
    デイスク装置の診断方式。
  3. 【請求項3】 チヤネルからのアクセス頻度の小さいト
    ラツクを優先させて診断することを特徴とする請求項1
    または2記載のデイスク装置の診断方式。
  4. 【請求項4】 一定回数以上のリードエラー発生時に、
    オンライン中のリード診断を中止するように構成したこ
    とを特徴とする請求項1ないし3のいずれか1記載のデ
    イスク装置の診断方式。
  5. 【請求項5】 リード診断中にチヤネルからの起動要求
    を検出した場合又はデイスク装置に対するリード診断以
    外の処理が必要になつた場合には、当該リード診断契機
    を終了したチヤネルからの起動の受付又はデイスク装置
    に対する必要な処理に移るように構成したことを特徴と
    する請求項1ないし4のいずれか1記載のデイスク装置
    の診断方式。
  6. 【請求項6】 リード診断で検出したエラー及びリード
    診断の実行状況をチヤネルに報告し又は保守用回線を介
    して報告する手段を持つように構成したことを特徴とす
    る請求項1ないし5のいずれか1記載のデイスク装置の
    診断方式。
  7. 【請求項7】 前記デイスク制御装置は不揮発性の制御
    用メモリを持たないデイスク制御装置で構成され、この
    デイスク制御装置の電源投入後のリード診断開始シリン
    ダアドレスを乱数値を用いて決定するように構成したこ
    とを特徴とする請求項1〜6のいずれか1記載のデイス
    ク装置の診断方式。
JP4053605A 1991-03-18 1992-03-12 デイスク装置の診断方式 Pending JPH0574059A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4053605A JPH0574059A (ja) 1991-03-18 1992-03-12 デイスク装置の診断方式

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7720491 1991-03-18
JP3-77204 1991-03-18
JP4053605A JPH0574059A (ja) 1991-03-18 1992-03-12 デイスク装置の診断方式

Publications (1)

Publication Number Publication Date
JPH0574059A true JPH0574059A (ja) 1993-03-26

Family

ID=26394315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4053605A Pending JPH0574059A (ja) 1991-03-18 1992-03-12 デイスク装置の診断方式

Country Status (1)

Country Link
JP (1) JPH0574059A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5751947A (en) * 1995-04-26 1998-05-12 Kabushiki Kaisha Toshiba Magnetic disk apparatus having inspection function of recording medium and method of inspecting recording medium in magnetic disk apparatus
US6636985B1 (en) 1999-06-11 2003-10-21 International Business Machines Corporation Disk storage device and a method for processing defective sectors in a disk storage device
JP2006004078A (ja) * 2004-06-16 2006-01-05 Fujitsu Ltd ディスク制御装置、ディスクパトロール方法およびディスクパトロールプログラム
JP2007122108A (ja) * 2005-10-25 2007-05-17 Hitachi Ltd セルフチェック機能を有するディスクドライブ装置を用いたストレージシステムの制御
JP2010211529A (ja) * 2009-03-10 2010-09-24 Fujitsu Ltd ストレージ装置、中継装置、及び、診断方法
WO2014006701A1 (ja) * 2012-07-04 2014-01-09 富士通株式会社 情報処理装置、アクセス制御プログラム、およびアクセス制御方法
US10338844B2 (en) 2015-09-07 2019-07-02 Fujitsu Limited Storage control apparatus, control method, and non-transitory computer-readable storage medium

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5751947A (en) * 1995-04-26 1998-05-12 Kabushiki Kaisha Toshiba Magnetic disk apparatus having inspection function of recording medium and method of inspecting recording medium in magnetic disk apparatus
US6636985B1 (en) 1999-06-11 2003-10-21 International Business Machines Corporation Disk storage device and a method for processing defective sectors in a disk storage device
JP2006004078A (ja) * 2004-06-16 2006-01-05 Fujitsu Ltd ディスク制御装置、ディスクパトロール方法およびディスクパトロールプログラム
JP2007122108A (ja) * 2005-10-25 2007-05-17 Hitachi Ltd セルフチェック機能を有するディスクドライブ装置を用いたストレージシステムの制御
JP2010211529A (ja) * 2009-03-10 2010-09-24 Fujitsu Ltd ストレージ装置、中継装置、及び、診断方法
WO2014006701A1 (ja) * 2012-07-04 2014-01-09 富士通株式会社 情報処理装置、アクセス制御プログラム、およびアクセス制御方法
JPWO2014006701A1 (ja) * 2012-07-04 2016-06-02 富士通株式会社 情報処理装置、アクセス制御プログラム、およびアクセス制御方法
US10338844B2 (en) 2015-09-07 2019-07-02 Fujitsu Limited Storage control apparatus, control method, and non-transitory computer-readable storage medium

Similar Documents

Publication Publication Date Title
US5613066A (en) Disk controlling method and apparatus for transferring a record from a disk to a host via an intermediate buffer
US7415636B2 (en) Method and apparatus for replacement processing
JPH1078897A (ja) コンピュータ・データ記憶システム
US7836268B2 (en) Method, apparatus, and system for controlling data storage
US7633695B2 (en) Medium scan method for use in disk device
JPH0574059A (ja) デイスク装置の診断方式
JP4775843B2 (ja) ストレージシステム及び記憶制御方法
US5838991A (en) Preemptable idle time activities for constant data delivery by determining whether initiating a host command will conflict with an idle time activity being executed
JPH1195933A (ja) ディスクアレイ装置
JPH07182250A (ja) 磁気ディスクの自動交代処理方式
JPS63279318A (ja) 磁気ディスク装置
JP3431582B2 (ja) デスク記憶装置、及び同装置に適用されるハングアップ発生時の処理方法
JP2001035096A (ja) 書き込みデータのチェック方法及びこれを用いたデータ記憶装置
JP3150242B2 (ja) ディスク装置
JP2002278705A (ja) コンピュータシステム
JPH0651918A (ja) 半導体ディスク装置
JPS6153744B2 (ja)
JPS58223860A (ja) 磁気デイスク制御装置
JP2775865B2 (ja) 周辺制御装置の障害解析情報収集方式
JP2001189060A (ja) 磁気ディスク装置
JPH0281224A (ja) 磁気ディスク装置のバックアップ装置
JPH07281966A (ja) アレー型記憶システム
JPH07306812A (ja) 入出力制御装置
JPH05158627A (ja) ディスク装置
JPH05241852A (ja) 情報処理システムの割り込み発生装置