JP2618078B2 - Array disk controller - Google Patents

Array disk controller

Info

Publication number
JP2618078B2
JP2618078B2 JP2180961A JP18096190A JP2618078B2 JP 2618078 B2 JP2618078 B2 JP 2618078B2 JP 2180961 A JP2180961 A JP 2180961A JP 18096190 A JP18096190 A JP 18096190A JP 2618078 B2 JP2618078 B2 JP 2618078B2
Authority
JP
Japan
Prior art keywords
magnetic disk
specified value
error
failure
medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2180961A
Other languages
Japanese (ja)
Other versions
JPH0467476A (en
Inventor
朝永 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2180961A priority Critical patent/JP2618078B2/en
Publication of JPH0467476A publication Critical patent/JPH0467476A/en
Application granted granted Critical
Publication of JP2618078B2 publication Critical patent/JP2618078B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 複数の磁気ディスク装置にデータを配分して格納する
アレイデイスクの制御を行なうアレイディスク制御装置
に関し、 リードエラー又はシークエラーの発生が高頻度である
磁気ディスク、又は媒体異常がある磁気ディスクをアレ
イディスク制御装置が切離して信頼性を向上させること
を目的とし、 ユーザデータを格納する複数のユーザ用磁気ディスク
装置及びパリティデータを格納するパリティ用磁気ディ
スク装置及び予備の磁気ディスク装置で構成される論理
デバイスを制御するアレイディスク制御装置において、
リードエラー、シークエラー夫々の発生回数をカウント
して保持するエラーカウント手段と、該リードエラー、
シークエラー夫々の発生頻度を第1,第2の規定値と比較
し、該第1,第2の規定値を越えたとき障害と判定する第
1の判定手段と、リードエラーが訂正不可能なときリー
ドエラー発生位置を媒体欠陥として登録する欠陥登録手
段と、該欠陥登録手段に登録された媒体欠陥の総欠陥数
を第3の規定値と比較し、該第3の規定値を越えたとき
障害と判定する第2の判定手段と、障害の判定により該
論理デバイス内の障害のある磁気ディスク装置を切離し
てそのデータを予備の磁気ディスク装置に復元する切離
し手段とを有すると共に、該欠陥登録手段に登録された
媒体欠陥のヘッド毎の欠陥数を第4の規定値と比較し、
該第4の規定値を越えたとき障害と判定する第3の判定
手段と、該欠陥登録手段に登録された媒体欠陥のトラッ
ク毎の欠陥数を第5の規定値と比較し、該第5の規定値
を越えたとき障害と判定する第4の判定手段を有し構成
する。
The present invention relates to an array disk control device for controlling an array disk that distributes and stores data to a plurality of magnetic disk devices, comprising: a magnetic disk in which read errors or seek errors occur frequently; Also, a plurality of magnetic disk devices for storing user data, a magnetic disk device for storing parity data, and a spare disk are provided for the purpose of improving reliability by separating the magnetic disk having a medium error by the array disk controller and improving the reliability. An array disk control device that controls a logical device composed of magnetic disk devices of
Error counting means for counting and holding the number of occurrences of each of the read error and the seek error;
First determining means for comparing the occurrence frequency of each seek error with the first and second specified values and determining a failure when the frequency exceeds the first and second specified values; A defect registration unit for registering a read error occurrence position as a medium defect, and comparing the total number of medium defects registered in the defect registration unit with a third specified value, and when the number exceeds the third specified value. A second determination unit for determining a failure; a disconnection unit for disconnecting the failed magnetic disk device in the logical device by determining the failure and restoring the data to a spare magnetic disk device; The number of media defects registered in the means is compared with a fourth specified value for each head,
A third determining means for determining a failure when the value exceeds the fourth specified value; and comparing the number of medium defects registered in the defect registering means for each track with a fifth specified value. And a fourth determination means for determining that a failure has occurred when the predetermined value is exceeded.

〔産業上の利用分野〕[Industrial applications]

本発明はアレイディスク制御装置に関し、複数の磁気
ディスク装置にデータを配分して格納するアレイディス
クの制御を行なうアレイディスク制御装置に関する。
The present invention relates to an array disk controller, and more particularly, to an array disk controller that controls an array disk that distributes and stores data to a plurality of magnetic disk devices.

複数の磁気ディスク装置にデータを分配して格納する
アレイディスクではユーザデータを格納する複数のユー
ザ用磁気ディスク装置の他にパリティデータを格納する
パリティ用磁気ディスク装置を用意して高信頼性を図っ
ており、また電源やロジック回路の故障による障害の機
器チェックが発生した磁気ディスク装置を切離して残り
の磁気ディスク装置にデータを格納しているが、リード
エラー又はシークエラーの如き障害が頻発する磁気ディ
スク装置も切離して信頼性を確保する必要がある。
In an array disk that distributes and stores data to a plurality of magnetic disk devices, a parity magnetic disk device for storing parity data is prepared in addition to a plurality of user magnetic disk devices for storing user data, thereby achieving high reliability. In addition, the magnetic disk drive that has been checked for failure due to a power supply or logic circuit failure is disconnected and the data is stored in the remaining magnetic disk drives.However, magnetic failures such as read errors or seek errors frequently occur. It is necessary to separate the disk device to ensure reliability.

〔従来の技術〕[Conventional technology]

従来より特開平1−191368号公報に記載のように、エ
ラー発生回数を計数して、これが規定値を越えた場合に
交換又は修理のために警告を発する磁気ディスク装置が
提案されている。
Conventionally, as described in JP-A-1-191368, there has been proposed a magnetic disk drive which counts the number of errors and issues a warning for replacement or repair when the number of errors exceeds a specified value.

〔発明が解決しようとする課題〕 上記従来の磁気ディスク装置は、エラー発生回数が規
定値を越えたとき警告を発するため、エラーが誤り訂正
符号(ECC)で誤り訂正可能な場合であっても計数さ
れ、このような誤り訂正可能なエラーが長時間に累積し
た場合にも、交換又は修理の必要がないのにも拘らず警
告が発せられてしまい、エラー発生要因に応じて警告を
発することができないという問題があった。また、警告
を発するだけで実際は何も行なわれていないという問題
があった。
[Problems to be Solved by the Invention] Since the above-mentioned conventional magnetic disk device issues a warning when the number of times of occurrence of an error exceeds a prescribed value, even if the error can be corrected by an error correction code (ECC), Even if such errors that can be corrected and errors that can be corrected accumulate for a long time, a warning is issued even though there is no need for replacement or repair, and a warning is issued according to the cause of the error. There was a problem that can not be. There is also a problem that nothing is actually done just by issuing a warning.

本発明は上記の点に鑑みなされたもので、リードエラ
ー又はシークエラーの発生が高頻度である磁気ディス
ク、又は媒体異常がある磁気ディスクをアレイディスク
制御装置が切離して信頼性を向上させるアレイディスク
制御装置を提供することを目的とする。
The present invention has been made in view of the above points, and an array disk in which an array disk controller separates a magnetic disk in which a read error or a seek error frequently occurs or a magnetic disk in which a medium has an abnormality to improve reliability. It is an object to provide a control device.

〔課題を解決するための手段〕[Means for solving the problem]

第1図(A),(B),(C)は本発明の原理図を示
す。
1 (A), 1 (B) and 1 (C) show the principle of the present invention.

第1図(A)において、アレイディスク制御装置1
は、ユーザデータを格納する複数のユーザ用磁気ディス
ク装置21〜2n-2及びパリティデータを格納するパリティ
用磁気ディスク装置2n-1及び予備の磁気ディスク装置2n
で構成される論理デバイスを制御する。
In FIG. 1A, the array disk controller 1
A plurality of magnetic disk devices for the user to store user data 2 1 ~2 n-2 and the parity magnetic disk unit for storing the parity data 2 n-1 and the spare magnetic disk device 2 n
Control the logical device composed of

エラーカウント手段3は、リードエラー、シークエラ
ー夫々の発生回数をカウントして保持する。
The error counting means 3 counts and holds the number of occurrences of each of a read error and a seek error.

第1の判定手段4は、リードエラー、シークエラー夫
々の発生頻度を第1,第2の規定値と比較し、第1,第2の
規定値を越えたとき障害と判定する。
The first determination means 4 compares the frequency of occurrence of each of the read error and the seek error with the first and second specified values, and determines that a failure has occurred when the frequency exceeds the first and second specified values.

欠陥登録手段5は、リードエラーが訂正不可能なとき
リードエラー発生位置を媒体欠陥として登録する。
The defect registering means 5 registers a read error occurrence position as a medium defect when the read error cannot be corrected.

第2の判定手段6は、欠陥登録手段5に登録された媒
体欠陥の総欠陥数を第3の規定値と比較し、第3の規定
値を越えたとき障害と判定する。
The second determination unit 6 compares the total number of medium defects registered in the defect registration unit 5 with a third specified value, and determines that a fault has occurred when the number exceeds the third specified value.

切離し手段7は、障害の判定により論理デバイス内の
障害のある磁気ディスク装置を切離してそのデータを予
備の磁気ディスク装置に復元する。
The disconnecting means 7 disconnects the failed magnetic disk device in the logical device based on the determination of the failure, and restores the data to a spare magnetic disk device.

また、同図(B)に示す第3の判定手段8は、欠陥登
録手段5に登録された媒体欠陥のヘッド毎の欠陥数を第
4の規定値と比較し、第4の規定値を越えたとき障害と
判定する。
Further, the third determination means 8 shown in FIG. 4B compares the number of medium defects registered in the defect registration means 5 for each head with a fourth specified value, and exceeds the fourth specified value. Is determined to be a failure.

また、同図(C)に示す第4の判定手段9は、欠陥登
録手段に登録された媒体欠陥のトラック毎の欠陥数を第
5の規定値と比較し、第5の規定値を越えたとき障害と
判定する。
Further, the fourth determination means 9 shown in FIG. 3C compares the number of medium defects registered in the defect registration means for each track with a fifth specified value, and exceeds the fifth specified value. Is determined to be a failure.

〔作用〕[Action]

本発明においてはリードエラー、シークエラー夫々の
発生頻度が第1,第2の規定値を越えたときにその磁気デ
ィスクを切離し、また媒体欠陥位置を登録して総欠陥数
が第3の規定値を越えたときにその磁気ディスクを切離
すため、誤り訂正可能なリードエラーが低頻度で発生す
るような磁気ディスク装置を不必要に切離すことがな
い。
In the present invention, when the frequency of occurrence of each of the read error and the seek error exceeds the first and second specified values, the magnetic disk is separated, and the position of the medium defect is registered to reduce the total number of defects to the third specified value. Since the magnetic disk is separated when it exceeds the limit, the magnetic disk device in which an error-correctable read error occurs infrequently does not needlessly be separated.

また、ヘッド毎の媒体欠陥数が第4の規定値を越えた
ときにその磁気ディスクを切離すことにより、ヘッドに
ゴミが付着した場合等に障害が小さいうちに対処でき信
頼性を確保できる。
Further, by separating the magnetic disk when the number of medium defects for each head exceeds the fourth specified value, it is possible to cope with the case where dust adheres to the head while the obstacle is small, and to secure reliability.

また、トラック毎の媒体欠陥数が第5の規定値を越え
たときにその磁気ヘッドを切離してヘッドが媒体に接触
して媒体の1トラックを損傷した場合等に障害が広がる
前に対処でき信頼性を確保できる。
In addition, when the number of medium defects per track exceeds the fifth specified value, the magnetic head is cut off and the head contacts the medium to damage one track of the medium. Nature can be secured.

〔実施例〕〔Example〕

第2図は本発明装置の一実施例のブロック図を示す。 FIG. 2 shows a block diagram of an embodiment of the apparatus of the present invention.

同図中、10は上位装置であり、上位装置10内のチャネ
ル11a,11b夫々はアレイディスク制御装置12内の制御部1
4a,14b夫々に接続されている。
In the figure, reference numeral 10 denotes a higher-level device, and channels 11a and 11b in the higher-level device 10 respectively correspond to control units 1 in the array disk controller 12.
4a and 14b are connected respectively.

アレイディスク制御装置12は制御部14a,14b夫々で論
理デバイス15,16を共にアクセスするクロスコール構成
であり、また情報格納手段17として不揮発性メモリを有
している。
The array disk control device 12 has a cross-call configuration in which the control units 14a and 14b respectively access the logical devices 15 and 16, and has a nonvolatile memory as the information storage unit 17.

制御部14a,14b夫々は上位装置10よりの指示に応じて
論理デバイス15,16夫々のデータ書込み及び読出しを行
ない、このとき障害検出手段18a,18b夫々で機器チェッ
ク及びシークエラー及びリードエラーの検出を行なう。
また情報監視手段19a,19bはエラー検出手段18a,18bのエ
ラー検出時に情報格納手段17に格納するエラー情報を更
新し、規定値との比較を行なう。
The control units 14a and 14b respectively write and read the data of the logical devices 15 and 16 in accordance with the instruction from the higher-level device 10.At this time, the failure detection means 18a and 18b respectively check the device and detect the seek error and the read error. Perform
The information monitoring means 19a, 19b updates the error information stored in the information storage means 17 when the error detection means 18a, 18b detects an error, and compares the updated error information with a specified value.

ところで機器チェックはディスク装置の電源やロジッ
ク回路の故障による障害であり、シークエラーは所望の
シリンダをシークできないというディスク媒体に関する
エラーであり、リードエラーは読出したデータに誤り訂
正符号による訂正可能又は訂正不能な誤りがあるという
ディスク媒体に関するエラーである。
By the way, the device check is a failure due to a failure of the power supply or the logic circuit of the disk device, the seek error is an error relating to the disk medium that the desired cylinder cannot be sought, and the read error is a correction or correction of the read data by an error correction code. This is an error relating to the disk medium that there is an impossible error.

情報格納手段17には次の情報が格納される。 The information storage means 17 stores the following information.

訂正可能なリードエラー数 訂正不可能なリードエラー数 回復可能なシークエラー数 回復不可能なシークエラー数 媒体欠陥の総数 媒体欠陥の位置テーブルつまり欠陥毎のディスク番
号、シリンダ番号、ヘッド番号、セクタ番号 ヘッド毎の媒体欠陥数 トラック毎の媒体欠陥数 情報監視手段19a,19bには上記〜,,の情報
に対応して規定値I〜VIIが保持されている。
Number of correctable read errors Number of uncorrectable read errors Number of recoverable seek errors Number of unrecoverable seek errors Total number of media defects Location table of media defects, that is, disk number, cylinder number, head number, and sector number for each defect Number of media defects per head Number of media defects per track The information monitoring means 19a and 19b hold prescribed values I to VII corresponding to the above information.

′規定値I(第1の規定値)は訂正可能なリードエラ
ー数の閾値 ′規定値II(第1の規定値)は訂正不可能なリードエ
ラー数の閾値(規定値I>規定値II) ′規定値III(第2の規定値)は回復可能なシークエ
ラー数の閾値 ′規定値IV(第2の規定値)は回復不可能なシークエ
ラー数の閾値(規定値III>規定値IV=2) ′規定値V(第3の規定値)は媒体欠陥総数の閾値 ′規定値VI(第4の規定値)は単一ヘッド当りの媒体
欠陥数の閾値 ′規定値VII(第5の規定値)は単一トラック当りの
媒体欠陥数の閾値 論理デバイス15,16夫々は例えば10台等の複数のディ
スク装置201〜20n,211〜21nより構成され、ディスク装
置201〜20n-2,211〜21n-2にはユーザデータが格納さ
れ、ディスク装置20n-1,21n-1にはユーザデータから生
成されるパリティデータが格納され、ディスク装置20n,
21nは予備とされている。
'The specified value I (first specified value) is a threshold value of the number of correctable read errors.' The specified value II (first specified value) is a threshold value of the number of uncorrectable read errors (specified value I> specified value II). 'The specified value III (the second specified value) is a threshold value of the number of seek errors that can be recovered.' The specified value IV (the second specified value) is the threshold value of the number of seek errors that cannot be recovered (the specified value III> the specified value IV = 2) 'Specified value V (third specified value) is a threshold value of the total number of medium defects.' Specified value VI (fourth specified value) is a threshold value of the number of medium defects per single head. 'Specified value VII (fifth specified value). value) is s threshold logic devices 15 and 16 respectively of the medium number of defects per a single track is composed of a plurality of disk devices 20 1 to 20 n, 21 1 through 21 n, such as, for example, ten, disk devices 20 1 to 20 n-2 , 21 1 to 21 n-2 store user data, and the disk devices 20 n-1 and 21 n-1 store parity data generated from the user data. The disk unit 20 n ,
21 n is reserved.

第3図は制御部14a,14bが実行するリードエラー処理
のフローチャートを示す。
FIG. 3 shows a flowchart of a read error process executed by the control units 14a and 14b.

同図中、リードエラーが発生すると、まずステップ30
でリードエラーが発生したセクタ位置を一担記憶し、か
つリードエラー発生の磁気ディスクを除く他のユーザ用
磁気ディスク及びパリティデータ用磁気ディスクのデー
タからリードエラーのデータを復元してリード処理を続
行する。
In the figure, when a read error occurs, first, in step 30
And the read error data is restored from the data on the magnetic disk for the user and the magnetic disk for parity data other than the magnetic disk in which the read error occurred, and the read process is continued. I do.

次に制御部の空き時間を利用してリードエラーが発生
したセクタを再度リードし(ステップ31)、正常にリー
ドが終了したかどうかを判別して(ステップ32)、正常
であれば処理を終了する。
Next, the sector in which the read error has occurred is read again using the idle time of the control unit (step 31), and it is determined whether or not the read has been normally completed (step 32). I do.

正常でなければ、このときのリードエラーが訂正可能
かどうかを判別し(ステップ33)、訂正可能な場合には
情報の訂正可能なリードエラー数に「1」を加算して
更新し(ステップ34)、この更新結果と第1の規定値の
うちの規定値Iとを比較する(ステップ35)。ここで更
新結果が規定値I以下ならば処理を終了するが、規定値
Iを越えると、この磁気ディスク装置を論理デバイスか
ら切離し(ステップ36)、この切離した磁気ディスク装
置の全データを復元して予備の磁気ディスク装置に格納
する(ステップ37)。上記ステップ36,37が切離し手段
7に対応する。
If it is not normal, it is determined whether or not the read error at this time can be corrected (step 33). If it can be corrected, "1" is added to the number of correctable read errors of the information and updated (step 34). ), And compares the update result with a specified value I of the first specified values (step 35). If the update result is equal to or less than the specified value I, the process is terminated. If the updated value exceeds the specified value I, the magnetic disk device is disconnected from the logical device (step 36), and all data of the separated magnetic disk device is restored. Stored in a spare magnetic disk device (step 37). The steps 36 and 37 correspond to the separating means 7.

また、ステップ33でリードエラーが訂正不可能な場合
には情報の訂正不可能なリードエラー数に「1」を加
算して更新し(ステップ39)、この更新結果と第1の規
定値のうちの規定値IIとを比較し(ステップ40)、更新
結果が大なる場合にはステップ36,37を実行する。更新
結果が規定値II以下の場合はこのリードエラーのセクタ
を不良セクタとして交代セクタを割付けつまりアサイン
し(ステップ41)、不良セクタのデータを復元して交代
セクタに移す(ステップ42)。上記ステップ34,39がエ
ラーカウント手段3に対応し、ステップ35,40が第1の
判定手段に対応する。
If the read error cannot be corrected in step 33, the number of uncorrectable read errors in the information is updated by adding "1" (step 39). Is compared with the specified value II (step 40), and if the update result is large, steps 36 and 37 are executed. If the update result is equal to or smaller than the specified value II, the replacement sector is assigned or assigned as the read error sector (Step 41), and the data of the defective sector is restored and transferred to the replacement sector (Step 42). Steps 34 and 39 correspond to the error counting means 3, and steps 35 and 40 correspond to the first determining means.

この後、情報の媒体欠陥の総数に「1」を加算して
更新し(ステップ43)、この更新結果と規定値Vとを比
較する。ここで規定値V以下の場合には情報のテーブ
ルに不良セクタの位置を登録し(ステップ45)、テーブ
ル上で同一トラックの不良セクタ数を計数して情報に
格納し(ステップ46)、この計数結果を規定値VIIと比
較する(ステップ47)。上記ステップ44が第2の判定手
段6に対応し、ステップ45が欠陥登録手段5に対応す
る。
Thereafter, "1" is added to the total number of medium defects in the information to update the information (step 43), and this update result is compared with a specified value V. If the value is equal to or smaller than the specified value V, the position of the defective sector is registered in the information table (step 45), the number of defective sectors on the same track is counted on the table and stored in the information (step 46). The result is compared with a specified value VII (step 47). Step 44 corresponds to the second determination means 6, and step 45 corresponds to the defect registration means 5.

ここで計数結果が規定値VII以下の場合は情報のテ
ーブル上で同一ヘッドの不良セクタ数を計数して情報
に格納し(ステップ48)、この計数結果と規定値VIとを
比較し(ステップ49)、計数結果が規定値以下の場合は
処理を終了する。ステップ44で更新結果が規定値Vを越
えた場合、又はステップ47で計数結果が規定値VIIを越
えた場合、又はステップ49で計数結果が規定値VIを越え
た場合はステップ50に進み、ここでこの磁気ディスク装
置を論理デバイスから切離し、この切離した磁気ディス
ク装置の全データを復元して予備の磁気ディスク装置に
格納し(ステップ51)、処理を終了する。上記ステップ
47が第3の判定手段8に対応し、ステップ49が第4の判
定手段に対応する。
If the counting result is equal to or smaller than the specified value VII, the number of defective sectors of the same head is counted on the information table and stored in the information (step 48), and the counted result is compared with the specified value VI (step 49). If the counting result is equal to or less than the specified value, the process ends. If the updated result exceeds the specified value V in step 44, or if the counted result exceeds the specified value VII in step 47, or if the counted result exceeds the specified value VI in step 49, the process proceeds to step 50, where Then, the magnetic disk device is disconnected from the logical device, all data of the separated magnetic disk device is restored and stored in the spare magnetic disk device (step 51), and the process is terminated. The above steps
47 corresponds to the third determining means 8, and step 49 corresponds to the fourth determining means.

第4図は制御部14a,14bが実行するシークエラー処理
のフローチャートを示す。
FIG. 4 shows a flowchart of a seek error process executed by the control units 14a and 14b.

同図中、シークエラーが発生すると、ステップ60で規
定回数だけシークを再試行し、シークエラーが回復した
かどうか判別する(ステップ61)。
In the figure, when a seek error occurs, the seek is retried a specified number of times in step 60, and it is determined whether the seek error has been recovered (step 61).

シークエラーが回復した場合には情報の回復可能な
シークエラー数に「1」を加算して更新し(ステップ6
2)、この更新結果と規定値IIIとを比較し(ステップ6
3)、規定値III以下の場合には処理を終了する。規定値
IIIを越える場合にはこの磁気ディスク装置を論理デバ
イスから切離し(ステップ64)、この切離した磁気ディ
スク装置の全データを復元して予備の磁気ディスク装置
に格納し(ステップ65)、処理を終了する。
When the seek error has been recovered, "1" is added to the number of seek errors for which information can be recovered and updated (step 6).
2) Compare this update result with the specified value III (step 6).
3) If the value is equal to or less than the specified value III, the process ends. Specified value
If it exceeds III, the magnetic disk device is disconnected from the logical device (step 64), all data of the disconnected magnetic disk device is restored and stored in a spare magnetic disk device (step 65), and the process is terminated. .

シークエラーが回復しない場合には情報の回復不可
能なシークエラー数に「1」を加算して更新し(ステッ
プ66)、この更新結果と規定値IVとを比較し(ステップ
67)、規定値IV以下の場合には処理を終了し、規定値IV
を越える場合にはステップ64,65を実行して処理を終了
する。
If the seek error does not recover, the information is updated by adding "1" to the number of unrecoverable seek errors of the information (step 66), and the updated result is compared with the specified value IV (step 66).
67) If the value is equal to or less than the specified value IV, the process ends, and the specified value IV
If the number exceeds the limit, steps 64 and 65 are executed, and the process ends.

上記ステップ62,66がエラーカウント手段3に対応
し、ステップ63,67が第1の判定手段4に対応し、ステ
ップ64,65が切離し手段7に対応する。
Steps 62 and 66 correspond to the error counting means 3, steps 63 and 67 correspond to the first judging means 4, and steps 64 and 65 correspond to the separating means 7.

ところで制御部14a,14b夫々は論理デバイスに対する
リードバイト総数が規定バイト数に達すると情報格納手
段17の情報,の訂正可能なリードエラー数、訂正不
可能なリードエラー数、回復可能なシークエラー数を夫
々ゼロにリセットする。また、シーク回数が規定バイト
数に達すると情報格納手段17の情報,の回復不可能
なシークエラー数夫々をゼロリセットする。
By the way, when the total number of read bytes for the logical device reaches the specified number of bytes, the control units 14a and 14b respectively determine the number of correctable read errors, the number of uncorrectable read errors, and the number of recoverable seek errors of the information in the information storage unit 17. Are reset to zero respectively. When the number of seeks reaches the specified number of bytes, the number of unrecoverable seek errors in the information in the information storage unit 17 is reset to zero.

これによってリードエラー又はシークエラーの発生頻
度が低い場合には磁気デイク装置が切離されることはな
い。
As a result, when the frequency of occurrence of read errors or seek errors is low, the magnetic disk device is not disconnected.

このようにリードエラー、シークエラー夫々の発生頻
度が規定値I,IIIを越えたときにその磁気ディスクを切
離し、また媒体欠陥位置をテーブルに登録して総欠陥数
が規定値Vを越えたときにその磁気ディスクを切離すた
め、誤り訂正可能なリードエラーが低頻度で発生するよ
うな磁気ディスク装置を不必要に切離すことがない。
As described above, when the frequency of occurrence of each of the read error and the seek error exceeds the specified values I and III, the magnetic disk is separated, and the position of the medium defect is registered in the table so that the total number of defects exceeds the specified value V. Since the magnetic disk is separated, the magnetic disk device in which an error-correctable read error occurs at a low frequency is not unnecessarily separated.

また、ヘッド毎の媒体欠陥数が規定値VIを越えたとき
にその磁気ディスクを切離すことにより、ヘッドにゴミ
が付着した場合等に障害が小さいうちに対処でき信頼性
を確保できる。
Further, by separating the magnetic disk when the number of medium defects for each head exceeds the specified value VI, it is possible to cope with a case where dust adheres to the head while the obstacle is small, and to secure reliability.

また、トラック毎の媒体欠陥数が規定値VIIを越えた
ときにその磁気ヘッドを切離してヘッドが媒体に接触し
て媒体の1トラックを損傷するヘッドクラッシュが発生
した場合等にこのようなヘッドクラッシュの障害が他の
トラックに広がる前に対処でき信頼性を確保できる。
Also, when the number of medium defects per track exceeds the prescribed value VII, the magnetic head is separated and the head comes into contact with the medium, causing a head crash that damages one track of the medium. Obstacles can be dealt with before they spread to other trucks, ensuring reliability.

更に切離した磁気ディスクの障害を分析するとき、情
報格納手段17に保持されている情報〜を読出して、
どのような障害かを知ることができ、障害復旧を早急に
行なうことが可能となる。
Further, when analyzing the failure of the separated magnetic disk, the information stored in the information storage means 17 is read,
It is possible to know what kind of failure has occurred, and it is possible to quickly recover from the failure.

ところで、上記実施例ではリードエラー及びサーチエ
ラーについて説明したが、機器チェックが発生した場合
には、その磁気ディスクを論理デバイスより切離し、切
離した磁気ディスクの全データを復元して予備の磁気デ
ィスクに移すことは勿論である。
By the way, in the above embodiment, a read error and a search error have been described. However, when a device check occurs, the magnetic disk is separated from the logical device, all data of the separated magnetic disk is restored, and a spare magnetic disk is restored. Needless to say, move.

〔発明の効果〕〔The invention's effect〕

上述の如く、本発明のアレイディスク制御装置によれ
ば、リードエラー又はシークエラーの発生が高頻度であ
る磁気ディスク、又は媒体異常がある磁気ディスクを切
離して信頼性を向上させることができ、また障害が小さ
いうちにこの障害に対処でき、実用上きわめて有用であ
る。
As described above, according to the array disk control device of the present invention, it is possible to improve the reliability by separating a magnetic disk in which a read error or a seek error frequently occurs, or a magnetic disk having a medium abnormality, and This obstacle can be dealt with while the obstacle is small, and is extremely useful in practice.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の原理図、 第2図は本発明装置の一実施例のブロック図、 第3図はリードエラー処理のフローチャート、 第4図はシークエラー処理のフローチャートである。 図において、 1,12はアレイディスク制御装置、 21〜2n,201〜20n,211〜21nは磁気ディスク装置、 3はエラーカウント手段、 4は第1の判定手段、 5は欠陥登録手段、 6は第2の判定手段、 7は切離し手段、 8は第3の判定手段、 9は第4の判定手段、 10は上位装置、 11a,11bはチャネル、 14a,14bは制御部、 15,16は論理デバイス、 17は情報格納手段、 18a,18bは障害検出手段、 19a,19bは情報監視手段、 30〜67はステップ を示す。1 is a principle diagram of the present invention, FIG. 2 is a block diagram of an embodiment of the present invention, FIG. 3 is a flowchart of a read error process, and FIG. 4 is a flowchart of a seek error process. In the figure, 1 and 12 array disk controller, 2 1 ~2 n, 20 1 ~20 n, 21 1 ~21 n magnetic disk drive, 3 error counter, the first judging means 4, 5 Defect registration means, 6 is second determination means, 7 is disconnection means, 8 is third determination means, 9 is fourth determination means, 10 is a higher-level device, 11a and 11b are channels, and 14a and 14b are control sections. Reference numerals 15, 16 and 17 denote logical devices, 17 denotes information storage means, 18a and 18b denote fault detection means, 19a and 19b denote information monitoring means, and 30 to 67 denote steps.

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】ユーザデータを格納する複数のユーザ用磁
気ディスク装置(21〜2n-2)及びパリティデータを格納
するパリティ用磁気ディスク装置(2n-1)及び予備の磁
気ディスク装置(2n)で構成される論理デバイスを制御
するアレイディスク制御装置において、 リードエラー、シークエラー夫々の発生回数をカウント
して保持するエラーカウント手段(3)と、 該リードエラー、シークエラー夫々の発生頻度を第1,第
2の規定値と比較し、該第1,第2の規定値を越えたとき
障害と判定する第1の判定手段(4)と、 リードエラーが訂正不可能なときリードエラー発生位置
を媒体欠陥として登録する欠陥登録手段(5)と、 該欠陥登録手段(5)に登録された媒体欠陥の総欠陥数
を第3の規定値と比較し、該第3の規定値を越えたとき
障害と判定する第2の判定手段(6)と、 障害の判定により該論理デバイス内の障害のある磁気デ
ィスク装置を切離してそのデータを予備の磁気ディスク
装置に復元する切離し手段(7)とを有することを特徴
とするアレイディスク制御装置。
1. A plurality of user magnetic disk devices (2 1 to 2 n−2 ) for storing user data, a parity magnetic disk device (2 n−1 ) for storing parity data, and a spare magnetic disk device (2). 2 n ) An error counting means (3) for counting and holding the number of occurrences of read errors and seek errors in the array disk control device for controlling the logical device composed of 2n ); A first judging means for comparing the frequency with the first and second specified values and judging a failure when the frequency exceeds the first and second specified values; A defect registration unit (5) for registering an error occurrence position as a medium defect; and comparing the total number of medium defects registered in the defect registration unit (5) with a third specified value, and determining the third specified value. Obstacle when crossing And a disconnecting means (7) for disconnecting the failed magnetic disk device in the logical device by the failure determination and restoring the data to a spare magnetic disk device. An array disk control device, characterized in that:
【請求項2】該欠陥登録手段(5)に登録された媒体欠
陥のヘッド毎の欠陥数を第4の規定値と比較し、該第4
の規定値を越えたとき障害と判定する第3の判定手段
(8)を有する請求項(1)記載のアレイディスク制御
装置。
2. The method according to claim 2, wherein the number of medium defects registered in said defect registration means (5) for each head is compared with a fourth prescribed value.
3. The array disk control device according to claim 1, further comprising third determining means for determining that a failure has occurred when a predetermined value is exceeded.
【請求項3】該欠陥登録手段に登録された媒体欠陥のト
ラック毎の欠陥数を第5の規定値と比較し、該第5の規
定値を越えたとき障害と判定する第4の判定手段(9)
を有する請求項(1)又は請求項(2)記載のアレイデ
ィスク制御装置。
3. A fourth judging means for comparing the number of medium defects registered in the defect registering means for each track with a fifth specified value, and judging a failure when the number exceeds the fifth specified value. (9)
The array disk control device according to claim 1 or 2, further comprising:
JP2180961A 1990-07-09 1990-07-09 Array disk controller Expired - Fee Related JP2618078B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2180961A JP2618078B2 (en) 1990-07-09 1990-07-09 Array disk controller

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2180961A JP2618078B2 (en) 1990-07-09 1990-07-09 Array disk controller

Publications (2)

Publication Number Publication Date
JPH0467476A JPH0467476A (en) 1992-03-03
JP2618078B2 true JP2618078B2 (en) 1997-06-11

Family

ID=16092309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2180961A Expired - Fee Related JP2618078B2 (en) 1990-07-09 1990-07-09 Array disk controller

Country Status (1)

Country Link
JP (1) JP2618078B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0635625A (en) * 1992-07-15 1994-02-10 Nec Corp Disk array controller
KR100524898B1 (en) * 1998-04-02 2005-12-27 삼성전자주식회사 Method and device for automatic kill head sorting in burn-in test
JP2006079418A (en) 2004-09-10 2006-03-23 Fujitsu Ltd Storage control apparatus, control method and program
JP4678384B2 (en) * 2007-03-30 2011-04-27 日本電気株式会社 Link failure diagnosis method, disk array system, and link failure diagnosis program
WO2010116514A1 (en) * 2009-04-09 2010-10-14 富士通株式会社 Raid control device

Also Published As

Publication number Publication date
JPH0467476A (en) 1992-03-03

Similar Documents

Publication Publication Date Title
US6442711B1 (en) System and method for avoiding storage failures in a storage array system
US9009526B2 (en) Rebuilding drive data
US7143308B2 (en) Apparatus, system, and method for differential rebuilding of a reactivated offline RAID member disk
EP2778926B1 (en) Hard disk data recovery method, device and system
CN103309775B (en) A kind of fault-tolerance approach of high-reliability disk array
US5530705A (en) Soft error recovery system and method
US7627786B2 (en) Tracking error events relating to data storage drives and/or media of automated data storage library subsystems
US20080126840A1 (en) Method for reconstructing data in case of two disk drives of raid failure and system therefor
US20060090098A1 (en) Proactive data reliability in a power-managed storage system
JP2005122338A (en) Disk array device having spare disk drive, and data sparing method
CN1746854A (en) The device, method and the program that are used for control store
JP2005322399A (en) Maintenance method of track data integrity in magnetic disk storage device
CN114265728A (en) Storage system fault recovery method and device, computer equipment and medium
JP2618078B2 (en) Array disk controller
JP2000200157A (en) Disk array device and data restoration method in disk array device
JP4012420B2 (en) Magnetic disk device and disk control device
JP3120753B2 (en) Disk array unit failure recovery device
JP3063666B2 (en) Array disk controller
JP4143040B2 (en) Disk array control device, processing method and program for data loss detection applied to the same
JP5381519B2 (en) A storage control device, a storage system, and an access method for detecting an erroneous calculation of a write position on a disk.
JP2003140839A (en) Hard disk multiplex control device and hard disk multiplex control program
CN111752765B (en) Method and system for recovering damaged data of RAID5
JPH05341921A (en) Disk array device
JPH01130243A (en) Fault recovering system for storage device
JPH0962461A (en) Automatic data restoring method for disk array device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees