JPH0467476A - アレイディスク制御装置 - Google Patents

アレイディスク制御装置

Info

Publication number
JPH0467476A
JPH0467476A JP2180961A JP18096190A JPH0467476A JP H0467476 A JPH0467476 A JP H0467476A JP 2180961 A JP2180961 A JP 2180961A JP 18096190 A JP18096190 A JP 18096190A JP H0467476 A JPH0467476 A JP H0467476A
Authority
JP
Japan
Prior art keywords
specified value
magnetic disk
defects
errors
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2180961A
Other languages
English (en)
Other versions
JP2618078B2 (ja
Inventor
Tomonaga Oyama
朝永 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2180961A priority Critical patent/JP2618078B2/ja
Publication of JPH0467476A publication Critical patent/JPH0467476A/ja
Application granted granted Critical
Publication of JP2618078B2 publication Critical patent/JP2618078B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 複数の磁気ディスク装置にデータを配分して格納するア
レイディスクの制御を行なうアレイディスク制御装置に
関し、 リードエラー又はシークエラーの発生か高頻度である磁
気ディスク、又は媒体異常がある磁気ディスクをアレイ
ディスク制御装置か切離して信頼性を向上させることを
目的とし、 ユーザデータを格納する複数のユーザ用磁気ディスク装
置及びパリティデータを格納するパリティ用磁気ディス
ク装置及び予備の磁気ディスク装置で構成される論理デ
バイスを制御するアレイディスク制御装置において、リ
ードエラー、シークエラー夫々の発生回数をカウントし
て保持するエラーカウント手段と、該リードエラー、シ
ークエラー夫々の発生頻度を第1.第2の規定値と比較
し、該第1.第2の規定値を越えたとき障害と判定する
第1の判定手段と、リードエラーか訂正不可能なときリ
ートエラー発生位置を媒体欠陥として登録する欠陥登録
手段と、該欠陥登録手段に登録された媒体欠陥の総欠陥
数を第3の規定値と比較し、該第3の規定値を越えたと
き障害と判定する第2の判定手段と、障害の判定により
該論理デバイス内の障害のある磁気ディスク装置を切離
してそのデータを予備の磁気ディスク装置に復元する切
離し手段とを有すると共に、該欠陥登録手段に登録され
た媒体欠陥のヘット毎の欠陥数を第4の規定値と比較し
、該第4の規定値を越えたとき障害と判定する第3の判
定手段と、該欠陥登録手段に登録された媒体欠陥のトラ
ック毎の欠陥数を第5の規定値と比較し、該第5の規定
値を越えたとき障害と判定する第4の判定手段を有し構
成する。
〔産業上の利用分野〕
本発明はアレイディスク制御装置に関し、複数の磁気デ
ィスク装置にデータを配分して格納するアレイディスク
の制御を行なうアレイディスク制御装置に関する。
複数の磁気ディスク装置にデータを分配して格納するア
レイディスクではユーザデータを格納する複数のユーザ
用磁気ディスク装置の他にパリティデータを格納するパ
リティ用磁気ディスク装置を用意して高信頼性を図って
おり、また電源やロジック回路の故障による障害の機器
チエツクか発生した磁気ディスク装置を切離して残りの
磁気ディスク装置にデータを格納しているか、リードエ
ラー又はシークエラーの如き障害が頻発する磁気ディス
ク装置も切離して信頼性を確保する必要がある。
〔従来の技術〕
従来より特開平1−191368号公報に記載のように
、エラー発生回数を計数して、これか規定値を越えた場
合に交換又は修理のために警告を発する磁気ディスク装
置が提案されている。
〔発明か解決しようとする課題〕
上記従来の磁気ディスク装置は、エラー発生回数か規定
値を越えたとき警告を発するため、エラーか誤り訂正符
号(FCC)で誤り訂正可能な場合であっても計数され
、このような誤り訂正可能なエラーか長時間に累積した
場合にも、交換又は修理の必要かないのにも拘らず警告
か発せられてしまい、エラー発生要因に応じて警告を発
することかてきないという問題かあった。また、警告を
発するたけで実際は何も行なわれていないという問題か
あった。
本発明は上記の点に鑑みなされたもので、り一ドエラー
又はシークエラーの発生か高頻度である磁気ディスク、
又は媒体異常かある磁気ディスクをアレイディスク制御
装置が切離して信頼性を向上させるアレイディスク制御
装置を提供することを目的とする。
〔課題を解決するための手段〕
第1図(A)、(B)、(C)は本発明の原理図を示す
第1図(A)において、アレイディスク制御装置lは、
ユーザデータを格納する複数のユーザ用磁気ディスク装
置2I〜2.、、及びパリティデータを格納するパリテ
ィ用磁気ディスク装置2n及び予備の磁気ディスク装置
2.、て構成される論理デバイスを制御する。
エラーカウント手段3は、リードエラー、ノークエラー
夫々の発生回数をカウントして保持する。
第1の判定手段4は、リードエラー、シークエラー夫々
の発生頻度を第1.第2の規定値と比較し、第1.第2
の規定値を越えたとき障害と判定する。
欠陥登録手段5は、リードエラーか訂正不可能なときり
一ドエラー発生位置を媒体欠陥として登録する。
第2の判定手段6は、欠陥登録手段5に登録された媒体
欠陥の総欠陥数を第3の規定値と比較し、第3の規定値
を越えたとき障害と判定する。
切離し手段7は、障害の判定により論理デバイス内の障
害のある磁気ディスク装置を切離してそのデータを予備
の磁気ディスク装置に復元する。
また、同図(B)に示す第3の判定手段8は、欠陥登録
手段5に登録された媒体欠陥のヘッド毎の欠陥数を第4
の規定値と比較し、第4の規定値を越えたとき障害と判
定する。
また、同図(C)に示す第4の判定手段9は、欠陥登録
手段に登録された媒体欠陥のトラック毎の欠陥数を第5
の規定値と比較し、第5の規定値を越えたとき障害と判
定する。
〔作用〕
本発明においてはリードエラー、シークエラー夫々の発
生頻度か第1.第2の規定値を越えたときにその磁気デ
ィスクを切離し、また媒体欠陥位置を登録して総欠陥数
か第3の規定値を越えたときにその磁気ディスクを切離
すため、誤り訂正可能なリードエラーか低頻度で発生す
るような磁気ディスク装置を不必要に切離すことかない
また、ヘッド毎の媒体欠陥数か第4の規定値を越えたと
きにその磁気ディスクを切離すことにより、ヘッドにゴ
ミか付着した場合等に障害か小さいうちに対処でき信頼
性を確保てきる。
また、トラック毎の媒体欠陥数か第5の規定値を越えた
ときにその磁気ヘッドを切離してヘッドか媒体に接触し
て媒体の1トラツクを損傷した場合等に障害が広がる前
に対処でき信頼性を確保てきる。
〔実施例〕
第2図は本発明装置の一実施例のブロック図を示す。
同図中、lOは上位装置であり、上位装置10内のチャ
ネル11a、11b夫々はアレイディスク制御装置12
内の制御部14a、14b夫々に接続されている。
アレイディスク制御装置I2は制御部14a。
14b夫々で論理デバイス15.16を共にアクセスす
るクロスコール構成であり、また情報格納手段17とし
て不揮発性メモリを有している。
制御部14a、14b夫々は上位装置lOよりの指示に
応じて論理デバイス15.16夫々のデータ書込み及び
読出しを行ない、このとき障害検出手段18a、18b
夫々て機器チエツク及びシークエラー及びリードエラー
の検出を行なう。
また情報監視手段19a、19bはエラー検出手段18
a、18bのエラー検出時に情報格納手段17に格納す
るエラー情報を更新し、規定値との比較を行なう。
ところで機器チエツクはディスク装置の電源やロジック
回路の故障による障害てあり、シークエラーは所望のシ
リンダをシーつてきないというディスク媒体に関するエ
ラーてあり、リードエラーは読出したデータに誤り訂正
符号による訂正可能又は訂正不能な誤りかあるというデ
ィスク媒体に関するエラーである。
情報格納手段17には次の情報か格納される。
■ 訂正可能なリードエラー数 ■ 訂正不可能なリードエラー数 ■ 回復可能なシークエラー数 ■ 回復不可能なシークエラー数 ■ 媒体欠陥の総数 ■ 媒体欠陥の位置テーブルつまり欠陥毎のディスク番
号、シリンダ番号、ヘット番号、セクタ番号 ■ ヘッド毎の媒体欠陥数 ■ トラック毎の媒体欠陥数 情報監視手段19a、19bには上記■〜■。
■、■の情報に対応して規定値工〜■か保持されている
■′規定値I(第1の規定値)は訂正可能なIJ−ドエ
ラー数の閾値 ■′規定値■(第1の規定値)は訂正不可能なり一ドエ
ラー数の閾値(規定値I〉規定値■)■′規定値■(第
2の規定値)は回復可能なシークエラー数の閾値 ■′規定値■(第2の規定値)は回復不可能なシークエ
ラー数の閾値(規定値■〉規定値■■′規定値V(13
の規定値)は媒体欠陥総数の閾値 ■′規定値■(第4の規定値)は単一ヘット当りの媒体
欠陥数の閾値 ■′規定値■(第5の規定値)は単一トランク当りの媒
体欠陥数の閾値 論理デバイス15.16夫々は例えは10台等の複数の
ディスク装置20.〜20..2+、〜21、より構成
され、ディスク装置20.〜20.2.21.〜21.
−2にはユーザデータか格納され、ディスク装置20゜
−、、21n−1にはユーザデータから生成されるパリ
ティデータか格納され、ディスク装置20.、.21.
は予備とされている。
第3図は制御部14a、14bか実行するり−ドエラー
処理のフローチャートを示す。
同図中、リードエラーか発生すると、まずステップ30
てリードエラーか発生したセクタ位置を一担記憶し、か
つリードエラー発生の磁気ディスクを除く他のユーザ用
磁気ディスク及びパリティデータ用磁気ディスクのデー
タからリードエラーのデータを復元してリード処理を続
行する。
次に制御部の空き時間を利用してリードエラーか発生し
たセクタを再度リードしくステ、ブ31)、正常にリー
ドか終了したかどうかを判別して(ステップ32)、正
常であれば処理を終了する。
正常でなければ、このときのリードエラーか訂正可能か
どうかを判別しくステップ33)、訂正可能な場合には
情報■の訂正可能なリートエラー数に「1ノを加算して
更新しくステップ34)、この更新結果と第1の規定値
のうちの規定値Iとを比較する(ステップ35)。ここ
で更新結果か規定値I以下ならば処理を終了するか、規
定値工を越えると、この磁気ディスク装置を論理デバイ
スから切離しくステップ36)、この切離した磁気ディ
スク装置の全データを復元して予備の磁気ディスク装置
に格納する(ステップ37)。上記ステップ36.37
か切離し手段7に対応する。
また、ステップ33でリードエラーか訂正不可能な場合
には情報■の訂正不可能なリードエラー数に「1」を加
算して更新しくステップ39)、この更新結果と第1の
規定値のうちの規定値■とを比較しくステップ40)、
更新結果か大なる場合にはステップ36.37を実行す
る。更新結果か規定値■以下の場合はこのリードエラー
のセクタを不良セクタとして交代セクタを割付けつまり
アサインしくステップ41)、不良セクタのデータを復
元して交代セクタに移す(ステップ42)。
上記ステップ34.39かエラーカウント手段3に対応
し、ステップ35.40か第1の判定手段に対応する。
この後、情報■の媒体欠陥の総数にNJを加算して更新
しくステップ43)、この更新結果と規定値■とを比較
する。ここで規定値v以下の場合には情報■のテーブル
に不良セクタの位置を登録しくステップ45)、テーブ
ル上で同一トラックの不良セクタ数を計数して情報■に
格納しくステップ46)、この計数結果を規定値■と比
較する(ステップ47)。上記ステップ44か第2の判
定手段6に対応し、ステップ45が欠陥登録手段5に対
応する。
ここて計数結果か規定値■以下の場合は情報■のテーブ
ル上で同一ヘッドの不良セクタ数を計数して情報■に格
納しくステップ48)、この計数結果と規定値■とを比
較しくステップ49)、計数結果か規定値以下の場合は
処理を終了する。ステップ44て更新結果か規定値■を
越えた場合、又はステップ47て計数結果か規定値■を
越えた場合、又はステップ49て計数結果か規定値■を
越えた場合はステップ50に進み、ここでこの磁気ディ
スク装置を論理デバイスから切離し、この切離した磁気
ディスク装置の全データを復元して予備の磁気ディスク
装置に格納しくステップ51)、処理を終了する。上記
ステップ47が第3の判定手段8に対応し、ステップ4
9が第4の判定手段に対応する。
第4図は制御部14a、14bか実行するシークエラー
処理のフローチャートを示す。
同図中、シークエラーか発生すると、ステップ60て規
定回数だけシークを再試行し、シークエラーか回復した
かどうかを判別する(ステップ61)。
シークエラーか回復した場合には情報■の回復可能なシ
ークエラー数に「1」を加算して更新しくステップ62
)、この更新結果と規定値■とを比較しくステップ63
)、規定値■以下の場合には処理を終了する。規定値■
を越える場合にはこの磁気ディスク装置を論理デバイス
から切離しくステップ64)、この切離した磁気ディス
ク装置の全データを復元して予備の磁気ディスク装置に
格納しくステップ65)、処理を終了する。
シークエラーが回復しない場合には情報■の回復不可能
なシークエラー数に「l」を加算して更新しくステップ
66)、この更新結果と規定値■とを比較しくステップ
67)、規定値■以下の場合には処理を終了し、規定値
■を越える場合にはステップ64.’65を実行して処
理を終了する。
上記ステップ62.66かエラーカウント手段3に対応
し、ステップ63’、67か第1の判定手段4に対応し
、ステップ64.65か切離し手段7に対応する。
ところて制御部14a、14b夫々は論理デバイスに対
するリードバイト総数か規定バイト数に達すると情報格
納手段17の情報■、■の訂正可能なリードエラー数、
訂正不可能なリードエラー数、回復可能なシークエラー
数を夫々ゼロにリセットする。また、シーク回数か規定
バイト数に達すると情報格納手段17の情報■、■の回
復不可能なシークエラー散失々をゼロリセットする。
これによってリードエラー又はシークエラーの発生頻度
が低い場合には磁気デイク装置か切離されることはない
このようにリードエラー、シークエラー夫々の発生頻度
が規定値1. II[を越えたときにその磁気ディスク
を切離し、また媒体欠陥位置をテーブルに登録して総欠
陥数が規定値■を越えたときにその磁気ディスクを切離
すため、誤り訂正可能なリードエラーが低頻度で発生す
るような磁気ディスク装置を不必要に切離すことかない
また、ヘッド毎の媒体欠陥数か規定値■を越えたときに
その磁気ディスクを切離すことにより、ヘッドにゴミか
付着した場合等に障害か小さいうちに対処でき信頼性を
確保できる。
また、トラック毎の媒体欠陥数か規定値■を越えたとき
にその磁気ヘットを切離してヘットか媒体に接触して媒
体の1トラツクを損傷するヘッドクラッシュか発生した
場合等にこのようなヘッドクラッシュの障害か他のトラ
ックに広がる前に対処でき信頼性を確保てきる。
更に切離した磁気ディスクの障害を分析するとき、情報
格納手段17に保持されている情報■〜■を続出して、
とのような障害かを知ることかでき、障害復旧を早急に
行なうことか可能となる。
ところで、上記実施例ではリートエラー及びサーチエラ
ーについて説明したか、機器チエツクが発生した場合に
は、その磁気ディスクを論理デバイスより切離し、切離
した磁気ディスクの全データを復元して予備の磁気ディ
スクに移すことは勿論である。
〔発明の効果〕
上述の如く、本発明のアレイディスク制御装置によれば
、リードエラー又はシークエラーの発生か高頻度である
磁気ディスク、又は媒体異常かある磁気ディスクを切離
して信頼性を向上させることかでき、また障害か小さい
うちにこの障害に対処でき、実用上きわめて有用である
【図面の簡単な説明】
第1図は本発明の原理図、 第2図は本発明装置の一実施例のブロック図、第3図は
リードエラー処理のフローチャート、第4図はシークエ
ラー処理のフローチャートである。 図において、 1.12はアレイディスク制御装置、 2n〜2..201〜20..21.〜21、は磁気デ
ィスク装置、 3はエラーカウント手段、 4は第1の判定手段、 5は欠陥登録手段、 6は第2の判定手段、 7は切離し手段、 8は第3の判定手段、 9は第4の判定手段、 10は上位装置、 11a、llbはチャネル、 14a、14bは制纒部、 15.16は論理デバイス、 17は情報格納手段、 18a、18bは障害検出手段、 19a、19bは情報監視手段、 30〜67はステップ を示す。 (A) 本発明の原理図 第1図(その1) (B) 本発明の原理図 第1図(その2) (C) 本発明の原理図 第1図(その3) 本発明装置のブロック図 第2図

Claims (3)

    【特許請求の範囲】
  1. (1)ユーザデータを格納する複数のユーザ用磁気ディ
    スク装置(2_1〜2_n_−_2)及びパリテイデー
    タを格納するパリテイ用磁気ディスク装置(2_n_−
    _1)及び予備の磁気ディスク装置(2_n)で構成さ
    れる論理デバイスを制御するアレイディスク制御装置に
    おいて、 リードエラー、シークエラー夫々の発生回数をカウント
    して保持するエラーカウント手段(3)と、 該リードエラー、シークエラー夫々の発生頻度を第1、
    第2の規定値と比較し、該第1、第2の規定値を越えた
    とき障害と判定する第1の判定手段(4)と、 リードエラーが訂正不可能なときリードエラー発生位置
    を媒体欠陥として登録する欠陥登録手段(5)と、 該欠陥登録手段(5)に登録された媒体欠陥の総欠陥数
    を第3の規定値と比較し、該第3の規定値を越えたとき
    障害と判定する第2の判定手段(6)と、 障害の判定により該論理デバイス内の障害のある磁気デ
    ィスク装置を切離してそのデータを予備の磁気ディスク
    装置に復元する切離し手段(7)とを有することを特徴
    とするアレイディスク制御装置。
  2. (2)該欠陥登録手段(5)に登録された媒体欠陥のヘ
    ッド毎の欠陥数を第4の規定値と比較し、該第4の規定
    値を越えたとき障害と判定する第3の判定手段(8)を
    有する請求項(1)記載のアレイディスク制御装置。
  3. (3)該欠陥登録手段に登録された媒体欠陥のトラック
    毎の欠陥数を第5の規定値と比較し、該第5の規定値を
    越えたとき障害と判定する第4の判定手段(9)を有す
    る請求項(1)又は請求項(2)記載のアレイディスク
    制御装置。
JP2180961A 1990-07-09 1990-07-09 アレイディスク制御装置 Expired - Fee Related JP2618078B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2180961A JP2618078B2 (ja) 1990-07-09 1990-07-09 アレイディスク制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2180961A JP2618078B2 (ja) 1990-07-09 1990-07-09 アレイディスク制御装置

Publications (2)

Publication Number Publication Date
JPH0467476A true JPH0467476A (ja) 1992-03-03
JP2618078B2 JP2618078B2 (ja) 1997-06-11

Family

ID=16092309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2180961A Expired - Fee Related JP2618078B2 (ja) 1990-07-09 1990-07-09 アレイディスク制御装置

Country Status (1)

Country Link
JP (1) JP2618078B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0635625A (ja) * 1992-07-15 1994-02-10 Nec Corp ディスクアレイ制御装置
KR100524898B1 (ko) * 1998-04-02 2005-12-27 삼성전자주식회사 번-인 테스트에서의 킬링 헤드 자동 선별 방법 및 장치
US7395451B2 (en) 2004-09-10 2008-07-01 Fujitsu Limited Apparatus, method and program for the control of storage
JP2008250929A (ja) * 2007-03-30 2008-10-16 Nec Corp リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム
WO2010116514A1 (ja) * 2009-04-09 2010-10-14 富士通株式会社 Raid制御装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0635625A (ja) * 1992-07-15 1994-02-10 Nec Corp ディスクアレイ制御装置
KR100524898B1 (ko) * 1998-04-02 2005-12-27 삼성전자주식회사 번-인 테스트에서의 킬링 헤드 자동 선별 방법 및 장치
US7395451B2 (en) 2004-09-10 2008-07-01 Fujitsu Limited Apparatus, method and program for the control of storage
JP2008250929A (ja) * 2007-03-30 2008-10-16 Nec Corp リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム
JP4678384B2 (ja) * 2007-03-30 2011-04-27 日本電気株式会社 リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム
WO2010116514A1 (ja) * 2009-04-09 2010-10-14 富士通株式会社 Raid制御装置

Also Published As

Publication number Publication date
JP2618078B2 (ja) 1997-06-11

Similar Documents

Publication Publication Date Title
US7143308B2 (en) Apparatus, system, and method for differential rebuilding of a reactivated offline RAID member disk
US7543178B2 (en) Low cost RAID with seamless disk failure recovery
US6886108B2 (en) Threshold adjustment following forced failure of storage device
US7627786B2 (en) Tracking error events relating to data storage drives and/or media of automated data storage library subsystems
US9009526B2 (en) Rebuilding drive data
CN100353328C (zh) 用于控制存储的装置和方法
US7587631B2 (en) RAID controller, RAID system and control method for RAID controller
US20140215262A1 (en) Rebuilding a storage array
JP2005122338A (ja) スペアディスクドライブをもつディスクアレイ装置及びデータスペアリング方法
WO2002089133A2 (en) Data integrity error handling in a redundant storage array
JP2002007077A (ja) ディスクアレイ装置のループ診断システム及びその方法
US20070234107A1 (en) Dynamic storage data protection
CN108170375B (zh) 一种分布式存储系统中的超限保护方法和装置
CN112084097B (zh) 一种磁盘告警方法及装置
US20070136624A1 (en) Failure recovering method and recording apparatus
JP2000200157A (ja) ディスクアレイ装置およびディスクアレイ装置におけるデ―タ復旧方法
JPH0467476A (ja) アレイディスク制御装置
JP3120753B2 (ja) ディスクアレイ装置の障害復旧装置
JPH1195933A (ja) ディスクアレイ装置
JP2003263703A (ja) 磁気ディスク装置及びディスク制御装置
JPH0962461A (ja) ディスクアレイ装置における自動データ復旧方法
JPH06282385A (ja) 記憶制御装置および記憶制御装置を備える情報処理システム
CN111752765B (zh) 一种raid5损坏数据恢复的方法及系统
JPH01130243A (ja) 記憶装置の障害回復方式
JPH07182116A (ja) 外部記憶装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees