JPH10275060A - アレイディスク制御装置 - Google Patents

アレイディスク制御装置

Info

Publication number
JPH10275060A
JPH10275060A JP9080998A JP8099897A JPH10275060A JP H10275060 A JPH10275060 A JP H10275060A JP 9080998 A JP9080998 A JP 9080998A JP 8099897 A JP8099897 A JP 8099897A JP H10275060 A JPH10275060 A JP H10275060A
Authority
JP
Japan
Prior art keywords
disk
failure
value
management table
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9080998A
Other languages
English (en)
Other versions
JP3063666B2 (ja
Inventor
Yoshiaki Mori
善昭 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9080998A priority Critical patent/JP3063666B2/ja
Publication of JPH10275060A publication Critical patent/JPH10275060A/ja
Application granted granted Critical
Publication of JP3063666B2 publication Critical patent/JP3063666B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

(57)【要約】 【課題】 少ない障害履歴情報で、的確にディスクの切
り離しを行い、信頼性を向上させること。 【解決手段】 ホストインタフェース制御部6で受信し
たデータを冗長構成にして複数のディスクに格納するア
レイ制御部3と、ディスクの障害に応じて予め定められ
た値が格納されるメディア障害管理テーブル1と、この
メディア障害管理テーブル1の内容を制御するマイクロ
プログラム制御部5とを備えている。そして、マイクロ
プログラム制御部5は、ディスクの障害が発生したとき
にディスク障害管理テーブルの値を増加させるディスク
障害値加算機能と、当該ディスクに対して正常にデータ
の格納又は読み出しが行われたときにはディスク障害管
理テーブルの値を減少させるディスク障害値減算機能
と、ディスク障害管理テーブルのディスク障害値が予め
定められたしきい値よりも上回ったときに当該インタフ
ェースを切り離すディスク切り離し機能とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のディスクに
データを分散して書き込むアレイディスクを制御するア
レイディスク制御装置に係り、特に、ディスクまたはデ
ィスクインターフェースでの障害発生時にディスクの切
り離しを行うアレイディスク制御装置に関する。
【0002】
【従来の技術】従来より、特開平4−67476号公報
に開示されているように、磁気ディスク装置のリードエ
ラーまたはシークエラーの発生状況を監視し、媒体異常
がある磁気ディスクを切り離すアレイディスク制御装置
が提案されている。これは、エラーの発生回数により媒
体の状態を検出し、エラーの発生回数が予め定められた
値を越えたときに当該ディスクを強制的に切り離すもの
である。
【0003】
【発明が解決しようとする課題】しかしながら、特開平
4−67476号公報に示されている従来の技術ては、
媒体異常の発生頻度を知るために各媒体欠陥の位置に関
する構報を記憶しておかなければならなず、すると、非
常に大きな記憶容量が必要となってしまう、という不都
合があった。
【0004】さらに、従来の技術では、ディスクインタ
フェース制御部に異常があった場合であっても、当該デ
ィスクインタフェース制御部に接続されているディスク
に異常があるとして切り離してしまう、という不都合が
あった。
【0005】具体的には、近年の磁気ディスクは媒体の
品質が向上し、記録媒体の障害による障害は比較的少な
く、例え発生しても交代セクター処理などによりあまり
大きな被害が生じにくい。逆に、ディスクの記録密度の
高密度化などに伴い、ヘッドの記録面への吸着、あるい
は、スピンドルモータの故障、アレイディスク制御装置
とディスクとの間のインターフェースの障害のようにデ
ィスクの記録媒体の一部の障害よりもディスク全体がア
クセス不能になる障害の方が生じやすく、また、これに
よる被害の方がディスク全体がアクセス不能になる分大
きなものとなる。
【0006】ヘッドの記録面への吸着、あるいは、スピ
ンドルモータの故障などディスク自身の障害に対しては
従来技術の延長でディスクを切り離すことで信頼性を向
上させることができる。しかし、ディスクインターフェ
ースの障害に関してはディスク自身の障害であるか、ア
レイディスク制御装置のインターフェース部の障害であ
るかの切り分けは困難であり、従来技術のようにエラー
の発生履歴をカウントすることによりディスクを切り離
すことは悪影響を招くことがある。
【0007】例えば、図6のように2台のアレイディス
ク制御装置から各ディスク71〜74をアクセスできる
ように構成されたアレイディスク装置で、アレイディス
ク制御装置10A内のディスクインターフェース制御回
路42Aが故障した場合、ディスク52Aを切り離すこ
とにより処理の継続は可能であるが、この場合正常なデ
ィスクを切り離すことになってしまう。
【0008】さらに、従来例では、複数のディスクの内
の1つのディスクの一部分の領域に障害がある場合に、
他のディスクに障害が発生したとして切り離してしまう
と、当該1つのディスクの障害のない他の部分のデータ
を読み出すことができなくなってしまう、という不都合
があった。すなわち、障害の発生の回数で単純に切り離
し処理を行うと、復旧可能なデータであっても喪失して
しまう、という不都合があった。
【0009】まず、冗長性を持ったアレイディスクで
は、媒体の障害により書き込みができない場合にはデー
タを格納するデータディスクとパリティデータを格納す
る冗長ディスクとの整合性をとるため、障害ディスクを
切り離して処理を行う必要がある。
【0010】しかし、読み出しの場合には冗長ディスク
でデータを復旧してホストコンピュータに転送すること
が可能なため、より影響が大きくなるディスク全体の切
り離しは行わず一時的な切り離しだけで処理を継続しよ
うとすることがある。あるいは、媒体に比較的軽微な障
害が発生しているが、再試行により救済することが可能
な状況ではディスクの切り離しは行われない場合があ
る。
【0011】このような部分的な媒体障害が発生してい
るが、そのディスクの切り離しが行われていない状態に
なることがあり得る。このような状態で他のディスクで
重度な障害が発生した場合には、従来技術のように障害
の発生頻度をカウントする方法だけでディスクを切り離
すようにすると、ディスクは切り離されて処理を継続し
てしまうことになる。
【0012】この状態でディスクを切り離した場合、処
理を継続することが可能であるが、これにより冗長性が
なくなるため、の部分的な媒体障害の発生している部分
はその後読み出すことができなくなる。これは、すでに
書き込まれているデータを読み出せない、すなわちデー
タの消失という、データを書き込むことができなくなり
処理を中断するよりも大きな問題になる。
【0013】
【発明の目的】本発明は、係る従来例の有する不都合を
改善し、特に、少ない障害履歴情報で、的確にディスク
の切り離しを行い、信頼性を向上させることのできるア
レイディスク制御装置を提供することを、その目的とす
る。
【0014】
【課題を解決するための手段】そこで、本発明では、上
位装置から送信されたデータを受信するホストインタフ
ェース制御部と、このホストインタフェースで受信した
データを冗長構成にして複数のディスクに格納するアレ
イ制御手段とを備えている。さらに、アレイ制御手段
に、ディスクの障害に応じて予め定められた値が格納さ
れるディスク障害管理テーブルを併設している。そし
て、アレイ制御手段が、ディスクの障害が発生したとき
にディスク障害管理テーブルの値を増加させるディスク
障害値加算機能と、当該ディスクに対して正常にデータ
の格納又は読み出しが行われたときにはディスク障害管
理テーブルの値を減少させるディスク障害値減算機能
と、ディスク障害管理テーブルのディスク障害値が予め
定められたしきい値よりも上回ったときに当該インタフ
ェースを切り離す機能をとを備えた、という構成を採っ
ている。これにより前述した目的を達成しようとするも
のである。
【0015】アレイ制御手段は、ディスクの障害状態に
応じてディスクの切り離し処理を行う。このとき、本発
明では、ディスクの障害に応じて予め定められた値が格
納されるディスク障害管理テーブルを用いる。アレイ制
御手段は、ディスク障害値加算機能により、ディスクの
障害が発生したときにディスク障害管理テーブルの値を
増加させる。一方、間欠的な障害によってディスクの切
り離しを行うことを防止するため、ディスク障害値減算
機能によって、ディスクに対して正常にデータの格納又
は読み出しが行われたときにはディスク障害管理テーブ
ルの値を減少させる。そして、アレイ制御手段は、ディ
スク切り離し機能により、ディスク障害管理テーブルの
ディスク障害値が予め定められたしきい値よりも上回っ
たときに当該インタフェースを切り離す。
【0016】ディスク障害値減算機能によって、回復不
能なメディアの障害の発生と、間欠的なリード/ライト
エラーの発生とを的確にディスク障害管理テーブルに反
映される。このため、軽度の障害で切り離す必要がない
ときに切り離し処理を行うことがない。
【0017】
【発明の実施の形態】以下、本発明の実施の形態を説明
する。本実施形態によるアレイディスク制御装置は、上
位装置から送信されたデータを受信するホストインタフ
ェース制御部と、このホストインタフェースで受信した
データを冗長構成にして複数のディスクに格納するアレ
イ制御手段とを備えている。このアレイ制御手段に、デ
ィスクの障害に応じて予め定められた値が格納されるデ
ィスク(メディア)障害管理テーブルを併設している。
【0018】しかも、アレイ制御手段は、ディスクの障
害が発生したときにディスク障害管理テーブルの値を増
加させるディスク障害値加算機能と、当該ディスクに対
して正常にデータの格納又は読み出しが行われたときに
はディスク障害管理テーブルの値を減少させるディスク
障害値減算機能と、ディスク障害管理テーブルのディス
ク障害値が予め定められたしきい値よりも上回ったとき
に当該インタフェースを切り離すディスク切り離し機能
とを備えている。
【0019】この構成では、ディスク障害値減算機能
が、ディスクに対して正常にデータの格納又は読み出し
が行われたときには、ディスク障害値加算機能によって
加算されたディスク障害値を減算する。このため、間欠
的なディスクの障害の場合には、ディスク障害値加算機
能によってディスク障害値が加算されても、正常な動作
が継続することによりディスク障害値はしきい値に至ら
ず、従って、切り離す必要がない場合に切り離し処理を
行うことがない。
【0020】また、実施の形態によっては、アレイ制御
手段が、複数のディスク装置をさらに複数の領域に分割
すると共に、ディスク障害管理テーブルが、当該分割領
域ごとに障害の履歴を管理するテーブル項目を有する。
さらに、ディスク障害値加算機能が、ディスクの障害が
発生したときに一定値aを加算する機能を備え、ディス
ク障害管理テーブルのしきい値を、一定値aのn倍に設
定すると共に、このnの値を、上位装置が同一データを
自動的にリトライする回数に設定する。そして、ディス
ク障害値減算機能が、ディスク装置の分割領域数に応じ
て一定値aよりも小さい値を減算する機能を備える。
【0021】この領域の分割を行う例では、分割領域と
ディスクに障害が発生する箇所との大きさの相違と、上
位装置が同一データを自動的にリトライする回数を考慮
している。上位装置が同一データの書き込みを繰り返す
回数が3回だとすると、3回繰り返して書き込みが行え
ない場合には、書き込み又は読み出しを行うディスクの
位置は同一箇所であるため、当該データを書き込もうと
したセクタにメディアの障害が発生していると判定でき
る。従って、しきい値をaのn倍とすると、このnを上
位装置が同一のデータをリトライする回数に設定する
と、この上位装置のリトライが不成功となった場合に
は、必ず障害有りとなり、切り離し処理の対象とする。
【0022】一方、複数の異なるアクセス命令が上位装
置から出力され、一部に障害のある分割領域に異なる命
令によってアクセスするときには、実際にアクセスする
箇所が異なる。この場合には、分割領域の正常な箇所に
アクセスすることがあるため、正常な箇所へのアクセス
によってディスク障害値を減算していく。しかし、この
減算の値は、加算の設定値aよりも十分に小さい値とす
ることで、ディスクに障害が発生したという履歴をディ
スク障害テーブルに残しておく。すなわち、分割領域が
小さい場合には、一旦障害が発生したとされる箇所が正
常な状態となったと判定できる場合であっても、分割領
域が大きく、分割領域のなかに障害のある部分とない部
分とがある場合には、障害が発生した分割領域であって
も正常にデータのリードライトが行える場合が多くな
る。このため、減算する値は、ディスク装置の分割領域
数に応じて一定値aよりも小さい値とする。この小さい
値での減算が継続すると、すなわち、正常なリードライ
トが繰り返されると、ディスク障害テーブルの値は0と
なる。一方、上位装置からリトライ命令が繰り返される
と、大きい値aが加算されるため、しきい値に達する。
このように分割領域としきい値及び加算、減算値の関係
を設定するため、的確にディスクの切り離し処理を行う
ことができる。
【0023】他の実施形態では、アレイ制御手段が、デ
ィスク切り離し機能によってディスクを切り離す制御を
行うときにディスク障害管理テーブルによって他のディ
スクも障害を有するとされた場合には当該切り離し制御
を中止する切り離し中止機能を備える。この切り離し中
止機能により、自動的に切り離し処理を行うのは複数の
ディスクのうち1台のみに障害が発生している場合に限
られ、このため、切り離し処理を行ってもデータの冗長
構成によりデータを復旧することができる。一方、1台
に障害が判定され、切り離し処理を行うとしたときであ
っても、他のディスクにも障害がある場合には、当該他
のディスクの障害部分についてのデータの復旧ができな
くなるため、切り離し処理を行わずに、上位装置に報告
する。このため、切り離し処理によりデータを読み出せ
なくなる事態の発生を確実に防止することができる。
【0024】また、アレイ制御手段とディスクとを接続
するデバイスインタフェースの障害を監視するアレイデ
ィスク制御装置にあっては、このデバイスインタフェー
スの障害状態に応じて切り離し処理を行う。この実施形
態では、ディスク障害管理テーブルに、デバイスインタ
ーフェースの障害に応じて予め定められた値が格納され
るデバイスインタフェース障害管理テーブルを併設す
る。さらに、アレイ制御手段が、デバイスインターフェ
ースの障害が発生したときにデバイスインタフェース障
害管理テーブルの値を増加させるインタフェース障害値
加算機能と、当該デバイスインタフェースを介して正常
にデータの格納又は読み出しが行われたときにデバイス
インタフェース障害管理テーブルの値を減少させるイン
タフェース障害値減算機能と、デバイスインタフェース
障害管理テーブルのインタフェース障害値が予め定めら
れたしきい値よりも上回ったときに当該インタフェース
を切り離すデバイスインタフェース切り離し機能とを備
える。
【0025】このデバイスインタフェースの状態に応じ
てディスクの切り離し処理を行う場合であっても、一旦
障害が発生したのちに正常にデータの転送が行えた場合
には、障害値の減算を行う。これにより、切り離し処理
が必要な場合にのみ切り離し処理を行うことができる。
【0026】デバイスインタフェースの管理を行う実施
形態では、アレイ制御手段が2台以上あり、同一のディ
スクへそれぞれのアレイ制御手段が接続されている場合
には、切り離し処理を行ったのち、他方のアレイ制御手
段によって当該ディスクにアクセスする。すなわち、こ
の実施形態では、デバイスインタフェース切り離し機能
に、当該デバイスインタフェース切り離し機能によって
デバイスインタフェースが切り離された場合には上位装
置からの再試行を複数のアレイ制御手段を順次選択して
行う制御をする再試行制御機能を併設する。これによ
り、ディスクインタフェースの切り離し処理と他のアレ
イ制御手段による接続という復旧処理とを自動的に行う
ことができる。
【0027】図1は本実施形態の構成例を示すブロック
図である。図1に示すように、本実施形態では、接続さ
れているディスク毎にメディアの障害が検出された履歴
を記憶するメディア障害管埋テーブル(ディスク障害管
理テーブル)1と、接続されているディスクインターフ
ェース41〜44毎に、インターフェース障害が検出さ
れ、ホストコンピュータに報告された履歴を記憶するデ
バイスインターフェース障害管理テーブル2とを有して
いる。
【0028】この各障害管理テーブル1,2に障害値を
加算又は減算するのは、図1に示す例では、マイクロプ
ログラム処理部5が行う。このマイクロプログラム処理
部5は、CPU,RAM等の構成を備え、障害値の加算
又は減算を行う手順が記載されたプログラムを実行する
ことで、アレイ制御手段の各種機能を実現する。
【0029】マイクロプログラム処理部5は、ディスク
又はデバイスインタフェースの障害が検出または報告さ
れたときには該当するメディア障害管理テーブル1又は
デバイスインターフェース障害管理テーブル2にあらか
じめ設定された値を加算する。
【0030】一方、当該ディスクを使用しても障害が発
生しなかったとき、あるいは一時的に障害を回避するた
めに当該ディスクを切り離して処理を行った場合には当
該ディスクのメディア障害管埋テーブル1、およびデバ
イスインターフェース障害管埋テーブル2の内容からあ
らかじめ設定された値を減ずる。
【0031】さらに、マイクロプログラム処理部5は、
ディスクに対してアクセスする前にメディア障害管埋テ
ーブル1、および、デバイスインターフェース障害管埋
テーブル2の内容を調べ、規定値を超えていたときに当
該ディスクを障害と見なして切り離しの対象とする。上
述したアレイ制御手段は、このマイクロプログラム処理
部5と、アレイ制御部3とを備える。
【0032】また、マイクロプログラム処理部5は、メ
ディア障害管理テーブル1、および、デバイスインター
フェース障害管理テーブル2の内容を調べ切り離しの対
象となるディスクが検出された場合に、他のディスクの
メディア障害履歴がある場合にはディスクの切り離しを
中止する機能を有している。
【0033】図1に示す実施形態では、障害履歴管理の
ために必要な情報は1ディスク当たりディスクインター
フェース障害の履歴管埋のための1つと、メディアに障
害履歴管埋のための1ディスクの記録領域を分割した数
に対応するだけの情報があればいい。例えば、1ディス
クの記録領域を32分割したのであれば32個の記憶領
域があればいい。ディスクインターフェース、または、
メディアの障害が検出された場合には対応する障害履歴
管埋テーブルにあらかじめ設定された値を加算する。
【0034】これらの障害履歴の値がしきい値に達した
場合に当該ディスクを切り離しの対象とする処理は従来
より行われていた。本発明では、ディスクへのアクセス
で異常が発生しなかった場合には、当該記憶領域に対応
するメディア障害管埋テーブル1、および、デバイスイ
ンターフェース障害管理テーブル2の内容からあらかじ
め設定された値を減ずる。これにより、間欠的に発生し
得る軽微な障害が累積されてディスクが切り離されるこ
とを防止する。
【0035】このディスクインターフェースの障害が発
生した場合には、必ずホストコンピュータへの障害報告
を行う。デバイソインターフェース障害管埋テーブル2
の加算はホストコンピュータへの障害報告時に加工され
るため、ホストコンピュータが障害の発生を認識した回
数として扱うことができる。複数のアレイディスク制御
装置から同一ディスクに対してアクセス可能なシステム
ではホストコンピュータが障害の発生を認識することに
よって、他のアレイディスク制御装置を経由して再試行
を行うことが可能になる。
【0036】アレイディスク制御装置内のディスクイン
ターフェース制御回路の故障であればこの再試行によっ
てディスクを切り離すことなく、他の正常なアレイディ
スク制御装置を使用して処理の継続が可能になる。ディ
スクインターフェース障害の原因がディスク側にあれば
ホストコンピュータが他のアレイディスク制御装置を経
由して再試行を行っても回復せず、再度最初に障害を報
告したアレイディスク制御装置を使用して再試行を操り
返す。これにより、デバイスインターフェース障害管埋
テーブル2の値が加算されしきい値を越えるとディスク
の切り離しの対象になる。
【0037】さらに、ディスク切り離しの対象になった
ディスクは実際に切り離す前に他のディスクのメディア
障害管理テーブル1の内容を調べ、障害の発生履歴が残
っている場合にはそのディスクの切り離しにより復旧で
きないデータが発生する可能性があるため切り離しを中
止する。これにより、ディスクの切り離しによって読み
出せないデータが生ずることを防ぐ。
【0038】
【実施例】次に本発明について図面を参照して説明す
る。
【0039】図1は本発明のアレイディスク制御装置の
1構成例を示すブロック図である。アレイディスク制御
装置は、ホストコンピュータとアレイディスク制御装置
との間のデータ転送制御を行うホストインターフェース
制御部6と、ホストコンピュータから送られたデータの
複数ディスクへの分散、RAIDでの冗長データの生
成、あるいは複数ディスク(直接アクセス記憶装置,D
ASD)から読み出したデータからのオリジナルデータ
(ホストコンピュータから送られた時の形)への合成、
冗長データとの整合性のチェック、冗長データによるデ
ータの修復などを行うアレイ制御部3と、データを記憶
するディスク71,72,73,74と、各ディスク7
1,72,73,74とアレイ制御部3との間のインタ
ーフェース制御を行うディスクインターフェース制御部
41,42,43,44とを備えている。
【0040】さらに、図1に示す例では、メディア障害
管埋テーブル1を備えている、本実施例では、メディア
障害管埋テーブル1は、各ディスク71,72,73,
74の記録領域を8分割して個々の領域毎に工ラーの発
生履歴をカウントする1バイトのカウンタの集合であ
る。また、アレイディスク制御装置は、デバイスインタ
ーフェース障害管埋テーブル2を備えている。このデバ
イスインターフェース障害管埋テーブル2は、各ディス
クインターフェース制御部41,42,43,44毎に
エラーの発生履歴をカウントする1バイトのカウンタの
集合である。
【0041】マイクロプログラム処理部5は、ホストイ
ンターフェース制御部6、アレイ制御部3など各部の動
作制御を行う部分であり、本実施例では、メディア障害
管埋テーブル1、デバイスインターフェース障害管理テ
ーブル2の更新もマイクロプログラム処理部5によって
マイクロプログラムによって実現されている。
【0042】次にフローチャートに基づいて動作を説明
する。この例では、ディスク障害の加算値を(2
0)16,しきい値を(60)16,減算値を(01)16
する。また、ディスクを8領域に分割する。そして、デ
バイスインタフェースの障害の加算値を(01)16,し
きい値を(03),減算は初期値(00)へクリアする
処理により行う。上位装置のオペレーティングシステム
のリトライ回数は3回である。この設定により、切り離
し処理の適否の判断が良好に行われる。
【0043】図2はホストコンピュータからコマンドを
受け付け、切り離し対象ディスクの有無をチェックする
処理のフローチャートである。
【0044】アレイディスク制御装置はホストインター
フェース制御部6を経由してホストコンピュータからコ
マンドを受け付けると(ステップS201)、このコマ
ンドで指定された読み出し、または書き込みアドレスか
らアクセスするディスク71〜74と、記録領域がディ
スクの全記録域を8分割したどの領域(以下ゾーンと記
す)に含まれるかを決定する(ステップS202)。
【0045】次にメディア障害管理テーブル1からステ
ップS202で決定されたディスク、ゾーンに対応する
カウンタの内容を読み出す(ステップS203)。複数
のディスク、またはゾーンにまたがる場合は、そのカウ
ンタ値の全てをあらかじめ設定されたしきい値と比較す
る(ステップS204)。
【0046】ここではしきい値として(60)16が設定
されているものとする。しきい値を超えるカウンタ値が
ない場合には、続いてデバイスインターフェース障害管
埋テーブル2の中からステップS202で決定された使
用するディスクに対応するディスクインターフェース制
御部41〜44の障害履歴カウントを読み出す(ステッ
プS205)。
【0047】複数のディスクにまたがる場合は、そのカ
ウンタ値の全てをあらかじめ設定されたしきい値と比較
する(ステップS206)。ここではしきい値として
(03)16が設定されている。このため、デバイスイン
タフェースの障害が3回報告された場合に当該インタフ
ェースの切り離しを行う。ステップS204、206何
れの判断でもしきい値を越えていない場合には、必要な
ディスクを選択してディスクをアクセスする(ステップ
S208)。
【0048】なお、ステップS208ではすでに必要な
ディスクが切り離されている場合にはデータ復旧できる
様に冗長ディスクを使用するかどうかの判断も行う。メ
ディア障害管埋テーブル1の内容がしきい値を越えてい
ないかどうかの判断(ステップS204)、および、デ
バイスインターフェース障害管埋テーブル2の内容がし
きい値を越えていないかどうかの判断(ステップS20
6)でしきい値を越えているカウンタが検出された場合
には、このディスクを切り離し対象として切り離しの可
否の判断を行う(ステップS207)。
【0049】メディア障害管理テーブル1、または、デ
バイスインターフェース障害管埋テーブル2の内容がし
きい値を越えていて、なおかつ切り離し可能な状態であ
れば、ステップS207で切り離され、必要なディスク
を選択して読み出し、書き込みなどのアクセスの実行を
行う(ステップS208)。
【0050】図3はディスクへのアクセス後のメディア
障害管埋テーブル1、および、デバイスインターフェー
ス障害管理テーブル2の操作に関するフローチャートで
ある。ディスクへのアクセス後、最初にディスクインタ
ーフェースに関する障害の有無を判断する(ステップS
301)。
【0051】ディスクインターフェースで異常が検出さ
れた場合には、エラーの検出されたディスクに対応する
デバイスインターフェース障害管埋テーブル2のカウン
タの内容に(01)を加算し(ステップS302)、ホ
ストコンピュータに工ラーの発生を知らせるステータス
を報告する(ステップS303)。
【0052】ディスクインターフェースに異常が検出さ
れなかった場合には、使用した全てのディスクに対応す
るデバイスインターフェース障害管理テーブル2の内容
を(00)にクリアする(ステップS304)。
【0053】ディスクインターフェースに異常が検出さ
れなかった場合には、続いてディスクの工ラーの有無を
調べる(ステップS305)。ディスクでのエラーも発
生していなければ、ホストコンピュータに正常終了を示
すステータスを報告し(ステップS309)、さらにア
クセス対象になったディスク、およびゾーンの対応する
メディア障害管埋テーブル1の内容から(01)を減じ
る(ステップS310)。
【0054】なお、ステップS310の処理はメディア
障害管理テーブル1の該当するカウンタの値が(00)
の場合、すなわち、メディア障害の発生履歴がない場合
にはスキップされ、何もしない。
【0055】ステップS305の判断でディスクに工ラ
ーが発生した場合には工ラ一の発生したディスク、およ
び発生位置に対応するゾーンを確定する(ステップS3
06)。ステップS306で決定されたゾーンに対応す
るカウンタをメディア障害管理テーブル1から読み出
し、カウンタ値に(20)16を加算し(ステップS30
7)、ホストコンピュータにエラーの発生を示すステー
タスを報告する(ステップS303)。
【0056】ディスクで工ラーが発生しなかった場合と
同様に、アクセス対象になり、なおかつエラーの発生し
なかったディスク、ゾーンに対応するメディア障害管埋
テーブル1のカウンタは(01)を減じる(ステップS
310)。
【0057】この場合も、ステップS310の処理はメ
ディア障害管理テーブル1の該当するカウンタの値が
(00)の場合、すなわち、メディア障害の発生履歴が
ない場合にはスキップされ、何もしない。
【0058】図3に示されるように、ディスクアクセス
により障害が発生した場合でもメディア障害管理テーブ
ル1、およびデバイスインターフェース障害管理テーブ
ル2のカウンタ値の操作だけで、この時点ではディスク
の切り離しは行わない。
【0059】ディスクの切り離しは工ラーが発生して、
ホストコンピュータにエラーが報告され、ホストコンピ
ュータ側の判断で有限回の再試行を行うことにより、メ
ディア障害管埋テーブル1、または、デバイスインター
フェース障害管理テーブル2のカウント値が増加してデ
ィスクの切り離しに至る。
【0060】図3のステップS207に示されるメディ
ア障害管埋テーブル1、または、デバイスインターフェ
ース障害管理テーブル2の内容がしきい値を越えてして
いる場合のディスクの切り離しの可否は図4のフローチ
ャートに示されるしきい値を越えている場合には、まず
最初に現在のアレイディスクの状態をチェックする(ス
テップS401)。
【0061】本実施例のアレイディスクは3台のディス
クと1台の冗長ディスクによって構成されているものを
想定している。したがって、すでに1台のディスクが切
り離されている場合には冗長性を失っており、これ以上
のディスクの切り離しはできないため、すでに切り離し
済みのディスクが存在しないかどうかを調べる(ステッ
プS401)。
【0062】すでに切り離し済みのディスクが存在する
場合には、何もせずにディスク切り離しの可否の判断を
終了する。切り離し済みのディスクが存在せず冗長性を
維持できている時には、切り離し対象とされたディスク
以外のディスクに関するメディアの障害履歴をメディア
障害管埋テーブル1から読み出す。読み出すカウンタは
全てのゾーンを対象に読み出す(ステップS402)。
【0063】切り離し対象ディスク以外のディスクに障
害履歴の有無を判断するために、読み出したカウンタ値
を調べる(ステップS403)。(00)以外のものが
存在する場合には切り離すことによって後に読み出せな
くなるデータが発生する可能性があるため切り離しを中
止する。
【0064】切り離し対象ディスク以外のディスクに障
害履歴がない場合には、さらに切り離し対象のディスク
以外のディスクに対応するディスクインターフェースの
障害履歴をデバイスインターフェース障害管理テーブル
2から読み出す(ステップS404)。
【0065】切り離し対象ディスク以外のディスクに対
応するディスクインターフェースに障害履歴を調ベ(ス
テップS403)、(00)以外のものが存在する場合
には切り離すことによって後に読み出せなくなるデータ
が発生する可能性があるため切り離しを中止する。他の
ディスクインターフェース制御部に障害履歴がない場合
には、切り離し対象のディスクを切り離す(ステップS
406)。
【0066】次に第2の実施例として図5のような2つ
のアレイディスク制御装置10A,10Bから同一ディ
スク71〜74をアクセス可能な構成を採った場合につ
いて説明する。この場合もアレイディスク制御装置の動
作は前述の処理と全く同じである。
【0067】ホストコンピュータが再試行を行う際に2
つのディレクタに交互に再試行を行うことにより、障害
の原因がアレイディスク制御装置10A内のディスクイ
ンターフェース制御部41A〜44Aにある場合にはア
レイディスク制御装置10B側から再試行をすることに
よって、入出力命令は成功し、ディスクを切り離すこと
なく処理を継続することができる。
【0068】障害の原因がディスク71〜74内にある
場合には、2つのアレイディスク制御装置10A、10
B何れを通してもエラーが発生し、ホストコンピュータ
に工ラーが報告される度にメディア障害管理テーブル1
の内容、または、デバイスインターフェース障害管埋テ
ーブル2の内容が増加して、ホストコンピュータが無条
件に再試行を繰り返すことによってディスクの切り離し
に至る。
【0069】上述したように本実施例によると、以下の
効果を奏する。
【0070】第1の効果は、ディスクインターフェース
制御部の数に相当するカウンタと各ディスクの記録領域
をメディアエラー管埋のために分割した数だけのカウン
タ用意すればよく、少ない制御情報で障害ディスクの切
り離し管理を行うことができる。
【0071】第2の効果は、ディスクインターフェース
の障害のようにアレイディスク制御装置側に原因がある
場合と、ディスク側に原因がある場合との切り分けが容
易でない障害でも、的確に障害ディスクの切り離し制御
を行うことができる。
【0072】特に2台以上のアレイディスク制御装置か
らなるアレイディスク装置ではホストコンピュータから
の再試行を各アレイディスク制御装置を通して交互に実
行することにより、アレイディスク制御装置側に原因が
ある場合と、ディスク側に原因がある場合とを的確に切
り分け、アレイディスク制御装置側に障害がある場合に
は正常なディスクを切り離すことなく処理を継続可能に
し、ディスク側に原因がある場合にはディスクを切り離
して処理の継続を可能にすることができる。
【0073】また、これはホストコンピュータからの再
試行を前提にしているが、ホストコンピュータからの再
試行は単に再試行を行うアレイディスク制御装置を交互
に切り換えるだけでよく、ソフトウェアによる複雑なス
テータス解析等は必要ないため、アレイディスク装置を
使用するためのソフトウェアの負担も増えることはな
い。
【0074】第3の効果は、先に本発明が解決しようと
する課題の項でも記載したように冗長性を持ったアレイ
ディスクでは、媒体の障害により書き込みができない場
合にはデータを格納するデータディスクとパリティデー
タを格納する冗長ディスクとの整合性をとるため、障害
ディスクを切り離して処理を行う必要があるが、読み出
しの場合には冗長ディスクでデータを復旧してホストコ
ンピュータに転送することが可能なため、より影響が大
きくなるディスク全体の切り離しは行わず一時的な切り
離しだけで処理を継続しようとすることがある。
【0075】あるいは、媒体に比較的軽微な障害が発生
しているが、再試行により救済することが可能な状況で
はディスクの切り離しは行われない場合がある。
【0076】このような部分的な媒体障害が発生してい
るが、そのディスクの切り離しが行われていない場合で
も、ディスクの切り離しを行うための判断の際に、メデ
ィア障害管理テーブル、あるいはデバイスインターフェ
ース障害管埋テーブルをチェックし、他のディスクでの
障害の有無を容易に判断することができるため、安易な
ディスクの切り離しで後に読めないデータが生ずること
を避けることができる。
【0077】
【発明の効果】本発明は以上の陽に構成され機能するの
で、これによると、アレイ制御手段が、ディスクの障害
が発生したときにディスク障害管理テーブルの値を増加
させ、一方、ディスクに対して正常にデータの格納又は
読み出しが行われたときにはディスク障害管理テーブル
の値を減少させ、そして、ディスク障害管理テーブルの
ディスク障害値が予め定められたしきい値よりも上回っ
たときに当該インタフェースを切り離すため、回復不能
なメディアの障害の発生と、間欠的なリード/ライトエ
ラーの発生とを的確にディスク障害管理テーブルに反映
することができ、このため、軽度の障害で切り離す必要
がないときに切り離し処理を行うことがなく、さらに、
加算値と減算値及びしきい値を上位装置のリトライ回数
及びディスクの管理上の分割領域数に応じて設定するこ
とで、ディスクの一部に障害が発生したときであっても
良好にその状態をディスク障害管理テーブルに反映する
ことができ、さらに、デバイスインタフェースの状態を
重ねて管理することで、切り離し処理を必要な場合にの
み行うことができ、また、切り離し処理を行うときに、
ディスク障害管理テーブルを用いて他のディスクの状態
を確認して他のディスクにも障害がある場合には切り離
し処理を中止するため、冗長構成に基づいて復旧ができ
なくなる事態を良好に回避することができる。このよう
に、少ない障害履歴情報で、的確にディスクの切り離し
を行い、信頼性を向上させることができる従来にない優
れたアレイディスク制御装置を提供することができる。
【図面の簡単な説明】
【図1】本発明のアレイディスク制御装置の構成例を示
すブロック図である。
【図2】本発明のアレイディスク制御装置のディスクア
クセス開始前の切り離し判断の処理を示すフローチャー
トである。
【図3】本発明のアレイディスク制御装置のディスクア
クセス後のエラー履歴管埋の処理を示すフローチャート
である。
【図4】本発明のアレイディスク制御装置におけるディ
スク切り離しの判断処理を示すフローチャートである。
【図5】本発明のアレイディスク制御装置を2台使用し
たアレイディスクの1構成例を示すブロック図である。
【図6】従来技術での2台の制御装置からなるアレイデ
ィスクの1構成例を示すブロック図である。
【符号の説明】
1,1A,1B メディア障害管埋テーブル 2,2A,2B デバイスインターフェース障害管埋テ
ーブル 3,3A,3B アレイ制御部 5,5A,5B マイクロプログラム処理部 6,6A,6B ホストインターフェース制御部 10,10A,10B アレイディスク制御装置 41,42,43,44 ディスクインターフェース制
御部 41A,42A,43A,44A ディスクインターフ
ェース制御部 41B,42B,43B,44B ディスクインターフ
ェース制御部 71,72,73,74 ディスク

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 上位装置から送信されたデータを受信す
    るホストインタフェース制御部と、このホストインタフ
    ェースで受信したデータを冗長構成にして複数のディス
    クに格納するアレイ制御手段とを備えたアレイディスク
    制御装置において、 前記アレイ制御手段に、前記ディスクの障害に応じて予
    め定められた値が格納されるディスク障害管理テーブル
    を併設し、 前記アレイ制御手段が、前記ディスクの障害が発生した
    ときに前記ディスク障害管理テーブルの値を増加させる
    ディスク障害値加算機能と、当該ディスクに対して正常
    にデータの格納又は読み出しが行われたときには前記デ
    ィスク障害管理テーブルの値を減少させるディスク障害
    値減算機能と、前記ディスク障害管理テーブルのディス
    ク障害値が予め定められたしきい値よりも上回ったとき
    に当該インタフェースを切り離すディスク切り離し機能
    とを備えたことを特徴とするアレイディスク制御装置。
  2. 【請求項2】 前記アレイ制御手段が、前記複数のディ
    スクをさらに複数の領域に分割すると共に、前記ディス
    ク障害管理テーブルが、当該分割領域ごとに障害の履歴
    を管理するテーブル項目を有し、 前記ディスク障害値加算機能が、ディスクの障害が発生
    したときに一定値aを加算する機能を備え、 前記ディスク障害管理テーブルのしきい値を、前記一定
    値aのn倍に設定すると共に、このnの値を、前記上位
    装置が同一データを自動的にリトライする回数に設定
    し、 前記ディスク障害値減算機能が、前記ディスクの分割領
    域数に応じて一定値aよりも小さい値を減算する機能を
    備えたことを特徴とする請求項1記載のアレイディスク
    制御装置。
  3. 【請求項3】 前記アレイ制御手段が、前記ディスク切
    り離し機能によって前記ディスクを切り離す制御を行う
    ときに前記ディスク障害管理テーブルによって他のディ
    スクも障害を有するとされた場合には当該切り離し制御
    を中止する切り離し中止機能を備えたことを特徴とする
    請求項1記載のアレイディスク制御装置。
  4. 【請求項4】 前記ディスク障害管理テーブルに、デバ
    イスインターフェースの障害に応じて予め定められた値
    が格納されるデバイスインタフェース障害管理テーブル
    を併設し、 前記アレイ制御手段が、前記デバイスインターフェース
    の障害が発生したときに前記デバイスインタフェース障
    害管理テーブルの値を増加させるインタフェース障害値
    加算機能と、当該デバイスインタフェースを介して正常
    にデータの格納又は読み出しが行われたときに前記デバ
    イスインタフェース障害管理テーブルの値を減少させる
    インタフェース障害値減算機能と、前記デバイスインタ
    フェース障害管理テーブルのインタフェース障害値が予
    め定められたしきい値よりも上回ったときに当該インタ
    フェースを切り離すデバイスインタフェース切り離し機
    能とを備えたことを特徴とする請求項1記載のアレイデ
    ィスク制御装置。
  5. 【請求項5】 前記アレイ制御手段が、前記デバイスイ
    ンタフェース切り離し機能によって前記デバイスインタ
    フェースを切り離す制御を行うときに前記ディスク障害
    管理テーブルによって他のディスクも障害を有するとさ
    れた場合には当該切り離し制御を中止する切り離し中止
    機能を備えたことを特徴とする請求項4記載のアレイデ
    ィスク制御装置。
  6. 【請求項6】 上位装置から送信されたデータを受信す
    るホストインタフェース制御部と、このホストインタフ
    ェース制御部で受信したデータを冗長構成にすると共に
    デバイスインタフェースを介して複数のディスクに格納
    するアレイ制御手段とを備えたアレイディスク制御装置
    において、 前記アレイ制御手段に、前記デバイスインターフェース
    の障害に応じて予め定められた値が格納されるデバイス
    インタフェース障害管理テーブルを併設し、 前記アレイ制御手段が、前記デバイスインターフェース
    の障害が発生したときに前記デバイスインタフェース障
    害管理テーブルの値を増加させるインタフェース障害値
    加算機能と、当該デバイスインタフェースを介して正常
    にデータの格納又は読み出しが行われたときに前記デバ
    イスインタフェース障害管理テーブルの値を減少させる
    インタフェース障害値減算機能と、前記デバイスインタ
    フェース障害管理テーブルのインタフェース障害値が予
    め定められたしきい値よりも上回ったときに当該インタ
    フェースを切り離すデバイスインタフェース切り離し機
    能とを備えたことを特徴とするアレイディスク制御装
    置。
  7. 【請求項7】 上位装置から送信されたデータを受信す
    るホストインタフェース制御部と、このホストインタフ
    ェース制御部で受信したデータを記憶する複数のディス
    クにそれぞれ接続されデバイスインタフェースを介して
    前記複数のディスクに格納する複数のアレイ制御手段と
    を備えたアレイディスク制御装置において、 前記アレイ制御手段に、前記デバイスインターフェース
    の障害に応じて予め定められた値が格納されるデバイス
    インタフェース障害管理テーブルを併設し、 前記アレイ制御手段がそれぞれ、前記デバイスインター
    フェースの障害が発生したときには前記デバイスインタ
    フェース障害管理テーブルの値を増加させるテーブル値
    加算機能と、当該デバイスインタフェースを介して正常
    にデータの格納又は読み出しが行われたときには前記デ
    バイスインタフェース障害管理テーブルの値を減少させ
    るテーブル値減算機能と、前記デバイスインタフェース
    障害管理テーブルの値が予め定められたしきい値よりも
    上回ったときに当該インタフェースを切り離すデバイス
    インタフェース切り離し機能とを備えると共に、 このデバイスインタフェース切り離し機能に、当該デバ
    イスインタフェース切り離し機能によってデバイスイン
    タフェースが切り離された場合には前記上位装置からの
    再試行を前記複数のアレイ制御手段を順次選択して行う
    制御をする再試行制御機能を併設したことを特徴とした
    アレイディスク制御装置。
JP9080998A 1997-03-31 1997-03-31 アレイディスク制御装置 Expired - Fee Related JP3063666B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9080998A JP3063666B2 (ja) 1997-03-31 1997-03-31 アレイディスク制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9080998A JP3063666B2 (ja) 1997-03-31 1997-03-31 アレイディスク制御装置

Publications (2)

Publication Number Publication Date
JPH10275060A true JPH10275060A (ja) 1998-10-13
JP3063666B2 JP3063666B2 (ja) 2000-07-12

Family

ID=13734164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9080998A Expired - Fee Related JP3063666B2 (ja) 1997-03-31 1997-03-31 アレイディスク制御装置

Country Status (1)

Country Link
JP (1) JP3063666B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005251042A (ja) * 2004-03-08 2005-09-15 Hitachi Ltd ディスクアレイ装置およびその制御方法
US6985979B2 (en) * 2001-12-17 2006-01-10 Matsushita Electric Industrial Co., Ltd. Digital data processing device, bus controlling method, bus controlling program and recording medium
US7395451B2 (en) 2004-09-10 2008-07-01 Fujitsu Limited Apparatus, method and program for the control of storage
JP2008250929A (ja) * 2007-03-30 2008-10-16 Nec Corp リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム
JP2009205316A (ja) * 2008-02-27 2009-09-10 Fujitsu Ltd ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置
WO2010116514A1 (ja) * 2009-04-09 2010-10-14 富士通株式会社 Raid制御装置
JP2013538409A (ja) * 2010-09-17 2013-10-10 シマンテック コーポレーション 障害処理システム及び方法
WO2014045691A1 (ja) * 2012-09-18 2014-03-27 三菱電機株式会社 Raid障害自己修復装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6985979B2 (en) * 2001-12-17 2006-01-10 Matsushita Electric Industrial Co., Ltd. Digital data processing device, bus controlling method, bus controlling program and recording medium
JP2005251042A (ja) * 2004-03-08 2005-09-15 Hitachi Ltd ディスクアレイ装置およびその制御方法
US7395451B2 (en) 2004-09-10 2008-07-01 Fujitsu Limited Apparatus, method and program for the control of storage
JP2008250929A (ja) * 2007-03-30 2008-10-16 Nec Corp リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム
JP4678384B2 (ja) * 2007-03-30 2011-04-27 日本電気株式会社 リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム
JP2009205316A (ja) * 2008-02-27 2009-09-10 Fujitsu Ltd ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置
US7900083B2 (en) 2008-02-27 2011-03-01 Fujitsu Limited Disk array apparatus, disk array control method and disk array controller
WO2010116514A1 (ja) * 2009-04-09 2010-10-14 富士通株式会社 Raid制御装置
JP2013538409A (ja) * 2010-09-17 2013-10-10 シマンテック コーポレーション 障害処理システム及び方法
WO2014045691A1 (ja) * 2012-09-18 2014-03-27 三菱電機株式会社 Raid障害自己修復装置

Also Published As

Publication number Publication date
JP3063666B2 (ja) 2000-07-12

Similar Documents

Publication Publication Date Title
JP3184171B2 (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
JP2002108573A (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
US7587631B2 (en) RAID controller, RAID system and control method for RAID controller
US7840838B2 (en) Rapid regeneration of failed disk sector in a distributed database system
US6442711B1 (en) System and method for avoiding storage failures in a storage array system
JP3681766B2 (ja) ディスクアレイ装置
JP2005322399A (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
JP2006079418A (ja) 記憶制御装置、制御方法及びプログラム
US20060277354A1 (en) Library apparatus
JP3063666B2 (ja) アレイディスク制御装置
JPH09269871A (ja) ディスクアレイ装置におけるデータ再冗長化方式
US20070234107A1 (en) Dynamic storage data protection
JP4203034B2 (ja) アレイコントローラ、メディアエラー修復方法及びプログラム
US7529776B2 (en) Multiple copy track stage recovery in a data storage system
JP4012420B2 (ja) 磁気ディスク装置及びディスク制御装置
JPH1195933A (ja) ディスクアレイ装置
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
JP2001142650A (ja) アレイディスク制御方法及び装置
JPH07182250A (ja) 磁気ディスクの自動交代処理方式
US7523347B2 (en) RAID control apparatus, and RAID control program and RAID control method
JP2008084168A (ja) 情報処理装置及びデータ修復方法
JP2000137584A (ja) 外部記憶装置の制御装置及び不良ブロック代替方法並びに不良ブロック代替制御プログラムを格納した記憶媒体
JP2003186627A (ja) 磁気テープ装置データパックアップ制御方式
JP2005149248A (ja) メタデータ修復方式,方法および記憶装置ならびにプログラム
JP2830840B2 (ja) ディスクアレイ修復処理方式及び方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120512

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees