JPH07200191A - ディスクアレイ装置 - Google Patents

ディスクアレイ装置

Info

Publication number
JPH07200191A
JPH07200191A JP6000722A JP72294A JPH07200191A JP H07200191 A JPH07200191 A JP H07200191A JP 6000722 A JP6000722 A JP 6000722A JP 72294 A JP72294 A JP 72294A JP H07200191 A JPH07200191 A JP H07200191A
Authority
JP
Japan
Prior art keywords
data
disk device
disk
spare
restoration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6000722A
Other languages
English (en)
Other versions
JP3681766B2 (ja
Inventor
Keiichi Sato
恵一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP00072294A priority Critical patent/JP3681766B2/ja
Publication of JPH07200191A publication Critical patent/JPH07200191A/ja
Application granted granted Critical
Publication of JP3681766B2 publication Critical patent/JP3681766B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】予備ディスク装置に対するデータ復元の必要性
をいち早く認識し、また上位装置からの処理を遅延する
ことなしにデータ復元を可能とする。 【構成】ディスクアレイ装置1は、複数のデータディス
ク装置2、少なくとも1台の冗長ディスク装置3及び予
備ディスク装置4を備える。各データディスク装置2か
らのデータ到着時間をタイマ手段9で計測し、所定時間
を越えて遅延した場合に、制御手段7で残りのディスク
装置から遅延しているデータ復元する。ディスク装置
2,3のずれかで訂正不可能なデータブロックが検出さ
れた場合、同一パリティグループに属する残りのディス
ク装置からデータ復元して交代領域に割り付ける。更
に、交代領域オーバフロー、回転同期障害、故障の危険
性の高いディスク装置につき、予備ディスク装置へのデ
ータ復元を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、アレイ状に配置された
複数の複数のディスク装置を並列的にアクセスするディ
スクアレイ装置に関し、特に、ディスク装置の故障に対
し予備ディスク装置を利用してデータ復元を行うディス
クアレイ装置に関する。現在、電子計算機の外部記憶装
置には、主に磁気ディスクが使用されている。
【0002】近年、電子計算機の性能向上はめざまし
く、外部記憶装置にも高性能のものが求められている。
特に、画像処理や科学技術計算の分野では、磁気ディス
ク装置を並列に配置し、複数台の磁気ディスクから同時
にデータを読み書きしてデータ転送を高速化したディス
クアレイ装置が用いられている。また冗長ディスク装置
を装備し、データディスク装置に障害が起きても残りの
ディスク装置からデータを復元することが可能である
が、障害に対し迅速に対応可能な信頼性の高いディスク
アレイ装置が求められている。
【0003】
【従来の技術】従来、ディスクアレイ装置は小型のディ
スク装置を多量に使用し、システムの故障率を下げるた
めに一般的に冗長性を持たせている。図21は従来のデ
ィスクアレイ装置を示す。ディスクアレイ装置1はアレ
イコントローラ部6と複数のデータディスク装置2−0
〜2−3、冗長ディスク装置3およびホットスペアとし
て知られた予備ディスク装置4で構成される。各ディス
ク装置2−0〜2−3,3,4はアレイコントローラ部
6に設けたポート15−0〜15−5に接続され、並列
的に動作できる。アレイコントローラ部6には、プロセ
ッサ8と分配結合器8が設けられる。
【0004】上位装置5からのライトコマンドの発行に
伴って転送されてきたブロックデータは、アレイコント
ローラ部6の分配結合器8で、4台のデータディスク装
置2−0〜2−3のデータに分配(ストライピング)さ
れ、ポート15−0〜15−3を介して並列的に書込ま
れる。同時に4つの分配データからパリティデータが生
成され、ポート15−4を介して冗長ディスク装置3に
書込まれる。
【0005】ここでブロックデータはビット又はバイト
単位に分配され、また冗長ディスク装置の位置を固定し
ていることから、いわゆるRAID3に従った制御を行
っている。データのリード時には、ライト時と逆にデー
タディスク装置2−0〜2−3からデータを読み出して
アレイコントローラ部6の分配結合器8で結合して元の
ブロックデータを復元し、同時に冗長ディスク装置3か
ら読み出したパリティデータと比較して正常に結合され
ている場合に、復元したブロックデータを上位装置5に
転送する。
【0006】またディスクアレイ装置1では、仮に1台
のデータディスク装置、例えばデータディスク装置2−
3が故障した場合、残りのデータディスク装置2−0〜
2−2のデータと冗長ディスク装置3のパリティデータ
から故障したデータディスク装置2−3のデータを復元
することができる。このため予備ディスク装置4が設け
られ、例えばディスク装置2−3で致命的な故障が起き
た場合、残りのデータディスク装置2−0〜20−2の
データと冗長ディスク装置3のパリティデータから故障
したデータディスク装置2−3のデータを復元して予備
ディスク装置4に書込み、予備ディスク装置4の復元デ
ータを使用可能とする。
【0007】
【発明が解決しようとする課題】しかしながら、このよ
うな従来のディスクアレイ装置にあっては、配下のディ
スク装置に訂正不可能な媒体エラーや致命的なハードウ
ェアエラーが起きた場合にのみ、故障と判断して予備デ
ィスク装置に対するデータ復元を行っており、復元処理
を行っている間、上位装置からアクセスができない不都
合があった。
【0008】また、故障したディスク装置のデータを予
備ディスク装置4に復元した後、故障ディスク装置を正
常なものと交換し、交換したディスク装置に予備ディス
ク装置4から復元データをコピーした後に正常な運用に
移行させていたため、データ復元やディスク装置の交換
に手間と時間がかかるという問題があった。本発明は、
このような従来の問題点に鑑みてなされたもので、予備
ディスク装置に対するデータ復元の必要性をいち早く認
識し、また上位装置からの処理を遅延することなしにデ
ータ復元を可能とする冗長性が高く予備ディスク装置を
効率良く使用可能なディスクアレイ装置を提供すること
を目的とする。
【0009】
【問題点を解決するための手段】図1は本発明の原理説
明図である。まず本発明は、複数のデータディスク装置
2、少なくとも1台の冗長ディスク装置3及び予備ディ
スク装置4を備えたディスクアレイ装置1を対象とす
る。 [タイマ監視によるデータ復元処理]このようなディス
クアレイ装置1につき本発明は、配下の各データディス
ク装置2からのデータ到着時間をタイマ手段9で計測
し、データ到着時間が所定時間を越えて遅延した場合
に、制御手段7で遅延したディスク装置のデータを残り
のディスク装置から復元する。
【0010】尚、冗長ディスク装置3からのデータが遅
延しても、データディスク装置2のデータのみからホス
トデータは生成できるため、冗長ディスク装置3のパリ
ティデータを復元する必要はない。 [データ復元を伴う交代割付処理]またディスクアレイ
装置1の制御手段7は、配下の各データディスク装置2
および冗長ディスク装置3のいずれかで訂正不可能なデ
ータブロックが検出された場合に、訂正不可能となった
データを同一パリティグループに属する残りのディスク
装置から復元し、訂正不可能なデータブロックを検出し
たディスク装置の交代領域に割り付ける。
【0011】[交代領域オーバフローに伴なう予備デー
タ復元処理]さらにディスクアレイ装置1の制御手段7
は、交代領域が全て使用済みとなった場合にも予備ディ
スク装置へのデータ復元を行う。即ち、配下のデータデ
ィスク装置2及び冗長ディスク装置3のいずれかで交代
領域が全て使用された場合に、そのディスク装置のデー
タを予備ディスク装置4に復元する。
【0012】この場合、予備ディスク装置4に対する復
元終了まで、又は、データ復元中に再度交代割付処理が
要求されるまでは、当該ディスク装置を論理ディスク装
置の構成として上位装置5からの入出力要求を処理す
る。その後に全交代領域が使用済みとなったディスク装
置は、故障ディスク装置として扱われ、論理ディスク装
置の構成要素から除外される。
【0013】[交代領域オーバフロー予測に基づく予備
データ復元処理]交代領域の使用済みに基づく予備ディ
スク装置4へのデータ復元処理は、予測的に行ってもよ
い。即ち、データディスク装置2および冗長ディスク装
置3のいずれかで使用可能な交代領域内ブロック数(空
き数)が閾値まで減少した場合に、当該ディスク装置の
データを予備ディスク装置4に復元する。
【0014】この場合、データ復元終了まで、又はデー
タ復元中に再度交代処理が要求されるまで又は交代ブロ
ックが全て使用されるまで、当該ディスク装置を論理デ
ィスク装置の構成要素として上位装置5からの入出力要
求を処理する。その後は、制御手段7において故障ディ
スク装置として扱われる。 [同期回転異常時の予備データ復元処理]一方、ディス
クアレイ装置1の制御手段7は、配下のデータディスク
装置2及び冗長ディスク装置3のいずれかでの同期回転
異常を検出した場合に、該ディスク装置のデータを予備
ディスク4に復元する。
【0015】この場合、データ復元終了まで又はデータ
復元中にライト命令を受けるまで、当該ディスク装置を
論理ディスク装置の構成要素として上位装置5からの入
出力要求を処理する。その後は、制御手段7において故
障ディスク装置として扱われる。この場合、データ復元
中に上位装置5よりライト命令を受けても故障ディスク
装置とせず、回転同期を維持することのできなくなった
ディスク装置をそのまま使用してライト動作を行わせる
ようにしてもよい。
【0016】[障害発生の予測処理]ディスクアレイ装
置1の制御手段7は、ディスク装置の障害発生を予測し
て予備ディスク装置4に対するデータ復元を行う。即
ち、制御手段7は、配下の各ディスク装置のエラー回数
とその頻度を管理するエラー統計テーブル10を有し、
エラー統計テーブル10を参照して故障の危険性の高い
ディスク装置を認識する。
【0017】[障害発生の予測に基づく予備データ復元
処理]エラー統計テーブル10を参照して故障の危険性
の高いディスク装置を認識した場合、故障する以前に当
該ディスク装置のデータを先行して予備ディスク装置4
に復元する。この場合、データ復元終了まで当該ディス
ク装置を論理ディスク装置の構成要素として上位装置5
からの入出力要求を処理する。
【0018】データ復元が済むと、故障する危険性の高
いディスク装置は、制御手段7により故障ディスク装置
として扱われる。 [交代ブロックの増加に伴うディスク装置の予備データ
復元処理]またディスアレイ装置の制御手段7は、回転
同期制御を行っている配下の各ディスク装置の同一トラ
ック又は同一シリンダの交代領域の使用状態(交代ブロ
ック数)を管理する交代ブロックテーブル11を有し、
交代ブロック数が閾値に達して別のトラック又はシリン
ダに交代領域が割付られ、このような交代領域へのデー
タ割付けに伴うシーク動作でデータ到着時間が遅延す
る。このようにデータ到達の遅延が予測されるディスク
装置のデータを予備ディスク装置4に復元する。
【0019】この場合、データ復元終了まで、又はデー
タ復元中に上位装置5から交代ブロック領域のデータブ
ロックを含むライト命令を受けるまで、当該ディスク装
置を論理ディスク装置の構成要素としてとして上位装置
5からの入出力要求を処理する。また、データ復元中に
上位装置5から交代領域のデータブロックを含むライト
命令を受けても当該ディスク装置を故障ディスク装置と
して除外せず、データ復元終了まで論理ディスク装置の
構成要素として上位装置5からの入出力要求の処理を継
続させてもよい。
【0020】[人的介入を伴なう再構成処理]ディスク
アレイ装置1の制御手段7は、配下の各ディスク装置の
固有情報、動作状態、物理的な設置位置を管理するアレ
イ構成テーブル12を有し、アレイ構成テーブル12を
参照して配下のディスク装置のデータが予備ディスク装
置4に復元されていることを認識した場合に、予備ディ
スク装置4と故障ディスク装置との物理的位置を交換移
動を促すメッセージを例えば上位装置5に送って外部に
出力し、ユーザや保守要員に再構成させる。
【0021】[人的介入を伴なわない再構成処理]ディ
スクアレイ装置1の制御手段7は、配下の各ディスク装
置の固有情報、動作状態、物理的な設置位置を管理する
アレイ構成テーブル12を参照してデータが予備ディス
ク装置4に復元されていることを認識した場合に、予備
ディスク装置4を故障ディスク装置の論理的位置に移動
させ、物理的に移動することなく再構成させる。
【0022】
【作用】このような本発明のディスクアレイ装置にあっ
ては、次の作用が得られる。 [タイマ監視によるデータ復元処理]タイマ手段でデー
タ到達時間の監視を行い、故障を起こした1台のデータ
ディスク装置のディスク転送が規定時間以上遅れた時、
残りのデータディスク装置と冗長ディスク装置から遅延
したデータディスク装置のデータを復元することによっ
て、遅延しているデータディスク装置が各種リトライ処
理を行っているような場合でも、その結果を待つことな
しに上位装置に対しホストデータを転送することがで
き、上位装置に対する転送速度が向上する。
【0023】[データ復元を伴う交代割付処理]訂正不
可能なデータブロックと同一のパリティグループを構成
する残りのディスク装置のデータから、訂正不可能なブ
ロックのデータを復元して交代領域に割付けることで、
訂正不可能ブロックを検出したディスク装置を故障ディ
スクとして扱わなくとも良いため、ディスク装置を有効
に利用することができる。
【0024】[交代領域オーバフローに伴なう予備デー
タ復元処理]交代領域が使用済みとなっているディスク
装置のデータを予備ディスク装置に復元し、故障ディス
ク装置と見做して交換可能とする。この場合、データ復
元終了まで、又は、このディスク装置においてデータ復
元中に再度交代割付処理が必要となるまで継続して使用
し続けることによって、データ復元中に他のデータディ
スク装置または冗長ディスク装置が故障した場合にも、
論理ディスク装置の冗長性を確保でき、ユーザデータを
保証することができる。
【0025】[交代領域オーバフロー予測に基づく予備
データ復元処理]一方、交代領域の使用済みに伴う予備
ディスク装置のデータ復元中に再度交代割付処理が必要
となった場合、ディスク装置の冗長性が失われてしまう
のに対し、交代領域の使用可能な残りブロック数が閾値
以下に減少した時に予備ディスク装置へのデータ復元を
開始することで、テータ復元中にも残り数分の交代割付
処理かできるので、より高い信頼性でユーザデータを保
証することができる。
【0026】また、データ復元中に起こり得る交代割付
処理以上に残りブロック数の閾値を上げておくことで、
データ復元後まで論理ディスク装置の冗長性を保つこと
ができる。 [同期回転異常時の予備データ復元処理]回転同期が維
持できなくなったディスク装置のデータを予備ディスク
装置に復元し、故障ディスク装置として交換可能とす
る。
【0027】この場合、同期回転が維持できなくなった
ディスク装置を、データ復元終了まで、又は上位装置か
らライト命令を受け取るまで継続して使用し続けること
によって、データ復元中に他のデータディスク装置また
は冗長ディスク装置が故障した場合にも、ディスク装置
の冗長性を確保でき、ユーザデータを保証することがで
きる。また、データ復元中の上位装置5からのライト命
令を高速に処理できる。
【0028】一方、データ復元中にライト命令に対し、
同期回転が維持きなくなっているディスク装置にライト
動作を行わせてもよい。これにより回転同期を維持して
いる時よりライト動作に時間はかかるが、回転同期を維
持することが不可能となったディスク装置を、データ復
元終了まで継続して使用し続けて冗長性が確保され、よ
り高い信頼性でユーザデータを保証することができる。
【0029】[障害発生の予測処理]エラー統計テーブ
ルの内容を設定されている閾値と比較することによっ
て、故障する危険性の高いディスク装置を事前に把握で
きる。 [障害発生の予測に基づく予備データ復元処理]故障す
る危険性の高いディスク装置が致命的な故障を起こす以
前に予備ディスク装置にデータを復元することができ
る。また、データ復元中に他のデータディスク装置また
は冗長ディスク装置が故障した場合にも、ディスクの冗
長性を確保できるためユーザデータを保証することがで
きる。
【0030】[交代ブロック数に伴うディスク装置の予
備データ復元処理]同一のトラック又は同一シリンダの
交代領域の交代ブロック数が増加すると他のトラック又
はシリンダに交代領域が拡張され、このような交代ブロ
ックをリードするとシーク動作に時間がかかり、上位装
置へのデータ転送速度が遅延する。このようなディスク
装置のデータを予備ディスク装置に復元し、交代領域を
使用せずにリード可能な状態にすることで、データ転送
の遅延を抑えることができる。
【0031】[人的介入を伴なう再構成処理]何らかの
原因により配下のディスク装置のデータが予備ディスク
に復元されている場合に、予備ディスク装置のデータを
交換したディスク装置にコピーすること無しに、ユーザ
や保守要員が物理的な位置を移動するだけで論理ディス
ク装置を再構成して使用することができる。 [人的介入を伴なわない再構成処理]予備ディスク装置
の物理的な位置を移動せずに、論理ディスク装置を再構
成して使用でき、ディスク装置の交換に伴う人為的ミス
を防止できる。
【0032】
【実施例】
<目 次> 1.ハードウェア構成と機能 2.タイマ監視によるデータ復元 3.データ復元を伴う交代割付処理 4.交代領域オーバフローに伴う予備へのデータ復元 5.交代領域オーバフロー予測に基づく予備へのデータ
復元 6.同期回転異常時の予備へのデータ復元 7.障害発生の予測と予備へのデータ復元 8.同一トラック内の交代ブロック数の増加に伴う予備
へのデータ復元 9.人的介入を伴う再構成 10.人的介入を伴わない再構成 1.ハードウェア構成と機能 図2は本発明のディスクアレイ装置のハードウェア構成
と機能を示した実施例構成図である。
【0033】図2において、本発明のディスクアレイ装
置1は例えば4台のデータディスク装置2−0〜2−
3、1台の冗長ディスク装置3、および1台の予備ディ
スク装置4を備え、各ディスク装置をアレイコントロー
ル部6に設けられたポート15−0〜15−5のそれぞ
れに接続している。ディスクアレイ装置1における各デ
ィスク装置は、その論理的位置および物理的位置がポー
ト番号#0〜#5とランク番号#0〜#nで特定され
る。この実施例にあっては、1ランク構成を例にとって
いるが、必要に応じて複数ランク設けることができる。
【0034】この実施例にあっては、ポート番号#0〜
#3のポート15−0〜15−3にデータディスク装置
2−0〜2−3を接続し、またポート番号#4のポート
15−4にパリティデータを格納する冗長ディスク装置
3を接続している。データディスク装置2−0〜2−3
および冗長ディスク装置3のアドレス(デバイスID)
はポート番号とランク番号で特定され、#00,#0
1,#02,#03,#04となる。
【0035】4台のデータディスク装置2−0〜2−3
と1台の冗長ディスク装置3により、1つのパリティグ
ループを構成している。例えば、上位装置5からのデー
タブロックを書き込む場合には、転送されたデータブロ
ックをアレイコントローラ部6で4つのデータディスク
装置2−0〜2−3に分配するストライピング処理を行
い、同時に各ストライピングデータからパリティデータ
を生成し、各ストライピングデータおよびパリティデー
タを並列的にポート15−0〜15−4からデータディ
スク装置2−1〜2−3および冗長ディスク装置3に供
給して、並列的に書き込む。
【0036】一方、上位装置5からのリード要求に対し
ては、アレイコントローラ部6でリードブロックのアド
レスからデータディスク装置2−0〜2−3の各アドレ
スを生成し、更に冗長ディスク装置3についてもアドレ
スを生成し、ストライピングデータおよびパリティデー
タを系列的にリードする。そしてアレイコントローラ部
6において、リードした各ストライピングデータからリ
ードブロックを生成し、生成したリードブロックからパ
リティを生成して冗長ディスク3からリードしたパリテ
ィデータとの整合をチェックし、正常であれば上位装置
5にリードブロックを転送することになる。
【0037】このようなディスクアレイ装置1における
ライト動作およびリード動作のため、アレイコントロー
ラ部6には制御手段としてのプロセッサ7および分配結
合器8が設けられている。なお、この実施例にあって
は、冗長ディスク装置3を固定的に決めていることか
ら、データブロックをビット単位あるいはバイト単位に
分配して系列的に読み書きする、いわゆるRAID3と
して知られたディスクアレイの制御形式を例にとってい
る。
【0038】更に本発明のアレイコントローラ部6にあ
っては、タイマ9,エラー統計テーブル10,交代ブロ
ックテーブル11,アレイ構成テーブル12および閾値
設定テーブル13を新たに設けている。プロセッサ7は
タイマ9,エラー統計テーブル10,交代ブロックテー
ブルテーブル11,アレイ構成テーブル12および閾値
設定テーブル13を使用し、配下のデータディスク装置
2−0〜2−3および冗長ディスク装置3のいずれかで
障害が発生したことを認識すると、障害発生ディスク装
置を除く他のディスク装置からのデータに基づく復元処
理、あるいは障害と判定されたディスク装置のデータを
予備ディスク装置4に復元する復元処理を実行する。
【0039】即ち、本発明によるプロセッサ7の制御処
理は、次に列挙する内容となる。 タイマ9の監視によるリードブロックデータの復元 データ復元を伴う交代割付処理 交代領域がオーバフローになった場合の予備ディスク
装置4へのデータ復元 交代領域のオーバフローを予測して、予備ディスク装
置4へのデータ復元 回転同期制御を行っている各ディスク装置のいずれか
における同期回転異常の際の予備ディスク装置4へのデ
ータ復元 各ディスク装置の障害の発生を予測して、予備ディス
ク装置4へのデータ復元 交代ブロック数が増加したディスク装置の予備ディス
ク装置へのデータ復元 予備ディスク装置4へのデータ復元が済んだ後の人的
介入による再構成 予備ディスク装置への復元が済んだ後の、人的介入を
伴わない再構成 以下、前記〜のそれぞれについて詳細に説明する。 2.タイマ監視によるデータ復元 図3は上位装置5からのリード命令に対し、アレイコン
トローラ部6のプロセッサ7が適当なタイミングでタイ
マ9を初期化して起動し、パリティグループを構成する
データディスク装置2−0〜2−3のいずれか1台から
のデータ転送が閾値設定テーブル13に設定されている
タイムアウト時間以上遅れた場合、既に得られている残
りのデータディスク装置からのデータに基づき、遅延し
たデータディスク装置のデータを復元し、リードブロッ
クを生成して上位装置5に転送するようにしたことを特
徴とする。
【0040】図3のフローチャートについて詳細に説明
すると次のようになる。まずステップS1で、ホストコ
ンピュータ5よりプロセッサ7がリード要求を受領する
と、ステップS2で、ホストコンピュータにおける論理
ディスクを構成する配下のデータディスク装置2−0〜
2−3および冗長ディスク装置3に対しリードコマンド
を発行する。
【0041】このリードコマンドの発行に基づきステッ
プS3で、配下のデータディスク装置2−0〜2−3お
よび冗長ディスク装置3のリード処理が行われ、リード
データが転送されてくる。このときプロセッサ7はどの
ディスク装置が分配結合器8に対しデータ転送を完了し
たか否かを監視しており、パリティデータとデータ復元
に必要なリードデータが分配結合器8に転送されるか否
か、ステップS4でチェックしている。
【0042】即ち、この実施例にあっては、4台のデー
タディスク装置2−0〜2−3を配下にもつことから、
パリティデータと4台のディスク装置のうちの3台のリ
ードデータが得られると、残り1つのリードデータを復
元することができるため、4台のデータディスク装置2
−0〜2−3のうちの3台のデータ転送と冗長ディスク
装置3からのパリティデータの転送が済んだ時点で、ス
テップS4のデータ復元に必要なデータ受領と判定す
る。
【0043】続いてステップS5のデータ遅延のフラグ
セットをチェックするが、初期状態でフラグはリセット
されていることからステップS6に進み、プロセッサ7
はタイマ9の初期化および起動を行う。ステップS6に
おけるタイマ9の起動後、プロセッサ7は閾値設定テー
ブル13より、予め定められたタイムアウト時間(閾値
時間)を読み出す。
【0044】ステップS8で、設定されたタイムアウト
時間内に遅延しているディスク装置からのデータを受領
した場合には、分配結合器8で全てのデータディスク装
置2−0〜2−3からのリードデータからホストコンピ
ュータ5に対するリードブロックデータを生成し、冗長
ディスク装置3からのパリティデータとの整合性を確認
した上で、ホストコンピュータ5に対しリードデータか
ら生成されたホストブロックデータを転送する。
【0045】一方、ステップS8の設定タイムアウト時
間内に残りのデータディスク装置からのリードデータを
受け取ることができなかった場合には、ステップS9に
進んで、データ遅延が発生したことを示すフラグをセッ
トし、既に分配結合器8に転送されている3台のデータ
ディスク装置からのリードデータと冗長ディスク装置3
からのパリティデータを使用して、ステップS10でホ
ストデータブロックを生成してホストコンピュータ5に
転送する。
【0046】続いてプロセッサ7は、データ転送が遅延
しているデータディスク装置をその後も監視し、遅延の
原因と結果を示すステータス情報の受領を待つ。このス
テップS11におけるステータス情報の受領待ちの際
に、ステップS12で再度リード要求があるか否かチェ
ックしている。もしステータス情報を受領する前に再度
リード要求があると、ステップS2に戻り、ホストコン
ピュータからのリード要求に基づきステップS2〜S3
で配下のデータディスク装置へのリードコマンドの発行
に伴うリード処理およびデータ転送を行わせ、この場合
にも前回と同様、同じデータディスク装置からのデータ
遅延を起こすことになる。
【0047】この場合、前回の処理で既にデータ遅延フ
ラグがセットされていることから、ステップS5から直
ちにステップS10に進み、ステップS6〜S9のタイ
マ起動に基づく監視処理は行わず、ステップS4で分配
結合器8に得られた遅延ディスク装置を除くデータディ
スク装置からのリードデータと冗長ディスク装置3から
のパリティデータによってデータを復元してホストブロ
ックデータを生成して、ホストコンピュータ5に直ちに
転送する。
【0048】ステップS11で、遅延しているディスク
装置の原因と結果を示すステータス情報が受領される
と、ステップS13に進み、データ遅延を示すフラグを
クリアし、ステップS14で、データ遅延の原因が各種
のリトライ処理にあったか否かチェックする。遅延理由
が各種のリトライ処理にあった場合には、続いてステッ
プS15で、データ遅延の原因が訂正不可能なリードデ
ータのリトライ処理であったか否かチェックする。
【0049】もし訂正不可能なリードデータのリトライ
処理であった場合には、図4のステップS16以降の処
理に進む。ここで、訂正不可能なリードデータのリトラ
イ処理は主にディスク媒体の媒体欠陥を原因とするもの
であり、交代領域に対する割付処理でリカバーすること
ができる。一方、ステップS15でデータ遅延の原因が
訂正不可能なリードデータのリトライ処理でなかった場
合、即ちデータディスク装置のエラーであった場合に
は、図5のステップS21に示すエラー統計テーブル1
0の更新処理に移行する。 3.データ復元を伴う交代割付処理 図4のフローチャートは、図3のステップS15に示し
たデータ遅延を起こしたデータディスク装置について訂
正不可能ブロックが検出された場合の交代割付処理を示
している。
【0050】図4において、ステップS1〜S15の処
理は図3と同じであり、ステップS2〜S14について
は省略して示している。ステップS15でデータ遅延の
原因が訂正不可能なデータブロックの検出にあったこと
が判別された場合、ステップS16に進み、訂正不可能
なデータブロックのアドレスから他の正常なデータディ
スク装置での同一パリティグループを構成するアドレス
を算出し、次のステップS17で、正常なデータディス
ク装置2および冗長ディスク装置3から訂正不可能なデ
ータブロックが検出されたディスク装置のデータ復元に
必要なデータリードのためのリードコマンドを発行す
る。
【0051】続いてステップS18で、正常なデータデ
ィスク装置2および冗長ディスク装置3から得られたリ
ードデータおよびパリティデータに基づき、訂正不可能
なブロックから検出されたディスク装置のリードデータ
を復元し、ステップS19で、データ遅延を起こしたデ
ータディスク装置の交代領域に復元したデータを書き込
む割付けを行う。
【0052】このようなステップS16〜S19におけ
る訂正不可能なデータブロックを他のディスク装置から
のリードデータで復元して交代領域に割り付ける処理
は、ディスクアレイ装置1がホストコンピュータ5から
の命令を何も実行していない空き時間に行うことが望ま
しい。またステップS19で、交代領域に対するデータ
割付けが済んだ場合には、図5のステップS21および
S22に示すエラー統計テーブル10の更新および交代
ブロックテーブル11の更新を行うようになる。 4.交代領域オーバフローに伴う予備へのデータ復元 図5のフローチャートは、配下のディスク装置において
交代割付用の交代領域が全て使い尽くされたときに、交
代領域を全て使い尽くしたディスク装置のデータを予備
ディスク装置4に復元するようにしたことを特徴とす
る。
【0053】具体的に図5について説明すると次のよう
になる。なお図5のフローチャートにあっては、データ
ディスク装置2−3(機番アドレス#03)で交代領域
が使い尽くされてオーバフローとなった場合の処理を示
している。尚、図のフローチャート中でデータディスク
装置は、データ#03と省略して示している。まずステ
ップS20で、配下のディスク装置のうちのデータディ
スク装置2−3が訂正不可能なブロックの検出に基づ
き、交代領域への割付処理を実施したとする。続いてス
テップS21で、交代処理の原因となったエラーのエラ
ー統計テーブル10に対する更新を行い、またステップ
S22で、交代ブロックテーブル11に対する更新を行
う。
【0054】次にステップS23でデータディスク装置
2−3に関する交代ブロックテーブル11の内容を参照
し、交代領域の残りブロック数が0となって使い尽され
ていた場合には、ステップS24に進み、プロセッサ7
は直ちに交代領域が使い尽くされたデータディスク装置
2−3のデータを予備ディスク装置4に復元するための
処理を開始する。
【0055】このデータ復元処理は、交代領域が使い尽
くされたデータディスク装置2−3を除く他のデータデ
ィスク装置2−0〜2−2および冗長ディスク装置3の
リード処理を行って、分配結合器8でデータディスク装
置2−3のデータを復元し、これを予備ディスク装置4
に書き込む処理を行う。ステップS24で予備ディスク
装置4へのデータ復元を開始すると、データ復元中にお
けるホストコンピュータ5からのリード要求に対しては
ステップS25〜S30に示す処理が行われ、一方、ラ
イト要求についてはステップS32〜S38(S41,
S42を含む)の処理が行われる。
【0056】まずホストコンピュータ5からデータ復元
中にリード要求を受けると、このリード要求はステップ
S25で判別され、ステップS26に進む。ステップS
26にあっては、データディスク装置2−3が故障ディ
スク装置に設定されているか否かチェックする。最初、
データディスク装置2−3は故障ディスク装置には設定
されていないことから、ステップS27に進み、データ
ディスク装置2−3における交代割付処理が必要なリー
ド要求か否かチェックする。
【0057】ステップS27でデータディスク装置2−
3の交代割付処理を必要としないリード要求であった場
合には、ステップS28に進み、全てのデータディスク
装置2−0〜2−3および冗長ディスク装置3に対しリ
ードコマンドを発行してリード動作を行わせ、分配結合
器8で各データデータディスク装置2−0〜2−3のリ
ードデータからホストブロックデータを生成し、パリテ
ィデータとの整合をチェックした後、ホストコンピュー
タ5に転送する。
【0058】一方、ステップS27でデータディスク装
置2−3に関し、交代割付処理を必要とするリード要求
であった場合には、データディスク装置2−3について
交代処理を行ってリードデータを転送すると処理時間が
かかることから、ステップS29でデータディスク装置
2−3を故障ディスク装置に設定し、ステップS30で
ディスク装置2−3を除くデータディスク装置2−0〜
2−2および冗長ディスク装置3に対しリードコマンド
を発行して、得られたデータからホストブロックデータ
を復元してホストコンピュータ5に転送する。
【0059】次に図6のステップS31で予備ディスク
装置4へのデータ復元中にホストコンピュータ5からの
ライト要求が判別されると、ステップS32に進み、デ
ータディスク装置2−3は故障ディスク装置に設定され
ているか否かチェックする。故障ディスク装置に設定さ
れていなければステップS33に進み、データディスク
装置2−3の交代割付処理を伴うライト要求か否かチェ
ックする。交代割付処理を伴うライト要求でなければ、
ステップS34で全てのデータディスク装置2−0〜2
−3および冗長ディスク装置3に対しライト命令を実行
する。
【0060】一方、ステップS33でデータディスク装
置2−3に関し交代割付処理を必要とするライト要求で
あった場合には、データディスク装置2−3の交代領域
は使い尽くされて使用不可となっていることから、ステ
ップS35に進み、データディスク装置2−3を故障デ
ィスク装置に設定する。
【0061】続いてステップS36で、故障ディスク装
置に設定されたデータディスク装置2−3を除くデータ
ディスク装置2−0〜2−2および冗長ディスク装置3
に対しライト命令を実行する。この場合、故障ディスク
装置に設定されたデータディスク装置2−3分の分配デ
ータ(ストライピングデータ)が欠落するが、他のディ
スク装置のライトデータおよびパリティデータから復元
可能であることから問題はない。
【0062】なお、予備ディスク装置4に対する復元済
みのデータについてのライト要求であった場合には、ラ
イト要求の実行完了後に再度、予備ディスク装置4への
復元データに割り付ける必要がある。ステップS31の
ライト要求に伴う処理が済むと、ステップS37で、予
備ディスク装置4への復元を行っているデータディスク
装置2−3以外のデータディスク装置2−0〜2−2に
障害発生か否かをチェックした後、ステップS38で予
備ディスク装置4へのデータ復元終了を監視し、予備デ
ィスク装置4へのデータ復元終了まで以上の処理を繰り
返す。
【0063】ステップS38で予備ディスク装置へのデ
ータ復元終了が判別されると、ステップS39で、デー
タ復元中にデータディスク装置2−3は故障ディスク装
置に設定されたか否かチェックし、もし設定されていな
ければステップS40でデータディスク装置2−3を故
障ディスク装置とする。一方、データ復元中のステップ
S37で、復元対象となっているデータディスク装置2
−3以外のデータディスク装置2−0〜2−2または冗
長ディスク装置3に障害が発生した場合には、ステップ
S41に進んで、データディスク装置2−3が故障ディ
スク装置に設定されているか否かチェックする。
【0064】もし故障ディスク装置に設定されていた場
合にはパリティグループに属する2台のディスク装置に
故障が起きていることから、この場合には冗長性が失わ
れ、ユーザデータの崩壊につながり、異常終了となる。
ステップS40でデータディスク装置2−3がまだ故障
ディスク装置として設定されていない場合には、ステッ
プS42に進み、データディスク装置2−3について行
っていた予備ディスク装置4へのデータ復元を中止し、
新たに障害を起こしたディスク装置のデータを予備ディ
スク装置4に対し行うようにする。即ち、交代領域が使
い尽くされた場合の予備ディスク装置4へのデータ復元
に対し、致命的な障害となるような故障ディスク装置に
ついての予備ディスク装置4へのデータ復元処理を優先
させる。
【0065】図5および図6に示した交代領域オーバフ
ローに伴う予備ディスク装置へのデータ復元処理にあっ
ては、交代領域が使い尽くされたデータ復元の対象とな
っているデータディスク装置2−3の故障ディスク装置
への設定は、もしリード要求またはライト要求により交
代割付処理を必要としなければ、予備ディスク装置4へ
のデータ復元終了まで交代領域が使い尽くされたデータ
ディスク装置2−3を正常なディスク装置としてリード
動作またはライト動作することができ、冗長性および並
列アクセス性能が確保できる。
【0066】一方、データ復元中に割付交代処理を必要
とするリード要求またはライト要求があると、交代領域
が使い尽くされたデータディスク装置2−3は故障ディ
スク装置に設定され、リード動作およびライト動作の対
象から除外される。しかしリード動作については、他の
ディスク装置のリードデータから故障ディスク装置に設
定されたデータディスク装置2−3のリードデータを復
元できることから、リード性能の低下は起きない。
【0067】またライト動作についても、故障ディスク
装置として設定されたデータディスク装置2−3に対す
るライト動作が行われないだけであることから、ライト
性能も低下することはない。 5.交代領域オーバフロー予測に基づく予備へのデータ
復元 図7および図8のフローチャートは、ディスク装置の交
代領域の残り数が予め定めた閾値に減少したときに予備
ディスク装置へのデータ復元を行うようにしたことを特
徴とする。
【0068】図7において、ステップ20で例えばデー
タディスク装置2−3が交代割付処理を実施したとする
と、ステップS21でエラー統計テーブル10の更新を
行い、またステップS22で交代ブロックテーブル11
の更新を行う。次にステップS23で、閾値設定テーブ
ル13を参照して、予め定めたデータ復元処理を開始す
るための交代領域の残りブロック数の閾値を求め、ステ
ップS24で、交代ブロックテーブル11から求めたデ
ータディスク装置2−3の現在の交代領域残りブロック
数と比較する。
【0069】この交代領域残りブロック数が閾値と等し
ければ、ステップS25に進み、データディスク装置2
−3のデータを予備ディスク装置4に復元する処理を開
始する。予備ディスク装置4へのデータ復元中にホスト
コンピュータ5からリード要求があると、ステップS2
6〜S32の処理が行われ、一方、ライト要求がある
と、図8のステップS33〜S40の処理が行われる。
【0070】図7のデータ復元中のリード要求について
は、ステップS26でリード要求が判別されてステップ
S27に進み、データディスク装置2−3が故障ディス
ク装置に設定されていなければ、ステップS28で交代
割付処理を必要とするか否かチェックし、必要としなけ
ればステップS29で、パリティグループに含まれる全
ディスク装置を対象にリード命令を実行する。
【0071】ステップS28で、交代領域残りブロック
数が閾値に減少したデータディスク装置2−3に関し交
代割付処理が必要となった場合には、ステップS30
で、交代領域残りブロック数が0に達したか否かチェッ
クし、達していなければ、ステップS31の故障ディス
ク装置への設定を行わず、ステップS32で、データデ
ィスク装置2−3以外のパリティグループに属するディ
スク装置でリード命令を実行する。
【0072】即ち、この場合の予備ディスク装置へのデ
ータ復元の開始は閾値分の空きブロックが残っている状
態で開始していることから、交代領域残りブロック数が
0になるまではデータディスク装置2−3を故障ディス
ク装置とはせず、冗長性を確保する。データ復元中のラ
イト要求は図8のステップS33で判別され、ステップ
S34に進み、交代領域残りブロック数が閾値に減少し
たデータディスク装置2−3は故障ディスク装置に設定
されたか否かチェックし、設定されていなければ、ステ
ップS36で交代割付処理を必要とするライト要求か否
かチェックし、必要としなければステップS37で、パ
リティグループを構成する全ディスク装置に対しライト
命令を実行する。
【0073】ステップS36でデータディスク装置2−
3に関し交代割付処理を必要とするライト要求であった
場合には、ステップS38で交代領域残りブロック数が
0か否かチェックし、0に達するまではステップS39
でデータディスク装置2−3を故障ディスク装置に設定
せず、ステップS40でデータディスク装置2−3以外
のディスク装置でライト命令を実行する。
【0074】このようなライト要求に対するデータ復元
中の処理が済むと、ステップS41でデータディスク装
置2−3以外のディスク装置の障害発生の有無をチェッ
クした後、ステップS40で予備ディスク装置4へのデ
ータ復元終了の有無をチェックし、これを繰り返す。ス
テップS42で予備ディスク装置4へのデータ復元終了
が判別されると、ステップS43で、データ復元中にデ
ータディスク装置2−3は故障ディスク装置に設定され
たか否かチェックし、設定されていなければステップS
44で故障ディスク装置に設定して、一連の処理を終了
する。
【0075】一方、ステップS41でデータ復元中にデ
ータディスク装置2−3以外のディスク装置で障害が発
生した場合には、ステップS45に進み、このときデー
タディスク装置2−3が故障ディスク装置に設定されて
いなければ、ステップS46で予備ディスク装置4への
データ復元を中断し、新たに故障した他のディスク装置
のデータの予備ディスク装置4への復元を開始する。
【0076】またステップS45で、データ復元中に既
にデータディスク装置2−3が故障ディスク装置に設定
されていた場合には、同一パリティグループに含まれる
2台のディスク装置に故障が起きたことから冗長性が失
われ、ユーザデータの崩壊によって異常終了となる。 6.同期回転異常時の予備へのデータ復元 図2に示した本発明のディスクアレイ装置1にあって
は、アレイコントローラ部6の配下に設けたデータディ
スク装置2−0〜2−3,冗長ディスク装置3および予
備ディスク装置4は、スピンドルモータによるディスク
媒体の回転制御につき回転同期をとる制御を行う場合が
ある。このように各ディスク装置のスピンドルモータの
回転同期制御が行われている場合には、特定のディスク
装置に回転同期の異常が起きると、異常を起こしたディ
スク装置のアクセス性能の低下に伴って全体的な性能低
下を引き起こすことになる。
【0077】そこで本発明にあっては、図9のフローチ
ャートに示すように回転同期の維持ができなくなったこ
とを検出して、そのディスク装置のデータを予備のディ
スク装置に復元する処理を行うようにしたことを特徴と
する。図9において、パリティグループを構成している
ディスク装置の中の特定のディスク装置、例えばデータ
ディスク装置2−3で回転同期が維持できなくなったと
き、この回転同期の異常をプロセッサ7が受領し、ステ
ップS2で、回転同期が維持できなくなったデータディ
スク装置2−3のデータを予備ディスク装置4に復元す
るデータ復元処理を開始する。
【0078】即ち、残りの回転同期が正常なデータディ
スク装置2−0〜2−2および冗長ディスク装置3にリ
ード命令を発行して、得られたリードデータを分配結合
器8で生成して予備ディスク装置4に書き込む復元処理
を開始する。予備ディスク装置4へのデータ復元中に、
ステップS3でホストコンピュータ5からのリード要求
が判別されると、ステップS4に進み、データディスク
装置2−3以外の同一パリティグループに属するディス
ク装置のリード命令の実行でホストブロックデータをリ
ードデータから生成して、ホストコンピュータ5に転送
する。
【0079】またデータ復元中にステップS5でホスト
コンピュータ5からのライト要求を判別すると、ステッ
プS6で回転同期が維持できなくなっているデータディ
スク装置2−3を故障ディスク装置に設定し、データデ
ィスク装置2−3を除く同一グループに属するディスク
装置でライト命令を実行する。この場合、同期回転が維
持できないデータディスク装置2−3はライト命令の実
行対象から除外されているため、ライト命令は同期回転
を維持しているディスク装置で行われ、ライト処理を高
速に行うことができる。
【0080】リード要求またはライト要求に伴う処理が
済むと、ステップS8で同期回転が維持できないデータ
ディスク装置2−3以外のディスク装置に障害発生があ
ったか否かチェックした後、ステップS9で予備ディス
ク装置4へのデータ復元終了の有無をチェックし、デー
タ復元終了まで以上の処理を繰り返す。ステップS9で
予備ディスク装置4へのデータ復元終了が判別される
と、ステップS10で、データ復元中に同期回転が維持
できなくなっているデータディスク装置2−3が障害デ
ィスク装置に設定されたか否かチェックし、もし設定さ
れていなければ、ステップS11で故障ディスク装置に
設定する。
【0081】一方、データ復元中にステップS8で同期
回転が維持できなくなったデータディスク装置2−3以
外のディスク装置に障害が発生した場合には、ステップ
S12に進み、障害発生以前にライト命令を実行したか
否かチェックし、もし障害発生以前にライト命令を実行
していると、同期回転が維持できなくなったディスク装
置2−3を含めて同一パリティグループに属する2台の
ディスク装置が故障したことから冗長性が失われ、ユー
ザデータの崩壊として異常終了に至る。
【0082】一方、障害発生以前にライト命令が実行さ
れていなければステップS13に進み、現在行っている
同期回転が維持できないデータディスク装置2−3に関
する予備ディスク装置4へのデータ復元を中止し、新た
に障害発生となった他のディスク装置のデータを予備デ
ィスク装置4に復元する。この場合の予備ディスク装置
へのデータ復元は、同期回転が維持できなくなっている
データディスク装置2−3を正常なディスク装置として
扱うことから、データ復元処理に多少時間がかかること
になる。更に、新たに故障したデータディスク装置の予
備ディスク装置へのデータ復元が終了したならば、デー
タ復元ができた予備ディスク装置を後から故障した障害
ディスク装置と物理的に入れ替え、予備ディスク装置の
位置に別の新たなディスク装置をセットして再度、同期
回転が維持できていないデータディスク装置2−3のデ
ータの復元処理を行う。
【0083】図10は同期回転を維持できなくなったデ
ィスク装置に対するデータ復元処理の第2実施例を示し
たフローチャートである。この第2実施例にあっては、
データ復元中にホストコンピュータからのライト要求を
受けても同期回転を維持できなくなったディスク装置を
故障ディスク装置に設定せず、同期回転を維持できなく
なっているディスク装置を正常なディスク装置としてラ
イト動作を実行するようにしたことを特徴とする。
【0084】即ち、図10のステップS1〜S4は図9
のフローチャートと同じであるが、データ復元中のライ
ト要求をステップS5で判別すると、ステップS6で、
同期回転を維持できなくなっているデータディスク装置
2−3を故障ディスク装置に設定せず、全ディスク装置
でライト命令を実行する。このため、ライト要求に対す
るライト命令の実行時間は同期回転を維持できなくなっ
ているデータディスク装置2−3の性能低下に依存する
ため、ライト処理が低速で時間がかかるようになる。し
かしながら、ディスクアレイ装置1としての冗長性は維
持できる。
【0085】更に、データ復元中にステップS7で同期
回転が維持できなくなっているデータディスク装置2−
3以外のディスク装置に障害が発生したことを判別する
と、ステップS10に進み、現在の予備ディスク装置4
へのデータ復元を中止し、新たに障害発生となったディ
スク装置のデータの予備ディスク装置への復元を先行し
て行う。
【0086】これに対し、図9に示した実施例では、デ
ータ復元中にライト要求があった場合には、同期回転が
維持できなくなったデータディスク装置2−3を故障デ
ィスク装置に設定してしまっているため、他のディスク
装置の障害発生に対し同一パリティグループに属する2
台のデータディスク装置が故障となって冗長性が失わ
れ、ユーザデータの崩壊につながっている。
【0087】しかし、図10の第2実施例では同期回転
が維持できなくなってもデータディスク装置2−3を故
障ディスク装置としていないことから、他のディスク装
置の障害に対し冗長性を失うことなく予備ディスク装置
へのデータ復元ができ、その後に同期回転が維持できな
くなっているデータディスク装置2−3の予備ディスク
装置4へのデータ復元が可能となる。
【0088】更に、ステップS8で予備ディスク装置へ
のデータ復元の終了が判別されると、ステップS9で、
最終的に同期回転が維持できなくなっているデータディ
スク装置2−3を故障ディスク装置と設定する。 7.障害発生の予測と予備へのデータ復元図2に示した
本発明のディスクアレイ装置1にあっては、次のような
エラーを 検出したときにプロセッサ7にエラー報告を行う。
【0089】ディスク装置内部のリトライ処理によっ
て回復されたリードエラー ディスク装置内部のリトライ処理によって回復された
ポジショニング系のエラー ディスク装置内部のリトライ処理によって回復された
パリティエラー 交代割付処理で回復されたライトエラー 回復不可能なリードエラー プロセッサ7はこのようなエラー検出に基づく報告を受
領すると、エラー統計テーブル10を作成または内容更
新すると共に、閾値設定テーブル13に予め設定されて
いる閾値とエラー回数を比較し、エラー回数が閾値を越
えているディスク装置を故障する危険の高いディスク装
置として扱う障害予測処理を行う。
【0090】具体的には、図11のフローチャートのス
テップS1〜S6により障害発生の予測処理が行われ
る。まずステップS1で、配下のディスク装置の各種の
エラーを検出して報告を受けると、ステップS2で、エ
ラー統計テーブル10の更新の必要性の有無をチェック
し、必要があれば、ステップS3でエラー統計テーブル
10の作成または更新を行う。
【0091】続いてステップS4で、閾値設定テーブル
13を参照して予め定めた閾値を求め、ステップS5で
エラー回数と閾値を比較する。エラー回数が閾値以上で
あればステップS6に進み、そのディスク装置を故障の
危険性が高いディスク装置と認識する。ステップS6以
降にあっては、ディスク装置2−3が故障の危険性の高
いディスク装置と認識された場合を例にとって具体的に
説明する。
【0092】ステップS6で、データディスク装置2−
3が故障の危険性が高いディスク装置と認定されると、
ステップS7に進んで、プロセッサ7は直ちに認定され
たデータディスク装置2−3のデータを予備ディスク装
置4に復元するデータ復元処理を開始する。データ復元
中にホストコンピュータ5からのリード要求をステップ
S8で判別すると、ステップS9〜S14に示す処理が
行われる。即ちステップS9で、故障の危険性が高いと
認識されたデータディスク装置2−3は故障ディスク装
置に設定されているか否かチェックし、設定されていな
ければ、ステップS10でデータディスク装置2−3に
各種のエラー発生があったか否かチェックし、エラー発
生がなければステップS11で、全ディスク装置に対し
リード命令を実行させて、ホストブロックデータを転送
する。
【0093】ステップS10でデータディスク装置2−
3に各種のエラーが発生した場合には、ステップS12
で各種リカバリ処理の成功の有無をチェックし、リカバ
リ処理に成功すれば、ステップS13での故障ディスク
装置への設定を行わず、ステップS14で、故障の危険
性が高いと認識されているデータディスク装置2−3を
除く他のディスク装置でリード命令を実行して、復元し
たホストブロックデータを上位装置5に転送する。ステ
ップS12で各種リカバリ処理に失敗した場合には、ス
テップS13で、故障の危険性の高いデータディスク装
置2−3は故障ディスク装置に設定され、処理対象から
除外される。
【0094】データ復元中にホストコンピュータ5から
のライト要求が図12のステップS15で判別される
と、ステップS16〜S21の処理が行われる。即ち、
ステップS16で、故障の危険性が高いデータディスク
装置2−3は故障ディスク装置に設定されているか否か
チェックされ、設定されていなければステップS17
で、各種エラーが発生したか否かチェックし、発生して
いなければステップS18で、全ディスク装置に対しラ
イト命令を実行させる。
【0095】ステップS17で、故障の危険性が高いと
認識されているデータディスク装置2−3で各種エラー
が発生した場合には、ステップS19で、各種リカバリ
処理の成功をチェックし、成功すれば、ステップS20
における故障ディスク装置への設定を行わず、ステップ
S21で、データディスク装置2−3を除く他のディス
ク装置でライト命令を実行する。リカバリ処理に失敗す
れば、ステップS20でデータディスク装置2−3を故
障ディスク装置に設定する。
【0096】データ復元中にステップS22で、故障の
危険性の高いデータディスク装置2−3以外のディスク
装置に障害が発生すると、ステップS26で、データデ
ィスク装置2−3が故障ディスク装置に設定されていな
ければ、ステップS27で新たに障害発生となった障害
ディスク装置の予備ディスク装置に対するデータ復元を
先行し、その後に故障の危険性の高いデータディスク装
置2−3の予備ディスク装置へのデータ復元を行う。
【0097】ステップS26で、データ復元中にデータ
ディスク装置2−3が既に故障ディスク装置に設定され
ていた場合には、同一パリティグループに属する2つの
ディスク装置に障害が発生して冗長性が失われているこ
とから、ユーザデータの崩壊として異常終了する。ステ
ップS23で、予備ディスク装置4に対するデータ復元
の終了が判別されると、ステップS24に進み、データ
ディスク装置2−3が故障ディスク装置に設定されてい
なければ、ステップS25で故障ディスク装置への設定
を行った後、一連の処理を終了する。 8.同一トラック内の交代ブロック数の増加に伴う予備
へのデータ復元 図2に示した本発明のディスクアレイ装置1にあって
は、ホストコンピュータ5からのリード要求またはライ
ト要求に対し各ディスク装置のデータブロックが媒体欠
陥などにより訂正不可能なデータブロックとなった場合
には、交代領域への割付処理が行われる。この割付処理
の対象となる交代領域は同一トラック上または同一シリ
ンダ上に存在するが、同一トラック上または同一シリン
ダ上の交代領域ブロック数が、交代処理が進んで残り数
が少なくなると、別のトラックまたは別のシリンダ位置
を交代領域として新たに確保するため、その後の交代領
域に対するリード動作またはライト動作の際のシーク時
間が長くなる。
【0098】そこで図13のフローチャートに示すよう
に、同一トラックまたは同一シリンダに含まれる交代ブ
ロック数が予め定めた閾値を越えたディスク装置につい
ては、シーク時間の増加に伴う性能低下の原因になるこ
とから、予備ディスク装置へのデータ復元を行う。これ
を図13のフローチャートについて説明すると次のよう
になる。
【0099】図13において、ステップS1で配下のデ
ィスク装置例えばデータディスク装置2−3で交代ブロ
ックの割付処理が行われ、これをプロセッサ7が受領し
たとする。プロセッサ7は交代処理の報告を受けて、ス
テップS2で交代ブロックテーブル11の作成または更
新を行い、続いてステップS3で、閾値設定テーブル1
3を参照して同一トラックまたは同一シリンダに割付け
可能な交代ブロック数の閾値を読み出す。
【0100】次にステップS4で、現在の同一トラック
またと同一シリンダの交代ブロック数と閾値設定テーブ
ル13から読み出した閾値とを比較し、閾値を越えてい
る場合には、このデータディスク装置2−3について、
ステップS5において予備ディスク装置4へのデータの
復元を開始する。データ復元中にホストコンピュータ5
からのリード要求がステップS6で判別すると、ステッ
プS7〜S10の処理を行う。即ちステップS7で、同
一トラックまたは同一シリンダの交代ブロック数が閾値
を越えたデータディスク装置2−3が既に故障ディスク
装置に設定されているか否かチェックし、設定されてい
なければステップS8で、リード要求ブロックは交代ブ
ロックを含んでいるか否かチェックし、含んでいなけれ
ばステップS9で、全ディスク装置でリード命令を実行
する。
【0101】ステップS8でリード要求ブロックに交代
ブロックを含んでいた場合には交代ブロックのシーク動
作に時間がかかることから、ステップS10に進み、デ
ータディスク装置2−3以外のディスク装置でリード命
令を実行し、このリード命令で得られたリードデータお
よびパリティデータからホストブロックデータを復元し
てホストコンピュータ5にデータ転送する。
【0102】予備ディスク装置4に対するデータ復元中
に、図14のステップS11でホストコンピュータ5か
らのライト要求が判別されると、ステップS12〜S1
6の処理が行われる。即ち、ステップS12で同一トラ
ックまたは同一シリンダの交代ブロック数が閾値に達し
たデータディスク装置2−3は故障ディスク装置に設定
されているか否かチェックし、設定されていなければス
テップS3で、ライト要求ブロックは交代ブロックを含
んでいるか否かチェックする。
【0103】交代ブロックを含んでいなければステップ
S14で、全ディスク装置でライト命令を実行する。一
方、ステップS13でライト要求ブロックにデータディ
スク装置2−3の交代ブロックを含んでいる場合、ステ
ップS14で同一トラックまたは同一シリンダの交代ブ
ロック数が閾値に達したデータディスク装置2−3を故
障ディスク装置に設定する。そしてステップS16で、
故障ディスク装置に設定したデータディスク装置2−3
を除く他のディスク装置でライト命令を実行する。
【0104】更に、データ復元中にステップS17でデ
ータディスク装置2−3以外のディスク装置に障害が発
生すると、ステップS21で、現在予備ディスク装置4
へのデータ復元の対象となっているデータディスク装置
2−3が故障ディスク装置に設定されていないことを条
件に、ステップS22で、新たに障害発生となった障害
ディスク装置の予備ディスク装置へのデータ復元を行
う。
【0105】そして新たな障害ディスク装置へのデータ
復元が終了すると、一旦中断したデータディスク装置2
−3に関する予備ディスク装置へのデータ復元を行う。
一方、データ復元中に受けたライト要求ブロックにデー
タディスク装置2−3の交代ブロックが含まれていた場
合には、ステップS15で故障ディスク装置に設定され
ていることから、この場合には同一パリティグループに
含まれる2台のディスク装置で故障が起きたこととな
り、冗長性が失われ、ユーザデータの崩壊として異常終
了となる。
【0106】ステップS18にあっては、予備ディスク
装置4へのデータ復元の終了をチェックしており、デー
タ復元を終了するとステップS19で、データディスク
装置2−3の故障ディスク装置への設定が済んでいるこ
とをチェックすると、ステップS20で故障ディスク装
置に設定した後、一連の処理を終了する。図15は同一
トラックまたは同一シリンダの交代ブロック数が閾値に
達したときの予備ディスク装置へのデータ復元処理の第
2実施例を示したフローチャートである。この図15の
フローチャートに示す第2実施例にあっては、予備ディ
スク装置へのデータ復元中にホストコンピュータから交
代ブロックを含むライト要求を受けても、データ復元対
象となっているデータディスク装置2−3を故障ディス
ク装置に設定せずに、論理ディスク装置を構成する有効
なディスク装置として冗長性を確保するようにしたこと
を特徴とする。
【0107】即ち、図15のステップS1〜S5の処理
は図13と同じであるが、データ復元中にステップS6
でホストコンピュータ5からのリード要求を判別した場
合には、ステップS7で、全リード命令を実行する。ま
たデータ復元中にステップS8でホストコンピュータ5
からのライト要求を判別した場合には、ステップS9
で、全ディスク装置でライト命令を実行する。
【0108】このため、予備ディスク装置へのデータ復
元の対象となったデータディスク装置2−3は、復元終
了までホストコンピュータ5の論理ディスク装置を構成
する有効なディスク装置として扱われることで冗長性が
確保される。更にデータ復元中において、図16のステ
ップS11で、データディスク装置2−3以外のディス
ク装置で障害が発生した場合には、ステップS15で、
新たに障害発生となった障害ディスク装置のデータの予
備ディスク装置4への復元を行った後、一旦中断したデ
ータディスク装置2−3に関する予備ディスク装置4へ
のデータ復元を行う。
【0109】データ復元中にステップS12で予備ディ
スク装置4へのデータ復元の終了が判別されると、ステ
ップS13に進む。ここで初めてデータディスク装置2
−3は故障ディスク装置に設定され、論理ディスク装置
を構成するディスク装置の中から除外される。 9.人的介入を伴う再構成 図2に示した本発明のディスクアレイ装置1にあって
は、何らかに原因により特定のディスク装置で予備ディ
スク装置へのデータ復元が必要となり、予備ディスク装
置4へのデータ復元が終了すると、データ復元の済んだ
予備のディスク装置をホストコンピュータの論理ディス
ク装置を構成するディスク装置に入れ替える再構成が必
要となる。
【0110】即ち、ホストコンピュータ5から見た論理
ディスク装置を構成するディスク装置の中の故障ディス
ク装置を取り外して、データを復元した予備ディスク装
置4に置き替える処理が必要となる。図17のフローチ
ャートにあっては、予備ディスク装置4に対するデータ
復元の終了後の故障ディスク装置との入れ替えを、ユー
ザや保守要員などの人的介入により行うようにしたこと
を特徴とする。
【0111】図17のフローチャートにおいて、まずス
テップS1で、何らかの原因によりデータディスク装置
2−3の予備ディスク装置4に対するデータの復元が必
要なことを受領すると、ステップS2に進み、プロセッ
サ7はアレイ構成テーブル12を参照し、その種別情報
から予備ディスク装置4を選択して、ステップS3で予
備ディスク装置4へのデータ復元を開始する。
【0112】ステップS2のデータ復元開始前のアレイ
構成テーブル12の内容は、例えば図18(B)に示す
ようになる。図18(B)において、アレイ構成テーブ
ル12はディスクアレイ装置1における論理ディスクを
構成する複数のディスク装置をランク番号,ポート番
号,動作状態を示す種別情報で示している。即ち、アレ
イ構成テーブル12内において各ディスク装置は、図1
8(A)に示すように、「aby」で表わされる。この
内、先頭のaはランク番号、次のbはポート番号、最後
のyは装置の動作状態即ち役割を示す種別情報である。
この種別情報はデータディスク装置はD、冗長ディスク
装置はP、予備ディスク装置はH、故障ディスク内は
F、データ復元中ディスク装置はRが使用される。
【0113】図18(B)のデータ復元前のアレイ構成
テーブル12にあっては、ポート番号#0〜#3のディ
スク装置の論理基板は00D〜03Dであり、データデ
ィスク装置2であることが判る。またポート番号#4の
ディスク装置は論理基板04Pとなって、冗長ディスク
装置3となっていることが判る。更にポート番号#5の
ディスク装置は論理基板05Hから、予備ディスク装置
となっていることが判る。
【0114】このような図18(B)に示すデータ復元
前のアレイ構成テーブル12の参照により、ステップS
3で予備ディスク装置4を認識して予備ディスク装置4
へのデータ復元を開始する。予備ディスク装置4へのデ
ータ復元中にあっては、ステップS4でアレイ構成テー
ブル12の内容を更新する。即ち、図18(C)に示す
ように、データ復元を必要とするポート番号#3のデー
タディスク装置2−3の内容を「03F」と故障ディス
ク装置に変更し、データ復元を行っているポート番号#
5の予備ディスク装置4の内容を「05R」として、デ
ータ復元中のディスク装置であることを示すように更新
する。
【0115】ステップS5で予備ディスク装置5へのデ
ータ復元が終了すると、ステップS6で、データ復元終
了に伴うアレイ構成テーブル12の更新を行う。即ち、
図18(D)に示すように、故障ディスク装置となった
ポート番号#3のディスク装置のデータの存在を消去
し、ポート番号#5の予備ディスク装置4については復
元したデータ#03の存在を登録すると共に、「05
D」に更新してデータディスク装置となったことを示
す。
【0116】続いてステップS7で、予備ディスク装置
4へのデータ復元終了をホストコンピュータに通知し、
ホストコンピュータ5側のディスプレイ装置などを使用
して、ユーザまたは保守要員に対し予備ディスク装置を
故障ディスク装置の位置に物理的に差し替える再構成の
作業を促すメッセージ出力などを行う。このホストコン
ピュータ5におけるメッセージ出力を受けてユーザある
いは保守要員は、ステップS8で、故障ディスク装置と
なっているデータディスク装置2−3を取り外し、デー
タ復元の済んだ予備ディスク装置4を故障ディスク装置
の位置に差し替える位置の移動を行う。
【0117】予備ディスク装置4の故障ディスク装置の
位置への移動が済むと、ステップS9で、プロセッサ7
は移動後のアレイ構成テーブル12の更新を図18
(E)に示すように行う。勿論、ディスクアレイ装置1
から取り外された故障ディスク装置は点検修理が行われ
ることになる。また、空きとなった予備ディスク装置4
の位置には別の正常なディスク装置あるいは処理が済ん
だ故障ディスク装置が実装されることになる。 10.人的介入を伴わない再構成 図19は何らかに原因によりデータ復元が必要と判断さ
れて、予備ディスク装置へのデータ復元が済んだ後の人
的な介入によるディスク装置の移動を必要としない再構
成処理を示している。
【0118】図19にあっては、ステップS1で、何ら
かの原因により例えばデータディスク装置2−3のデー
タ復元が必要となった場合の処理を示している。この場
合、ステップS2でまず復元前のアレイ構成テーブル1
2をプロセッサ7が参照する。この場合のアレイ構成テ
ーブル12は、例えば図20(B)に示す内容を有す
る。図20(B)において、アレイ構成テーブル12上
で各ディスク装置は「aby,a´b´」で表わされ
る。先頭の「a,b」は物理的な位置を示すランク番号
aとポート番号bである。次のyはデータディスクD,
冗長ディスクP,予備ディスクH,故障ディスクF,デ
ータ復元中ディスクRとなる動作状態を示す種別情報で
ある。最後の「a´,b´」は論理的な位置を示すラン
ク番号a´とポート番号b´である。
【0119】このことから、図20(B)のデータ復元
前のアレイ構成テーブル12にあっては、ランク番号#
0に属する6台のディスク装置について、ポート番号#
0〜#3のディスク装置については「00D00」〜
「03D03」が登録され、またポート番号#4のディ
スク装置については「04P04」が登録され、更にポ
ート番号#5のディスク装置については「05H」が登
録されており、前半の物理的な位置と後半の論理的な位
置の値は共に等しく、物理的な位置と論理的な位置が1
対1に対応している。
【0120】このようなアレイ構成テーブル12をもつ
各ディスク装置につき、ステップS3で予備ディスク装
置4に対するデータ復元が必要となったデータディスク
装置2−3のデータの復元処理を開始する。データ復元
中にあっては、ステップS4でアレイ構成テーブルの更
新を行う。この場合のアレイ構成テーブル12は、図2
0(C)に示すように、データ復元が必要となったポー
ト番号#3のディスク装置2−3の登録内容を「03F
03」として故障ディスク装置に設定し、またポート番
号#5のディスク装置を「05R05」としてデータ復
元中のディスク装置であることを示す。
【0121】ステップS5で予備ディスク装置4へのデ
ータ復元が終了すると、ステップS6で予備ディスク装
置4の論理的な位置の移動を行い、ステップS7で、こ
の論理的な位置移動に伴うアレイ構成テーブル12の更
新を行う。即ち、図20(D)に示すように、ポート番
号#5のデータ復元が済んだ予備ディスク装置4につい
て「05D02」に更新し、ポート番号#3の故障ディ
スク装置のもっていた論理的な位置を示す番号「03」
に変更する。
【0122】このため、それ以降のホストコンピュータ
5からのリード要求およびライト要求については、ポー
ト番号#5に接続されているデータ復元の済んだ予備デ
ィスク装置4が論理的な位置「02」をもつデータディ
スク装置として扱われる。また故障ディスク装置となっ
たポート番号#3のデータディスク装置2−3は論理的
な位置から除外され、故障ディスク装置を取り外し、新
たに正常なディスク装置を実装した際、アレイ構成テー
ブル12のポート番号#3の位置に予備ディスク装置と
しての「03H05」の登録が行われ、異なった物理的
な位置で予備ディスク装置4として機能するようにな
る。
【0123】勿論、図19によってはステップS7でデ
ータ復元終了後のアレイ構成テーブルの更新が済むと、
ステップS8でデータ復元終了をホストコンピュータ5
に通知し、通常のホストコンピュータ5からのコマンド
要求に基づく入出力処理に戻る。尚、上記の各実施例に
あっては、ディスクアレイ装置1のプロセッサ7におい
て配下のディスク装置でデータ復元が必要なことを認識
した場合の予備ディスク装置に対するデータ復元の起動
を行っているが、ディスクアレイ装置1からホストコン
ピュータ5に対しデータ復元が必要なディスク装置が認
識されたことを通知し、ホストコンピュータ5からのコ
マンドにより予備ディスク装置4に対するデータ復元を
開始するようにしてもよい。
【0124】この処理は例えば図5のフローチャートの
ステップS23からS24の処理に移行する部分に示す
ように上位装置から行われる。この点は、図7、図9、
図10、図11、図13、図15、図17及び図19の
フローチャートについても同様である。このように予備
ディスク装置4に対するデータの復元をホストコンピュ
ータ5側で管理することで、ディスクアレイ装置1側の
処理負担を軽減すると同時に、ディスクアレイ装置1に
対する入出力要求の空き時間を効率的に利用した予備デ
ィスク装置4へのデータ復元処理を可能とする。
【0125】また本発明は1ランクに6台のディスク装
置を設けた場合を例にとっているが、ランク数および1
ランク当りのディスク装置の台数は必要に応じて適宜に
定めることができる。また1ランクに設ける予備ディス
ク装置を1台としているが、複数台設けてもよい。また
1ランクに1台、予備ディスク装置を設けず、複数ラン
ク当り1台の予備ディスク装置を設けてもよい。
【0126】更にまた、上記の実施例はホストブロック
データをビットまたはバイト単位に分配結合して、ポー
トに並列接続された複数のディスク装置を並列動作し、
またパリティデータを格納するディスク装置を特定ポー
トに固定したRAID3のディスクアレイ制御形態を例
にとっているが、セクタ単位にデータのリード,ライト
を行い、セクタごとにパリティデータを格納するディス
ク位置が変化するRAID5のディスクアレイ制御形態
についても、例えばパリティグループを構成する全ディ
スク装置に対しセクタデータを並列的に読み書きするよ
うな場合については、そのまま適用することができる。
【0127】
【発明の効果】以上説明してきたように本発明によれ
ば、次の効果が得られる。まずタイマによりリード動作
実行時のデータ到達時間を監視し、パリティグループの
中の1台のディスク装置からのデータ転送が遅れた場合
には、既に得られているデータおよびパリティデータか
らデータを復元して上位装置に返送することで、上位装
置に対する転送速度を向上できる。
【0128】また訂正不可能なデータブロックについ
て、同一パリティグループに属する他のディスク装置の
データから訂正不可能なデータを復元して交代領域に割
り付けるため、訂正ブロックを検出したディスク装置を
故障ディスク装置として扱わなくてもよく、ディスク装
置の信頼性を向上することができる。更に、交代領域が
全て使い尽くされたり残り数が少なくなったディスク装
置のデータを予備ディスク装置に復元して故障ディスク
装置として扱うことで、交代領域のアクセスに伴う応答
時間の遅れを防止し、ディスクアレイ装置の処理性能を
維持することができる。
【0129】更にまた、同期回転を維持できなくなった
ディスク装置についても、予備ディスク装置にデータを
復元して故障ディスク装置として扱うことで、同期回転
が維持できなくなった装置が論理ディスク装置を構成す
るディスク装置の中に存在することで処理性能が低下し
てしまうことを防止できる。
【0130】更にまた、同一トラックまたは同一シリン
ダの交代領域ブロック数が所定値を越えた場合に、予備
ディスク装置にデータを復元して故障ディスク装置とし
て扱うことで、交代領域が複数トラックや複数シリンダ
位置に及ぶことによるアクセス性能の低下を防止でき
る。更にまた、ディスク装置のエラー回数が閾値に達し
たときに予備ディスク装置へのデータ復元を行って故障
ディスク装置として扱うことで、故障の危険性の高いデ
ィスク装置を論理ディスク装置を構成するディスク装置
の中から除外し、信頼性を向上できる。
【0131】一方、何らかの原因によりデータ復元が必
要となって、予備ディスク装置に対するデータ復元が終
了した後の予備ディスク装置の故障ディスク装置との置
き替えについて、置き替えを促すメッセージ出力を自動
的に行うことで、物理的な移動を伴う人的な再構成を確
実にできる。更に、予備ディスク装置の論理的な位置を
アレイ構成テーブル上で書き替えるだけで、物理的な故
障ディスク装置と予備ディスク装置の移動を必要とする
ことなく簡単にディスクアレイの再構成が実現できる。
【0132】
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明のハードウェア構成と機能を示した実施
例構成図
【図3】タイマ監視によるデータ復元処理を示したフロ
ーチャート
【図4】データ復元を伴う交代割付処理を示したフロー
チャト
【図5】交代領域オーバフローに伴う予備へのデータ復
元処理を示したフローチャート
【図6】図5の続きを示したフローチャート
【図7】交代領域オーバフローの予測に基づくデータ復
元処理を示したフローチャート
【図8】図8の続きを示したフローチャート
【図9】同期回転異常時の予備へのデータ復元処理を示
したフローチャート
【図10】同期回転異常時の予備へのデータ復元処理の
他の実施例を示したフローチャート
【図11】障害発生の予測と予備へのデータ復元処理を
示したフローチャート
【図12】図11の続きを示したフローチャート
【図13】同一トラック又はシリンダ内の交代ブロック
数が増加した場合の予備へのデータ復元処理を示したフ
ローチャート
【図14】図13の続きを示したフローチャート
【図15】同一トラック又はシリンダ内の交代ブロック
数が増加した場合の予備へのデータ復元処理の他の実施
例を示したフローチャート
【図16】図15の続きを示したフローチャート
【図17】人的介入により物理的なディスク装置の移動
を伴う再構成処理を示したフローチャート
【図18】図17の処理で更新されるアレイ構成テーブ
ルの内容を示した説明図
【図19】人的介入により物理的なディスク装置の移動
を必要としない再構成処理を示したフローチャート
【図20】図19の処理で更新されるアレイ構成テーブ
ルの内容を示した説明図
【図21】従来装置の説明図
【0133】
【符号の説明】
1:ディスクアレイ装置 2,2−0〜2−3:データディスク装置 3:冗長ディスク装置 4:予備ディスク装置 5:上位装置(ホストコンピュータ) 6:アレイコントローラ部 7:プロセッサ(制御手段) 8:分配結合器 9:タイマ(タイマ手段) 10:エラー統計テーブル 11:交代ブロックテーブル 12:アレイ構成テーブル 13:閾値設定テーブル

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】複数のデータディスク装置(2)、少なく
    とも1台の冗長ディスク装置(3)及び予備ディスク装
    置(4)を備えたディスクアレイ装置に於いて、 配下の各データディスク装置(2)からのデータ到着時
    間を監視するタイマ手段(9)と、 該タイマ手段(9)で監視しているデータ到着時間が所
    定時間を越えて遅延した場合に、遅延したディスク装置
    のデータを残りのディスク装置から復元する制御手段
    (7)と、を設けたことを特徴とするディスクアレイ装
    置。
  2. 【請求項2】請求項1記載のディスクアレイ装置におい
    て、前記制御手段(7)は、配下の各データディスク装
    置(2)で訂正不可能なデータブロックが検出された場
    合に、訂正不可能となったデータを残りのディスク装置
    から復元し訂正不可能なデータブロックを検出したディ
    スク装置の交代領域に割り付けることを特徴とするディ
    スクアレイ装置。
  3. 【請求項3】請求項1記載のディスクアレイ装置におい
    て、前記制御手段(7)は、配下のデータディスク装置
    (2)及び冗長ディスク装置(3)のいずれかで交代領
    域のブロックが全て使用された場合に、該ディスク装置
    のデータを予備ディスク装置(4)に復元すると共に、
    予備ディスク装置(4)に対する復元終了まで又は復元
    中に再度交代割付処理が要求されるまで、当該ディスク
    装置を論理ディスク装置の構成要素として上位装置
    (5)からの入出力要求を処理することを特徴とするデ
    ィスクアレイ装置。
  4. 【請求項4】請求項1記載のディスクアレイ装置におい
    て、前記制御手段(7)は、配下のデータディスク装置
    (2)及び冗長ディスク装置(3)のいずれかで使用可
    能な交代領域内ブロック数が閾値まで減少した場合に、
    該ディスク装置のデータを予備ディスク装置(4)に復
    元すると共に、データ復元終了まで又は復元中に再度交
    代割付処理が要求されるまで又は交代ブロックが全て使
    用されるまで、当該ディスク装置を論理ディスク装置の
    構成要素として前記上位装置(5)からの入出力要求を
    処理することを特徴とするディスクアレイ装置。
  5. 【請求項5】請求項1記載のディスクアレイ装置におい
    て、前記制御手段(7)は、回転同期制御を行っている
    配下のデータディスク装置(2)及び冗長ディスク装置
    (3)のいずれかの同期回転異常を検出した場合に、該
    ディスク装置のデータを予備ディスク装置(4)に復元
    すると共に、データ復元終了まで又は復元中にライト命
    令を受けるまで、当該ディスク装置を論理ディスク装置
    の構成用として前記上位装置(5)からの入出力要求を
    処理することを特徴とするディスクアレイ装置。
  6. 【請求項6】請求項1記載のディスクアレイ装置におい
    て、前記制御手段(7)は、回転同期制御を行っている
    配下のデータディスク装置(2)及び冗長ディスク装置
    (3)のいずれかの同期回転異常を検出した場合に、該
    ディスク装置のデータを予備ディスク装置(4)に復元
    すると共に、データ復元終了まで当該ディスク装置を論
    理ディスク装置の構成要素として処理し、更に、データ
    復元中に上位装置(5)よりライト命令を受けた場合に
    も、回転同期を維持することのできなくなったディスク
    装置を論理ディスク装置の構成要素として前記上位装置
    (5)からのライト動作を行わせることを特徴とするデ
    ィスクアレイ装置。
  7. 【請求項7】請求項1記載のディスクアレイ装置におい
    て、前記制御手段(7)は、配下の各ディスク装置のエ
    ラー回数とその頻度を管理するエラー統計テーブル(1
    0)を有し、該エラー統計テーブル(10)を参照して
    故障の危険性の高いディスク装置を認識することを特徴
    とするディスクアレイ装置。
  8. 【請求項8】請求項7記載のディスクアレイ装置におい
    て、前記制御手段(7)は、前記エラー統計テーブル
    (10)を参照して故障の危険性の高いディスク装置を
    認識した場合に、故障する以前に該ディスク装置のデー
    タを先行して前記予備ディスク装置(4)に復元すると
    共に、データ復元終了まで当該ディスク装置を論理ディ
    スク装置の構成要素として前記上位装置(5)からの入
    出力要求を処理することを特徴とするディスクアレイ装
    置。
  9. 【請求項9】請求項1記載のディスクアレイ装置におい
    て、前記制御手段(7)は、該ディスク装置のデータを
    予備ディスク装置(4)に復元すると共に、データ復元
    終了まで又はデータ復元中に前記上位装置(5)から交
    代ブロック領域のデータブロックに対するライト命令を
    受けるまで、当該ディスク装置を論理ディスク装置の構
    成要素として前記上位装置(5)からの入出力要求を処
    理することを特徴とするディスクアレイ装置。
  10. 【請求項10】請求項1記載のディスクアレイ装置にお
    いて、前記制御手段(7)は、回転同期制御を行ってい
    る配下の各ディスク装置の同一トラック又は同一シリン
    ダ位置に設けた交代領域の使用済みブロック数を管理す
    る交代ブロックテーブル(11)を有し、前記交代ブロ
    ックテーブル(11)で管理される交代ブロック数が閾
    値を越え交代領域割付けのシーク動作に伴いデータ到達
    が遅延するディスク装置を認識した場合、該ディスク装
    置のデータを予備ディスク装置(4)に復元すると共
    に、データ復元終了まで当該ディスク装置を論理ディス
    ク装置の構成要素として前記上位装置(5)からの入出
    力要求を処理することを特徴とするディスクアレイ装
    置。
  11. 【請求項11】請求項1記載のディスクアレイ装置にお
    いて、前記制御手段(7)は、配下の各ディスク装置の
    固有情報、動作状態、物理的な設置位置を管理するアレ
    イ構成テーブル(12)を有し、前記アレイ構成テーブ
    ル(12)を参照して配下のディスク装置のデータが予
    備ディスク装置(4)に復元されていることを認識した
    場合に、前記予備ディスク装置(4)と故障ディスク装
    置との物理的位置を交換移動を促すメッセージを外部に
    出力して再構成させることを特徴とするディスクアレイ
    装置。
  12. 【請求項12】請求項1記載のディスクアレイ装置にお
    いて、前記制御手段(7)は、配下の各ディスク装置の
    固有情報、動作状態、物理的な設置位置を管理するアレ
    イ構成テーブル(12)を有し、前記アレイ構成テーブ
    ル(12)を参照して配下のディスク装置のデータが予
    備ディスク装置(4)に復元されていることを認識した
    場合に、前記予備ディスク装置(4)を故障ディスク装
    置との論理的位置を移動させ、物理的に移動することな
    く再構成させることを特徴とするディスクアレイ装置。
  13. 【請求項13】請求項1記載のディスクアレイ装置にお
    いて、前記制御手段(7)は、前記上位装置(5)から
    の命令で、データディクス装置(2)及び冗長ディスク
    装置(3)のデータを前記予備ディスク装置(4)に復
    元させることを特徴とするディスクアレイ装置。
JP00072294A 1994-01-10 1994-01-10 ディスクアレイ装置 Expired - Fee Related JP3681766B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00072294A JP3681766B2 (ja) 1994-01-10 1994-01-10 ディスクアレイ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00072294A JP3681766B2 (ja) 1994-01-10 1994-01-10 ディスクアレイ装置

Publications (2)

Publication Number Publication Date
JPH07200191A true JPH07200191A (ja) 1995-08-04
JP3681766B2 JP3681766B2 (ja) 2005-08-10

Family

ID=11481645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00072294A Expired - Fee Related JP3681766B2 (ja) 1994-01-10 1994-01-10 ディスクアレイ装置

Country Status (1)

Country Link
JP (1) JP3681766B2 (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996032673A1 (fr) * 1995-04-09 1996-10-17 Sony Corporation Dispositif et procede de reproduction de signaux d'information
US6374269B1 (en) 1998-01-26 2002-04-16 Hitachi, Ltd. Storage sub-system having expanded data read
US6434711B1 (en) 1998-06-12 2002-08-13 Nec Corporation Disk array apparatus that avoids premature declarations of faults
US6539461B2 (en) 1998-03-24 2003-03-25 Hitachi, Ltd. Data saving method and external storage device
US6643734B2 (en) 1998-03-10 2003-11-04 Nec Corporation Control device and control method for a disk array
US7210011B2 (en) 2002-11-27 2007-04-24 Hitachi, Ltd. Information processing system, storage system, storage device controller and program that enable facilitating the recovery work of remote copying
JP2008040713A (ja) * 2006-08-04 2008-02-21 Hitachi Ltd 記憶媒体グループの故障を抑えるストレージシステム
JP2008134830A (ja) * 2006-11-28 2008-06-12 Hitachi Ltd 節電機能と診断機能の両方を備えたストレージシステム
JP2008171231A (ja) * 2007-01-12 2008-07-24 Fujitsu Ltd アレイディスク群の保守管理システム、アレイディスク群の保守管理装置、アレイディスク群の保守管理方法およびアレイディスク群の保守管理プログラム
JP2008217811A (ja) * 2008-04-03 2008-09-18 Hitachi Ltd 不揮発メモリを使用したディスク制御装置
US7496696B2 (en) 2006-03-10 2009-02-24 International Business Machines Corporation Method and apparatus for evaluating performance on host data transfer within a tape drive
US7529965B2 (en) 2004-11-10 2009-05-05 Fujitsu Limited Program, storage control method, and storage system
JP2009116896A (ja) * 2009-01-13 2009-05-28 Fujitsu Ltd プログラム、記憶制御方法及び記憶制御装置
US7757042B2 (en) 2003-09-26 2010-07-13 Hitachi, Ltd. Array-type disk apparatus preventing lost data and providing improved failure tolerance
US7779202B2 (en) 2005-04-15 2010-08-17 Kabushiki Kaisha Toshiba Apparatus and method for controlling disk array with redundancy and error counting
JP2010191762A (ja) * 2009-02-19 2010-09-02 Nec Corp ディスクアレイ装置及びリアサイン方法
WO2010116514A1 (ja) * 2009-04-09 2010-10-14 富士通株式会社 Raid制御装置
JP2012103853A (ja) * 2010-11-09 2012-05-31 Hitachi Ltd ディスクアレイ装置のエラー制御方法
JP2013041443A (ja) * 2011-08-17 2013-02-28 Fujitsu Ltd ストレージシステム、ストレージ制御装置およびストレージ制御方法
US8433882B2 (en) 2008-10-29 2013-04-30 Kabushiki Kaisha Toshiba Disk array control device and storage device
JP2013539134A (ja) * 2010-10-01 2013-10-17 ピュア・ストレージ・インコーポレイテッド 動的構成のraidアレイにおける再構成読み込み

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996032673A1 (fr) * 1995-04-09 1996-10-17 Sony Corporation Dispositif et procede de reproduction de signaux d'information
US5809206A (en) * 1995-04-09 1998-09-15 Sony Corporation Information signal reproducing apparatus and information signal reproducing method
US7337200B2 (en) 1998-01-26 2008-02-26 Hitachi, Ltd. Storage sub-system having expanded data read
US6954769B2 (en) 1998-01-26 2005-10-11 Hitachi, Ltd. Storage sub-system having expanded data read
US6374269B1 (en) 1998-01-26 2002-04-16 Hitachi, Ltd. Storage sub-system having expanded data read
US6611851B2 (en) 1998-01-26 2003-08-26 Hitachi, Ltd. Storage sub-system having expanded data read
US6643734B2 (en) 1998-03-10 2003-11-04 Nec Corporation Control device and control method for a disk array
US6772306B2 (en) 1998-03-24 2004-08-03 Hitachi, Ltd. Data saving method and external storage device
US7020756B2 (en) 1998-03-24 2006-03-28 Hitachi, Ltd. Data saving method and external storage device
US6539461B2 (en) 1998-03-24 2003-03-25 Hitachi, Ltd. Data saving method and external storage device
US6434711B1 (en) 1998-06-12 2002-08-13 Nec Corporation Disk array apparatus that avoids premature declarations of faults
US7210011B2 (en) 2002-11-27 2007-04-24 Hitachi, Ltd. Information processing system, storage system, storage device controller and program that enable facilitating the recovery work of remote copying
US7913039B2 (en) 2003-09-26 2011-03-22 Hitachi, Ltd. Array-type disk apparatus preventing data lost and providing improved failure tolerance
US7757042B2 (en) 2003-09-26 2010-07-13 Hitachi, Ltd. Array-type disk apparatus preventing lost data and providing improved failure tolerance
US7529965B2 (en) 2004-11-10 2009-05-05 Fujitsu Limited Program, storage control method, and storage system
US7779202B2 (en) 2005-04-15 2010-08-17 Kabushiki Kaisha Toshiba Apparatus and method for controlling disk array with redundancy and error counting
US7496696B2 (en) 2006-03-10 2009-02-24 International Business Machines Corporation Method and apparatus for evaluating performance on host data transfer within a tape drive
JP2008040713A (ja) * 2006-08-04 2008-02-21 Hitachi Ltd 記憶媒体グループの故障を抑えるストレージシステム
JP2008134830A (ja) * 2006-11-28 2008-06-12 Hitachi Ltd 節電機能と診断機能の両方を備えたストレージシステム
US8219748B2 (en) 2006-11-28 2012-07-10 Hitachi, Ltd. Storage system comprising both power saving and diagnostic functions
JP2008171231A (ja) * 2007-01-12 2008-07-24 Fujitsu Ltd アレイディスク群の保守管理システム、アレイディスク群の保守管理装置、アレイディスク群の保守管理方法およびアレイディスク群の保守管理プログラム
JP2008217811A (ja) * 2008-04-03 2008-09-18 Hitachi Ltd 不揮発メモリを使用したディスク制御装置
US8433882B2 (en) 2008-10-29 2013-04-30 Kabushiki Kaisha Toshiba Disk array control device and storage device
JP2009116896A (ja) * 2009-01-13 2009-05-28 Fujitsu Ltd プログラム、記憶制御方法及び記憶制御装置
JP2010191762A (ja) * 2009-02-19 2010-09-02 Nec Corp ディスクアレイ装置及びリアサイン方法
WO2010116514A1 (ja) * 2009-04-09 2010-10-14 富士通株式会社 Raid制御装置
JP2013539134A (ja) * 2010-10-01 2013-10-17 ピュア・ストレージ・インコーポレイテッド 動的構成のraidアレイにおける再構成読み込み
US9229808B2 (en) 2010-10-01 2016-01-05 Pure Storage, Inc. Reconstruct reads in a raid array with dynamic geometries
USRE48222E1 (en) 2010-10-01 2020-09-22 Pure Storage, Inc. Reconstruct reads in a raid array with dynamic geometries
JP2012103853A (ja) * 2010-11-09 2012-05-31 Hitachi Ltd ディスクアレイ装置のエラー制御方法
JP2013041443A (ja) * 2011-08-17 2013-02-28 Fujitsu Ltd ストレージシステム、ストレージ制御装置およびストレージ制御方法
US9047219B2 (en) 2011-08-17 2015-06-02 Fujitsu Limited Storage system, storage control device, and storage control method

Also Published As

Publication number Publication date
JP3681766B2 (ja) 2005-08-10

Similar Documents

Publication Publication Date Title
JP3681766B2 (ja) ディスクアレイ装置
JP3078972B2 (ja) ディスクアレイ装置
JP3732869B2 (ja) 外部記憶装置
US7185222B2 (en) Apparatus, system, and method for maintaining data in a storage array
JP2501752B2 (ja) コンピユ―タ・システムのストレ―ジ装置及びデ―タのストア方法
US5579474A (en) Disk array system and its control method
US7600152B2 (en) Configuring cache memory from a storage controller
KR100275900B1 (ko) 알에이아이디 서브시스템에 있어서 분할패러티 예비 디스크 구현방법
US6006342A (en) Failover and failback system for a direct access storage device
US5596709A (en) Method and apparatus for recovering parity protected data
US7913039B2 (en) Array-type disk apparatus preventing data lost and providing improved failure tolerance
US6442711B1 (en) System and method for avoiding storage failures in a storage array system
JP4303187B2 (ja) プログラム、記憶制御方法及び記憶装置
US7457916B2 (en) Storage system, management server, and method of managing application thereof
JP5887757B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
JP3184171B2 (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
KR20020025759A (ko) 디스크 어레이 장치, 그 장치에 대한 에러 제어 방법, 및그 방법에 대한 제어 프로그램
JPH09146842A (ja) 記憶サブシステム
JP2005301419A (ja) ディスクアレイ装置およびそのデータ処理方法
US6957301B2 (en) System and method for detecting data integrity problems on a data storage device
JPH09269871A (ja) ディスクアレイ装置におけるデータ再冗長化方式
JPH1195933A (ja) ディスクアレイ装置
CN111240903A (zh) 数据恢复方法及相关设备
JP2006114064A (ja) 記憶サブシステム
JP3155836B2 (ja) ディスクアレイ装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040618

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040921

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041119

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050519

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080527

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090527

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090527

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100527

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees