JPH10247134A - 直結バス用ディスクアレイ装置の障害処理回路 - Google Patents

直結バス用ディスクアレイ装置の障害処理回路

Info

Publication number
JPH10247134A
JPH10247134A JP9049523A JP4952397A JPH10247134A JP H10247134 A JPH10247134 A JP H10247134A JP 9049523 A JP9049523 A JP 9049523A JP 4952397 A JP4952397 A JP 4952397A JP H10247134 A JPH10247134 A JP H10247134A
Authority
JP
Japan
Prior art keywords
data disk
disk
data
fault
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9049523A
Other languages
English (en)
Inventor
Yoshio Shimizu
義雄 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9049523A priority Critical patent/JPH10247134A/ja
Publication of JPH10247134A publication Critical patent/JPH10247134A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 寿命となったデータディスク装置を予防的に
交換して自動復旧することが可能な直結バス用ディスク
アレイ装置の障害処理回路を提供する。 【解決手段】 装置状態監視手段5はディスクI/F制
御装置13,14とディスクアレイ制御装置11と装置
状態監視装置12とを介して通知されるデータディスク
装置6a−1〜6a−3,6b−1〜6b−3及び予備
データディスク装置6a−n,6b−n、ディスクI/
F、もしくはディスクI/F制御装置13,14の障害
発生、電源装置7a,7b及びファン機構8a,8bの
障害発生を累計して障害情報記憶手段5aに記録する。
障害ディスク復旧制御手段3は障害内容毎の発生回数が
設定したしきい値を越えた時の装置状態監視手段5から
の交換指示に応じて、交換対象のデータディスク装置を
予備データディスク装置6a−n,6b−nと交換し、
交換したデータディスク装置のデータを修復する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はディスクアレイ装置
の障害処理回路に関し、特にコンピュータシステム上の
メインバスに直結して接続される直結バス用ディスクア
レイ装置内の各データディスク装置の監視及び復旧に関
する。
【0002】
【従来の技術】一般のコンピュータシステムで行われる
業務では、補助記憶装置にデータを記録保存しており、
必要な時にそのデータを抽出したり、抽出したデータを
もとにデータを加工し、そのデータをまた補助記憶装置
に書込んでいる。
【0003】このため、コンピュータシステムで行われ
る業務ではデータが不可欠なものであり、年々増加する
データを記録するために大容量の補助記憶装置が必要と
なってきている。また、最近では大容量システムに加え
て、コンピュータシステムを24時間運転するためにフ
ォールトトレラントの要求、つまり故障が発生しても停
止することなく、動作を続行させるための要求も強くな
っている。その要求に応えるべく、近年、複数台のデー
タディスク装置を論理的に1台のデータディスク装置と
して使用するディスクアレイ装置システムが各分野で使
用されている。
【0004】従来、ディスクアレイ装置内の1つのデー
タディスク装置が使用不可能となるような障害を検出す
ると、そのデータディスク装置を交換し、ディスクアレ
イ装置の特徴であるデータの自動復元機能を使用して通
常の業務運用中にデータを修復しているが、ハードウェ
アを管理するオペレーティングシステムからはその障害
内容が見えず、データディスク装置の寿命を管理するこ
とができない。
【0005】上記のようなディスクアレイ装置におい
て、コンピュータシステムの電源を遮断することなく、
通常業務運用中に障害発生データディスク装置を交換し
てデータを修復する技術が、特開平7−152495号
公報に開示されている。
【0006】この公報記載のディスクアレイ装置では、
複数のデータディスク装置及びパリティディスク装置か
らなるディスクアレイ装置と、ディスクアレイ装置を制
御するディスクアレイ制御装置と、データディスク装置
の障害情報を統計情報として記録する障害情報統計手段
と、統計情報を保持する統計情報保持手段と、データデ
ィスク装置の状態を監視して障害の発生しているデータ
ディスク装置を通知する装置状態監視手段と、障害の発
生しているデータディスク装置の交換指示やデータ修復
の各処理手順を制御する障害ディスク復旧制御手段とか
ら構成されている。
【0007】
【発明が解決しようとする課題】上述した従来のディス
クアレイ装置では、ディスクアレイ装置がオペレーティ
ングシステムから1つの論理的なデータディスク装置と
して認識されており、ディスクアレイ装置内の個々のデ
ータディスク装置の動作内容や障害内容を見ることがで
きないので、それらをオペレーティングシステムが認識
することができない。
【0008】したがって、従来のディスクアレイ装置で
は装置内の物理的なデータディスク装置個々に発生する
障害内容をオペレーティングシステムが認識ができない
ので、寿命となったデータディスク装置を予防的に交換
して自動復旧することができない。
【0009】これに対し、上記の公報記載のディスクア
レイ装置では、データディスク装置の障害情報を統計情
報として記録しているので、寿命となったデータディス
ク装置を予防的に交換して自動復旧することが可能とな
る。
【0010】このディスクアレイ装置はオペレーティン
グシステムを内蔵する装置外に設置されて接続され、い
わゆる外付けの外部記憶装置として用いられれており、
ディスクアレイ装置を構成する個々のデータディスク装
置の交換を容易に行えるようになっている。
【0011】これに対し、システム内に内蔵されかつシ
ステム内のメインバスに直結される複数のデータディス
ク装置からなる直結バス用ディスクアレイ装置は本体装
置内に内蔵されているので、個々のデータディスク装置
の交換が容易ではない。したがって、直結バス用ディス
クアレイ装置に上記の公報記載の方法を用いても、寿命
となったデータディスク装置を予防的に交換して自動復
旧することが難しい。場合によっては、データディスク
装置が寿命となる毎にシステムの電源を遮断し、そのデ
ータディスク装置を交換しなければならない状態となる
ことも予想される。
【0012】そこで、本発明の目的は上記の問題点を解
消し、寿命となったデータディスク装置を予防的に交換
して自動復旧することが可能な直結バス用ディスクアレ
イ装置の障害処理回路を提供することにある。
【0013】
【課題を解決するための手段】本発明による直結バス用
ディスクアレイ装置の障害処理回路は、システム内に内
蔵されかつ前記システム内のメインバスに直結される複
数のデータディスク装置からなる論理ディスク装置にお
ける障害発生を監視し、障害の発生したデータディスク
装置を復旧する手段を含む直結バス用ディスクアレイ装
置の障害処理回路であって、前記複数のデータディスク
装置各々に電源を供給する電源供給手段と、前記複数の
データディスク装置各々の動作状態を監視して前記複数
のデータディスク装置各々の障害を検出する障害検出手
段と、前記障害検出手段で検出された障害情報を前記複
数のデータディスク装置各々毎に累計して統計情報とし
て記憶する記憶手段と、前記記憶手段に記憶された前記
障害情報の累計結果が予め設定された所定値を越えたか
否かを判定する判定手段と、前記判定手段で前記障害情
報の累計結果が前記所定値を越えたと判定されたデータ
ディスク装置を交換対象装置として通知する通知手段
と、前記通知手段によって前記交換対象装置として通知
されたデータディスク装置を前記システムから切離す手
段と、前記通知手段によって前記交換対象装置として通
知されたデータディスク装置に対する前記電源供給手段
からの電源の供給を断とする手段と、前記判定手段で前
記障害情報の累計結果が前記所定値を越えたと判定され
るデータディスク装置の代替用の予備データディスク装
置と、前記システムから切離されるデータディスク装置
を前記予備データディスク装置で代替する手段とを備え
ている。
【0014】すなわち、本発明の直結バス用ディスクア
レイ装置の監視機能は、装置内のメインバスに直結され
る複数のデータディスク装置と、複数のデータディスク
装置各々に電源を供給する電源装置と、複数のデータデ
ィスク装置各々を冷却するファン機構(FAN)と、配
下の複数のデータディスク装置を制御するディスクI/
F(インタフェース)制御装置と、配下のディスクI/
F制御装置を制御するディスクアレイ制御装置と、電源
装置及びファン機構各々を制御する電源装置/FAN制
御装置と、複数のデータディスク装置各々と電源装置と
ファン機構とにおける動作状態等を監視する装置状態監
視装置とから構成されている。
【0015】また、ディスクアレイ制御装置を制御する
ディスクアレイ制御手段と、データディスク装置の動作
状態を監視して障害を検出しかつその障害情報を統計的
に記憶手段に記憶させる装置状態監視手段と、障害の発
生したデータディスク装置を復旧するための処理制御を
行う障害ディスク復旧制御手段とを備え、コンピュータ
システムの電源を遮断することなく、障害が多発するデ
ータディスク装置を予備データディスク装置に予防交換
してデータを修復する。
【0016】また、装置状態監視手段は事前にデータデ
ィスク装置の障害内容及びその障害内容毎の発生回数を
設定し、各データディスク装置が稼働中に発生した障害
情報を記録し、その記録内容が設定した障害内容毎のし
きい値(障害内容毎の発生回数)を越えるとデータディ
スク装置の交換指示を発行する。
【0017】コンピュータシステムの稼働前に、装置状
態監視手段にディスクアレイシステム配下のデータディ
スク装置の障害内容と障害内容毎の発生回数とを設定す
る。装置状態監視手段はコンピュータシステムの稼働中
に装置状態監視装置を介してディスクアレイ装置内の各
データディスク装置にて発生した障害内容及び障害内容
毎の発生回数を記録し、その発生回数が事前に設定され
ているその障害内容のしきい値を越えた時、交換用の予
備データディスク装置を用いて障害発生データディスク
装置の自動交換及び復旧するとともに、障害発生データ
ディスク装置の自動切離しを行い、オペレーティングシ
ステムを介して警報を上げる。この時、記録された各デ
ータディスク装置の障害内容を分析することで、障害に
対する対策を講じることも可能となる。
【0018】
【発明の実施の形態】次に、本発明の一実施例について
図面を参照して説明する。図1は本発明の一実施例の構
成を示すブロック図である。図において、本発明の一実
施例による直結バス用ディスクアレイ装置は直結バス用
ディスクアレイ制御装置1と、複数のデータディスク装
置6a−1〜6a−n,6b−1〜6b−nと、電源装
置7a,7bと、ファン機構8a,8bとから構成され
ている。ここで、データディスク装置6a−n,6b−
nは予め予備データディスク装置として配置されてお
り、電源装置7a,7bは図示せぬ複数の電源を備えて
いる。また、ファン機構8a,8bも図示していない
が、データディスク装置6a−1〜6a−n,6b−1
〜6b−nのうち少なくとも複数台毎に1台ずつ配設さ
れているものとする。
【0019】直結バス用ディスクアレイ制御装置1はデ
ィスクアレイ制御装置11と、装置状態監視装置12
と、ディスクI/F制御装置13,14と、電源装置/
FAN制御装置15とから構成されている。
【0020】また、直結バス用ディスクアレイ制御装置
1にはディスクアレイ制御装置11を制御するディスク
アレイ制御手段4と、装置状態監視装置12を制御する
装置状態監視手段5と、障害情報を統計情報として記憶
する障害情報記憶手段5aと、障害発生のデータディス
ク装置に対する交換指示やデータ修復の各処理手順を制
御する障害ディスク復旧制御手段3とから構成されてい
る。
【0021】図2は図1の直結バス用ディスクアレイ装
置の構成を示すブロック図である。図において、直結バ
ス用ディスクアレイ装置は夫々複数のデータディスク装
置6a−1〜6a−(n−1),6b−1〜6b−(n
−1)[データディスク装置6a−4〜6a−(n−
1),6b−4〜6b−(n−1)は図示せず]及び予
備データディスク装置6a−n,6b−nからなりかつ
1つのディスク装置として認識される論理ディスク6
a,6bから構成されている。これら論理ディスク6
a,6bは直結バス用ディスクアレイ制御装置1ととも
に本体装置9内に内蔵されている。
【0022】以下、図1及び図2を用いて本発明の一実
施例による直結バス用ディスクアレイ装置の動作につい
て説明する。尚、データディスク装置6a−1〜6a−
(n−1),6b−1〜6b−(n−1)及び予備デー
タディスク装置6a−n,6b−nは活線挿抜の技術に
よってメインメモリに対して接続及び抜出し可能となっ
ている。直結バス用ディスクアレイ制御装置1は本体装
置9のメインバス(図示せず)に接続され、そのメイン
バスにはディスクI/F(インタフェース)(図示せ
ず)を介して複数のデータディスク装置6a−1〜6a
−(n−1),6b−1〜6b−(n−1)及び予備デ
ータディスク装置6a−n,6b−nが接続されてい
る。
【0023】論理ディスク6a,6bは複数台のデータ
ディスク装置6a−1〜6a−(n−1),6b−1〜
6b−(n−1)及び予備データディスク装置6a−
n,6b−nから構成される論理的な大容量のデータ記
録装置である。本体装置9上で動作するオペレーティン
グシステム2上からは複数のデータディスク装置6a−
1〜6a−(n−1),6b−1〜6b−(n−1)及
び予備データディスク装置6a−n,6b−nで構成さ
れる論理ディスク6a,6bを夫々1つのデータディス
クとみなしている。
【0024】データディスク装置6a−1〜6a−(n
−1),6b−1〜6b−(n−1)及び予備データデ
ィスク装置6a−n,6b−nは直結バス用ディスクア
レイ制御装置1内のディスクI/F制御装置13,14
に夫々接続され、通常のコンピュータシステムの業務で
使用するデータとディスクアレイ制御装置11にて生成
されたパリティデータとを記録して保存するための補助
記録装置である。
【0025】電源装置7a,7bはデータディスク装置
6a−1〜6a−(n−1),6b−1〜6b−(n−
1)及び予備データディスク装置6a−n,6b−nに
電源を供給する装置であり、データディスク装置を交換
する際に電源装置/FAN制御装置15からの指示によ
って電源の供給を停止/再開したり、電源に障害が発生
した場合にその旨を電源装置/FAN制御装置15に通
知する。
【0026】ファン機構8a,8bはデータディスク装
置6a−1〜6a−(n−1),6b−1〜6b−(n
−1)及び予備データディスク装置6a−n,6b−n
を夫々冷却する装置であり、障害が発生した場合にその
旨を電源装置/FAN制御装置15に通知する。
【0027】ディスクI/F制御装置13,14はディ
スクアレイ制御装置11から指示された命令によってデ
ータディスク装置6a−1〜6a−(n−1),6b−
1〜6b−(n−1)及び予備データディスク装置6a
−n,6b−nの制御を行い、データディスク装置6a
−1〜6a−(n−1),6b−1〜6b−(n−1)
及び予備データディスク装置6a−n,6b−n、ディ
スクI/F、もしくはディスクI/F制御装置13,1
4で障害が発生した場合に、ディスクアレイ制御装置1
1にその旨を通知する。
【0028】ディスクアレイ制御装置11はディスクI
/F制御装置13,14の配下の制御を行い、データを
書込む際にデータを一定の長さのブロックに分割し、2
個のデータブロックからパリティを生成した後、ディス
クI/F制御装置13,14を介してディスク装置6a
−1〜6a−(n−1),6b−1〜6b−(n−1)
及び予備データディスク装置6a−n,6b−nに書込
む。
【0029】また、ディスクアレイ制御装置11はデー
タを読込む際に書込んだ時のデータブロック2個とパリ
ティブロックとを比較してパリティチェックを行う。デ
ィスクアレイ制御装置11はディスクI/F制御装置1
3,14から通知される障害情報を装置状態監視装置1
2に通知する。
【0030】電源装置/FAN制御装置15は電源装置
7a,7b及びファン機構8a,8bの制御を行い、装
置状態監視装置12からの指示によって交換するデータ
ディスク装置の電源をオン/オフ(ON/OFF)制御
したり、電源装置7a,7bまたはファン機構8a,8
bに障害が発生した場合、障害情報を引取る。障害が発
生した場合、電源装置7a,7bまたはファン機構8
a,8bは電源装置/FAN制御装置15によって供給
電源がオフとなり、オペレーティングシステム2に障害
発生が通知される。
【0031】装置状態監視装置12はディスクアレイ制
御装置11及び電源装置/FAN制御装置15から通知
される障害情報を装置状態監視手段5に通知する。ま
た、装置状態監視装置12は装置状態監視手段5から指
示された電源装置7a,7bまたはファン機構8a,8
bをオン/オフ制御する機能を備えている。
【0032】ディスクアレイ制御手段4は直結バス用デ
ィスクアレイ制御装置1を制御するための各種専用命令
を有している。装置状態監視手段5は装置状態監視装置
12から障害情報を引取り、それらの障害情報を障害内
容毎に累計してシステムの電源に依存しない障害情報記
憶手段5aに記録する。障害情報記憶手段5aは交換対
象のデータディスク装置について、障害ディスク復旧制
御手段3によってその記憶内容が消去されるまでその統
計情報を保持する機能を備えている。
【0033】また、装置状態監視手段5は障害内容及び
その障害内容毎の発生回数のしきい値の設定及び保持を
行い、障害内容毎に保持される発生回数が設定したしき
い値を越える場合に、障害ディスク復旧制御手段3に対
して障害が発生した交換対象のデータディスク装置の交
換指示を行う機能を有している。
【0034】さらに、装置状態監視手段5は障害ディス
ク復旧制御手段3から通知された電源装置7a,7bま
たはファン機構8a,8bのオン/オフを装置状態監視
装置12に指示する。
【0035】障害ディスク復旧制御手段3は装置状態監
視手段5等から交換対象のデータディスク装置が通知さ
れた後、システムの電源を遮断することなく、その交換
対象のデータディスク装置を正常な予備データディスク
装置6a−n,6b−nと交換し、ディスクアレイ制御
手段4に対して復旧処理命令を発行することで、交換し
たデータディスク装置のデータを修復する機能を有して
いる。
【0036】障害ディスク復旧制御手段3はデータディ
スク装置を交換する際に、そのデータディスク装置に供
給している電源のオン/オフを装置状態監視手段5に指
示する。
【0037】図3及び図4は本発明の一実施例による直
結バス用ディスクアレイ装置の復旧方法を示すフローチ
ャートである。これら図1〜図4を用いて、本発明の一
実施例による直結バス用ディスクアレイ装置の復旧方法
について説明する。
【0038】例えば、論理ディスク6a内のデータディ
スク装置6a−1に障害が発生すると(図3ステップS
1)、ディスクアレイ制御装置11がディスクI/F制
御装置13を介して障害が発生したデータディスク装置
6a−1から障害情報を引取る(図3ステップS2)。
ここで、障害情報が装置状態監視装置12を介して装置
状態監視手段5に引取られると、本コマンドに対するデ
ィスクアレイ制御装置11の動作は終了し、次のコマン
ドの受付け/実行が可能となる。
【0039】装置状態監視手段5は装置状態監視装置1
2を介して引取ったデータディスク装置6a−1の障害
情報を基に障害発生箇所や障害内容、及び障害発生回数
等を累計し、これらの情報を統計情報として障害情報記
録手段5a上に記録する。
【0040】このとき同時に、装置状態監視手段5は統
計情報にある障害内容毎の発生回数が事前に設定したし
きい値、つまりそのときの障害内容の発生回数のしきい
値を越えているか否かをチェックする(図3ステップS
3)。
【0041】データデイスク装置6a−1から引き取っ
た障害情報によって復旧不能な障害の発生を検出した場
合、もしくはその障害内容の発生回数がしきい値を越え
ていることを検出した場合、データディスク装置6a−
1を交換対象ディスクとして認識する(図3ステップS
4)。ここで、例えばデータが2台のデータディスク装
置6a−1,6a−2に書込まれ、データディスク装置
6a−3にそのデータから作成されたパリティデータが
格納されるものとする。
【0042】装置状態監視手段5は上記の統計情報のチ
ェックで、データディスク装置6a−1が交換対象とな
らない場合、エラーが発生した時のコマンドが読出し
(Read)コマンドであれば、データをデータディス
ク装置6a−1〜6a−3から読込む際に、データディ
スク装置6a−1〜6a−3のうちの1台から障害が発
生するため、同じアドレスに同じデータの書込みを行う
(図3ステップS6)。
【0043】この同じデータの再書込みによって、デー
タディスク装置6a−1〜6a−3内の媒体系のエラー
が発生し、エラーアドレスが特定されると(図3ステッ
プS8)、そのアドレスの代替処理を行う(図3ステッ
プS9)。ここで、データディスク装置6a−1にてア
ドレス代替処理を行ってもエラーが発生する場合、もし
くはデータディスク装置6a−1が交換対象となった場
合には復旧対象のデータディスク装置の決定を行う(図
4のステップS11)。
【0044】復旧対象のデータディスク装置6a−1を
決定後、装置状態監視手段5は障害ディスク復旧制御手
段3に復旧対象のデータディスク装置6a−1の交換指
示を行う。装置状態監視手段5は交換指示を行う前に、
復旧対象のデータディスク装置6a−1を含むディスク
アレイ装置の全データアドレスをアクセスし、復旧対象
のデータディスク装置6a−1以外に自動復旧可能なア
ドレスの有無についてチェック処理を行う(図4ステッ
プS13)。装置状態監視手段5は自動復旧可能なエラ
ーアドレスを検出すると、アドレス代替処理を行う(図
4ステップS14)。
【0045】このアドレス代替処理は後述する復旧処理
中に交換対象のデータディスク装置6a−1以外でエラ
ーアドレスが発生した場合に、データの修復ができなく
なるのを未然に防止するために行う処理である。全デー
タアドレスのチェック及びアドレス代替処理が終了する
と、障害ディスク復旧制御手段3は交換対象のデータデ
ィスク装置6a−1をディスクアレイ装置から切離し、
データディスク装置としてのアクセスを中止する(図4
ステップS15)。
【0046】この状態では、交換対象のデータディスク
装置6a−1を除いた他のデータディスク装置を使用す
ることで通常の読出し/書込みコマンド処理を行うこと
ができるので、コンピュータ業務には影響を与えない。
交換対象のデータディスク装置6a−1の切離し処理が
終了すると、電源装置/FAN制御装置15は装置状態
監視装置12からの指示によって交換対象のデータディ
スク装置6a−1の電源のみをオフにする(図4ステッ
プS16)。
【0047】上記の交換指示命令を実行後、交換対象の
データディスク装置6a−1の予備データディスク装置
6a−nへの交換が自動的に行われる(図4ステップS
17)。交換対象のデータディスク装置6a−1が交換
された後、交換した予備データディスク装置6a−nへ
の電源供給をオンとし、予備データディスク装置6a−
nに対して物理的なフォーマット処理が必要であれば
(図4ステップS18)、自動的にフォーマット処理を
行う(図4ステップS19)。また、フォーマット処理
が必要でなければ、フォーマット処理は行われない。
【0048】障害ディスク復旧制御手段3はディスクア
レイ制御手段4に対して復旧処理の命令を発行する。こ
れによって、ディスクアレイ制御手段4はディスクアレ
イ制御装置11に対して交換対象のデータディスク装置
6a−1以外のデータディスク装置から、修復するデー
タブロックに対応したデータブロックとパリティデータ
ブロックとを読込んでデータを再生し、交換した予備デ
ータディスク装置6a−n内に再生データの書込みを行
う(図4ステップS20)。
【0049】このデータの読込みから書込みまでの処理
は一連の処理であり、修復用のデータを読出してから書
込むまでの間、他のプログラムが当該データをアクセス
できないように排他制御を行っている。したがって、読
出したデータが書込まれるまでにデータ化けを起こすこ
とはない。この復旧処理は交換した予備データディスク
装置6a−nの全アドレスに対して繰返し行われる(図
4ステップS21)。
【0050】データ復旧後は復旧した予備データディス
ク装置6a−nをディスクアレイ装置として正常に動作
が行えるようにするため、復旧終了指示を発行する(図
4ステップS22)。この復旧終了指示の命令が実行さ
れると、障害が発生したデータディスク装置6a−1に
対する復旧が終了し、この以降のデータアクセスについ
てはデータの自動復旧によるアクセスではなく、障害が
発生したデータディスク装置6a−1以外の全てのデー
タディスク装置に物理的なアクセスを行うことが可能と
なる。
【0051】上述した手順によって、ディスクアレイ装
置の障害データディスク装置を復旧することができる
が、この復旧の間はシステムの電源を一切遮断する必要
はなく、また復旧中であってもシステムを使用する通常
の業務は何ら影響を受けることなく遂行することができ
る。
【0052】尚、上記の説明ではデータディスク装置6
a−1のある障害内容の発生回数がしきい値を越えた時
に予備データディスク装置6a−nに交換する動作につ
いて述べたが、他のデータディスク装置6a−2〜6a
−(n−1),6b−1〜6b−(n−1)のある障害
内容の発生回数がしきい値を越えた時に予備データディ
スク装置6a−n,6b−nに交換する動作も上記と同
様にして行われる。
【0053】また、ある障害内容の発生回数がしきい値
を越えたデータディスク装置の交換はシステム停止時に
まとめて交換し、また交換台数が予め設置された予備デ
ータディスク装置の台数を越えた時にまとめて交換する
ことで、複数のデータディスク装置が本体装置9内に内
蔵しているために交換が容易でない場合にも、障害が発
生する可能性が高いデータディスク装置の予防的な交換
が可能となる。さらに、ファン機構8a,8bに障害が
発生してその電源をオフする場合には、そのファン機構
8a,8bに対応するデータディスク装置を予備データ
ディスク装置に交換して復旧すれば、ファン機構8a,
8bの交換のためにシステムの電源を遮断する必要はな
い。さらにまた、電源7a,7bに障害が発生してその
電源をオフする場合にも、上記と同様に、その電源7
a,7bに対応するデータディスク装置を予備データデ
ィスク装置に交換して復旧すれば、電源7a,7bの交
換のためにシステムの電源を遮断する必要はない。
【0054】このように、データディスク装置6a−1
〜6a−(n−1),6b−1〜6b−(n−1)及び
予備データディスク装置6a−n,6b−n、ディスク
I/F、もしくはディスクI/F制御装置13,14で
障害が発生した際にその障害情報をディスクアレイ制御
装置11から装置状態監視装置12を介して装置状態監
視手段5に通知し、また電源装置7a,7bまたはファ
ン機構8a,8bに障害が発生した際にその障害情報を
電源装置/FAN制御装置15から装置状態監視装置1
2を介して障害情報を装置状態監視手段5に通知し、装
置状態監視手段5で障害情報を累計して障害情報記憶手
段5aに記録するとともに、装置状態監視手段5で障害
内容毎の発生回数が予め設定されたしきい値を越える場
合に障害ディスク復旧制御手段3に障害が発生した交換
対象のデータディスク装置の交換を指示し、システムの
電源を遮断することなく、障害ディスク復旧制御手段3
でその交換対象のデータディスク装置を正常な予備デー
タディスク装置6a−n,6b−nと交換して交換対象
のデータディスク装置のデータを修復することによっ
て、ディスクアレイシステムの論理ディスク6a,6b
内の物理的なデータディスク装置6a−1〜6a−(n
−1),6b−1〜6b−(n−1)の障害内容/発生
回数を監視/記録し、設定したしきい値を越えたデータ
ディスク装置の予備データディスク装置6a−n,6b
−nへの予防交換が可能となる。
【0055】その際、記録している障害内容/発生回数
を分析することで、事前にデータディスク装置6a−1
〜6a−(n−1),6b−1〜6b−(n−1)の障
害に対する対策を行うことができる。
【0056】
【発明の効果】以上説明したように本発明によれば、シ
ステム内に内蔵されかつシステム内のメインバスに直結
される複数のデータディスク装置からなる論理ディスク
装置における障害発生を監視し、障害の発生したデータ
ディスク装置を復旧する手段を含む直結バス用ディスク
アレイ装置において、複数のデータディスク装置各々の
動作状態を監視して複数のデータディスク装置各々の障
害を検出し、その障害情報を複数のデータディスク装置
各々毎に累計して統計情報として記憶するとともに、障
害情報の累計結果が予め設定された所定値を越えたと判
定したデータディスク装置を交換対象装置として通知し
て当該データディスク装置をシステムから切離し、当該
データディスク装置に対する電源の供給を断としてから
当該データディスク装置を予備データディスク装置に代
替することによって、直結バス用ディスクアレイ装置に
おいて寿命となったデータディスク装置を予防的に交換
して自動復旧することが可能になるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】図1の直結バス用ディスクアレイ装置の構成を
示すブロック図である。
【図3】本発明の一実施例による直結バス用ディスクア
レイ装置の復旧方法を示すフローチャートである。
【図4】本発明の一実施例による直結バス用ディスクア
レイ装置の復旧方法を示すフローチャートである。
【符号の説明】
1 直結バス用ディスクアレイ制御装置 2 オペレーティングシステム 3 障害ディスク復旧制御手段 4 ディスクアレイ制御手段 5 装置状態監視手段 5a 障害情報記憶手段 6a,6b 論理ディスク 6a−1〜6a−3,6b−1〜6b−3 データディ
スク装置 6a−n,6b−n 予備データディスク装置 7a,7b 電源装置 8a,8b ファン機構 9 本体装置 11 ディスクアレイ制御装置 12 装置状態監視装置 13,14 ディスクI/F制御装置 15 電源装置/FAN制御装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 システム内に内蔵されかつ前記システム
    内のメインバスに直結される複数のデータディスク装置
    からなる論理ディスク装置における障害発生を監視し、
    障害の発生したデータディスク装置を復旧する手段を含
    む直結バス用ディスクアレイ装置の障害処理回路であっ
    て、前記複数のデータディスク装置各々に電源を供給す
    る電源供給手段と、前記複数のデータディスク装置各々
    の動作状態を監視して前記複数のデータディスク装置各
    々の障害を検出する障害検出手段と、前記障害検出手段
    で検出された障害情報を前記複数のデータディスク装置
    各々毎に累計して統計情報として記憶する記憶手段と、
    前記記憶手段に記憶された前記障害情報の累計結果が予
    め設定された所定値を越えたか否かを判定する判定手段
    と、前記判定手段で前記障害情報の累計結果が前記所定
    値を越えたと判定されたデータディスク装置を交換対象
    装置として通知する通知手段と、前記通知手段によって
    前記交換対象装置として通知されたデータディスク装置
    を前記システムから切離す手段と、前記通知手段によっ
    て前記交換対象装置として通知されたデータディスク装
    置に対する前記電源供給手段からの電源の供給を断とす
    る手段と、前記判定手段で前記障害情報の累計結果が前
    記所定値を越えたと判定されるデータディスク装置の代
    替用の予備データディスク装置と、前記システムから切
    離されるデータディスク装置を前記予備データディスク
    装置で代替する手段とを有することを特徴とする障害処
    理回路。
  2. 【請求項2】 前記記憶手段は、前記ディスクアレイ装
    置とは独立に電源が供給されるよう構成したことを特徴
    とする請求項1記載の障害処理回路。
  3. 【請求項3】 前記記憶手段は、前記複数のデータディ
    スク装置各々に対応して障害内容及び前記障害内容毎の
    発生回数を記憶するよう構成したことを特徴とする請求
    項1または請求項2記載の障害処理回路。
  4. 【請求項4】 前記複数のデータディスク装置各々を冷
    却するファン機構と、前記ファン機構の障害を検出する
    検出手段と、前記検出手段で障害が検出されたファン機
    構に対する電源の供給を断とする手段とを含むことを特
    徴とする請求項1から請求項3のいずれか記載の障害処
    理回路。
JP9049523A 1997-03-05 1997-03-05 直結バス用ディスクアレイ装置の障害処理回路 Pending JPH10247134A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9049523A JPH10247134A (ja) 1997-03-05 1997-03-05 直結バス用ディスクアレイ装置の障害処理回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9049523A JPH10247134A (ja) 1997-03-05 1997-03-05 直結バス用ディスクアレイ装置の障害処理回路

Publications (1)

Publication Number Publication Date
JPH10247134A true JPH10247134A (ja) 1998-09-14

Family

ID=12833508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9049523A Pending JPH10247134A (ja) 1997-03-05 1997-03-05 直結バス用ディスクアレイ装置の障害処理回路

Country Status (1)

Country Link
JP (1) JPH10247134A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193711A (ja) * 2006-01-20 2007-08-02 Chugoku Electric Power Co Inc:The ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム
US7395451B2 (en) 2004-09-10 2008-07-01 Fujitsu Limited Apparatus, method and program for the control of storage

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7395451B2 (en) 2004-09-10 2008-07-01 Fujitsu Limited Apparatus, method and program for the control of storage
JP2007193711A (ja) * 2006-01-20 2007-08-02 Chugoku Electric Power Co Inc:The ハードディスク冗長管理装置、方法、プログラムおよび監視制御システム

Similar Documents

Publication Publication Date Title
US7526684B2 (en) Deterministic preventive recovery from a predicted failure in a distributed storage system
CN102880522B (zh) 面向硬件故障的系统关键文件故障纠正方法及装置
JP2002108573A (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
CN103970481A (zh) 重建存储器阵列的方法和装置
JP2005301476A (ja) 給電制御システム、及び記憶装置
CN105607973B (zh) 一种虚拟机系统中设备故障处理的方法、装置及系统
US20070234107A1 (en) Dynamic storage data protection
US20030214744A1 (en) Information recorder and its control method
JPH1195933A (ja) ディスクアレイ装置
JP3063666B2 (ja) アレイディスク制御装置
JPH10247134A (ja) 直結バス用ディスクアレイ装置の障害処理回路
JP3120753B2 (ja) ディスクアレイ装置の障害復旧装置
JP2001154929A (ja) 代替パス方式の管理方法とシステム
JP4248164B2 (ja) ディスクアレイのエラー回復方法、ディスクアレイ制御装置及びディスクアレイ装置
CN112084097B (zh) 一种磁盘告警方法及装置
US7523347B2 (en) RAID control apparatus, and RAID control program and RAID control method
JPH07152495A (ja) ディスクアレイ装置の復旧方式
JP2618078B2 (ja) アレイディスク制御装置
JP2007334770A (ja) Raid装置、そのモジュール、ディスク組込み可否判定方法、及びプログラム
JP2834083B2 (ja) データディスクアレイ装置
JPH0651918A (ja) 半導体ディスク装置
US7962781B2 (en) Control method for information storage apparatus, information storage apparatus and computer readable information recording medium
JPH06124169A (ja) 二重システム化された光ディスク装置及びそのi/oエラー自動復旧方法
JP4294568B2 (ja) ディスクアレイ装置及びその制御方法
JPH07261989A (ja) 制御プログラム復旧方式