JP4456060B2

JP4456060B2 - Ｒａｉｄ制御装置、ｒａｉｄ制御プログラム、ｒａｉｄ制御方法

Info

Publication number: JP4456060B2
Application number: JP2005360213A
Authority: JP
Inventors: 友幸金山
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2005-12-14
Filing date: 2005-12-14
Publication date: 2010-04-28
Anticipated expiration: 2025-12-14
Also published as: US20070174674A1; JP2007164495A; US7523347B2

Description

本発明は、ＲＡＩＤ（Redundant Arrays of Inexpensive Disks）装置における障害発生時のリカバリを行うＲＡＩＤ制御装置、ＲＡＩＤ制御プログラム、ＲＡＩＤ制御方法に関するものである。

図４は、従来のＲＡＩＤ装置の構成の一例を示すブロック図である。このＲＡＩＤ装置は、ＲＡＩＤ制御装置１１１ａ，１１１ｂ、ディスク２１ａ，２１ｂ，２１ｃ，２１ｄ，２１ｅを備える。ＲＡＩＤ制御装置１１１ａ，１１１ｂがディスク２１ａ，２１ｂ，２１ｃ，２１ｄ，２１ｅの制御を行うことにより、ディスク２１ａ，２１ｂ，２１ｃ，２１ｄ，２１ｅはＲＡＩＤ５のＲＡＩＤグループを構成する。

このようなＲＡＩＤ装置において、ＲＡＩＤグループを構成しているディスクのうち２本以上のディスクがエラーを起こしてしまった場合（ＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態）、ＲＡＩＤの冗長構成が壊れてしまうことから、ＲＡＩＤ装置がデータを復旧させることができない。

ＲＡＩＤ装置がＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態に陥ってしまった場合の、従来の一般的なＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法について説明する。図５は、従来のＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法において復旧させるディスクの順番の一例を示す表である。この表は、ディスクの番号、ディスクにエラーが発生した順番、ディスクを復旧させる順番、個々のディスクの復旧手段を示している。このＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法は、ＲＡＩＤグループ内で最後にエラーが発生したディスクから順番にシステムに強制的に組み込んでいき、最初にエラーが発生したディスクを最後に交換して、そのディスクをＲｅｂｕｉｌｄによって復旧させる。

このＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法によれば、ＲＡＩＤ装置は、ディスクへの書き込み処理等が停止する直前の状態に復旧することが可能である。

なお、本発明の関連ある従来技術として、例えば、下記に示す特許文献１が知られている。この障害検出システムにおいて、第１のコントローラは、自身が管理するメモリにアクセスを行うときは第２のコントローラが管理するメモリにもアクセスを要求する。要求に対する許可が帰って来なければ、第２のコントローラに障害が発生したと見なす。
特開平８−２４９１３０号公報

しかしながら、上述した従来のＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法は、ＲＡＩＤ制御装置障害に起因しないＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態（例えば、ＦＣ（Fibre Channel）ループ上の障害に起因したＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態）に対してだけ有効である。

ＲＡＩＤ制御装置障害に起因するＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態の場合、従来のＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法によりＲＡＩＤ構成の復旧は可能だが、復旧させたとたんに再び同様の障害に陥ってしまう可能性が高い。従って、システムの復旧に多大な時間を要するだけでなく、復旧作業中にデータ化けやデータロストに至る可能性が高くなる。

ここで、ＲＡＩＤ制御装置障害に起因するＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態とは、例えば、ディスクのマウント制御を行っているデバイスやＲＡＩＤ制御装置部分の信号配線で障害が発生することにより、システムからディスクが見えなくなってしまう場合である。この場合、ディスクおよびＲＡＩＤ制御装置の両方においてエラーを示すＬＥＤを点灯させ、ユーザに通知することは可能であるが、ユーザはＲＡＩＤ制御装置障害に起因するものかどうかの判断ができない。

本発明は上述した問題点を解決するためになされたものであり、ＲＡＩＤ制御装置の障害に起因してディスクエラーが発生した場合であっても、自動的に復旧を行うＲＡＩＤ制御装置、ＲＡＩＤ制御プログラム、ＲＡＩＤ制御方法を提供することを目的とする。

上述した課題を解決するため、本発明は、ＲＡＩＤ装置を制御するＲＡＩＤ制御装置であって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ装置を制御することができるＲＡＩＤ制御装置において、ディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断部と、前記診断部が前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御部とを備えたものである。

また、本発明に係るＲＡＩＤ制御装置において、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記ＲＡＩＤ装置の自動復旧を行う復旧部を更に備えることを特徴とするものである。

また、本発明に係るＲＡＩＤ制御装置において、前記復旧部は、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のＲＡＩＤ制御装置であると特定することを特徴とするものである。

また、本発明は、ＲＡＩＤ装置の制御をＲＡＩＤ制御装置のコンピュータに実行させるＲＡＩＤ制御プログラムであって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ制御装置を制御することができるＲＡＩＤ装置のＲＡＩＤ制御プログラムにおいて、ディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断ステップと、前記診断ステップが前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御ステップとをコンピュータに実行させるものである。

また、本発明は、ＲＡＩＤ装置の制御を行うＲＡＩＤ制御装置におけるＲＡＩＤ制御方法であって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ装置を制御することができるＲＡＩＤ制御装置のＲＡＩＤ制御方法において、ディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断ステップと、前記診断ステップが前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御ステップとを実行するものである。

本発明によれば、ＲＡＩＤ制御装置の障害に起因してディスクエラーが発生した場合であっても、自動的に復旧を行うことができる。

以下、本発明の実施の形態について図面を参照しつつ説明する。

まず、本実施の形態に係るＲＡＩＤ制御装置を用いたＲＡＩＤ装置の構成について説明する。

図１は、本実施の形態に係るＲＡＩＤ装置の構成の一例を示すブロック図である。図１において、図４と同一符号は図４に示された対象と同一又は相当物を示しており、ここでの説明を省略する。図４と比較すると図１は、ＲＡＩＤ制御装置１１１ａ，１１１ｂの代わりに本実施の形態に係るＲＡＩＤ制御装置であるＲＡＩＤ制御装置１１ａ，１１ｂを備える。ＲＡＩＤ制御装置１１ａ，１１ｂがディスク２１ａ，２１ｂ，２１ｃ，２１ｄ，２１ｅの制御を行うことにより、ディスク２１ａ，２１ｂ，２１ｃ，２１ｄ，２１ｅはＲＡＩＤ５のＲＡＩＤグループを構成する。

次に、ＲＡＩＤ制御装置１１ａの動作について説明する。

図２は、本実施の形態に係るＲＡＩＤ制御装置の動作の一例を示すブロック図である。ＲＡＩＤ制御装置１１ａが、ディスク２１ａ，２１ｂ，２１ｃ，２１ｄ，２１ｅのうち１本について１本目のディスクエラーを検出すると（Ｓ１１）、ＲＡＩＤ制御装置１１ａは、もう一つのＲＡＩＤ制御装置１１ｂの診断を行い、ＲＡＩＤ制御装置１１ｂに異常があるか否かの判断を行う（Ｓ１２）。ここでＲＡＩＤ制御装置１１ａが診断において採取した情報は、ＲＡＩＤ制御装置１１ａのキャッシュのような読み出し可能なメモリ等に格納しておき、ＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態から復旧する場合等に参照することができる。

もう一つのＲＡＩＤ制御装置１１ｂに異常がない場合（Ｓ１２，Ｎ）、ＲＡＩＤ制御装置１１ａは、ディスクエラーの原因がＲＡＩＤ制御装置以外にあると判断する（Ｓ２１）。

もし、２本目のディスクエラーが発生した場合（Ｓ２２，Ｎ）、図５の例に示したような従来のＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法を実行する（Ｓ２４）。ここでは、ディスクの強制組み込みと交換によるＲｅｂｕｉｌｄが行われ、その結果、ＲＡＩＤ装置が運用可能となり、このフローを終了する。

一方、もう一つのＲＡＩＤ制御装置１１ｂに異常がある場合（Ｓ１２，Ｙ）、ＲＡＩＤ制御装置１１ａは、もう一つのＲＡＩＤ制御装置１１ｂをＲＡＩＤ装置から切り離し（Ｓ１３）、その後、所定の時間内に２本目のディスクエラーが発生したか否かの判断を行う（Ｓ１４）。

ＲＡＩＤ制御装置１１ｂの切り離し後、所定の時間内に２本目のディスクエラーが発生しなかった場合（Ｓ１４，Ｎ）、ＲＡＩＤ制御装置１１ａは、ディスクエラーの原因がもう一つのＲＡＩＤ制御装置１１ｂにあり、ディスク自体は異常がないと判断し（Ｓ３１）、エラーが発生したディスクをＲＡＩＤ装置に組み込み直し（Ｓ３２）、ＲＡＩＤグループの自動復旧を実行する（Ｓ３３）。その結果、ディスクの交換を行うことなく、ＲＡＩＤ装置が自動的に運用可能となり、このフローを終了する。

一方、ＲＡＩＤ制御装置１１ｂの切り離し後、所定の時間内に２本目のディスクエラーが発生した場合（Ｓ１４，Ｙ）、ＲＡＩＤ制御装置１１ａは、ディスクエラーの原因がＲＡＩＤ制御装置１１ａ自身にあると判断し（Ｓ１５）、ＲＡＩＤ制御装置１１ｂを再びＲＡＩＤ装置に組み込み（Ｓ１６）、ＲＡＩＤ制御装置１１ａ自身をＲＡＩＤ装置から切り離し（Ｓ１７）、このフローを終了する。

上述した処理Ｓ１７において、ＲＡＩＤ制御装置１１ａは自己を切り離すとしたが、処理Ｓ１６により組み込まれたＲＡＩＤ制御装置１１ｂがＲＡＩＤ制御装置１１ａを切り離すように動作しても良い。

このフローにおいては、ＲＡＩＤ制御装置１１ａの動作について説明したが、ＲＡＩＤ制御装置１１ｂも同様の動作を行う。

上述した動作により、１本目のディスクエラーが発生した時点で、２つのＲＡＩＤ制御装置が互いの診断を行い、ディスクエラーの原因となったＲＡＩＤ制御装置を切り離した場合、ＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態を防ぐことができる。また、ＲＡＩＤ制御装置の異常により診断の結果が正しく得られず、正常なＲＡＩＤ制御装置を切り離してしまった場合でも、自動的にＲＡＩＤ制御装置を再び切り替えることにより原因を特定できると共に、更なる障害の発生を防ぐことができる。

次に、一旦ＲＡＩＤ装置から切り離され、再び組み込まれた場合のＲＡＩＤ制御装置１１ｂの動作について説明する。

図３は、本実施の形態に係る他のＲＡＩＤ制御装置の動作の一例を示すブロック図である。ＲＡＩＤ制御装置１１ａがＲＡＩＤ装置から切り離された後、ＲＡＩＤ制御装置１１ｂは、所定の時間内に３本目のディスクエラーが発生したか否かの判断を行う（Ｓ４１）。

ＲＡＩＤ制御装置１１ａの切り離し後、所定の時間内に３本目のディスクエラーが発生しなかった場合（Ｓ４１，Ｎ）、ＲＡＩＤ制御装置１１ｂは、ディスクエラーの原因がもう一つのＲＡＩＤ制御装置１１ａにあり、ディスク自体は異常がないと判断し（Ｓ４２）、エラーが発生したディスクをＲＡＩＤグループに組み込み直し（Ｓ４３）、ＲＡＩＤグループの自動復旧を実行する（Ｓ４４）。その結果、ディスクの交換などの人手による作業を行うことなく、ＲＡＩＤ装置が運用可能となり、このフローを終了する。ここで、ＲＡＩＤ制御装置１１ｂは、処理Ｓ１２やその他のプロセスで採取された情報を用いて自動復旧におけるディスクの復旧順序を決定する。

一方、ＲＡＩＤ制御装置１１ａの切り離し後、所定の時間内に３本目のディスクエラーが発生した場合（Ｓ４１，Ｙ）、ＲＡＩＤ制御装置１１ｂは、ディスクエラーの原因がＲＡＩＤ制御装置以外にあると判断し（Ｓ５１）、従来のＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法を実行する（Ｓ５２）。ここでは、ディスクの強制組み込みと交換によるＲｅｂｕｉｌｄが行われ、その結果、ＲＡＩＤ装置が運用可能となり、このフローを終了する。

このフローにおいては、ＲＡＩＤ制御装置１１ｂの動作について説明したが、ＲＡＩＤ制御装置１１ａも同様の動作を行う。

また、ＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ状態に至った原因となるコンポーネントを特定できると共に、原因がＲＡＩＤ制御装置であったとしてもＲＡＩＤ装置を自動で迅速に復旧させることができる。

更に、ＲＡＩＤ制御装置を構成するコンピュータにおいて上述した各ステップを実行させるプログラムを、ＲＡＩＤ制御プログラムとして提供することができる。上述したプログラムは、コンピュータにより読取り可能な記録媒体に記憶させることによって、ＲＡＩＤ制御装置を構成するコンピュータに実行させることが可能となる。ここで、上記コンピュータにより読取り可能な記録媒体としては、ＲＯＭやＲＡＭ等のコンピュータに内部実装される内部記憶装置、ＣＤ−ＲＯＭやフレキシブルディスク、ＤＶＤディスク、光磁気ディスク、ＩＣカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。

なお、診断部と制御部と復旧部は、実施の形態におけるＲＡＩＤ制御装置に対応する。また、診断ステップは、実施の形態の図２における処理Ｓ１２に対応する。また、復旧ステップは、実施の形態の図２と図３における処理Ｓ２３，Ｓ２４，Ｓ３２，Ｓ３３，Ｓ４３，Ｓ４４，Ｓ５２に対応する。また、制御ステップは、実施の形態の図２と図３における診断ステップと制御ステップ以外の処理に対応する。

（付記１）ＲＡＩＤ装置を制御するＲＡＩＤ制御装置であって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ装置を制御することができるＲＡＩＤ制御装置において、
ディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断部と、
前記診断部が前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御部と
を備えるＲＡＩＤ制御装置。
（付記２）付記１に記載のＲＡＩＤ制御装置において、
自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記ＲＡＩＤ装置の自動復旧を行う復旧部を更に備えることを特徴とするＲＡＩＤ制御装置。
（付記３）付記２に記載のＲＡＩＤ制御装置において、
前記復旧部は、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のＲＡＩＤ制御装置であると特定することを特徴とするＲＡＩＤ制御装置。
（付記４）付記２または付記３に記載のＲＡＩＤ制御装置において、
前記復旧部は、前記診断部が前記他のＲＡＩＤ制御装置に異常がないと判断した場合、前記ＲＡＩＤ装置の復旧を支援することを特徴とするＲＡＩＤ制御装置。
（付記５）付記２乃至付記４のいずれかに記載のＲＡＩＤ制御装置において、
前記復旧部は、前記他のＲＡＩＤ制御装置による単独制御の状態から、自己の単独制御の状態に切り替えられた場合において、該自己の単独制御中の所定の時間内にディスクエラーが検出された場合、前記ＲＡＩＤ装置の復旧を支援することを特徴とするＲＡＩＤ制御装置。
（付記６）付記２乃至付記５のいずれかに記載のＲＡＩＤ制御装置において、
前記復旧部は、前記診断部や前記復旧部による診断の結果に基づいて前記自動復旧を行うことを特徴とするＲＡＩＤ制御装置。
（付記７）ＲＡＩＤ装置の制御をＲＡＩＤ制御装置のコンピュータに実行させるＲＡＩＤ制御プログラムであって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ制御装置を制御することができるＲＡＩＤ装置のＲＡＩＤ制御プログラムにおいて、
ディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断ステップと、
前記診断ステップが前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御ステップと
をコンピュータに実行させるＲＡＩＤ制御プログラム。
（付記８）付記７に記載のＲＡＩＤ制御プログラムにおいて、
自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記ＲＡＩＤ装置の自動復旧を行う復旧ステップを更にコンピュータに実行させることを特徴とするＲＡＩＤ制御プログラム。
（付記９）付記８に記載のＲＡＩＤ制御プログラムにおいて、
前記復旧ステップは、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のＲＡＩＤ制御装置であると特定することを特徴とするＲＡＩＤ制御プログラム。
（付記１０）付記８または付記９に記載のＲＡＩＤ制御プログラムにおいて、
前記復旧ステップは、前記診断ステップが前記他のＲＡＩＤ制御装置に異常がないと判断した場合、前記ＲＡＩＤ装置の復旧を支援することを特徴とするＲＡＩＤ制御プログラム。
（付記１１）付記８乃至付記１０のいずれかに記載のＲＡＩＤ制御プログラムにおいて、
前記復旧ステップは、前記他のＲＡＩＤ制御装置による単独制御の状態から、自己の単独制御の状態に切り替えられた場合において、該自己の単独制御中にディスクエラーが検出された場合、前記ＲＡＩＤ装置の復旧を支援することを特徴とするＲＡＩＤ制御プログラム。
（付記１２）付記８乃至付記１１のいずれかに記載のＲＡＩＤ制御プログラムにおいて、
前記復旧ステップは、前記診断ステップや前記復旧ステップによる診断の結果に基づいて前記自動復旧を行うことを特徴とするＲＡＩＤ制御プログラム。
（付記１３）ＲＡＩＤ装置の制御を行うＲＡＩＤ制御装置におけるＲＡＩＤ制御方法であって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ装置を制御することができるＲＡＩＤ制御装置のＲＡＩＤ制御方法において、
ディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断ステップと、
前記診断ステップが前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御ステップと
を実行するＲＡＩＤ制御方法。
（付記１４）付記１３に記載のＲＡＩＤ制御方法において、
自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記ＲＡＩＤ装置の自動復旧を行う復旧ステップを更にコンピュータに実行させることを特徴とするＲＡＩＤ制御方法。
（付記１５）付記１４に記載のＲＡＩＤ制御方法において、
前記復旧ステップは、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のＲＡＩＤ制御装置であると特定することを特徴とするＲＡＩＤ制御方法。
（付記１６）付記１４または付記１５に記載のＲＡＩＤ制御方法において、
前記復旧ステップは、前記診断ステップが前記他のＲＡＩＤ制御装置に異常がないと判断した場合、前記ＲＡＩＤ装置の復旧を支援することを特徴とするＲＡＩＤ制御方法。
（付記１７）付記１４乃至付記１６のいずれかに記載のＲＡＩＤ制御方法において、
前記復旧ステップは、前記他のＲＡＩＤ制御装置による単独制御の状態から、自己の単独制御の状態に切り替えられた場合において、該自己の単独制御中にディスクエラーが検出された場合、前記ＲＡＩＤ装置の復旧を支援することを特徴とするＲＡＩＤ制御方法。
（付記１８）付記１４乃至付記１７のいずれかに記載のＲＡＩＤ制御方法において、
前記復旧ステップは、前記診断ステップによる診断の結果に基づいて前記自動復旧を行うことを特徴とするＲＡＩＤ制御方法。

本実施の形態に係るＲＡＩＤ装置の構成の一例を示すブロック図である。本実施の形態に係るＲＡＩＤ制御装置の動作の一例を示すブロック図である。本実施の形態に係る他のＲＡＩＤ制御装置の動作の一例を示すブロック図である。従来のＲＡＩＤ装置の構成の一例を示すブロック図である。従来のＭｕｌｔｉＤｅａｄ／ＭｕｌｔｉＵｎｍｏｕｎｔ復旧方法において復旧させるディスクの順番の一例を示す表である。

符号の説明

１１ａ，１１ｂＲＡＩＤ制御装置、２１ａ，２１ｂ，２１ｃ，２１ｄ，２１ｅディスク。

Claims

複数のディスクを有するＲＡＩＤ装置を制御するＲＡＩＤ制御装置であって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ装置を制御することができるＲＡＩＤ制御装置において、
前記ＲＡＩＤ装置が有する複数のディスクのうち、第１ディスクのディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断部と、
前記診断部が前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行い、該単独制御中に前記第１ディスクとは異なる第２ディスクのディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御部と
を備えるＲＡＩＤ制御装置。
請求項１に記載のＲＡＩＤ制御装置において、
自己の単独制御が開始されてから所定の時間内に前記第２ディスクのディスクエラーが検出されなかった場合、前記第１ディスクを使用可能な状態とし、前記ＲＡＩＤ装置の自動復旧を行う復旧部を更に備えることを特徴とするＲＡＩＤ制御装置。
請求項２に記載のＲＡＩＤ制御装置において、
前記復旧部は、自己の単独制御が開始されてから所定の時間内に前記第２ディスクのディスクエラーが検出されなかった場合、前記第１ディスクのディスクエラーの原因が前記他のＲＡＩＤ制御装置であると特定することを特徴とするＲＡＩＤ制御装置。
複数のディスクを有するＲＡＩＤ装置の制御をＲＡＩＤ制御装置のコンピュータに実行させるＲＡＩＤ制御プログラムであって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ制御装置を制御することができるＲＡＩＤ装置のＲＡＩＤ制御プログラムにおいて、
前記ＲＡＩＤ装置が有する複数のディスクのうち、第１ディスクのディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断ステップと、
前記診断ステップが前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行い、該単独制御中に前記第１ディスクとは異なる第２ディスクのディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御ステップと
をコンピュータに実行させるＲＡＩＤ制御プログラム。
複数のディスクを有するＲＡＩＤ装置の制御を行うＲＡＩＤ制御装置におけるＲＡＩＤ制御方法であって、当該ＲＡＩＤ制御装置と異なる他のＲＡＩＤ制御装置と協働して少なくとも一つのＲＡＩＤ装置を制御することができるＲＡＩＤ制御装置のＲＡＩＤ制御方法において、
前記ＲＡＩＤ装置が有する複数のディスクのうち、第１ディスクのディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置の診断を行う診断ステップと、
前記診断ステップが前記他のＲＡＩＤ制御装置に異常があると判断した場合、前記他のＲＡＩＤ制御装置との協働による制御を停止し、単独による前記ＲＡＩＤ装置の制御である単独制御を行い、該単独制御中に前記第１ディスクとは異なる第２ディスクのディスクエラーが検出された場合、前記他のＲＡＩＤ制御装置による前記ＲＡＩＤ装置の単独制御に切り替える制御ステップと
を実行するＲＡＩＤ制御方法。