JP2007334770A

JP2007334770A - Ｒａｉｄ装置、そのモジュール、ディスク組込み可否判定方法、及びプログラム

Info

Publication number: JP2007334770A
Application number: JP2006168110A
Authority: JP
Inventors: Koichi Tsukada; 孝一塚田; Satoshi Yazawa; 悟史矢澤; Shoji Oshima; 章二大嶋; Tatsuhiko Machida; 達彦町田; Hirokazu Matsubayashi; 宏和松林
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-06-16
Filing date: 2006-06-16
Publication date: 2007-12-27
Also published as: US20080010403A1

Abstract

【課題】同一ディスクによる活性交換が行われた場合でも、所定の条件を満たす場合には当該ディスクの組み込みを許可する。
【解決手段】Disk組み込み処理部５４は、Disk統計部５３が管理する情報を共有化し（共通テーブル）、任意のディスクが切り離された後、当該ディスクが搭載された場合、この共通テーブルを参照して、このディスクの再組み込みを許可するか否かを判定する。
【選択図】図３

Description

本発明は、ＲＡＩＤ装置に関する。

従来のRAID装置では、ディスク故障が発生した場合等、ディスクを交換する必要が生じた場合は、新しく保守部品を取り寄せて、ディスクの活性交換を実施する。ＲＡＩＤ装置は、搭載している各ディスクのDisk WWN（World Wide Name）を記憶・管理しており、活性交換の際には、ＲＡＩＤ装置内に登録されていないDisk WWNをもつディスクのみを組み込み対象としている。これは、故障ディスクが再度組み込まれることを防止する為である。もし、交換前と同一のDisk WWNを有するディスクがＲＡＩＤ装置に搭載された場合、これを組み込み対象としない制御をおこなっている。つまり、一度でもＲＡＩＤ装置に組み込まれたディスクは、2度とそのＲＡＩＤ装置に組み込めない。

図８（ａ），（ｂ）に、従来の活性交換制御の一例を示す。図８（ａ）、（ｂ）では、あるＲＡＩＤ装置に搭載される複数のディスクＡ〜Ｅのうち、ディスクＢが故障した例を示す。この場合、図８（ａ）の例では、ディスクＢを取り外して、代わりに新たなディスクＦを搭載しているので、ＲＡＩＤ装置側ではディスクＦの組み込みを行う。一方、図８（ｂ）の例では、ディスクＢを取り外し後、そのままディスクＢを再搭載しているので、ＲＡＩＤ装置側ではディスクＢの組み込みを行わない。

尚、もし、ディスクＢ（故障）を取り外し後、ディスクＤ（正常）も取り外して、ディスクＢの位置にディスクＤを搭載した場合でも、交換前と同一のDisk WWNを有するディスクと判定され、ディスクＤの組み込みは許可されない。つまり、交換後のディスクのDisk WWNは、そのＲＡＩＤ装置に登録されている全てのディスクのDisk WWNと比較され、一致するものがあれば、交換前と同一のDisk WWNを有するディスクが搭載されたものと判定される。

但し、組み込みが完了した場合には、交換前のディスクのDisk WWNは消去される。従って、上記例において、ディスクＤの位置にディスクＦを搭載して組み込みが完了した後に、ディスクＢの位置にディスクＤを搭載したならば、ディスクＤの組み込みは許可されることになる。

尚、以下の説明において“装置”とは、ＲＡＩＤ装置を意味するものとする。また、上記Disk WWN、活性交換について、一応、以下に説明しておく。
・Disk WWN：各ディスクは世界でひとつだけの名前（Disk WWN）を保持しており、これによりディスクの個別判断が可能となる。
・活性交換：装置の運用を停止させず、部品交換を可能とする機能。

上記の通り、従来では、同一ディスクによる活性交換を許可していない。その理由は以下の点が挙げられる。
（１）故障したディスクが再度装置に搭載された場合、場合によっては当該故障ディスクがシステムに悪影響を及ぼすことがあり得る為、組み込まずに切り離す
（２）ディスクが物理的に装置から抜き差しされたかリアルタイムに検出することができず、実際にはディスクが装置から抜かれなくとも、装置Firmからはディスクが装置から抜かれたと見える場合がある。その場合、組み込みを行うと切り離すべきディスクが再度組み込まれるという悪影響があるため、切り離したディスクは組み込まないよう制御している。

尚、ディスク装置の障害に関して、以下の公知技術が知られている。
特許文献１に記載の発明は、ディスク装置のオフトラックが測定可能限界に達したときのエラーに対し、ディスク装置を交換することなくリカバリできるディスクアレイ装置である。

特許文献２に記載の発明は、障害情報を確実に取得可能とすることを目的とし、ディスクアレイ装置において物理ドライブのいずれかに障害発生時に障害情報を格納するトレースバッファを備え、トレースバッファに記憶された障害情報を、障害採取用ドライブとして設定された物理ドライブに書き込むようにした発明である。

特許文献３に記載の発明は、ディスク障害そのものの発生頻度を下げ、データロストの危険性を回避することを目的とし、ディスクの状態を統計的に分析して、ディスク障害が発生する前に自動的に正常なディスクを使用してアレイディスクを組み替える機構を備えるものである。
特開平９−１６７４２７号公報特開平１１−３５３１２７号公報特開２０００−３０５７２０号公報

上記の通り、従来では、ディスク故障が発生した場合、ディスクの活性交換を実施するが、同一ディスクによる活性交換を許可していない。
しかし、実際には、ディスク故障となる場合は、ディスクが異常であるケースだけでなく、他部品の影響で故障とみえるケースもある。例えば、装置に搭載されるディスクはFC(Fiber Channel）で接続されており、FC伝送路の異常が時としてディスク異常にみえることがある。この様なディスク要因ではないディスク故障の場合でも（実際にはディスク自体は故障していなくとも）新しいディスクと交換しなければならず、余計な手間が掛かり、コスト増となるというデメリットが存在する。

また、あるディスク要因で他ディスクも故障した場合（但し、何れも、ディスク自体には異常が無いにも係らず、故障と見做されたものとする）、交換の際は保守ディスクを用いて順繰りに交換しなければならず手間がかかる。例えば、ディスクＡ〜Ｅが存在し、ディスクＡが要因となって、ディスクＡだけでなくディスクＢ〜Ｅも故障と見做されてしまった場合、まず、ディスクＡの代わりに保守ディスクＦを搭載して組み込みが行われると、上記の通りディスクＡの登録が抹消されるので、今度はディスクＢの位置にディスクＡを搭載する。その後も、同様に、ディスクＣの位置にディスクＢ、ディスクＤの位置にディスクＣというように、順繰りに交換する（実際には故障していないので、新しいディスクを用いるのはもったいない為）。

尚、上記特許文献１〜３は、何れも、Disk WWNを用いた管理を行う場合の上記問題に関係するものではない。
本発明の課題は、Disk WWNを用いて活性交換の管理を行うＲＡＩＤ装置に係わり、同一ディスクによる活性交換が行われた場合でも、所定の条件を満たす場合には当該ディスクの組み込みを許可することで上記デメリットを解消できるＲＡＩＤ装置、そのモジュール等を提供することである。

本発明によるＲＡＩＤ装置内のモジュールは、複数のディスクより成るＲＡＩＤグループを有するＲＡＩＤ装置内のモジュールにおいて、前記各ディスクの識別名が登録される第１の記憶手段と、前記各ディスクの切離要因が格納される第２の記憶手段と、任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、前記第１の記憶手段に登録されている識別名と該搭載されたディスクの識別名とが一致する場合であっても、前記第２の記憶手段を参照して所定の各種条件を満たすか否かを判定し、該条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行するディスク組み込み処理手段とを有する。

従来では、登録されている識別名と搭載されたディスクの識別名とが一致する場合、すなわち切り離されたディスクが再搭載された場合には、必ず、当該ディスクの組み込みは行わなかった。一方、上記本発明のモジュールでは、前記各ディスクで発生するエラー内容、前記各ディスクの状態、前記各ディスクの切離要因等に基づく所定の条件を満たす場合に限り、同一ディスクが再搭載された場合であっても組み込みを許可し、組み込み処理を実行する。所定の条件を満たす場合とは、切り離されたディスクを再度組み込んでも問題が生じる可能性は低いと考えられる場合であり、例えば上記のようにディスク要因ではないディスク故障の場合等である。

但し、上記モジュールにおいて、例えば、前記ディスク組み込み処理手段は、前記搭載されたディスクの組み込み処理を実行後、所定時間以内に該ディスクが再び切り離された場合には、前記条件を満たすか否かに関係なく、該ディスクを再度組み込むことは許可しない。

尚、本発明は、上記モジュールの形態に限らず、その方法、プログラム、あるいは上記モジュールを有するＲＡＩＤ装置として構成することもできる。

本発明のＲＡＩＤ装置、そのモジュール等では、識別名を用いて活性交換の管理を行うＲＡＩＤ装置に係わり、同一ディスクによる活性交換が行われた場合でも、所定の条件を満たす場合には当該ディスクの組み込みを許可する。上記の通り、新しいディスクと交換する場合には、余計な手間が掛かり、コスト増となったが、この様な問題を解消できる。

以下、図面を参照して、本発明の実施の形態について説明する。
図１に、ＲＡＩＤ装置の一般的な構成図を示す。
図示のＲＡＩＤ装置１は、２つのＣＭ１０（１０ａ、１０ｂ）、ＦＲＴ３、ＢＲＴ４、ＢＲＴ５、ＤＥ６、ＤＥ７を有する。

ＣＭ（Centralized Module）１０は、ＲＡＩＤ装置１内における各種ディスクアクセス処理、エラーリカバリ処理等を管理・制御する。ＢＲＴ（Backend Router）４、５は、ＣＭ１０とＤＥ６、７との間に位置し、ＣＭ１０と各ＤＥ（各ディスク群）とを繋ぐ為のスイッチの役割を果たす。ホスト２がＣＭ１０を介して任意のＤＥにアクセスする経路（パス）は２つあり、この２つのアクセス経路の各々にＢＲＴ４、５が設けられている。従って、どちらか一方のアクセス経路が何等かの理由（例えば、ＢＲＴの故障等）によって使用不可となっても、他方のアクセス経路を用いてアクセスすることができる。

ここでは、ＣＭ１０ａは、ＢＲＴ４とＢＲＴ５の両系統に接続しており、ＣＭ１０ｂも、ＢＲＴ４とＢＲＴ５の両系統に接続している。尚、後述する再組み込み可否判定処理等は、ＣＭ１０ａ、１０ｂが各々個別に実行する。また、ＦＲＴ３は、ＣＭ１０ａ−１０ｂ間の通信を中継制御するものである。

ＤＥ（ドライブエンクロージャー）６は、ＰＢＣ６ａ，６ｂと、ディスク群６ｃを有する。同様に、ＤＥ（ドライブエンクロージャー）７は、ＰＢＣ７ａ，７ｂと、ディスク群７ｃとを有する。

ＰＢＣはポート・バイパス・サーキットである。PBCは、Loopで形成されるFC伝送路において、あるディスクが異常となったときにLoopをせき止めることを防ぐため、そのディスクをLoopからBypassさせる機能(つまり、そのディスクを切り離す機能)を持つハードウェアである。ＰＢＣは、切り離したディスクについてＣＭ１０に通知する。

ＢＲＴ４の各ポートはＰＢＣ６ａ、ＰＢＣ７ａに接続しており、ＢＲＴ５の各ポートはＰＢＣ６ｂ、ＰＢＣ７ｂに接続しており、各ＣＭ１０は、ＢＲＴ４又はＢＲＴ５とＰＢＣを介して、ディスク群６ｃ、ディスク群７ｃにアクセスする。

各ＣＭ１０は、任意の通信線を介してホスト２（２ａ、２ｂ）に接続している。
また、各ＣＭ１０には、必要に応じて（例えば保守／修理作業の際）、ＦＳＴ２０が接続される。ＦＳＴ２０は、保守専用ＰＣ（パソコン）である。そして、オペレータ（保守作業員等）は、必要に応じて、ＦＳＴ２０を操作して、任意のディスクの切り離しをＣＭ１０に対して指示する。

図２に上記ＣＭ１０のハードウェア構成図を示す。
図２に示すＣＭ１０は、各ＤＩ３１、各ＤＭＡ３２、２つのＣＰＵ３３，３４、ＭＣＨ(Memory Controller Hub)３５、メモリ３６、及び各ＣＡ３７を有する。

ＤＩ３１は、各ＢＲＴと接続するＦＣコントローラである。ＤＭＡ３２はＦＲＴ３に接続する通信回路である。ＭＣＨ３５は、ＣＰＵ３３，３４の外部バス等の所謂ホスト側のバスを、ＰＣＩバスと接続し、相互に通信できるようにする為の回路である。ＣＡ３７は、ホストと接続する為のアダプタである。

後述する図５や図７等に示す各種フローチャートの処理や図３に示す各機能部の機能は、メモリ３６に予め格納されているアプリケーションプログラムを、ＣＰＵ３３又はＣＰＵ３４が読出し・実行することにより実現される。また、後述する共通テーブル６０等も、メモリ３６に格納される。

図３に、ＣＭ１０の機能ブロック図を示す。
ＣＭ１０は、監視部５１、構成管理部５２、Disk統計部５３、及びDisk組み込み処理部５４を有する。このうち、監視部５１、構成管理部５２、Disk統計部５３の機能は、従来とほぼ同じであってよい（違いは、それぞれが検出／管理するデータを共通テーブル６０に反映させる点である）。

本例のＣＭの特徴は、主にDisk組み込み処理部５４にある。従来でも、Disk組み込み可否を判定する機能部は存在したが、上述してある通り、単に、Disk WWNを用いて判定しているだけである為、上述した問題が生じていた。

監視部５１は、上記ＰＢＣ判断で切り離した場合にＰＢＣから上記の通り通知を受けるので、これを後述する共通テーブル６０のＰＢＣ要因６３に設定する。構成管理部５２は、各ディスクがリカバリ中(Rebuild／Copyback状態)であるか否かを判定し、この判定結果を後述する共通テーブル６０のリカバリ中６４に設定する。

また、各ディスクで発生したエラーの情報は、Disk統計部５３に集約される。すなわち、Disk統計部５３は、ＲＡＩＤ装置１内に搭載されている各ディスク毎に、Error発生毎にこのError事象に対応する点数を加点していき、閾値を超えたディスクを切り離すといった処理を行うモジュールである。

そして、本例のDisk統計部５３は、更に、ディスクを切り離す場合には、切離要因を共通テーブル６０の切離要因６１に設定する。切離要因は、Device系ErrorとFC系Errorの２種類ある。Device系ErrorとFC系Errorの違いは、前者はハードウェア的な異常であり、後者はFC LoopからみたErrorとなる。更に、切離要因の更に詳細な情報として、Disk切り離しFactorを共通テーブル６０のFactor６５に設定する。Disk切り離しFactorは、例えば、Disk統計による切り離し、強制縮退による切り離し、Disk Not Readyによる切り離しなどがある。

Disk組み込み処理部５４は、Disk統計部５３が管理する情報を共有しており、この共通テーブル６０を参照して、切り離されたディスクの再組み込みを許可するか否かを判定する。尚、Disk組み込み処理部５４は、まず、従来通り、Disk WWNによる判定を行っている。よって、任意のディスクを切り離し後に搭載されたディスクのDisk WWNが、登録されているDisk WWNとは異なる場合（保守用ディスク等の新たなディスクが搭載された場合）には、当然、組み込みを許可する。一方、任意のディスクを切り離し後に搭載されたディスクのDisk WWNが、登録されているDisk WWNと同じ場合（上記同一ディスクを用いた活性交換が行われた場合）、従来では必ず、組み込みを許可しなかったが、本手法では以下に示す判定を行うことで、組み込みを許可する場合もある。
＊一旦装置から切り離されたディスクを再度組み込むことを許可するか否かの判定方法
（１）基本的には、以下の条件１〜条件４の全ての条件に合致した場合のみ、再組み込みを許可し、組み込み処理を実施する。但し、必ずしも全ての条件を満たさなければならないわけではない。但し、全ての条件を満たす場合、切り離されたディスクを再度組み込んでも問題が生じる可能性は極めて低いと考えられる。

条件１；切り離し要因がDevice系Error（ディスクのハード的な故障）ではないこと
条件２； FC系Error（ディスク伝送路のError)の場合は、FC Errorの種類に応じて、組み込みを許可するか否かを判断する。すなわち、以下の条件のうち１つでも満たさない場合は、再組み込みは許可しない。
・リカバリ中（Rebuild/Copyback状態）ではないこと（FC系Errorによるリカバリ失敗ディスク(Rebuild/Copyback中ディスク）は、Rebuild/ Copyback処理遅延を防止する目的で、組み込みを行わない)
・明らかにディスク要因の統計加点による切り離しではないこと
条件３； PBC判断の切り離しではないこと（PBC が自発的に切り離したディスクの再組み込みは許可しない）
条件４；上記“Disk切り離しFactor”が、組み込み対象のFactorであること（Disk切り離しFactorを参照し、それが組み込み対象Factorである場合には再組み込みを許可して組み込み実施する）
（２）Disk組み込み処理部５４は、再組み込みを実施した場合、組み込んだ後、一定時間Disk統計部５３を監視し、他のディスクへ加点されているようであれば、組み込んだディスクが原因として当該ディスクを切り離す。換言すれば、再組み込み後は、一定時間、当該ディスクが組み込まれたFC伝送路の統計を監視し、伝送路に加点されているようであれば、当該ディスクを被疑ディスクとして切り離す。尚、上記“他のディスク”とは、例えば、組み込んだディスクと同じLoop上にあるディスク（例えば同じＤＥ内にあるディスク）全てである。

図４に、上記共通テーブルの構成の一例を示す。
図示の共通テーブル６０は、各ディスク毎に上記切り離し要因〜Factor等の各種情報を記憶する記憶領域を用意しており、記憶されたデータはディスク交換時にクリアされる。

図示の共通テーブル６０は、各ディスク毎に、切離要因６１、再組込６２、ＰＢＣ要因６３、リカバリ中６４、及びFactor６５を記憶する。Factor６５以外の情報（切離要因６１、再組込６２、ＰＢＣ要因６３、リカバリ中６４）は、例えば１Bitのフラグ情報である。

切離要因６１には、当該ディスクが、Device系Error（ハード的な壊れ）、FC系Error（伝送路異常）のどちらの要因によって切り離されたかが、Disk統計部５３によって判断されて設定される。例えば、Device系Errorは‘１’、FC系Errorは‘０’が設定される。

再組込６２には、当該ディスクが再組み込みされた場合に、Disk組み込み処理部５４によって例えば‘１’が設定される。‘１’に設定後、一定時間経過したら、‘０’クリアされる。

PBC要因６３には、当該ディスクがPBC判断による切り離しが実施された場合に、ＰＢＣからの通知に応じて監視部５１によって例えば‘１’が設定される。
リカバリ中６４には、当該ディスクに関して、再組み込み以前に、Rebuild/Copybackが動作していた場合に（つまり、当該ディスクの状態がリカバリ中であった場合に）、構成管理部５２によって例えば‘１’が設定される。

Factor６５には、最終的な切り離し要因（例えば後述する‘0x0028’等のエラーコード）が、Disk統計部５３によって判断されて設定される。つまり、上記“Disk切り離しFactor”が設定される。

尚、特に図示しないが、現在搭載されている各ディスクのDisk WWNも記憶されている。
図５に、Disk組み込み処理部５４の処理フローチャート図を示す。この処理は、実施例１に係る処理であるものとする。

例えばＰＢＣ等は、任意のディスクが一旦外された後にディスクが接続されたことを検出すると、このディスク（以下、対象ディスクという）のDisk WWNを読み取ってDisk組み込み処理部５４に通知する（ステップＳ１１）。Disk組み込み処理部５４はステップＳ１２以降の処理を実行する。

すなわち、まず、通知されたDisk WWNと上記記憶してあるDisk WWNとを比較して（ステップＳ１２）、一致しない場合、すなわち例えば切り離されたディスクとは異なるディスクが搭載された場合には（ステップＳ１３，ＮＯ）、通常の組み込み処理を実行する（ステップＳ１４）。一方、Disk WWNが一致した場合、すなわち切り離したディスクが再度搭載された場合には（ステップＳ１３，ＹＥＳ）、ステップＳ１５以降の処理を実行する。

ステップＳ１５以降の処理は、共通テーブル６０において上記再搭載された対象ディスクに関する各種情報を参照して行う。
すなわち、まず、切離要因６１を参照することで、対象ディスクの切り離し要因が、Device系Error（ディスク自体のハード的な壊れ）であるか、FC系Error（伝送路異常）であるかが分かるので、Device系Errorであれば（ステップＳ１６，ＹＥＳ）、対象ディスクの組み込み処理を中断する（再組み込みは許可しない）（ステップＳ２１）。

一方、対象ディスクの切り離し要因が、FC系Error（伝送路異常）である場合でも（ステップＳ１７，ＹＥＳ）、対象ディスクの状態が“リカバリ中”である場合には（リカバリ中６４が例えば‘１’の場合）（ステップＳ１８，ＹＥＳ）、組み込み処理を中断する（再組み込みは許可しない）（ステップＳ２１）。

更に、対象ディスクがＰＢＣ判断で切り離されたものである場合（PBC要因６３が例えば‘１’の場合）（ステップＳ１９，ＹＥＳ）、又は対象ディスクの“Disk切り離しFactor”（Factor６５参照）が、“組み込み対象Factor”ではない場合（ステップＳ２０，ＮＯ）にも、組み込み処理を中断する（再組み込みは許可しない）（ステップＳ２１）。

尚、組み込み対象Factorについては、後に、具体例を示して説明する。また、尚、ステップＳ１９の判定がＮＯになる場合（ＰＢＣ判断での切り離しではない場合）とは、例えば、オペレータ（保守作業員等）がＦＳＴ２０を操作して対象ディスクの切り離しをＣＭ１０に対して指示した場合や、ＣＭ１０側の判断によって対象ディスクが切り離された場合等である。

上記組み込み処理を中断する（再組み込みは許可しない）と判定される場合以外は、当該対象ディスクの組み込み処理を許可し実行する（ステップＳ２２）。
そして、対象ディスクの組み込み処理完了後、予め決められている所定時間でタイムアウトするタイマーを起動する（ステップＳ２３）。そして、タイマーがタイムアウトするまでの間、Disk統計部５３を監視し（Disk統計部５３による上記加点処理状況を監視し）、他のディスクへの加点が、予め設定される第２閾値を越えるか否かを判定し、閾値を超えた場合には（ステップＳ２４，ＹＥＳ）、組み込んだディスクの切り離し処理を実行する（ステップＳ２６）。一方、他のディスクへの加点が閾値を超えることなくタイマーがタイムアウトした場合には（ステップＳ２４，ＮＯ）、そのまま何もしない（ステップＳ２５）。尚、上記ステップＳ２４で用いる第２閾値は、上記切り離しを行うか否かを判定する為の閾値（第１閾値と呼ぶ）とは異なる閾値である（第２閾値＜第１閾値）。

以上説明したように、実施例１による処理では、上記ステップＳ１６〜Ｓ２０に示す全ての条件を満たした場合には、同一ディスクが再搭載された場合であっても、組み込みを許可する。換言すれば、ディスク故障の要因や故障時の状況が、同一ディスクを再搭載しても基本的には問題ないと考えられるものである場合には、同一ディスクの組み込みを許可する。但し、組み込んだディスクが他のディスクに影響を及ぼす可能性がある為、組み込み処理後、所定時間監視を行い、問題があれば、再度切り離すようにしている。

図６（ａ）に、ＦＣ系エラーの一例を示す。
図示の‘0x0028’、‘0x100b’等は、ＦＣ系エラーのエラーコードであり、その意味と、障害要因が、図示の通り、一覧で示してある。

エラーコード‘0x0028’は「構成情報上では存在することになっているが、ＦＣループ上にディスクが存在しなかった」ことを意味し、エラーコード‘0x1083’は「ＦＣループ上にディスクが存在しなかった」ことを意味する。これら２つのエラーが、上記“FC系Error（ディスク伝送路のError)であるが明らかにディスク要因のエラー”の一例である。

尚、同図には、一応、障害要因が伝送路であるFC系Errorの一例も示しておく。すなわち、エラーコード‘0x0002’は「データ転送中にＤＭＡエラーを検出した」ことを意味し、エラーコード‘0x0015’は「データランダーランを検出した」ことを意味し、エラーコード‘0x100b’は「ドライバタイムアウトを検出した」ことを意味する。

また、図６（ｂ）には、上記“Disk切り離しFactor”の具体例を示す。同図に示す“再組み込み可否”が“可”であるFactorが、上記“組み込み対象Factor”である。すなわち、図示の一例では「Disk統計による切り離し」、「強制縮退による切り離し」、「予防保守による切り離し」、及び「Disk Not Ready」の各Factorが、上記“組み込み対象Factor”である。図示の例では、これら以外の各Factorは、上記“組み込み対象Factor”とはならないので、たとえ他の条件を満たしていても再組み込みは許可されない。

すなわち、図示の一例における「Write＆Verify Error」、「ディスクからのSMART通知」、「RAIDリカバリからのディスク切り離し」、「Disk Event検出の切り離し」、及び「DE Off/Onによる切り離し」の各Factorは、上記“組み込み対象Factor”とはならない。

次に、以下、実施例２について説明する。
図７に、実施例２に係るDisk組み込み処理部５４の処理フローチャート図を示す。
実施例２では、図５のステップＳ１３の判定がＹＥＳとなった直後に、ある処理を行うことを前提とする。すなわち、「共通テーブル６０の再組込６２を参照し、もし‘１’であった場合（当該ディスクが再組み込みされたものであることを意味する）、ステップＳ１５に移行することなく直ちに“組み込みを中断する”」という処理を行うことを前提とする。更に、上記ステップＳ２４の判定がＮＯとなった場合、何もしないのではなく、再組込６２に‘１’をセットする（ステップＳ３１）。

そして、上記ステップＳ２３のタイマーとは異なるタイマー（監視タイマーと呼ぶ）をスタートさせる（ステップＳ３２）。この監視タイマーの設定時間は、基本的には、ステップＳ２３のタイマーより長い時間とする。

そして、上記再組み込みしたディスクが、監視タイマーがタイムアウトする前に再び切り離された場合には（ステップＳ３３，ＹＥＳ）、図５の処理を実行するが、ステップＳ３１で再組込６２が‘１’にセットされたままであるので、上記追加処理によって“組み込みを中断する”と判定される。つまり、図５の判定論理を適用することなく、強制的に“組み込みを中断する”と判定させる（ステップＳ３５）。

一方、上記再組み込みしたディスクが再び切り離されることなく上記監視タイマーがタイムアウトした場合には（ステップＳ３３，ＮＯ）、再組込６２を‘０’クリアする（ステップＳ３４）。従って、この場合には、もしその後に再組み込みしたディスクが再び切り離された場合でも、強制的に“組み込みを中断する”と判定されることはなく、図５の判定論理が適用されることになる。

(付記１) 複数のディスクより成るＲＡＩＤグループを有するＲＡＩＤ装置内のモジュールにおいて、
前記各ディスクの識別名が登録される第１の記憶手段と、
前記各ディスクの切離要因が格納される第２の記憶手段と、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、前記第１の記憶手段に登録されている識別名と該搭載されたディスクの識別名とが一致する場合であっても、前記第２の記憶手段を参照して所定の各種条件を満たすか否かを判定し、該条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行するディスク組み込み処理手段と、
を有することを特徴とするモジュール。

（付記２）前記各ディスク毎に、エラー発生毎に該エラー事象に対応する点数を加点していき、該加点結果が予め設定される第１閾値を超えたディスクを切り離す処理を行うディスク統計手段を更に有し、
前記ディスク組み込み処理手段は、前記搭載されたディスクの組み込み処理を実行後に一定時間、該ディスク統計手段による加点状況を監視し、前記搭載されたディスク以外の他のディスクに対する加点結果が、予め設定される第２閾値を越えた場合には、前記搭載されたディスクを切り離すことを特徴とする付記１記載のモジュール。

（付記３）前記所定の各種条件は、少なくとも、前記切り離されたディスクの前記切離要因が、該ディスク自体のハード的な要因ではないことであることを特徴とする付記１記載のモジュール。

（付記４）前記所定の各種条件には、更に、詳細なFactorが“組み込み対象Factor”であるという条件が加わることを特徴とする付記３記載のモジュール。
（付記５）前記第２の記憶手段には、更に、前記各ディスク毎に、ＰＢＣ判断で切り離されたか否かを示す情報が格納され、
前記所定の各種条件には、更に、前記切り離されたディスクが、ＰＢＣ判断で切り離されたものではないという条件が加わることを特徴とする付記３記載のモジュール。

（付記６）前記第２の記憶手段には、更に、前記各ディスクの状態がリカバリ中であるか否かを示す情報が格納され、
前記所定の各種条件には、更に、前記切り離されたディスクの状態がリカバリ中ではないという条件が加わることを特徴とする付記３記載のモジュール。

(付記７) 前記ディスク組み込み処理手段は、前記搭載されたディスクの組み込み処理を実行後、所定時間以内に該ディスクが再び切り離された場合には、前記条件を満たすか否かに関係なく、該ディスクを再度組み込むことは許可しないことを特徴とする付記１記載のモジュール。

（付記８）ＲＡＩＤ装置において、
複数のディスクより成るＲＡＩＤグループと、
前記各ディスクで発生するエラー内容、前記各ディスクの状態を収集・管理すると共に任意のディスクの組み込み処理を実行するモジュールとを有し、
該モジュールは、
前記各ディスクの識別名が登録される第１の記憶手段と、
前記各ディスクの切離要因が格納される第２の記憶手段と、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、前記第１の記憶手段に登録されている識別名と該搭載されたディスクの識別名とが一致する場合であっても、前記第２の記憶手段を参照して所定の各種条件を満たすか否かを判定し、該条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行するディスク組み込み処理手段と、
を有することを特徴とするＲＡＩＤ装置。

（付記９）複数のディスクより成るＲＡＩＤグループを有するＲＡＩＤ装置内のコントローラ・モジュールにおけるディスク組込み可否判定方法であって、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、記憶されている前記各ディスクの識別名と該搭載されたディスクの識別名とが一致する場合であっても、所定の条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行することを特徴とするディスク組込み可否判定方法。

（付記１０）複数のディスクより成るＲＡＩＤグループを有するＲＡＩＤ装置におけるコンピュータに、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、記憶されている前記各ディスクの識別名と該搭載されたディスクの識別名とが一致する場合であっても、所定の条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行する機能、
を実現させる為のプログラム。

ＲＡＩＤ装置の一般的な構成図である。図１に示すＣＭのハードウェア構成図である。図１に示すＣＭの機能ブロック図である。共通テーブルの構成の一例を示す図である。実施例１に係るDisk組み込み処理部の処理フローチャート図である。（ａ）はＦＣ系エラーの一例、（ｂ）は“Disk切り離しFactor”の具体例を示す図である。実施例２に係るDisk組み込み処理部の処理フローチャート図である。（ａ）、（ｂ）は、従来の活性交換の一例を示す図である。

符号の説明

１ＲＡＩＤ装置
２（２ａ，２ｂ）ホスト
３ＦＲＴ
４ＢＲＴ
５ＢＲＴ
６ＤＥ
６ａ，６ｂＰＢＣ
６ｃディスク群
７ＤＥ
７ａ，７ｂＰＢＣ
７ｃディスク群
１０（１０ａ，１０ｂ）ＣＭ
２０ＦＳＴ
３１ＤＩ
３２ＤＭＡ
３３，３４ＣＰＵ
３５ＭＣＨ
３６メモリ
３７ＣＡ
５１監視部
５２構成管理部
５３ Disk統計部
５４ Disk組み込み処理部
６０共通テーブル
６１切離要因
６２再組込
６３ＰＢＣ要因
６４リカバリ中
６５ Factor

Claims

複数のディスクより成るＲＡＩＤグループを有するＲＡＩＤ装置内のモジュールにおいて、
前記各ディスクの識別名が登録される第１の記憶手段と、
前記各ディスクの切離要因が格納される第２の記憶手段と、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、前記第１の記憶手段に登録されている識別名と該搭載されたディスクの識別名とが一致する場合であっても、前記第２の記憶手段を参照して所定の各種条件を満たすか否かを判定し、該条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行するディスク組み込み処理手段と、
を有することを特徴とするモジュール。
前記ディスク組み込み処理手段は、前記搭載されたディスクの組み込み処理を実行後、所定時間以内に該ディスクが再び切り離された場合には、前記条件を満たすか否かに関係なく、該ディスクを再度組み込むことは許可しないことを特徴とする請求項１記載のモジュール。
ＲＡＩＤ装置において、
複数のディスクより成るＲＡＩＤグループと、
前記各ディスクで発生するエラー内容、前記各ディスクの状態を収集・管理すると共に任意のディスクの組み込み処理を実行するモジュールとを有し、
該モジュールは、
前記各ディスクの識別名が登録される第１の記憶手段と、
前記各ディスクの切離要因が格納される第２の記憶手段と、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、前記第１の記憶手段に登録されている識別名と該搭載されたディスクの識別名とが一致する場合であっても、前記第２の記憶手段を参照して所定の各種条件を満たすか否かを判定し、該条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行するディスク組み込み処理手段と、
を有することを特徴とするＲＡＩＤ装置。
複数のディスクより成るＲＡＩＤグループを有するＲＡＩＤ装置内のコントローラ・モジュールにおけるディスク組込み可否判定方法であって、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、記憶されている前記各ディスクの識別名と該搭載されたディスクの識別名とが一致する場合であっても、所定の条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行することを特徴とするディスク組込み可否判定方法。
複数のディスクより成るＲＡＩＤグループを有するＲＡＩＤ装置におけるコンピュータに、
任意の前記ディスクが切り離され、任意のディスクが搭載されたことが検出されると、記憶されている前記各ディスクの識別名と該搭載されたディスクの識別名とが一致する場合であっても、所定の条件を満たす場合には、前記搭載されたディスクの組み込み処理を実行する機能、
を実現させる為のプログラム。