JP6212934B2

JP6212934B2 - ストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法

Info

Publication number: JP6212934B2
Application number: JP2013097648A
Authority: JP
Inventors: 荻原　一隆; 一隆荻原
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-05-07
Filing date: 2013-05-07
Publication date: 2017-10-18
Anticipated expiration: 2033-05-07
Also published as: JP2014219787A; US20140337665A1; US9507664B2

Description

本発明は、ストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法に関する。

複数のディスクでＲＡＩＤ（Redundant Arrays of Independent Disks）を構成してデータの可用性および信頼性を確保するストレージシステムが知られている。ストレージシステムでは、ＲＡＩＤを構成するディスクの障害に備えて、複数のＲＡＩＤグループに共通のスペアディスクを用意したり、特定のＲＡＩＤグループに専用のスペアディスクを用意したりしてディスクの故障に備える。ストレージシステムは、ディスクの障害時にスペアディスクを交えたリビルド処理により、障害からの復旧をおこなう。

特開２００９−１８７４０６号公報特開２００５−１００２５９号公報

しかしながら、ストレージシステムは、所定数のディスクを収容可能な、ディスクボックスやディスクエンクロージャと呼ばれるストレージユニットを複数備えることで、多数のディスクをディスクプールとして管理する場合がある。

このようなストレージシステムは、信頼性を考慮してそれぞれ異なるストレージユニットのディスクによってＲＡＩＤを構成するが、ディスクの障害によりスペアディスクを交えたリビルド処理をおこなうと、ＲＡＩＤを構成する複数のディスクが同一のストレージユニットに属することがある。このとき、ストレージユニット単位の障害が発生すると、ストレージシステムは、複数のディスクで同時に障害が発生することとなり、データロストするおそれがある。

１つの側面では、本発明は、ストレージユニット単位の障害によるデータロストを防止できるストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法を提供することを目的とする。

上記目的を達成するために、以下に示すような、ストレージシステムが提供される。ストレージシステムは、複数のストレージデバイスを有する複数のストレージユニットと、ストレージデバイスを管理する管理装置と、管理装置から割当を受けてストレージデバイスと接続可能な情報処理装置と、を備える。情報処理装置は、構成部と、検出部と、再構成部と、複製部と、を備える。構成部は、それぞれ異なるストレージユニットに属するストレージデバイスの割当を受けてグループを構成する。検出部は、グループを構成するストレージデバイスの障害を検出する。再構成部は、障害を検出したストレージデバイスを代替するストレージデバイスを、グループを構成するその余のストレージデバイスが属するストレージユニットから割当を受ける場合に、その余のストレージデバイスが属するストレージユニットのうちの第１のストレージユニットから第１のストレージデバイスの割当を受けてグループの再構成をおこなう。複製部は、その余のストレージデバイスが属するストレージユニットのうちの第２のストレージユニットから第２のストレージデバイスの割当を受けて、第２のストレージデバイスに第１のストレージデバイスを複製する。

１態様によれば、ストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法において、ストレージユニット単位の障害によるデータロストを防止できる。

第１の実施形態のストレージシステムの構成の一例を示す図である。第２の実施形態のストレージシステムの構成の一例を示す図である。第２の実施形態のディスクエンクロージャの構成の一例を示す図である。第２の実施形態のサーバのハードウェア構成の一例を示す図である。第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。第２の実施形態のＲＡＩＤ構成情報の一例を示す図である。第２の実施形態の故障処理のフローチャートを示す図である。第２の実施形態のディスク故障再構成処理のフローチャートを示す図である。第２の実施形態のディスクエンクロージャ故障再構成処理のフローチャートを示す図である。第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。第２の実施形態のＲＡＩＤ構成情報の一例を示す図である。第２の実施形態の復旧処理のフローチャートを示す図である。第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。第３の実施形態のディスクエンクロージャ故障再構成処理のフローチャートを示す図である。第３の実施形態のディスクエンクロージャ故障再構成処理のフローチャートを示す図である。第３の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。第３の実施形態のＲＡＩＤ構成情報の一例を示す図である。第３の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。

以下、実施の形態について、図面を参照しながら詳細に説明する。
［第１の実施形態］
まず、第１の実施形態のストレージシステムについて図１を用いて説明する。図１は、第１の実施形態のストレージシステムの構成の一例を示す図である。

ストレージシステム１は、管理装置２と、情報処理装置３と、複数のストレージユニット４を備える。図１に示すストレージシステム１は、４つのストレージユニット４（４ａ，４ｂ，４ｃ，４ｄ）を備えるが、３または５以上のストレージユニット４を備えるものであってもよい。

ストレージユニット４は、複数のストレージデバイス５を有する。ストレージユニット４は、たとえば、ディスクボックスやディスクエンクロージャなどであり、複数のストレージデバイス５を収容する。ストレージユニット４は、収容する複数のストレージデバイス５の電源供給や冷却、所要のコントロールなどを担う。ストレージデバイス５は、データを格納可能なデバイスであり、たとえば、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive:フラッシュメモリドライブ）などである。

管理装置２は、ストレージシステム１におけるストレージ資源を管理し、情報処理装置３へのストレージデバイス５の割当を担う。管理装置２は、通信パス７を介してストレージユニット４と接続し、ストレージユニット４、およびストレージユニット４が収容するストレージデバイス５を管理する。また、管理装置２は、通信パス６を介して情報処理装置３と接続し、情報処理装置３とストレージデバイス５との接続を管理する。

情報処理装置３は、管理装置２からストレージ資源の割当を受けて、割当を受けたストレージ資源にデータを格納する。情報処理装置３は、通信パス８を介してストレージユニット４と接続し、割当を受けたストレージ資源、すなわち割当を受けたストレージデバイス５と接続する。

情報処理装置３は、構成部３ａと、検出部３ｂと、再構成部３ｃと、複製部３ｄを備える。構成部３ａは、それぞれ異なるストレージユニット４に属するストレージデバイス５の割当を受けてグループを構成する。グループは、たとえばＲＡＩＤグループであり、ＲＡＩＤの１つにＲＡＩＤ５などがある。図１に示すＲＡＩＤグループの構成例では、ストレージデバイス５ａ，５ｂ，５ｃ，５ｄは、それぞれデータ「Ａ」，「Ｂ」，「Ｃ」，「Ｄ」を格納してＲＡＩＤグループを構成する。ストレージデバイス５ａ，５ｂ，５ｃ，５ｄは、それぞれ、異なるストレージユニット４ａ，４ｂ，４ｃ，４ｄに属する。

このように、グループを構成するストレージデバイス５をそれぞれ異なるストレージユニット４から割り当てることで、ストレージシステム１は、グループを構成する複数のストレージデバイス５の同時故障によるデータロストの危険を低減する。

検出部３ｂは、グループを構成するストレージデバイス５の障害を検出する。検出部３ｂは、通信パス８を介して接続するストレージデバイス５の障害を検出することができる。また、検出部３ｂは、通信パス６を介して接続する管理装置２からの通知によりストレージデバイス５の障害を検出することができる。また、検出部３ｂは、管理装置２からの通知によりストレージデバイス５が属するストレージユニット４の障害を検出することができる。

再構成部３ｃは、検出部３ｂによるグループを構成するストレージデバイス５の障害検出により、障害を検出したストレージデバイス５をグループの構成から外す。再構成部３ｃは、あらたにストレージデバイス５の割当を受けてグループの再構成をおこなう。このとき、再構成部３ｃは、構成部３ａがグループを構成したように、障害を検出していないストレージデバイス５とは異なるストレージユニット４からストレージデバイス５の割当を受けることが望ましい。しかしながら、再構成部３ｃは、ストレージ資源の状況によっては、障害を検出していないストレージデバイス５が属するストレージユニット４から割当を受けざるを得ない場合がある。このような場合に、再構成部３ｃは、障害を検出していないストレージデバイス５が属するストレージユニット４のうちの１つからストレージデバイス５の割当を受けてグループの再構成をおこなう。

図１に示すグループの構成例において、再構成部３ｃは、ストレージデバイス５ａの障害検出を受けて、ストレージデバイス５ｂの属するストレージユニット４ｂからストレージデバイス５ｅを割り当てる。したがって、再構成部３ｃは、ストレージデバイス５ａの障害検出後、ストレージデバイス５ｅ，５ｂ，５ｃ，５ｄに、それぞれデータ「Ａ１（Ａ）」，「Ｂ」，「Ｃ」，「Ｄ」を格納してグループを再構成する。ストレージデバイス５ｅ，５ｂは、ともにストレージユニット４ｂに属し、ストレージデバイス５ｃ，５ｄは、それぞれ、ストレージユニット４ｃ，４ｄに属する。このとき、ストレージユニット４ｂに障害が発生すると、ストレージデバイス５ｅ，５ｂにも障害が発生してデータをロストするおそれがある。

複製部３ｄは、障害を検出していないストレージデバイス５が属するストレージユニット４のうち再構成部３ｃが割当を受けたストレージデバイス５が属するストレージユニット４と異なるストレージユニット４からストレージデバイス５の割当を受ける。複製部３ｄは、複製部３ｄが割当を受けたストレージデバイス５に、再構成部３ｃが割当を受けたストレージデバイス５を複製する。

図１に示すグループの構成例において、複製部３ｄは、ストレージデバイス５ｅ，５ｂがともにストレージユニット４ｂに属することから、ストレージユニット４ｂ以外のストレージユニット４からストレージデバイス５を割り当てる。この場合、複製部３ｄは、ストレージデバイス５ｃの属するストレージユニット４ｃからストレージデバイス５ｆを割り当てる。複製部３ｄは、ストレージデバイス５ｅをストレージデバイス５ｆに複製する。したがって、複製部３ｄは、ストレージデバイス５ｅ，５ｆは、それぞれデータ「Ａ１（Ａ）」，「Ａ２（Ａ）」を格納してＲＡＩＤ１を構成する。

これにより、ストレージシステム１は、ストレージユニット４ｂ，４ｃ，４ｄのいずれに障害が発生しても、データをロストすることがない。また、ストレージシステム１は、ＲＡＩＤ１による２重化機会を限定するため、グループ構成時に使用するストレージデバイス５の数を抑制できる。したがって、ストレージシステム１は、低コストにして耐障害性に優れるシステムを構築可能である。

［第２の実施形態］
次に、第２の実施形態のストレージシステムの構成について図２を用いて説明する。図２は、第２の実施形態のストレージシステムの構成の一例を示す図である。

ストレージシステム１０は、リソースマネージャ１１と、サーバ１２と、複数のディスクエンクロージャ１３を備える。ディスクエンクロージャ１３は、ストレージ資源として複数のディスク１５を収容する。なお、図２に示すディスクエンクロージャ１３は、６つのディスク１５を備えるが、２以上を備えるもの（たとえば、２４）であればいくつであってもよい。ディスク１５は、データを格納可能なストレージデバイスであり、たとえば、ＨＤＤやＳＳＤなどである。

ディスクエンクロージャ１３は、スイッチ１４を備え、スイッチ１４により外部機器（サーバ１２）とディスク１５との接続および切り離しをおこなう。スイッチ１４は、リソースマネージャ１１の制御対象であり、通信パス１７によりリソースマネージャ１１と接続する。

ストレージシステム１０は、ディスクエンクロージャ１３を一単位にしてストレージ資源の交換あるいは増減をおこなうことができる。なお、図２に示すストレージシステム１０は、４つのディスクエンクロージャ１３（１３ａ，１３ｂ，１３ｃ，１３ｄ）を備えるが、３または５以上のディスクエンクロージャ１３を備えるものであってもよい。

リソースマネージャ１１は、ストレージシステム１０におけるストレージ資源を管理する管理装置であり、サーバ１２へのディスク１５の割当を担う。リソースマネージャ１１は、通信パス１７を介してディスクエンクロージャ１３と接続し、ディスクエンクロージャ１３、およびディスクエンクロージャ１３が収容するディスク１５を管理する。また、リソースマネージャ１１は、通信パス１６を介してサーバ１２と接続し、サーバ１２とディスク１５との接続を管理する。

リソースマネージャ１１は、スイッチ１４を制御し、サーバ１２とディスク１５との接続によりサーバ１２へのディスク１５の割当をおこなう。また、リソースマネージャ１１は、スイッチ１４を制御し、サーバ１２とディスク１５との接続解除（切り離し）によりサーバ１２へのディスク１５の割当解消をおこなう。なお、図２に示すストレージシステム１０は、１つのリソースマネージャ１１を備えるが、２以上のリソースマネージャ１１を備えて冗長性確保あるいは負荷分散を図るものであってもよい。

サーバ１２は、ストレージシステム１０においてリソースマネージャ１１からストレージ資源の割当を受ける情報処理装置である。サーバ１２は、各ディスクエンクロージャ１３が備えるスイッチ１４と通信パス１８を介して接続する。サーバ１２は、スイッチ１４を介して接続するディスク１５の接続と接続解除を、ホットプラグ機能により認識できる。なお、図２に示すストレージシステム１０は、３つのサーバ１２（１２ａ，１２ｂ，１２ｃ）を備えるが、任意の数のサーバ１２を備えることができる。

サーバ１２は、複数のディスクエンクロージャ１３からそれぞれディスク１５の割当を受けて、ＲＡＩＤ（たとえば、ＲＡＩＤ５）グループを構成する。サーバ１２は、複数のＲＡＩＤグループを構成可能であり、それぞれのＲＡＩＤグループは識別情報によって区別される。このように、ＲＡＩＤグループを構成するディスク１５をそれぞれ異なるディスクエンクロージャ１３から割り当てることで、ストレージシステム１０は、ＲＡＩＤグループを構成する複数のディスク１５の同時故障によるデータロストの危険を低減する。

なお、複数のサーバ１２と、複数のディスクエンクロージャ１３を、通信パス１８を介してそれぞれ接続するようにしたが、別途スイッチを設けて接続するようにしてもよい。
次に、第２の実施形態のディスクエンクロージャの構成について図３を用いて説明する。図３は、第２の実施形態のディスクエンクロージャの構成の一例を示す図である。

ディスクエンクロージャ１３は、スイッチ１４と、複数のディスク１５と、コントローラ２５と、電源部２６と、冷却部２７を備える。スイッチ１４は、各ディスク１５について外部機器との接続および切り離しをおこなう。冷却部２７は、ディスク１５、電源部２６を含めてディスクエンクロージャ１３の筺体内を冷却する。電源部２６は、コントローラ２５、冷却部２７、スイッチ１４、およびディスク１５を含むディスクエンクロージャ１３内の各機器に電力を供給する。

コントローラ２５は、ディスクエンクロージャ１３内の各機器を制御する。また、コントローラ２５は、ディスクエンクロージャ１３内の各機器の状態監視をおこない、ディスクエンクロージャ１３内の各機器の故障、またはディスクエンクロージャ１３全体としての故障を検出する。コントローラ２５は、検出した故障をリソースマネージャ１１に通知する。

次に、第２の実施形態のサーバのハードウェア構成について図４を用いて説明する。図４は、第２の実施形態のサーバのハードウェア構成の一例を示す図である。
サーバ１２は、プロセッサ１０１によって装置全体が制御されている。プロセッサ１０１には、バス１０６を介してＲＡＭ（Random Access Memory）１０２と複数の周辺機器が接続されている。プロセッサ１０１は、マルチプロセッサであってもよい。プロセッサ１０１は、たとえばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、またはＰＬＤ（Programmable Logic Device）である。またプロセッサ１０１は、ＣＰＵ、ＭＰＵ、ＤＳＰ、ＡＳＩＣ、ＰＬＤのうちの２以上の要素の組み合わせであってもよい。

ＲＡＭ１０２は、サーバ１２の主記憶装置として使用される。ＲＡＭ１０２には、プロセッサ１０１に実行させるオペレーティングシステム（Operating System）のプログラムやファームウェア、アプリケーションプログラムの少なくとも一部が一時的に格納される。また、ＲＡＭ１０２には、プロセッサ１０１による処理に必要な各種データ（たとえば、システム制御の情報管理）が格納される。また、ＲＡＭ１０２は、各種データの格納に用いるメモリと別体にキャッシュメモリを含むものであってもよい。

バス１０６に接続されている周辺機器としては、不揮発性メモリ１０３、入出力インタフェース１０４、および通信インタフェース１０５がある。
不揮発性メモリ１０３は、サーバ１２の電源遮断時においても記憶内容を保持する。不揮発性メモリ１０３は、たとえば、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read-Only Memory）やフラッシュメモリなどの半導体記憶装置や、ＨＤＤなどである。また、不揮発性メモリ１０３は、サーバ１２の補助記憶装置として使用される。不揮発性メモリ１０３には、オペレーティングシステムのプログラムやファームウェア、アプリケーションプログラム、および各種データが格納される。

入出力インタフェース１０４は、図示しない入出力装置と接続して入出力をおこなう。
通信インタフェース１０５は、通信パス１６，１８を形成するネットワークと接続することで、通信パス１６，１８を介して、リソースマネージャ１１やディスクエンクロージャ１３との間でデータの送受信をおこなう。

以上のようなハードウェア構成によって、第２の実施形態のサーバ１２の処理機能を実現することができる。なお、サーバ１２の他、リソースマネージャ１１、コントローラ２５、第１の実施形態に示した管理装置２、情報処理装置３、ストレージユニット４も、図４に示したサーバ１２と同様のハードウェアにより実現することができる。

サーバ１２は、たとえばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第２の実施形態の処理機能を実現する。サーバ１２に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。たとえば、サーバ１２に実行させるプログラムを不揮発性メモリ１０３に格納しておくことができる。プロセッサ１０１は、不揮発性メモリ１０３内のプログラムの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。またサーバ１２に実行させるプログラムを、図示しない光ディスク、メモリ装置、メモリカードなどの可搬型記録媒体に記録しておくこともできる。光ディスクには、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ−ＲＡＭ、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ−Ｒ（Recordable）／ＲＷ（ReWritable）などがある。メモリ装置は、入出力インタフェース１０４あるいは図示しない機器接続インタフェースとの通信機能を搭載した記録媒体である。たとえば、メモリ装置は、メモリリーダライタによりメモリカードへのデータの書き込み、またはメモリカードからのデータの読み出しをおこなうことができる。メモリカードは、カード型の記録媒体である。

可搬型記録媒体に格納されたプログラムは、たとえばプロセッサ１０１からの制御により、不揮発性メモリ１０３にインストールされた後、実行可能となる。またプロセッサ１０１が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。

次に、第２の実施形態のサーバが構成するＲＡＩＤグループについて図５を用いて説明する。図５は、第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。

ディスクエンクロージャ１３ａは、複数のディスク１５（「＃Ａ１」，「＃Ａ２」，「＃Ａ３」，・・・）を備える。ディスクエンクロージャ１３ｂは、複数のディスク１５（「＃Ｂ１」，「＃Ｂ２」，「＃Ｂ３」，・・・）を備える。ディスクエンクロージャ１３ｃは、複数のディスク１５（「＃Ｃ１」，「＃Ｃ２」，「＃Ｃ３」，・・・）を備える。ディスクエンクロージャ１３ｄは、複数のディスク１５（「＃Ｄ１」，「＃Ｄ２」，「＃Ｄ３」，・・・）を備える。

サーバ１２（たとえば、サーバ１２ａ）は、ディスクエンクロージャ１３ａ，１３ｂ，１３ｃ，１３ｄからそれぞれディスク１５（「＃Ａ１」，「＃Ｂ１」，「＃Ｃ１」，「＃Ｄ１」）の割当を受けてＲＡＩＤグループ３０（たとえば、ＲＡＩＤ５）を構成する。

ＲＡＩＤグループ３０は、ディスク１５（「＃Ａ１」，「＃Ｂ１」，「＃Ｃ１」，「＃Ｄ１」）がそれぞれ異なるディスクエンクロージャ１３に属する。そのため、サーバ１２は、４つのディスクエンクロージャ１３のうちの１つが故障しても、故障するディスク１５が１つに限られる。したがって、サーバ１２は、ＲＡＩＤグループ３０のデータへのアクセスを継続可能であり、またＲＡＩＤグループ３０を再構成可能である。

次に、第２の実施形態のサーバが管理するＲＡＩＤ構成情報について図６を用いて説明する。図６は、第２の実施形態のＲＡＩＤ構成情報の一例を示す図である。
ＲＡＩＤ構成情報５０は、サーバ１２（たとえば、サーバ１２ａ）が管理するＲＡＩＤグループの構成を示す情報である。サーバ１２は、たとえば、不揮発性メモリ１０３にＲＡＩＤ構成情報５０を保持する。ＲＡＩＤ構成情報５０は、ＲＡＩＤグループＩＤ（Identification）、ブロックＮｏ．、ステータス、ディスクエンクロージャＩＤ、ディスクＩＤを含む。

ＲＡＩＤグループＩＤは、サーバ１２が管理するＲＡＩＤグループ３０を識別するための情報である。ＲＡＩＤ構成情報５０に示すＲＡＩＤグループＩＤは、いずれも「＃０００１」であり、ＲＡＩＤ構成情報５０に示す情報は、同一のＲＡＩＤグループに属する情報である。

ブロックＮｏ．は、ＲＡＩＤグループ３０を構成するディスク１５に付したシリアル番号である。ステータスは、ＲＡＩＤグループ３０を構成するディスク１５の状態を示す。通常時のステータスは、「物理」である。ディスクエンクロージャＩＤは、ストレージシステム１０内でディスクエンクロージャ１３を一意に識別可能な識別情報である。ディスクＩＤは、各ディスクエンクロージャ１３内でディスク１５を一意に識別可能な識別情報である。したがって、サーバ１２は、ディスクエンクロージャＩＤとディスクＩＤとから、ストレージシステム１０内でディスク１５を一意に識別できる。

したがって、ＲＡＩＤ構成情報５０は、ブロックＮｏ．「１」，「２」，「３」，「４」の４つのディスク１５からＲＡＩＤグループＩＤ「＃０００１」のＲＡＩＤグループ３０が構成されていることを示す。また、ＲＡＩＤ構成情報５０は、ステータス「物理」より、通常のＲＡＩＤグループが構成されていることを示す。また、ＲＡＩＤ構成情報５０は、ブロックＮｏ．「１」のディスク１５がディスクエンクロージャＩＤ「＃Ａ」、ディスクＩＤ「＃１」であることを示す。同様に、ＲＡＩＤ構成情報５０は、ブロックＮｏ．「２」のディスク１５がディスクエンクロージャＩＤ「＃Ｂ」、ディスクＩＤ「＃１」であることを示す。同様に、ＲＡＩＤ構成情報５０は、ブロックＮｏ．「３」のディスク１５がディスクエンクロージャＩＤ「＃Ｃ」、ディスクＩＤ「＃１」であることを示す。同様に、ＲＡＩＤ構成情報５０は、ブロックＮｏ．「４」のディスク１５がディスクエンクロージャＩＤ「＃Ｄ」、ディスクＩＤ「＃１」であることを示す。

次に、第２の実施形態の故障処理について図７を用いて説明する。図７は、第２の実施形態の故障処理のフローチャートを示す図である。
故障処理は、ストレージ資源の故障を検出してＲＡＩＤの再構成をおこなう処理である。故障処理は、サーバ１２が定期的に実行する処理である。

［ステップＳ１１］サーバ１２のプロセッサ１０１（制御部）は、ディスク故障情報を取得する。ディスク故障情報は、サーバ１２に割当のあるディスク１５の故障に関する情報である。プロセッサ１０１は、通信パス１８を介して定期または不定期にディスク１５の稼働状態を監視することによりディスク１５の故障を検出してディスク故障情報を生成する。プロセッサ１０１は、ディスク１５へのポーリングまたはディスク１５からの通知により、ディスク１５の稼働状態を監視することができる。

［ステップＳ１２］制御部は、ディスクエンクロージャ故障情報を取得する。ディスクエンクロージャ故障情報は、リソースマネージャ１１が管理するディスクエンクロージャ１３の故障に関する情報である。リソースマネージャ１１は、通信パス１７を介して定期または不定期にディスクエンクロージャ１３の稼働状態を監視することによりディスクエンクロージャ１３の故障を検出してディスクエンクロージャ故障情報を生成する。リソースマネージャ１１は、ディスクエンクロージャ１３へのポーリングまたはディスクエンクロージャ１３からの通知により、ディスクエンクロージャ１３の稼働状態を監視することができる。なお、リソースマネージャ１１は、ディスクエンクロージャ１３を介して検出したディスク故障にもとづいてディスク故障情報を生成してサーバ１２に通知するようにしてもよい。

［ステップＳ１３］制御部は、ディスク故障情報およびディスクエンクロージャ故障情報からディスク１５の故障の有無を判定する。制御部は、ディスク１５の故障ありと判定した場合にステップＳ１４にすすみ、ディスク１５の故障なしと判定した場合に故障処理を終了する。

［ステップＳ１４］制御部は、ＲＡＩＤ構成情報を参照して故障したディスク１５に関係するＲＡＩＤグループの有無を判定する。制御部は、故障したディスク１５に関係するＲＡＩＤグループがある場合にステップＳ１５にすすみ、故障したディスク１５に関係するＲＡＩＤグループがない場合に故障処理を終了する。

［ステップＳ１５］制御部は、故障したディスク１５を構成要素とするＲＡＩＤグループの１つを特定する。
［ステップＳ１６］制御部は、故障個所がディスク１５かディスクエンクロージャ１３かを判定する。制御部は、故障個所がディスク１５の場合にステップＳ１７にすすみ、故障個所がディスクエンクロージャ１３の場合にステップＳ１８にすすむ。

［ステップＳ１７］制御部は、ディスク故障再構成処理を実行する。ディスク故障再構成処理は、ディスク１５が故障した場合にＲＡＩＤの再構成をおこなう処理である。詳細は、図８を用いて後で説明する。

［ステップＳ１８］制御部は、ディスクエンクロージャ故障再構成処理を実行する。ディスクエンクロージャ故障再構成処理は、ディスクエンクロージャ１３が故障した場合にＲＡＩＤの再構成をおこなう処理である。詳細は、図９を用いて後で説明する。

［ステップＳ１９］制御部は、ステップＳ１５で特定したＲＡＩＤグループの他に、故障したディスク１５を構成要素とするＲＡＩＤグループ、すなわち再構成対象のＲＡＩＤグループがまだあるか否かを判定する。制御部は、再構成対象のＲＡＩＤグループがあると判定した場合にステップＳ１５にすすみ、再構成対象のＲＡＩＤグループがないと判定した場合に故障処理を終了する。

次に、第２の実施形態のディスク故障再構成処理について図８を用いて説明する。図８は、第２の実施形態のディスク故障再構成処理のフローチャートを示す図である。ディスク故障再構成処理は、故障処理のステップＳ１７でサーバ１２が実行する処理である。

［ステップＳ２１］サーバ１２のプロセッサ１０１（制御部）は、故障したディスク１５が属するディスクエンクロージャ１３（ＤＥ：Disk Enclosure）、すなわち故障ディスクのＤＥに空きディスクがあるか否かを判定する。制御部は、リソースマネージャ１１に照会することにより、故障ディスクのＤＥに空きディスクがあるか否かを判定することができる。制御部は、故障ディスクのＤＥに空きディスクがある場合にステップＳ２２にすすみ、故障ディスクのＤＥに空きディスクがない場合にステップＳ２３にすすむ。

［ステップＳ２２］制御部は、故障ディスクが属するディスクエンクロージャ１３からディスク１５の割当を受けて、代替ディスクを獲得する。
［ステップＳ２３］制御部は、ＲＡＩＤグループを構成するディスクが属さないディスクエンクロージャ１３（ＤＥ）、すなわちＲＡＩＤ構成外ＤＥに空きディスクがあるか否かを判定する。制御部は、リソースマネージャ１１に照会することにより、ＲＡＩＤ構成外ＤＥに空きディスクがあるか否かを判定することができる。制御部は、空きディスクがある場合にステップＳ２４にすすみ、空きディスクがない場合にステップＳ２５にすすむ。

［ステップＳ２４］制御部は、ＲＡＩＤ構成外ＤＥから代替ディスクを獲得する。
［ステップＳ２５］制御部は、ＲＡＩＤグループを構成するディスクが属する２以上のディスクエンクロージャ１３（ＤＥ）、すなわちＲＡＩＤ構成ＤＥに空きディスクがあるか否かを判定する。制御部は、リソースマネージャ１１に照会することにより、２以上のＲＡＩＤ構成ＤＥに空きディスクがあるか否かを判定することができる。制御部は、２以上のＲＡＩＤ構成ＤＥに空きディスクがない場合にステップＳ２６にすすみ、２以上のＲＡＩＤ構成ＤＥに空きディスクがある場合にステップＳ２７にすすむ。

［ステップＳ２６］制御部は、１つのＲＡＩＤ構成ＤＥからディスク１５の割当を受けて、代替ディスクを獲得する。
［ステップＳ２７］制御部は、２以上のＲＡＩＤ構成ＤＥのうちの２つのＲＡＩＤ構成ＤＥから１つずつディスク１５の割当を受けて、代替ディスクを獲得する。

［ステップＳ２８］制御部は、獲得した代替ディスクを含めてＲＡＩＤ再構成（第１のリビルド処理）をおこなう。このとき、ステップＳ２２，Ｓ２４において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクがそれぞれ異なるディスクエンクロージャ１３に属する。一方、ステップＳ２６において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクが一部のディスクエンクロージャ１３に重複して属する。そのため、このＲＡＩＤグループは、一部のディスクエンクロージャ１３が故障した場合に、データロストのおそれがある。

［ステップＳ２９］制御部は、獲得した代替ディスクを含めてＲＡＩＤ１併用ＲＡＩＤ再構成（第２のリビルド処理）をおこなう。ステップＳ２７において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクが一部のディスクエンクロージャ１３に重複して属する。制御部は、２つの代替ディスクがそれぞれの複製となるようにして、ＲＡＩＤグループを再構成する。ＲＡＩＤグループの再構成については、後で図１０から図１２を用いてＲＡＩＤグループの再構成例を挙げて説明する。

［ステップＳ３０］制御部は、ＲＡＩＤ構成情報を更新してディスク故障再構成処理を終了する。
次に、第２の実施形態のディスクエンクロージャ故障再構成処理について図９を用いて説明する。図９は、第２の実施形態のディスクエンクロージャ故障再構成処理のフローチャートを示す図である。ディスクエンクロージャ故障再構成処理は、故障処理のステップＳ１８でサーバ１２が実行する処理である。

［ステップＳ３１］サーバ１２のプロセッサ１０１（制御部）は、ＲＡＩＤグループを構成するディスクが属さないディスクエンクロージャ１３（ＤＥ）、すなわちＲＡＩＤ構成外ＤＥに空きディスクがあるか否かを判定する。制御部は、リソースマネージャ１１に照会することにより、ＲＡＩＤ構成外ＤＥに空きディスクがあるか否かを判定することができる。制御部は、空きディスクがある場合にステップＳ３２にすすみ、空きディスクがない場合にステップＳ３３にすすむ。

［ステップＳ３２］制御部は、ＲＡＩＤ構成外ＤＥから代替ディスクを獲得する。
［ステップＳ３３］制御部は、ＲＡＩＤグループを構成するディスクが属する２以上のディスクエンクロージャ１３（ＤＥ）、すなわちＲＡＩＤ構成ＤＥに空きディスクがあるか否かを判定する。制御部は、リソースマネージャ１１に照会することにより、２以上のＲＡＩＤ構成ＤＥに空きディスクがあるか否かを判定することができる。制御部は、２以上のＲＡＩＤ構成ＤＥに空きディスクがない場合にステップＳ３４にすすみ、２以上のＲＡＩＤ構成ＤＥに空きディスクがある場合にステップＳ３５にすすむ。

［ステップＳ３４］制御部は、１つのＲＡＩＤ構成ＤＥからディスク１５の割当を受けて、代替ディスクを獲得する。
［ステップＳ３５］制御部は、２以上のＲＡＩＤ構成ＤＥのうちの２つのＲＡＩＤ構成ＤＥから１つずつディスク１５の割当を受けて、代替ディスクを獲得する。

［ステップＳ３６］制御部は、獲得した代替ディスクを含めてＲＡＩＤ再構成（第１のリビルド処理）をおこなう。このとき、ステップＳ３２において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクがそれぞれ異なるディスクエンクロージャ１３に属する。一方、ステップＳ３４において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクが一部のディスクエンクロージャ１３に重複して属する。そのため、このＲＡＩＤグループは、一部のディスクエンクロージャ１３が故障した場合に、データロストのおそれがある。

［ステップＳ３７］制御部は、獲得した代替ディスクを含めてＲＡＩＤ１併用ＲＡＩＤ再構成（第２のリビルド処理）をおこなう。ステップＳ３５において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクが一部のディスクエンクロージャ１３に重複して属する。制御部は、２つの代替ディスクがそれぞれの複製となるようにして、ＲＡＩＤグループを再構成する。ＲＡＩＤグループの再構成については、後で図１０から図１２を用いてＲＡＩＤグループの再構成例を挙げて説明する。

［ステップＳ３８］制御部は、ＲＡＩＤ構成情報を更新してディスクエンクロージャ故障再構成処理を終了する。
次に、第２の実施形態のＲＡＩＤ構成ＤＥから代替ディスクを獲得する場合のＲＡＩＤ再構成について図１０から図１２を用いて説明する。まず、ＲＡＩＤ構成ＤＥの１つが故障して、代替ディスクを他のＲＡＩＤ構成ＤＥから獲得しなければならない場合について図１０を用いて説明する。図１０は、第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。

ディスクエンクロージャ１３ａは、故障により、複数のディスク１５（「＃Ａ１」，「＃Ａ２」，「＃Ａ３」，・・・）が故障した状態である。制御部は、ディスクエンクロージャ１３ａの故障検出により、他のディスクエンクロージャ１３からディスク１５「＃Ａ１」を代替するディスク１５の割当を受ける。たとえば、ディスク故障再構成処理のステップＳ２６、またはディスクエンクロージャ故障再構成処理のステップＳ３４の場合、制御部は、ディスクエンクロージャ１３ｂからディスク１５「＃Ｂ２」の割当を受ける。また、ディスク故障再構成処理のステップＳ２７、またはディスクエンクロージャ故障再構成処理のステップＳ３５の場合、制御部は、ディスク１５「＃Ｂ２」に加えて、ディスクエンクロージャ１３ｃからディスク１５「＃Ｃ２」の割当を受ける。

制御部は、ディスクエンクロージャ１３ａのディスク１５「＃Ａ１」に代えてディスクエンクロージャ１３ｂのディスク１５「＃Ｂ２」を加えて、ＲＡＩＤグループ３０をＲＡＩＤグループ３０ａとして再構成する。

すなわち、制御部は、ディスクエンクロージャ１３ｂ，１３ｃ，１３ｄからそれぞれディスク１５（「＃Ｂ２」，「＃Ｂ１」，「＃Ｃ１」，「＃Ｄ１」）の割当を受けてＲＡＩＤグループ３０をＲＡＩＤグループ３０ａとして再構成する。

ＲＡＩＤグループ３０ａは、ディスク１５（「＃Ｂ２」，「＃Ｂ１」）が同一のディスクエンクロージャ１３ｂに属する。そのため、サーバ１２は、ディスクエンクロージャ１３ｂが故障するとデータロストするおそれのある状態である。したがって、ディスク故障再構成処理のステップＳ２６、またはディスクエンクロージャ故障再構成処理のステップＳ３４を経てＲＡＩＤ再構成をおこなった場合、サーバ１２は、ディスクエンクロージャ１３ｂが故障した場合にデータロストするおそれがある。

一方、サーバ１２は、２つのＲＡＩＤ構成ＤＥからそれぞれ代替ディスクを獲得できた場合は、データロストのおそれのないＲＡＩＤ再構成をおこなうことができる。２つのＲＡＩＤ構成ＤＥからそれぞれ代替ディスクを獲得できた場合について図１１を用いて説明する。図１１は、第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。

制御部は、ディスク１５「＃Ｂ２」に加えて、ディスクエンクロージャ１３ｃからディスク１５「＃Ｃ２」の割当を受けた場合、ディスク１５「＃Ｂ２」をディスク１５「＃Ｃ２」に複製する。すなわち、制御部は、ディスク１５「＃Ｂ２」とディスク１５「＃Ｃ２」とでＲＡＩＤ１を構成する。言い換えれば、制御部は、ディスクエンクロージャ１３ａのディスク１５「＃Ａ１」を、ディスク１５「＃Ｂ２」とディスク１５「＃Ｃ２」とに置き換える。

これにより、制御部は、ディスクエンクロージャ１３ｂ，１３ｃ，１３ｄからそれぞれディスク１５（「＃Ｂ２」，「＃Ｃ２」，「＃Ｂ１」，「＃Ｃ１」，「＃Ｄ１」）の割当を受けて、ＲＡＩＤ１を併用してＲＡＩＤグループ３０をＲＡＩＤグループ３０ｂとして再構成する。

ＲＡＩＤグループ３０ｂは、ディスク１５（「＃Ｂ２」，「＃Ｂ１」）が同一のディスクエンクロージャ１３ｂに属し、ディスク１５（「＃Ｃ２」，「＃Ｃ１」）が同一のディスクエンクロージャ１３ｂに属する。しかしながら、ディスクエンクロージャ１３ｂ，１３ｃのいずれか一方が故障しても、サーバ１２は、ＲＡＩＤグループ３０に対してアクセス可能である。

したがって、ストレージシステム１０は、ディスクエンクロージャ１３（ストレージユニット単位）の障害によるデータロストを防止できる。また、ストレージシステム１０は、通常時において、各ディスク１５を２重化することを要しないから信頼性の向上とストレージ資源の効率的な利用とを両立することができる。

ＲＡＩＤ１併用なしのＲＡＩＤ再構成をおこなった場合、ディスク１５が２台存在しているディスクエンクロージャ１３の故障でデータロストのおそれがある。このとき、ディスク故障率をｆ_hdd、ディスクエンクロージャ故障率をｆ_deとすると、故障率は、ｆ_hdd×（ｆ_hdd＋ｆ_de）となる。

一方、ＲＡＩＤ１併用ＲＡＩＤ再構成をおこなった場合、ディスク１５が２台存在しているディスクエンクロージャ１３の故障があってもデータロストのおそれがない。このとき、故障率は、ｆ_hdd×ｆ_hddとなり、ＲＡＩＤ１併用なしのＲＡＩＤ再構成をおこなった場合と比較して故障率を低減できる。

次に、第２の実施形態のＲＡＩＤ１併用ＲＡＩＤ再構成後のＲＡＩＤ構成情報について図１２を用いて説明する。図１２は、第２の実施形態のＲＡＩＤ構成情報の一例を示す図である。

ＲＡＩＤ構成情報５１は、ＲＡＩＤ構成情報５０をＲＡＩＤ１併用ＲＡＩＤ再構成後に更新した情報である。
ＲＡＩＤ構成情報５１は、ブロックＮｏ．「１」が２つと、ブロックＮｏ．「２」，「３」，「４」が１つずつの合計５つのディスク１５からＲＡＩＤグループＩＤ「＃０００１」のＲＡＩＤグループ３０が構成されていることを示す。また、ＲＡＩＤ構成情報５１は、ステータス「ＲＡＩＤ１」より、ブロックＮｏ．「１」の２つのディスク１５がＲＡＩＤ１を構成していることを示す。ステータス「ＲＡＩＤ１」は、ディスク１５が複製を有することを示す。すなわち、ステータス「ＲＡＩＤ１」は、ディスク１５が複製を有するか否かを判別可能な複製判別情報に相当する。

また、ＲＡＩＤ構成情報５１は、ブロックＮｏ．「１」の１つのディスク１５がディスクエンクロージャＩＤ「＃Ｂ」、ディスクＩＤ「＃２」であることを示す。また、ＲＡＩＤ構成情報５１は、ブロックＮｏ．「１」のもう１つのディスク１５がディスクエンクロージャＩＤ「＃Ｃ」、ディスクＩＤ「＃２」であることを示す。同様に、ＲＡＩＤ構成情報５１は、ブロックＮｏ．「２」のディスク１５がディスクエンクロージャＩＤ「＃Ｂ」、ディスクＩＤ「＃１」であることを示す。同様に、ＲＡＩＤ構成情報５１は、ブロックＮｏ．「３」のディスク１５がディスクエンクロージャＩＤ「＃Ｃ」、ディスクＩＤ「＃１」であることを示す。同様に、ＲＡＩＤ構成情報５１は、ブロックＮｏ．「４」のディスク１５がディスクエンクロージャＩＤ「＃Ｄ」、ディスクＩＤ「＃１」であることを示す。

次に、第２の実施形態の復旧処理について図１３を用いて説明する。図１３は、第２の実施形態の復旧処理のフローチャートを示す図である。復旧処理は、故障したディスク１５や、故障したディスクエンクロージャ１３の交換処理など、ストレージ資源のメンテナンスの終了を契機にしてサーバ１２が実行する処理である。たとえば、復旧処理は、管理者による指示にもとづいて実行されるが、定期的に実行されるものであってもよい。

［ステップＳ４１］サーバ１２のプロセッサ１０１（制御部）は、復旧情報を取得する。復旧情報は、サーバ１２に割当のあるディスク１５、またはサーバ１２に割当のあるディスク１５が属するディスクエンクロージャ１３の故障に関する情報である。プロセッサ１０１は、通信パス１８を介して定期または不定期にディスク１５の稼働状態を監視することによりディスク１５の復旧を検出してディスク１５に関する復旧情報を生成する。リソースマネージャ１１は、通信パス１７を介して定期または不定期にディスクエンクロージャ１３の稼働状態を監視することによりディスクエンクロージャ１３の復旧を検出してディスクエンクロージャに関する復旧情報を生成する。なお、リソースマネージャ１１は、ディスクエンクロージャ１３を介して検出したディスク１５の復旧にもとづいてディスクに関する復旧情報を生成してサーバ１２に通知するようにしてもよい。なお、ここでいう復旧は、故障したディスク１５、または故障したディスクエンクロージャ１３の交換であるが、ディスク１５の割当可能な状態への移行という観点から、ディスク１５またはディスクエンクロージャ１３の追加を含むものであってもよい。

［ステップＳ４２］制御部は、復旧したディスク１５を割当可能なＲＡＩＤグループの有無を判定する。制御部は、復旧したディスク１５を割当可能なＲＡＩＤグループがある場合にステップＳ４３にすすみ、復旧したディスク１５を割当可能なＲＡＩＤグループがない場合に復旧処理を終了する。

［ステップＳ４３］制御部は、復旧したディスク１５を割当可能なＲＡＩＤグループの１つを特定する。
［ステップＳ４４］制御部は、１つのディスクエンクロージャ１３（同一ＤＥ）に属するＲＡＩＤグループを構成するディスク（ＲＡＩＤ構成ディスク）の有無を判定する。制御部は、同一ＤＥに属するＲＡＩＤ構成ディスクがある場合にステップＳ４５にすすみ、同一ＤＥに属するＲＡＩＤ構成ディスクがない場合にステップＳ４９にすすむ。

［ステップＳ４５］制御部は、復旧情報とＲＡＩＤ構成情報とにもとづいて、特定したＲＡＩＤグループに属するディスクエンクロージャ１３（ＲＡＩＤ構成ＤＥ）から代替ディスクを獲得可能か否かを判定する。制御部は、ＲＡＩＤ構成ＤＥから代替ディスクを獲得できる場合にステップＳ４６にすすみ、ＲＡＩＤ構成ＤＥから代替ディスクを獲得できない場合にステップＳ４９にすすむ。

［ステップＳ４６］制御部は、代替ディスクを獲得する。
［ステップＳ４７］制御部は、同一ＤＥに属するＲＡＩＤ構成ディスクについて代替ディスクとの間でＲＡＩＤ１化をおこなう。

［ステップＳ４８］制御部は、ＲＡＩＤ構成情報を更新してステップＳ４９にすすむ。
［ステップＳ４９］制御部は、復旧情報とＲＡＩＤ構成情報とにもとづいて、特定したＲＡＩＤグループに属さないディスクエンクロージャ１３（ＲＡＩＤ構成外ＤＥ）から代替ディスクを獲得可能か否かを判定する。制御部は、ＲＡＩＤ構成外ＤＥから代替ディスクを獲得できる場合にステップＳ５０にすすみ、ＲＡＩＤ構成外ＤＥから代替ディスクを獲得できない場合にステップＳ４２にすすむ。

［ステップＳ５０］制御部は、ＲＡＩＤ構成情報のステータスを参照して、特定したＲＡＩＤグループにＲＡＩＤ１があるか否かを判定する。制御部は、特定したＲＡＩＤグループにＲＡＩＤ１がある場合にステップＳ５１にすすみ、特定したＲＡＩＤグループにＲＡＩＤ１がない場合にステップＳ４２にすすむ。

［ステップＳ５１］制御部は、ＲＡＩＤ構成外ＤＥからから代替ディスクを獲得する。
［ステップＳ５２］制御部は、ＲＡＩＤ１を構成していたディスク１５から代替ディスクにコピーバック処理をおこなう。

［ステップＳ５３］制御部は、ＲＡＩＤ１を構成していたディスク１５を解放する。
［ステップＳ５４］制御部は、ＲＡＩＤ構成情報を更新してステップＳ４２にすすむ。
ここで、獲得ディスクへのコピーバックと、ＲＡＩＤ１を構成していたディスク１５の解放について図１４を用いて説明する。図１４は、第２の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。

図１１に示したＲＡＩＤグループ３０ｂは、ディスクエンクロージャ１３ａが故障し、ＲＡＩＤ１を併用してＲＡＩＤグループを構成している状態である。ここで、図１４に示すようにディスクエンクロージャ１３ａが復旧した場合、制御部は、ディスクエンクロージャ１３ａのディスク１５（たとえば、ディスク１５「＃Ａ１」）を獲得する。制御部は、ＲＡＩＤ１を構成していたディスク１５「＃Ｂ２」からディスク１５「＃Ａ１」にコピーバック処理をおこなう。これにより、サーバ１２は、ＲＡＩＤグループ３０ｃを再構成することができる。また、制御部は、ＲＡＩＤ１を構成していたディスク１５「＃Ｂ２」，「＃Ｃ２」を解放対象３１として、リソースマネージャ１１に解放依頼をおこない、サーバ１２への割当から解放する。

したがって、ストレージシステム１０は、ディスクエンクロージャ１３（ストレージユニット単位）の復旧により、ＲＡＩＤ１を併用していたＲＡＩＤグループを復旧することができる。

［第３の実施形態］
次に、第３の実施形態のディスクエンクロージャ故障再構成処理について図１５、図１６を用いて説明する。図１５および図１６は、第３の実施形態のディスクエンクロージャ故障再構成処理のフローチャートを示す図である。第３の実施形態のディスクエンクロージャ故障再構成処理は、ＲＡＩＤ１を併用するＲＡＩＤグループを構成するディスクエンクロージャ１３の故障に対応する。

［ステップＳ６１］サーバ１２のプロセッサ１０１（制御部）は、故障ディスクのステータスを確認する。制御部は、故障ディスクのステータスが「物理」である場合にステップＳ６６にすすみ、故障ディスクのステータスが「ＲＡＩＤ１」である場合にステップＳ６２にすすむ。

［ステップＳ６２］制御部は、ＲＡＩＤグループを構成するディスクが属するディスクエンクロージャ１３（ＲＡＩＤ構成ＤＥ）のうち、ＲＡＩＤ１を復元可能なディスクエンクロージャ１３（ＤＥ）に空きディスクがあるか否かを判定する。ＲＡＩＤ１を復元可能なディスクエンクロージャ１３は、ステータスが「ＲＡＩＤ１」のディスク１５が属するディスクエンクロージャ１３と異なるディスクエンクロージャ１３である。制御部は、ＲＡＩＤ１を復元可能なディスクエンクロージャ１３（ＤＥ）に空きディスクがある場合にステップＳ６３にすすみ、空きディスクがない場合にステップＳ７４にすすむ。

［ステップＳ６３］制御部は、ＲＡＩＤ１を復元可能なディスクエンクロージャ１３（ＤＥ）から代替ディスクを獲得する。
［ステップＳ６４］制御部は、故障ディスクに代えて代替ディスクでＲＡＩＤ１を復元する。

［ステップＳ６５］制御部は、ＲＡＩＤ構成情報を更新してステップＳ７４にすすむ。
［ステップＳ６６］制御部は、ＲＡＩＤグループを構成するディスクが属さないディスクエンクロージャ１３（ＲＡＩＤ構成外ＤＥ）に空きディスクがあるか否かを判定する。制御部は、ＲＡＩＤ構成外ＤＥに空きディスクがある場合にステップＳ６７にすすみ、ＲＡＩＤ構成外ＤＥに空きディスクがない場合にステップＳ６８にすすむ。

［ステップＳ６７］制御部は、ＲＡＩＤ構成外ＤＥから代替ディスクを獲得する。
［ステップＳ６８］制御部は、２以上のＲＡＩＤ構成ＤＥに空きディスクがあるか否かを判定する。制御部は、２以上のＲＡＩＤ構成ＤＥに空きディスクがない場合にステップＳ６９にすすみ、２以上のＲＡＩＤ構成ＤＥに空きディスクがある場合にステップＳ７０にすすむ。

［ステップＳ６９］制御部は、１つのＲＡＩＤ構成ＤＥからディスク１５の割当を受けて、代替ディスクを獲得する。
［ステップＳ７０］制御部は、２以上のＲＡＩＤ構成ＤＥのうちの２つのＲＡＩＤ構成ＤＥから１つずつディスク１５の割当を受けて、代替ディスクを獲得する。

［ステップＳ７１］制御部は、獲得した代替ディスクを含めてＲＡＩＤ再構成（第１のリビルド処理）をおこなう。このとき、ステップＳ６７において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクがそれぞれ異なるディスクエンクロージャ１３に属する。一方、ステップＳ６９において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクが一部のディスクエンクロージャ１３に重複して属する。そのため、このＲＡＩＤグループは、一部のディスクエンクロージャ１３が故障した場合に、データロストのおそれがある。

［ステップＳ７２］制御部は、獲得した代替ディスクを含めてＲＡＩＤ１併用ＲＡＩＤ再構成（第２のリビルド処理）をおこなう。ステップＳ７０において獲得した代替ディスクによりＲＡＩＤ再構成したＲＡＩＤグループは、ＲＡＩＤグループを構成するディスクが一部のディスクエンクロージャ１３に重複して属する。制御部は、２つの代替ディスクがそれぞれの複製となるようにして、ＲＡＩＤグループを再構成する。

［ステップＳ７３］制御部は、ＲＡＩＤ構成情報を更新する。
［ステップＳ７４］制御部は、すべての故障ディスクについて代替ディスクを獲得したか否かを判定する。制御部は、すべての故障ディスクについて代替ディスクを獲得していない場合にステップＳ６１にすすみ、すべての故障ディスクについて代替ディスクを獲得した場合にディスクエンクロージャ故障再構成処理を終了する。

これにより、制御部は、故障ディスクのステータスが「ＲＡＩＤ１」であっても、さらにＲＡＩＤ１を併用したＲＡＩＤグループを再構成することができる。したがって、ストレージシステム１０は、ディスクエンクロージャ１３（ストレージユニット単位）の繰り返しの障害があってもデータロストを防止できる。また、ストレージシステム１０は、通常時において、各ディスク１５を２重化することを要しないから信頼性の向上とストレージ資源の効率的な利用とを両立することができる。

次に、第３の実施形態のＲＡＩＤ構成ＤＥから代替ディスクを獲得する場合のＲＡＩＤ再構成について図１７および図１８を用いて説明する。まず、ＲＡＩＤ構成ＤＥの１つが故障して、代替ディスクを他のＲＡＩＤ構成ＤＥから獲得した図１１に示すＲＡＩＤグループ３０ｂの状態から、さらにＲＡＩＤ構成ＤＥの１つが故障した場合について図１７を用いて説明する。図１７は、第３の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。

ディスクエンクロージャ１３ｂは、故障により、複数のディスク１５（「＃Ｂ１」，「＃Ｂ２」，「＃Ｂ３」，・・・）が故障した状態である。制御部は、ディスクエンクロージャ１３ｂの故障検出により、他のディスクエンクロージャ１３からディスク１５（「＃Ｂ１」，「＃Ｂ２」）を代替するディスク１５の割当を受ける。たとえば、ディスクエンクロージャ故障再構成処理のステップＳ６７の場合、制御部は、ディスク１５「＃Ｂ１」を代替するため、ディスクエンクロージャ１３ｃ，１３ｄからそれぞれディスク１５「＃Ｃ３」，「＃Ｄ２」の割当を受ける。また、ディスクエンクロージャ故障再構成処理のステップＳ７０の場合、制御部は、ディスク１５「＃Ｂ２」を代替するため、ディスクエンクロージャ１３ｄからディスク１５「＃Ｄ３」の割当を受ける。

制御部は、ディスクエンクロージャ１３ｂのディスク１５「＃Ｂ１」に代えてディスクエンクロージャ１３ｃのディスク１５「＃Ｃ３」を加えて、ＲＡＩＤグループ３０を再構成する。

すなわち、制御部は、ディスクエンクロージャ１３ｃ，１３ｄからそれぞれディスク１５（「＃Ｃ２」，「＃Ｃ３」，「＃Ｃ１」，「＃Ｄ１」）の割当を受けてＲＡＩＤグループ３０を再構成する。また、制御部は、ディスク１５「＃Ｃ２」をディスク１５「＃Ｄ３」に複製してＲＡＩＤ１を構成する。また、制御部は、ディスク１５「＃Ｃ３」をディスク１５「＃Ｄ２」に複製してＲＡＩＤ１を構成する。

これにより、制御部は、２組のＲＡＩＤ１を併用してＲＡＩＤグループ３０ｄとしてＲＡＩＤグループ３０を再構成する。
ＲＡＩＤグループ３０ｄは、ディスクエンクロージャ１３ｃ，１３ｄのいずれか一方が故障しても、サーバ１２がＲＡＩＤグループ３０に対してアクセス可能である。

また、故障ディスクのステータスが「ＲＡＩＤ１」の場合に、制御部は、故障ディスクとペアになるステータスが「ＲＡＩＤ１」のディスク１５からデータを取得し、代替ディスクへの書き込みをおこなうことができる。また、故障ディスクとペアになるステータスが「ＲＡＩＤ１」のディスク１５をＲＡＩＤグループの再構成に利用することで、ＲＡＩＤグループの再構成のためのデータリードタイムを短縮することができる。

次に、第３の実施形態のＲＡＩＤ１併用ＲＡＩＤ再構成後のＲＡＩＤ構成情報について図１８を用いて説明する。図１８は、第３の実施形態のＲＡＩＤ構成情報の一例を示す図である。

ＲＡＩＤ構成情報５２は、２組のＲＡＩＤ１併用によるＲＡＩＤ再構成後にＲＡＩＤ構成情報５１を更新した情報である。
ＲＡＩＤ構成情報５２は、ブロックＮｏ．「１」，「２」が２つと、ブロックＮｏ．「３」，「４」が１つずつの合計６つのディスク１５からＲＡＩＤグループＩＤ「＃０００１」のＲＡＩＤグループ３０が構成されていることを示す。また、ＲＡＩＤ構成情報５２は、ステータス「ＲＡＩＤ１」より、ブロックＮｏ．「１」の２つのディスク１５がＲＡＩＤ１を構成し、ブロックＮｏ．「２」の２つのディスク１５がもう１つのＲＡＩＤ１を構成していることを示す。また、ＲＡＩＤ構成情報５２は、ブロックＮｏ．「１」の１つのディスク１５がディスクエンクロージャＩＤ「＃Ｃ」、ディスクＩＤ「＃２」であることを示す。また、ＲＡＩＤ構成情報５２は、ブロックＮｏ．「１」のもう１つのディスク１５がディスクエンクロージャＩＤ「＃Ｄ」、ディスクＩＤ「＃３」であることを示す。また、ＲＡＩＤ構成情報５２は、ブロックＮｏ．「２」の１つのディスク１５がディスクエンクロージャＩＤ「＃Ｃ」、ディスクＩＤ「＃３」であることを示す。また、ＲＡＩＤ構成情報５２は、ブロックＮｏ．「２」のもう１つのディスク１５がディスクエンクロージャＩＤ「＃Ｄ」、ディスクＩＤ「＃２」であることを示す。同様に、ＲＡＩＤ構成情報５２は、ブロックＮｏ．「３」のディスク１５がディスクエンクロージャＩＤ「＃Ｃ」、ディスクＩＤ「＃１」であることを示す。同様に、ＲＡＩＤ構成情報５２は、ブロックＮｏ．「４」のディスク１５がディスクエンクロージャＩＤ「＃Ｄ」、ディスクＩＤ「＃１」であることを示す。

ここで、獲得ディスクへのコピーバックと、ＲＡＩＤ１を構成していたディスク１５の解放について図１９を用いて説明する。図１９は、第３の実施形態のサーバが構成するＲＡＩＤグループの一例を示す図である。

図１７に示したＲＡＩＤグループ３０ｄは、ディスクエンクロージャ１３ａ，１３ｂが故障し、ＲＡＩＤ１を併用してＲＡＩＤグループを構成している状態である。ここで、図１９に示すようにディスクエンクロージャ１３ａ，１３ｂが復旧した場合、制御部は、ディスクエンクロージャ１３ａ，１３ｂからそれぞれディスク１５（たとえば、ディスク１５「＃Ａ１」，「＃Ｂ１」）を獲得する。制御部は、ＲＡＩＤ１を構成していたディスク１５「＃Ｃ２」からディスク１５「＃Ａ１」にコピーバック処理をおこなう。また、制御部は、もう１つのＲＡＩＤ１を構成していたディスク１５「＃Ｃ３」からディスク１５「＃Ｂ１」にコピーバック処理をおこなう。これにより、サーバ１２は、ＲＡＩＤグループ３０ｅを再構成することができる。また、制御部は、ＲＡＩＤ１を構成していたディスク１５「＃Ｃ２」，「＃Ｃ３」，「＃Ｄ２」，「＃Ｄ３」を解放対象３２として、リソースマネージャ１１に解放依頼をおこない、サーバ１２への割当から解放する。

なお、上記の処理機能は、コンピュータによって実現することができる。その場合、管理装置２、情報処理装置３、リソースマネージャ１１、サーバ１２が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置（ＨＤＤ）、フレキシブルディスク（ＦＤ）、磁気テープなどがある。光ディスクには、ＤＶＤ、ＤＶＤ−ＲＡＭ、ＣＤ−ＲＯＭ／ＲＷなどがある。光磁気記録媒体には、ＭＯ（Magneto-Optical disk）などがある。

プログラムを流通させる場合には、たとえば、そのプログラムが記録されたＤＶＤ、ＣＤ−ＲＯＭなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。

プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。

また、上記の処理機能の少なくとも一部を、ＤＳＰ、ＡＳＩＣ、ＰＬＤなどの電子回路で実現することもできる。

１、１０ストレージシステム
２管理装置
３情報処理装置
３ａ構成部
３ｂ検出部
３ｃ再構成部
３ｄ複製部
４，４ａ，４ｂ，４ｃ，４ｄストレージユニット
５，５ａ，５ｂ，５ｃ，５ｄ，５ｅ，５ｆストレージデバイス
６，７，８，１６，１７，１８通信パス
１１リソースマネージャ
１２，１２ａ，１２ｂ，１２ｃサーバ
１３，１３ａ，１３ｂ，１３ｃ，１３ｄディスクエンクロージャ
１４スイッチ
１５ディスク
２５コントローラ
２６電源部
２７冷却部
１０１プロセッサ
１０２ＲＡＭ
１０３不揮発性メモリ
１０４入出力インタフェース
１０５通信インタフェース
１０６バス

Claims

複数のストレージデバイスを有する複数のストレージユニットと、前記ストレージデバイスを管理する管理装置と、前記管理装置から割当を受けて前記ストレージデバイスと接続可能な情報処理装置と、を備えるストレージシステムであって、
前記情報処理装置は、
それぞれ異なる前記ストレージユニットに属する前記ストレージデバイスの割当を受けて第１のグループを構成する第１の構成部と、
前記第１のグループを構成するストレージデバイスの障害を検出する検出部と、
障害を検出したストレージデバイスを代替するストレージデバイスを、前記第１のグループを構成するその余のストレージデバイスが属するストレージユニットから割当を受ける場合に、前記その余のストレージデバイスが属するストレージユニットのうちの第１のストレージユニットから第１のストレージデバイスの割当を受けて前記第１のグループの構成を前記その余のストレージデバイスと前記第１のストレージデバイスとが属する第２のグループに構成する第２の構成部と、
前記その余のストレージデバイスが属するストレージユニットのうちの第２のストレージユニットから第２のストレージデバイスの割当を受けて、前記第２のストレージデバイスに前記第１のストレージデバイスを複製する複製部と、
を備えることを特徴とするストレージシステム。
前記情報処理装置は、前記第２のグループを構成するストレージデバイスが属さないストレージユニットから第３のストレージデバイスの割当を受けて、前記第１のストレージデバイスまたは前記第２のストレージデバイスを前記第３のストレージデバイスに複製して前記第２のグループの構成を前記その余のストレージデバイスと前記第３のストレージデバイスとが属する第３のグループに構成する第３の構成部を備えることを特徴とする請求項１記載のストレージシステム。
前記情報処理装置は、前記第３のグループに構成した後、前記第１のストレージデバイスおよび前記第２のストレージデバイスの割当を解放することを特徴とする請求項２記載のストレージシステム。
前記情報処理装置は、前記第２のグループを構成するストレージデバイスを特定可能な管理情報を記憶する記憶部を有し、
前記管理情報は、前記ストレージデバイスが複製を有するか否かを判別可能な複製判別情報を含む、
ことを特徴とする請求項１記載のストレージシステム。
前記情報処理装置と前記ストレージユニットの接続と接続解除を切替可能なスイッチを備え、
前記管理装置は、前記スイッチの接続と接続解除の切替を制御して、前記情報処理装置に前記ストレージデバイスを割り当てる、
ことを特徴とする請求項１記載のストレージシステム。
前記管理装置は、前記ストレージユニットの障害を検出し、検出した前記ストレージユニットの障害を前記情報処理装置に通知することを特徴とする請求項１記載のストレージシステム。
複数のストレージデバイスを有する複数のストレージユニットを管理する管理装置と接続される情報処理装置の制御プログラムにおいて、
前記情報処理装置に、
それぞれ異なる前記ストレージユニットに属する前記ストレージデバイスの割当を受けて第１のグループを構成させ、
前記第１のグループを構成するストレージデバイスの障害を検出させ、
障害を検出したストレージデバイスを代替するストレージデバイスを、前記第１のグループを構成するその余のストレージデバイスが属するストレージユニットから割当を受ける場合に、前記その余のストレージデバイスが属するストレージユニットのうちの第１のストレージユニットから第１のストレージデバイスの割当を受けて前記第１のグループの構成を前記その余のストレージデバイスと前記第１のストレージデバイスとが属する第２のグループに構成させ、
前記その余のストレージデバイスが属するストレージユニットのうちの第２のストレージユニットから第２のストレージデバイスの割当を受けて、前記第２のストレージデバイスに前記第１のストレージデバイスを複製させる、
ことを特徴とする情報処理装置の制御プログラム。
複数のストレージデバイスを有する複数のストレージユニットと、前記ストレージデバイスを管理する管理装置と、前記管理装置から割当を受けて前記ストレージデバイスと接続可能な情報処理装置と、を備えるストレージシステムの制御方法において、
前記情報処理装置が、
それぞれ異なる前記ストレージユニットに属する前記ストレージデバイスの割当を受けて第１のグループを構成し、
前記第１のグループを構成するストレージデバイスの障害を検出し、
障害を検出したストレージデバイスを代替するストレージデバイスを、前記第１のグループを構成するその余のストレージデバイスが属するストレージユニットから割当を受ける場合に、前記その余のストレージデバイスが属するストレージユニットのうちの第１のストレージユニットから第１のストレージデバイスの割当を受けて前記第１のグループの構成を前記その余のストレージデバイスと前記第１のストレージデバイスとが属する第２のグループに構成し、
前記その余のストレージデバイスが属するストレージユニットのうちの第２のストレージユニットから第２のストレージデバイスの割当を受けて、前記第２のストレージデバイスに前記第１のストレージデバイスを複製する、
ことを特徴とするストレージシステムの制御方法。