JP2010257254A

JP2010257254A - 磁気ディスク装置

Info

Publication number: JP2010257254A
Application number: JP2009106892A
Authority: JP
Inventors: Shigeru Kaga; 滋加賀
Original assignee: Hitachi Computer Peripherals Co Ltd
Current assignee: Hitachi Information and Telecommunication Engineering Ltd
Priority date: 2009-04-24
Filing date: 2009-04-24
Publication date: 2010-11-11

Abstract

【課題】冗長性を有するＲＡＩＤを構成するＨＤＤが故障した場合においても、予備のＨＤＤを用いることなく、かつ、冗長性レベルを著しく下げることなく稼働することができる磁気ディスク装置を提供する。
【解決手段】ＲＡＩＤを構成するＨＤＤが故障した場合に、故障したＨＤＤが属するＲＡＩＤグループと他のＲＡＩＤグループとを１つのＲＡＩＤグループに統合し、当該ＲＡＩＤグループ内で最大限の冗長性を維持しながら稼働させる。
【選択図】図１

Description

本発明は、データを冗長化・分散化して記憶するＲＡＩＤ方式の磁気ディスク装置に関し、特に、ＲＡＩＤを構成するディスクの故障時において予備ディスクを使用しなくともデータの冗長性を維持しながら運用することができる磁気ディスクに関するものである。

ＲＡＩＤ（ＲｅｄｕｎｄａｎｔＡｒｒａｙｓｏｆＩｎｅｘｐｅｎｓｉｖｅＤｉｓｋｓ）方式の磁気ディスク装置とは、複数台の磁気ハードディスク（以下、「ＨＤＤ」という）の集合を１台の記憶装置として管理するものであり、データを複数ブロック単位（あるいはビット・バイト単位）で分散化して記憶したり、データを２重化（あるいは多重化）して記憶したり、エラー検出・訂正用データを付加したりすることで、処理性能、信頼性、可用性の向上が図られている。
現在、ＲＡＩＤ方式としては、ＲＡＩＤ０、ＲＡＩＤ１、ＲＡＩＤ２、ＲＡＩＤ３、ＲＡＩＤ４、ＲＡＩＤ５、ＲＡＩＤ６などが利用されている。

ＲＡＩＤ方式の中でも、特に、ＲＡＩＤ５、ＲＡＩＤ６は、エラー訂正用パリティデータを各ＨＤＤに分散させて記憶させることで、１台又は２台のＨＤＤが故障しても完全なデータ回復が可能であることを特徴とし、信頼性、可用性が高く、かつ、経済的なストレージシステムを構築可能であるので、広く利用されている。
特許文献１には、一般的なＲＡＩＤ方式の磁気ディスク装置が開示されており、特に、データ消失の恐れなく、磁気ディスクの記憶データを書き換えて、ＲＡＩＤレベルをＲＡＩＤ５からＲＡＩＤ０に変換するＬＤＥ（ＬｏｇｉｃａｌＤｉｓｋＥｘｐａｎｓｉｏｎ）技術が開示されている。
特許文献２には、ＲＡＩＤを構成するＨＤＤが故障した場合に、当該ＨＤＤが復旧するまでの間、他のＨＤＤに記憶されたパリティデータを通常データに変換し、冗長性レベルを下げた状態（例えば、ＲＡＩＤ５の場合はＲＡＩＤ０に下げる）で稼働させる技術が本出願人により開示されている。

特開２００７−３２３２５２号公報特願２００８−１８７７３３号明細書等

ところで、複数台のＨＤＤを有する磁気ディスク装置では、ＨＤＤの障害時に備えて予備のＨＤＤを有しているのが一般的である。予備のＨＤＤを有するＲＡＩＤ方式の磁気ディスク装置においてＨＤＤが故障した場合、故障したＨＤＤを予備のＨＤＤで代替するとともに、他のＨＤＤが記憶しているデータとパリティデータとを用いて、故障したＨＤＤに記憶されていたデータを再生成し予備のＨＤＤに記憶させることで、障害発生前の状態に復旧することができる。

このように、磁気ディスク装置では、ＨＤＤ障害時の対応の観点からは十分な台数の予備のＨＤＤを搭載しているのが理想的である。しかしながら、予備のＨＤＤの搭載台数を多くすることは、コスト増大と装置の大型化を招くため、余剰な台数の予備のＨＤＤを搭載した磁気ディスク装置を採用することは現実的ではない。このため、度重なるＨＤＤ障害発生により、ＨＤＤ障害時に予備のＨＤＤの空きがない状態が起こり得る。

一方で、必要な台数の予備のＨＤＤがない場合、特許文献１や特許文献２に記載されているように、ＨＤＤ障害時に予備ＨＤＤは用いず、故障したＨＤＤが属するＲＡＩＤグループ内のみ冗長性レベルを下げた運用に切り替えるといった対応手段を取ることも考えられる。しかしながら、特許文献１や特許文献２の技術では、例えばＲＡＩＤ５以下のＲＡＩＤグループについては冗長性が完全に失われてしまうことになり、更なるＨＤＤ障害が発生した場合にはデータが消失してしまうおそれがある。この点、パリティ比率の高い構成（例えばＲＡＩＤ６）としておくという対応策も考えられるが、記憶効率やアクセス速度などの性能が低下してしまうため、必要以上にパリティ比率が高い構成とすることも現実的ではない。

例えば、４台のディスクでＲＡＩＤを構成する場合には、３Ｄ＋１Ｐの構成とするのが一般的であるが、このＲＡＩＤ構成ではパリティ比率が比較的高いにもかかわらず、１台のＨＤＤが故障した場合、特許文献１や特許文献２の技術では、冗長性のないＲＡＩＤ構成に変更して運用せざるを得ない。

本発明は、このような実情に鑑みてなされたものであり、冗長性を有するＲＡＩＤを構成するＨＤＤが故障した場合においても、予備のＨＤＤを用いることなく、かつ、冗長性レベルを著しく下げることなく稼働することができる磁気ディスク装置を提供しようとするものである。

上記課題に鑑みて鋭意研究の結果、本発明者は、ＲＡＩＤを構成するＨＤＤが故障した場合に、故障したＨＤＤが属するＲＡＩＤグループと他のＲＡＩＤグループとを１つのＲＡＩＤグループに統合し、当該ＲＡＩＤグループ内で最大限の冗長性を維持しながら稼働させることに想到し、本発明をなすに至った。

すなわち、本発明は、複数の磁気ディスクにより冗長性を有するＲＡＩＤグループを構成する磁気ディスク装置であって、ホストコンピュータから前記磁気ディスクへのリードライト要求を処理する対ホスト制御部と、前記磁気ディスクの状態を管理するＨＤＤ状態管理部と、前記ＲＡＩＤグループの状態を管理するＲＡＩＤ状態管理部と、前記磁気ディスク上の消失したデータを回復するデータ回復制御部と、前記データ回復制御部による消失データの回復処理の進捗を管理する進捗管理部とを備え、前記ＨＤＤ状態管理部が磁気ディスクの障害を検知すると、前記ＲＡＩＤ状態管理部は、障害発生した磁気ディスクが属するＲＡＩＤグループと他のＲＡＩＤグループとを結合して新たなＲＡＩＤグループを構成し、前記データ回復制御部は、障害発生した磁気ディスク上の消失したデータを、当該磁気ディスクと同ＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータを用いて回復するとともに、前記新たなＲＡＩＤグループ内でパリティデータを生成して格納することを特徴とする磁気ディスク装置を提供するものである。
このように、磁気ディスク障害発生により消失したデータをパリティデータを用いて回復した後、他のＲＡＩＤグループと結合した新たなＲＡＩＤグループを構成することにより、冗長性を維持したＲＡＩＤとして運用継続することが可能である。

本発明の磁気ディスク装置において、前記データ回復制御部は、前記磁気ディスク上の先頭論理アドレスからアドレス順に、消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理を実行し、前記進捗管理部は、当該処理が完了した最後の論理アドレスを示すポインタを用いて進捗管理を行うことを特徴とする。
これにより、消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中にホストコンピュータからのデータアクセスが生じた場合にも、アクセス先の状態に応じた適切な応答をすることが可能となる。具体的には、以下の通りである。

前記データ回復制御部による消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのリード要求が発生した場合、前記対ホスト制御部は、前記リード要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記回復されたデータを読み込み、前記リード要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、障害発生した磁気ディスクが属するＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータを用いて回復されるデータを読み込むことを特徴とする。

また、前記データ回復制御部による消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのライト要求が発生した場合、前記対ホスト制御部は、前記ライト要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記回復されたデータと前記新たなＲＡＩＤグループのパリティデータとを上書きし、前記ライト要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、障害発生した磁気ディスクが属するＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータからライト処理後のデータが回復されるように当該パリティデータを書き換えることを特徴とする。

尚、前記ＲＡＩＤ状態管理部は、障害発生した磁気ディスクが属するＲＡＩＤグループにおいて冗長性が維持されている場合、又は他のＲＡＩＤグループと結合しても冗長性を有する新たなＲＡＩＤグループを構成できない場合には、他のＲＡＩＤグループとの結合を行う必要はない。

本発明は、また、複数の磁気ディスクにより冗長性を有するＲＡＩＤグループを構成する磁気ディスク装置であって、ホストコンピュータから前記磁気ディスクへのリードライト要求を処理する対ホスト制御部と、前記磁気ディスクの状態を管理するＨＤＤ状態管理部と、前記ＲＡＩＤグループの状態を管理するＲＡＩＤ状態管理部と、前記磁気ディスク上の消失したデータを回復するデータ回復制御部と、ＲＡＩＤグループ分離のためにデータ及びパリティデータを再生成する分離再生成部と、前記データ回復制御部による消失データの回復処理、及び前記分離再生成部によるＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理の進捗を管理する進捗管理部とを備え、前記ＨＤＤ状態管理部が磁気ディスクの障害を検知すると、前記ＲＡＩＤ状態管理部は、障害発生した磁気ディスクが属するＲＡＩＤグループと他のＲＡＩＤグループとを結合して新たなＲＡＩＤグループを構成し、前記データ回復制御部は、障害発生した磁気ディスク上の消失したデータを、当該磁気ディスクと同ＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータを用いて回復するとともに、前記新たなＲＡＩＤグループ内でパリティデータを生成して格納し、前記ＨＤＤ状態管理部が磁気ディスクの復旧を検知すると、前記分離再生成部は、前記回復したデータを復旧した磁気ディスクにコピーするとともに、前記新たなＲＡＩＤグループ内のデータ及びパリティデータを用いて、前記障害発生した磁気ディスクが属するＲＡＩＤグループのパリティデータ及び前記他のＲＡＩＤグループのパリティデータを再生成しそれぞれ元の格納位置に再格納し、前記ＲＡＩＤ状態管理部は、前記障害発生した磁気ディスクが属するＲＡＩＤグループと他のＲＡＩＤグループとをそれぞれ独立したＲＡＩＤグループとして再構成することを特徴とする磁気ディスク装置を提供するものである。
このように、磁気ディスク復旧後に、消失したデータを元の格納位置に戻すとともに、新たなＲＡＩＤグループを分離して元通りのＲＡＩＤ構成に戻すことにより、障害発生前の状態のＨＤＤが復元され、本来の冗長性レベルでの運用を再開することが可能である。

本発明の磁気ディスク装置において、前記データ回復制御部は、前記磁気ディスク上の先頭論理アドレスからアドレス順に、消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理を実行し、前記分離再生成部は、前記磁気ディスク上の先頭論理アドレスからアドレス順に、ＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理を実行し、前記進捗管理部は、当該処理が完了した最後の論理アドレスを示すポインタを用いて進捗管理を行うことを特徴とする。
これにより、消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中や、ＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理中にホストコンピュータからのデータアクセスが生じた場合にも、アクセス先の状態に応じた適切な応答をすることが可能となる。具体的には、以下の通りである。

前記分離再生成部によるＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのリード要求が発生した場合、前記対ホスト制御部は、前記リード要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記復旧した磁気ディスク上に回復されたデータを読み込み、前記リード要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、前記新たなＲＡＩＤグループ内のデータ及びパリティデータを用いて回復されるデータを読み込むことを特徴とする。

前記分離再生成部によるＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理中に、ホストコンピュータから前記障害発生し磁気ディスクへのライト要求が発生した場合、前記対ホスト制御部は、前記ライト要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記復旧した磁気ディスク上にデータの書き込みを行うとともに前記障害発生した磁気ディスクが属するＲＡＩＤグループのパリティデータの更新を行い、前記ライト要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、前記新たなＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータからライト処理後のデータが回復されるように当該パリティデータを書き換えることを特徴とする。

以上、説明したように、本発明の磁気ディスク装置は、ＲＡＩＤを構成するＨＤＤが故障した場合に、故障したＨＤＤが属するＲＡＩＤグループと他のＲＡＩＤグループとを１つのＲＡＩＤグループに統合し、当該ＲＡＩＤグループ内で最大限の冗長性を維持しながら稼働させることができる。例えば、ＲＡＩＤ５で３Ｄ＋１Ｐのディスク構成である場合、ＨＤＤ障害時に２つのＲＡＩＤグループを統合して６Ｄ＋１Ｐのディスク構成とすることによりＲＡＩＤ５としての運用が可能である。これにより、当該ＲＡＩＤグループ内で更なるＨＤＤ障害が発生した場合にも、データを消失することなく対応することが可能となる。
尚、この統合に要する処理は、障害が生じたＨＤＤの格納データを回復して予備のＨＤＤに格納する処理とほぼ同等であるので、システムに過度な負荷がかかることもない。

本発明の一実施形態に係る磁気ディスク装置の内部構成を示す図である。図１に示す磁気ディスク装置におけるＨＤＤ障害発生時の運用切り替え及び障害復旧処理の原理を概略的に説明する図である。図１に示す磁気ディスク装置におけるＨＤＤ障害発生時の運用切り替え及び障害復旧処理の原理を概略的に説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ５で構成したＲＡＩＤグループ＃０のうち１台のＨＤＤに障害が発生した場合に、ＲＡＩＤグループ＃１との結合を行う運用切り替え処理の動作を説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ５で構成したＲＡＩＤグループ＃０のうち１台のＨＤＤに障害が発生した場合に、ＲＡＩＤグループ＃２との結合を行う運用切り替え処理の動作を説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ１で構成したＲＡＩＤグループ＃３のうち１台のＨＤＤに障害が発生した場合に、ＲＡＩＤグループ＃１との結合を行う運用切り替え処理の動作を説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ１で構成したＲＡＩＤグループ＃３のうち１台のＨＤＤに障害が発生した場合に、ＲＡＩＤグループ＃２との結合を行う運用切り替え処理の動作を説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＨＤＤ障害が発生したＲＡＩＤ５のＲＡＩＤグループを他のＲＡＩＤ５のＲＡＩＤグループと結合したものを再び分離する障害復旧処理の動作を説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＨＤＤ障害が発生したＲＡＩＤ５のＲＡＩＤグループを他のＲＡＩＤ６のＲＡＩＤグループと結合したものを再び分離する障害復旧処理の動作を説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＨＤＤ障害が発生したＲＡＩＤ１のＲＡＩＤグループを他のＲＡＩＤ５のＲＡＩＤグループと結合したものを再び分離する障害復旧処理の動作を説明する図である。図１に示す本実施形態の磁気ディスク装置において、ＨＤＤ障害が発生したＲＡＩＤ１のＲＡＩＤグループを他のＲＡＩＤ６のＲＡＩＤグループと結合したものを再び分離する障害復旧処理の動作を説明する図である。本実施形態の磁気ディスク装置において、ＨＤＤ障害発生による運用切り替え処理中の状態におけるホストからのアクセスの処理方法を説明する図である。本実施形態の磁気ディスク装置において、ＨＤＤ回復に伴う障害復旧処理中の状態におけるホストからのアクセスの処理方法を説明する図である。本実施形態の磁気ディスク装置の全体動作を示すフロー図である。本実施形態の磁気ディスク装置による回復・結合コピー処理の詳細を示すフロー図である。本実施形態の磁気ディスク装置によるパリティ再生成・分離コピー処理の詳細を示すフロー図である。本実施形態の磁気ディスク装置による通常のホストアクセス処理の詳細を示すフロー図である。本実施形態の磁気ディスク装置によるデータ回復処理時のホストアクセス処理の詳細を示すフロー図である。本実施形態の磁気ディスク装置によるパリティ復旧時のホストアクセス処理の詳細を示すフロー図である。本実施形態の磁気ディスク装置において、ＨＤＤ障害発生によるＲＡＩＤグループの結合の際に、複数の結合先候補グループから結合先グループを選定する基準となる優先度テーブルの例を示す図である。

以下、添付図面を参照しながら、本発明の磁気ディスク装置を実施するための最良の形態を詳細に説明する。図１〜図２０は、本発明の実施の形態を例示する図であり、これらの図において、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。

＜装置構成＞
図１は、本発明の一実施形態に係る磁気ディスク装置の内部構成を示す図である。
図１に示すように、本実施形態の磁気ディスク装置２１は、ホストインタフェース２２と、キャッシュメモリ２３と、ドライブインタフェース２４と、ホストコンピュータ１１からのリードライト要求を処理する対ホスト制御部３１と、ＲＡＩＤ構成のＨＤＤ群を制御する対ドライブ制御部４１と、ＲＡＩＤを構成する複数のＨＤＤからなるドライブモジュール６１とを有している。

対ホスト制御部３１は、ホストコンピュータ１１からのリード要求を処理するリード処理部３２と、ライト要求を処理するライト処理部３３と、有限回数ループカウンタ３４とを有している。

対ドライブ制御部４１は、ドライブモジュール６１における各ＨＤＤの稼働状態を管理するＨＤＤ状態管理部４２と、ドライブモジュール６１のＲＡＩＤの稼働状態を管理するＲＡＩＤ状態管理部４３と、ＨＤＤ障害時の消失データの回復及び運用切り替えとＨＤＤ復旧時のデータ復旧を行う回復／復旧コピー機能部４４と、消失データの回復及び復旧処理におけるデータコピー作業を管理するコピー進捗管理部５１と、タイマ監視部５３とを有している。

ＲＡＩＤ状態管理部４３は、ドライブモジュール６１におけるＲＡＩＤグループ同士の結合状態を管理する機能部であり、各ＲＡＩＤグループにつき他のＲＡＩＤグループとの結合可否を示す結合可否フラグ４３Ａと、各ＲＡＩＤグループに対する結合候補ＲＡＩＤグループに関する情報を保持する結合候補管理部４３Ｂとを有している。

回復／復旧コピー機能部４４は、障害の発生したＨＤＤ以外のＨＤＤに記憶されたデータ及びパリティデータから消失データを回復させるデータ回復制御部４４Ａと、回復されたデータのパリティデータを再生成するパリティ再生成部４４Ｂとを有し、さらに障害対応の運用切り替えとしてＲＡＩＤグループの結合を行うＲＡＩＤグループ結合部４４Ｃと、障害復旧時に結合したＲＡＩＤグループの分離を行うＲＡＩＤグループ分離部４４Ｄとを有している。
コピー進捗管理部５１は、消失データの回復及び復旧処理におけるデータコピー作業の進捗に関する情報として、コピー中ポインタ５２Ａとコピー済ポインタ５２Ｂとを有している。

ドライブモジュール６１は、ＨＤＤ＃０〜＃１３の１４台のＨＤＤを有している。ＨＤＤ＃０〜＃３がＲＡＩＤグループ＃０（６２）を構成し、ＨＤＤ＃４〜＃７がＲＡＩＤグループ＃１（６３）を構成し、ＨＤＤ＃８〜＃１１がＲＡＩＤグループ＃２（６４）を構成し、ＨＤＤ＃１２〜＃１３がＲＡＩＤグループ＃３（６５）を構成している。ＲＡＩＤグループ＃０，＃１は３Ｄ＋１ＰのＲＡＩＤ５であり、ＲＡＩＤグループ＃２は、２Ｄ＋１Ｐ＋１ＱのＲＡＩＤ６であり、ＲＡＩＤグループ＃３はＲＡＩＤ１である。

＜障害対応の原理＞
図２及び図３は、本実施形態の磁気ディスク装置におけるＨＤＤ障害発生時の運用切り替え及び障害復旧処理の原理を概略的に説明する図である。
図２（Ａ）に、正常状態のＲＡＩＤシステムの構成を示している。このＲＡＩＤシステムは、ＨＤＤ＃０〜＃２からなるＲＡＩＤグループ＃０と、ＨＤＤ＃３〜＃５からなるＲＡＩＤグループ＃１とから構成されている。ＲＡＩＤグループ＃０，＃１は、それぞれ２Ｄ＋１ＰのＲＡＩＤ５を構成しており、図中、Ｄ_０〜Ｄ_５，Ｄ_０’〜Ｄ_５’はデータブロックを示し、Ｐ_０〜Ｐ_２，Ｐ_０’〜Ｐ_２’はパリティブロックを示している。
尚、ここでは簡略化のため、ＨＤＤ３台でＲＡＩＤ５を構成し、各ＨＤＤを３つのストライプに分割した場合を例示するが、本原理は他の構成のＲＡＩＤ５、ＲＡＩＤ６等のシステムにも応用が可能である。

以下、図２（Ａ）に示すＲＡＩＤシステムにおいて、ＨＤＤ＃２に障害が発生した場合の運用切り替え及び障害復旧処理について説明する。
まず、先頭のストライプ＃０から運用切り替え処理が開始される。図２（Ｂ）に示すように、ＨＤＤ＃２に格納されていたパリティブロックＰ_０が消失している。ここで、磁気ディスク装置は、ＲＡＩＤグループ＃０と＃１とを結合して１つのＲＡＩＤグループに統合する。すなわち、ストライプ＃０におけるデータブロックＤ_０，Ｄ_１，Ｄ_０’，Ｄ_１’とパリティブロックＰ_０’とから新たなパリティデータ^結合Ｐ_０を生成し、パリティデータブロックＰ_０’が格納されていたＨＤＤ＃５に格納する。

ストライプ＃１においては、図２（Ｃ）に示すように、ＨＤＤ＃２に格納されていたデータブロックＤ_３が消失している。そこで、磁気ディスク装置は、データブロックＤ_２とパリティブロックＰ_１とから消失したデータブロックＤ_３を回復し、これをパリティデータブロックＰ_１が格納されていたＨＤＤ＃１に格納する。
その後、ＲＡＩＤグループ＃０と＃１のストライプ＃１におけるデータブロックＤ_２，Ｄ_３，Ｄ_２’，Ｄ_３’とパリティブロックＰ_１’とから新たなパリティデータ^結合Ｐ_１を生成し、パリティデータブロックＰ_１’が格納されていたＨＤＤ＃４に格納する。

ストライプ＃２においては、図２（Ｄ）に示すように、ＨＤＤ＃２に格納されていたデータブロックＤ_５が消失している。そこで、磁気ディスク装置は、データブロックＤ_４とパリティブロックＰ_２とから消失したデータブロックＤ_５を回復し、これをパリティデータブロックＰ_２が格納されていたＨＤＤ＃０に格納する。
その後、ＲＡＩＤグループ＃０と＃１のストライプ＃２におけるデータブロックＤ_４，Ｄ_５，Ｄ_４’，Ｄ_５’とパリティブロックＰ_２’とから新たなパリティデータ^結合Ｐ_２を生成し、パリティデータブロックＰ_２’が格納されていたＨＤＤ＃３に格納する。

以上説明したように、磁気ディスク装置は、ＲＡＩＤグループ＃０のＨＤＤ＃２に障害が発生した際に、消失データの回復を行うととともに、ＲＡＩＤグループ＃０と＃１とを結合して１つのＲＡＩＤグループ（ＲＡＩＤ５、４Ｄ＋１Ｐ）とすることにより、ＲＡＩＤシステムの冗長性を保ちながら運用を継続することができる。

続いて、閉塞していたＨＤＤ＃２が復旧した際の障害復旧処理について説明する。障害復旧処理では、結合していたＲＡＩＤグループ＃０と＃１を分離して、ＲＡＩＤシステムを障害発生前の状態に復旧する。
まず、先頭のストライプ＃０においては、図３（Ａ）に示すように、データブロックＤ_０，Ｄ_１から再生成されるパリティブロックＰ_０を復旧したＨＤＤ＃２上に格納する。他方で、データブロックＤ_０’，Ｄ_１’から再生成されるパリティブロックＰ_０’をＨＤＤ＃５上に格納する。

ストライプ＃１においては、図３（Ｂ）に示すように、データブロックＤ_２，Ｄ_３からパリティブロックＰ_１を再生成し、ＨＤＤ＃２上のデータブロックＤ_３を本来の格納位置であるＨＤＤ＃２上にコピーした後、再生成したパリティブロックＰ_１をＨＤＤ＃１上に格納する。他方で、データブロックＤ_２’，Ｄ_３’から再生成されるパリティブロックＰ_１’をＨＤＤ＃４上に格納する。

ストライプ＃２においては、図３（Ｃ）に示すように、データブロックＤ_４，Ｄ_５からパリティブロックＰ_２を再生成し、ＨＤＤ＃１上のデータブロックＤ_５を本来の格納位置であるＨＤＤ＃２上にコピーした後、再生成したパリティブロックＰ_２をＨＤＤ＃０上に格納する。他方で、データブロックＤ_４’，Ｄ_５’から再生成されるパリティブロックＰ_２’をＨＤＤ＃３上に格納する。

以上説明したように、磁気ディスク装置は、ＨＤＤ障害発生により２つのＲＡＩＤグループを結合して１つのＲＡＩＤグループに統合していたものを、ＨＤＤ復旧にともなって再び分割し、元の構成のＲＡＩＤシステムに復旧させることができる。

＜動作＞
次に、図１に示す本実施形態の磁気ディスク装置において、ドライブモジュール６１内でＨＤＤ障害発生が発生した場合の運用切り替え及び障害復旧処理の詳細について説明する。

＜障害発生時の運用切り替え処理＞
図４は、図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ５で構成したＲＡＩＤグループ＃０（６２）のうち１台のＨＤＤに障害が発生した場合の運用切り替え処理の動作を説明する図である。以下に説明する運用切り替え処理は、磁気ディスク装置２１の回復／復旧コピー機能部４４のデータ回復制御部４４Ａ、パリティ再生成部４４Ｂ、ＲＡＩＤグループ結合部４４Ｃが、上記で説明した障害発生時の運用切り替えの原理に基づいて実行・管理する。

ここでは図４に示すように、ＲＡＩＤグループ＃０（６２）のＨＤＤ＃２が障害により閉塞した場合に、ＲＡＩＤ５であるＲＡＩＤグループ＃１（６３）との結合を行う運用切り替え処理を例に説明する。
まず、磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤの先頭ストライプ＃０の格納データ（Ｄ_０，Ｄ_１，Ｐ_０）をキャッシュメモリ２３上の作業領域にコピー（ステージ）し、これらのデータからＨＤＤ＃２の障害により消失したデータブロックＤ_２を回復し、パリティブロックＰ_０が格納されていたＨＤＤ＃３上に回復データブロックＤ_２を上書きコピー（デステージ）する。
（ここで便宜上、ＨＤＤ上のデータをキャッシュメモリに読み込むことを「ステージ」といい、キャッシュメモリ上のデータをＨＤＤに書き込むことを「デステージ」という。また、図中回復したデータブロックＤ_２を^ｒＤ_２のように表記する。）

続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１の先頭ストライプ＃０のＨＤＤ＃７に格納されたパリティブロックＰ_０’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているパリティブロックＰ_０とＰ_０’とから結合パリティ^ＣＰ_０を生成し、パリティブロックＰ_０’が格納されていたＨＤＤ＃７上に結合パリティ^ＣＰ_０をデステージする。
このようにして、先頭ストライプ＃０については、７台のＨＤＤにより６Ｄ＋１ＰのＲＡＩＤ５が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

１つのストライプについて、運用切り替え処理が完了すると、次のストライプに作業が移行する。ここで、本実施形態の磁気ディスク装置では、コピー進捗管理部５１により、運用切り替え処理の進捗状況を管理している。具体的には、図４に示すように、論理ブロック（ストライプ）単位で、運用切り替え処理が完了した位置を示すコピー済ポインタ５２Ｂと、現在運用切り替え処理中である先頭位置とを示すコピー中ポインタ５２Ａとを用いて管理している。これらのポインタにより、論理ブロック（ストライプ）単位で、運用切り替え処理済み範囲、運用切り替え処理中範囲、運用切り替え処理未着手範囲が容易に把握できるようになっている。

次に、ストライプ＃１について運用切り替え処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃１の格納データ（Ｄ_４，Ｄ_５，Ｄ_３）をキャッシュメモリ２３上の作業領域にステージする。ＲＡＩＤグループ＃０のストライプ＃１については、データブロックが消失していないため、データブロックの回復及びデステージ処理は不要である。
続いて、ＲＡＩＤグループ＃１のストライプ＃１のＨＤＤ＃６に格納されたパリティブロックＰ_１’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているデータブロックＤ_４，Ｄ_５，Ｄ_３とパリティブロックＰ_１’とから結合パリティ^ＣＰ_１を生成し、パリティブロックＰ_１’が格納されていたＨＤＤ＃６上に結合パリティ^ＣＰ_１をデステージする。
このようにして、ストライプ＃１についても、７台のＨＤＤにより６Ｄ＋１ＰのＲＡＩＤ５が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

次に、ストライプ＃２について運用切り替え処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃２の格納データ（Ｄ_８，Ｐ_２，Ｄ_７）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからＨＤＤ＃２の障害により消失したデータブロックＤ_６を回復し、パリティブロックＰ_２が格納されていたＨＤＤ＃１上に回復データブロックＤ_６をデステージする。
続いて、ＲＡＩＤグループ＃１のストライプ＃２のＨＤＤ＃５に格納されたパリティブロックＰ_２’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているパリティブロックＰ_２とＰ_２’とから結合パリティ^ＣＰ_２を生成し、パリティブロックＰ_２’が格納されていたＨＤＤ＃５上に結合パリティ^ＣＰ_２をデステージする。
このようにして、ストライプ＃２についても、７台のＨＤＤにより６Ｄ＋１ＰのＲＡＩＤ５が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

次に、ストライプ＃３について運用切り替え処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃３の格納データ（Ｐ_３，Ｄ_９，Ｄ_１１）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからＨＤＤ＃２の障害により消失したデータブロックＤ_１０を回復し、パリティブロックＰ_３が格納されていたＨＤＤ＃０上に回復データブロックＤ_１０をデステージする。
続いて、ＲＡＩＤグループ＃１のストライプ＃３のＨＤＤ＃４に格納されたパリティブロックＰ_３’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているパリティブロックＰ_３とＰ_３’とから結合パリティ^ＣＰ_３を生成し、パリティブロックＰ_３’が格納されていたＨＤＤ＃４上に結合パリティ^ＣＰ_３をデステージする。
このようにして、ストライプ＃３についても、７台のＨＤＤにより６Ｄ＋１ＰのＲＡＩＤ５が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。
以下、ストライプ＃４以降についても同様にして運用切り替え処理を行うことができる。

尚、本実施形態の磁気ディスク装置では、コピー進捗管理部５１により、論理ブロックごとに行われる運用切り替え処理の進捗状況を管理している。具体的には、図示するように、論理ブロック（ストライプ）単位で、データ回復処理及び結合パリティ生成処理が完了した位置を示すコピー済ポインタ５２Ｂと、現在データ回復処理及び結合パリティ生成処理を行っている先頭位置を示すコピー中ポインタ５２Ａとを用いて管理している。これらのポインタにより、論理ブロック（ストライプ）単位で、運用切り替え済み範囲、運用切り替え中範囲、運用切り替え未着手範囲が容易に把握できるようになっている。

以上、ＲＡＩＤ５の場合を例に挙げて説明したが、パリティが１台のパリティディスクに集約されているＲＡＩＤ３、ＲＡＩＤ４についても、全く同様に適用することが可能である。また、データからハミングコード（ＥＣＣコード）を生成し、ビット毎に複数のＨＤＤに分散して記憶するＲＡＩＤ２についても、全く同様に適用することが可能である。

図５は、図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ５で構成したＲＡＩＤグループ＃０（６２）のうちＨＤＤ＃２に障害が発生した場合に、ＲＡＩＤグループ＃２（６４）との結合を行う運用切り替え処理の動作を説明する図である。尚、ＲＡＩＤグループ＃２（６４）はＲＡＩＤ６である。

まず、磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤの先頭ストライプ＃０の格納データ（Ｄ_０，Ｄ_１，Ｐ_０）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからＨＤＤ＃２の障害により消失したデータブロックＤ_２を回復し、パリティブロックＰ_０が格納されていたＨＤＤ＃３上に回復データブロックＤ_２をデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２の先頭ストライプ＃０のＨＤＤ＃１０，＃１１に格納されたパリティブロックＰ_０’，Ｑ_０’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているパリティブロックＰ_０とＰ_０’とから結合パリティ^ＣＰ_０を生成し、先にステージされているデータブロックＤ_０，Ｄ_１と回復されたデータブロックＤ_２とパリティブロックＱ_０’とから結合パリティ^ＣＱ_０を生成し、パリティブロックＰ_０’，Ｑ_０’が格納されていたＨＤＤ＃１０，＃１１上に結合パリティ^ＣＰ_０，^ＣＱ_０をデステージする。
このようにして、先頭ストライプ＃０については、７台のＨＤＤにより５Ｄ＋１Ｐ＋１ＱのＲＡＩＤ６が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

次に、ストライプ＃１について運用切り替え処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃１の格納データ（Ｄ_４，Ｄ_５，Ｄ_３）をキャッシュメモリ２３上の作業領域にステージする。ＲＡＩＤグループ＃０のストライプ＃１については、データブロックが消失していないため、データブロックの回復及びデステージ処理は不要である。
続いて、ＲＡＩＤグループ＃２のストライプ＃１のＨＤＤ＃９，＃１０に格納されたパリティブロックＰ_１’，Ｑ_１’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているデータブロックＤ_４，Ｄ_５，Ｄ_３とパリティブロックＰ_１’とから結合パリティ^ＣＰ_１を生成し、先にステージされているデータブロックＤ_４，Ｄ_５，Ｄ_３とパリティブロックＱ_１’とから結合パリティ^ＣＱ_１を生成し、パリティブロックＰ_１’，Ｑ_１’が格納されていたＨＤＤ＃９，＃１０上に結合パリティ^ＣＰ_１，^ＣＱ_１をデステージする。
このようにして、ストライプ＃１についても、７台のＨＤＤにより５Ｄ＋１Ｐ＋１ＱのＲＡＩＤ６が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

次に、ストライプ＃２について運用切り替え処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃２の格納データ（Ｄ_８，Ｐ_２，Ｄ_７）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからＨＤＤ＃２の障害により消失したデータブロックＤ_６を回復し、パリティブロックＰ_２が格納されていたＨＤＤ＃１上に回復データブロックＤ_６をデステージする。
続いて、ＲＡＩＤグループ＃２のストライプ＃２のＨＤＤ＃８，＃９に格納されたパリティブロックＰ_２’，Ｑ_２’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているパリティブロックＰ_２とＰ_２’とから結合パリティ^ＣＰ_２を生成し、先にステージされているデータブロックＤ_８，Ｄ_７と回復されたデータブロックＤ_６とパリティブロックＱ_２’とから結合パリティ^ＣＱ_２を生成し、パリティブロックＰ_２’，Ｑ_２’が格納されていたＨＤＤ＃８，＃９上に結合パリティ^ＣＰ_２，^ＣＱ_２をデステージする。
このようにして、ストライプ＃２についても、７台のＨＤＤにより５Ｄ＋１Ｐ＋１ＱのＲＡＩＤ６が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

次に、ストライプ＃３について運用切り替え処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図２に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃３の格納データ（Ｐ_３，Ｄ_９，Ｄ_１１）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからＨＤＤ＃２の障害により消失したデータブロックＤ_１０を回復し、パリティブロックＰ_３が格納されていたＨＤＤ＃０上に回復データブロックＤ_１０をデステージする。
続いて、ＲＡＩＤグループ＃２のストライプ＃３のＨＤＤ＃１１、＃８に格納されたパリティブロックＰ_３’，Ｑ_３’をキャッシュメモリ２３上の作業領域にステージし、先にステージされているパリティブロックＰ_３とＰ_３’とから結合パリティ^ＣＰ_３を生成し、
先にステージされているデータブロックＤ_９，Ｄ_１１と回復されたデータブロックＤ_１０とパリティブロックＱ_３’とから結合パリティ^ＣＱ_３を生成し、パリティブロックＰ_３’，Ｑ_３’が格納されていたＨＤＤ＃１１，＃８上に結合パリティ^ＣＰ_３，^ＣＱ_３をデステージする。
このようにして、ストライプ＃３についても、７台のＨＤＤにより５Ｄ＋１Ｐ＋１ＱのＲＡＩＤ６が構成されることになり、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。
以下、ストライプ＃４以降についても同様にして運用切り替え処理を行うことができる。

図６は、図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ１で構成したＲＡＩＤグループ＃３（６５）のうちＨＤＤ＃１３に障害が発生した場合に、ＲＡＩＤ５であるＲＡＩＤグループ＃１（６３）との結合を行う運用切り替え処理の動作を説明する図である。

図６に示すように、各ストライプにおいて、ＲＡＩＤグループ＃３のＨＤＤ＃１２に格納されたデータブロックと、ＲＡＩＤグループ＃１におけるパリティブロックとをキャッシュメモリ２３上にステージし、これらから結合パリティブロックを生成して、ＲＡＩＤグループ＃１のパリティブロック格納位置にデステージする。
これにより、ＨＤＤ障害が発生したＲＡＩＤ１のＲＡＩＤグループ＃３とＲＡＩＤ５のＲＡＩＤグループ＃１とを結合して、４Ｄ＋１ＰのＲＡＩＤ５を構成することができるので、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

図７は、図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ１で構成したＲＡＩＤグループ＃３（６５）のうちＨＤＤ＃１３に障害が発生した場合に、ＲＡＩＤ６であるＲＡＩＤグループ＃２（６４）との結合を行う運用切り替え処理の動作を説明する図である。

図７に示すように、各ストライプにおいて、ＲＡＩＤグループ＃３のＨＤＤ＃１２に格納されたデータブロックと、ＲＡＩＤグループ＃２における２種類のパリティブロックとをキャッシュメモリ２３上にステージし、各々の組み合わせから２種類の結合パリティブロックを生成して、ＲＡＩＤグループ＃２の各種のパリティブロック格納位置にデステージする。
これにより、ＨＤＤ障害が発生したＲＡＩＤ１のＲＡＩＤグループ＃３とＲＡＩＤ６のＲＡＩＤグループ＃２とを結合して、３Ｄ＋１Ｐ＋１ＱのＲＡＩＤ６を構成することができるので、ＨＤＤ障害に対応しながらも冗長性が維持されたこととなる。

＜障害回復時のデータ復旧処理＞
図８は、図１に示す本実施形態の磁気ディスク装置において、ＲＡＩＤ５で構成したＲＡＩＤグループ＃０（６２）のうちＨＤＤ＃２に障害が発生し、ＲＡＩＤ５で構成したＲＡＩＤグループ＃１（６３）との結合ＲＡＩＤグループを構成した後に、ＨＤＤ＃２の復旧により元のＲＡＩＤ構成を復旧する障害復旧処理の動作を説明する図である。以下に説明する障害復旧処理は、磁気ディスク装置２１の回復／復旧コピー機能部４４のデータ回復制御部４４Ａ、パリティ再生成部４４Ｂ、ＲＡＩＤグループ分離部４４Ｄが、上記で図３を参照しながら説明した障害復旧の原理に基づいて実行・管理する。

まず、磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤの先頭ストライプ＃０に格納されたデータブロックＤ_０，Ｄ_１，^ｒＤ_２をキャッシュメモリ２３上の作業領域にステージし、これらのデータからパリティブロックＰ_０を再生成し、データブロック^ｒＤ_２をＨＤＤ＃２にデステージし、パリティブロックＰ_０をＨＤＤ＃３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１の先頭ストライプ＃０のＨＤＤ＃７に格納された結合パリティブロック^ＣＰ_０をキャッシュメモリ２３上の作業領域にステージし、先にステージされているデータブロックＤ_０，Ｄ_１，^ｒＤ_２と結合パリティブロック^ＣＰ_０とから本来ＨＤＤ＃７に格納されていたパリティブロックＰ_０’ を再生成し、ＨＤＤ＃７上にデステージする。
このようにして、先頭ストライプ＃０については、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０，＃１が復旧されたこととなる。

次に、ストライプ＃１について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃１の格納データ（Ｄ_４，Ｄ_５，Ｄ_３）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからＨＤＤ＃２に本来格納されるべきパリティブロックＰ_１を再生成し、ＨＤＤ＃２上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１の先頭ストライプ＃１のＨＤＤ＃６に格納された結合パリティブロック^ＣＰ_１をキャッシュメモリ２３上の作業領域にステージし、先にステージされているデータブロックＤ_４，Ｄ_５，Ｄ_３と結合パリティブロック^ＣＰ_１とから本来ＨＤＤ＃６に格納されていたパリティブロックＰ_１’を再生成し、ＨＤＤ＃６上にデステージする。
このようにして、ストライプ＃１についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０，＃１が復旧されたこととなる。

次に、ストライプ＃２について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃２の格納データ（Ｄ_８，^ｒＤ_６，Ｄ_７）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからパリティブロックＰ_２を再生成し、データブロック^ｒＤ_６をＨＤＤ＃２にデステージし、パリティブロックＰ_２をＨＤＤ＃１上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１の先頭ストライプ＃２のＨＤＤ＃５に格納された結合パリティブロック^ＣＰ_２をキャッシュメモリ２３上の作業領域にステージし、先にステージされているデータブロックＤ_８，^ｒＤ_６，Ｄ_７と結合パリティブロック^ＣＰ_２とから本来ＨＤＤ＃５に格納されていたパリティブロックＰ_２’を再生成し、ＨＤＤ＃５上にデステージする。
このようにして、ストライプ＃２についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０，＃１が復旧されたこととなる。

次に、ストライプ＃３について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃３の格納データ（^ｒＤ_１０，Ｄ_９，Ｄ_１１）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからパリティブロックＰ_３を再生成し、データブロック^ｒＤ_１０をＨＤＤ＃２にデステージし、パリティブロックＰ_３をＨＤＤ＃１上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１の先頭ストライプ＃３のＨＤＤ＃４に格納された結合パリティブロック^ＣＰ_３をキャッシュメモリ２３上の作業領域にステージし、先にステージされているデータブロック^ｒＤ_１０，Ｄ_９，Ｄ_１１と結合パリティブロック^ＣＰ_３とから本来ＨＤＤ＃４に格納されていたパリティブロックＰ_３’を再生成し、ＨＤＤ＃４上にデステージする。
このようにして、ストライプ＃３についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０，＃１が復旧されたこととなる。
以下、ストライプ＃４以降についても同様にして障害復旧処理を行うことができる。

尚、本実施形態の磁気ディスク装置では、コピー進捗管理部５１により、論理ブロックごとに行われるデータ復旧処理の進捗状況を管理している。具体的には、図示するように、論理ブロック（ストライプ）単位で、障害復旧処理が完了した位置を示すコピー済ポインタ５２Ｂと、現在障害復旧を行っている先頭位置を示すコピー中ポインタ５２Ａとを用いて管理している。これらのポインタにより、論理ブロック（ストライプ）単位で、障害復旧済み範囲、障害復旧中範囲、障害復旧未着手範囲が容易に把握できるようになっている。

図９は、図１に示す本実施形態の磁気ディスク装置において、ＨＤＤ障害が発生したＲＡＩＤ５のＲＡＩＤグループ＃０（６２）を他のＲＡＩＤ６のＲＡＩＤグループ＃２（６４）と結合したものを再び分離する障害復旧処理の動作を説明する図である。

まず、磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤの先頭ストライプ＃０に格納されたデータブロックＤ_０，Ｄ_１，^ｒＤ_２をキャッシュメモリ２３上の作業領域にステージし、これらのデータからパリティブロックＰ_０を再生成し、データブロック^ｒＤ_２をＨＤＤ＃２にデステージし、パリティブロックＰ_０をＨＤＤ＃３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２の先頭ストライプ＃０のＨＤＤ＃１０，＃１１に格納された結合パリティブロック^ＣＰ_０，^ＣＱ_０をキャッシュメモリ２３上の作業領域にステージし、再生成されたパリティブロックＰ_０と結合パリティブロック^ＣＰ_０とから本来ＨＤＤ＃１０に格納されていたパリティブロックＰ_０’を再生成し、先にステージされているデータブロックＤ_０，Ｄ_１，^ｒＤ_２と結合パリティブロック^ＣＱ_０とから本来ＨＤＤ＃１１に格納されていたパリティブロックＱ_０’を再生成し、それぞれをＨＤＤ＃１０，＃１１上にデステージする。
このようにして、先頭ストライプ＃０については、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。

次に、ストライプ＃１について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃１の格納データ（Ｄ_４，Ｄ_５，Ｄ_３）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからパリティブロックＰ_１を再生成し、ＨＤＤ＃２上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２のストライプ＃１のＨＤＤ＃９，＃１０に格納された結合パリティブロック^ＣＰ_１，^ＣＱ_１をキャッシュメモリ２３上の作業領域にステージし、再生成されたパリティブロックＰ_１と結合パリティブロック^ＣＰ_１とから本来ＨＤＤ＃９に格納されていたパリティブロックＰ_１’を再生成し、先にステージされているデータブロックＤ_４，Ｄ_５，Ｄ_３と結合パリティブロック^ＣＱ_１とから本来ＨＤＤ＃１０に格納されていたパリティブロックＱ_１’を再生成し、それぞれをＨＤＤ＃９，＃１０上にデステージする。
このようにして、ストライプ＃１についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。

次に、ストライプ＃２について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃２の格納データ（Ｄ_８，^ｒＤ_６，Ｄ_７）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからパリティブロックＰ_２を再生成し、データブロック^ｒＤ_６をＨＤＤ＃２にデステージし、パリティブロックＰ_２をＨＤＤ＃１上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２のストライプ＃２のＨＤＤ＃８，＃９に格納された結合パリティブロック^ＣＰ_２，^ＣＱ_２をキャッシュメモリ２３上の作業領域にステージし、再生成されたパリティブロックＰ_２と結合パリティブロック^ＣＰ_２とから本来ＨＤＤ＃８に格納されていたパリティブロックＰ_２’を再生成し、先にステージされているデータブロックＤ_８，^ｒＤ_６，Ｄ_７と結合パリティブロック^ＣＱ_２とから本来ＨＤＤ＃９に格納されていたパリティブロックＱ_２’を再生成し、それぞれをＨＤＤ＃８，＃９上にデステージする。
このようにして、ストライプ＃２についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。

次に、ストライプ＃３について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃０の各ＨＤＤのストライプ＃３の格納データ（^ｒＤ_１０，Ｄ_９，Ｄ_１１）をキャッシュメモリ２３上の作業領域にステージし、これらのデータからパリティブロックＰ_３を再生成し、データブロック^ｒＤ_１０をＨＤＤ＃２にデステージし、パリティブロックＰ_３をＨＤＤ＃０上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２のストライプ＃３のＨＤＤ＃１１，＃８に格納された結合パリティブロック^ＣＰ_３，^ＣＱ_３をキャッシュメモリ２３上の作業領域にステージし、再生成されたパリティブロックＰ_３と結合パリティブロック^ＣＰ_３とから本来ＨＤＤ＃１１に格納されていたパリティブロックＰ_３’を再生成し、先にステージされているデータブロック^ｒＤ_１０，Ｄ_９，Ｄ_１１と結合パリティブロック^ＣＱ_３とから本来ＨＤＤ＃８に格納されていたパリティブロックＱ_３’を再生成し、それぞれをＨＤＤ＃１１，＃８上にデステージする。
このようにして、ストライプ＃３についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ５で構成されたＲＡＩＤグループ＃０及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。
以下、ストライプ＃４以降についても同様にして障害復旧処理を行うことができる。

図１０は、図１に示す本実施形態の磁気ディスク装置において、ＨＤＤ障害が発生したＲＡＩＤ１のＲＡＩＤグループ＃３（６５）を他のＲＡＩＤ５のＲＡＩＤグループ＃１（６３）と結合したものを再び分離する障害復旧処理の動作を説明する図である。

まず、磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３のＨＤＤ＃１２の先頭ストライプ＃０に格納されたデータブロックＤ_０をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１の先頭ストライプ＃０のＨＤＤ＃７に格納された結合パリティブロック^ＣＰ_０をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_０と結合パリティブロック^ＣＰ_０とから本来ＨＤＤ＃７に格納されていたパリティブロックＰ_０’を再生成し、ＨＤＤ＃７上にデステージする。
このようにして、先頭ストライプ＃０については、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ５で構成されたＲＡＩＤグループ＃１が復旧されたこととなる。

次に、ストライプ＃１について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３のＨＤＤ＃１２のストライプ＃１の格納データ（Ｄ_１）をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１のストライプ＃１のＨＤＤ＃６に格納された結合パリティブロック^ＣＰ_１をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_１と結合パリティブロック^ＣＰ_１とから本来ＨＤＤ＃６に格納されていたパリティブロックＰ_１’を再生成し、ＨＤＤ＃６上にデステージする。
このようにして、ストライプ＃１についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ５で構成されたＲＡＩＤグループ＃１が復旧されたこととなる。

次に、ストライプ＃２について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３の各ＨＤＤのストライプ＃２の格納データ（Ｄ_２）をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１のストライプ＃２のＨＤＤ＃５に格納された結合パリティブロック^ＣＰ_２をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_２と結合パリティブロック^ＣＰ_２とから本来ＨＤＤ＃５に格納されていたパリティブロックＰ_２’を再生成し、ＨＤＤ＃５上にデステージする。
このようにして、ストライプ＃２についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ５で構成されたＲＡＩＤグループ＃１が復旧されたこととなる。

次に、ストライプ＃３について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３の各ＨＤＤのストライプ＃３の格納データ（Ｄ３）をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃１のストライプ＃３のＨＤＤ＃４に格納された結合パリティブロック^ＣＰ_３をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_３と結合パリティブロック^ＣＰ_３とから本来ＨＤＤ＃４に格納されていたパリティブロックＰ_３’を再生成し、ＨＤＤ＃４上にデステージする。
このようにして、ストライプ＃３についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ５で構成されたＲＡＩＤグループ＃１が復旧されたこととなる。
以下、ストライプ＃４以降についても同様にして障害復旧処理を行うことができる。

図１１は、図１に示す本実施形態の磁気ディスク装置において、ＨＤＤ障害が発生したＲＡＩＤ１のＲＡＩＤグループ＃３（６５）を他のＲＡＩＤ６のＲＡＩＤグループ＃２（６４）と結合したものを再び分離する障害復旧処理の動作を説明する図である。
まず、磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３の各ＨＤＤの先頭ストライプ＃０に格納されたデータブロックＤ_０をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２の先頭ストライプ＃０のＨＤＤ＃１０，＃１１に格納された結合パリティブロック^ＣＰ_０，^ＣＱ_０をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_０と結合パリティブロック^ＣＰ_０とから本来ＨＤＤ＃１０に格納されていたパリティブロックＰ_０’を再生成し、ステージされているデータブロックＤ_０と結合パリティブロック^ＣＱ_０とから本来ＨＤＤ＃１１に格納されていたパリティブロックＱ_０’を再生成し、それぞれをＨＤＤ＃１０，＃１１上にデステージする。
このようにして、先頭ストライプ＃０については、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。

次に、ストライプ＃１について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３の各ＨＤＤのストライプ＃１の格納データ（Ｄ_１）をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２のストライプ＃１のＨＤＤ＃９，＃１０に格納された結合パリティブロック^ＣＰ_１，^ＣＱ_１をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_１と結合パリティブロック^ＣＰ_１とから本来ＨＤＤ＃９に格納されていたパリティブロックＰ_１’を再生成し、ステージされているデータブロックＤ_１と結合パリティブロック^ＣＱ_１とから本来ＨＤＤ＃１０に格納されていたパリティブロックＱ_１’を再生成し、それぞれをＨＤＤ＃９，＃１０上にデステージする。
このようにして、ストライプ＃１についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。

次に、ストライプ＃２について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３の各ＨＤＤのストライプ＃２の格納データ（Ｄ_２）をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２のストライプ＃２のＨＤＤ＃８，＃９に格納された結合パリティブロック^ＣＰ_２，^ＣＱ_２をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_２と結合パリティブロック^ＣＰ_２とから本来ＨＤＤ＃８に格納されていたパリティブロックＰ_２’を再生成し、ステージされているデータブロックＤ_２と結合パリティブロック^ＣＱ_２とから本来ＨＤＤ＃９に格納されていたパリティブロックＱ_２’を再生成し、それぞれをＨＤＤ＃８，＃９上にデステージする。
このようにして、ストライプ＃２についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。

次に、ストライプ＃３について障害復旧処理を行う。
磁気ディスク装置２１の回復／復旧コピー機能部４４は、図３に示した原理に従い、ＲＡＩＤグループ＃３の各ＨＤＤのストライプ＃３の格納データ（Ｄ_３）をキャッシュメモリ２３上の作業領域にステージし、回復したＨＤＤ＃１３上にデステージする。
続いて、磁気ディスク装置２１の回復／復旧コピー機能部４４は、ＲＡＩＤグループ＃２のストライプ＃３のＨＤＤ＃１１，＃８に格納された結合パリティブロック^ＣＰ_３，^ＣＱ_３をキャッシュメモリ２３上の作業領域にステージし、ステージされているデータブロックＤ_３と結合パリティブロック^ＣＰ_３とから本来ＨＤＤ＃１１に格納されていたパリティブロックＰ_３’を再生成し、ステージされているデータブロックＤ_３と結合パリティブロック^ＣＱ_３とから本来ＨＤＤ＃８に格納されていたパリティブロックＱ_３’を再生成し、それぞれをＨＤＤ＃１１，＃８上にデステージする。
このようにして、ストライプ＃３についても、結合していたＲＩＡＤグループが分離され、障害発生前のＲＡＩＤ１で構成されたＲＡＩＤグループ＃３及びＲＡＩＤ６で構成されたＲＡＩＤグループ＃２が復旧されたこととなる。
以下、ストライプ＃４以降についても同様にして障害復旧処理を行うことができる。

＜閉塞中又は復旧中のＨＤＤへのアクセス＞
次に、本実施形態の磁気ディスク装置におけるＨＤＤ障害発生時の閉塞中又は復旧中のＨＤＤへのアクセスの処理方法について、図４及び図８に示した２つのＲＡＩＤ５グループを結合して運用する場合を例に挙げて、詳細に説明する。
このアクセス処理は、図１に示す磁気ディスク装置２１の対ホスト制御部３１と対ドライブ制御部４１とが実行する。

＜運用切り替え処理中の閉塞ＨＤＤへのアクセス＞
図１２は、本実施形態の磁気ディスク装置において、ＨＤＤ障害発生による運用切り替え処理中の状態におけるホストから閉塞ＨＤＤへのアクセスの処理方法を説明する図である。
以下、アクセス対象データが、運用切り替え済み範囲、運用切り替え中範囲、運用切り替え未着手範囲のそれぞれにある場合について、説明する。

（１）アクセス対象データが運用切り替え済み範囲にある場合
図１２において、運用切り替え済み範囲であるストライプ＃０のデータブロックＤ_２へのアクセス要求があると、対ドライブ制御部４１は、ＨＤＤ＃３に格納されているデータブロックＤ_２をキャッシュメモリ２３にステージさせる。この間、対ホスト制御部３１は、データブロックＤ_２へのアクセスを所定回数再試行する（アクセス回数は有限回数ループカウンタ３４にて管理）。データブロックＤ_２がキャッシュメモリ２３にステージされると、対ホスト制御部３１のリード処理部３２は、データブロックＤ_２をホスト１１に転送する。
また、運用切り替え完了直後であるストライプ＃２のデータブロックＤ_６へのアクセス要求があった場合、キャッシュメモリ２３には運用切り替え処理において生成されたデータブロックＤ_６が残存しているので、対ホスト制御部３１のリード処理部３２は、キャッシュメモリ２３にアクセスしてデータブロックＤ_６をホスト１１に転送することができる。

（２）アクセス対象データが運用切り替え中範囲にある場合
図１２において、運用切り替え中範囲であるストライプ＃３のデータブロックＤ_１０にアクセスする場合、データブロックＤ_１０はこれからキャッシュメモリ上に回復されるため、対ホスト制御部３１は、キャッシュメモリ上でデータブロックＤ_１０にヒットするまで、複数回アクセスを再試行する。

（３）アクセス対象データが運用切り替え未着手範囲にある場合
図１２において、コピー未着手範囲であるストライプ＃ｍのデータブロックＤ_ｎ−１にアクセスする場合、対ドライブ制御部４１は、ストライプ＃ｍのＨＤＤ＃０、ＨＤＤ＃１、ＨＤＤ＃３からパリティブロックＰ_ｍ、データブロックＤ_ｎ−２、データブロックＤ_ｎをキャッシュメモリ２３上にステージさせ、これらからキャッシュメモリ上にデータブロックＤ_ｎ−１を回復させる。この間、対ホスト制御部３１は、データブロックＤ_ｎへのアクセスを所定回数再試行する（アクセス回数は有限回数ループカウンタ３４にて管理）。データブロックＤ_ｎがキャッシュメモリ２３に回復されると、対ホスト制御部３１のリード処理部３２は、データブロックＤ_ｎをホスト１１に転送する。

本実施形態の磁気ディスク装置においては、以上のようにして、運用切り替え処理中の閉塞ＨＤＤについても、ホストコンピュータ１１からのアクセスに対して処理性能を低下させることなく要求処理をすることができる。
尚、上記ではリード処理について説明しているが、ライト処理の場合も同様にして処理することができる。ライト処理では、運用切り替え済み範囲、運用切り替え中範囲のデータ書き込みの際には、パリティ生成を行わず、運用切り替え未着手範囲のデータ書き込みの際には、同ストライプ上のデータブロック及びパリティブロックからライト処理後のデータブロックが回復されるように当該パリティブロックを書き換えるようにすることで、運用切り替え処理の進捗状況に関わらず、ライト処理を行うことができる。

＜障害復旧処理中の閉塞ＨＤＤへのアクセス＞
図１３は、本実施形態の磁気ディスク装置において、ＨＤＤ回復に伴う障害復旧処理中の状態におけるホストから閉塞ＨＤＤへのアクセスの処理方法を説明する図である。
以下、アクセス対象データが、障害復旧済み範囲、障害復旧中範囲、障害復旧未着手範囲のそれぞれにある場合について、説明する。

（１）アクセス対象データが障害復旧済み範囲にある場合
図１３において、障害復旧済み範囲であるストライプ＃０のデータブロックＤ_２は、キャッシュメモリから復旧したＨＤＤ＃２への格納が完了しているため、キャッシュメモリ２３上にはデータブロックＤ_２は存在しない。この場合、対ドライブ制御部４１は、復旧したＨＤＤ＃２からデータブロックＤ_２をキャッシュメモリ２３上に再ステージさせる。この間、対ホスト制御部３１は、データブロックＤ_２へのアクセスを所定回数再試行する（アクセス回数は有限回数ループカウンタ３４にて管理）。データブロックＤ_２がキャッシュメモリ２３にステージされると、対ホスト制御部３１のリード処理部３２は、データブロックＤ_２をホスト１１に転送する。
また、運用切り替え完了直後であるストライプ＃２のデータブロックＤ_６へのアクセス要求があった場合、キャッシュメモリ２３には障害復旧処理において生成されたデータブロックＤ_６が残存しているので、対ホスト制御部３１のリード処理部３２は、キャッシュメモリ２３にアクセスしてデータブロックＤ_６をホスト１１に転送することができる。

（２）アクセス対象データが障害復旧中範囲にある場合
図１３において、障害復旧中範囲であるストライプ＃３のデータブロックＤ_１０にアクセスする場合、データブロックＤ_１０は、パリティブロックＰ_３の復旧コピー処理のためにこれからキャッシュメモリ２３上に回復されるため、対ホスト制御部３１は、キャッシュメモリ２３上でデータブロックＤ_１０にヒットするまで、複数回アクセスを再試行する。

（３）アクセス対象データが障害復旧未着手範囲にある場合
図１３において、障害復旧未着手範囲であるストライプ＃ｍのデータブロックＤ_ｎ−１にアクセスする場合、対ドライブ制御部４１は、ＨＤＤ＃０に格納されているデータブロック^ｒＤ_ｎ−１をキャッシュメモリ２３にステージさせる。この間、対ホスト制御部３１は、データブロックＤ_ｎ−１へのアクセスを所定回数再試行する（アクセス回数は有限回数ループカウンタ３４にて管理）。データブロック^ｒＤ_ｎ−１がキャッシュメモリ２３にステージされると、対ホスト制御部３１のリード処理部３２は、データブロック^ｒＤ_ｎ−１をホスト１１に転送する。

本実施形態の磁気ディスク装置においては、以上のようにして、障害復旧処理中の閉塞ＨＤＤについても、ホストコンピュータ１１からのアクセスに対して処理性能を低下させることなく要求を処理することができる。
尚、上記ではリード処理について説明しているが、ライト処理の場合も同様にして処理することができる。ライト処理では、障害復旧済み範囲、障害復旧中範囲のデータ書き込みの際には、データ書き込みとともにパリティ生成を行い、障害復旧未着手範囲のデータ書き込みの際には、データ書き込みのみを行いパリティ生成を行わないようにすることで、障害復旧処理の進捗状況に関わらず、ライト処理を行うことができる。

＜処理動作の詳細フロー＞
以下に、上記で説明した本実施形態の磁気ディスク装置による処理動作の詳細について説明する。
図１４は、本実施形態の磁気ディスク装置の全体動作を示すフロー図である。
図１４において、ホストからＨＤＤへのアクセスがあったとき、まず、アクセス対象ブロックがコピー系処理中であるかどうかを判定する。

アクセス対象ブロックがコピー系処理中であり、閉塞ＨＤＤへのアクセスである場合には、スペアＨＤＤがあれば、当該閉塞ＨＤＤのデータをスペアＨＤＤにコピーするよう指示する。スペアＨＤＤへのコピーが完了すれば正常ＨＤＤとしてアクセスすることが可能となる。スペアＨＤＤが無く当該ＲＡＩＤグループがデータ回復コピー中であれば、回復・結合コピー処理を実行するよう指示する。この回復・結合コピー処理の詳細を図１５に示す。
アクセス対象ブロックがコピー系処理中であり、閉塞から復旧中のＨＤＤへのアクセスである場合には、スペアＨＤＤがあれば、当該スペアＨＤＤのデータを閉塞から復旧中のＨＤＤにコピーするよう指示する。スペアＨＤＤが無く当該ＲＡＩＤグループがパリティ復旧コピーを完了していなければ、パリティ再生成・分離コピー処理を実行するよう指示する。このパリティ再生成・分離コピー処理の詳細を図１６に示す。
アクセス対象ブロックがコピー系処理中であるが、閉塞中又は復旧中ではない正常なＨＤＤへのアクセスである場合には、アクセス要求は受け付けられず、アクセス再試行が行われることとなる。

また、図１４において、アクセス対象ブロックがコピー系処理中でなく、正常ＨＤＤへのアクセスである場合には、通常のホストアクセス処理が行われる。この通常のホストアクセス処理の詳細を図１７に示す。
アクセス対象ブロックがコピー系処理中でなく、閉塞ＨＤＤへのアクセスである場合には、当該ＲＡＩＤグループがデータ回復中又は回復済みであれば、データ回復処理時のホストアクセス処理を行う。このデータ回復処理時のホストアクセス処理の詳細を図１８に示す。
アクセス対象ブロックがコピー系処理中でなく、閉塞ＨＤＤへのアクセスである場合であって、当該ＲＡＩＤグループがデータ回復未着手でパリティ復旧中であれば、パリティ復旧時のホストアクセス処理を行う。このパリティ復旧時のホストアクセス処理の詳細を図１９に示す。
当該ＲＡＩＤグループがデータ回復未着手でパリティ復旧中で無い場合には、通常のホストアクセス処理を行う。

尚、本実施形態の磁気ディスク装置において、ＨＤＤ障害発生によるＲＡＩＤグループの結合の際に、複数の結合先候補グループがある場合には、結合先のＲＡＩＤレベル、構成ＨＤＤ台数の差、ＨＤＤ容量の差、ブロック長の差などに基づき最適な結合先グループを決定する。例えば、図２０に示すような結合先グループ選定のための優先度テーブルを設定しておき、これに基づき結合先グループを選定することとしてもよい。

以上、本発明の磁気ディスク装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、上記各実施形態における磁気ディスクの構成、ＲＡＩＤ構成、ホストからのリードライト制御、対ドライブ制御などについて、本発明の要旨を逸脱しない範囲内において適当な変更・改良を加えることが可能である。

１１ホストコンピュータ
２１磁気ディスク装置
２２ホストインタフェース
２３キャッシュメモリ
２４ドライブインタフェース
３１対ホスト制御部
３２リード処理部
３３ライト処理部
３４有限回数ループカウンタ
４１対ドライブ制御部
４２ＨＤＤ状態管理部
４３ＲＡＩＤ状態管理部
４４回復／復旧コピー機能部
４４Ａデータ回復制御部
４４Ｂパリティ再生成部
５１コピー進捗管理部
５２Ａコピー中ポインタ
５２Ｂコピー済ポインタ
５３タイマ監視部
６１ドライブモジュール
６２ＲＡＩＤグループ＃０
６３ＲＡＩＤグループ＃１
６４ＲＡＩＤグループ＃２
６５ＲＡＩＤグループ＃３

Claims

複数の磁気ディスクにより冗長性を有するＲＡＩＤグループを構成する磁気ディスク装置であって、
ホストコンピュータから前記磁気ディスクへのリードライト要求を処理する対ホスト制御部と、
前記磁気ディスクの状態を管理するＨＤＤ状態管理部と、
前記ＲＡＩＤグループの状態を管理するＲＡＩＤ状態管理部と、
前記磁気ディスク上の消失したデータを回復するデータ回復制御部と、
前記データ回復制御部による消失データの回復処理の進捗を管理する進捗管理部とを備え、
前記ＨＤＤ状態管理部が磁気ディスクの障害を検知すると、
前記ＲＡＩＤ状態管理部は、障害発生した磁気ディスクが属するＲＡＩＤグループと他のＲＡＩＤグループとを結合して新たなＲＡＩＤグループを構成し、
前記データ回復制御部は、障害発生した磁気ディスク上の消失したデータを、当該磁気ディスクと同ＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータを用いて回復するとともに、前記新たなＲＡＩＤグループ内でパリティデータを生成して格納することを特徴とする磁気ディスク装置。
前記データ回復制御部は、前記磁気ディスク上の先頭論理アドレスからアドレス順に、消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理を実行し、
前記進捗管理部は、当該処理が完了した最後の論理アドレスを示すポインタを用いて進捗管理を行うことを特徴とする請求項１に記載の磁気ディスク装置。
前記データ回復制御部による消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのリード要求が発生した場合、
前記対ホスト制御部は、
前記リード要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記回復されたデータを読み込み、
前記リード要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、障害発生した磁気ディスクが属するＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータを用いて回復されるデータを読み込むことを特徴とする請求項２に記載の磁気ディスク装置。
前記データ回復制御部による消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのライト要求が発生した場合、
前記対ホスト制御部は、
前記ライト要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記回復されたデータと前記新たなＲＡＩＤグループのパリティデータとを上書きし、
前記ライト要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、障害発生した磁気ディスクが属するＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータからライト処理後のデータが回復されるように当該パリティデータを書き換えることを特徴とする請求項２又は３に記載の磁気ディスク装置。
前記ＲＡＩＤ状態管理部は、障害発生した磁気ディスクが属するＲＡＩＤグループにおいて冗長性が維持されている場合、又は他のＲＡＩＤグループと結合しても冗長性を有する新たなＲＡＩＤグループを構成できない場合には、他のＲＡＩＤグループとの結合を行わないことを特徴とする請求項１から４のいずれかに記載の磁気ディスク装置。
複数の磁気ディスクにより冗長性を有するＲＡＩＤグループを構成する磁気ディスク装置であって、
ホストコンピュータから前記磁気ディスクへのリードライト要求を処理する対ホスト制御部と、
前記磁気ディスクの状態を管理するＨＤＤ状態管理部と、
前記ＲＡＩＤグループの状態を管理するＲＡＩＤ状態管理部と、
前記磁気ディスク上の消失したデータを回復するデータ回復制御部と、
ＲＡＩＤグループ分離のためにデータ及びパリティデータを再生成する分離再生成部と、
前記データ回復制御部による消失データの回復処理、及び前記分離再生成部によるＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理の進捗を管理する進捗管理部とを備え、
前記ＨＤＤ状態管理部が磁気ディスクの障害を検知すると、
前記ＲＡＩＤ状態管理部は、障害発生した磁気ディスクが属するＲＡＩＤグループと他のＲＡＩＤグループとを結合して新たなＲＡＩＤグループを構成し、
前記データ回復制御部は、障害発生した磁気ディスク上の消失したデータを、当該磁気ディスクと同ＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータを用いて回復するとともに、前記新たなＲＡＩＤグループ内でパリティデータを生成して格納し、
前記ＨＤＤ状態管理部が磁気ディスクの復旧を検知すると、
前記分離再生成部は、前記回復したデータを復旧した磁気ディスクにコピーするとともに、前記新たなＲＡＩＤグループ内のデータ及びパリティデータを用いて、前記障害発生した磁気ディスクが属するＲＡＩＤグループのパリティデータ及び前記他のＲＡＩＤグループのパリティデータを再生成しそれぞれ元の格納位置に再格納し、
前記ＲＡＩＤ状態管理部は、前記障害発生した磁気ディスクが属するＲＡＩＤグループと他のＲＡＩＤグループとをそれぞれ独立したＲＡＩＤグループとして再構成することを特徴とする磁気ディスク装置。
前記データ回復制御部は、前記磁気ディスク上の先頭論理アドレスからアドレス順に、消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理を実行し、
前記分離再生成部は、前記磁気ディスク上の先頭論理アドレスからアドレス順に、ＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理を実行し、
前記進捗管理部は、当該処理が完了した最後の論理アドレスを示すポインタを用いて進捗管理を行うことを特徴とする請求項６に記載の磁気ディスク装置。
前記データ回復制御部による消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのリード要求が発生した場合、
前記対ホスト制御部は、
前記リード要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記回復されたデータを読み込み、
前記リード要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、障害発生した磁気ディスクが属するＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータを用いて回復されるデータを読み込むことを特徴とする請求項７に記載の磁気ディスク装置。
前記データ回復制御部による消失データの回復処理及び新たなＲＡＩＤグループのパリティデータ生成格納処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのライト要求が発生した場合、
前記対ホスト制御部は、
前記ライト要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記回復されたデータと前記新たなＲＡＩＤグループのパリティデータとを上書きし、
前記ライト要求のアクセス箇所が当該処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、障害発生した磁気ディスクが属するＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータからライト処理後のデータが回復されるように当該パリティデータを書き換えることを特徴とする請求項７又は８に記載の磁気ディスク装置。
前記分離再生成部によるＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理中に、ホストコンピュータから前記障害発生した磁気ディスクへのリード要求が発生した場合、
前記対ホスト制御部は、
前記リード要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記復旧した磁気ディスク上に回復されたデータを読み込み、
前記リード要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、前記新たなＲＡＩＤグループ内のデータ及びパリティデータを用いて回復されるデータを読み込むことを特徴とする請求項７から９のいずれかに記載の磁気ディスク装置。
前記分離再生成部によるＲＡＩＤグループ分離のためのデータ及びパリティデータの再生成処理中に、ホストコンピュータから前記障害発生し磁気ディスクへのライト要求が発生した場合、
前記対ホスト制御部は、
前記ライト要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも前のアドレスである場合には、前記復旧した磁気ディスク上にデータの書き込みを行うとともに前記障害発生した磁気ディスクが属するＲＡＩＤグループのパリティデータの更新を行い、
前記ライト要求のアクセス箇所が前記再生成処理が完了した最後の論理アドレスよりも後ろのアドレスである場合には、前記新たなＲＡＩＤグループ内の磁気ディスク上のデータ及びパリティデータからライト処理後のデータが回復されるように当該パリティデータを書き換えることを特徴とする請求項７から１１のいずれかに記載の磁気ディスク装置。