JPH08221876A

JPH08221876A - 記憶スペースを提供する方法

Info

Publication number: JPH08221876A
Application number: JP7330583A
Authority: JP
Inventors: Marvin D Nelson; マーヴィン・ディー・ネルソン; Theresa A Burkes; テレサ・エー・バークス; Bryan M Diamond; ブライアン・エム・ダイアモンド; Michael B Jacobson; マイケル・ビー・ジャコブソン; Wade A Dolphin; ウェイドゥ・エー・ドルフィン; Douglas L Voigt; ダグラス・エル・ヴォイト
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1995-02-10
Filing date: 1995-12-19
Publication date: 1996-08-30
Anticipated expiration: 2015-12-19
Also published as: EP0726521A3; DE69532030D1; EP0726521B1; JP3753259B2; US5666512A; DE69532030T2; EP0726521A2

Abstract

(57)【要約】【課題】ディスク・アレイのすべての記憶ディスクを
十分利用しながらホット・スペア資源を提供する。【解決手段】ディスク・アレイ（11）の全記憶ディス
ク（12）に分布してユーザ・データおよび冗長性データ
を格納しておき、記憶ディスク故障の場合、次の2つの
ステップの一つを行う。(a)故障した記憶ディスクから
ユーザ・データを再建し、冗長性を復元するための記憶
スペースとして、ミラーまたはパリティRAID領域として
割り当てられていない不使用の記憶スペースを使う。
(b)ミラーRAID領域からパリティRAID領域にユーザ・デ
ータを移行させ、記憶ディスク故障で失われたスペース
を補うための記憶スペースを空けるためにミラー領域を
詰め込む。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、ディスク・アレ
イに関し、より具体的には、記憶ディスクが故障する場
合、ユーザ・データと冗長情報の再構築のために十分な
スペースを提供するためのホット・スペア資源を持つ冗
長で階層的なディスク・アレイ・データ記憶システムに
関する。この発明は、再構築を容易にするために必要と
されるまでユーザ・データを格納するためにホット・ス
ペア資源を使うための方法に関する。

【０００２】

【従来の技術】ディスク・アレイ・データ記憶システム
は、一つの大容量記憶システムを形づくるよう配置され
協調するようにされた複数の記憶ディスク・ドライブ装
置を持っている。そのような記憶装置のための3つの主
要な設計基準がある。これらは、費用、パフォーマンス
および可用性である。メガバイトのコストが低く、入出
力パフォーマンスが高く、データ可用性が高いメモリ装
置を生産するすることが望まれる。「可用性」は、その
記憶装置に格納したデータをアクセスする能力およびな
んらかの故障の場合に継続操作を保証する能力である。
典型的には、データ可用性は、データ、またはデータ間
の関係が複数のロケーションに格納されいる状況で、冗
長性の使用を通して提供される。そのディスク・アレイ
における記憶ディスクが部分的に、あるいは、完全に故
障する場合、そのユーザ・データは残りのディスクに格
納された冗長データを通して再構成することができる。

【０００３】冗長データを格納するには2つの一般的な
方法がある。第１の方法、すなわち「ミラー」法によ
ると、データは、複製され、その記憶装置の2つの別々
の領域に格納される。例えば、ディスク・アレイにお
いて、同じデータがディスク・アレイの2つの別々のデ
ィスクに提供される。ミラー法は、二重記憶技術によっ
て高いパフォーマンスおよび高いデータ可用性の利点
を持っている。しかし、ミラー法は、データを格納する
費用を実質的に２倍にするので比較的高価である。

【０００４】第２の方法、すなわち「パリティ」法で
は、記憶領域の一部分が、冗長データを格納するために
使われるが、冗長な記憶領域のサイズは、オリジナルの
データを格納するのに使われた残りの記憶スペースより
小さい。例えば、5つのディスクを持つディスク・アレ
イにおいて、4つのディスクが、データを格納するのに
使われ、5番目のディスクが冗長データを格納するのに
使われる。パリティ法は、ミラー法より低コストだとい
う利点があるが、ミラー法に比べるとパフォーマンスお
よび可用性特性において劣る。

【０００５】

【発明が解決しようとする課題】データ冗長性は別とし
て、ディスク・アレイ・データ記憶システムのあるもの
は、故障した記憶ディスクの代用になる付加的な物理的
記憶ディスクを保留することによってデータ可用性を改
良する。この余分の記憶装置ディスクは、「スペア」と
呼ばれる。予備のディスクは、ディスク故障の後、「再
構築建」として知られるプロセスで、ディスク・アレイ
においてユーザ・データを再構成し、冗長性を復元する
ために使われる。ある場合には、この余分な記憶ディス
クはディスク・アレイに実際に取り付けられ完全に使用
可能であるが、記憶ディスクが故障するまではアイドル
状態のままである。これらの運転中の（ライヴ：live）
記憶ディスクは、「ホット・スペア」と呼ばれる。

【０００６】ホット・スペア・ディスクは、ディスク故
障の際に有用であるが、すべてのディスクが正常に機能
している正常状態ではディスク・アレイになんらのサー
ビスも提供しない。ホット・スペア目的のために物理的
な記憶ディスク全体を保留して印を付けることは、付加
資源をデータ記憶作用のために十分利用する利益なしで
システムのコストを増やす。

【０００７】したがって、この発明は、ディスク・アレ
イのすべての記憶ディスクを十分利用しながらホット・
スペア資源を提供することを課題とする。

【０００８】

【課題を解決するための手段】この発明は、アレイに付
けられたすべての記憶ディスクを十分に利用しながら、
ホット・スペア資源の余裕を持つディスク・アレイ・デ
ータ記憶システムを提供する。ホット・スペアのために
物理的ディスク全体を予約して印を付ける代わりに、こ
の発明のシステムおよび方法は、アレイの複数の記憶デ
ィスクにわたって分布した有効記憶スペースから成るホ
ット・スペア・ディスクの論理的容量を保留する。この
ように、ディスク故障の場合、ユーザ・データを再構成
し冗長性を復元するのに、適切な量のスペースを使うこ
とができることを確保しながら、すべての記憶装置ディ
スクが、ユーザ・データを格納するために使われる。

【０００９】この発明の一つの面によると、ディスク・
アレイ・データ記憶システムは、複数の記憶ディスク、
および記憶ディスクの間でユーザ・データの移転をコー
ディネートするためのディスク・アレイ・コントローラ
を持つ。RAID管理システムは、RAIDレベルの仮想記憶ス
ペースを記憶ディスクの物理的な記憶スペースにマップ
するために設けられている。RAIDレベルの仮想記憶スペ
ースは、データをミラー冗長性に従って格納するミラー
RAID領域、およびパリティ冗長性に従ってデータを格納
するパリティRAID領域を含む複数のRAID領域として物理
的な記憶スペースに提示される。RAID管理システムは、
またRAIDレベルの仮想記憶スペースを、ユーザに提示さ
れるアプリケーション・レベルの仮想記憶スペースにマ
ップする。

【００１０】ホット・スペア・オプションがイネーブル
されるとき、RAID管理システムは、記憶ディスク故障に
続いて冗長性を再構築するために、ホット・スペア・ス
ペースが使用可能になることを保証しながら、ミラー記
憶装置にユーザ・データを格納するためにホット・スペ
アのスペースを使う。スペースは、ミラー記憶装置から
パリティ記憶装置へデータを移行することによって使用
可能になる。この移行は、ミラー記憶装置の量を減少さ
せながら同時にパリティ記憶装置の量を増やす。この移
行プロセスと同時に、データ記憶のためのストライプ・
サイズが、故障した記憶ディスクから失われたスペース
のために減らされる。

【００１１】このシステムによると、アレイにおけるす
べての記憶ディスクがユーザ・データを格納するため、
およびディスク故障の場合にホット・スペアの目的のた
めで容易に使用可能にできる記憶スペースを維持するた
めに使われる。ホット・スペア記憶スペースのこの使用
は、並列性を増やすことによって、そしてミラー記憶装
置のためにより多くの容量を提供することによってかな
りパフォーマンスを改善する。

【００１２】

【発明の実施の形態】図1は、この発明に従ってつくら
れたデータ記憶システム10を示す。データ記憶システム
10は、複数の記憶ディスク12を持つ階層的なディスク・
アレイ11、記憶ディスク12との間でのデータの転送をコ
ーディネートするためディスク・アレイ11に結合された
ディスク・アレイ・コントローラ14、およびRAID管理シ
ステムを含む、ディスク・アレイ・データ記憶システム
であるのが好ましい。この発明は、冗長な階層的なディ
スク・アレイ・システムとしての好ましい実施形態のに
ついて記述される。しかし、この発明の概念は、非階層
的なディスク・アレイのようなディスク・アレイ・デー
タ記憶システムの他の型において使用することができる
ことに注意されたい。

【００１３】説明上、「ディスク」は、それ自身の記憶
装置故障を発見する能力を持つ、不揮発性でランダムに
アクセス可能な、再書き込み可能な大容量記憶装置であ
る。それは、回転する磁気ディスクおよび光ディスク、
ならびにソリッドステートのディスクまたは不揮発性電
子記憶素子（PROM、EPROMとEEPROMのような）を含む。
「ディスク・アレイ」という用語は、ディスクの集合を
いい、それらを一つまたは複数のホスト・コンピュータ
に接続するために必要なハードウェア、および物理的な
ディスクの操作を制御するために使われ、ホスト操作環
境へそれらを一つまたは複数の仮想ディスクとして提供
する管理ソフトウェアを含んでいる。仮想ディスクは、
管理ソフトウェアによってディスク・アレイの中で実現
される抽象的な構成要素である。

【００１４】用語「RAID」(Redundant Array of Indepe
ndent Disks)は、記憶容量の残りの部分に格納されたユ
ーザ・データに関する冗長情報を格納するために、物理
的な記憶容量の一部分が使われるディスク・アレイを意
味する。そのアレイの構成ディスクの一つが故障するか
それへのアクセス経路が故障した場合、冗長情報がユー
ザ・データの再生を可能にする。RAIDシステムのより詳
細な説明は、The RAIDBook: A Source Book for RAID T
echnology, the RAID Advisory Board, LinoLakes, Min
nesota、1993 年6月9日、に記載されている。

【００１５】ディスク・アレイ・コントローラ14は、小
型コンピュータ・システム・インターフェース（SCSI）
のような１つまたは複数のインターフェース・バス13を
通してディスク・アレイ11に結合されている。RAID管理
システム16は、インターフェース・プロトコル15を通し
て動作的にディスク・アレイ・コントローラ14に結合さ
れている。また、データ・メモリ・システム10は、I/O
インターフェース・バス17を通してホスト・コンピュー
タ（図示しない）に結合される。RAID管理システム16
は、ディスク記憶および信頼性のレベルを制御するた
め、およびいろいろな信頼性記憶レベルの間でデータを
転送するためにデータ・マネージャー手段を提供するよ
う、別々のコンポーネントとして具体化されることも、
ディスク・アレイ・コントローラ14内で、あるいはホス
ト・コンピュータ内で構成されることもできる。これら
の信頼性記憶レベルは、後述するようにミラーまたはパ
リティ冗長レベルであるのが好ましいが、全く冗長性な
しの信頼性記憶レベルを含むことができる。

【００１６】ディスク・アレイ・コントローラ14は、デ
ィスク・アレイ・コントローラA、14aとディスク・アレ
イ・コントローラB、14bから成る二重のコントローラと
して実施するのが好ましい。二重のコントローラ14aと1
4bは、連続的なバックアップと冗長性を提供することに
よって、一つのコントローラが動作不能になるときの信
頼性を高める。しかし、この発明は、一つのコントロー
ラその他のアーキテクチャーでも実施することができ
る。

【００１７】階層的なディスク・アレイは、その物理的
な記憶スペースおよび１つまたは複数の仮想記憶スペー
スを含めて、異なる記憶スペースとして特徴づけること
ができる。記憶装置のこれらのいろいろな見方は、マッ
ピング技法を通して関係づけられる。例えば、そのディ
スク・アレイの物理的な記憶スペースは、いろいろなデ
ータの信頼度レベルに従って記憶領域を画定する仮想記
憶スペースにマップすることができる。仮想記憶スペー
ス内のいくつかの領域が、ミラーまたはRAIDレベル1の
ような第１の信頼性記憶レベルのために割り当てられ、
他の領域がパリティまたはRAIDレベル5のような第２の
信頼性記憶レベルのために割り当てられることができ
る。いろいろなマッピング技術およびRAIDレベルに関す
る仮想スペースについて、以下に詳細を説明する。

【００１８】データ記憶システム10は、異なる記憶スペ
ースを互いにマップするために使われるる仮想マッピン
グ情報を持続的に記憶するためのメモリ・マップ・スト
ア21を含む。メモリ・マップ・ストアは、ディスク・ア
レイに対して外部にあり、ディスク・アレイ・コントロ
ーラ14に常駐するのが好ましい。異なるビューの間でい
ろいろなマッピング構成が変わるにつれて、メモリ・マ
ッピング情報がコントローラまたはRAID管理システムに
よって連続的に、あるいは定期的に更新されることがで
きる。

【００１９】メモリーマップ・ストア21は、それぞれの
コントローラ14aと14bに位置する2つの不揮発性RAM (Ra
ndom Access Memory) 21aおよび21bとして具体化される
のが好ましい。不揮発性RAM（NVRAM）の一例は、バッテ
リで支援されたRAMである。バッテリ支援RAMは、データ
記憶システム10への電力供給が損なわれた場合、ある時
間の間メモリの中のデータを維持するために独立のバッ
テリ源からのエネルギーを使う。一つの好ましい構造
は、自己リフレッシュ型のバッテリ支援DRAM（Dynamic
RAM）である。

【００２０】二重のNVRAM 21aおよび21bが、メモリ・マ
ッピング情報の冗長な記憶を行う。仮想マッピング情報
が、ミラー冗長技術に従って複製され、両方のNVRAM 21
aおよび21bに格納される。このように、NVRAM 21aが、
オリジナルのマッピング情報を格納することに専用さ
れ、NVRAM 21bが冗長なマッピング情報を格納すること
に専用されることができる。代替構造において、ミラー
されたメモリーマップ・ストアは、そのデータを二重に
記憶するに十分なスペースを持つ単一の不揮発性RAMを
使って構成することができる。

【００２１】図1に示されるように、ディスク・アレイ1
1は、複数の記憶ディスク・ドライブ装置12を持ってい
る。これらの記憶ディスクのサイズの例は、1ないし3ギ
ガバイトである。記憶ディスクは、SCSIバス13とのイン
ターフェイスを提供する機械的ベイに、独立に接続され
たり切り離したりされることができる。一つの実施例に
おいて、データ記憶システムは、12の機械的ベイを持つ
よう設計される。4つのSCSIバスが、これらのベイとデ
ィスク・アレイ・コントローラ14とをインターフェイス
するのに使われる（すなわち、3つの機械的ベイにつき
一つのバス）。活動ベイがいっぱいにロードされるなら
ば、データ記憶システムは、12ないし36ギガバイトの結
合された容量を持つ例になる。ディスク・アレイ・コン
トローラ14は、どのベイに接続されたかとは関係なく記
憶ディスク12を認識する。データ記憶システム10は、デ
ィスク・アレイが運転中である間に、ディスク・アレイ
の利用可能な機械的ベイに付加的ディスクを「ホットプ
ラグ」（稼働中にプラグ接続する）することができるよ
う設計されている。

【００２２】ディスク・アレイ11の中の記憶装置ディス
ク12は、説明の目的のために、複数のディスク20のミラ
ー・グループ18および複数のディスク24のパリティ・グ
ループ22に配列されているものと観念することができ
る。ミラー・グループ18は、データを第１の、すなわち
ミラー冗長レベルに従って格納する、ディスク・アレイ
の第１の記憶ロケーションすなわちRAID領域を表わす。
また、このミラー冗長レベルは、RAIDレベル1と考えら
れる。RAIDレベル1、あるいはディスク・ミラーリング
は、データのあらゆるビットがデータ記憶システム内で
複製され記憶される点で１対１の保護を与え、最も高い
データ信頼性を提供する。ミラー冗長性は、図１におい
て３対のディスク20によって表わされている。オリジナ
ルのデータが、第１組のディスク26に格納されることが
でき、重複して冗長データが対になった第２組のディス
ク28に格納される。

【００２３】図2は、RAIDレベル1に従ったデータの記憶
を図示する。垂直な列は、個々のディスク（ディスク
0、1、2および3が図示される）を表現する。4つのディ
スクのディスク・アレイに含まれる物理的な記憶スペー
スは、水平な行によって表現されるように、複数のスト
ライプに構成することができる。「ストライプ」は、記
憶ディスクを横切って広がり、一つのセグメントがその
アレイの中のそれぞれのディスクと関連する、多数の等
しい大きさの記憶スペースのセグメントを含む。すなわ
ち、セグメントは、一つのディスク上にあるストライプ
の部分である。各ストライプは、記憶ディスクを横切っ
て分配されるあらかじめ決められた量のデータを持つ。
ストライプのセグメントのあるものは、オリジナルのデ
ータのために使われ、他のセグメントが冗長データのた
めに使われる。

【００２４】ミラー冗長性（RAIDレベル1）のこの例に
おいて、ディスク0上でストライプ0のセグメント0に格
納されたデータは、複製され、ディスク1上でストライ
プ0のセグメント0'に格納される。同様に、ディスク2上
でストライプ2のセグメント5に格納されたデータは、デ
ィスク3上でストライプ2のセグメント5'にミラー（複
製）される。このように、データの各部分は、複製され
てディスク上に格納される。図2の冗長性レイアウト
は、説明の目的で用意されている。冗長データは、図示
しているのと同じストライプにきちんと置かれる必要は
ない。例えば、ディスク0上でストライプ1の中のセグメ
ント2に格納されたデータは、複製されて、ディスク3上
でストライプSのセグメントT'に置かれてもよい。

【００２５】再び図1を参照すると、ディスク24のパリ
ティ・グループ22は、データがRAIDレベル5のような第
２の冗長レベルに従って格納される第２の記憶ロケーシ
ョンすなわちRAID領域を表わす。6つのディスクを用い
た説明的なイラストにおいて、オリジナルのデータは、
5つのディスク30に格納され、冗長な「パリティ」デー
タが6番目のディスク32に格納される。

【００２６】図3は、パリティRAID領域のレイアウトを
より詳しく示す。図２のミラーRAID領域レイアウトと同
様に、ディスク0、1、2、3の物理的な記憶スペースは、
複数の等しい大きさのストライプに構成されることがで
きる。図の例において、データがRAIDレベル5に従って
格納され、セグメントに格納された冗長データは、文字
Pによって参照される。冗長なPセグメントは、他のセグ
メントのパリティをそのストライプに格納する。たとえ
ば、ストライプ0において、ディスク3上の冗長なPセグ
メントは、ディスク0、1および2のパリティを格納す
る。各ストライプのためのパリティが、次の式の中の記
号によって表わされる排他的ＯＲ機能のようななんらか
の機能によって計算される。第１の4つのストライプの
ためのパリティ（下付き添字数字が対応するストライプ
を表わす）は、次のようである：

【００２７】

【数１】パリティ冗長性は、ディスクの一つで利用できなくなる
データの再生を可能にする。例えば、セグメント5のデ
ータが利用できなくなったならば、その内容は、セグメ
ント3および4ならびにセグメントPの中のパリティ・デ
ータから確かめることができる。パリティ記憶は、ミラ
ー記憶より経済的であるが、相対的に信頼性が低く、パ
フォーマンスが低い。

【００２８】図1のディスク構成は、概念上の目的で用
意されている。実際上、ディスク・アレイ11は、データ
をミラーおよびパリティ冗長性に従って格納することが
できる単に複数のディスク12を持っていてよい。すべて
のディスク12によって提供される利用可能な記憶スペー
スの中で、その記憶スペースの一部がミラー冗長性のた
めに割り当てられ、他の部分がパリティ冗長のために割
り当てられる。ディスク12は、個々の区域が複数のセグ
メントを持つ、複数の等しい大きさに作られた記憶区域
（図４において数字35で参照される）を含むよう構成さ
れるのが好ましい。その区域は、記憶スペースの一つの
仮想ビューにおいて、RAID領域を形成するようグループ
化される。さらに、記憶スペースのもう一つの（ホスト
で規定される）ビューがユーザまたはホストに提示され
るので、RAID領域およびデータ冗長性記憶技術はユーザ
またはホストに透明である。これらの機構は、図4を参
照してより詳しく説明する。

【００２９】データ記憶システム10は、ミラーおよびパ
リティ記憶法の間でデータの「移行」を管理する。両方
の型の冗長性の管理は、RAID管理システム16（図1）で
協調される。RAID管理システム16は、ディスク・アレイ
の2つの異なる型のRAID領域を、ミラーRAID領域がパリ
ティRAID領域のためのキャッシュに似た動作をするメモ
リ・ハイアラーキとして管理する。RAID管理システム16
は、規定されたパフォーマンス・プロトコルに従って、
ミラーおよびパリティRAID領域の間でデータをシフト
し、組織するなど管理する。ミラーおよびパリティRAID
領域の間でデータを動かすプロセスは、「移行」と呼ば
れる。

【００３０】データ記憶システム10は、ミラー冗長性が
最も高いパフォーマンスと信頼性の余裕を持っているか
ら、よりパフォーマンスに厳格なデータをミラーRAID領
域に置こうとする。RAID管理システムによって実行され
るパフォーマンス・プロトコルは、2つの好ましい移行
方針の一つを含む。「アクセス頻度」として知られる第
１の移行方針によると、階層的なディスク・アレイ上の
最も頻繁にアクセスされるデータがミラーRAID領域18に
維持される。アクセスされる頻度の小さいデータは、パ
リティRAID領域22に維持される。「アクセスの最近度」
として知られている第２の移行方針によると、最も最近
アクセスされたデータがミラーRAID領域18に維持され、
アクセス最近度の低いデータがパリティRAID領域22に格
納される。他のパフォーマンス・プロトコルを使うこと
もできる。理想的には、そのようなプロトコルは、特定
のコンピュータ・アプリケーションおよびユーザのニー
ズに基づいて規定される。

【００３１】さらに、RAID管理システム16は、2つのパ
ラメーターの関数に従って、データ記憶システムの記憶
資源を自動的に「調整する」。この２つのパラメータ
は、物理的な記憶容量のサイズ、およびデータ記憶シス
テムに格納つつあるユーザ・データの現在量のサイズで
ある。最初は、最も高いパフォーマンスおよび信頼性を
持つので、すべてのデータがミラーRAID領域に格納され
る。より多くのデータがデータ記憶システムに加えられ
るにつれて、データは、パフォーマンスおよび信頼性を
最適化するために、ミラーRAID領域およびパリティRAID
領域の間で移行される。データ記憶システムが容量いっ
ぱいに近づくと、冗長性を通しての信頼性を提供しなが
らユーザのすべての要求に応ずるために、より多くのデ
ータがパリティRAID領域に移行される。それゆえに、こ
の発明のデータ記憶システムは、最大の融通性と順応性
を持つ。この発明の記憶システムは、ユーザに特定の記
憶体制を選ぶことを要求せず、ユーザの要求に適応する
ことができる。

【００３２】図4は、データ記憶システム10の利用可能
な記憶スペースのメモリ・マッピングを、マップされた
仮想記憶スペースの複数の段として図示する。図の中の
垂直に伸びたそれぞれの長方形は、物理的な記憶スペー
スのビューを表現する。この図の中で、物理的記憶スペ
ース34が２つの仮想記憶装置のビュー40および50で参照
される。物理的記憶スペース34は、数字0、1、2、およ
び3で参照される4つのディスク（図1の中のディスク12
のような）によって表現される。そのディスクに関連し
た4つの長方形は、ディスク1、2および3がほぼ等しい記
憶容量を持ち、ディスク0がわずかに小さい記憶容量を
持つ物理的な記憶スペースのビュー50を表わす。そのよ
うなディスクの例としての記憶容量は、1-3ギガバイト
である。記憶スペース34は、領域A0、A1、A2、その他に
区分される。個々の領域は、領域A0にストライプ0-Qの
ような多数のストライプを含む。個々の領域も、多数の
区域35を含む。区域35は、区域が全ディスク・アレイに
わたって同じ大きさであるように、あらゆる記憶ディス
ク上で選ばれた数の均一な大きさのセグメントから成る
のが好ましい。区域35の例としてのサイズは、１メガバ
イトである。

【００３３】ディスクの記憶スペースは、物理的な記憶
スペース34の第１の、中間の、RAIDレベルの仮想ビュー
40にマップされる。この第１の仮想ビューは、観念的に
は、連続してアドレス可能な記憶スペースを表現する第
２のアプリケーション・ビューにマップされることがで
きる一組のRAID領域である。その物理的構成およびその
記憶スペースのRAIDビューは、アプリケーション・ビュ
ーから隠されている。RAID領域記憶スペース40は、ミラ
ーおよびパリティ記憶スペースを識別する記憶装置のビ
ューである。たとえば、RAID領域42が、M割当てブロッ
ク43のミラーRAID領域を表現し、RAID領域44がN割当て
ブロック45のパリティRAID領域を表現してもよい。割当
てブロック43および45は、同じ大きさであるのが好まし
い。例としての大きさは、64キロバイトである。これら
のRAID領域は、物理的な記憶スペース34上の対応する物
理的な領域A0、A1、A2などに関連する。例として、RAID
仮想ビューにおける16の64K割当てブロック43または45
は、一つの1M区域35の上へマップすることができる。

【００３４】ミラーおよびパリティRAID領域は、ディス
ク・アレイの全記憶スペース34を消費するかもしれず、
消費しないかもしれない。したがって、ある種のアプリ
ケーションの間、特定のRAID領域に対応しない、不使用
の指定されていない記憶スペースがあることがある。し
かし、そのような記憶スペースは、ミラーまたはパリテ
ィRAID領域に変換されることができる。また、RAID領域
は、ディスク・アレイ上で連続する領域にマップされ、
各RAID領域に関連したそれぞれの区域が各記憶ディスク
の同じ物理アドレスに位置するものとして示されている
点に注意されたい。代わりに、RAID領域は、ディスク・
アレイ上の連続しない領域にマップされてもよい。

【００３５】RAID領域で利用可能な記憶スペースは、ユ
ーザまたはホスト・アプリケーション・プログラムによ
って規定され、それらに提示される記憶装置のビューで
ある、第２の、フロントエンドの、アプリケーション・
レベルの仮想ビュー50にマップされる。ユーザまたはホ
スト・アプリケーション・プログラムから見るとき、ア
プリケーション・レベルの仮想ビュー50は、記憶ディス
ク12上の利用可能な記憶スペースを示す一つの大きい記
憶容量を表わすことができる。仮想記憶スペース50は、
個別に0、1、2、...、J-1、J、J+1、...、Lー1、L、L+
1、...、などとして参照される等しい大きさの記憶仮想
ブロック52および53の線形セットのビューを提示する。
仮想ブロック52および53は、RAID領域40における割当て
ブロックと同じサイズであることが好ましい。サイズの
例は、64キロバイトである。仮想ブロック記憶スペース
50は、RAID領域40で表されるビューの割当てブロックへ
の参照すなわちポインタ（矢印54によって表現されるよ
うに）のテーブルによって表わされる。したがって、ア
プリケーション仮想ビュー50における仮想ブロック52お
よび53は、仮想ブロック・テーブルに維持されるポイン
タを通してRAID仮想ビュー40における割当てブロック43
および45と関連する。仮想ブロック・テーブルから参照
することができる少くとも2つ型のRAID領域、ミラーお
よびパリティがある。

【００３６】RAID管理システム16は、物理的な記憶スペ
ースにわたって動的にRAID領域の構成を変えることがで
きる。それぞれの型についてRAID領域の数が、システム
で格納されるユーザ・データの量および物理的なディス
ク記憶スペースのサイズに依存して増やされまたは減少
されうる。この結果、RAIDレベルの仮想ビュー40におけ
るRAID領域のディスクへのマッピング、およびアプリケ
ーション・レベルの仮想ビュー50のRAIDビュー40へのマ
ッピングは、概して変化状態にある。NVRAM 21aおよび2
1b（図１）におけるメモリ・マップ・ストアは、RAID領
域をディスクへマップするためにRAID管理システム16に
よって使われる現在のマッピング情報を、2つの仮想ビ
ューの間でマップするために使われる情報と同様に維持
する。RAID管理システムは、動的にRAIDレベルのマッピ
ングを変えるにつれて、その変更を反映するために、メ
モリ・マップ・ストアのマッピング情報を更新する。

【００３７】メモリ・システム10の移行操作を図1およ
び4を参照して説明する。

【００３８】説明を続ける目的で、アプリケーション・
レベルの仮想記憶スペース50の仮想ブロック53は、物理
的記憶スペース34の領域A1に格納されたパリティRAID領
域44における関連した割当てブロック45を参照する。そ
のような仮想ブロック53は、パリティ仮想ブロックと呼
ぶことができ、関連した割当てブロック45は、パリティ
割当てブロックと呼ぶことができる。同様に、仮想ブロ
ック52は、物理的記憶スペース34の領域AOに格納された
ミラーRAID領域42における関連した割当てブロック43を
参照する。そのような仮想ブロック52は、「ミラー仮想
ブロック」と呼ばれ、関連した割当てブロック43が「ミ
ラー割当てブロック」と呼ばれる。

【００３９】一般に、一つのRAID領域から別の領域に移
行するために、第１のRAIDレベル型（ミラーまたはレベ
ル1のような）の割当てブロックに関連した仮想ブロッ
クが選ばれる。次いで、第２のRAIDレベル型（パリティ
またはレベル5のような）を表す不使用の割当てブロッ
クが見いだされる。不使用の割当てブロックを見いだす
ことができないならば、一つが作成される。データは、
選ばれた仮想ブロックと関連する割当てブロックから不
使用の割当てブロックに移され、データは冗長レベルを
変更される。例えば、ミラー冗長性に従って格納されて
いたデータは、パリティ冗長性に従って格納され、ま
た、その逆が行われる。最終的なステップとして、RAID
レベルの仮想記憶スペース40へのアプリケーション・レ
ベルの仮想記憶スペース50のマッピング54は、データの
シフトを反映するために修正され、更新される。以前に
第１のRAIDレベル型の割当てブロックと関連していた、
選ばれた仮想ブロックが、更新されたポインタを介し
て、移行されたデータを含む第２のRAIDレベル型の割当
てブロックを参照する。この処理の間に生じるマッピン
グ変化は、メモリ・マップ・ストア21において更新され
る。

【００４０】この発明の好ましい方法と順序に従って、
ミラーおよびパリティ記憶領域の間を移行するデータの
より詳細な説明を続ける。データをパリティ記憶からミ
ラー記憶に移行するために、次のシーケンスが使われ
る。

【００４１】1. RAID管理システムは、ミラーRAID領域
42における、不使用のミラー割当てブロック43を見つけ
る。 2. 何も見つけられることができなければ、RAID管理シ
ステムは、ミラー割当てブロック（下で説明する）を作
り出す。 3. RAID管理システムは、移行すべき仮想ブロックへの
新しい記憶要求を中断する。 4. RAID管理システムは、仮想ブロックへのすべての有
効なデータ記憶要求が完了されるまで待つ。 5. 仮想ブロック53に関連したパリティ割当てブロック
45からのデータが、一時記憶バッファに読み込まれる。 6. データは、次いで、ステップ2において選ばれたミ
ラー割当てブロックに書き込まれる。 7. 仮想ブロック・テーブルは、ミラー割当て43ブロッ
クにおけるそのデータの新しいロケーションを参照する
よう修正される。 8. 中断されていた記憶要求が、再開される。

【００４２】上記の手順によると、アプリケーション・
レベルの仮想ビュー50における仮想ブロック53は、パリ
ティ記憶からミラー記憶に移行した。中間の仮想ビュー
40に関し、データは、パリティRAID領域44におけるパリ
ティ割当てブロック45からミラーRAID領域42におけるミ
ラー割当てブロック43に移行されている。物理的な記憶
スペースにおいて、データは領域A1から領域A0に動いて
いる。

【００４３】不使用のミラー割当てブロックを見いだす
ことができないならば（上のステップ1）、RAID管理シ
ステムは、次の3つの技法の好ましいシーケンスをため
す。第１に、RAID管理システムは、不使用のRAIDレベル
の記憶のシステムしきい値を破ることなくミラーRAID領
域に変換されることができる、不使用の（したがって指
定されていない）RAID領域を見つけるよう試みる。これ
は、移行を常に進めることができることを保証するため
に必要とされる。これが失敗し、そして保留量の不使用
のRAIDレベル記憶より多くをシステムが持っているなら
ば、システムは、不使用のパリティ割当てブロックを不
使用のRAID領域に集めるためにパリティ記憶装置内でデ
ータを移行させる。この移行によって、上述のようにミ
ラーRAID領域に変換されることができる不使用のRAID領
域が生じれば、システムは、それをミラーRAID領域に変
換する。さもなければ、システムは、不使用のミラー割
当てブロックを見いだすに十分か、または不使用のRAID
領域をミラーRAID領域に変換するに十分に、不使用のRA
IDレベルの記憶装置をシステムが増やすまで、データを
ミラー記憶装置からパリティ記憶装置へ移行し、ミラー
記憶装置を詰め込み、不使用のRAIDレベルの記憶をパリ
ティに変換する。ミラー割当てブロックがパリティ割当
てブロックより大きな物理的な記憶スペースを占めるか
ら、この最後の技法によって、不使用のRAIDレベル記憶
装置の量が正味増加する。

【００４４】不使用のミラー割当てブロックを見つける
ためおよび確立するために使われる創設/変換プロトコ
ルは、RAID管理システムがユーザ・データの量および物
理的な記憶スペースのサイズに従ってパリティおよびミ
ラー領域の間で記憶割当てを選択的に調節することを可
能にするので、有利である。データ使用および記憶容量
が変化するにつれて、RAID管理システムは、ミラー記憶
装置に保持されるデータの量を最大にするために上記の
3つの技法の１つまたは複数を使う。

【００４５】RAID管理システムは、スペース作成シーケ
ンスがアイドル時間に不使用RAID領域をつくることによ
って不使用のミラー割当てブロックを創設するのを、記
憶装置要求が待たなければならない状況を避けようとす
る。しかし、いくらかの状況において、記憶装置要求は
スペース作成シーケンスの間、中断されることがある。
RAID管理システムは、仮想スペースがRAIDビューより小
さくなるような形態で、仮想ブロック記憶スペースを構
成する。これは、少くとも1つのRAID領域と等しい自由
スペースが移行その他の目的のためにとっておかれるこ
とを保証する。このように、この技法は、常に不使用の
ミラー割当てブロックを生む。

【００４６】データをミラー記憶装置からパリティ記憶
装置へ移行させるために、以下の順序が使われる： 1．RAID管理システムは、アクセス最近度またはかアク
セス頻度のような移行方針に従ってミラー記憶装置から
パリティ記憶装置へ移行させるために仮想ブロックを52
から選ぶ。 2. RAID管理システムは、パリティRAID領域44に不使用
のパリティ割当てブロック45を見つける。 3．そのようなブロックが見つけられないならば、移行
用に保留されたスペースが上述の創設技法に従ってパリ
ティRAID領域に変換される。 4. 移行されるべき仮想ブロックへの新しい記憶装置要
求が中断される。 5. RAID管理システムは、仮想ブロックへのすべての有
効な記憶装置要求が完了するまで待つ。 6. データは、仮想ブロック52に関連したミラー割当て
ブロック43から一時記憶バッファに読込まれる。 7. そのデータは、選ばれたパリティ割当てブロック45
に書込まれる。 8. 仮想ブロック・テーブルが、パリティ割当てブロッ
ク45におけるデータの新しいロケーションを参照するよ
う修正される。 9. 仮想ブロックへのデータ要求が再開される。

【００４７】上述の2つの番号を付けたシーケンスは、
この発明のメモリ・システムが異なる2つの冗長性レベ
ルの間でデータを移行する方法の例を提供する。

【００４８】データ冗長は別として、この発明のディス
ク・アレイ・データ記憶システムは、データ可用性を
高めるために「ホット・スペア」能力を提供する。発明
の背景において説明したように、先行技術のディスク
・アレイは、記憶ディスクが故障する場合に使用する付
加的な物理的記憶ディスク、すなわち「スペア」をと
っておく。この余分な記憶ディスクは、ディスク・ア
レイに取り付けられ、完全に動作可能であるが、記憶デ
ィスク故障が起こるまで、働いていないままである。
このライブ記憶ディスクは、「ホット・スペア」と呼
ばれる。ホット・スペア・ディスクは、ディスク故障の
後、「再構築」として知られるプロセスでデータを再
構成し冗長性を復元するために使われる。あいにく専用
のホット・スペア・ディスクは、すべてのディスクが
正しく作用している通常操作の間には有用なサービスを
提供せず、ディスク故障の際にだけ有用である。

【００４９】この発明のディスク・アレイによると、デ
ィスク故障の際にユーザ・データを再構築するに十分な
量の記憶スペースが、アレイの多数のそして好ましくは
すべての記憶ディスクにわたって分布した形態で維持さ
れ、RAID１の記憶装置を増大させるのに使われる。「ホ
ット・スペア」に指定された記憶装置ディスクは一つも
ない。アレイにおけるすべてのディスクは、再構築のた
めに記憶スペースをつかうことができるような態様でア
クセス可能なユーザーデータを格納する。ホット・スペ
ア・スペースの使用は、並列性を増やすことによって、
そして、ミラー記憶のためにより多くの容量を提供する
ことによってかなりパフォーマンスを改善する本質にお
いて、過去、単にホット・スペア資源のためにだけ保留
された付加的な磁気ディスクが、ユーザ・データを格納
する通常動作のためにアレイに編入される。

【００５０】図5は、ディスク故障が起こる前に、記憶
ディスク0-5を持つ例としての６ディスクの同質のディ
スク・アレイを示す。その記憶スペースすなわち記憶空
間のすべてが、ミラーまたはパリティ技法に従ってユー
ザ・データおよび冗長データを格納するために使われ
る。どのディスクも領域も、ホット・スペア資源のため
にだけ保留されることがない。ここで、そのユーザ・デ
ータの55%がRAID5のパリティ領域に格納され、45%がRAI
D1のミラー領域に格納される。たとえすべての記憶空間
が普通のデータ記憶のために使われているとしても、デ
ィスク故障の場合、冗長性を復元するためおよびユーザ
・データを再建するために、ある量のスペースを使用可
能にすることができる。この図において、使用可能にす
ることができるホット・スペア・スペースが、アレイの
記憶ディスクにわたって分布するRAID1の記憶スペース
として現在使われている。

【００５１】図6は、図5と同じディスクアレイを示す
が、記憶ディスク5の故障の後を示している。ディスク5
の上に格納されたユーザ・データおよび／または冗長デ
ータは、失われる。故障が生じると、ディスク・アレイ
は、そのシステムにおける冗長性を再構築する再構築プ
ロセスを開始する。スペースは、ミラー記憶からパリテ
ィ記憶にデータを移行することにより使用可能にされ
る。この移行は、ミラー記憶の量を減少させてながら、
同時にパリティ記憶の量を増やす。この移行プロセスと
並行して、故障した記憶ディスクのために失なわれた一
つのセグメントだけシステムのすべてのストライプのサ
イズが減少する。いまや、ストライプがディスク0-4に
わたって広がるだけでディスク5にわたっては延びてい
ないことに注意されたい。このデータ移行およびストラ
イプ・サイズの減少の結果、90%のユーザ・データがRAI
D5の領域に格納され、10%がRAID1の領域に格納される。
冗長性は、この再構築プロセスに続いてディスク・アレ
イに復元されている。

【００５２】図7は、ディスク5の故障に続いてデータの
移動によってどのように付加的スペースが自由にされる
かを図示する。この図は、一般に数字90と92で参照され
る3つのストライプの２セットを含む記憶ディスク0-5の
部分を示す。上の3つのストライプにおけるデータは、
ユーザ・データがセグメント1-9に格納され、冗長デー
タがセグメント1'ないし9'に格納されるミラー記憶技法
に従って格納される。ディスク5の冗長データ3'、6'お
よび9'がこのディスクの故障のために消失していること
に注意されたい。

【００５３】図7の例において、ストライプ90における
ユーザ・データが低いセットのストライプ92に移行され
ると仮定する。ここで冗長性記憶技法の相違によって、
ユーザ・データ1ないし9をより少ないセグメントに格納
することができる。ディスク5の消失にもかかわらず、
そのデータの移動によって付加的な3つのセグメント
（「不使用」のラベル）が使用可能になった。この３つ
のセグメントは、ユーザ・データを格納するために使う
ことができる。

【００５４】ディスク故障に続く再構築を保証しながら
RAID1の記憶装置としてホット・スペア・スペースを使
う能力は、メモリ・マネージャーによって管理される。
好ましい実施例においいて、メモリ・マネジャーは、ユ
ーザ・データ、冗長データおよびのディスク・アレイ上
の不使用スペースの情報を追跡し続けるRAID管理システ
ム（図1）として具体化される。

【００５５】RAID管理システムは、ユーザに割り当てる
ことができるアプリケーション・レベルの仮想記憶スペ
ースの量（図4におけるスペース50）に人為的な天井を
設けることによって、使われた記憶スペースがホット・
スペア目的のために、有効にされることを保証する（ア
プリケーション・レベルの仮想記憶スペースの量が、ホ
ット・スペア・オプションがオフにされれば使用可能で
あるものから、減らされる点で「人為的」）。この天井
を提供するために、RAID管理システムは、ディスク・ア
レイがその必要な機能（データの移動のような）を実行
することができることを保証しながら、ユーザに割り当
てることができるアプリケーション・レベルの仮想記憶
スペースの容量を定型的に計算する。ユーザがホット・
スペア・オプションを選ぶとき、RAID管理システムは、
まるでそれがそのアレイにおける最も大きいサイズの記
憶ディスクの容量を含まなかったように、アプリケーシ
ョン・レベルの容量を計算する。最も大きい記憶ディス
クの容量は、アレイにおける最も大きいものを含む任意
の記憶ディスクが故障する場合に、再構築プロセスが実
行されることを保証するのに使われる。すべての記憶デ
ィスクが同じサイズである均質なディスク・アレイにお
いては、任意の記憶ディスクの容量を使うことができ
る。

【００５６】ひとたび人為的な天井が計算されるなら
ば、RAID管理システムは、計算された容量を越えて付加
的なアプリケーション・レベルの仮想記憶スペースが割
り当てられるのを防ぐことによってこの限界を強制す
る。容量分析および強制の結合によって、アプリケーシ
ョン-レベル仮想記憶スペースのサイズが人為的に減少
させられ、これによって、記憶ディスクが故障する場
合、確実に十分な量のRAIDレベルの仮想記憶スペースが
再構築のための使用可能になる。

【００５７】同時にホット・スペアを保証しながら、ア
プリケーション・レベルの仮想記憶スペースの現在の量
を、満たすことができなけらば、RAID管理システムは、
ホット・スペア・スペースが使用可能でないことをユー
ザに知らせる警告を生成する。ディスク・アレイがすで
に一つの記憶ディスクをなくしているとき、この状況が
起こるかもしれない。例えば、故障したディスク5をも
つ図６のディスク・アレイは、別のディスク損失を受
け、しかもユーザ・データの冗長性を維持することはで
きない。ユーザが最初にホット・スペア・オプションを
イネーブルしないで、アプリケーション・レベルの仮想
記憶スペースのサイズがセットされた後にこの機構を要
求するときに、別の状況が起こりうる。ディスク・アレ
イは、その時点で、ホット・スペア資源を保証すること
ができないかもしれない。

【００５８】図8は、正常状態の間、およびディスク故
障の場合のディスク・アレイの動作方法を示す。ステッ
プ100において、RAID管理システム16は、ディスク・ア
レイ12によって提供される物理的な記憶スペースを第１
のすなわちRAIDレベルの仮想記憶スペース40（図４参
照）にマップする。先に述べたように、RAIDレベルの仮
想記憶スペースは、ミラーおよびてパリティRAID領域と
して物理的な記憶スペースを提示する。ステップ102に
おいて、RAID管理システムは、ディスク故障の場合、デ
ィスク・アレイにわたって十分な記憶スペースが使用可
能にされることができるようにする。

【００５９】データが最初にそのシステムに置かれると
き、そのデータは、完全にミラー記憶装置（ステップ10
4）に格納される。ユーザ・データおよび対応する冗長
データは、均一にそのディスクにわたって広がるのがよ
い。ミラー記憶装置は、パリティ記憶装置と比較してパ
フォーマンスおよび信頼性がよく、したがって好ましい
記憶型である。ユーザ・データの量がそのシステムにお
けるそのディスクの物理的容量のおよそ二分の一に届く
とき、ユーザ・データが記憶容量のおよそ二分の一を消
費し、冗長性データが残りの半分を消費するから、ディ
スク・アレイは、実効的に満杯である。ユーザ・データ
の量が、50の%閾値を越えるにつれて、RAID管理システ
ムは、これらのタイプの間でのデータ移動を使って、デ
ータをミラーおよびパリティRAID領域両方に格納し始め
る（ステップ106）。パリティ記憶装置を使うと、同じ
合計スペースにミラー記憶よりも多くのユーザ・データ
を格納することができる。データ記憶システムがいっぱ
いになり続けると、増加する量のデータを収納するため
に、比例的により多くのデータがパリティ記憶に移行さ
れる。ミラー記憶装置におけるユーザ・データの量は、
減少する。

【００６０】記憶ディスクが、正常動作の間の任意の時
点で故障する場合（破線によってステップ108に）、RAI
D管理システムは、再構築プロセスを始める。ステップ1
09において、RAID管理システムは、ディスク故障の場合
に利用可能にされることができる適切な量のホット・ス
ペア・スペースがあるかどうかを、評価する。言い換え
ると、故障した記憶ディスクを除いたシステムで、割り
当てた容量のすべてを冗長性とともに格納することがで
きることができるかを評価する。ディスク故障の場合に
（すなわち、ステップ109から「NO」分岐）割り当てた
容量のすべてを冗長性とともに格納する、適切な量のス
ペースがなければ、ディスク・アレイ記憶システムは、
ホット・スペア資源すなわち冗長性を復元する能力なし
で劣化した条件で操作される（ステップ111）。

【００６１】一方、ホット・スペアのための適切なスペ
ースがあるならば（すなわち、ステップ109からの「YE
S」分岐）、RAID管理システムは、ユーザ・データを再
建して、冗長性を復元する目的のために十分なスペース
が利用可能にされているかどうかを、判断する（ステッ
プ110）。ある場合（すなわち、ステップ110からの「YE
S」分岐）、ディスクアレイは、利用可能な自由スペー
スを使って、故障した記憶ディスクからユーザ・データ
を再建し冗長性を復元する。代わりに使用可能にされた
十分なスペースがなければ（すなわち、ステップ112か
ら「NO」分岐）、RAID管理システムは、故障した記憶デ
ィスクで失われたスペースを補う利用可能な記憶スペー
スを空けるために、ミラー記憶装置からパリティ記憶装
置にユーザ・データを移行させる。RAID管理システム
は、十分な量の使用可能な記憶スペースが空けられ、故
障したディスク・スペースの必要性がなくなるまで、ミ
ラーからパリティ記憶装置にデータを移行し続ける（ス
テップ110および114のループによって表現されるよう
に）。

【００６２】この発明のディスク・アレイ・システム
は、ディスク故障に続いて再構築を保証しながら、すべ
ての記憶ディスクがデータをミラー記憶装置に格納する
ために等しく使われる点で、先行技術のディスク・アレ
イより有利である。故障が起こるまで、不使用になる専
用記憶ディスクがない。ミラー記憶装置としてのホット
・スペア記憶装置の使用は、並列性を増やし冗長な記憶
スペースへの書き込みを管理する複雑さを減少させるこ
とによって、かなりディスク・アレイ全体のパフォーマ
ンスを改善する。

【００６３】しかし、この発明は、上述した特定の特長
に限られるものではなく、均等論によって解釈される特
許請求の範囲で規定する事項を包含する。この発明は、
例として次の実施態様を含む。

【００６４】1.記憶ディスクが故障した場合、記憶ディ
スク・アレイにおける再構築に使用するための記憶スペ
ースを提供するための方法であって、複数の記憶ディス
クを有するディスク・アレイを準備するステップと、ユ
ーザ・データをすべての記憶ディスクに格納するステッ
プと、冗長データを記憶ディスクの中の少なくとも1つ
に格納するステップと、記憶ディスクの一つが故障する
場合、ユーザ・データを再建し、冗長性を復元するため
に十分な量の記憶スペースが利用可能にできるようにす
るステップと、を含み、ディスク故障が起きるまで上記
の量の記憶スペースをユーザ・データおよび冗長データ
の格納のために使用する、上記記憶スペースを提供する
方法。

【００６５】2. ユーザデータおよび冗長データを格納
するために使われる記憶スペースを、そのユーザ・デー
タを再建して、冗長性を復元するためのホット・スペア
・スペースに変換するステップを含む上記１の方法。 3.ディスク故障に続いてディスク・アレイにおけるユー
ザ・データを再建し冗長性を復元するために、十分な量
の記憶スペースを利用可能にすることができないことが
判断されるとき、ホット・スペア資源が、保証されえな
いことを知らせる警告を、ユーザに発するステップを含
んでいる上記1の方法。

【００６６】4. 物理的な記憶スペース(34)を規定する
選ばれた容量の複数の記憶ディスク（12）のディスク・
アレイ（11）を含んでいる階層的なデータ記憶システム
（10）おける再構築に使用する記憶スペースを提供する
ための方法であって、物理的な記憶スペース(34)をRAID
レベルの仮想記憶スペース(40)にマップする物理的な記
憶スペースを、データをミラー冗長性に従って格納する
ミラーRAID領域およびデータをパリティ冗長に従って格
納するパリティRAID領域を含む複数のRAID領域として提
示するステップと、ユーザ・データがディスク・アレイ
（11）のすべての記憶ディスク（12）にわたって分布す
る態様で少くともミラーまたはパリティRAID領域の1つ
にユーザ・データを格納するステップと、記憶ディスク
故障の場合、ユーザ・データを再建し冗長性を復元する
に十分な量のRAIDレベルの仮想記憶スペース(40)を利用
可能にすることができることを確実にするステップと、
を含み、記憶ディスク故障が生じるまでミラー冗長性に
従ってデータを格納するのに、ユーザ・データを再建し
冗長性を回復するために利用可能にされることができる
量の記憶スペースを使う、上記記憶スペースを提供する
方法。

【００６７】5. 次のステップを含む上記4の方法：RAI
D-レベル仮想記憶スペース(40)をアプリケーション・レ
ベルの仮想記憶スペース(50)にマップするステップと、
最も大きいサイズ記憶ディスクの容量を含むことなくユ
ーザに割り当てることができるアプリケーション・レベ
ルの仮想記憶スペース(50)の容量を計算するステップ。 6.十分な量のRAIDレベルの仮想記憶スペース(40)が、再
構築のために利用可能にされることができることを確保
するため、計算された容量を越えて付加的なアプリケー
ション・レベルの仮想記憶スペースを割り当てるのを防
ぐステップを含む上記５の方法。 7.上記4の方法において、ディスク・アレイ（11）が、2
つ以上の記憶装置ディスク（12）を持ち、ミラーRAID領
域がデータを格納するのに、同じ量のデータを格納する
のにパリティRAID領域によって消費されるよりも多くの
RAIDレベルの仮想記憶スペース(40)を消費するようにな
っており、さらに、以下のステップを含む方法：最初に
ユーザ・データをミラーRAID領域に格納するステップ
と、記憶ディスク故障の場合、以下の2ステップの一つ
を行うステップ； (a)故障した記憶ディスクからユーザ・データを再建
し、冗長性を復元するための記憶スペースとして、ミラ
ーまたはパリティRAID領域として割り当てられていない
不使用の記憶スペースを使う、または (b)ミラーRAID領域からパリティRAID領域にユーザ・デ
ータを移行させ、故障した記憶ディスクで失われたスペ
ースを補うための記憶スペースを空けるためにミラー領
域を詰め込む。

【００６８】8.複数の記憶ディスク（12）を有するディ
スク・アレイ（11）と；記憶ディスク(12)との間でユー
ザ・データの転送をコーディネートするためにディスク
・アレイ（11）に結合されたディスク・アレイ・コント
ローラ（14）と；メモリ割り当ておよびディスク・アレ
イ（11）上のデータ記憶を管理するためディスク・アレ
イ・コントローラ(14)に結合されたメモリマネージャー
（16）と；を含み、該メモリマネージャーは、すべての
記憶ディスク（12）にわたってユーザ・データおよび冗
長データを分配し、記憶ディスクの一つが故障する場
合、ユーザ・データを再建し冗長性を回復するために利
用可能にされることができる十分な量の記憶スペースを
維持し、記憶ディスク故障に続く再構築のためにその記
憶スペースが利用可能にされることを保証しながら、ユ
ーザ・データおよび冗長性データを格納するためにその
量の記憶スペースを使うようにしたデータ記憶システ
ム。

【００６９】9.記憶ディスク（12）が物理的な記憶空間
(34)を規定し、メモリ・マネージャー（16）が、RAIDレ
ベルの仮想記憶スペース(40)を記憶ディスク（12）の物
理的な記憶スペース(34)にマップするRAID管理システム
を含み、RAIDレベルの仮想記憶スペースが、物理的な記
憶スペースを複数のRAID領域として提示するRAID領域
は、データをミラー冗長に従って格納するミラーRAID領
域、およびデータをパリティ冗長に従って格納するパリ
ティRAID領域を含み、さらに、RAID管理システムは、RA
IDレベルの仮想記憶スペース(40)をアプリケーション・
レベルの仮想記憶スペース(50)にマップし、最も大きい
サイズ記憶ディスクの容量を含むことなくユーザに割り
当てることができるアプリケーション・レベルの仮想記
憶スペース(50)の容量を計算するようにした上記８のデ
ータ記憶システム。

【００７０】10. RAID管理システムは、十分な量のRAI
Dレベルの仮想記憶スペース(40)が、ユーザ・データを
回復し冗長性を復元するために利用可能にされることを
確実にするために、計算された容量を越えて、付加アプ
リケーション・レベルの仮想記憶スペース(50)の割り当
てを防ぐ上記9のデータ記憶システム。

【００７１】

【発明の効果】この発明によると、ディスク・アレイの
すべての記憶ディスクを十分利用しながらホット・スペ
ア資源が得られる。

【図面の簡単な説明】

【図１】この発明に従う冗長な階層的なディスク・アレ
イ・データ記憶システムの図表のブロック図である。

【図２】複数の記憶ディスク上の記憶スペースを示す図
表で、RAIDレベル1によるデータ記憶を示している。

【図３】複数の記憶ディスク上の記憶スペースの図表
で、RAIDレベル５によるデータ記憶を示す。

【図４】2つの仮想記憶スペースが物理的な記憶スペー
スの上へマップされている、この発明のメモリーマッピ
ング取り決めの図表である。

【図５】複数の記憶ディスク上の記憶スペースの図表で
あって、記憶ディスクの故障前のホット・スペア資源の
使用を示す。

【図６】複数の記憶ディスク上の記憶スペースの図表で
あって、記憶ディスクの故障後のホット・スペア資源の
使用を示す。

【図７】複数の記憶ディスク上の記憶スペースの図表で
あって、RAIDレベル1の記憶装置からRAIDレベル5の記憶
装置へのデータの移動によってホット・スペアのために
どのようにスペースが使用可能になるかを示す。

【図８】図8は、ホット・スペア・スペースの可用性を
保証するようディスク・アレイを操作する方法の流れ図
である。

【符号の説明】

１０データ記憶システム１１ディスク・アレイ１２記憶ディスク１３インターフェイス・バス１４ディスク・アレイ・コントローラ１８ミラー・グループ２２パリティ・グループ

フロントページの続き (72)発明者ブライアン・エム・ダイアモンドアメリカ合衆国83704アイダホ州ボイジー、ラムスゲート 9704 (72)発明者マイケル・ビー・ジャコブソンアメリカ合衆国83714アイダホ州ボイジー、オースティン 8884 (72)発明者ウェイドゥ・エー・ドルフィンアメリカ合衆国83704アイダホ州ボイジー、ペトリエ 7179 (72)発明者ダグラス・エル・ヴォイトアメリカ合衆国83702アイダホ州ボイジー、ノース・トゥエンティフォース 3030

Claims

【特許請求の範囲】

【請求項１】記憶ディスクが故障した場合、記憶ディス
ク・アレイにおける再構築に使用するための記憶スペー
スを提供するための方法であって、複数の記憶ディスクを有するディスク・アレイを準備す
るステップと、ユーザ・データをすべての記憶ディスクに格納するステ
ップと、冗長データを記憶ディスクの中の少なくとも1つに格納
するステップと、記憶ディスクの一つが故障する場合、ユーザ・データを
再建し、冗長性を復元するために十分な量の記憶スペー
スが利用可能にできるようにするステップと、を含み、ディスク故障が起きるまで上記の量の記憶スペ
ースをユーザ・データおよび冗長データの格納のために
使用する、上記記憶スペースを提供する方法。