JP2022017216A

JP2022017216A - 障害回復機能のあるストレージシステム及びその動作方法

Info

Publication number: JP2022017216A
Application number: JP2021115930A
Authority: JP
Inventors: 星旭柳; Sungwook Ryu; 亮ソク奇; Yang Seok Ki; 東起李; Dong-Gi Lee; 昌皓崔; Changho Choi; イーシャンナジャファーバード，; Najafabadi Ehsan
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2020-07-13
Filing date: 2021-07-13
Publication date: 2022-01-25
Also published as: JP2022017215A; US11803446B2; KR20220008203A; TW202203034A; US20220012147A1; CN113934367A; KR20220008237A; US20220012145A1; CN113934368A; TW202203037A; KR20220008206A; TW202219765A; TW202219766A; KR20220008214A; US11775391B2; US20220012130A1; US20230244570A1; US20220012142A1; US11630731B2; JP2022017212A

Abstract

【課題】障害回復力のあるストレージシステム及びその動作方法を提供する。【解決手段】本発明の第１ストレージ装置及び第２ストレージ装置を含むストレージシステムを動作させる方法は、第１ストレージ装置が読み取り専用の状態にあり、第２ストレージ装置が読み取り／書き込みの状態にあることを決定する段階と、ストレージシステムに対する第１ストライプの書き込み動作を遂行する段階と、ストレージシステムからの第２ストライプの第１読み取り動作を遂行する段階と、ストレージシステムからの第１ストライプの第２読み取り動作を遂行する段階と、を有し、書き込み動作を遂行する段階は、第１ストライプの一部を第２ストレージ装置に書き込む段階、第１ストライプのためのマッピングテーブルにエントリを生成する段階と、を含む。【選択図】図１

Description

本発明は、データストレージシステムに関し、より詳細には、内部障害状態の存在下で回復（復元）力を示すように構成されるデータストレージシステム及びその動作方法に関する。

本背景説明は、コンテキスト（文脈）のみを提供するものであり、背景説明のいかなる実施形態又は概念の開示も実施形態又は概念が先行技術であることを認めるものではない。

ストレージ装置及びシステムは、多様なデータ処理システム内で広範な応用性を有している。ストレージ装置は、温度センサーの障害又は放射線による（ｒａｄｉａｔｉｏｎ－ｉｎｄｕｃｅｄ）ビットフリップ（ｂｉｔｆｌｉｐ）を含む相当な範囲の内部障害状態に直面するほど十分に複雑である。ストレージ装置又はそのようなストレージ装置を使用しているシステム（例えば、ＲＡＩＤ（ＲｅｄｕｎｄａｎｔＡｒｒａｙｏｆＩｎｄｅｐｅｎｄｅｎｔＤｉｓｋｓ）：レイド）の設計時に、これらの障害状態を考慮しないと、ストレージ装置の単一障害により、全体のストレージ装置と、もしかするとストレージ装置を含む（ＲＡＩＤのようなもの）より大規模なシステムとが動作しなくなる。

従って、ストレージ装置及びストレージ装置を含むシステムの回復（復元）動作のためのシステム及びその動作方法に対する要求がある。

米国特許第７４５１３４６号明細書米国特許第８５８９７２３号明細書米国特許第８７６９５３５号明細書米国特許第９７１０３１７号明細書米国特許第９７２８２７７号明細書米国特許第９８３０２３６号明細書米国特許第１００９５５０６号明細書米国特許第１０１０２０８２号明細書米国特許第１０２６３８４２号明細書米国特許第１０４４５２００号明細書米国特許第１０５７２１６１号明細書米国特許出願公開第２００５０１２０２６７号明細書米国特許出願公開第２００６０１４３５０７号明細書米国特許出願公開第２００７０１０１１８８号明細書米国特許出願公開第２０１３００４７０２８号明細書米国特許出願公開第２０１４０１９５８４７号明細書米国特許出願公開第２０１５０１００７２０号明細書米国特許出願公開第２０１８００１１６４９号明細書米国特許出願公開第２０１９０３７７６３７号明細書米国特許出願公開第２０１９０３８４６７０号明細書米国特許出願公開第２０２００１３５２８０号明細書

本発明は、上記従来技術に鑑みてなされたものであって、本発明の目的は、障害回復力のあるストレージシステム及びその動作方法を提供することにある。

一実施形態で、障害復元のストレージ装置は、多様な回復（復元）モードで動作し、内部障害にも拘らずに部分的な機能を維持するか又はフル（ｆｕｌｌ）機能にリターン（回復）することができる。ストレージ装置が部分的機能を維持する方法の１つは、いくつかの状況において、読み取り専用モードで動作するものであり、読み取り専用モードでは、ストレージ装置がホストからの読み取り要請に応答するが、ホストからの書き込み要請を受信するとエラーメッセージをリターンする。ＲＡＩＤ－０ストレージシステムでは、ストレージ装置が読み取り専用モードで動作することに切り替える可能性は、ストレージ装置が読み取り専用モードで動作（演算）することに切り替えた後に遂行される任意の書き込み動作に対するストライプを構成するストリップを再分配することにより達成される。

上記目的を達成するためになされた本発明一態様による第１ストレージ装置及び第２ストレージ装置を含むストレージシステムを動作させる方法は、前記第１ストレージ装置が読み取り専用の状態にあり、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定する段階と、前記ストレージシステムに対する第１ストライプの書き込み動作（操作）を遂行する段階と、前記ストレージシステムからの第２ストライプの第１読み取り動作を遂行する段階と、前記ストレージシステムからの前記第１ストライプの第２読み取り動作を遂行する段階と、を有し、前記書き込み動作を遂行する段階は、前記第１ストライプの一部を前記第２ストレージ装置に書き込む段階と、前記第１ストライプのためのマッピングテーブルにエントリを生成する段階と、を含み、前記第１読み取り動作を遂行する段階は、前記第１ストレージ装置及び前記第２ストレージ装置から前記第２ストライプの一部を読み取る段階を含み、前記第２読み取り動作を遂行する段階は、前記マッピングテーブルが前記第１ストライプのためのエントリを含むことを決定する段階と、前記第２ストレージ装置から前記第１ストライプの一部を読み取る段階と、を含む。

前記ストレージシステムは、前記第１ストレージ装置及び前記第２ストレージ装置を含む複数のストレージ装置を含み、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定する段階は、前記第１ストレージ装置ではない、前記第２ストレージ装置を含む１つ以上の残りのストレージ装置が読み取り／書き込みの状態にあることを決定する段階を含み、前記書き込み動作を遂行する段階は、前記残りのストレージ装置に前記第１ストライプを書き込む段階を含み得る。
前記第１読み取り動作を遂行する段階は、前記第２ストライプが前記複数のストレージ装置内でオープン（ｏｐｅｎ）マッピングされていることを決定する段階と、前記複数のストレージ装置から前記第２ストライプを読み取る段階と、を含み得る。
前記方法は、前記残りのストレージ装置にドライブの識別番号を再び割り当てる段階を更に含み、前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、前記再び割り当てる段階は、前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当てる段階と、前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てる段階と、を含み得る。
前記第２読み取り動作を遂行する段階は、前記残りのストレージ装置から前記第１ストライプを読み取る段階と、前記マッピングテーブルに基づくアドレスでストレージ装置から前記第１ストライプのストリップを読み取る段階と、を含み得る。
前記方法は、前記残りのストレージ装置にドライブの識別番号を再び割り当てる段階を更に含み、前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、前記再び割り当てる段階は、前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当てる段階を含み得る。
前記再び割り当てる段階は、前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てる段階を更に含み得る。
前記第１ストレージ装置の元のドライブの識別番号がｎであり、前記第１ストライプのストリップを読み取る段階は、再び割り当てられた前記識別番号ｎを有するストレージ装置から前記ストリップを読み取る段階を含み得る。

上記目的を達成するためになされた本発明の一態様によるデータを格納するシステムは、第１ストレージ装置と、第２ストレージ装置と、前記第１ストレージ装置及び前記第２ストレージ装置に連結される処理回路と、を備え、前記処理回路は、前記第１ストレージ装置が読み取り専用の状態にあり、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定し、第１ストライプの書き込み動作を遂行し、第２ストライプの第１読み取り動作を遂行し、前記第１ストライプの第２読み取り動作を遂行するように構成され、前記書き込み動作を遂行することは、前記第１ストライプの一部を前記第２ストレージ装置に書き込み、前記第１ストライプのためのマッピングテーブルにエントリを生成することを含み、前記第１読み取り動作を遂行することは、前記第１ストレージ装置及び前記第２ストレージ装置から前記第２ストライプの一部を読み取ることを含み、前記第２読み取り動作を遂行することは、前記マッピングテーブルが前記第１ストライプのためのエントリを含むことを決定し、前記第２ストレージ装置から前記第１ストライプの一部を読み取ることを含む。

前記システムは、前記第１ストレージ装置及び前記第２ストレージ装置を含む複数のストレージ装置を含み、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定することは、前記第１ストレージ装置ではない、前記第２ストレージ装置を含む１つ以上の残りのストレージ装置が読み取り／書き込みの状態にあることを決定することを含み、前記書き込み動作を遂行することは、前記残りのストレージ装置に前記第１ストライプを書き込むことを含み得る。
前記第１読み取り動作を遂行することは、前記第２ストライプが前記複数のストレージ装置内でオープンマッピングされていることを決定し、前記複数のストレージ装置から前記第２ストライプを読み取ることを含み得る。
前記処理回路は、前記残りのストレージ装置にドライブの識別番号を再び割り当てるように更に構成され、前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、前記再び割り当てることは、前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当て、前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てることを含み得る。
前記第２読み取り動作を遂行することは、前記残りのストレージ装置から前記第１ストライプを読み取り、前記マッピングテーブルに基づくアドレスでストレージ装置から前記第１ストライプのストリップを読み取ることを含み得る。
前記処理回路は、前記残りのストレージ装置にドライブの識別番号を再び割り当てるように更に構成され、前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、前記再び割り当てることは、前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当てることを含み得る。
前記処理回路は、前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てるように更に構成され得る。
前記第１ストレージ装置の元のドライブの識別番号はｎであり、前記第１ストライプのストリップを読み取ることは、再び割り当てられた前記識別番号ｎを有するストレージ装置から前記ストリップを読み取ることを含み得る。

上記目的を達成するためになされた本発明の他の態様によるデータを格納するシステムは、第１ストレージ装置と、第２ストレージ装置と、前記第１ストレージ装置及び前記第２ストレージ装置に連結される処理手段と、を備え、前記処理手段は、前記第１ストレージ装置が読み取り専用の状態にあり、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定し、第１ストライプの書き込み動作を遂行し、第２ストライプの第１読み取り動作を遂行し、前記第１ストライプの第２読み取り動作を遂行するように構成され、前記書き込み動作を遂行することは、前記第１ストライプの一部を前記第２ストレージ装置に書き込み、前記第１ストライプのためのマッピングテーブルにエントリを生成することを含み、前記第１読み取り動作を遂行することは、前記第１ストレージ装置及び前記第２ストレージ装置から前記第２ストライプの一部を読み取ることを含み、前記第２読み取り動作を遂行することは、前記マッピングテーブルが前記第１ストライプのためのエントリを含むことを決定し、前記第２ストレージ装置から前記第１ストライプの一部を読み取ることを含む。

前記システムは、前記第１ストレージ装置及び前記第２ストレージ装置を含む複数のストレージ装置を含み、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定することは、前記第１ストレージ装置ではない、前記第２ストレージ装置を含む１つ以上の残りのストレージ装置が読み取り／書き込みの状態にあることを決定することを含み、前記書き込み動作を遂行することは、前記残りのストレージ装置に前記第１ストライプを書き込むことを含み得る。
前記第１読み取り動作を遂行することは、前記第２ストライプが前記複数のストレージ装置内でオープンマッピングされていることを決定し、前記複数のストレージ装置から前記第２ストライプを読み取ることを含み得る。
前記処理手段は、前記残りのストレージ装置にドライブの識別番号を再び割り当てるように更に構成され、前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、前記再び割り当てることは、前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当て、前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てることを含み得る。

本発明によると、多様な回復（復元）モードで動作し、内部障害にも拘らずに部分的な機能を維持するか又はフル（ｆｕｌｌ）機能にリターン（回復）することができる障害回復力のあるストレージ装置を有するレイドシステムが提供される。

本発明の一実施形態によるデータストレージシステムのブロック図である。本発明の一実施形態によるストレージ装置の障害状態のテーブルである。本発明の一実施形態によるストレージ装置の動作モードのテーブルである。本発明の一実施形態による、ホストによってストレージ装置に送られるコマンドのテーブルである。本発明の一実施形態による回復（復元）モードの階層構造を示したテーブルである。本発明の一実施形態による障害回復力のあるストレージ装置の動作の第１方法に対するフローチャートである。本発明の一実施形態による障害回復力のあるストレージ装置の動作の第２方法に対するフローチャートである。本発明の一実施形態によるストレージ装置の概略的なデータレイアウト図である。本発明の一実施形態による障害回復の読み取り専用モードでストレージ装置の動作の第１方法に対するフローチャートである。本発明の一実施形態による障害回復の読み取り専用モードでストレージ装置の動作の第２方法に対するフローチャートである。本発明の一実施形態による書き込み動作を遂行するＲＡＩＤ－０システムの概略的なデータレイアウト図である。本発明の一実施形態による読み取り動作を遂行するＲＡＩＤ－０システムの概略的なデータレイアウト図である。本発明の一実施形態による再マッピング（ｒｅｍａｐｐｉｎｇ）と書き込み動作を遂行するＲＡＩＤ－０システムの概略的なデータレイアウト図である。本発明の一実施形態によるＲＡＩＤ－０ストレージシステムの動作の第１方法に対するフローチャートである。本発明の一実施形態によるＲＡＩＤ－０ストレージシステムの動作の第２方法に対するフローチャートである。

以下、本発明を実施するための形態の具体例を、図面を参照しながら詳細に説明する。

本明細書で提供する図面は、実施形態を説明するためのものであり、明示的に開示されていない他の実施形態は、本発明の範囲から排除されない。本発明のこれら及び他の特徴や利点は、明細書、特許請求の範囲、及び図面を参照して、認知されて理解されるだろう。

図面に関連して以下に説明する詳細な説明は、本発明に基づいて提供されるメモリリソース管理システム及び方法の例としての実施形態を説明するためのものであり、本発明が構成・活用される唯一の形態を示すものではない。以下の説明は、図示した実施形態に関連して、本発明の特徴を提示する。しかし、同一又は同等の機能及び構造が、また本発明の範囲内に含まれるように意図される他の実施形態によって達成されることが理解されるべきである。本明細書で類似の図面符号は類似の構成要素又は特徴を示す。

一実施形態で、障害回復力のあるストレージ装置は、多様な回復（復元）モードで動作し、内部障害にも拘らずに部分的な機能を維持するか又はフル（ｆｕｌｌ）機能にリターン（回復）することができる。例えば、温度センサーの障害に対応して、ストレージ装置は、減少した速度で動作するか若しくは書き込み動作のための減少した速度で動作するか、又は書き込み動作を殆ど遂行しない。ストレージ媒体にエラーを引き起こす可能性がある一時的な障害に応答して、ストレージ装置は、ストレージ媒体を再びフォーマットする。ストレージ装置は、エラーを起こさない一時的な障害に応答して、電源をパワーサイクリングする（ｐｏｗｅｒｃｙｃｌｉｎｇ）。ストレージ装置が部分的機能を維持する方法の１つは、いくつかの状況において、読み取り専用モードで動作するものであり、読み取り専用モードでは、ストレージ装置がホストからの読み取り要請に応答するが、ホストからの書き込み要請を受信すると、エラーメッセージをリターンする。また、満了予定のデータをレスキュースペースに移動するため、満了によりデータが失われない。ＲＡＩＤ－０のストレージシステムでは、ストレージ装置が読み取り専用モードで動作することに切り替える可能性は、ストレージ装置が読み取り専用モードで動作することに切り替えた後、遂行される任意の書き込み操作（動作）に対するストライプを構成するストリップを再分配することにより達成される。

図１は、本発明の一実施形態によるデータストレージシステムのブロック図であり、１つ以上のストレージ装置１１０（又は「ドライブ」）に連結されるホスト１０５を含むコンピューティングシステムを示す。ストレージ装置１１０は、図示したように、ボリュームマネージャー１１５（以下、詳細に説明する）を介してホスト１０５に連結されるか又はホスト１０５に直接連結される。いくつかの実施形態で、ストレージ装置１１０は、内部障害状態を経験し、ストレージ装置は、障害状態のシステムレベルの影響を緩和するために、以下で詳細に記述するように、多様な復元動作（操作）を示す。各ストレージ装置１１０は、ソリッドステートドライブ（ＳＳＤ）であり、コントローラ１２０（又は「制御回路」）及びストレージ媒体１２５（例えば、ナンド（ＮＡＮＤ）型フラッシュメモリ）を含む。ストレージ装置１１０で消去可能な最小単位は「ブロック」と呼ばれ、ストレージ装置１１０で最小の書き込み可能な単位は「ページ」と称される。各ストレージ装置１１０は、２．５インチ、１．８インチ、ＭＯ－２９７、ＭＯ－３００、Ｍ．２、及びＥＤＳＦＦ（ＥｎｔｅｒｐｒｉｓｅａｎｄＤａｔａＣｅｎｔｅｒＳＳＤＦｏｒｍＦａｃｔｏｒ）を含むか、或いはこれらに限定されない永続性ストレージ装置に適する複数のフォームファクタのうちのいずれか１つのフォームファクタを有し、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ）、ＰＣＩｅ（ＰＣＩｅｘｐｒｅｓｓ）、ＳＣＳＩ（Ｅｔｈｅｒｎｅｔ、ＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅ）、ＳＡＴＡ、（ＳｅｒｉａｌＡＴＡｔｔａｃｈｍｅｎｔ）、及びＳＡＳ（ＳｅｒｉａｌＡｔｔａｃｈｅｄＳＣＳＩ）を含む永続性ストレージ装置に適する複数のインターフェースのうちのいずれか１つである電気的インターフェースを有し、インターフェースを介してホスト１０５に接続される。

ストレージ媒体１２５は、保存期間（ストレージ媒体１２５の使用履歴に左右され、それに応じてストレージ媒体１２５内で変化する）を有し、保存期間よりも長く格納されたデータ（即ち、保存期間を超える年齢を有するデータ）は、信頼できなくなって有効期間が切れたと言う。データは、ブロックコードの可能性があるエラー訂正コードを用いて、ストレージ媒体１２５に格納される。ストレージ媒体１２５からデータを読み取るとき、ストレージ媒体１２５からコードブロック（ｃｏｄｅｂｌｏｃｋ）と称される多量のローデータを読み取ってデコーディングを試みる。試みが失敗した場合、追加の試み（読み取りの再試み）が行われる。使用に応じて、ストレージ媒体１２５の一部、例えばブロックは、保存期間が許容することができないほど短くなる地点までに低下すると、そのブロックは、「不良ブロック」として分類される。このような状況が全体のストレージ媒体１２５を利用不可能にすることを防止するために、「不良ブロック管理の予備スペース」と呼ばれる予備スペースが存在し（例えば、各フラッシュメモリダイ又は各フラッシュメモリプレーンに含まれる）、フラッシュメモリダイ又はフラッシュメモリプレーン内部のコントローラ１２０又は他のコントローラは、予備ブロックを使用し始め、不良ブロックの使用を中断する。

図２Ａは、本発明の一実施形態によるストレージ装置の障害状態のテーブルであり、図２Ｂは、ストレージ装置の動作モードのテーブルである。図２Ｃは、ホストによってストレージ装置に送られるコマンドのテーブルであり、図２Ｄは、回復（復元）モードの階層構造を示したテーブルである。図２Ａは、各ケース識別子（「ケースＩＤ」）でラベル付けされた障害状態（又は「障害条件」）のテーブルを示す。ケース１は、ストレージ装置１１０は、もはや読み取り又は書き込みの動作（操作）を遂行することができず、電源をパワーサイクリングするか又はストレージ媒体を再フォーマットすることでも、解決することができない任意の障害状態（条件）である。ストレージ装置１１０は、このような方法で動作する状態は、例えば異なる障害のメカニズム（ｆａｉｌｕｒｅｍｅｃｈａｎｉｓｍ）に各々対応する多様なサブ状態を有する。このような状態又は障害の状態（ストレージ装置１１０は、もはや読み取り又は書き込みの操作を遂行することができず、電源をパワーサイクリングするか又はストレージ媒体を再フォーマットすることでも、解決することができない）は、例えば損傷したコントローラのファームウェアの一部（この場合、コントローラが、損傷したコマンドが実行されない安全モードで再起動する）、又はストレージ装置１１０の処理回路の障害（例えば、ストレージ媒体との相互作用を管理するが、ホスト１０５との通信を担当していない処理回路の障害）によって引き起こされる。このようなタイプの障害状態が発生すると、ストレージ装置１１０は、ホスト１０５からの任意の読み取り又は書き込みのコマンドに対してエラーメッセージと共に応答する。

ケース２は、（ｉ）ストレージ装置１１０がもはや読み取り又は書き込みの動作を遂行することができないが、（ｉｉ）ストレージ装置１１０の電源をパワーサイクリングするか又はストレージ媒体を再フォーマットすることで復元可能な任意の障害状態である。このような障害の状態は、例えばストレージ装置１１０のコントローラ１２０のプログラムの実行エラー（例えば、コントローラ１２０のランダムアクセスメモリ（ＲＡＭ）でビットフリップの結果として範囲を超えたポインタ、又はビットフリップの結果として間違ったコマンド）によって発生する。プログラムの実行エラーによってコントローラ１２０がストレージ媒体１２５に間違ったデータを書き込んでいない場合（例えば、コントローラによってストレージ媒体に最新の書き込みの後、プログラムの実行エラーが発生した場合）、ストレージ装置の電源をパワーサイクリングすることがストレージ装置１１０を正常の動作に復元するのに十分であり、プログラムの実行エラーによってコントローラ１２０がエラーデータをストレージ媒体１２５に書き込んだ場合にストレージ媒体１２５を再フォーマットすることは、ストレージ装置１１０を正常の動作に復元するのに十分である。

ケース３は、ストレージ装置１１０を読み取り専用モードで動作させることによって緩和され、ストレージ媒体１２５を再フォーマットするが全機能を復元できない任意の障害状態である。このような障害の例は、（ｉ）温度センサーの障害、（ｉｉ）読み取り専用モードに転換されたストレージ媒体１２５の一部を含む。温度センサーの障害の場合、温度センサーの測定値が範囲を超えている（例えば、臨界温度を超えた）と判定して障害を感知し、この場合、ストレージ装置１１０の過熱のリスクが読み取り動作よりも多くの電力を消費することから、書き込み動作を回避することによって減少する可能性がある。ストレージ媒体１２５の一部の読み取り専用モードへの移行は、例えばフラッシュメモリプレーン又はダイがランタイムの不良ブロックの管理に使用されている不良ブロック管理の予備スペースを使いつくす場合に、フラッシュメモリストレージ媒体１２５に対して発生する。例えば、ストレージ装置１１０は、読み取り動作の遂行を試みつつ、データ項目をデコーディングする試みに失敗し、データを格納するブロックが不良ブロックであると判断してデータを不良ブロックから不良ブロック管理の予備スペースに移動するとき、残りの不良ブロック管理の予備スペースが臨界サイズよりも小さく、それに応じてプレーン又はダイの信頼性を確保するには不十分であると決定する。その次に、ストレージ装置１１０は、不良ブロック管理がもはや遂行されていないと決定して、読み取り専用モードに切り替える。読み取り専用モードの動作は、以下で詳細に説明する。本明細書で使用するように、「データ項目（ｄａｔａｉｔｅｍ）」は、１つの動作で処理される任意の量のデータであり、例えばコードブロックをデコーディングした結果のデータはデータ項目である。

ケース４は、ライトスルー（ｗｒｉｔｅ－ｔｈｒｏｕｇｈ）モードでストレージ装置１１０を動作させることによって緩和される任意の障害状態である。例えば、ストレージ装置１１０の電源バックアップキャパシタが故障した場合、装置は、ホストから受信された任意の書き込みコマンドに応答して、コマンドの完了をホスト１０５に送る前にストレージ媒体１２５への書き込みを完了するため、ストレージ媒体１２５への書き込みが完了する前に電源が故障した場合、ホストは、記録が正常に完了したことを誤って通知されることがない。ライトスルーモードで動作することは、性能の低減をもたらす（スループットとレイテンシの側面から）。

ケース５は、電力損失を減少させる方法でストレージ装置１１０を作動させることによって緩和される任意の障害状態である。例えば、温度センサーの障害の場合、ストレージ装置１１０は、上述したように読み取り専用モードで動作するか、又は動作（例えば、読み取り動作よりももっと多くの電力を消費する書き込み操作）が遂行される速度を減少させて、ストレージ装置１１０での電力損失を低減させる。例えば、ストレージ装置１１０は、ストレージ媒体に対する１番目の書き込みを遂行した後、減少した性能に対応する間隔（待機のために書き込み操作が遂行される速度が減少する）の間に待機し、その後ストレージ媒体に他の書き込み（例えば、１秒）を遂行する。

ケース６は、ストレージ装置１１０を読み取り専用モードで動作させることによって緩和され、ストレージ媒体１２５を再フォーマットすることがフル機能を復元する任意の障害状態である。図２Ａのテーブルの３番目のカラムは、各々の場合に対して有効なユーザーデータが利用可能であるか否か、及びストレージ装置１１０は、例えばストレージ媒体１２５を再フォーマットすることでフル機能にリターン（回復）するか否かを示す。

図２Ａにリストされたケースによって例示されるように、いくつかの実施形態で、３つのレベルの障害復元性（障害回復力）、即ち完全回復（復元）モード、部分回復（復元）モード、及び脆弱モードは、ストレージ装置１１０によって達成される。完全（フル）回復（復元）モードで、ストレージ装置１１０は、「自己回復」機能で動作し、ストレージ装置１１０は、パワーサイクリング（ｐｏｗｅｒｃｙｃｌｉｎｇ）又はストレージ媒体１２５のフォーマットのような動作を再設定することで、フル機能（装置からユーザーデータが失われることがあるとしても）を復元することができる。

部分的な回復（復元）モードで、ストレージ装置１１０は、障害状態が存在する場合、より低い性能、より小さい容量又は減少した機能で動作する。例えば、上述したように、電源バックアップキャパシタが故障すると、データがストレージ媒体１２５に記録された後にのみ（即ち、同期式書き込みが行われる）、全ての書き込みが完了し（即ち、コマンド完了がホスト１０５に送られる）、それに応じてストレージ装置１１０の動作を遅らせ、その性能を低下させる。このような状況で、ユーザーデータは保存される。ストレージ装置１１０は、ＲＴＢＢ（ｂａｄｂｌｏｃｋｍａｎａｇｅｍｅｎｔｒｕｎｔｉｍｅｂａｄｂｌｏｃｋ）のための予備スペースが消尽されると、より小さな容量で動作する。このような状況で、ストレージ装置１１０の影響を受けるダイは、ディスクスペースから除外され、全体のディスク容量が減少する。失われたスペースのユーザーデータが失われる。例えば、ＩＯ決定論（ＩＯｄｅｔｅｒｍｉｎｉｓｍ）のセット又はゾーニングされた名前空間（ｎａｍｅｓｐａｃｅ）のゾーンが、もはや新たなデータの書き込みを許容することができない場合、セット又はゾーンがディスクスペースから除外されるが、残りのディスクスペースは、読み取り及び書き込みの動作に対して使用可能な状態になる。ゾーン又はセットのユーザーデータが失われる。

ストレージ装置１１０が書き込み動作を許容せずに、読み取り専用モードに切り替わる場合、ストレージ装置１１０は、減少した機能で動作する。ストレージ装置１１０は、２つのタイプの読み取り専用モード、即ち持続可能な読み取り専用モード（「１番目の読み取り専用モード」と呼ばれる）及び持続不可能な読み取り専用モード（「２番目の読み取り専用モード」と呼ばれる）で動作する。持続可能な読み取り専用モードで、ストレージ装置１１０は、ストレージ媒体１２５の保存期間を超えて読み取り要請をサービスし続ける。持続可能な読み取り専用モードで動作することが実現可能でない場合、例えばレスキュースペースを設定するために使用されていないストレージ空間が十分でない場合、持続不可能な読み取り専用モードが使用される（以下、詳細に説明する）。持続不可能な読み取り専用モードに切り替えるとき、ストレージ装置１１０は、ストレージ装置１１０が第２（持続不可能な）読み取り専用モードで動作しており、ストレージ装置１１０に格納されたデータ項目が満了（例えば、そのそれぞれの保存期間が終了）することが許容されるという通知をホスト１０５に送る。持続不可能な読み取り専用モードで、ストレージ装置１１０は、ストレージ媒体１２５の保存期間中に継続して読み取り要請に対してサービスするが、ストレージ装置１１０がデータのインテグリティ問題（例えば、読み取り動作中のデータをデコーディングする１つ以上失敗した試行によって検出される）に遭遇すると、ストレージ装置１１０は、有効ではないデータ領域を報告する。脆弱モードで動作するストレージ装置１１０は、上述したように、読み取り又は書き込みの操作（動作）を遂行することができず、正常な終了（ｇｒａｃｅｆｕｌｅｘｉｔ）を遂行して、ホストからのコマンドを受信し続けてエラーをリターンする。

一実施形態で、（ｉ）遂行スペース（Ｐ）、（ｉｉ）性能低下スペース（ＵＰ）、（ｉｉｉ）読み取り専用スペース（ＲＯ）、（ｉｖ）揮発性読み取り専用スペース（ＶＲＯ）、及び（ｖ）アクセス不可能スペース（ＩＡ）と呼ばれる５つの論理ブロックアドレス（ＬＢＡ）のスペースタイプが定義される。遂行（Ｐ）スペースは、性能の犠牲なしに正常の方法で読み書きできる有効なデータを含むＬＢＡスペースである。性能低下（ＵＰ）スペースは、正常の方法で読み書きすることができるが、性能が低下した（例えば、低下した書き込みの性能）有効なデータを含むＬＢＡスペースである。読み取り専用（ＲＯ）スペースは、読み取り専用の有効なデータを含むＬＢＡスペースである。ストレージ装置１１０は、このようなタイプのＬＢＡスペースに向かうホストからの書き込みコマンドに対してエラーメッセージで応答する。読み取り専用スペースのデータは、保存期間を超える期間の間、有効である。揮発性読み取り専用（ＶＲＯ）スペースは、読み取り専用であり、ストレージ装置１１０は、このようなタイプのＬＢＡスペースに向かうホストからの書き込みコマンドに対してエラーメッセージで応答する。このようなタイプのＬＢＡスペース上にあるデータは、一時的に有効であり、有効期限が切れると、即ちストレージ媒体１２５内のデータの年齢がストレージ媒体１２５の保存期間に達すると、無効になる。アクセス不可能（ＩＡ）スペースは、ホストからアクセスができない有効ではないデータを含むＬＢＡスペースである。図２Ｂのテーブルは、上記テーブルの１番目のカラムで識別され、障害状態の各々でストレージ装置１１０に存在するＬＢＡスペースのタイプの組み合わせを示す。アスタリスク（＊）で識別されるモードは、ＬＢＡスペースに対する詳細な情報を検索するために、ホストが特徴獲得コマンド（ｇｅｔｆｅａｔｕｒｅｃｏｍｍａｎｄ）を使用することを支援する。図２Ｃは、ストレージ装置１１０にその状態及び関連するパラメータの値についてストレージ装置１１０にクエリ（ｑｕｅｒｙ）するために、ストレージ装置１１０に伝達される「特徴獲得」コマンドの議論を示す（「ＩＯＰＳ」は、毎秒入力及び出力の動作を意味する）。

図２Ｄのテーブルは、ホスト１０５がストレージ装置１１０にその状態についてクエリするために使用できるＮＶＭｅ（ｎｏｎｖｏｌａｔｉｌｅｍｅｍｏｒｙｅｘｐｒｅｓｓ）コマンドと、ストレージ装置１１０が障害回復特徴のカテゴリ内で応答するために使用できるリストされた定数（ｅｎｕｍｅｒａｔｅｄｃｏｎｓｔａｎｔｓ）の階層構造とを示している。

図３Ａは、本発明の一実施形態による障害回復力のあるストレージ装置の動作の第１方法に対するフローチャートであり、いくつかの実施形態で、障害回復モードで動作する方法を示す。３０５段階で、ホスト１０５は、ストレージ装置との間でデータを送信又は受信し、３１０段階で、ホスト１０５は、ストレージ装置でエラーが発生したか否かを決定し、３１５段階で、ストレージ装置１１０は、内部診断を遂行してその障害復元状態（例えば、完全（ｆｕｌｌ）復元、部分復元、又は脆弱モード）を決定し、３２０段階で、ストレージ装置１１０は、診断に基づいて、その性能、容量、機能（ｃａｐａｂｉｌｉｔｙ）（例えば、読み取り専用モードへの移行）を変更し、３２５段階で、ストレージ装置１１０は、アプリケーション・プログラミング・インターフェース（ＡＰＩ）に基づいて、ホスト１０５からの要請に応じて状態を掲示し、３３０段階で、ホスト１０５は、状態に基づいて、与えられた帯域幅で所定のタイプのデータをストレージ装置１１０又は他のストレージ装置１１０にルーティングする。図３Ｂは、本発明の一実施形態による障害回復力のあるストレージ装置の動作の第２方法に対するフローチャートであり、障害回復モードで動作する方法の詳細を示す。方法は、３３５段階で、ストレージ装置は、ストレージ装置が電源をパワーサイクリング（ｐｏｗｅｒｃｙｃｌｉｎｇ）するか又はストレージ媒体をフォーマットすることにより、回復が可能な第１障害状態にあることを決定し、３４０段階で、ストレージ装置は、ストレージ装置が減少した性能で、減少した容量で、又は読み取り専用モードでストレージ装置を動作させることによって、部分復元可能な第２障害状態にあることを決定し、３４５段階で、減少した性能で、減少した容量で、又は読み取り専用モードでストレージ装置を動作させる。

ここに開示した実施形態に対する多数の実施形態及び変形がまた構成される。ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）やエンベデッドプロセッサは、内部ブロックのチェックを遂行して、ストレージ装置１１０の状態に対する非同期アップデートをホスト１０５に送る。イベントが発生して、ホスト１０５に送信される（例えば、温度や装置内部の他のパラメータ）。ホスト１０５は、通知を提供するための装置ドライバの特徴が存在しない場合、所定のスケジュールに基づいてストレージ装置１１０をポーリングする。ＦＰＧＡやエンベデッドプロセッサは、ストレージ装置１１０の履歴性能をモニタリング（監視）し、マシンラーニングを使用して予測分析（例えば、与えられた障害回復状態にある可能性）を提供する。コマンドがＮＶＭｅ仕様に導入され、例えばＮＶＭｅ仕様の遠隔測定情報が（ストレージ装置１１０の状態を報告するために）拡張される。一実施形態は、例えばイーサネット（登録商標）ストレージ装置又はキーバリュー（ＫＶ）ストレージ装置で具現化される。

一実施形態で、ホストは、（ｉ）ストレージ装置１１０の状態（例えば、イメージ、ビデオ、テキスト、又は高い優先順位若しくは低い優先順位データのようなファイルタイプ）に基づいて異なるデータタイプを送信し（例えば、部分的に脆弱なモードで考えられている装置には、高い優先順位データやリアルタイムデータが記録されないことがある）、（ｉｉ）ストレージ装置１１０が部分的に脆弱な状態でより低い性能状態にある場合、送信速度を減少させ、（ｉｉｉ）ストレージ装置１１０が部分的に脆弱で低い容量状態にある場合、減少したデータの総量を送信し、（ｉｖ）ストレージ装置１１０が部分的に脆弱で持続不可能な読み取り専用モードにある場合、最大速度でデータを読み取り、データを別の場所に格納して保存期間を超えないようにし（このような状況で、ホストは、コピーするデータの量及び保存期間に基づいて、必要なデータレートを計算する）、（ｖ）データがエラーを有するため、脆弱なストレージ装置１１０からデータの「読み取り」を無視し、ホスト１０５によって受信されたデータを簡単に削除し、（ｖｉ）ホストとストレージ装置１１０との間でこのようなイベントのタイミングを制御するメッセージに基づいて、パワーサイクリング又はフォーマットされた完全復元ストレージ装置１１０のキャッシュに読み取り／書き込みの入力及び出力を一時的に再ルーティングする。容量が減少した部分的に脆弱なＳＳＤ上のＦＰＧＡは、入ってくるデータの書き込みをフィルタリングしてそのデータの一部だけをストレージ装置１１０に書き込む。いくつかの場合で、フィルタリングは、圧縮を含む。このようなＦＰＧＡは、ホスト１０５から多様な種類のデータ（例えば、イメージ、ビデオ、テキスト、又は高い優先順位若しくは低い優先順位データのようなファイルタイプ）を受信してストレージ装置１１０の状態に応じてフィルタリングする。例えば、ＦＰＧＡは、部分的に脆弱なモードにあるストレージ装置１１０に高い優先順位のデータが記録されてはいけないと決定する。ＦＰＧＡは、拒否メッセージをホスト１０５に送信し、拒否の理由を提供する。代替的に、ＦＰＧＡは、部分復元の低容量の状態ストレージ装置１１０に記録するための特定のタイプのデータ（例えば、イメージデータ）をフィルタリングする。例えば、ストレージ装置１１０が、性能を失う場合（例えば、減少した書き込み速度で動作）、レイテンシに敏感な（ｌａｔｅｎｃｙ－ｓｅｎｓｉｔｉｖｅ）読み取り及び書き込みが拒否される。

一実施形態で、上述したように、ストレージ装置１１０は、「持続可能な」（又は「第１」）読み取り専用モード及び「持続不可能な」（又は「第２」）読み取り専用モードと呼ばれる２つの読み取り専用モードのうちのいずれか１つで動作する。持続不可能な読み取り専用モードで、ストレージ装置１１０は、ホスト１０５から受信する任意の書き込みコマンドを単に拒否し、（ｉ）有効期限が切れていないデータに対する読み取りコマンドを実行するか又は（ｉｉ）全ての読み取りコマンドを実行しようと試み、それに応じて、デコーディングが成功しなかった場合、成功的なデコーディングの試みによって発生したデータ及びエラーコード（データ項目が読み取られないことを示すインディケーション、例えば０）をリターンする。

持続可能な読み取り専用モードで、ストレージ装置１１０は、ストレージ媒体１２５の保存期間を超えて外部の読み取り要請に対してサービスを提供する。ストレージ装置１１０は、ホスト１０５からの任意の書き込みコマンドに応答して、エラーメッセージをリターンすることを除いては、いかなる措置も取ることができないが、以下で説明するように、内部目的のためにストレージ媒体１２５に書き込みを行う。保存期間後のデータ保存を可能にするために、ストレージ装置１１０は、満了期限が間近に迫ったデータ（例えば、保存媒体１２５の保存期間に基づいて臨界年齢（例えば、ストレージ媒体１２５の保存期間の８０％）を超える年齢を有するデータ）を移動するスペースに「レスキュースペース」と呼ばれるスペースを割り当て、それに応じて、データの満了はレスキュースペースの保存期間だけ延期される。レスキュースペースのデータは、有効期限が切れる予定の場合、データの損失を防止するために、必要に応じて頻繁にレスキュースペース内で再び移動される。いくつかの実施形態で、ストレージ装置１１０は、例えばこのような移動を遂行するために低負荷（ｌｏｗｌｏａｄ）期間を利用して満了の前にデータを移動させる。上述したように、持続可能な読み取り専用モードへの移行は、不良ブロック管理の予備スペースの枯渇によりトリガーされる。このような状況で影響を受けるプレーン又はダイは、読み取り専用になり、ここに格納された全てのデータがレスキュースペースに再配置されると、ストレージ装置１１０の物理アドレスのスペースから除外される。

ストレージ装置１１０は、全体のＬＢＡスペースに亘って、ホスト１０５からの読み出しコマンドに応答する。ストレージ装置１１０の物理的スペースが減少するが（例えば、ストレージ媒体１２５の一部が読み取り専用になって、そのデータがレスキュースペースに移動されているため（又は移動されたため））、装置の論理スペースは変更されないため、ホスト１０５がＰＢＡ（ＰｈｙｓｉｃａｌＢｌｏｃｋＡｄｄｒｅｓｓ）スペースにマッピングすることができないＬＢＡスペース内で読み取りコマンドを送信すると、ストレージ装置１１０は、０（ｚｅｒｏ）をリターンする。

レスキュースペースは、オーバープロビジョニングスペース、又はストレージ装置１１０の未使用スペースから割り当てられる。ＩＯ決定論のセット又はゾーニングされた名前空間のゾーンが書き込み可能でない場合、全てのデータが再配置されると、そのセット又はゾーンが読み取り専用になって物理アドレスのスペースから除外される。レスキュースペースは名前空間を使用して動的に生成される。１つ以上の名前空間がユーザーデータに使用され、追加の名前空間がレスキュースペースのために生成される。ストレージ装置１１０が持続可能な読み取り専用モードに切り替えると、ユーザーデータのための１つ以上の名前空間は、サイズが減少し、レスキュースペースのための名前空間のサイズが増加する。

障害に影響を受けるストレージ媒体１２５の領域（例えば、不良ブロック管理の予備スペースが使いつくされた領域）のサイズが、利用可能なレスキュースペースのサイズを超えると、ストレージ装置１１０は、最も早く満了するデータ（例えば、最も古いデータ）のみを移動するか、重要な又は所定のファイルタイプ（例えば、イメージ、ビデオ、ドキュメント）に関連するものとしてタグ付けされたデータのみを移動するか、又は隣接するタイプ（ｃｏｎｔｉｇｕｏｕｓｔｙｐｅ）のデータ（例えば、ファイルに関連する全てのデータ）を移動し、他のデータを残しておく。重要であると考えられているファイルタイプのセットは、ユーザーが構成することができる。ＫＶストレージ装置１１０を使用している一実施形態で、データの重要度は、キーバリューのペア（ｋｅｙｖａｌｕｅｐａｉｒｓ）で圧縮又はエンコーディングされる。

一実施形態で、ストレージ装置１１０は、利用可能なレスキュースペースの量が臨界サイズよりも小さく、それに応じて持続可能な読み取り専用モードでの動作をサポートするのに不十分であると決定し、その結果、ストレージ装置１１０は、持続不可能な読み取り専用モードに切り替える。このような決定は、障害が最初に感知されるときに行われるか、又は障害が最初に感知されるときにストレージ装置１１０が最初に持続可能な読み取り専用モードに切り替え、一定時間後にレスキュースペースが、利用可能なレスキュースペースが臨界サイズ未満に減少するほど消費され（例えば、ストレージ媒体１２５の障害部分でのデータの継続的な満了によって）、ストレージ装置１１０は、持続可能な読み取り専用モードから持続不可能な読み取り専用モードに切り替える。持続可能な読み取り専用モードから持続不可能な読み取り専用モードに切り替えるとき、ストレージ装置１１０は、ホスト１０５に、このような転換を通知し、ホスト１０５は、データが満了する前に、ストレージ装置から他のストレージ装置に可能な限り多くのデータをコピーしようと試みる。

場合によって、データは一日や１時間の期間を超えて失われることがある。このように、ストレージ装置１１０のＦＰＧＡは、ストレージ装置１１０が持続可能な読み取り専用モードに切り替えるときに、移転（ｔｒａｎｓｆｅｒ）を容易にするために、ドライブ上のデータの属性（例えば、古くなった、タグ付けされた連続の又はファイルタイプの）をモニタリング（監視）する。ＦＰＧＡは、優先順位に基づいてデータをキュー（ｑｕｅｕｅ）に入れるか、又はレスキュースペースに移転するデータを整理し（ｏｒｄｅｒ）、データがレスキュースペースに移動するときにデータを圧縮する。一実施形態は、例えばイーサネット（登録商標）ストレージ装置又はキーバリュー（ＫＶ）ストレージ装置で具現化される。

図４は、本発明の一実施形態によるストレージ装置の概略的なデータレイアウト図であり、いくつかの実施形態におけるストレージ装置１１０の概略的なデータレイアウト図を示す。ブロック寿命テーブル４０５は、ストレージ装置１１０の各ブロックの保存期間をリストし、マッピングテーブル４１０は、論理ブロックアドレスから物理ブロックアドレスへのマッピングをリストする。ストレージ装置１１０が持続可能な読み取り専用モードに切り替えるときに、ストレージ装置１１０は、障害のある使用スペース４１５（障害状態によって影響を受ける物理スペース）のデータをレスキュースペース４２０にコピーする。正常の使用スペース４２５のデータは、ストレージ装置１１０が（持続可能な読み取り専用モードにある代わりに）正常の動作モードにあったかのように処理される。障害状態は、物理スペースの損失をもたらすため、使用されたＬＢＡスペース４３０のサイズが対応して減少し、前に利用可能だったＬＢＡスペースの一部は、未使用のＬＢＡスペース４３５になる。コントローラ１２０によって実行されるファームウェア４４０は、上述したように、データが移動されてテーブルがアップデートされる。

図５Ａは、本発明の一実施形態による障害回復の読み取り専用モードでストレージ装置の動作の第１方法に対するフローチャートであり、いくつかの実施形態で、持続可能な読み取り専用モードに切り替える方法を示す。５０５段階で、ホスト１０５は、ストレージ装置との間でデータを送受信し、５１０段階で、ホスト１０５は、ストレージ装置でエラーが発生したか否かを決定し、５１５段階で、ストレージ装置１１０は、内部診断を遂行して持続可能な読み取り専用モードに転換し、５２０段階で、選択的にＦＰＧＡはストレージ装置１１０上の有効なデータ属性（ｎａｔｕｒｅ）を（例えば、データタイプ又は年齢に基づいて）モニタリングし、５２５段階で、ストレージ装置１１０は、データの年齢が保存期間に近づくと、有効なデータをレスキュースペースに再配置し、５３０段階で、選択的にストレージ装置１１０は、レスキュースペースの状態及び内容に対する情報を、データをフラッシュ（ｆｌｕｓｈ）するホスト１０５に送る。図５Ｂは、本発明の一実施形態による障害回復の読み取り専用モードでストレージ装置の動作の第２方法に対するフローチャートであり、持続可能な読み取り専用モードで動作する方法の詳細を示す。方法は、５３５段階で、ストレージ装置は、第１読み取り専用モードでストレージ装置を動作させることにより、ストレージ装置が部分復元可能な障害の状態にあることを決定し、５４０段階で、ストレージ装置のページに格納された第１データ項目の年齢が臨界年齢を超えたことを決定し、第１データ項目をストレージ装置のレスキュースペースにコピーすることにより、ストレージ装置を第１読み取り専用モードで動作させる。

一実施形態で、上述したように、ストレージ装置１１０のアレイ及びボリュームマネージャー１１５を含むＲＡＩＤ－０システムは、ＲＡＩＤ－０システムのストレージ装置１１０のいずれか１つを読み取り専用モード（例えば、持続可能な読み取り専用モード）への移行を収容するように構成される。正常の動作で、ボリュームマネージャー１１５は、ストレージ装置１１０のアレイに亘ってデータをストライピングする（ｓｔｒｉｐｉｎｇ）責任があり、例えばストレージ装置１１０のアレイのそれぞれのストレージ装置１１０に各ストライプ（各ストライプは、このようなストリップで構成される）のいずれか１つのストリップを書き込む責任がある。このようなシステムで、ストレージ装置１１０のアレイのうちの任意のストレージ装置が読み取り専用モード（又は「読み取り専用状態」）に移行するとき、ＲＡＩＤ－０システムは動作モード（「エマージェンシーモード」と呼ばれる）に転換し、ストレージ装置１１０のアレイのためのボリュームマネージャー１１５は、（ｉ）障害のあるストレージ装置１１０からメタデータ及び回復されたユーザーデータに対して残りの影響を受けないストレージ装置１１０（読み取り／書き込みの状態にある）の各々にレスキュースペースを割り当て、（ｉｉ）マッピングテーブル（「エマージェンシーマッピングテーブル」と呼ばれる）を維持する。各ストレージ装置１１０上のレスキュースペースは、ｎ個のストリップを格納する。ここで、ｎ＝Ｒ／（ストリップサイズ）、Ｒ＝Ｃ／Ｍ、Ｃは、ストレージ装置１１０のアレイのストレージ装置の各々の容量である。ボリュームマネージャー１１５は、ホストで（例えば、ハードウェア、ソフトウェア、ファームウェア、又はハードウェア、ソフトウェア及びファームウェアの組み合わせで）、又はＲＡＩＤ－０システムのレイドコントローラ（例えば、ホストとは別途のエンクロージャー（筐体）に収容される）で具現化される。いくつかの実施形態で、ボリュームマネージャー１１５は、ＦＰＧＡで具現化される。ＲＡＩＤ－０システムは、自己完結型であり、ホストの観点から、ＲＡＩＤ－０システムが単一のストレージ装置１１０のように動作するようにストレージ装置１１０のアレイを仮想化する。一般的に、ボリュームマネージャーは、ボリュームマネージャーによって遂行されるものとして、ここで説明する動作を遂行するように（例えば、適切なソフトウェア又はファームウェアによって）構成される処理回路（以下、詳細に説明する）である。

ＲＡＩＤ－０システムがエマージェンシーモードで動作しており、ホスト１０５から書き込みコマンドが受信されてストレージ装置１１０のアレイにストライプを書き込むことを要求する場合、ボリュームマネージャー１１５は、緊急（エマージェンシー）時のマッピングテーブルを確認してストライプが「登録されたか否か」を判定する。即ちエントリがストライプに対して既に作成されたか否かを判定する。まだエントリが生成されていない場合（即ち、ストライプが「オープンマッピングされた（ｏｐｅｎｍａｐｐｅｄ）」、即ち登録されていない場合）、ボリュームマネージャー１１５は、通常障害のあるストレージ装置１１０（読み取り専用モードに転換されたストレージ装置１１０）に書き込まれるストリップが、書き込まれる位置をインディケート（表示）するためにエマージェンシーマッピングテーブルにエントリを生成する。エマージェンシーマッピングテーブルが既にストライプに対するエントリを含む場合、エントリは、通常障害のあるストレージ装置１１０に書き込まれるストリップが書き込む位置を決定するために使用される。図６Ａは、本発明の一実施形態による書き込み動作を遂行するＲＡＩＤ－０システムの概略的なデータレイアウト図である。どのような場合でも、ボリュームマネージャー１１５は、図６Ａに示すように、ストレージ装置１１０のアレイに各ストリップを記録することで、通常障害のあるストレージ装置１１０に書き込まれるストリップ６０５を他のストレージ装置１１０のレスキュースペースに記録する。

読み取りコマンドが受信されてストレージ装置１１０のアレイからストライプを読み取ることを要求する場合、ボリュームマネージャー１１５は、エマージェンシー（緊急）時のマッピングテーブルを確認して、エントリがストライプに対して作成されたか否かを判定する。図６Ｂは、本発明の一実施形態による読み取り動作を遂行するＲＡＩＤ－０システムの概略的なデータレイアウト図である。エントリが全く作成されていない場合、図６Ｂに示すように、ボリュームマネージャー１１５は、正常な動作で障害のあるストレージ装置１１０を含むストレージ装置１１０の各々からストリップを読み取るようにストライプを読み取る。エマージェンシーマッピングテーブルがストライプに対するエントリを含む場合、エントリは、通常障害のあるストレージ装置１１０から読み込まれるストリップが読み取る位置を決定するのに使用される。

通常障害のあるストレージ装置１１０に書き込まれるストリップの再マッピングは、例えば次のように達成される。ストレージ装置１１０のアレイの各ストレージ装置１１０は、０とＭ－１との間の数字であるドライブの識別番号（又は「ドライブＩＤ」）を有する。ここで、Ｍはストレージ装置１１０のアレイ内のストレージ装置１１０の個数である。ボリュームマネージャー１１５は、ドライブの識別番号を再び割り当てる。例えば、登録されたストライプ（登録されていないストライプに対する読み取り動作は、元のドライブの識別番号を使用し続けることができる）への読み取り又は書き込みの動作を遂行するのに使用される代替のドライブの識別番号をストレージ装置１１０のアレイの各ストレージ装置１１０に割り当てる。次の式を使用して代替のドライブの識別番号を生成する。

ドライブＩＤ＜障害のあるドライブＩＤである場合

新たなドライブＩＤ＝ドライブＩＤ

そうでない場合、

新たなドライブＩＤ＝（（ドライブＩＤ－１）＋（Ｍ－１））ｍｏｄ（Ｍ－１）

この公式の効果に応じて、（ｉ）障害のあるストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置にそれぞれの元のドライブの識別番号を割り当て、（ｉｉ）第１ストレージ装置の元ドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に１よりも小さいそれぞれの元のドライブの識別番号を割り当てる。

代替のドライブ番号を使用して、通常障害のあるストレージ装置１１０に書き込まれるストリップが書き込まれるターゲットドライブは、公式「ターゲットドライブＩＤ（ＴａｒｇｅｔＤｒｉｖｅＩＤ）＝ｓｉｄ％（Ｍ－１）を使用して識別される。ここで、ターゲットドライブＩＤはターゲットドライブの代替のドライブの識別番号であり、ｓｉｄは通常障害のあるストレージ装置１１０に書き込まれるストリップのストリップ識別子であり、「％」はモジュロ演算子（ｍｏｄｕｌｏｏｐｅｒａｔｏｒ）である。

図６Ｃは、本発明の一実施形態による再マッピング（ｒｅｍａｐｐｉｎｇ）と書き込み動作を遂行するＲＡＩＤ－０システムの概略的なデータレイアウト図であり、ドライブ１が読み取り専用モードに転換された４つのストレージ装置１１０（即ち、Ｍ＝４）を有するＲＡＩＤ－０システムを示す。スとライプ１が書き込まれるターゲットドライブＩＤは、次の式によって暗示的に決定される。

ターゲットドライブＩＤ＝ストリップＩＤ％（Ｍ－１）＝１、

即ち、ターゲットドライブは、代替のドライブの識別番号１（即ち、ドライブ２）を有するストレージ装置１１０である。ドライブ内において、レスキュースペースは、ストリップサイズと同じサイズのストリップ（「レスキューストリップ」又は「Ｒ－ストリップ」と呼ばれる）に分割される。エマージェンシーマッピングテーブルは、エントリ（１、０）（１番目のエレメント（要素）がストライプＩＤ（ストライプ１）であり、２番目の要素がターゲットドライブのＲ－ストリップＩＤである）を含む。従って、エマージェンシーマッピングテーブルのエントリ（１、０）は、ストリップ（１、１）がＲ－ストリップ（１、０）にマッピングされたことを意味する。

ＲＡＩＤ－０システムは、ストレージ装置１１０のアレイのうちの１つ以上によって、持続可能な読み取り専用モード又は持続不可能な読み取り専用モードへの移行を収容するように構成される。持続不可能な読み取り専用モードに切り替える場合、障害のあるストレージ装置１１０の登録されたストリップは、他の装置のレスキュースペースに永続的に書き込まれる。持続不可能な読み取り専用モードに切り替える場合、例えば障害のあるストレージ装置から全てのデータを移動するのに十分な速度で、ボリュームマネージャー１１５は、障害のあるストレージ装置１１０から影響を受けないストレージ装置１１０に、データの有効期限が切れる前に移動する。サーバーは、データ量及びデータ満了前の残り時間を基準に速度を計算する。

図７Ａは、本発明の一実施形態によるＲＡＩＤ－０ストレージシステムの動作の第１方法に対するフローチャートであり、ＲＡＩＤ－０システムを動作させる方法を示す。７０５段階で、ＲＡＩＤ－０システムのストレージ装置１１０は、障害を有して読み取り専用モードに切り替え、７１０段階で、影響を受けるストレージ装置１１０は、内部診断を遂行し、その障害回復状態が部分的に復元されて読み取り専用であると決定し、７１５段階で、ボリュームマネージャー１１５は、影響を受けるストレージ装置１１０が読み取り専用モードにあると決定して（「正常に機能する」）、影響を受けないストレージ装置のＩＤを再び割り当て、７２０段階で、ボリュームマネージャー１１５は、書き込み動作を受信し、影響を受ける装置のストリップがターゲット（影響を受けない）ストレージ装置１１０にリダイレクトされ（ｒｅｄｉｒｅｃｔｅｄ）、全体のストリップが影響を受けないストレージ装置の新たなドライブＩＤをベースにターゲット（影響を受けない）のレスキュースペースに書き込まれることを示すように一時的マッピングテーブルに対するエントリを追加し、７２５段階で、ボリュームマネージャー１１５は、ホスト１０５から読み取りコマンドを受信し、影響を受けるストレージ装置のストリップをターゲット（影響を受けない）ストレージ装置のレスキュースペースから読み取りながらＲＡＩＤシステムの正常に機能する影響を受けないストレージ装置１１０からストライプの全てのストリップを読み取る。

図７Ｂは、本発明の一実施形態によるＲＡＩＤ－０ストレージシステムの動作の第２方法に対するフローチャートであり、ＲＡＩＤ－０ストレージシステムを動作させる方法の詳細を示す。方法は、７３０段階で、第１ストレージ装置が読み取り専用の状態にあり、第２ストレージ装置が読み取り／書き込みの状態にあると決定し、７３５段階で、第１ストライプの一部を第２ストレージ装置に書き込み、第１ストライプに対するマッピングテーブルにエントリを生成することにより、ストレージシステムに対する第１ストライプの書き込み動作を遂行し、７４０段階で、第１ストレージ装置及び第２ストレージ装置から第２ストライプの一部を読み取ることにより、ストレージシステムからの第２ストライプの第１読み取り動作を遂行し、７４５段階で、マッピングテーブルが第１ストライプに対するエントリを含むことを決定し、第２ストレージ装置から第１ストライプの一部を読み取ることにより、ストレージシステムから第１ストライプの第２読み取り動作を遂行する。

ホスト１０５又はコントローラ１２０のような本明細書で説明した多様な装置は、処理回路であるか又は処理回路を含む。本明細書で、用語「処理回路」又は「コントローラ手段」は、データ又はデジタル信号を処理するのに採用されるハードウェア、ファームウェア、及びソフトウェアの任意の組み合わせを意味するために使用される。処理回路のハードウェアには、例えば特定用途向け集積回路（ＡＳＩＣ）、汎用又は特殊目的の中央処理装置（ＣＰＵ）、デジタル信号プロセッサ（ＤＳＰ）、グラフィックス処理装置（ＧＰＵ）、及びフィールドプログラマブルゲートアレイ（ＦＰＧＡ）のようなプログラマブルロジック装置を含む。処理回路で、本明細書で使用されるように、各機能は、その機能を遂行するように構成される。即ちハードワイヤードの（ｈａｒｄ－ｗｉｒｅｄ）ハードウェアによって、又は非一時的ストレージ媒体に格納されたコマンドを実行するように構成されるＣＰＵのようなより汎用のハードウェアによって遂行される。処理回路は、単一の印刷回路基板（ＰＣＢ）上で製作されるか、又は１つ以上の相互連結されるＰＣＢの上で分布される。処理回路は、他の処理回路を含み、例えば処理回路は、ＰＣＢ上の相互連結される２つの処理回路、即ちＦＰＧＡ、ＣＰＵを含む。

本明細書で使用されるように、「～の一部」は、物体の「少なくとも一部」を意味し、従って物体の全部又は全部よりも少ないことを意味する。このように、物体の「一部」は、物体全体を特別な場合として含む。即ち、物体全体が物体の一部に対する一例である。ここで使用される用語「又は」は、「及び／又は」として解釈されるべきであり、例えば「Ａ又はＢ」は、「Ａ」、「Ｂ」、又は「Ａ及びＢ」のうちのいずれか１つを意味する。

明細書の背景のセクションで提供される背景は、脈絡（コンテキスト）を設定するためにのみ含まれており、このセクションのコンテンツは、従来技術であると認められない。説明される任意のコンポーネント又はコンポーネントの任意の組み合わせ（例えば、ここに含まれる任意のシステム図で）は、ここに含まれる任意のフローチャートの動作のうちのいずれか１つを遂行するために使用される。なお、（ｉ）動作は、例としてのものであり、明示的にカバーされない多様な追加の段階を含み、（ｉｉ）動作の時間的順序は変更されることがある。

本明細書で使用されるように、方法（例えば、調整）又は第１数量（例えば、第１変数）が第２数量（例えば、第２変数）に「基づく」と言及する場合、これは、第２数量が方法に対する入力又は第１数量に影響を与えるが、例えば第２数量は第１数量を計算する関数への入力（例えば、唯一の入力又は１つ以上の入力のうちの１つ）であるか、第１数量は第２数量と同じ値を有するか又は第２数量と同じであり得る（例えば、メモリ内の同じ位置又は位置に格納される）。

但し、用語「第１」、「第２」、「第３」などが、本明細書では、多様なエレメント、構成要素、領域、レイヤー及び／又はセクションを説明するために使用されるが、これらのエレメント、構成要素、領域、レイヤー及び／又はセクションは、これらの用語により限定されないと理解されるだろう。これらの用語は、１つのエレメント、構成要素、領域、レイヤー、又はセクションを他のエレメント、構成要素、領域、レイヤー、又はセクションと区別するためにのみ使用される。従って、本明細書に記載された第１エレメント、構成要素、領域、レイヤー、又はセクションは、本発明の概念の技術的思想及び範囲を逸脱することなく、第２エレメント、構成要素、領域、レイヤー、又はセクションと称される。

「すぐ下（ｂｅｎｅａｔｈ）」、「下（ｂｅｌｏｗ）」、「下位（ｌｏｗｅｒ）」、「下部（ｕｎｄｅｒ）」、「上部（ａｂｏｖｅ）」、「上位（ｕｐｐｅｒ）」などのような空間的に相対的な用語は、説明の便宜のために、図面に示すような１つのエレメント、特徴の異なるエレメント又は特徴に対して存在する関係を説明するために使用される。そのような空間的に相対的な用語は、図面に示す方向に加えて、使用中又は動作中の装置の他の方向を含むように意図されたものであることを理解するはずである。例えば、図面の装置が裏返された場合、他のエレメント若しくは特徴の「下」、「下」、又は「すぐ下」として説明されたエレメントは、他の装置又は特徴の「上部」に向かうことになる。従って、例としての用語「下」及び「下部」は、上部及び下部の方向の両方を含む。装置は、別の方法で配置されることがあり（例えば、９０度回転されるか、又は他の方向に）、ここで使用された空間的に相対的な記述語（ｄｅｓｃｒｉｐｔｏｒ）は、それに応じて解釈されるべきである。更に、１つのレイヤーが２つのレイヤーの間にあるものとして述べられるときに、これは２つのレイヤーの間の唯一のレイヤーであるか、又は１つ以上の介在するレイヤー（ｉｎｔｅｒｖｅｎｉｎｇｌａｙｅｒｓ）が存在する可能性があることを理解するだろう。

本明細書で使用される用語は、特定の実施形態を説明するためのものであり、本発明を限定するものではない。本明細書で使用される用語「実質的に」、「約」、及びこれと類似した用語は、程度（ｄｅｇｒｅｅ）の用語ではなく、近似値の用語として使用され、当業者によって認知されることが可能な測定又は計算された値の固有な偏差を考慮するように意図されたものである。

本明細書で使用されているように、単数形「ａ」及び「ａｎ」は、文脈上明らかに別の意味を示していると判定されない限り、複数形も含むように意図される。本明細書で使用される場合、「含む（ｃｏｍｐｒｉｓｅｓ）」及び／又は「含んでいる（ｃｏｍｐｒｉｓｉｎｇ）」という用語は、言及する特徴、整数、段階、動作、エレメント、及び／又は構成要素（コンポーネント）の存在を特定するが、１つ以上の他の特徴、整数、段階、動作、エレメント、構成要素、及び／又はそのグループの存在若しくは追加を排除しないということも理解されるだろう。本明細書で使用される用語「及び／又は」は、１つ以上が関連してリストされた項目の１つ以上の任意且つ全ての組み合わせを含む。「の少なくとも１つ」のような表現は、エレメントのリストの前に来る場合、エレメントの全リストを変更し、リストの個々のエレメントを変更しない。なお、本発明の実施形態を説明する際に、「できる（ｍａｙ）」という用語は、「本発明の１つ以上の実施形態」を表す。また、「例としての」という用語は、例えば例又は例示を示すものであると意図される。本明細書で使用される「使用する（ｕｓｅ）」、「使用している（ｕｓｉｎｇ）」、「使用された（ｕｓｅｄ）」という用語は、それぞれ「活用する（ｕｔｉｌｉｚｅ）」、「活用している（ｕｔｉｌｉｚｉｎｇ）」、「活用された（ｕｔｉｌｉｚｅｄ）」という用語と同義語として見なされる。

コンポーネント又はレイヤーが、他の構成要素又はレイヤー「に位置する」、「に連結される」、「に結合される」、又は「に隣接する」と述べる場合、構成要素又はレイヤーが、他の構成要素又はレイヤーに直接位置するか、連結・結合されるか、又は隣接するものであり、１つ以上の介在する構成要素又はレイヤーが存在する。対照的に、構成要素又はレイヤーが、他の構成要素又はレイヤー「のすぐ上に」、「に直接連結される」、「に直接結合される」、又は「に隣接する」と述べる場合、介在する構成要素又はレイヤーが存在しない。

本明細書で引用された任意の数値範囲は、引用された範囲内に含まれる同じ数値精度の全てのサブ範囲を含むように意図される。例えば、「１．０～１０．０」の範囲や「１．０と１０．０の間」の範囲は、記載された最小値１．０と記載された最大値１０．０の間の（これらを含む）、即ち１．０以上の最小値と１０．０以下の最大値を有する全てのサブ範囲、例えば２．４～７．６の範囲を含む。本明細書に記載された任意の最大値の限定は、その中に含まれる全てのより低い数値限定を含むように意図され、本明細書に記載された任意の最小値の限定は、その中に含まれる全てのより高い数値限定を含むように意図される。

以上、本発明の実施形態について図面を参照しながら詳細に説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の技術的思想から逸脱しない範囲内で多様に変更実施することが可能である。

１０５ホスト
１１０ストレージ装置
１１５ボリュームマネージャー
１２０コントローラ
１２５ストレージ媒体
４０５ブロック寿命テーブル
４１０マッピングテーブル
４１５障害のある使用スペース
４２０レスキュースペース
４２５通常の使用スペース
４３０使用されたＬＢＡスペース
４３５未使用のＬＢＡスペース
４４０ファームウェア（Ｆ／Ｗ）

Claims

第１ストレージ装置及び第２ストレージ装置を含むストレージシステムを動作させる方法であって、
前記第１ストレージ装置が読み取り専用の状態にあり、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定する段階と
前記ストレージシステムに対する第１ストライプの書き込み動作を遂行する段階と、
前記ストレージシステムからの第２ストライプの第１読み取り動作を遂行する段階と、
前記ストレージシステムからの前記第１ストライプの第２読み取り動作を遂行する段階と、を有し、
前記書き込み動作を遂行する段階は、
前記第１ストライプの一部を前記第２ストレージ装置に書き込む段階と、
前記第１ストライプのためのマッピングテーブルにエントリを生成する段階と、を含み、
前記第１読み取り動作を遂行する段階は、前記第１ストレージ装置及び前記第２ストレージ装置から前記第２ストライプの一部を読み取る段階を含み、
前記第２読み取り動作を遂行する段階は、
前記マッピングテーブルが前記第１ストライプのためのエントリを含むことを決定する段階と、
前記第２ストレージ装置から前記第１ストライプの一部を読み取る段階と、を含むことを特徴とする方法。
前記ストレージシステムは、前記第１ストレージ装置及び前記第２ストレージ装置を含む複数のストレージ装置を含み、
前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定する段階は、前記第１ストレージ装置ではない、前記第２ストレージ装置を含む１つ以上の残りのストレージ装置が読み取り／書き込みの状態にあることを決定する段階を含み、
前記書き込み動作を遂行する段階は、前記残りのストレージ装置に前記第１ストライプを書き込む段階を含むことを特徴とする請求項１に記載の方法。
前記第１読み取り動作を遂行する段階は、
前記第２ストライプが前記複数のストレージ装置内でオープンマッピングされていることを決定する段階と、
前記複数のストレージ装置から前記第２ストライプを読み取る段階と、を含むことを特徴とする請求項２に記載の方法。
前記残りのストレージ装置にドライブの識別番号を再び割り当てる段階を更に含み、
前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、
前記再び割り当てる段階は、
前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当てる段階と、
前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てる段階と、を含むことを特徴とする請求項２に記載の方法。
前記第２読み取り動作を遂行する段階は、
前記残りのストレージ装置から前記第１ストライプを読み取る段階と、
前記マッピングテーブルに基づくアドレスでストレージ装置から前記第１ストライプのストリップを読み取る段階と、を含むことを特徴とする請求項２に記載の方法。
前記残りのストレージ装置にドライブの識別番号を再び割り当てる段階を更に含み、
前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、
前記再び割り当てる段階は、前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当てる段階を含むことを特徴とする請求項５に記載の方法。
前記再び割り当てる段階は、前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てる段階を更に含むことを特徴とする請求項６に記載の方法。
前記第１ストレージ装置の元のドライブの識別番号がｎであり、前記第１ストライプのストリップを読み取る段階は、再び割り当てられた前記識別番号ｎを有するストレージ装置から前記ストリップを読み取る段階を含むことを特徴とする請求項６に記載の方法。
データを格納するシステムであって、
第１ストレージ装置と、
第２ストレージ装置と、
前記第１ストレージ装置及び前記第２ストレージ装置に連結される処理回路と、を備え、
前記処理回路は、
前記第１ストレージ装置が読み取り専用の状態にあり、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定し、
第１ストライプの書き込み動作を遂行し、
第２ストライプの第１読み取り動作を遂行し、
前記第１ストライプの第２読み取り動作を遂行するように構成され、
前記書き込み動作を遂行することは、
前記第１ストライプの一部を前記第２ストレージ装置に書き込み、
前記第１ストライプのためのマッピングテーブルにエントリを生成することを含み、
前記第１読み取り動作を遂行することは、前記第１ストレージ装置及び前記第２ストレージ装置から前記第２ストライプの一部を読み取ることを含み、
前記第２読み取り動作を遂行することは、
前記マッピングテーブルが前記第１ストライプのためのエントリを含むことを決定し、
前記第２ストレージ装置から前記第１ストライプの一部を読み取ることを含むことを特徴とするシステム。
前記第１ストレージ装置及び前記第２ストレージ装置を含む複数のストレージ装置を含み、
前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定することは、前記第１ストレージ装置ではない、前記第２ストレージ装置を含む１つ以上の残りのストレージ装置が読み取り／書き込みの状態にあることを決定することを含み、
前記書き込み動作を遂行することは、前記残りのストレージ装置に前記第１ストライプを書き込むことを含むことを特徴とする請求項９に記載のシステム。
前記第１読み取り動作を遂行することは、
前記第２ストライプが前記複数のストレージ装置内でオープンマッピングされていることを決定し、
前記複数のストレージ装置から前記第２ストライプを読み取ることを含むことを特徴とする請求項１０に記載のシステム。
前記処理回路は、前記残りのストレージ装置にドライブの識別番号を再び割り当てるように更に構成され、
前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、
前記再び割り当てることは、
前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当て、
前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てることを含むことを特徴とする請求項１０に記載のシステム。
前記第２読み取り動作を遂行することは、
前記残りのストレージ装置から前記第１ストライプを読み取り、
前記マッピングテーブルに基づくアドレスでストレージ装置から前記第１ストライプのストリップを読むみ取ることを含むことを特徴とする請求項１０に記載のシステム。
前記処理回路は、前記残りのストレージ装置にドライブの識別番号を再び割り当てるように更に構成され、
前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、
前記再び割り当てることは、前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当てることを含むことを特徴とする請求項１３に記載のシステム。
前記処理回路は、前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てるように更に構成されることを特徴とする請求項１４に記載のシステム。
前記第１ストレージ装置の元のドライブの識別番号がｎであり、前記第１ストライプのストリップを読み取ることは、再び割り当てられた前記識別番号ｎを有するストレージ装置から前記ストリップを読み取ることを含むことを特徴とする請求項１４に記載のシステム。
データを格納するシステムであって、
第１ストレージ装置と、
第２ストレージ装置と、
前記第１ストレージ装置及び前記第２ストレージ装置に連結される処理手段と、を備え、
前記処理手段は、
前記第１ストレージ装置が読み取り専用の状態にあり、前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定し、
第１ストライプの書き込み動作を遂行し、
第２ストライプの第１読み取り動作を遂行し、
前記第１ストライプの第２読み取り動作を遂行するように構成され、
前記書き込み動作を遂行することは、
前記第１ストライプの一部を前記第２ストレージ装置に書き込み、
前記第１ストライプのためのマッピングテーブルにエントリを生成することを含み、
前記第１読み取り動作を遂行することは、前記第１ストレージ装置及び前記第２ストレージ装置から前記第２ストライプの一部を読み取ることを含み、
前記第２読み取り動作を遂行することは、
前記マッピングテーブルが前記第１ストライプのためのエントリを含むことを決定し、
前記第２ストレージ装置から前記第１ストライプの一部を読み取ることを含むことを特徴とするシステム。
前記第１ストレージ装置及び前記第２ストレージ装置を含む複数のストレージ装置を含み、
前記第２ストレージ装置が読み取り／書き込みの状態にあることを決定することは、前記第１ストレージ装置ではない、前記第２ストレージ装置を含む１つ以上の残りのストレージ装置が前記読み取り／書き込みの状態にあることを決定することを含み、
前記書き込み動作を遂行することは、前記残りのストレージ装置に前記第１ストライプを書き込むことを含むことを特徴とする請求項１７に記載のシステム。
前記第１読み取り動作を遂行することは、
前記第２ストライプが前記複数のストレージ装置内でオープンマッピングされていることを決定し、
前記複数のストレージ装置から前記第２ストライプを読み取ることを含むことを特徴とする請求項１８に記載のシステム。
前記処理手段は、前記残りのストレージ装置にドライブの識別番号を再び割り当てるように更に構成され、
前記複数のストレージ装置の各々は、元のドライブの識別番号を有し、
前記再び割り当てることは、
前記第１ストレージ装置の元のドライブの識別番号よりも小さい識別番号を有する各ストレージ装置に、それぞれの元のドライブの識別番号を割り当て、
前記第１ストレージ装置の元のドライブの識別番号よりも大きい識別番号を有する各ストレージ装置に、１よりも小さいそれぞれの元のドライブの識別番号を割り当てることを含むことを特徴とする請求項１８に記載のシステム。