JP2007087109A - ストレージ装置 - Google Patents
ストレージ装置 Download PDFInfo
- Publication number
- JP2007087109A JP2007087109A JP2005275053A JP2005275053A JP2007087109A JP 2007087109 A JP2007087109 A JP 2007087109A JP 2005275053 A JP2005275053 A JP 2005275053A JP 2005275053 A JP2005275053 A JP 2005275053A JP 2007087109 A JP2007087109 A JP 2007087109A
- Authority
- JP
- Japan
- Prior art keywords
- storage
- backup
- master
- storage component
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】 障害LUがバックアップLUとして使用可能になるまでの時間を短縮することができるストレージ装置を提供することである。
【解決手段】 同じRAIDレベルのHDDの集合であるRAIDグループを論理的に分割した記憶構成要素16を組み合わせてマスタLU13およびバックアップLU14を構成し、マスタLU13の中の記憶構成要素16a2に障害が発生したときはその障害状態の記憶構成要素16a2のみをストレージプール15の記憶構成要素16c2と交換し、バックアップLU14の記憶構成要素16b2と同期させる。これにより、障害LUがバックアップLUとして使用可能になるまでの時間を短縮する。
【選択図】 図1
【解決手段】 同じRAIDレベルのHDDの集合であるRAIDグループを論理的に分割した記憶構成要素16を組み合わせてマスタLU13およびバックアップLU14を構成し、マスタLU13の中の記憶構成要素16a2に障害が発生したときはその障害状態の記憶構成要素16a2のみをストレージプール15の記憶構成要素16c2と交換し、バックアップLU14の記憶構成要素16b2と同期させる。これにより、障害LUがバックアップLUとして使用可能になるまでの時間を短縮する。
【選択図】 図1
Description
本発明は、ホスト計算機からのデータを記憶するストレージ装置に関する。
ホスト計算機からのデータを記憶するストレージ装置として、同じRAID(Redundant array of inexpensive disks)レベルのHDD(Hard disk drive)の集合であるRAIDグループを論理的に分割し、その分割した記憶構成要素を組み合わせてLU(Logical Unit)を構成したものがある。
そして、コントローラを多重化し、マルチパスソフトウェアを使用するなどによって、LUへの経路の冗長化が行われている。この場合、LU自体が障害状態になると、LUへの経路の冗長化が行われていても、ホスト計算機はそのLUへのアクセスを継続できない。
そのため、一つのLU(Logical Unit)をマスタLUとして、そのマスタLUと常に同期を取る一つまたは複数のバックアップLUを用意し、マスタLUの障害時にはバックアップLUの一つに切り替えて、新しいマスタLUとしてアクセスを継続している。
ディスクシステムにおいてプライマリ・ディスクに障害が起こった場合に、複数のセカンダリ・ディスクの中から適当な代替となるディスクを選択することができ、ディスクシステムに重大な遅延を生じさせることなく、ホストシステムの処理を実行することができるようにしたものがある(例えば、特許文献1参照)。
すなわち、ストレージ装置のメモリ内に収められるデータがマスタLU(プライマリ・ボリューム)と1ないし複数のバックアップLU(セカンダリ・ボリューム)という編成を記録しており、マスタLUに障害が発生すると、バックアップLUを選択するためにこのデータが参照される。
特開2002−182862号公報
しかし、障害LUを再びバックアップLUとして利用するためには、障害復旧後に全領域の同期を行う必要があり、再びバックアップLUとして利用するまでには時間がかかる。これは、LU全体を障害とみなすことにより、差分同期のためのテーブルを無効とみなすことによる。
すなわち、従来のものでは、LUが障害状態となると障害LU全体を使用不可であるとみなすため、差分同期のためのテーブルは失われる。そのため、障害状態のLUをバックアップLUとして使用可能にするためには、障害復旧後にその時のマスタLUからの全領域の同期が必要となっている。従って、再びバックアップLUとして利用するまでには時間がかかる。
本発明の目的は、障害LUがバックアップLUとして使用可能になるまでの時間を短縮することができるストレージ装置を提供することである。
請求項1の発明に係わるストレージ装置は、ホスト計算機からのデータを記憶するストレージ装置において、同じRAIDレベルのHDDの集合であるRAIDグループを論理的に分割した記憶構成要素を組み合わせてマスタLUおよびバックアップLUを構成し、マスタLUの中の記憶構成要素に障害が発生したときはその障害状態の記憶構成要素のみをストレージプールの記憶構成要素と交換し、バックアップLUの記憶構成要素と同期させることを特徴とする。
請求項2の発明に係わるストレージ装置は、ホスト計算機からのデータを記憶するストレージ装置において、同じRAIDレベルのHDDの集合であるRAIDグループを論理的に分割した記憶構成要素を組み合わせてマスタLUおよびバックアップLUを構成し、バックアップLUの中の記憶構成要素に障害が発生したときはその障害状態の記憶構成要素のみをストレージプールの記憶構成要素と交換し、マスタLUの記憶構成要素と同期させることを特徴とする。
本発明によれば、マスタLUの中で障害状態の記憶構成要素のみをストレージプールの記憶構成要素と交換し、バックアップLUの記憶構成要素と同期させるので、障害LUがバックアップLUとして使用可能になるまでの時間が短縮できる。同様に、バックアップLUが障害となった場合でも、障害状態の記憶構成要素のみ交換し、マスタLUの記憶構成要素と同期を行うので、使用可能になるまでの時間が短縮できる。
以下、本発明の実施の形態を説明する。図1は本発明の第1の実施の形態に係わるストレージ装置の構成図である。第1の実施の形態ではホスト計算機11からストレージ装置12のマスタLU13へのアクセス中に、マスタLU13に障害が起こった場合を示している。
図1において、マスタLU13に対して一つのバックアップLU14を有し、またストレージプール15を有している。マスタLU13とバックアップLU14は、記憶構成要素16ごとに同期しているとする。すなわち、記憶構成要素16a1、16b1、記憶構成要素16a2、16b2、記憶構成要素16a3、16b3はそれぞれ同期している。
バックアップLU14には、マスタLU13の障害前に完了したトランザクションの結果まで同期が取れているとする。これは、マスタLU13へのアクセス中に、マスタLU13のある記憶構成要素16a2で障害が起こっても、バックアップLU14でアクセスが継続できることを意味する。
図1のように、マスタLU13のある記憶構成要素16a2が障害となった場合に、マスタLU13へのアクセスは従来どおりバックアップLU14に引き継がれる。すなわち、バックアップLU14が新マスタLU17になり、障害が発生した記憶構成要素16a2のみをストレージプール15の記憶構成要素16c2と交換し、マスタLU13が新バックアップLU18となる。
第1の実施の形態によれば、マスタLU13の中で障害状態の記憶構成要素16a2のみをストレージプール15の記憶構成要素16c2と交換し、バックアップLU14の記憶構成要素16b2と同期させるので、障害LU13がバックアップLU18として使用可能になるまでの時間が短縮できる。
図2は本発明の第2の実施の形態に係わるストレージ装置の構成図である。この第2の実施の形態ではホスト計算機11からストレージ装置12のマスタLU13へのアクセス中に、バックアップLU14に障害が起こった場合を示している。
図2において、マスタLU13に対して一つのバックアップLU14を有し、またストレージプール15を有している。マスタLU13とバックアップLU14は、記憶構成要素16ごとに同期しているとする。すなわち、記憶構成要素16a1、16b1、記憶構成要素16a2、16b2、記憶構成要素16a3、16b3はそれぞれ同期している。
図2のように、バックアップLU14のある記憶構成要素16b2が障害となった場合には、マスタLU13へのアクセスに影響はない。マスタLU13へのアクセスは継続できる。一方、バックアップLU14が新バックアップLU18になり、障害が発生した記憶構成要素16b2のみをストレージプール15の記憶構成要素16c2と交換する。この場合、マスタLU13の記憶構成要素16a2を記憶構成要素16c2にコピーする。
第2の実施の形態によれば、バックアップLU14が障害となった場合でも、障害状態の記憶構成要素16b2のみを交換し、マスタLU13の記憶構成要素16a2と同期を行うので、使用可能になるまでの時間が短縮できる。
すなわち、本発明では、障害の起こった記憶構成要素のみに対して同期の切り離しが行われるので、障害でない記憶構成要素の同期は継続される。また、障害の起こった記憶構成要素をストレージプール15にある同容量の記憶構成要素と交換するので、バックアップが可能である。そして、交換されて新バックアップLUに移動した記憶構成要素は、新マスタLUの中で対応する記憶構成要素と同期する。なお、障害状態の記憶構成要素は、物理的な修復を待ち、その修復が行われれば、ストレージプール15に所属することになる。以上のように、本発明では障害LUがバックアップLUとして使用可能になるまでの時間をLUの全領域を同期するよりも短縮できる。
図3は、本発明のストレージ装置12の仕組みを実現するための構成図である。ホスト計算機11は、レプリケーション制御コマンド19、ユーティリティコマンド20、I/O制御ドライバ21を有し、ストレージ装置12は、マスタLU13、バックアップLU14、ストレージプール15、コントローラ22、ファームウェア23を有している。
ストレージ装置12にあるファームウェア23は、次の4つの処理を行う。
(1)記憶構成要素単位の同期・切り離し処理
(2)記憶構成要素の障害の検出処理
(3)LUの中の障害状態の記憶構成要素をストレージプールにある同容量の記憶構成要素と入れ替えてLU再構成する処理
(4)マスタLUとバックアップLUとを切り替える処理
また、ファームウェア23がこれらを行うために、以下のデータD1〜D4はストレージ装置のメモリに存在する。
(2)記憶構成要素の障害の検出処理
(3)LUの中の障害状態の記憶構成要素をストレージプールにある同容量の記憶構成要素と入れ替えてLU再構成する処理
(4)マスタLUとバックアップLUとを切り替える処理
また、ファームウェア23がこれらを行うために、以下のデータD1〜D4はストレージ装置のメモリに存在する。
(D1)一つの記憶構成要素とそれを同期する一つまたは複数の記憶構成要素の編成
(D2)記憶構成要素のデータの有効性(障害中、および復旧後の同期が未完了の場合は無効となる。)
(D3)一つのLU、及びストレージプールを構成する記憶構成要素の編成
(D4)マスタLUとそれに対応する一つまたは複数のバックアップLUの編成
ホスト計算機11のレプリケーション制御コマンド19は、記憶構成要素の同期・切り離し、および、マスタLUとバックアップLUの切り替えを制御する。ユーティリティコマンド20は、LUを構成する記憶構成要素の入れ替えを制御する。I/O制御ドライバ21は、主にI/Oのキューイングとリトライを行う。ドライバがI/Oをストレージ装置12に発行した時に、障害状態の記憶構成要素をファームウェアが検出して、I/Oがエラーで返却されると、それ以降の同じLUへのI/Oをキューイングする。その後、I/Oの送り先として、マスタLUからバックアップLUに切り替わったら、キューイングされたI/Oをリトライする。
(D2)記憶構成要素のデータの有効性(障害中、および復旧後の同期が未完了の場合は無効となる。)
(D3)一つのLU、及びストレージプールを構成する記憶構成要素の編成
(D4)マスタLUとそれに対応する一つまたは複数のバックアップLUの編成
ホスト計算機11のレプリケーション制御コマンド19は、記憶構成要素の同期・切り離し、および、マスタLUとバックアップLUの切り替えを制御する。ユーティリティコマンド20は、LUを構成する記憶構成要素の入れ替えを制御する。I/O制御ドライバ21は、主にI/Oのキューイングとリトライを行う。ドライバがI/Oをストレージ装置12に発行した時に、障害状態の記憶構成要素をファームウェアが検出して、I/Oがエラーで返却されると、それ以降の同じLUへのI/Oをキューイングする。その後、I/Oの送り先として、マスタLUからバックアップLUに切り替わったら、キューイングされたI/Oをリトライする。
次に、本発明のストレージ装置12の実施手順を説明する。
(a).運用前のシステム構築時に、ストレージ装置12の各RAIDグループに、以下の2種類の記憶構成要素を同一の容量で用意する。
・LUを構成する記憶構成要素
・障害状態の記憶構成要素と入れ替えるために、LUに所属させない記憶構成要素
(b).レプリケーション制御コマンドで、マスタLUとバックアップLUの各記憶構成要素の同期を開始する。
・障害状態の記憶構成要素と入れ替えるために、LUに所属させない記憶構成要素
(b).レプリケーション制御コマンドで、マスタLUとバックアップLUの各記憶構成要素の同期を開始する。
(c).運用時に、ファームウェア23は記憶構成要素の障害を検出する。障害の検出には、以下の2種類の場合がある。
(c-1).ホスト計算機11からのI/Oを記憶構成要素に発行してエラーで返却された場合
(c-2).記憶構成要素を監視して、障害を検出した場合
以下、(c-1)の場合は手順(d)〜(j)と(l)を、(c-2)の場合は手順(k)〜(l)を行う。
(c-2).記憶構成要素を監視して、障害を検出した場合
以下、(c-1)の場合は手順(d)〜(j)と(l)を、(c-2)の場合は手順(k)〜(l)を行う。
(d).(c-1)の場合、つまり、ホスト計算機11がマスタLUに対してI/Oを発行し、マスタLUの記憶構成要素でI/Oエラーとなった場合、ファームウェア23はI/OエラーをI/O制御ドライバに返却する。
(e).I/Oエラーが返ってきたら、I/O制御ドライバ21は、エラー返却されたI/Oと、同じLUへのそれ以降I/OをマスタLUとバックアップLUの切り替えが完了するまでキューイングする。
(f).I/O制御ドライバは、障害中の記憶構成要素の同期を切り離すため、レプリケーション制御コマンドを発行する。切り離しはファームウェアが行う。
(g).I/O制御ドライバは、マスタLUとバックアップLUを切り替えるため、レプリケーション制御コマンドを発行する。切り替えはファームウェアが行う。切り替えが完了したらI/O制御ドライバに通知する。
(h).I/O制御ドライバは、マスタLUとバックアップLUの切り替えが完了した通知を受け取ったら、キューイングしていたI/Oをリトライする。
(i).I/O制御ドライバは、障害中の記憶構成要素を、LUに含まれない記憶構成要素と入れ替えて、LUを再構成するため、ユーティリティコマンドを発行する。入れ替えはファームウェアが行う。その際、該当する記憶構成要素のデータが有効なバックアップLUを選択する。入れ替えが完了したらI/O制御ドライバに通知する。
(j).I/O制御ドライバは、記憶構成要素の入れ替えが完了した通知を受け取ったら、入れ替えた記憶構成要素の同期(新しいマスタLUの記憶構成要素からのコピー)を行うため、レプリケーション制御コマンドを発行する。同期はファームウェアが行う。同期が完了したら、その記憶構成要素のデータは有効とみなされる。
(k).(c-2)の場合、つまり、マスタLUやバックアップLUの記憶構成要素を定期的に監視して、障害が検出された場合は、I/O制御ドライバを経ることなく、以下を行う。
・障害中の記憶構成要素の同期の切り離し
・LUに所属しない記憶構成要素との入れ替え
・データが有効な記憶構成要素との同期
(l).入れ替え後の障害記憶構成要素は、物理的な復旧を待つ。復旧されれば、もとのRAIDグループで、LUに所属しない記憶構成要素として、再度入れ替え可能となる。
・LUに所属しない記憶構成要素との入れ替え
・データが有効な記憶構成要素との同期
(l).入れ替え後の障害記憶構成要素は、物理的な復旧を待つ。復旧されれば、もとのRAIDグループで、LUに所属しない記憶構成要素として、再度入れ替え可能となる。
11…ホスト計算機、12…ストレージ装置、13…マスタLU、14…バックアップLU、15…ストレージプール、16…記憶構成要素、17…新マスタLU、18…新バックアップLU、19…レプリケーション制御コマンド、20…ユーティリティコマンド、21…I/O制御ドライバ、22…コントローラ、23…ファームウェア
Claims (2)
- ホスト計算機からのデータを記憶するストレージ装置において、同じRAIDレベルのHDDの集合であるRAIDグループを論理的に分割した記憶構成要素を組み合わせてマスタLUおよびバックアップLUを構成し、マスタLUの中の記憶構成要素に障害が発生したときはその障害状態の記憶構成要素のみをストレージプールの記憶構成要素と交換し、バックアップLUの記憶構成要素と同期させることを特徴とするストレージ装置。
- ホスト計算機からのデータを記憶するストレージ装置において、同じRAIDレベルのHDDの集合であるRAIDグループを論理的に分割した記憶構成要素を組み合わせてマスタLUおよびバックアップLUを構成し、バックアップLUの中の記憶構成要素に障害が発生したときはその障害状態の記憶構成要素のみをストレージプールの記憶構成要素と交換し、マスタLUの記憶構成要素と同期させることを特徴とするストレージ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005275053A JP2007087109A (ja) | 2005-09-22 | 2005-09-22 | ストレージ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005275053A JP2007087109A (ja) | 2005-09-22 | 2005-09-22 | ストレージ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007087109A true JP2007087109A (ja) | 2007-04-05 |
Family
ID=37974027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005275053A Withdrawn JP2007087109A (ja) | 2005-09-22 | 2005-09-22 | ストレージ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007087109A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9235472B2 (en) | 2013-04-05 | 2016-01-12 | Kabushiki Kaisha Toshiba | Drive array apparatus, controller, data storage apparatus and method for rebuilding drive array |
-
2005
- 2005-09-22 JP JP2005275053A patent/JP2007087109A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9235472B2 (en) | 2013-04-05 | 2016-01-12 | Kabushiki Kaisha Toshiba | Drive array apparatus, controller, data storage apparatus and method for rebuilding drive array |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5391993B2 (ja) | ディスクアレイ装置 | |
JP5285610B2 (ja) | グローバルホットスペアディスクが存在するときに、故障したドライブを復元、及びコピーバックする最適化された方法 | |
US20130145208A1 (en) | Method for a Plurality of RAID Systems and Data Storage System Thereof | |
US20090287880A1 (en) | Online storage capacity expansion of a raid storage system | |
JP2007086972A (ja) | ストレージシステム、二重化制御方法、及びプログラム | |
JP2009266015A (ja) | ストレージシステム及びその監視条件変更方法 | |
JP2008250458A (ja) | ストレージシステム及びストレージシステムの管理方法 | |
JP2006293910A (ja) | 安全で高速なデータベース・レプリケーション技術 | |
US8862846B2 (en) | Control apparatus, control method, and storage apparatus | |
JP6569476B2 (ja) | ストレージ装置、ストレージシステムおよびストレージ制御プログラム | |
JP3776438B2 (ja) | 記憶装置 | |
JP2006260376A (ja) | ストレージ装置およびメディアエラー回復方法 | |
JP2007087109A (ja) | ストレージ装置 | |
JP5644795B2 (ja) | ストレージ装置、データ復旧方法およびプログラム | |
JP2008276281A (ja) | データ同期システム、方法、及び、プログラム | |
JP4456060B2 (ja) | Raid制御装置、raid制御プログラム、raid制御方法 | |
JP6277878B2 (ja) | ストレージ装置の制御装置、ストレージ装置の制御方法及びストレージ装置の制御プログラム | |
JP2002278706A (ja) | ディスクアレイ装置 | |
JP5032620B2 (ja) | ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法 | |
JP5729043B2 (ja) | ストレージ装置および制御装置 | |
JP2016143248A (ja) | ストレージ制御装置及びストレージ制御プログラム | |
JP2007274255A (ja) | 冗長構成システム及びノード | |
JP6957845B2 (ja) | ストレージ制御装置及びストレージ装置 | |
JP2009069965A (ja) | ストレージ装置、データ回復方法及び計算機システム | |
JPH06124169A (ja) | 二重システム化された光ディスク装置及びそのi/oエラー自動復旧方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081202 |