JP4041473B2 - マルチクラスタ・ストレージ・サブシステムのための自律型パワー・ロス・リカバリ - Google Patents

マルチクラスタ・ストレージ・サブシステムのための自律型パワー・ロス・リカバリ Download PDF

Info

Publication number
JP4041473B2
JP4041473B2 JP2004156184A JP2004156184A JP4041473B2 JP 4041473 B2 JP4041473 B2 JP 4041473B2 JP 2004156184 A JP2004156184 A JP 2004156184A JP 2004156184 A JP2004156184 A JP 2004156184A JP 4041473 B2 JP4041473 B2 JP 4041473B2
Authority
JP
Japan
Prior art keywords
cluster
protected area
modified data
data
directing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004156184A
Other languages
English (en)
Other versions
JP2004355623A (ja
Inventor
ユーチェン・ス
ヴァーノン・ジェイ・レグヴォルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2004355623A publication Critical patent/JP2004355623A/ja
Application granted granted Critical
Publication of JP4041473B2 publication Critical patent/JP4041473B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

本発明は、概してストレージ・サブシステムの分野に関し、特に、パワー・ロスもしくはそれに匹敵するイベントに続いてマルチクラスタ・システムの1つのクラスタがリカバリに失敗した場合の喪失を防止するデータ転送管理に関する。
大規模分散コンピューティング・システムにおいては、多数のホスト・コンピュータが、通常、ストレージ・コントローラによってテープあるいはディスク・ドライブ・ユニットといった多数のダイレクト・アクセス・ストレージ・デバイス(DASD)と接続されている。ストレージ・コントローラは、その機能の中でも特に、特定のコンピュータとDASDの間におけるデータ・レコードの転送に関する接続および切断の処理を行う。それに加えてストレージ・コントローラは、より高速な入力および出力オペレーションのために、電子メモリ内にデータをストアする。
インターナショナル・ビジネス・マシーンズ(IBM)・コーポレーション(ニューヨーク州アーモンク)のエンタープライズ・ストレージ・サーバ(ESS)は、ストレージ・コントローラの一例であり、磁気ディスク・ユニットとホスト・コンピュータの間の接続を制御する。ホスト・コンピュータは、通常、IBM 3090、モデルES/9000、またはそのほかの同等システム等のメイン・フレーム・システムである。
代表的なIBMストレージ・コントローラは、最大でホスト・コンピュータからの16チャンネル、および最大で64の磁気ストレージ・ユニットの制御が可能である。ホスト・コンピュータは、1〜4チャンネルによってストレージ・コントローラに接続される。ストレージ・コントローラは、通常、2つのストレージ・クラスタを有し、そのそれぞれは、ホスト・コンピュータとダイレクト・アクセス・ストレージ・デバイスの間における選択的な接続を提供し、かつ好ましくはそのそれぞれが異なる電源境界上にある。各クラスタは、第1および第2のストレージ・パスを伴うマルチパス・ストレージ・ディレクタ、共有制御アレイ(SCA)、キャッシュ・メモリ、および不揮発性ストレージ(NVS)メモリ含むことがある。SCAは、すべてのストレージ・パスにわたって共有されるメモリ・アレイである。
キャッシュは、コンピュータ・メモリの付属物としての応用によってもっともよく知られており、それにおいては、頻繁にアクセスされるインストラクションおよびデータのための高速ストレージとしてそれが使用される。使用の頻度のインジケータとしては、そのレコードの最後の使用からの時間長が使用される。キャッシュは、最後の使用の時点からその内容のエージングが始まることからシステム・メモリと区別される。コンピュータ・メモリのアドレス空間においては、そのアドレス空間内のスペースに関して競合するデータがアクセスされる前にプログラム・データが解放されなければならない。キャッシュにおいては、スペースに関する競合の結果、最低使用頻度データとなるデータがキャッシュから追い出される。アクセスされる頻度の低いデータが周期的にキャッシュ内に入っても、そのようなデータはエージングによりキャッシュから追い出される。キャッシュ内のデータは、全体的に、もしくは部分的に不揮発性メモリ内に複製される。ダイレクト・アクセス・ストレージ・デバイスの磁気メディアからのデータの読み出し(および、それへの書き込み)は、かなり時間を要する。読み出し書き込みオペレーションを低速化する要因の主なものは、磁気ディスクが記録ロケーションをトランスデューサと整列するために必要となる時間、およびデータの読み出しおよび書き込みに使用される磁気トランスデューサの限られた帯域幅である。頻繁にアクセスされるデータをキャッシュ内に複製することによって、データの読み出し時間が短縮され、データ・ストレージ・システムのスループットが格段に向上する。
各クラスタにおいては、不揮発性ストレージがバッファリング機能のためキャッシュに対するバックアップとして作用する(図3参照)。NVSに対するアクセスは、ダイレクト・アクセス・ストレージ・デバイスに対するアクセスより高速であるが、一般にキャッシュに対するよりは遅い。データは、キャッシュおよびNVSに分岐され、電源異常時のキャッシュのバックアップが行われる。NVSに書き込まれたデータは、磁気メディアに書き込まれた場合と同程度に安全であると考えられる。NVSに対するデータ・レコードのステージングが完了すると、ホスト・コンピュータに対してデータのストアに成功したことを示す表示が与えられる。
従来のストレージ制御ユニットは、通常、ユニット内の単一障害点がシステム全体の障害を引き起こさないように設計されている。しかしながら、特定コンポーネントの障害は、制御ユニットのパフォーマンスの低下をもたらし得る。たとえばキャッシュ内の障害は、一般にその種のパフォーマンスの低下を招く。残念ながらホスト・システムは、完全に機能的なキャッシュによって提供される速度に調整されており、したがってそれに頼っていることから、キャッシュ内の障害に関連するパフォーマンスの低下は、単一障害点と同じ影響を有する。
キャッシュ・メモリ内の障害に関連するストレージ制御ユニットのパフォーマンス低下を緩和するためのシステムおよび技術に関する必要性は、たとえば、特許文献1で論じられている。特許文献1の発明は、2つのキャッシュ・メモリおよび2つの不揮発性ストレージ・バッファを伴うストレージ・コントローラを提供する。一方のクラスタのNVSメモリは、プロセッサを介して、他方のクラスタのキャッシュ・メモリのバックアップを行う(図4参照)。またこのストレージ・コントローラは、障害からのリカバリのため、およびその制御ユニットの再構成のためのマイクロコードを含んでいる。DASD Fast Writeが実行されるとき、書き込みデータはキャッシュおよびNVSへ同時に転送される。このシステムは、キャッシュまたはNVSの障害が発生した場合であっても、拡張機能動作(たとえば、DASD Fast WriteおよびDual Copy)が継続的に利用できるように設計されている。(DASD Fast Writeは、ストレージ・デバイスへ書き込まれるべきデータがキャッシュへ書き込まれ、かつ不揮発性メモリへバックアップされる動作である。Dual Copyは、ストレージ・デバイスに対するその後のバックアップに関するデータの指定および保護に関連する。)そのほかの、ストレージ・サブシステムの堅牢性の向上およびコンポーネント障害時におけるパフォーマンス低下の軽減に向けられた従来技術が、特許文献2および特許文献3に記載されている。
NVSは電源異常があった場合にデータを維持するが、その欠点は、NVSが特別なバッテリ・バックアップされたメモリ・サブシステムを必要とすることであり、それがストレージ・コントローラのコストを増加させている。NVSを使用しない1つのテクニックは、電源異常があった場合に各クラスタが全キャッシュをディスクへ転送するというものである(図5参照)。電源の回復時には、キャッシュがディスクからリストアされる。しかしながら、この種のファイアホース・ダンプの欠点は、転送を処理するために必要となるバッテリ電源の容量が、保護するべきメモリのサイズに比例することである。結局、非常に大きなキャッシュ・メモリを伴うシステムにおいてファイアホース・ダンプのアプローチは経済的でない。
しかも、電源異常に続いてクラスタの1つに障害を生じた場合には、修正済みデータを含むデータの一部を、データ処理システムのカスタマが利用できなくなることがある。
米国特許第5,437,022号 米国特許第6,006,342号 米国特許第5,771,367号
つまり、特別なバッテリ・バックアップされたメモリ・サブシステムを必要とすることなく電源異常またはそれに匹敵する障害発生時に、データ、特に修正済みデータを保護するため、およびクラスタがリストアに失敗した場合においてもデータの喪失を防止するためのシステムおよび技術が必要とされている。
本発明のシステムおよび方法は上記の必要性を満たすものである。本発明のストレージ・コントローラは、ホスト・コンピュータからストレージ・デバイスへデータを振り向けるための第1のクラスタおよびホスト・コンピュータからストレージ・デバイスへデータを振り向けるための第2のクラスタを含む。第1のクラスタは、第1のキャッシュ・メモリ、メモリの第1の保護エリア、および第1のディスク・デバイスを含んでおり;第2のクラスタは、第2のキャッシュ・メモリ、メモリの第2の保護エリア、および第2のディスク・デバイスを含んでいる。正常動作モードにおいては、第1のクラスタ内の修正済みデータが、第1のキャッシュに振り向けられ、かつ第2の保護エリア(第2のクラスタ内)にバックアップされる。同様に正常動作モードにおいては、第2のクラスタ内の修正済みデータが、第2のキャッシュに振り向けられ、かつ第1の保護エリア(第1のクラスタ内)にバックアップされる。電源異常が生じた場合においては、修正済みデータが、第1の保護エリアから第1のディスク・デバイスにコピーされ、第2の保護エリアから第2のディスク・デバイスにコピーされる。それに加えて、第1の保護エリアから第2のディスク・デバイスへ、また第2の保護エリアから第1のディスク・デバイスへも修正済みデータがコピーされる。したがって、クラスタの一方が電源異常の後のリカバリに失敗したとしても、失敗したクラスタからの修正済みデータが、他方のクラスタを介して利用可能となる。
図1は、データ処理システム100のハイレベルのブロック図であり、本発明を具体化することのできるストレージ・サブシステムを含んでいる。このシステム100は、1または複数のホスト・コンピュータ102、ダイレクト・アクセス・ストレージ・デバイス(DASD)等の1または複数のストレージ・デバイス104、およびホスト・コンピュータ102とストレージ・デバイス104の間におけるデータの転送を管理するためのストレージ・コントローラ200を含む。図2は、クラスタ0 210およびクラスタ1 220のような複数のクラスタに区分されたストレージ・コントローラ200のブロック図である。ストレージ・コントローラ200を3以上のクラスタに区分してもよく、本発明は、任意数のクラスタを伴うストレージ・コントローラに対して等しく適用可能であるが、明瞭性を目的としてここでは2つだけを例示して説明することにする。各クラスタ210および220は、ホスト・アダプタ211および221を備え、それを介してホスト・コンピュータ102が接続され、さらにデバイス・アダプタ212および222を備え、それを介してDASD 104Aおよび104B等のストレージ・デバイスが接続される。各クラスタ210および220は、さらにクラスタ内の動作を管理するべくプログラムされたプロセッサ213および223、対応するデバイス・アダプタ212および222とプロセッサ213および223の間のデバイス・アダプタ・バス214および224、プロセッサ213および223に結合されたキャッシュ・メモリ215および225、ならびに同様にプロセッサ213および223に結合されたメモリの保護エリア216および226を備えている。ホスト・アダプタ・ブリッジ230は、クラスタ210および220の間の相互接続を行う。
図6は、本発明の方法を示したフローチャートであり、次に図7〜9を参照してその考察を行う。正常動作モードにおいては(ステップ600)、ホスト・コンピュータ102によってアクセスされることになるストレージ・デバイス104内にストアされているデータが、ストレージ・コントローラ200によってクラスタ210および220の一方に割り当てられ(ステップ602)、キャッシュ・メモリ215または225内へ転送される(ステップ604)。そのデータがホスト・コンピュータ102によって単に読み出されるだけの場合には、データを保護するためのそれ以上の動作は必要ない。電源異常が、ストレージ・デバイス104内にストアされているデータのオリジナルのコピーに影響を及ぼすことはない。しかしながら、そのデータの修正をホスト・コンピュータ102が行う場合には(ステップ606)、本発明が保護を提供する(図7)。第1のクラスタ210のキャッシュ215内にある修正済みデータが、第2のクラスタ220の保護エリア226内にコピーされる。同様に、第2のクラスタ220のキャッシュ225内にある修正済みデータが、第1のクラスタ210の保護エリア216内にコピーされる(ステップ608)。保護エリア216および226を、バッテリ・バックアップされたNVSとすることもできるが、それに代えて保護エリア216および226を、各クラスタ210および220の通常のメモリの専用部分とすることもできる。保護エリア216および226に割り振られるメモリのサイズは、処理中の修正済みデータの量に適合するべく必要に応じて調整されるようにしてもよい。高価なNVSの容量は容易に変更できず、メモリ・モジュールおよび関連するバックアップ回路の追加または取り外し、およびクラスタの再構成により、調整を認識させる必要がある。さらに、規定サイズを超えたNVSの容量の増加を妨げる特定の制限が存在することもある。修正済みのデータだけを保護することは、バッテリ要件を大きく軽減する。
パワー・ロスまたはそれに匹敵するほかの障害が生じた場合には(図8;ステップ610)、ストレージ・コントローラ200は、バッテリの下に動作を継続し、プロセッサ213は、クラスタ0 210の保護エリア216内にストアされているすべてのデータを、接続されているディスク104Aへ保存するよう指示する(ステップ612)。同様にプロセッサ223は、クラスタ1 220の保護エリア226内にストアされているすべてのデータを、接続されているディスク104Bへ保存するよう指示する(ステップ614)。それに加えて、プロセッサ213は、クラスタ0 210の保護エリア216内にストアされているすべてのデータを、クラスタ1 220の保護エリア226(または、より包括的なメモリ228)内へ一時的にストアするよう指示し(図9)、さらにそれに続いて接続されているディスク104Aへ保存するよう指示する(図10;ステップ616)。同様にプロセッサ223は、クラスタ1 220の保護エリア226内にストアされているすべてのデータを、クラスタ0 210の保護エリア216(または、より包括的なメモリ218)内へ一時的にストアするよう指示し、さらにそれに続いて接続されているディスク104Bへ保存するよう指示する(ステップ618)。このようにクラスタ210および220は、ともに、両方のクラスタ210および220からの修正済みデータの持続的なコピーを保持することになる。
パワー・ロスの終結時には、ストレージ・コントローラ200を正常動作に復帰させる試みがなされる(ステップ620)。両方のクラスタ210および220が完全にリストアされていれば(ステップ622)、データの喪失をまったく伴うことなく正常動作を再開することができる(ステップ624)。一方のクラスタ(たとえばクラスタ1 220)が、その初期マイクロコード・ロード・シーケンスに失敗するか、そのほかのパワー・ロスからのリカバリに失敗した場合には(ステップ626)、他方のクラスタ(この例の場合はクラスタ0 210)が、それ独自のデータ(ディスク104Aから復元)および失敗したクラスタ220からのデータ(同様に、ディスク104Aから復元)の処理を継続することができる(図11;ステップ628)。失敗したクラスタ220が修復(ステップ630)された後は、正常な2クラスタの動作を再開することができる(ステップ624)。
ここに開示された実施態様を通じて、本発明の目的は完全に達成される。当業者であれば認識されるように、本発明の各種側面は、本発明の本質的な機能から逸脱することなしに異なる実施態様を介して達成することができる。これら特定の実施態様は、例示のためであり、付随する特許請求の範囲に示される本発明の範囲を制限することを意味していない。たとえば、本発明の説明は、2クラスタのストレージ・コントローラに関連してなされているが、3以上のクラスタを有するストレージ・コントローラにおいても同様に具体化することができる。その種の実施態様の1つにおいては、各クラスタの保護エリアが、電源異常またはそれに匹敵するそのほかの障害の発生時に、各クラスタの接続されたディスクにコピーされ、それによって1つを除くすべてのクラスタがリカバリに失敗した場合においても修正済みデータが保護される。それに代えて、互いをサポートするべくクラスタをペアにすることもできる。後者の実施態様は、前者の実施態様に比べてデータ保護に必要なディスク空間の量、ロジック、および時間を低減することになろう。
本発明を具体化することのできるストレージ・サブシステムを含むデータ処理システムのブロック図である。 本発明を具体化することのできるストレージ・サブシステムのブロック図である。 不揮発性ストレージがクラスタ・キャッシュの内容のイメージを維持する従来技術のストレージ・サブシステムのデータ・フローを例示したブロック図である。 一方のクラスタの不揮発性ストレージが他方のクラスタのキャッシュの内容の少なくとも一部を維持する従来技術のストレージ・サブシステムのデータ・フローを例示したブロック図である。 電源異常時に実行されるファイアホース・ダンプを例示した従来技術のストレージ・サブシステムのブロック図である。 本発明の方法のフローチャートである。 正常動作モードにおける本発明のストレージ・サブシステムのデータ・フローを例示したブロック図である。 電源異常に続く障害モードの第1のステップにおける図7のストレージ・サブシステムのデータ・フローを例示したブロック図である。 電源異常に続く障害モードの第2のステップにおける図7のストレージ・サブシステムのデータ・フローを例示したブロック図である。 電源異常に続く障害モードの第3のステップにおける図7のストレージ・サブシステムのデータ・フローを例示したブロック図である。 クラスタの1つが電源異常からのリカバリに失敗した後の修正動作モードにおける図7のストレージ・サブシステムのデータ・フローを例示したブロック図である。

Claims (14)

  1. 少なくとも1つのホスト・コンピュータに接続されたストレージ・コントローラを有するデータ処理システム内にデータをストアするための、前記ストレージ・コントローラによって実行される方法であって、
    正常動作モードにおいて、前記ストレージ・コントローラの第1のクラスタ内の第1の修正済みデータを、前記ストレージ・コントローラの第2のクラスタのメモリの保護エリア内にストアするよう振り向けること、
    前記正常動作モードにおいて、第2のクラスタ内の第2の修正済みデータを、前記第1のクラスタのメモリの保護エリア内にストアするよう振り向けること、
    電源異常モードにおいて、バッテリの下に動作を継続すること、
    前記電源異常モードにおいて、前記第1の修正済みデータを、第1のストレージ・デバイス内にストアするよう振り向けること、
    前記電源異常モードにおいて、前記第2の修正済みデータを、第2のストレージ・デバイス内にストアするよう振り向けること、
    前記電源異常モードにおいて、前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のストレージ・デバイスへ転送するよう振り向けること、および、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のストレージ・デバイスへ転送するよう振り向けること
    前記ストレージ・コントローラを前記正常動作モードに復帰させるよう試みることを含み、
    前記第1のクラスタが電源異常の後にリカバリに失敗した場合においても、前記第2のクラスタが、前記第2のストレージ・デバイスを介して、前記第1のクラスタの第1の修正済みデータを処理することを可能にする方法。
  2. 前記電源異常モードにおいて、前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のストレージ・デバイスへ転送するよう振り向けることは、
    前記第1の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第2のクラスタの前記保護エリアへ転送するよう振り向けること、および、
    前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のストレージ・デバイスへ転送するよう振り向けることを含み、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のストレージ・デバイスへ転送するよう振り向けることは、
    前記第2の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第1のクラスタの前記第1の保護エリアへ転送するよう振り向けること、および、
    前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のストレージ・デバイスへ転送するよう振り向けることを含む、請求項1に記載の方法。
  3. さらに、
    前記第1および第2の修正済みデータに適応するべく前記第1のクラスタの前記保護エリアの容量を調整すること、および、
    前記第1および第2の修正済みデータに適応するべく前記第2のクラスタの前記保護エリアの容量を調整すること、
    を含む、請求項1に記載の方法。
  4. さらに、
    前記第1のクラスタの前記保護エリアに、一時的な不揮発性手段であって、それによって、前記第1のクラスタの前記保護エリア内にストアされたデータが、前記第1のストレージ・デバイスへ転送されるまで保存される一時的な不揮発性手段を備えること、および、
    前記第2のクラスタの前記保護エリアに、一時的な不揮発性手段であって、それによって、前記第2のクラスタの前記保護エリア内にストアされたデータが、前記第2のストレージ・デバイスへ転送されるまで保存される一時的な不揮発性手段を備えること、
    を含む、請求項1に記載の方法。
  5. ホスト・コンピュータとストレージ・デバイスの間のデータ転送を管理するための第1のクラスタであって、第1のキャッシュ・メモリ、メモリの第1の保護エリア、および第1のディスク・デバイス、を備える第1のクラスタと、
    ホスト・コンピュータとストレージ・デバイスの間のデータの転送を管理するための第2のクラスタであって、第2のキャッシュ・メモリ、メモリの第2の保護エリア、および第2のディスク・デバイスを備える第2のクラスタと、
    正常動作モードにおいて、前記第1のクラスタ内の第1の修正済みデータを、前記第2のクラスタの前記保護エリア内にストアするよう振り向けるための手段と、
    前記正常動作モードにおいて、前記第2のクラスタ内の第2の修正済みデータを、前記第1のクラスタの前記保護エリア内にストアするよう振り向けるための手段と、
    電源異常モードにおいて、動作を継続させるためのバッテリと、
    前記電源異常モードにおいて、前記第1の修正済みデータを、前記第1のディスク・デバイス内にストアするよう振り向けるための手段と、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第2のディスク・デバイス内にストアするよう振り向けるための手段と、
    前記電源異常モードにおいて、前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のディスク・デバイスへ転送するよう振り向けるための手段と、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のディスク・デバイスへ転送するよう振り向けるための手段とを備え、
    前記第1のクラスタが電源異常の後にリカバリに失敗した場合においても、前記第2のクラスタが、前記第2のディスク・デバイスを介して、前記第1のクラスタの第1の修正済みデータを処理することを可能にする手段とを有する
    ストレージ・コントローラ。
  6. 前記第1の保護エリアが一時的な不揮発性手段を備え、それによって、前記第1の保護エリア内にストアされたデータが、前記第1のディスク・デバイスへ転送されるまで保存され、かつ、
    前記第2の保護エリアが一時的な不揮発性手段を備え、それによって、前記第2の保護エリア内にストアされたデータが、前記第2のディスク・デバイスへ転送されるまで保存される、請求項5に記載のストレージ・コントローラ。
  7. さらに、
    前記第1および第2の修正済みデータに適応するべく前記第1のクラスタの前記保護エリアの容量を調整するための手段と、
    前記第1および第2の修正済みデータに適応するべく前記第2のクラスタの前記保護エリアの容量を調整するための手段と
    を備える、請求項5に記載のストレージ・コントローラ。
  8. 少なくとも1つのホスト・コンピュータと、
    少なくとも1つのストレージ・デバイスと、
    ストレージ・コントローラであって、
    ホスト・コンピュータとストレージ・デバイスの間のデータの転送を管理するための第1のクラスタであって、第1のキャッシュ・メモリ、メモリの第1の保護エリア、および第1のディスク・デバイスを備える第1のクラスタ、
    ホスト・コンピュータとストレージ・デバイスの間のデータの転送を管理するための第2のクラスタであって、第2のキャッシュ・メモリ、メモリの第2の保護エリア、および第2のディスク・デバイスを備える第2のクラスタ、
    正常動作モードにおいて、前記第1のクラスタ内の第1の修正済みデータを、前記第2の保護エリア内にストアするよう振り向けるための手段、
    前記正常動作モードにおいて、前記第2のクラスタ内の第2の修正済みデータを、前記第1の保護エリア内にストアするよう振り向けるための手段、
    電源異常モードにおいて、動作可能にするためのバッテリ、
    前記電源異常モードにおいて、前記第1の修正済みデータを、前記第1のディスク・デバイス内にストアするよう振り向けるための手段、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第2のディスク・デバイス内にストアするよう振り向けるための手段、
    前記電源異常モードにおいて、前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のディスク・デバイスへ転送するよう振り向けるための手段、ならびに、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のディスク・デバイスへ転送するよう振り向けるための手段を備え、
    前記第1のクラスタが電源異常の後にリカバリに失敗した場合においても、前記第2のクラスタが、前記第2のディスク・デバイスを介して、前記第1のクラスタの第1の修正済みデータを処理することを可能にするストレージ・コントローラと
    を備えるデータ処理システム。
  9. 前記第1の保護エリアが一時的な不揮発性手段を備え、それによって、前記第1の保護エリア内にストアされたデータが、前記第1のディスク・デバイスへ転送されるまで保存され、かつ、
    前記第2の保護エリアが一時的な不揮発性手段を備え、それによって、前記第2の保護エリア内にストアされたデータが、前記第2のディスク・デバイスへ転送されるまで保存される、請求項に記載のデータ処理システム。
  10. さらに、
    前記第1および第2の修正済みデータに適応するべく前記第1のクラスタの前記保護エリアの容量を調整するための手段と、
    前記第1および第2の修正済みデータに適応するべく前記第2のクラスタの前記保護エリアの容量を調整するための手段と
    を備える、請求項に記載のデータ処理システム。
  11. ホスト・システムとストレージ・デバイスの間のデータ転送を管理するストレージ・コントローラに、
    正常動作モードにおいて、第1のクラスタ内の第1の修正済みデータを、第2のクラスタのメモリの保護エリア内にストアするよう振り向けるステップと、
    前記正常動作モードにおいて、第2のクラスタ内の第2の修正済みデータを、前記第1のクラスタのメモリの保護エリア内にストアするよう振り向けるステップと、
    電源異常モードにおいて、バッテリの下に動作を継続するステップと、
    前記電源異常モードにおいて、前記第1の修正済みデータを、第1のストレージ・デバイス内にストアするよう振り向けるステップと、
    前記電源異常モードにおいて、前記第2の修正済みデータを、第2のストレージ・デバイス内にストアするよう振り向けるステップと、
    前記電源異常モードにおいて、前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のストレージ・デバイスへ転送するよう振り向けるステップと、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のストレージ・デバイスへ転送するよう振り向けるステップと、
    前記正常動作モードに復帰させるよう試みるステップと、
    を実行させ、
    前記第1のクラスタが電源異常の後にリカバリに失敗した場合においても、前記第2のクラスタが、前記第2のストレージ・デバイスを介して、前記第1のクラスタの第1の修正済みデータを処理することを可能にするプログラム。
  12. 前記ストレージ・コントローラに、
    前記電源異常モードにおいて、前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のストレージ・デバイスへ転送するよう振り向けるステップであって、
    前記第1の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第2のクラスタの前記保護エリアへ転送するよう振り向けるステップ、および、
    前記第1の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第2のストレージ・デバイスへ転送するよう振り向けるステップを含むステップと、
    前記電源異常モードにおいて、前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のストレージ・デバイスへ転送するよう振り向けるステップであって、
    前記第2の修正済みデータを、前記第2のクラスタの前記保護エリアから前記第1のクラスタの前記保護エリアへ転送するよう振り向けるステップと、
    前記第2の修正済みデータを、前記第1のクラスタの前記保護エリアから前記第1のストレージ・デバイスへ転送するよう振り向けるステップを含むステップと
    を実行させる、請求項11に記載のプログラム。
  13. さらに、前記ストレージ・コントローラに:
    前記第1および第2の修正済みデータに適応するべく前記第1のクラスタの前記保護エリアの容量を調整するステップと、
    前記第1および第2の修正済みデータに適応するべく前記第2のクラスタの前記保護エリアの容量を調整するステップと
    を実行させる、請求項11に記載のプログラム。
  14. さらに、前記ストレージ・コントローラに:
    前記第1のクラスタの前記保護エリアに一時的な不揮発性手段を提供し、それによって、前記第1のクラスタの前記保護エリア内にストアされたデータが、前記第1のストレージ・デバイスへ転送されるまで保存されるようにするステップと、
    前記第2のクラスタの前記保護エリアに一時的な不揮発性手段を提供し、それによって、前記第2のクラスタの前記保護エリア内にストアされたデータが、前記第2のストレージ・デバイスへ転送されるまで保存されるようにするステップと
    を実行させる、請求項11に記載のプログラム。
JP2004156184A 2003-05-28 2004-05-26 マルチクラスタ・ストレージ・サブシステムのための自律型パワー・ロス・リカバリ Expired - Fee Related JP4041473B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/446,911 US7085886B2 (en) 2003-05-28 2003-05-28 Autonomic power loss recovery for a multi-cluster storage sub-system

Publications (2)

Publication Number Publication Date
JP2004355623A JP2004355623A (ja) 2004-12-16
JP4041473B2 true JP4041473B2 (ja) 2008-01-30

Family

ID=33510324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004156184A Expired - Fee Related JP4041473B2 (ja) 2003-05-28 2004-05-26 マルチクラスタ・ストレージ・サブシステムのための自律型パワー・ロス・リカバリ

Country Status (5)

Country Link
US (1) US7085886B2 (ja)
JP (1) JP4041473B2 (ja)
KR (1) KR100621446B1 (ja)
CN (1) CN1300696C (ja)
TW (1) TWI291103B (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047231B2 (en) 2003-10-16 2015-06-02 International Business Machines Corporation Apparatus system and method for deterministically transferring data by rebooting to a data transfer kernel
KR100608012B1 (ko) * 2004-11-05 2006-08-02 삼성전자주식회사 데이터 백업 방법 및 장치
US7406624B2 (en) * 2005-02-15 2008-07-29 General Motors Corporation Method for responding to a control module failure
US20070118693A1 (en) * 2005-11-19 2007-05-24 International Business Machines Cor Method, apparatus and computer program product for cache restoration in a storage system
US8090987B2 (en) * 2005-12-05 2012-01-03 Lg Electronics Inc. Imaging apparatus having automatic backup function and method for controlling the same
US7715307B2 (en) * 2005-12-13 2010-05-11 Alcatel Lucent Communication connection control systems and methods
US7444541B2 (en) * 2006-06-30 2008-10-28 Seagate Technology Llc Failover and failback of write cache data in dual active controllers
US7694031B2 (en) * 2006-10-31 2010-04-06 Globalfoundries Inc. Memory controller including a dual-mode memory interconnect
US7680982B2 (en) * 2007-02-20 2010-03-16 International Business Machines Corporation Preservation of cache data following failover
US7761680B2 (en) * 2007-04-03 2010-07-20 International Business Machines Corporation Copying data from a first cluster to a second cluster to reassign storage areas from the first cluster to the second cluster
JP4977554B2 (ja) * 2007-08-22 2012-07-18 株式会社日立製作所 キャッシュメモリ上のデータをバックアップする機能を備えたストレージシステム
US7861048B2 (en) * 2007-11-14 2010-12-28 Infineon Technologies Ag Method and arrangement for processing a file
JP2009146169A (ja) * 2007-12-14 2009-07-02 Fujitsu Ltd ストレージシステム、ストレージ装置、データバックアップ方法
US7975169B2 (en) * 2008-06-03 2011-07-05 International Business Machines Corporation Memory preserved cache to prevent data loss
US7895465B2 (en) * 2008-06-03 2011-02-22 International Business Machines Corporation Memory preserved cache failsafe reboot mechanism
US8325554B2 (en) * 2008-07-10 2012-12-04 Sanmina-Sci Corporation Battery-less cache memory module with integrated backup
US8055846B2 (en) * 2008-08-15 2011-11-08 International Business Machines Corporation Data vaulting in emergency shutdown
US8621569B1 (en) * 2009-04-01 2013-12-31 Netapp Inc. Intercluster relationship management
US9438471B1 (en) * 2012-02-20 2016-09-06 F5 Networks, Inc. Multi-blade network traffic management apparatus with improved failure handling and methods thereof
JP6291776B2 (ja) * 2013-10-11 2018-03-14 富士通株式会社 情報処理システム、情報処理システムの制御方法及び情報処理装置の制御プログラム
US9459676B2 (en) 2013-10-28 2016-10-04 International Business Machines Corporation Data storage device control with power hazard mode
CN103605620B (zh) * 2013-11-28 2017-01-11 北京华胜天成科技股份有限公司 一种集群存储数据保护方法及装置
EP2937785B1 (en) 2014-04-25 2016-08-24 Fujitsu Limited A method of recovering application data
US9489149B2 (en) * 2014-06-16 2016-11-08 Netapp, Inc. Methods and systems for using a write cache in a storage system
WO2016006108A1 (ja) * 2014-07-11 2016-01-14 株式会社日立製作所 ストレージおよびその制御方法
US11550676B2 (en) * 2018-09-06 2023-01-10 International Business Machines Corporation Hardware-management-console-initiated data protection
US11416147B2 (en) * 2018-09-06 2022-08-16 International Business Machines Corporation Rack-power-controller-initiated data protection

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5454099A (en) * 1989-07-25 1995-09-26 International Business Machines Corporation CPU implemented method for backing up modified data sets in non-volatile store for recovery in the event of CPU failure
JP2888401B2 (ja) * 1992-08-03 1999-05-10 インターナショナル・ビジネス・マシーンズ・コーポレイション 冗長ディスクドライブアレイに対する同期方法
CA2086874E (en) * 1992-08-03 2000-01-04 Renzo Mauro Canetta Methods for administration of taxol
DE4241494A1 (de) * 1992-12-09 1994-06-16 Emitec Emissionstechnologie Verfahren zur Steuerung der Aufheizung eines elektrisch beheizbaren katalytischen Konverters
US5437022A (en) * 1992-12-17 1995-07-25 International Business Machines Corporation Storage controller having additional cache memory and a means for recovering from failure and reconfiguring a control unit thereof in response thereto
US5771367A (en) * 1992-12-17 1998-06-23 International Business Machines Corporation Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores
US5640530A (en) * 1992-12-17 1997-06-17 International Business Machines Corporation Use of configuration registers to control access to multiple caches and nonvolatile stores
JPH06282386A (ja) 1993-03-25 1994-10-07 Toshiba Corp ディスク記憶装置
US5548711A (en) * 1993-08-26 1996-08-20 Emc Corporation Method and apparatus for fault tolerant fast writes through buffer dumping
US5586291A (en) * 1994-12-23 1996-12-17 Emc Corporation Disk controller with volatile and non-volatile cache memories
EP0721162A2 (en) * 1995-01-06 1996-07-10 Hewlett-Packard Company Mirrored memory dual controller disk storage system
US5682513A (en) * 1995-03-31 1997-10-28 International Business Machines Corporation Cache queue entry linking for DASD record updates
US5588110A (en) * 1995-05-23 1996-12-24 Symbios Logic Inc. Method for transferring data between two devices that insures data recovery in the event of a fault
WO1997001139A1 (en) * 1995-06-23 1997-01-09 Elonex Plc Disk array controller with enhanced synchronous write
US5774643A (en) * 1995-10-13 1998-06-30 Digital Equipment Corporation Enhanced raid write hole protection and recovery
US5870537A (en) * 1996-03-13 1999-02-09 International Business Machines Corporation Concurrent switch to shadowed device for storage controller and device errors
US5968182A (en) * 1997-05-12 1999-10-19 International Business Machines Corporation Method and means for utilizing device long busy response for resolving detected anomalies at the lowest level in a hierarchical, demand/response storage management subsystem
US6006342A (en) * 1997-12-11 1999-12-21 International Business Machines Corporation Failover and failback system for a direct access storage device
US6173374B1 (en) * 1998-02-11 2001-01-09 Lsi Logic Corporation System and method for peer-to-peer accelerated I/O shipping between host bus adapters in clustered computer network
US6324654B1 (en) * 1998-03-30 2001-11-27 Legato Systems, Inc. Computer network remote data mirroring system
US6438661B1 (en) * 1999-03-03 2002-08-20 International Business Machines Corporation Method, system, and program for managing meta data in a storage system and rebuilding lost meta data in cache
US6378037B1 (en) * 1999-06-29 2002-04-23 International Business Machines Corporation Write-twice method of fail-safe write caching
US7043504B1 (en) * 2000-04-10 2006-05-09 International Business Machines Corporation System and method for parallel primary and secondary backup reading in recovery of multiple shared database data sets
JP3640349B2 (ja) 2001-07-10 2005-04-20 インターナショナル・ビジネス・マシーンズ・コーポレーション クラスタリング・システムおよびクラスタリング・システムにおける障害発生時のデータ復旧方法

Also Published As

Publication number Publication date
KR100621446B1 (ko) 2006-09-08
CN1573705A (zh) 2005-02-02
US20040255181A1 (en) 2004-12-16
KR20040104391A (ko) 2004-12-10
US7085886B2 (en) 2006-08-01
TW200506636A (en) 2005-02-16
TWI291103B (en) 2007-12-11
CN1300696C (zh) 2007-02-14
JP2004355623A (ja) 2004-12-16

Similar Documents

Publication Publication Date Title
JP4041473B2 (ja) マルチクラスタ・ストレージ・サブシステムのための自律型パワー・ロス・リカバリ
US7669008B2 (en) Destage management of redundant data copies
US5437022A (en) Storage controller having additional cache memory and a means for recovering from failure and reconfiguring a control unit thereof in response thereto
EP1585022B1 (en) Disk array device and data processing method thereof
EP0727745B1 (en) Cache memory control apparatus and method
US7809979B2 (en) Storage control apparatus and method
US7293196B2 (en) Method, apparatus, and system for preserving cache data of redundant storage controllers
US6604171B1 (en) Managing a cache memory
US20070050689A1 (en) Storage system comprising logical circuit configured in accordance with information in memory on PLD
US20080163385A1 (en) Method and apparatus for raid on memory
US20110010499A1 (en) Storage system, method of controlling storage system, and method of controlling control apparatus
JP2011170589A (ja) ストレージ制御装置、ストレージ装置およびストレージ制御方法
KR100827287B1 (ko) 반도체 보조 기억 장치 및 이를 이용한 데이터 저장 방법
US7171610B2 (en) Method, system, and article of manufacture for preventing data loss
US7130973B1 (en) Method and apparatus to restore data redundancy and utilize spare storage spaces
JP2000357059A (ja) ディスクアレイ装置
US20030037207A1 (en) Disk array apparatus
JP2009104369A (ja) ディスクサブシステム
JP2007058873A (ja) 不揮発メモリを使用したディスク制御装置
US9836359B2 (en) Storage and control method of the same
JPH09212424A (ja) ディスクキャッシュ及びディスクキャッシュ方法
JP2008217811A (ja) 不揮発メモリを使用したディスク制御装置
JP2000305717A (ja) ディスクアレイ装置およびディスクアクセスを高速化する方法
KR100205289B1 (ko) 기록데이타 손실 방지방법
JPH06161673A (ja) 二重化ディスクを使用する計算機システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070327

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees