JP2008515112A - 仮想順序付け書き込み - Google Patents

仮想順序付け書き込み Download PDF

Info

Publication number
JP2008515112A
JP2008515112A JP2007534801A JP2007534801A JP2008515112A JP 2008515112 A JP2008515112 A JP 2008515112A JP 2007534801 A JP2007534801 A JP 2007534801A JP 2007534801 A JP2007534801 A JP 2007534801A JP 2008515112 A JP2008515112 A JP 2008515112A
Authority
JP
Japan
Prior art keywords
data
storage device
slot
cache
sequence number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007534801A
Other languages
English (en)
Inventor
ロンジノフ、バディム
ダブリュ. ヨーダー、ベンジャミン
ジェイ. ハルステッド、マーク
メイリ、デイビッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC Corp filed Critical EMC Corp
Publication of JP2008515112A publication Critical patent/JP2008515112A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2064Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0804Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with main memory updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0866Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0866Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache
    • G06F12/0868Data transfer between cache memory and other subsystems, e.g. storage devices or host systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0866Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache
    • G06F12/0871Allocation or management of cache space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/28Using a specific disk cache architecture
    • G06F2212/283Plural cache memories
    • G06F2212/284Plural cache memories being distributed

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

データ記憶装置(62)への順序付けられた書き込みの処理は、データ記憶装置のキャッシュ(642)のスロット(652)内において第1のデータの部分(56)を受信し、ハッシュ・テーブル(702)を用いて、第1のデータの部分からのデータを含むキャッシュ・スロットとデータ記憶装置(62)の論理記憶装置(698)の場所との間の相関を提供することを含む。順序付けられた書き込みの処理は、更に、第1のデータの部分を含むキャッシュ・スロットに対するポインタ(674)の環状にリンク付けされたリストを保持することを含み得る。順序付けられた書き込みの処理は、更に、データ記憶装置(62)のキャッシュのスロット内において第2のデータの部分(58)を受信し、第1のデータの部分に対応する全てのデータがデータ記憶装置(698)に転送されたことを示すメッセージを受信することを含み得る。順序付けられた書き込みの処理は、更に、メッセージの受信に応答して、第1のデータの部分から論理記憶装置(698)にデータを記憶することを含み得る。順序付けられた書き込みの処理は、更に、ハッシュ・テーブル(702)を用いて、第2のデータの部分からのデータを含むキャッシュ・スロット(652)とデータ記憶装置(62)の論理記憶装置(698)の場所との間の相関を提供することを含み得る。

Description

本願は、コンピュータ記憶装置に関する。より詳細には、記憶装置の間でデータを転送する分野に関する。
ホスト・プロセッサ・システムは、複数のインターフェース・ユニット(ホスト・アダプタ)、ディスク・ドライブ、およびディスク・インターフェース・ユニット(ディスク・アダプタ)を含む記憶装置を用いてデータを記憶したり、引き出したりする。このような記憶装置は、例えば、マサチューセッツ州ホプキントンのEMCコーポレイションから提供され、ヤナイら(Yanai et al.)に付与された米国特許第5,206,939号明細書、ガルツァら(Galtzur et al.)に付与された米国特許第5,778,394号明細書、ヴィシィリツキーら(Vishlitzky at al. )に付与された米国特許第5,845,147号明細書、およびオフェック(Ofek)に付与された米国特許第5,857,208号明細書に開示されている。ホスト・システムは、共に設けられる複数のチャネルを通じて記憶装置にアクセスする。ホスト・システムは、記憶装置にチャネルを通じてデータを供給して制御情報にアクセスし、記憶装置は、同様に、チャネルを通じてホスト・システムにデータを供給する。ホスト・システムは、直接的に記憶装置のディスク・ドライブにアドレス指定しないが、その代わりに、複数の論理ディスク・ユニットとしてホスト・システムに現れるものをアクセスする。論理ディスク・ユニットは、実際のディスク・ドライブに対応していても、していなくてもよい。多数のホスト・システムが単一の記憶装置にアクセスすることを可能にすることで、多数のホスト・システムはその中に記憶されるデータを共有することができる。
一つの記憶装置から別の記憶装置にデータをコピーすることが望ましい場合がある。例えば、ホストが第1の記憶装置にデータを書き込む場合、該データを別の場所に設けられている第2の記憶装置にコピーすることが望ましく、第1の記憶装置を動作不能にさせる災害が生じたときにホスト(または別のホスト)が第2の記憶装置のデータを用いて動作を復旧することができる。このような性能は、例えば、マサチューセッツ州ホプキントンのEMCコーポレイションから提供されるリモート・データ・ファシリティ(RDF:Remote Data Facility)なる製品によってもたらされる。RDFでは、「一次記憶装置」(または「R1」)と称される第1の記憶装置がホストに接続される。「二次記憶装置」(または「R2」)と称される一つ以上の記憶装置は、ホストによって一次記憶装置に書き込まれたデータのコピーを受信する。ホストは、一次記憶装置と直接的に相互作用する。しかし、一つ以上の二次記憶装置には、一次記憶装置に対する全てのデータ変更がRDFを用いて自動的に供給される。一次記憶装置と二次記憶装置とは、ESCONリンク、ファイバー・チャネル・リンク、および/またはギガビット・イーサネット(登録商標)リンクのようなデータ・リンクによって接続される。RDFの機能は、各記憶装置に設けられるRDFアダプタ(RA:RDF adapter )により促進される。
RDFは、同期データ転送を可能にする。この場合、ホストから一次記憶装置に書き込まれるデータが一次記憶装置から二次記憶装置にRDFを用いて転送された後、二次記憶装置は一次記憶装置に対して受信を承認する。次いで、一次記憶装置は、書き込みの承認をホストに戻す。従って、同期モードでは、二次記憶装置へのRDF転送が完了され二次記憶装置によって承認されるまで、ホストは、一次記憶装置から書き込みの承認を受信しない。
同期RDFシステムの欠点は、各書き込み動作の待ち時間がRDF転送の承認を待つことで増加される点である。この問題は、一次記憶装置と二次記憶装置との間で距離が長いときにひどく、送信遅延により、RDF転送を行い、転送が完了した後に承認が戻されるに必要な時間遅延が許容可能ではない。
半同期モードでRDFを用いることも可能である。この場合、データはホストから一次記憶装置に書き込まれ、直ちにその書き込みは承認され、同時に、二次記憶装置へのデータの転送の処理が開始される。それにより、データの単一の転送について、このスキームは同期モードにおいてRDFを用いる際の幾つかの不都合な点を克服する。しかしながら、データ保全のため、半同期モードでは前の転送が二次記憶装置によって承認されるまで一次記憶装置は二次記憶装置にデータを転送することはできない。それにより、同期モードにおいてRDFを用いることに関連する障害は、前のデータの転送が二次記憶装置によって承認されるまで第2のデータ量の転送が生じないため、一回の繰り返し分だけ単に遅延される。
更なる可能性は、非同期モードでホストに一次記憶装置にデータを書き込ませ、一次記憶装置にバックグラウンドで二次記憶装置にデータをコピーさせることである。バックグラウンド・コピーは、順次に一次記憶装置の各トラック中を巡回することを伴い、特定のブロックが、該ブロックが最後にコピーされてから、変更されたと判断されると、そのブロックは一次記憶装置から二次記憶装置に転送される。この機構は、同期および半同期データ転送モードに関連付けられる待ち時間問題を減衰するが、一次記憶装置と二次記憶装置との間でデータの一貫性が保証されないため依然として問題がある。一次システムの故障のような問題が発生すると、二次システムは動かなくなりデータは使用不可能になる。
この問題に対する提案された解決策は、共に2002年8月21日に出願された米国仮特許出願第10/224,918号明細書および第10/225,021号明細書に開示されるシメトリックス自動複製(SAR:Symmetrix Automated Replication )処理である。SARは、標準論理装置をミラーする装置(BCV)を用いる。BCV装置は、ミラーされた後に標準論理装置からスプリットされ、スプリットされた後に標準論理装置に再同調(即ち、ミラーとして再確立)され得る。しかしながら、SAR処理の使用は、BCVを連続的にスプリットし、再同調する著しいオーバーヘッドを必要とする。SAR処理は、制御しているホストが動作可能であることに依存するホスト制御および管理を用いる。更に、SAR処理の実際的な実行に対するサイクル時間は、20乃至30分のオーダーであり、従って、RDFリンクおよび/または一次装置が故障したときに損失し得るデータの量は20乃至30分分のデータとなり得る。
従って、欠点を減少させる一方で上述の異なる技法のそれぞれの幾つかの有利な特性を発揮するRDFシステムが望ましい。このようなシステムは、一次装置と二次装置との間の距離に関係なく各ホストの書き込みに対する低い待ち時間を達成し、故障の場合に二次装置の一貫性(修復性)を提供する。
本発明によると、データ記憶装置への順序付けられた書き込みの処理は、データ記憶装置のキャッシュのスロット内において第1のデータの部分を受信すること、ハッシュ・テーブルを用いて、第1のデータの部分からのデータを含むキャッシュ・スロットとデータ記憶装置の論理記憶装置の場所との間の相関を提供すること、を含む。順序付けられた書き込みの処理は、更に、第1のデータの部分を含むキャッシュ・スロットに対するポインタの環状にリンク付けされたリストを保持することを含み得る。順序付けられた書き込みの処理は、更に、データ記憶装置のキャッシュのスロット内において第2のデータの部分を受信すること、第1のデータの部分に対応する全てのデータがデータ記憶装置に転送されたことを示すメッセージを受信すること、を含み得る。順序付けられた書き込みの処理は、更に、メッセージの受信に応答して、第1のデータの部分から論理記憶装置にデータを記憶することを含み得る。順序付けられた書き込みの処理は、更に、ハッシュ・テーブルを用いて、第2のデータの部分からのデータを含むキャッシュ・スロットとデータ記憶装置の論理記憶装置の場所との間の相関を提供することを含み得る。順序付けられた書き込みの処理は、更に、第2のデータの部分を含むキャッシュ・スロットに対するポインタの環状にリンク付けされたリストを保持することを含み得る。ハッシュ・テーブルは、キャッシュのスロットに対するポインタのテーブルであってもよい。順序付けられた書き込みの処理では、コリジョンに対応して、ハッシュ・テーブルのエントリーが第1のスロットへのポインタを含み、第1のスロットが第2のスロットへのポインタを含んでいてもよい。
更に、本発明によると、データ記憶装置への順序付けられた書き込みを処理するコンピュータ・ソフトウェアは、データ記憶装置のキャッシュのスロット内において第1のデータの部分を受信する実行可能なコードと、ハッシュ・テーブルを用いて、第1のデータの部分からのデータを含むキャッシュ・スロットとデータ記憶装置の論理記憶装置の場所との間の相関を提供する実行可能なコードと、を含む。コンピュータ・ソフトウェアは、更に、第1のデータの部分を含むキャッシュ・スロットに対するポインタの環状にリンク付けされたリストを保持する実行可能なコードを含み得る。コンピュータ・ソフトウェアは、更に、データ記憶装置のキャッシュのスロット内において第2のデータの部分を受信する実行可能なコードと、第1のデータの部分に対応する全てのデータがデータ記憶装置に転送されたことを示すメッセージを受信する実行可能なコードと、を含み得る。コンピュータ・ソフトウェアは、更に、メッセージの受信に応答して、第1のデータの部分から論理記憶装置にデータを記憶する実行可能なコードを含み得る。コンピュータ・ソフトウェアは、更に、ハッシュ・テーブルを用いて、第2のデータの部分からのデータを含むキャッシュ・スロットとデータ記憶装置の論理記憶装置の場所との間の相関を提供する実行可能なコードを含み得る。コンピュータ・ソフトウェアは、更に、第2のデータの部分を含むキャッシュ・スロットに対するポインタの環状にリンク付けされたリストを保持する実行可能なコードを含み得る。ハッシュ・テーブルは、キャッシュのスロットに対するポインタのテーブルであってもよい。コンピュータ・ソフトウェアは、更に、コリジョンに対応して、ハッシュ・テーブルのエントリーとして第1のスロットへのポインタを提供し、かつ第1のスロットに第2のスロットへのポインタを提供する実行可能なコードを含み得る。
更に、本発明によると、データ記憶装置は、データを含む少なくとも一つのディスク・ドライブと、少なくとも一つのディスク・ドライブに接続され、少なくとも一つのディスク・ドライブに記憶されるべきデータを受信する少なくとも一つのホスト・アダプタと、少なくとも一つのディスク・ドライブおよび少なくとも一つのホスト・アダプタに接続され、データ記憶装置に記憶されるべきデータを受信する少なくとも一つのリモート・アダプタと、を含み、データ記憶装置は、データ記憶装置のキャッシュのスロット内において第1のデータの部分を受信し、ハッシュ・テーブルを用いて、第1のデータの部分からのデータを含むキャッシュ・スロットとデータ記憶装置の論理記憶装置の場所との間の相関を提供する。データ記憶装置は、第1のデータの部分を含むキャッシュ・スロットに対するポインタの環状にリンク付けされたリストを保持し得る。データ記憶装置は、データ記憶装置のキャッシュのスロット内において第2のデータの部分を受信し、第1のデータの部分に対応する全てのデータがデータ記憶装置に転送されたことを示すメッセージを受信する。メッセージの受信に応答して、データ記憶装置は、第1のデータの部分からのデータを論理記憶装置に記憶する。
図1を参照すると、ダイアグラム20は、ホスト22と、ローカル記憶装置24と、リモート記憶装置26との関係を示す。ホスト22は、ホスト22とローカル記憶装置24との間のインターフェースを促進するホスト・アダプタ(HA:host adapter)28を介してローカル記憶装置24からデータを読み出す、あるいは、そこに書き込む。ダイアグラム20には、一つのホスト22と一つのHA28のみが示されているが、多数のHAが使用されてもよいし、一つ以上のHAに一つ以上のホストが接続されてもよいことは当業者には理解されるであろう。
ローカル記憶装置24からのデータは、RDFリンク29を介してリモート記憶装置26にコピーされ、リモート記憶装置26上のデータがローカル記憶装置24上のデータと同一になる。一つのリンク29のみが示されているが、記憶装置24と記憶装置26の間で追加的なリンクを設け、記憶装置24および記憶装置26の一方または両方と、他の記憶装置(図示せず)との間にリンクを設けることも可能である。ローカル記憶装置24からリモート記憶装置26へのデータの転送の間には時間遅延があるため、リモート記憶装置26は、ある瞬間にローカル記憶装置24上のデータと同一ではないデータを含み得ることに注意する。RDFを用いる通信は、本願に参照として組み込まれる例えば、米国特許第5,742,792号明細書に開示されている。
ローカル記憶装置24は、第1の複数のRDFアダプタ・ユニット(RA:RDF adapter unit)30a,30b,30cを含み、リモート記憶装置26は第2の複数のRA32a−32cを含む。RA30a−30c,32a−30cは、RDFリンク29に接続され、ホスト・アダプタ28と同様に記憶装置24と記憶装置26との間でデータを転送するために使用される。RA30a−30c,32a−30cに関連して使用されるソフトウェアは以下に詳細に説明される。
記憶装置24,26は、一つ以上のディスクを含み、それらのディスクのそれぞれは、記憶装置24,26にそれぞれ記憶されるデータの異なる部分を含み得る。図1は、記憶装置24が複数のディスク33a,33b,33cを含み、記憶装置26が複数のディスク34a,34b,34cを含むことを示している。本明細書で記載されるRDF機能は、RDFを用いてローカル記憶装置24のディスク33a−33cの少なくとも一部に対するデータがリモート記憶装置26のディスク34a−34cの少なくとも一部にコピーされるように適用される。記憶装置24,26の他のデータが記憶装置24と記憶装置26との間でコピーされず、従って、同一ではない場合もある。
各ディスク33a−33cは、対応する一つのディスク33a−33cにデータを供給するとともに、対応する一つのディスク33a−33cからデータを受信するディスク・アダプタ・ユニット(DA:disk adapter unit )35a,35b,35cに接続される。同様にして、リモート記憶装置26の複数のDA36a,36b,36cは、対応する一つのディスク34a−34cにデータを供給するとともに、対応する一つのディスク34a−34cからデータを受信するために使用される。内部データ経路は、ローカル記憶装置24のDA35a−35cと、HA28と、RA30a−30cとの間で存在する。同様にして、内部データ経路は、リモート記憶装置26のDA36a−36cと、RA32a−32cとの間で存在する。他の実施形態では、一つ以上のディスクが一つのDAからサービスを受けることが可能であり、一つ以上のDAが一つのディスクにサービスすることが可能であることに注意する。
ローカル記憶装置24は、DA35a−35cと、HA28と、RA30a−30cとの間のデータ転送を促進するために使用されるグローバル・メモリ37も含む。メモリ37は、一つ以上のDA35a−35cと、HA28と、RA30a−30cとによって実施されるべきタスク、および一つ以上のディスク33a−33cからフェッチされるデータ用のキャッシュを含む。同様にして、リモート記憶装置26は、一つ以上のDA36a−36cと、RA32a−32cとによって実施されるべきタスク、および、一つ以上のディスク34a−34cからフェッチされるデータ用のキャッシュを含むグローバル・メモリ38を含む。メモリ37,38の使用については、以下により詳細に説明される。
ディスク33a−33cに対応するローカル記憶装置24における記憶空間は、複数のボリュームまたは論理装置に細分化される。論理装置は、ディスク33a−33cの物理的な記憶空間に対応していても、対応しなくてもよい。従って、例えば、ディスク33aが複数の論理装置を含む、あるいは、単一の論理装置がディスク33a,33bの双方にまたがっていてもよい。同様にして、ディスク34a−34cを備えるリモート記憶装置26に対する記憶空間が複数のボリュームまたは論理装置に細分化されており、各論理装置は一つ以上のディスク34a−34cに対応していても、対応しなくてもよい
ローカル記憶装置24の一部とリモート記憶装置26の一部との間でRDFマッピングを提供することは、ローカル記憶装置24の論理装置に対するリモート・ミラーである、リモート記憶装置26の論理装置を設定することを含む。ホスト22は、ローカル記憶装置24の論理装置からデータを読み出し、且つ、そこに書き込み、RDFマッピングにより変更されたデータがローカル記憶装置24からリモート記憶装置26にRA30a−30c,32a−32c、およびRDFリンク29を用いて転送される。安定状態の動作では、リモート記憶装置26の論理装置はローカル記憶装置の論理装置のデータと同一のデータを含み、ホスト22によってアクセスされるローカル記憶装置24の論理装置は、「R1ボリューム」(または単に「R1」)と称され、R1ボリュームのデータのコピーを含むリモート記憶装置26の論理装置は「R2ボリューム」(または単に「R2」)と称される。ホストは、データをR1から読み出し、且つ、そこに書き込み、RDFはR1ボリュームからR2ボリュームへのデータの自動コピーおよび更新を取り扱う。
図2は、ホスト22からローカル記憶装置24およびリモート記憶装置26に至るデータの経路を示す。ホスト22からローカル記憶装置24に書き込まれるデータは、ローカル記憶装置24のデータ素子51によって示されるように、局所的に記憶される。ホスト22によってローカル記憶装置24に書き込まれるデータは、リンク29を介してローカル記憶装置24からリモート記憶装置26に送られることに関連してローカル記憶装置24によっても保持される。
本明細書に記載のシステムでは、ホスト22(例えば、レコード、複数のレコード、トラック等)による各データ書き込みにはシーケンス番号が割り当てられる。シーケンス番号は、書き込みに関連付けられる適当なデータ・フィールドで提供されてもよい。図2において、ホスト22による書き込みは、シーケンス番号Nが割り当てられて示されている。シーケンス番号Nが割り当てられたホスト22によって実施される全ての書き込みは、データの単一の部分52の形態で収集される。部分52は、ほぼ同時に生ずるホスト22による複数の別個の書き込みを表す。
一般的に、ローカル記憶装置24は、一つのシーケンス番号の部分を累積する一方で、前に累積された部分(前のシーケンス番号を有する)をリモート記憶装置26に送信する。従って、ローカル記憶装置24が、シーケンス番号Nが割り当てられたホスト22からの書き込みを累積する間に、前のシーケンス番号(N−1)に対して生じた書き込みは、ローカル記憶装置24からリンク29を介してリモート記憶装置26に送信される。部分54は、リモート記憶装置26にまだ送信されていないシーケンス番号N−1が割り当てられたホスト22からの書き込みを表す。
リモート記憶装置26は、シーケンス番号N−1が割り当てられた書き込みに対応する部分54からデータを受信して、シーケンス番号N−1を有するホスト書き込みの新たな部分56を構成する。データは、リンク29上で送信されたデータを承認する適当なRDFプロトコルを用いて送信されてもよい。リモート記憶装置26が部分54から全てのデータを受信すると、ローカル記憶装置24は、リモート記憶装置26に委任メッセージを送信して、部分56に対応するN−1のシーケンス番号が割り当てられた全てのデータを委任する。一般的に、一旦、特定のシーケンス番号に対応する部分が委任されると、該部分は、論理記憶装置に記憶される。これは、図2において示され、部分58がシーケンス番号N−2(即ち、ホスト22によるローカル記憶装置26への書き込みに関連して使用されている現在のシーケンス番号の二つ前)が割り当てられた書き込みに対応する。図2において、部分58は、リモート記憶装置26用のディスク記憶部を表すデータ素子62に書き込まれるものとして示される。従って、前のシーケンス番号(N−2)に対応する部分58がデータ素子62によって示されるリモート記憶装置26のディスク記憶部に書き込まれる間、リモート記憶装置26がシーケンス番号N−1に対応する部分56を受信し累積する。一部の実施形態では、部分58に対するデータは、書き込み用にマーキングされ(必ずしも直ちに書き込まれる訳ではない)、部分56に対するデータはマーキングされない。
動作の間、ホスト22は、データ素子51に局所的に記憶されるとともに、部分52に累積されるデータをローカル記憶装置24に書き込む。一旦、特定のシーケンス番号に対する全てのデータが累積されると(本明細書の他の所で説明される)、ローカル記憶装置24はシーケンス番号をインクリメントする。現在のシーケンス番号よりも一つ少ないものに対応する部分54からのデータは、リンク29を介してローカル記憶装置24からリモート記憶装置26に転送される。部分58は、リモート記憶装置26にメッセージを送信するローカル記憶装置24から委任されたシーケンス番号に対するデータに対応する。部分58からのデータは、リモート記憶装置26のディスク記憶部に書き込まれる。
特定の一つの部分52,54,56,58内の書き込みが必ずしも順序付けされていなくてもよいことに注意する。しかしながら、本明細書の他の所でより詳細に説明されているように、シーケンス番号N−2に対応する部分58に対する全ての書き込みは、シーケンス番号N−1に対応する部分54,56に対するいずれかの書き込みが開始される前に開始される。更に、シーケンス番号N−1に対応する部分54,56に対する全ての書き込みは、シーケンス番号Nに対応する部分52に対するいずれかの書き込みが開始される前に開始される。従って、ローカル記憶装置24とリモート記憶装置26との間での通信障害の際、リモート記憶装置26は、データの最後に委任された部分(図2の例では部分58)の書き込みを単に終えることで、データ素子62がある時間点より前に開始された全ての書き込みを含み、該時間点より後に開始された書き込みを含まないことに関して、リモート記憶装置26でのデータの状態の順序付けが確実となる。従って、R2は、R1の時間点のコピーを常に含み、R2装置から一貫した画像を再確立することが可能である。
図3を参照すると、ダイアグラム70は、部分52,54を構成し保持するために使用されるアイテムを示す。標準的な論理装置72は、ホスト22によって書き込まれるデータを含み、図2のデータ素子51および図1のディスク33a−33cに対応する。標準的な論理装置72は、ホスト22によってローカル記憶装置24に書き込まれたデータを含む。
二つのポインタのリンク付けされたリスト74,76が標準的な論理装置72に関連して使用される。リンク付けされたリスト74,76は、例えば、ローカル記憶装置24のメモリ37に記憶され得るデータに対応する。リンク付けされたリスト74は、ローカル記憶装置24に関連して使用されるキャッシュ88のスロットをそれぞれ指定する複数のポインタ81−85を含む。同様にして、リンク付けされたリスト76は、キャッシュ88のスロットをそれぞれ指定する複数のポインタ91−95を含む。一部の実施形態では、キャッシュ88は、ローカル記憶装置24のメモリ37に設けられる。キャッシュ88は、標準的な論理装置72への書き込みに関連して使用され、同時に、リンク付けされたリスト74,76に関連して使用される複数のキャッシュ・スロット102−104を含む。
リンク付けされたリスト74,76のそれぞれは、データの部分52,54のうちの一つのために使用されてもよい。例えば、リンク付けされたリスト74はシーケンス番号Nに対するデータの部分52に対応し、リンク付けされたリスト76はシーケンス番号N−1に対するデータの部分54に対応してもよい。データがホスト22によりローカル記憶装置24に書き込まれると、データはキャッシュ88に供給され、場合によっては(本明細書の他の所で説明される)、リンク付けされたリスト74の適当なポインタが形成される。本明細書の他の所で説明されるように、データが標準的な論理装置72にデステージされ、且つ、そのデータがリンク付けされたリスト74のポインタ81−85のうちの一つによってもはや指定されなくなるまで、データはキャッシュ88から除去されないことに注意する。
本明細書の実施形態において、リンク付けされたリスト74,76の一方は「活性的」と判断され、他方は「不活性」と判断される。例えば、シーケンス番号が偶数である場合、リンク付けされたリスト74は活性的であり、リンク付けされたリスト76は不活性である。リンク付けされたリスト74,76のうちの活性的なリストは、ホスト22からの書き込みを取り扱い、リンク付けされたリスト74,76のうちの不活性なリストはローカル記憶装置24からリモート記憶装置26に送信されるデータに対応する。
ホスト22によって書き込まれるデータがリンク付けされたリスト74,76のうちの活性的なリスト(シーケンス番号Nに対応する)を用いて累積され、リンク付けされたリスト74,76のうちの不活性のリスト(前のシーケンス番号N−1に対応する)に対応するデータはローカル記憶装置24からリモート記憶装置26に送信される。RA30a−30cは、リンク付けされたリスト74,76を用いて、ローカル記憶装置24からリモート記憶装置26に送信するデータを決定する。
一旦、リンク付けされたリスト74,76のうちの一つにおける特定の一つのポインタに対応するデータがリモート記憶装置26に送信されると、この特定の一つのポインタは、適当な一方のリンク付けされたリスト74,76から除去されてもよい。更に、データは、スロット中のデータが別の目的(例えば、標準的な論理装置72へのデステージ)のために必要でないことを前提として、キャッシュ88から除去されるようマーキングされてもよい(即ち、スロットは後の関係のない使用のためにスロットのプールに戻される)。全ての装置がもはやデータを使用しなくなるまでデータがキャッシュ88から除去されないことを確実にするために特定の機構が使用されてもよい。このような機構は、例えば、1996年7月16日に発行された米国特許第5,537,568号明細書、および2001年7月7日に出願された米国特許出願第09/850,551号明細書に記載されており、それぞれ本明細書に参照として組み込まれる。
図4を参照すると、スロット120、例えば、キャッシュ88のスロット102−104のうちの一つは、ヘッダ122とデータ124とを含む。ヘッダ122は、スロット120を管理するためにシステムによって使用されるオーバーヘッド情報に対応する。データ124は、スロット120に(一時的に)記憶されるディスクからの対応するデータである。ヘッダ122における情報は、ディスクに戻すポインタ、タイム・スタンプ等を含む。
ヘッダ122は、更に、本明細書に記載のシステムに関連して使用されるキャッシュ・スタンプ126を含む。本明細書の実施形態において、キャッシュ・スタンプ126は、8バイトである。そのうちの2バイトは、スロット120が本明細書に記載のシステムによって使用されているか否かを示す「パスワード」である。他の実施形態において、パスワードが1バイトで後続するバイトがパッドのために使用されてもよい。本明細書の他の所で説明されるように、特定の値に等しい2バイトのパスワード(場合によっては1バイト)は、スロット120がリンク付けされたリスト74,76のうちの少なくとも一つのエントリーによって指定されていることを示す。特定の値に等しくないパスワードは、スロットがリンク付けされたリスト74,76のエントリーによって指定されていないことを示す。パスワードの使用は本明細書の他の所で説明される。
キャッシュ・スタンプ126は、スロット120のデータ124のシーケンス番号(例えば、N,N−1,N−2等)を示す2バイトのフィールドを含む。本明細書の他の所で説明されるように、キャッシュ・スタンプ126のシーケンス番号のフィールドは、本明細書に記載の処理を促進するために使用されてもよい。キャッシュ・スタンプ126の残りの4バイトは、本明細書の他の所で説明されるようにポインタのために使用されてもよい。当然のことながら、シーケンス番号の2バイトと、ポインタの4バイトは、スロット120が一方のリスト74,76における少なくとも一つのエントリーによって指定されていることを示す特定の値にパスワードが等しいときにのみ有効である。
図5を参照すると、書き込み動作を実施するホスト22に関連してHA28によって実施されるステップを示すフロー・チャート140が示されている。当然のことながら、ホスト22が書き込みを実施するとき、データがR1/R2 RDFグループの一部であるか否かに関わらず、通常の方法で書き込みを取り扱うよう処理が行われる。例えば、ホスト22がディスクの一部分にデータを書き込むとき、書き込みはキャッシュ・スロットに対して行われ、最終的にディスクにデステージされる。キャッシュ・スロットは、新たなキャッシュ・スロットでもよいし、あるいは、同じトラックに対する前の読み取りおよび/または書き込み動作に関連して作成された既存のキャッシュ・スロットでもよい。
処理は、第1のステップ142から開始され、書き込みに対応するスロットがロックされる。本明細書の実施形態では、キャッシュ88の各スロット102−104は、標準的な論理装置72上のデータのトラックに対応する。ステップ142においてスロットをロックすることで、フロー・チャート140のステップに対応するHA28によって実施される処理中に当該スロットに対して更なる処理が動作されることが防止される。
ステップ142に後続するステップ144では、シーケンス番号に対する値がNに設定される。本明細書の他の所で説明されるように、ステップ144において得られるシーケンス番号に対する値は、スロットがロックされている間にHA28によって実施される書き込み動作全体にわたって保持される。本明細書の他の所で説明されるように、シーケンス番号は、書き込みが属するデータの部分52,54のうちの一つを設定するために各書き込みに割り当てられる。ホスト22によって実施される書き込みには、現在のシーケンス番号が割り当てられる。単一の書き込み動作が全体にわたって同一のシーケンス番号を保持することが有用である。
ステップ144に後続する検査ステップ146では、キャッシュ・スロットのパスワード・フィールドが有効であるか否かが判断される。上述したように、本明細書に記載のシステムは、キャッシュ・スロットが、ポインタのリンク付けされたリスト74,76のうちの一つに既に存在することを示すためにパスワード・フィールドを所定の値に設定する。ステップ146においてパスワード・フィールドが有効ではないと判断された場合(スロットが新たに、リスト74,76からのどのポインタもスロットを指定しない)、ステップ146からステップ148に制御が渡り、パスワードを所定の値に設定し、シーケンス番号フィールドをNに設定し、更に、ポインタ・フィールドをヌルに設定することで新たなスロットのキャッシュ・スタンプが設定される。他の実施形態では、ポインタ・フィールドは、スロット自体を指定するよう設定される。
ステップ148に後続するステップ152では、新たなスロットへのポインタがポインタのリスト74,76のうちの活性的なリストに追加される。本明細書の実施形態において、リスト74,76は、円形の二重にリンク付けられたリストであり、新たなポインタは従来の方法で円形の二重にリンク付けされたリストに追加される。当然のことながら、他の適当なデータ構造がリスト74,76を管理するために使用されてもよい。ステップ152に後続するステップ154では、フラグが設定される。ステップ154において、RDF_WPフラグ(RDF書き込み保留(RDF write pending )フラグ)が、スロットがRDFを用いてリモート記憶装置26に送信される必要があることを示すために設定される。更に、ステップ154では、IN_CACHEフラグが、スロットが標準的な論理装置72にデステージされる必要があることを示すために設定される。ステップ154に後続するステップ156では、ホスト22およびHA28によって書き込まれるデータがスロットに書き込まれる。ステップ156に後続するステップ158では、スロットがアンロックされる。ステップ158に後続して、処理が完了される。
スロットのパスワード・フィールドが有効であると検査ステップ146において判断された場合(スロットがリスト74,76のうちの少なくとも一つのポインタによって既に指定されていることを示す)、ステップ146から検査ステップ162に制御が渡り、スロットのシーケンス番号のフィールドが現在のシーケンス番号Nに等しいか否かが判断される。有効なパスワードを有するスロットのシーケンス番号のフィールドに対して二つの有効な可能性が存在することに注意する。一つは、シーケンス番号のフィールドが現在のシーケンス番号であるNに等しい可能性である。これは、シーケンス番号Nを有する前の書き込みにスロットが対応するときに生ずる。もう一方の可能性は、シーケンス番号のフィールドがN−1に等しくなることである。これは、シーケンス番号N−1を有する前の書き込みにスロットが対応するときに生ずる。シーケンス番号のフィールドに対する全ての他の値は無効である。従って、一部の実施形態では、ステップ162においてエラー/有効性チェックを含むことも可能であり、あるいは、エラー/有効性チェックを別のステップとして設けてもよい。このようなエラーは、メッセージをユーザに供給することを含む全ての適当な方法で取り扱われる。
スロットのシーケンス番号のフィールドにおける値が現在のシーケンス番号Nに等しいとステップ162において判断された場合、特別な処理は必要なく、ステップ162からステップ156に制御が渡り、上述のように、データがスロットに書き込まれる。シーケンス番号のフィールドの値がN−1(唯一の他の有効値)である場合、ステップ162からステップ164に制御が渡り、新たなスロットが得られる。ステップ164において得られる新たなスロットは、書き込まれるデータを記憶するために使用される。
ステップ164に後続するステップ166では、古いスロットからのデータがステップ164で得られた新たなスロットにコピーされる。コピーされたデータは、スロットが最初に作成されたときに前の書き込みに対してステップ154で設定されているべきであるRDF_WPフラグを含む。ステップ166に後続するステップ168では、パスワード・フィールドを適当な値に設定し、シーケンス番号のフィールドを現在のシーケンス番号Nに設定し、ポインタ・フィールドが古いスロットを指定するように設定することで、新たなスロットに対するキャッシュ・スタンプが設定される。ステップ168に後続するステップ172では、新たなスロットへのポインタがリンク付けされたリスト74,76のうちの活性的なリストに追加される。この場合、新たなスロットであるスロットにデータが書き込まれる上述のステップ156がステップ172に後続される。
図6を参照すると、フロー・チャート200は、ローカル記憶装置24からリモート記憶装置26にRDFデータを送信するためにリスト72,74のうちの不活性なリストをスキャンするRA30a−30cに関連して実施されるステップを示す。上述したように、リスト72,74のうちの不活性なリストは、リスト72,74のうちの活性的なリストを用いてホストからNサイクルがR1装置に書き込まれているときに、R1装置に対するN−1サイクルに対応するスロットを指定する。
処理は、第1のステップ202から開始され、リスト72,74のうちの不活性なリストにエントリーが存在するか否かが判断される。データが送信されると、対応するエントリーは、リスト72,74のうちの不活性なリストから除去される。加えて、新たな書き込みは、一般的に、リスト72,74のうちの不活性なリストにではなく、リスト72,74のうちの活性的なリストに供給される。従って、リスト72,74のうちの不活性なリストは、時間によってはデータを含まないことがある(本明細書の他の所で説明されるように、それが望ましい)。ステップ202において、送信されるべきデータが存在しないと判断されると、リスト72,74のうちの不活性なリストは、データが利用可能となるまで連続的にポーリングされる。送信するデータは、リスト72,74のうちの不活性なリストがリスト72,74のうちの活性的なリストになるか、あるいは、その逆になるサイクル切換(本明細書の他の所で説明される)に関連して利用可能となる。
ステップ202において、送信するのに利用可能なデータが存在すると判断されると、ステップ202からステップ204に制御が渡り、スロットが正しいことが確認される。ステップ204において実施される処理は、パスワード・フィールドが正しいことを確認すること、および、シーケンス番号のフィールドが正しいことを確認することを含む任意の「正常検査(sanity check)」である。スロットに正しくない(予想しない)データが存在する場合、エラーをユーザに通知し、可能性として、エラー回復処理を行うことを含むエラー処理が実施される。
ステップ204に後続するステップ212では、データが従来の方法でRDFを介して送信される。本明細書の実施形態では、スロット全体は送信されない。その代わりに、適当なミラー・ビットの組(レコードが変更されたことを示す)を有するスロット内のレコードだけがリモート記憶装置26に送信される。しかしながら、他の実施形態では、リモート記憶装置26が適当なミラー・ビットの組を有するレコードに対応するデータだけを書き込み、有効か否かが分からないトラックに対する他のデータを無視することを前提として、スロット全体が送信されることも可能である。ステップ212に後続する検査ステップ214では、送信されたデータがR2装置によって承認されたか否かが判断される。承認されない場合、ステップ214からステップ212に戻るフローで示されるようにデータが再送信される。他の実施形態では、データを送信して、その受信に応答するために別のより複雑な処理が使用されてもよい。このような処理は、データを送信する試みが数回失敗した後に実施されるエラー報告および代替の処理を含む。
一旦、ステップ214においてデータの送信が成功であったと判断されると、ステップ214からステップ216に制御が渡り、RDF_WPフラグ(データの送信がRDFを介して成功であったため)が消去される。ステップ216に後続するステップ218では、スロットが、リスト72,74のうちの不活性なリストに既存のエントリーを既に有するスロットへの書き込みに関連して作成された複製スロットであるか否かが判断される。この可能性は、ステップ162,164,166,168,172に関連して上述されている。ステップ218においてスロットが複製スロットであると判断されると、ステップ218からステップ222に制御が渡り、スロットが利用可能なスロットのプールに(再使用のために)戻される。更に、スロットで提供されるデータが全ての他の目的のためには有効ではないため、他のスロットより前に直ちに再使用されるよう、スロットは古くされる(または、何らかの他の適当な機構が適用される)。ステップ222またはスロットが複製スロットではない場合にはステップ218に後続するステップ224では、スロット・ヘッダのパスワード・フィールドが消去される、スロットが再使用されるときに、図5のステップ146における検査がスロットを新たなスロットとして正しく分類する。
ステップ224に後続するステップ226では、リスト72,74のうちで不活性なリストにおけるエントリーが除去される。ステップ226に後続して、制御がステップ202に戻り、上述したように、転送される必要があるデータに対応する追加的なエントリーがリスト72,74のうちの不活性なリストに存在するか否かが判断される。
図7を参照すると、ダイアグラム240は、リモート記憶装置26によって使用される部分56,58の作成および操作を示す。リンク29を介してリモート記憶装置26によって受信されたデータは、リモート記憶装置26のキャッシュ242に供給される。キャッシュ242は、例えば、リモート記憶装置26のメモリ38に設けられる。キャッシュ242は、標準的な論理記憶装置252のトラックにそれぞれマッピングされ得る複数のキャッシュ・スロット244−246を含む。キャッシュ242は、図3のキャッシュ88に類似し、リモート記憶装置26の標準的な論理記憶装置252にデステージされ得るデータを含み得る。標準的な論理記憶装置252は、図2に示すデータ素子62および図1に示すディスク34a−34cに対応する。
リモート記憶装置26は、更に、一対のキャッシュ専用仮想装置(COVD:cache only virtual device )254,256を含む。キャッシュ専用仮想装置254,256は、例えば、リモート記憶装置26のメモリ38に記憶され得る装置テーブルを対応付ける。各キャッシュ専用仮想装置254,256のテーブルのトラック・エントリーは、標準的な論理装置252のトラックを指定するか、キャッシュ242のスロットを指定する。キャッシュ専用仮想装置は、2003年3月25日に出願された「揮発性メモリを使用する仮想記憶装置(VIRTUAL STORAGE DEVICE THAT USES VOLATILE MEMORY)」なる名称の同時係属中の米国特許出願第10/396,800号明細書に記載されている。この出願は、本明細書に参照として組み込まれる。
複数のキャッシュ・スロット244−246が標準的な論理装置252への書き込みに関連して使用されてもよく、同時に、キャッシュ専用仮想装置254,256に関連して使用されてもよい。本明細書の実施形態では、キャッシュ専用仮想装置254,256のトラック・テーブル・エントリーのそれぞれは、該トラックに対するデータが標準的な論理装置252の対応するトラックに記憶されていることを示すためにヌルを含む。さもなければ、各キャッシュ専用仮想装置254,256に対するトラック・テーブルにおけるエントリーは、キャッシュ242のスロット244−246のうちの一つに対するポインタを含む。
キャッシュ専用仮想装置254,256のそれぞれは、データの部分56,58の一つに対応する。例えば、キャッシュ専用仮想装置254がデータの部分56に対応し、キャッシュ専用仮想装置256がデータの部分58に対応する。本明細書の実施形態では、キャッシュ専用仮想装置254,256のうちの一方が「活性的」と判断され、キャッシュ専用仮想装置254,256の他方が「不活性」と判断される。キャッシュ専用仮想装置254,256のうちの不活性な仮想装置は、ローカル記憶装置24から受信されているデータに対応し(即ち、部分56)、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置は、標準的な論理装置252に復元される(書き込まれる)データに対応する。
リンク29を介して受信されるローカル記憶装置24からのデータは、キャッシュ242のスロット244−246のうちの一つに配置される。キャッシュ専用仮想装置254,256のうちの不活性な仮想装置の対応するポインタが受信したデータを指定するよう設定される。同じシーケンス番号を有するその後のデータは同様にして処理される。ある時点で、ローカル記憶装置24は、同じシーケンス番号を用いて送信された全てのデータを委任するメッセージを供給する。一旦、特定のシーケンス番号に対するデータが委任されると、キャッシュ専用仮想装置254,256のうちの不活性な仮想装置が活性的となるか、あるいは、その逆となる。その時点で、キャッシュ専用仮想装置254,256のうちの現在活性的な仮想装置からのデータが標準的な論理装置252にコピーされ、キャッシュ専用仮想装置254,256のうちの不活性な仮想装置はローカル記憶装置24からリモート記憶装置26に送信される新たなデータ(新たなシーケンス番号を有する)を受信するために使用される。
データがキャッシュ専用仮想装置254,256のうちの活性的な仮想装置から除去されると(本明細書の他の所で説明される)、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置における対応するエントリーがヌルに設定される。更に、データは、スロット中のデータが別の目的(例えば、標準的な論理装置252へのデステージ)のために必要でないことを前提として、キャッシュ244から除去される(即ち、後の使用のためにフリー・スロットのプールにスロットが戻される)。全てのミラー(キャッシュ専用仮想装置254,256を含む)がもはやデータを使用しなくなるまでキャッシュ242からデータが除去されないことを確実にするために特定の機構が使用されてもよい。このような機構は、例えば、1996年7月16日に発行された米国特許第5,537,568号明細書、および、2001年7月7日に出願された米国特許出願第09/850,551号明細書に記載されており、それぞれ本明細書に参照として組み込まれる。
本明細書の他の所で説明される一部の実施形態では、リモート記憶装置は、ローカル記憶装置24によって使用されるリスト74,76のようなリンク付けされたリスト258,262を保持してもよい。リスト258,262は、変更された、対応するキャッシュ専用仮想装置254,256のスロットを識別する情報を含んでもよく、リスト258,262のうちの一方は、キャッシュ専用仮想装置254,256のうちの一方に対応し、リスト258,262のうちの他方は、キャッシュ専用仮想装置254,256のうちの他方に対応する。本明細書の他の所で説明されるように、リスト258,262はキャッシュ専用仮想装置254,256から標準的な論理装置252へのデータの復元を促進するために使用される。
図8を参照すると、フロー・チャート270は、ローカル記憶装置24によってリモート記憶装置26に送信され、委任されるシーケンス番号のデータを処理することに関連してリモート記憶装置26によって実施されるステップを示す。本明細書の他の所で説明されるように、ローカル記憶装置24はシーケンス番号を定期的にインクリメントする。それにより、ローカル記憶装置24は、前のシーケンス番号に対する全てのデータの送信を終了し、前のシーケンス番号に対して委任メッセージを送信する。
処理は、第1のステップ272から開始され、委任が受信される。ステップ272に後続する検査ステップ274では、リモート記憶装置26のキャッシュ専用仮想装置254,256のうちの活性的な仮想装置が空か否かが判断される。本明細書の他の所で説明されるように、リモート記憶装置26のキャッシュ専用仮想装置254,256のうちの不活性な仮想装置は、RDFを用いて送信されるローカル記憶装置24からのデータを累積するために使用され、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置は標準的な論理装置252に復元される。
検査ステップ274においてキャッシュ専用仮想装置254,256のうちの活性的な仮想装置が空ではないと判断された場合、検査ステップ274からステップ276に制御が渡り、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置に対する復元が更なる処理が実施される前に完了される。キャッシュ専用仮想装置254,256のうちの活性的な仮想装置からデータを復元することは、本明細書の他の所でより詳細に説明される。キャッシュ専用仮想装置254,256のうちの活性的な仮想装置が委任を取り扱い、次のシーケンス番号に対してデータを復元し始める前に空であることが有用である。
ステップ276に後続して、あるいは、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置が空であると判断された場合にはステップ274に後続して、ステップ278では、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置が不活性にされる。ステップ278に後続するステップ282では、キャッシュ専用仮想装置254,256のうちの前に不活性であった仮想装置(即ち、ステップ278の実行前に不活性であった仮想装置)が活性化される。ステップ278,282においてキャッシュ専用仮想装置254,256の活性的な仮想装置および不活性の仮想装置を交換することにより、次のシーケンス番号に対してローカル記憶装置24からデータを受信し始めるようキャッシュ専用仮想装置254,256のうちの現在不活性(且つ、空)の仮想装置を準備する。
ステップ282に後続するステップ284では、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置がリモート記憶装置26の標準的な論理装置252に復元される。キャッシュ専用仮想装置254,256のうちの活性的な仮想装置の標準的な論理装置252への復元は、以下により詳細に説明される。しかしながら、一部の実施形態では、ステップ284において復元処理が開始されるが、必ずしも完了されないことに注意する。ステップ284に後続するステップ286では、ローカル記憶装置24からリモート記憶装置26に送られる委任が承認されてローカル記憶装置24に戻され、ローカル記憶装置24に委任が成功であったことを通知する。ステップ286に続いて、処理が完了される。
図9を参照すると、フロー・チャート300は、リモート記憶装置26がキャッシュ専用仮想装置254,256のうちの活性的な仮想装置を復元する、図8のステップ276,284をより詳細に説明する。処理は、第1のステップ302から開始され、ポインタがキャッシュ専用仮想装置254,256のうちの活性的な仮想装置の第1のスロットを指定するよう設定される。ポインタは、それぞれ個別に処理されるキャッシュ専用仮想装置254,256のうちの活性的な仮想装置の各トラック・テーブル・エントリーを繰り返すために使用される。ステップ302に後続する検査ステップ304では、処理されているキャッシュ専用仮想装置254,256のうちの活性的な仮想装置のトラックが標準的な論理装置252を指定するか否かが判断される。指定する場合は、復元するものがない。指定しない場合は、ステップ304からステップ306に制御が渡り、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置の対応するスロットがロックされる。
ステップ306に後続する検査ステップ308では、標準的な論理装置252の対応するスロットがリモート記憶装置26のキャッシュに既に存在するか否かが判断される。存在する場合は、検査ステップ208からステップ312に制御が渡り、標準的な論理装置のスロットがロックされる。ステップ312に後続するステップ314では、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置からのデータが標準的な論理装置252に対するキャッシュにおけるデータと統合される。ステップ314においてデータを統合することは、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置の新たなデータで標準的な論理装置に対するデータを上書きすることを含む。レコード・レベル・フラグを提供する実施形態では、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置からの新たなレコードをキャッシュにおける標準的な論理装置252のレコードに対して単にORすることも可能であることに注意する。つまり、レコードが交互配置される場合、変更されたキャッシュ専用仮想装置254,256のうちの活性的な仮想装置からのレコードを使用し、そのレコードを標準的な論理装置252のキャッシュ・スロットに供給することのみが必要である。ステップ314に後続するステップ316では、標準的な論理装置252のスロットがアンロックされる。ステップ316に後続するステップ318では、処理されているキャッシュ専用仮想装置254,256のうちの活性的な仮想装置のスロットもアンロックされる。
検査ステップ308において、標準的な論理装置252の対応するスロットがキャッシュに存在しないと判断された場合、検査ステップ308からステップ322に制御が渡り、標準的な論理装置252のスロットがキャッシュにあり(例えば、IN_CACHEフラグが設定されてもよい)デステージされる必要があることを示すために標準的な論理装置242のスロットに対するトラック・エントリーが変更される。本明細書の他の所で説明されるように、一部の実施形態では、適当なミラー・ビット・セットを有するトラックのレコードだけがデステージされる必要がある。ステップ322に後続するステップ324では、トラックに対するデータがキャッシュに存在することを示すためにトラックに対するフラグが設定される。
ステップ324に後続するステップ326では、標準的な論理装置252に対するスロット・ポインタがキャッシュにおけるスロットを指定するよう変更される。ステップ326に後続する検査ステップ328では、ステップ322,324,326において実施された動作が成功であったか否かが判断される。場合によっては、「比較および交換」動作と呼ばれる単一の動作がステップ322,324,326を実施するために使用されてもよい。これらの動作が何らかの理由により成功しない場合、ステップ328からステップ308に制御が戻り、標準的な論理装置252の対応するトラックがキャッシュに存在するか否かが再び検査される。前の動作が成功であったと検査ステップ328において判断された場合、検査ステップ328から上述のステップ318に制御が渡る。
ステップ318に後続する検査ステップ332では、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置(復元されている)のキャッシュ・スロットが依然として使用されているか否かが判断される。場合によっては、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置に対するスロットが別のミラーによって依然として使用されている可能性がある。検査ステップ332において、キャッシュ専用仮想装置のスロットが別のミラーによって使用されていないと判断されたとき、検査ステップ332からステップ334に制御が渡り、他の処理によって使用されるようスロットが解放される(例えば、本明細書の他の所で説明されるように、利用可能なスロットのプールに復元される)。ステップ334に後続するステップ336では、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置の次のスロットを処理するために次のスロットが指定される。ステップ332においてキャッシュ専用仮想装置254,256のうちの活性的な仮想装置が別のミラーによって使用されていると判断された場合には、検査ステップ332からステップ336に到達することに注意する。更に、ステップ304において、処理されているスロットに関して、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置が標準的な論理装置252を指定すると判断された場合には、検査ステップ304からステップ336に到達することにも注意する。ステップ336に後続する検査ステップ338では、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置で処理されるべきスロットが更に存在するか否かが判断される。これ以上存在しない場合には、処理が完了される。存在する場合は、検査ステップ338からステップ304に制御が戻る。
別の実施形態では、図7に示すリスト258,262のような、リモート記憶装置26へのN−1サイクルに対応する受信データの部分56に対して変更されたスロットのリストを構成することが可能である。データを受信すると、リモート記憶装置26は、変更されたスロットのリンク付けされたリストを構成する。構成されるリストは、円形、線形(ヌル終端)、または、全ての他の適当な設計であってもよい。リストは、キャッシュ専用仮想装置254,256のうちの活性的な仮想装置を復元するために使用される。
図9のフロー・チャート300は、変更されたスロットのリストが使用される実施形態の動作を示す二つの代替的な経路342,344を示す。ステップ302において、ポインタ(変更されたスロットのリスト中を繰り返すために使用される)は、リストの第1のエレメントを指定するようにされる。代替の経路342によってステップ302からステップ306に到達される。変更されたスロットのリストを使用する実施形態において、リストのどのスロットも標準的な論理装置252を指定しないためステップ304が不要となる。
ステップ306に続いて、前の実施形態において上述したように処理が続けられるが、ステップ336は、COVDにおける次のスロットを指定する代わりに、変更されたスロットのリストを横断することを意味する。同様にして、ステップ338における検査は、ポインタがリストの最後に存在するか(または、円形のリンク付けされたリストの場合には始めに戻ったか)が判断される。更に、ステップ338において、処理するスロットが依然として存在すると判断された場合には、代替の経路344で示されるように、ステップ338からステップ306に制御が渡る。前述したように、変更されたスロットのリストを使用する実施形態について、ステップ304が省略され得る。
図10を参照すると、フロー・チャート350は、シーケンス番号を増加させるローカル記憶装置24に関連して実施されるステップを示す。処理は、第1のステップ352から開始され、ローカル記憶装置24はシーケンス番号を増加する前に少なくともM秒待機する。本明細書の実施形態では、Mは30であるが、当然のことながらMは任意の数でもよい。Mの値が大きいと、記憶装置24と記憶装置26との間の通信が中断された場合に損失し得るデータ量が増加する。しかしながら、Mの値が小さいと、シーケンス番号をより頻繁にインクリメントすることで生ずるオーバーヘッドの合計量が増加する。
ステップ352に後続する検査ステップ354では、ローカル記憶装置24の全てのHAが、前のシーケンス番号に対する全てのI/OをHAが完了したことを示すビットを設定したか否かが判断される。シーケンス番号が変わると、各HAは、変更に気付き、前のシーケンス番号の全てのI/Oが完了されたことを示すビットを設定する。例えば、シーケンス番号がN−1からNに変わると、HAは、HAがシーケンス番号N−1に対する全てのI/Oを完了したときにビットを設定する。場合によっては、HAに対する単一のI/Oに長い時間がかかり、シーケンス番号が変わった後も進行中の場合もあることに注意する。一部のシステムに対して、全てのHAがそれぞれのN−1のI/Oを完了したか否かを判断するために異なる機構が使用されてもよいことに注意する。異なる機構は、メモリ37中の装置テーブルを検査することを含む。
検査ステップ354において、前のシーケンス番号からのI/Oが完了されたと判断された場合、ステップ354からステップ356に制御が渡り、リスト74,76のうちの不活性のリストが空か否かが判断される。シーケンス番号の切換は、リスト74,76のうちの不活性のリストに対応する全てのデータがRDFプロトコルを用いてローカル記憶装置24からリモート記憶装置26に完全に送信されるまで行われない。一旦、リスト74,76のうちの不活性のリストが空であると判断されると、ステップ356からステップ358に制御が渡り、前のシーケンス番号に対する委任がローカル記憶装置24からリモート記憶装置26に送信される。前述のように、特定のシーケンス番号に対する委任メッセージを受信するリモート記憶装置26は、リモート記憶装置26にシーケンス番号に対応するデータを復元し始めさせる。
ステップ358に後続するステップ362では、リスト74,76のうちの不活性のリストに対するデータのコピーが一時停止される。本明細書の他の所で説明されるように、リストのうちの不活性のリストは、走査され、ローカル記憶装置24からの対応するデータをリモート記憶装置26に送信する。シーケンス番号の切換が完了されるまでデータのコピーを一時停止することが有用である。本明細書の実施形態では、一時停止は、RA30a−30cにメッセージを送信することで提供される。しかしながら、本明細書に記載のシステムを用いてデータを送信することを促進するために他の構成要素を用いる実施形態に関して、コピーの一時停止が他の構成要素に適当なメッセージ/コマンドを送信することで提供されることが当業者には理解されるであろう。
ステップ362に後続するステップ364では、シーケンス番号がインクリメントされる。ステップ364に後続するステップ366では、シーケンス番号のインクリメントに関連してビットが再び設定されるよう、検査ステップ354において使用されたHAに対するビットが全て消去される。ステップ366に後続する検査ステップ372では、リモート記憶装置26がステップ358において送信された委任メッセージを承認したか否かが判断される。一旦、リモート記憶装置26がステップ358において送信された委任メッセージを承認したと判断されると、ステップ372からステップ374に制御が渡り、ステップ362において提供されるコピーの一時停止が消去され、コピーが再開される。ステップ374に後続して、処理が終了される。シーケンス番号を連続的にインクリメントするために新たなサイクルを始めるようステップ374からステップ352に戻ることが可能であることに注意する。
活性的なデータおよび不活性なデータの部分に関連付けられるスロットを収集するためにR1装置でCOVDを使用することも可能である。この場合、R2装置と同様に、あるCOVDが不活性のシーケンス番号に関連付けられ、別のCOVDが活性的なシーケンス番号に関連付けられる。これについては以下に説明される。
図11を参照すると、ダイアグラム400は、部分52,54を構成し維持するために使用されるアイテムを示す。標準的な論理装置402は、ホスト22によって書き込まれたデータを含み、図2のデータ素子51および図1のディスク33a−33cに対応する。標準的な論理装置402は、ホスト22によってローカル記憶装置24に書き込まれたデータを含む。
二つのキャッシュ専用仮想装置404,406が標準的な論理装置402に関連して使用される。キャッシュ専用仮想装置404,406は、例えば、ローカル記憶装置24のメモリ37に記憶される装置テーブルを対応付ける。キャッシュ専用仮想装置404,406のそれぞれのテーブルの各トラック・エントリーは、標準的な論理装置402のトラックを指定するか、あるいはローカル記憶装置24に関連して使用されるキャッシュ408のスロットを指定する。一部の実施形態では、キャッシュ408は、ローカル記憶装置24のメモリ37に設けられてもよい。
キャッシュ408は、標準的な論理装置402への書き込みに関連して使用されると同時に、キャッシュ専用仮想装置404,406に関連して使用される複数のキャッシュ・スロット412−414を含む。本明細書の実施形態では、キャッシュ専用仮想装置404,406の各トラック・テーブル・エントリーは、標準的な論理装置402の対応するトラックを指定するためにヌルを含む。そのようで場合は、キャッシュ専用仮想装置404,406のそれぞれに対するトラック・テーブルにおけるエントリーは、キャッシュ408におけるスロット412−414の一つに対するポインタを含む。
キャッシュ専用仮想装置404,406のそれぞれは、データの部分52,54の一方に使用され、例えば、キャッシュ専用仮想装置404はシーケンス番号Nに対するデータの部分52に対応し、キャッシュ専用仮想装置406はシーケンス番号N−1に対するデータの部分54に対応する。従って、ホスト22によってローカル記憶装置24にデータが書き込まれるとき、データがキャッシュ408に供給され、キャッシュ専用仮想装置404の適当なポインタが調節される。本明細書の他の所で説明されるように、データが標準的な論理装置402にデステージされ、且つ、そのデータがキャッシュ専用仮想装置404によって解放されるまで、データは、キャッシュ408から除去されないことに注意する。
本明細書の実施形態では、キャッシュ専用仮想装置404,406のうちの一方は「活性的」と判断され、他方は「不活性」と判断される。それにより、例えば、シーケンス番号Nが偶数であるとき、キャッシュ専用仮想装置404は活性的でありキャッシュ専用仮想装置406は不活性である。キャッシュ専用仮想装置404,406のうちの活性的な仮想装置は、ホスト22からの書き込みを取り扱い、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置はローカル記憶装置24からリモート記憶装置26に送信されるデータに対応する。
ホスト22によって書き込まれるデータはキャッシュ専用仮想装置404,406のうちの活性的な仮想装置(シーケンス番号Nに対応する)を用いて累積され、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置(前のシーケンス番号N−1に対応する)に対応するデータはローカル記憶装置24からリモート記憶装置26に送信される。当該および関連する実施形態について、ローカル記憶装置のDA35a−35cは、ローカル記憶装置24からリモート記憶装置26にデータを送信するために一つ以上のRA30a−30cにコピー要求を送信するようキャッシュ専用仮想装置404,406のうちの不活性な仮想装置を走査する。従って、コピーの一時停止および再開に関連して上述したステップ362,374は、DA35a−35cにメッセージ/コマンドを供給することを含む。
一旦、リモート記憶装置26にデータが送信されると、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置における対応するエントリーはヌルに設定される。更に、データは、スロット中のデータが別の目的(例えば、標準的な論理装置402へのデステージ)のために必要とされない場合は、キャッシュ408から除去されてもよい(即ち、後の使用のためにスロットがスロットのプールに戻される)。全てのミラー(キャッシュ専用仮想装置404,406を含む)がデータをもはや使用しなくなるまでデータがキャッシュから除去されないことを確実にするために特定の機構が使用されてもよい。このような機構は、例えば、1996年7月16日に発行された米国特許第5,537,568号明細書、および2001年7月7日に出願された米国特許出願第09/850,551号明細書に記載されており、それぞれ本明細書に参照として組み込まれる。
図12を参照すると、フロー・チャート440は、本明細書に記載のシステムを提供するために二台のCOVDがR1装置によって使用される実施形態に関して書き込み動作を実施するホスト22に関連してHA28によって実施されるステップを示す。処理は、第1のステップ442から開始され、書き込みに対応するスロットがロックされる。本明細書の実施形態では、キャッシュ408中のスロット412−414のそれぞれは、標準的な論理装置402上のデータのトラックに対応する。ステップ442においてスロットをロックすることで、フロー・チャート440のステップに対応するHA28によって実施される処理中に更なる処理が当該スロットに対して実施されることが防止される。
ステップ442に後続するステップ444では、シーケンス番号に対する値がNに設定される。R1側でCOVDの代わりにリストを用いる実施形態のように、ステップ444で得られたシーケンス番号に対する値は、スロットがロックされている間にHA28によって実施される書き込み動作全体にわたって保持される。本明細書の他の所で説明されるように、シーケンス番号は、書き込みが属するデータの部分52,54のうちの一つを設定するために各書き込みに対して割り当てられる。ホスト22によって実施される書き込みには、現在のシーケンス番号が割り当てられる。単一の書き込み動作が同一のシーケンス番号を全体にわたって保持することが有用である。
ステップ444に後続するステップ446では、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置がステップ442でロックされていたスロット(動作されているスロット)を既に指定するか否かが判断される。これは、シーケンス番号が現在のシーケンス番号よりも一つ少ないときに同一のスロットへの書き込みが提供される場合に生ずる。前のシーケンス番号に対する書き込みに対応するデータは、リモート記憶装置26に送信されていない場合もある。
検査ステップ446においてキャッシュ専用仮想装置404,406のうちの不活性な仮想装置はスロットを指定していないと判断されると、検査ステップ446から別の検査ステップ448に制御が渡り、キャッシュ専用仮想装置404,406のうちの活性的な仮想装置がスロットを指定するか否かが判断される。シーケンス番号が現在のシーケンス番号と同一であるとともに、スロットへの前の書き込みがあった場合に、キャッシュ専用仮想装置404,406のうちの活性的な仮想装置はスロットを指定する。検査ステップ448においてキャッシュ専用仮想装置404,406のうちの活性的な仮想装置がスロットを指定していないと判断されると、検査ステップ448からステップ452に制御が渡り、新たなスロットがデータに対して得られる。ステップ452に後続するステップ454では、キャッシュ専用仮想装置404,406のうちの活性的な仮想装置がスロットを指定するにようにされる。
ステップ454に後続して、あるいは、キャッシュ専用仮想装置404,406のうちの活性的な仮想装置がスロットを指定する場合にはステップ448に後続して、ステップ456では、フラグが設定される。ステップ456では、スロットがRDFを用いてリモート記憶装置26に送信される必要があることを示すためにRDF_WPフラグ(RDF書き込み保留フラグ)が設定される。更に、ステップ456において、IN_CACHEフラグが、スロットが標準的な論理装置402にデステージされる必要があることを示すために設定される。場合によっては、キャッシュ専用仮想装置404,406のうちの活性的な仮想装置が既にスロット(ステップ448で判断されるように)を指定する場合、RDF_WPフラグおよびIN_CACHEフラグがステップ456の実行前に既に設定されている可能性がある。しかしながら、ステップ456でフラグを設定することで、以前の状態に関わらずフラグが正しく設定されることが確実になる。
ステップ456に後続するステップ458では、スロットを指定するトラック・テーブルの間接的なフラグが消去され、当該データが間接的に指定する異なるスロットではなく該スロットに供給されていることを示す。ステップ458に後続するステップ462では、ホスト22およびHA28によって書き込まれるデータがスロットに書き込まれる。ステップ462に後続するステップ464では、スロットがアンロックされる。ステップ464に後続して、処理が完了される。
検査ステップ446においてキャッシュ専用仮想装置404,406のうちの不活性な仮想装置がスロットを指定すると判断された場合、ステップ446からステップ472に制御が渡り、新たなスロットが得られる。ステップ472において得られた新たなスロットは、RDF転送を行うためにキャッシュ専用仮想装置404,406のうちの不活性の仮想装置のために使用され、古いスロットは、以下に説明するように、キャッシュ専用仮想装置404,406のうちの活性的な仮想装置に関連付けられる。
ステップ472に後続するステップ474では、古いスロットからのデータはステップ472において得られた新たなスロットにコピーされる。ステップ474に後続するステップ476では、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置に対するトラック・テーブル・エントリーは古いスロットを指定するがデータは古いスロットによって指定されている新たなスロットに存在することを示すために、間接的なフラグ(上述した)が設定される。従って、ステップ476において間接的なフラグを設定することは、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置のトラック・テーブルに作用し、そのトラック・テーブル・エントリーはデータが新たなスロットに存在することを示す。
ステップ476に後続するステップ478では、新たなスロットにおけるレコードに対するミラー・ビットが調節される。ステップ474において古いスロットから新たなスロットにデータがコピーされたときにコピーされた全てのローカル・ミラー・ビットは、新たなスロットの目的がキャッシュ専用仮想装置のうちの不活性な仮想装置に対して単にRDF転送を行うためだけであるため、消去される。古いスロットは、全てのローカル・ミラーを取り扱うために使用される。ステップ478に後続するステップ462では、データがスロットに書き込まれる。ステップ462に後続するステップ464では、スロットがアンロックされる。スロット464に後続して、処理が完了される。
図13を参照すると、フロー・チャート500は、リモート記憶装置26にデータの部分54を送信するローカル記憶装置24に関連して実施されるステップを示す。送信は、基本的に、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置が活性的であったときの前の繰り返し中に書き込まれたトラックに関してキャッシュ専用仮想装置404,406のうちの不活性な装置を走査することを含む。本実施形態では、ローカル記憶装置14のDA35a−35cは、キャッシュ専用仮想装置404,406のうちの不活性な装置を走査し、RDFプロトコルを用いて一つ以上のRA30a−30cによるリモート記憶装置26への送信のためにデータをコピーする。
処理は、第1のステップ502から開始され、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置の第1のトラックが、全てのトラックにわたる反復処理を始めるために指定される。第1のステップ502に後続する検査ステップ504では、RDF_WPフラグが設定されているか否かが判断される。本明細書の他の所で説明されるように、RDF_WPフラグは、スロット(トラック)がRDFリンクを介して送信される必要があるデータを含むことを示すために使用される。設定されているRDF_WPフラグは、スロット(トラック)における少なくとも一部のデータがRDFを用いて送信されるべきことを示す。本明細書の実施形態では、スロット全体は送信されない。むしろ、適当なミラー・ビット・セット(レコードが変更されたことを示す)を有するスロット内のレコードのみがリモート記憶装置26に送信される。しかしながら、他の実施形態では、リモート記憶装置26が適当なミラー・ビット・セットを有するレコートに対応するデータのみを書き込み、有効か否かが明らかではないトラックに対する他のデータを無視することを前提として、スロット全体が送信されてもよい。
検査ステップ504において、処理されるキャッシュ・スロットにRDF_WPが設定されていると判断された場合、ステップ504から検査ステップ505に制御が渡り、スロットがデータを含むか、あるいはスロットが当該データを含む別のスロットを指定する間接的スロットである否かが判断される。場合によっては、スロットは、スロットに対応するディスクの部分にデータを含まない場合もある。その代わりに、スロットは、該データを含む別のスロットを指定する間接的スロットとなり得る。ステップ505においてスロットが間接的スロットであると判断された場合、ステップ505からステップ506に制御が渡り、(間接的スロットによって指定されたスロットから)データが得られる。従って、スロットが直接的スロットである場合は、RDFによって送信されるべきデータはスロットに記憶され、スロットが間接的スロットである場合は、RDFによって送信されるべきデータは間接的スロットによって指定される別のスロットに存在する。
ステップ506に後続して、あるいは、スロットが直接的スロットである場合にはステップ505に後続して、ステップ507では、(スロットから直接的にまたは間接的に)送信されるデータが、RDFプロトコルを用いてローカル記憶装置24からリモート記憶装置26に送信されるようDA35a−35cの一つによってコピーされる。ステップ507に後続する検査ステップ508では、リモート記憶装置26がデータの受信を承認したか否かが判断される。承認しない場合は、ステップ508からステップ507に制御が戻り、データを再送信する。他の実施形態では、異なる、より複雑な処理がデータを送信してその受信を承認するために使用されてもよい。このような処理は、データを送信するための試み数回失敗した後に実施されるエラー報告、および、代替の処理を含んでもよい。
一旦、検査ステップ508においてデータの送信が成功であったと判断されると、ステップ508からステップ512に制御が渡り、RDF_WP(RDFを介したデータの送信が成功したため)が消去される。ステップ512に後続するステップ514では、少なくともRDFミラー(R2)がもはやデータを必要としなくなることを示すために適当なミラー・フラグが消去される。本明細書の他の実施形態では、スロット(トラック)の一部である各レコードは、どのミラーが特定のレコードを使用するかを示す個々のミラー・フラグを有する。R2装置は、レコードのそれぞれに対するミラーの一つであり、R2装置に対応するフラグがステップ514において消去される。
ステップ514に後続するステップ516では、処理されているトラックの任意のレコードが(他のミラー装置のための)任意の他のミラー・フラグを有しているか否かが判断される。有していない場合は、ステップ516からステップ518に制御は渡り、スロットは開放される(即ち、もはや使用されない)。一部の実施形態では、未使用のスロットが使用可能なスロットのプールに保持されている。追加的なフラグがスロットのレコードの一部に依然として設定されている場合、そのレコードは標準的な論理装置402にデステージされる必要があるか、あるいは、他のミラー(別のR2装置を含む)によって使用されていることを意味することに注意する。ステップ518に後続して、あるいは、より多くのミラー・フラグが存在する場合にはステップ516に後続して、ステップ522では、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置の各トラック・エントリーにわたって反復して使用されるポインタが次のトラックを指定する。ステップ522に後続する検査ステップ524では、処理されるべきトラックが、キャッシュ専用仮想装置404,406のうちの不活性な仮想装置に更に存在するか否かが判断される。存在しない場合には、処理は完了される。存在する場合には、上述の検査ステップ504に制御が戻る。ステップ522は、処理されているトラックに対してRDF_WPフラグが設定されていないと判断された場合には、検査ステップ504からも到達される。
本願記載の別の実施形態では、図7のダイアグラム240に示すようにR2装置にCOVDを使用しないことも可能である。つまり、R2装置でCOVDを使用することなく非同期データのR2受信を実行することが可能である。
図14を参照すると、ダイアグラム640はデータを受信するリモート記憶装置26に設けられるキャッシュ642を示す。キャッシュ642は、ローカル記憶装置24から受信する非同期データが配置される複数のスロット652−654を含む。キャッシュ642のスロット652−654に対するポインタを含む第1の環状にリンク付けされたリスト674および第2の環状にリンク付けされたリスト676も図示される。例えば、環状にリンク付けされたリスト674は、キャッシュ642中のスロット652−654の一つをそれぞれ指す複数のポインタ681−685を含む。同様にして、環状にリンク付けされたリスト676は、キャッシュ642中のスロット652−654の一つをそれぞれ指す複数のポインタ691−695を含む。標準的な論理装置698もキャッシュ642の一部分にマッピングされる。
本願の一実施形態では、一方のリスト674,676は不活性的なデータの部分(例えば、図2に示す部分56)に対応し、他方のリスト674,676は活性的なデータの部分(例えば、図2の部分58)に対応する。図7のダイアグラム240および対応するテキストに関連して本願の他の箇所で記載するように、受信データは、不活性的な方のデータの部分を用いて蓄積され、活性的な方のデータの部分は標準的な論理装置698にデータを記憶するために使用される。従って、新しいデータが到着すると、キャッシュ642に配置され、データを受信した際に不活性的なデータの部分である方の環状にリンク付けされたリスト674,676に新しいポインタが追加される。
ある場合では、標準的な論理装置698(または全ての他の論理装置)の一部分が、受信データに対応して関連するスロットをキャッシュ642に有しているか否かを判断することが有用となる場合もある。当然のことながら、キャッシュ642中に対応するスロットがあるか否かを判断するためにリスト674,676の両方を検討することも可能である。しかしながら、装置にデステージされるために待機している、対応する一つのスロット652−654がキャッシュ642中にあるか否かを判断するために特定の装置、シリンダ、および、論理装置のヘッド値を使用する方法があればより有用である。
図15を参照すると、ダイアグラム700は複数のエントリー704−706を含むハッシュ・テーブル702を示す。本願記載の実施形態では、各エントリー704−706は、ヌル・ポインタを含むか、あるいは、受信済であるが標準的な論理装置698(または別の標準的な論理装置)にまだ記憶されていないデータに対応するキャッシュ・スロット652−654の一つを指す。テーブル702では、対応するエントリーを探すためのインデックスをテーブル702に付けるために装置、シリンダ、および、ヘッドの特定の値を用いて数学的演算を実行するハッシュ関数を用いてインデックスが付けられる。それにより、データがR2装置によって受信されると、テーブル702中のインデックス値を探すためにハッシュ関数が、装置、シリンダ、および、ヘッドに適用され、キャッシュ642中の特定のスロット652−654を指している対応する一つのエントリー704−706にポインタが書き込まれる。一旦、受信データが標準的な論理装置698(または別の装置)に適当にデステージされると、該対応する一つのエントリー704−706はヌルに設定される。ハッシュ・テーブル702により、標準的な論理装置の特定の部分がまだデステージされていない受信データに対応するか否かを迅速に判断することが可能となる。本願記載のシステムでは、テーブル702にインデックスを付けるためにどの適当なハッシュ関数が使用されてもよい。
ある場合では、装置、シリンダ、および、ヘッドに対する異なる値によって付けられたインデックスと同じインデックスを、特定の装置、シリンダ、および、ヘッド値がテーブル702に付けることも可能である。これは、いわゆる「コリジョン」と呼ばれる。コリジョンが起こると、テーブル702への第2のエントリーは設けられた同じインデックスに対応し、第2のエントリーは特定のインデックスが一つ以上のエントリーに対応するよう第1のエントリーにリンク付けされる。例えば、テーブル702の素子705にリンク付けされている素子708によって例示される。従って、第1の装置、シリンダ、および、ヘッドは、エントリー705にインデックスを付けるようハッシュされる一方で、該インデックスについて同じ値を生成するために別の装置、シリンダ、および、ヘッドがハッシュ関数に入力される。本願記載の実施形態では、エントリー705は第1の装置、シリンダ、および、ヘッドに対応するキャッシュ642中のデータを指すために使用され、エントリー708は第2の装置、シリンダ、および、ヘッドに対応するキャッシュ642中のデータを指すために使用される。当然のことながら、適当な装置にデータがデステージされると、対応するエントリー705,708はテーブル700から削除されてもよい。
任意の数のエントリーが単一のインデックスに対応してもよく、例えば、同じインデックスを生成するために装置、シリンダ、および、ヘッドに対して別個の三組の値を生ずるコリジョンが起きた場合、テーブル702には特定のインクデックスについて三つ(以上)のエントリーが一緒にリンク付けされる。更に、追加的なテーブル(例えば、第2のテーブル、第3のテーブル、第4のテーブル、等)を設ける等、コリジョンを処理するために他の適当な技法が使用されてもよいことに注意する。
図16を参照すると、ダイアグラム720は、複数のエントリー724−726を含むハッシュ・テーブル722の代替的な実施形態を示す図である。図16の実施形態は、図15の実施形態に類似するが、本願で説明するように幾つかの相違点がある。各エントリー724−726は、ヌル・ポインタを含むか、あるいは、受信済であるがまだ標準的な論理装置698(または別の標準的な論理装置)に記憶されていないデータに対応する、ダイアグラム720に示すキャッシュ・スロット728,832,734の一つを指す。テーブル722では、対応するエントリーを探すためのインデックステーブル722に付けるために装置、シリンダ、および、ヘッドの特定の値を用いて数学的演算を実行するハッシュ関数を用いてインデックスが付けられる。それにより、R2装置によってデータが受信されると、テーブル722中のインデックス値を探すためにハッシュ関数が装置、シリンダ、および、ヘッドに適用され、特定のスロット728,832,834を指している対応する一つのエントリー724−726にポインタが書き込まれる。一旦、受信データが標準的な論理装置698(または別の装置)に適当にデステージされると、該対応する一つのエントリー724−726は適当に調節される。ハッシュ・テーブル722により、標準的な論理装置の特定の部分がまだデステージされていない受信データに対応するか否かを迅速に判断することができる。本願記載のシステムでは、テーブル722にインデックスを付けるためにどの適当なハッシュ関数が使用されてもよい。
図16に示す実施形態について、コリジョンが起きた場合、テーブル・エントリーが指している第1のスロットは、コリジョンを引き起こした第2のスロットを指している。例えば、スロット732とスロット736がテーブル・エントリー725でコリジョンを起こすと、テーブル・エントリー725はスロット732を指し、スロット732はスロット736を指す。従って、後続するスロットを追加することは先行するスロットに対するポインタ値を変化させることだけを伴うため、後続するスロットが追加されたとしてもテーブル722はコリジョンによって変更されない。当然のことながら、任意の数のスロットが単一のテーブル・エントリーに対応してもよい。
任意の数のエントリーが単一のインデックスに対応してもよく、例えば、同じインデックスを生成するために装置、シリンダ、および、ヘッドに対して別個の三組の値を生ずるコリジョンが起きた場合、テーブル702には特定のインクデックスについて三つ(以上)のエントリーが一緒にリンク付けされる。更に、追加的なテーブル(例えば、第2のテーブル、第3のテーブル、第4のテーブル、等)を設ける等、コリジョンを扱うために他の適当な技法が使用されてもよいことに注意する。
本発明を様々な実施形態に関連して説明したが、その変更態様も当業者には容易に明らであろう。本発明の技術思想および範囲は添付の特許請求の範囲に記載される。
本明細書に記載のシステムに関連して使用されるホスト、ローカル記憶装置、およびリモート・データ記憶装置を示す概略図。 本明細書に記載のシステムに関連して使用されるホスト、ローカル記憶装置、およびリモート・データ記憶装置間のデータのフローを示す概略図。 本明細書に記載のシステムによる、ローカル記憶装置上にデータの部分を構成し操作するアイテムを示す概略図。 本明細書に記載のシステムに関連して使用されるスロットのデータ構造を示す図。 本明細書に記載のシステムによる、ホストによる書き込みに応答する、ホスト・アダプタ(HA)の動作を示すフロー・チャート。 本明細書に記載のシステムによる、ローカル記憶装置からデータ記憶装置へのデータの転送を示すフロー・チャート。 本明細書に記載のシステムによる、リモート記憶装置上にデータの部分を構成し操作するアイテムを示す概略図。 本明細書に記載のシステムによる、ローカル記憶装置から委任インジケータを受信することに関連してリモート記憶装置によって実施されるステップを示すフロー・チャート。 本明細書に記載のシステムによる、送信されたデータのリモート記憶装置における記憶を示すフロー・チャート。 本明細書に記載のシステムによる、ローカル記憶装置がシーケンス番号をインクリメントすることに関連して実施されるステップを示すフロー・チャート。 本明細書に記載のシステムの別の実施形態による、ローカル記憶装置上にデータの部分を構成し操作するアイテムを示す概略図。 本明細書に記載のシステムの別の実施形態による、ホストによる書き込みに応答するホスト・アダプタ(HA)の動作を示すフロー・チャート。 本明細書に記載のシステムの別の実施形態による、ローカル記憶装置からリモート記憶装置へのデータの転送を示すフロー・チャート。 本願記載のシステムによる、リモート記憶装置でデータの部分を構成し操作するアイテムを例示する概略図。 本願記載のシステムによる、リモート記憶装置によって受信されるデータを含むスロットに論理装置の場所をマッピングするために使用されるテーブルを示す図。 本願記載のシステムによる、リモート記憶装置によって受信されるデータを含むスロットに論理装置の場所をマッピングするために使用されるテーブルの別の実施形態を示す図。

Claims (10)

  1. データ記憶装置への順序付けられた書き込みを処理する方法であって、
    前記データ記憶装置のキャッシュのスロット内において第1のデータの部分を受信すること、
    ハッシュ・テーブルを用いて、前記第1のデータの部分からのデータを含むキャッシュ・スロットと前記データ記憶装置の論理記憶装置の場所との間の相関を提供すること、
    を備える方法。
  2. 請求項1に記載の方法であって、更に、
    前記データ記憶装置の前記キャッシュのスロット内において第2のデータの部分を受信すること、
    前記第1のデータの部分に対応する全てのデータが前記データ記憶装置に転送されたことを示すメッセージを受信すること、
    を備える方法。
  3. 請求項2に記載の方法であって、更に、
    前記メッセージの受信に応答して、前記第1のデータの部分から前記論理記憶装置にデータを記憶すること、
    を備える方法。
  4. 請求項2に記載の方法であって、更に、
    ハッシュ・テーブルを用いて、前記第2のデータの部分からのデータを含むキャッシュ・スロットと前記データ記憶装置の論理記憶装置の場所との間の相関を提供すること、
    を備える方法。
  5. 請求項1に記載の方法において、前記ハッシュ・テーブルは、前記キャッシュのスロットに対するポインタのテーブルである、方法。
  6. 請求項5に記載の方法において、コリジョンに対応して、前記ハッシュ・テーブルのエントリーが第1のスロットへのポインタを含み、前記第1のスロットが第2のスロットへのポインタを含む、方法。
  7. データ記憶装置であって、
    データを含む少なくとも一つのディスク・ドライブと、
    前記少なくとも一つのディスク・ドライブに接続され、前記少なくとも一つのディスク・ドライブに記憶されるべきデータを受信する少なくとも一つのホスト・アダプタと、
    前記少なくとも一つのディスク・ドライブおよび前記少なくとも一つのホスト・アダプタに接続され、前記データ記憶装置に記憶されるべきデータを受信する少なくとも一つのリモート・アダプタと、
    を備え、前記データ記憶装置は、前記データ記憶装置のキャッシュのスロット内において第1のデータの部分を受信し、ハッシュ・テーブルを用いて、前記第1のデータの部分からのデータを含むキャッシュ・スロットと前記データ記憶装置の論理記憶装置の場所との間の相関を提供する、データ記憶装置。
  8. 請求項7に記載のデータ記憶装置において、該データ記憶装置は、前記第1のデータの部分を含むキャッシュ・スロットに対するポインタの環状にリンク付けされたリストを保持する、データ記憶装置。
  9. 請求項7に記載のデータ記憶装置において、該データ記憶装置は、該データ記憶装置の前記キャッシュのスロット内において第2のデータの部分を受信し、前記第1のデータの部分に対応する全てのデータが該データ記憶装置に転送されたことを示すメッセージを受信する、データ記憶装置。
  10. 請求項9に記載のデータ記憶装置において、該データ記憶装置は、前記メッセージの受信に応答して、前記第1のデータの部分からのデータを前記論理記憶装置に記憶する、データ記憶装置。
JP2007534801A 2004-10-01 2005-09-30 仮想順序付け書き込み Pending JP2008515112A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/956,493 US7114033B2 (en) 2003-03-25 2004-10-01 Handling data writes copied from a remote data storage device
PCT/US2005/035201 WO2006039493A2 (en) 2004-10-01 2005-09-30 Virtual ordered writes

Publications (1)

Publication Number Publication Date
JP2008515112A true JP2008515112A (ja) 2008-05-08

Family

ID=36143082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007534801A Pending JP2008515112A (ja) 2004-10-01 2005-09-30 仮想順序付け書き込み

Country Status (5)

Country Link
US (2) US7114033B2 (ja)
EP (1) EP1805628A4 (ja)
JP (1) JP2008515112A (ja)
CN (1) CN101031891A (ja)
WO (1) WO2006039493A2 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103727B2 (en) 2002-07-30 2006-09-05 Hitachi, Ltd. Storage system for multi-site remote copy
JP4021823B2 (ja) * 2003-09-01 2007-12-12 株式会社日立製作所 リモートコピーシステム及びリモートコピーの方法
US8032726B2 (en) * 2003-12-03 2011-10-04 Hitachi, Ltd Remote copy system
US7437389B2 (en) * 2004-03-10 2008-10-14 Hitachi, Ltd. Remote copy system
US7724599B2 (en) * 2003-12-03 2010-05-25 Hitachi, Ltd. Remote copy system
US7085788B2 (en) * 2003-12-03 2006-08-01 Hitachi, Ltd. Remote copy system configured to receive both a write request including a write time and a write request not including a write time.
JP4549709B2 (ja) * 2004-03-23 2010-09-22 株式会社日立製作所 ストレージ装置
JP4477950B2 (ja) * 2004-07-07 2010-06-09 株式会社日立製作所 リモートコピーシステム及び記憶装置システム
US7330861B2 (en) 2004-09-10 2008-02-12 Hitachi, Ltd. Remote copying system and method of controlling remote copying
JP4915775B2 (ja) * 2006-03-28 2012-04-11 株式会社日立製作所 ストレージシステム及びストレージシステムのリモートコピー制御方法
US20070234105A1 (en) * 2006-03-31 2007-10-04 Quinn Brett A Failover to asynchronous backup site in connection with triangular asynchronous replication
US7647525B2 (en) * 2006-03-31 2010-01-12 Emc Corporation Resumption of operations following failover in connection with triangular asynchronous replication
US8843783B2 (en) * 2006-03-31 2014-09-23 Emc Corporation Failover to backup site in connection with triangular asynchronous replication
US7430646B2 (en) * 2006-03-31 2008-09-30 Emc Corporation Planned switchover in connection with triangular asynchronous replication
US7680997B1 (en) 2006-12-29 2010-03-16 Emc Corporation Data recovery simulation
US7752404B2 (en) * 2006-12-29 2010-07-06 Emc Corporation Toggling between concurrent and cascaded triangular asynchronous replication
US7734884B1 (en) 2006-12-29 2010-06-08 Emc Corporation Simultaneous concurrent and cascaded triangular asynchronous replication
US7779291B2 (en) * 2006-12-29 2010-08-17 Emc Corporation Four site triangular asynchronous replication
US8261029B1 (en) 2007-03-28 2012-09-04 Emc Corporation Dynamic balancing of writes between multiple storage devices
US8423616B2 (en) * 2007-05-03 2013-04-16 Microsoft Corporation Identifying and correlating electronic mail messages
JP2010039986A (ja) * 2008-08-08 2010-02-18 Hitachi Ltd データのバックアップを管理する計算機システム及び方法
US8019826B2 (en) 2008-09-29 2011-09-13 Cisco Technology, Inc. Reliable reception of messages written via RDMA using hashing
US8688916B2 (en) 2011-04-22 2014-04-01 Hitachi, Ltd. Storage system and data processing method using cache memory
US9330048B1 (en) 2013-01-28 2016-05-03 Emc Corporation Balancing response times for synchronous I/O requests having different priorities
US9588886B2 (en) * 2013-03-15 2017-03-07 Seagate Technology Llc Staging sorted data in intermediate storage
US9606870B1 (en) 2014-03-31 2017-03-28 EMC IP Holding Company LLC Data reduction techniques in a flash-based key/value cluster storage
US9846642B2 (en) * 2014-10-21 2017-12-19 Samsung Electronics Co., Ltd. Efficient key collision handling
US10324635B1 (en) 2016-03-22 2019-06-18 EMC IP Holding Company LLC Adaptive compression for data replication in a storage system
US10565058B1 (en) 2016-03-30 2020-02-18 EMC IP Holding Company LLC Adaptive hash-based data replication in a storage system
US10496668B1 (en) * 2016-06-28 2019-12-03 EMC IP Holding Company LLC Optimized tender processing of hash-based replicated data
US10503609B1 (en) 2017-04-27 2019-12-10 EMC IP Holding Company LLC Replication link smoothing using historical data
US10409520B1 (en) 2017-04-27 2019-09-10 EMC IP Holding Company LLC Replication of content-based storage using address space slices
US10853221B2 (en) 2018-05-04 2020-12-01 EMC IP Holding Company LLC Performance evaluation and comparison of storage systems
US10860239B2 (en) 2018-05-04 2020-12-08 EMC IP Holding Company LLC Fan-out asynchronous replication caching
US11360688B2 (en) 2018-05-04 2022-06-14 EMC IP Holding Company LLC Cascading snapshot creation in a native replication 3-site configuration
US10705753B2 (en) 2018-05-04 2020-07-07 EMC IP Holding Company LLC Fan-out asynchronous replication logical level caching
US11048722B2 (en) 2018-07-31 2021-06-29 EMC IP Holding Company LLC Performance optimization for data persistency in asynchronous replication setups
US10613793B1 (en) 2018-11-01 2020-04-07 EMC IP Holding Company LLC Method to support hash based xcopy synchronous replication
US10719249B1 (en) 2019-01-31 2020-07-21 EMC IP Holding Company LLC Extent lock resolution in active/active replication
US10853200B2 (en) 2019-02-01 2020-12-01 EMC IP Holding Company LLC Consistent input/output (IO) recovery for active/active cluster replication
US11194666B2 (en) 2019-04-26 2021-12-07 EMC IP Holding Company LLC Time addressable storage in a content addressable storage system
US10719257B1 (en) 2019-04-29 2020-07-21 EMC IP Holding Company LLC Time-to-live (TTL) license management in an active/active replication session
US11216388B2 (en) 2019-04-30 2022-01-04 EMC IP Holding Company LLC Tiering between storage media in a content aware storage system
US11301138B2 (en) 2019-07-19 2022-04-12 EMC IP Holding Company LLC Dynamic balancing of input/output (IO) operations for a storage system
US11238063B2 (en) 2019-07-25 2022-02-01 EMC IP Holding Company LLC Provenance-based replication in a storage system
US10908828B1 (en) 2019-07-25 2021-02-02 EMC IP Holding Company LLC Enhanced quality of service (QoS) for multiple simultaneous replication sessions in a replication setup
US11429493B2 (en) 2020-01-20 2022-08-30 EMC IP Holding Company LLC Remote rollback of snapshots for asynchronous replication
US11593396B2 (en) 2020-09-23 2023-02-28 EMC IP Holding Company LLC Smart data offload sync replication
US11281407B1 (en) 2020-09-23 2022-03-22 EMC IP Holding Company LLC Verified write command in active-active replication

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62108342A (ja) * 1985-11-06 1987-05-19 Alps Electric Co Ltd デイスクキヤツシユ制御方式
JPS63247853A (ja) * 1987-03-30 1988-10-14 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン Dasdキヤツシユ管理方法
JP2004213647A (ja) * 2002-12-27 2004-07-29 Internatl Business Mach Corp <Ibm> データ記憶装置およびシステム用のログ構造の書込みキャッシュ
US20040193802A1 (en) * 2003-03-25 2004-09-30 Emc Corporation Reading virtual ordered writes at local storage device
JP2006523890A (ja) * 2003-03-25 2006-10-19 イーエムシー コーポレイション 仮想順序付け書き込み

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2264843B (en) * 1992-02-28 1995-09-20 Texas Instruments Ltd An interface device for coupling a host device having a network interface to a computer network having a predetermined communications medium
JPH086854A (ja) * 1993-12-23 1996-01-12 Unisys Corp アウトボードファイルキャッシュ外部処理コンプレックス
US5778430A (en) * 1996-04-19 1998-07-07 Eccs, Inc. Method and apparatus for computer disk cache management
US6192408B1 (en) 1997-09-26 2001-02-20 Emc Corporation Network file server sharing local caches of file access information in data processors assigned to respective file systems
US6192450B1 (en) * 1998-02-03 2001-02-20 International Business Machines Corporation Destage of data for write cache
US6301643B1 (en) * 1998-09-03 2001-10-09 International Business Machines Corporation Multi-environment data consistency
US6785714B1 (en) * 2000-09-28 2004-08-31 Microsoft Corporation System and method for employing slot level locking of a cache
US6732117B1 (en) * 2001-02-27 2004-05-04 Emc Corporation Techniques for handling client-oriented requests within a data storage system
US7051176B2 (en) * 2003-03-25 2006-05-23 Emc Corporation Reading data provided to a remote storage device
US6898685B2 (en) * 2003-03-25 2005-05-24 Emc Corporation Ordering data writes from a local storage device to a remote storage device
US7231496B2 (en) * 2003-09-15 2007-06-12 International Business Machines Corporation Method, system and program product for caching data objects

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62108342A (ja) * 1985-11-06 1987-05-19 Alps Electric Co Ltd デイスクキヤツシユ制御方式
JPS63247853A (ja) * 1987-03-30 1988-10-14 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン Dasdキヤツシユ管理方法
JP2004213647A (ja) * 2002-12-27 2004-07-29 Internatl Business Mach Corp <Ibm> データ記憶装置およびシステム用のログ構造の書込みキャッシュ
US20040193802A1 (en) * 2003-03-25 2004-09-30 Emc Corporation Reading virtual ordered writes at local storage device
JP2006523890A (ja) * 2003-03-25 2006-10-19 イーエムシー コーポレイション 仮想順序付け書き込み

Also Published As

Publication number Publication date
US20070038841A1 (en) 2007-02-15
US7386668B2 (en) 2008-06-10
US20050066122A1 (en) 2005-03-24
US7114033B2 (en) 2006-09-26
EP1805628A2 (en) 2007-07-11
WO2006039493A2 (en) 2006-04-13
CN101031891A (zh) 2007-09-05
WO2006039493A3 (en) 2006-07-27
EP1805628A4 (en) 2008-12-31

Similar Documents

Publication Publication Date Title
JP2008515112A (ja) 仮想順序付け書き込み
US7380082B2 (en) Reading virtual ordered writes at local storage device
US7051176B2 (en) Reading data provided to a remote storage device
US7197616B2 (en) Virtual ordered writes
US9753663B1 (en) Triangular asynchronous replication
US8924665B2 (en) Virtual ordered writes transfer log
US6968425B2 (en) Computer systems, disk systems, and method for controlling disk cache
US7228456B2 (en) Data recovery for virtual ordered writes for multiple storage devices
US7624229B1 (en) Spillover slot
US8145865B1 (en) Virtual ordered writes spillover mechanism
US20060069890A1 (en) Triangular asynchronous replication with minimal synchronous storage
JP2002149499A (ja) データの完全性を備えるリモートコピーシステム
US8601209B1 (en) Maintaining dasd and tape continuous availability
US7228396B2 (en) Switching between virtual ordered writes mode and synchronous or semi-synchronous RDF transfer mode
US8942073B1 (en) Maintaining tape emulation consistency
JP2006523890A (ja) 仮想順序付け書き込み
JP2006107450A (ja) トライアングル非同期複製(triangularasynchronousreplication)
JP2007513424A (ja) 複数の記憶装置に対する仮想の順序付けられた書き込み

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110209

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110628