JP4902538B2 - 通信網を介してデータセットを更新するためのシステム、方法及び装置 - Google Patents
通信網を介してデータセットを更新するためのシステム、方法及び装置 Download PDFInfo
- Publication number
- JP4902538B2 JP4902538B2 JP2007525173A JP2007525173A JP4902538B2 JP 4902538 B2 JP4902538 B2 JP 4902538B2 JP 2007525173 A JP2007525173 A JP 2007525173A JP 2007525173 A JP2007525173 A JP 2007525173A JP 4902538 B2 JP4902538 B2 JP 4902538B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- data center
- rdc
- data block
- storage area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004891 communication Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims description 76
- 238000003860 storage Methods 0.000 claims abstract description 128
- 238000011084 recovery Methods 0.000 claims abstract description 84
- 230000001360 synchronised effect Effects 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 24
- 230000008569 process Effects 0.000 claims description 27
- 238000012546 transfer Methods 0.000 claims description 17
- 239000003999 initiator Substances 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 239000000835 fiber Substances 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 15
- 230000010076 replication Effects 0.000 description 10
- 238000013500 data storage Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000007726 management method Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 101000741965 Homo sapiens Inactive tyrosine-protein kinase PRAG1 Proteins 0.000 description 4
- 102100038659 Inactive tyrosine-protein kinase PRAG1 Human genes 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 101150113941 trt1 gene Proteins 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
- G06F11/2076—Synchronous techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1471—Saving, restoring, recovering or retrying involving logging of persistent data for recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
- G06F11/2074—Asynchronous techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Mobile Radio Communication Systems (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
Description
特に、本発明はデータセットを保護するための同期ミラーリング技術に関する。
第1の技術又は方法は同期ミラーリングとして公知であり、RDCにある遠隔コピーの更新が、PDCにあるローカルコピー中のデータ項目の変更と同時に行われる。
第2の技術は非同期ミラーリングとして公知であり、遠隔コピーの更新はバッチポリシーに従って行われる。
a- データ項目をローカル記憶装置に書き込む工程;
b- 該データ項目をリモート記憶装置に書き込む工程;
c- さらに新しいデータ項目を書き込むことで工程a)及びb)を繰り返す前に、リモートディスクからの肯定応答信号ACKを待つ工程;
を行なう。
実際、同期ミラーリング技術を採用することにより、主データセットとソフトウエアアプリケーションを再開するのに有効なそのコピーとの間のずれを理想的に1回の処理で低減させることができる。
当該技術において、主データセットとそのコピーとの間でのこのずれ(時間で測定)は一般に目標回復時点すなわちRPOという。
- データ項目のシリアル化時間;
- 往復時間、すなわちメイン計算機システムと遠隔コピーとの間の接続に沿って存在する装置における伝搬遅延と処理及び待ち時間との総和;
- ディスク上のデータ項目のRDCへの書き込み時間;
- 肯定応答信号の生成及びシリアル化時間(データ項目のシリアル化時間及び往復時間に比べて無視し得る);
の総和として概算できる。
- 非特許文献1は、高帯域幅リンクを用いている場合でも400kmを距離の限界として示している;
- 非特許文献2は50kmを示し、距離の限界は特にアプリケーション応答時間に依存することを述べている;
- 同期ミラーリングについての所有者の解決策は、データ複製を管理する特定のソフトウエアゆえに異なる距離限界を示す。特に、非特許文献3は距離の限界として40〜100kmを示す。非特許文献4は最大距離限界として80kmを示す。
このマルチホップ・ミラーリング技術では、PDCにてソフトウエアアプリケーションにより課される制限に適合する距離だけ離れて位置する中間場所にて同期ミラーリングを実行し、非同期にてデータを複製してRDCの場所に送る。
従来技術によると、マルチホップミラーリングでは、PDCの記憶装置の記憶容量と少なくとも同じ記憶容量をもつ記憶装置を中間の場所に導入する必要がある。
この解決策では、アーキテクチャーの全体の信頼性が低下する。
また、一般に中間場所から回復場所(RDC)への更新は、相対的に遅い周波数にてバッチモードで行われるので、主データセットと回復データセットとの間で関連の相違が生じ得る。
したがって、本発明の目的は、距離に独立な同期ミラーリング技術を実行可能にして通信網を介してデータセットを更新するためのシステム、方法及び装置を提供することである。
特に、本発明の好ましい態様によると、このキャッシュサイズは、
- クライアント処理システムと一時記憶装置との間で用いられる帯域幅と;
- 一時記憶装置と回復サイトRDCとの間で用いられる帯域幅と;
- PDCにてクライアント・ソフトウエア・アプリケーションにより生成されるデータのレート(例えば、このデータレートは単位時間に生成又は変更されるデータの数として定量化できる)と;
に依存して決められる。
- 主データセンターPDCと一時記憶装置との間の距離より短い所定の範囲内での故障又は損傷の場合、すなわち、一時記憶装置が損傷していない場合、単一ホップ同期ミラーリング技術(ローカル及びリモートディスク間で不一致がない)のRPOに等しくするRPOの最適化;
- 中間場所にも影響を与えるイベントの場合、ゼロに非常に近いRPO(アプリケーションの二三の処理に限定された不一致);この場合、中間場所に存在しているが、リモートディスクへのコピーがまだされていないデータは失われるが、本発明に開示されたデータの転送方法によれば、本質的に損失データは非常に限定された量である;
- 主データセンターと回復データセンターとの間に適用される同期ディスクミラーリング技術により得ることのできるRTOに匹敵しうる非常に小さいRTO;
- 距離からの独立、又はローカルディスクとリモートディスクとの間の距離に関して制限がない。逆に、RPO及びRTOについて同等の信頼性を与えつつ、単一ホップ同期ミラーリング技術にて行われる;
- 中間場所に記憶されるデータ量が限定的であること。というのは、本発明により提案される方法では、中間場所が主データセンターのローカルディスクのすべてのデータセットを含む必要はないからである。
すべての図面において、同じ符号は同じ構成要素か又は実質的に同じ機能を行なう構成要素を示すのに用いた。
以下ではディスクミラーリング技術に関して本発明を説明するが、例えばローカルディスクの故障の場合や、データセットのローカルコピーが与えられていないアプリケーションにおいて、ミラーリングアプリケーションが実行されない種々の環境下でも同様の発明原理を首尾よく実行できることに留意されたい。
本発明における距離なる用語は、例えば、PDCと中間場所とを接続し、中間場所とRDCとを接続するために用いる光ファイバー又は通信ケーブルの長さを表す。
モジュール22の下流に配置されたモジュール23は仮想化モジュールであり、PDCに論理記憶領域を与える役割を有し、この論理記憶領域は、RDCに存在するディスクボリュームのために確保されている物理記憶領域とは異なる。
モジュール20及び21はそれぞれ、トランスポート・プロトコル・ターミネータ、例えばNIC、及び遠隔でデータを記憶するためのプロトコルのターゲット装置、例えば修正バージョンのiSCSIターゲット装置によって表すことができる。この場合、モジュール22は修正された商用又はフリーバーションのSCSIターゲット装置である。実質的に、上記の修正は、所定の論理ユニット番号LUNに対してSCSIコマンドをインターセプトし、かつ上記コマンドをキャッシュシステム27にアドレス指定するか又はコマンドをRDCに送るために装置13の残りのモジュール23〜26にアドレス指定するように、ソフトウエアフィルターを構築することからなる。
リナックス環境においてロジカル・ボリューム・マネージャー23を用いる場合、修正されたSCSIターゲット装置22はLVM23に適合するI/Oブロックインターフェースを有することが必要である。
しかし、好ましい態様によると、ロジカル・ボリューム・マネージャー23が存在すると、例えば、地理的に分離し得る複数の回復データセンターに属する記憶領域をアドレス指定する論理パーティションを作ることができるので有益である。
当業者には分かるように、LVM23はソフトウエア仮想化装置で置き換えることもできる。
しかし、ハイブリッドな解決策も可能であり、この解決策では、装置13により分離された2つのネットワークセクションに遠隔にてデータを記憶するために異なるプロトコルを用い、記憶装置の管理プロトコルとしてSCSIを利用しないか、又は、依然としてRDCが1より多くかつ様々な技術により管理される場合のようにより多くの通信技術を用いる。ハイブリッドな解決策はまた、図2のモジュール24により管理されるプロトコル類型に影響を与える。
以下において、用語「データブロック」は下記のものの論理的な集合を示す。
・RDCに記憶する情報(データ);
・宛先記憶装置システム上でのメモリ位置のアドレス又はアドレスセットのようなI/O操作属性;
・上記情報と共に記憶すべき追加データ属性。
- 上記ソフトウエアアプリケーションの通常の動作方法を妨害又は減速させないように、装置13におけるデータ項目の受信及び書き込みをアクノリッジする信号3をディスク・ミラーリング・ソフトウエア14を介してソフトウエアアプリケーションに戻すこと;
- リモートディスク12に転送すべきデータブロックを一時的に記憶すること;
- 非同期にてデータブロック5をリモートディスク12に転送すること。リモートディスク12でローカルディスク11のすべてのデータセットを再構成する。
また、同じ主データセンターPDCに接続された複数のクライアントは同じ一時保存装置13を共用してもよい。
1.セットアップ段階:すなわち、新しいクライアント/アプリケーションにサービスを行なうように装置13の一般的なアーキテクチャーを構成;
2.通常運転段階:デステージング処理を含み、I/Oコマンドをフィルタリングする;
3.故障イベントからの回復段階。
a)PDC及びRDCに対してトランスペアレントな方法にて一時データ保存装置13を介してRDCに存在する物理的ボリュームディスクを利用可能にする工程;
b)あたかも同期ミラーリング技術がPDCとRDCとの間で実行されているように本発明の機能を使用可能にする工程。
RDCに存在する物理的パーティションのロジカル画像である上記ロジカルボリュームに対し、上記ロジカルボリュームにアクセスするためにクライアントアプリケーションにより用いられる識別子が関連付けられる。特に、装置13内のボリュームのロジカル画像は、最終的な宛先からの否定応答を待つことなく誤った名宛人にエラーメッセージを送るのに有効である。
- ボリュームの一致したコピーがリモートサイトに転送され(第1の同期化);
- 記憶領域が装置13のキャッシュ・システム・モジュール27においてそのクライアントに対して確保され;
- 上記記憶領域が、クライアントによりアドレス指定されたボリュームの特徴を記述するコンフィギュレーションデータ(アドレス、ボリュームサイズ、ブロックサイズなどのセット)を参照し[このコンフィギュレーションデータはキャッシュ・システム・モジュール27の内部データベース27bに記憶されている];
- モジュール22内にて、クライアント・ミラーリング・ソフトウエアにより発せられたコマンドのフィルタリング処理が可能にされ、これらのコマンドの一部(例えばリモートディスクユニットのヘッドのクリーニング、ディスクのフォーマッティングなど)が一連のモジュール23〜26を介してRDCに送られ、他のコマンド(例えばデータの書き込み又はデータの読み出し)がインターセプトされてキャッシュ・システム・モジュール27に送られるようにされる。
- 新しいクライアントが許可され、キャッシュ・システム・モジュール27内の特定の記憶領域がそのクライアントに割り当てられたことが、キャッシュ制御ソフトウエア27aに知らされる。
1.装置13のキャッシュに記憶されたデータをRDCに移動させるためのデステージング処理;
2.書き込み及び読み出し操作をインターセプトし、首尾一貫して装置13のキャッシュを管理するI/Oコマンドフィルタリング処理。
このキャッシュソフトウエア27aはまず、様々なクライアントに対応するキャッシュ記憶領域のすべてについて連続的なポーリングを実行し(工程101)、RDCにまだ送られていないデータブロックがキャッシュ27中に存在するか否かを調べる。
RDCに転送しなければならないブロックはすべて、RDCに送られる(工程103)。
いったんデータブロックが送られたなら、前後関係上キャッシュ27から該データブロックは消去されないが、RDCにより発せられた肯定応答信号が、実際にデータブロックが間違いなくそこに到着したことを確認したときにのみ消去される(工程107)。
実際、データの損失を防ぐために、データブロックは、RDCがキャッシュから送られたデータブロックを実際に記憶するまで、キャッシュ27に記憶されたままである。換言すれば、データブロックを装置13からRDCに転送している間、データの損失を防ぐ一種の配送制御が存在する。この制御は、図5Aにおいて、送出ブロック103の下に配置されたブロックにより表される。
a)エラーなしでRDCに到着する;
b)RDCに到着するが間違っている;
c)RDCに到着しない。
- a)の場合、肯定応答信号ACK(工程111、下向きの矢印);
- b)の場合、否定応答信号NACK(工程111、右向きの矢印)、もしNACK信号がデータの遠隔転送に用いられるプロトコルにより正しく解釈され得るならば;
- 状態c)を認識するために、装置13とRDCとの間の往復時間の推定値よりも大きいタイムアウト遅延を設定する;いったんタイムアウト遅延を過ぎ(工程109)、肯定応答信号ACK又は否定応答信号NACKが到着しなかったなら(工程107、左向き矢印)、キャッシュ27により送られたデータブロックは失われたと考える。データブロックを送出すると、タイムアウト遅延が開始する(工程105)。肯定応答信号(工程111、下向き矢印)に続く制御ブロック111、115及び119では、上述の場合a)を管理し、制御ブロック111、113及び117は、場合b)を管理し、制御ブロック109によりタイムアウト遅延の制御を行いつつ、いったん所定のタイムアウト遅延が過ぎれば、データブロックがRDCにより受信されなかったものと見なす。
別の態様では、遠隔でのデータ転送に用いられるプロトコルでは否定応答信号NACKを与えず、間違いのあるデータブロックに対してもタイムアウト遅延の同じプロセスが適用される。すなわち、連続間違いブロックの所定数に達した後、ミラーリングサービスが停止される。
・PDCからRDCへのコマンドをインターセプトし;
・特定の使用プロトコルに基づいて1以上のPDU(プロトコル・データ・ユニット)を考慮して操作の種類(書き込み、読み出し、その他の操作)を識別する。
・書き込みコマンドの場合、これらのパラメータは例えばデータブロック全体であり、すなわち、記憶すべきデータ、操作属性(例えばメモリ位置のアドレス)及び追加データ属性である;
・読み出しコマンドの場合、データは取得されるので、パラメータは例えば操作属性だけである。
これらの操作は下記で説明するように行われる。
装置13内にて、ミラーリングソフトウエア14により発せられた書き込みコマンドは、図2のブロック22によりインターセプトされ、図5Bに記載のプロセスに従って分析される。
好ましい態様によると、キャッシュ27に書き込まれる関連のデータブロック及びキャッシュ内のそのステータスに対して、起こり得る4つの状態がある。当業者なら分かるように、状態の数はそれより少なくても多くてもよい。
- ケース1):リクエストされたアドレスを有するデータブロックがキャッシュ27中に存在しないなら(工程153)、そのクライアントに利用可能な新しいキャッシュ位置が用いられ、その新しい位置にデータブロックが書き込まれる(工程161);
- ケース2):リクエストされたアドレスを有するデータブロックが既にキャッシュ27中に存在し(工程153)、それが「デステージング中」でないならば、新しいデータブロックが既存の古いものに取って代る(工程157);
- ケース3):リクエストされたアドレスを有するデータブロックが既にキャッシュ27中に存在するが(工程153)、「デステージング中」である(工程155)、すなわち、システムが依然として保存データセンターRDCによる肯定応答信号を待っておりかつ、同じアドレスを有する第2のデータブロックがキャッシュ27中に存在しないならば(工程159)、データブロックが新しいキャッシュ位置に書き込まれる(工程161);
- ケース4):リクエストされたアドレスを有する2つのデータブロックがキャッシュ中に存在するならば(その一つが「デステージング中」であり、もう一方がそうでない)、新しいブロックが「デステージング中」でない既存のものに取って代る(工程157)。
いずれにせよ、データブロックの記録が完了した後に、書き込みプロセスは操作の成功をI/Oコマンドフィルター(図2のモジュール22)に知らせ、次にこのI/Oコマンドフィルターが、現在使用されているI/Oプロトコルにより要求されるACK信号をPDCのミラーリングソフトウエアに戻す。
データをキャッシュ27から読出すことはできるが、好ましくはキャッシュはRDCに取って代る役割を有さないことに留意されたい。
好ましい態様によると、読出される関連のデータブロックに対して、4つの状態が与えられる。当業者なら分かるように、この状態の数はそれより少なくとて多くてもよい。
- ケース1):リクエストされたアドレスを有するデータブロックがキャッシュ27内に存在しないならば(工程203)、読み出し操作が図2のモジュール23〜26を介してRDCに送られる;
- ケース2):リクエストされたアドレスを有するデータブロックがキャッシュ内に存在すると共に(工程203)、「デステージング中」でないならば(工程205)、該データブロックがキャッシュから読み出され、データがPDCに戻される(工程207);
- ケース3):リクエストされたアドレスを有するデータブロックがキャッシュ内に存在するが(工程203)「デステージング中」であるなら(工程205)、すなわち、システムが依然としてRDCによる肯定応答信号を待っており、同じアドレスを有する第2のデータブロックがキャッシュ27内に存在しないならば(工程209)、読み出し操作で「デステージング中」のデータブロックのデータ内容を戻す(工程211);
- ケース4):リクエストされたアドレスを有する2つのデータブロックがキャッシュ内に存在すれば(そのうちの一方が「デステージング中」であり、もう一方がそうでない)、「デステージング中」のデータブロックのデータ内容が戻される(工程207)。
図6は起こり得る故障の状態と、それに従って採用できるいくつかの対応を示す。特に、通常運転の初期状態(ブロック251)から、少なくとも2つの異常の類型を下記の通り考えることができる。
a)クライアントと一時データ保存装置13との間での接続故障、又は装置13自体の故障(ブロック253)、この場合、中間場所にある図2のキャッシュ27に書き込むことはできない;
b)装置13と回復データセンターRDCとの間の接続故障、又はRDC自体の故障。この場合、RDCにアクセスできない。
ケースa)について図6のフローチャートの左側の枝において詳細に説明する。下記事項が択一的に可能である。
- 本発明により同期転送が絶対的に要求される場合にはディスクミラーリングを中断する(工程257);
- 主データセンターのローカルディスクに一時的にデータを記憶し(工程265)、いったん接続が復旧したならキャッシュ27へのデータブロックの転送を終え、その結果RDCへの転送を完了する(工程267);
- 利用できないキャッシュをバイパスし、直接RDCにより非同期ミラーリングを行なう。
ケースb)について図6のフローチャートの右側の枝において詳細に説明する。下記の事項が可能である。
- キャッシュが十分な記憶容量を有し、利用できない時間がむしろ短いと推定されるならば、動作せず(工程261)、図5Aのデステージングプロセスを用いることによりRDC中のディスクを一致させるべく接続が復旧されるのを待っている間、トランザクションをキャッシュに記憶し続ける(工程269);
- 別法として、利用できない時間がむしろ長い場合にキャッシュを飽和させないように、キャッシュ内に存在するデータを代わりのサイトにコピーする(工程263)。
この時点で、クライアントアプリケーション(図1に示されるようにミラーリングソフトウエア14を介して装置13と相互作用する)は、iSCSI/SCSIプロトコルを介してRDCのリモートボリュームにアクセスできる。
- ローカル・ボリューム・ディスクの一致したコピーがリモートサイトに転送される(最初の同期化);
- クライアントアプリケーションのLUNのために装置13のキャッシュ27に記憶領域が確保される;
- この記憶領域がコンフィギュレーションデータ(アドレス、ボリュームサイズ、ブロックサイズなどのセット)を参照して上記LUNボリュームの特徴を記述し、キャッシュ・システム・モジュール27の内部データベース27bに記憶される;
- モジュール22内で、クライアント・ミラーリング・ソフトウエアにより発せられたSCSIコマンドのフィルタリング処理を可能にし、その際に、これらのコマンドの一部は一連のモジュール23〜26を介して回復データセンターに送り、その他のコマンドはインターセプトしてキャッシュ・システム・モジュール27に送るようにする;
- キャッシュ制御ソフトウエア27aに、新しいクライアントが有効にされたこと、及びキャッシュ・システム・モジュール27内の特定の記憶領域とLUN記述子がこのクライアントに割り当てられたことが知らされる。
a)データブロック数Nを書き込むためイニシエータ装置が書き込みリクエストをターゲット装置に送る;
b)ターゲット装置が肯定応答信号をイニシエータ装置に送る;
c)肯定応答信号を受信した後、イニシエータがN個のデータブロックを送る;
d)N個のデータブロックの書き込みが成功したことをターゲット装置がアクノリッジする。
- 修正されたSCSIターゲットモジュール22は、主データセンターにおけるミラーリングアプリケーション(及びそれに結合されたSCSIイニシエータ)から所定数Nのデータブロックを書き込むための書き込みリクエストを受信する;
- モジュール22が書き込みコマンドをインターセプトし、書き込み操作であれば、このコマンドがキャッシュシステム27に関するものの一つであることを認識する。よって、キャッシュシステムがそれらのデータブロックを記憶できるか否かが検証される。それが肯定的な場合には、モジュール22はSCSI規格に従ってデータ・リクエスト・メッセージをミラーリングアプリケーションに送ることによって応答する;
- ミラーリングアプリケーションがN個のデータブロックを送る;
- モジュール22が上記データブロックの宛先アドレスを検索し、データを送出しているクライアントに専用のキャッシュ27の記憶領域にそれらを転送する。特に、モジュール22は、上記説明したことに従って、ボリューム内のデータ内容、アドレス、及びSCSIプロトコルの書き込みコマンドのヘッダーの重要な情報(DPO(Disable Page Output)、FUA(Force Unit Access)など)を、SCSIブロックから抽出し、キャッシュに記憶する;
- キャッシュソフトウエア27aは、デステージング処理を行なうこと、及び上述したように書き込みリクエストをRDCに送ることを担当する。
同様にして、読み出しコマンドもキャッシュ27によりインターセプトされる。というのは、否定的な場合には、依然としてキャッシュ27中に存在しているので更新されていないデータ項目をRDCから読み出すことができるからである。
NCACHED=[(TRT2+TS)/(1/R)]+[TMAX/(1/R)]+[TRT1/(1/R)]
ここで、[]括弧は結果を上の整数に丸めることを示す(この式における種々のパラメータの意味は後で定義する)。パラメータ値の変動を考慮に入れるため適当なマージンだけインクリメントさせた平均ブロック数NCACHEDのこの概算は、1つのデータブロックのサイズを定めた装置13のキャッシュメモリの大きさを決めるために用いることができる。NCACHEDの上記式は3つの加算からなる。
- 第1の加算、[(TRT2+TS)/(1/R)]は、キャッシュに到達しているブロック数を表しており、シリアル化時間(TS)と、装置13とRDCとの間のネットワーク部分の往復時間(TRT2)と、2つの連続データブロック間の平均到着間時間を表す1/Rとの関数として求めることができる;
- 第2の加算、[TMAX/(1/R)]は、何らかの理由で特定の時間制限(タイムアウト)内にRDCに達しなかった「デステージング中」のブロック数を表す。これは、TMAX(結果として損失することになる最初のデータブロックについての装置13による受信間で経過した時間間隔を表す)と、装置13がタイムアウトイベントを管理する最後のブロックのタイムアウトとの関数として求めることができる。TMAXは例えば次式として求めることができる。
TMAX=TOUT+TS+(NMAX−1)・max(1/R,TS)
ここで、TOUTは装置13からRDCに送られる1ブロックについてのタイムアウト間隔を表す設定可能なパラメータであり、NMAXは装置13によりタイムアウトイベントが管理されるブロックの最大数を表す設定可能なパラメータである;
- 第3の加算、[TRT1/(1/R)]は、ディスク・ミラーリング・サービスが一時的に利用できないことをキャッシュがクライアントに知らせる前に、クライアントによりキャッシュに送られるブロック数を表す。ここで、TRT1はPDCと装置13との間のネットワーク部分の往復時間である。
上述したシナリオによると、このSPは、すべての都市圏に装置13を含んだサイトと、これらの都市圏から遠く離れた地理的領域に1又は複数のRDC12とを提供する。当業者には明らかなように、この装置13はスタンドアロン装置である必要はなく、ネットワーク装置中に一体化することもできる。
- RDCへのデステージングの後に利用可能なデータを利用することにより、RDCにてクライアントアプリケーションを再開できる(標準的な災害/回復アプローチ)(307);
- 場合によっては高ビットレートの代わりの接続を起動することにより、RDCにおける複製からPDCでの新しいディスク上のクライアントデータを修復し;
- 主ディスクとしてRDCデータへのアクセスを一時的に可能にする。
この特定のネットワークサービスは「長距離の同期ミラーリング加速」として定義できる。実際、このサービスにより装置13により戻される肯定応答信号のおかげで、クライアントアプリケーションの観点から、データ項目のローカルコピーとその遠隔コピーとの間での同期複製は、まるでこれら2場所間の距離が実際の距離よりも短くなったように行われる。
このサービスはクライアントに対して完全にトランスペアレントであり、このことは、クライアントが同期ミラーリングの標準的な構成に関してそのシステム及びその操作方法を変更しないことを意味する。
- L1及びL2は、災害から保護される2つの領域を分ける。外延がL1より小さいイベント(災害領域A1)、すなわち装置13に関与しないイベントでは、本サービスは1トランザクションに等しいRPOを保証し;外延がL2より小さく(災害領域A2)かつL1より大きい災害では、本サービスは、場合により失われるデータを、災害が起こったときキャッシュデステージングポリシーに依存してせいぜい装置13により移動中のものとする;
- Tl及びT2はそれぞれ、書き込みの肯定応答が行われる最大時間間隔、及びデータ項目のコピーがRDCでも完了する最大時間間隔を示す。
- 従来の同期ミラーリング技術の固有時間よりも小さい固定制限時間T1内での遠隔コピーコマンドの肯定応答。例えばT1<0.5ms;
- ローカル又は隣接の同期ミラーリング技術の場合に許容される最大距離よりもさらに大きい遠隔コピーの距離L2。例えばL2>>50km;
- 最大間隔時間T2内にリモートディスクにおいて利用可能なデータ項目のコピー。これは、広域ネットワークWAN上に割り当てられた帯域幅とデステージングポリシーとに依存して、距離L2をカバーするための全体の伝搬時間に非常に近くできる;
- 範囲がL1より小さい災害の場合での最大でも1つのトランザクションの喪失の保証、及びL1<R<L2の範囲の故障の場合での時間間隔T2中に生成される最大限のトランザクションの喪失の保証。
- 回線業者が所有する交換機内で都市圏ネットワークMANの装置13の転位;
- 本サービスは回線業者により様々なサービスプロバイダSPに提供され、サービスプロバイダSPがその最終の顧客に災害回復のサービスを提供する。図10では、SPとそのそれぞれの顧客が枠内の同じハッチングにより識別される;
- 回線業者により提供されるサービスの境界(一点鎖線)が、プロバイダの限界サイトから最終顧客のサイトまで延びている。
11 ローカルディスク
12 リモート・ディスク・ユニット
13 一時データ保存装置
14 ミラーリングソフトウエア
Claims (32)
- 通信網を介してデータセットを更新するためのシステムであって、前記データセットは回復データセンター(RDC)内に置かれた回復記憶装置(12)に予め記憶されていると共に、主データセンター(PDC)に接続された少なくとも1つの処理システム(10)により生成された入力データブロックを用いて更新されなければならない前記システムにおいて、
- 前記通信網を介して前記主データセンター(PDC)と前記回復データセンター(RDC)との間に配置され、一時記憶領域(27)となるキャッシュ・システム・モジュールに接続された装置(13)であって、前記記憶領域に前記処理システム(10)により生成された前記入力データブロックを一時的に書き込み、かつ前記データブロックを前記回復データセンター(RDC)に転送する前記装置(13)を備え、前記装置(13)は、
- 前記データブロックが前記一時記憶領域(27)に書き込まれるとすぐに、前記データブロックの前記一時記憶領域(27)への書き込みが成功したことをアクノリッジする第1の同期肯定応答信号(3)を前記主データセンター(PDC)に送り、
- 前記データブロックの転送後に、前記データセットの更新が成功したことをアクノリッジする前記回復データセンター(RDC)により送られた第2の肯定応答信号(6)を受信し該信号の消去の可否について管理し、
- 前記第2の肯定応答信号(6)の受信後に新しい入力データブロックに対して前記一時記憶領域(27)を利用可能にする、
モジュールを備えると共に、
前記装置(13)が、前記データブロックを前記一時記憶領域(27)において前記主データセンター(PDC)によりリクエストされたアドレスに、下記条件、すなわち、
- リクエストされたアドレスにてデータブロックが前記記憶領域に書き込まれていないならば、前記データブロックを前記記憶領域(27)に書き込み;
- リクエストされたアドレスにてデータブロックが記憶領域に既に書き込まれているが、前記データブロックが転送されていないならば、前のデータブロックを置換することにより前記データブロックを前記記憶領域(27)に書き込み;
- リクエストされたアドレスにてデータブロックが記憶領域(27)に既に書き込まれ、転送されているが、前記回復データセンター(RDC)から肯定応答を受信していないならば、前記データブロックを前記記憶領域(27)に新たに書き込む、
なる条件を満たすように書き込むモジュールを更に備えることを特徴とする前記システム。 - 前記処理システム(10)は前記データセットのコピーが記憶される主記憶装置(11)に接続されることを特徴とする請求項1に記載のシステム。
- 前記一時記憶領域(27)の記憶容量が、前記主記憶装置(11)と前記回復記憶装置(12)の両方の記憶容量よりも小さいことを特徴とする請求項2に記載のシステム。
- 前記装置(13)と前記主データセンター(PDC)との距離が前記装置(13)と前記回復データセンター(RDC)との距離より短いことを特徴とする請求項1に記載のシステム。
- 前記通信網がiSCSI型プロトコルとファイバー・チャンネル型プロトコルとからなる群から選択された少なくとも1つのプロトコルを含むことを特徴とする請求項1に記載のシステム。
- 前記装置(13)が、
- 前記装置(13)を前記主データセンター(PDC)及び前記回復データセンター(RDC)にそれぞれインターフェースするためのインターフェースモジュール(20、26)と;
- 前記主データセンター(PDC)により送られたI/Oコマンドをインターセプトすると共に、前記データブロックを一時的に記憶する前記一時記憶領域(27)又は前記回復データセンター(RDC)に前記コマンドを選択的に送るためのフィルターモジュール(22)と;
- 前記主データセンター(PDC)から前記データブロックとそれらの相対アドレスパラメータを受信し、前記回復記憶装置(12)の管理のために確保されたコマンド内部に前記データブロックをカプセル化し、それらを前記回復データセンター(RDC)に転送するための制御モジュール(24、25)と、
を備えることを特徴とする請求項1に記載のシステム。 - 前記装置(13)が、
- ネットワーク・インターフェース・カード(NIC)と;
- 前記ネットワーク・インターフェース・カード(NIC)の下流に配置されたiSCSIターゲット装置(21)と;
- 前記iSCSIターゲット装置(21)の下流に配置された修正されたSCSIターゲット装置(22)と;
- 前記修正されたiSCSIターゲット装置(22)に接続されたキャッシュシステム(27)と;
- 前記修正されたSCSIターゲット装置(22)の下流に配置されたロジカル・ボリューム・マネージャーすなわちLVM装置(23)と;
- 前記ロジカル・ボリューム・マネージャー装置(23)の下流に配置されたネイティブSCSIサブシステム(24)と;
- 前記SCSIサブシステム(24)の下流に配置されたiSCSIイニシエータ装置(25)と;
- 前記回復データセンター(12)に対する別のネットワーク・インターフェース・カード(NIC)と、
を備えることを特徴とする請求項1に記載のシステム。 - 前記装置(13)が、
- 前記主データセンター(PDC)に対するホスト・バス・アダプタ(HBA)と;
- 前記ホスト・バス・アダプタ(HBA)の下流に配置された修正されたSCSIターゲット装置(22)と;
- 前記修正されたSCSIターゲット装置(22)に接続されたキャッシュシステム(27)と;
- 前記修正されたSCSIターゲット装置(22)の下流に配置されたロジカル・ボリューム・マネージャーすなわちLVM装置(23)と;
- 前記ロジカル・ボリューム・マネージャー装置(23)の下流に配置されたSCSIサブシステム(24)と、
- 前記回復記憶装置(12)に対する別のホスト・バス・アダプタ(HBA)と、
を備えることを特徴とする請求項6に記載のシステム。 - 前記データブロックを一時的に記憶するための前記装置(13)が、前記通信網に接続されたネットワーク装置からなることを特徴とする請求項1〜8のいずれか一項に記載のシステム。
- 前記記憶装置(11、12)がディスク記憶装置であることを特徴とする請求項1〜9のいずれか一項に記載のシステム。
- 前記一時記憶領域(27)が複数の処理システム(10)及び/又は複数の主データセンター(PDC)に対してそれぞれ専用の複数の記憶領域を備えることを特徴とする請求項1〜10のいずれか一項に記載のシステム。
- 通信網を介してデータセットを更新するための方法であって、前記データセットは回復データセンター(RDC)内に置かれた回復記憶装置(12)に記憶されると共に、主データセンター(PDC)に接続された少なくとも1つの処理システム(10)により生成された入力データブロックを用いて更新されなければならない前記方法において、
- 前記処理システム(10)により生成された前記入力データブロックを、前記主データセンター(PDC)と前記回復データセンター(RDC)との間に配置された装置(13)に接続された一時記憶領域(27)の対応する記憶場所に前記通信網を介して一時的に書き込む工程;
- 前記データブロックが前記記憶領域(27)に書き込まれるとすぐ、前記装置(13)により前記通信網を介して、前記データブロックの前記一時記憶領域(27)への書き込みが成功したことをアクノリッジする第1の同期肯定応答信号(3)を前記主データセンター(PDC)に送信する工程;
- 前記装置により前記通信網を介して前記データブロックを前記回復データセンター(RDC)に転送する工程;
- 前記装置により前記通信網を介して、前記回復データセンター(RDC)への前記データセットの更新が成功したことをアクノリッジする第2の肯定応答信号(6)を受信し該信号の消去の可否について管理する工程;及び
- 前記第2の肯定応答信号(6)の受信後に、新しい入力データブロックに対して前記一時記憶領域(27)の前記場所を利用できるようにする工程、
を含む方法。 - - 請求項12に記載の方法を行なう前に、前記データセットを前記処理システム(10)に接続された主記憶装置(11)に記憶する工程、
を行なうことを特徴とする請求項12に記載の方法。 - 入力データブロックを前記装置(13)に一時的に書き込む前記工程が、
- リクエストされたアドレスにてデータブロックが記憶領域に書き込まれていないならば、前記データブロックを前記記憶領域(27)に書き込む工程と;
- リクエストされたアドレスにてデータブロックが記憶領域に既に書き込まれているが、前記データブロックが転送されていないならば、前のデータブロックを置換することにより前記データブロックを前記記憶領域(27)に書き込む工程と;
- リクエストされたアドレスにてデータブロックが記憶領域(27)に既に書き込まれ、転送されているが、前記回復データセンター(RDC)から肯定応答を受信していないならば、前記データブロックを前記記憶領域(27)の新しい場所に書き込む工程と、
からなることを特徴とする請求項12に記載の方法。 - 前記入力データブロックを前記記憶領域(27)に一時的に書き込む前記工程が、
- リクエストされたアドレスにてデータブロックが前記記憶領域(27)に二回記憶されているならば、まだ転送されていないデータブロックを置換することにより書き込む工程、
をさらに含むことを特徴とする請求項14に記載の方法。 - 前記データブロックを前記装置(13)から前記回復データセンター(RDC)に転送する前記工程が、
- 前記回復データセンター(RDC)に転送するデータブロックが存在するか否かを調べるために、前記装置(13)に接続された前記記憶領域(27)をポーリングする工程と;
- 転送するデータブロックを前記回復データセンター(RDC)に送ると同時に、所定のタイムアウト遅延を有するタイマーをスタートさせる工程と;
を含み、
前記第2の肯定応答信号を受信し該信号の消去の可否について管理する前記工程が、
- 前記タイムアウト遅延が経過したか否かを調べる工程と;
- 前記タイムアウトが経過したならば、失われたデータブロックを表すカウンタをインクリメントする工程と;
- 失われたデータブロックの前記カウンタが所定の値に達したならば、前記装置(13)へのデータブロックの更なる伝送をロックするためにアラートを主データセンター(PDC)に送る工程と、
を含むことを特徴とする請求項12に記載の方法。 - 前記第2の肯定応答信号を受信し該信号の消去の可否について管理する前記工程が、前記データブロックが回復データセンター(RDC)に到着したが破損していることを示す否定応答信号(NACK)の消去の可否について管理する工程を含むことを特徴とする請求項16に記載の方法。
- 前記タイムアウト遅延が、前記装置(13)から送られて前記回復記憶装置(12)が受信するデータブロックの往復時間よりも大きい値に設定されることを特徴とする請求項16に記載の方法。
- 請求項12に記載の方法を行なう前に、
- リクエストされたアドレスにてデータブロックが前記一時記憶領域(27)に記憶されていないならば、前記装置(13)により回復されたデータブロックを前記回復データセンター(RDC)にリクエストする工程と;
- リクエストされたアドレスにてデータブロックが前記記憶領域に記憶されかつ回復データセンター(RDC)への転送工程が行われていないならば、回復されたデータブロックを一時記憶領域(27)から読み出す工程と;
- リクエストされたアドレスにてデータブロックが前記一時記憶領域に記憶されかつそれらが回復データセンター(RDC)に転送されているならば、回復されたデータブロックを一時記憶領域(27)から読み出す工程と;
- 前記主データセンター(PDC)のリクエストに応じて、前の工程の少なくとも1つを介して前記装置(13)により前記主データセンター(PDC)に対し前記回復されたデータブロックを回復する工程と、
を更に行なうことで、主データセンター(PDC)のデータブロックを回復するためのプロセスが提供されることを特徴とする請求項12に記載の方法。 - 通信網を介してデータセットを更新するための装置であって、前記装置は対応する記憶場所に主データセンター(PDC)に接続された処理システム(10)により生成された入力データブロックを一時的に書き込むため、かつ前記データブロックを回復データセンター(RDC)内に置かれた回復記憶装置(12)に転送するために記憶領域(27)に接続され、前記装置は、
- 前記データブロックが前記一時記憶領域(27)に書き込まれるとすぐ、前記一時記憶領域(27)への前記データブロックの書き込みが成功したことをアクノリッジする第1の同期肯定応答信号(3)を前記通信網を介して前記主データセンター(PDC)に送り、
- 前記データブロックの転送後に、前記データセットの更新が成功したことをアクノリッジする前記回復データセンター(RDC)により送られた第2の肯定応答信号(6)を前記通信網を介して受信し該信号の消去の可否について管理し、
- 前記第2の肯定応答信号(6)の受信後に、新しい入力データブロックに対して前記一時記憶領域(27)の前記場所を利用できるようにする、
モジュールを備えることを特徴とする装置。 - 前記処理システム(10)が、前記データセットのコピーが記憶される主記憶装置(11)に接続されることを特徴とする請求項20に記載の装置。
- 前記装置(13)と前記主データセンター(PDC)との距離が、前記装置(13)と前記回復データセンター(RDC)との距離より短いことを特徴とする請求項20に記載の装置。
- SCSI型プロトコル、iSCSI型プロトコル、ファイバーチャンネル型プロトコルからなる群から選択された少なくとも1つのプロトコルをインターフェースするモジュールを備えることを特徴とする請求項20に記載の装置。
- 前記装置が、
- 前記装置(13)を前記主データセンター(PDC)及び前記回復データセンター(RDC)に対してそれぞれインターフェースするためのインターフェースモジュール(20、26)と;
- データが関連付けられているI/Oコマンドをインターセプトするため、及び前記コマンドを、前記ブロックを一時的に記憶するための記憶領域(27)に送るか又は前記回復記憶装置(12)に送るかを決定するためのフィルターモジュール(21、22)と;
- 前記データブロックとそれらの相対アドレスパラメータとを受信し、それらを前記回復記憶装置(12)の管理のために確保されたコマンド内部にカプセル化し、前記回復データセンター(RDC)に送るための制御モジュール(24、25)と、
を備えることを特徴とする請求項20に記載の装置。 - 前記装置が、
- 前記主データセンター(PDC)に対するネットワーク・インターフェース・カード(NIC)と;
- 前記ネットワーク・インターフェース・カード(NIC)又はホスト・バス・アダプタ(HBA)の下流に配置されたiSCSIターゲット装置(21)と;
- 前記iSCSIターゲット装置(21)の下流に配置された修正されたSCSIターゲット装置(22)と;
- 前記修正されたSCSIターゲット装置(22)に接続されたキャッシュシステム(27)と;
- 前記修正されたSCSIターゲット装置(22)の下流に配置されたロジカル・ボリューム・マネージャーすなわちLVM装置(23)と;
- 前記ロジカル・ボリューム・マネージャー装置(23)の下流に配置されたネイティブSCSIサブシステム(24)と;
- 前記SCSIサブシステム(24)の下流に配置されたiSCSIイニシエータ装置(25)と;
- 前記回復データセンター(RDC)に対する別のネットワーク・インターフェース・カード(NIC)又はホスト・バス・アダプタ(HBA)と、
を備えることを特徴とする請求項20に記載の装置。 - 前記装置が、
- 前記主データセンター(PDC)に対するホスト・バス・アダプタ(HBA)と;
- 前記ホスト・バス・アダプタ(20)の下流に配置された修正されたSCSIターゲット装置(22)と;
- 前記修正されたSCSIターゲット装置(22)に接続されたキャッシュシステム(27)と;
- 前記修正されたSCSIターゲット装置(22)の下流に配置されたロジカル・ボリューム・マネージャーすなわちLVM装置(23)と;
- 前記ロジカル・ボリューム・マネージャー装置(23)の下流に配置されたSCSIサブシステム(24)と;
- 前記回復データセンター(RDC)に対する別のホスト・バス・アダプタ(HBA)と、
を備えることを特徴とする請求項20に記載の装置。 - 前記LVM装置がソフトウエア仮想化装置と置換されることを特徴とする請求項25又は26に記載の装置。
- 前記装置(13)が前記通信網に接続されたネットワーク装置からなることを特徴とする請求項20に記載の装置。
- 請求項12〜19のいずれか一項に記載の方法を実行するソフトウエアコード部分を含んだ、少なくとも1つの電子計算機のメモリにロードできるコンピュータプログラム。
- 電気通信網を介してデータセットを更新するために同期ミラーリングサービスを提供する方法であって、前記データセットは回復データセンター(RDC)内に置かれた回復記憶装置(12)に記憶されると共に、主データセンター(PDC)に接続された少なくとも1つのクライアントシステム(10)により生成されたデータブロックを用いて更新されなければならない方法において、
- 前記電気通信網を介して前記少なくとも1つのクライアントシステム(10)により生成された入力データブロックを、前記主データセンター(PDC)と前記回復データセンター(RDC)との間に配置された装置(13)に接続された一時記憶領域(27)の対応する記憶場所に一時的に書き込む工程;
- 前記データブロックが前記記憶領域(27)に書き込まれるとすぐに、前記装置(13)により前記電気通信網を介して、前記一時記憶領域(27)への前記データブロックの書き込みが成功したことをアクノリッジする第1の同期肯定応答信号(3)を前記主データセンター(PDC)に与える工程;
- 前記装置により前記電気通信網を介して前記データブロックを前記回復データセンター(RDC)に転送する工程;
- 前記装置により前記電気通信網を介して、前記回復データセンター(RDC)への前記データセットの更新が成功したことをアクノリッジする第2の肯定応答信号(6)を受信し該信号の消去の可否について管理する工程;及び
- 前記第2の肯定応答信号(6)の受信後に、新しい入力データブロックに対して前記一時記憶領域(27)の前記場所を利用できるようにする工程、
を含むことを特徴とする方法。 - 請求項30に記載の方法を行なう前に、
- 前記複数の主データセンター(PDC)に接続された夫々のクライアントシステムにより生成された夫々のデータブロックを一時的に書き込むために、複数の主データセンター(PDC)を都市圏型ネットワーク(MAN)中に配置された前記装置(13)に接続する工程と;
- 前記都市圏型ネットワーク(MAN)を広域型ネットワーク(WAN)に接続する工程と;
- 前記夫々のデータブロックを前記装置(13)から前記広域型ネットワーク(WAN)を介して前記回復データセンター(RDC)に転送する工程と、
を更に行なうことを特徴とする請求項30に記載の同期ミラーリングサービスを提供する方法。 - 請求項31に記載の方法を行なう前に、
- クライアントシステム(10)が故障した場合に、他のクライアントシステムの夫々のデータブロックに対して、前記夫々のデータブロックを前記装置(13)から前記広域型ネットワーク(WAN)を介して前記回復データセンター(RDC)に転送している間に優先度を評価する工程、
を更に行なうことを特徴とする請求項31に記載の同期ミラーリングサービスを提供する方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2004/009047 WO2006015612A1 (en) | 2004-08-12 | 2004-08-12 | A system, a method and a device for updating a data set through a communication network |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008509489A JP2008509489A (ja) | 2008-03-27 |
JP4902538B2 true JP4902538B2 (ja) | 2012-03-21 |
Family
ID=34958231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007525173A Expired - Fee Related JP4902538B2 (ja) | 2004-08-12 | 2004-08-12 | 通信網を介してデータセットを更新するためのシステム、方法及び装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7987154B2 (ja) |
EP (1) | EP1776638B1 (ja) |
JP (1) | JP4902538B2 (ja) |
KR (1) | KR101200453B1 (ja) |
CN (1) | CN101031889B (ja) |
AT (1) | ATE414949T1 (ja) |
DE (1) | DE602004017913D1 (ja) |
ES (1) | ES2318300T3 (ja) |
WO (1) | WO2006015612A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7549080B1 (en) * | 2002-08-27 | 2009-06-16 | At&T Corp | Asymmetric data mirroring |
US20080140798A1 (en) * | 2006-12-08 | 2008-06-12 | Aten International Co., Ltd. | Storage adapter and method thereof |
US8234327B2 (en) * | 2007-03-30 | 2012-07-31 | Netapp, Inc. | System and method for bandwidth optimization in a network storage environment |
US8135838B2 (en) | 2008-04-08 | 2012-03-13 | Geminare Incorporated | System and method for providing data and application continuity in a computer system |
US8959182B1 (en) * | 2008-04-15 | 2015-02-17 | Crimson Corporation | Systems and methods for computer data recovery and destruction |
KR101024249B1 (ko) * | 2008-05-28 | 2011-03-29 | 매크로임팩트 주식회사 | 실시간 데이터 복제 시스템 |
US8364636B2 (en) * | 2009-09-14 | 2013-01-29 | International Business Machines Corporation | Real time data replication |
KR101587995B1 (ko) * | 2009-10-28 | 2016-01-22 | 삼성전자주식회사 | 적응적 로깅 장치 및 방법 |
WO2011089678A1 (ja) * | 2010-01-22 | 2011-07-28 | パナソニック株式会社 | 電力収集装置、電力計測装置及び電力収集方法 |
CN101877653A (zh) * | 2010-06-29 | 2010-11-03 | 中兴通讯股份有限公司 | 告警变化信息是否丢失的判定方法、系统及主控板 |
US9223583B2 (en) * | 2010-12-17 | 2015-12-29 | Oracle International Corporation | Proactive token renewal and management in secure conversations |
US9047126B2 (en) * | 2011-04-06 | 2015-06-02 | International Business Machines Corporation | Continuous availability between sites at unlimited distances |
US9058304B2 (en) * | 2011-06-30 | 2015-06-16 | International Business Machines Corporation | Continuous workload availability between sites at unlimited distances |
US9641449B2 (en) * | 2012-05-22 | 2017-05-02 | International Business Machines Corporation | Variable configurations for workload distribution across multiple sites |
CN103678163B (zh) * | 2012-09-18 | 2017-11-10 | 腾讯科技(深圳)有限公司 | 数据流的切换方法、装置及系统 |
US9104607B2 (en) | 2012-10-31 | 2015-08-11 | International Business Machines Corporation | Simulation engine for use in disaster recovery virtualization |
CN103118073B (zh) * | 2013-01-08 | 2015-07-22 | 华中科技大学 | 一种云环境下虚拟机数据持久化存储系统和方法 |
US10034407B2 (en) * | 2016-07-22 | 2018-07-24 | Intel Corporation | Storage sled for a data center |
CN107357536B (zh) * | 2017-07-28 | 2020-07-07 | 郑州云海信息技术有限公司 | 分布式存储系统数据修改写方法及系统 |
US11061924B2 (en) * | 2017-11-22 | 2021-07-13 | Amazon Technologies, Inc. | Multi-region, multi-master replication of database tables |
CN113704212B (zh) * | 2020-05-22 | 2024-08-16 | 深信服科技股份有限公司 | 服务器的数据同步方法、装置、设备及计算机存储介质 |
CN111752764A (zh) * | 2020-08-31 | 2020-10-09 | 湖南康通电子股份有限公司 | 一种数据分布方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004005370A (ja) * | 2002-04-26 | 2004-01-08 | Hitachi Ltd | 記憶装置システムの制御方法および記憶制御装置 |
JP2004038928A (ja) * | 2002-03-19 | 2004-02-05 | Network Appliance Inc | 2つのスナップショット間の変化を判定して宛先スナップショットに送信するシステム及び方法 |
JP2004086721A (ja) * | 2002-08-28 | 2004-03-18 | Nec Corp | データ複製システム、中継装置、データ送受信方法およびストレージ内のデータを複製するためのプログラム |
JP2004126716A (ja) * | 2002-09-30 | 2004-04-22 | Fujitsu Ltd | 広域分散ストレージシステムを利用したデータ格納方法、その方法をコンピュータに実現させるプログラム、記録媒体、及び広域分散ストレージシステムにおける制御装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5574950A (en) | 1994-03-01 | 1996-11-12 | International Business Machines Corporation | Remote data shadowing using a multimode interface to dynamically reconfigure control link-level and communication link-level |
US6304980B1 (en) | 1996-03-13 | 2001-10-16 | International Business Machines Corporation | Peer-to-peer backup system with failure-triggered device switching honoring reservation of primary device |
JPH10207754A (ja) * | 1997-01-16 | 1998-08-07 | Fujitsu Ltd | 更新系データベースの複製方式 |
US5933849A (en) * | 1997-04-10 | 1999-08-03 | At&T Corp | Scalable distributed caching system and method |
US6112239A (en) * | 1997-06-18 | 2000-08-29 | Intervu, Inc | System and method for server-side optimization of data delivery on a distributed computer network |
US6148383A (en) * | 1998-07-09 | 2000-11-14 | International Business Machines Corporation | Storage system employing universal timer for peer-to-peer asynchronous maintenance of consistent mirrored storage |
US6192481B1 (en) * | 1998-08-18 | 2001-02-20 | International Business Machines Corporation | Structure and method for power sequencing of disk drives in a computer system |
CN100409234C (zh) * | 2000-03-23 | 2008-08-06 | 三菱电机株式会社 | 图像检索配送系统和图像检索配送方法 |
US20040233910A1 (en) | 2001-02-23 | 2004-11-25 | Wen-Shyen Chen | Storage area network using a data communication protocol |
US20040006587A1 (en) * | 2002-07-02 | 2004-01-08 | Dell Products L.P. | Information handling system and method for clustering with internal cross coupled storage |
US7134044B2 (en) * | 2002-08-16 | 2006-11-07 | International Business Machines Corporation | Method, system, and program for providing a mirror copy of data |
CN1497458A (zh) * | 2002-10-15 | 2004-05-19 | 松下电器产业株式会社 | 网络数据发送系统 |
US20040146185A1 (en) * | 2002-11-14 | 2004-07-29 | Blair Forrest K. | Apparatus, system, and method for creating an electronic description of a geographic site |
JP2005267609A (ja) * | 2004-02-20 | 2005-09-29 | Fuji Photo Film Co Ltd | デジタル図鑑システム、図鑑検索方法、及び図鑑検索プログラム |
US7395265B2 (en) * | 2004-08-27 | 2008-07-01 | Hitachi, Ltd. | Data processing system and storage subsystem provided in data processing system |
-
2004
- 2004-08-12 DE DE602004017913T patent/DE602004017913D1/de not_active Expired - Lifetime
- 2004-08-12 KR KR1020077005734A patent/KR101200453B1/ko active IP Right Grant
- 2004-08-12 JP JP2007525173A patent/JP4902538B2/ja not_active Expired - Fee Related
- 2004-08-12 CN CN2004800441189A patent/CN101031889B/zh not_active Expired - Fee Related
- 2004-08-12 AT AT04741409T patent/ATE414949T1/de not_active IP Right Cessation
- 2004-08-12 ES ES04741409T patent/ES2318300T3/es not_active Expired - Lifetime
- 2004-08-12 US US11/659,824 patent/US7987154B2/en not_active Expired - Fee Related
- 2004-08-12 WO PCT/EP2004/009047 patent/WO2006015612A1/en active Application Filing
- 2004-08-12 EP EP04741409A patent/EP1776638B1/en not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004038928A (ja) * | 2002-03-19 | 2004-02-05 | Network Appliance Inc | 2つのスナップショット間の変化を判定して宛先スナップショットに送信するシステム及び方法 |
JP2004005370A (ja) * | 2002-04-26 | 2004-01-08 | Hitachi Ltd | 記憶装置システムの制御方法および記憶制御装置 |
JP2004086721A (ja) * | 2002-08-28 | 2004-03-18 | Nec Corp | データ複製システム、中継装置、データ送受信方法およびストレージ内のデータを複製するためのプログラム |
JP2004126716A (ja) * | 2002-09-30 | 2004-04-22 | Fujitsu Ltd | 広域分散ストレージシステムを利用したデータ格納方法、その方法をコンピュータに実現させるプログラム、記録媒体、及び広域分散ストレージシステムにおける制御装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1776638B1 (en) | 2008-11-19 |
US7987154B2 (en) | 2011-07-26 |
DE602004017913D1 (de) | 2009-01-02 |
ATE414949T1 (de) | 2008-12-15 |
KR20070059095A (ko) | 2007-06-11 |
WO2006015612A8 (en) | 2006-05-11 |
WO2006015612A1 (en) | 2006-02-16 |
CN101031889B (zh) | 2011-06-08 |
CN101031889A (zh) | 2007-09-05 |
ES2318300T3 (es) | 2009-05-01 |
KR101200453B1 (ko) | 2012-11-12 |
JP2008509489A (ja) | 2008-03-27 |
EP1776638A1 (en) | 2007-04-25 |
US20070255766A1 (en) | 2007-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4902538B2 (ja) | 通信網を介してデータセットを更新するためのシステム、方法及び装置 | |
US6282610B1 (en) | Storage controller providing store-and-forward mechanism in distributed data storage system | |
JP4236049B2 (ja) | データのミラー・コピーを提供するための方法、システム、およびプログラム | |
EP1796004B1 (en) | Storage system and data processing system | |
US6912629B1 (en) | System and method for restoring data from secondary volume to primary volume in a data storage system | |
US7340490B2 (en) | Storage network data replicator | |
US7467168B2 (en) | Method for mirroring data at storage locations | |
US7043665B2 (en) | Method, system, and program for handling a failover to a remote storage location | |
US7472173B2 (en) | Remote data copying among storage systems | |
EP1873645A1 (en) | Storage system and data replication method | |
JP2006500693A (ja) | 動的rdfグループ | |
CN114096957A (zh) | 跨数据存储设备镜像写操作 | |
US20030154305A1 (en) | High availability lightweight directory access protocol service | |
JP2005157712A (ja) | リモートコピーネットワーク | |
JP4282850B2 (ja) | フォールトトレーラントネットワーク用のファイル同期方法、装置、システム。 | |
JP4721057B2 (ja) | データ管理システム,データ管理方法及びデータ管理用プログラム | |
JP2004272884A (ja) | 複数リモートストレージでのリモートコピー停止後のデータ同期化方式 | |
JP2004272884A5 (ja) | ||
JP6912105B2 (ja) | ディスクアレイシステム、ディスクアレイシステムの制御方法、および、ディスクアレイ装置 | |
JP5874526B2 (ja) | バックアップ取得装置、バックアップ取得方法、およびバックアップ取得プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100727 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100825 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101026 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110127 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110714 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111129 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4902538 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |