JP5218121B2 - Information system and disaster recovery method - Google Patents

Information system and disaster recovery method Download PDF

Info

Publication number
JP5218121B2
JP5218121B2 JP2009025948A JP2009025948A JP5218121B2 JP 5218121 B2 JP5218121 B2 JP 5218121B2 JP 2009025948 A JP2009025948 A JP 2009025948A JP 2009025948 A JP2009025948 A JP 2009025948A JP 5218121 B2 JP5218121 B2 JP 5218121B2
Authority
JP
Japan
Prior art keywords
storage device
storage
data
update
update data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009025948A
Other languages
Japanese (ja)
Other versions
JP2010182154A (en
Inventor
毅郎 葛西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009025948A priority Critical patent/JP5218121B2/en
Publication of JP2010182154A publication Critical patent/JP2010182154A/en
Application granted granted Critical
Publication of JP5218121B2 publication Critical patent/JP5218121B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、同時に被災しないように離れて設けられた複数のストレージ装置を有する情報システム及びディザスタリカバリ方法に関する。   The present invention relates to an information system and a disaster recovery method having a plurality of storage devices provided so as not to be damaged at the same time.

昨今の企業や公共団体などは、市民生活上で重要な役割を担っており、それらが運用する情報システムの役割はますます重要になっている。このため、社会的な責任、危機管理、尊法などの観点からも、災害が発生するなどしてシステム障害に陥っても業務を継続できるか、又は容易に復旧できるようにするという情報システムのリカバリ対策、いわゆるディザスタリカバリ(disaster recovery)が重要となってきている。   Recent enterprises and public organizations play an important role in civic life, and the role of information systems operated by them has become increasingly important. For this reason, from the viewpoint of social responsibility, crisis management, and law, information system recovery that enables business to continue or be easily recovered even if a system failure occurs due to a disaster, etc. Countermeasures, so-called disaster recovery, have become important.

ディザスタリカバリにおける災害とは、サイトに設置した装置に全体的に被害を与える現象全般を意味し、特定の現象を表すものではない。すなわち、建物単体での火災のような小規模なものから、風水害や地震などの大規模なものも含まれる。また、不正侵入やテロなどの人為的な原因のものも含まれる。なお、本明細書において「サイト」とは、コンピュータやストレージ装置などのハードウェアが設置される場所を意味する。また、サイトに設置した装置が災害によって全体的に破損することを「被災」と表記する。   Disasters in disaster recovery mean all phenomena that damage the devices installed on the site as a whole, and do not represent a specific phenomenon. That is, from small-scale things such as a fire in a single building to large-scale things such as storms and floods and earthquakes. It also includes artifacts such as unauthorized intrusion and terrorism. In this specification, “site” means a place where hardware such as a computer or a storage device is installed. In addition, “damaged” means that the device installed on the site is totally damaged by the disaster.

ディザスタリカバリのために、大規模な災害が発生しても同時に影響を受けないことが想定できる程度メインサイトから離してリモートサイトを設け、メインサイト内のデータをリモートサイトに複製(バックアップ)しておき、メインサイトが被災しても、リモートサイトで業務を継続できるようにする手法がある。この手法に関連する技術としては、特許文献1に開示される「ホストシステム間のバックアップシステム」がある。   For disaster recovery, set up a remote site as far as possible from the main site so that even if a large-scale disaster occurs, it can be assumed that it will not be affected at the same time, and replicate (backup) the data in the main site to the remote site, There is a method that allows business to continue at a remote site even if the main site is damaged. As a technique related to this method, there is a “backup system between host systems” disclosed in Patent Document 1.

メインサイトの情報をリモートサイトに反映する方法として、ディスクストレージのレプリケーションが知られている。レプリケーションは、メインサイトのディスクの複製(replica)をリモートサイトに作成する方法である。   Disk storage replication is known as a method for reflecting main site information to a remote site. Replication is a method of creating a replica of the main site disk at the remote site.

以下、メインサイトに設置されたストレージをメインストレージ、リモートサイトに設置されたストレージを複製ストレージと表記する。   Hereinafter, the storage installed at the main site is referred to as main storage, and the storage installed at the remote site is referred to as replication storage.

特許文献1に開示される発明のようにメインサイトとリモートサイトとを通信回線で結んだ情報システムにおいては、図37に示すように、レプリケーションの際には、メインサイトのデータをリモートサイトに送り、リモートサイト内の複製ストレージに反映する。
なお、メインサイトのストレージのデータを更新するのと同期して、複製ストレージにもデータを反映させる情報の伝達を「同期コピー」と表記する。また、メインストレージの更新と同期していないが、メインストレージと同じ順序で複製ストレージにデータを反映させる情報の伝達を「準同期コピー」と表記する。さらに、メインストレージから複製ストレージへ、非同期かつ更新順序を保証せずに行う情報の伝達を「非同期コピー」と表記する。
In an information system in which a main site and a remote site are connected by a communication line as in the invention disclosed in Patent Document 1, as shown in FIG. 37, during replication, data on the main site is sent to the remote site, and the remote site Reflect to the replicated storage in the site.
Note that the transmission of information that reflects the data in the replicated storage in synchronization with the update of the storage data at the main site is referred to as “synchronous copy”. In addition, transmission of information that is not synchronized with the update of the main storage but reflects data in the duplicate storage in the same order as the main storage is referred to as “quasi-synchronous copy”. Furthermore, the transmission of information asynchronously and without guaranteeing the update order from the main storage to the replica storage is referred to as “asynchronous copy”.

メインストレージから複製ストレージに同期コピーを行っている場合、情報の厳密一貫性(strict consistency)が保たれており、メインストレージ内の全てのデータが複製ストレージにも存在するため、メインサイトが被災してもデータの消失は無い。ただし、これはメインサイトとリモートサイトとの間に通信障害が発生しないことが前提である。   When synchronous copy is performed from main storage to replica storage, the strict consistency of information is maintained, and all data in the main storage also exists in the replica storage. There is no data loss. However, this assumes that no communication failure occurs between the main site and the remote site.

なお、厳密一貫性とは、データ項目に対するどのような読み取り操作も、最も新しい書き込み結果に対応した値を返却することである。   Strict consistency means that any read operation on a data item returns a value corresponding to the newest write result.

図37に示した情報システムは、メインサイトとリモートサイトとの間に通信障害が発生すると、同期コピーを実行できないため、図38に示すように更新データをメインストレージのバッファに蓄える。メインストレージは、通信障害が復旧した後、バッファの内容を複製ストレージに準同期コピーする。バッファ内の全てのデータが複製ストレージに反映された時点で、情報システムは同期コピーを行える状態に復旧する。   The information system shown in FIG. 37 stores update data in a buffer of the main storage as shown in FIG. 38 because synchronous copying cannot be performed if a communication failure occurs between the main site and the remote site. The main storage copies the contents of the buffer semi-synchronously to the replica storage after the communication failure is recovered. When all the data in the buffer is reflected in the duplicate storage, the information system is restored to a state where synchronous copying can be performed.

しかし、通信障害が発生している間はリモートサイトにデータが送信されていないため、図39に示すように通信障害発生中でメインストレージにのみ更新データが存在する状態でメインサイトが被災すると、更新データが消失してしまう。   However, since data is not transmitted to the remote site while the communication failure occurs, if the main site is damaged when the communication failure occurs and update data exists only in the main storage as shown in FIG. Data will be lost.

この問題への対処に関連する技術として、特許文献2に開示される「データ複製システム、中継装置、データ送受信方法およびストレージ内のデータを複製するためのプログラム」がある。特許文献1には、ストレージ間の伝送経路に冗長性(redundancy)を持たせる構成が開示されている。この手法によれば、伝送経路のいずれかで通信障害が発生したとしても、別の通信経路を利用して更新データを送信できるため、全ての伝送経路に通信障害が発生しない限り、メインサイトが被災してもデータが消失することはない。   As a technique related to coping with this problem, there is a “data replication system, relay device, data transmission / reception method, and program for replicating data in storage” disclosed in Patent Document 2. Patent Document 1 discloses a configuration in which a transmission path between storages has redundancy. According to this method, even if a communication failure occurs in one of the transmission paths, update data can be transmitted using another communication path, so the main site is damaged unless communication failure occurs in all transmission paths. However, no data is lost.

また、特許文献3に開示される発明のように、リモートサイトを複数にし、冗長性を維持するという手法もある。この手法によれば、一つのリモートサイトとの間で通信障害が発生したとしても、メインサイトから残りのリモートサイトへ更新データを送信できるため、全てのリモートサイトとの間に通信障害が発生しない限り、メインサイトが被災してもデータが消失することはない。   Further, as in the invention disclosed in Patent Document 3, there is also a method of maintaining a redundancy by using a plurality of remote sites. According to this method, even if a communication failure occurs with one remote site, update data can be sent from the main site to the remaining remote sites, so as long as there is no communication failure with all remote sites. Even if the main site is damaged, no data will be lost.

特開2000−76151号公報JP 2000-76151 A 特開2004−86721号公報(図8)Japanese Patent Laying-Open No. 2004-86721 (FIG. 8) 特開2004−227528号公報JP 2004-227528 A

しかし、大規模な災害が発生しても同時に影響を受けないことが想定できる程度離れた位置にあるサイト間の伝送経路に冗長性を持たせることは容易ではなく、ケーブルの敷設等に多大な費用や時間が必要となる。   However, it is not easy to provide redundancy for the transmission paths between sites that are far enough to assume that they will not be affected at the same time even if a large-scale disaster occurs. Expenses and time are required.

また、リモートサイトを複数持つことは、多大な費用が必要となり、多くのシステムにとって現実的ではない。すなわち、リモートサイトを開設する場所や機材の用意や各リモートサイトとメインサイトとを接続するケーブルを敷設する作業などの初期投資のみならず、それらを維持管理する費用が必要となってしまう。さらに、複数のリモートサイトを開設すると情報システムの運用が複雑になってしまう。   Also, having multiple remote sites is expensive and not practical for many systems. In other words, not only initial investment such as preparation of a place and equipment for establishing a remote site and installation of a cable connecting each remote site and the main site, but also costs for maintaining and managing them. Furthermore, the operation of an information system becomes complicated when multiple remote sites are opened.

したがって、特許文献2や3に開示される発明は、低コストでのディザスタリカバリの実現が困難である。   Therefore, it is difficult for the inventions disclosed in Patent Documents 2 and 3 to realize disaster recovery at a low cost.

このように、リモートサイトとの通信障害発生中にメインサイトが被災してもデータが消失することがなく、低コストで導入可能な情報システム及びディザスタリカバリ方法は提供されていなかった。   As described above, there is no information system and disaster recovery method that can be introduced at low cost without data being lost even if the main site is damaged during a communication failure with a remote site.

本発明は係る問題に鑑みてなされたものであり、リモートサイトとの通信障害発生中にメインサイトが被災してもデータが消失することがなく、低コストで導入可能な情報システム及びディザスタリカバリ方法を提供することを目的とする。   The present invention has been made in view of the above problems, and an information system and a disaster recovery method that can be introduced at a low cost without causing data loss even if a main site is damaged during a communication failure with a remote site. The purpose is to provide.

上記目的を達成するため、本発明は、第1の態様として、第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムであって、同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に更新されたデータを反映させるコピーであり、第1及び第2のストレージ装置の双方に接続された第3のストレージ装置を有し、第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、更新データを第3のストレージ装置へ同期コピーし、第3のストレージ装置に格納した更新データを、第2のストレージ装置へ準同期コピーし、準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、第1のストレージ装置と第2のストレージ装置との間の通信障害が解消された後に、第1のストレージ装置からの更新データの同期コピー先を第2のストレージ装置に戻すことを特徴とする情報システムを提供するものである。 In order to achieve the above object, according to the present invention, as a first aspect, when the data of the first storage device and the first storage device is updated, the update data is synchronously copied from the first storage device. The synchronous copy is a copy that reflects the updated data in the other storage device in synchronization with the update of the data in the one storage device, If there is a third storage device connected to both the first and second storage devices, and a communication failure occurs between the first storage device and the second storage device, update data is stored. copy sync to the third storage device, the update data stored in the third storage apparatus, quasi-synchronous copy to the second storage device, quasi-synchronous copy, the one storage device In over data updates asynchronously, and a copy to reflect the updated data to another storage device in the same order as the updating of data in one storage device, between the first storage apparatus and second storage apparatus An information system is provided in which the synchronous copy destination of the update data from the first storage device is returned to the second storage device after the communication failure is resolved.

上記目的を達成するため、本発明は、第2の態様として、第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムであって、同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に更新されたデータを反映させるコピーであり、第1のストレージ装置に接続された第3のストレージ装置を有し、第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、更新データを第3のストレージ装置へ同期コピーし、第1のストレージ装置と第2のストレージ装置との間の通信障害が解消された後に、第3のストレージ装置に格納した更新データを、第1のストレージ装置を経由して第2のストレージ装置へ準同期コピーし、準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、第1のストレージ装置からの更新データの同期コピー先を第2のストレージ装置に戻し、第1のストレージ装置と第2のストレージ装置との間で通信障害が発生している間に第1のストレージ装置が破損した場合は、第1のストレージ装置の修復後に第2のストレージ装置からデータを書き戻し、その後、第3のストレージ装置に格納した更新データを第1のストレージ装置へ準同期コピーすることを特徴とする情報システムを提供するものである。 In order to achieve the above object, according to the present invention, as a second aspect, when the data of the first storage device and the first storage device is updated, the update data is synchronously copied from the first storage device. The synchronous copy is a copy that reflects the updated data in the other storage device in synchronization with the update of the data in the one storage device, a third storage apparatus connected to the first storage device, when a communication failure occurs between the first storage device and the second storage device, the update data third storage device copy synchronization to, after the communication failure between the first storage apparatus and second storage apparatus has been eliminated, the update data stored in the third storage apparatus, the first stress The second quasi-synchronous copy to the storage device via the di apparatus, quasi-synchronous copy, the data update and asynchronous one storage device, and the other in the same order as the updating of the data of one storage device A copy that reflects update data in the storage device, and returns the synchronous copy destination of the update data from the first storage device to the second storage device, and communicates between the first storage device and the second storage device. When the first storage device is damaged while a failure occurs, the data is written back from the second storage device after the first storage device is repaired, and then the update data stored in the third storage device The information system is characterized in that the quasi-synchronous copying is performed to the first storage device.

上記目的を達成するため、本発明は、第3の態様として、第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムにおけるディザスタリカバリ方法であって、同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に更新されたデータを反映させるコピーであり、第1及び第2のストレージ装置の双方に第3のストレージ装置を接続し、第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、更新データを第3のストレージ装置へ同期コピーし、第3のストレージ装置に格納した更新データを、第2のストレージ装置へ準同期コピーし、準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、第1のストレージ装置と第2のストレージ装置との間の通信障害が解消された後に、第1のストレージ装置からの更新データの同期コピー先を第2のストレージ装置に戻すことを特徴とするディザスタリカバリ方法を提供するものである。 In order to achieve the above object, according to the present invention, as a third aspect, when the data of the first storage device and the first storage device are updated, the update data is synchronously copied from the first storage device. A disaster recovery method in an information system comprising a second storage device, wherein the synchronous copy reflects the updated data in another storage device in synchronization with the update of data in one storage device If the third storage device is connected to both the first and second storage devices and a communication failure occurs between the first storage device and the second storage device, the update data the copy synchronization to the third storage device, the update data stored in the third storage apparatus, quasi-synchronous copy to the second storage device, quasi-synchronous copy In one of the storage device data updates and asynchronous, and a copy to reflect the updated data in the same order as the updating of the data of one storage device to another storage device, the first storage apparatus and second storage It is an object of the present invention to provide a disaster recovery method characterized in that after a communication failure with an apparatus is resolved, a synchronous copy destination of update data from the first storage apparatus is returned to the second storage apparatus.

上記目的を達成するため、本発明は、第4の態様として、第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムにおけるディザスタリカバリ方法であって、同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に更新されたデータを反映させるコピーであり、第1のストレージ装置に第3のストレージ装置を接続し、第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、更新データを第3のストレージ装置へ同期コピーし、第1のストレージ装置と第2のストレージ装置との間の通信障害が解消された後に、第3のストレージ装置に格納した更新データを、第1のストレージ装置を経由して第2のストレージ装置へ準同期コピーし、準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、第1のストレージ装置からの更新データの同期コピー先を第2のストレージ装置に戻し、第1のストレージ装置と第2のストレージ装置との間で通信障害が発生している間に第1のストレージ装置が破損した場合は、第1のストレージ装置の修復後に第2のストレージ装置からデータを書き戻し、その後、第3のストレージ装置に格納した更新データを第1のストレージ装置へ準同期コピーすることを特徴とするディザスタリカバリ方法を提供するものである。
In order to achieve the above object, according to a fourth aspect of the present invention, the update data is synchronously copied from the first storage device when the first storage device and the data of the first storage device are updated. A disaster recovery method in an information system comprising a second storage device, wherein the synchronous copy reflects the updated data in another storage device in synchronization with the update of data in one storage device If the third storage device is connected to the first storage device and a communication failure occurs between the first storage device and the second storage device, the update data is transferred to the third storage device. synchronization copied to device, after the communication failure between the first storage apparatus and second storage apparatus has been eliminated, and stored in the third storage apparatus updates The chromatography data via the first storage device quasi-synchronous copy to the second storage device, quasi-synchronous copy, the data updates asynchronously of one storage device and the data of one storage device This is a copy in which update data is reflected in another storage device in the same order as the update, and the synchronous copy destination of the update data from the first storage device is returned to the second storage device, and the first storage device and the second storage device If the first storage device is damaged while a communication failure has occurred with the storage device, data is written back from the second storage device after the first storage device is repaired, and then the third storage device The present invention provides a disaster recovery method characterized in that update data stored in a storage device is quasi-synchronously copied to a first storage device.

本発明によれば、リモートサイトとの通信障害発生中にメインサイトが被災してもデータが消失することがなく、低コストで導入可能な情報システム及びディザスタリカバリ方法を提供できる。   According to the present invention, it is possible to provide an information system and a disaster recovery method that can be introduced at low cost without data being lost even if the main site is damaged during a communication failure with a remote site.

本発明を好適に実施した第1の実施形態に係る情報システムの構成を示す図である。It is a figure which shows the structure of the information system which concerns on 1st Embodiment which implemented this invention suitably. 第1の実施形態に係る情報システムの詳細な構成を示す図である。It is a figure which shows the detailed structure of the information system which concerns on 1st Embodiment. メインストレージのディスクから複製ストレージのディスクに同期コピーを行う通常状態を示す図である。It is a figure which shows the normal state which performs synchronous copy from the disk of main storage to the disk of replication storage. メインサイトとリモートサイトとの間で通信障害が発生した状態を示す図である。It is a figure which shows the state which the communication failure generate | occur | produced between the main site and the remote site. メインサイトとリモートサイトとの間で通信障害が発生中にメインサイトが被災した状態を示す図である。It is a figure which shows the state in which the main site was damaged while the communication failure generate | occur | produced between the main site and the remote site. ジャーナルストレージが複製ストレージに差分反映完了を通知した状態を示す図である。It is a figure which shows the state which the journal storage notified difference completion completion to the replication storage. メインサイトとリモートサイトとの間で通信障害が発生した後、メインサイトが被災せずに通信障害が解消した状態を示す図である。It is a figure which shows the state from which the communication failure was eliminated without the main site being damaged after the communication failure between the main site and the remote site. ジャーナルストレージがメインストレージ及び複製ストレージに差分反映完了を通知した状態を示す図である。It is a figure which shows the state which the journal storage notified the difference reflection completion to the main storage and the replication storage. メインストレージが、同期コピー先を複製ストレージに切り替えた状態を示す図である。It is a figure which shows the state which the main storage switched the synchronous copy destination to the replication storage. ジャーナルストレージに空き容量が無くなった状態を示す図である。It is a figure which shows the state where the free space is lost in the journal storage. ジャーナルストレージに空きができたのち、バッファに格納した更新データがジャーナルストレージへ準同期コピーされる状態を示す図である。It is a figure which shows the state in which the update data stored in the buffer are semi-synchronously copied to the journal storage after the journal storage is vacant. メインサイトとジャーナルサイトとの間及びリモートサイトとジャーナルサイトとの間に通信障害が発生した状態を示す図である。It is a figure which shows the state which the communication failure generate | occur | produced between the main site and the journal site, and between the remote site and the journal site. メインサイトとリモートサイトとの間及びジャーナルサイトとリモートサイトとの間に通信障害が発生した状態を示す図である。It is a figure which shows the state which the communication failure generate | occur | produced between the main site and the remote site, and between the journal site and the remote site. メインサイトとリモートサイトとの間及びメインサイトとジャーナルサイトとの間に通信障害が発生した状態を示す図である。It is a figure which shows the state which the communication failure generate | occur | produced between the main site and the remote site, and between the main site and the journal site. 本発明を好適に実施した第2の実施形態に係る情報システムの詳細な構成を示す図である。It is a figure which shows the detailed structure of the information system which concerns on 2nd Embodiment which implemented this invention suitably. メインサイトとリモートサイトとの間に通信障害が発生した状態を示す図である。It is a figure which shows the state which the communication failure generate | occur | produced between the main site and the remote site. メインサイトとリモートサイトとの間の通信障害が解消した状態を示す図である。It is a figure which shows the state from which the communication failure between a main site and a remote site was eliminated. ジャーナルストレージが複製ストレージに差分反映完了を通知した状態を示す図である。It is a figure which shows the state which the journal storage notified difference completion completion to the replication storage. メインストレージから複製ストレージへの同期コピーが再開された状態を示す図である。It is a figure which shows the state by which the synchronous copy from main storage to replication storage was restarted. 本発明を好適に実施した第3の実施形態に係る情報システムの構成を示す図である。It is a figure which shows the structure of the information system which concerns on 3rd Embodiment which implemented this invention suitably. 第3の実施形態に係る情報システムの詳細な構成を示す図である。It is a figure which shows the detailed structure of the information system which concerns on 3rd Embodiment. メインストレージが同期コピー先をジャーナルストレージに切り替えた状態を示す図である。It is a figure which shows the state which the main storage switched the synchronous copy destination to the journal storage. 複製ストレージ内のデータをメインストレージに書き戻した状態を示す図である。It is a figure which shows the state which written in the main storage the data in replication storage. ジャーナルストレージから更新データをメインストレージに準同期コピーするとともに、メインストレージから複製ストレージへも準同期コピーする状態を示す図である。FIG. 6 is a diagram showing a state in which update data is copied from the journal storage to the main storage semi-synchronously and also from the main storage to the replica storage. 複製ストレージがメインストレージへ差分反映完了を通知した状態を示す図である。It is a figure which shows the state which the replication storage notified the difference reflection completion to the main storage. メインストレージへの更新データが複製ストレージに同期コピーされる状態を示す図である。It is a figure which shows the state by which the update data to main storage are synchronously copied to replication storage. ジャーナルストレージが更新データをメインストレージを経由して、複製ストレージへ準同期コピーする状態を示す図である。It is a figure which shows the state which journal storage copies update data to a replication storage via main storage. ジャーナルストレージがメインストレージに差分反映完了を通知した状態を示す図である。It is a figure which shows the state which the journal storage notified the difference reflection completion to the main storage. 同期が完了したことを複製ストレージがメインストレージに通知した状態を示す図である。It is a figure which shows the state which the replication storage notified to the main storage that the synchronization was completed. メインストレージから複製ストレージへの同期コピーが再開された状態を示す図である。It is a figure which shows the state by which the synchronous copy from main storage to replication storage was restarted. 複製ストレージにバッファを設けた構成の情報システムを示す図である。It is a figure which shows the information system of the structure which provided the buffer in the replication storage. ジャーナルストレージからの準同期コピーが完了するまでの間は更新データをバッファに蓄積する状態を示す図である。It is a figure which shows the state which accumulate | stores update data in a buffer until the semisynchronous copy from journal storage is completed. ジャーナルストレージから複製ストレージへの更新データの準同期コピーが完了した状態を示す図である。It is a figure which shows the state which the semi-synchronous copy of the update data from a journal storage to a replication storage was completed. 複製ストレージのバッファ内の更新データが反映された状態を示す図である。It is a figure which shows the state in which the update data in the buffer of replication storage were reflected. ジャーナルサイトをデータセンタに集約し、複数のメインサイトとそのリモートサイトとをデータセンタと接続した状態を示す図である。FIG. 4 is a diagram illustrating a state in which journal sites are aggregated in a data center, and a plurality of main sites and their remote sites are connected to the data center. ジャーナルサイトをデータセンタに集約し、複数のメインサイトとそのリモートサイトとをデータセンタと接続した状態を示す図である。FIG. 4 is a diagram illustrating a state in which journal sites are aggregated in a data center, and a plurality of main sites and their remote sites are connected to the data center. メインサイトの更新データをリモートサイトに同期コピーする状態を示す図である。It is a figure which shows the state which synchronously copies the update data of a main site to a remote site. メインサイトとリモートサイトとの間に通信障害が発生した状態を示す図である。It is a figure which shows the state which the communication failure generate | occur | produced between the main site and the remote site. メインサイトとリモートサイトとの間に通信障害が発生中にメインサイトが被災した状態を示す図である。It is a figure which shows the state which the main site was damaged while the communication failure generate | occur | produced between the main site and the remote site.

〔第1の実施形態〕
本発明を好適に実施した第1の実施形態について説明する。
図1に、本実施形態に係る情報システムの構成を示す。本実施形態に係る情報システムは、メインストレージ110と、メインストレージ110のデータが更新された際に、更新データがメインストレージ110から同期コピーされる複製ストレージ130とを備えた情報システムであって、メインストレージ110及び複製ストレージ130の双方にネットワーク151、153を介して接続されたジャーナルストレージ140を有し、メインストレージ110と複製ストレージ130との間のネットワーク151に通信障害が発生した場合には、更新データをジャーナルストレージ140へ同期コピーし、ジャーナルストレージ140に格納した更新データを、複製ストレージ130へ準同期コピーし、ネットワーク151の通信障害が解消された後に、メインストレージ110からの更新データの同期コピー先を複製ストレージ130に戻す。
[First Embodiment]
A first embodiment in which the present invention is suitably implemented will be described.
FIG. 1 shows the configuration of the information system according to this embodiment. The information system according to the present embodiment is an information system including a main storage 110 and a duplicate storage 130 to which update data is synchronously copied from the main storage 110 when data in the main storage 110 is updated. When the main storage 110 and the replication storage 130 both have a journal storage 140 connected via the networks 151 and 153, and a communication failure occurs in the network 151 between the main storage 110 and the replication storage 130, The update data is synchronously copied to the journal storage 140, and the update data stored in the journal storage 140 is semi-synchronously copied to the replication storage 130, and after the communication failure of the network 151 is resolved, the update data from the main storage 110 is copied. Returning the synchronous copy destination data replication storage 130.

図2に、本実施形態に係る情報システムのより詳細な構成を示す。
本実施形態に係る情報システムは、メインサイト、リモートサイト及びジャーナルサイトの三つのサイトを備える。各サイトは、大規模な災害が発生しても同時に被災しないように離れて設けられている。
FIG. 2 shows a more detailed configuration of the information system according to the present embodiment.
The information system according to the present embodiment includes three sites: a main site, a remote site, and a journal site. Each site is set apart so that a large-scale disaster will not occur at the same time.

メインサイトには、プログラム制御によって動作するホストコンピュータ100及びメインストレージ110が設置されている。   At the main site, a host computer 100 and a main storage 110 that operate under program control are installed.

ホストコンピュータ100は、ディスクアクセス部101を備える。ディスクアクセス部101は、メインストレージ110に対して情報の読み込み及び書き込みを行う。   The host computer 100 includes a disk access unit 101. The disk access unit 101 reads information from and writes information to the main storage 110.

メインストレージ110は、ディスク111、バッファ112、ビットマップ113、ストレージ制御部114及び通信部115を備える。ビットマップ113は、メインストレージ110と複製ストレージ130との間で一貫性が保てなくなった後でメインストレージ110上で更新された領域を表している。ストレージ制御部114は、メインストレージ110の各部の動作を制御する。通信部115は、リモートサイトに設けられている複製ストレージ130やジャーナルサイトに設けられているジャーナルストレージ140との通信を行う。また、リモートサイトとの間のネットワーク151やジャーナルサイトとの間のネットワーク152に通信障害が発生したことを検出する。   The main storage 110 includes a disk 111, a buffer 112, a bitmap 113, a storage control unit 114, and a communication unit 115. The bitmap 113 represents an area updated on the main storage 110 after consistency cannot be maintained between the main storage 110 and the duplicate storage 130. The storage control unit 114 controls the operation of each unit of the main storage 110. The communication unit 115 communicates with the replication storage 130 provided at the remote site and the journal storage 140 provided at the journal site. Further, it detects that a communication failure has occurred in the network 151 with the remote site and the network 152 with the journal site.

リモートサイトには、プログラム制御によって動作するホストコンピュータ120及び複製ストレージ130が設置されている。   At the remote site, a host computer 120 and a duplicate storage 130 that operate under program control are installed.

ホストコンピュータ120は、ディスクアクセス部121を備える。ディスクアクセス部121は、複製ストレージ130に対して情報の読み込み及び書き込みを行う。   The host computer 120 includes a disk access unit 121. The disk access unit 121 reads information from and writes information to the replica storage 130.

複製ストレージ130は、ディスク131、ストレージ制御部134、及び通信部135を備える。ストレージ制御部134は、複製ストレージ130の各部の動作を制御する。通信部135は、メインサイトに設けられているメインストレージ110やジャーナルサイトに設けられているジャーナルストレージ140との通信を行う。また、メインサイトとの間のネットワーク152やジャーナルサイトとの間のネットワーク153に通信障害が発生したことを検出する。なお、複製ストレージ130は、メインストレージ110との間で厳密一貫性が保たれている状態、メインストレージ110との間で順序一貫性(sequential consistency)が保たれている状態、及び、メインストレージ110との間に一貫性が保たれていない状態のいずれかの状態をとる。
なお、順序一貫性とは、全てのプロセスによるストレージに対する読み書き操作は、どのプロセスからも同じ順序で観測できることである。順序一貫性は、操作が行われた時間については言及しない。ただし、個々のプロセスに閉じれば、そのプログラムに書かれた順序通りに観測できる。
The duplicate storage 130 includes a disk 131, a storage control unit 134, and a communication unit 135. The storage control unit 134 controls the operation of each unit of the duplicate storage 130. The communication unit 135 communicates with the main storage 110 provided at the main site and the journal storage 140 provided at the journal site. Further, it detects that a communication failure has occurred in the network 152 with the main site and the network 153 with the journal site. The duplicate storage 130 is in a state in which strict consistency is maintained with the main storage 110, a state in which sequential consistency is maintained with the main storage 110, and the main storage 110 One of the states in which consistency is not maintained is taken.
Note that the order consistency means that all processes can read and write operations to the storage from any process in the same order. Order consistency does not refer to the time at which the operation was performed. However, if you close to individual processes, you can observe them in the order written in the program.

ジャーナルサイトには、ジャーナルストレージ140が設置されている。ジャーナルストレージ140は、ディスク141、通信部142及びストレージ制御部143を備える。ストレージ制御部143は、ジャーナルストレージ140の各部の動作を制御する。通信部142は、メインサイトに設けられているメインストレージ110やリモートサイトに設けられている複製ストレージ130との通信を行う。また、メインサイトとの間のネットワーク152やリモートサイトとの間のネットワーク153に通信障害が発生したことを検出する。   A journal storage 140 is installed at the journal site. The journal storage 140 includes a disk 141, a communication unit 142, and a storage control unit 143. The storage control unit 143 controls the operation of each unit of the journal storage 140. The communication unit 142 communicates with the main storage 110 provided at the main site and the replication storage 130 provided at the remote site. Further, it detects that a communication failure has occurred in the network 152 with the main site and the network 153 with the remote site.

各サイト間は、ネットワーク151〜153でそれぞれ接続されている。   The sites are connected by networks 151 to 153, respectively.

次に、本実施形態に係る情報システムのリカバリ動作について説明する。なお、上記のように、メインストレージ110、複製ストレージ130及びジャーナルストレージ140の動作はそれぞれストレージ制御部114、134及び143によって制御され、ストレージ間の通信は通信部115、135及び142によって実現されるが、以下では説明の簡略化のため、単にストレージ装置が動作(コピーや通信など)を行うと表記する。   Next, the recovery operation of the information system according to the present embodiment will be described. As described above, the operations of the main storage 110, the replica storage 130, and the journal storage 140 are controlled by the storage control units 114, 134, and 143, respectively, and communication between the storages is realized by the communication units 115, 135, and 142. However, for the sake of simplification of description, it is simply expressed that the storage apparatus performs an operation (copying, communication, etc.).

本実施形態において、情報システムは厳密一貫性を必要とするシステムであるとする。ただし、本発明を厳密一貫性を必要とするシステムに限定する主旨ではなく、順序一貫性を必要とするシステムとして構成することも可能である。   In this embodiment, it is assumed that the information system is a system that requires strict consistency. However, the present invention is not intended to be limited to a system that requires strict consistency, and can be configured as a system that requires order consistency.

通常状態では、メインサイトとリモートサイトとの間でネットワーク151を介して通信し、図3に示すようにメインストレージ110のディスク111から複製ストレージ130のディスク131に同期コピーを行う。   In the normal state, communication is performed between the main site and the remote site via the network 151, and the synchronous copy is performed from the disk 111 of the main storage 110 to the disk 131 of the duplicate storage 130 as shown in FIG.

図4に示すようにメインサイトとリモートサイトとの間で通信障害が発生した場合について説明する。メインストレージ110及び複製ストレージ130は、ハートビート通信などによって通信障害を検出する。通信障害が検出されると、メインストレージ110は、同期コピー先をジャーナルストレージ140のディスク141に変更し、リモートサイトへ送信できなかったデータを順にジャーナルストレージ140へ送信する。   A case where a communication failure occurs between the main site and the remote site as shown in FIG. 4 will be described. The main storage 110 and the duplicate storage 130 detect a communication failure by heartbeat communication or the like. When a communication failure is detected, the main storage 110 changes the synchronous copy destination to the disk 141 of the journal storage 140, and sequentially sends data that could not be sent to the remote site to the journal storage 140.

複製ストレージ130は、メインストレージ110からの同期コピーを受けられなくなったため、厳密一貫性を保った状態から順序一貫性を保った状態へと遷移する。本実施形態においては情報システムが厳密一貫性を必要とするシステムであるため、以降リモートサイトのホストコンピュータ120からディスク131内のデータを参照する処理はエラーとなる。   Since the duplicate storage 130 can no longer receive a synchronous copy from the main storage 110, the replica storage 130 transitions from a state in which strict consistency is maintained to a state in which order consistency is maintained. In the present embodiment, since the information system is a system that requires strict consistency, the process of referring to the data in the disk 131 from the host computer 120 at the remote site will result in an error.

ジャーナルストレージ140は、メインストレージ110と同期して更新データをディスク141に書き込む。メインストレージ110からの同期コピー先が複製ストレージ130のディスク131からジャーナルストレージ140のディスク141へ切り替わると、ジャーナルストレージ140は複製ストレージ130との通信を確立する。接続後、ジャーナルストレージ140は、ディスク141に保存されている更新データを複製ストレージ130のディスク131へ準同期コピーする。更新順序が維持されるため、メインストレージ110と複製ストレージ130との順序一貫性が保たれる。   The journal storage 140 writes update data to the disk 141 in synchronization with the main storage 110. When the synchronous copy destination from the main storage 110 is switched from the disk 131 of the replication storage 130 to the disk 141 of the journal storage 140, the journal storage 140 establishes communication with the replication storage 130. After connection, the journal storage 140 semi-synchronously copies the update data stored in the disk 141 to the disk 131 of the replication storage 130. Since the update order is maintained, order consistency between the main storage 110 and the duplicate storage 130 is maintained.

この状態で、図5に示すようにメインサイトが被災した場合について説明する。
この場合、ジャーナルストレージ140は、ディスク141に存在する更新データの複製ストレージ130のディスク131への準同期コピーを継続する。ディスク141に存在する更新データを全てディスク131に準同期コピーした後、図6に示すように、ジャーナルストレージ140は差分反映完了を複製ストレージ130に通知する。複製ストレージ130は、差分反映完了の通知を受け取った時点で全データが最新となっている。このとき、複製ストレージ130はメインストレージ110との厳密一貫性が保たれた状態であり、リモートサイトのホストコンピュータ120からディスク131内のデータを参照する処理が可能である。
In this state, a case where the main site is damaged as shown in FIG. 5 will be described.
In this case, the journal storage 140 continues the quasi-synchronous copy of the update data existing on the disk 141 to the disk 131 of the duplicate storage 130. After all the update data existing in the disk 141 is quasi-synchronously copied to the disk 131, the journal storage 140 notifies the replication storage 130 of the completion of the difference reflection as shown in FIG. In the duplicate storage 130, all data is the latest when the notification of the difference reflection completion is received. At this time, the duplicate storage 130 is in a state in which strict consistency with the main storage 110 is maintained, and processing for referencing data in the disk 131 from the host computer 120 at the remote site is possible.

一般に、ストレージのデータが最新になった後は、ジャーナルによるロールバックなどを行い、OS(Operating System)や上位のアプリケーションから論理的に整合性のあるデータになるように修復が行われる。本実施形態においても、公知のロールバックを行うものとする。なお、順序一貫性が保たれた状態でなければジャーナルによる修復は行えないが、上記の手順においては常に順序一貫性が保たれているため、ジャーナルによる修復が可能である。   Generally, after the storage data becomes the latest, a rollback by a journal or the like is performed, and restoration is performed so that logically consistent data is obtained from an OS (Operating System) or a higher-level application. Also in this embodiment, a known rollback is performed. The journal cannot be repaired unless order consistency is maintained. However, in the above procedure, the order consistency is always maintained, so that journal repair is possible.

次に、図4に示すように通信障害が発生した後、図7に示すようにメインサイトが被災せずに通信障害から復旧した場合について説明する。メインストレージ110は定期的に複製ストレージ130に対する通信を試み、通信が成功した時点で通信障害が解消されたことを認識する。メインストレージ130は、複製ストレージ130との間の通信が復旧したことを、通信復旧通知を送信することによってジャーナルストレージ140に通知する。メインストレージ110は、通信復旧後もジャーナルストレージ140への更新データの送信を継続する。   Next, after a communication failure occurs as shown in FIG. 4, a case where the main site is recovered from the communication failure without being damaged as shown in FIG. 7 will be described. The main storage 110 periodically tries to communicate with the duplicate storage 130, and recognizes that the communication failure has been resolved when the communication is successful. The main storage 130 notifies the journal storage 140 that the communication with the replication storage 130 has been recovered by sending a communication recovery notification. The main storage 110 continues to send update data to the journal storage 140 even after communication is restored.

ジャーナルストレージ140は、通信復旧通知を受け取った後、ディスク141に存在する更新データが全て複製ストレージ130のディスク131に反映され、ディスク141に更新データが存在しなくなった時点で、図8に示すようにメインストレージ110及び複製ストレージ130に差分反映完了を通知する。ジャーナルストレージ140は、差分反映完了を通知するまでは、ディスク111からの同期コピーを受け付け、ディスク131への準同期コピーを継続する。   After the journal storage 140 receives the communication recovery notification, all the update data existing in the disk 141 is reflected in the disk 131 of the replication storage 130 and no update data exists in the disk 141, as shown in FIG. Notifies the main storage 110 and the duplicate storage 130 of the completion of the difference reflection. The journal storage 140 accepts the synchronous copy from the disk 111 and continues the semi-synchronous copy to the disk 131 until it notifies the difference reflection completion.

差分反映完了通知を受け取ったメインストレージ110は、図9に示すように、同期コピー先を複製ストレージ130のディスク131に切り替える。以降は、ジャーナルストレージ140は使用せずにメインストレージ110と複製ストレージ130との間で通信を行う。   Receiving the difference reflection completion notification, the main storage 110 switches the synchronous copy destination to the disk 131 of the replication storage 130 as shown in FIG. Thereafter, communication is performed between the main storage 110 and the replica storage 130 without using the journal storage 140.

同様に、差分反映完了通知を受け取った複製ストレージ130は、ジャーナルストレージ140のディスク141からの準同期コピーに替わり、メインストレージ110のディスク111からの同期コピーを処理する。複製ストレージ130は、ディスク111からの同期コピーを受け付ける時点でメインストレージ110との厳密一貫性が保たれた状態となる。したがって、これ以降は、リモートサイトのホストコンピュータ120からディスク131内のデータを参照する処理が可能である。   Similarly, the duplicate storage 130 that has received the difference reflection completion notification processes the synchronous copy from the disk 111 of the main storage 110 instead of the semi-synchronous copy from the disk 141 of the journal storage 140. The duplicate storage 130 is in a state in which strict consistency with the main storage 110 is maintained when a synchronous copy from the disk 111 is received. Therefore, thereafter, it is possible to refer to data in the disk 131 from the host computer 120 at the remote site.

次に、ジャーナルストレージ140に空き容量が無くなった場合の動作について説明する。図10に示すようにジャーナルストレージ140に空き容量が無くなると、メインストレージ110のディスク111からジャーナルストレージ140のディスク141への同期コピーができなくなるため、メインストレージ110は更新データをバッファ112に格納する。ジャーナルストレージ140のディスク141に空きができたら、図11に示すように、メインストレージ110はバッファ112に格納した更新データを準同期コピーによってジャーナルストレージ140のディスク141へ送信する。
メインストレージ110のバッファ112を使用しているため、この状態でメインサイトが被災すると更新データが消失するが、複製ストレージ130又はジャーナルストレージ140にコピーしたデータは、少なくとも順序一貫性が保たれているため、残ったデータを使用して情報システムを復旧することができる。
Next, the operation when the journal storage 140 runs out of free space will be described. As shown in FIG. 10, when there is no free space in the journal storage 140, synchronous copying from the disk 111 of the main storage 110 to the disk 141 of the journal storage 140 cannot be performed, so the main storage 110 stores the update data in the buffer 112. . When the disk 141 in the journal storage 140 is free, the main storage 110 transmits the update data stored in the buffer 112 to the disk 141 in the journal storage 140 by semi-synchronous copying as shown in FIG.
Since the buffer 112 of the main storage 110 is used, the update data is lost when the main site is damaged in this state, but the data copied to the replication storage 130 or the journal storage 140 is at least in order consistency. The information system can be recovered using the remaining data.

バッファ112に空き容量が無くなった場合、メインストレージ110は、ディスク111上の更新箇所をビットマップ113で管理する方法に切り替える。メインストレージ110は、バッファ112に空き容量が無くなったことを複製ストレージ130に通知する。そして、バッファ112に格納した更新データが準同期コピーでジャーナルストレージ140へ送信され、ジャーナルストレージ140から複製ストレージ130への更新データの反映が完了したら、複製ストレージ130は、ビットマップ113で管理された更新箇所をディスク131に反映させる。   When the buffer 112 runs out of free space, the main storage 110 switches to a method of managing the update location on the disk 111 with the bitmap 113. The main storage 110 notifies the duplicate storage 130 that there is no more free space in the buffer 112. Then, the update data stored in the buffer 112 is transmitted to the journal storage 140 by a semi-synchronous copy, and when the update data is reflected from the journal storage 140 to the replication storage 130, the replication storage 130 is managed by the bitmap 113. The update location is reflected on the disk 131.

更新箇所をビットマップで管理する方法は公知の技術を適用可能である。ビットマップ113は更新順序を保持しないため、ビットマップ113で管理された更新箇所を複製ストレージ130のディスク131に反映させる際には、更新順序とは無関係の非同期コピーとなり、一貫性(consistency)は保たれない。このため、ビットマップで管理された更新箇所を複製ストレージ130に反映させる場合は、全更新箇所の反映が完了するまで複製ストレージ130は使用できない。   A well-known technique can be applied to the method of managing the update location with a bitmap. Since the bitmap 113 does not hold the update order, when the update location managed by the bitmap 113 is reflected in the disk 131 of the replication storage 130, the copy becomes an asynchronous copy that is unrelated to the update order, and the consistency is Not kept. For this reason, when the update location managed by the bitmap is reflected in the replication storage 130, the replication storage 130 cannot be used until the reflection of all the update locations is completed.

次に、ネットワークの二重障害が発生した場合の動作について説明する。図12に示すように、メインサイトとジャーナルサイトとの間のネットワーク152及びリモートサイトとジャーナルサイトとの間のネットワーク153に通信障害が発生した場合は、メインサイトとリモートサイトとの間のネットワーク151が使用できるため、通常時と同様にメインストレージ110から複製ストレージ130へ同期コピーを行う。   Next, the operation when a double network failure occurs will be described. As shown in FIG. 12, when a communication failure occurs in the network 152 between the main site and the journal site and the network 153 between the remote site and the journal site, the network 151 between the main site and the remote site is used. Therefore, synchronous copy is performed from the main storage 110 to the duplicate storage 130 as in the normal case.

図13に示すように、メインサイトとリモートサイトとの間のネットワーク151及びジャーナルサイトとリモートサイトとの間のネットワーク153に通信障害が発生した場合、メインストレージ110は更新データをジャーナルストレージ140に同期コピーする。ジャーナルストレージ140は、更新データをディスク141に保持しておき、保持している更新データをネットワーク153が復旧した後で複製ストレージ130に非同期コピーする。   As shown in FIG. 13, when a communication failure occurs in the network 151 between the main site and the remote site and the network 153 between the journal site and the remote site, the main storage 110 synchronously copies the update data to the journal storage 140. To do. The journal storage 140 holds update data in the disk 141, and asynchronously copies the held update data to the replication storage 130 after the network 153 recovers.

メインサイトとリモートサイトとの間のネットワーク151及びメインサイトとジャーナルサイトとの間のネットワーク152に通信障害が発生した場合、メインストレージ110は更新データを送信できないため、図14に示すようにジャーナルストレージ140に空き容量が無くなった場合と同様の動作(更新データをバッファ112に保持する動作)を行う。   When a communication failure occurs in the network 151 between the main site and the remote site and the network 152 between the main site and the journal site, the main storage 110 cannot transmit update data. The same operation as when the free space is exhausted (the operation of holding the update data in the buffer 112) is performed.

本実施形態においては、メインサイトとリモートサイトとにネットワークを介して接続され、ストレージを備えたジャーナルサイトを第3のサイトとしてメインサイトとリモートサイトとの間でデータを送信している情報システムに設けている。そして、メインサイトとリモートサイトとの間で通信障害が発生した場合に、メインサイトのストレージはリモートサイトに送信していた更新データをジャーナルサイトのストレージに同期コピーするように切り替える。
ジャーナルサイトに更新データを格納することにより、メインサイトとリモートサイトとの間の通信障害発生中にメインサイトが被災しても、データが消失することはない。
ジャーナルサイトに存在する更新データをリモートサイトに反映させることにより、データの復旧が完了させ、リモートサイトで業務を継続できる。
In the present embodiment, a journal site that is connected to a main site and a remote site via a network and has a storage as a third site is provided in an information system that transmits data between the main site and the remote site. Yes. When a communication failure occurs between the main site and the remote site, the storage at the main site switches so that the update data that has been transmitted to the remote site is synchronously copied to the storage at the journal site.
By storing the update data in the journal site, even if the main site is damaged during a communication failure between the main site and the remote site, the data is not lost.
By reflecting the update data existing in the journal site to the remote site, the data recovery is completed, and the business can be continued at the remote site.

また、リモートサイトを複数設けたり、メインサイトとリモートサイトとの伝送経路を冗長化する必要がないため、導入にかかる初期費用や運用にかかるコストを低減できる。   In addition, since there is no need to provide a plurality of remote sites or to make the transmission path between the main site and the remote site redundant, it is possible to reduce initial costs for installation and costs for operation.

このように、本実施形態に係る情報システムは、リモートサイトとの通信障害発生中にメインサイトが被災してもデータが消失することがなく、低コストで導入可能である。   As described above, the information system according to the present embodiment can be introduced at a low cost without losing data even if the main site is damaged during the occurrence of a communication failure with the remote site.

〔第2の実施形態〕
本発明を好適に実施した第2の実施形態について説明する。本実施形態に係る情報システムは、第1の実施形態とほぼ同様である。図15に本実施形態に係る情報システムの詳細な構成を示す。本実施形態に係る情報システムは、複製ストレージ130がバッファ132をさらに有する点で第1の実施形態と相違する。
[Second Embodiment]
A second embodiment in which the present invention is suitably implemented will be described. The information system according to this embodiment is substantially the same as that of the first embodiment. FIG. 15 shows a detailed configuration of the information system according to the present embodiment. The information system according to the present embodiment is different from the first embodiment in that the duplicate storage 130 further includes a buffer 132.

本実施形態に係る情報システムのリカバリ動作について説明する。
図16、図17に示すように、本実施形態においては、メインサイトとリモートサイトとの通信が復旧した直後に、メインストレージ110からジャーナルストレージ140へ通信復旧を通知し、メインストレージ110内の更新データの同期コピー先をジャーナルストレージ140から複製ストレージ130へ切り替える。
A recovery operation of the information system according to the present embodiment will be described.
As shown in FIGS. 16 and 17, in the present embodiment, immediately after the communication between the main site and the remote site is recovered, the main storage 110 notifies the journal storage 140 of the communication recovery, and the update data in the main storage 110 is displayed. Is switched from the journal storage 140 to the replica storage 130.

複製ストレージ130は、ジャーナルストレージ140及びメインストレージ110の両方からデータを受け取るが、ジャーナルストレージ140から受け取る更新データを先にディスク131に反映させ、メインストレージ110から受け取るデータはバッファ132に蓄えておく。例えば、図16に示す状態からさらにメインストレージ110に「7」というデータが書き込まれた時点で通信障害が復旧した場合には、図17に示すように、ジャーナルストレージ140内の「4」のデータと、メインストレージ内の「7」というデータとが複製ストレージ130に送られるが、複製ストレージ130は、ジャーナルストレージ140から受信した「4」のデータをディスク131に反映させ、メインストレージ110から受信した「7」のデータはバッファ132に蓄える。   The duplicate storage 130 receives data from both the journal storage 140 and the main storage 110, but the update data received from the journal storage 140 is reflected on the disk 131 first, and the data received from the main storage 110 is stored in the buffer 132. For example, when the communication failure is recovered when data “7” is further written to the main storage 110 from the state shown in FIG. 16, the data “4” in the journal storage 140 is shown in FIG. The data “7” in the main storage is sent to the replication storage 130, and the replication storage 130 reflects the data “4” received from the journal storage 140 on the disk 131 and receives it from the main storage 110. The data “7” is stored in the buffer 132.

ジャーナルストレージ140は、メインストレージ110からの同期コピーが終了したことを、通信復旧が通知されることによって認識する。ジャーナルストレージ140は、ディスク141にある更新データが全て複製ストレージ130のディスク131に反映され、ジャーナルストレージ140に更新データが存在しなくなった時点で、図18に示すように、複製ストレージ130に差分反映完了を通知する。   The journal storage 140 recognizes that the synchronous copy from the main storage 110 has been completed by notifying communication recovery. In the journal storage 140, all the update data in the disk 141 is reflected in the disk 131 of the replication storage 130, and when no update data exists in the journal storage 140, the difference is reflected in the replication storage 130 as shown in FIG. Notify completion.

複製ストレージ130は、差分反映完了の通知を受け取った後、バッファ132に存在する更新データをディスク131に反映させる。全てのデータを反映し終わったら、図19に示すように、メインストレージ110からの同期コピーは複製ストレージ130のディスク131に直接反映させる。   The replica storage 130 reflects the update data existing in the buffer 132 on the disk 131 after receiving the notification of the difference reflection completion. When all the data has been reflected, the synchronous copy from the main storage 110 is directly reflected on the disk 131 of the duplicate storage 130 as shown in FIG.

本実施形態においては、メインサイトとリモートサイトとの通信復旧を契機として、更新データの送信先をリモートサイトに切り替える。したがって、更新データがジャーナルサイト及びメインサイトの両方から並行してリモートサイトへ送信されるため、更新データをリモートサイトに反映させるのに要する時間を短縮できる。   In the present embodiment, the update data transmission destination is switched to the remote site in response to the communication recovery between the main site and the remote site. Accordingly, since update data is transmitted from both the journal site and the main site to the remote site in parallel, the time required for reflecting the update data on the remote site can be shortened.

〔第3の実施形態〕
本発明を好適に実施した第3の実施形態について説明する。
図20に本実施形態に係る情報システムの構成を示す。本実施形態に係る情報システムは、メインストレージ210と、メインストレージ210のデータが更新された際に、更新データのデータがメインストレージ210から同期コピーされる複製ストレージ230とを備えた情報システムであって、メインストレージ210にネットワーク252を介して接続されたジャーナルストレージ240を有し、メインストレージ210と複製ストレージ230との間のネットワーク251で通信障害が発生した場合には、更新データをジャーナルストレージ240へ同期コピーし、ネットワーク251の通信障害が解消された後に、ジャーナルストレージ240に格納した更新データを、メインストレージ210を経由して複製ストレージ230へ準同期コピーし、メインストレージ210からの更新データの同期コピー先を複製ストレージ230に戻し、ネットワーク151で通信障害が発生している間にメインストレージ210が破損した場合は、メインストレージ210の修復後に複製ストレージ230からデータを書き戻し、その後、ジャーナルストレージ240に格納した更新データをメインストレージ210へ準同期コピーする。
[Third Embodiment]
A third embodiment in which the present invention is preferably implemented will be described.
FIG. 20 shows the configuration of the information system according to this embodiment. The information system according to the present embodiment is an information system including a main storage 210 and a duplicate storage 230 to which update data is synchronously copied from the main storage 210 when the data in the main storage 210 is updated. When the communication failure occurs in the network 251 between the main storage 210 and the replication storage 230, the update data is transferred to the journal storage 240. After the communication failure of the network 251 is resolved, the update data stored in the journal storage 240 is semi-synchronously copied to the replica storage 230 via the main storage 210 and updated from the main storage 210. If the main storage 210 is damaged while a communication failure has occurred in the network 151, the data is written back from the replication storage 230 after the main storage 210 is repaired. The update data stored in the journal storage 240 is quasi-synchronously copied to the main storage 210.

図21に、本実施形態に係る情報システムのより詳細な構成を示す。
本実施形態に係る情報システムは、メインサイト、リモートサイト及びジャーナルサイトの三つのサイトを備える。
FIG. 21 shows a more detailed configuration of the information system according to the present embodiment.
The information system according to the present embodiment includes three sites: a main site, a remote site, and a journal site.

メインサイトには、プログラム制御によって動作するホストコンピュータ200及びメインストレージ210が設置されている。
ホストコンピュータ200は、ディスクアクセス部201を備える。ディスクアクセス部201は、メインストレージ210に対して情報の読み込み及び書き込みを行う。
メインストレージ210は、ディスク211、バッファ212、ビットマップ213、ストレージ制御部214及び通信部215を備える。ビットマップ213は、メインストレージ210と複製ストレージ230との間で一貫性が保てなくなった後でメインストレージ210上で更新された領域を表している。ストレージ制御部214は、メインストレージ210の各部の動作を制御する。通信部215は、リモートサイトに設けられている複製ストレージ230やジャーナルサイトに設けられているジャーナルストレージ240との通信を行う。
A host computer 200 and a main storage 210 that operate by program control are installed at the main site.
The host computer 200 includes a disk access unit 201. The disk access unit 201 reads information from and writes information to the main storage 210.
The main storage 210 includes a disk 211, a buffer 212, a bitmap 213, a storage control unit 214, and a communication unit 215. The bitmap 213 represents an area updated on the main storage 210 after the consistency between the main storage 210 and the replication storage 230 cannot be maintained. The storage control unit 214 controls the operation of each unit of the main storage 210. The communication unit 215 communicates with the replication storage 230 provided at the remote site and the journal storage 240 provided at the journal site.

リモートサイトには、複製ストレージ230が設置されている。
複製ストレージ230は、ディスク231、バッファ232、ストレージ制御部234、及び通信部235を備える。ストレージ制御部234は、複製ストレージ230の各部の動作を制御する。通信部235は、メインサイトに設けられているメインストレージ210やジャーナルサイトに設けられているジャーナルストレージ240との通信を行う。
A replication storage 230 is installed at the remote site.
The duplicate storage 230 includes a disk 231, a buffer 232, a storage control unit 234, and a communication unit 235. The storage control unit 234 controls the operation of each unit of the replication storage 230. The communication unit 235 performs communication with the main storage 210 provided at the main site and the journal storage 240 provided at the journal site.

ジャーナルサイトには、ジャーナルストレージ240が設置されている。ジャーナルストレージ240は、ディスク241、通信部242及びストレージ制御部243を備える。ストレージ制御部243は、ジャーナルストレージ240の各部の動作を制御する。通信部242は、メインサイトに設けられているメインストレージ210やリモートサイトに設けられている複製ストレージ230との通信を行う。   A journal storage 240 is installed at the journal site. The journal storage 240 includes a disk 241, a communication unit 242, and a storage control unit 243. The storage control unit 243 controls the operation of each unit of the journal storage 240. The communication unit 242 performs communication with the main storage 210 provided at the main site and the replication storage 230 provided at the remote site.

メインサイトとリモートサイトとの間はネットワーク251、メインサイトとジャーナルサイトとの間は、ネットワーク252でそれぞれ接続されている。なお、本実施形態においては、ジャーナルサイトとリモートサイトとの間は接続されていない。   The main site and the remote site are connected by a network 251, and the main site and the journal site are connected by a network 252. In this embodiment, the journal site and the remote site are not connected.

本実施形態に係る情報システムのリカバリ動作について説明する。   A recovery operation of the information system according to the present embodiment will be described.

通常時は、更新データはメインストレージ210から複製ストレージ230に同期コピーされる。メインストレージ210と複製ストレージ230との間の通信に障害が発生したことをメインストレージ210が検出した場合、図22に示すように、メインストレージ210は同期コピー先をジャーナルストレージ240に切り替える。   At normal times, the update data is synchronously copied from the main storage 210 to the duplicate storage 230. When the main storage 210 detects that a failure has occurred in communication between the main storage 210 and the duplicate storage 230, the main storage 210 switches the synchronous copy destination to the journal storage 240 as shown in FIG.

この状態でメインサイトが被災した場合は、ますメインサイトを復旧させ、図23に示すように複製ストレージ230からメインストレージ210に全データをコピーする。この時のコピーは、非同期かつ更新順序を保証せずに行われるため、「非同期コピー」に相当する。その後、図24に示すように、ジャーナルストレージ240から更新データをメインストレージ210に準同期コピーするとともに、メインストレージ210から複製ストレージ230へも準同期コピーする。ジャーナルストレージ240の全ての更新データをメインストレージ210に反映させたら、ジャーナルストレージ240は差分反映完了をメインストレージ210に通知する。これを受けて、メインストレージ210は複製ストレージ230に差分反映完了を通知する。
複製ストレージ230は、図25に示すように、全データを反映し終わったらメインストレージ210へ同期完了を通知する。
以降、ホストコンピュータ200からメインストレージ210が使用可能となり、図26に示すように、メインストレージ210への更新は複製ストレージ230に同期コピーされる。
When the main site is damaged in this state, the main site is restored and all data is copied from the duplicate storage 230 to the main storage 210 as shown in FIG. Since the copy at this time is performed asynchronously and without guaranteeing the update order, it corresponds to “asynchronous copy”. Thereafter, as shown in FIG. 24, the update data from the journal storage 240 is semi-synchronously copied to the main storage 210, and is also semi-synchronously copied from the main storage 210 to the duplicate storage 230. When all the update data in the journal storage 240 is reflected in the main storage 210, the journal storage 240 notifies the main storage 210 that the difference has been reflected. In response to this, the main storage 210 notifies the replication storage 230 of the completion of the difference reflection.
As shown in FIG. 25, the duplicate storage 230 notifies the main storage 210 of the completion of synchronization when all the data has been reflected.
Thereafter, the main storage 210 can be used from the host computer 200, and updates to the main storage 210 are synchronously copied to the duplicate storage 230, as shown in FIG.

次に、メインサイトが被災せずに、図22に示す通信障害が復旧した場合について説明する。
メインストレージ210は定期的に複製ストレージ230に通信を試み、通信障害が解消されたことを通信が成功することによって認識する。メインストレージ210は、メインサイトとリモートサイトとの間の通信障害が解消されたことを、通信復旧通知を送ることによってジャーナルストレージ240に通知する。メインストレージ210は、通信が復旧した後も、ジャーナルストレージ240への同期コピーを継続する。
Next, a case where the communication failure shown in FIG. 22 is recovered without the main site being damaged will be described.
The main storage 210 periodically tries to communicate with the replication storage 230 and recognizes that the communication failure has been resolved by successful communication. The main storage 210 notifies the journal storage 240 that the communication failure between the main site and the remote site has been resolved by sending a communication recovery notification. The main storage 210 continues the synchronous copy to the journal storage 240 even after the communication is restored.

図27に示すように、ジャーナルストレージ240は、通信復旧通知を受け取った後、ディスク244に存在する更新データをメインストレージ210を経由して、複製ストレージ230へ準同期コピーする。ジャーナルストレージ240に更新データが無くなった時点で、図28に示すように、ジャーナルストレージ240はメインストレージ210に差分反映完了を通知する。これを受けて、メインストレージ210は複製ストレージ230へ差分反映完了を通知する。   As shown in FIG. 27, after receiving the communication recovery notification, the journal storage 240 performs semi-synchronous copying of the update data existing in the disk 244 to the duplicate storage 230 via the main storage 210. When there is no update data in the journal storage 240, the journal storage 240 notifies the main storage 210 of the completion of the difference reflection as shown in FIG. In response to this, the main storage 210 notifies the replication storage 230 of the completion of the difference reflection.

ジャーナルストレージ240は、差分反映完了をメインストレージ210に通知するまではメインストレージ210からの同期コピーを受け続ける。メインストレージ210は、差分反映完了を通知された後は、ジャーナルストレージ240に更新データを送らない。   The journal storage 240 continues to receive the synchronous copy from the main storage 210 until the main storage 210 is notified of the difference reflection completion. The main storage 210 does not send update data to the journal storage 240 after being notified of the completion of the difference reflection.

複製ストレージ230は、全データを反映し終わったら、図29に示すように、同期完了をメインストレージ210に通知する。同期完了を通知されたメインストレージ210は、同期コピー先を複製ストレージ230に切り替える。以降は、ジャーナルストレージ240は使用せず、図30に示すように、メインストレージ210と複製ストレージ230との間で通信を行い、更新データをメインストレージのディスク211から複製ストレージ230のディスク231へ同期コピーする。   When all the data has been reflected, the duplicate storage 230 notifies the main storage 210 of the completion of synchronization as shown in FIG. The main storage 210 notified of the completion of synchronization switches the synchronous copy destination to the duplicate storage 230. Thereafter, the journal storage 240 is not used, and communication is performed between the main storage 210 and the replication storage 230 as shown in FIG. 30, and the update data is synchronized from the disk 211 of the main storage to the disk 231 of the replication storage 230. make a copy.

なお、図31に示すように第2の実施形態と同様に複製ストレージ230がバッファ232を備えた構成とし、メインストレージ210と複製ストレージ230との間の通信が復旧した時点で、メインストレージ210からの同期コピー先を複製ストレージ230に変更し、図32に示すように、ジャーナルストレージ240からの準同期コピーが完了するまでの間は更新データをバッファ232に蓄積しておくようにしても良い。この場合には、図33に示すように、ジャーナルストレージ240からの準同期コピーが完了した後で図34に示すようにディスク231に反映させても良い。   As shown in FIG. 31, the replica storage 230 includes a buffer 232 as in the second embodiment, and when the communication between the main storage 210 and the replica storage 230 is restored, the main storage 210 The synchronous copy destination may be changed to the replica storage 230, and update data may be accumulated in the buffer 232 until the semi-synchronous copy from the journal storage 240 is completed as shown in FIG. In this case, as shown in FIG. 33, after the semi-synchronous copy from the journal storage 240 is completed, it may be reflected on the disk 231 as shown in FIG.

ジャーナルストレージに空き容量が無くなった場合の動作は、第1の実施形態と同様であり、メインストレージ210は更新データをバッファ212に格納する。ジャーナルストレージ240に空きができたら、メインストレージ210はバッファ212に格納した更新データを準同期コピーによってジャーナルストレージ240へ送信する。   The operation when there is no more free space in the journal storage is the same as in the first embodiment, and the main storage 210 stores the update data in the buffer 212. When the journal storage 240 becomes empty, the main storage 210 transmits the update data stored in the buffer 212 to the journal storage 240 by semi-synchronous copying.

さらに、バッファ212に空き容量が無くなった場合の動作は第1の実施形態と同様であり、メインストレージ210は、ディスク211上の更新箇所をビットマップ213で管理する方法に切り替える。   Furthermore, the operation when the buffer 212 runs out of free space is the same as in the first embodiment, and the main storage 210 switches to a method of managing the update location on the disk 211 with the bitmap 213.

本実施形態に係る情報システムは、リモートサイトとジャーナルサイトとの間の通信経路を省略した構成となっているため、システムを構築する際のコストをさらに低減できる。   Since the information system according to the present embodiment has a configuration in which the communication path between the remote site and the journal site is omitted, the cost for constructing the system can be further reduced.

なお、上記各実施形態は本発明の好適な実施の一例であり、本発明はこれらに限定されることはない。   Each of the above embodiments is an example of a preferred embodiment of the present invention, and the present invention is not limited to these.

例えば、上記各実施形態においては、メインサイト及びリモートサイトが単独の構成を例としたが、ジャーナルサイトを集約し、複数のサイトがジャーナルサイトを共用する構成とすることも可能である。
具体的には、図35に示すように、ジャーナルサイトをデータセンタに集約し、第1、第2の実施形態に係る複数のメインサイトとそのリモートサイトとをデータセンタと接続する。データセンタはジャーナルストレージのプールを用意し、各サイトに動的に割り当てる。各サイトの地理的又はネットワーク的な位置について重複しないように考慮することで、通信障害が同時に発生するサイト数を低減でき、必要なジャーナルストレージプールの量を低減できる。すなわち、各サイトが個別にジャーナルサイトを備える場合と比較して、コストの削減とリソースの有効利用とが可能となる。図36に示すように、ジャーナルサイトをデータセンタに集約し、第3の実施形態に係る複数のメインサイトをデータセンタと接続しても同様の効果が得られる。
また、図37に示すように、複数の複製ストレージをデータセンタに集約しておくことにより、複製ストレージ及びジャーナルストレージを用いたディザスタリカバリをアウトソーシングサービスとして実現できる。すなわち、企業等は、リモートサイト及びジャーナルサイトの開設や、複製ストレージ及びジャーナルストレージの保守・運営を専門の業者に委託することが可能となり、メインサイトの開設及び運営のみを行うだけで良くなるため、ディザスタリカバリに対応した情報システムの導入が容易になる。
このように、本発明は様々な変形が可能である。
For example, in each of the above embodiments, the main site and the remote site are configured as a single configuration, but a configuration in which the journal sites are aggregated and a plurality of sites share the journal site is also possible.
Specifically, as shown in FIG. 35, journal sites are aggregated in a data center, and a plurality of main sites according to the first and second embodiments and their remote sites are connected to the data center. The data center prepares a pool of journal storage and dynamically allocates it to each site. By considering the geographical or network location of each site so as not to overlap, the number of sites where communication failures occur simultaneously can be reduced, and the amount of required journal storage pool can be reduced. That is, it is possible to reduce costs and use resources more effectively than when each site has a journal site individually. As shown in FIG. 36, the same effect can be obtained by consolidating journal sites in a data center and connecting a plurality of main sites according to the third embodiment to the data center.
Also, as shown in FIG. 37, by collecting a plurality of replicated storages in the data center, disaster recovery using the replicated storage and journal storage can be realized as an outsourcing service. In other words, companies can entrust the establishment of remote sites and journal sites and the maintenance and operation of replica storage and journal storage to specialized vendors, and only need to open and operate the main site. It becomes easy to introduce an information system that supports disaster recovery.
As described above, the present invention can be variously modified.

100、120、200 ホストコンピュータ
101、121、201 ディスクアクセス部
110、210 メインストレージ
111、131、141、211、231、241 ディスク
112、132、212 バッファ
113 ビットマップ
114、134、143、214、234、243 ストレージ制御部
115、135、142、215、235、242 通信部
130、230 複製ストレージ
140、240 ジャーナルストレージ
151、152、153、251、252 ネットワーク
100, 120, 200 Host computer 101, 121, 201 Disk access unit 110, 210 Main storage 111, 131, 141, 211, 231, 241 Disk 112, 132, 212 Buffer 113 Bit map 114, 134, 143, 214, 234 243 Storage control unit 115, 135, 142, 215, 235, 242 Communication unit 130, 230 Replication storage 140, 240 Journal storage 151, 152, 153, 251, 252 Network

Claims (12)

第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが前記第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムであって、前記同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に前記更新されたデータを反映させるコピーであり、
前記第1及び第2のストレージ装置の双方に接続された第3のストレージ装置を有し、
前記第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、前記更新データを前記第3のストレージ装置へ同期コピーし、
前記第3のストレージ装置に格納した前記更新データを、前記第2のストレージ装置へ準同期コピーし、前記準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、前記一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、
前記第1のストレージ装置と前記第2のストレージ装置との間の通信障害が解消された後に、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第2のストレージ装置に戻すことを特徴とする情報システム。
An information system comprising: a first storage device; and a second storage device to which update data is synchronously copied from the first storage device when data of the first storage device is updated. The synchronous copy is a copy that reflects the updated data in another storage device in synchronization with the update of data in one storage device,
A third storage device connected to both the first and second storage devices;
When a communication failure occurs between the first storage device and the second storage device, the update data is synchronously copied to the third storage device,
The update data stored in the third storage device is quasi-synchronously copied to the second storage device, and the quasi -synchronous copy is asynchronous with update of data of one storage device and the one storage device It is a copy that reflects the update data on other storage devices in the same order as the device data update.
After the communication failure between the first storage device and the second storage device is resolved, the synchronous copy destination of the update data from the first storage device is returned to the second storage device. An information system characterized by
第1ストレージと第2ストレージ間の通信障害が解消され、前記第3のストレージ装置に前記更新データが存在しなくなった時点で、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第3のストレージ装置から前記第2のストレージ装置に変更することを特徴とする請求項1記載の情報システム。 When the communication failure between the first storage and the second storage is resolved and the update data no longer exists in the third storage device, the synchronous copy destination of the update data from the first storage device is The information system according to claim 1, wherein the information system is changed from a third storage device to the second storage device. 前記第1のストレージ装置と前記第2のストレージ装置との間の通信障害が解消された時点で、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第2のストレージ装置に戻し、
前記第2のストレージ装置は、前記第3のストレージ装置から準同期コピーされる更新データの反映が完了するよりも前に前記第1のストレージ装置から受信した更新データを反映せず自装置のバッファに蓄積し、前記バッファに蓄積した更新データを、前記第3のストレージ装置から準同期コピーされる更新データの反映が完了した後で反映させることを特徴とする請求項1記載の情報システム。
When the communication failure between the first storage device and the second storage device is resolved, the synchronous copy destination of the update data from the first storage device is returned to the second storage device. ,
It said second storage device, a buffer of the third of its own apparatus does not reflect the updated data received from the first storage device before the reflected from the storage device quasi synchronization copied the update data is completed 2. The information system according to claim 1, wherein the update data stored in the buffer is reflected after the update data to be semi-synchronously copied from the third storage apparatus is reflected.
前記第1のストレージ装置は、前記第2のストレージ装置又は前記第3のストレージ装置へ同期コピーできない分の更新データを格納するバッファを有し、前記更新データの同期コピー先への送信が可能となった時点で、前記バッファ内のデータを準同期コピーすることを特徴とする請求項1又は2に記載の情報システム。 The first storage device has a buffer for storing update data that cannot be synchronously copied to the second storage device or the third storage device, and the update data can be transmitted to a synchronous copy destination. 3. The information system according to claim 1 or 2 , wherein the data in the buffer is quasi-synchronously copied at a point in time. 前記第1のストレージ装置は、前記バッファの空き容量が無くなった場合に、それ以降の更新内容をメモリアドレスマップで管理し、前記バッファに格納されている更新データが前記第2のストレージ装置に反映された後に、前記メモリアドレスマップによって管理されている更新内容を前記第2にストレージ装置に非同期コピーで反映させ、前記非同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、前記一のストレージ装置のデータの更新順序を保証せず他のストレージ装置に更新データを反映させるコピーである、ことを特徴とする請求項4記載の情報システム。 When the first storage device runs out of free space in the buffer, the first storage device manages subsequent update contents in a memory address map, and the update data stored in the buffer is reflected in the second storage device. After that, the update contents managed by the memory address map are reflected in the second storage device by asynchronous copy, and the asynchronous copy is asynchronous with update of data of one storage device and 5. The information system according to claim 4, wherein the information system is a copy that does not guarantee the data update order of the storage apparatus and reflects the update data in another storage apparatus . 第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが前記第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムであって、前記同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に前記更新されたデータを反映させるコピーであり、
前記第1のストレージ装置に接続された第3のストレージ装置を有し、
前記第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、前記更新データを前記第3のストレージ装置へ同期コピーし、
前記第1のストレージ装置と前記第2のストレージ装置との間の通信障害が解消された後に、前記第3のストレージ装置に格納した前記更新データを、前記第1のストレージ装置を経由して前記第2のストレージ装置へ準同期コピーし、前記準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、前記一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第2のストレージ装置に戻し、前記第1のストレージ装置と前記第2のストレージ装置との間で通信障害が発生している間に前記第1のストレージ装置が破損した場合は、前記第1のストレージ装置の修復後に前記第2のストレージ装置からデータを書き戻し、その後、前記第3のストレージ装置に格納した前記更新データを前記第1のストレージ装置へ準同期コピーすることを特徴とする情報システム。
An information system comprising: a first storage device; and a second storage device to which update data is synchronously copied from the first storage device when data of the first storage device is updated. The synchronous copy is a copy that reflects the updated data in another storage device in synchronization with the update of data in one storage device,
A third storage apparatus connected to the first storage device,
When a communication failure occurs between the first storage device and the second storage device, the update data is synchronously copied to the third storage device,
After the communication failure between the first storage device and the second storage device is resolved, the update data stored in the third storage device is transferred to the third storage device via the first storage device. A semi-synchronous copy is made to the second storage device, and the semi -synchronous copy is asynchronous with update of data of one storage device and updated to another storage device in the same order as update of data of the one storage device. A copy reflecting data, and the synchronous copy destination of the update data from the first storage device is returned to the second storage device, and between the first storage device and the second storage device If the first storage device is damaged while a communication failure has occurred, the second storage device can restore the first storage device after the first storage device is repaired. Written back over data, then the information system, characterized in that the third said semi-synchronous copy the updated data to the first storage device stored in the storage device.
前記第3のストレージ装置に前記更新データが存在しなくなった時点で、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第3のストレージ装置から前記第2のストレージ装置に変更することを特徴とする請求項6記載の情報システム。 When the update data no longer exists in the third storage device, the synchronous copy destination of the update data from the first storage device is changed from the third storage device to the second storage device. The information system according to claim 6. 前記第1のストレージ装置と前記第2のストレージ装置との間の通信障害が解消された時点で、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第2のストレージ装置に戻し、
前記第2のストレージ装置は、前記第3のストレージ装置から前記第1のストレージ装置を経由して準同期コピーされる更新データの反映が完了するよりも前に前記第1のストレージ装置から受信した更新データを反映せず自装置のバッファに蓄積し、前記バッファに蓄積した更新データを、前記第3のストレージ装置から前記第1のストレージ装置を経由して準同期コピーされる更新データの反映が完了した後で反映させることを特徴とする請求項6記載の情報システム。
When the communication failure between the first storage device and the second storage device is resolved, the synchronous copy destination of the update data from the first storage device is returned to the second storage device. ,
The second storage device has received from the first storage device before the reflection of update data that is semi-synchronously copied from the third storage device via the first storage device is completed. The update data is stored in the buffer of the own device without reflecting the update data, and the update data stored in the buffer is reflected from the third storage device via the first storage device in a semi-synchronous manner. The information system according to claim 6, which is reflected after completion.
前記第1のストレージ装置は、前記第2のストレージ装置又は前記第3のストレージ装置へ同期コピーできない分の更新データを格納するバッファを有し、前記更新データの同期コピー先への送信が可能となった時点で、前記バッファ内のデータを準同期コピーすることを特徴とする請求項6から8のいずれか1項記載の情報システム。 The first storage device has a buffer for storing update data that cannot be synchronously copied to the second storage device or the third storage device, and the update data can be transmitted to a synchronous copy destination. 9. The information system according to claim 6, wherein the data in the buffer is quasi-synchronously copied at a point of time. 前記第1のストレージ装置及び前記第2のストレージ装置の対を複数有し、
複数の前記第1及び第2のストレージ装置の対で、前記第3のストレージをストレージプールとして共有することを特徴とする請求項1から9のいずれか1項記載の情報システム。
A plurality of pairs of the first storage device and the second storage device;
The information system according to claim 1, wherein the third storage is shared as a storage pool by a plurality of pairs of the first and second storage apparatuses.
第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが前記第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムにおけるディザスタリカバリ方法であって、前記同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に前記更新されたデータを反映させるコピーであり、
前記第1及び第2のストレージ装置の双方に第3のストレージ装置を接続し、
前記第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、前記更新データを前記第3のストレージ装置へ同期コピーし、
前記第3のストレージ装置に格納した前記更新データを、前記第2のストレージ装置へ準同期コピーし、前記準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、前記一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、
前記第1のストレージ装置と前記第2のストレージ装置との間の通信障害が解消された後に、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第2のストレージ装置に戻すことを特徴とするディザスタリカバリ方法。
Disaster recovery in an information system comprising a first storage device and a second storage device to which update data is synchronously copied from the first storage device when the data of the first storage device is updated In the method, the synchronous copy is a copy reflecting the updated data in another storage device in synchronization with the update of data in one storage device,
A third storage device is connected to both the first and second storage devices;
When a communication failure occurs between the first storage device and the second storage device, the update data is synchronously copied to the third storage device,
The update data stored in the third storage device is quasi-synchronously copied to the second storage device, and the quasi-synchronous copy is asynchronous with update of data of one storage device and the one storage device It is a copy that reflects the update data on other storage devices in the same order as the device data update.
After the communication failure between the first storage device and the second storage device is resolved, the synchronous copy destination of the update data from the first storage device is returned to the second storage device. Disaster recovery method characterized by this.
第1のストレージ装置と、該第1のストレージ装置のデータが更新された際に、更新データが前記第1のストレージ装置から同期コピーされる第2のストレージ装置とを備えた情報システムにおけるディザスタリカバリ方法であって、前記同期コピーは、一のストレージ装置のデータの更新と同期して、他のストレージ装置に前記更新されたデータを反映させるコピーであり、
前記第1のストレージ装置に第3のストレージ装置を接続し、
前記第1のストレージ装置と第2のストレージ装置との間で通信障害が発生した場合には、前記更新データを前記第3のストレージ装置へ同期コピーし、
前記第1のストレージ装置と前記第2のストレージ装置との間の通信障害が解消された後に、前記第3のストレージ装置に格納した前記更新データを、前記第1のストレージ装置を経由して前記第2のストレージ装置へ準同期コピーし、前記準同期コピーは、一のストレージ装置のデータの更新と非同期で、かつ、前記一のストレージ装置のデータの更新と同じ順序で他のストレージ装置に更新データを反映させるコピーであり、前記第1のストレージ装置からの前記更新データの同期コピー先を前記第2のストレージ装置に戻し、
前記第1のストレージ装置と前記第2のストレージ装置との間で通信障害が発生している間に前記第1のストレージ装置が破損した場合は、前記第1のストレージ装置の修復後に前記第2のストレージ装置からデータを書き戻し、その後、前記第3のストレージ装置に格納した前記更新データを前記第1のストレージ装置へ準同期コピーすることを特徴とするディザスタリカバリ方法。
Disaster recovery in an information system comprising a first storage device and a second storage device to which update data is synchronously copied from the first storage device when the data of the first storage device is updated In the method, the synchronous copy is a copy reflecting the updated data in another storage device in synchronization with the update of data in one storage device,
Connecting a third storage device to the first storage device;
When a communication failure occurs between the first storage device and the second storage device, the update data is synchronously copied to the third storage device,
After the communication failure between the first storage device and the second storage device is resolved, the update data stored in the third storage device is transferred to the third storage device via the first storage device. A semi-synchronous copy is made to the second storage device, and the semi -synchronous copy is asynchronous with update of data of one storage device and updated to another storage device in the same order as update of data of the one storage device. A data reflecting copy, and a synchronous copy destination of the update data from the first storage device is returned to the second storage device;
If the first storage device is damaged while a communication failure has occurred between the first storage device and the second storage device, the second storage device is restored after the first storage device is repaired. A disaster recovery method comprising: writing back data from the storage device and then semi-synchronously copying the update data stored in the third storage device to the first storage device.
JP2009025948A 2009-02-06 2009-02-06 Information system and disaster recovery method Expired - Fee Related JP5218121B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009025948A JP5218121B2 (en) 2009-02-06 2009-02-06 Information system and disaster recovery method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009025948A JP5218121B2 (en) 2009-02-06 2009-02-06 Information system and disaster recovery method

Publications (2)

Publication Number Publication Date
JP2010182154A JP2010182154A (en) 2010-08-19
JP5218121B2 true JP5218121B2 (en) 2013-06-26

Family

ID=42763707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009025948A Expired - Fee Related JP5218121B2 (en) 2009-02-06 2009-02-06 Information system and disaster recovery method

Country Status (1)

Country Link
JP (1) JP5218121B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150317175A1 (en) * 2012-11-19 2015-11-05 Hitachi Systems, Ltd. Virtual machine synchronization system
US10503427B2 (en) 2017-03-10 2019-12-10 Pure Storage, Inc. Synchronously replicating datasets and other managed objects to cloud-based storage systems
JP6931081B2 (en) 2017-11-28 2021-09-01 Necプラットフォームズ株式会社 Data backup system, relay site storage, data backup method, and relay site storage control program

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004013367A (en) * 2002-06-05 2004-01-15 Hitachi Ltd Data storage subsystem
JP2004086721A (en) * 2002-08-28 2004-03-18 Nec Corp Data reproducing system, relay system, data transmission/receiving method, and program for reproducing data in storage
US7600087B2 (en) * 2004-01-15 2009-10-06 Hitachi, Ltd. Distributed remote copy system
JP4376750B2 (en) * 2004-10-14 2009-12-02 株式会社日立製作所 Computer system
JP2006285919A (en) * 2005-04-05 2006-10-19 Hitachi Ltd Computer system, computer and remote copy processing method
JP4531643B2 (en) * 2005-06-27 2010-08-25 株式会社日立製作所 Storage control method, system and program
JP4900784B2 (en) * 2006-04-13 2012-03-21 株式会社日立製作所 Storage system and storage system data migration method
JP2008299481A (en) * 2007-05-30 2008-12-11 Hitachi Ltd Storage system and data copy method between several base points

Also Published As

Publication number Publication date
JP2010182154A (en) 2010-08-19

Similar Documents

Publication Publication Date Title
US7512755B2 (en) Computer system storing data on multiple storage systems
US7941622B2 (en) Point in time remote copy for multiple sites
JP4668763B2 (en) Storage device restore method and storage device
JP4422519B2 (en) Information processing system
CN101755257B (en) Managing the copying of writes from primary storages to secondary storages across different networks
US8495014B2 (en) Asynchronous remote copy system and storage control method
CN1983202A (en) Method and system for managing failures
KR20110044858A (en) Maintain data indetermination in data servers across data centers
US8255649B2 (en) Remote copy control method and system in storage cluster environment
WO2011015970A1 (en) Data gap management in a remote data mirroring system
US11321005B2 (en) Data backup system, relay site storage, data backup method, and control program for relay site storage
US7412577B2 (en) Shared data mirroring apparatus, method, and system
JP5218121B2 (en) Information system and disaster recovery method
KR20160004721A (en) Method for Replicationing of Redo Log without Data Loss and System Thereof
JP2006039976A (en) Remote copy system
CN107291924A (en) A kind of synchronous replication log control method and system for disaster recovery and backup systems
JP2006318077A (en) Remote copy system
JP4452494B2 (en) Data synchronization method after stopping remote copy on multiple remote storages
JP2006221487A (en) Remote copy system
JP4721057B2 (en) Data management system, data management method, and data management program
JP2004272884A5 (en)
JP2011253400A (en) Distributed mirrored disk system, computer device, mirroring method and its program
CN113467717B (en) Dual-machine volume mirror image management method, device and equipment and readable storage medium
US9497266B2 (en) Disk mirroring for personal storage
JP2018163520A (en) Storage device, replication system, and replication method

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110920

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5218121

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees