JP2010231257A - High availability system and method for handling failure of high availability system - Google Patents
High availability system and method for handling failure of high availability system Download PDFInfo
- Publication number
- JP2010231257A JP2010231257A JP2009074847A JP2009074847A JP2010231257A JP 2010231257 A JP2010231257 A JP 2010231257A JP 2009074847 A JP2009074847 A JP 2009074847A JP 2009074847 A JP2009074847 A JP 2009074847A JP 2010231257 A JP2010231257 A JP 2010231257A
- Authority
- JP
- Japan
- Prior art keywords
- server
- standby
- active
- virtual
- synchronization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
本発明は、クラスタを用いた高可用性システムに関し、特に、高可用性システムの対障害対策方法に関する。 The present invention relates to a high availability system using a cluster, and more particularly, to a countermeasure method against a failure in a high availability system.
クラスタリングは一般的な技術であり、高可用性を実現するための技術である。一方、迅速な障害復旧を実現する技術としてバックアップが広く利用されている。 Clustering is a general technique and is a technique for realizing high availability. On the other hand, backup is widely used as a technique for realizing quick failure recovery.
これらクラスタリング及びバックアップの技術は、アプローチこそ異なるが、何れも対障害対策の技術であり、これら2つの技術を有機的に結合すれば、可用性を更に高めることが可能である。しかし、クラスタリングとバックアップを有機的に結合した技術は確立されていない。 Although these clustering and backup technologies are different in approach, they are all anti-failure technologies, and if these two technologies are organically combined, availability can be further increased. However, a technology that organically combines clustering and backup has not been established.
例えば、特許文献1に記載される関連技術では、仮想マシン上に同一機能を持ったサーバを構築してクラスタとして動作させる技術を提要しているが、障害復旧対策のためのバックアップについては何ら考慮されていない。
For example, in the related technology described in
上述したように、クラスタリング及びバックアップの技術は共に対障害対策を目的としているにもかかわらず、これらの技術を有機的に結合して、可用性を更に高める技術については確立されていない。 As described above, although both clustering and backup technologies are aimed at countermeasures against failure, no technology has been established for further combining these technologies to further increase availability.
特許文献1等に記載される関連技術では、クラスタシステムを安全にバックアップするためには、クラスタを停止しなければならないという問題がある。これは、データの整合性を保持するために静止点を設ける必要があり、この状態でバックアップを実施する必要があるためである。従って、業務を停止することができないシステムでクラスタを停止せずにバックアップを実施することができなかった。
The related art described in
(発明の目的)
本発明の目的は、クラスタを用いた高可用性システムにおいて、クラスタとバックアップの2つの技術を有機的に結合させ、クラスタを停止させることなく最新のデータでのバックアップとリカバリを可能にした高可用性システムを提供することにある。
(Object of invention)
An object of the present invention is to provide a high-availability system in which two technologies of a cluster and a backup are organically combined in a high-availability system using a cluster, and backup and recovery with the latest data can be performed without stopping the cluster. Is to provide.
本発明の高可用性システムは、稼働系サーバと、当該稼働系サーバと同期してデータを常に最新に保持する待機系サーバを含むクラスタと、待機系サーバとの間でデータの同期をとる仮想サーバを含み、稼動系サーバと待機系サーバの同期処理と連動して、待機系サーバと仮想サーバの同期処理を行い、待機系サーバの稼動系サーバとの同期機能と仮想サーバの待機系サーバとの同期機能を停止した状態で、仮想サーバのバックアップを行う。 The high availability system of the present invention includes an active server, a cluster including a standby server that keeps data up-to-date in synchronization with the active server, and a virtual server that synchronizes data with the standby server In synchronization with the synchronization processing of the active server and the standby server, the standby server and the virtual server are synchronized. The synchronization function between the standby server and the active server and the standby server of the virtual server Backup the virtual server with the synchronization function stopped.
本発明の高可用性システムの対障害対策方法は、クラスタを構成する稼働系サーバと待機系サーバとの同期処理に連増して、待機系サーバと仮想サーバとの同期処理を行うステップと、待機系サーバの稼動系サーバとの同期機能と仮想サーバの待機系サーバとの同期機能を停止した状態で、仮想サーバのバックアップを行うステップを有する。 The method for countermeasures against failure of the high availability system of the present invention includes a step of performing synchronization processing between a standby server and a virtual server in addition to synchronization processing between an active server and a standby server constituting a cluster, There is a step of backing up the virtual server in a state where the synchronization function of the server with the active server and the synchronization function of the virtual server with the standby server are stopped.
本発明によれば、クラスタを用いた高可用性システムにおいて、クラスタとバックアップの2つの技術を有機的に結合させ、クラスタを停止させることなく最新のデータでのバックアップとリカバリを可能にする。 According to the present invention, in a high-availability system using a cluster, the two technologies of cluster and backup are organically combined to enable backup and recovery with the latest data without stopping the cluster.
以下、本発明の実施の形態について図面を参照して詳細に説明する。第1の実施の形態では、仮想マシンサーバとクラスタを用いた高可用性システムの基本構成と特徴、バックアップ及びリカバリ処理の動作について詳説する。また、第2の実施の形態では、稼動サーバに障害が発生した場合の自働リカバリ方法について詳説する。第3の実施の形態では、コスト削減に対応させるためにクラスタを仮想マシンサーバ上の仮想マシンに構築した場合の例について詳説する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the first embodiment, the basic configuration and characteristics of a high availability system using virtual machine servers and clusters, and operations of backup and recovery processing will be described in detail. In the second embodiment, an automatic recovery method when a failure occurs in the active server will be described in detail. In the third embodiment, an example in which a cluster is constructed in a virtual machine on a virtual machine server in order to cope with cost reduction will be described in detail.
(第1の実施の形態)
図1は、本発明の第1の実施の形態による高可用性システムの全体構成を示すブロック図である。図1を参照すると、第1の実施の形態による高可用性システムは、AP(アプリケーション)サーバ101とAPサーバ102で構築したクラスタ103、DB(データベース)サーバ111とDBサーバで構築したクラスタ113、仮想マシンサーバ121、仮想マシンサーバ121上に構築した仮想APサーバ122及び仮想DBサーバ123、管理サーバ131を含んでいる。
(First embodiment)
FIG. 1 is a block diagram showing the overall configuration of the high availability system according to the first embodiment of the present invention. Referring to FIG. 1, the high availability system according to the first embodiment includes a
上記のように、APサーバ101及びAPサーバ102はクラスタ103を、DBサーバ111及びDBサーバ112は、クラスタ113をそれぞれ構築しており、クラスタ内のサーバのうち、一方がユーザにサービス提供を行っている稼動系サーバ、もう一方が待機中の待機系サーバとして動作している。クラスタ103、113は、ミラー型のクラスタリング機能を有している。待機系サーバであるAPサーバ102及びDBサーバ112は、それぞれ稼動系サーバであるAPサーバ101及びDBサーバ111と同期してデータを常に最新に保持する。
As described above, the AP
このクラスタ103とクラスタ113は、サービスネットワーク141は、業務に使用されるサービスネットワーク141と、クラスタ内の同期やバックアップのために使用される管理ネットワーク142にそれぞれ接続されている。
In the
また、図2及び図3に示すように、稼働系APサーバ101及び待機系APサーバ102は、クラスタ同期手段202、302、データ同期手段202、302を含む。クラスタ同期手段202、302は、例えば、クラスタ同期を実行するエージェントとして実装できる。また、同様に、データ同期手段203、303も、データ同期を実行するエージェントとして実装することができる。
As shown in FIGS. 2 and 3, the
稼働系APサーバ101及び待機系APサーバ102は、クラスタ同期手段202、302を用いて、クラスタ103内でデータの同期を行う機能を有する。また、データ同期手段203及び303を用いて、仮想APサーバ122とデータの同期を行う機能を有する。
The
なお、クラスタ113を構成する稼動系DBサーバ111、待機系DBサーバ112についても、上記稼働系APサーバ101及び待機系APサーバ102と同様の構成であり、クラスタ同期手段202、302を用いて、クラスタ113内でデータの同期を行う。また、データ同期手段203及び303を用いて、仮想DBサーバ123とデータの同期を行う。
Note that the active DB server 111 and the
管理ネットワーク142には、クラスタ103の待機系APサーバ102と同期する仮想APサーバ122と、クラスタ113の待機系DBサーバ112と同期する仮想DBサーバ123、管理サーバ131が存在する。
The
仮想APサーバ122及び仮想DBサーバ123は、仮想マシンサーバ121上に構築された仮想サーバであり、図4に示すように、データ同期手段402を備える。このデータ同期手段402によって、待機系APサーバ102及び待機系DBサーバ112とデータの同期を行う。この仮想APサーバ122及び仮想DBサーバ123が、バックアップ対象サーバとなる。
The
管理サーバ131は、図5に示すように、クラスタ制御プログラム502、バックアッププログラム503、リカバリプログラム504を含む。
As shown in FIG. 5, the
クラスタ制御プログラム502は、クラスタ103及びクラスタ113内の稼動系サーバと待機系サーバを切り替えるクラスタ制御機能を有する。
The
バックアッププログラム503は、仮想APサーバ122、仮想DBサーバ12をバックアップする機能を有する。
The
リカバリプログラム504は、クラスタ103及びクラスタ113内の稼働系サーバ及び待機系サーバに、バックアップ対象サーバである仮想サーバをマイグレーションしてシステムを復旧するリカバリ機能を有する。
The
本実施の形態の特徴は、APサーバ101とAPサーバ102のバックアップをクラスタ停止せずに実現でき、かつ、バックアップのためにAPサーバ101とAPサーバ102にかかる負荷を低減することができることである。これらを実現するために、仮想APサーバ122からバックアップを行う。また、負荷の低減するためにAPサーバ102の差分データのみを仮想APサーバ122に送信して同期処理を行う。
The feature of this embodiment is that backup of the
(第1の実施の形態の動作の説明)
次に、図6、図7を使用して本実施の形態による高可用性システムの処理動作を説明する。
(Description of the operation of the first embodiment)
Next, processing operations of the high availability system according to the present embodiment will be described with reference to FIGS.
図6は、本実施の形態における高可用性システムのバックアップ処理例を示すシーケンス図である。なお、クラスタ103のAPサーバ101を稼動系サーバ、APサーバ102を待機系サーバとした場合を例示して説明する。
FIG. 6 is a sequence diagram illustrating an example of backup processing of the high availability system according to the present embodiment. An example will be described in which the
管理サーバ131は、稼働系APサーバ101と待機系APサーバ102、仮想APサーバ122に対して同期処理を指示する(ステップ601)。
The
稼働系APサーバ101は、データの更新が発生すると、クラスタ同期手段202を起動し、前回の同期から変更のあった差分データを待機系APサーバ102に送信する(ステップ602)。また、待機系APサーバ102は、クラスタ同期手段302を動作させ、稼働系APサーバ101からの差分データを受信してディスクに書き込み、同期処理を行う(ステップ603)。
When the data update occurs, the
待機系APサーバ102は、同期処理が完了すると、クラスタ同期手段302を停止することにより、以降は稼働系APサーバ101と同期をとらないように設定変更する(ステップ604)。
When the synchronization process is completed, the
次に、待機系APサーバ102は、データ同期手段303を起動し、稼働系APサーバ101から受信した差分データを仮想APサーバ122に送信する(ステップ605)。仮想APサーバ122は、データ同期手段402を起動し、差分データを受信してディスクに書き込み、同期処理を行う(ステップ606)。
Next, the
同期が完了すると、仮想APサーバ122は、データ同期手段402を停止することにより、以降は待機系APサーバ102と同期をとらないように設定を変更する(ステップ607)。すなわち、APサーバ102と仮想APサーバ122の同期処理を一旦停止する。
When the synchronization is completed, the
続いて、管理サーバ131は、バックアッププログラム503によって仮想APサーバ122のバックアップを実行する(ステップ608)。このバックアップにおいて、システムを含めたバックアップであればオフラインでバックアップを行うが、データのバックアップのみであればオンラインでも実行可能である。また、バックアップが完了するまでの間、APサーバ102は仮想APサーバ122に差分データの送信を行うことはできないので、内部に差分データを保持しておく。
Subsequently, the
管理サーバ131は、仮想APサーバ122のバックアップが完了すると、停止している待機系APサーバ102のクラスタ同期手段302と、仮想APサーバ122のデータ同期手段402の動作を再開させる(ステップ609、610)。これにより、稼動系APサーバ101と待機系APサーバ102の同期処理及び待機系APサーバ102と仮想APサーバ122の同期処理が再開する。
When the backup of the
以上の説明では、クラスタ103のAPサーバ101を稼動系サーバ、APサーバ102を待機系サーバとした場合のバックアップ処理を説明したが、クラスタ113のDBサーバ111を稼動系サーバ、DBサーバ112を待機系サーバとした場合でも、上記の同様の手順によりバックアップ処理が実行される。
In the above description, the backup processing when the
図7は本実施の形態における高可用性システムのリカバリ処理例を示すシーケンス図である。なお、ここでは、稼動系サーバがAPサーバ101で、待機系サーバがAPサーバ102の場合において、稼働系APサーバ101にシステム異常が発生してリカバリを実行する場合の処理について説明する。
FIG. 7 is a sequence diagram showing an example of recovery processing of the high availability system in the present embodiment. Here, a description will be given of processing in a case where a system abnormality occurs in the
稼働系APサーバ101に障害が発生すると、管理サーバ131は、クラスタ制御プログラム502によって、稼動系サーバをAPサーバ101からAPサーバ102に切り替えて、APサーバ1101をクラスタ103から切り離す(ステップ701、702、703)。これにより、APサーバ102が稼動系サーバとして業務を継続する。
When a failure occurs in the
管理サーバ131は、仮想APサーバ122に対してデータ同期手段402の停止を指示する(ステップ706)。仮想APサーバ122は、APサーバ102との同期処理を停止して、システム異常が発生した時点での静止ポイントを設ける。
The
その後、管理サーバ131は、リカバリプログラム504を実行し、仮想APサーバ122を、障害が発生したAPサーバ101にマイグレーションして、システムを復旧する(705、707)。
Thereafter, the
なお、仮想マシンサーバの機能として異なるハードウェア構成のマシンをマイグレーションする技術が実現されてきているので、仮想APサーバ122とAPサーバ101のハードウェアが異なることによるドライバの互換性等の問題は発生しない。
Since technology for migrating machines with different hardware configurations has been realized as a function of the virtual machine server, problems such as driver compatibility due to different hardware of the
マイグレーションによってAPサーバ101が静止ポイントまでリカバリされると、管理サーバ131は、APサーバ101のクラスタ同期手段202と、仮想APサーバ122のデータ同期手段402を再開させる(709、710)。これにより、稼働系のAPサーバ102とAPサーバ101間の同期処理、APサーバ101と仮想APサーバ122の同期処理が再開する。
When the
上記の説明では、クラスタ103のAPサーバ101を稼動系サーバ、APサーバ102を待機系サーバとした場合のリカバリ処理を説明したが、クラスタ113のDBサーバ111を稼動系サーバ、DBサーバ112を待機系サーバとした場合でも、上記の同様の手順によりリカバリ処理が実行される。
In the above description, the recovery process is described in the case where the
(第1の実施の形態による効果)
次に、上述した第1の実施の形態による効果について説明する。
第1に、クラスタによる高可用性を実現しながらサービス停止をすることなくバックアップを実施することができる。すなわち、クラスタとバックアップの2つの技術を有機的に結合させた可用性の高いシステムを提供することができる。
(Effects of the first embodiment)
Next, effects of the first embodiment described above will be described.
First, backup can be performed without stopping the service while realizing high availability by the cluster. That is, it is possible to provide a highly available system that organically combines the two technologies of cluster and backup.
第2に、稼動サーバを直接バックアップするのではなく、同一のオペレーティングシステムおよびアプリケーション、データを保持している仮想サーバからバックアップを実行することにより、稼働サーバおよび待機サーバのサービス無停止と、バックアップの負荷低減を実現することができる。また、差分データによるバックアップのため、この点でも稼動サーバ及び待機サーバへの負荷軽減が実現できる。 Second, instead of backing up the active server directly, by executing the backup from the virtual server holding the same operating system, application, and data, the service of the active server and the standby server can be stopped without interruption. Load reduction can be realized. In addition, since the backup is based on the differential data, the load on the active server and the standby server can be reduced.
第3に、クラスタの同期機能と差分バックアップを包括的に考慮することが可能である。すなわち、クラスタリングで発生する差分データを仮想サーバにも書き込みことで、クラスタとバックアップの融合を実現することができる。 Third, it is possible to comprehensively consider the cluster synchronization function and differential backup. That is, it is possible to realize the fusion of the cluster and the backup by writing the difference data generated in the clustering to the virtual server.
第4に、仮想マシンサーバのディスク状態はクラスタの同期処理と連動して、常に同時に差分データによるバックアップが実現されているため、常に最新の状態でのバックアップ、及びリカバリを提供することができる。 Fourth, since the disk state of the virtual machine server is always synchronized with the cluster synchronization process and always backed up by differential data, backup and recovery in the latest state can always be provided.
第5に、仮想マシンサーバ121上に仮想サーバを構築し、仮想サーバをバックアップ対象サーバとすることにより、バックアップ対象サーバの設置コストの削減、省エネルギー、スペース集約などのメリットが得られる。
Fifth, by constructing a virtual server on the
(第2の実施の形態)
次に、本発明の第2の実施の形態による高可用性システムについて説明する。第2の実施の形態では、障害監視機能を使用することで、サーバに障害が発生したときに、自動的に、クラスタの切り替え、及び障害発生サーバのリカバリを実行するものである。
(Second Embodiment)
Next, a high availability system according to the second embodiment of the present invention will be described. In the second embodiment, by using the failure monitoring function, when a failure occurs in the server, the cluster is automatically switched and the failed server is recovered.
第2の実施の形態による高可用性システムの全体構成については、図1に示した第1の実施の形態の構成と同様であるので、ここでは説明を省略する。 Since the overall configuration of the high availability system according to the second embodiment is the same as the configuration of the first embodiment shown in FIG. 1, the description thereof is omitted here.
図8から図10は、本発明の第2の実施の形態に係る稼動系APサーバ101、待機系サーバ102、及び管理サーバ131の機能構成を示すブロック図である。
8 to 10 are block diagrams showing functional configurations of the
稼動系APサーバ101は、クラスタ同期手段202、データ同期手段203、障害監視手段204を含む。同様に、待機系APサーバ102は、クラスタ同期手段302、データ同期手段303、障害監視手段304を含む。
The
稼動系APサーバ101と待機系APサーバ102の障害監視手段204、304は、それぞれサーバの障害を監視して検出するプログラムであり、SNMPなど公知のプロトコルに基づいて実装されたプログラムによって実装される。障害監視手段204、304は、サーバにおけるシステム障害等を検出すると、障害発生通知を管理サーバ131に送る。
The failure monitoring means 204 and 304 of the
管理サーバ131は、クラスタ制御プログラム502、バックアッププログラム503、リカバリプログラム504、障害監視プログラム505を含む。
The
障害監視プログラム505は、障害監視手段204及び304からの障害発生通知を監視しており、障害発生通知を受信すると、これをトリガーとして、管理サーバ131が、クラスタの切り替え及び障害サーバのリカバリ処理を実行する。
The
なお、稼動系APサーバ101と待機系APサーバ102のクラスタ同期手段202、データ同期手段203、303の機能、管理サーバ131のクラスタ制御プログラム502、バックアッププログラム503、リカバリプログラム504の機能については、第1の実施の形態と同様であるので、ここでは説明を省略する。
The functions of the cluster synchronization means 202 and data synchronization means 203 and 303 of the
また、図8、9において、稼動系APサーバ101と待機系APサーバ102の構成を説明したが、稼動系DBサーバ111、待機系DBサーバ112についても、同じように障害監視手段を備えている。
8 and 9, the configurations of the
本実施の形態による高可用性システムにおけるリカバリ処理の動作について説明する。 The operation of the recovery process in the high availability system according to this embodiment will be described.
図11は、本実施の形態における管理サーバ131の動作を示したフローチャート図である。
FIG. 11 is a flowchart showing the operation of the
管理サーバ131では障害監視プログラム505が動作しており、障害監視手段204または304からの障害検出通知を監視している(ステップS901)。障害検出通知を受信すると、これをトリガーとして、クラスタの切り替えおよび障害発生サーバのリカバリ処理を開始する。なお、以下の説明では、稼動系サーバをAPサーバ101、待機系サーバをAPサーバ102とし、稼動系APサーバ101に障害が発生した場合を例にとって説明する。
In the
管理サーバ131は、稼動系APサーバ101の障害監視手段204から障害発生通知を受信すると、自動的にクラスタ制御プログラム502が動作し、稼動系サーバをAPサーバ101からAPサーバ102に切り替えて、(ステップS902)、障害が発生したAPサーバ101をクラスタ103から切り離す(ステップS903)。
When the
続いて、管理サーバ131は、仮想APサーバ122に対してデータ同期手段402の停止を指示し、同期処理を停止させる(ステップS904)。ここで、仮想APサーバ122は、システム異常が発生した時点での静止ポイントを設ける。
Subsequently, the
そして、管理サーバ131は、リカバリプログラム504を実行し、仮想APサーバ122を、障害が発生したAPサーバ101にマイグレーションして、システムを復旧する(ステップS905)。マイグレーションによりAPサーバ101が静止ポイントまでリカバリされると、管理サーバ131は、稼働系APサーバ101のクラスタ同期手段202と、仮想APサーバ122のデータ同期手段402を再開させる(ステップS906)。
Then, the
なお、第2の実施の形態におけるバックアップ処理については、第1の実施の形態の場合と全く同様に実行される。 Note that the backup processing in the second embodiment is executed in exactly the same way as in the first embodiment.
(第2の実施の形態による効果)
本実施の形態によれば、高可用性システムにおいて、稼動系サーバまたは待機系サーバの何れかに障害が発生した場合に、最新のデータにより自動的にリカバリを実現することができる。常に最新のデータでリカバリが可能な理由は、仮想APサーバのディスク状態はクラスタの同期処理と連動して、常に差分データによるバックアップが実現されているからである。すなわち、障害監視機能と組み合わせることにより、自動切り替えおよび自動リカバリを実現することができる。
(Effects of the second embodiment)
According to this embodiment, when a failure occurs in either the active server or the standby server in the high availability system, recovery can be automatically realized with the latest data. The reason why the latest data can always be recovered is that the disk state of the virtual AP server is always backed up by differential data in conjunction with the cluster synchronization process. That is, automatic switching and automatic recovery can be realized by combining with the failure monitoring function.
なお、第1の実施の形態及び第2の実施の形態において、図1に示すクラスタ103、113を仮想マシンサーバ上の仮想マシンで構築することも可能である。
In the first embodiment and the second embodiment, the
ここで、第1の実施の形態及び第2の実施の形態の各サーバのハードウェア構成例について簡単に説明する。図12は、APサーバ101のハードウェア構成例を示すブロック図である。ここでは、APサーバ101を例にとって説明するが、他のサーバについても同様の構成である。
Here, a hardware configuration example of each server according to the first embodiment and the second embodiment will be briefly described. FIG. 12 is a block diagram illustrating a hardware configuration example of the
図12を参照すると、APサーバ101は、一般的なコンピュータ装置と同様のハードウェア構成によって実現することができ、CPU(Central Processing Unit)701、RAM(Random Access Memory)等のメモリからなる、データの作業領域やデータの一時退避領域に用いられる主記憶部702、ネットワークを介してデータの送受信を行う通信部703、入力装置705、出力装置706及び記憶装置707と接続してデータの送受信を行う入出力インタフェース部704、上記各構成要素を相互に接続するシステムバス708を備えている。記憶装置707は、例えば、ROM(Read Only Memory)、磁気ディスク、半導体メモリ等の不揮発性メモリから構成される。
Referring to FIG. 12, the
APサーバ101は、プログラムを組み込んだ、LSI(Large Scale Integration)等のハードウェア部品である回路部品を実装することにより、その動作をハードウェア的に実現することは勿論として、上記クラスタ同期手段202、データ同期手段203等の機能を提供するプログラムを、記憶装置707に格納し、そのプログラムを主記憶部702にロードしてCPU701で実行することにより、ソフトウェア的に実現することも可能である。
The
以上好ましい実施の形態をあげて本発明を説明したが、本発明は必ずしも、上記実施の形態に限定されるものでなく、その技術的思想の範囲内において様々に変形して実施することができる。 Although the present invention has been described with reference to the preferred embodiments, the present invention is not necessarily limited to the above embodiments, and various modifications can be made within the scope of the technical idea. .
101、102:APサーバ
111、112:DBサーバ
103、113、1007:クラスタ
121:仮想マシンサーバ
122:仮想APサーバ
123:仮想DBサーバ
131:管理サーバ
141:サービスネットワーク
142:管理ネットワーク
202、302:クラスタ同期手段
203、303、402:データ同期手段
204、304:障害監視手段
502:クラスタ制御プログラム
503:バックアッププログラム
504:リカバリプログラム
505:障害監視プログラム
101, 102: AP server 111, 112:
Claims (10)
前記待機系サーバとの間でデータの同期をとる仮想サーバを備え、
前記稼動系サーバと前記待機系サーバの同期処理と連動して、前記待機系サーバと前記仮想サーバの同期処理を行い、前記待機系サーバの前記稼動系サーバとの同期機能と前記仮想サーバの前記待機系サーバとの同期機能を停止した状態で、前記仮想サーバのバックアップを行うことを特徴とする高可用性システム。 A cluster including an active server and a standby server that always keeps data up-to-date in synchronization with the active server;
A virtual server that synchronizes data with the standby server,
In synchronization with the synchronization processing of the active server and the standby server, the standby server and the virtual server are synchronized, the synchronization function of the standby server with the active server, and the virtual server A high availability system, wherein the virtual server is backed up in a state where the synchronization function with the standby server is stopped.
前記バックアップ完了後に、前記待機系サーバの前記稼動系サーバとの同期機能と、前記仮想サーバの前記待機系サーバとの同期機能を再開させる
ことを特徴とする請求項1に記載の高可用性システム。 Sending difference data from the active server to the standby server to perform synchronization processing, and sending the difference data from the standby server to the virtual server to perform synchronization processing,
The high availability system according to claim 1, wherein after the backup is completed, the synchronization function of the standby server with the active server and the synchronization function of the virtual server with the standby server are resumed.
切り離した前記稼動系サーバと前記仮想サーバのマイグレーションを実行することにより、システムをリカバリして前記稼動系サーバを前記クラスタに復帰させることを特徴とする請求項1又は請求項2に記載の高可用性システム。 If a system error occurs on the active server, disconnect the active server from the cluster,
3. The high availability according to claim 1, wherein the system is recovered and the active server is returned to the cluster by executing migration of the disconnected active server and the virtual server. system.
前記管理サーバが、
前記前記待機系サーバの前記稼動系サーバとの同期と、前記仮想サーバの前記待機系サーバとの同期を制御する制御プログラムと、
前記仮想サーバのバックアップを実行するバックアッププログラムと、
切り離した前記稼動系サーバと前記仮想サーバのマイグレーションを実行することにより、システムをリカバリするリカバリプログラムを備えることを特徴とする請求項1から請求項3の何れかに記載の高可用性システム。 With a management server,
The management server is
A control program for controlling synchronization of the standby server with the active server and synchronization of the virtual server with the standby server;
A backup program for performing backup of the virtual server;
The high availability system according to any one of claims 1 to 3, further comprising a recovery program that recovers the system by executing migration of the separated active server and the virtual server.
前記管理サーバが、前記稼動系サーバ又は前記待機系サーバの前記障害監視手段からの障害検出通知を受信すると、障害検出通知をトリガーとして自動的に、障害が発生した前記稼動系サーバ又は前記待機系サーバの切り離しと、前記仮想サーバとのマイグレーションを実行することを特徴とする請求項4に記載の高可用性システム。 The active server and the standby server include failure monitoring means for monitoring a failure of the own server,
When the management server receives a failure detection notification from the failure monitoring means of the active server or the standby server, the active server or the standby system in which a failure has occurred automatically, triggered by the failure detection notification The high availability system according to claim 4, wherein server detachment and migration with the virtual server are executed.
前記待機系サーバの前記稼動系サーバとの同期機能と前記仮想サーバの前記待機系サーバとの同期機能を停止した状態で、前記仮想サーバのバックアップを行うステップを有する
ことを特徴とする高可用性システムの対障害対策方法。 A step of performing synchronization processing between the standby server and the virtual server in series with synchronization processing between the active server and the standby server constituting the cluster;
A high availability system comprising a step of backing up the virtual server in a state where the synchronization function of the standby server with the active server and the synchronization function of the virtual server with the standby server are stopped. Measures against failure.
前記バックアップ完了後に、前記待機系サーバの前記稼動系サーバとの同期機能と、前記仮想サーバの前記待機系サーバとの同期機能を再開させるステップを有する
ことを特徴とする請求項6に記載の高可用性システムの対障害対策方法。 Performing synchronization processing by transmitting difference data from the active server to the standby server, and performing synchronization processing by transmitting the difference data from the standby server to the virtual server;
7. The method according to claim 6, further comprising a step of resuming a synchronization function of the standby server with the active server and a synchronization function of the virtual server with the standby server after the backup is completed. How to deal with failures in availability systems.
切り離した前記稼動系サーバと前記仮想サーバのマイグレーションを実行することにより、システムをリカバリして前記稼動系サーバを前記クラスタに復帰させるステップを有することを特徴とする請求項6又は請求項7に記載の高可用性システムの対障害対策方法。 When a system error occurs in the active server, disconnecting the active server from the cluster; and
8. The method according to claim 6, further comprising a step of recovering a system and returning the active server to the cluster by executing migration of the disconnected active server and the virtual server. For high-availability systems.
前記管理サーバで、
前記前記待機系サーバの前記稼動系サーバとの同期と、前記仮想サーバの前記待機系サーバとの同期を制御し、
前記仮想サーバのバックアップを実行し、
切り離した前記稼動系サーバと前記仮想サーバのマイグレーションを実行することを特徴とする請求項6から請求項8の何れかに記載の高可用性システムの対障害対策方法。 With a management server,
On the management server,
Controlling the synchronization of the standby server with the active server and the synchronization of the virtual server with the standby server,
Perform a backup of the virtual server,
9. The countermeasure against failure of a high availability system according to claim 6, wherein migration of the separated active server and the virtual server is executed.
前記管理サーバで、前記稼動系サーバ又は前記待機系サーバからの障害検出通知を受信すると、障害検出通知をトリガーとして自動的に、障害が発生した前記稼動系サーバ又は前記待機系サーバの切り離しと、前記仮想サーバとのマイグレーションを実行することを特徴とする請求項9に記載の高可用性システムの対障害対策方法。 The active server and the standby server monitor the failure of the local server,
Upon receiving a failure detection notification from the active server or the standby server in the management server, automatically triggered by the failure detection notification, disconnection of the active server or the standby server that has failed, 10. The countermeasure against failure of a high availability system according to claim 9, wherein migration with the virtual server is executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009074847A JP2010231257A (en) | 2009-03-25 | 2009-03-25 | High availability system and method for handling failure of high availability system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009074847A JP2010231257A (en) | 2009-03-25 | 2009-03-25 | High availability system and method for handling failure of high availability system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010231257A true JP2010231257A (en) | 2010-10-14 |
Family
ID=43047049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009074847A Pending JP2010231257A (en) | 2009-03-25 | 2009-03-25 | High availability system and method for handling failure of high availability system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010231257A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012132046A1 (en) | 2011-03-31 | 2012-10-04 | 株式会社日立ソリューションズ | Information processing system, backup management method and program |
JP2013186692A (en) * | 2012-03-08 | 2013-09-19 | Hitachi Systems Ltd | Virtual machine providing system |
WO2014076838A1 (en) * | 2012-11-19 | 2014-05-22 | 株式会社日立システムズ | Virtual machine synchronization system |
CN105978746A (en) * | 2016-07-26 | 2016-09-28 | 北京沐星科技有限公司 | Game server cluster system and method for improving game space service |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07262066A (en) * | 1994-03-23 | 1995-10-13 | Hitachi Ltd | Failure recovery and transmission type data base system |
JP2005173751A (en) * | 2003-12-09 | 2005-06-30 | Hitachi Ltd | Master system operation management method using virtual machine system |
JP2006106901A (en) * | 2004-09-30 | 2006-04-20 | Nippon Digital Kenkyusho:Kk | Virtual server, its computer and program to be executed by computer |
JP2009003769A (en) * | 2007-06-22 | 2009-01-08 | Nec Corp | Network file system and network file system restoration method |
JP2009507280A (en) * | 2005-08-23 | 2009-02-19 | ミモーサ・システムズ・インコーポレーテッド | Enterprise service availability through ID storage |
-
2009
- 2009-03-25 JP JP2009074847A patent/JP2010231257A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07262066A (en) * | 1994-03-23 | 1995-10-13 | Hitachi Ltd | Failure recovery and transmission type data base system |
JP2005173751A (en) * | 2003-12-09 | 2005-06-30 | Hitachi Ltd | Master system operation management method using virtual machine system |
JP2006106901A (en) * | 2004-09-30 | 2006-04-20 | Nippon Digital Kenkyusho:Kk | Virtual server, its computer and program to be executed by computer |
JP2009507280A (en) * | 2005-08-23 | 2009-02-19 | ミモーサ・システムズ・インコーポレーテッド | Enterprise service availability through ID storage |
JP2009003769A (en) * | 2007-06-22 | 2009-01-08 | Nec Corp | Network file system and network file system restoration method |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012132046A1 (en) | 2011-03-31 | 2012-10-04 | 株式会社日立ソリューションズ | Information processing system, backup management method and program |
JP2012212389A (en) * | 2011-03-31 | 2012-11-01 | Hitachi Solutions Ltd | Information processing system, backup management method, and program |
JP2013186692A (en) * | 2012-03-08 | 2013-09-19 | Hitachi Systems Ltd | Virtual machine providing system |
WO2014076838A1 (en) * | 2012-11-19 | 2014-05-22 | 株式会社日立システムズ | Virtual machine synchronization system |
CN105978746A (en) * | 2016-07-26 | 2016-09-28 | 北京沐星科技有限公司 | Game server cluster system and method for improving game space service |
CN105978746B (en) * | 2016-07-26 | 2019-02-01 | 北京沐星科技有限公司 | Game server group system and raising gamespace method of servicing |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101043310B (en) | Image backup method for dual-core control of core controlled system | |
JP5352115B2 (en) | Storage system and method for changing monitoring condition thereof | |
WO2021136422A1 (en) | State management method, master and backup application server switching method, and electronic device | |
CN106850255B (en) | Method for implementing multi-machine backup | |
US20170308446A1 (en) | System and method for disaster recovery of cloud applications | |
JP5707355B2 (en) | Hot-standby client-server system | |
CN102394914A (en) | Cluster brain-split processing method and device | |
CN103036719A (en) | Cross-regional service disaster method and device based on main cluster servers | |
CN106970861A (en) | A kind of virtual machine fault-tolerance approach and system | |
EP2224341A1 (en) | Node system, server switching method, server device, and data transfer method | |
CN115576655B (en) | Container data protection system, method, device, equipment and readable storage medium | |
CN105338095A (en) | Conversation data processing method and device | |
CN112527567A (en) | System disaster tolerance method, device, equipment and storage medium | |
CN103795572A (en) | Method for switching master server and slave server and monitoring server | |
CN113438111A (en) | Method for restoring RabbitMQ network partition based on Raft distribution and application | |
CN102111281A (en) | Hot standby method for implementing dual-machine hot standby system | |
WO2006005251A1 (en) | Method and system for carrying out the function of switching in a communication system | |
JP2010231257A (en) | High availability system and method for handling failure of high availability system | |
CN112052127A (en) | Data synchronization method and device for dual-computer hot standby environment | |
CN115396296A (en) | Service processing method and device, electronic equipment and computer readable storage medium | |
JP5285045B2 (en) | Failure recovery method, server and program in virtual environment | |
CN112929438A (en) | Business processing method and device of double-site distributed database | |
US7519857B2 (en) | Method, apparatus, and system for a software based business continuity solution for a computing environment | |
JP5285044B2 (en) | Cluster system recovery method, server, and program | |
JP2011141675A (en) | Computer, method and program for managing computer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120209 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20131010 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140318 |