JP2010103695A - Cluster system, cluster server and cluster control method - Google Patents
Cluster system, cluster server and cluster control method Download PDFInfo
- Publication number
- JP2010103695A JP2010103695A JP2008272162A JP2008272162A JP2010103695A JP 2010103695 A JP2010103695 A JP 2010103695A JP 2008272162 A JP2008272162 A JP 2008272162A JP 2008272162 A JP2008272162 A JP 2008272162A JP 2010103695 A JP2010103695 A JP 2010103695A
- Authority
- JP
- Japan
- Prior art keywords
- application
- server
- heartbeat
- cluster
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、複数のサーバを有し、ある稼働系のサーバで稼働している業務アプリケーションに障害が発生した際に、他のサーバである待機系のサーバで同様の業務アプリケーションを稼働させ、常にその業務アプリケーションを稼働状態とするクラスタシステム、ならびに、そのクラスタシステムの制御方法に関する。 The present invention has a plurality of servers, and when a business application running on a certain active server fails, the same business application is always run on the standby server that is another server. The present invention relates to a cluster system that puts the business application in an operating state, and a control method for the cluster system.
近年、クラスタシステムは、システムの大規模化によりデータ量が増大しているため、複数のサーバにより負荷分散を行い、かつ稼働させる業務アプリケーションに対して稼働系及び待機系を設け、所定の業務アプリケーションが稼働しないダウンタイムを低減して信頼性を向上させている。
すなわち、クラスタシステムは、複数のサーバにより、それぞれ異なる所定の業務アプリケーションが稼働しており、各サーバが他のサーバと通信を行い相互監視を行い(ハートビート処理)、いずれかのコンピュータの業務アプリケーションに障害が発生した場合、他のサーバにおいて、その業務アプリケーションを稼働させ、その業務アプリケーションを継続して実行させる構成となっている(例えば、引用文献1参照)。
In other words, in a cluster system, different predetermined business applications are operated by a plurality of servers, and each server communicates with other servers to perform mutual monitoring (heartbeat processing). When a failure occurs, the business application is operated on another server and the business application is continuously executed (see, for example, cited document 1).
しかしながら、上述したクラスタシステムは、ハートビート処理を行っている通信が不通となった場合、相互監視が行えなくなるスプリットブレーン状態となるため、各サーバが共通にアクセス可能なシステム情報管理テーブルを有している。
すなわち、各サーバの監視ソフトが、このシステム情報管理テーブルの各サーバの業務アプリケーション毎(あるいは複数のグループからなる業務アプリケーショングループ毎)に動作主体となっているサーバの識別子を書き込む欄があり、その欄に周期的にアクセス結果を書き込んでいる。
However, the cluster system described above has a split brain state in which mutual monitoring cannot be performed when communication for performing heartbeat processing is interrupted. ing.
That is, there is a column in which the monitoring software of each server writes the identifier of the server that is the operating entity for each business application (or each business application group consisting of a plurality of groups) of each server in this system information management table. The access result is periodically written in the column.
したがって、他サーバの業務アプリケーションに対応する上記欄を確認し、設定された時間以上の間隔を置いて、新たな時間が書き込まれなかった場合、その業務アプリケーションに障害が発生していることを検出し、他のサーバがその障害のあった業務アプリケーションを自身が行う切り替え処理を行う。
ところが、上述したシステム情報管理テーブルを設ける場合、新たにディスクをシステムに配設することとなり、システム全体の価格が高くなってしまうという問題がある。
また、クラスタシステムのアプリケーションが提供するサービスの種類によっては、データを外部のディスクに蓄積する必要の無いものもあり、スプリットブレーンに対応することだけの目的で、ディスクを設けることはシステム全体の価格を高くすることとなる。
Therefore, check the above column corresponding to the business application on the other server, and if a new time is not written after an interval longer than the set time, it is detected that a fault has occurred in that business application. Then, another server performs a switching process for itself to execute the business application having the failure.
However, when the above-described system information management table is provided, there is a problem that a new disk is disposed in the system, which increases the price of the entire system.
In addition, depending on the type of service provided by the cluster system application, there is no need to store data on an external disk, and installing a disk only for the purpose of supporting split brain is the price of the entire system. Will be higher.
本発明は、このような事情に鑑みてなされたもので、ハートビート処理を行っている通信が不通となるスプリットブレーン状態となった場合に、上述したシステム情報管理テーブルを用いずとも、障害の発生した業務アプリケーションを検出することができるクラスタシステム、クラスタサーバ及びクラスタ方法を提供することを目的とする。 The present invention has been made in view of such circumstances, and in the case of a split brain state in which communication for which heartbeat processing is performed is interrupted, the failure information can be obtained without using the above-described system information management table. An object of the present invention is to provide a cluster system, a cluster server, and a cluster method capable of detecting a generated business application.
本発明のクラスタシステムは、ネットワークにて接続された複数のサーバからなり、各アプリケーションを稼働系のサーバにおいて処理し、アプリケーションが異常となった場合に、異常となったアプリケーションを待機系のサーバにて処理するクラスタシステムであり、前記各サーバが、他のサーバとの間におけるハートビートが正常に動作しているか否かを検出するハートビート監視部と、該ハートビート監視部が他のサーバとの間のハートビートが異常であることを検出した場合、前記他のサーバにて稼働しているアプリケーションを起動するアプリケーション制御部と、ルータにおける当該アプリケーションのIPアドレスに対応するMACアドレスを、自身のMACアドレスに変更するアプリケーション切り替え部とを有することを特徴とする。 The cluster system of the present invention is composed of a plurality of servers connected via a network. Each application is processed by an active server, and when an application becomes abnormal, the abnormal application becomes a standby server. A heartbeat monitoring unit that detects whether or not the heartbeat is operating normally with another server, and the heartbeat monitoring unit communicates with another server. When detecting that the heartbeat between is abnormal, the application control unit that activates the application running on the other server, and the MAC address corresponding to the IP address of the application in the router, Having an application switching unit for changing to a MAC address And features.
本発明のクラスタシステムは、前記アプリケーション制御部が、前記ハートビートに異常が発生した際、前記ネットワークを介してエコーパケットを各他のサーバに送信し、前記エコーパケットに対する返信の無いサーバに対応するアプリケーションを、現在実行しているアプリケーションに加えて実行することを特徴とする。 In the cluster system of the present invention, the application control unit transmits an echo packet to each other server via the network when an abnormality occurs in the heartbeat, and corresponds to a server that does not return a response to the echo packet. An application is executed in addition to the currently executing application.
本発明のクラスタシステムは、前記アプリケーション制御部が、前記エコーパケットに対して返信があった場合、当該エコーパケットを返信した他のサーバへ仮想端末ソフトウェアを用いて前記ネットワークを介してログインし、前記エコーパケットを返信したサーバで稼働している各アプリケーションの動作状態をチェックし、正常であるか否かの検出を行うことを特徴とする。 In the cluster system of the present invention, when the application control unit returns a response to the echo packet, the application control unit logs in to another server that has returned the echo packet through the network using virtual terminal software, The operating state of each application running on the server that has returned the echo packet is checked to detect whether it is normal or not.
本発明のクラスタサーバは、ネットワークにて接続された複数のサーバからなり、各アプリケーションを稼働系のサーバにおいて処理し、アプリケーションが異常となった場合に、異常となったアプリケーションを待機系のサーバにて処理するクラスタシステムで用いるクラスタサーバであり、他のサーバとの間におけるハートビートが正常に動作しているか否かを検出するハートビート監視部と、該ハートビート監視部が他のサーバとの間のハートビートが異常であることを検出した場合、前記他のサーバにて稼働しているアプリケーションを起動するアプリケーション制御部と、ルータにおける当該アプリケーションのIPアドレスに対応するMACアドレスを、自身のMACアドレスに変更するアプリケーション切り替え部とを有することを特徴とする。 The cluster server of the present invention is composed of a plurality of servers connected via a network. Each application is processed by an active server, and when an application becomes abnormal, the abnormal application becomes a standby server. A cluster server used in the cluster system to process the heartbeat monitoring unit for detecting whether or not the heartbeat with other servers is operating normally, and the heartbeat monitoring unit If the heartbeat between them is detected to be abnormal, the application control unit that activates the application running on the other server and the MAC address corresponding to the IP address of the application in the router And an application switching unit for changing to an address And wherein the door.
本発明のクラスタ制御方法は、ネットワークにて接続された複数のサーバからなり、各アプリケーションを稼働系のサーバにおいて処理し、アプリケーションが異常となった場合に、異常となったアプリケーションを待機系のサーバにて処理するクラスタシステムにおいて用いられるクラスタ制御方法であり、前記各サーバにおいて、ハートビート監視部が他のサーバとの間におけるハートビートが正常に動作しているか否かを検出するハートビート監視過程と、前記ハートビート監視部により他のサーバとの間のハートビートが異常であることが検出された場合、アプリケーション制御部が、前記他のサーバにて稼働しているアプリケーションを起動するアプリケーション制御過程と、アプリケーション切り替え部が、ルータにおける当該アプリケーションのIPアドレスに対応するMACアドレスを、自身のMACアドレスに変更するアプリケーション切り替え過程とを有することを特徴とする。 The cluster control method according to the present invention includes a plurality of servers connected via a network, and each application is processed by an active server. When an application becomes abnormal, the abnormal application is processed as a standby server. Is a cluster control method used in a cluster system for processing in which the heartbeat monitoring process in which the heartbeat monitoring unit detects whether or not the heartbeat with other servers is operating normally in each server And when the heartbeat monitoring unit detects that the heartbeat with the other server is abnormal, the application control unit starts an application running on the other server. And the application switching unit The MAC address corresponding to the IP address of the application, and having an application switching process to change its MAC address.
以上説明したように、本発明によれば、監視専用接続が不通あるいは稼働しているサーバが異常となることで、通信ハートビート処理(以下、ハートビート)が行えなくなり、スプリットブレーン状態となった場合でも、従来のように高価なシステム情報管理テーブル共有ディスクを設けなくとも、各アプリケーションに対するICMP(Control Message Protocol)のエコーパケット(エコーリクエストパケット)、例えばPING(Packet INternet Groper)の送信、及び他のサーバに対してネットワークからのログインによるアプリケーションのチェックにより、障害のあるアプリケーションを容易に検出することが可能であり、従来例に比較して安価なクラスタシステムを構成することができる。 As described above, according to the present invention, the communication heartbeat process (hereinafter referred to as heartbeat) cannot be performed due to the disconnection of the monitoring dedicated connection or the malfunctioning server, resulting in a split brain state. Even in the case where an expensive system information management table shared disk is not provided as in the past, ICMP (Control Message Protocol) echo packets (echo request packets) for each application, for example, PING (Packet Internet Groper) transmission, and others It is possible to easily detect a faulty application by checking the application by logging in to the server from the network, and it is possible to configure a cluster system that is less expensive than the conventional example.
以下、本発明の一実施形態によるクラスタシステムの構成を図面を参照して説明する。図1は同実施形態によるクラスタシステムの構成例を示すブロック図である。
この図において、本実施形態のクラスタシステムは、サーバ1、サーバ2、…の複数のサーバと、ルータ30と、により構成されている。
サーバ1、サーバ2、…は、ネットワーク100に接続されており、ルータ30を介して外部システム、すなわちクライアント端末等に接続されている。また、外部システムとの接続は、ルータ30の代わりにスイッチングハブでもよく、ネットワークにおいて、VIP(仮想IP)アドレスとMAC(Media Access Control address)アドレスとの対応を示すARP(Address Resolution Protocol)テーブルを有している経路制御を行うネットワーク機器であれば何でも良い。
Hereinafter, a configuration of a cluster system according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of a cluster system according to the embodiment.
In this figure, the cluster system of this embodiment is composed of a plurality of servers, a
The
このVIPアドレスは、ネットワーク100を介して、あるいはルータ30を介して接続されるクライアント端末が業務アプリケーションにアクセスする際に用いられる。
すなわち、上記VIPアドレスは、図3のテーブルにより各業務アプリケーションに対応するネットワークセグメントに設定される。
上記サーバ1、サーバ2、…各々は、それぞれにて稼働している業務アプリケーションにて、各業務アプリケーションにアクセスするクライアント端末に対してサービスを提供する。上述した各サーバにおいて、あるサーバは稼働系として用いて、業務用アプリケーションを処理し、あるサーバは待機系として、処理が異常となった業務用アプリケーションが検出された場合、その業務アプリケーションが稼働していた稼働系のサーバから、業務アプリケーションが稼働していない待機系のサーバに移行する処理が行われる。以下説明を簡単とするため、本実施形態においては、サーバが2台であって、サーバ1(稼働系)及びサーバ2(待機系)がネットワーク100に接続されているとして説明する。
This VIP address is used when a client terminal connected via the
That is, the VIP address is set in the network segment corresponding to each business application according to the table of FIG.
Each of the
サーバ1は、ハートビート監視部11、業務アプリケーション制御部12、業務アプリケーション切り替え部13、インターフェース14及び記憶部15を有している。
同様に、サーバ2は、ハートビート監視部21、業務アプリケーション制御部22、業務アプリケーション切り替え部23、インターフェース24及び記憶部25を有している。
上記業務アプリケーション制御部12は、監視部121と制御部122とを有する。
同様に、上記業務アプリケーション制御部22は、監視部221と制御部222とを有する。
記憶部15及び記憶部25には、アプリケーションIDと、そのアプリケーションIDに対応して業務アプリケーション(実行ファイル)とが記憶されている。
ハートビート監視部11は、ハートビート監視部21に対し、あらかじめ設定した周期毎に、監視信号を出力し、その応答の有無により、ハートビート監視部11との間のハートビートが正常に動作しているか否かの検出を行う。
同様に、ハートビート監視部21は、ハートビート監視部11に対し、あらかじめ設定した周期毎に、監視信号を出力し、その応答の有無により、ハートビート監視部11との間のハートビートが正常に動作しているか否かの検出を行う。
ここで、ハートビート監視部11とハートビート監視部21とは、ハートビートのデータの送受信を行うネットワークを、ルータ30に接続されているネットワーク100と異なるネットワークセグメントを用いて行っている。
The
Similarly, the
The business
Similarly, the business
The
The
Similarly, the
Here, the
業務アプリケーション制御部12は、監視部121と制御部122とを有している。
ここで、監視部121は、サーバ1において稼働されている業務アプリケーションの監視、すなわち、あらかじめ設定した周期毎に、自身の属するサーバ1で稼働している業務アプリケーションの動作における障害の有無を検出する。この障害の検出において、監視部121は、各業務アプリケーションに動作確認の確認信号を送信し、業務アプリケーションからの応答信号の有無により、自身の属するサーバ1で稼働しているアプリケーションの障害の有無を検出している。ここで、監視部121は、内部の記憶部に各業務アプリケーションの識別情報であるアプリケーションIDに対応付けて動作状態を書き込んで記録する。
制御部122は、業務アプリケーションの起動及び停止を行い、上記監視部121が障害を検出すると、対応する業務アプリケーションを停止し、停止させた業務アプリケーションのアプリケーションIDを、ハートビート監視部11を介し、ハートビート監視部21へ送信する。また、制御部122は、ハートビート監視部11から通知されるアプリケーションIDに対応する業務アプリケーションを、記憶部15のテーブルから読み込んで実行する。
The business
Here, the monitoring unit 121 monitors the business application running on the
The
また、業務アプリケーション制御部22は、監視部221と制御部222とを有している。
ここで、監視部221は、サーバ2において稼働されている業務アプリケーションの監視、すなわち、あらかじめ設定した周期毎に、自身の属するサーバ2で稼働している業務アプリケーションの動作における障害の有無を検出する。この障害の検出において、監視部221は、各業務アプリケーションに動作確認の確認信号を送信し、業務アプリケーションからの応答信号の有無により、自身の属するサーバ2で稼働している障害の有無を検出している。ここで、監視部221は、内部の記憶部に各業務アプリケーションのアプリケーションIDに対応付けて動作状態を書き込んで記録する。
制御部222は、業務アプリケーションの起動及び停止を行い、上記監視部221が障害を検出すると、対応する業務アプリケーションを停止し、停止させた業務アプリケーションのアプリケーションIDを、ハートビート監視部21を介し、ハートビート監視部11へ送信する。また、制御部222は、ハートビート監視部21から通知されるアプリケーションIDに対応する業務アプリケーションを、記憶部25のテーブルから読み込んで実行する。
The business
Here, the monitoring unit 221 monitors the business application running on the
The control unit 222 starts and stops the business application. When the monitoring unit 221 detects a failure, the control unit 222 stops the corresponding business application, and the application ID of the stopped business application is sent via the
業務アプリケーション切り替え部13は、ルータ30に記憶されているARPテーブルを書き換えるため、ハートビート監視部11から通知されるアプリケーションIDに対応したVIPアドレスと、MACアドレスとを含むARPパケットを、ルータ30に送信する。
インターフェース14は、ネットワーク100を介してルータ30に接続されたMACアドレス#1を有し、LANアダプタを有するインターフェースである。このLANアダプタは、同一のMACアドレス#1に対して複数のVIPアドレスを対応付け、複数のアプリケーション毎に異なるVIPアドレスを用いた通信処理を行う。
このLANアダプタは、同一のMACアドレス#1に対して複数のVIPアドレスを対応付け、複数のアプリケーション毎に異なるVIPアドレスを用いた通信処理を行う。
In order to rewrite the ARP table stored in the
The
This LAN adapter associates a plurality of VIP addresses with the same
業務アプリケーション切り替え部23は、ルータ30に記憶されているARPテーブルを書き換えるため、ハートビート監視部21から通知される業務アプリケーションIDに対応したVIPアドレス及びMACアドレス含むARPパケットを、ルータ30に送信する。
インターフェース24は、ネットワーク100を介してルータ30に接続されたMACアドレス#2を有し、LANアダプタを有するインターフェースである。このLANアダプタは、同一のMACアドレス#2に対して複数のVIPアドレスを対応付け、複数の業務アプリケーション毎に異なるVIPアドレスを用いた通信処理を行う。
このLANアダプタは、同一のMACアドレス#2に対して複数のVIPアドレスを対応付け、複数の業務アプリケーション毎に異なるVIPアドレスを用いた通信処理を行う。
The business
The interface 24 is an interface having a
This LAN adapter associates a plurality of VIP addresses with the same
ルータ30には、サーバ1,2,…のMACアドレス(Media Access Control address)と、それぞれのサーバが業務アプリケーションに対応して有しているVIPアドレスとが対応付けられた、図2に示すARPテーブルが記憶されている。ここで、#1がサーバ1のMACアドレスであり、#2がサーバ2のMACアドレスである。VIPアドレスX.X.X.X1がアプリケーションAP1に対応して設けられたVIPアドレスであり、VIPアドレスX.X.X.X2がアプリケーションAP2に対応して設けられたVIPアドレスであり、VIPアドレスX.X.X.X3がアプリケーションAP3に対応して設けられたVIPアドレスであり、VIPアドレスX.X.X.X4がアプリケーションAP4に対応して設けられたVIPアドレスである。
The
また、記憶部15及び記憶部25各々には、上記VIPアドレスと、当該VIPアドレスに対応した業務アプリケーションを示す識別情報であるアプリケーションIDとが対応付けられた、図3に示す対応テーブルが記憶されている。この図3において、VIPアドレスX.X.X.X1はアプリケーションIDであるアプリケーションAP1に対応付けられており、VIPアドレスX.X.X.X2はアプリケーションIDであるアプリケーションAP2に対応付けられ、VIPアドレスX.X.X.X3はアプリケーションIDであるアプリケーションAP3に対応付けられ、VIPアドレスX.X.X.X4はアプリケーションIDであるアプリケーションAP4に対応付けられている。
Each of the
また、ルータ30は、VIPアドレスを含む上記ARPパケットをサーバから受信すると、ARPパケットに付加されたVIPアドレスに対応するMACアドレスを、当該ARPパケットを送信したサーバのMACアドレスに変更する。
ここで、上記VIPアドレスは、すでに述べたように、テーブルにて対応する各業務アプリケーションに対するパケットのネットワークセグメントヘッダーやUDPデータグラムヘッダー中の宛先ポート番号に対応している。すなわち、上記VIPアドレスは、各業務アプリケーションに対して1つのIPアドレスを割り当てるために設定されている。
When the
Here, as described above, the VIP address corresponds to the destination port number in the network segment header or the UDP datagram header of the packet for each business application corresponding in the table. That is, the VIP address is set in order to assign one IP address to each business application.
次に、図1及び図4を参照して本実施形態によるクラスタシステムの動作を説明する。図4は、図1のクラスタシステムにおける、ハートビートが正常な場合、すなわちスプリットブレーンではない状態でのアプリケーションの切り替えの動作例を示すフローチャートである。以下、説明を簡単とするため、クラスタシステムが、サーバ1及びサーバ2の2つにより構成され、サーバ1の動作を中心に説明する。しかしながら、サーバ2においても同様の動作が行われている。
以下、図2及び図3の各テーブルに示すように、図1のクラスタシステムにおいて、初期状態において、稼働系のサーバ1でアプリケーションAP1、AP2、AP3及びAP4が稼働しており、待機系のサーバ2ではいずれの業務アプリケーションも稼働していない。
Next, the operation of the cluster system according to the present embodiment will be described with reference to FIGS. FIG. 4 is a flowchart showing an operation example of application switching in the cluster system of FIG. 1 when the heartbeat is normal, that is, when the heartbeat is not split. Hereinafter, in order to simplify the description, the cluster system includes two servers,
As shown in the tables of FIGS. 2 and 3, in the cluster system of FIG. 1, the applications AP1, AP2, AP3, and AP4 are operating on the
監視部121は、サーバ1において稼働している業務アプリケーションAP1、AP2、AP3及びAP4の動作状態の監視を、予め設定された周期において行う(ステップS1)。
そして、監視部121は、各業務アプリケーションに対して確認信号を送信し、応答信号の有無を確認することによって、正常であるか否かの判定を行い(ステップS2)、正常である旨の応答があった場合、処理を繰り返し、一方、応答がない場合、または異常である旨の応答があった場合には、異常の検出されたアプリケーションIDを、例えばアプリケーションAP3を制御部122へ送信して処理をS3へ進める。
上記アプリケーションIDが入力されると、制御部122は、このアプリケーションAP3に対応する業務アプリケーションを記憶部15のテーブルにより特定し(ステップS3)、特定された業務アプリケーションの稼働を停止させる(ステップS4)。
このとき、業務アプリケーション切り替え部13は、このアプリケーションAP3に付与されたVIPに対するネットワークセグメントの対応関係の記述を記憶部15から削除する。
The monitoring unit 121 monitors operation states of the business applications AP1, AP2, AP3, and AP4 running on the
Then, the monitoring unit 121 transmits a confirmation signal to each business application and determines whether or not it is normal by confirming the presence or absence of a response signal (step S2). If there is a response, the process is repeated. On the other hand, if there is no response or if there is a response indicating an abnormality, the application ID in which the abnormality is detected is transmitted to the
When the application ID is input, the
At this time, the business
次に、制御部122は、停止させた業務アプリケーションのアプリケーションIDを、異常検出信号とともに、ハートビート監視部11を介して、サーバ2へ送信する(ステップS5)。
上記異常検出信号及びアプリケーションIDがサーバ1のハートビート監視部11から送信されると、サーバ2のハートビート監視部21は、このアプリケーションID及び異常検出信号を受信する(ステップS6)。
これにより、サーバ2の制御部222は、ハートビート監視部21が受信した上記アプリケーションID及び異常検出信号に基づいて業務アプリケーションの起動処理、すなわち、入力されたアプリケーションAP3に対応する業務アプリケーションを、記憶部25のテーブルから読み出し、この業務アプリケーションを起動する。
そして、業務アプリケーション切り替え部23は、この起動したアプリケーションAP3に対応するVIPアドレスを、図3のテーブルより読み出し、このVIPアドレスに対するネットワークセグメントを生成し、起動した業務アプリケーションのアプリケーションIDとVIPアドレスの対応付けを行い、記憶部25に書き込む(ステップS7)。
この後、サーバ2において、制御部222は、アプリケーションAP3に対する稼働の確認処理を行う。
Next, the
When the abnormality detection signal and the application ID are transmitted from the
As a result, the control unit 222 of the
Then, the business
Thereafter, in the
また、業務アプリケーション切り替え部23は、アプリケーションIDがアプリケーションAP3のVIPアドレスであるX.X.X.X3と、サーバ2のMACアドレス#2を付加したARPパケットをルータ30に送信する。
ARPパケットが入力されると、ルータ30は、ARPテーブルにおいて、VIPアドレスX.X.X.X3に対応したMACアドレスをサーバ1のMACアドレス#1からサーバ1の#2へ書き換える。
これにより、以降の外部システムのクライアント端末からのアプリケーションAP3に対するアクセスは、待機系から稼働系となったサーバ2において実行されているプリケーションAP3に対して行われることになる。
In addition, the business
When the ARP packet is input, the
As a result, the subsequent access to the application AP3 from the client terminal of the external system is performed with respect to the application AP3 being executed in the
以下、スプリットブレーンが発生した際に、異常とされたサーバから、正常な他のサーバへ業務アプリケーションを切り替える2つの異なる切り替え処理について説明する。
<スプリットブレーン発生時の第1の業務アプリケーション切り替え処理>
次に、ハートビートが異常、すなわちサーバ1及びサーバ2においてスプリットブレーンが発生した場合の業務アプリケーションの切り替え処理について説明する。図5は、サーバ2を主体として、アプリケーション切り替え処理の動作を説明するフローチャートである。
ハートビート監視部11及びハートビート監視部21のそれぞれは、互いの属するサーバの稼働状態をハートビート(上述したサーバの稼働状態を示す通知の送受信処理)にて監視するとともに、監視用専用接続であるネットワークの通信状況を確認している。ここでは、サーバ2のハートビート監視部21がサーバ1を監視している(ステップS11)。
ここで、ハートビート監視部11及びハートビート監視部21は、それぞれルータ30と接続されたインターフェース14、15のネットワーク100と異なるネットワークセグメントにより、それぞれの間に監視用専用接続を形成している。
In the following, two different switching processes for switching a business application from an abnormal server to another normal server when a split brain occurs will be described.
<First business application switching process when split brain occurs>
Next, a business application switching process when the heartbeat is abnormal, that is, when a split brain occurs in the
Each of the
Here, the
ハートビート監視部11及びハートビート監視部21のそれぞれは、接続されている相手から予め設定された一定周期毎に、返信の有無によりハートビートが有効に行われているか否か、すなわちスプリットブレーンの状態であるか否かを判定する。ここでは、サーバ2のハートビート監視部21は、サーバ1との間のハートビートが有効に行われているか否かを判定する(ステップS12)。この場合も、図1のクラスタシステムにおいて、初期状態において、稼働系のサーバ1でアプリケーションAP1、AP2、AP3及びAP4が稼働しており、待機系のサーバ2ではいずれの業務アプリケーションも稼働していないものとして説明する。
ここで、ハートビート監視部21は、ハートビート監視部11に対して送信した監視信号に対する応答信号を受信した場合、サーバ1が正常に動作しているとして、処理をステップS13へ進め、すでに説明したハートビートが正常な場合の監視処理となり、一方、監視信号に対する応答信号が受信されない場合、サーバ1自体が異常あるいは監視用専用接続が異常である(スプリットブレーンの状態である)として、処理をステップS14へ進める。
Each of the
Here, when the
次に、サーバ2の制御部222は、クラスタシステムにて稼働している業務アプリケーションのアプリケーションIDを記憶部25において抽出し、自身にて稼働しているアプリケーションが無いため、抽出した全てのアプリケーションIDに対応する業務アプリケーションが、稼働系であるサーバ1において稼働している業務アプリケーションであると特定する(ステップS14)。
そして、制御部222は、特定した上記アプリケーションID、すなわちアプリケーションAP1、AP2、AP3及びAP4を起動する。
そして、業務アプリケーション切り替え部23は、起動した各アプリケーションAP1、AP2、AP3、AP4各々に対応するVIPアドレスを、図3のテーブルより読み出し、このVIPアドレスに対するネットワークセグメントをそれぞれ生成し、起動した業務アプリケーションにそれぞれ対応付け、記憶部25に記憶させる(ステップS15)。
Next, the control unit 222 of the
Then, the control unit 222 activates the identified application ID, that is, the applications AP1, AP2, AP3, and AP4.
Then, the business
この後、制御部222は、アプリケーションAP1、AP2、AP3及びAP4に対する稼働の確認処理を行う。
また、業務アプリケーション切り替え部23は、VIPアドレスX.X.X.X1とMACアドレス#2とを付加したARPパケット、VIPアドレスX.X.X.X2とMACアドレス#2とを付加したARPパケット、X.X.X.X3とMACアドレス#2とを付加したARPパケット、及びVIPアドレスX.X.X.X4とMACアドレス#2とを付加したARPパケットの4つのARPパケットをルータ30に送信する(ステップS16)。
ARPパケットが入力されると、ルータ30は、ARPテーブルにおいて、VIPアドレスX.X.X.X1、VIPアドレスX.X.X.X2、X.X.X.X3及びVIPアドレスX.X.X.X4それぞれとに対応したMACアドレスをサーバ1のMACアドレス#1からサーバ2の#2へ書き換える。
これにより、以降の外部システムのクライアント端末からのアプリケーションAP1、AP2、AP3及びAP4に対するアクセスは、サーバ1において実行されているプリケーションAP1、AP2、AP3及びAP4に対して行われることになる。
Thereafter, the control unit 222 performs operation confirmation processing for the applications AP1, AP2, AP3, and AP4.
The business
When the ARP packet is input, the
As a result, subsequent access to the applications AP1, AP2, AP3, and AP4 from the client terminals of the external system is performed with respect to the applications AP1, AP2, AP3, and AP4 executed in the
上述したように、本実形態における書き換えは、サーバ2における業務アプリケーションの稼働状態によらず、スプリットブレーンとなると強制的に業務アプリケーションの切り替えが行われることになる。
これにより、本実施形態によれば、従来のように高価なシステム情報管理テーブル共有ディスクを設けなくとも、スプリットブレーンとなったことが検出されると、ハートビートを行っていた相手のサーバで稼働している業務アプリケーションを、容易に自身のサーバにて行うように切り替えることが可能となり、従来例に比較して安価なクラスタシステムを構成することができる。
As described above, the rewriting in the present embodiment forcibly switches the business application in the split brain regardless of the operating state of the business application in the
As a result, according to the present embodiment, even if an expensive system information management table shared disk is not provided as in the prior art, when it is detected that a split brain has been detected, it operates on the partner server that performed the heartbeat. It is possible to easily switch the business application to be executed on its own server, and it is possible to configure an inexpensive cluster system as compared with the conventional example.
<スプリットブレーン発生時の第2の業務アプリケーション切り替え処理>
次に、図6を用いて、ハートビートが異常、すなわちサーバ1及びサーバ2においてスプリットブレーンが発生した際に、すでに述べた第1の実施形態と異なる業務アプリケーションの切り替え処理について説明する。図6は、サーバ2を主体として、アプリケーション切り替え処理の動作を説明するフローチャートである。
ハートビート監視部11及びハートビート監視部21のそれぞれは、属するサーバの稼働状態を互いにハートビート(上述したサーバの稼働状態を示す通知の送受信処理)にて監視するとともに、監視用専用接続であるネットワークの通信状況を確認している。ここでは、サーバ2のハートビート監視部21がサーバ1を監視している(ステップS21)。
ここで、ハートビート監視部11及びハートビート監視部21は、それぞれルータ30と接続されたインターフェース14、15のネットワーク100と異なるセグメントにより、それぞれの間に監視用専用接続を形成している。
<Second business application switching process when split brain occurs>
Next, a business application switching process different from that of the first embodiment already described when the heartbeat is abnormal, that is, when a split brain occurs in the
Each of the
Here, the
ハートビート監視部11及びハートビート監視部21のそれぞれは、接続されている相手から予め設定された一定周期毎に、返信の有無によりハートビートが有効に行われているか否か(スプリットブレーンの状態であるか否か)を判定する。ここでは、サーバ2のハートビート監視部21は、サーバ1との間のハートビートが有効に行われているか否かを判定する(ステップS22)。この場合も、図1のクラスタシステムにおいて、初期状態において、稼働系のサーバ1でアプリケーションAP1、AP2、AP3及びAP4が稼働しており、待機系のサーバ2ではいずれの業務アプリケーションも稼働していない場合について説明する。
ここで、ハートビート監視部21は、ハートビート監視部11に対して送信した監視信号に対する応答を受信した場合、サーバ1が正常に動作しているとして、処理をステップS23へ進め、すでに説明したハートビートが正常な場合の監視処理となり、一方、監視信号に対する応答信号が受信されない場合、サーバ1自体が異常あるいは監視用専用接続が異常であるとして、処理をステップS24へ進める。
Each of the
Here, when the
次に、サーバ2において、制御部222は、サーバ1に対してインターフェース24から、ネットワーク100を介してエコーパケットを送信し(ステップS24)、このエコーパケットに対する応答信号の有無を確認する(ステップS25)。
このとき、制御部222は、応答信号が無い場合、サーバ1自体が動作していないと判定し、処理をステップS26へ進め、このステップS26において第1の実施形態におけるステップS14からS16までの処理を行い、サーバ1で稼働していた業務アプリケーションをサーバ2にて起動する。
一方、応答信号が入力された場合、制御部222は、処理をステップS27へ進める。
Next, in the
At this time, if there is no response signal, the control unit 222 determines that the
On the other hand, when the response signal is input, the control unit 222 advances the process to step S27.
ここで、エコーパケットに対する応答が入力されたが、エコーパケットの応答のみではL3(レイヤー3)までの動作状態しか検出できないため、制御部222は各業務アプリケーションの動作の状態を検出する処理を行う。
すなわち、制御部222は、ネットワークの上位のレイヤーにおける動作を確認するため、OS、例えばWINDOWS(登録商標)やUNIX(登録商標)における仮想端末ソフトウェアの機能として設けられているTelnetあるいはSSH(Secure Shell)により、他のサーバ、すなわちインターフェース24及びネットワーク100を介してサーバ1にリモートでログインし(遠隔操作により)、サーバ1の監視部121における業務アプリケーションの監視処理を起動させて、各業務アプリケーションの稼働状態をチェックし(ステップS28)、チェック結果に基づいて、サーバ1のアプリケーションが正常に稼働しているか否かを判定する(ステップS29)。
サーバ1のアプリケーションが正常に稼働していない場合、サーバ2の制御部222は、ステップS26と同様に、第1の実施形態におけるステップS14からS16までの処理を行い、サーバ1で稼働していない業務アプリケーションを起動する(ステップS30)。
一方、ステップS29において、業務アプリケーションの全てが正常に動作しており、サーバ1の監視部121が業務アプリケーションの障害を検出しなかった場合、スプリットブレーン状態ではあるものの、稼働系サーバ自体には障害がないと判断できるため、サーバ1にリモートログインしている制御部222は、制御部122に業務アプリケーションを停止させる処理、及びルータ30に対するARPパケットの送信を行わず、すなわち業務アプリケーションの稼働を強制的に待機系のサーバ2へ移行する処理であるステップS30を行わずに処理を終了する。
Here, although a response to the echo packet is input, only the response to the echo packet can detect only the operation state up to L3 (layer 3), so the control unit 222 performs a process of detecting the operation state of each business application. .
In other words, the control unit 222 confirms the operation in the upper layer of the network in order to confirm the operation of the virtual terminal software in the OS, for example, WINDOWS (registered trademark) or UNIX (registered trademark), Telnet or SSH (Secure Shell. ) To remotely log in to the
When the application of the
On the other hand, if all the business applications are operating normally in step S29 and the monitoring unit 121 of the
次に、サーバ1において、制御部122は、上記ステップS28において、障害が発生した異常な業務アプリケーションが検出されると、その業務アプリケーションのアプリケーションID、例えばアプリケーションAP4を読み出し、制御部122により、アプリケーションAP4に対応する業務アプリケーションを停止させる。これにより、業務アプリケーション切り替え部23は、アプリケーションAP4に対応するVIPアドレスX.X.X.X4のネットワークセグメントを削除する。
そして、サーバ2において、制御部222は、上記アプリケーションID、すなわちアプリケーションAP4を起動する。
次に、業務アプリケーション切り替え部23は、起動したアプリケーションAP4に対応するVIPを、図3のテーブルより読み出し、このVIPアドレスに対するネットワークセグメントを生成し、起動した業務アプリケーションにそれぞれ対応付け、記憶部25に記憶する(ステップS30)。
なお、スプリットブレーン発生と同時に、稼働系のサーバ1の業務用アプリケーションの動作を監視する監視部121に異常が発生していることも考えられる。その場合には、制御部122により業務アプリケーションを停止させるという上述の処理に代えて、リモートにてログインしている制御部222がサーバ1の業務アプリケーションの停止処理を行うこととしても良い。
Next, in the
In the
Next, the business
It is also conceivable that an abnormality has occurred in the monitoring unit 121 that monitors the operation of the business application of the
この後、制御部222は、アプリケーションAP4に対する稼働の確認処理を行う。
また、業務アプリケーション切り替え部23は、VIPアドレスX.X.X.X4及びMACアドレス#2を付加したARPパケットをルータ30に送信する。
ARPパケットが入力されると、ルータ30は、ARPテーブルにおいて、VIPアドレスX.X.X.X4に対応したMACアドレスをサーバ1のMACアドレス#1からサーバ2のMACアドレス#2へ書き換える。
これにより、以降の外部システムのクライアント端末からのアプリケーションAP4に対するアクセスは、サーバ2において実行されているプリケーションAP4に対して行われることになる。
上述したように、本実形態における書き換えは、稼働系のサーバ1が正常に動作していない場合、このサーバ1における業務アプリケーションの稼働状態によらず、スプリットブレーンとなると強制的に業務アプリケーションの切り替えを行い、サーバ1が正常に動作している場合、サーバ1において障害のある業務アプリケーションのみ、待機系のサーバ2への切り替えが行われることになる。
Thereafter, the control unit 222 performs operation confirmation processing for the application AP4.
The business
When the ARP packet is input, the
As a result, the subsequent access to the application AP4 from the client terminal of the external system is made to the application AP4 executed in the
As described above, when the
すなわち、本実施形態によれば、従来のように高価なシステム情報管理テーブル共有ディスクを設けなくとも、各アプリケーションに対するICMPのエコーパケットの送信、及び他のサーバに対してネットワークからのログインによるアプリケーションのチェックにより、スプリットブレーンとなった場合に、ハートビートを行う監視用専用接続のネットワークの通信障害により、ハートビートが行えなくなった他のサーバにおいて、障害のある業務アプリケーションを容易に検出することが可能となり、従来例に比較して安価なクラスタシステムを構成することができる。 That is, according to the present embodiment, without providing an expensive system information management table shared disk as in the prior art, it is possible to send an ICMP echo packet to each application and to log in to another server by logging in from the network. If the check results in a split brain, it is possible to easily detect faulty business applications on other servers that cannot perform heartbeat due to a communication failure in the dedicated monitoring network that performs heartbeats. Thus, an inexpensive cluster system can be configured as compared with the conventional example.
なお、図1におけるサーバ1(あるいはサーバ2)それぞれの各部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより障害の発生しているアプリケーションの検出処理及びアプリケーションの切り替え処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。 Note that a program for realizing the function of each unit of the server 1 (or server 2) in FIG. 1 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system. It is also possible to perform application detection processing and application switching processing by executing the fault. The “computer system” here includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。 The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
11,21…ハートビート監視部
12,22…業務アプリケーション制御部
13,23…業務アプリケーション切り替え部
14,24…インターフェース
15,25…記憶部
30…ルータ
100…ネットワーク
121,221…監視部
122,222…制御部
11, 21 ...
Claims (5)
前記各サーバが、
他のサーバとの間におけるハートビートが正常に動作しているか否かを検出するハートビート監視部と、
該ハートビート監視部が他のサーバとの間のハートビートが異常であることを検出した場合、前記他のサーバにて稼働しているアプリケーションを起動するアプリケーション制御部と、
ルータにおける当該アプリケーションのIPアドレスに対応するMACアドレスを、自身のMACアドレスに変更するアプリケーション切り替え部と
を有することを特徴とするクラスタシステム。 A cluster system that consists of multiple servers connected via a network. Each application is processed on the active server, and when the application becomes abnormal, the abnormal application is processed on the standby server. ,
Each of the servers is
A heartbeat monitoring unit that detects whether or not the heartbeat with other servers is operating normally;
When the heartbeat monitoring unit detects that a heartbeat with another server is abnormal, an application control unit that starts an application running on the other server;
A cluster system comprising: an application switching unit configured to change a MAC address corresponding to an IP address of the application in the router to the own MAC address.
前記ハートビートに異常が発生した際、前記ネットワークを介してエコーパケットを各他のサーバに送信し、前記エコーパケットに対する返信の無いサーバに対応するアプリケーションを、現在実行しているアプリケーションに加えて実行することを特徴とする請求項1に記載のクラスタシステム。 The application control unit
When an abnormality occurs in the heartbeat, an echo packet is transmitted to each other server via the network, and an application corresponding to a server that does not reply to the echo packet is executed in addition to the currently executing application. The cluster system according to claim 1, wherein:
他のサーバとの間におけるハートビートが正常に動作しているか否かを検出するハートビート監視部と、
該ハートビート監視部が他のサーバとの間のハートビートが異常であることを検出した場合、前記他のサーバにて稼働しているアプリケーションを起動するアプリケーション制御部と、
ルータにおける当該アプリケーションのIPアドレスに対応するMACアドレスを、自身のMACアドレスに変更するアプリケーション切り替え部と
を有することを特徴とするクラスタサーバ。 Used in a cluster system that consists of multiple servers connected to the network, and each application is processed on the active server, and when the application becomes abnormal, the abnormal application is processed on the standby server A cluster server,
A heartbeat monitoring unit that detects whether or not the heartbeat with other servers is operating normally;
When the heartbeat monitoring unit detects that a heartbeat with another server is abnormal, an application control unit that starts an application running on the other server;
A cluster server, comprising: an application switching unit that changes a MAC address corresponding to an IP address of the application in the router to its own MAC address.
前記各サーバにおいて、
ハートビート監視部が他のサーバとの間におけるハートビートが正常に動作しているか否かを検出するハートビート監視過程と、
前記ハートビート監視部により他のサーバとの間のハートビートが異常であることが検出された場合、アプリケーション制御部が、前記他のサーバにて稼働しているアプリケーションを起動するアプリケーション制御過程と、
アプリケーション切り替え部が、ルータにおける当該アプリケーションのIPアドレスに対応するMACアドレスを、自身のMACアドレスに変更するアプリケーション切り替え過程と
を有することを特徴とするクラスタ制御方法。 Used in a cluster system that consists of multiple servers connected to the network, each application is processed on the active server, and if the application becomes abnormal, the abnormal application is processed on the standby server Cluster control method,
In each of the servers,
A heartbeat monitoring process in which the heartbeat monitoring unit detects whether the heartbeat with other servers is operating normally;
When the heartbeat monitoring unit detects that the heartbeat with another server is abnormal, the application control unit starts an application running on the other server, and
A cluster control method, wherein the application switching unit includes an application switching process in which a MAC address corresponding to the IP address of the application in the router is changed to its own MAC address.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008272162A JP2010103695A (en) | 2008-10-22 | 2008-10-22 | Cluster system, cluster server and cluster control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008272162A JP2010103695A (en) | 2008-10-22 | 2008-10-22 | Cluster system, cluster server and cluster control method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010103695A true JP2010103695A (en) | 2010-05-06 |
Family
ID=42293943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008272162A Pending JP2010103695A (en) | 2008-10-22 | 2008-10-22 | Cluster system, cluster server and cluster control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010103695A (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101924698A (en) * | 2010-07-22 | 2010-12-22 | 福建星网锐捷网络有限公司 | Method, system and equipment for balancing two-layer domain load based on IP unicast route |
JP2013008320A (en) * | 2011-06-27 | 2013-01-10 | Nippon Telegr & Teleph Corp <Ntt> | Network system, redundancy method, failure detector and failure detection program |
WO2019049433A1 (en) * | 2017-09-06 | 2019-03-14 | 日本電気株式会社 | Cluster system, cluster system control method, server device, control method, and non-transitory computer-readable medium having program stored therein |
KR20190052279A (en) * | 2017-11-08 | 2019-05-16 | 라인 가부시키가이샤 | Network service continuity management |
CN109995883A (en) * | 2017-12-29 | 2019-07-09 | 资易国际股份有限公司 | The self-repairing method of the corresponding failure in network equipment reality virtual address |
CN110716876A (en) * | 2019-09-30 | 2020-01-21 | 国核自仪系统工程有限公司 | Test platform and test method for automatically verifying programmable logic code |
CN111209025A (en) * | 2020-01-19 | 2020-05-29 | 山东浪潮通软信息科技有限公司 | SaaS platform implementation method based on heartbeat mechanism |
CN114189547A (en) * | 2022-02-14 | 2022-03-15 | 北京安盟信息技术股份有限公司 | SSL tunnel fast switching method under cluster |
CN115102962A (en) * | 2022-06-22 | 2022-09-23 | 青岛中科曙光科技服务有限公司 | Cluster management method and device, computer equipment and storage medium |
CN115499300A (en) * | 2022-09-19 | 2022-12-20 | 八维通科技有限公司 | Embedded equipment clustering operation architecture, method and device |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10320323A (en) * | 1997-05-15 | 1998-12-04 | Hewlett Packard Japan Ltd | Server computer and method for controlling server computer and recording medium for recording program for controlling server computer |
JPH10326208A (en) * | 1997-03-24 | 1998-12-08 | N T T Data:Kk | Failure restoration system and record medium |
JPH11184825A (en) * | 1997-12-19 | 1999-07-09 | Mitsubishi Electric Corp | Cluster system |
JPH11313101A (en) * | 1998-04-24 | 1999-11-09 | Nec Corp | Acceleration method and system for reconnecting connection of duplex lan system |
JP2000215076A (en) * | 1999-01-26 | 2000-08-04 | Toshiba Corp | Cluster system and fail-over processing method for cluster system |
JP2003348156A (en) * | 2002-05-28 | 2003-12-05 | Hitachi Ltd | Network management method |
JP2005073277A (en) * | 2003-08-27 | 2005-03-17 | Internatl Business Mach Corp <Ibm> | Reliable fault resolution in cluster |
JP2006033140A (en) * | 2004-07-13 | 2006-02-02 | Fujitsu Ltd | Network management apparatus, network management method, and program |
JP2006048477A (en) * | 2004-08-06 | 2006-02-16 | Fujitsu Ltd | Node control program and server of cluster system |
JP2006094155A (en) * | 2004-09-24 | 2006-04-06 | Hitachi Information Systems Ltd | Network failure monitoring system and program therefor |
JP2008172592A (en) * | 2007-01-12 | 2008-07-24 | Hitachi Ltd | Cluster system, computer and its abnormality detection method |
-
2008
- 2008-10-22 JP JP2008272162A patent/JP2010103695A/en active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10326208A (en) * | 1997-03-24 | 1998-12-08 | N T T Data:Kk | Failure restoration system and record medium |
JPH10320323A (en) * | 1997-05-15 | 1998-12-04 | Hewlett Packard Japan Ltd | Server computer and method for controlling server computer and recording medium for recording program for controlling server computer |
JPH11184825A (en) * | 1997-12-19 | 1999-07-09 | Mitsubishi Electric Corp | Cluster system |
JPH11313101A (en) * | 1998-04-24 | 1999-11-09 | Nec Corp | Acceleration method and system for reconnecting connection of duplex lan system |
JP2000215076A (en) * | 1999-01-26 | 2000-08-04 | Toshiba Corp | Cluster system and fail-over processing method for cluster system |
JP2003348156A (en) * | 2002-05-28 | 2003-12-05 | Hitachi Ltd | Network management method |
JP2005073277A (en) * | 2003-08-27 | 2005-03-17 | Internatl Business Mach Corp <Ibm> | Reliable fault resolution in cluster |
JP2006033140A (en) * | 2004-07-13 | 2006-02-02 | Fujitsu Ltd | Network management apparatus, network management method, and program |
JP2006048477A (en) * | 2004-08-06 | 2006-02-16 | Fujitsu Ltd | Node control program and server of cluster system |
JP2006094155A (en) * | 2004-09-24 | 2006-04-06 | Hitachi Information Systems Ltd | Network failure monitoring system and program therefor |
JP2008172592A (en) * | 2007-01-12 | 2008-07-24 | Hitachi Ltd | Cluster system, computer and its abnormality detection method |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101924698B (en) * | 2010-07-22 | 2012-12-12 | 福建星网锐捷网络有限公司 | Method, system and equipment for balancing two-layer domain load based on IP unicast route |
CN101924698A (en) * | 2010-07-22 | 2010-12-22 | 福建星网锐捷网络有限公司 | Method, system and equipment for balancing two-layer domain load based on IP unicast route |
JP2013008320A (en) * | 2011-06-27 | 2013-01-10 | Nippon Telegr & Teleph Corp <Ntt> | Network system, redundancy method, failure detector and failure detection program |
CN111052092A (en) * | 2017-09-06 | 2020-04-21 | 日本电气株式会社 | Cluster system, cluster system control method, server device, control method, and non-transitory computer-readable medium storing program |
WO2019049433A1 (en) * | 2017-09-06 | 2019-03-14 | 日本電気株式会社 | Cluster system, cluster system control method, server device, control method, and non-transitory computer-readable medium having program stored therein |
CN111052092B (en) * | 2017-09-06 | 2024-03-29 | 日本电气株式会社 | Cluster system, cluster system control method, server apparatus, control method, and non-transitory computer readable medium storing program |
US11223515B2 (en) | 2017-09-06 | 2022-01-11 | Nec Corporation | Cluster system, cluster system control method, server device, control method, and non-transitory computer-readable medium storing program |
JPWO2019049433A1 (en) * | 2017-09-06 | 2020-08-27 | 日本電気株式会社 | Cluster system, cluster system control method, server device, control method, and program |
KR20190052279A (en) * | 2017-11-08 | 2019-05-16 | 라인 가부시키가이샤 | Network service continuity management |
KR101986695B1 (en) * | 2017-11-08 | 2019-06-07 | 라인 가부시키가이샤 | Network service continuity management |
CN109995883A (en) * | 2017-12-29 | 2019-07-09 | 资易国际股份有限公司 | The self-repairing method of the corresponding failure in network equipment reality virtual address |
CN110716876A (en) * | 2019-09-30 | 2020-01-21 | 国核自仪系统工程有限公司 | Test platform and test method for automatically verifying programmable logic code |
CN111209025A (en) * | 2020-01-19 | 2020-05-29 | 山东浪潮通软信息科技有限公司 | SaaS platform implementation method based on heartbeat mechanism |
CN114189547A (en) * | 2022-02-14 | 2022-03-15 | 北京安盟信息技术股份有限公司 | SSL tunnel fast switching method under cluster |
CN114189547B (en) * | 2022-02-14 | 2022-05-03 | 北京安盟信息技术股份有限公司 | SSL tunnel fast switching method under cluster |
CN115102962A (en) * | 2022-06-22 | 2022-09-23 | 青岛中科曙光科技服务有限公司 | Cluster management method and device, computer equipment and storage medium |
CN115499300A (en) * | 2022-09-19 | 2022-12-20 | 八维通科技有限公司 | Embedded equipment clustering operation architecture, method and device |
CN115499300B (en) * | 2022-09-19 | 2024-03-15 | 八维通科技有限公司 | Embedded equipment clustering operation architecture system, construction method and construction device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010103695A (en) | Cluster system, cluster server and cluster control method | |
JP7009560B2 (en) | Methods and equipment for providing redundancy for process control systems | |
CN108259629B (en) | Virtual internet protocol address switching method and device | |
JP5187249B2 (en) | Redundant system connection recovery device, method and processing program | |
US20130159487A1 (en) | Migration of Virtual IP Addresses in a Failover Cluster | |
US9898377B2 (en) | Switch provided failover | |
EP1697843A2 (en) | System and method for managing protocol network failures in a cluster system | |
CN102710457A (en) | N+1 backup method and device of cross-network segment | |
JP5255035B2 (en) | Failover system, storage processing apparatus, and failover control method | |
JP2004032103A (en) | Network system and server switching method | |
JP4703682B2 (en) | Cluster system and program | |
CN109586986B (en) | Method, device, equipment and storage medium for switching network equipment | |
US7730168B2 (en) | Method and apparatus for assigning packet addresses to a plurality of devices | |
CN108270593B (en) | Dual-computer hot backup method and system | |
JP2002344450A (en) | High availability processing method, and executing system and processing program thereof | |
JP4133738B2 (en) | High-speed network address takeover method, network device, and program | |
JP2009003491A (en) | Server switching method in cluster system | |
JP2006129094A (en) | Redundant server system and server apparatus | |
JP2017017465A (en) | Address conversion system, address conversion duplication method and program | |
JP2003084996A (en) | Switching method for host computer | |
JP6462421B2 (en) | Switching hub in network system | |
JP2009278436A (en) | Communication system and redundant configuration management method | |
JP2005012599A (en) | Network constitution control system | |
JP2015070452A (en) | Packet complementation method and monitor system | |
JP6185513B2 (en) | COMMUNICATION MONITORING DEVICE, COMMUNICATION RELAY DEVICE, COMMUNICATION MONITORING METHOD, AND COMPUTER PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101026 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110301 |