JP2005258947A - Duplexing system and multiplexing control method - Google Patents
Duplexing system and multiplexing control method Download PDFInfo
- Publication number
- JP2005258947A JP2005258947A JP2004071495A JP2004071495A JP2005258947A JP 2005258947 A JP2005258947 A JP 2005258947A JP 2004071495 A JP2004071495 A JP 2004071495A JP 2004071495 A JP2004071495 A JP 2004071495A JP 2005258947 A JP2005258947 A JP 2005258947A
- Authority
- JP
- Japan
- Prior art keywords
- server
- client
- computers
- computer
- server computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、相互に通信可能な2台のサーバコンピュータから構成され、当該2台のサーバコンピュータのいずれか一方が稼動系として動作し、他方が待機系として動作する2重化システム及び多重化制御方法に関する。 The present invention is composed of two server computers that can communicate with each other, and one of the two server computers operates as an active system and the other operates as a standby system and multiplexing control. Regarding the method.
近年、コンピュータ技術やネットワーク技術の向上は目覚ましく、これに伴って、業務のコンピュータ処理化が広く行われている。しかし、業務の内容によっては、故障などによる中断が許されないものも多い。そこで最近では、複数のコンピュータをネットワークで結合した分散システムを構築することが一般的になりつつある。 In recent years, the improvement of computer technology and network technology has been remarkable, and along with this, computerization of business has been widely performed. However, depending on the contents of the business, there are many cases where interruption due to a failure or the like is not allowed. Therefore, recently, it is becoming common to construct a distributed system in which a plurality of computers are connected by a network.
分散システムの運用手法の1つとして、コンピュータの処理の多重化が知られている。分散システムでは、各コンピュータが独立に故障する可能性がある。仮に、1つのコンピュータが故障しただけでシステム全体が機能しないシステムでは、システムの稼働率は、1台のコンピュータの稼働率よりも低くなってしまう。かかる事態を防止するために、システム全体に係わる処理は多重化することが必要である。逆に、多重化することによって、分散システムの稼働率を1台のコンピュータの稼働率よりも高くすることが可能である。例えば、稼働率99パーセントのコンピュータ2台で構成する分散システムが、全く多重化(2重化)されていないとすると、その分散システムの稼働率は98%程度である。もし、これが2重化されているとすると、稼働率は、99.99%程度となる。このような2重化システムは、例えば特許文献1に記載されている。この特許文献1に記載された2重化システムは、2台のサーバユニニットから構成される2重化サーバシステムである。また、特許文献1には、2重化システムを利用する複数のクライアント端末の全てから当該システム内の従系サーバユニット(待機系サーバコンピュータ)に対し、主系サーバユニット(稼動系サーバコンピュータ)からサービスの提供を受けられない旨の通知があった場合だけ、従系サーバユニットが主系サーバユニットに切り替わることが記載されている。このような2重化システムでは、たとえ2つのサーバユニット間で通信ができなくても、当該2つのサーバユニットが同時に主系となるのを防止することが可能となる。
As one method for operating a distributed system, multiplexing of computer processing is known. In a distributed system, each computer may fail independently. In a system in which the entire system does not function just because one computer fails, the system operation rate is lower than the operation rate of one computer. In order to prevent such a situation, it is necessary to multiplex processes related to the entire system. Conversely, by multiplexing, it is possible to make the operating rate of the distributed system higher than the operating rate of one computer. For example, if a distributed system composed of two computers having an operation rate of 99% is not multiplexed (duplexed) at all, the operation rate of the distributed system is about 98%. If this is duplicated, the operation rate is about 99.99%. Such a duplex system is described in
<フェイルオーバ方式>
分散システムにおいて、コンピュータの処理を多重化する方式として、コンピュータの故障を検出したら、別のコンピュータでその処理を引き継ぐ方式が従来から知られている。この方式をフェイルオーバ方式と呼ぶ。
<Failover method>
As a method of multiplexing computer processing in a distributed system, a method of taking over the processing by another computer when a computer failure is detected is conventionally known. This method is called a failover method.
フェイルオーバ方式では、コンピュータの故障を検出するのに、コンピュータ間で定期的に通信し合い、お互いの動作状況を確認し合う方法が一般的に行われている。この通信のことを「ハートビート」と呼ぶ。コンピュータの故障停止は、ハートビートのタイムアウトによって検出される。つまり一定時間ハートビートが送出されていないコンピュータは故障停止したものとみなされる。 In the failover method, in order to detect a failure of a computer, a method of regularly communicating between computers and checking each other's operation status is generally performed. This communication is called “heartbeat”. Computer outages are detected by heartbeat timeouts. In other words, a computer that has not sent a heartbeat for a certain period of time is considered to have failed.
フェイルオーバ方式を適用する分散システムにおいては、スプリットブレインの発生が問題となる。スプリットブレインとは、実行のコンテキスト(状態)が2つ以上に分かれてしまうことを指す。スプリットブレインは、故障検出が誤って行われたときに発生する。例えば、分散システムを構成するコンピュータが、2つのコンピュータグループの間で互いに通信できない状態となった場合(network partitioning: ネットワーク分割)、両コンピュータグループは、互いに相手の故障を検出する。この場合、両コンピュータグループは独立して動作を始めることから、スプリットブレインに陥る。或いは、異常な高負荷のために、あるコンピュータのハートビートの送信が一時的に中断して故障が検出され、その後、そのコンピュータが動作を再開した後も、スプリットブレインに陥る可能性がある。 In a distributed system to which the failover method is applied, the occurrence of split brain becomes a problem. Split brain means that the execution context (state) is divided into two or more. Split brain occurs when fault detection is mistakenly performed. For example, when the computers constituting the distributed system become unable to communicate with each other between two computer groups (network partitioning), both computer groups detect each other's failure. In this case, since both computer groups start to operate independently, they fall into a split brain. Or, due to an abnormally high load, the transmission of a heartbeat of a computer may be temporarily interrupted, and a failure may be detected. Then, even after the computer resumes operation, it may fall into a split brain.
多重化された処理は、一般に分散システムの中で重要な処理である。そのため、スプリットブレインが起きると、その処理に一貫性がなくなり、システム全体に致命的な影響を及ぼす。 Multiplexed processes are generally important processes in a distributed system. Therefore, when split brain occurs, the processing becomes inconsistent and has a fatal effect on the entire system.
<多数決方式>
フェイルオーバ方式でのスプリットブレインの問題を根源的に解決するための方式として、多数決を用いた方式(多数決方式)が知られている。この多数決方式は、多重化した全てのコンピュータで同一の処理を実行し、全体の過半数(majority)を占めるコンピュータの動作を一致させることができるならば、他のコンピュータの動作に関係なく、処理を継続するものである。多数決方式は、定足数方式の1つである。定足数方式とは、多重化した全てのコンピュータで同一の処理を実行し、定足数(quorum:クォーラム)を占めるコンピュータの動作を一致させることができるならば、他のコンピュータの動作に関係なく、処理を継続するものである。この定足数を全体の過半数とした方式が多数決方式であり、例えば特許文献2に記載されている。
<Majority method>
As a system for fundamentally solving the problem of split brain in the failover system, a system using a majority vote (major vote system) is known. In this majority method, if the same processing is executed on all the multiplexed computers and the operations of the computers occupying the majority are matched, the processing is performed regardless of the operations of other computers. It will continue. The majority voting method is one of the quorum methods. In the quorum method, if the same processing is executed on all the multiplexed computers and the operations of the computers that occupy the quorum (quorum) can be matched, the processing is performed regardless of the operation of other computers. It will continue. A method in which the quorum is a majority of the whole is a majority method, and is described in, for example, Patent Document 2.
多数決方式では、スプリットブレインを原理的に回避できる。例えば、3台のコンピュータX,Y,Zで処理を多重化(3重化)している場合で、2台のコンピュータX,YのグループAと、1台のコンピュータZのグループBにネットワーク分割となったものとする。この場合でも、グループAでの処理は動き続ける。これに対し、グループBでの処理は中断する。ここでの中断とは、自身を含めて動作を一致させることができるコンピュータの数が過半数となるまで、処理を先に進めない状態をいう。 In the majority method, split brain can be avoided in principle. For example, when processing is multiplexed (triple) by three computers X, Y, and Z, the network is divided into group A of two computers X and Y and group B of one computer Z Suppose that Even in this case, the processing in the group A continues to move. On the other hand, the process in group B is interrupted. The interruption here means a state in which the processing cannot be advanced until the number of computers that can match the operation including itself becomes a majority.
また、コンピュータZが異常な高負荷でハングアップしたものとすると、残りの過半数を占めるコンピュータグループ(ここではグループA)での処理は、当該コンピュータZに関係なく動作を続ける。コンピュータZが回復したとき、当該コンピュータZでの処理は、過半数を構成できないため勝手に動き出すことはない。つまりコンピュータZは、他の過半数を占めるコンピュータグループの処理に再同期化した後に、動作を再開する。
前述した多数決方式のシステムでは、最低でもコンピュータの数が3台以上必要である。したがって2台のコンピュータで構成される最も単純な多重化システム、つまり2重化されたコンピュータで構成される2重化システムでは、多数決方式は使用できない。 In the majority system described above, at least three computers are required. Therefore, the majority voting method cannot be used in the simplest multiplexing system constituted by two computers, that is, a duplex system constituted by duplicated computers.
一方、特許文献1に記載された2重化システムでは、当該システムを利用する複数のクライアント端末の全てから従系サーバユニットに対し、主系サーバユニットからサービスの提供を受けられない旨の通知があった場合に、当該システム内の2重化されたサーバユニット(サーバコンピュータ)間での主系、従系の切り替えが行われる。この2重化システムでは、2つのサーバユニット間で通信ができなくても、当該2つのサーバユニットが同時に主系となる、一種のスプリットブレインに陥るのを防止できる。
On the other hand, in the duplex system described in
しかし、この2重化システムでは、たとえ全てのクライアント端末が主系サーバユニットからサービスの提供を受けられなくなったとしても、1台でもクライアント端末が故障すると、その故障クライアント端末から従系サーバユニットに対し、主系サーバユニットからサービスの提供を受けられない旨が通知されないことから、主系、従系の切り替えが行われない。この場合、各クライアント端末は、主系、従系いずれからもサービスの提供を受けられなくなる。 However, in this duplex system, even if all the client terminals cannot receive service from the primary server unit, if one client terminal fails, the faulty client terminal changes to the secondary server unit. On the other hand, since there is no notification that the service cannot be provided from the primary server unit, switching between the primary and secondary is not performed. In this case, each client terminal cannot receive service from either the primary system or the secondary system.
本発明は上記事情を考慮してなされたものでその目的は、2重化されたサーバコンピュータ間でスプリットブレインが発生するのを防止しながら、クライアントコンピュータに対してサービスが提供されなくなる事態が発生するのを極力防止できる2重化システム及び多重化制御方法を提供することにある。 The present invention has been made in view of the above circumstances, and its purpose is to prevent a situation where a service is not provided to a client computer while preventing a split brain from occurring between duplicate server computers. It is an object of the present invention to provide a duplex system and a multiplexing control method that can prevent this from occurring as much as possible.
本発明の1つの観点によれば、N台(Nは1以上の整数)のクライアントコンピュータにサービスを提供するための、相互に通信可能な2台のサーバコンピュータから構成され、当該2台のサーバコンピュータのいずれか一方が稼動系として動作し、他方が待機系として動作する2重化システムが提供される。この2重化システムの上記2台のサーバコンピュータの各々は、上記サービスを提供するためのサーバ処理を実行するサーバ処理手段と、上記N台のクライアントコンピュータとの接続状態を管理するためのクライアント接続状態管理手段と、このクライアント接続状態管理手段によって管理されている上記N台のクライアントコンピュータとの接続状態に基づく多数決により、上記サーバ処理手段によるサーバ処理を実行させるか否かを制御する多重化制御手段とを備える。 According to one aspect of the present invention, two server computers configured to provide services to N client computers (N is an integer equal to or greater than 1) can communicate with each other. A duplex system is provided in which either one of the computers operates as an active system and the other operates as a standby system. Each of the two server computers of the duplex system has a client connection for managing a connection state between the server processing means for executing the server processing for providing the service and the N client computers. Multiplexing control for controlling whether or not to execute server processing by the server processing means by a majority decision based on the connection state between the state management means and the N client computers managed by the client connection state management means Means.
上記の構成において、クライアントコンピュータが2重化システムからのサービスの提供を受けるには、当該システム内の2台のサーバコンピュータのうち、その時点においてサービスの提供が可能なサーバコンピュータに接続する必要がある。通常、クライアントコンピュータは2台のサーバコンピュータのうち稼動系のサーバコンピュータに接続する。また、稼動系のサーバコンピュータが故障して、当該稼動系のサーバコンピュータと通信できなくなった場合、つまり稼動系のサーバコンピュータを認識できなくなった場合には、クライアントコンピュータは、接続先を稼動系のサーバコンピュータから待機系のサーバコンピュータに切り替える。したがって、クライアントコンピュータが、2台のサーバコンピュータのいずれか一方に接続したということは、その接続先のサーバコンピュータを当該クライアントコンピュータが認識できたことを意味する。ここで、サーバコンピュータに接続されたクライアントコンピュータの数をnとすると、当該サーバコンピュータとn台のクライアントコンピュータとにより1つのグループが形成されているといえる。そこで、上記2台のサーバコンピュータの各々が、上記N台のクライアントコンピュータとの接続状態を管理するならば、その接続状態から、自身が、クライアントコンピュータを含めたコンピュータの総数に対して多数を占めるグループに属しているか否かが判定可能である。 In the above configuration, in order for the client computer to receive the service from the duplex system, it is necessary to connect to the server computer that can provide the service at that time, out of the two server computers in the system. is there. Usually, the client computer is connected to the active server computer of the two server computers. If the active server computer fails and cannot communicate with the active server computer, that is, if the active server computer cannot be recognized, the client computer connects the connection destination of the active server computer. Switch from the server computer to the standby server computer. Therefore, the fact that the client computer is connected to one of the two server computers means that the client computer can recognize the connection destination server computer. Here, if the number of client computers connected to the server computer is n, it can be said that one group is formed by the server computer and the n client computers. Therefore, if each of the two server computers manages the connection state with the N client computers, the server computer itself occupies a large number with respect to the total number of computers including the client computer. It can be determined whether or not it belongs to a group.
よって上記の構成においては、2重化システムを構成する2台のサーバコンピュータの各々は、上記接続状態から、当該サーバコンピュータを利用するクライアントコンピュータをも含めた一種の多数決により、サーバ処理を実行するか否かを正しく決定できる。これにより、たとえ2台のサーバコンピュータ間で相互に相手を認識できなくなって、互いに相手が故障したと判定しても、つまりネットワーク分割が発生しても、当該2台のサーバコンピュータの各々は、上記の接続状態からサーバ処理を実行するか否かを正しく決定できる。 Therefore, in the above configuration, each of the two server computers constituting the duplex system executes server processing from the connected state by a kind of majority vote including client computers that use the server computer. Whether or not can be determined correctly. As a result, even if it is determined that the other party cannot recognize each other between the two server computers and the other party has failed, that is, even if network partitioning occurs, each of the two server computers Whether or not to execute server processing can be correctly determined from the above connection state.
本発明によれば、2重化システムを構成する2台のサーバコンピュータ(稼動系のサーバコンピュータと待機系のサーバコンピュータ)の間でたとえネットワーク分割が起きても、当該2台のサーバコンピュータの各々は、N台のクライアントコンピュータとの接続状態から、クライアントコンピュータをも含めた多数決により、自身がサーバ処理を実行するかを決定できる。これにより、スプリットブレインの発生を防止できると共に、クライアントコンピュータに対してサービスが提供されなくなる事態が発生するのを極力防止できる。 According to the present invention, even if a network partition occurs between two server computers (active server computer and standby server computer) constituting a duplex system, each of the two server computers Can determine whether to execute server processing by a majority vote including the client computers from the connection state with the N client computers. As a result, it is possible to prevent the occurrence of split brain and to prevent the occurrence of a situation where the service is not provided to the client computer as much as possible.
以下、本発明の実施形態につき図面を参照して説明する。
[第1の実施形態]
図1は本発明の第1の実施形態に係る2重化システムの構成を示すブロック図である。図1の2重化システムは、2台のサーバコンピュータ10-1,10-2から構成される。サーバコンピュータ10-1,10-2はネットワーク20を介して相互に通信が可能なように構成されている。このサーバコンピュータ10-1,10-2(から構成される2重化システム)は、ネットワーク20を介してクライアントコンピュータ30から利用可能である。本実施形態では、サーバコンピュータ10-1,10-2は、データベースサーバが動作するデータベースサーバコンピュータであり、クライアントコンピュータ30は、データベースサーバコンピュータを利用するアプリケーションサーバコンピュータである。このアプリケーションサーバコンピュータ上では、当該アプリケーションサーバコンピュータを利用するクライアント端末に対してサービスを提供するアプリケーションサーバが動作する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a block diagram showing the configuration of a duplex system according to the first embodiment of the present invention. The duplex system shown in FIG. 1 includes two server computers 10-1 and 10-2. The server computers 10-1 and 10-2 are configured to be able to communicate with each other via the
サーバコンピュータ10-1,10-2は、それぞれサーバ処理部11-1,11-2と、ハートビート機構12-1,12-2と、多重化制御部13-1,13-2とを備えている。サーバ処理部11-1,11-2は、サーバ処理(サーバプログラム)を実行するサーバとして機能する。本実施形態において、サーバコンピュータ10-1,10-2はデータベースサーバコンピュータであり、サーバ処理部11-1,11-2はデータベースサーバとして機能する。ハートビート機構12-1,12-2は、互いにハートビートを授受することにより、互いが正常であることを確認する。 The server computers 10-1 and 10-2 include server processing units 11-1 and 11-2, heartbeat mechanisms 12-1 and 12-2, and multiplexing control units 13-1 and 13-2, respectively. ing. The server processing units 11-1 and 11-2 function as servers that execute server processing (server programs). In the present embodiment, the server computers 10-1 and 10-2 are database server computers, and the server processing units 11-1 and 11-2 function as database servers. The heartbeat mechanisms 12-1 and 12-2 confirm that each other is normal by exchanging heartbeats with each other.
多重化制御部13-1,13-2は、対応するサーバコンピュータ10-1,10-2が稼動系となってサーバ処理部11-1,11-2を動作させるか、待機系となってサーバ処理部11-1,11-2の処理を待たせるかを制御する。この制御のために、多重化制御部13-1,13-2は、対応するサーバコンピュータ10-1,10-2とクライアントコンピュータ30との接続状態を管理するクライアント接続状態管理手段としてのクライアント接続フラグ130-1,130-2を保持する。フラグ130-1,130-2は、サーバコンピュータ10-1,10-2にクライアントコンピュータ30が接続しているか否かを表す。ここで、「サーバコンピュータ10-1,10-2にクライアントコンピュータ30が接続している」とは、サーバコンピュータ10-1,10-2とクライアントコンピュータ30との間にセッションが設定されていることを表す。
The multiplexing control units 13-1 and 13-2 operate the server processing units 11-1 and 11-2 with the corresponding server computers 10-1 and 10-2 as the active system or the standby system. Controls whether to wait for the processing of the server processing units 11-1 and 11-2. For this control, the multiplexing controllers 13-1 and 13-2 connect client connections as client connection state management means for managing the connection state between the corresponding server computers 10-1 and 10-2 and the
多重化制御部13-1,13-2は、対応するサーバコンピュータ10-1,10-2のハートビート機構12-1,12-2によって互いが正常であることが認識されている場合は、自身が稼動系であるならばサーバ処理部11-1,11-2による処理の実行を継続させ、待機系であるならばサーバ処理部11-1,11-2の停止状態を継続させる。また多重化制御部13-1,13-2は、ハートビート機構12-1,12-2が相手を認識しない場合、クライアント接続フラグ130-1,130-2がONであるならば、サーバ処理部11-1,11-2による処理を実行させ、OFFであるならば、サーバ処理部11-1,11-2による処理を停止させる。 If the multiplexing controllers 13-1 and 13-2 recognize that the heartbeat mechanisms 12-1 and 12-2 of the corresponding server computers 10-1 and 10-2 are normal, If it is an active system, the server processing units 11-1 and 11-2 continue to execute processing, and if it is a standby system, the server processing units 11-1 and 11-2 continue to be stopped. In addition, the multiplexing control units 13-1 and 13-2 perform server processing if the client connection flags 130-1 and 130-2 are ON when the heartbeat mechanisms 12-1 and 12-2 do not recognize the partner. The processing by the units 11-1 and 11-2 is executed. If the processing is OFF, the processing by the server processing units 11-1 and 11-2 is stopped.
一方、クライアントコンピュータ30は、クライアント処理部31と、サーバ接続部32とを備えている。クライアント処理部31は、クライアント処理(クライアントプログラム)を実行するクライアントとして機能する。サーバ接続部32は、サーバコンピュータ10-1,10-2との接続を管理する。サーバ接続部32は、クライアントコンピュータ30の接続先のサーバコンピュータ10-i(iは1または2)が有するクライアント接続フラグ130-iをONにする。またサーバ接続部32は、クライアントコンピュータ30の接続先をサーバコンピュータ10-j(jは1または2、但しj≠i)からサーバコンピュータ10-iに切り替えたときには、元の接続先のサーバコンピュータ10-jのクライアント接続フラグ130-jをOFFにする。
On the other hand, the
次に、図1のシステムにおける動作について説明する。
<通常時の動作>
まず、サーバコンピュータ10-1,10-2が共に正常である通常時の動作について、図2のシステム状態図を参照して説明する。今、サーバコンピュータ10-1が稼動系として動作し、サーバコンピュータ10-2が待機系として動作しているものとする。サーバコンピュータ10-1,10-2のハートビート機構12-1,12-2は、ネットワーク20を介して相互に「ハートビート」と呼ばれる定期的な通信をし合うことにより、相手のサーバコンピュータの動作状況、即ち相手が正常に稼動しているかを確認する。
Next, the operation in the system of FIG. 1 will be described.
<Normal operation>
First, the normal operation in which both the server computers 10-1 and 10-2 are normal will be described with reference to the system state diagram of FIG. Assume that the server computer 10-1 operates as an active system and the server computer 10-2 operates as a standby system. The heartbeat mechanisms 12-1 and 12-2 of the server computers 10-1 and 10-2 communicate with each other through the
ここでは、ハートビート機構12-1,12-2が、ハートビートの授受により互いに相手のサーバコンピュータを認識することができ、したがって図2に示すように相手のサーバコンピュータが正常に稼動していると確認できているものとする。この場合、サーバコンピュータ10-1は稼動系として動作を継続し、サーバコンピュータ10-2は待機系として動作を継続する。 Here, the heartbeat mechanisms 12-1 and 12-2 can recognize each other's server computer by sending and receiving the heartbeat, and therefore the other server computer is operating normally as shown in FIG. It shall be confirmed that In this case, the server computer 10-1 continues to operate as an active system, and the server computer 10-2 continues to operate as a standby system.
このような状況では、クライアントコンピュータ30のサーバ接続部3は、サーバコンピュータ10-1,10-2のうちの待機系のサーバコンピュータ10-2に対して接続要求を送出したとしても、当該要求は拒絶される。したがってクライアントコンピュータ30はサーバコンピュータ10-2に接続できない。一方、クライアントコンピュータ30のサーバ接続部3から稼動系のサーバコンピュータ10-1に対する接続要求は受け付けられる。したがって、クライアントコンピュータ30は、図2において矢印201に示すように稼動系のサーバコンピュータ10-1に接続される。この状態で、クライアントコンピュータ30のサーバ接続部3は、サーバコンピュータ10-1のクライアント接続フラグ130-1をONにする。
In such a situation, even if the server connection unit 3 of the
サーバコンピュータ10-1の多重化制御部13-1は、クライアント接続フラグ130-1がONの場合、当該サーバコンピュータ10-1のサーバ処理部11-1による処理を実行させる。つまり、サーバコンピュータ10-1,10-2のうち、稼動系のサーバコンピュータ10-1がサーバ処理を実行して、クライアントコンピュータ30に対してサービスを提供する。一方、待機系のサーバコンピュータ10-2では、サーバ処理部11-2は停止状態にある。
When the client connection flag 130-1 is ON, the multiplexing control unit 13-1 of the server computer 10-1 causes the server processing unit 11-1 of the server computer 10-1 to execute processing. That is, of the server computers 10-1 and 10-2, the active server computer 10-1 executes server processing and provides a service to the
<稼動系の停止時の動作>
次に、稼動系のサーバコンピュータ10-1が停止した場合の動作について、図3のシステム状態図を参照して説明する。稼動系のサーバコンピュータ10-1が故障等で停止すると、当該サーバコンピュータ10-1のハートビート機構12-1からのハートビートが一定時間を超えて途絶える。この場合、待機系のサーバコンピュータ10-2のハートビート機構12-1は稼動系のサーバコンピュータ10-1を認識できないため、取り敢えず当該サーバコンピュータ10-1の故障を判定する。この状況では、クライアントコンピュータ30は稼動系のサーバコンピュータ10-1と通信できず、当該サーバコンピュータ10-1からサービスの提供を受けられない。そこでクライアントコンピュータ30のサーバ接続部32は、接続先を、稼動系のサーバコンピュータ10-1から、図3において矢印301で示すように待機系のサーバコンピュータ10-2に切り替えて、当該サーバコンピュータ10-2のクライアント接続フラグ130-2をONにする。このことは、クライアントコンピュータ30が稼動系のサーバコンピュータ10-1の故障を認識したことを表す。
<Operation when the active system stops>
Next, the operation when the active server computer 10-1 is stopped will be described with reference to the system state diagram of FIG. When the active server computer 10-1 stops due to a failure or the like, the heartbeat from the heartbeat mechanism 12-1 of the server computer 10-1 stops after a certain time. In this case, since the heartbeat mechanism 12-1 of the standby server computer 10-2 cannot recognize the active server computer 10-1, the failure of the server computer 10-1 is determined for the time being. In this situation, the
したがって、クライアントコンピュータ30のサーバ接続部32がサーバコンピュータ10-2のクライアント接続フラグ130-2をONしたことは、2台のサーバコンピュータ10-1,10-2と1台のクライアントコンピュータ30との合計3台のコンピュータから構成されるシステムにおいて、サーバコンピュータ10-2とクライアントコンピュータ30の双方が、残りのサーバコンピュータ10-1の故障を認識していることを表す。つまり、図3のシステムの状態は、クライアントコンピュータ30を含めたコンピュータの総数に対して、待機系のサーバコンピュータ10-2とクライアントコンピュータ30との2台で多数を占めるグループを形成していることを表す。
Therefore, the fact that the
そこで待機系のサーバコンピュータ10-2の多重化制御部13-2は、クライアント接続フラグ130-2がONになると、当該サーバコンピュータ10-2が、システム内のコンピュータの総数に対して多数(過半数)を占めているグループに属していると判断する。この場合、サーバコンピュータ10-2の多重化制御部13-2は、当該サーバコンピュータ10-2が待機系であることから、当該サーバコンピュータ10-2のサーバ処理部11-2により、稼動系のサーバコンピュータ10-1のサーバ処理部11-1で行われていた処理を引き継がせる(フェイルオーバさせる)。これにより、サーバコンピュータ10-2は待機系から稼動系に切り替わる。 Therefore, when the client connection flag 130-2 is turned ON, the multiplexing control unit 13-2 of the standby server computer 10-2 has a large number (the majority number) of the server computer 10-2 with respect to the total number of computers in the system. ). In this case, since the server computer 10-2 is a standby system, the multiplexing control unit 13-2 of the server computer 10-2 has an active system by the server processing unit 11-2 of the server computer 10-2. The processing performed in the server processing unit 11-1 of the server computer 10-1 is taken over (failed over). As a result, the server computer 10-2 is switched from the standby system to the active system.
<ネットワーク分割時の動作>
次に、図2の状態にあった稼動系のサーバコンピュータ10-1と待機系のサーバコンピュータ10-2との間でネットワーク分割となったときの動作について、図4のシステム状態図を参照して説明する。
<Operation during network division>
Next, referring to the system state diagram of FIG. 4 for the operation when the network is divided between the active server computer 10-1 and the standby server computer 10-2 in the state of FIG. I will explain.
今、稼動系のサーバコンピュータ10-1と待機系のサーバコンピュータ10-2が例えば正常に動作しているにも拘わらずに、通信障害等の要因により、図4に示すように、サーバコンピュータ10-1のハートビート機構12-1とサーバコンピュータ10-2のハートビート機構12-2との間で互いにハートビートを授受できない状態、つまりネットワーク分割が発生したものとする。この状態では、サーバコンピュータ10-1,10-2のハートビート機構12-1,12-2は、互いに相手を認識できず、互いに相手のサーバコンピュータの故障を判定する。このとき、クライアントコンピュータ30のサーバ接続部32は、稼動系のサーバコンピュータ10-1または待機系のサーバコンピュータ10-2のどちらにも接続することが可能である。
Now, although the active server computer 10-1 and the standby server computer 10-2 are operating normally, for example, as shown in FIG. -1 heartbeat mechanism 12-1 and the heartbeat mechanism 12-2 of the server computer 10-2 cannot exchange heartbeats with each other, that is, network division occurs. In this state, the heartbeat mechanisms 12-1 and 12-2 of the server computers 10-1 and 10-2 cannot recognize each other, and determine each other's failure of the other server computer. At this time, the
ここでは、クライアントコンピュータ30のサーバ接続部32は、図4に示すように稼動系のサーバコンピュータ10-1に接続して、当該サーバコンピュータ10-1のクライアント接続フラグ130-1をONにしたものとする。この動作は、クライアントコンピュータ30が既に稼動系のサーバコンピュータ10-1に接続している場合には行われない。、 サーバコンピュータ10-1の多重化制御部13-1は、相手(サーバコンピュータ10-2)の故障を判定し、且つクライアント接続フラグ130-1がONの場合、当該サーバコンピュータ10-1が、システム内のコンピュータの総数に対して多数(過半数)を占めているグループに属していると判断する。この場合、サーバコンピュータ10-1の多重化制御部13-1は、当該サーバコンピュータ10-1が稼動系であることから、当該サーバコンピュータ10-1のサーバ処理部11-1による処理の実行を継続させる。
Here, the
一方、サーバコンピュータ10-2の多重化制御部13-2は、相手(サーバコンピュータ10-1)の故障を判定しても、この例のようにクライアント接続フラグ130-2がOFFの場合、当該サーバコンピュータ10-2が、システム内のコンピュータの総数に対して多数を占めているグループに属していないと判断する。この場合、サーバコンピュータ10-2の多重化制御部13-2は、当該サーバコンピュータ10-2が待機系であることから、当該サーバコンピュータ10-2のサーバ処理部11-2の停止状態を継続させる。 On the other hand, even if the multiplexing control unit 13-2 of the server computer 10-2 determines that the partner (server computer 10-1) has failed, if the client connection flag 130-2 is OFF as in this example, It is determined that the server computer 10-2 does not belong to a group that occupies a large number with respect to the total number of computers in the system. In this case, the multiplexing control unit 13-2 of the server computer 10-2 continues the stopped state of the server processing unit 11-2 of the server computer 10-2 because the server computer 10-2 is a standby system. Let
このように本実施形態においては、サーバコンピュータ10-1及び10-2の間でネットワーク分割が発生しても、当該サーバコンピュータ10-1及び10-2の各々は、クライアント接続フラグ130-1及び130-2の状態、つまりクライアントコンピュータ30との接続状態から、サーバ処理を実行するか否かを正しく決定できる。これにより、スプリットブレインの発生を防止できる。
As described above, in the present embodiment, even if network division occurs between the server computers 10-1 and 10-2, each of the server computers 10-1 and 10-2 has the client connection flag 130-1 and Whether or not to execute server processing can be correctly determined from the state of 130-2, that is, the connection state with the
<稼動系が高負荷となりハートビート送信が渋滞したときの動作)
次に、サーバコンピュータ10-1のハートビート機構12-1からサーバコンピュータ10-2へのハートビート送信が渋滞したときの動作について、図5のシステム状態図を参照して説明する。
<Operation when heartbeat transmission is congested due to a heavy load on the operating system)
Next, the operation when the heartbeat transmission from the heartbeat mechanism 12-1 of the server computer 10-1 to the server computer 10-2 is congested will be described with reference to the system state diagram of FIG.
今、図2の状態にあった稼動系のサーバコンピュータ10-1が高負荷となって、当該サーバコンピュータ10-1のハートビート機構12-1からサーバコンピュータ10-2へのハートビート送信が渋滞したものとする。待機系のサーバコンピュータ10-2のハートビート機構12-2は、図5に示すように稼動系のサーバコンピュータ10-1を認識できない。この状態では、クライアントコンピュータ30がサーバコンピュータ10-1に接続していたとしても、当該サーバコンピュータ10-1からクライアントコンピュータ30に対するサービスの提供も渋滞する。
Now, the active server computer 10-1 in the state of FIG. 2 becomes heavily loaded, and the heartbeat transmission from the heartbeat mechanism 12-1 of the server computer 10-1 to the server computer 10-2 is congested. Shall be. The heartbeat mechanism 12-2 of the standby server computer 10-2 cannot recognize the active server computer 10-1, as shown in FIG. In this state, even if the
そこで、クライアントコンピュータ30のサーバ接続部32は、接続先を、稼動系のサーバコンピュータ10-1から、図5において矢印501で示すように待機系のサーバコンピュータ10-2に切り替えて、当該サーバコンピュータ10-2のクライアント接続フラグ130-2をONにする。このときサーバ接続部32は、稼動系のサーバコンピュータ10-1のクライアント接続フラグ130-1をOFFにする。
Therefore, the
待機系のサーバコンピュータ10-2の多重化制御部13-2は、クライアント接続フラグ130-2がONになると、当該サーバコンピュータ10-2が、システム内のコンピュータの総数に対して多数を占めているグループに属していると判断する。この場合、サーバコンピュータ10-2の多重化制御部13-2は、当該サーバコンピュータ10-2が待機系であることから、当該サーバコンピュータ10-2のサーバ処理部11-2により、稼動系のサーバコンピュータ10-1のサーバ処理部11-1で行われていた処理を引き継がせる。これにより、サーバコンピュータ10-2は待機系から稼動系に切り替わる。 In the multiplexing control unit 13-2 of the standby server computer 10-2, when the client connection flag 130-2 is turned ON, the server computer 10-2 occupies a large number with respect to the total number of computers in the system. It belongs to a certain group. In this case, since the server computer 10-2 is a standby system, the multiplexing control unit 13-2 of the server computer 10-2 has an active system by the server processing unit 11-2 of the server computer 10-2. The processing performed in the server processing unit 11-1 of the server computer 10-1 is taken over. As a result, the server computer 10-2 is switched from the standby system to the active system.
一方、稼動系のサーバコンピュータ10-1の多重化制御部13-1は、クライアント接続フラグ130-1がOFFになると、当該サーバコンピュータ10-1が、システム内のコンピュータの総数に対して多数を占めているグループに属していないと判断する。この場合、サーバコンピュータ10-1の多重化制御部13-1は、当該サーバコンピュータ10-1が稼動系であることから、当該サーバコンピュータ10-1のサーバ処理部11-12の動作を停止させる。これにより、サーバコンピュータ10-1は稼動系から待機系に切り替わる。 On the other hand, when the client connection flag 130-1 is turned off, the multiplexing control unit 13-1 of the active server computer 10-1 determines that the server computer 10-1 has a larger number than the total number of computers in the system. Judge that it does not belong to the group it occupies. In this case, the multiplexing control unit 13-1 of the server computer 10-1 stops the operation of the server processing unit 11-12 of the server computer 10-1 because the server computer 10-1 is an active system. . As a result, the server computer 10-1 is switched from the active system to the standby system.
上記第1の実施形態では、クライアントコンピュータ30のサーバ接続部32は、サーバコンピュータに接続する場合だけ接続先のサーバコンピュータのクライアント接続フラグをONしている。また、サーバ接続部32は、接続先を切り替えたときは、元の接続先のサーバコンピュータのクライアント接続フラグをOFFにしている。しかし、サーバ接続部32が、接続先のサーバコンピュータのクライアント接続フラグをONにする更新操作(ON操作)を定期的に行うようにしても良い。この場合、サーバコンピュータの多重化制御部にクライアント接続フラグをOFFにするOFF操作手段を持たせ、当該OFF操作手段がクライアント接続フラグを定期的に監視して、一定時間ON操作が行われなかった場合に当該フラグをOFFすると良い。ここで、一定時間ON操作が行われなかったことを検出可能とするには、例えばON操作毎に時刻情報が更新されるタイムスタンプをクライアント接続フラグに付加して、当該タイムスタンプを現在時刻と比較すれば良い。
In the first embodiment, the
[第2の実施形態]
図6は本発明の第2の実施形態に係る2重化システムの構成を示すブロック図である。図6において、図1中の構成要素と同様の要素には、便宜的に同一符号を付してある。
[Second Embodiment]
FIG. 6 is a block diagram showing a configuration of a duplex system according to the second embodiment of the present invention. In FIG. 6, the same components as those in FIG. 1 are denoted by the same reference numerals for the sake of convenience.
図6の2重化システムは、図1の2重化システムと同様に、ネットワーク20を介して相互に通信可能な2台のサーバコンピュータ10-1,10-2から構成される。図6の2重化システムが、図1の2重化システムと異なる点は、当該2重化システム(を構成するサーバコンピュータ10-1,10-2)がN台(Nは2以上の整数)のクライアントコンピュータ30-1〜30-Nによって利用される点である。図6の2重化システムの特徴は、サーバコンピュータ10-i(i=1,2)に接続されるクライアントコンピュータの数がクライアントコンピュータの総数の過半数を占めている(つまりN/2を超えている)場合には、当該サーバコンピュータ10-iでサーバ処理を実行し、過半数に満たない(つまりN/2以下の)場合には、当該サーバコンピュータ10-iでサーバ処理を実行しない点にある。
The duplex system shown in FIG. 6 includes two server computers 10-1 and 10-2 that can communicate with each other via the
そこで、サーバコンピュータ10-1,10-2の多重化制御部13-1,13-2は、図1中のクライアント接続フラグ130-1,130-2に代えて、クライアント接続カウンタ131-1,131-2を有する。クライアント接続カウンタ131-1,131-2は、サーバコンピュータ10-1,10-2とクライアントコンピュータとの接続状態を管理するためのクライアント接続状態管理手段であり、サーバコンピュータ10-1,10-2に接続されているクライアントコンピュータの数(接続数)C1,C2を保持する。 Therefore, the multiplexing controllers 13-1 and 13-2 of the server computers 10-1 and 10-2 replace the client connection flags 130-1 and 130-2 in FIG. 131-2. The client connection counters 131-1 and 131-2 are client connection state management means for managing the connection state between the server computers 10-1 and 10-2 and the client computer, and the server computers 10-1 and 10-2. The number (number of connections) C1 and C2 of client computers connected to is held.
各クライアントコンピュータ30-1〜30-Nは、図1中のクライアント処理部31及びサーバ接続部32に相当する、クライアント処理部31-1〜31-N及びサーバ接続部32-1〜32-Nを有する。クライアントコンピュータ30-k(k=1〜N)のサーバ接続部32-kは、クライアント処理部31-kがサーバコンピュータ10-iからサービスの提供を受けようとする場合、当該サーバコンピュータ10-iに接続要求を送出することにより、当該サーバコンピュータ10-iに接続する。このときサーバ接続部32-kは、サーバコンピュータ10-iのクライアント接続カウンタ131-iの値を1インクリメントする。またサーバ接続部32-kは、クライアントコンピュータ30-kの接続先をサーバコンピュータ10-j(jは1または2、但しj≠i)からサーバコンピュータ10-iに切り替えたときには、元の接続先のサーバコンピュータ10-jのクライアント接続カウンタ131-iの値を1デクリメントする。これにより、サーバコンピュータ10-1,10-2のクライアント接続カウンタ131-1,131-2は、それぞれ当該サーバコンピュータ10-1,10-2に接続されているクライアントコンピュータの数C1,C2を保持する
サーバコンピュータ10-1,10-2の多重化制御部13-1,13-2は、当該サーバコンピュータ10-1,10-2のハートビート機構12-1,12-2によって互いが正常であることが認識されている場合は、自身が稼動系であるならばサーバ処理部11-1,11-2による処理の実行を継続させ、待機系であるならばサーバ処理部11-1,11-2の停止状態を継続させる。また多重化制御部13-1,13-2は、ハートビート機構12-1,12-2が相手を認識しない場合、クライアント接続カウンタ131-1,131-2の値、即ちサーバコンピュータ10-1,10-2に接続されているクライアントコンピュータの数(接続数)C1,C2がN/2を超えているか否かを判定する。多重化制御部13-1,13-2は、接続数C1,C2がN/2を超えているならば、サーバ処理部11-1,11-2による処理を実行させ、N/2以下であるならば、サーバ処理部11-1,11-2による処理を停止させる。これにより、2重化されたサーバコンピュータ10-1及び10-2の間でネットワーク分割が発生しても、またN台のクライアントコンピュータ30-1〜30-Nの一部が故障しても、サーバコンピュータ10-1及び10-2の間でスプリットブレインが発生するのを防止しながら、クライアントコンピュータに対してサービスが提供されなくなる事態が発生するのを極力防止できる。
The client computers 30-1 to 30-N correspond to the
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。 Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Further, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.
10-1,10-2…サーバコンピュータ、11-1,11-2…サーバ処理部、12-1,12-2…ハートビート機構、13-1,13-2…多重化制御部、20…ネットワーク、30,30-1〜30-N…クライアントコンピュータ、31,31-1〜31-N…クライアント処理部、32,32-1〜32-N…サーバ接続部、130-1,130-2…クライアント接続フラグ(クライアント接続状態管理手段)、131-1,131-2…クライアント接続カウンタ(クライアント接続状態管理手段)。 10-1, 10-2 ... server computer, 11-1, 11-2 ... server processing unit, 12-1, 12-2 ... heartbeat mechanism, 13-1, 13-2 ... multiplexing control unit, 20 ... Network, 30, 30-1 to 30-N ... Client computer, 31, 31-1 to 31-N ... Client processing unit, 32, 32-1 to 32-N ... Server connection unit, 130-1, 130-2 ... client connection flag (client connection state management means), 131-1 and 131-2 ... client connection counter (client connection state management means).
Claims (7)
前記2台のサーバコンピュータの各々は、
前記サービスを提供するためのサーバ処理を実行するサーバ処理手段と、
前記N台のクライアントコンピュータとの接続状態を管理するためのクライアント接続状態管理手段と、
前記クライアント接続状態管理手段によって管理されている前記N台のクライアントコンピュータとの接続状態に基づく多数決により、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する多重化制御手段と
を具備することを特徴とする2重化システム。 Consists of two server computers that can communicate with each other to provide services to N (N is an integer of 1 or more) client computers, and either one of the two server computers operates as an active system In a duplex system in which the other operates as a standby system,
Each of the two server computers is
Server processing means for executing server processing for providing the service;
Client connection state management means for managing connection states with the N client computers;
And multiplexing control means for controlling whether or not to execute server processing by the server processing means based on a majority decision based on connection states with the N client computers managed by the client connection state management means. A duplex system characterized by this.
前記多重化制御手段は前記ハートビート機構が相手を認識できなかった場合に、前記クライアント接続状態管理手段によって管理されている前記N台のクライアントコンピュータとの接続状態に基づく多数決により、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する
ことを特徴とする請求項1記載の2重化システム。 Each of the two server computers has a heartbeat mechanism for recognizing each other by communicating with each other,
When the heartbeat mechanism cannot recognize the other party, the multiplexing control means uses the server processing means by a majority decision based on connection states with the N client computers managed by the client connection state management means. 2. The duplex system according to claim 1, wherein whether or not to execute server processing according to claim 1 is controlled.
前記多重化制御手段は、前記クライアント接続状態管理手段によって管理されている前記接続数がN/2を超えるか否かにより、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する
ことを特徴とする請求項1記載の2重化システム。 The client connection state management means manages the connection state with the N client computers by the number of connections indicating the number of client computers connected to the corresponding server computer among the N client computers. And
The multiplexing control means controls whether or not to execute server processing by the server processing means depending on whether or not the number of connections managed by the client connection state management means exceeds N / 2. The duplex system according to claim 1, characterized in that:
前記クライアント接続状態管理手段は、前記クライアントコンピュータとの接続状態を、当該クライアントコンピュータが対応する前記サーバコンピュータに接続されているか否かを示すフラグ情報であって、前記クライアントコンピュータが前記対応するサーバコンピュータに接続されている期間、前記クライアントコンピュータが前記対応するサーバコンピュータに接続されていことを示す第1の状態に、前記クライアントコンピュータによって定期的に更新されるフラグ情報により管理すると共に、当該フラグ情報が一定期間前記第1の状態に更新されなかった場合、当該フラグ情報を前記クライアントコンピュータが前記対応するサーバコンピュータに接続されていないことを示す第2の状態に設定し、
前記多重化制御手段は、前記クライアント接続状態管理手段によって管理されている前記フラグ情報が前記第1の状態または前記第2の状態のいずれであるかにより、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する
ことを特徴とする請求項1記載の2重化システム。 N is 1;
The client connection state management means is flag information indicating whether or not a connection state with the client computer is connected to the server computer corresponding to the client computer, and the client computer corresponds to the server computer corresponding to the client computer. During the period when the client computer is connected to the first state indicating that the client computer is connected to the corresponding server computer, the flag information is periodically updated by the client computer, and the flag information is If not updated to the first state for a certain period of time, the flag information is set to a second state indicating that the client computer is not connected to the corresponding server computer;
The multiplexing control unit causes the server processing unit to execute server processing depending on whether the flag information managed by the client connection state management unit is the first state or the second state. The duplex system according to claim 1, wherein control is performed.
前記2台のサーバコンピュータの各々は、前記N台のクライアントコンピュータとの接続状態を管理し、
前記2台のサーバコンピュータの各々は、前記N台のクライアントコンピュータとの前記接続状態に基づく多数決により、自身がサーバ処理を実行するか否かを決定する
ことを特徴とする多重化制御方法。 Consists of two server computers that can communicate with each other to provide services to N (N is an integer of 1 or more) client computers, and either one of the two server computers operates as an active system In a duplex system in which the other operates as a standby system, a multiplexing control method for controlling server processing that is duplicated between the two server computers,
Each of the two server computers manages a connection state with the N client computers,
Each of the two server computers determines whether or not it executes server processing by a majority decision based on the connection state with the N client computers.
前記2台のサーバコンピュータの各々は、相手を認識できなかった場合には、前記N台のクライアントコンピュータとの前記接続状態に基づく多数決により、自身がサーバ処理を実行するか否かを決定する
ことを特徴とする請求項6記載の多重化制御方法。 Each of the two server computers recognize each other by communicating with each other,
If each of the two server computers fails to recognize the other party, it determines whether or not to execute server processing by a majority decision based on the connection state with the N client computers. The multiplexing control method according to claim 6.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004071495A JP3910967B2 (en) | 2004-03-12 | 2004-03-12 | Duplex system and multiplexing control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004071495A JP3910967B2 (en) | 2004-03-12 | 2004-03-12 | Duplex system and multiplexing control method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005258947A true JP2005258947A (en) | 2005-09-22 |
JP3910967B2 JP3910967B2 (en) | 2007-04-25 |
Family
ID=35084575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004071495A Expired - Fee Related JP3910967B2 (en) | 2004-03-12 | 2004-03-12 | Duplex system and multiplexing control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3910967B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008192139A (en) * | 2007-01-31 | 2008-08-21 | Hewlett-Packard Development Co Lp | Control for node cluster |
JP2008287632A (en) * | 2007-05-21 | 2008-11-27 | Panasonic Corp | Control device recovery system |
JP2009223519A (en) * | 2008-03-14 | 2009-10-01 | Toshiba Corp | Cluster system and method for selecting master node in system |
JP2010026714A (en) * | 2008-07-17 | 2010-02-04 | Toshiba Corp | Computer and program, configuring cluster system |
US8977840B2 (en) | 2011-02-10 | 2015-03-10 | Nec Corporation | Failover to a standby system calculator in the loss of communication between currently-used system calculator and standby system calculator |
WO2018037535A1 (en) | 2016-08-25 | 2018-03-01 | 富士通株式会社 | Alive management program, alive management method, and alive management device |
US9977720B2 (en) | 2015-03-11 | 2018-05-22 | Fujitsu Limited | Method, information processing apparatus, and computer readable medium |
-
2004
- 2004-03-12 JP JP2004071495A patent/JP3910967B2/en not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008192139A (en) * | 2007-01-31 | 2008-08-21 | Hewlett-Packard Development Co Lp | Control for node cluster |
JP4505763B2 (en) * | 2007-01-31 | 2010-07-21 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | Managing node clusters |
JP2008287632A (en) * | 2007-05-21 | 2008-11-27 | Panasonic Corp | Control device recovery system |
JP2009223519A (en) * | 2008-03-14 | 2009-10-01 | Toshiba Corp | Cluster system and method for selecting master node in system |
JP2010026714A (en) * | 2008-07-17 | 2010-02-04 | Toshiba Corp | Computer and program, configuring cluster system |
JP4599435B2 (en) * | 2008-07-17 | 2010-12-15 | 株式会社東芝 | Computer and program constituting cluster system |
US8977840B2 (en) | 2011-02-10 | 2015-03-10 | Nec Corporation | Failover to a standby system calculator in the loss of communication between currently-used system calculator and standby system calculator |
US9977720B2 (en) | 2015-03-11 | 2018-05-22 | Fujitsu Limited | Method, information processing apparatus, and computer readable medium |
WO2018037535A1 (en) | 2016-08-25 | 2018-03-01 | 富士通株式会社 | Alive management program, alive management method, and alive management device |
Also Published As
Publication number | Publication date |
---|---|
JP3910967B2 (en) | 2007-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3768775B2 (en) | Backup apparatus and backup method | |
US7966514B2 (en) | Scalable fault tolerant system | |
CN108900415B (en) | Master-slave equipment switching method and system under MLAG interface failure | |
US20040049573A1 (en) | System and method for managing clusters containing multiple nodes | |
US20130212205A1 (en) | True geo-redundant hot-standby server architecture | |
CN113014634A (en) | Cluster election processing method, device, equipment and storage medium | |
US20050055418A1 (en) | Method to manage high availability equipments | |
US20080301489A1 (en) | Multi-agent hot-standby system and failover method for the same | |
JPH05108392A (en) | Data processing system | |
US20070177589A1 (en) | Network system and node redundancy method of network system | |
JP4491482B2 (en) | Failure recovery method, computer, cluster system, management computer, and failure recovery program | |
CN112583708B (en) | Connection relation control method and device and electronic equipment | |
CN110971662A (en) | Two-node high-availability implementation method and device based on Ceph | |
JP3910967B2 (en) | Duplex system and multiplexing control method | |
WO2006020390A2 (en) | Computing system redundancy and fault tolerance | |
CN113254205A (en) | Load balancing system, method and device, electronic equipment and storage medium | |
EP2456163B1 (en) | Registering an internet protocol phone in a dual-link architecture | |
US11544162B2 (en) | Computer cluster using expiring recovery rules | |
KR100832543B1 (en) | High availability cluster system having hierarchical multiple backup structure and method performing high availability using the same | |
CN115242701B (en) | Airport data platform cluster consumption processing method, device and storage medium | |
JP3884417B2 (en) | Cluster system and server program | |
JP2606107B2 (en) | Processor redundancy | |
EP4084492A1 (en) | A method, system and olt for dual-parenting pon protection | |
CN115037674B (en) | Single-machine and multi-equipment redundancy backup method for central control system | |
JPH08249196A (en) | Redundancy execution system for task |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060606 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070125 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |