JP2011159222A - Server system and control method thereof - Google Patents

Server system and control method thereof Download PDF

Info

Publication number
JP2011159222A
JP2011159222A JP2010022305A JP2010022305A JP2011159222A JP 2011159222 A JP2011159222 A JP 2011159222A JP 2010022305 A JP2010022305 A JP 2010022305A JP 2010022305 A JP2010022305 A JP 2010022305A JP 2011159222 A JP2011159222 A JP 2011159222A
Authority
JP
Japan
Prior art keywords
server
standby
active
failure
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010022305A
Other languages
Japanese (ja)
Inventor
Satoshi Watanabe
聡 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010022305A priority Critical patent/JP2011159222A/en
Publication of JP2011159222A publication Critical patent/JP2011159222A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a server system and a control method thereof for continuing a service without increasing the number of servers even if a continuing failure occurs. <P>SOLUTION: The server system includes: a plurality of redundant constitutions 10 and 20, each provided with one active server and one backup server; and a management server 3 for managing the redundant constitutions 10 and 20. When at least one of the active servers fails, the management server 3 switches a backup server corresponding to the fault active server to an active server, and assigns one of the backup servers constituting the redundant constitutions as a backup server for the new active server. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明はサーバシステム及びサーバシステムの制御方法に関し、特に運用系サーバと待機系サーバとを有する冗長構成を備えるサーバシステム及びサーバシステムの制御方法に関する。   The present invention relates to a server system and a server system control method, and more particularly to a server system having a redundant configuration having an active server and a standby server and a server system control method.

サーバシステムでは、サーバに障害が発生してもサービスを継続して提供する必要があるため、一般的に運用系サーバと待機系サーバからなる冗長構成が用いられている。冗長構成を有するサーバシステムでは、運用系サーバに障害が発生した場合、直ちに待機系サーバに切り替えることで継続してサービスを提供することができる。   In a server system, since it is necessary to provide services continuously even if a failure occurs in a server, a redundant configuration including an active server and a standby server is generally used. In a server system having a redundant configuration, when a failure occurs in the active server, the service can be continuously provided by immediately switching to the standby server.

特許文献1乃至3には、このような運用系サーバと待機系サーバを含む冗長構成を備えたサーバシステムが開示されている。特許文献1に開示されているサーバシステムを図7に示す。図7に示すサーバシステム110は、サーバ121とサーバ122を含む冗長構成であり、サーバ121とサーバ122は、ネットワーク170で接続されている。サーバ121を運用系、サーバ122を待機系として動作している場合、サーバ121に障害が発生すると、HDD(磁気記憶装置)141のファイルは、サーバ121のファイルレプリケーション制御部161とサーバ122のファイルレプリケーション制御部162によって、サーバ122のHDD142に転送される。   Patent Documents 1 to 3 disclose a server system having a redundant configuration including such an active server and a standby server. A server system disclosed in Patent Document 1 is shown in FIG. A server system 110 illustrated in FIG. 7 has a redundant configuration including a server 121 and a server 122, and the server 121 and the server 122 are connected via a network 170. When the server 121 is operating and the server 122 is a standby system, when a failure occurs in the server 121, the file in the HDD (magnetic storage device) 141 is stored in the file replication control unit 161 of the server 121 and the file of the server 122 The data is transferred to the HDD 142 of the server 122 by the replication control unit 162.

また、特許文献2に開示されているサーバシステムを図8に示す。図8に示すサーバシステムは、運用系サーバ210と、待機系サーバ211を有する。運用系サーバ210は、プロセス220と、共有メモリ230と、CPU監視機能部240と、レプリケーション機能部250と、管理テーブル260を備える。プロセス220は、データ処理を行うためのプログラムであり、CPUにより実行される処理の単位である。共有メモリ230は、データの書き込み及び読み出しを行う。CPU監視機能部240は、CPU使用率を監視する。レプリケーション機能部250は、レプリケーション(メモリ同期化)を行う。管理テーブル260は、レプリケーション未完了のデータの管理情報を格納する。待機系サーバ211も運用系サーバ210と同様の構成である。そして、障害などの理由により、運用系サーバ210のサービスが停止した場合には、運用系サーバ210と待機系サーバ211が切り替わり、待機系サーバ211が運用系としてサービスを開始する。   A server system disclosed in Patent Document 2 is shown in FIG. The server system shown in FIG. 8 includes an active server 210 and a standby server 211. The active server 210 includes a process 220, a shared memory 230, a CPU monitoring function unit 240, a replication function unit 250, and a management table 260. The process 220 is a program for performing data processing, and is a unit of processing executed by the CPU. The shared memory 230 writes and reads data. The CPU monitoring function unit 240 monitors the CPU usage rate. The replication function unit 250 performs replication (memory synchronization). The management table 260 stores management information of data that has not been replicated. The standby server 211 has the same configuration as that of the active server 210. When the service of the active server 210 is stopped due to a failure or the like, the active server 210 and the standby server 211 are switched, and the standby server 211 starts the service as the active system.

また、特許文献3に開示されている冗長コンピュータシステムを図9に示す。特許文献3にかかる複数の動作モードを有する複数のコンピュータで構成されたシステムでは、現用コンピュータ301〜304と、この現用コンピュータ301〜304に割り当てられた1次予備コンピュータ311〜314と、現用および1次予備コンピュータ共用の2次予備コンピュータ321、322を伝送路330上に接続している。そして、集中コンピュータ管理装置340は、例えば現用コンピュータ301の異常が検出された場合には、1次予備コンピュータ311を現用コンピュータに切り替え、現用コンピュータ301から全保持情報を1次予備コンピュータ311に転送させ、2次予備コンピュータ321を新たな1次予備コンピュータとして割り当てる。   FIG. 9 shows a redundant computer system disclosed in Patent Document 3. In a system composed of a plurality of computers having a plurality of operation modes according to Patent Document 3, the active computers 301 to 304, the primary spare computers 311 to 314 assigned to the active computers 301 to 304, the active and 1 Secondary spare computers 321 and 322 shared by the next spare computer are connected on the transmission line 330. Then, the centralized computer management device 340 switches the primary spare computer 311 to the active computer, for example, when an abnormality of the active computer 301 is detected, and transfers all retained information from the active computer 301 to the primary spare computer 311. The secondary spare computer 321 is assigned as a new primary spare computer.

特開2007−328595号公報JP 2007-328595 A 特開2007−286952号公報JP 2007-286952 A 特開平8−185330号公報JP-A-8-185330

上記特許文献1および特許文献2にかかる冗長構成のサーバシステムでは、運用系サーバと待機系サーバの2台のサーバを一組としてシステムを構成している。このようなシステム構成では、運用系サーバに障害が発生した場合に待機系サーバを運用系サーバに切り替えると、障害が発生したサーバを切り離して、新たに運用系サーバに切り替わったサーバ単独でサービスを継続する。そのため障害が発生したサーバが復旧する前に再び障害が起こった場合、システムがダウンしてしまうという問題があった。   In the redundant server system according to Patent Document 1 and Patent Document 2, the system is configured by combining two servers, an active server and a standby server. In such a system configuration, when a failure occurs in the active server, if the standby server is switched to the active server, the server in which the failure occurred is disconnected, and the server that is newly switched to the active server can provide services. continue. Therefore, if a failure occurs again before the failed server is recovered, there is a problem that the system goes down.

また、特許文献3にかかる冗長コンピュータシステムでは、現用コンピュータと1次予備コンピュータの2台のコンピュータを一組としたシステムに、新たに現用および1次予備コンピュータ共用の2次予備コンピュータを設ける必要があり、使用するコンピュータの台数が増加するという問題があった。   Further, in the redundant computer system according to Patent Document 3, it is necessary to newly provide a secondary spare computer that is shared by both the current and primary spare computers in a system in which two computers, the current computer and the primary spare computer, are combined. There was a problem that the number of computers used increased.

よって本発明の目的は、運用系サーバと待機系サーバとを備える冗長構成を有するサーバシステムにおいて、連続した障害が発生した場合でもサーバの台数を増やすことなくサービスを継続することができるサーバシステム及びサーバシステムの制御方法を提供することである。   Accordingly, an object of the present invention is to provide a server system capable of continuing service without increasing the number of servers in a server system having a redundant configuration including an active server and a standby server, even when consecutive failures occur, and It is to provide a method for controlling a server system.

本発明にかかるサーバシステムは、運用系サーバと待機系サーバとをそれぞれ1つずつ備える複数の冗長構成と、前記冗長構成を管理する管理サーバと、を備え、前記管理サーバは、前記運用系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した運用系サーバに対する待機系サーバを運用系サーバに切り替えると共に、当該切り替わった後の運用系サーバに対する待機系サーバとして前記冗長構成を構成する前記待機系サーバのうちのいずれかを割り当てる。   The server system according to the present invention includes a plurality of redundant configurations each including one active server and one standby server, and a management server that manages the redundant configuration, and the management server includes the active server. When a failure occurs in at least one of the servers, the standby server for the failed active server is switched to the active server, and the redundant configuration is used as a standby server for the active server after the switching. Any one of the standby servers to be configured is assigned.

本発明にかかる、運用系サーバと待機系サーバとをそれぞれ1つずつ備える複数の冗長構成と、前記冗長構成を管理する管理サーバと、を備えるサーバシステムの制御方法は、前記運用系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した運用系サーバに対する待機系サーバを運用系サーバに切り替えると共に、当該切り替わった後の運用系サーバに対する待機系サーバとして前記冗長構成を構成する前記待機系サーバのうちのいずれかを割り当てる。   According to the present invention, there is provided a server system control method comprising a plurality of redundant configurations each including one active server and one standby server, and a management server that manages the redundant configuration. When one failure occurs, the standby server for the failed active server is switched to the active server, and the redundant configuration is configured as a standby server for the active server after the switching. Any one of the standby servers is assigned.

本発明により、運用系サーバと待機系サーバとを備える冗長構成を有するサーバシステムにおいて、連続した障害が発生した場合でもサーバの台数を増やすことなくサービスを継続することができるサーバシステム及びサーバシステムの制御方法を提供することが可能となる。   According to the present invention, in a server system having a redundant configuration including an active server and a standby server, a server system and a server system capable of continuing service without increasing the number of servers even when consecutive failures occur. A control method can be provided.

実施の形態1にかかるサーバシステムを示すブロック図である。(a)は通常時のサーバシステムの構成を示すブロック図であり、(b)は運用系サーバに障害が発生したときのサーバシステムの構成を示すブロック図である。1 is a block diagram showing a server system according to a first exemplary embodiment; (A) is a block diagram showing a configuration of a normal server system, and (b) is a block diagram showing a configuration of a server system when a failure occurs in an active server. 実施の形態1にかかるサーバシステムがシステムを再構成する場合の動作シーケンスを示す図である(運用系サーバに障害が発生した場合)。It is a figure which shows the operation | movement sequence when the server system concerning Embodiment 1 reconfigure | reconfigures a system (when a failure generate | occur | produces in an active system server). 実施の形態1にかかるサーバシステムがシステムを再構成する場合の動作シーケンスを示す図である(運用系サーバの障害が復旧した場合)。It is a figure which shows the operation | movement sequence in case the server system concerning Embodiment 1 reconfigure | reconfigures a system (when the failure of an active server is recovered). 実施の形態2にかかるサーバシステムを示すブロック図である。(a)は通常時のサーバシステムの構成を示すブロック図であり、(b)は待機系サーバに障害が発生したときのサーバシステムの構成を示すブロック図である。It is a block diagram which shows the server system concerning Embodiment 2. FIG. (A) is a block diagram showing a configuration of a normal server system, and (b) is a block diagram showing a configuration of a server system when a failure occurs in a standby server. 実施の形態2にかかるサーバシステムがシステムを再構成する場合の動作シーケンスを示す図である(待機系サーバに障害が発生した場合)。It is a figure which shows the operation | movement sequence when the server system concerning Embodiment 2 reconfigure | reconfigures a system (when a failure generate | occur | produces in a standby system server). 実施の形態2にかかるサーバシステムがシステムを再構成する場合の動作シーケンスを示す図である(待機系サーバの障害が復旧した場合)。It is a figure which shows the operation | movement sequence in case the server system concerning Embodiment 2 reconfigure | reconfigures a system (when the failure of a standby system server is recovered). 特許文献1にかかるサーバシステムを説明するためのブロック図である。It is a block diagram for demonstrating the server system concerning patent document 1. FIG. 特許文献2にかかるサーバシステムを説明するためのブロック図である。It is a block diagram for demonstrating the server system concerning patent document 2. FIG. 特許文献3にかかるサーバシステムを説明するためのブロック図である。It is a block diagram for demonstrating the server system concerning patent document 3. FIG.

実施の形態1
以下、図面を参照して本発明の実施の形態1について説明する。図1は本実施の形態にかかるサーバシステムを示すブロック図である。図1(a)は通常時におけるサーバシステムの構成を示し、図1(b)は運用系サーバに障害が発生したときのサーバシステムの構成を示している。図1(a)において、冗長構成10は運用系サーバ1Aと待機系サーバ1Bを有する。また、冗長構成20は運用系サーバ2Aと待機系サーバ2Bを有する。本実施の形態にかかる通常時のサーバシステムは、運用系サーバと待機系サーバとをそれぞれ1つずつ備える冗長構成を複数有する構成となっている。また、これらの複数の冗長構成の運用は管理サーバ3で管理されている。
Embodiment 1
Embodiment 1 of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a server system according to the present embodiment. FIG. 1A shows the configuration of the server system during normal operation, and FIG. 1B shows the configuration of the server system when a failure occurs in the active server. In FIG. 1A, the redundant configuration 10 includes an active server 1A and a standby server 1B. The redundant configuration 20 includes an active server 2A and a standby server 2B. The normal server system according to the present embodiment has a plurality of redundant configurations each including one active server and one standby server. Also, the operation of these redundant configurations is managed by the management server 3.

管理サーバ3は各サーバの運用状態(運用中、待機中、障害発生)を管理する機能を有する。そして、運用系サーバに障害が発生し、この運用系サーバに対する待機系サーバが運用系サーバに切り替わった際に、切り替わった後の運用系サーバに対応した待機系サーバが存在しない状態が発生すると、運用系サーバと待機系サーバの冗長構成の組を、1:1の構成から、n:1の構成に再構成する。   The management server 3 has a function of managing the operating state (operating, standby, failure) of each server. Then, when a failure occurs in the active server, and the standby server for this active server is switched to the active server, if there is no standby server corresponding to the switched active server, The redundant configuration pair of the active server and the standby server is reconfigured from a 1: 1 configuration to an n: 1 configuration.

例えば、図1(b)に示すように、運用系サーバ1Aに障害が発生すると、管理サーバ3は運用系サーバ1Aに対応した待機系サーバとして動作している待機系サーバ1Bを運用系サーバに切り替える。このとき、管理サーバ3は新たに運用系サーバに切り替わった運用系サーバ1Bに対応した待機系サーバとして、待機系サーバ2Bを割り当てる。ここで、待機系サーバ2Bは運用系サーバ2Aの待機系サーバとしても機能している。   For example, as shown in FIG. 1B, when a failure occurs in the active server 1A, the management server 3 turns the standby server 1B operating as the standby server corresponding to the active server 1A into the active server. Switch. At this time, the management server 3 assigns the standby server 2B as a standby server corresponding to the active server 1B newly switched to the active server. Here, the standby server 2B also functions as a standby server of the active server 2A.

また、逆に障害発生サーバの障害が復旧したと管理サーバ3が判断した場合には、管理サーバは2台1組の構成(通常状態)へ戻すように冗長構成を再構成する。つまり、管理サーバ3は通常時は1:1の冗長構成でサーバシステムを構成し、1台以上のサーバに障害が発生した時はn:1の冗長構成でサーバシステムを構成することができる。   Conversely, when the management server 3 determines that the failure of the failed server has been recovered, the management server reconfigures the redundant configuration so as to return to the configuration (normal state) of two units. That is, the management server 3 can normally configure a server system with a 1: 1 redundant configuration, and can configure a server system with an n: 1 redundant configuration when a failure occurs in one or more servers.

尚、図1(a)、(b)では、2つの冗長構成10、20を有するサーバシステムを例として説明したが、本実施の形態にかかるサーバシステムは、3つ以上の冗長構成を有するサーバシステムについても同様に適用することができる。つまり、本実施の形態にかかるサーバシステムでは、管理サーバ3は、サーバに障害が発生した場合は、運用系サーバと待機系サーバの比をn:1とすることができる。以下で本実施の形態にかかるサーバシステムの動作について具体的に説明する。   1A and 1B, the server system having two redundant configurations 10 and 20 has been described as an example. However, the server system according to the present embodiment is a server having three or more redundant configurations. The same applies to the system. That is, in the server system according to the present embodiment, the management server 3 can set the ratio of the active server and the standby server to n: 1 when a failure occurs in the server. The operation of the server system according to this embodiment will be specifically described below.

図2は、本実施の形態にかかるサーバシステムにおいて運用系サーバ1Aに障害が発生した際に管理サーバ3がサーバシステムを再構成する動作を説明するための図である。図2においても、通常状態では、サーバ1Aは運用系サーバ、サーバ1Bは待機系サーバとして動作し、これらは冗長構成10を構成している。また、サーバ2Aは運用系サーバ、サーバ2Bは待機系サーバとして動作し、これらは冗長構成20を構成している。管理サーバは、各サーバ1A、1B、2A、2Bの運用状態を監視している。また、運用系サーバ1Aと待機系サーバ1Bは互いにレプリケーション処理を実施している。また、運用系サーバ2Aと待機系サーバ2Bも互いにレプリケーション処理を実施している。   FIG. 2 is a diagram for explaining an operation in which the management server 3 reconfigures the server system when a failure occurs in the active server 1A in the server system according to the present embodiment. Also in FIG. 2, in a normal state, the server 1 </ b> A operates as an active server and the server 1 </ b> B operates as a standby server, and these constitute a redundant configuration 10. Further, the server 2A operates as an active server, and the server 2B operates as a standby server, and these constitute a redundant configuration 20. The management server monitors the operational status of each server 1A, 1B, 2A, 2B. In addition, the active server 1A and the standby server 1B perform replication processing with each other. The active server 2A and the standby server 2B also perform replication processing with each other.

管理サーバ3は、例えば運用系サーバ1Aに障害が発生したと判断すると(図2のステップS1)、待機系サーバ1Bに対して運用系へ遷移するように状態変更要求を通知する(ステップS2)。この時、管理サーバ3は、サーバ1Bが運用系に遷移した際に待機系サーバとなる待機系サーバ2Bの情報をサーバ1Bに対して通知する。   For example, when the management server 3 determines that a failure has occurred in the active server 1A (step S1 in FIG. 2), the management server 3 notifies the standby server 1B of a state change request so as to transition to the active system (step S2). . At this time, the management server 3 notifies the server 1B of information on the standby server 2B that becomes the standby server when the server 1B transitions to the active system.

また、運用系に遷移するように指示を受けた待機系サーバ1Bは、管理サーバ3に対して待機系サーバから運用系サーバへ遷移が完了したことを通知する(ステップS3)。そして、サーバ2Bを待機系サーバとして、サーバ1Bは運用系サーバとしてのサービスを開始する。サーバ1Bから状態遷移の完了通知を受けた管理サーバ3はシステムの運用状態を更新し(ステップS4)、再構成後のシステム構成で運用を開始する。   Further, the standby server 1B that has received an instruction to transition to the active system notifies the management server 3 that the transition from the standby server to the active server has been completed (step S3). Then, the server 2B is a standby server, and the server 1B starts a service as an active server. The management server 3 that has received the notification of completion of the state transition from the server 1B updates the operation state of the system (step S4), and starts operation with the system configuration after reconfiguration.

また、運用系に遷移したサーバ1Bは、管理サーバ3から通知された待機系サーバ2Bに対して、サーバ1Bとレプリケーション処理を行うように運用系追加要求を通知する(ステップS5)。尚、上記ステップS2乃至S5の動作の順序は整合性の取れる範囲であれば前後しても構わない。待機系サーバ2Bは、運用系サーバ1Bから受けた運用系追加要求により運用系サーバ1Bに対してもレプリケーション処理を行う。このとき、待機系サーバ2Bは、引き続き運用系サーバ2Aに対してもレプリケーション処理を行う。このように、管理サーバ3は通常時は1:1の冗長構成でサーバシステムを構成し、サーバ1Aに障害が発生した時は2:1の冗長構成でサーバシステムを構成することができる。   In addition, the server 1B transitioned to the active system notifies the standby system server 2B notified from the management server 3 of an active system addition request so as to perform replication processing with the server 1B (step S5). Note that the order of the operations in steps S2 to S5 may be changed as long as consistency can be obtained. The standby server 2B also performs replication processing for the active server 1B in response to the active addition request received from the active server 1B. At this time, the standby server 2B continues to perform replication processing for the active server 2A. As described above, the management server 3 can normally configure a server system with a 1: 1 redundant configuration, and can configure a server system with a 2: 1 redundant configuration when a failure occurs in the server 1A.

次に、サーバに障害が発生した状態から通常の状態へ復旧するまでのサーバシステムの動作について図3を用いて説明する。図3の初期状態では、サーバ1Aに障害が発生している状態であるため、サーバ1Aは切り離されている。また、サーバ1B、サーバ2Aは運用系サーバとして、またサーバ2Bは待機系サーバとして動作し、これらは冗長構成30を構成している。また、運用系サーバ1Bと待機系サーバ2Bは互いにレプリケーション処理を実施している。また、運用系サーバ2Aと待機系サーバ2Bも互いにレプリケーション処理を実施している。   Next, the operation of the server system until the server is restored from the failure state to the normal state will be described with reference to FIG. In the initial state of FIG. 3, the server 1A is disconnected because a failure has occurred in the server 1A. Further, the server 1B and the server 2A operate as an active server, and the server 2B operates as a standby server, and these constitute a redundant configuration 30. In addition, the active server 1B and the standby server 2B perform replication processing with each other. The active server 2A and the standby server 2B also perform replication processing with each other.

管理サーバ3は、各サーバ1A、1B、2A、2Bの運用状態を監視している。管理サーバ3は、例えば障害サーバ1Aの障害が復旧したと判断した場合(図3のステップS11)、サーバ1Aに対して待機系へ遷移するように状態変更要求を通知する(ステップ12)。この時、管理サーバ3は、サーバ1Aが待機系に遷移した際に対となる運用系サーバ1Bの情報をサーバ1Aに対して通知する。   The management server 3 monitors the operational status of each server 1A, 1B, 2A, 2B. For example, when the management server 3 determines that the failure of the failed server 1A has been recovered (step S11 in FIG. 3), the management server 3 notifies the server 1A of a state change request so as to transition to the standby system (step 12). At this time, the management server 3 notifies the server 1A of information of the operational server 1B that becomes a pair when the server 1A transitions to the standby system.

また、管理サーバ3は運用系サーバ1Bに対して待機系サーバをサーバ2Bからサーバ1Aに変更するように待機系変更要求を通知する(ステップS13)。待機系サーバを変更するように指示を受けた運用系サーバ1Bは、新しい待機系サーバ1Aに対してレプリケーション処理を行う(ステップS14)。また、運用系サーバ1Bは待機系サーバ1Aとのレプリケーション処理完了後、待機系サーバ2Bに対し運用系削除要求を通知する(ステップS15)。   Further, the management server 3 notifies the active server 1B of a standby system change request so as to change the standby server from the server 2B to the server 1A (step S13). The active server 1B that has received the instruction to change the standby server performs replication processing for the new standby server 1A (step S14). Further, after completing the replication process with the standby server 1A, the active server 1B notifies the standby server 2B of an operation deletion request (step S15).

次に、運用系サーバ1Bは、管理サーバ3に対してサーバ2Bからサーバ1Aへ待機系サーバの変更が完了したことを通知する(ステップS16)。また、待機系サーバ1Aは運用系サーバ1Bとのレプリケーション処理が終了した後、管理サーバ3に対して待機系への状態変更が完了したことを通知する(ステップS17)。そして、サーバ1Aは待機系サーバへ遷移し、運用系サーバ1Bの待機系サーバとしての動作を開始する。   Next, the active server 1B notifies the management server 3 that the change of the standby server has been completed from the server 2B to the server 1A (step S16). Further, after the replication processing with the active server 1B is completed, the standby server 1A notifies the management server 3 that the status change to the standby system is completed (step S17). Then, the server 1A transitions to the standby server and starts the operation of the active server 1B as the standby server.

運用系サーバ1Bから、運用系削除要求を受信した待機系サーバ2Bは、運用系サーバ1Bとのレプリケーション処理を終了する。尚、上記ステップS12乃至S17の動作の順序は整合性の取れる範囲であれば前後しても構わない。   The standby server 2B that has received the active deletion request from the active server 1B ends the replication process with the active server 1B. Note that the order of the operations in steps S12 to S17 may be changed as long as consistency is obtained.

管理サーバ3は、運用系サーバ1Bから待機系変更完了通知(ステップS16)を、また待機系サーバ1Aから状態変更完了通知(ステップS17)を受けた後、システムの運用状態(サーバ情報)を更新し(ステップS18)、再構成後のシステム構成で運用を開始する。このとき、運用系サーバ1Bと待機系サーバ1Aは互いにレプリケーション処理を実施している。また、運用系サーバ2Aと待機系サーバ2Bも互いにレプリケーション処理を実施している。本実施の形態にかかるサーバシステムでは、以上で説明した図2および図3の処理をサーバの運用状態に応じて繰り返しながらアプリケーションサービスを提供する。   After receiving the standby system change completion notification (step S16) from the active server 1B and the status change completion notification (step S17) from the standby server 1A, the management server 3 updates the system operating status (server information). (Step S18), and operation is started with the system configuration after reconfiguration. At this time, the active server 1B and the standby server 1A perform replication processing with each other. The active server 2A and the standby server 2B also perform replication processing with each other. In the server system according to the present embodiment, an application service is provided while the processes in FIGS. 2 and 3 described above are repeated according to the operation state of the server.

以上で説明したように、本実施の形態にかかる発明では1:1の冗長構成で動作しているサーバシステムにおいて、運用系サーバに障害が発生したことにより待機系サーバを運用系サーバに切り替えた場合でも、障害が発生していない他のサーバで冗長構成を再構築し、切り替えた後の運用系サーバに対応した待機系サーバを割り当てることができる。よって、本発明により、連続した障害が発生した場合でもサーバの台数を増やすことなくサービスを継続することができるサーバシステム及びサーバシステムの制御方法を提供することが可能となる。   As described above, in the invention according to this embodiment, in the server system operating in the 1: 1 redundant configuration, the standby server is switched to the active server due to a failure in the active server. Even in this case, it is possible to reconstruct the redundant configuration on another server in which no failure has occurred and to assign a standby server corresponding to the active server after switching. Therefore, according to the present invention, it is possible to provide a server system and a server system control method capable of continuing service without increasing the number of servers even when consecutive failures occur.

以上で説明した本実施の形態にかかるサーバシステムでは、通常状態の場合は運用系サーバが2台、待機系サーバが2台であり、サーバ1台に障害が発生した場合は運用系サーバが2台、待機系サーバが1台となる。しかし、本実施の形態にかかるサーバシステムはこのような組み合わせに限定されることはなく、例えば運用系サーバ3台、待機系サーバ3台でサーバシステムを構成してもよい。この場合、1台のサーバで障害が発生した場合には運用系サーバ3台、待機系サーバ2台として再構成することができる。また、2台のサーバで障害が発生した場合には運用系サーバ3台、待機系サーバ1台として再構成することもできる。   In the server system according to the present embodiment described above, there are two active servers and two standby servers in the normal state, and two active servers when a failure occurs in one server. And one standby server. However, the server system according to the present embodiment is not limited to such a combination. For example, the server system may be configured by three active servers and three standby servers. In this case, when a failure occurs in one server, it can be reconfigured as three active servers and two standby servers. When a failure occurs in two servers, it can be reconfigured as three active servers and one standby server.

また、例えば運用系サーバ4台、待機系サーバ4台でサーバシステムを構成してもよい。この場合、サーバ1台に障害が発生した場合では運用系サーバ4台、待機系サーバ3台として再構成することができる。また、2台のサーバで障害が発生した場合には、運用系サーバ4台、待機系サーバ2台として再構成することもできる。更に、3台のサーバで障害が発生した場合には、運用系サーバ4台、待機系サーバ1台として再構成することもできる。このように、障害が発生したサーバがN/2台未満(Nはサーバの総数)の場合に、運用系サーバに対し常に1台の待機系サーバが存在することを考慮し管理サーバが適宜設定することができる。   Further, for example, the server system may be configured by four active servers and four standby servers. In this case, when a failure occurs in one server, it can be reconfigured as four active servers and three standby servers. Further, when a failure occurs in two servers, it can be reconfigured as four active servers and two standby servers. Furthermore, when a failure occurs in three servers, it can be reconfigured as four active servers and one standby server. As described above, when the number of failed servers is less than N / 2 (N is the total number of servers), the management server is set appropriately considering that there is always one standby server for the active server. can do.

実施の形態2
以下、図面を参照して本発明の実施の形態2について説明する。実施の形態1では、サーバシステムを構成する運用系サーバに障害が発生した場合について説明したが、本実施の形態では待機系サーバに障害が発生した場合について説明する。図4は本実施の形態にかかるサーバシステムを示すブロック図である。図4(a)は通常時におけるサーバシステムの構成を示しており、図1(a)と同様の構成である。また、図4(b)は待機系サーバに障害が発生したときのサーバシステムの構成を示している。
Embodiment 2
The second embodiment of the present invention will be described below with reference to the drawings. In the first embodiment, the case where a failure occurs in the active server constituting the server system has been described, but in this embodiment, the case where a failure occurs in the standby server will be described. FIG. 4 is a block diagram showing a server system according to the present embodiment. FIG. 4A shows the configuration of the server system in a normal state, which is the same configuration as FIG. FIG. 4B shows the configuration of the server system when a failure occurs in the standby server.

管理サーバ3は各サーバの運用状態(運用中、待機中、障害発生)を管理する機能を有する。そして、待機系サーバの少なくとも1つに障害が発生した場合には、障害が発生した待機系サーバに対する運用系サーバの待機系サーバとして、他の待機系サーバのうちのいずれかを割り当て、運用系サーバと待機系サーバの冗長構成の組を、1:1の構成から、n:1の構成に再構成する。   The management server 3 has a function of managing the operating state (operating, standby, failure) of each server. If a failure occurs in at least one of the standby servers, one of the other standby servers is assigned as the standby server of the active server to the failed standby server, and the active server The redundant configuration set of the server and the standby server is reconfigured from a 1: 1 configuration to an n: 1 configuration.

例えば、図4(b)に示すように、待機系サーバ1Bに障害が発生すると、管理サーバ3は待機系サーバ1Bに対応した運用系サーバ1Aの待機系サーバとして、待機系サーバ2Bを割り当てる。ここで、待機系サーバ2Bは運用系サーバ2Aの待機系サーバとしても機能している。   For example, as shown in FIG. 4B, when a failure occurs in the standby server 1B, the management server 3 assigns the standby server 2B as the standby server of the active server 1A corresponding to the standby server 1B. Here, the standby server 2B also functions as a standby server of the active server 2A.

また、逆に障害発生サーバの障害が復旧したと管理サーバ3が判断した場合には、管理サーバは2台1組の構成(通常状態)へ戻すように冗長構成を再構成する。つまり、管理サーバ3は通常時は1:1の冗長構成でサーバシステムを構成し、1台以上のサーバに障害が発生した時はn:1の冗長構成でサーバシステムを構成することができる。   Conversely, when the management server 3 determines that the failure of the failed server has been recovered, the management server reconfigures the redundant configuration so as to return to the configuration (normal state) of two units. That is, the management server 3 can normally configure a server system with a 1: 1 redundant configuration, and can configure a server system with an n: 1 redundant configuration when a failure occurs in one or more servers.

尚、図4(a)、(b)では、2つの冗長構成10、20を有するサーバシステムを例として説明したが、本実施の形態にかかるサーバシステムは、3つ以上の冗長構成を有するサーバシステムについても同様に適用することができる。つまり、本実施の形態にかかるサーバシステムでは、管理サーバ3は、サーバに障害が発生した場合は、運用系サーバと待機系サーバの比をn:1とすることができる。以下で本実施の形態にかかるサーバシステムの動作について具体的に説明する。   4A and 4B, the server system having two redundant configurations 10 and 20 has been described as an example. However, the server system according to the present embodiment is a server having three or more redundant configurations. The same applies to the system. That is, in the server system according to the present embodiment, the management server 3 can set the ratio of the active server and the standby server to n: 1 when a failure occurs in the server. The operation of the server system according to this embodiment will be specifically described below.

図5は、本実施の形態にかかるサーバシステムにおいて待機系サーバ1Bに障害が発生した際に管理サーバ3がサーバシステムを再構成する動作を説明するための図である。図5においても、通常状態では、サーバ1Aは運用系サーバ、サーバ1Bは待機系サーバとして動作し、これらは冗長構成10を構成している。また、サーバ2Aは運用系サーバ、サーバ2Bは待機系サーバとして動作し、これらは冗長構成20を構成している。管理サーバ3は、各サーバ1A、1B、2A、2Bの運用状態を監視している。また、運用系サーバ1Aと待機系サーバ1Bは互いにレプリケーション処理を実施している。また、運用系サーバ2Aと待機系サーバ2Bも互いにレプリケーション処理を実施している。   FIG. 5 is a diagram for explaining an operation in which the management server 3 reconfigures the server system when a failure occurs in the standby server 1B in the server system according to the present embodiment. Also in FIG. 5, in a normal state, the server 1 </ b> A operates as an active server and the server 1 </ b> B operates as a standby server, and these constitute a redundant configuration 10. Further, the server 2A operates as an active server, and the server 2B operates as a standby server, and these constitute a redundant configuration 20. The management server 3 monitors the operational status of each server 1A, 1B, 2A, 2B. In addition, the active server 1A and the standby server 1B perform replication processing with each other. The active server 2A and the standby server 2B also perform replication processing with each other.

管理サーバ3は、例えば待機系サーバ1Bに障害が発生したと判断すると(図5のステップS21)、運用系サーバ1Aに対して、待機系サーバを待機系サーバ1Bから待機系サーバ2Bに変更するように待機系変更要求を通知する(ステップS22)。そして、運用系サーバ1Aは、待機系サーバ2Bに対して、運用系サーバ1Aとレプリケーション処理を行うように運用系追加要求を通知する(ステップS23)。   For example, when the management server 3 determines that a failure has occurred in the standby server 1B (step S21 in FIG. 5), the management server 3 changes the standby server from the standby server 1B to the standby server 2B with respect to the active server 1A. Thus, a standby system change request is notified (step S22). Then, the active server 1A notifies the standby server 2B of an active system addition request to perform replication processing with the active server 1A (step S23).

その後、運用系サーバ1Aは管理サーバ3に対して待機系変更完了を通知する(ステップS24)。そして、待機系サーバ2Bを運用系サーバ1Aの待機系サーバとしてサービスを開始する。運用系サーバ1Aから待機系変更完了通知を受けた管理サーバ3はシステムの運用状態を更新し(ステップS25)、再構成後のシステム構成で運用を開始する。   Thereafter, the active server 1A notifies the management server 3 of the completion of the standby system change (step S24). Then, the service is started with the standby server 2B as the standby server of the active server 1A. The management server 3 that has received the standby system change completion notification from the active server 1A updates the operating state of the system (step S25), and starts operation with the system configuration after reconfiguration.

待機系サーバ2Bは、運用系サーバ1Aから受けた運用系追加要求(ステップS23)により運用系サーバ1Aに対してもレプリケーション処理を行う。このとき、待機系サーバ2Bは、引き続き運用系サーバ2Bに対してもレプリケーション処理を行う。このように、管理サーバ3は通常時は1:1の冗長構成でサーバシステムを構成し、サーバ1Bに障害が発生した時は2:1の冗長構成でサーバシステムを構成することができる。   The standby server 2B also performs replication processing for the active server 1A in response to an active addition request (Step S23) received from the active server 1A. At this time, the standby server 2B continues to perform replication processing for the active server 2B. As described above, the management server 3 can normally configure a server system with a 1: 1 redundant configuration, and can configure a server system with a 2: 1 redundant configuration when a failure occurs in the server 1B.

次に、待機系サーバ1Bに障害が発生した状態から通常の状態へ復旧するまでのサーバシステムの動作について図6を用いて説明する。図6の初期状態では、サーバ1Bに障害が発生している状態であるため、サーバ1Bは切り離されている。また、サーバ1A、サーバ2Aは運用系サーバとして、またサーバ2Bは待機系サーバとして動作し、これらは冗長構成30を構成している。また、運用系サーバ1Aと待機系サーバ2Bは互いにレプリケーション処理を実施している。また、運用系サーバ2Aと待機系サーバ2Bも互いにレプリケーション処理を実施している。   Next, the operation of the server system until the standby server 1B recovers from the failure state to the normal state will be described with reference to FIG. In the initial state of FIG. 6, the server 1B is disconnected because a failure has occurred in the server 1B. Further, the server 1A and the server 2A operate as an active server, and the server 2B operates as a standby server, and these constitute a redundant configuration 30. Also, the active server 1A and the standby server 2B perform replication processing with each other. The active server 2A and the standby server 2B also perform replication processing with each other.

管理サーバ3は、各サーバ1A、1B、2A、2Bの運用状態を監視している。管理サーバ3は、例えば障害サーバ1Bの障害が復旧したと判断した場合(図6のステップS31)、運用系サーバ1Aに対して、待機系サーバを待機系サーバ2Bから待機系サーバ1Bに変更するように待機系変更要求を通知する(ステップS32)。そして、運用系サーバ1Aは、待機系サーバ1Bに対して、運用系サーバ1Aとレプリケーション処理を行うように運用系追加要求を通知する(ステップS33)。   The management server 3 monitors the operational status of each server 1A, 1B, 2A, 2B. For example, when the management server 3 determines that the failure of the failure server 1B has been recovered (step S31 in FIG. 6), the management server 3 changes the standby server from the standby server 2B to the standby server 1B for the active server 1A. Thus, a standby system change request is notified (step S32). Then, the active server 1A notifies the standby server 1B of an active system addition request to perform replication processing with the active server 1A (step S33).

運用系サーバ1Aは、新しい待機系サーバ1Bに対してレプリケーション処理を行う。また、運用系サーバ1Aは待機系サーバ1Bとのレプリケーション処理完了後、待機系サーバ2Bに対して運用系削除要求を通知する(ステップS34)。   The active server 1A performs replication processing for the new standby server 1B. In addition, after completing the replication process with the standby server 1B, the active server 1A notifies the standby server 2B of an active deletion request (step S34).

その後、運用系サーバ1Aは管理サーバ3に対して待機系変更完了を通知する(ステップS35)。そして、待機系サーバ1Bを運用系サーバ1Aの待機系サーバとしてサービスを開始する。運用系サーバ1Aから待機系変更完了通知を受けた管理サーバ3はシステムの運用状態を更新し(ステップS36)、再構成後のシステム構成で運用を開始する。   Thereafter, the active server 1A notifies the management server 3 of the completion of the standby system change (step S35). Then, the service is started with the standby server 1B as the standby server of the active server 1A. The management server 3 that has received the standby system change completion notification from the active server 1A updates the operating state of the system (step S36), and starts operation with the system configuration after reconfiguration.

このとき、運用系サーバ1Aから、運用系削除要求を受信した待機系サーバ2Bは、サーバ1Aとのレプリケーション処理を終了する。また、運用系サーバ1Aと待機系サーバ1Bは互いにレプリケーション処理を実施している。また、運用系サーバ2Aと待機系サーバ2Bも互いにレプリケーション処理を実施している。本実施の形態にかかるサーバシステムでは、以上で説明した図5および図6の処理をサーバの運用状態に応じて繰り返しながらアプリケーションサービスを提供する。   At this time, the standby server 2B that has received the active deletion request from the active server 1A ends the replication process with the server 1A. In addition, the active server 1A and the standby server 1B perform replication processing with each other. The active server 2A and the standby server 2B also perform replication processing with each other. In the server system according to the present embodiment, the application service is provided while repeating the processes of FIGS. 5 and 6 described above according to the operation state of the server.

以上で説明したように、本実施の形態にかかる発明では1:1の冗長構成で動作しているサーバシステムにおいて、待機系サーバに障害が発生したとしても、障害が発生していない他のサーバで冗長構成を再構築することができる。よって、本発明により、連続した障害が発生した場合でもサーバの台数を増やすことなくサービスを継続することができるサーバシステム及びサーバシステムの制御方法を提供することが可能となる。   As described above, in the invention according to the present embodiment, in the server system operating in the 1: 1 redundant configuration, even if a failure occurs in the standby server, other servers in which no failure has occurred Redundant configuration can be reconstructed with Therefore, according to the present invention, it is possible to provide a server system and a server system control method capable of continuing service without increasing the number of servers even when consecutive failures occur.

なお、本発明にかかるサーバシステム及びサーバシステムの制御方法では、実施の形態1および実施の形態2で説明した処理、つまり図2、図3、図5、図6に示した処理をサーバの運用状態に応じて繰り返しながらアプリケーションサービスを提供することができる。   Note that in the server system and the server system control method according to the present invention, the processing described in the first and second embodiments, that is, the processing shown in FIGS. Application services can be provided while repeating according to the state.

以上、本発明を上記実施の形態に即して説明したが、上記実施の形態の構成にのみ限定されるものではなく、本願特許請求の範囲の請求項の発明の範囲内で当業者であればなし得る各種変形、修正、組み合わせを含むことは勿論である。   Although the present invention has been described with reference to the above-described embodiment, the present invention is not limited to the configuration of the above-described embodiment, and those skilled in the art within the scope of the invention of the claims of the present application claims. Of course, various modifications, corrections, and combinations that can be made are included.

上記の実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。   A part or all of the above embodiments can be described as in the following supplementary notes, but is not limited thereto.

(付記1)運用系サーバと待機系サーバとをそれぞれ1つずつ備える複数の冗長構成と、
前記冗長構成を管理する管理サーバと、を備え、
前記管理サーバは、前記運用系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した運用系サーバに対する待機系サーバを運用系サーバに切り替えると共に、当該切り替わった後の運用系サーバに対する待機系サーバとして前記冗長構成を構成する前記待機系サーバのうちのいずれかを割り当てる、
サーバシステム。
(Appendix 1) A plurality of redundant configurations each including one active server and one standby server;
A management server for managing the redundant configuration,
When a failure occurs in at least one of the active servers, the management server switches the standby server for the active server in which the failure has occurred to an active server, and the active server after the switch Assigning any of the standby servers constituting the redundant configuration as a standby server for
Server system.

(付記2)前記管理サーバは、前記待機系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した待機系サーバに対する運用系サーバの待機系サーバとして前記障害が発生した待機系サーバ以外の待機系サーバを割り当てる、付記1に記載のサーバシステム。   (Supplementary note 2) When a failure occurs in at least one of the standby servers, the management server is a standby system in which the failure occurs as a standby server of an active server for the standby server in which the failure has occurred. The server system according to appendix 1, wherein a standby server other than a server is assigned.

(付記3)前記管理サーバは、前記障害が発生した運用系サーバが復旧した場合は、当該復旧した運用系サーバを前記切り替わった後の運用系サーバの待機系サーバとして用いる、付記1または付記2に記載のサーバシステム。   (Supplementary note 3) When the active server in which the failure has occurred is recovered, the management server uses the restored active server as a standby server of the active server after the switching. The server system described in 1.

(付記4)前記管理サーバは、前記障害が発生した待機系サーバが復旧した場合は、当該復旧した待機系サーバを待機系サーバとして用いる、付記2または付記3に記載のサーバシステム。   (Supplementary note 4) The server system according to supplementary note 2 or supplementary note 3, wherein the management server uses the restored standby server as a standby server when the failed standby server is restored.

(付記5)前記管理サーバは、前記運用系サーバの状態を監視し、当該運用系サーバに障害が発生した場合には、当該障害が発生した運用系サーバに対する待機系サーバに対して待機系から運用系へ状態を変更するための状態変更要求を通知し、
前記状態変更要求が通知された待機系サーバは、運用系サーバに切り替わると共に前記冗長構成を構成する前記待機系サーバのうちのいずれかに対して運用系追加要求を通知する、付記1乃至4のいずれか一項に記載のサーバシステム。
(Supplementary Note 5) The management server monitors the status of the active server, and when a failure occurs in the active server, the management server starts from the standby server with respect to the standby server for the failed active server. Notify the status change request to change the status to the active system,
The standby server to which the state change request is notified switches to the active server and notifies the active server addition request to any one of the standby servers configuring the redundant configuration. The server system according to any one of the above.

(付記6)前記管理サーバは、前記待機系サーバの状態を監視し、当該待機系サーバに障害が発生した場合には、当該障害が発生した待機系サーバに対する運用系サーバに対して待機系変更要求を通知し、
前記待機系変更要求が通知された運用系サーバは、前記障害が発生した待機系サーバ以外の待機系サーバに対して運用系追加要求を通知する、付記2乃至5のいずれか一項に記載のサーバシステム。
(Appendix 6) The management server monitors the status of the standby server, and if a failure occurs in the standby server, the standby server changes to the active server for the standby server in which the failure has occurred Notify the request,
The active server to which the standby system change request is notified notifies the standby system server other than the standby server in which the failure has occurred, with an active system addition request, according to any one of appendices 2 to 5. Server system.

(付記7)前記管理サーバは、前記障害が発生した運用系サーバの状態を監視し、当該障害が発生した運用系サーバが復旧した場合には、当該復旧した運用系サーバに対して待機系サーバとして動作するように状態変更要求を通知すると共に、
前記障害が発生した運用系サーバの代りに運用系サーバとして動作していたサーバに対して、待機系を前記復旧した運用系サーバとするように待機系変更要求を通知する、付記1乃至6のいずれか一項に記載のサーバシステム。
(Supplementary note 7) The management server monitors the status of the active server in which the failure has occurred, and when the active server in which the failure has occurred is recovered, the management server is a standby server for the recovered active server Notify the status change request to work as
Additional notes 1 to 6, wherein a standby system change request is notified to a server operating as an active server instead of the failed active server so that the standby system becomes the restored active server. The server system according to any one of the above.

(付記8)前記管理サーバは、前記障害が発生した待機系サーバの状態を監視し、当該障害が発生した待機系サーバが復旧した場合には、前記障害が発生した待機系サーバに対応する運用系サーバとして動作していた運用系サーバに対して、待機系サーバを前記復旧した待機系サーバに変更するように待機系変更要求を通知する、付記2乃至7のいずれか一項に記載のサーバシステム。   (Appendix 8) The management server monitors the status of the standby server in which the failure has occurred, and when the standby server in which the failure has occurred is recovered, the management server corresponds to the standby server in which the failure has occurred. The server according to any one of appendices 2 to 7, wherein a standby system change request is notified to an active server that has been operating as a secondary server so that the standby server is changed to the restored standby server. system.

(付記9)運用系サーバと待機系サーバとをそれぞれ1つずつ備える複数の冗長構成と、
前記冗長構成を管理する管理サーバと、を備えるサーバシステムの制御方法であって、
前記運用系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した運用系サーバに対する待機系サーバを運用系サーバに切り替えると共に、当該切り替わった後の運用系サーバに対する待機系サーバとして前記冗長構成を構成する前記待機系サーバのうちのいずれかを割り当てる、
サーバシステムの制御方法。
(Supplementary note 9) A plurality of redundant configurations each including one active server and one standby server,
A control method of a server system comprising a management server for managing the redundant configuration,
When a failure occurs in at least one of the active servers, the standby server for the failed active server is switched to the active server, and as a standby server for the active server after the switch Assigning any one of the standby servers constituting the redundant configuration;
Server system control method.

(付記10)前記待機系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した待機系サーバに対する運用系サーバの待機系サーバとして前記障害が発生した待機系サーバ以外の待機系サーバを割り当てる、付記9に記載のサーバシステムの制御方法。   (Supplementary Note 10) When a failure occurs in at least one of the standby servers, a standby system other than the failed standby server as the standby server of the active server with respect to the failed standby server The server system control method according to appendix 9, wherein a server is allocated.

(付記11)前記障害が発生した運用系サーバが復旧した場合は、当該復旧した運用系サーバを待機系サーバとして用いる、付記9または10に記載のサーバシステムの制御方法。   (Supplementary note 11) The server system control method according to supplementary note 9 or 10, wherein when the failed active server is recovered, the recovered active server is used as a standby server.

(付記12)前記障害が発生した待機系サーバが復旧した場合は、当該復旧した待機系サーバを前記切り替わった後の運用系サーバの待機系サーバとして用いる、付記10または付記11に記載のサーバシステムの制御方法。   (Supplementary note 12) The server system according to Supplementary note 10 or Supplementary note 11, wherein when the standby server in which the failure has occurred is restored, the restored standby server is used as a standby server of the active server after the switching. Control method.

1A、1B、2A、2B サーバ
3 管理サーバ
10、20、30 冗長構成
1A, 1B, 2A, 2B server 3 Management server 10, 20, 30 Redundant configuration

Claims (10)

運用系サーバと待機系サーバとをそれぞれ1つずつ備える複数の冗長構成と、
前記冗長構成を管理する管理サーバと、を備え、
前記管理サーバは、前記運用系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した運用系サーバに対する待機系サーバを運用系サーバに切り替えると共に、当該切り替わった後の運用系サーバに対する待機系サーバとして前記冗長構成を構成する前記待機系サーバのうちのいずれかを割り当てる、
サーバシステム。
A plurality of redundant configurations each including one active server and one standby server;
A management server for managing the redundant configuration,
When a failure occurs in at least one of the active servers, the management server switches the standby server for the active server in which the failure has occurred to an active server, and the active server after the switch Assigning any of the standby servers constituting the redundant configuration as a standby server for
Server system.
前記管理サーバは、前記待機系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した待機系サーバに対する運用系サーバの待機系サーバとして前記障害が発生した待機系サーバ以外の待機系サーバを割り当てる、請求項1に記載のサーバシステム。   When a failure occurs in at least one of the standby servers, the management server is a standby server other than the standby server in which the failure has occurred as a standby server of an active server for the standby server in which the failure has occurred. The server system according to claim 1, wherein a system server is assigned. 前記管理サーバは、前記障害が発生した運用系サーバが復旧した場合は、当該復旧した運用系サーバを前記切り替わった後の運用系サーバの待機系サーバとして用いる、請求項1または2に記載のサーバシステム。   The server according to claim 1 or 2, wherein, when the failed active server is recovered, the management server uses the recovered active server as a standby server of the active server after the switch. system. 前記管理サーバは、前記障害が発生した待機系サーバが復旧した場合は、当該復旧した待機系サーバを待機系サーバとして用いる、請求項2または3に記載のサーバシステム。   The server system according to claim 2 or 3, wherein, when the standby server in which the failure has occurred is recovered, the management server uses the recovered standby server as a standby server. 前記管理サーバは、前記運用系サーバの状態を監視し、当該運用系サーバに障害が発生した場合には、当該障害が発生した運用系サーバに対する待機系サーバに対して待機系から運用系へ状態を変更するための状態変更要求を通知し、
前記状態変更要求が通知された待機系サーバは、運用系サーバに切り替わると共に前記冗長構成を構成する前記待機系サーバのうちのいずれかに対して運用系追加要求を通知する、請求項1乃至4のいずれか一項に記載のサーバシステム。
The management server monitors the status of the active server, and if a failure occurs in the active server, the status of the standby server for the active server in which the failure has occurred is changed from the standby system to the active system. A status change request to change
The standby server notified of the state change request switches to an active server and notifies an active system addition request to one of the standby servers configuring the redundant configuration. The server system according to any one of the above.
前記管理サーバは、前記待機系サーバの状態を監視し、当該待機系サーバに障害が発生した場合には、当該障害が発生した待機系サーバに対する運用系サーバに対して待機系変更要求を通知し、
前記待機系変更要求が通知された運用系サーバは、前記障害が発生した待機系サーバ以外の待機系サーバに対して運用系追加要求を通知する、請求項2乃至5のいずれか一項に記載のサーバシステム。
The management server monitors the status of the standby server, and when a failure occurs in the standby server, notifies the standby server change request to the active server for the standby server in which the failure has occurred. ,
The active server notified of the standby system change request notifies an active system addition request to a standby server other than the standby server in which the failure has occurred. Server system.
前記管理サーバは、前記障害が発生した運用系サーバの状態を監視し、当該障害が発生した運用系サーバが復旧した場合には、当該復旧した運用系サーバに対して待機系サーバとして動作するように状態変更要求を通知すると共に、
前記障害が発生した運用系サーバの代りに運用系サーバとして動作していたサーバに対して、待機系を前記復旧した運用系サーバとするように待機系変更要求を通知する、請求項1乃至6のいずれか一項に記載のサーバシステム。
The management server monitors the status of the failed active server, and when the failed active server recovers, it operates as a standby server for the recovered active server. Notifying the status change request to
7. A standby system change request is notified to a server operating as an active server instead of the failed active server so that the standby system becomes the restored active server. The server system according to any one of the above.
前記管理サーバは、前記障害が発生した待機系サーバの状態を監視し、当該障害が発生した待機系サーバが復旧した場合には、前記障害が発生した待機系サーバに対応する運用系サーバとして動作していた運用系サーバに対して、待機系サーバを前記復旧した待機系サーバに変更するように待機系変更要求を通知する、請求項2乃至7のいずれか一項に記載のサーバシステム。   The management server monitors the state of the failed standby server and operates as an active server corresponding to the failed standby server when the failed standby server is restored. The server system according to any one of claims 2 to 7, wherein a standby system change request is notified to the active server that has been changed so that the standby server is changed to the restored standby server. 運用系サーバと待機系サーバとをそれぞれ1つずつ備える複数の冗長構成と、
前記冗長構成を管理する管理サーバと、を備えるサーバシステムの制御方法であって、
前記運用系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した運用系サーバに対する待機系サーバを運用系サーバに切り替えると共に、当該切り替わった後の運用系サーバに対する待機系サーバとして前記冗長構成を構成する前記待機系サーバのうちのいずれかを割り当てる、
サーバシステムの制御方法。
A plurality of redundant configurations each including one active server and one standby server;
A control method of a server system comprising a management server for managing the redundant configuration,
When a failure occurs in at least one of the active servers, the standby server for the failed active server is switched to the active server, and as a standby server for the active server after the switch Assigning any one of the standby servers constituting the redundant configuration;
Server system control method.
前記待機系サーバの少なくとも1つに障害が発生した場合には、前記障害が発生した待機系サーバに対する運用系サーバの待機系サーバとして前記障害が発生した待機系サーバ以外の待機系サーバを割り当てる、請求項9に記載のサーバシステムの制御方法。   When a failure occurs in at least one of the standby servers, a standby server other than the failed standby server is assigned as a standby server of the active server to the standby server in which the failure has occurred. The method for controlling a server system according to claim 9.
JP2010022305A 2010-02-03 2010-02-03 Server system and control method thereof Pending JP2011159222A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010022305A JP2011159222A (en) 2010-02-03 2010-02-03 Server system and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010022305A JP2011159222A (en) 2010-02-03 2010-02-03 Server system and control method thereof

Publications (1)

Publication Number Publication Date
JP2011159222A true JP2011159222A (en) 2011-08-18

Family

ID=44591098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010022305A Pending JP2011159222A (en) 2010-02-03 2010-02-03 Server system and control method thereof

Country Status (1)

Country Link
JP (1) JP2011159222A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014139706A (en) * 2013-01-21 2014-07-31 Nec Corp Fault tolerant system
US11010269B2 (en) 2017-06-15 2021-05-18 Hitachi, Ltd. Distributed processing system and method for management of distributed processing system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014139706A (en) * 2013-01-21 2014-07-31 Nec Corp Fault tolerant system
US11010269B2 (en) 2017-06-15 2021-05-18 Hitachi, Ltd. Distributed processing system and method for management of distributed processing system

Similar Documents

Publication Publication Date Title
CN106331098B (en) Server cluster system
CN102308273B (en) Storage system
JP5352115B2 (en) Storage system and method for changing monitoring condition thereof
CN111427728B (en) State management method, main/standby switching method and electronic equipment
CN108964948A (en) Principal and subordinate&#39;s service system, host node fault recovery method and device
JP2020021277A (en) Information processing system, managing method for information processing system, and program
WO2017097006A1 (en) Real-time data fault-tolerance processing method and system
CN115576655B (en) Container data protection system, method, device, equipment and readable storage medium
CN113515408A (en) Data disaster tolerance method, device, equipment and medium
JP4318211B2 (en) High reliability system, redundant configuration control method and program
CN102487332B (en) Fault processing method, apparatus thereof and system thereof
CN112087506B (en) Cluster node management method and device and computer storage medium
JP2009217358A (en) Duplex programmable controller
JP2011159222A (en) Server system and control method thereof
CN115550287B (en) Method for establishing remote copy relationship and related device
JP2011141675A (en) Computer, method and program for managing computer
JP2010198060A (en) Server system and server system control method
CN101567804B (en) Method, equipment and system for realizing protection of system anomaly
JP6260470B2 (en) Network monitoring system and network monitoring method
JP4806382B2 (en) Redundant system
CN109218386A (en) A kind of high availability method managing Hadoop NameSpace
JP2005173751A (en) Master system operation management method using virtual machine system
JP2007274255A (en) Redundancy configuration system and node
JP5353378B2 (en) HA cluster system and clustering method thereof
CN110855505B (en) High-availability rule stacking implementation system and method