JP3910967B2 - 2重化システム及び多重化制御方法 - Google Patents
2重化システム及び多重化制御方法 Download PDFInfo
- Publication number
- JP3910967B2 JP3910967B2 JP2004071495A JP2004071495A JP3910967B2 JP 3910967 B2 JP3910967 B2 JP 3910967B2 JP 2004071495 A JP2004071495 A JP 2004071495A JP 2004071495 A JP2004071495 A JP 2004071495A JP 3910967 B2 JP3910967 B2 JP 3910967B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- client
- computers
- computer
- connection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
分散システムにおいて、コンピュータの処理を多重化する方式として、コンピュータの故障を検出したら、別のコンピュータでその処理を引き継ぐ方式が従来から知られている。この方式をフェイルオーバ方式と呼ぶ。
フェイルオーバ方式でのスプリットブレインの問題を根源的に解決するための方式として、多数決を用いた方式(多数決方式)が知られている。この多数決方式は、多重化した全てのコンピュータで同一の処理を実行し、全体の過半数(majority)を占めるコンピュータの動作を一致させることができるならば、他のコンピュータの動作に関係なく、処理を継続するものである。多数決方式は、定足数方式の1つである。定足数方式とは、多重化した全てのコンピュータで同一の処理を実行し、定足数(quorum:クォーラム)を占めるコンピュータの動作を一致させることができるならば、他のコンピュータの動作に関係なく、処理を継続するものである。この定足数を全体の過半数とした方式が多数決方式であり、例えば特許文献2に記載されている。
[第1の実施形態]
図1は本発明の第1の実施形態に係る2重化システムの構成を示すブロック図である。図1の2重化システムは、2台のサーバコンピュータ10-1,10-2から構成される。サーバコンピュータ10-1,10-2はネットワーク20を介して相互に通信が可能なように構成されている。このサーバコンピュータ10-1,10-2(から構成される2重化システム)は、ネットワーク20を介してクライアントコンピュータ30から利用可能である。本実施形態では、サーバコンピュータ10-1,10-2は、データベースサーバが動作するデータベースサーバコンピュータであり、クライアントコンピュータ30は、データベースサーバコンピュータを利用するアプリケーションサーバコンピュータである。このアプリケーションサーバコンピュータ上では、当該アプリケーションサーバコンピュータを利用するクライアント端末に対してサービスを提供するアプリケーションサーバが動作する。
<通常時の動作>
まず、サーバコンピュータ10-1,10-2が共に正常である通常時の動作について、図2のシステム状態図を参照して説明する。今、サーバコンピュータ10-1が稼動系として動作し、サーバコンピュータ10-2が待機系として動作しているものとする。サーバコンピュータ10-1,10-2のハートビート機構12-1,12-2は、ネットワーク20を介して相互に「ハートビート」と呼ばれる定期的な通信をし合うことにより、相手のサーバコンピュータの動作状況、即ち相手が正常に稼動しているかを確認する。
次に、稼動系のサーバコンピュータ10-1が停止した場合の動作について、図3のシステム状態図を参照して説明する。稼動系のサーバコンピュータ10-1が故障等で停止すると、当該サーバコンピュータ10-1のハートビート機構12-1からのハートビートが一定時間を超えて途絶える。この場合、待機系のサーバコンピュータ10-2のハートビート機構12-1は稼動系のサーバコンピュータ10-1を認識できないため、取り敢えず当該サーバコンピュータ10-1の故障を判定する。この状況では、クライアントコンピュータ30は稼動系のサーバコンピュータ10-1と通信できず、当該サーバコンピュータ10-1からサービスの提供を受けられない。そこでクライアントコンピュータ30のサーバ接続部32は、接続先を、稼動系のサーバコンピュータ10-1から、図3において矢印301で示すように待機系のサーバコンピュータ10-2に切り替えて、当該サーバコンピュータ10-2のクライアント接続フラグ130-2をONにする。このことは、クライアントコンピュータ30が稼動系のサーバコンピュータ10-1の故障を認識したことを表す。
次に、図2の状態にあった稼動系のサーバコンピュータ10-1と待機系のサーバコンピュータ10-2との間でネットワーク分割となったときの動作について、図4のシステム状態図を参照して説明する。
次に、サーバコンピュータ10-1のハートビート機構12-1からサーバコンピュータ10-2へのハートビート送信が渋滞したときの動作について、図5のシステム状態図を参照して説明する。
図6は本発明の第2の実施形態に係る2重化システムの構成を示すブロック図である。図6において、図1中の構成要素と同様の要素には、便宜的に同一符号を付してある。
サーバコンピュータ10-1,10-2の多重化制御部13-1,13-2は、当該サーバコンピュータ10-1,10-2のハートビート機構12-1,12-2によって互いが正常であることが認識されている場合は、自身が稼動系であるならばサーバ処理部11-1,11-2による処理の実行を継続させ、待機系であるならばサーバ処理部11-1,11-2の停止状態を継続させる。また多重化制御部13-1,13-2は、ハートビート機構12-1,12-2が相手を認識しない場合、クライアント接続カウンタ131-1,131-2の値、即ちサーバコンピュータ10-1,10-2に接続されているクライアントコンピュータの数(接続数)C1,C2がN/2を超えているか否かを判定する。多重化制御部13-1,13-2は、接続数C1,C2がN/2を超えているならば、サーバ処理部11-1,11-2による処理を実行させ、N/2以下であるならば、サーバ処理部11-1,11-2による処理を停止させる。これにより、2重化されたサーバコンピュータ10-1及び10-2の間でネットワーク分割が発生しても、またN台のクライアントコンピュータ30-1〜30-Nの一部が故障しても、サーバコンピュータ10-1及び10-2の間でスプリットブレインが発生するのを防止しながら、クライアントコンピュータに対してサービスが提供されなくなる事態が発生するのを極力防止できる。
Claims (7)
- N台(Nは1以上の整数)のクライアントコンピュータにサービスを提供するための、相互に通信可能な2台のサーバコンピュータから構成され、当該2台のサーバコンピュータのいずれか一方が稼動系として動作し、他方が待機系として動作する2重化システムにおいて、
前記2台のサーバコンピュータの各々は、
前記サービスを提供するためのサーバ処理を実行するサーバ処理手段と、
前記N台のクライアントコンピュータのうちのいずれかのクライアントコンピュータから当該サーバコンピュータに接続要求が送出された場合に、当該接続要求の受け付けを制御する接続要求受け付け制御手段と、
前記N台のクライアントコンピュータとの接続状態を管理するためのクライアント接続状態管理手段と、
前記接続要求が受け付けられた結果、当該接続要求を送出したクライアントコンピュータと接続された際に、前記クライアント接続状態管理手段によって管理されている前記N台のクライアントコンピュータとの接続状態に基づく多数決により、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する多重化制御手段と
を具備することを特徴とする2重化システム。 - 前記2台のサーバコンピュータの各々は、相互に通信を行うことで相互に相手を認識するハートビート機構を備え、
前記多重化制御手段は前記ハートビート機構が相手を認識できなかった場合に、前記クライアント接続状態管理手段によって管理されている前記N台のクライアントコンピュータとの接続状態に基づく多数決により、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する
ことを特徴とする請求項1記載の2重化システム。 - 前記クライアント接続状態管理手段は、前記N台のクライアントコンピュータとの接続状態を、前記N台のクライアントコンピュータのうち対応する前記サーバコンピュータに接続されているクライアントコンピュータの数を示す接続数によって管理しており、
前記多重化制御手段は、前記クライアント接続状態管理手段によって管理されている前記接続数がN/2を超えるか否かにより、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する
ことを特徴とする請求項1記載の2重化システム。 - 前記クライアント接続状態管理手段によって管理されている前記接続数は、前記N台のクライアントコンピュータのいずれかが接続先を切り替える際に更新され、対応する前記サーバコンピュータが切り替え後の新たな接続先となる際には1インクリメントされ、対応する前記サーバコンピュータが切り替え前の元の接続先となる際には1デクリメントされることを特徴とする請求項3記載の2重化システム。
- 前記Nは1であり、
前記クライアント接続状態管理手段は、前記クライアントコンピュータとの接続状態を、当該クライアントコンピュータが対応する前記サーバコンピュータに接続されているか否かを示すフラグ情報であって、前記クライアントコンピュータが前記対応するサーバコンピュータに接続されている期間、前記クライアントコンピュータが前記対応するサーバコンピュータに接続されていことを示す第1の状態に、前記クライアントコンピュータによって定期的に更新されるフラグ情報により管理すると共に、当該フラグ情報が一定期間前記第1の状態に更新されなかった場合、当該フラグ情報を前記クライアントコンピュータが前記対応するサーバコンピュータに接続されていないことを示す第2の状態に設定し、
前記多重化制御手段は、前記クライアント接続状態管理手段によって管理されている前記フラグ情報が前記第1の状態または前記第2の状態のいずれであるかにより、前記サーバ処理手段によるサーバ処理を実行させるか否かを制御する
ことを特徴とする請求項1記載の2重化システム。 - N台(Nは1以上の整数)のクライアントコンピュータにサービスを提供するための、相互に通信可能な2台のサーバコンピュータから構成され、当該2台のサーバコンピュータのいずれか一方が稼動系として動作し、他方が待機系として動作する2重化システムにおいて、前記2台のサーバコンピュータ間で2重化されたサーバ処理を制御する多重化制御方法であって、
前記2台のサーバコンピュータの各々は、前記N台のクライアントコンピュータのうちのいずれかのクライアントコンピュータから当該サーバコンピュータに接続要求が送出された場合に当該接続要求の受け付けを制御し、
前記2台のサーバコンピュータの各々は、前記N台のクライアントコンピュータとの接続状態を管理し、
前記2台のサーバコンピュータの各々は、前記接続要求が受け付けられた結果、当該接続要求を送出したクライアントコンピュータと接続された際に、前記N台のクライアントコンピュータとの前記接続状態に基づく多数決により、自身がサーバ処理を実行するか否かを決定する
ことを特徴とする多重化制御方法。 - 前記2台のサーバコンピュータの各々は、相互に通信を行うことで相互に相手を認識し、
前記2台のサーバコンピュータの各々は、相手を認識できなかった場合には、前記N台のクライアントコンピュータとの前記接続状態に基づく多数決により、自身がサーバ処理を実行するか否かを決定する
ことを特徴とする請求項6記載の多重化制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004071495A JP3910967B2 (ja) | 2004-03-12 | 2004-03-12 | 2重化システム及び多重化制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004071495A JP3910967B2 (ja) | 2004-03-12 | 2004-03-12 | 2重化システム及び多重化制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005258947A JP2005258947A (ja) | 2005-09-22 |
JP3910967B2 true JP3910967B2 (ja) | 2007-04-25 |
Family
ID=35084575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004071495A Expired - Fee Related JP3910967B2 (ja) | 2004-03-12 | 2004-03-12 | 2重化システム及び多重化制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3910967B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4505763B2 (ja) * | 2007-01-31 | 2010-07-21 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | ノードクラスタの管理 |
JP5005425B2 (ja) * | 2007-05-21 | 2012-08-22 | パナソニック株式会社 | 制御装置復帰システム |
JP4796086B2 (ja) * | 2008-03-14 | 2011-10-19 | 株式会社東芝 | クラスタシステム及び同システムにおいてマスタノードを選択する方法 |
JP4599435B2 (ja) * | 2008-07-17 | 2010-12-15 | 株式会社東芝 | クラスタシステムを構成する計算機及びプログラム |
JP5699658B2 (ja) | 2011-02-10 | 2015-04-15 | 日本電気株式会社 | 待機系計算機、クラスタシステム、サービス提供方法およびプログラム |
JP2016170521A (ja) | 2015-03-11 | 2016-09-23 | 富士通株式会社 | 正常なプロセッサの抽出方法及びプログラム、情報処理装置 |
EP3506099A4 (en) | 2016-08-25 | 2019-09-04 | Fujitsu Limited | MAINTENANCE MANAGEMENT PROGRAM, MAINTENANCE MANAGEMENT METHOD, AND MAINTENANCE MANAGEMENT DEVICE |
-
2004
- 2004-03-12 JP JP2004071495A patent/JP3910967B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005258947A (ja) | 2005-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108900415B (zh) | Mlag接口故障下的主从设备切换方法及系统 | |
US7975016B2 (en) | Method to manage high availability equipments | |
US20040049573A1 (en) | System and method for managing clusters containing multiple nodes | |
US20130212205A1 (en) | True geo-redundant hot-standby server architecture | |
CN113014634A (zh) | 集群选举处理方法、装置、设备及存储介质 | |
US20080301489A1 (en) | Multi-agent hot-standby system and failover method for the same | |
JP2001306349A (ja) | バックアップ装置及びバックアップ方法 | |
CN105337780B (zh) | 一种服务器节点配置方法及物理节点 | |
CN102916825A (zh) | 一种双机热备系统的管理设备、管理方法及双机热备系统 | |
US20070177589A1 (en) | Network system and node redundancy method of network system | |
EP2224341B1 (en) | Node system, server switching method, server device, and data transfer method | |
CN112181660A (zh) | 一种基于服务器集群的高可用方法 | |
CN112583708B (zh) | 一种连接关系控制方法、装置和电子设备 | |
CN110971662A (zh) | 一种基于Ceph的两节点高可用实现方法及装置 | |
JP3910967B2 (ja) | 2重化システム及び多重化制御方法 | |
WO2006020390A2 (en) | Computing system redundancy and fault tolerance | |
CN110674192A (zh) | 一种Redis高可用VIP漂移方法、终端及存储介质 | |
CN113254205A (zh) | 负载均衡系统、方法、装置、电子设备及存储介质 | |
EP2456163B1 (en) | Registering an internet protocol phone in a dual-link architecture | |
JP4879823B2 (ja) | 監視制御システム | |
US11544162B2 (en) | Computer cluster using expiring recovery rules | |
GB2499822A (en) | Failover processing using different physical paths | |
CN111309515A (zh) | 一种容灾控制方法、装置及系统 | |
CN113794595A (zh) | 一种基于工业互联网的IoT设备高可用方法 | |
KR100832543B1 (ko) | 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060606 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070125 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |