JP4695705B2 - クラスタシステムおよびノード切り替え方法 - Google Patents
クラスタシステムおよびノード切り替え方法 Download PDFInfo
- Publication number
- JP4695705B2 JP4695705B2 JP2009501033A JP2009501033A JP4695705B2 JP 4695705 B2 JP4695705 B2 JP 4695705B2 JP 2009501033 A JP2009501033 A JP 2009501033A JP 2009501033 A JP2009501033 A JP 2009501033A JP 4695705 B2 JP4695705 B2 JP 4695705B2
- Authority
- JP
- Japan
- Prior art keywords
- business
- server node
- node
- node device
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
Description
(1)誤検知
クラスタシステムにおいて、業務処理そのものは正常に実行されていても、オペレーティングシステム(OS)の部分的異常等により、ハートビート信号が正常に送受信されない場合がある。この場合、業務とは直接関係がないシステム状態の異常が検知され、実際には業務処理を継続可能な状況でも、ノード切り替えが発生してしまう。
(2)検知時間
ハートビート信号によるノード異常検知には、相当の検知時間が必要である。そこで、検知時間を短くするためにタイマを短く設定すると、上記(1)の誤検知を助長することになる。したがって、不要なノード切り替えが発生するリスクが高まる。
本発明の第1のクラスタシステムは、クライアントノード装置および複数のサーバノード装置を含む。上記複数のサーバノード装置のうち第1のサーバノード装置に異常が発生したとき、クライアントノード装置は、第2のサーバノード装置に対して異常検知情報を送信する。
図1は、本実施形態のクラスタシステムの構成例を示している。このクラスタシステムは、構成管理サーバ101およびノード(サーバ)N1〜N6を備える。このうち、クラスタシステムとして切り替え制御の対象となる複数のノードは、ノードグループとして管理され、ノードグループを複数用意することで、システムの能力増強が実現される。この例では、ノードN1〜N3はノードグループXに属し、ノードN4〜N6はノードグループYに属する。
図7は、業務処理を依頼するクライアントノードを含む、クラスタシステムの構成例を示している。このクラスタシステムは、クライアントノード(業務クライアント)CN1、CN2、およびノード(業務サーバ)N1〜Nmを備え、これらのノードは、通信ネットワーク701により互いに接続されている。不図示の構成管理サーバは、通信ネットワーク701上に設けられる。
(1)誤検知
異常検出の仕組みを業務パケットと兼用することにより、より直接的かつ正確に、業務を継続できない状態を検知できる。
(2)検知時間
一定時間内(例えば3秒以内)に業務パケットの処理が行われなければ、その宛先ノードを異常とみなすことにすれば、ユーザにとってより納得性のあるノード異常検知時間を設定することができる。
図12は、ノードN1〜Nmに設けられる異常ノードリストを示している。この異常ノードリストには、業務グループID、異常ノードID、および検知元クライアントノードIDの組み合わせが記録される。この例では、業務Aの業務グループに対して、ノードN1が異常ノードとして記録され、クライアントノードCN1が検知元クライアントノードとして記録されている。
クライアントノードは、まず、処理対象の業務グループに対するタイマTMR1のタイマ値をタイマ管理テーブルに設定し(ステップ1801)、ノードN1〜Nmに対して業務パケットを送信する(ステップ1802)。そして、業務応答パケットの受信待ち処理を行い(ステップ1803)、ノードN1〜Nmのすべてから業務応答パケットを受信したか否かをチェックする(ステップ1804)。
クラスタ制御部は、まず、パケット受信待ち処理を行い(ステップ1901)、ノード異常検知パケットを受信したか否かをチェックする(ステップ1902)。
Claims (4)
- 複数のクライアントノード装置および複数のサーバノード装置を含むクラスタシステムであって、
前記複数のクライアントノード装置のうちの第1のクライアントノード装置は、前記複数のサーバノード装置のうち第1のサーバノード装置に業務処理要求を送信し、前記第1のサーバノード装置から前記業務処理要求に対する業務応答を受信しない場合に、前記複数のサーバノード装置のうちの第2のサーバノード装置に対して異常検知情報を送信し、
前記第2のサーバノード装置は、前記異常検知情報を受信したとき、前記第1のサーバノード装置に対して生存確認要求を送信し、前記生存確認応答を送信してから所定時間該第1のサーバノード装置から生存確認応答を受信しないこと、前記生存確認要求を送信してから前記所定時間経過するまでの間に前記複数のクライアントノード装置のうちの第2のクライアントノード装置からさらに異常検知情報を受信すること、のいずれの条件を満たした場合についても、該第1のサーバノード装置に異常が発生したものと判断して、業務処理を行うサーバノード装置の切り替え制御を開始する、
ことを特徴とするクラスタシステム。 - 複数のクライアントノード装置および複数のサーバノード装置を含むクラスタシステムにおけるノード切り替え方法であって、
前記複数のクライアントノード装置のうちの第1のクライアントノード装置は、前記複数のサーバノード装置のうち第1のサーバノード装置に業務処理要求を送信し、前記第1のサーバノード装置から前記業務処理要求に対する業務応答を受信しない場合に、前記複数のサーバノード装置のうちの第2のサーバノード装置に対して異常検知情報を送信し、
前記第2のサーバノード装置は、前記異常検知情報を受信したとき、前記第1のサーバノード装置に対して生存確認要求を送信し、前記生存確認応答を送信してから所定時間該第1のサーバノード装置から生存確認応答を受信しないこと、前記生存確認要求を送信してから前記所定時間経過するまでの間に前記複数のクライアントノード装置のうちの第2のクライアントノード装置からさらに異常検知情報を受信すること、のいずれの条件を満たした場合についても、該第1のサーバノード装置に異常が発生したものと判断して、業務処理を行うサーバノード装置の切り替え制御を開始する、
ことを特徴とするノード切り替え方法。 - クライアントノード装置および複数のサーバノード装置を含むクラスタシステムにおけるノード切り替え方法であって、
前記複数のサーバノード装置のうち第1のサーバノード装置に異常が発生したとき、前記クライアントノード装置は、第2のサーバノード装置に対して異常検知情報を送信し、
前記第2のサーバノード装置は、前記異常検知情報を受信したとき、前記第1のサーバノード装置に対して生存確認要求を送信し、該第1のサーバノード装置から生存確認応答を受信しなければ、該第1のサーバノード装置に異常が発生したものと判断して、業務処理を行うサーバノード装置の切り替え制御を開始し、前記第1のサーバノード装置内のアクティブ業務プロセスと他のサーバノード装置内のスタンバイ業務プロセスを含む業務グループが、該第1のサーバノード装置と他のサーバノード装置を含むノードグループにいくつ割り当てられているかをチェックし、複数の業務グループが該ノードグループに割り当てられており、かつ、該複数の業務グループのうち所定数以上の業務グループについて該第1のサーバノード装置に異常が発生したものと判断した場合は、ノード単位の切り替えを実行することを特徴とするノード切り替え方法。 - 複数のクライアントノード装置および複数のサーバノード装置を含むクラスタシステムにおけるノード切り替え方法であって、
前記複数のクライアントノード装置の各々は、前記複数のサーバノード装置のうち第1のサーバノード装置に対して業務処理要求を送信し、該第1のサーバノード装置から業務処理応答を受信しなければ、第2のサーバノード装置に対して異常検知情報を送信し、
前記第2のサーバノード装置は、2つ以上のクライアントノード装置から前記異常検知情報を受信したときに、前記第1のサーバノード装置に異常が発生したものと判断して、業務処理を行うサーバノード装置の切り替え制御を開始し、前記第1のサーバノード装置内のアクティブ業務プロセスと他のサーバノード装置内のスタンバイ業務プロセスを含む業務グループが、該第1のサーバノード装置と他のサーバノード装置を含むノードグループにいくつ割り当てられているかをチェックし、複数の業務グループが該ノードグループに割り当てられており、かつ、該複数の業務グループのうち所定数以上の業務グループについて該第1のサーバノード装置に異常が発生したものと判断した場合は、ノード単位の切り替えを実行することを特徴とするノード切り替え方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/000147 WO2008105031A1 (ja) | 2007-02-28 | 2007-02-28 | クラスタシステムおよびノード切り替え方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008105031A1 JPWO2008105031A1 (ja) | 2010-06-03 |
JP4695705B2 true JP4695705B2 (ja) | 2011-06-08 |
Family
ID=39720882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009501033A Expired - Fee Related JP4695705B2 (ja) | 2007-02-28 | 2007-02-28 | クラスタシステムおよびノード切り替え方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8051321B2 (ja) |
JP (1) | JP4695705B2 (ja) |
WO (1) | WO2008105031A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8594069B2 (en) * | 2007-08-06 | 2013-11-26 | Qualcomm Incorporated | In-order data delivery during handover in a wireless communication system |
WO2009133819A1 (ja) * | 2008-04-30 | 2009-11-05 | パナソニック電工株式会社 | 機器管理システム |
JP5501630B2 (ja) * | 2009-02-12 | 2014-05-28 | 三菱電機株式会社 | 構成制御システム |
JP5403406B2 (ja) * | 2009-04-30 | 2014-01-29 | 富士ゼロックス株式会社 | 印刷システム |
US8825842B2 (en) * | 2011-04-28 | 2014-09-02 | Facebook, Inc. | Managing notifications pushed to user devices |
JP6309711B2 (ja) * | 2013-03-15 | 2018-04-11 | 株式会社三菱東京Ufj銀行 | プロセス監視プログラム及びプロセス監視システム |
JP6217189B2 (ja) * | 2013-07-04 | 2017-10-25 | 富士通株式会社 | 無線通信装置、無線通信方法、無線通信プログラムおよび無線通信システム |
JP6282536B2 (ja) * | 2014-06-18 | 2018-02-21 | 株式会社Nttドコモ | データベースシステム及び運用切替方法 |
US20160090300A1 (en) * | 2014-09-30 | 2016-03-31 | Invensense, Inc. | Piezoelectric microphone with integrated cmos |
US9836368B2 (en) * | 2015-10-22 | 2017-12-05 | Netapp, Inc. | Implementing automatic switchover |
CN106685676B (zh) * | 2015-11-06 | 2020-02-11 | 中国移动通信集团浙江有限公司 | 一种节点切换方法及装置 |
CN116248748A (zh) * | 2023-02-27 | 2023-06-09 | 西安奕斯伟材料科技股份有限公司 | 一种通讯连接方法、装置、设备、介质及产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04141744A (ja) * | 1990-10-02 | 1992-05-15 | Fujitsu Ltd | 仮想計算機のホットスタンバイ制御システム |
JPH0575637A (ja) * | 1991-09-18 | 1993-03-26 | Hitachi Ltd | ネームサーバー制御方式 |
JPH09293059A (ja) * | 1996-04-25 | 1997-11-11 | Hitachi Ltd | 分散システム及びその運用管理方法 |
JP2000330814A (ja) * | 1999-05-19 | 2000-11-30 | Toshiba Corp | 二重化サーバシステム |
JP2006285532A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Frontech Ltd | サービス提供方法、及びデータ処理装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0934852A (ja) | 1995-07-13 | 1997-02-07 | Nec Corp | クラスタシステム |
US6886035B2 (en) * | 1996-08-02 | 2005-04-26 | Hewlett-Packard Development Company, L.P. | Dynamic load balancing of a network of client and server computer |
US7409420B2 (en) * | 2001-07-16 | 2008-08-05 | Bea Systems, Inc. | Method and apparatus for session replication and failover |
US6910078B1 (en) * | 2001-11-15 | 2005-06-21 | Cisco Technology, Inc. | Methods and apparatus for controlling the transmission of stream data |
US20040153709A1 (en) * | 2002-07-03 | 2004-08-05 | Burton-Krahn Noel Morgen | Method and apparatus for providing transparent fault tolerance within an application server environment |
JP2004334534A (ja) | 2003-05-07 | 2004-11-25 | Nec Corp | クラスタシステム管理装置、クラスタシステム管理方法、クラスタシステム管理プログラム、クラスタシステム |
JP4144882B2 (ja) | 2004-05-14 | 2008-09-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理装置、情報システム、プロキシ処理方法、及びプログラムと記録媒体 |
US7870416B2 (en) * | 2005-02-07 | 2011-01-11 | Mimosa Systems, Inc. | Enterprise service availability through identity preservation |
US7827262B2 (en) * | 2005-07-14 | 2010-11-02 | Cisco Technology, Inc. | Approach for managing state information by a group of servers that services a group of clients |
-
2007
- 2007-02-28 WO PCT/JP2007/000147 patent/WO2008105031A1/ja active Application Filing
- 2007-02-28 JP JP2009501033A patent/JP4695705B2/ja not_active Expired - Fee Related
-
2009
- 2009-08-25 US US12/547,106 patent/US8051321B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04141744A (ja) * | 1990-10-02 | 1992-05-15 | Fujitsu Ltd | 仮想計算機のホットスタンバイ制御システム |
JPH0575637A (ja) * | 1991-09-18 | 1993-03-26 | Hitachi Ltd | ネームサーバー制御方式 |
JPH09293059A (ja) * | 1996-04-25 | 1997-11-11 | Hitachi Ltd | 分散システム及びその運用管理方法 |
JP2000330814A (ja) * | 1999-05-19 | 2000-11-30 | Toshiba Corp | 二重化サーバシステム |
JP2006285532A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Frontech Ltd | サービス提供方法、及びデータ処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US20100017646A1 (en) | 2010-01-21 |
US8051321B2 (en) | 2011-11-01 |
JPWO2008105031A1 (ja) | 2010-06-03 |
WO2008105031A1 (ja) | 2008-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4695705B2 (ja) | クラスタシステムおよびノード切り替え方法 | |
EP2691859B1 (en) | Fault detection and recovery as a service | |
CN106330475B (zh) | 一种通信系统中管理主备节点的方法和装置及高可用集群 | |
JPH10200552A (ja) | イーサネット通信を用いた冗長方法 | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
JP2010541413A (ja) | ネットワーク競合防止装置およびネットワーク競合防止方法 | |
CN107508694B (zh) | 一种集群内的节点管理方法及节点设备 | |
EP2637102B1 (en) | Cluster system with network node failover | |
US11748217B2 (en) | Method for failure detection and role selection in a network of redundant processes | |
WO2019049433A1 (ja) | クラスタシステム、クラスタシステムの制御方法、サーバ装置、制御方法、及びプログラムが格納された非一時的なコンピュータ可読媒体 | |
JP5613119B2 (ja) | マスター/スレーブシステム、制御装置、マスター/スレーブ切替方法、および、マスター/スレーブ切替プログラム | |
JP2011203941A (ja) | 情報処理装置、監視方法、および監視プログラム | |
JP4806382B2 (ja) | 冗長化システム | |
JP6134720B2 (ja) | 接続方法 | |
JPH07168790A (ja) | 情報処理装置 | |
JP3248485B2 (ja) | クラスタシステム、クラスタシステムにおける監視方式およびその方法 | |
JP2009110218A (ja) | 仮想化スイッチおよびそれを用いたコンピュータシステム | |
JP2009026182A (ja) | プログラム実行システム及び実行装置 | |
JP4863984B2 (ja) | 監視処理プログラム、方法及び装置 | |
JP2004007930A (ja) | 電力系統監視制御システムおよびプログラム | |
JP6935819B2 (ja) | ノード装置、回復動作制御方法、及び回復動作制御プログラム | |
JP5763030B2 (ja) | 二重化ネットワーク制御システムおよび二重化ネットワーク制御方法 | |
US11947431B1 (en) | Replication data facility failure detection and failover automation | |
JPH05304528A (ja) | 多重化通信ノード | |
JP5082147B2 (ja) | マルチノードシステム、ノード間スイッチ及びデータ中継方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100506 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100809 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101026 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110126 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110225 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140304 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4695705 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |