JP4796086B2 - クラスタシステム及び同システムにおいてマスタノードを選択する方法 - Google Patents
クラスタシステム及び同システムにおいてマスタノードを選択する方法 Download PDFInfo
- Publication number
- JP4796086B2 JP4796086B2 JP2008066189A JP2008066189A JP4796086B2 JP 4796086 B2 JP4796086 B2 JP 4796086B2 JP 2008066189 A JP2008066189 A JP 2008066189A JP 2008066189 A JP2008066189 A JP 2008066189A JP 4796086 B2 JP4796086 B2 JP 4796086B2
- Authority
- JP
- Japan
- Prior art keywords
- check
- computers
- value
- weighting
- nth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Description
図1は本発明の一実施形態に係るクラスタシステム10を含むクライアント−サーバシステムの構成を示すブロック図である。
図1において、クラスタシステム10は、複数の計算機、例えばn台の計算機(以下、ノードと称する)100-1〜100-nから構成される。
まず重み付け処理部130-1内の重み算出部132は、記憶部140-1内に、図4に示されるように重みレジスタ領域142を確保し、当該重みレジスタ領域142に初期重みとして0を設定する(ステップS1)。
(1)プロセス監視コマンド
(2)DISK(ディスク)経路監視コマンド
(3)LAN経路監視コマンド
である。これらの第1のタイプのコマンドの実行により、以下に述べるように、ノードでのサービス開始の必要条件が成立するかが確認される。本実施形態では、この必要条件が成立していると確認された場合をチェック成功、それ以外をチェック失敗と定義する。
(1)ノード100-i(i=1,…n)でのプロセス監視コマンドの実行により、サービス開始に必要なプロセスが当該ノード100-iで動作しているかがチェックされる。
(2)ノード100-iでのDISK経路監視コマンド(サービス用共有デスク経路監視コマンド)の実行により、当該ノード100-iから共有ストレージ装置200に確保されているサービス用共有デスク領域にアクセスできるかがチェックされる。
(3)ノード100-iでのLAN経路監視コマンドの実行により、当該ノード100-iからネットワーク20を介してクライアントと通信ができるかがチェックされる。
(4)CPU使用率監視コマンド
(5)MEMORY(メモリ)使用率監視コマンド
である。これらの第2のタイプのコマンドの実行により、以下に述べるように、ノードでのサービス開始に有利となる十分条件が成立するかが確認される。
(4)ノード100-i(i=1,…n)でのCPU使用率監視コマンドの実行により、当該ノード100-i内のCPUの使用状況がチェックされる。
(5)ノード100-iでのMEMORY使用率監視コマンドの実行により、当該ノード100-i内のメモリ(物理メモリ)の使用状況がチェックされる。
Claims (5)
- マスタノードとして動作した場合にクライアントに対してサービスを提供する、クラスタ構成の第1乃至第nの計算機と、
前記第1乃至第nの計算機によって共有される共有ストレージ装置であって、前記第1乃至第nの計算機のいずれかをマスタノードとして選択する際の優先順位の決定に用いられる当該第1乃至第nの計算機各々の重みが保持された重み情報を格納する共有ストレージ装置と
を具備し、
前記第1乃至第nの計算機は、それぞれ、
相互にハートビート通信を行うことで計算機障害を検出する第1乃至第nのクラスタ管理手段と、
前記第1乃至第nの計算機自身が前記サービスを開始するのに必須の必要条件が成立するかをチェックするための第1のタイプのチェック方法及び前記第1乃至第nの計算機自身が前記サービスを開始するのに有利となる十分条件が成立するかをチェックするための第2のタイプのチェック方法を定義したチェック方法定義情報と、前記第1のチェック方法に基づくチェック結果がチェック失敗の場合に対応した重み付けの減点の値及び前記第2のチェック方法に基づくチェック結果がチェック成功の場合に対応した重み付けの加点の値を含む、チェック結果に対応した重み付けのための加減点の値とが設定されたチェックリストを格納する第1乃至第nのチェックリスト記憶手段と、
前記第1乃至第nのクラスタ管理手段による計算機障害検出に応じて、それぞれ、前記第1乃至第nのチェックリスト記憶手段に格納されている前記チェックリストに設定されたチェック方法定義情報によって定義される前記第1のチェック方法及び前記第2のチェック方法に従って前記第1乃至第nの計算機自身の前記サービスの開始に関する状態をチェックし、前記チェックリストからチェック結果に対応する前記重み付けのための加減点の値を取得して、当該取得された値で前記共有ストレージ装置に格納されている前記重み情報中の、前記第1乃至第nの計算機自身の重みを更新する第1乃至第nの重み付け処理手段であって、前記第1のチェック方法に基づくチェック結果がチェック失敗の場合、前記チェックリストから当該チェック失敗に対応した重み付けの減点の値を取得し、前記第2のチェック方法に基づくチェック結果がチェック成功の場合、前記チェックリストから当該チェック成功に対応した重み付けの加点の値を取得する第1乃至第nの重み付け処理手段と、
前記更新された前記重み情報中の前記第1乃至第nの計算機の重みに基づいて当該第1乃至第nの計算機自身が前記マスタノードとして最も優先順位が高いかを判定し、最も優先順位が高い場合に当該第1乃至第nの計算機自身を前記マスタノードとして選択するためのマスタノード調停処理を実行する第1乃至第nの調停手段とを
含むことを特徴とするクラスタシステム。 - 前記チェックリストに設定される加減点の値は、前記第1のチェック方法に基づく前記チェック結果がチェック成功の場合に対応した重み付けの加点を0とする値と、前記第2のチェック方法に基づく前記チェック結果がチェック失敗の場合に対応した重み付けの減点を0とする値とを更に含み、前記重み付けの加点の値と減点の値とは、“加点の合計値−減点の最小値”が負となるように設定されていることを特徴とする請求項1記載のクラスタシステム。
- 前記第1乃至第nのクラスタ管理手段による計算機障害検出時から、前記第1乃至第nの計算機が正常な場合に前記第1乃至第nの重み付け処理手段が前記重み情報中の前記第1乃至第nの計算機自身の重みを更新するまでに要する時間よりも長い規定時間が予め定められており、
前記第1乃至第nの調停手段は、それぞれ前記第1乃至第nのクラスタ管理手段による計算機障害検出時から前記規定時間が経過するのを待って前記マスタノード調停処理を開始する
ことを特徴とする請求項1または2のいずれか一項に記載のクラスタシステム。 - マスタノードとして動作した場合にクライアントに対してサービスを提供する、クラスタ構成の第1乃至第nの計算機であって、それぞれ、前記第1乃至第nの計算機自身が前記サービスを開始するのに必須の必要条件が成立するかをチェックするための第1のタイプのチェック方法及び前記第1乃至第nの計算機自身が前記サービスを開始するのに有利となる十分条件が成立するかをチェックするための第2のタイプのチェック方法とを定義したチェック方法定義情報と、前記第1のチェック方法に基づくチェック結果がチェック失敗の場合に対応した重み付けの減点の値及び前記第2のチェック方法に基づくチェック結果がチェック成功の場合に対応した重み付けの加点の値を含む、チェック結果に対応した重み付けのための加減点の値とが設定されたチェックリストを格納する第1乃至第nのチェックリスト記憶手段を含む第1乃至第nの計算機と、前記第1乃至第nの計算機によって共有される共有ストレージ装置であって、前記第1乃至第nの計算機のいずれかをマスタノードとして選択する際の優先順位の決定に用いられる当該第1乃至第nの計算機各々の重みが保持された重み情報を格納する共有ストレージ装置とを有するクラスタシステムにおいて、
前記第1乃至第nの計算機が相互にハートビート通信を行うことで計算機障害を検出するステップと、
前記計算機障害検出に応じて、それぞれ、前記第1乃至第nのチェックリスト記憶手段に格納されている前記チェックリストに設定されたチェック方法定義情報によって定義される前記第1のチェック方法及び第2のチェック方法に従って前記第1乃至第nの計算機が自身の前記サービスの開始に関する状態をチェックするステップと、
前記第1乃至第nの計算機が、前記チェックリストからチェック結果に対応する前記重み付けのための加減点の値を取得するステップであって、前記第1のチェック方法に基づくチェック結果がチェック失敗の場合に、前記チェックリストから当該チェック失敗に対応した重み付けの減点の値を取得し、前記第2のチェック方法に基づくチェック結果がチェック成功の場合に、前記チェックリストから当該チェック成功に対応した重み付けの加点の値を取得するステップと、
前記第1乃至第nの計算機が、前記共有ストレージ装置に格納されている前記重み情報中の、前記第1乃至第nの計算機自身の重みを、前記取得された値で更新するステップと、
前記第1乃至第nの計算機が、前記更新された前記重み情報中の自身の重みを参照することにより、前記マスタノードとして自身が最も優先順位が高いかを判定するステップと、
前記第1乃至第nの計算機のうち、前記マスタノードとして最も優先順位が高いと判定した計算機自身が、自身を前記マスタノードとして選択するステップと
を具備することを特徴とするクラスタシステムにおいてマスタノードを選択する方法。 - 前記チェックリストに設定される加減点の値は、前記第1のチェック方法に基づく前記チェック結果がチェック成功の場合に対応した重み付けの加点を0とする値と、前記第2のチェック方法に基づく前記チェック結果がチェック失敗の場合に対応した重み付けの減点を0とする値とを更に含み、前記重み付けの加点の値と減点の値とは、“加点の合計値−減点の最小値”が負となるように設定されていることを特徴とする請求項4記載のクラスタシステムにおいてマスタノードを選択する方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008066189A JP4796086B2 (ja) | 2008-03-14 | 2008-03-14 | クラスタシステム及び同システムにおいてマスタノードを選択する方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008066189A JP4796086B2 (ja) | 2008-03-14 | 2008-03-14 | クラスタシステム及び同システムにおいてマスタノードを選択する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009223519A JP2009223519A (ja) | 2009-10-01 |
JP4796086B2 true JP4796086B2 (ja) | 2011-10-19 |
Family
ID=41240245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008066189A Expired - Fee Related JP4796086B2 (ja) | 2008-03-14 | 2008-03-14 | クラスタシステム及び同システムにおいてマスタノードを選択する方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4796086B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5016696B2 (ja) * | 2010-03-05 | 2012-09-05 | 日本電信電話株式会社 | 高可用性システム、サーバ、高可用性維持方法及びプログラム |
US9686161B2 (en) * | 2013-09-16 | 2017-06-20 | Axis Ab | Consensus loss in distributed control systems |
JP6924598B2 (ja) * | 2017-03-31 | 2021-08-25 | 三菱重工業株式会社 | 計算機、制御方法、及びプログラム |
CN107957915B (zh) * | 2017-11-21 | 2019-12-24 | 深圳壹账通智能科技有限公司 | 一种被调用方系统的心跳检测方法、存储介质和服务器 |
JP7422492B2 (ja) * | 2019-05-24 | 2024-01-26 | アズビル株式会社 | 冗長システム及びデータ同期方法 |
CN115499447A (zh) * | 2022-09-15 | 2022-12-20 | 北京天融信网络安全技术有限公司 | 一种集群主节点确认方法、装置、电子设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0644090A (ja) * | 1992-07-27 | 1994-02-18 | Toshiba Corp | マスタスレーブ計算機システム及びマスタ選定制御方法 |
JPH0756838A (ja) * | 1993-08-11 | 1995-03-03 | Toshiba Corp | 分散サーバ制御装置 |
JP3296378B2 (ja) * | 1993-08-27 | 2002-06-24 | 株式会社東芝 | コンピュータバックアップシステム |
JP2000215076A (ja) * | 1999-01-26 | 2000-08-04 | Toshiba Corp | クラスタシステム及びクラスタシステムにおけるフェ―ルオ―バ処理方法 |
JP2004126982A (ja) * | 2002-10-03 | 2004-04-22 | Nri & Ncc Co Ltd | 運用管理システム |
JP3910967B2 (ja) * | 2004-03-12 | 2007-04-25 | 東芝ソリューション株式会社 | 2重化システム及び多重化制御方法 |
JP2006031096A (ja) * | 2004-07-12 | 2006-02-02 | Fuji Xerox Co Ltd | 分散処理システムおよびその再起動制御方法および再起動制御プログラム |
JP4516458B2 (ja) * | 2005-03-18 | 2010-08-04 | 株式会社日立製作所 | フェイルオーバークラスタシステム及びフェイルオーバー方法 |
-
2008
- 2008-03-14 JP JP2008066189A patent/JP4796086B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009223519A (ja) | 2009-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5851503B2 (ja) | 高可用性仮想機械環境におけるアプリケーションの高可用性の提供 | |
US10609159B2 (en) | Providing higher workload resiliency in clustered systems based on health heuristics | |
JP4796086B2 (ja) | クラスタシステム及び同システムにおいてマスタノードを選択する方法 | |
US9208029B2 (en) | Computer system to switch logical group of virtual computers | |
EP3400528B1 (en) | Deferred server recovery in computing systems | |
JP4811830B1 (ja) | コンピュータリソース制御システム | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
JP2007226400A (ja) | 計算機管理方法、計算機管理プログラム、実行サーバの構成を管理する待機サーバ及び計算機システム | |
JP4491482B2 (ja) | 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム | |
JP6615761B2 (ja) | 分散データグリッドにおいて非同期呼出をサポートするためのシステムおよび方法 | |
EP2645635B1 (en) | Cluster monitor, method for monitoring a cluster, and computer-readable recording medium | |
US20170212815A1 (en) | Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program | |
JP2007164264A (ja) | 負荷分散プログラム、負荷分散装置、サービスシステム | |
WO2013190694A1 (ja) | 計算機の復旧方法、計算機システム及び記憶媒体 | |
CN114237910A (zh) | 客户端负载均衡实现方法及装置 | |
US10970098B2 (en) | Methods for sharing input-output device for process automation on a computing machine and devices thereof | |
CN109587218B (zh) | 一种集群选举的方法和装置 | |
US9645857B2 (en) | Resource fault management for partitions | |
CN112269693B (zh) | 一种节点自协调方法、装置和计算机可读存储介质 | |
WO2018188958A1 (en) | A method and a host for managing events in a network that adopts event-driven programming framework | |
JP2009026182A (ja) | プログラム実行システム及び実行装置 | |
US8671307B2 (en) | Task relay system, apparatus, and recording medium | |
JP2010170168A (ja) | 流量制御方法およびシステム | |
JP2009098715A (ja) | 冗長システム装置並びに冗長システム装置におけるジョブの実行方法及び実行プログラム | |
JP2020177489A (ja) | 制御方法、制御プログラム、および情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100405 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110215 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110705 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110728 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |