JP2009217504A - 計算機システム、計算機制御方法及び計算機制御プログラム - Google Patents
計算機システム、計算機制御方法及び計算機制御プログラム Download PDFInfo
- Publication number
- JP2009217504A JP2009217504A JP2008060017A JP2008060017A JP2009217504A JP 2009217504 A JP2009217504 A JP 2009217504A JP 2008060017 A JP2008060017 A JP 2008060017A JP 2008060017 A JP2008060017 A JP 2008060017A JP 2009217504 A JP2009217504 A JP 2009217504A
- Authority
- JP
- Japan
- Prior art keywords
- node
- nodes
- collation
- verification
- master
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Abstract
【解決手段】本システムは、同じ処理を同時に実行する複数のCPUノード11〜14と、CPUノード11〜14からの演算結果を照合する複数の照合ノード21〜28とを備える。複数のCPUノード11〜14と複数の照合ノード21〜28とは多重化ネットワーク1に接続され、複数の照合ノード21〜28は外部ネットワーク2に接続される。さらに本システムでは、各CPUノード11〜14及び各照合ノード21〜28は、自ノードの稼動状態を生存状態情報として定期的に多重化ネットワーク1を介して送信すると共に、他ノードの生存状態情報を多重化ネットワーク1を介して受信する。
【選択図】図1
Description
従って、上述した特許文献1、2に記載の技術では、一連のノード処理だけでは高信頼性データを得ることができず、ネットワーク障害にも対応できないというような課題が発生する。
また、本発明の計算機システムは、複数の照合ノードのうちの任意の照合ノードと他の照合ノードの対を照合ノードペアとし、照合ノードペアを複数組生成し、複数組の照合ノードペアのうちの1つを主系照合ノードペアとし、他の照合ノードペアを従系照合ノードペアとすることを特徴とする。
図1は、本実施の形態例のシステム構成例を示している。
図1において、本実施の形態例の計算機システム10は、演算処理を行なうCPU(Central Processing Unit)ノード11〜14と、演算処理の結果を照合する照合ノード21〜28を備えている。
図3は、CPUノード及び照合ノードのコンピュータに計算機制御プログラムを実行させたときに、機能を実行する手段を示している。
なお、各CPUノード11〜14は、演算処理を行なう演算手段105と、演算処理の結果を出力する演算結果データ出力手段106とを有している。
また、各照合ノード21〜28は、自ノードの機能を縮退させる縮退手段209と、他ノードの機能を縮退させる要求をする縮退要求手段210とを有する。
図4Aにおいて、自ノード番号401は、この生存状態情報400を送信しているCPUノード11のノード番号CPU1を表す。
IPアドレス403は、自ノード及び他ノードのIPアドレスを表す。例えばCPUノード11において、自CPUノードのIPアドレスA1と他CPUノード12〜14のそれぞれのIPアドレスB1、C1、D1を表している。
図5に示すノード管理テーブル300おいて、ノード番号501は、その生存状態情報400を送信したCPUノード又は照合ノード(自ノードを含む)のノード番号CPU1〜CPU2n、照合1〜照合2mを表している。
また、構成管理手段208は、主系ペア40と従系1ペア41〜従系(m−1)ペア43とを要求時に切り替える。
この場合、図3Bに示した構成管理手段208より、照合ノード21〜28は主系ペア40と従系ペア41〜43との主従関係が管理されている。照合ノード21〜28はこの主系ペア40と従系ペア41〜43のいずれかとの主従関係を入れ替える要求をする。
ステップS801で構成制御要求を受信した後、照合ノード21〜28は、自ノードが従系ペアに含まれ、かつ、ペア番号がもっとも小さいか否かを判断する(ステップS802)。
判断ステップS804において、自ノードのノード番号がペアとなる照合ノードのノード番号より小さい場合、照合ノード21〜28は、ステップS805に移行する。
そして、照合結果データを保持していた場合、照合ノード21〜28は、多重化ネットワーク1及び外部ネットワーク2へ保持している照合結果データを出力する(ステップS805)。
図10において、ノード番号1001は、自ノードを含む他の照合ノード番号照合1〜照合2mを表している。このノード番号1001に対して、それぞれ他の照合ノード22〜28の状態を管理するテーブル1002が設けられている。
また、IPアドレス1004は、照合ノード21が状態を把握している他の照合ノードのIPアドレスa1〜h1を表している。
判断ステップS1104において、自ノードが主系ペアに属していないときは、照合ノード21〜28は、自ノードの縮退処理をする(ステップS1105)。これは、自ノードのみが異常を検知していた場合、自ノードが障害をもっていると判断するからである。
照合ノード21〜28は、自ノードが主系ペアに属しているか否かを判断する(ステップS1202)。
判断ステップS1202において、自ノードが主系ペアに属していないときは、照合ノード21〜28は、自ノードの縮退処理をする(ステップS1203)。
また、サブシステム間で状態監視して異常検知時に主従関係を変更して構成制御することにより健全性を保障することを要求するフォールトトレラントシステムに利用可能である。
Claims (17)
- 実質的に同じ処理を同時に実行する複数の演算ノードと、
前記演算ノードからの演算結果を照合する複数の照合ノードと、
前記複数の演算ノードと前記複数の照合ノードとが接続された多重化ネットワークと、
前記複数の照合ノードが接続された外部ネットワークと、を備え、
前記各演算ノード及び前記各照合ノードは、自ノードの稼動状態を生存状態情報として定期的に前記多重化ネットワークを介して送信すると共に、他ノードの生存状態情報を前記多重化ネットワークを介して受信する情報収集部を有する
ことを特徴とする計算機システム。 - 前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは互いを監視する監視部を有する
ことを特徴とする請求項1に記載の計算機システム。 - 前記各照合ノードは、前記生存状態情報を記憶する管理テーブルを有する
ことを特徴とする請求項1に記載の計算機システム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、
前記演算ノードからの演算結果を照合する複数の照合ノードと、
前記複数の演算ノードと前記複数の照合ノードとが接続された多重化ネットワークと、
前記照合ノードが接続された外部ネットワークと、を備え、
前記各照合ノードは、自ノードの生存状態情報及び他ノードから出力される生存状態情報に基づいて自ノード及び他ノードの稼動状態を判断する生存判断部を有する
ことを特徴とする計算機システム。 - 前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは前記主従関係の照合ノードのいずれかの稼動状態を判断する主従判断部を有する
ことを特徴とする請求項4に記載の計算機システム。 - 前記主従判断部により主系の照合ノードが稼動していないと判断されたとき、稼動状態の従系の照合ノードを主系の照合ノードとする主従関係更新部を有する
ことを特徴とする請求項5に記載の計算機システム。 - 前記主従判断部により主系の照合ノードが稼動していないと判断されたとき、前記主系の照合ノードは自ノードの機能を縮退する縮退部を有する
ことを特徴とする請求項6に記載の計算機システム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力する計算機制御方法であって、
前記各演算ノード及び前記各照合ノードにおいて、自ノードの稼動状態を生存状態情報として定期的に前記多重化ネットワークを介して送信すると共に、他ノードの生存状態情報を前記多重化ネットワークを介して受信する情報収集ステップを含む
ことを特徴とする計算機制御方法。 - 前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは互いを監視する監視ステップを含む
ことを特徴とする請求項8に記載の計算機制御方法。 - 前記各照合ノードは、前記生存状態情報を記憶する管理テーブルを用いる
ことを特徴とする請求項8に記載の計算機制御方法。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力する計算機制御方法であって、
前記各照合ノードにおいて、自ノードの生存状態情報及び他ノードから出力される生存状態情報に基づいて自ノード及び他ノードの稼動状態を判断する生存判断ステップを含む
ことを特徴とする計算機制御方法。 - 前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは前記主従関係の照合ノードのいずれかの稼動状態を判断する主従判断ステップを含む
ことを特徴とする請求項11に記載の計算機制御方法。 - 前記主従判断ステップにより主系の照合ノードが稼動していないと判断されたとき、稼動状態の従系の照合ノードを主系の照合ノードとする主従関係更新ステップを含む
ことを特徴とする請求項12に記載の計算機制御方法。 - 前記主従判断ステップにより主系の照合ノードが稼動していないと判断されたとき、前記主系の照合ノードは自ノードの機能を縮退する縮退ステップを含む
ことを特徴とする請求項13に記載の計算機制御方法。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力するために、コンピュータを、前記複数の演算ノード及び前記複数の照合ノードとして機能させるための計算機制御プログラムであって、
前記各演算ノード及び前記各照合ノードにおいて、自ノードの稼動状態を生存状態情報として定期的に前記多重化ネットワークを介して送信すると共に、他ノードの生存状態情報を、前記多重化ネットワークを介して受信する情報収集機能を、
実現するための計算機制御プログラム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力するために、コンピュータを、前記複数の照合ノードとして機能させるための計算機制御プログラムであって、
前記各照合ノードにおいて、自ノードの生存状態情報及び他ノードから出力される生存状態情報に基づいて自ノード及び他ノードの稼動状態を判断する生存判断機能を、
コンピュータで実現するための計算機制御プログラム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、
前記演算ノードからの演算結果を照合する複数の照合ノードと、
前記複数の演算ノードと前記複数の照合ノードとが接続された多重化ネットワークと、
前記複数の照合ノードが接続された外部ネットワークと、を備え、
前記複数の照合ノードのうちの任意の照合ノードと他の照合ノードの対を照合ノードペアとし、前記照合ノードペアを複数組生成し、前記複数組の照合ノードペアのうちの1つを主系照合ノードペアとし、他の照合ノードペアを従系照合ノードペアとする
ことを特徴とする計算機システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008060017A JP5176231B2 (ja) | 2008-03-10 | 2008-03-10 | 計算機システム、計算機制御方法及び計算機制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008060017A JP5176231B2 (ja) | 2008-03-10 | 2008-03-10 | 計算機システム、計算機制御方法及び計算機制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009217504A true JP2009217504A (ja) | 2009-09-24 |
JP5176231B2 JP5176231B2 (ja) | 2013-04-03 |
Family
ID=41189287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008060017A Active JP5176231B2 (ja) | 2008-03-10 | 2008-03-10 | 計算機システム、計算機制御方法及び計算機制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5176231B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011076262A (ja) * | 2009-09-29 | 2011-04-14 | Hitachi Ltd | 計算機システムおよびその方法 |
JP2014197266A (ja) * | 2013-03-29 | 2014-10-16 | 富士通株式会社 | 情報処理システム,情報処理装置,情報処理装置の制御プログラム,及び情報処理システムの制御方法 |
JP2018106619A (ja) * | 2016-12-28 | 2018-07-05 | 株式会社日立製作所 | 計算機システム |
CN109741054A (zh) * | 2018-12-13 | 2019-05-10 | 平安普惠企业管理有限公司 | 交易数据处理方法、装置、计算机设备及可读存储介质 |
CN110959257A (zh) * | 2017-07-28 | 2020-04-03 | 国际商业机器公司 | 用处理器核中本地检测回路降低或减轻芯片上电源噪声电压 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07306794A (ja) * | 1994-05-12 | 1995-11-21 | Mitsubishi Electric Corp | 分散システム及び分散システムの高信頼化方法 |
JPH08314744A (ja) * | 1995-05-18 | 1996-11-29 | Hitachi Ltd | フォールトトレラントシステム |
JPH0923241A (ja) * | 1995-07-05 | 1997-01-21 | Fujitsu Ltd | 非同期型データの通信制御方法 |
JP2005130049A (ja) * | 2003-10-21 | 2005-05-19 | Fujitsu Ltd | ノード |
JP2005251055A (ja) * | 2004-03-08 | 2005-09-15 | Fujitsu Ltd | 高信頼システム、冗長構成制御方法及びプログラム |
JP2007228293A (ja) * | 2006-02-23 | 2007-09-06 | Mitsubishi Electric Corp | ノード装置および通信システム |
-
2008
- 2008-03-10 JP JP2008060017A patent/JP5176231B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07306794A (ja) * | 1994-05-12 | 1995-11-21 | Mitsubishi Electric Corp | 分散システム及び分散システムの高信頼化方法 |
JPH08314744A (ja) * | 1995-05-18 | 1996-11-29 | Hitachi Ltd | フォールトトレラントシステム |
JPH0923241A (ja) * | 1995-07-05 | 1997-01-21 | Fujitsu Ltd | 非同期型データの通信制御方法 |
JP2005130049A (ja) * | 2003-10-21 | 2005-05-19 | Fujitsu Ltd | ノード |
JP2005251055A (ja) * | 2004-03-08 | 2005-09-15 | Fujitsu Ltd | 高信頼システム、冗長構成制御方法及びプログラム |
JP2007228293A (ja) * | 2006-02-23 | 2007-09-06 | Mitsubishi Electric Corp | ノード装置および通信システム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011076262A (ja) * | 2009-09-29 | 2011-04-14 | Hitachi Ltd | 計算機システムおよびその方法 |
JP2014197266A (ja) * | 2013-03-29 | 2014-10-16 | 富士通株式会社 | 情報処理システム,情報処理装置,情報処理装置の制御プログラム,及び情報処理システムの制御方法 |
JP2018106619A (ja) * | 2016-12-28 | 2018-07-05 | 株式会社日立製作所 | 計算機システム |
CN110959257A (zh) * | 2017-07-28 | 2020-04-03 | 国际商业机器公司 | 用处理器核中本地检测回路降低或减轻芯片上电源噪声电压 |
JP2020529072A (ja) * | 2017-07-28 | 2020-10-01 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | プロセッサ・コアにおいてローカル検出ループを使用するオンチップ電源ノイズ電圧の低減または軽減 |
JP7279013B2 (ja) | 2017-07-28 | 2023-05-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | プロセッサ・コアにおいてローカル検出ループを使用するオンチップ電源ノイズ電圧の低減または軽減 |
CN110959257B (zh) * | 2017-07-28 | 2023-11-28 | 国际商业机器公司 | 用处理器核中本地检测回路降低或减轻芯片上电源噪声电压 |
CN109741054A (zh) * | 2018-12-13 | 2019-05-10 | 平安普惠企业管理有限公司 | 交易数据处理方法、装置、计算机设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5176231B2 (ja) | 2013-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106331098B (zh) | 一种服务器集群系统 | |
US8892936B2 (en) | Cluster wide consistent detection of interconnect failures | |
US7702667B2 (en) | Methods and systems for validating accessibility and currency of replicated data | |
US6928589B1 (en) | Node management in high-availability cluster | |
JP4648447B2 (ja) | 障害復旧方法、プログラムおよび管理サーバ | |
JP5548829B2 (ja) | 計算機システム、データ管理方法及びデータ管理プログラム | |
CN109845192B (zh) | 动态地适配网络的计算机系统和方法及计算机可读介质 | |
JP2011091464A (ja) | ネットワーク構成の想定のための装置、システム | |
JP5176231B2 (ja) | 計算機システム、計算機制御方法及び計算機制御プログラム | |
JP2011145823A (ja) | 通信システム及びその障害検出方法 | |
CN107968847A (zh) | 高可用id生成器及其id生成方法和装置 | |
KR20220052654A (ko) | 메시지 전송 버스를 이용한 고가용성 배전 지능화 시스템 및 지능화 클러스터 시스템 | |
CN112994935A (zh) | prometheus管控方法、装置、设备及存储介质 | |
CN111708668B (zh) | 集群故障的处理方法、装置及电子设备 | |
JP2015146165A (ja) | 障害耐性信号処理装置および障害耐性信号処理方法 | |
US8489721B1 (en) | Method and apparatus for providing high availabilty to service groups within a datacenter | |
JP5446405B2 (ja) | イベント検出制御方法及びシステム | |
Venâncio et al. | VNF‐Consensus: A virtual network function for maintaining a consistent distributed software‐defined network control plane | |
JP6091376B2 (ja) | クラスタシステムおよびSplit−BrainSyndrome検出方法 | |
CN111309515B (zh) | 一种容灾控制方法、装置及系统 | |
CA2241861C (en) | A scheme to perform event rollup | |
KR20200113995A (ko) | 엣지 인공지능 서비스에 대한 고가용성 보장을 위한 삼중화 이상 다중화 구조 및 방법 | |
JP2016015065A (ja) | プロセス監視制御システム | |
JP6318902B2 (ja) | 冗長システムおよび冗長化方法 | |
CN113626252A (zh) | 一种基于集群的城市级容灾方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5176231 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |