JP5176231B2 - 計算機システム、計算機制御方法及び計算機制御プログラム - Google Patents
計算機システム、計算機制御方法及び計算機制御プログラム Download PDFInfo
- Publication number
- JP5176231B2 JP5176231B2 JP2008060017A JP2008060017A JP5176231B2 JP 5176231 B2 JP5176231 B2 JP 5176231B2 JP 2008060017 A JP2008060017 A JP 2008060017A JP 2008060017 A JP2008060017 A JP 2008060017A JP 5176231 B2 JP5176231 B2 JP 5176231B2
- Authority
- JP
- Japan
- Prior art keywords
- nodes
- collation
- node
- pair
- master
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
従って、上述した特許文献1、2に記載の技術では、一連のノード処理だけでは高信頼性データを得ることができず、ネットワーク障害にも対応できないというような課題が発生する。
を有することを特徴とする。
また、本発明の計算機システムは、複数の照合ノードのうちの任意の照合ノードと他の照合ノードの対を照合ノードペアとし、照合ノードペアを複数組生成し、複数組の照合ノードペアのうちの1つを主系照合ノードペアとし、他の照合ノードペアを従系照合ノードペアとし、前記主系照合ノードペア,前記従系照合ノードペアが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系照合ノードペアは前記選出したデータを出力し、前記従系照合ノードペアは前記選出したデータを保持し、前記主系照合ノードペアの照合ノード同士で前記選出したデータの内容が一致しなかった場合、いずれかの前記従系照合ノードペアが、前記主系照合ノードペアに切替わり、前記保持していたデータを出力することを特徴とする。
図1は、本実施の形態例のシステム構成例を示している。
図1において、本実施の形態例の計算機システム10は、演算処理を行なうCPU(Central Processing Unit)ノード11〜14と、演算処理の結果を照合する照合ノード21〜28を備えている。
図3は、CPUノード及び照合ノードのコンピュータに計算機制御プログラムを実行させたときに、機能を実行する手段を示している。
なお、各CPUノード11〜14は、演算処理を行なう演算手段105と、演算処理の結果を出力する演算結果データ出力手段106とを有している。
また、各照合ノード21〜28は、自ノードの機能を縮退させる縮退手段209と、他ノードの機能を縮退させる要求をする縮退要求手段210とを有する。
図4Aにおいて、自ノード番号401は、この生存状態情報400を送信しているCPUノード11のノード番号CPU1を表す。
IPアドレス403は、自ノード及び他ノードのIPアドレスを表す。例えばCPUノード11において、自CPUノードのIPアドレスA1と他CPUノード12〜14のそれぞれのIPアドレスB1、C1、D1を表している。
図5に示すノード管理テーブル300おいて、ノード番号501は、その生存状態情報400を送信したCPUノード又は照合ノード(自ノードを含む)のノード番号CPU1〜CPU2n、照合1〜照合2mを表している。
また、構成管理手段208は、主系ペア40と従系1ペア41〜従系(m−1)ペア43とを要求時に切り替える。
この場合、図3Bに示した構成管理手段208より、照合ノード21〜28は主系ペア40と従系ペア41〜43との主従関係が管理されている。照合ノード21〜28はこの主系ペア40と従系ペア41〜43のいずれかとの主従関係を入れ替える要求をする。
ステップS801で構成制御要求を受信した後、照合ノード21〜28は、自ノードが従系ペアに含まれ、かつ、ペア番号がもっとも小さいか否かを判断する(ステップS802)。
判断ステップS804において、自ノードのノード番号がペアとなる照合ノードのノード番号より小さい場合、照合ノード21〜28は、ステップS805に移行する。
そして、照合結果データを保持していた場合、照合ノード21〜28は、多重化ネットワーク1及び外部ネットワーク2へ保持している照合結果データを出力する(ステップS805)。
図10において、ノード番号1001は、自ノードを含む他の照合ノード番号照合1〜照合2mを表している。このノード番号1001に対して、それぞれ他の照合ノード22〜28の状態を管理するテーブル1002が設けられている。
また、IPアドレス1004は、照合ノード21が状態を把握している他の照合ノードのIPアドレスa1〜h1を表している。
判断ステップS1104において、自ノードが主系ペアに属していないときは、照合ノード21〜28は、自ノードの縮退処理をする(ステップS1105)。これは、自ノードのみが異常を検知していた場合、自ノードが障害をもっていると判断するからである。
照合ノード21〜28は、自ノードが主系ペアに属しているか否かを判断する(ステップS1202)。
判断ステップS1202において、自ノードが主系ペアに属していないときは、照合ノード21〜28は、自ノードの縮退処理をする(ステップS1203)。
また、サブシステム間で状態監視して異常検知時に主従関係を変更して構成制御することにより健全性を保障することを要求するフォールトトレラントシステムに利用可能である。
Claims (13)
- 実質的に同じ処理を同時に実行する複数の演算ノードと、
前記演算ノードからの演算結果を照合する複数の照合ノードと、
前記複数の演算ノードと前記複数の照合ノードとが接続された多重化ネットワークと、
前記複数の照合ノードが接続された外部ネットワークと、を備え、
前記各演算ノード及び前記各照合ノードは、自ノードの稼動状態を生存状態情報として定期的に前記多重化ネットワークを介して送信すると共に、他ノードの生存状態情報を前記多重化ネットワークを介して受信する情報収集部を有し、
前記各照合ノードは、
前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは互いを監視する監視部と、
前記主系,前記従系の各対の照合ノードが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系の対の照合ノードは前記選出したデータを出力し、前記従系の対の照合ノードは前記選出したデータを保持し、前記主系の対の照合ノード同士で前記選出したデータの内容が一致しなかった場合、前記従系のいずれかの対の照合ノードが、前記主系の対の照合ノードに切替わり、前記保持していたデータを出力するデータ比較照合・出力部とを有する
ことを特徴とする計算機システム。 - 前記各照合ノードは、前記生存状態情報を記憶する管理テーブルを有する
ことを特徴とする請求項1に記載の計算機システム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、
前記演算ノードからの演算結果を照合する複数の照合ノードと、
前記複数の演算ノードと前記複数の照合ノードとが接続された多重化ネットワークと、
前記照合ノードが接続された外部ネットワークと、を備え、
前記各照合ノードは、
自ノードの生存状態情報及び他ノードから出力される生存状態情報に基づいて自ノード及び他ノードの稼動状態を判断する生存判断部と、
前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは前記主従関係の照合ノードのいずれかの稼動状態を判断する主従判断部と、
前記主系,前記従系の各対の照合ノードが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系の対の照合ノードは前記選出したデータを出力し、前記従系の対の照合ノードは前記選出したデータを保持し、前記主系の対の照合ノード同士で前記選出したデータの内容が一致しなかった場合、前記従系のいずれかの対の照合ノードが、前記主系の対の照合ノードに切替わり、前記保持していたデータを出力するデータ比較照合・出力部とを有する
ことを特徴とする計算機システム。 - 前記主従判断部により主系の照合ノードが稼動していないと判断されたとき、稼動状態の従系の照合ノードを主系の照合ノードとする主従関係更新部を有する
ことを特徴とする請求項3に記載の計算機システム。 - 前記主従判断部により主系の照合ノードが稼動していないと判断されたとき、前記主系の照合ノードは自ノードの機能を縮退する縮退部を有する
ことを特徴とする請求項4に記載の計算機システム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力する計算機制御方法であって、
前記各演算ノード及び前記各照合ノードにおいて、自ノードの稼動状態を生存状態情報として定期的に前記多重化ネットワークを介して送信すると共に、他ノードの生存状態情報を前記多重化ネットワークを介して受信する情報収集ステップと、
前記各照合ノードにおいて、前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは互いを監視する監視ステップと、
前記各照合ノードにおいて、前記主系,前記従系の各対の照合ノードが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系の対の照合ノードは前記選出したデータを出力し、前記従系の対の照合ノードは前記選出したデータを保持し、前記主系の対の照合ノード同士で前記選出したデータの内容が一致しなかった場合、前記従系のいずれかの対の照合ノードが、前記主系の対の照合ノードに切替わり、前記保持していたデータを出力するデータ比較照合・出力ステップとを含む
ことを特徴とする計算機制御方法。 - 前記各照合ノードは、前記生存状態情報を記憶する管理テーブルを用いる
ことを特徴とする請求項6に記載の計算機制御方法。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力する計算機制御方法であって、
前記各照合ノードにおいて、自ノードの生存状態情報及び他ノードから出力される生存状態情報に基づいて自ノード及び他ノードの稼動状態を判断する生存判断ステップと、
前記各照合ノードにおいて、前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは前記主従関係の照合ノードのいずれかの稼動状態を判断する主従判断ステップと、
前記各照合ノードにおいて、前記主系,前記従系の各対の照合ノードが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系の対の照合ノードは前記選出したデータを出力し、前記従系の対の照合ノードは前記選出したデータを保持し、前記主系の対の照合ノード同士で前記選出したデータの内容が一致しなかった場合、前記従系のいずれかの対の照合ノードが、前記主系の対の照合ノードに切替わり、前記保持していたデータを出力するデータ比較照合・出力ステップとを含む
ことを特徴とする計算機制御方法。 - 前記主従判断ステップにより主系の照合ノードが稼動していないと判断されたとき、稼動状態の従系の照合ノードを主系の照合ノードとする主従関係更新ステップを含む
ことを特徴とする請求項8に記載の計算機制御方法。 - 前記主従判断ステップにより主系の照合ノードが稼動していないと判断されたとき、前記主系の照合ノードは自ノードの機能を縮退する縮退ステップを含む
ことを特徴とする請求項9に記載の計算機制御方法。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力するために、コンピュータを、前記複数の演算ノード及び前記複数の照合ノードとして機能させるための計算機制御プログラムであって、
前記各演算ノード及び前記各照合ノードにおいて、自ノードの稼動状態を生存状態情報として定期的に前記多重化ネットワークを介して送信すると共に、他ノードの生存状態情報を、前記多重化ネットワークを介して受信する情報収集機能と、
前記各照合ノードにおいて、前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは互いを監視する監視機能と、
前記各照合ノードにおいて、前記主系,前記従系の各対の照合ノードが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系の対の照合ノードは前記選出したデータを出力し、前記従系の対の照合ノードは前記選出したデータを保持し、前記主系の対の照合ノード同士で前記選出したデータの内容が一致しなかった場合、前記従系のいずれかの対の照合ノードが、前記主系の対の照合ノードに切替わり、前記保持していたデータを出力するデータ比較照合・出力機能とを、
コンピュータに実現させるための計算機制御プログラム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、前記演算ノードからの演算結果を照合する複数の照合ノードとが多重化ネットワークを介して通信を行い、前記複数の照合ノードが外部ネットワークに照合結果を出力するために、コンピュータを、前記複数の照合ノードとして機能させるための計算機制御プログラムであって、
前記各照合ノードにおいて、自ノードの生存状態情報及び他ノードから出力される生存状態情報に基づいて自ノード及び他ノードの稼動状態を判断する生存判断機能と、
前記各照合ノードにおいて、前記複数の照合ノードのうち一対を主系とし他の対を従系と定め、主従関係の照合ノードは互いを監視する監視機能と、
前記各照合ノードにおいて、前記主系,前記従系の各対の照合ノードが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系の対の照合ノードは前記選出したデータを出力し、前記従系の対の照合ノードは前記選出したデータを保持し、前記主系の対の照合ノード同士で前記選出したデータの内容が一致しなかった場合、前記従系のいずれかの対の照合ノードが、前記主系の対の照合ノードに切替わり、前記保持していたデータを出力するデータ比較照合・出力機能とを、
コンピュータに実現させるための計算機制御プログラム。 - 実質的に同じ処理を同時に実行する複数の演算ノードと、
前記演算ノードからの演算結果を照合する複数の照合ノードと、
前記複数の演算ノードと前記複数の照合ノードとが接続された多重化ネットワークと、
前記複数の照合ノードが接続された外部ネットワークと、を備え、
前記複数の照合ノードのうちの任意の照合ノードと他の照合ノードの対を照合ノードペアとし、前記照合ノードペアを複数組生成し、前記複数組の照合ノードペアのうちの1つを主系照合ノードペアとし、他の照合ノードペアを従系照合ノードペアとし、
前記主系照合ノードペア,前記従系照合ノードペアが、前記複数の演算ノードからの演算結果データのうち最も信頼性があるデータを選出する同一の処理を実行し、前記主系照合ノードペアは前記選出したデータを出力し、前記従系照合ノードペアは前記選出したデータを保持し、前記主系照合ノードペアの照合ノード同士で前記選出したデータの内容が一致しなかった場合、いずれかの前記従系照合ノードペアが、前記主系照合ノードペアに切替わり、前記保持していたデータを出力する
ことを特徴とする計算機システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008060017A JP5176231B2 (ja) | 2008-03-10 | 2008-03-10 | 計算機システム、計算機制御方法及び計算機制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008060017A JP5176231B2 (ja) | 2008-03-10 | 2008-03-10 | 計算機システム、計算機制御方法及び計算機制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009217504A JP2009217504A (ja) | 2009-09-24 |
JP5176231B2 true JP5176231B2 (ja) | 2013-04-03 |
Family
ID=41189287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008060017A Active JP5176231B2 (ja) | 2008-03-10 | 2008-03-10 | 計算機システム、計算機制御方法及び計算機制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5176231B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5342395B2 (ja) * | 2009-09-29 | 2013-11-13 | 株式会社日立製作所 | 計算機システムおよびその方法 |
JP6089884B2 (ja) * | 2013-03-29 | 2017-03-08 | 富士通株式会社 | 情報処理システム,情報処理装置,情報処理装置の制御プログラム,及び情報処理システムの制御方法 |
JP6653250B2 (ja) * | 2016-12-28 | 2020-02-26 | 株式会社日立製作所 | 計算機システム |
US10171081B1 (en) * | 2017-07-28 | 2019-01-01 | International Business Machines Corporation | On-chip supply noise voltage reduction or mitigation using local detection loops in a processor core |
CN109741054A (zh) * | 2018-12-13 | 2019-05-10 | 平安普惠企业管理有限公司 | 交易数据处理方法、装置、计算机设备及可读存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07306794A (ja) * | 1994-05-12 | 1995-11-21 | Mitsubishi Electric Corp | 分散システム及び分散システムの高信頼化方法 |
JPH08314744A (ja) * | 1995-05-18 | 1996-11-29 | Hitachi Ltd | フォールトトレラントシステム |
JPH0923241A (ja) * | 1995-07-05 | 1997-01-21 | Fujitsu Ltd | 非同期型データの通信制御方法 |
JP2005130049A (ja) * | 2003-10-21 | 2005-05-19 | Fujitsu Ltd | ノード |
JP4318211B2 (ja) * | 2004-03-08 | 2009-08-19 | 富士通株式会社 | 高信頼システム、冗長構成制御方法及びプログラム |
JP2007228293A (ja) * | 2006-02-23 | 2007-09-06 | Mitsubishi Electric Corp | ノード装置および通信システム |
-
2008
- 2008-03-10 JP JP2008060017A patent/JP5176231B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009217504A (ja) | 2009-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7702667B2 (en) | Methods and systems for validating accessibility and currency of replicated data | |
JP4648447B2 (ja) | 障害復旧方法、プログラムおよび管理サーバ | |
EP2092432B1 (en) | Message forwarding backup manager in a distributed server system | |
US8892936B2 (en) | Cluster wide consistent detection of interconnect failures | |
US6928589B1 (en) | Node management in high-availability cluster | |
JP5033856B2 (ja) | ネットワーク構成の想定のための装置、システム | |
JP5548829B2 (ja) | 計算機システム、データ管理方法及びデータ管理プログラム | |
JP5176231B2 (ja) | 計算機システム、計算機制御方法及び計算機制御プログラム | |
CN109845192B (zh) | 动态地适配网络的计算机系统和方法及计算机可读介质 | |
US9231779B2 (en) | Redundant automation system | |
KR20220052654A (ko) | 메시지 전송 버스를 이용한 고가용성 배전 지능화 시스템 및 지능화 클러스터 시스템 | |
JP2011145823A (ja) | 通信システム及びその障害検出方法 | |
CN107968847A (zh) | 高可用id生成器及其id生成方法和装置 | |
CN112994935A (zh) | prometheus管控方法、装置、设备及存储介质 | |
CN111708668B (zh) | 集群故障的处理方法、装置及电子设备 | |
JP2015146165A (ja) | 障害耐性信号処理装置および障害耐性信号処理方法 | |
US8489721B1 (en) | Method and apparatus for providing high availabilty to service groups within a datacenter | |
JP5446405B2 (ja) | イベント検出制御方法及びシステム | |
Venâncio et al. | VNF‐Consensus: A virtual network function for maintaining a consistent distributed software‐defined network control plane | |
JP6091376B2 (ja) | クラスタシステムおよびSplit−BrainSyndrome検出方法 | |
CN110290163A (zh) | 一种数据处理方法及装置 | |
CN111309515B (zh) | 一种容灾控制方法、装置及系统 | |
KR20200113995A (ko) | 엣지 인공지능 서비스에 대한 고가용성 보장을 위한 삼중화 이상 다중화 구조 및 방법 | |
CN115550287A (zh) | 一种远程复制关系的建立方法及相关装置 | |
JP2016015065A (ja) | プロセス監視制御システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5176231 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |