JP2007058708A - 多重系システム - Google Patents
多重系システム Download PDFInfo
- Publication number
- JP2007058708A JP2007058708A JP2005245319A JP2005245319A JP2007058708A JP 2007058708 A JP2007058708 A JP 2007058708A JP 2005245319 A JP2005245319 A JP 2005245319A JP 2005245319 A JP2005245319 A JP 2005245319A JP 2007058708 A JP2007058708 A JP 2007058708A
- Authority
- JP
- Japan
- Prior art keywords
- cpu
- lxp
- computer
- general
- switching control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
Abstract
【解決手段】 複数計算機の相互監視のために、汎用LAN1・102、LAN2・103という2つの独立した経路を用いる。ネットワークドライバも、それぞれの経路102,103に対応させて2つに分離する。内部バスをバス上の電文流量が固定されCPUの制御に用いる管理バス120と、電文量が変動しCPUとの通信に用いる拡張バス121に分離する。系切換え制御(LXP)ボード116のドライバは、割込み処理118をしないで、ポーリング方式により障害情報信号を送受信する。系切換え制御(LXP)ボード116は、他系からのCPU再起動(リセット)機能,他系からのCPU停止機能,自系のCPU停止機能を備えている。
【選択図】 図1
Description
(1)ネットワークの二重化
複数の計算機が相互監視するための通信経路は、互いに独立した2つの汎用ネットワークからなる二重構成とする。
(2)ネットワークドライバの二重化
複数の計算機を相互監視するために独立した2つのネットワークを制御するネットワークドライバ(ネットワーク制御プログラム)も、それぞれの経路に対応するように2つに分離する。
(3)内部バスの二重化
内部バスを管理バスと拡張バスとに分離し、二重化する。
(4)系切換え制御(LXP)ドライバのポーリング
分離された系切換え制御(LXP)ドライバは、割込み処理をすることなく、系切換え制御(LXP)ボードに対して送信要求または処理要求がないかを定期的にポーリングし、他周辺機器からの電文量の影響を受けないで、障害情報信号のみを送受信する。
(5)CPU再起動(リセット)/停止
障害発生が発生すると、それを検出した計算機が、障害系にCPU再起動(リセット)要求電文を送信する。CPU再起動(リセット)要求電文を受信した障害系の系切換え制御(LXP)ボードが、OSに対してマスク不可能割込み信号を発生させる。マスク不可能割込み信号に応じて当該時点におけるメインメモリの内容をディスク装置に保存するメモリダンプを開始する。メモリダンプ終了後にシステム停止または再起動(リセット)を実行する。
(1)ネットワークの二重化
計算機間で相互に監視する際に、それぞれが汎用ネットワークであるLAN1・102、LAN2・103という物理的に独立した2つの経路を用いる。
(2)ネットワークドライバの二重化
汎用ネットワークの二重化に伴い、OS130内の汎用ドライバについても二重化する。OS130内の汎用ドライバは、通常の汎用ドライバ(Ethernetドライバ)141と系切換え制御(LXP)ドライバ142とに二重化する。
(3)内部バスの分離
内部バスを管理バス120と拡張バス121とに分離する。1つの計算機の内部で、系切換え制御ボード116は、CPU110の制御に管理バス120を用い、CPU110との通信に拡張バス121を用いる。拡張バス121は、SCSIボード等の機能拡張ボードと通信するので、バス上の電文量が変動する。これに対して、管理バス120は、バス上の電文流量が固定であるため、CPU110の再起動要求実行時などに障害要因が少ない。また、相互の障害監視に用いると、相手系に発生した障害を検知できる。
(4)系切換え制御(LXP)ドライバのポーリング
系切換え制御(LXP)ドライバ142は、割込み処理プログラム118を使用せずに、ポーリングによって送受信する。
(5)CPU再起動(リセット)/停止機能
系切換え制御(LXP)ボード116は、他系からのCPU再起動(リセット)機能,他系からのCPU停止機能,自系のCPU停止機能を備えている。
a.他系からのCPU再起動(リセット)/停止機能
図7は、他系監視プログラムにより、障害情報を収集して、CPUを停止する処理手順を示すタイムチャートである。
b.他系からのCPU再起動(リセット)/停止機能
図8は、他系監視プログラムにより、障害情報を収集しないで、CPUを停止する処理手順を示すタイムチャートである。
c.自系のCPU停止機能
再起動(リセット)制御装置201は、自系のCPU停止要求信号を受信すると、拡張バス121に対して障害通知信号を発生させ、NMI割込みを発生させる。
102 LAN1
103 LAN2
104,105 汎用ネットワーク
111 メインメモリ
112 入出力制御装置(I/O)
113 ディスク装置
114 LAN制御装置
115 LANボード
116 系切換え制御(LXP)ボード
117 ソフトウェア
118 割込処理プログラム
120 管理バス
121 拡張バス
122 拡張管理バス
130 OS
131 アプリケーション
132 管理プログラム
133 他系監視プログラム
141 Ethernetドライバ
142 LXPドライバ
143 管理バス用ドライバ
144 I/F層
145 UDP/IP層
150 生存通知電文
151 スプリットブレイン状態
152 高負荷状態(輻輳状態)
200 ネットワークインタフェース
201 再起動(リセット)制御装置
202 電文比較回路
209 CPUリセット停止信号
Claims (6)
- 複数の計算機が稼働系または待機系として組み合わされて相互監視し稼働系計算機の障害発生時に当該計算機が実行している処理を待機系計算機が引き継ぐ多重系システムにおいて、
前記複数の計算機が相互監視するための通信経路は、他系監視プログラムが他計算機と主に生存通知電文を送受信するLAN制御装置を含む汎用ネットワークと、他系監視プログラムが他計算機と主に系切換えに関連する情報を送受信する系切換え制御(LXP)ボードを含む汎用ネットワークとからなり、互いに独立した二重構成であることを特徴とする多重系システム。 - 請求項1に記載の多重系システムにおいて、
前記複数の計算機を相互監視するために独立した2つの汎用ネットワークを制御するネットワークドライバ(ネットワーク制御プログラム)が、それぞれの経路に対応してインタフェース層および汎用通信プロトコル層を経由して他系監視プログラムと通信する汎用ドライバと、他系監視プログラムと直接通信する系切換え制御(LXP)ドライバとに分離していることを特徴とする多重系システム。 - 請求項1または2に記載の多重系システムにおいて、
系切換え制御(LXP)ボードを接続する内部バスが、バス上の電文流量が固定されCPUの制御に用いる管理バスと、バス上の電文量が変動しCPUとの通信に用いる拡張バスとに分離されていることを特徴とする多重系システム。 - 請求項1ないし3のいずれか一項に記載の多重系システムにおいて、
前記系切換え制御(LXP)ボードが、他系からの電文がCPU再起動(リセット)要求電文かCPU停止要求電文かを判断する電文比較回路と、CPU再起動(リセット)要求である場合はCPUに割込み信号を出力し、CPU停止要求である場合はCPUにCPU停止信号を出力する再起動(リセット)制御装置とを搭載していることを特徴とする多重系システム。 - 請求項2ないし4のいずれか一項に記載の多重系システムにおいて、
前記系切換え制御(LXP)ドライバが、割込み処理をすることなく、系切換え制御(LXP)ボードに対して送信要求または処理要求がないかを定期的にポーリングし、障害情報信号のみを送受信するポーリングプログラムを含むことを特徴とする多重系システム。 - 請求項1ないし5のいずれか一項に記載の多重系システムの再起動(リセット)/停止方法において、
障害発生を検出した計算機が、障害系にCPU再起動(リセット)要求電文を送信し、
CPU再起動(リセット)要求電文を受信した障害系の系切換え制御(LXP)ボードが、OSに対してマスク不可能割込み信号を発生させ、
マスク不可能割込み信号に応じて当該時点におけるメインメモリの内容をディスク装置に保存するメモリダンプを開始し、
メモリダンプ終了後にシステム停止または再起動(リセット)を実行し、
マスク不可能割込み信号によっても障害系がメモリダンプを実行しないデッドロック状態では、障害発生を検出した計算機が、障害系にCPU停止要求電文を送信し、
CPU停止要求電文を受信した障害系の系切換え制御(LXP)ボードが、障害系をCPU停止状態とすることを特徴とする多重系システムの再起動(リセット)/停止方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245319A JP4487260B2 (ja) | 2005-08-26 | 2005-08-26 | 多重系システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245319A JP4487260B2 (ja) | 2005-08-26 | 2005-08-26 | 多重系システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058708A true JP2007058708A (ja) | 2007-03-08 |
JP4487260B2 JP4487260B2 (ja) | 2010-06-23 |
Family
ID=37922127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005245319A Expired - Fee Related JP4487260B2 (ja) | 2005-08-26 | 2005-08-26 | 多重系システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4487260B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009040199A (ja) * | 2007-08-08 | 2009-02-26 | Mitsubishi Electric Corp | 運行管理用フォルトトレラントシステム |
JP2011039630A (ja) * | 2009-08-07 | 2011-02-24 | Hitachi Ltd | Cpu脱着型のフェールセーフ装置及びフェールセーフ用プログラム |
JP2013084121A (ja) * | 2011-10-11 | 2013-05-09 | Hitachi Ltd | 多重系制御装置 |
JP2013250918A (ja) * | 2012-06-04 | 2013-12-12 | Hitachi Ltd | 複数計算機が独立動作する制御システム |
JP2013254333A (ja) * | 2012-06-06 | 2013-12-19 | Hitachi Ltd | 多重系制御システム及びその制御方法 |
JP2014044690A (ja) * | 2012-08-29 | 2014-03-13 | Hitachi Ltd | 計算機制御装置、方法およびプログラム |
CN116238569A (zh) * | 2023-03-23 | 2023-06-09 | 北京全路通信信号研究设计院集团有限公司 | 主备平台切换方法、装置、设备、系统及介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101362237B1 (ko) * | 2012-05-29 | 2014-02-13 | 린나이코리아 주식회사 | 복수의 마이컴을 구비한 보일러에서 마이컴 상호 감시를 통한 가스안전 차단방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999026138A1 (fr) * | 1997-11-14 | 1999-05-27 | Hitachi, Ltd. | Procede de permutation dans un systeme multiplex |
JP2003067219A (ja) * | 2001-08-29 | 2003-03-07 | Hitachi Ltd | 電子計算機システム及びその復旧処理方法 |
-
2005
- 2005-08-26 JP JP2005245319A patent/JP4487260B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999026138A1 (fr) * | 1997-11-14 | 1999-05-27 | Hitachi, Ltd. | Procede de permutation dans un systeme multiplex |
JP2003067219A (ja) * | 2001-08-29 | 2003-03-07 | Hitachi Ltd | 電子計算機システム及びその復旧処理方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009040199A (ja) * | 2007-08-08 | 2009-02-26 | Mitsubishi Electric Corp | 運行管理用フォルトトレラントシステム |
JP2011039630A (ja) * | 2009-08-07 | 2011-02-24 | Hitachi Ltd | Cpu脱着型のフェールセーフ装置及びフェールセーフ用プログラム |
JP2013084121A (ja) * | 2011-10-11 | 2013-05-09 | Hitachi Ltd | 多重系制御装置 |
JP2013250918A (ja) * | 2012-06-04 | 2013-12-12 | Hitachi Ltd | 複数計算機が独立動作する制御システム |
JP2013254333A (ja) * | 2012-06-06 | 2013-12-19 | Hitachi Ltd | 多重系制御システム及びその制御方法 |
JP2014044690A (ja) * | 2012-08-29 | 2014-03-13 | Hitachi Ltd | 計算機制御装置、方法およびプログラム |
CN116238569A (zh) * | 2023-03-23 | 2023-06-09 | 北京全路通信信号研究设计院集团有限公司 | 主备平台切换方法、装置、设备、系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4487260B2 (ja) | 2010-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4487260B2 (ja) | 多重系システム | |
US8332506B2 (en) | Network monitor program executed in a computer of cluster system, information processing method and computer | |
JP2006195821A (ja) | 情報処理システムの制御方法、情報処理システム、ダイレクトメモリアクセス制御装置、プログラム | |
WO2015104841A1 (ja) | 多重系システムおよび多重系システム管理方法 | |
CN104050061A (zh) | 一种基于PCIe总线多主控板冗余备份系统 | |
JP2004054907A (ja) | プログラマブルコントローラ及びcpuユニット並びに通信ユニット及び通信ユニットの制御方法 | |
JP2004171370A (ja) | 冗長構成におけるクライアント/サーバ間のアドレス制御方式および方法 | |
WO2007105271A1 (ja) | ネットワーク・システム | |
WO1999026138A1 (fr) | Procede de permutation dans un systeme multiplex | |
JP2011203941A (ja) | 情報処理装置、監視方法、および監視プログラム | |
JP2008152552A (ja) | 計算機システム及び障害情報管理方法 | |
CN105553735A (zh) | 一种堆叠系统故障处理方法、设备及堆叠系统 | |
JP2008003731A (ja) | 情報処理システム | |
JP2013254333A (ja) | 多重系制御システム及びその制御方法 | |
JP2000020336A (ja) | 二重化通信システム | |
JP4692419B2 (ja) | ネットワーク装置及びそれに用いる冗長切替え方法並びにそのプログラム | |
JP2008287632A (ja) | 制御装置復帰システム | |
JP7431034B2 (ja) | コントローラ及び施設監視システム | |
JP7306983B2 (ja) | コントローラ及び施設監視システム | |
JP2004213412A (ja) | 二重化制御装置 | |
JP2012104869A (ja) | ネットワークシステム | |
JP2006171995A (ja) | 制御用計算機 | |
JPH1196033A (ja) | 情報処理装置 | |
JP5951520B2 (ja) | 多重系処理システム | |
JP2010244129A (ja) | 計算機システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100223 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100318 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4487260 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140409 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |