JP4487260B2 - 多重系システム - Google Patents
多重系システム Download PDFInfo
- Publication number
- JP4487260B2 JP4487260B2 JP2005245319A JP2005245319A JP4487260B2 JP 4487260 B2 JP4487260 B2 JP 4487260B2 JP 2005245319 A JP2005245319 A JP 2005245319A JP 2005245319 A JP2005245319 A JP 2005245319A JP 4487260 B2 JP4487260 B2 JP 4487260B2
- Authority
- JP
- Japan
- Prior art keywords
- computer
- cpu
- message
- general
- restart
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
Description
(1)ネットワークの二重化
複数の計算機が相互監視するための通信経路は、互いに独立した2つの汎用ネットワークからなる二重構成とする。
(2)ネットワークドライバの二重化
複数の計算機を相互監視するために独立した2つのネットワークを制御するネットワークドライバ(ネットワーク制御プログラム)も、それぞれの経路に対応するように2つに分離する。
(3)内部バスの二重化
内部バスを管理バスと拡張バスとに分離し、二重化する。
(4)系切換え制御(LXP)ドライバのポーリング
分離された系切換え制御(LXP)ドライバは、割込み処理をすることなく、系切換え制御(LXP)ボードに対して送信要求または処理要求がないかを定期的にポーリングし、他周辺機器からの電文量の影響を受けないで、障害情報信号のみを送受信する。
(5)CPU再起動(リセット)/停止
障害発生が発生すると、それを検出した計算機が、障害系にCPU再起動(リセット)要求電文を送信する。CPU再起動(リセット)要求電文を受信した障害系の系切換え制御(LXP)ボードが、OSに対してマスク不可能割込み信号を発生させる。マスク不可能割込み信号に応じて当該時点におけるメインメモリの内容をディスク装置に保存するメモリダンプを開始する。メモリダンプ終了後にシステム停止または再起動(リセット)を実行する。
具体的には、本発明は、複数の計算機が稼働系または待機系として組み合わされ、各計算機に備えられた他系監視プログラムにより相互監視して稼働系計算機の障害発生時に当該計算機が実行している処理を待機系計算機が引き継ぐ多重系システムにおいて、前記複数の計算機は、それぞれ、前記他系監視プログラムが他計算機と生存通知電文を送受信するLAN制御装置と、前記他系監視プログラムが他計算機と系切換えに関連する情報を送受信する系切換え制御ボードとを備え、各計算機の前記LAN制御装置は、インタフェース層および汎用通信プロトコル層を経由して前記他系監視プログラムと通信する汎用ドライバを介して第1の汎用ネットワークに互いに通信可能に接続され、各計算機の前記系切換え制御ボードは、前記インタフェース層および前記汎用通信プロトコル層を経由しないで前記他系監視プログラムと直接通信する系切換え制御ドライバを介して、第1の汎用ネットワークから独立した第2の汎用ネットワークに互いに通信可能に接続されてなることを特徴とする。
(1)ネットワークの二重化
計算機間で相互に監視する際に、それぞれが汎用ネットワークであるLAN1・102、LAN2・103という物理的に独立した2つの経路を用いる。
(2)ネットワークドライバの二重化
汎用ネットワークの二重化に伴い、OS130内の汎用ドライバについても二重化する。OS130内の汎用ドライバは、通常の汎用ドライバ(Ethernetドライバ)141と系切換え制御(LXP)ドライバ142とに二重化する。
(3)内部バスの分離
内部バスを管理バス120と拡張バス121とに分離する。1つの計算機の内部で、系切換え制御ボード116は、CPU110の制御に管理バス120を用い、CPU110との通信に拡張バス121を用いる。拡張バス121は、SCSIボード等の機能拡張ボードと通信するので、バス上の電文量が変動する。これに対して、管理バス120は、バス上の電文流量が固定であるため、CPU110の再起動要求実行時などに障害要因が少ない。また、相互の障害監視に用いると、相手系に発生した障害を検知できる。
(4)系切換え制御(LXP)ドライバのポーリング
系切換え制御(LXP)ドライバ142は、割込み処理プログラム118を使用せずに、ポーリングによって送受信する。
(5)CPU再起動(リセット)/停止機能
系切換え制御(LXP)ボード116は、他系からのCPU再起動(リセット)機能,他系からのCPU停止機能,自系のCPU停止機能を備えている。
a.他系からのCPU再起動(リセット)/停止機能
図7は、他系監視プログラムにより、障害情報を収集して、CPUを停止する処理手順を示すタイムチャートである。
b.他系からのCPU再起動(リセット)/停止機能
図8は、他系監視プログラムにより、障害情報を収集しないで、CPUを停止する処理手順を示すタイムチャートである。
c.自系のCPU停止機能
再起動(リセット)制御装置201は、自系のCPU停止要求信号を受信すると、拡張バス121に対して障害通知信号を発生させ、NMI割込みを発生させる。
102 LAN1
103 LAN2
104,105 汎用ネットワーク
111 メインメモリ
112 入出力制御装置(I/O)
113 ディスク装置
114 LAN制御装置
115 LANボード
116 系切換え制御(LXP)ボード
117 ソフトウェア
118 割込処理プログラム
120 管理バス
121 拡張バス
122 拡張管理バス
130 OS
131 アプリケーション
132 管理プログラム
133 他系監視プログラム
141 Ethernetドライバ
142 LXPドライバ
143 管理バス用ドライバ
144 I/F層
145 UDP/IP層
150 生存通知電文
151 スプリットブレイン状態
152 高負荷状態(輻輳状態)
200 ネットワークインタフェース
201 再起動(リセット)制御装置
202 電文比較回路
209 CPUリセット停止信号
Claims (5)
- 複数の計算機が稼働系または待機系として組み合わされ、各計算機に備えられた他系監視プログラムにより相互監視して稼働系計算機の障害発生時に当該計算機が実行している処理を待機系計算機が引き継ぐ多重系システムにおいて、
前記複数の計算機は、それぞれ、前記他系監視プログラムが他計算機と生存通知電文を送受信するLAN制御装置と、前記他系監視プログラムが他計算機と系切換えに関連する情報を送受信する系切換え制御ボードとを備え、
各計算機の前記LAN制御装置は、インタフェース層および汎用通信プロトコル層を経由して前記他系監視プログラムと通信する汎用ドライバを介して第1の汎用ネットワークに互いに通信可能に接続され、
各計算機の前記系切換え制御ボードは、前記インタフェース層および前記汎用通信プロトコル層を経由しないで前記他系監視プログラムと直接通信する系切換え制御ドライバを介して、第1の汎用ネットワークから独立した第2の汎用ネットワークに互いに通信可能に接続されてなることを特徴とする多重系システム。 - 請求項1に記載の多重系システムにおいて、
前記各計算機は、バス上の電文流量が固定である管理バスとバス上の電文量が変動する拡張バスとに分離された内部バスを備え、
前記系切換え制御ボードは、前記管理バスと前記拡張バスの両方を介して前記計算機のCPUに通信可能に接続され、自己の計算機のCPUの制御に前記管理バスを用い、自己のCPUと他系のCPUとの間で系切換えに関連する情報の通信に前記拡張バスを用いることを特徴とする多重系システム。 - 請求項1または2に記載の多重系システムにおいて、
前記系切換え制御ボードは、他系からの電文がCPU再起動要求電文かCPU停止要求電文かを判断する電文比較回路と、該電文比較回路の判断がCPU再起動要求である場合は自己の計算機のCPUに割込み信号を出力し、CPU停止要求である場合は自己の計算機のCPUにCPU停止信号を出力する再起動制御装置とが搭載されてなることを特徴とする多重系システム。 - 請求項1ないし3のいずれか1項に記載の多重系システムにおいて、
前記系切換え制御ドライバは、割込み処理をすることなく、自己の前記系切換え制御ボードに対して送信要求または処理要求がないかを定期的にポーリングし、障害情報信号のみを送受信するポーリングプログラムを含むことを特徴とする多重系システム。 - 請求項1ないし4のいずれか1項に記載の多重系システムの再起動および停止方法において、
障害発生を検出した計算機は、障害系の計算機にCPU再起動要求電文を送信し、
該CPU再起動要求電文を受信した障害系の系切換え制御ボードは、マスク不可能割込み信号を発生させ、
該マスク不可能割込み信号に応じて当該時点におけるメインメモリの内容をディスク装置に保存するメモリダンプを開始し、
メモリダンプ終了後にシステム停止または再起動を実行し、
マスク不可能割込み信号によっても障害系がメモリダンプを実行しないデッドロック状態では、障害発生を検出した計算機が、障害系にCPU停止要求電文を送信し、
CPU停止要求電文を受信した障害系の系切換え制御ボードが、障害系をCPU停止状態とすることを特徴とする多重系システムの再起動および停止方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245319A JP4487260B2 (ja) | 2005-08-26 | 2005-08-26 | 多重系システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245319A JP4487260B2 (ja) | 2005-08-26 | 2005-08-26 | 多重系システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058708A JP2007058708A (ja) | 2007-03-08 |
JP4487260B2 true JP4487260B2 (ja) | 2010-06-23 |
Family
ID=37922127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005245319A Expired - Fee Related JP4487260B2 (ja) | 2005-08-26 | 2005-08-26 | 多重系システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4487260B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101362237B1 (ko) * | 2012-05-29 | 2014-02-13 | 린나이코리아 주식회사 | 복수의 마이컴을 구비한 보일러에서 마이컴 상호 감시를 통한 가스안전 차단방법 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009040199A (ja) * | 2007-08-08 | 2009-02-26 | Mitsubishi Electric Corp | 運行管理用フォルトトレラントシステム |
JP5416506B2 (ja) * | 2009-08-07 | 2014-02-12 | 株式会社日立製作所 | Cpu脱着型のフェールセーフ装置及びフェールセーフ用プログラム |
JP5719744B2 (ja) * | 2011-10-11 | 2015-05-20 | 株式会社日立製作所 | 多重系制御装置 |
JP6026142B2 (ja) * | 2012-06-04 | 2016-11-16 | 株式会社日立製作所 | 複数計算機が独立動作する制御システム |
JP2013254333A (ja) * | 2012-06-06 | 2013-12-19 | Hitachi Ltd | 多重系制御システム及びその制御方法 |
JP5913003B2 (ja) * | 2012-08-29 | 2016-04-27 | 株式会社日立製作所 | 計算機制御装置、方法およびプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3806600B2 (ja) * | 1997-11-14 | 2006-08-09 | 株式会社日立製作所 | 多重系システムの系切り替え方法 |
JP2003067219A (ja) * | 2001-08-29 | 2003-03-07 | Hitachi Ltd | 電子計算機システム及びその復旧処理方法 |
-
2005
- 2005-08-26 JP JP2005245319A patent/JP4487260B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101362237B1 (ko) * | 2012-05-29 | 2014-02-13 | 린나이코리아 주식회사 | 복수의 마이컴을 구비한 보일러에서 마이컴 상호 감시를 통한 가스안전 차단방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2007058708A (ja) | 2007-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4487260B2 (ja) | 多重系システム | |
US6658595B1 (en) | Method and system for asymmetrically maintaining system operability | |
EP1768320A2 (en) | Information processing apparatuses, communication method, communication load decentralizing method and communication system | |
JP2006195821A (ja) | 情報処理システムの制御方法、情報処理システム、ダイレクトメモリアクセス制御装置、プログラム | |
WO2015104841A1 (ja) | 多重系システムおよび多重系システム管理方法 | |
JP2004054907A (ja) | プログラマブルコントローラ及びcpuユニット並びに通信ユニット及び通信ユニットの制御方法 | |
JP2004171370A (ja) | 冗長構成におけるクライアント/サーバ間のアドレス制御方式および方法 | |
KR100928187B1 (ko) | 듀얼 프로세서 제어 장치의 고장 안전 구조 | |
WO2007105271A1 (ja) | ネットワーク・システム | |
WO1999026138A1 (fr) | Procede de permutation dans un systeme multiplex | |
JP2008152552A (ja) | 計算機システム及び障害情報管理方法 | |
JP6134720B2 (ja) | 接続方法 | |
JP2008003731A (ja) | 情報処理システム | |
JP3325785B2 (ja) | 計算機の故障検出・回復方式 | |
JP6762032B2 (ja) | 受電装置および制御方法 | |
JP2000020336A (ja) | 二重化通信システム | |
JP7431034B2 (ja) | コントローラ及び施設監視システム | |
JP4692419B2 (ja) | ネットワーク装置及びそれに用いる冗長切替え方法並びにそのプログラム | |
JP2006309292A (ja) | サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法 | |
JP2013254333A (ja) | 多重系制御システム及びその制御方法 | |
JP7306983B2 (ja) | コントローラ及び施設監視システム | |
JPH1196033A (ja) | 情報処理装置 | |
JPH05304528A (ja) | 多重化通信ノード | |
JP2004213412A (ja) | 二重化制御装置 | |
JP7283314B2 (ja) | スイッチ装置及び情報処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100223 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100318 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4487260 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140409 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |