JP4117684B2 - フォルトトレラント・二重化コンピュータシステムとその制御方法 - Google Patents
フォルトトレラント・二重化コンピュータシステムとその制御方法 Download PDFInfo
- Publication number
- JP4117684B2 JP4117684B2 JP2004367748A JP2004367748A JP4117684B2 JP 4117684 B2 JP4117684 B2 JP 4117684B2 JP 2004367748 A JP2004367748 A JP 2004367748A JP 2004367748 A JP2004367748 A JP 2004367748A JP 4117684 B2 JP4117684 B2 JP 4117684B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- fault
- information
- processing
- diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/165—Error detection by comparing the output of redundant processing systems with continued operation after detection of the error
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/1633—Error detection by comparing the output of redundant processing systems using mutual exchange of the output between the redundant processing components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/18—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
- G06F11/182—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits based on mutual exchange of the output between redundant processing components
Description
111,121 データバス
112,122 CPU
113,123 メモリ
114,124 IOプロセッサ
115,125 診断バス
116,126 故障診断プロセッサ
130 故障監視部
131 修復可能障害情報
132 修復不可能障害情報
140 同期バス
141,142 通信バス
Claims (6)
- 2つのシステムが互いの動作状況を監視しながら同期して二重化運転を行う二重化コンピュータシステムにおいて、
各システムが、システム内のデータのやりとりや演算処理の過程で発生した障害修復処理を行い通知する手段と、
システム内で発生した障害情報の通知を行い、そのシステムに対して指示された処理を行う故障診断プロセッサと、を有し、
前記二重化コンピュータシステムは、各システムから受信した障害情報の分類を行い、修復可能障害情報又は修復不可能障害情報として記録すると共に、その情報を元に障害修復処理を各システムに指示する故障監視部を備え、
この故障監視部は、各システムから修復可能障害を受信した場合には、該当するシステムの修復可能障害情報を更新し、
修復不可能障害を受信した場合には、該当するシステムの修復不可能障害情報を更新して、該当するシステムの診断指示を行い、
同期ずれを受信した場合には、各システムの障害情報の比較を行い、障害情報の少ないシステムをアクティブ系、障害情報の多いシステムをスタンバイ系として、同期処理の指示を行うことを特徴とするフォルトトレラント・二重化コンピュータシステム。 - 修復不可能障害を受信した場合の診断結果が、動作可能であると判断した場合には再度、同期処理の指示を、該当するシステムに通知することを特徴とする請求項1記載のフォルトトレラント・二重化コンピュータシステム。
- 修復不可能障害を受信した場合の診断結果が、動作不可能であると判断した場合には、該当するシステムの処理を停止し、システムの交換通知を行うことを特徴とする請求項1記載のフォルトトレラント・二重化コンピュータシステム。
- システム内のデータのやりとりや演算処理の過程で発生した障害修復処理を行い通知するCPUと、IOプロセッサと、CPU並びにIOプロセッサが利用するメモリと、故障診断プロセッサと、を備えるデータ処理部を各システムに有する二重化コンピュータシステムが、各システムで互いの動作状況を監視しながら同期して二重化運転を行うフォルトトレラント制御方法であって、
前記二重化コンピュータシステムは、各システムから受信した障害情報の分類を行い、修復可能障害情報又は修復不可能障害情報として記録すると共に、その情報を元に障害修復処理を各システムに指示する故障監視部を更に備え、
前記故障診断プロセッサが、システム内で発生した障害情報の通知を行い、そのシステムに対して指示された処理を行う故障診断ステップと、
前記故障監視部が、前記故障監視ステップにおいて、各システムから修復可能障害を受信した場合には、該当するシステムの修復可能障害情報を更新し、
修復不可能障害を受信した場合には、該当するシステムの修復不可能障害情報を更新して、該当するシステムの診断指示を行い、
同期ずれを受信した場合には、各システムの障害情報の比較を行い、障害情報の少ないシステムをアクティブ系、障害情報の多いシステムをスタンバイ系として、同期処理の指示を行うことを特徴とする二重化コンピュータシステムのフォルトトレラント制御方法。 - 前記故障監視部が、修復不可能障害を受信した場合の診断結果が、動作可能であると判断した場合には再度、同期処理の指示を、該当するシステムに通知することを特徴とする請求項4記載の二重化コンピュータシステムのフォルトトレラント制御方法。
- 前記故障監視部が、修復不可能障害を受信した場合の診断結果が、動作不可能であると判断した場合には、該当するシステムの処理を停止し、システムの交換通知を行うことを特徴とする請求項4記載の二重化コンピュータシステムのフォルトトレラント制御方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004367748A JP4117684B2 (ja) | 2004-12-20 | 2004-12-20 | フォルトトレラント・二重化コンピュータシステムとその制御方法 |
CA002530575A CA2530575A1 (en) | 2004-12-20 | 2005-12-15 | Fault tolerant duplex computer system and its control method |
EP05027816A EP1672501A3 (en) | 2004-12-20 | 2005-12-19 | Fault tolerant duplex computer system and its control method |
CNB2005101339201A CN100394394C (zh) | 2004-12-20 | 2005-12-20 | 容错双工计算机系统及其控制方法 |
US11/312,116 US7751310B2 (en) | 2004-12-20 | 2005-12-20 | Fault tolerant duplex computer system and its control method |
AU2005246954A AU2005246954A1 (en) | 2004-12-20 | 2005-12-20 | Fault tolerant duplex computer system and its control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004367748A JP4117684B2 (ja) | 2004-12-20 | 2004-12-20 | フォルトトレラント・二重化コンピュータシステムとその制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006172390A JP2006172390A (ja) | 2006-06-29 |
JP4117684B2 true JP4117684B2 (ja) | 2008-07-16 |
Family
ID=36016969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004367748A Expired - Fee Related JP4117684B2 (ja) | 2004-12-20 | 2004-12-20 | フォルトトレラント・二重化コンピュータシステムとその制御方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7751310B2 (ja) |
EP (1) | EP1672501A3 (ja) |
JP (1) | JP4117684B2 (ja) |
CN (1) | CN100394394C (ja) |
AU (1) | AU2005246954A1 (ja) |
CA (1) | CA2530575A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4640359B2 (ja) * | 2007-03-12 | 2011-03-02 | 日本電気株式会社 | フォールトトレラントコンピュータ、フォールトトレラントコンピュータにおける同期制御方法 |
CN103443774A (zh) * | 2007-09-25 | 2013-12-11 | 富士通株式会社 | 信息处理装置和控制方法 |
JP4893650B2 (ja) * | 2008-02-13 | 2012-03-07 | 日本電気株式会社 | 情報処理装置、情報処理システム、制御方法及び制御プログラム |
JP5243113B2 (ja) * | 2008-06-19 | 2013-07-24 | 株式会社日立製作所 | 演算処理装置多重化制御システム |
JP5347414B2 (ja) * | 2008-10-03 | 2013-11-20 | 富士通株式会社 | 同期制御装置,情報処理装置及び同期管理方法 |
JP5699658B2 (ja) * | 2011-02-10 | 2015-04-15 | 日本電気株式会社 | 待機系計算機、クラスタシステム、サービス提供方法およびプログラム |
KR101192202B1 (ko) | 2011-03-28 | 2012-10-17 | 국방과학연구소 | 내장형 운영체제 기반의 응용프로그램에서 고장 감지 방법 및 시스템 |
JP5760847B2 (ja) | 2011-08-22 | 2015-08-12 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理装置の異常兆候検出方法、及び異常兆候検出プログラム |
FR3026205B1 (fr) * | 2014-09-23 | 2016-11-04 | Commissariat Energie Atomique | Execution speculative et iterative de graphes de flot de donnees temporises |
CN105511310A (zh) * | 2015-11-30 | 2016-04-20 | 马鞍山市示范生产力促进中心有限公司 | 一种应用于轨道交通的计算机系统 |
CN110597159A (zh) * | 2019-09-06 | 2019-12-20 | 浙江无极互联科技有限公司 | 一种计算机远程监控控制系统 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3864670A (en) * | 1970-09-30 | 1975-02-04 | Yokogawa Electric Works Ltd | Dual computer system with signal exchange system |
US4049957A (en) * | 1971-06-23 | 1977-09-20 | Hitachi, Ltd. | Dual computer system |
US4228496A (en) * | 1976-09-07 | 1980-10-14 | Tandem Computers Incorporated | Multiprocessor system |
CA2002361C (en) * | 1989-03-10 | 1993-12-21 | Robert M. Blake | Fault tolerant computer memory systems and components employing dual level error correction and detection with disablement feature |
CN2048993U (zh) * | 1989-04-27 | 1989-12-06 | 航空航天工业部第二研究所二○七所 | 双机自动切换、交换数据的控制板 |
JPH03273344A (ja) | 1990-03-22 | 1991-12-04 | Nec Corp | フォールトトレラントシステム |
JP3156429B2 (ja) | 1993-03-17 | 2001-04-16 | 株式会社日立製作所 | 高信頼型計算機用システム制御lsi及びそれを用いたコンピュータシステム |
JP3149047B2 (ja) | 1992-11-02 | 2001-03-26 | 富士通株式会社 | 二重化データ処理装置 |
JPH07200334A (ja) * | 1993-12-29 | 1995-08-04 | Nec Corp | 二重化同期運転方式 |
JPH08235015A (ja) | 1995-02-27 | 1996-09-13 | Mitsubishi Electric Corp | プロセッサ装置並びにプロセッサ故障診断方法 |
JP2723073B2 (ja) | 1995-03-17 | 1998-03-09 | 日本電気株式会社 | コンピュータシステムの障害ログ情報取得方式 |
JP3200661B2 (ja) * | 1995-03-30 | 2001-08-20 | 富士通株式会社 | クライアント/サーバシステム |
JPH09146853A (ja) | 1995-11-20 | 1997-06-06 | Hitachi Ltd | 二重化計算機及びその障害系復旧方法 |
US5796934A (en) * | 1996-05-31 | 1998-08-18 | Oracle Corporation | Fault tolerant client server system |
JPH10240555A (ja) * | 1997-02-25 | 1998-09-11 | Nec Corp | フォールト・トレラント・データ処理システムとその方 法 |
US6092213A (en) * | 1997-09-30 | 2000-07-18 | Tandem Computers Incorporated | Fault tolerant method of maintaining and distributing configuration information in a distributed processing system |
JPH11143729A (ja) * | 1997-11-07 | 1999-05-28 | Nec Corp | フォールトトレラントコンピュータ |
US6038288A (en) * | 1997-12-31 | 2000-03-14 | Thomas; Gene Gilles | System and method for maintenance arbitration at a switching node |
JP2001069585A (ja) * | 1999-08-31 | 2001-03-16 | Fujitsu Ltd | 二重化装置及びハイウェイインタフェース回路 |
JP2001209561A (ja) * | 2000-01-27 | 2001-08-03 | Mitsubishi Electric Corp | 異常処理方式及び異常処理方法 |
US6594786B1 (en) * | 2000-01-31 | 2003-07-15 | Hewlett-Packard Development Company, Lp | Fault tolerant high availability meter |
US6820213B1 (en) * | 2000-04-13 | 2004-11-16 | Stratus Technologies Bermuda, Ltd. | Fault-tolerant computer system with voter delay buffer |
US6542962B2 (en) * | 2001-03-21 | 2003-04-01 | Hitachi, Ltd. | Multiple processor data processing system with mirrored data for distributed access |
US6854072B1 (en) * | 2000-10-17 | 2005-02-08 | Continuous Computing Corporation | High availability file server for providing transparent access to all data before and after component failover |
US7275100B2 (en) * | 2001-01-12 | 2007-09-25 | Hitachi, Ltd. | Failure notification method and system using remote mirroring for clustering systems |
US6785838B2 (en) * | 2001-02-13 | 2004-08-31 | Sun Microsystems, Inc. | Method and apparatus for recovering from failure of a mirrored boot device |
JP2002259154A (ja) | 2001-03-05 | 2002-09-13 | Nec Corp | フォールト・トレラント・コンピュータシステム |
US6971043B2 (en) * | 2001-04-11 | 2005-11-29 | Stratus Technologies Bermuda Ltd | Apparatus and method for accessing a mass storage device in a fault-tolerant server |
US7380001B2 (en) * | 2001-05-17 | 2008-05-27 | Fujitsu Limited | Fault containment and error handling in a partitioned system with shared resources |
GB0112781D0 (en) * | 2001-05-25 | 2001-07-18 | Global Continuity Plc | Method for rapid recovery from a network file server failure |
US6892316B2 (en) * | 2001-11-02 | 2005-05-10 | International Business Machines Corporation | Switchable resource management in clustered computer system |
US6931568B2 (en) * | 2002-03-29 | 2005-08-16 | International Business Machines Corporation | Fail-over control in a computer system having redundant service processors |
US20040001449A1 (en) * | 2002-06-28 | 2004-01-01 | Rostron Andy E. | System and method for supporting automatic protection switching between multiple node pairs using common agent architecture |
JP2004046455A (ja) * | 2002-07-10 | 2004-02-12 | Nec Corp | 情報処理装置 |
JP2004046599A (ja) * | 2002-07-12 | 2004-02-12 | Nec Corp | フォルトトレラントコンピュータ装置、その再同期化方法及び再同期化プログラム |
JP4155399B2 (ja) * | 2003-03-28 | 2008-09-24 | 株式会社日立製作所 | コンピュータ処理方法及びその実施システム並びにその処理プログラム |
US7991889B2 (en) * | 2004-05-07 | 2011-08-02 | Alcatel-Lucent Usa Inc. | Apparatus and method for managing networks having resources having reduced, nonzero functionality |
JP2006285631A (ja) * | 2005-03-31 | 2006-10-19 | Yokogawa Electric Corp | 二重化システム |
-
2004
- 2004-12-20 JP JP2004367748A patent/JP4117684B2/ja not_active Expired - Fee Related
-
2005
- 2005-12-15 CA CA002530575A patent/CA2530575A1/en not_active Abandoned
- 2005-12-19 EP EP05027816A patent/EP1672501A3/en not_active Withdrawn
- 2005-12-20 CN CNB2005101339201A patent/CN100394394C/zh not_active Expired - Fee Related
- 2005-12-20 US US11/312,116 patent/US7751310B2/en not_active Expired - Fee Related
- 2005-12-20 AU AU2005246954A patent/AU2005246954A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP1672501A2 (en) | 2006-06-21 |
CA2530575A1 (en) | 2006-06-20 |
AU2005246954A1 (en) | 2006-07-06 |
US20060133410A1 (en) | 2006-06-22 |
CN1794198A (zh) | 2006-06-28 |
CN100394394C (zh) | 2008-06-11 |
EP1672501A3 (en) | 2012-06-20 |
US7751310B2 (en) | 2010-07-06 |
JP2006172390A (ja) | 2006-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7751310B2 (en) | Fault tolerant duplex computer system and its control method | |
EP2175371B1 (en) | Synchronization control apparatuses, information processing apparatuses, and synchronization management methods | |
JP5392594B2 (ja) | 仮想計算機冗長化システム、コンピュータシステム、仮想計算機冗長化方法、及びプログラム | |
JPH0950424A (ja) | ダンプ採取装置およびダンプ採取方法 | |
Lyu et al. | Software fault tolerance in a clustered architecture: Techniques and reliability modeling | |
JP2010067115A (ja) | データ記憶システム、データ記憶方法 | |
JP4640071B2 (ja) | 情報処理装置、情報処理復旧方法及び情報処理復旧プログラム | |
JP4072392B2 (ja) | マルチプロセッサの切り替え方式 | |
JPH07183891A (ja) | 計算機システム | |
JP5509651B2 (ja) | ログ採取装置、ログ採取方法、プログラム | |
JP3255934B2 (ja) | ベーシックプロセッシングユニット及び高信頼化コンピュータシステム | |
JP3604171B2 (ja) | プロセス自動再起動処理方式 | |
JP4788516B2 (ja) | 動的置き換えシステム、動的置き換え方法およびプログラム | |
JP2003256399A (ja) | ホットスタンバイシステム切り替え制御方式 | |
JPS5957351A (ja) | デ−タ処理システム | |
JP4887837B2 (ja) | マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法 | |
JP6819061B2 (ja) | 情報処理装置、プロセス切り替え方法及びプログラム | |
JPH10326202A (ja) | 高信頼化コンピュータシステム及び高信頼化コンピュータシステムの復旧方法 | |
JP4494263B2 (ja) | サービスシステムの冗長化方式 | |
JP2011022741A (ja) | コンピュータシステム、サービスプロセッサ、及びその診断方法 | |
JP2003308178A (ja) | 情報処理装置および情報処理方法 | |
JP3325836B2 (ja) | 計算機盤 | |
JPH08329025A (ja) | プロセスマイグレーション方式 | |
JPH08328989A (ja) | 入出力制御装置の管理方式 | |
JP2007272493A (ja) | コンピュータシステム、データの正常性確認方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080331 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080413 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110502 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110502 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120502 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120502 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130502 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140502 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |