JP4117684B2 - フォルトトレラント・二重化コンピュータシステムとその制御方法 - Google Patents

フォルトトレラント・二重化コンピュータシステムとその制御方法 Download PDF

Info

Publication number
JP4117684B2
JP4117684B2 JP2004367748A JP2004367748A JP4117684B2 JP 4117684 B2 JP4117684 B2 JP 4117684B2 JP 2004367748 A JP2004367748 A JP 2004367748A JP 2004367748 A JP2004367748 A JP 2004367748A JP 4117684 B2 JP4117684 B2 JP 4117684B2
Authority
JP
Japan
Prior art keywords
failure
fault
information
processing
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004367748A
Other languages
English (en)
Other versions
JP2006172390A (ja
Inventor
雅広 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004367748A priority Critical patent/JP4117684B2/ja
Priority to CA002530575A priority patent/CA2530575A1/en
Priority to EP05027816A priority patent/EP1672501A3/en
Priority to CNB2005101339201A priority patent/CN100394394C/zh
Priority to US11/312,116 priority patent/US7751310B2/en
Priority to AU2005246954A priority patent/AU2005246954A1/en
Publication of JP2006172390A publication Critical patent/JP2006172390A/ja
Application granted granted Critical
Publication of JP4117684B2 publication Critical patent/JP4117684B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/165Error detection by comparing the output of redundant processing systems with continued operation after detection of the error
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1633Error detection by comparing the output of redundant processing systems using mutual exchange of the output between the redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
    • G06F11/182Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits based on mutual exchange of the output between redundant processing components

Description

本発明は、2つのシステムが互いの動作状況を監視しながら同期して二重化運転を行うフォルトトレラント・二重化コンピュータシステムに関する。
従来、2重化されたプロセッサを有するシステムにおいて、障害発生時には2重化動作を一旦停止させて、障害の状況に従って正常と思われるプロセッサの動作継続を行うコンピュータシステムがある(例えば、特許文献1参照)。
この処理の中断を抑止するためには、修復可能な障害情報の採取を実施せずに2重化システムの動作を継続することとなる。
特開平06−266574号公報
しかしながら、従来は、修復可能な障害の障害情報を採取するために二重化運転を一旦停止していたため、処理が中断してしまうという問題があった。
また、処理の中断を抑止するために修復可能な障害情報の採取を実施しないと、アクティブ系、スタンバイ系の判断精度が低下してしまうという問題があった。
そこで本発明は、修復可能な障害であっても二重化運転を停止することなく障害情報を採取し、採取した障害情報を同期ずれが発生した場合のアクティブ系、スタンバイ系の判断材料に利用することにより、判断精度を高めることで継続させる処理の正確性を高めることができるフォルトトレラント・二重化コンピュータシステムとその制御方法を提供することを目的とする。
上述の課題を解決するため、本発明は、2つのシステムが互いの動作状況を監視しながら同期して二重化運転を行う二重化コンピュータシステムにおいて、各システムが、システム内のデータのやりとりや演算処理の過程で発生した障害修復処理を行い通知する手段と、システム内で発生した障害情報の通知を行い、そのシステムに対して指示された処理を行う故障診断プロセッサとを有し、前記二重化コンピュータシステムは、各システムから受信した障害情報の分類を行い、修復可能障害情報又は修復不可能障害情報として記録すると共に、その情報を元に障害修復処理を各システムに指示する故障監視部を備え、この故障監視部は、各システムから修復可能障害を受信した場合には、該当するシステムの修復可能障害情報を更新し、修復不可能障害を受信した場合には、該当するシステムの修復不可能障害情報を更新して、該当するシステムの診断指示を行い、同期ずれを受信した場合には、各システムの障害情報の比較を行い、障害情報の少ないシステムをアクティブ系、障害情報の多いシステムをスタンバイ系として、同期処理の指示を行うことを特徴とする。
以上の構成によって、二重化運転を行いながら各システムに対応して修復可能障害情報及び修復不可能障害情報を記録し、その記録された障害情報を、同期ずれが発生した場合のアクティブ系、スタンバイ系の判断材料に利用することができる。
本発明による第1の効果は、アクティブ系、スタンバイ系の判断精度を高めることで、継続させる処理の正確性を高めることができることである。修復可能な障害であっても障害情報を採取し、採取した障害情報を同期ずれが発生した場合のアクティブ系、スタンバイ系の判断材料に利用しているためである。
第2の効果は、同期ずれ発生時の処理の中断を最小限に抑えることができることである。二重化運転を停止することなく障害情報を採取できるためである。
次に、本発明の最良の形態について図面を参照して説明する。
図1は、本発明の一実施例を示した構成図である。システム110,120は、同期バス140を介して互いの動作状況を監視しあいながら、同期して二重化運転を行っている。システム110,120は、それぞれデータ処理部としてCPU112,122、メモリ113,123、IOプロセッサ114,124、故障診断プロセッサ116,126を含んで構成される。
各CPU112,122、メモリ113,123、IOプロセッサ114,124は、データバス111,121を介してデータのやりとりを行うことで、演算処理を実現している。また、各CPU112,122、メモリ113,123、IOプロセッサ114,124は、データのやりとりや演算処理の過程で障害が発生した場合には、その障害が、ECC(Error Correcting Code)等の付加データにより修復可能であるか否かを判断し、修復可能である場合には、診断バス115,125を通して故障診断プロセッサ116,126に修復可能障害の通知を行い、障害を修復して以後の処理を継続する。
発生した障害が修復不可能である場合には、診断バス115,125を通して故障診断プロセッサ116,126に修復不可能障害の通知を行い、以後の処理を停止し、故障診断プロセッサ116,126からの指示を待つ。また、各CPU112,122、メモリ113,123、IOプロセッサ114,124は、同期バス140上で互いの同期がずれたことが確認された場合には、診断バス115,125を通して故障診断プロセッサ116,126に同期ずれの通知を行う。
故障監視部130は、システム110とシステム120からそれぞれ受信した障害情報の分類を行い、各システムに対応した修復可能障害情報131及び修復不可能障害情報132として記録している。
図2は、故障診断プロセッサの内部構成を示す。故障診断プロセッサ116,126は、故障検出部201で診断バス115,125を通して、各CPU112,122、メモリ113,123、IOプロセッサ114,124からの修復可能障害、修復不可能障害、同期ずれの通知を受信する。
故障情報通信部202は、通信バス141,142を通して、修復可能障害の場合には通知のみ、修復不可能障害、同期ずれの場合には、通知及び以後の処理内容の問い合わせを故障監視部130に対して実施し、問い合わせた結果を故障対策部203に通知する。
故障対策部203は、故障監視部130への問い合わせ結果をもとに、システム110,120の修復不可能障害、同期ずれ発生後の処理の指示を、各CPU112,122、メモリ113,123、IOプロセッサ114,124に対して実施する。
次に図3に示すフローチャートを参照して、故障監視部の動作の概略を説明する。故障監視部130は、通信バス141,142を通してシステム110、120からの修復可能障害、修復不可能障害、同期ずれの通知を受信する(ステップ301)。
修復可能障害を受信した場合には、該当するシステムの修復可能障害情報131を更新する(ステップ310)。修復不可能障害を受信した場合には、該当するシステムの修復不可能障害情報132を更新し(ステップ320)、該当するシステムの診断指示を行う(ステップ321)。動作可能であると判断した場合には再度、同期処理の指示を(ステップ323)、該当するシステムに通知する(ステップ325)。動作不可能であると判断した場合には、該当するシステムの処理を停止し、システムの交換通知を行う(ステップ324)。また、同期ずれを受信した場合には、システム110とシステム120の障害情報の比較を行い、障害情報の少ないシステム110をアクティブ系、障害情報の多いシステム120をスタンバイ系として、同期処理の指示を行う(ステップ330)。システム120に対して、通信バス142を通してスタンバイ系としての同期処理の指示を通知する(ステップ331)。
次に、各傷害情報に対応した故障監視部の動作について説明する。まず、2つ同期して動作している一方のシステムで修復可能障害が発生した場合の動作に関して、図4を用いて説明する。
何らかの要因でシステム120のIOプロセッサ124で障害が発生したとする。IOプロセッサ124は障害の内容を判断し、修復可能であるとの判断を行い、障害を修復して以後の処理を継続し、修復可能障害の発生を診断バス125を通して故障診断プロセッサ126に通知する。
故障診断プロセッサ126は、故障検出部201でIOプロセッサ124から修復可能障害の通知を受信し、故障情報通信部202は通信バス142を通して、修復可能障害の発生を故障監視部130に通知する。
故障監視部130は、通信バス142を通してシステム120からの修復可能障害の通知を受信する(ステップ301)。受信した通知が修復可能障害であるため、システム120の修復可能障害情報131を更新し(ステップ310)、処理を終了する。
次に、2つ同期して動作している一方のシステムで修復不可能障害が発生した場合の動作に関して、図5を用いて説明する。
何らかの要因でシステム120のIOプロセッサ124で障害が発生したとする。IOプロセッサ124は障害の内容を判断し、修復不可能であるとの判断を行い、以後の処理を中止し、修復不可能障害の発生を診断バス125を通して故障診断プロセッサ126に通知する。
故障診断プロセッサ126は、故障検出部201でIOプロセッサ124から修復不可能障害の通知を受信し、故障情報通信部202は通信バス142を通して、修復不可能障害の発生と以後の処理内容の問い合わせを故障監視部130に通知する。
故障監視部130は、通信バス142を通してシステム120からの修復不可能障害の通知を受信する(ステップ301)。受信した通知が修復不可能障害であるため、システム120の修復不可能障害情報132を更新し(ステップ320)、システム120に対して診断指示を行う(ステップ321)。
故障診断プロセッサ126は、故障監視部130からの診断実施の指示を、通信バス142を通して故障情報通信部202で受信する。受信した診断実施の指示を故障対策部203で診断バス125を通して、修復不可能障害の発生を通知したIOプロセッサ124に伝える。
IOプロセッサ124は、故障診断プロセッサ126からの診断実施の指示に従って、内部の診断を実施し、その結果を診断バス125を通して、故障診断プロセッサ126に伝える。
故障診断プロセッサ126は、受信したIOプロセッサ124からの診断結果を、通信バス142を通して、故障監視部130に通知する。
故障診断プロセッサ126は、受信した診断結果の判定を行い(ステップ322)、動作可能であると判断した場合には再度、同期処理の指示を(ステップ323)、システム120に通知する(ステップ325)。故障診断プロセッサ126により動作可能であると判断されたシステム120は、同期処理の指示を受信し、システム110との同期処理を開始し、二重化運転を再開する。動作不可能であると判断した場合には、システム120への通知は行わず、以後の処理を停止したままの状態にしておき、システム120の交換要求をディスプレイに表示する等により、システム管理者に通知する(ステップ324)。
次に、2つ同期して動作しているシステム間で同期ずれが発生した場合の動作に関して、図6を用いて説明する。
何らかの要因でシステム110とシステム120の間で同期ずれが発生したとする。システム110では、CPU112が同期バス140を介してシステム120の動作状況を監視しており、同期ずれが発生したことを検出する。CPU112は同期ずれを検出すると、システム120との同期ずれ検出処理を停止し、診断バス115を通して故障診断プロセッサ116に同期ずれの通知を行う。
故障診断プロセッサ116は、故障検出部201でCPU112から同期ずれの通知を受信し、故障情報通信部202は通信バス141を通して、同期ずれの発生と以後の処理内容の問い合わせを故障監視部130に通知する。
システム120では、CPU122が同期バス140を介してシステム110の動作状況を監視しており、同期ずれが発生したことを検出する。CPU122は同期ずれを検出すると、システム110との同期ずれ検出処理を停止し、診断バス125を通して故障診断プロセッサ126に同期ずれの通知を行う。
故障診断プロセッサ126は、故障検出部201でCPU122から同期ずれの通知を受信し、故障情報通信部202は通信バス142を通して、同期ずれの発生と以後の処理内容の問い合わせを故障監視部130に通知する。
故障監視部130は、通信バス141を通してシステム110からの同期ずれの通知を、通信バス142を通じてシステム120からの同期ずれの通知を受信する(ステップ301)。
受信した通知が同期ずれであるため(ステップ302)、システム110とシステム120の障害情報の比較を行い、障害情報の少ないシステム110をアクティブ系、障害情報の多いシステム120をスタンバイ系として、同期処理の指示を行う(ステップ330)。システム120に対して、通信バス142を通してスタンバイ系としての同期処理が通知される(ステップ331)。
故障診断プロセッサ126は、故障監視部130からのスタンバイ系としての同期処理を、通信バス142を通して故障情報通信部202で受信する。スタンバイ系としての同期処理を受け取った故障診断プロセッサ126は、システム120の処理を停止し、システム110との同期化処理を行い、システム110、システム120の二重化運転を再開する。
本発明は、例えば、インターネットショッピング等のユーザ情報を管理するための24時間、365日処理を停止することができないデータサーバに適用される二重化コンピュータシステムに適用可能である。
本発明の一実施例を示した構成図である。 故障診断プロセッサの内部構成図である。 故障監視部の動作を説明するフローチャートである。 一方のシステムで修復可能障害が発生した場合の説明図である。 一方のシステムで修復不可能障害が発生した場合の説明図である。 システム間で同期ずれが発生した場合の説明図である。
符号の説明
110,120 システム
111,121 データバス
112,122 CPU
113,123 メモリ
114,124 IOプロセッサ
115,125 診断バス
116,126 故障診断プロセッサ
130 故障監視部
131 修復可能障害情報
132 修復不可能障害情報
140 同期バス
141,142 通信バス

Claims (6)

  1. 2つのシステムが互いの動作状況を監視しながら同期して二重化運転を行う二重化コンピュータシステムにおいて、
    各システムが、システム内のデータのやりとりや演算処理の過程で発生した障害修復処理を行い通知する手段と、
    システム内で発生した障害情報の通知を行い、そのシステムに対して指示された処理を行う故障診断プロセッサとを有し、
    前記二重化コンピュータシステムは、各システムから受信した障害情報の分類を行い、修復可能障害情報又は修復不可能障害情報として記録すると共に、その情報を元に障害修復処理を各システムに指示する故障監視部を備え、
    この故障監視部は、各システムから修復可能障害を受信した場合には、該当するシステムの修復可能障害情報を更新し、
    修復不可能障害を受信した場合には、該当するシステムの修復不可能障害情報を更新して、該当するシステムの診断指示を行い、
    同期ずれを受信した場合には、各システムの障害情報の比較を行い、障害情報の少ないシステムをアクティブ系、障害情報の多いシステムをスタンバイ系として、同期処理の指示を行うことを特徴とするフォルトトレラント・二重化コンピュータシステム。
  2. 修復不可能障害を受信した場合の診断結果が、動作可能であると判断した場合には再度、同期処理の指示を、該当するシステムに通知することを特徴とする請求項1記載のフォルトトレラント・二重化コンピュータシステム。
  3. 修復不可能障害を受信した場合の診断結果が、動作不可能であると判断した場合には、該当するシステムの処理を停止し、システムの交換通知を行うことを特徴とする請求項1記載のフォルトトレラント・二重化コンピュータシステム。
  4. システム内のデータのやりとりや演算処理の過程で発生した障害修復処理を行い通知するCPUと、IOプロセッサと、CPU並びにIOプロセッサが利用するメモリと、故障診断プロセッサと、を備えるデータ処理部を各システムに有する二重化コンピュータシステムが、各システムで互いの動作状況を監視しながら同期して二重化運転を行うフォルトトレラント制御方法であって、
    前記二重化コンピュータシステムは、各システムから受信した障害情報の分類を行い、修復可能障害情報又は修復不可能障害情報として記録すると共に、その情報を元に障害修復処理を各システムに指示する故障監視部を更に備え、
    前記故障診断プロセッサが、システム内で発生した障害情報の通知を行い、そのシステムに対して指示された処理を行う故障診断ステップと、
    前記故障監視部が、前記故障監視ステップにおいて、各システムから修復可能障害を受信した場合には、該当するシステムの修復可能障害情報を更新し、
    修復不可能障害を受信した場合には、該当するシステムの修復不可能障害情報を更新して、該当するシステムの診断指示を行い、
    同期ずれを受信した場合には、各システムの障害情報の比較を行い、障害情報の少ないシステムをアクティブ系、障害情報の多いシステムをスタンバイ系として、同期処理の指示を行うことを特徴とする二重化コンピュータシステムのフォルトトレラント制御方法。
  5. 前記故障監視部が、修復不可能障害を受信した場合の診断結果が、動作可能であると判断した場合には再度、同期処理の指示を、該当するシステムに通知することを特徴とする請求項4記載の二重化コンピュータシステムのフォルトトレラント制御方法。
  6. 前記故障監視部が、修復不可能障害を受信した場合の診断結果が、動作不可能であると判断した場合には、該当するシステムの処理を停止し、システムの交換通知を行うことを特徴とする請求項4記載の二重化コンピュータシステムのフォルトトレラント制御方法。
JP2004367748A 2004-12-20 2004-12-20 フォルトトレラント・二重化コンピュータシステムとその制御方法 Expired - Fee Related JP4117684B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004367748A JP4117684B2 (ja) 2004-12-20 2004-12-20 フォルトトレラント・二重化コンピュータシステムとその制御方法
CA002530575A CA2530575A1 (en) 2004-12-20 2005-12-15 Fault tolerant duplex computer system and its control method
EP05027816A EP1672501A3 (en) 2004-12-20 2005-12-19 Fault tolerant duplex computer system and its control method
CNB2005101339201A CN100394394C (zh) 2004-12-20 2005-12-20 容错双工计算机系统及其控制方法
US11/312,116 US7751310B2 (en) 2004-12-20 2005-12-20 Fault tolerant duplex computer system and its control method
AU2005246954A AU2005246954A1 (en) 2004-12-20 2005-12-20 Fault tolerant duplex computer system and its control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004367748A JP4117684B2 (ja) 2004-12-20 2004-12-20 フォルトトレラント・二重化コンピュータシステムとその制御方法

Publications (2)

Publication Number Publication Date
JP2006172390A JP2006172390A (ja) 2006-06-29
JP4117684B2 true JP4117684B2 (ja) 2008-07-16

Family

ID=36016969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004367748A Expired - Fee Related JP4117684B2 (ja) 2004-12-20 2004-12-20 フォルトトレラント・二重化コンピュータシステムとその制御方法

Country Status (6)

Country Link
US (1) US7751310B2 (ja)
EP (1) EP1672501A3 (ja)
JP (1) JP4117684B2 (ja)
CN (1) CN100394394C (ja)
AU (1) AU2005246954A1 (ja)
CA (1) CA2530575A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4640359B2 (ja) * 2007-03-12 2011-03-02 日本電気株式会社 フォールトトレラントコンピュータ、フォールトトレラントコンピュータにおける同期制御方法
CN103443774A (zh) * 2007-09-25 2013-12-11 富士通株式会社 信息处理装置和控制方法
JP4893650B2 (ja) * 2008-02-13 2012-03-07 日本電気株式会社 情報処理装置、情報処理システム、制御方法及び制御プログラム
JP5243113B2 (ja) * 2008-06-19 2013-07-24 株式会社日立製作所 演算処理装置多重化制御システム
JP5347414B2 (ja) * 2008-10-03 2013-11-20 富士通株式会社 同期制御装置,情報処理装置及び同期管理方法
JP5699658B2 (ja) * 2011-02-10 2015-04-15 日本電気株式会社 待機系計算機、クラスタシステム、サービス提供方法およびプログラム
KR101192202B1 (ko) 2011-03-28 2012-10-17 국방과학연구소 내장형 운영체제 기반의 응용프로그램에서 고장 감지 방법 및 시스템
JP5760847B2 (ja) 2011-08-22 2015-08-12 日本電気株式会社 情報処理装置、情報処理システム、情報処理装置の異常兆候検出方法、及び異常兆候検出プログラム
FR3026205B1 (fr) * 2014-09-23 2016-11-04 Commissariat Energie Atomique Execution speculative et iterative de graphes de flot de donnees temporises
CN105511310A (zh) * 2015-11-30 2016-04-20 马鞍山市示范生产力促进中心有限公司 一种应用于轨道交通的计算机系统
CN110597159A (zh) * 2019-09-06 2019-12-20 浙江无极互联科技有限公司 一种计算机远程监控控制系统

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3864670A (en) * 1970-09-30 1975-02-04 Yokogawa Electric Works Ltd Dual computer system with signal exchange system
US4049957A (en) * 1971-06-23 1977-09-20 Hitachi, Ltd. Dual computer system
US4228496A (en) * 1976-09-07 1980-10-14 Tandem Computers Incorporated Multiprocessor system
CA2002361C (en) * 1989-03-10 1993-12-21 Robert M. Blake Fault tolerant computer memory systems and components employing dual level error correction and detection with disablement feature
CN2048993U (zh) * 1989-04-27 1989-12-06 航空航天工业部第二研究所二○七所 双机自动切换、交换数据的控制板
JPH03273344A (ja) 1990-03-22 1991-12-04 Nec Corp フォールトトレラントシステム
JP3156429B2 (ja) 1993-03-17 2001-04-16 株式会社日立製作所 高信頼型計算機用システム制御lsi及びそれを用いたコンピュータシステム
JP3149047B2 (ja) 1992-11-02 2001-03-26 富士通株式会社 二重化データ処理装置
JPH07200334A (ja) * 1993-12-29 1995-08-04 Nec Corp 二重化同期運転方式
JPH08235015A (ja) 1995-02-27 1996-09-13 Mitsubishi Electric Corp プロセッサ装置並びにプロセッサ故障診断方法
JP2723073B2 (ja) 1995-03-17 1998-03-09 日本電気株式会社 コンピュータシステムの障害ログ情報取得方式
JP3200661B2 (ja) * 1995-03-30 2001-08-20 富士通株式会社 クライアント/サーバシステム
JPH09146853A (ja) 1995-11-20 1997-06-06 Hitachi Ltd 二重化計算機及びその障害系復旧方法
US5796934A (en) * 1996-05-31 1998-08-18 Oracle Corporation Fault tolerant client server system
JPH10240555A (ja) * 1997-02-25 1998-09-11 Nec Corp フォールト・トレラント・データ処理システムとその方 法
US6092213A (en) * 1997-09-30 2000-07-18 Tandem Computers Incorporated Fault tolerant method of maintaining and distributing configuration information in a distributed processing system
JPH11143729A (ja) * 1997-11-07 1999-05-28 Nec Corp フォールトトレラントコンピュータ
US6038288A (en) * 1997-12-31 2000-03-14 Thomas; Gene Gilles System and method for maintenance arbitration at a switching node
JP2001069585A (ja) * 1999-08-31 2001-03-16 Fujitsu Ltd 二重化装置及びハイウェイインタフェース回路
JP2001209561A (ja) * 2000-01-27 2001-08-03 Mitsubishi Electric Corp 異常処理方式及び異常処理方法
US6594786B1 (en) * 2000-01-31 2003-07-15 Hewlett-Packard Development Company, Lp Fault tolerant high availability meter
US6820213B1 (en) * 2000-04-13 2004-11-16 Stratus Technologies Bermuda, Ltd. Fault-tolerant computer system with voter delay buffer
US6542962B2 (en) * 2001-03-21 2003-04-01 Hitachi, Ltd. Multiple processor data processing system with mirrored data for distributed access
US6854072B1 (en) * 2000-10-17 2005-02-08 Continuous Computing Corporation High availability file server for providing transparent access to all data before and after component failover
US7275100B2 (en) * 2001-01-12 2007-09-25 Hitachi, Ltd. Failure notification method and system using remote mirroring for clustering systems
US6785838B2 (en) * 2001-02-13 2004-08-31 Sun Microsystems, Inc. Method and apparatus for recovering from failure of a mirrored boot device
JP2002259154A (ja) 2001-03-05 2002-09-13 Nec Corp フォールト・トレラント・コンピュータシステム
US6971043B2 (en) * 2001-04-11 2005-11-29 Stratus Technologies Bermuda Ltd Apparatus and method for accessing a mass storage device in a fault-tolerant server
US7380001B2 (en) * 2001-05-17 2008-05-27 Fujitsu Limited Fault containment and error handling in a partitioned system with shared resources
GB0112781D0 (en) * 2001-05-25 2001-07-18 Global Continuity Plc Method for rapid recovery from a network file server failure
US6892316B2 (en) * 2001-11-02 2005-05-10 International Business Machines Corporation Switchable resource management in clustered computer system
US6931568B2 (en) * 2002-03-29 2005-08-16 International Business Machines Corporation Fail-over control in a computer system having redundant service processors
US20040001449A1 (en) * 2002-06-28 2004-01-01 Rostron Andy E. System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
JP2004046455A (ja) * 2002-07-10 2004-02-12 Nec Corp 情報処理装置
JP2004046599A (ja) * 2002-07-12 2004-02-12 Nec Corp フォルトトレラントコンピュータ装置、その再同期化方法及び再同期化プログラム
JP4155399B2 (ja) * 2003-03-28 2008-09-24 株式会社日立製作所 コンピュータ処理方法及びその実施システム並びにその処理プログラム
US7991889B2 (en) * 2004-05-07 2011-08-02 Alcatel-Lucent Usa Inc. Apparatus and method for managing networks having resources having reduced, nonzero functionality
JP2006285631A (ja) * 2005-03-31 2006-10-19 Yokogawa Electric Corp 二重化システム

Also Published As

Publication number Publication date
EP1672501A2 (en) 2006-06-21
CA2530575A1 (en) 2006-06-20
AU2005246954A1 (en) 2006-07-06
US20060133410A1 (en) 2006-06-22
CN1794198A (zh) 2006-06-28
CN100394394C (zh) 2008-06-11
EP1672501A3 (en) 2012-06-20
US7751310B2 (en) 2010-07-06
JP2006172390A (ja) 2006-06-29

Similar Documents

Publication Publication Date Title
US7751310B2 (en) Fault tolerant duplex computer system and its control method
EP2175371B1 (en) Synchronization control apparatuses, information processing apparatuses, and synchronization management methods
JP5392594B2 (ja) 仮想計算機冗長化システム、コンピュータシステム、仮想計算機冗長化方法、及びプログラム
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
Lyu et al. Software fault tolerance in a clustered architecture: Techniques and reliability modeling
JP2010067115A (ja) データ記憶システム、データ記憶方法
JP4640071B2 (ja) 情報処理装置、情報処理復旧方法及び情報処理復旧プログラム
JP4072392B2 (ja) マルチプロセッサの切り替え方式
JPH07183891A (ja) 計算機システム
JP5509651B2 (ja) ログ採取装置、ログ採取方法、プログラム
JP3255934B2 (ja) ベーシックプロセッシングユニット及び高信頼化コンピュータシステム
JP3604171B2 (ja) プロセス自動再起動処理方式
JP4788516B2 (ja) 動的置き換えシステム、動的置き換え方法およびプログラム
JP2003256399A (ja) ホットスタンバイシステム切り替え制御方式
JPS5957351A (ja) デ−タ処理システム
JP4887837B2 (ja) マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法
JP6819061B2 (ja) 情報処理装置、プロセス切り替え方法及びプログラム
JPH10326202A (ja) 高信頼化コンピュータシステム及び高信頼化コンピュータシステムの復旧方法
JP4494263B2 (ja) サービスシステムの冗長化方式
JP2011022741A (ja) コンピュータシステム、サービスプロセッサ、及びその診断方法
JP2003308178A (ja) 情報処理装置および情報処理方法
JP3325836B2 (ja) 計算機盤
JPH08329025A (ja) プロセスマイグレーション方式
JPH08328989A (ja) 入出力制御装置の管理方式
JP2007272493A (ja) コンピュータシステム、データの正常性確認方法、及び、プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080107

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080331

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080413

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110502

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110502

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120502

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120502

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130502

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140502

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees