JP4182948B2 - フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法 - Google Patents
フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法 Download PDFInfo
- Publication number
- JP4182948B2 JP4182948B2 JP2004369875A JP2004369875A JP4182948B2 JP 4182948 B2 JP4182948 B2 JP 4182948B2 JP 2004369875 A JP2004369875 A JP 2004369875A JP 2004369875 A JP2004369875 A JP 2004369875A JP 4182948 B2 JP4182948 B2 JP 4182948B2
- Authority
- JP
- Japan
- Prior art keywords
- control unit
- cpu
- ioapic
- interrupt
- master
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/165—Error detection by comparing the output of redundant processing systems with continued operation after detection of the error
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/1633—Error detection by comparing the output of redundant processing systems using mutual exchange of the output between the redundant processing components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1675—Temporal synchronisation or re-synchronisation of redundant processing components
- G06F11/1691—Temporal synchronisation or re-synchronisation of redundant processing components using a quantum
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
Description
32ビットプロセッサに代わって、64ビットプロセッサが市場に出回っている。64ビットプロセッサには、64ビットプロセッサとしてふるまう拡張モードと、旧環境と同じく32ビットプロセッサとしてふるまうレガシーモードとが用意されている。レガシーモードにおいては、64ビット命令が使用できないが、IA−32との互換性が確保されている。64ビットプロセッサにおいては、モードにより割込み制御が異なることになる。
上記と関連して、特開平9−251443号公報には、情報処理システムのプロセッサ障害回復処理方法が開示されている。この従来例では、情報処理システムは、複数のプロセッサを備え、少なくとも1個のプロセッサをシステム支援プロセッサとして動作させ、その他のプロセッサを命令プロセッサとして動作させるマルチプロセッサ構成の計算機システムである。プロセッサに固定障害が発生したとき、前記システム支援プロセッサの障害発生時、少なくとも1個の命令プロセッサ上で動作しているオペレーティングシステムに割り込みを発生し、前記オペレーティングシステムが、前記命令プロセッサにおいて障害が発生したことを認識し、前記命令プロセッサ上で前記割込み発生時に動作していたアプリケーションプログラムを異常終了させ、前記命令プロセッサをシステム支援プロセッサと交代させている。
本発明の他の課題は、システムの切替え時に割り込み要求が保持されることができるフォールト・トレラント・コンピュータシステムを提供することにある。
本発明の他の課題は、CPUからはサウス・ブリッジの故障を隠蔽することができるフォールト・トレラント・コンピュータシステムを提供することにある。
本発明の他の課題は、故障したFT制御部が交換されたときでも、完全に同期状態に復帰させることができるフォールト・トレラント・コンピュータシステムを提供することにある。
本発明の他の課題は、フォールト・トレラント・コンピュータシステムを意識せずに作成された既存のOS、既存のサウス・ブリッジを搭載したコンピュータシステム(サーバー)においても、割込みコントローラの二重化を実現することが可能となるフォールト・トレラント・コンピュータシステムを提供することにある。
また、前記レガシーモード後の、前記オペレーティング・システムが動作している拡張モードにおいて、前記第1サウス・ブリッジからの第2割り込み要求は、前記第1IOAPIC制御部から前記第1CPUに転送され、また前記リンク、前記第2FT制御部の前記第2IOAPIC制御部から前記第2CPUに転送される。
また、前記拡張モードにおいて、前記第2I/Oデバイス群のうちの1つからの第3割り込み要求は、前記第2マスターIOAPIC制御部を介して前記第2CPUに転送され、また前記リンクと前記第1マスターIOAPIC制御部を介して前記第1CPUに転送される。
以上により、レガシーモードにおいても、拡張モードにおいて、割り込みが同期して処理されることができる。
また、前記第1割り込み要求が前記第1マスターIOAPIC制御部に届くタイミングと前記第2マスターIOAPIC制御部に届くタイミングは同一であることが望ましい。
また、割り込み制御方法は、前記拡張モードにおいて、前記第2I/Oデバイス群のうちの1つからの第3割り込み要求を、前記第2マスターIOAPIC制御部を介して前記第2CPUに転送するステップと、前記第3割り込み要求を前記リンクと前記第1マスターIOAPIC制御部を介して前記第1CPUに転送するステップとを更に具備してもよい。
さらに、両モードにおいても、マスターIOAPIC12Aと12Bは常に同期して動作しているので、一方のFT制御部10自身が故障し、CPUサブシステムが論理的に切り離されたとしても、他方の正常動作しているFT制御部10のマスターIOAPIC12により正常動作を続けることが可能である。こうして、割り込みをロストすることもない。
さらに、故障したFT制御部10が交換された場合、交換後のモジュールのマスターIOAPIC12やサウス・ブリッジ6内のIOAPIC36の設定、状態は全て消えてしまっているが、システム・ソフトウェア(SMIハンドラー)により動作を続行しているシステム側のマスターIOAPIC12のコンフィグレーション/ステータス格納部22を参照し、コピーすることにより、完全に同期状態に復帰させることが可能である。
以上に示す通り、FT制御部内にコンフィグレーション/ステータスを保持する格納部を備えたマスターIOAPIC12を実装し、割り込みのルーティング制御を行うことで、割込みコントローラを二重化することが可能である。これにより、フォールト・トレラント・コンピュータシステムを意識せずに作成された既存のOS、既存のサウス・ブリッジ6を搭載したサーバにおいても、割込みコントローラの二重化を実現することが可能となる。
現在のシステムでは、上記のように、OSが起動されるまでのレガシーモードではPIC34が使用され、OSの起動後の拡張モードではIOAPIC12と36が使用される。こうして、割り込み要求パスは、切り替えが行われている。
FT制御部10のIOAPIC12は、IOAPIC24と、マスターIOAPIC12の全ての設定、状態を知ることができるコンフィグレーション/ステータス格納部22(レジスタ群)と、PCIブリッジ7側からINT#xメッセージを受け付け、モードによりINT#xメッセージをIOAPIC24へ、あるいはゲート・コントローラ16を介してサウス・ブリッジ6へ転送するルーティングロジック20とを備えている。
・IOAPICに対する設定情報
・FT制御部10内IOAPIC制御ロジックの内部ステータス(バイナリ状態であり、システム・ソフトウェアがこの値を見て何かを判断するわけではなく、純粋に内部状態をコピーするために使用される)
・PICに対する設定情報(FT制御部10はPIC機能は持っていないが、フェイルオーバー時のサウス・ブリッジ6への設定に使用)
・FT制御部内PIC制御ロジックの内部ステータス(バイナリー状態)
・その他、割込みコントローラに対する設定情報(FT制御部独自のレジスタ設定情報など)
・その他、割込みコントローラロジックの内部ステータス(バイナリー状態)
を保持している。格納部22の内容の全てを、交換された新モジュールの格納部22へコピーすることで、マスターIOAPIC12はコピー元と全く同じ設定、動作状況となり、完全に同期して動作することが可能となる。
CPU2との割込みに関する授受は全てマスターIOAPIC12により行われる。マスターIOAPIC12は、拡張モード時にはアクティブ・サウス・ブリッジ6の割り込みと、PCIブリッジ7からの割り込みを統括して管理する。このため、マスターIOAPIC12の一部はアクティブ・サウス・ブリッジのIOAPIC36が、そのまま透過的に見える形となる。このため各サウス・ブリッジ6内のIOAPIC36は、システムからは不可視状態にされる。これは、サウス・ブリッジ6が故障するケースを考慮したものである。アクティブ・サウス・ブリッジ6が故障した場合、マスターIOAPIC12の割込み制御は、直ちにスタンバイ・サウス・ブリッジ6のIOAPIC36に置換される。このため、OS側からは特にIOAPICの増減は発生しない。
2(2A、2B):CPU
3(3A,3B):メインメモリ
6(6A,6B):サウス・ブリッジ
7(7A,7B):PCIブリッジ
5(5−1(5−1A,5−1B)、5−2(5−2A,5−2B)):I/Oデバイス
8:FTリンク
12:マスターIOAPIC
14:メッセージコンバーター
15、FTコンパレーター
16:ゲートコントローラ
18:ルーター
20:ルーティングロジック
22:コンフィグレーション/ステータス格納部(レジスタ群)
32:割り込みルーティングロジック
34:PIC
36:IOAPIC
Claims (19)
- 1次系システムと2次系システムとを具備し、
前記1次系システムは、第1CPUと、前記第1CPUに接続された第1FT制御部と、及び前記第1FT制御部に電気的かつ動作的に接続された第1サウス・ブリッジとを具備し、
前記2次系システムは、第2CPUと、前記第2CPUに接続された第2FT制御部と、及び前記第2FT制御部に電気的に接続され、かつ動作的に接続されていない第2サウス・ブリッジとを具備し、
前記第1FT制御部と前記第2FT制御部はリンクにより接続され、
前記リンクを用いて前記1次系システムと前記2次系システムとは、前記第2サウス・ブリッジを除き同期して動作する
フォールト・トレラント・コンピュータシステム。 - 請求項1に記載のフォールト・トレラント・コンピュータシステムにおいて、
前記第1CPUと第2CPUは同じオペレーティング・システム上で動作し、
前記第2サウス・ブリッジは前記オペレーティング・システムから不可視であるフォールト・トレラント・コンピュータシステム。 - 請求項1又は2に記載のフォールト・トレラント・コンピュータシステムにおいて、
前記第1FT制御部は、第1マスターIOAPIC制御部を有し、
前記第2FT制御部は、第2マスターIOAPIC制御部を有し、
前記第1サウス・ブリッジは、PIC制御部とIOAPIC制御部を有し、
前記第1サウス・ブリッジの前記IOAPIC制御部のアドレス空間は、前記第1マスターIOAPIC制御部のアドレス空間の一部と同じであり、前記第2サウス・ブリッジの前記IOAPIC制御部のアドレス空間は、前記第2マスターIOAPIC制御部のアドレス空間の一部と同じであるフォールト・トレラント・コンピュータシステム。 - 請求項1乃至3のいずれかに記載のフォールト・トレラント・コンピュータシステムにおいて、
前記第1と第2のFT制御部は、前記1次系と2次系のシステムの設定データとステータスを示すステータスデータを格納する第1と第2のステータス格納部をそれぞれ更に有し、
前記1次系システムがアクティブ・システムとして動作し、前記2次系システムがスタンバイ・システムとして前記1次系システムと同期的に動作している間に、前記第1サウス・ブリッジに障害が発生したとき、前記第1FT制御部の前記第1ステータス格納部に格納された前記設定データ・ステータスデータは前記第2FT制御部の前記第2ステータス格納部に転送され、
その後、前記2次系システムがアクティブ・システムとして動作するフォールト・トレラント・コンピュータシステム。 - 請求項3に記載のフォールト・トレラント・コンピュータシステムにおいて、
前記1次系システムは、前記第1FT制御部に接続された第1PCIブリッジと、前記第1PCIブリッジに接続された第1I/Oデバイス群とを更に備え、
前記2次系システムは、前記第2FT制御部に接続された第2PCIブリッジと、前記第2PCIブリッジに接続された第2I/Oデバイス群とを更に備え、
前記1次系システムがアクティブ・システムとして設定され、前記2次系システムがスタンバイ・システムとして前記1次系システムと同期的に動作するように設定されているとき、オペレーティング・システムが動作していない起動時のレガシーモードにおいて、前記第1I/Oデバイス群のうちの1つからの第1割り込み要求は、前記第1マスターIOAPIC制御部と前記第1サウス・ブリッジのPIC制御部を介して前記第1CPUに転送されるフォールト・トレラント・コンピュータシステム。 - 請求項5に記載のフォールト・トレラント・コンピュータシステムにおいて、
前記第1割り込み要求は、前記リンクを介して前記第2FT制御部の前記第2マスターIOAPIC制御部を介して前記第2CPUに転送され、また、予め定められた遅延時間をもって前記第1FT制御部の前記第1マスターIOAPIC制御部に転送される
フォールト・トレラント・コンピュータシステム。 - 請求項5または6に記載のフォールト・トレラント・コンピュータシステムにおいて、
前記レガシーモード後の、前記オペレーティング・システムが動作している拡張モードにおいて、前記第1サウス・ブリッジからの第2割り込み要求は、前記第1IOAPIC制御部から前記第1CPUに転送され、また前記リンク、前記第2FT制御部の前記第2IOAPIC制御部から前記第2CPUに転送される
フォールト・トレラント・コンピュータシステム。 - 請求項5乃至7のいずれかに記載のフォールト・トレラント・コンピュータシステムにおいて、
前記拡張モードにおいて、前記第1I/Oデバイス群のうちの1つからの第2割り込み要求は、前記第1マスターIOAPIC制御部を介して前記第1CPUに転送され、また前記リンクと前記第2マスターIOAPIC制御部を介して前記第2CPUに転送される
フォールト・トレラント・コンピュータシステム。 - 請求項5乃至8のいずれかに記載のフォールト・トレラント・コンピュータシステムにおいて、
前記拡張モードにおいて、前記第2I/Oデバイス群のうちの1つからの第3割り込み要求は、前記第2マスターIOAPIC制御部を介して前記第2CPUに転送され、また前記リンクと前記第1マスターIOAPIC制御部を介して前記第1CPUに転送される
フォールト・トレラント・コンピュータシステム。 - 請求項5乃至9のいずれかに記載のフォールト・トレラント・コンピュータシステムにおいて、
前記第1と第2のFT制御部は、前記1次系と2次系の設定データとシステムのステー
タスを示すステータスデータを格納する第1と第2のステータス格納部をそれぞれ更に有
し、
前記第1IOAPIC制御部は、前記第1割り込み要求以外の受信した前記割り込み要
求とそのときの前記システムのステータスデータを前記第1ステータス格納部に格納し、
前記第2IOAPIC制御部は、前記第1割り込み要求以外の受信した前記割り込み要
求とそのときの前記システムのステータスデータを前記第2ステータス格納部に格納する
フォールト・トレラント・コンピュータシステム。 - 請求項1乃至3と5乃至9のいずれかに記載のフォールト・トレラント・コンピュータシステムにおいて、
前記第1と第2のFT制御部は、前記1次系と2次系のシステムの設定データとステータスを示すステータスデータを格納する第1と第2のステータス格納部をそれぞれ更に有し、
前記第1CPUと前記第2CPUが同期して動作している間に前記第1と第2のステータス格納部の格納データの不一致が検出されたとき、SMI(システム・マネージメント・インターラプト)ハンドラーは、前記第1CPUと前記第2CPUの動作を停止させ、前記第1と第2のステータス格納部の前記設定データ/ステータスデータが一致するように、前記第1と第2のFT制御部を制御する
フォールト・トレラント・コンピュータシステム。 - 1次系システムと2次系システムとを具備し、
前記1次系システムは、第1CPUと、前記第1CPUに接続された第1FT制御部と、及び前記第1FT制御部に電気的かつ動作的に接続された第1サウス・ブリッジと、前記第1FT制御部に接続された第1PCIブリッジと、前記第1PCIブリッジに接続された第1I/Oデバイス群とを具備し、
前記2次系システムは、第2CPUと、前記第2CPUに接続された第2FT制御部と、及び前記第2FT制御部に電気的に接続され、かつ動作的に接続されていない第2サウス・ブリッジと、前記第2FT制御部に接続された第2PCIブリッジと、前記第2PCIブリッジに接続された第2I/Oデバイス群とを具備し、
前記第1FT制御部と前記第2FT制御部はリンクにより接続され、
前記第1FT制御部は、第1マスターIOAPIC制御部を有し、前記第2FT制御部は、第2マスターIOAPIC制御部を有し、
前記第1CPUと前記第2CPUの各々は、第1割り込みパスと第2割り込みパスを有し、
起動時に前記1次系システム内で生成された第1割り込みは、前記第1と第2のマスターIOAPICと前記第1割り込みパスを経由して前記第1と第2のCPUへ転送され、動作時に前記1次系システムまたは前記2次系システム内で生成された第2割り込みは、前記第1と第2のマスターIOAPICと前記第2割り込みパスを経由して前記第1と第2のCPUへ転送されるフォールト・トレラント・コンピュータシステム。 - 1次系システムと2次系システムとを具備し、前記1次系システムは、第1CPUと、前記第1CPUに接続された第1FT制御部と、及び前記第1FT制御部に電気的かつ動作的に接続された第1サウス・ブリッジと、前記第1FT制御部に接続された第1PCIブリッジと、前記第1PCIブリッジに接続された第1I/Oデバイス群とを具備し、前記2次系システムは、第2CPUと、前記第2CPUに接続された第2FT制御部と、及び前記第2FT制御部に電気的に接続され、かつ動作的に接続されていない第2サウス・ブリッジと、前記第2FT制御部に接続された第2PCIブリッジと、前記第2PCIブリッジに接続された第2I/Oデバイス群とを具備し、前記第1FT制御部は、第1マスターIOAPIC制御部を有し、前記第2FT制御部は、第2マスターIOAPIC制御部を有するフォールト・トレラント・コンピュータシステムにおいて、
前記1次系システムがアクティブ・システムとして設定され、前記2次系システムがスタンバイ・システムとして前記1次系システムと同期的に動作するように設定されているとき、オペレーティング・システムが動作していない起動時のレガシーモードにおいて、前記フォールト・トレラント・コンピュータシステムが、第1I/Oデバイス群のうちの1つからの第1割り込み要求を、前記第1I/Oデバイス群のうちの1つから前記第1マスターIOAPIC制御部に転送するステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第1割り込み要求を前記リンクを介して、前記1次系システムから前記第2FT制御部の前記第2マスターIOAPIC制御部に転送するステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第1割り込み要求を、前記第1マスターIOAPIC制御部から前記第1サウス・ブリッジのPIC制御部を介して、前記第2マスターIOAPIC制御部へ転送すると共に、再び前記第1マスターIOAPIC制御部から前記第1CPUに転送するステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第1サウス・ブリッジのPIC制御部を介して転送された前記第1割り込み要求を、前記第2マスターIOAPIC制御部から前記第2CPUに転送するステップとを具備する割り込み制御方法。 - 請求項13に記載の割り込み制御方法において、
前記第1割り込み要求が前記第1マスターIOAPIC制御部に届くタイミングと前記第2マスターIOAPIC制御部に届くタイミングは同一である
割り込み制御方法。 - 請求項13又は14に記載の割り込み制御方法において、
前記レガシーモード後の、前記オペレーティング・システムが動作している拡張モードにおいて、前記第1サウス・ブリッジからの第2割り込み要求を、前記第1IOAPIC制御部から前記第1CPUに転送するステップと、
前記第2割り込み要求を前記リンク、前記第2FT制御部の前記第2IOAPIC制御部から前記第2CPUに転送するステップと
を更に具備する割り込み制御方法。 - 請求項15に記載の割り込み制御方法において、
前記拡張モードにおいて、前記フォールト・トレラント・コンピュータシステムが、前記第2割り込み要求を、前記第1サウス・ブリッジから前記第1マスターIOAPIC制御部を介して前記第1CPUに転送するステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第2割り込み要求を、前記1次系システムから、前記リンクと前記第2マスターIOAPIC制御部を介して前記第2CPUに転送するステップとを更に具備する割り込み制御方法。 - 請求項13乃至16のいずれかに記載の割り込み制御方法において、
前記拡張モードにおいて、前記フォールト・トレラント・コンピュータシステムが、前記第2I/Oデバイス群のうちの1つからの第3割り込み要求を、前記第2I/Oデバイス群のうちの1つから前記第2マスターIOAPIC制御部を介して前記第2CPUに転送するステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第3割り込み要求を、前記2次系システムから前記リンクと前記第1マスターIOAPIC制御部を介して前記第1CPUに転送するステップとを更に具備する割り込み制御方法。 - 請求項13乃至17のいずれかに記載の割り込み制御方法において、
前記フォールト・トレラント・コンピュータシステムが、前記第1割り込み要求以外の受信された前記割り込み要求とそのときの前記システムのステータスデータを前記第1FT制御部内の第1ステータス格納部に格納するステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第1割り込み要求以外の受信した前記割り込み要求とそのときの前記システムのステータスデータを前記第2FT制御部内の第2ステータス格納部に格納するステップとを更に具備する割り込み制御方法。 - 請求項18に記載の割り込み制御方法において、
前記フォールト・トレラント・コンピュータシステムが、前記第1CPUと前記第2CPUが同期して動作している間に前記第1と第2のステータス格納部の格納データの不一致が検出されたとき、SMI(システム・マネージメント・インターラプト)ハンドラーにより、前記第1CPUと前記第2CPUの動作を停止させるステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第1と第2のステータス格納部の設定データと前記ステータスデータが一致するように、前記第1と第2のFT制御部を制御するステップと、
前記フォールト・トレラント・コンピュータシステムが、前記第1と第2のステータス格納部の前記設定データと前記ステータスデータが一致したとき、前記第1CPUと前記第2CPUの動作を再開するステップとを更に具備する割り込み制御方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004369875A JP4182948B2 (ja) | 2004-12-21 | 2004-12-21 | フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法 |
US11/311,404 US7441150B2 (en) | 2004-12-21 | 2005-12-20 | Fault tolerant computer system and interrupt control method for the same |
CA002530913A CA2530913A1 (en) | 2004-12-21 | 2005-12-20 | Fault tolerant computer system and interrupt control method for the same |
AU2005246990A AU2005246990A1 (en) | 2004-12-21 | 2005-12-21 | Fault tolerant computer system and interrupt control method for the same |
EP05112572A EP1675006A2 (en) | 2004-12-21 | 2005-12-21 | Fault tolerant computer system and interrupt control method for the same |
CN200510133818.1A CN1821973A (zh) | 2004-12-21 | 2005-12-21 | 容错计算机系统及其中断控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004369875A JP4182948B2 (ja) | 2004-12-21 | 2004-12-21 | フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006178659A JP2006178659A (ja) | 2006-07-06 |
JP4182948B2 true JP4182948B2 (ja) | 2008-11-19 |
Family
ID=36084265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004369875A Expired - Fee Related JP4182948B2 (ja) | 2004-12-21 | 2004-12-21 | フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7441150B2 (ja) |
EP (1) | EP1675006A2 (ja) |
JP (1) | JP4182948B2 (ja) |
CN (1) | CN1821973A (ja) |
AU (1) | AU2005246990A1 (ja) |
CA (1) | CA2530913A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100416484C (zh) * | 2006-09-06 | 2008-09-03 | 威盛电子股份有限公司 | 具磁盘阵列控制功能的核心逻辑单元及磁盘阵列控制方法 |
CN100410866C (zh) * | 2006-09-06 | 2008-08-13 | 威盛电子股份有限公司 | 具磁盘阵列控制功能的计算机系统及磁盘阵列控制方法 |
US7870417B2 (en) | 2007-04-20 | 2011-01-11 | International Business Machines Corporation | Apparatus, system, and method for adapter card failover |
EP2149089A2 (en) * | 2007-04-20 | 2010-02-03 | International Business Machines Corporation | Apparatus, system, and method for adapter card failover |
US8103816B2 (en) * | 2008-10-28 | 2012-01-24 | Intel Corporation | Technique for communicating interrupts in a computer system |
JP2012128697A (ja) * | 2010-12-16 | 2012-07-05 | Hitachi Ltd | 情報処理装置 |
CN102455951A (zh) * | 2011-07-21 | 2012-05-16 | 中标软件有限公司 | 一种虚拟机容错方法和系统 |
US8595546B2 (en) | 2011-10-28 | 2013-11-26 | Zettaset, Inc. | Split brain resistant failover in high availability clusters |
JP6098778B2 (ja) * | 2012-03-29 | 2017-03-22 | 日本電気株式会社 | 冗長化システム、冗長化方法、冗長化システムの可用性向上方法、及びプログラム |
JP6069951B2 (ja) * | 2012-08-23 | 2017-02-01 | 日本電気株式会社 | フォールトトレラントコンピュータシステム、フォールトトレラントコンピュータシステムの起動方法およびフォールトトレラントコンピュータシステムの起動プログラム |
US9891917B2 (en) * | 2013-03-06 | 2018-02-13 | Infineon Technologies Ag | System and method to increase lockstep core availability |
JP6193910B2 (ja) * | 2015-04-03 | 2017-09-06 | ファナック株式会社 | インタロックバスとスプリットバスを接続するブリッジ回路を備えたバスシステム |
CN106844113B (zh) * | 2017-03-10 | 2020-09-29 | 苏州浪潮智能科技有限公司 | 一种采用冗余pch的服务器故障恢复系统及方法 |
CN108563557B (zh) * | 2018-02-08 | 2020-01-21 | 北京东土科技股份有限公司 | 一种多通道计算机的通道同步方法及装置 |
CN115167933B (zh) * | 2022-09-08 | 2022-12-02 | 深圳市恒运昌真空技术有限公司 | 一种双处理器设备及其控制方法和处理器 |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2407241A1 (de) * | 1974-02-15 | 1975-08-21 | Ibm Deutschland | Verfahren und anordnung zur erhoehung der verfuegbarkeit eines digitalrechners |
US4412281A (en) * | 1980-07-11 | 1983-10-25 | Raytheon Company | Distributed signal processing system |
GB8310003D0 (en) * | 1983-04-13 | 1983-05-18 | Gen Electric Co Plc | Input signal handling apparatus |
US4610013A (en) * | 1983-11-08 | 1986-09-02 | Avco Corporation | Remote multiplexer terminal with redundant central processor units |
US4979108A (en) * | 1985-12-20 | 1990-12-18 | Ag Communication Systems Corporation | Task synchronization arrangement and method for remote duplex processors |
EP0306211A3 (en) * | 1987-09-04 | 1990-09-26 | Digital Equipment Corporation | Synchronized twin computer system |
US5204952A (en) * | 1988-07-18 | 1993-04-20 | Northern Telecom Limited | Duplex processor arrangement for a switching system |
US4965717A (en) * | 1988-12-09 | 1990-10-23 | Tandem Computers Incorporated | Multiple processor system having shared memory with private-write capability |
NL193573C (nl) * | 1989-04-04 | 2000-02-02 | Yokogawa Electric Corp | Duplex-computerstelsel. |
EP0394514B1 (de) * | 1989-04-25 | 1994-07-13 | Siemens Aktiengesellschaft | Verfahren zur Synchronisation von Datenverarbeitungsanlagen |
US5157663A (en) * | 1990-09-24 | 1992-10-20 | Novell, Inc. | Fault tolerant computer system |
US5914953A (en) * | 1992-12-17 | 1999-06-22 | Tandem Computers, Inc. | Network message routing using routing table information and supplemental enable information for deadlock prevention |
US5384769A (en) * | 1993-03-19 | 1995-01-24 | Apple Computer, Inc. | Method and apparatus for a bus transceiver incorporating a high speed binary data transfer mode with a ternary control transfer mode having a full duplex, dominant logic transmission scheme |
JP3047275B2 (ja) * | 1993-06-11 | 2000-05-29 | 株式会社日立製作所 | バックアップ切り換え制御方法 |
EP0731945B1 (en) * | 1993-12-01 | 2000-05-17 | Marathon Technologies Corporation | Fault resilient/fault tolerant computing |
JPH07262034A (ja) * | 1994-03-18 | 1995-10-13 | Fujitsu Ltd | データ引き継ぎシステム |
EP0690597A1 (en) * | 1994-06-30 | 1996-01-03 | Hughes Aircraft Company | A system utilizing built-in redundancy switchover control |
JP3132744B2 (ja) * | 1995-05-24 | 2001-02-05 | 株式会社日立製作所 | 二重化cpu保守交換時の動作一致検証方式 |
JPH09251443A (ja) | 1996-03-18 | 1997-09-22 | Hitachi Ltd | 情報処理システムのプロセッサ障害回復処理方法 |
US6141769A (en) * | 1996-05-16 | 2000-10-31 | Resilience Corporation | Triple modular redundant computer system and associated method |
JPH10150479A (ja) * | 1996-11-19 | 1998-06-02 | Fujitsu Ltd | 二重化装置の障害時における誤動作防止装置 |
US5951669A (en) * | 1996-12-27 | 1999-09-14 | Apple Computer, Inc. | Method and apparatus for serialized interrupt transmission |
JPH10240557A (ja) * | 1997-02-27 | 1998-09-11 | Mitsubishi Electric Corp | 待機冗長化システム |
AU753120B2 (en) * | 1997-11-14 | 2002-10-10 | Marathon Technologies Corporation | Fault resilient/fault tolerant computing |
US6243829B1 (en) * | 1998-05-27 | 2001-06-05 | Hewlett-Packard Company | Memory controller supporting redundant synchronous memories |
DE19832060C2 (de) * | 1998-07-16 | 2000-07-06 | Siemens Ag | Doppelbare Prozessoreinrichtung |
DE19836347C2 (de) * | 1998-08-11 | 2001-11-15 | Ericsson Telefon Ab L M | Fehlertolerantes Computersystem |
US6948092B2 (en) * | 1998-12-10 | 2005-09-20 | Hewlett-Packard Development Company, L.P. | System recovery from errors for processor and associated components |
KR100279929B1 (ko) * | 1998-12-24 | 2001-02-01 | 서평원 | 교환기에서의 이중화 프로세서_ |
US6327670B1 (en) * | 1999-01-22 | 2001-12-04 | Lucent Technologies Inc. | Duplex processor with an update bus and method for operating the update bus |
US6715099B1 (en) * | 1999-06-02 | 2004-03-30 | Nortel Networks Limited | High-availability architecture using high-speed pipes |
US6510529B1 (en) * | 1999-09-15 | 2003-01-21 | I-Bus | Standby SBC backplate |
US6578158B1 (en) * | 1999-10-28 | 2003-06-10 | International Business Machines Corporation | Method and apparatus for providing a raid controller having transparent failover and failback |
US6687851B1 (en) * | 2000-04-13 | 2004-02-03 | Stratus Technologies Bermuda Ltd. | Method and system for upgrading fault-tolerant systems |
JP4054509B2 (ja) * | 2000-04-19 | 2008-02-27 | 株式会社東芝 | フィールド機器制御システムおよびコンピュータが読取り可能な記憶媒体 |
KR100709888B1 (ko) * | 2000-08-04 | 2007-04-20 | 엘지노텔 주식회사 | 웜 스탠바이 이중화 장치의 구현방법 |
GB2366012B (en) * | 2000-08-14 | 2002-08-14 | Sun Microsystems Inc | A computer system |
US6708285B2 (en) * | 2001-03-15 | 2004-03-16 | Hewlett-Packard Development Company, L.P. | Redundant controller data storage system having system and method for handling controller resets |
US7065672B2 (en) * | 2001-03-28 | 2006-06-20 | Stratus Technologies Bermuda Ltd. | Apparatus and methods for fault-tolerant computing using a switching fabric |
US6978398B2 (en) * | 2001-08-15 | 2005-12-20 | International Business Machines Corporation | Method and system for proactively reducing the outage time of a computer system |
US7146448B2 (en) * | 2001-09-28 | 2006-12-05 | Dot Hill Systems Corporation | Apparatus and method for adopting an orphan I/O port in a redundant storage controller |
US6918062B2 (en) * | 2001-09-28 | 2005-07-12 | Intel Corporation | System and method to implement a cost-effective remote system management mechanism using a serial communication controller and interrupts |
US6874103B2 (en) * | 2001-11-13 | 2005-03-29 | Hewlett-Packard Development Company, L.P. | Adapter-based recovery server option |
GB0206604D0 (en) * | 2002-03-20 | 2002-05-01 | Global Continuity Plc | Improvements relating to overcoming data processing failures |
US7003692B1 (en) * | 2002-05-24 | 2006-02-21 | Cisco Technology, Inc. | Dynamic configuration synchronization in support of a “hot” standby stateful switchover |
JP2004046599A (ja) * | 2002-07-12 | 2004-02-12 | Nec Corp | フォルトトレラントコンピュータ装置、その再同期化方法及び再同期化プログラム |
US7178058B2 (en) * | 2002-08-30 | 2007-02-13 | Nec Corporation | Fault tolerant computer and transaction synchronization control method |
US7197664B2 (en) * | 2002-10-28 | 2007-03-27 | Intel Corporation | Stateless redundancy in a network device |
US7194652B2 (en) * | 2002-10-29 | 2007-03-20 | Brocade Communications Systems, Inc. | High availability synchronization architecture |
US7028218B2 (en) * | 2002-12-02 | 2006-04-11 | Emc Corporation | Redundant multi-processor and logical processor configuration for a file server |
US7181642B1 (en) * | 2003-01-17 | 2007-02-20 | Unisys Corporation | Method for distributing the processing among multiple synchronization paths in a computer system utilizing separate servers for redundancy |
US7206963B2 (en) * | 2003-06-12 | 2007-04-17 | Sun Microsystems, Inc. | System and method for providing switch redundancy between two server systems |
JP4490745B2 (ja) * | 2004-06-29 | 2010-06-30 | 株式会社日立製作所 | ホットスタンバイシステム |
US7366948B2 (en) * | 2004-10-25 | 2008-04-29 | Hewlett-Packard Development Company, L.P. | System and method for maintaining in a multi-processor system a spare processor that is in lockstep for use in recovering from loss of lockstep for another processor |
JP4289293B2 (ja) * | 2004-12-20 | 2009-07-01 | 日本電気株式会社 | 起動制御方法、二重化プラットフォームシステム及び情報処理装置 |
JP2006178636A (ja) * | 2004-12-21 | 2006-07-06 | Nec Corp | フォールトトレラントコンピュータ、およびその制御方法 |
US7669073B2 (en) * | 2005-08-19 | 2010-02-23 | Stratus Technologies Bermuda Ltd. | Systems and methods for split mode operation of fault-tolerant computer systems |
-
2004
- 2004-12-21 JP JP2004369875A patent/JP4182948B2/ja not_active Expired - Fee Related
-
2005
- 2005-12-20 CA CA002530913A patent/CA2530913A1/en not_active Abandoned
- 2005-12-20 US US11/311,404 patent/US7441150B2/en not_active Expired - Fee Related
- 2005-12-21 CN CN200510133818.1A patent/CN1821973A/zh active Pending
- 2005-12-21 EP EP05112572A patent/EP1675006A2/en not_active Withdrawn
- 2005-12-21 AU AU2005246990A patent/AU2005246990A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
AU2005246990A1 (en) | 2006-07-06 |
CA2530913A1 (en) | 2006-06-21 |
EP1675006A2 (en) | 2006-06-28 |
US7441150B2 (en) | 2008-10-21 |
JP2006178659A (ja) | 2006-07-06 |
CN1821973A (zh) | 2006-08-23 |
US20060150005A1 (en) | 2006-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7441150B2 (en) | Fault tolerant computer system and interrupt control method for the same | |
CN106776159B (zh) | 具有故障转移的快速外围元件互连网络系统与操作方法 | |
EP0986008B1 (en) | Computer system comprising controllers and computing elements | |
JP5585332B2 (ja) | 耐故障システム、マスタft制御lsi、スレーブft制御lsiおよび耐故障制御方法 | |
US7493517B2 (en) | Fault tolerant computer system and a synchronization method for the same | |
US9195553B2 (en) | Redundant system control method | |
JP2005293315A (ja) | データミラー型クラスタシステム及びデータミラー型クラスタシステムの同期制御方法 | |
US20040193735A1 (en) | Method and circuit arrangement for synchronization of synchronously or asynchronously clocked processor units | |
JP5287974B2 (ja) | 演算処理システム、再同期方法、およびファームプログラム | |
JP3774826B2 (ja) | 情報処理装置 | |
JP4165499B2 (ja) | コンピュータシステム及びそれを用いたフォールトトレラントシステム並びにその動作制御方法 | |
JP3365282B2 (ja) | クラスタ接続マルチcpuシステムのcpuデグレード方式 | |
US20240176739A1 (en) | Fault tolerant systems and methods using shared memory configurations | |
JP4117685B2 (ja) | フォルトトレラント・コンピュータとそのバス選択制御方法 | |
JP6449671B2 (ja) | コアi/oフェールオーバー制御システムおよびコアi/oフェールオーバー制御方法 | |
JP3679412B6 (ja) | 故障から立直りが速い/故障に対する耐性がある計算処理 | |
JPH06124242A (ja) | 二重化共有メモリ等価性保証方式 | |
KR20030068663A (ko) | 이중화 보드간의 비휘발성 메모리 정보 동기화 장치 및 방법 | |
JP2000047948A (ja) | 共有メモリモジュールを備えた情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080718 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080812 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080825 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |