JP4555713B2 - エラー通知方法及び情報処理装置 - Google Patents

エラー通知方法及び情報処理装置 Download PDF

Info

Publication number
JP4555713B2
JP4555713B2 JP2005078013A JP2005078013A JP4555713B2 JP 4555713 B2 JP4555713 B2 JP 4555713B2 JP 2005078013 A JP2005078013 A JP 2005078013A JP 2005078013 A JP2005078013 A JP 2005078013A JP 4555713 B2 JP4555713 B2 JP 4555713B2
Authority
JP
Japan
Prior art keywords
error
processor
interrupt signal
level
processor system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005078013A
Other languages
English (en)
Other versions
JP2006260291A (ja
Inventor
仁 ▲高▼橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005078013A priority Critical patent/JP4555713B2/ja
Priority to DE602005020898T priority patent/DE602005020898D1/de
Priority to EP05254461A priority patent/EP1703393B1/en
Priority to US11/182,848 priority patent/US7584388B2/en
Priority to KR1020050072589A priority patent/KR100740850B1/ko
Priority to CNB2005100901263A priority patent/CN100392608C/zh
Publication of JP2006260291A publication Critical patent/JP2006260291A/ja
Application granted granted Critical
Publication of JP4555713B2 publication Critical patent/JP4555713B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers

Description

本発明は、エラー通知方法及び情報処理装置に係り、特に二重化動作が可能な情報処理装置におけるエラー通知方法及びそのようなエラー通知方法を用いる情報処理装置に関する。
コンピュータシステムの如き情報処理装置においてエラーが発生すると、エラーを検出した回路がエラーレベル(又は、エラー強度)に対応した割り込み信号を用いてコンピュータシステム内のCPU等のプロセッサにエラーを通知する。プロセッサのエラー処理を行うためのソフトウェア、即ち、エラー処理ハンドラは、割り込み信号により通知されたエラーのエラーレベルに応じて、コンピュータシステムをシャットダウンするか、或いは、コンピュータシステムの継続運用を許可するかを判断する。これにより、コンピュータシステムは、エラーレベルが高いとシャットダウンされ、エラーレベルが低いと継続運用が許可される。通常、このようなエラー処理ハンドラは、プロセッサの製造メーカにより仕様が決まっており、そのソフトウェアの変更は行えない構成となっている。
他方、複数のプロセッサシステムからなるコンピュータシステムの場合、上記割り込み信号はコンピュータシステム内の全てのプロセッサシステムに通知される。又、このようなコンピュータシステムの場合、二重化動作を行うことで、コンピュータシステムの信頼性を向上するようにしている。このような二重化動作は、ミラーリングとも呼ばれる。ミラーリングの場合、2つのプロセッサシステムが同一の処理を行い、2つのプロセッサシステムの処理結果を比較してチェックすることで処理結果の信頼性を向上することができる。
図1は、従来のエラー通知方法の一例を説明する図である。コンピュータシステムは、通常モードで使用されるシステムボード1と、ミラーモードでシステムボード1と共に使用されるシステムボード2と、システムボード1,2で検出されたエラーを処理するホームシステムボード3とを備える。各システムボード1,2は、1又は複数のCPU(図示せず)等を含み、プロセッサシステムを構成する。各システムボード1,2は、エラー表示レジスタ5と、オア回路6〜8とを含む。エラー表示レジスタ5は、エラーが発生した箇所に対応させたレジスタ部からなり、エラーレベルが各レジスタ部に格納される。ここでは、説明の便宜上、エラーレベルには致命的(Fatal)なエラーレベルFatと、訂正不能(Uncorrectable)なエラーレベルUnと、訂正可能(Correctable)なエラーレベルCorとがあるものとする。エラーレベルの高さは、Fat>Un>Corなる関係にある。致命的なエラーレベルFatを格納するレジスタ部の出力は、オア回路6によりエラー割り込み信号ERR2として出力される。訂正不能なエラーレベルUnを格納するレジスタ部の出力は、オア回路7によりエラー割り込み信号ERR1として出力される。又、訂正可能なエラーレベルCorを格納するレジスタ部の出力は、オア回路8によりエラー割り込み信号ERR0として出力される。ホームシステムボード3は、コンピュータシステムのパーティションを決定すると共に、上記エラー割り込み信号ERR2,ERR1,ERR0をコンピュータシステム内の各CPUに通知する回路からなる。
コンピュータシステム内の各CPUのエラー処理ハンドラは、エラー割り込み信号ERR2又はエラー割り込み信号ERR1によるエラー通知を受けると、コンピュータシステムをシャットダウンする。又、コンピュータシステム内の各CPUのエラー処理ハンドラは、エラー割り込み信号ERR0によるエラー通知を受けると、訂正可能なエラーCorはECC等により訂正可能であるため、コンピュータシステムの継続運用を許可する。
尚、アドレス指数及び/又は障害要因指数に応じた障害復旧動作については、例えば特許文献1に記載されている。
特開2000−276364号公報
ミラーモードの場合、システムボード1からはエラーレベルの高いエラー割り込み信号ERR2又はエラー割り込み信号ERR1が出力されていても、ミラーリングによりシステムボード2ではエラーが回避できることがある。つまり、システムボード2からは、エラーレベルの低いエラー割り込み信号ERR0が出力されることも、エラー割り込み信号が出力されないこともある。しかし、コンピュータシステム内の各CPUのエラー処理ハンドラは上記の如く通常は変更できない構成であり、ホームシステムボード3はシステムボード1から高いエラーレベルのエラー通知を受けると、たとえシステムボード2からは低いエラーレベルのエラー通知しか受けていなくても、或いは、システムボード2からはエラー通知を受けていなくても、通常モードと同様に各CPUに対して高い方のエラーレベルのエラー通知を行うため、コンピュータシステムがシャットダウンされてしまうという問題があった。
尚、ミラーモード時にはミラーモード専用のエラー処理ハンドラに切り替えることも考えられるが、CPUのソフトウェア設計を変更しなければならないので、好ましくない。
そこで、本発明は、通常モード及びミラーモードにおいて最適なエラー通知を行うことのできるエラー通知方法及び情報処理装置を提供することを目的とする。
上記の課題は、通常モードで動作可能な第1のプロセッサシステム及びミラーモードで該第1のプロセッサと共に動作可能な第2のプロセッサシステムを備えたコンピュータシステムにおいて、該第1及び第2のプロセッサシステムで発生したエラーを該第1及び第2のプロセッサシステム内の各プロセッサに通知するエラー通知方法であって、該エラーを、複数あるエラーレベルのうちの対応するエラーレベルで示すエラー割り込み信号を生成し、該ミラーモード時に該第1のプロセッサシステム内のエラーを回避できると、対応するエラー割り込み信号のエラーレベルを減少させ、該エラー割り込み信号を用いて該第1及び第2のプロセッサシステム内の各プロセッサに該エラーを通知することを特徴とするエラー通知方法によって達成できる。
上記の課題は、通常モードで動作可能な第1のプロセッサシステムと、ミラーモードで該第1のプロセッサと共に動作可能な第2のプロセッサシステムと、該第1及び第2のプロセッサシステムの各々は、内部で発生したエラーを複数あるエラーレベルのうちの対応するエラーレベルで格納する格納手段を有し、該レジスタの出力に基づいて対応するエラーレベルのエラー割り込み信号を生成する第1の回路と、該ミラーモード時に該第1のプロセッサシステム内のエラーを回避できると、対応するエラー割り込み信号のエラーレベルを減少させる第2の回路と、該エラー割り込み信号を用いて該第1及び第2のプロセッサシステム内の各プロセッサに該エラーを通知する第3の回路とを備えたことを特徴とする情報処理装置によっても達成できる。
本発明によれば、通常モード及びミラーモードにおいて最適なエラー通知を行うことのできるエラー通知方法及び情報処理装置を実現可能である。
以下に、本発明になるエラー通知方法及び情報処理装置の各実施例を、図2以降と共に説明する。
図2は、本発明になる情報処理装置の概略構成を示すブロック図である。情報処理装置の本実施例は、本発明になるエラー通知方法の一実施例を採用する。本実施例では、本発明が図2に示す如きコンピュータシステムに適用されている。
図2に示すコンピュータシステム10は、通常モードで使用されるシステムボード11と、ミラーモードでシステムボード11と共に使用されるシステムボード12と、システムボード11,12で検出されたエラーを処理するホームシステムボード13からなる。システムボード11は、複数のCPU14と、メモリ141と、複数の入出力(I/O)ポートからなるI/Oボード142とからなる。システムボード12も、システムボード11と同様の構成を有する。又、ホームシステムボード13も、システムボード11と同様の構成を有しても良い。各システムボード11,12,13は、プロセッサシステムを構成する。
図3は、本発明になる情報処理装置の一実施例の要部を示すブロック図である。各システムボード11,12は、図3に示すように、エラー表示レジスタ15と、オア回路16〜18とを含む。システムボード12は、後述するエラー回避検出回路19を更に含む。
エラー表示レジスタ15は、エラーが発生した箇所に対応させたレジスタ部からなり、エラーレベルが各レジスタ部に格納される。ここでは、説明の便宜上、エラーレベルには致命的(Fatal)なエラーレベルFatと、訂正不能(Uncorrectable)なエラーレベルUnと、訂正可能(Correctable)なエラーレベルCorとがあるものとする。エラーレベルの高さは、Fat>Un>Corなる関係にある。致命的なエラーレベルFatを格納するレジスタ部の出力は、オア回路6によりエラー割り込み信号ERR2として出力される。訂正不能なエラーレベルUnを格納するレジスタ部の出力は、オア回路7によりエラー割り込み信号ERR1として出力される。又、訂正可能なエラーレベルCorを格納するレジスタ部の出力は、オア回路8によりエラー割り込み信号ERR0として出力される。尚、エラー表示レジスタ15は、後述するミラーモード時に使用されるレジスタ部15Aを更に有する。システムボード11側のエラー表示レジスタ15のレジスタ部15Aは、省略しても良い。ホームシステムボード13は、コンピュータシステム10のパーティションを決定すると共に、上記エラー割り込み信号ERR2,ERR1,ERR0をコンピュータシステム10内の各CPU4に通知する回路からなる。
エラー回避検出回路19は、ミラーモード時にプロセッサシステム11内のエラーを回避できると、対応するエラー割り込み信号のエラーレベルをコンピュータシステム10の継続運用を許可するエラーレベルに減少させる機能を有する。具体的には、エラー回避検出回路19は、プロセッサシステム11内のエラーレベルERR2又はERR1のエラーがプロセッサシステム12のミラーリングにより回避できることを検出すると、エラー割り込み信号ERR2又はERR1をエラー割り込み信号ERR0としてホームシステムボード13に出力する。
コンピュータシステム10内の各CPU14のエラー処理ハンドラ14Aは、エラー割り込み信号ERR2又はエラー割り込み信号ERR1によるエラー通知を受けると、コンピュータシステム10をシャットダウンする。又、各CPU14のエラー処理ハンドラ14Aは、エラー割り込み信号ERR0によるエラー通知を受けると、訂正可能なエラーCorはECC等により訂正可能であるため、コンピュータシステム10の継続運用を許可する。
図4は、CPU14のソフトウェア構成を示す図である。同図に示すように、CPU14のソフトウェアは階層構造を有し、最上層のオペレーティングシステム(OS:Operating System)の下に、SAL(System Abstraction Layer)、PAL(Processor Abstraction Layer)等のBIOS(Basic Input Output System)を含む。上記エラー処理ハンドラ14Aは、SALに含まれる。
図5は、情報処理装置の実施例の要部を示す回路図である。同図中、図3と同一部分には同一符号を付し、その説明は省略する。
図5において、オアゲート16−1,17−1は、図3に示すシステムボード12内のオアゲート16,17に対応し、オアゲート16−2,17−2は、図3に示すシステムボード11内のオアゲート16,17に対応する。オアゲート18−1は、図3に示すシステムボード11,12内の両方のオアゲート18に対応する。アンドゲート21〜24及びインバータ25は、図3に示すエラー回避検出回路19に対応する。エラー回避検出回路19には、コンピュータシステム10の動作モードを示すモード信号MmodeがCPU14から入力される。モード信号Mmodeは、例えばミラーモード時には「1」となり、通常モード時には「0」となる。又、エラー表示レジスタ15のレジスタ部15Aには、ミラーモード時のミラーリングがエラーの発生により崩れたことを示す情報MbがCPU14からセットされる。この情報Mbは、例えばミラーリングが崩れると「1」となり、ミラーリングが維持されていると「0」になる。尚、システムボード11側のエラー表示レジスタ15にもレジスタ部15Aが設けられている場合には、上記情報Mbをシステムボード11側のエラー表示レジスタ15のレジスタ部15Aにセットし、このレジスタ部15Aの出力をオアゲート18−1に入力するようにしても良い。
ミラーモードの場合、システムボード11からはエラーレベルの高いエラー割り込み信号ERR2又はエラー割り込み信号ERR1が出力されていても、ミラーリングによりシステムボード12ではエラーが回避できることがある。つまり、システムボード12からは、エラーレベルの低いエラー割り込み信号ERR0が出力される。エラーが検出されたら、回避できたとしても、エラー回避できたことを割り込み信号は出力することによって通知する。ただし、エラー割り込み信号を出力しないように制御することはできる。このため、コンピュータシステム10内の各CPU14のエラー処理ハンドラ14Aを変更せずにシステムボード11からのエラー通知をそのままホームシステムボード13に出力すると、ホームシステムボード13はシステムボード11から高いエラーレベルのエラー通知を受けると、たとえシステムボード12からは低いエラーレベルのエラー通知しか受けていなくても、通常モードと同様に各CPU14に対して高い方のエラーレベルのエラー通知を行うため、コンピュータシステム10がシャットダウンされてしまう。しかし、本実施例では、エラー回避検出回路19がプロセッサシステム11内のエラーレベルERR2又はERR1のエラーがプロセッサシステム12のミラーリングにより回避できることを検出すると、エラー割り込み信号ERR2又はERR1をエラー割り込み信号ERR0としてホームシステムボード13に出力するので、通常モードとは異なるエラー通知が行われることになる。従って、エラーが発生しても、ミラーリングによりコンピュータシステム10をシャットダウンする必要がなくなれば、コンピュータシステムの継続運用が可能となる。
尚、上記ゲート16〜18及びエラー回避検出回路19の少なくとも一部を、ホームシステムボード13側に設ける構成としても良いことは、言うまでもない。
図6は、情報処理装置のハードウェア(システムボード11,12及びホームシステムボード13)の処理を説明するフローチャートである。同図中、ステップS1は、エラーが検出されたか否かを判定する。ステップS1の判定結果がYESになると、ステップS2は、エラー表示レジスタ15内のエラーが発生した箇所に対応させたレジスタ部に、検出されたエラーレベルをセットする。ステップS3は、検出されたエラーレベルを示すエラー割り込み信号によりCPU14のエラー処理ハンドラ14Aに割り込みを発生することでエラー通知を行い、処理は終了する。
尚、ミラーモードは、システムボード単位で設定しても、パーティション単位で設定しても良い。
図7は、情報処理装置のCPU14のソフトウェア(エラー処理ハンドラ14A)の処理を説明するフローチャートである。同図中、ステップS11は、ホームシステムボード13からエラー割り込み信号による割り込みが発生したか否か、即ち、エラー通知が入力されたか否かを判定する。ステップS11の判定結果がYESになると、ステップS12は、周知の方法でエラーログを入手すると共に、エラー箇所を特定する。ステップS13は、エラー割り込み信号がERR0であるか否かを判定する。ステップS13の判定結果がNOであると、ステップS14は、エラー割り込み信号がERR1又はERR2であるか否かを判定する。ステップS14の判定結果がNOであると、処理はエラー割り込み信号に対応する他のエラー処理へ進む。他方、ステップS14の判定結果がYESであると、ステップS15は、コンピュータシステム10をシャットダウンし、処理は終了する。又、ステップS13の判定結果がYESであると、ステップS16は、エラー表示レジスタ15のレジスタ部をクリアし、処理は通常のエラー処理へ進むことで、訂正可能(Correctable)なエラーレベルCorのエラーが周知の方法で訂正される。
本発明は、通常モード及びミラーモードを有するコンピュータシステム等の情報処理装置におけるエラー通知に好適である。
尚、本発明は、以下に付記する発明をも包含するものである。
(付記1) 通常モードで動作可能な第1のプロセッサシステム及びミラーモードで該第1のプロセッサと共に動作可能な第2のプロセッサシステムを備えたコンピュータシステムにおいて、該第1及び第2のプロセッサシステムで発生したエラーを該第1及び第2のプロセッサシステム内の各プロセッサに通知するエラー通知方法であって、
該エラーを、複数あるエラーレベルのうちの対応するエラーレベルで示すエラー割り込み信号を生成し、
該ミラーモード時に該第1のプロセッサシステム内のエラーを回避できると、対応するエラー割り込み信号のエラーレベルを減少させ、
該エラー割り込み信号を用いて該第1及び第2のプロセッサシステム内の各プロセッサに該エラーを通知することを特徴とする、エラー通知方法。
(付記2) 該ミラーモード時に該エラーを回避できると、該第2のプロセッサシステムで発生したエラーを示すエラー割り込み信号に基づいて該エラーレベルを減少させることを特徴とする、付記1記載のエラー通知方法。
(付記3) 該ミラーモード時に該エラーを回避できると、該エラー割り込み信号のエラーレベルを該コンピュータシステムの継続運用を許可するエラーレベルに減少させることを特徴とする、付記1又は2記載のエラー通知方法。
(付記4) 該エラー割り込み信号の生成、該エラーレベルの減少及び該エラー割り込み信号によるエラー通知はハードウェアにより実行され、該エラー通知は各CPUのソフトウェアに対して行われることを特徴とする、付記1〜3のいずれか1項記載のエラー通知方法。
(付記5) 該ソフトウェアは、システムアブストラクションレイヤ(SAL:System Abstraction Layer)内のエラー処理ハンドラであることを特徴とする、付記4記載のエラー通知方法。
(付記6) 通常モードで動作可能な第1のプロセッサシステムと、
ミラーモードで該第1のプロセッサと共に動作可能な第2のプロセッサシステムと、
該第1及び第2のプロセッサシステムの各々は、内部で発生したエラーを複数あるエラーレベルのうちの対応するエラーレベルで格納する格納手段を有し、
該レジスタの出力に基づいて対応するエラーレベルのエラー割り込み信号を生成する第1の回路と、
該ミラーモード時に該第1のプロセッサシステム内のエラーを回避できると、対応するエラー割り込み信号のエラーレベルを減少させる第2の回路と、
該エラー割り込み信号を用いて該第1及び第2のプロセッサシステム内の各プロセッサに該エラーを通知する第3の回路とを備えたことを特徴とする、情報処理装置。
(付記7) 該第2の回路は、該ミラーモード時に該エラーを回避できると、該第2のプロセッサシステムで発生したエラーを示すエラー割り込み信号に基づいて該エラーレベルを減少させることを特徴とする、付記6記載の情報処理装置。
(付記8) 該第2の回路は、該ミラーモード時に該エラーを回避できると、該エラー割り込み信号のエラーレベルを該コンピュータシステムの継続運用を許可するエラーレベルに減少させることを特徴とする、付記6又は7記載の情報処理装置。
(付記9) 該格納手段は、該ミラーモード時のミラーリングがエラーの発生により崩れたことを示す情報も格納することを特徴とする、付記6〜8のいずれか1項記載の情報処理装置。
(付記10) 該第2の回路は、該レジスタの出力と該ミラーモードを示すモード信号とに基づいて、該対応するエラー割り込み信号のエラーレベルを減少させることを特徴とする、付記6〜9のいずれか1項記載の情報処理装置。
(付記11) 該第3の回路は、該エラー通知を各CPUのソフトウェアに対して行うことを特徴とする、付記6〜10のいずれか1項記載の情報処理装置。
(付記12) 該ソフトウェアは、システムアブストラクションレイヤ(SAL:System Abstraction Layer)内のエラー処理ハンドラであることを特徴とする、付記11記載のエラー通知方法。
(付記13) 該第3の回路は、該コンピュータシステムのパーティションを決定することを特徴とする、付記6〜12のいずれか1項記載の情報処理装置。
以上、本発明を実施例により説明したが、本発明は上記実施例に限定されるものではなく、種々の変形及び改良が可能であることは、言うまでもない。
従来のエラー通知方法の一例を説明する図である。 本発明になる情報処理装置の概略構成を示すブロック図である。 本発明になる情報処理装置の一実施例の要部を示すブロック図である。 CPUのソフトウェア構成を示す図である。 情報処理装置の実施例の要部を示す回路図である。 情報処理装置のハードウェアの処理を説明するフローチャートである。 情報処理装置のCPUのソフトウェアの処理を説明するフローチャートである。
符号の説明
10 コンピュータシステム
11,12 システムボード
13 ホームシステムボード
14 CPU
15 エラー表示レジスタ
19 エラー回避検出回路

Claims (10)

  1. 通常モードで動作可能な第1のプロセッサシステム及びミラーモードで該第1のプロセッサと共に動作可能な第2のプロセッサシステムを備えたコンピュータシステムにおいて、該第1及び第2のプロセッサシステムで発生したエラーを該第1及び第2のプロセッサシステム内の各プロセッサに通知するエラー通知方法であって、
    該エラーを、複数あるエラーレベルのうちの対応するエラーレベルで示すエラー割り込み信号を生成し、
    該ミラーモードで動作している前記第2のプロセッサシステムにおいて前記第1のプロセッサシステム内のエラーを回避できることがエラー回避検出回路において検出されると、該第1のプロセッサシステムで発生したエラーに対応するエラー割り込み信号のエラーレベルを減少させ、
    前記エラーレベルを減少させたエラー割り込み信号を用いて該第1及び第2のプロセッサシステム内の各プロセッサに該エラーを通知する、エラー通知方法。
  2. 該ミラーモードで動作している前記第2のプロセッサシステムにおいて前記第1のプロセッサシステム内のエラーを回避できることが前記エラー回避検出回路において検出されると、該第2のプロセッサシステムで発生したエラーを示すエラー割り込み信号に基づいて該エラーレベルを減少させる、請求項1記載のエラー通知方法。
  3. 該ミラーモードで動作している前記第2のプロセッサシステムにおいて前記第1のプロセッサシステム内のエラーを回避できることが前記エラー回避検出回路において検出されると、該エラー割り込み信号のエラーレベルを該コンピュータシステムの継続運用を許可するエラーレベルに減少させる、請求項1又は2記載のエラー通知方法。
  4. 該エラー割り込み信号の生成、該エラーレベルの減少及び該エラー割り込み信号によるエラー通知はハードウェアにより実行され、該エラー通知は各CPUのソフトウェアに対して行われる、請求項1〜3のいずれか1項記載のエラー通知方法。
  5. 通常モードで動作可能な第1のプロセッサシステムと、
    ミラーモードで該第1のプロセッサと共に動作可能な第2のプロセッサシステムを備えた情報処理装置であって、
    該第1及び第2のプロセッサシステムの各々は、内部で発生したエラーを複数あるエラーレベルのうちの対応するエラーレベルで格納する格納手段と、該格納手段の出力に基づいて対応するエラーレベルのエラー割り込み信号を生成する第1の回路を有し、
    該ミラーモードで動作している前記第2のプロセッサシステムにおいて前記第1のプロセッサシステム内のエラーを回避できることを検出すると、該第1のプロセッサシステムで発生したエラーに対応するエラー割り込み信号のエラーレベルを減少させる第2の回路と、
    前記エラーレベルを減少させたエラー割り込み信号を用いて該第1及び第2のプロセッサシステム内の各プロセッサに該エラーを通知する第3の回路を更に備えた、情報処理装置。
  6. 該第2の回路は、該ミラーモードで動作している前記第2のプロセッサシステムにおいて前記第1のプロセッサシステム内のエラーを回避できることを検出すると、該第2のプロセッサシステムで発生したエラーを示すエラー割り込み信号に基づいて該エラーレベルを減少させる、請求項5記載の情報処理装置。
  7. 該第2の回路は、該ミラーモードで動作している前記第2のプロセッサシステムにおいて前記第1のプロセッサシステム内のエラーを回避できることを検出すると、該エラー割り込み信号のエラーレベルを該情報処理装置の継続運用を許可するエラーレベルに減少させる、請求項5又は6記載の情報処理装置。
  8. 該格納手段は、該ミラーモード時のミラーリングがエラーの発生により崩れたことを示す情報も格納する、請求項5〜7のいずれか1項記載の情報処理装置。
  9. 該第2の回路は、該格納手段の出力と該ミラーモードを示すモード信号とに基づいて、該対応するエラー割り込み信号のエラーレベルを減少させる、請求項5〜8のいずれか1項記載の情報処理装置。
  10. 該第3の回路は、該エラー通知を各CPUのソフトウェアに対して行う、請求項5〜9のいずれか1項記載の情報処理装置。
JP2005078013A 2005-03-17 2005-03-17 エラー通知方法及び情報処理装置 Expired - Fee Related JP4555713B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2005078013A JP4555713B2 (ja) 2005-03-17 2005-03-17 エラー通知方法及び情報処理装置
DE602005020898T DE602005020898D1 (de) 2005-03-17 2005-07-18 Verfahren zur Fehlermeldung für ein auf gespiegelten Operationen basierend Datenverarbeitungssystem und entsprechende Vorrichtung
EP05254461A EP1703393B1 (en) 2005-03-17 2005-07-18 Error notification method and apparatus for an information processing system carrying out mirror operation
US11/182,848 US7584388B2 (en) 2005-03-17 2005-07-18 Error notification method and information processing apparatus
KR1020050072589A KR100740850B1 (ko) 2005-03-17 2005-08-09 에러 통지 방법 및 정보 처리 장치
CNB2005100901263A CN100392608C (zh) 2005-03-17 2005-08-10 错误通知方法及信息处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005078013A JP4555713B2 (ja) 2005-03-17 2005-03-17 エラー通知方法及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2006260291A JP2006260291A (ja) 2006-09-28
JP4555713B2 true JP4555713B2 (ja) 2010-10-06

Family

ID=36616961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005078013A Expired - Fee Related JP4555713B2 (ja) 2005-03-17 2005-03-17 エラー通知方法及び情報処理装置

Country Status (6)

Country Link
US (1) US7584388B2 (ja)
EP (1) EP1703393B1 (ja)
JP (1) JP4555713B2 (ja)
KR (1) KR100740850B1 (ja)
CN (1) CN100392608C (ja)
DE (1) DE602005020898D1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009144824A1 (ja) * 2008-05-30 2009-12-03 富士通株式会社 情報処理装置、転送回路及び情報処理装置のエラー制御方法
JP5217647B2 (ja) * 2008-06-04 2013-06-19 富士通株式会社 情報処理装置および情報処理方法
JP5509568B2 (ja) * 2008-10-03 2014-06-04 富士通株式会社 コンピュータ装置、プロセッサ診断方法、及びプロセッサ診断制御プログラム
US9519532B2 (en) * 2014-01-20 2016-12-13 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Handling system interrupts with long-running recovery actions

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01145734A (ja) * 1987-12-01 1989-06-07 Nec Corp データ処理装置
JPH03184155A (ja) * 1989-08-01 1991-08-12 Digital Equip Corp <Dec> 非存在メモリエラー処理の方法
JPH0695902A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd プロセッサ二重化方式の情報処理装置
JPH07129425A (ja) * 1993-10-29 1995-05-19 Hitachi Ltd リブート処理方法
JPH07230436A (ja) * 1994-02-16 1995-08-29 Hitachi Ltd プロセッサ構成方法及び情報処理装置
JPH0863365A (ja) * 1994-08-23 1996-03-08 Fujitsu Ltd データ処理装置
JPH08286779A (ja) * 1995-04-18 1996-11-01 Fuji Xerox Co Ltd アプリケーション自動再起動装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0441087B1 (en) 1990-02-08 1995-08-16 International Business Machines Corporation Checkpointing mechanism for fault-tolerant systems
US5193181A (en) * 1990-10-05 1993-03-09 Bull Hn Information Systems Inc. Recovery method and apparatus for a pipelined processing unit of a multiprocessor system
GB2345362B (en) * 1995-07-13 2000-08-23 Fujitsu Ltd Information processing system
US5915082A (en) * 1996-06-07 1999-06-22 Lockheed Martin Corporation Error detection and fault isolation for lockstep processor systems
JPH10312327A (ja) 1997-05-13 1998-11-24 Oki Electric Ind Co Ltd ミラーリング監視方式
US6948092B2 (en) * 1998-12-10 2005-09-20 Hewlett-Packard Development Company, L.P. System recovery from errors for processor and associated components
JP2000276364A (ja) 1999-03-24 2000-10-06 Oki Electric Ind Co Ltd 障害復旧方法、中央処理装置及び中央処理システム
US6622260B1 (en) * 1999-12-30 2003-09-16 Suresh Marisetty System abstraction layer, processor abstraction layer, and operating system error handling
US20020029358A1 (en) * 2000-05-31 2002-03-07 Pawlowski Chester W. Method and apparatus for delivering error interrupts to a processor of a modular, multiprocessor system
US6654909B1 (en) * 2000-06-30 2003-11-25 Intel Corporation Apparatus and method for protecting critical resources against soft errors in high performance microprocessors
US6823482B2 (en) * 2001-03-08 2004-11-23 International Business Machines Corporation System and method for reporting platform errors in partitioned systems
JP2003006004A (ja) * 2001-06-25 2003-01-10 Mitsubishi Electric Corp 障害発生通知抑止装置および障害発生通知抑止方法
US20040078732A1 (en) * 2002-10-21 2004-04-22 International Business Machines Corporation SMP computer system having a distributed error reporting structure
US7055060B2 (en) * 2002-12-19 2006-05-30 Intel Corporation On-die mechanism for high-reliability processor
JP2005055995A (ja) 2003-08-07 2005-03-03 Hitachi Ltd ストレージ制御方法、および、冗長化機能を有するサーバシステム
US20050240806A1 (en) * 2004-03-30 2005-10-27 Hewlett-Packard Development Company, L.P. Diagnostic memory dump method in a redundant processor
US7502958B2 (en) * 2004-10-25 2009-03-10 Hewlett-Packard Development Company, L.P. System and method for providing firmware recoverable lockstep protection
US7624336B2 (en) * 2004-11-08 2009-11-24 International Business Machines Corporation Selection of status data from synchronous redundant devices

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01145734A (ja) * 1987-12-01 1989-06-07 Nec Corp データ処理装置
JPH03184155A (ja) * 1989-08-01 1991-08-12 Digital Equip Corp <Dec> 非存在メモリエラー処理の方法
JPH0695902A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd プロセッサ二重化方式の情報処理装置
JPH07129425A (ja) * 1993-10-29 1995-05-19 Hitachi Ltd リブート処理方法
JPH07230436A (ja) * 1994-02-16 1995-08-29 Hitachi Ltd プロセッサ構成方法及び情報処理装置
JPH0863365A (ja) * 1994-08-23 1996-03-08 Fujitsu Ltd データ処理装置
JPH08286779A (ja) * 1995-04-18 1996-11-01 Fuji Xerox Co Ltd アプリケーション自動再起動装置

Also Published As

Publication number Publication date
EP1703393A2 (en) 2006-09-20
DE602005020898D1 (de) 2010-06-10
EP1703393A3 (en) 2009-03-11
US7584388B2 (en) 2009-09-01
JP2006260291A (ja) 2006-09-28
US20060212763A1 (en) 2006-09-21
CN1834927A (zh) 2006-09-20
KR20060101169A (ko) 2006-09-22
CN100392608C (zh) 2008-06-04
KR100740850B1 (ko) 2007-07-20
EP1703393B1 (en) 2010-04-28

Similar Documents

Publication Publication Date Title
US20120117428A1 (en) Cache memory system
JP2006178557A (ja) コンピュータシステム及びエラー処理方法
JPH02135536A (ja) チエツクポイント再試行機構
US20080046802A1 (en) Memory controller and method of controlling memory
US7827449B2 (en) Non-inline transaction error correction
JP4555713B2 (ja) エラー通知方法及び情報処理装置
JP2012104112A (ja) ミラー化データ・ストレージ・システムにおけるエラーを検出するための方法、コンピュータ・プログラム及びシステム
JP2770913B2 (ja) パリティの置換装置及び方法
JP3068009B2 (ja) 冗長化メモリのエラー訂正機構
US8516303B2 (en) Arithmetic device for concurrently processing a plurality of threads
US7353433B2 (en) Poisoned error signaling for proactive OS recovery
JPH09134314A (ja) メモリアクセス制御装置
KR20210116342A (ko) 데이터 처리 디바이스 및 데이터 처리 방법
US20090193322A1 (en) Information processing apparatus including transfer device for transferring data
JP4507875B2 (ja) 多重化装置及びレガシーデバイス多重化方法
JP5325032B2 (ja) 多重系システムの高信頼性制御装置
US20100223527A1 (en) Data protection circuit, data protection method, and data processing apparatus
JP2559531B2 (ja) 二重化システムのエラーチェック回路
JPH06195235A (ja) 制御装置およびプロセッサ
JPH0981465A (ja) 主記憶制御装置
JP5529794B2 (ja) マイクロコンピュータ及び異常メモリアクセス検出方法
JPH05265790A (ja) マイクロプロセッサ装置
JPH0527994A (ja) デイジタル機器の誤出力防止方法
JPS59216255A (ja) 割込みスタツクエリアのエラ−検出方式
JPH04252344A (ja) コンピュータシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100713

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100716

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130723

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees