JPH1153222A - 多重系計算機システムにおける自己診断方式 - Google Patents

多重系計算機システムにおける自己診断方式

Info

Publication number
JPH1153222A
JPH1153222A JP9204218A JP20421897A JPH1153222A JP H1153222 A JPH1153222 A JP H1153222A JP 9204218 A JP9204218 A JP 9204218A JP 20421897 A JP20421897 A JP 20421897A JP H1153222 A JPH1153222 A JP H1153222A
Authority
JP
Japan
Prior art keywords
processor unit
circuit
cpu
interrupt
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9204218A
Other languages
English (en)
Inventor
Takeshi Tokoro
剛 所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9204218A priority Critical patent/JPH1153222A/ja
Publication of JPH1153222A publication Critical patent/JPH1153222A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】 本発明は、CPUの監視を簡単なハードウェ
アで、かつCPU単位で行うことにより故障CPUの縮
退や他CPUへの切替えを可能とし、安価なHAシステ
ム等多重系計算機システムにおける自己診断方式を提供
することを課題とする。 【解決手段】 本発明は、1以上のプロセッサユニット
1〜4と、各プロセッサユニットに対して定期的に割り
込みを発し、その応答を待ってプロセッサユニットの状
態を監視する監視ユニット8とを備え、監視ユニットに
よってプロセッサユニットの異常を検出したとき、その
プロセッサユニットをシステムから論理的に切断する。
監視ユニットは、レジスタ81,82、カウンタ83,
84、比較器85,86の組み合わせで構成される簡単
なハードウェアにより実現される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、HA(High
Availability;高可用性)システム等、多
重系計算機システムに用いて好適な自己診断方式に関す
る。
【0002】
【従来の技術】HAシステム等高信頼性が要求される多
重系計算機システムでは、システムの二重化を行い、一
方のシステムの異常を検知すると他方のシステムへの切
替えが自動的に行われ、ユーザに意識させることなくシ
ステムの稼動が継続される。この切替処理のために従
来、各計算機システムはウオッチドッグタイマを内蔵
し、ソフトウェアがセットリセットを繰り返し、ある設
定された値までの間に応答がなければシステム異常とみ
なし、システム切替えのための処理を行っていた。
【0003】
【発明が解決しようとする課題】上述した従来例に従え
ば、異常が監視できてもシステムのどの部分の故障か判
別不可能であり、従って、例えばCPUのみ等部分的な
縮退や切替えができず、周辺装置も含めて二重化する必
要がありコスト高となって好ましくない。また、ソフト
ウェアによる監視であるため、ソフトウェア自身が何ら
かの原因でタイマアクセスできなくなった場合、故障個
所の特定のみならず異常監視自体も不可能な状態となっ
てしまう。
【0004】本発明は上記事情に鑑みてなされたもので
あり、CPUの監視をハードウェアで、かつCPU単位
で行うことにより故障CPUの縮退や他CPUへの切替
えを可能とし、安価なHAシステム等多重系計算機シス
テムにおける自己診断方式を提供することを目的とす
る。
【0005】
【課題を解決するための手段】本発明の多重系計算機シ
ステムにおける自己診断方式は、その計算機システム
が、1以上のプロセッサユニットと、各プロセッサユニ
ットに対して定期的に割り込みを発し、その応答を待っ
てプロセッサユニットの状態を監視する監視ユニットと
を備え、監視ユニットによってプロセッサユニットの異
常を検出したとき、そのプロセッサユニットをシステム
から論理的に切断することを特徴とする。監視ユニット
は、プロセッサユニットにより割り込み間隔値が設定さ
れる第1のレジスタと、定間隔で生成されるクロックを
カウントする第1の計数回路と、第1の計数回路が上記
レジスタに設定された値をカウントしたときに割り込み
信号を生成するとともに上記第1の計数回路をリセット
する第1の比較回路と、プロセッサユニットが割り込み
を受信してから上記第1の計数回路をリセットするまで
に要するリセット間隔の上限値が設定される第2のレジ
スタと、上記第1の比較回路出力により定間隔で生成さ
れるクロックのカウントを開始する第2の計数回路と、
この第2の計数回路出力が上記リセット間隔の上限値を
カウントしたときプロセッサユニットの異常を示す信号
を生成する第2の比較回路で構成される。
【0006】また、本発明の多重系計算機システムにお
ける自己診断方式は、1以上のプロセッサユニットと、
各プロセッサユニットに対して定期的に割り込みを発
し、その応答を待ってプロセッサユニットの状態を監視
する監視ユニットとを備え、監視ユニットは各プロセッ
サユニット単体の状態監視を行うとともに、各プロセッ
サユニットの状態監視結果の論理積演算を行うことによ
り自身を含むプロセッサ単体以外の共通回路の異常を検
出することも特徴とする。
【0007】このことにより、CPU(プロセッサユニ
ット)単位での故障検出が行え、故障CPUの縮退や他
CPUへの処理の切替えを可能とし、安価なHAシステ
ム等多重化計算機システムを構築することができる。
【0008】
【発明の実施の形態】図1は本発明の実施例を示すブロ
ック図である。本発明実施例では4CPU構成の計算機
システムが想定されている。図において、1〜4はプロ
セッサユニット(CPU)である。CPU1〜4は、シ
ステムバス5を介して接続される共通メモリ6に記憶さ
れたプログラムを読み出し実行することにより、演算制
御他、システムに接続される各種周辺装置7-1〜7-nの
制御を行う。
【0009】8は監視装置である。監視装置8は、各C
PU1〜4に対して定期的に割り込みを発し、その応答
を待つことによりCPU1〜4の状態監視を行うもの
で、監視装置8によりCPU1〜4の異常を検出したと
き、そのCPU1〜4をシステムから論理的に切断する
ための指示を発する。また、CPU1〜4の状態監視結
果の論理積演算を行うことにより自身を含むシステムバ
ス5等プロセッサ単体以外の共通回路の異常をも検出す
る。監視装置8の内部構成等詳細については図2に示さ
れている。
【0010】図2において、81、82はレジスタ、8
3、84はカウンタ、85、86は比較器である。監視
装置8を構成する監視回路8-1〜8-4はCPU1〜4毎
用意され、監視回路8-1〜8-4上述したコンポーネント
81〜86により構成される。レシジスタ81にはCP
U1(234)により割り込み間隔値が設定され、レジ
スタ82には、CPU1(234)が割り込みを受信し
てから後述するカウンタ83をリセットするまでに要す
るリセット間隔の上限値が設定される。カウンタ838
4は、システムクロック等一定間隔で生成されるクロッ
クをカウントするもので、比較器85による一致出力に
よりリセットされる。比較器85は、カウンタ値とレジ
スタ値を比較することにより、カウンタ83がレジスタ
81に設定された値をカウントしたときに割り込み信号
を生成するとともにカウンタ83をリセットする。一
方、カウンタ84は、比較器85によって生成される割
り込み信号により定間隔で生成されるクロックのカウン
トを開始する。比較器86は、カウンタ84が、レジス
タ82に設定された、CPU1(2、3、4)が割り込
みを受信してからカウンタ83をリセットするまでに要
するリセット間隔の上限値をカウントしたときに異常信
号として出力する。
【0011】以下、本発明実施例の動作について詳細に
説明する。
【0012】図1は計算機システムが4CPUにより構
成されるケースを例示しており、監視装置8を構成する
各監視回路8-1〜8-4はシステムバス5に接続された各
々のCPU1〜4に接続されている。監視装置8からは
各CPU1〜4に対して割り込み信号が出力され、これ
に対しCPU1〜4の応答がなければ該当するCPU1
〜4は異常状態にあることがわかる。
【0013】監視回路8-1〜8-4は、CPU1〜4毎同
様の回路構成になっており、監視回路8-1を例示して、
まず、レジスタ81には定期的にCPU1に対して割り
込みを出力するためのタイミングデータ、ここでは“F
F”が設定されるものとする。カウンタ83はシステム
クロック等一定周期のクロックをカウント更新してい
く。ここでカウンタ83による値が先に設定されたレジ
スタ値“FF”をカウントしたなら比較器85出力が有
効となって割り込み信号としてCPU1に対し通知され
る。同時に比較器85出力はカウンタ84に対するカウ
ント許可信号として入力され、カウンタ83の更新は停
止され、割り込み信号が連続で出力される。
【0014】割り込みを受信したCPU1は、システム
バス5を介してカウンタ83をクリアする処理を行い、
結果的に割り込みをクリアする。CPU1が異常の場
合、このクリア処理は実行されないため、一定時間を越
えてクリアされない場合は、CPU1異常と判断する。
この一定期間の判定については、レジスタ82、カウン
タ84、比較器86により行われる。レジスタ82に
は、CPU1からの割り込みクリア処理の待機最大時間
の値が設定され、カウンタ84は、比較器85によって
生成される割り込み信号をカウント更新開始許可信号と
して得、システムクロックのカウントを開始する。比較
器86は、レジスタ82値とカウンタ84値の比較を行
い、割り込み発生後CPU1がカウンタクリア処理を実
行までの間の待機最大時間を越えたことを検出し、この
場合、システム異常として信号を出力する。CPU1が
正常で期間内にクリア処理が実行された場合、カウンタ
84の内容もリセットされる。
【0015】上述した監視回路をCPU毎に備え、各々
のCPUを監視することで異常CPUの検出が可能とな
る。異常が検知されたCPUは図示せぬ構成制御装置に
より論理的に切り離され、システムからの使用は禁止さ
れる。また、上述した監視回路ではカウンタの他にレジ
スタについても個々のCPU毎用意する方式について述
べたが、このレジスタについてのみ1個のレシジスタを
共用する方式てでも構わない。
【0016】一方、監視回路8-1〜8-4毎生成される異
常信号を監視装置8外部で論理積演算を行うことによ
り、CPU1(2、3、4)単体の異常ではなく、自身
8も含めシステムバス5等共通回路の異常として検出す
ることが可能となる。多重系計算機システムを構成する
CPU1(2、3、4)が同時に異常発生する確率は十
分に低く、どのCPU1(2、3、4)からも割り込み
クリアの処理がなされない場合はCPU1(2、3、
4)以外の共通回路によるものと判断できる。
【0017】以上説明のように本発明は、CPUの監視
をハードウェアで、かつCPU単位で行うものてであ
り、このことにより、故障CPUの縮退や他CPUへの
切替えを可能とし、安価なHAシステム等多重系計算機
システムを構築することが可能となる。
【0018】
【発明の効果】以上説明のように本発明によれば、レジ
スタ、カウンタ、比較器で構成される簡単なハードウェ
アコンポーネントを追加するだけで監視回路を構築する
ことができ、以上のロジックをCPU毎備え、おのおの
がCPUを監視することで以上CPUの検出を可能とす
るものてある。また、監視回路毎生成される以上信号の
論理積をとることによってCPU単体の異常ではなく、
共通回路の異常も検出可能となり、故障CPUの縮退や
他CPUへの切替えを可能とし、従来のようにシステム
を全二重化する必要はなくなるため、安価な多重化計算
機システムを構築することができる。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図。
【図2】図1における監視装置の内部構成を示すブロッ
ク図。
【符号の説明】
1〜4…プロセッサユニット(CPU)、5…システム
バス、6…メモリ、7(7-1〜7-n)…周辺装置、8
(8-1〜8-4)…監視装置(回路)、81、82…レジ
スタ、83、84…カウンタ、85、86…比較器。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 1以上のプロセッサユニットと、各プロ
    セッサユニットに対して定期的に割り込みを発し、その
    応答を待ってプロセッサユニットの状態を監視する監視
    ユニットとを備え、監視ユニットによってプロセッサユ
    ニットの異常を検出したとき、そのプロセッサユニット
    をシステムから論理的に切断することを特徴とする多重
    系計算機システムにおける自己診断方式。
  2. 【請求項2】 監視ユニットは、プロセッサユニットに
    より割り込み間隔値が設定される第1のレジスタと、定
    間隔で生成されるクロックをカウントする第1の計数回
    路と、第1の計数回路が上記レジスタに設定された値を
    カウントしたときに割り込み信号を生成するとともに上
    記第1の計数回路をリセットする第1の比較回路と、プ
    ロセッサユニットが割り込みを受信してから上記第1の
    計数回路をリセットするまでに要するリセット間隔の上
    限値が設定される第2のレジスタと、上記第1の比較回
    路出力により定間隔で生成されるクロックのカウントを
    開始する第2の計数回路と、この第2の計数回路出力が
    上記リセット間隔の上限値をカウントしたときプロセッ
    サユニットの異常を示す信号を生成する第2の比較回路
    から成ることを特徴とする請求項1記載の多重系計算機
    システムにおける自己診断方式。
  3. 【請求項3】 1以上のプロセッサユニットと、各プロ
    セッサユニットに対して定期的に割り込みを発し、その
    応答を待ってプロセッサユニットの状態を監視する監視
    ユニットとを備え、監視ユニットは各プロセッサユニッ
    ト単体の状態監視を行うとともに、各プロセッサユニッ
    トの状態監視結果の論理積演算を行うことにより自身を
    含むプロセッサ単体以外の共通回路の異常を検出するこ
    とを特徴とする多重系計算機システムにおける自己診断
    方式。
JP9204218A 1997-07-30 1997-07-30 多重系計算機システムにおける自己診断方式 Pending JPH1153222A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9204218A JPH1153222A (ja) 1997-07-30 1997-07-30 多重系計算機システムにおける自己診断方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9204218A JPH1153222A (ja) 1997-07-30 1997-07-30 多重系計算機システムにおける自己診断方式

Publications (1)

Publication Number Publication Date
JPH1153222A true JPH1153222A (ja) 1999-02-26

Family

ID=16486801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9204218A Pending JPH1153222A (ja) 1997-07-30 1997-07-30 多重系計算機システムにおける自己診断方式

Country Status (1)

Country Link
JP (1) JPH1153222A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001266196A (ja) * 2000-03-17 2001-09-28 Toshiba Corp 多重機器システム、多重機器システムの機器切替方法、料金収受システム、および料金収受システムの機器切替方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001266196A (ja) * 2000-03-17 2001-09-28 Toshiba Corp 多重機器システム、多重機器システムの機器切替方法、料金収受システム、および料金収受システムの機器切替方法

Similar Documents

Publication Publication Date Title
JPH0792765B2 (ja) 入/出力コントローラ
US6321289B1 (en) Apparatus for automatically notifying operating system level applications of the occurrence of system management events
US6463492B1 (en) Technique to automatically notify an operating system level application of a system management event
JPH1153222A (ja) 多重系計算機システムにおける自己診断方式
JP2003256240A (ja) 情報処理装置及びその障害回復方法
JPH11259340A (ja) コンピュータの再起動制御回路
JPS60134942A (ja) 異常状態におけるバツクアツプシステム
JP2845616B2 (ja) マルチプロセッサシステム
JPH0652130A (ja) マルチプロセッサシステム
JPH10143393A (ja) 診断処理装置
JPH03266131A (ja) 多重化システムの無応答判定方式
JPH07114521A (ja) マルチマイクロコンピュータシステム
KR100394736B1 (ko) 이중화 시스템에서 보드 선택 및 에러 복구장치 및 방법
JPH05224964A (ja) バス異常通知方式
JP2744113B2 (ja) 計算機システム
JPH03111962A (ja) マルチプロセッサ・システム
JPH04123145A (ja) マイクロコンピュータ
JP2001350674A (ja) 計算機システム
JPH02206866A (ja) マルチプロセッサシステムにおけるリセット信号発生装置
JP2020071492A (ja) 情報処理システム
JPH07200334A (ja) 二重化同期運転方式
JPH01310422A (ja) マイクロコンピュータのリセット回路
JPS60254338A (ja) マルチプロセツサの異常検出方式
JPH041831A (ja) プログラム暴走監視方式
JPH01224848A (ja) マルチプロセッシングシステム