JPH06231009A - Monitoring device - Google Patents

Monitoring device

Info

Publication number
JPH06231009A
JPH06231009A JP5014576A JP1457693A JPH06231009A JP H06231009 A JPH06231009 A JP H06231009A JP 5014576 A JP5014576 A JP 5014576A JP 1457693 A JP1457693 A JP 1457693A JP H06231009 A JPH06231009 A JP H06231009A
Authority
JP
Japan
Prior art keywords
cpu
bus
central processing
frequency
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5014576A
Other languages
Japanese (ja)
Inventor
Tetsuya Toi
哲也 戸井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP5014576A priority Critical patent/JPH06231009A/en
Publication of JPH06231009A publication Critical patent/JPH06231009A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To provide a monitoring device capable of recognizing the malfunction of a CPU due to a cause other than a transitory one correctly. CONSTITUTION:A CPU monitoring device 11 is equipped with a bus request number of times counter 31 which counts the number of times of bus requests of respective CPU set as the target of monitoring, and applies interruption to the CPU with a count value within a time set by an interval timer 32 less than a value set by a lower limitation setting register 33. A result of interruption is registered on a response register 37. and a control circuit 34 discriminates the CPU as an abnormal one when no normal response is received within fixed time. A discrimination result is outputted to an error display signal line 21 and an error notification signal line 22.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は複数の中央処理装置を備
えた計算機システムで、これら中央処理装置の動作を監
視するために用いられる監視装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a monitoring system used in a computer system having a plurality of central processing units to monitor the operation of these central processing units.

【0002】[0002]

【従来の技術】中央処理装置(以下、単にCPUと略称
する。)を使用した計算機システムでは、何らかの原因
によってCPUが暴走することがある。CPUの暴走を
監視して、これが検出されたときにシステムを正常な状
態に戻すために、従来からウォッチ・ドッグ・タイマが
使用されている。
2. Description of the Related Art In a computer system using a central processing unit (hereinafter simply referred to as CPU), the CPU may run away for some reason. Watchdog timers have traditionally been used to monitor CPU runaway and return the system to a normal state when this is detected.

【0003】ウォッチ・ドッグ・タイマに関しては、例
えば特公平4−19577号公報に詳細な開示が行われ
ている。すなわち、この監視手法では、CPUがクロッ
クパルスを計数することによって、周期的に信号が発生
されるようにしている。そして、これにより発生する信
号がこの周期よりも長い所定の時間以上途切れるような
事態が発生した場合には、CPUに暴走等の動作不良が
生じたものと判断し、適切な措置が採られるようになっ
ている。例えば、この判断が行われた時点でリセット信
号を出力してCPUをリセットし、正常動作に戻すとい
った措置が採られる。
The watch dog timer is disclosed in detail in, for example, Japanese Patent Publication No. 4-19577. That is, in this monitoring method, a signal is generated periodically by the CPU counting clock pulses. Then, when a situation occurs in which the signal generated thereby is interrupted for a predetermined time longer than this cycle, it is determined that a malfunction of the CPU such as runaway has occurred, and appropriate measures are taken. It has become. For example, when this judgment is made, a reset signal is output to reset the CPU to restore normal operation.

【0004】ところで、CPUが動作不良に陥る原因と
しては各種のものがある。このうちの一過性の原因とし
ては、瞬発的な外来雑音の発生が代表的である。この他
に、ハードウェアの障害によるものやソフトウェアその
他の障害によるものがある。前者の例としては、CPU
に対する直流電源の供給不良や、動作クロックの停止、
半導体素子の冷却不良に基づく熱暴走を挙げることがで
きる。後者の例としては、ソフトウェアに欠陥(バグ)
があったような場合や、入力データにエラーがあってプ
ログラム自身が異常を検出して動作中止(ホールト)状
態になったような場合を挙げることができる。
By the way, there are various causes of CPU malfunction. One of the typical causes of the transient noise is the occurrence of instantaneous external noise. In addition to this, there are hardware failures and software and other failures. An example of the former is a CPU
Supply of DC power to the
Thermal runaway due to poor cooling of semiconductor elements can be mentioned. An example of the latter is a software defect (bug)
There is a case where there is an error, or a case where an error occurs in the input data and the program itself detects an abnormality and enters an operation halt state.

【0005】[0005]

【発明が解決しようとする課題】CPUが動作不良に陥
る原因のうち一過性のものは、ウォッチ・ドッグ・タイ
マを使用してCPUにリセットをかければ、これを正常
に復帰させることができる。しかしながら、ハードウェ
アの故障やソフトウェアを原因としてホールトが発生し
たような場合には、システムを正常に復帰させることが
できない。すなわち、この場合にウォッチ・ドッグ・タ
イマが異常を検出してCPUを繰り返しリセットさせて
も、CPUは同一状況において再び動作不良を起こして
しまう。したがって、このような場合にはウォッチ・ド
ッグ・タイマを用いてもシステムの改善を行うことがで
きない。
The temporary cause of the malfunction of the CPU can be restored to normal by resetting the CPU using the watch dog timer. . However, if a halt occurs due to a hardware failure or software, the system cannot be restored normally. That is, in this case, even if the watch dog timer detects an abnormality and resets the CPU repeatedly, the CPU will malfunction again in the same situation. Therefore, in such a case, the system cannot be improved even by using the watch dog timer.

【0006】そればかりか、ウォッチ・ドッグ・タイマ
自体は正常に動作してCPUのリセットが行われている
ので、これによっても不都合な状況が改善されていない
といった認識をシステム自体が持つこともできなかっ
た。したがって、何らかの不具合が発生したときにこれ
を上位のシステム等に通知するような機構を持ったシス
テムであったとしても、この段階でこの不具合を通知す
ることもできなかった。
Not only that, since the watch dog timer itself operates normally and the CPU is reset, the system itself may have the recognition that the inconvenient situation is not improved even by this. There wasn't. Therefore, even if the system has a mechanism for notifying a higher level system when some kind of trouble occurs, it is not possible to notify this trouble at this stage.

【0007】また、従来のこのような監視装置では、ウ
ォッチ・ドッグ・タイマがCPUに周期的に割込信号を
入力して、一定時間以内にこれに対する応答があるかど
うかをチェックし、応答があれば正常動作が行われてい
ると判断することになっていた。したがって、CPUは
自分が問題なく正常に動作しているような場合にも、周
期的に発生する割り込みに対して必ず応答を行うことが
必要となり、これが処理能力を実質的に低下させること
につながることになった。
Further, in such a conventional monitoring device, the watch dog timer periodically inputs an interrupt signal to the CPU and checks whether or not there is a response to the signal within a predetermined time. If so, it was decided that the normal operation was performed. Therefore, even when the CPU is operating normally without any problem, it is necessary for the CPU to respond to interrupts that occur periodically, which leads to a substantial decrease in processing capability. is what happened.

【0008】そこで本発明の目的は、一過性以外の原因
で引き起こされたCPUの動作不良を正しく認識するこ
とのできる監視装置を提供することにある。
Therefore, an object of the present invention is to provide a monitoring device capable of correctly recognizing a malfunction of a CPU caused by a cause other than a transient.

【0009】本発明の他の目的は、CPUの動作不良を
正しく認識してこれを上位装置に通知することのできる
監視装置を提供することにある。
Another object of the present invention is to provide a monitoring device capable of correctly recognizing a malfunction of a CPU and notifying the malfunction to a host device.

【0010】本発明の更に他の目的は、正常動作中のC
PUに過度の負担を強いることなくその監視を行うこと
のできる監視装置を提供することにある。
Still another object of the present invention is to provide C during normal operation.
It is an object of the present invention to provide a monitoring device capable of monitoring the PU without imposing an excessive burden on the PU.

【0011】[0011]

【課題を解決するための手段】請求項1記載の発明で
は、(イ)CPUが一定時間にバスを使用する頻度を測
定する頻度測定手段と、(ロ)この頻度測定手段の測定
値を予め定めた許容範囲と比較する比較手段と、(ハ)
この比較手段によって予め定めた許容範囲に属さない頻
度であると判別されたとき、そのCPUの異常を検出す
る異常検出手段とを監視装置に具備させる。
According to a first aspect of the present invention, (a) a frequency measuring means for measuring the frequency of use of a bus by a CPU for a fixed time, and (b) a measurement value of the frequency measuring means in advance. Comparison means to compare with the specified tolerance range, and (c)
When the comparison unit determines that the frequency does not fall within the predetermined allowable range, the monitoring device is provided with an abnormality detection unit that detects an abnormality of the CPU.

【0012】すなわち請求項1記載の発明では、CPU
が一定時間にバスを使用する頻度を測定して、これが予
め定めた許容範囲外である場合には、そのCPUに何ら
かの障害が発生したものとしてそのCPUの異常を検出
するようにしている。
That is, in the invention described in claim 1, the CPU
Measures the frequency of using the bus for a certain period of time, and if it is out of a predetermined allowable range, it is determined that some failure has occurred in the CPU and the abnormality of the CPU is detected.

【0013】請求項2記載の発明では、(イ)CPUが
一定時間にバスを使用する頻度を測定する頻度測定手段
と、(ロ)この頻度測定手段の測定値を予め定めた許容
範囲と比較する比較手段と、(ハ)この比較手段によっ
て予め定めた許容範囲に属さない頻度であると判別され
たとき、そのCPUに対して所定の応答を出力させるた
めの割込信号を送出する割込信号送出手段と、(ニ)こ
の割込信号が送出されてから所定の時間内にそのCPU
が正常な応答を行った場合を除いてそのCPUの異常を
検出する異常検出手段とを監視装置に具備させる。
In a second aspect of the present invention, (a) a frequency measuring means for measuring the frequency of use of the bus by the CPU for a fixed time, and (b) a measurement value of the frequency measuring means is compared with a predetermined allowable range. And (c) an interrupt that sends an interrupt signal for outputting a predetermined response to the CPU when the comparison means determines that the frequency does not fall within the predetermined allowable range. (D) signal transmission means, and (d) the CPU within a predetermined time after this interrupt signal is transmitted.
The monitoring device is provided with an abnormality detecting means for detecting an abnormality of the CPU except when the CPU makes a normal response.

【0014】すなち請求項2記載の発明では、CPUが
一定時間にバスを使用する頻度を測定して、これが予め
定めた許容範囲外である場合には、そのCPUに何らか
の障害が発生したもの一応推察し、そのCPUに対して
割り込みをかけ、異常な応答が行われたり、所定の時間
内に応答が行われなかったような場合にはそのCPUの
異常を検出するようにしている。
That is, according to the second aspect of the present invention, the frequency at which the CPU uses the bus for a certain period of time is measured, and if it is outside the predetermined allowable range, some failure occurs in the CPU. In the meantime, the CPU is interrupted, and if an abnormal response is made or no response is made within a predetermined time, the abnormality of the CPU is detected.

【0015】請求項3記載の発明では、(イ)バスを共
用する複数のCPUそれぞれが一定時間にバスを使用す
る頻度を個別に測定する頻度測定手段と、(ロ)この頻
度測定手段による各CPUごとの測定値を予め定めた許
容範囲と比較する比較手段と、(ハ)この比較手段によ
って予め定めた許容範囲に属さない頻度であると判別さ
れたCPUに対して所定の応答を出力させるための割込
信号を送出する割込信号送出手段と、(ニ)この割込信
号が送出されてから所定の時間内にそのCPUが正常な
応答を行った場合を除いてそのCPUの異常を検出する
異常検出手段と、(ホ)この異常検出手段の検出結果を
外部に出力する検出結果出力手段とを監視装置に具備さ
せる。
According to the third aspect of the present invention, (a) frequency measuring means for individually measuring the frequency of each of a plurality of CPUs sharing a bus using the bus at a fixed time; and (b) each of the frequency measuring means. A comparing means for comparing the measured value for each CPU with a predetermined allowable range; and (c) outputting a predetermined response to the CPU determined to have a frequency that does not fall within the predetermined allowable range by the comparing means. An interrupt signal transmitting means for transmitting an interrupt signal for the purpose of: (d) Except when the CPU makes a normal response within a predetermined time after the interrupt signal is transmitted, the abnormality of the CPU is detected. The monitoring device is provided with abnormality detecting means for detecting and (e) detection result outputting means for outputting the detection result of the abnormality detecting means to the outside.

【0016】すなわち請求項3記載の発明では、バスを
共用する複数のCPUが監視の対象になる場合を扱って
おり、この場合にはそれらCPUごとに頻度測定手段を
用意することにしている。そして、測定した各頻度を許
容範囲と比較し、異常と推察されるCPUに対しては割
り込みをかけてチェックを行い、いずれかのCPUに異
常が判別されたら、その検出結果を外部に出力し、例え
ば各CPUの状況を表示部に表示したり、上位装置に結
果を報告することを可能にしている。
That is, the invention according to claim 3 deals with the case where a plurality of CPUs sharing a bus are to be monitored, and in this case, frequency measuring means is prepared for each of these CPUs. Then, each measured frequency is compared with the permissible range, and CPUs that are suspected to be abnormal are interrupted and checked. If any of the CPUs is determined to be abnormal, the detection result is output to the outside. For example, the status of each CPU can be displayed on the display unit and the result can be reported to the host device.

【0017】請求項4記載の発明では、(イ)バスを共
用する複数のCPUそれぞれが一定時間にバスを使用す
る頻度を個別に測定する頻度測定手段と、(ロ)この頻
度測定手段による各CPUごとの測定値を予め定めた許
容範囲と比較する比較手段と、(ハ)この比較手段によ
って予め定めた許容範囲に属さない頻度であると判別さ
れたCPUに対して所定の応答を出力させるための割込
信号を送出する割込信号送出手段と、(ニ)この割込信
号が送出されてから所定の時間内にそのCPUが正常な
応答を行った場合を除いてそのCPUの異常を検出する
異常検出手段と、(ホ)前記した複数のCPUのバス使
用要求を調停するバス調停手段と、(ヘ)異常検出手段
によって異常が検出されたCPUがバス使用要求を行っ
たときこれがバス調停手段に到達しないようにマスクす
るバス要求マスク手段とを監視装置に具備させる。
According to the fourth aspect of the present invention, (a) frequency measuring means for individually measuring the frequency of each of a plurality of CPUs sharing a bus using the bus at a fixed time; and (b) each of the frequency measuring means. A comparing means for comparing the measured value for each CPU with a predetermined allowable range; and (c) outputting a predetermined response to the CPU determined to have a frequency that does not fall within the predetermined allowable range by the comparing means. An interrupt signal transmitting means for transmitting an interrupt signal for the purpose of: (d) Except when the CPU makes a normal response within a predetermined time after the interrupt signal is transmitted, the abnormality of the CPU is detected. Abnormality detection means for detecting, (e) bus arbitration means for arbitrating the bus use requests of the plurality of CPUs described above, and (f) when a CPU in which an abnormality is detected by the abnormality detection means makes a bus use request A bus request mask means for masking so as not to reach the stop means is provided in the monitoring device.

【0018】すなわち請求項4記載の発明でも、請求項
3記載の発明と同様にバスを共用する複数のCPUが監
視の対象になる場合を扱っている。請求項4記載の発明
の場合にはこれらのCPUがバスの使用を要求した場合
の競合を調整するためのバス調停手段を備えており、C
PUごとに頻度の測定を行い、異常と推察されるCPU
に対しては割り込みによって確認を行って、最終的に異
常と判別されたCPUについては、バス調停手段に対す
るバスの使用要求をマスクすることによって、誤動作の
発生を防止している。
That is, the invention according to claim 4 also deals with the case where a plurality of CPUs sharing a bus are to be monitored as in the invention according to claim 3. In the case of the invention described in claim 4, a bus arbitration means for adjusting contention when these CPUs request the use of the bus is provided, and C
CPU is estimated to be abnormal by measuring the frequency for each PU
For the CPU that is finally determined to be abnormal, the bus use request to the bus arbitration unit is masked to prevent the malfunction from occurring.

【0019】[0019]

【実施例】以下実施例につき本発明を詳細に説明する。EXAMPLES The present invention will be described in detail below with reference to examples.

【0020】図1は本発明の一実施例における監視装置
を使用した計算機システムの構成を表わしたものであ
る。このシステムでCPU監視装置11はシステムバス
12を介して第0〜第3のCPU130 〜133 と、こ
れらの共有メモリ14および入出力制御回路15と接続
されている。入出力制御回路15には、図示しない入出
力装置が接続されるようになっている。CPU監視装置
11と第0〜第3のCPU130 〜133 の間には、C
PU監視装置11側からこれらに個別に割り込みをかけ
るための割込信号線(INT)170 〜173 と、各C
PU130 〜13 3 がシステムバス12の使用を要求す
る際に使用するバス要求線(BR)180〜183 と、
CPU監視装置11がこれらのCPU130 〜133
1つにシステムバス12の使用を許可する際に使用する
バス使用許可線190 〜193 が配置されている。
FIG. 1 is a monitoring device according to an embodiment of the present invention.
Represents the configuration of a computer system using
It In this system, the CPU monitoring device 11 is a system bus
0th to 3rd CPUs 13 via 120~ 133And this
Connection with shared memory 14 and input / output control circuit 15
Has been done. The input / output control circuit 15 is not shown
Force device is connected. CPU monitoring device
11 and the 0th to 3rd CPU 130~ 133Between C
These are individually interrupted from the PU monitoring device 11 side.
Interrupt signal line (INT) 17 for0~ 173And each C
PU130~ 13 3Requires the use of system bus 12
Bus request line (BR) 18 used when0~ 183When,
The CPU monitoring device 11 has these CPUs 130~ 133of
Used to allow the use of the system bus 12 for one
Bus use permission line 190~ 193Are arranged.

【0021】更に、CPU監視装置11にはエラー表示
信号線21とエラー通知信号線22の一端が接続されて
いる。エラー表示信号線21は第0〜第3のCPU13
0 〜133 のエラーの発生状況を表示する信号を出力す
るもので、その他端はエラー表示装置23に接続されて
いる。エラー通知信号線22は第0〜第3のCPU13
0 〜133 に何らかのエラーが発生した場合にこれを上
位装置に通知するためのものであり、本実施例ではその
他端が通知先としての図示しないシステム管理プロセッ
サに接続されている。
Further, one end of an error display signal line 21 and an error notification signal line 22 is connected to the CPU monitoring device 11. The error display signal line 21 is connected to the 0th to 3rd CPUs 13
0-13 3 outputs a signal indicating the occurrence of an error, the other end is connected to the error display 23. The error notification signal line 22 is connected to the 0th to 3rd CPUs 13
0-13 is 3 for notifying this to the host apparatus when an error occurs, in the present embodiment and the other end is connected to a system management processor (not shown) as a notification destination.

【0022】図2は、CPU監視装置の機能的な構成を
表わしたものである。CPU監視装置11は、図1に示
した第0〜第3のCPU130 〜133 のバス要求回数
をカウントするバス要求回数カウンタ31を備えてい
る。これらのバス要求回数は、インターバルタイマ32
によって設定された時間内で計数され、下限値設定レジ
スタ33に設定された下限値と比較されるようになって
いる。この結果として計数値が下限値に満たないCPU
13が存在した場合には、制御回路34が該当するその
CPU13に接続された割込信号線17に割込信号を送
出するようになっている。応答タイマ35はこのときの
そのCPU13からの応答時間を測定するためのタイマ
である。
FIG. 2 shows a functional configuration of the CPU monitoring device. The CPU monitoring device 11 includes a bus request number counter 31 that counts the number of bus requests of the 0th to 3rd CPUs 13 0 to 13 3 shown in FIG. These bus request counts are determined by the interval timer 32.
Is counted within the time set by, and compared with the lower limit value set in the lower limit value setting register 33. As a result, the CPU whose count value is less than the lower limit value
When there is 13, the control circuit 34 sends an interrupt signal to the interrupt signal line 17 connected to the corresponding CPU 13. The response timer 35 is a timer for measuring the response time from the CPU 13 at this time.

【0023】なお、本実施例では下限値設定レジスタ3
3に各CPU130 〜133 の下限値として共通の下限
値を設定するが、これはCPU130 〜133 ごとにそ
れらのバスアクセスの頻度を考慮して異なった下限値を
設定するようにしてもよい。この場合には、アドレスバ
ス12Aに接続されたデコーダ36の解読結果を基にし
てCPU13ごとに下限値を下限値設定レジスタ33に
登録するようにすればよい。
In this embodiment, the lower limit value setting register 3
A common lower limit value is set as the lower limit value for each of the CPUs 13 0 to 13 3 in the CPU 3. However, a different lower limit value is set for each of the CPUs 13 0 to 13 3 in consideration of the frequency of bus access. Good. In this case, the lower limit value may be registered in the lower limit value setting register 33 for each CPU 13 based on the decoding result of the decoder 36 connected to the address bus 12A.

【0024】CPU監視装置11は、該当するCPU1
3から割り込みに対する応答があった場合にはデコーダ
36で応答のあったCPU13を解読し、データバス1
2に現われたデータを応答レジスタ37に登録して制御
回路34で正常な応答があったかどうかを判別するよう
にしている。そして、エラーの発生が判別された場合に
は、エラー表示信号線21にエラー表示信号を出力する
と共に、エラー通知信号線22にエラー通知信号を出力
することになる。
The CPU monitoring device 11 has a corresponding CPU 1
When there is a response to the interrupt from 3, the decoder 36 decodes the responding CPU 13 and the data bus 1
The data appearing in 2 is registered in the response register 37 so that the control circuit 34 determines whether or not there is a normal response. When it is determined that an error has occurred, the error display signal is output to the error display signal line 21 and the error notification signal is output to the error notification signal line 22.

【0025】CPU監視装置11には、この他にバス調
停回路38が設けられており、システムバス12(図
1)の使用に際しての調停が行われるようになってい
る。バス調停回路38の入力側には、それぞれのバス要
求線180 〜183 に対応させて2入力アンドゲート3
0 〜393 が配置されている。これらのアンドゲート
390 〜393 の一方の入力端にはそれぞれのバス要求
信号が入力され、他方の入力端には制御回路34からマ
スク信号410 〜413 が入力されるようになってい
る。これらのマスク信号410 〜413 は、エラーの発
生したCPU13がバス要求信号を発生させた場合に、
これを無効とするためのものである。
In addition to this, the CPU monitoring device 11 is provided with a bus arbitration circuit 38 so that arbitration is performed when the system bus 12 (FIG. 1) is used. The input side of the bus arbitration circuit 38, two-input AND gate 3 respectively corresponding to the bus request line 18 0-18 3
9 0-39 3 are arranged. Each of the AND gates 39 0 to 39 3 receives the bus request signal at one input terminal thereof, and the mask signals 41 0 to 41 3 from the control circuit 34 at the other input terminal thereof. There is. These mask signals 41 0 to 41 3 are used when the CPU 13 in which an error has occurred generates a bus request signal.
This is to invalidate this.

【0026】これは、たとえハードウェアの故障が全く
一時的に発生して、その後の回路動作に問題が生じない
ような場合であっても、この故障によるプログラムの実
行の中断によって他のCPU13との処理同期が採られ
ない場合があることを考慮したためである。したがっ
て、1つのCPUが動作を回復してプログラムの実行を
開始しても他のCPUとの間に何らの不都合も生じさせ
ないような計算機システムでは、このようなバス要求信
号のマスクを必ずしも行う必要がないことは当然であ
る。
This is because even if a hardware failure occurs totally temporarily and no problem occurs in the subsequent circuit operation, interruption of the program execution due to this failure causes the CPU 13 to be interrupted by another CPU 13. This is because there is a case where the processing synchronization of is not always taken. Therefore, in a computer system in which one CPU does not cause any inconvenience with another CPU even if the CPU recovers its operation and starts executing a program, it is necessary to always mask the bus request signal. It is natural that there is no.

【0027】次にこの図2に示したCPU監視装置の回
路動作を具体的に説明する。下限設定レジスタ33に
は、この装置の初期設定の段階で、図1に示したシステ
ムバス12におけるデータバスDを通じて下限設定デー
タが供給され、セットされる。また、システム全体に共
通のクロック信号がクロック信号線51を通じてインタ
ーバルタイマ32と応答タイマ35に供給されている。
インターバルタイマ32は、計算機システムの各CPU
130 〜133 が動作を開始する時点で制御回路34か
らリセット信号52の供給を受け、以後、クロック信号
線51を通じてクロック信号のカウントアップを行うよ
うになっている。そして、所定の計数値に到達するたび
にカウントアップ信号53を出力して再び零から計数を
カウントアップするようになっている。すなわち、イン
ターバルタイマ32は制御回路34に対して所定の周期
でカウントアップ信号53を供給することになる。
Next, the circuit operation of the CPU monitoring device shown in FIG. 2 will be specifically described. The lower limit setting register 33 is supplied and set with the lower limit setting data through the data bus D in the system bus 12 shown in FIG. 1 at the stage of initial setting of this device. A clock signal common to the entire system is supplied to the interval timer 32 and the response timer 35 via the clock signal line 51.
The interval timer 32 corresponds to each CPU of the computer system.
13 0-13 3 receives a supply of the reset signal 52 from the control circuit 34 at the time of starting the operation, thereafter, and performs the count-up of the clock signal via a clock signal line 51. Then, each time a predetermined count value is reached, a count-up signal 53 is output and the count is again counted up from zero. That is, the interval timer 32 supplies the count-up signal 53 to the control circuit 34 at a predetermined cycle.

【0028】このカウントアップ信号53の1周期の時
間ごとにバス要求カウンタ31は各CPU130 〜13
3 のバス要求の回数をカウントする。すなわち、バス要
求カウンタ31はそれぞれのCPU130 〜133 に対
応したカウンタ550 〜55 3 を備えており、それぞれ
対応するバス要求線180 〜183 と接続されている。
そして、インターバルタイマ32がカウントアップ信号
53を出力するたびにこれらの計数したバス要求の回数
をカウント値情報560 〜563 として制御回路34に
供給する一方、この直後に制御回路34からリセット信
号57の供給を受けてそれぞれのカウンタ550 〜55
3 のカウント値を零にリセットするようになっている。
このようにして、バス要求カウンタ31からはそれぞれ
のCPU130 〜133 が単位時間当たりにバス要求を
行った頻度がカウント値として出力されることになる。
When one cycle of the count-up signal 53
The bus request counter 31 is provided for each CPU 13 at intervals.0~ 13
3Counts the number of bus requests for. That is, the bus is required
The job counter 31 is for each CPU 130~ 133Against
Counter 550~ 55 3Equipped with each
Corresponding bus request line 180~ 183Connected with.
Then, the interval timer 32 outputs a count-up signal.
Number of these counted bus requests each time 53 is output
Count value information 560~ 563As control circuit 34
While supplying, immediately after this, the reset signal from the control circuit 34.
Each counter 55 receives the supply of No. 57.0~ 55
3The count value of is reset to zero.
In this way, the bus request counter 31
CPU 130~ 133Bus requests per unit time
The frequency of execution is output as a count value.

【0029】制御回路34から出力されるマスク信号4
0 〜413 は各CPU130 〜133 に異常が検出さ
れない初期状態においてはH(ハイ)レベルとなってい
る。この状況下では、それぞれのバス要求線180 〜1
3 にCPU130 〜133からバス要求を示すHレベ
ルの信号が送られてくると、これらは対応するアンドゲ
ート390 〜393 を通過してバス調停回路38に供給
されることになる。図1に示したように、この計算機シ
ステムでは各CPU130 〜133 がシステムバス12
を共用している。したがって、バス調停回路38はCP
U130 〜13 3 のうちの複数が同時にシステムバス1
2の使用を要求したときに、いずれか1つにこれを使用
させるようにバスの使用権を調停するようになってい
る。この調停結果は、バス調停回路38に接続されたバ
ス使用許可線190 〜193 から対応するCPU130
〜133 に送出されるようになっている。
Mask signal 4 output from the control circuit 34
10~ 413Is each CPU 130~ 133Is detected
In the initial state, it is at H (high) level
It Under this situation, each bus request line 180~ 1
83To CPU130~ 133H level indicating bus request from
When a signal is sent from the
390~ 393Supply to the bus arbitration circuit 38 through
Will be done. As shown in Fig. 1, this computer system
Each CPU13 in the stem0~ 133Is the system bus 12
Are shared. Therefore, the bus arbitration circuit 38 is CP
U130~ 13 3System bus 1
Use this for any one when you request the use of 2.
To arbitrate the right to use the bus
It This arbitration result is stored in the bus arbitration circuit 38.
Use permission line 190~ 193Corresponding CPU130
~ 133It will be sent to.

【0030】さて、制御回路34は、バス要求カウンタ
31から得られたそれぞれのCPU130 〜133 につ
いての単位時間当たりのバス要求の回数を下限設定レジ
スタ33で設定しておいた下限値と比較するようになっ
ている。この下限値は、CPU130 〜133 が通常の
動作状況であると仮定したとき、インターバルタイマ3
2が設定した1周期の時間内でバス要求を行う統計的に
最低限の回数よりも若干低い値に設定されている。すな
わち、これらのCPU130 〜133 が正常に動作して
いれば、多くの場合、システムバス12に対するそれぞ
れのアクセスの回数はこの下限値よりも大きな値となる
ようになっている。
The control circuit 34 compares the number of bus requests per unit time for each of the CPUs 13 0 to 13 3 obtained from the bus request counter 31 with the lower limit value set in the lower limit setting register 33. It is supposed to do. This lower limit value is the interval timer 3 when the CPUs 13 0 to 13 3 are assumed to be in a normal operating condition.
2 is set to a value slightly lower than the statistically minimum number of times of requesting a bus within the time of one cycle set. That is, if these CPUs 13 0 to 13 3 are operating normally, the number of times of access to the system bus 12 will be larger than the lower limit value in many cases.

【0031】一方、もしCPU130 〜133 のいずれ
かが障害を発生しプログラムの実行が停止したような場
合には、システムバス12に対するバス要求の回数は増
加しなくなり、そのCPU13に対応するカウンタ55
のカウント値は前記した下限値よりも低い値になってし
まう。もちろん、あるCPU13のカウント値がこの下
限値よりも低い場合でも、直ちにそのCPU13に障害
が発生していると判断することはできない。そのCPU
13が、たまたまある時間帯でシステムバス12をアク
セスする必要性が少ないことは可能性として十分考えら
れることだからである。
On the other hand, if any of the CPUs 13 0 to 13 3 fails and execution of the program is stopped, the number of bus requests to the system bus 12 does not increase, and the counter corresponding to the CPU 13 is stopped. 55
The count value of is lower than the lower limit value. Of course, even if the count value of a certain CPU 13 is lower than this lower limit value, it cannot be immediately determined that a failure has occurred in that CPU 13. That cpu
This is because it is fully possible that 13 does not need to access the system bus 12 in a certain time zone.

【0032】そこで制御回路34はCPU130 〜13
3 のうち下限値よりも低い値となってしまったものに対
して確認の作業を行う。これは、制御回路34に接続さ
れた割込信号線170 〜173 のうち下限値よりもカウ
ント値が低くなってしまったCPU13に対応する線に
対して割込信号を送出することによって行われる。割込
信号は割込信号線17を通じて対応するCPU13の割
込端子INTに直接入力され、そのCPU13に割込処
理を行わせる。そのCPU13が正常ならば、割込処理
の結果として応答タイマ35によって設定された応答時
間内に正常な応答信号をシステムバス12に送出するよ
うになっている。
Therefore, the control circuit 34 controls the CPUs 13 0 to 13
Perform the confirmation work for those that have become lower than the lower limit of the three . This is done by sending an interrupt signal to the line corresponding to the CPU 13 of which the count value has become lower than the lower limit value among the interrupt signal lines 17 0 to 17 3 connected to the control circuit 34. Be seen. The interrupt signal is directly input to the corresponding interrupt terminal INT of the CPU 13 through the interrupt signal line 17, and causes the CPU 13 to perform the interrupt process. If the CPU 13 is normal, a normal response signal is sent to the system bus 12 within the response time set by the response timer 35 as a result of the interrupt processing.

【0033】応答タイマ35は、このような応答時間を
設定するために前記した割込信号が割込信号線17に送
出されるタイミングでリセット信号61を制御回路34
から供給され、そのカウント値を零にリセットされるよ
うになっている。そして、この時点からクロック信号線
51を通じてクロック信号のカウントアップを行い、応
答時間に相当する所定のクロック数をカウントアップし
たらカウントアップ信号62を制御回路34に送出する
ようになっている。
The response timer 35 outputs the reset signal 61 at the timing when the above-mentioned interrupt signal is sent to the interrupt signal line 17 in order to set such a response time.
It is supplied from and the count value is reset to zero. Then, from this time point, the clock signal is counted up through the clock signal line 51, and when the predetermined number of clocks corresponding to the response time is counted up, the count-up signal 62 is sent to the control circuit 34.

【0034】一方、応答レジスタ37はデータバス12
Dからデータを、またデコーダ36から応答のあったC
PU13の種類を判別するようになっている。このため
に、デコーダ36にはシステムバス12を構成するアド
レスバス12Aからアドレス情報が供給されるようにな
っている。
On the other hand, the response register 37 is the data bus 12
Data from D and C from which the decoder 36 responded
The type of PU 13 is discriminated. For this reason, the decoder 36 is supplied with address information from the address bus 12A constituting the system bus 12.

【0035】応答レジスタ37は、各CPU130 〜1
3 に対応した4つのレジスタ64 0 〜643 を備えて
いる。これらのレジスタ640 〜643 は、割込信号に
対する応答をCPUごとに登録するようになっている。
この中には、エラーの発生を示すエラービット(E)
と、応答の有無を示す応答ビット(R)とが含まれてい
る。
The response register 37 is provided for each CPU 130~ 1
Three34 registers 64 corresponding to 0~ 643Equipped with
There is. These registers 640~ 643Is the interrupt signal
A response to this is registered for each CPU.
In this, an error bit (E) indicating the occurrence of an error
And a response bit (R) indicating the presence or absence of a response are included.
It

【0036】障害の発生の可能性があるCPU13に対
して前記した割込信号が送出されたタイミングで、制御
回路34は応答レジスタ37内の対応するレジスタ64
の応答ビット(R)を応答ビットセット信号66によっ
て信号“1”にセットする。そして、応答タイマ35か
らカウントアップ信号62が出力される前に該当するC
PUから応答データ(正常時は“0”)の書き込みがあ
ると、該当するレジスタ37の応答ビットは信号“1”
から信号“0”に変化する。これに対して、時間内に応
答がなかった場合には、そのレジスタ37の応答ビット
は信号“1”のままとなる。また、応答自体はカウント
アップ信号62が出力される前に到来しても、その応答
データにおけるエラービット(E)がそのCPU13の
エラー検出によって信号“0”から信号“1”に変化し
ている場合がある。
At the timing when the above-mentioned interrupt signal is sent to the CPU 13 in which a failure may occur, the control circuit 34 causes the corresponding register 64 in the response register 37.
The response bit (R) is set to the signal "1" by the response bit set signal 66. Then, before the count-up signal 62 is output from the response timer 35, the corresponding C
When the response data (normally "0") is written from the PU, the response bit of the corresponding register 37 is the signal "1".
Changes to the signal "0". On the other hand, when there is no response within the time, the response bit of the register 37 remains the signal "1". Further, even if the response itself arrives before the count-up signal 62 is output, the error bit (E) in the response data changes from the signal "0" to the signal "1" due to the error detection of the CPU 13. There are cases.

【0037】制御回路34は、応答タイマ35からカウ
ントアップ信号62が出力された時点で対応するレジス
タ64内のエラービット(E)と応答ビット(R)の読
み出しを行う。そして、エラービット(E)が信号
“1”に変化していたり、応答ビットが信号“1”の場
合のまであれば、そのCPU13に何らかの障害が存在
するものとの判別を行う。制御回路34はこの場合に
は、CPU130 〜133 のうちのどれに障害が発生し
たかを示すエラー表示信号をエラー表示信号線21に出
力すると共に、エラー通知信号をエラー通知信号線22
に出力することになる。
The control circuit 34 reads the error bit (E) and the response bit (R) in the corresponding register 64 when the count-up signal 62 is output from the response timer 35. Then, if the error bit (E) is changed to the signal "1" or the response bit is the signal "1", it is determined that the CPU 13 has some trouble. In this case, the control circuit 34 outputs an error display signal indicating which of the CPUs 13 0 to 13 3 has a failure to the error display signal line 21 and outputs an error notification signal to the error notification signal line 22.
Will be output to.

【0038】また、制御回路34はこれと共に、障害の
発生したCPU13に対応するマスク信号41をHレベ
ルからL(ロー)レベルに論理レベルを切り替える。こ
の結果、Lレベルに切り替えられたアンドゲート39は
バス要求線18に表われたバス要求信号を通過させない
ようになり、障害の発生したCPU13からバス要求が
発生してもこれはバス調停回路38に到達しないことに
なる。すなわち、障害の発生したCPU13がシステム
バス12を要求しても、この要求を拒絶することにな
る。
At the same time, the control circuit 34 switches the logic level of the mask signal 41 corresponding to the faulty CPU 13 from the H level to the L (low) level. As a result, the AND gate 39 switched to the L level does not pass the bus request signal appearing on the bus request line 18, and even if a bus request is issued from the faulty CPU 13, this is caused by the bus arbitration circuit 38. Will not be reached. That is, even if the faulty CPU 13 requests the system bus 12, this request is rejected.

【0039】エラー表示信号がエラー表示信号線21に
出力されると、図示に示したようにエラー表示装置23
に障害を起こしたCPU13を特定する情報が表示され
る。この例では、異常と診断されたCPU13に対応す
るランプが点滅して、オペレータが適切な対応をとるこ
とができるようになる。エラー通知信号線22に出力さ
れたエラー信号は、前記したようにシステム管理プロセ
ッサに通知され、該当するCPU13の分担していた作
業を他のCPU13が分担する等の必要な措置が採られ
ることになる。
When the error display signal is output to the error display signal line 21, the error display device 23 as shown in the figure.
Information for identifying the CPU 13 that has failed is displayed. In this example, the lamp corresponding to the CPU 13 diagnosed as abnormal blinks, and the operator can take an appropriate action. The error signal output to the error notification signal line 22 is notified to the system management processor as described above, and necessary measures such as the work shared by the corresponding CPU 13 being shared by another CPU 13 are taken. Become.

【0040】図3は、制御回路による各CPUの監視制
御の様子を表わしたものである。なお、制御回路34
は、図示しないがCPUを内蔵しており、同じく図示し
ないROM(リード・オンリ・メモリ)に格納されたプ
ログラムを実行することによってこの図3に示したよう
な制御を行うようになっている。制御回路34内にはプ
ログラムの実行に際して各種データを一時的に格納する
ためのランダム・アクセス・メモリ(図示せず)も作業
用メモリとして用意されている。
FIG. 3 shows how the control circuit monitors and controls each CPU. The control circuit 34
3 has a built-in CPU (not shown), and similarly executes a program stored in a ROM (read only memory) (not shown) to perform the control as shown in FIG. A random access memory (not shown) for temporarily storing various data when the program is executed is also prepared in the control circuit 34 as a working memory.

【0041】制御回路34はインターバルタイマ32か
らカウントアップ信号53が出力されたかどうかを監視
している(ステップS101)。カウントアップ信号5
3が出力されると(Y)、前記した作業用メモリの所定
の領域に格納する数値Nが初期的に“0”にセットされ
る(ステップS102)。そして、まず第0のカウンタ
550 のカウント値が下限設定レジスタ33で設定して
おいた下限値よりも小さいかどうかの判別が行われる
(ステップS103)。小さくなければ(N)、値Nが
“3”に到達しているかどうかのチェックが行われる
(ステップS104)。この場合には値Nが“1”なの
で(N)、値Nが“1”だけカウントアップされる(ス
テップS05)。そして、ステップS103に戻って次
の第1のカウンタ551 について同様の比較作業が行わ
れることになる。
The control circuit 34 monitors whether or not the count-up signal 53 is output from the interval timer 32 (step S101). Count up signal 5
When 3 is output (Y), the numerical value N stored in the predetermined area of the working memory is initially set to "0" (step S102). Then, first, it is determined whether or not the count value of the 0th counter 55 0 is smaller than the lower limit value set in the lower limit setting register 33 (step S103). If not smaller (N), it is checked whether or not the value N has reached "3" (step S104). In this case, since the value N is "1" (N), the value N is incremented by "1" (step S05). Then, returning to step S103, the same comparison operation is performed for the next first counter 55 1 .

【0042】このようにして各カウンタ550 〜553
について順次、カウント値の比較が行われて、対応する
CPU130 〜133 がシステムバス12を通常行われ
る程度の頻度でアクセスしているかどうかのチェックが
行われる。この段階で、例えば第1のカウンタ551
カウント値が下限値よりも小さかったものとする。この
場合には(ステップS103;Y)、第1のCPU13
1 に対して割込信号が出力されることになる(ステップ
S106)。
In this way, each counter 55 0 to 55 3
Are sequentially compared with each other, and it is checked whether or not the corresponding CPUs 13 0 to 13 3 are accessing the system bus 12 as often as they are normally performed. At this stage, for example, it is assumed that the count value of the first counter 55 1 is smaller than the lower limit value. In this case (step S103; Y), the first CPU 13
An interrupt signal is output for 1 (step S106).

【0043】これと共に、応答タイマ35は応答の制限
時間を計るためにクロック信号線51を通じてクロック
信号のカウントアップを開始する(ステップS10
7)。そして、応答タイマ35からカウントアップ信号
62が出力される前に第1のCPU131 から応答があ
れば(ステップS109;N、S108;Y)、応答レ
ジスタ37の内容が正常応答であるかどうかをチェック
する(ステップS110)。そして、正常応答であれば
(Y)、第1のCPU131 は正常であるのでステップ
S104に進んで、次のCPU132 についての検査の
段階に作業を進めることになる。
At the same time, the response timer 35 starts counting up the clock signal through the clock signal line 51 in order to measure the response time limit (step S10).
7). If there is a response from the first CPU 13 1 before the count-up signal 62 is output from the response timer 35 (steps S109; N, S108; Y), it is determined whether the content of the response register 37 is a normal response. Check (step S110). Then, if the response is normal (Y), the first CPU 13 1 is normal, and thus the process proceeds to step S104 to proceed to the inspection stage for the next CPU 13 2 .

【0044】これに対して、ステップS110で第1の
CPU131 が正常な応答を行わなかったような場合、
すなわち第1のレジスタ641 内のエラービット(E)
が“1”に変化したような場合には(ステップS11
0;N)、第1のマスク信号411 をHレベルからLレ
ベルに切り替えて、第1のCPU131 のバス要求線1
1 にバス要求信号が表れたときにこれがバス調停回路
38に到達するのを遮断(マスク)する。また、第1の
CPU131 に障害があることが判明したのでその旨の
エラー表示を行わせるためにエラー表示信号線21にエ
ラー表示信号を出力すると共に、エラー通知信号線22
にエラー信号を出力する(ステップS111)。そし
て、ステップS104に戻って次のCPU132 に対す
るチェック作業を開始することになる。
On the other hand, if the first CPU 13 1 does not respond normally in step S110,
That is, the error bit (E) in the first register 64 1
Is changed to “1” (step S11
0; N), the first mask signal 41 1 is switched from H level to L level, the first CPU 13 1 of the bus request line 1
When the bus request signal appears at 8 1, it blocks (masks) the arrival of the bus request signal at the bus arbitration circuit 38. Further, since it has been found that the first CPU 13 1 has a failure, an error display signal is output to the error display signal line 21 and an error notification signal line 22
An error signal is output to (step S111). Then, the process returns to step S104 to start the check operation for the next CPU 13 2 .

【0045】このようにして各CPU130 〜133
対するチェック作業が順次進行し、この途中でカウント
値が下限値を下回ったCPU13に対しては割込処理に
よりそれらが正常に動作するかどうかのチェックが行わ
れることになる。そして、第3のCPU133 に対する
チェック作業が終了したら、ステップS104で値Nが
“3”となっているので、この値をカウントアップする
ことなく全チェック作業を終了させることになる(エン
ド)。もちろん、システムバス12にこれ以上の数のC
PU13が接続されている場合には、その数に応じた値
Nまでチェック作業が繰り返し行われることは当然であ
る。
In this way, the check work for each of the CPUs 13 0 to 13 3 progresses in sequence, and for the CPU 13 whose count value falls below the lower limit value during this, it is checked whether or not they normally operate by the interrupt process. A check will be made. Then, when the checking operation for the third CPU 13 3 is completed, the value N in step S104 is "3", so that to terminate the entire checking operation without counting up the value (END). Of course, there are more Cs on the system bus 12.
When the PUs 13 are connected, it goes without saying that the check work is repeated up to the value N according to the number.

【0046】変形例 Modification

【0047】図4は、本発明の監視装置の変形例を説明
するために、これに使用される条件設定レジスタの内容
を表わしたものである。この変形例では先の実施例の下
限設定レジスタ33の代わりに、監視の対象となるCP
Uごとに条件設定レジスタ71を配置している。この条
件設定レジスタ71は16ビット構成となっており、最
上位の1ビット“C”が条件ビット72を構成し、残り
の15ビットが条件値73を表わしている。
FIG. 4 shows the contents of the condition setting register used for explaining a modified example of the monitoring apparatus of the present invention. In this modified example, instead of the lower limit setting register 33 of the previous embodiment, the CP to be monitored
A condition setting register 71 is arranged for each U. The condition setting register 71 has a 16-bit configuration. The most significant 1 bit "C" constitutes a condition bit 72, and the remaining 15 bits represent a condition value 73.

【0048】ここで条件ビット72は、これが信号
“0”のときは条件値73で示された値未満のときにそ
のCPUを異常と判別し、先の実施例で説明したような
割込処理を行うことにしている。また、条件ビット72
が信号“1”のときには、条件値73で示された値を越
えたときにそのCPUを異常と判別し、先の実施例で説
明したような割込処理を行うことにしている。
When the condition bit 72 is the signal "0", it determines that the CPU is abnormal when it is less than the value indicated by the condition value 73, and the interrupt processing as described in the previous embodiment. I am going to do. Also, the condition bit 72
Is a signal "1", the CPU is determined to be abnormal when the value indicated by the condition value 73 is exceeded, and the interrupt processing as described in the previous embodiment is performed.

【0049】すなわち、この変形例では監視の対象とな
るCPUごとに一定時間内にバスをアクセスする回数に
対する異常推測の基準となる数値を自由に設定すると共
に、その基準となる数値よりも大きいときに異常と推測
するのか、小さいときに異常と推測するのかを条件ビッ
ト72によって設定できるようにしている。これによ
り、各CPUに対するより木目の細かい監視が可能にな
る。
In other words, in this modification, a numerical value that is a criterion for abnormality estimation with respect to the number of times the bus is accessed within a fixed time is freely set for each CPU to be monitored, and when it is larger than the criterion value. The condition bit 72 can set whether to presume abnormal or to presume abnormal when it is small. This allows more detailed monitoring of each CPU.

【0050】なお、以上説明した実施例では複数のCP
Uが共通のバスに接続されている計算機システムを例に
とって本発明の説明を行ったが、単独のCPUを監視す
る監視装置にも本発明を適用することができることはも
ちろんである。また、実施例および変形例では、一定時
間にバスの使用要求があったとき、それを計数して所定
の値と比較することにしたが、バスの使用要求の頻度を
割合等の他の手法で求め、これを所定の基準値または基
準範囲と比較するようにしてもよい。
In the embodiment described above, a plurality of CPs are used.
Although the present invention has been described by taking a computer system in which U is connected to a common bus as an example, it goes without saying that the present invention can also be applied to a monitoring device that monitors a single CPU. Further, in the embodiment and the modified example, when a bus use request is made in a certain period of time, the number is counted and compared with a predetermined value. However, another method such as a ratio of the bus use request frequency is used. It is also possible to compare the value with a predetermined reference value or reference range.

【0051】また、実施例および変形例ではこのような
比較作業の結果としてあるCPUが異常と推察されたと
き、更にそのCPUに割り込みをかけて応答を行わせ、
正常動作を行っているかどうかを判断することにした。
しかしながら、後者の再確認の作業を省略してそのCP
Uを異常と判断することも可能であることは言うまでも
ない。
Further, in the embodiment and the modified example, when a certain CPU is inferred to be abnormal as a result of such comparison work, the CPU is further interrupted to make a response,
I decided to judge whether it is operating normally.
However, omitting the latter reconfirmation work, the CP
It goes without saying that it is possible to judge U as abnormal.

【0052】特に、そのCPUがある時間帯においてど
の程度バスをアクセスする必要があるかを判別できるよ
うな場合には、それぞれの時間帯において下限設定レジ
スタ33(図2)あるいは条件設定レジスタ71の値を
こまめに書き換えるようすることで、そのCPUが異常
であるかどうかを十分正確に判断することが可能であ
る。
In particular, when it is possible to determine to what extent the CPU needs to access the bus in a certain time zone, the lower limit setting register 33 (FIG. 2) or the condition setting register 71 in each time zone can be determined. By frequently rewriting the values, it is possible to determine whether the CPU is abnormal or not with sufficient accuracy.

【0053】[0053]

【発明の効果】以上説明したように請求項1記載の発明
では、CPUがバスを使用する頻度を測定して、それが
異常な値であればそのCPUが異常であると判別するこ
とにした。したがって、そのCPUに何らの負担もかけ
ずに正常か否かの判別を行うことができるという効果が
ある。
As described above, according to the first aspect of the invention, the frequency at which the CPU uses the bus is measured, and if it is an abnormal value, it is determined that the CPU is abnormal. . Therefore, it is possible to determine whether the CPU is normal or not without imposing any load on the CPU.

【0054】また、請求項2記載の発明によれば、CP
Uがバスを使用する頻度を測定して、それが異常な値で
あれば、更にそのCPUに割り込みをかけて正常な応答
が行われるかどうかを判別することでそのCPUに異常
が発生したかどうかを最終的に判断することにしたの
で、正確な判断を行うことができる。しかも、CPUに
対する割り込みは、異常が推察される場合に限ったの
で、CPUにこの監視のための過度の負担を強いること
がないという利点がある。
According to the invention described in claim 2, CP
Whether the CPU has an abnormality by measuring the frequency at which the bus uses the bus and if it is an abnormal value, further interrupt the CPU to determine whether a normal response is made. I decided to make a final decision on whether to make an accurate decision. Moreover, the interruption to the CPU is limited to the case where an abnormality is suspected, so that there is an advantage that the CPU is not excessively burdened with the monitoring.

【0055】更に請求項3記載の発明によれば、バスを
共用する複数のCPUを監視の対象として、これらのC
PUに過度の負担をかけずに異常の有無を判別すること
ができる。しかも、異常を検出した場合にはその結果を
外部に出力することにしたので、例えば表示器に出力す
ることでオペレータにどのCPUが異常であるかを知ら
せることができる。また上位装置に知らせることで、こ
れら複数のCPUの共働作業に支障が生じないような措
置を採らせることができる。
Further, according to the third aspect of the invention, a plurality of CPUs sharing a bus are targeted for monitoring, and these C
It is possible to determine the presence or absence of an abnormality without imposing an excessive load on the PU. In addition, when an abnormality is detected, the result is output to the outside. Therefore, for example, by outputting the result to the display, the operator can be informed of which CPU is abnormal. In addition, by notifying the host device, it is possible to take measures so as not to hinder the cooperative work of the plurality of CPUs.

【0056】また、請求項4記載の発明によれば、複数
のCPUそれぞれについてバスの使用頻度の測定を行
い、異常と推察されるCPUに対しては割り込みによっ
て確認を行って、最終的に異常と判別されたCPUにつ
いては、バス調停手段に対するバスの使用要求をマスク
することにしたので、システム全体の誤動作の発生を未
然に防止することができる。
According to the invention described in claim 4, the bus usage frequency is measured for each of the plurality of CPUs, and the CPUs that are suspected to be abnormal are confirmed by interruption, and finally the abnormality is detected. With regard to the CPU determined to be the above, the use request of the bus to the bus arbitration means is masked, so that the malfunction of the entire system can be prevented.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の一実施例における監視装置を使用し
た計算機システムの構成を表わしたブロック図である。
FIG. 1 is a block diagram showing a configuration of a computer system using a monitoring device according to an embodiment of the present invention.

【図2】 本実施例でCPU監視装置の機能的な構成を
表わしたブロック図である。
FIG. 2 is a block diagram showing a functional configuration of a CPU monitoring device in this embodiment.

【図3】 制御回路による各CPUの監視制御の様子を
表わした流れ図である。
FIG. 3 is a flowchart showing a state of supervisory control of each CPU by a control circuit.

【図4】 本発明の変形例における条件設定レジスタの
内容を表わした説明図である。
FIG. 4 is an explanatory diagram showing contents of a condition setting register in a modified example of the present invention.

【符号の説明】[Explanation of symbols]

11…CPU監視装置(監視装置)、12…システムバ
ス、130 〜133 …CPU、14…共有メモリ、17
…割込信号線、18…バス要求線、19…バス使用許可
線、21…エラー表示信号線、22…エラー通知信号
線、23…エラー表示装置、31…バス要求カウンタ、
32…インターバルタイマ、33…下限設定レジスタ、
34…制御回路、35…応答タイマ、37…応答レジス
タ、38…バス調停回路、39…アンドゲート、55…
カウンタ、64…レジスタ、71…条件設定レジスタ、
72…条件ビット、73…条件値
11 ... CPU monitoring device (monitoring device), 12 ... System bus, 13 0 to 13 3 ... CPU, 14 ... Shared memory, 17
... interruption signal line, 18 ... bus request line, 19 ... bus use permission line, 21 ... error display signal line, 22 ... error notification signal line, 23 ... error display device, 31 ... bus request counter,
32 ... Interval timer, 33 ... Lower limit setting register,
34 ... Control circuit, 35 ... Response timer, 37 ... Response register, 38 ... Bus arbitration circuit, 39 ... AND gate, 55 ...
Counter, 64 ... Register, 71 ... Condition setting register,
72 ... Condition bit, 73 ... Condition value

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 中央処理装置が一定時間にバスを使用す
る頻度を測定する頻度測定手段と、 この頻度測定手段の測定値を予め定めた許容範囲と比較
する比較手段と、 この比較手段によって予め定めた許容範囲に属さない頻
度であると判別されたとき、その中央処理装置の異常を
検出する異常検出手段とを具備することを特徴とする監
視装置。
1. A frequency measuring means for measuring a frequency at which a central processing unit uses a bus for a fixed time, a comparing means for comparing a measured value of the frequency measuring means with a predetermined allowable range, and a comparing means for preliminarily using the comparing means. A monitoring device comprising: an abnormality detecting unit that detects an abnormality of the central processing unit when it is determined that the frequency does not fall within a predetermined allowable range.
【請求項2】 中央処理装置が一定時間にバスを使用す
る頻度を測定する頻度測定手段と、 この頻度測定手段の測定値を予め定めた許容範囲と比較
する比較手段と、 この比較手段によって予め定めた許容範囲に属さない頻
度であると判別されたとき、その中央処理装置に対して
所定の応答を出力させるための割込信号を送出する割込
信号送出手段と、 この割込信号が送出されてから所定の時間内にその中央
処理装置が正常な応答を行った場合を除いてその中央処
理装置の異常を検出する異常検出手段とを具備すること
を特徴とする監視装置。
2. A frequency measuring means for measuring the frequency of use of the bus by the central processing unit for a certain period of time, a comparing means for comparing the measured value of the frequency measuring means with a predetermined allowable range, and the comparing means beforehand. When it is determined that the frequency does not fall within the defined allowable range, an interrupt signal transmitting means for transmitting an interrupt signal for outputting a predetermined response to the central processing unit, and this interrupt signal are transmitted. A monitoring device comprising: an abnormality detecting means for detecting an abnormality of the central processing unit except when the central processing unit makes a normal response within a predetermined time after the operation.
【請求項3】 バスを共用する複数の中央処理装置それ
ぞれが一定時間にバスを使用する頻度を個別に測定する
頻度測定手段と、 この頻度測定手段による各中央処理装置ごとの測定値を
予め定めた許容範囲と比較する比較手段と、 この比較手段によって予め定めた許容範囲に属さない頻
度であると判別された中央処理装置に対して所定の応答
を出力させるための割込信号を送出する割込信号送出手
段と、 この割込信号が送出されてから所定の時間内にその中央
処理装置が正常な応答を行った場合を除いてその中央処
理装置の異常を検出する異常検出手段と、 この異常検出手段の検出結果を外部に出力する検出結果
出力手段とを具備することを特徴とする監視装置。
3. A frequency measuring means for individually measuring the frequency of each of a plurality of central processing units sharing a bus using the bus at a fixed time, and a measurement value for each central processing unit by the frequency measuring means is predetermined. Comparing means for comparing with the allowable range, and an interrupt signal for outputting a predetermined response to the central processing unit, which is determined by the comparing means to have a frequency that does not belong to the predetermined allowable range. An interrupt signal transmitting means, and an abnormality detecting means for detecting an abnormality of the central processing unit unless the central processing unit makes a normal response within a predetermined time after the interruption signal is transmitted, A monitoring device comprising: a detection result output means for outputting the detection result of the abnormality detection means to the outside.
【請求項4】 バスを共用する複数の中央処理装置それ
ぞれが一定時間にバスを使用する頻度を個別に測定する
頻度測定手段と、 この頻度測定手段による各中央処理装置ごとの測定値を
予め定めた許容範囲と比較する比較手段と、 この比較手段によって予め定めた許容範囲に属さない頻
度であると判別された中央処理装置に対して所定の応答
を出力させるための割込信号を送出する割込信号送出手
段と、 この割込信号が送出されてから所定の時間内にその中央
処理装置が正常な応答を行った場合を除いてその中央処
理装置の異常を検出する異常検出手段と、 前記複数の中央処理装置のバス使用要求を調停するバス
調停手段と、 前記異常検出手段によって異常が検出された中央処理装
置がバス使用要求を行ったときこれがバス調停手段に到
達しないようにマスクするバス要求マスク手段とを具備
することを特徴とする監視装置。
4. A frequency measuring means for individually measuring the frequency of use of a bus by each of a plurality of central processing units sharing a bus, and a measurement value for each central processing unit by the frequency measuring means is predetermined. Comparing means for comparing with the allowable range, and an interrupt signal for outputting a predetermined response to the central processing unit, which is determined by the comparing means to have a frequency that does not belong to the predetermined allowable range. An interruption signal sending means, an abnormality detecting means for detecting an abnormality of the central processing unit except when the central processing unit makes a normal response within a predetermined time after the interruption signal is sent, Bus arbitration means for arbitrating bus usage requests of a plurality of central processing units, and when the central processing unit in which the abnormality is detected by the abnormality detection means makes a bus usage request, this reaches the bus arbitration means. Monitoring apparatus characterized by comprising a bus request mask means for masking so as not.
JP5014576A 1993-02-01 1993-02-01 Monitoring device Pending JPH06231009A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5014576A JPH06231009A (en) 1993-02-01 1993-02-01 Monitoring device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5014576A JPH06231009A (en) 1993-02-01 1993-02-01 Monitoring device

Publications (1)

Publication Number Publication Date
JPH06231009A true JPH06231009A (en) 1994-08-19

Family

ID=11864994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5014576A Pending JPH06231009A (en) 1993-02-01 1993-02-01 Monitoring device

Country Status (1)

Country Link
JP (1) JPH06231009A (en)

Similar Documents

Publication Publication Date Title
US6434591B1 (en) Thread control system and method in a computer system
JP2006309760A (en) Monitoring logic and monitoring method for detecting abnormal operation of data processor
US6321289B1 (en) Apparatus for automatically notifying operating system level applications of the occurrence of system management events
US6463492B1 (en) Technique to automatically notify an operating system level application of a system management event
JPH06231009A (en) Monitoring device
CN115236497A (en) Method for diagnosing clock and timer of SOC (System on chip)
JP2680473B2 (en) Watchdog mechanism
JPH02130646A (en) Abnormality detecting system for cpu
JPS58221533A (en) Remote supervisory and controlling system
JPS6128146B2 (en)
JPH1160102A (en) Elevator controller
JPH04182835A (en) Bus monitor device for multiprocessor system
JPH06214831A (en) Abnormality detector for central processing unit
KR100269348B1 (en) Radio lan system having auto-restarting circuit
JPH0293738A (en) Interruption processing system
CN117743008A (en) Multi-core processor fault diagnosis and exception handling method, main control board card and equipment
JPH07230432A (en) Calculating device
KR20000002916A (en) Apparatus and method for sensing and processing defect of process built-in communication device
JPS60243749A (en) Method for checking operation of watchdog timer
JPH05143379A (en) Program monitoring device
JPH04363729A (en) Computer system
JPH0296840A (en) Runaway prevention circuit of central processing unit
JPH04236637A (en) Microprocessor fault detecting circuit
JPH03180939A (en) Fault detecting device for computer system
JPS6295647A (en) Microprogram controller with run monitoring device