JPS6375843A - Abnormality monitor system - Google Patents

Abnormality monitor system

Info

Publication number
JPS6375843A
JPS6375843A JP61220405A JP22040586A JPS6375843A JP S6375843 A JPS6375843 A JP S6375843A JP 61220405 A JP61220405 A JP 61220405A JP 22040586 A JP22040586 A JP 22040586A JP S6375843 A JPS6375843 A JP S6375843A
Authority
JP
Japan
Prior art keywords
signal
recovery
cpu
reset
reset signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61220405A
Other languages
Japanese (ja)
Inventor
Akio Murata
明男 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61220405A priority Critical patent/JPS6375843A/en
Publication of JPS6375843A publication Critical patent/JPS6375843A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To prevent degradation in throughput by monitoring two CPUs by each other and restarting and restoring a faulty CPU by the other normal CPU when one CPU is faulty. CONSTITUTION:If the response to monitor data is not sent within a prescribed time, a break signal 52 is sent from a break signal sending means 35. A first counting means 36 of the CPU which receives this signal generates an interrupt signal 53 at the time of counting a prescribed bit length, and a second counting means 37 outputs a reset signal 54 at the time of counting a bit length longer than said prescribed bit length. A restoration processing part 38 inhibits the output of the reset signal 54 to perform the restoration processing such as retry when receiving the interrupt signal 53, and the processing part 38 responds to a restoration message 55 when the other CPU is restored. Thus, the break signal 52 is stopped and the processing is restarted.

Description

【発明の詳細な説明】 〔概要〕 シリアルインタフェースを介して監視データをやりとり
して互に異常状態を監視する2組のプロセッサユニット
(CP U)を備えた処理装置において、 監視データ送出後、所定時間内に応答がないときブレー
ク信号を送出し、このブレーク信号を受信したCPUは
、ブレーク信号のビット長を所定長計数して割込み信号
およびリセット信号を発生する。
[Detailed Description of the Invention] [Summary] In a processing device equipped with two sets of processor units (CPUs) that mutually monitor abnormal conditions by exchanging monitoring data via a serial interface, after sending the monitoring data, a predetermined When there is no response within the time, a break signal is sent, and the CPU that receives this break signal counts the bit length of the break signal to a predetermined length and generates an interrupt signal and a reset signal.

割込み信号では現状態を保持した状態で復旧処理を行い
、復旧処理不能のときおよび割込み不能のときリセット
信号を発生させて各部をリセットし、正常であれば復旧
する。
Restoration processing is performed with the current state held in response to the interrupt signal, and when restoration processing is not possible or when interrupts are not possible, a reset signal is generated to reset each part, and if normal, restoration is performed.

以上のごとく、復旧処理を試みた後切り離し処理を行う
異常監視方式を提供する。
As described above, an abnormality monitoring method is provided in which the disconnection process is performed after attempting the recovery process.

〔産業上の利用分野〕[Industrial application field]

本発明は、2組のcpuが相互に監視し、異常を検知し
たCPUが自動復旧させる異常、監視方式信頼性の要求
される処理装置では、例えば2組のCPUを設けて機能
分担し、一方がダウンしたとき他方のCPUですべての
処理を行うよう構成するが、ダウンしたCPUの切り離
しが行われると処理能力が低下するという問題点がある
The present invention provides a system in which two sets of CPUs mutually monitor each other, and a CPU that detects an abnormality automatically recovers it.In a processing device that requires reliability of the monitoring system, for example, two sets of CPUs are provided to share functions, and one When a CPU goes down, all processing is performed by the other CPU, but there is a problem in that the processing capacity decreases when the failed CPU is disconnected.

このため、ダウンしたCPUを再起動して復旧させ、処
理能力の低下を防止した処理装置が求められている。
For this reason, there is a need for a processing device that can restart and restore a down CPU and prevent a decrease in processing performance.

〔従来の技術〕[Conventional technology]

第3図<a)は2組のCPUを備えて複数のIloを制
御するI10コントローラのブロック図、第3図(′b
)は、従来の異常監視方式説明図である。
Figure 3<a) is a block diagram of an I10 controller that is equipped with two sets of CPUs and controls a plurality of Ilo, and Figure 3 ('b
) is an explanatory diagram of a conventional abnormality monitoring system.

第3図(a)において、1,2はプロセッサユニット(
CP U、以下2組のCPUの一方をCPUI。
In FIG. 3(a), 1 and 2 are processor units (
CPU, one of the following two sets of CPUs is CPUI.

他方をCPU2とする))であって、図示省略したホス
トと接続され、I/○装宜14および15をそれぞれ制
御するもの、13は切換部であり、上記CPU1.2と
ともにI10コントローラを構成するものである。
The other is a CPU 2)) which is connected to a host (not shown) and controls the I/O devices 14 and 15, respectively, and 13 is a switching unit, which together with the CPU 1.2 constitutes an I10 controller. It is something.

上記I10コントローラでは、CPUIが■/○装置1
4を、CPU2がl1015を制御するとともに、CP
U1、2間で相互に監視し、一方(例えばCPU2)が
ダウンしたとき、他方(CPUI)がこれを検知して切
換部13に通知し、I10装置15をCPUIに接続す
るように構成されているものである。
In the above I10 controller, the CPUI is ■/○ device 1
4, CPU2 controls l1015, and CPU
The configuration is such that mutual monitoring is performed between U1 and U2, and when one (for example, CPU2) goes down, the other (CPUI) detects this, notifies the switching unit 13, and connects the I10 device 15 to the CPUI. It is something that exists.

CPU1、2間の相互監視は、第3図(b)に示すよう
に、シリアルインタフェース(シリアルIF制御部6.
11)を通じて一定時間ごとに監視データ50.51を
交信するもので、相手側より所定時間内(10)に応答
がないとき、異常と判別してI10装置を切換える。
Mutual monitoring between the CPUs 1 and 2 is performed using a serial interface (serial IF control unit 6.
11), the monitoring data 50 and 51 are exchanged at fixed time intervals, and when there is no response from the other party within the predetermined time (10), it is determined that there is an abnormality and the I10 device is switched.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

以上説明した従来の異常監視方式では、一時的な障害で
復旧可能な異常状態であっても、正常なCPUにより切
離しが行われていた。
In the conventional abnormality monitoring method described above, even if the abnormal state is a temporary failure and can be recovered, disconnection is performed by a normal CPU.

このため、正常なCPUに処理負担がかかり、I10コ
ントローラの処理能力が低下するという問題点があった
Therefore, there is a problem in that a processing load is placed on the normal CPU, and the processing capacity of the I10 controller is reduced.

本発明は、上記問題点に鑑み、正常なCPUより復旧処
理せしめる簡易な異常監視方式を提供することを目的と
する。
SUMMARY OF THE INVENTION In view of the above problems, it is an object of the present invention to provide a simple abnormality monitoring method that allows a normal CPU to perform recovery processing.

〔問題点を解決するための手段〕[Means for solving problems]

上記目的のため、本発明の異常監視方式は、第1図本発
明の原理説明図に示すように、 監視データを所定時間内に受信しないときブレーク信号
(52)を送出するとともに、復旧メソセージ(55)
を受信したとき該ブレーク信号の送出を停止するブレー
ク信号送出手段(35)と、受信した該ブレーク信号(
52)のビット長を計数し、第1の設定値に達したした
とき、復旧処理部(38)を起動する割込み信号(53
)を発生する第1の計数手段(36)と、 該ビット長を計数し、少な(とも第1の設定値以上の値
に設定された第2の設定値に達したとき、各部をリセッ
トするリセット信号(54)を出力する第2の計数手段
(37)と、 該リセット信号(54)の出力を禁止する禁止手段(3
9)と、 該禁止手段(39)に指示して該リセット信号(54)
の出力を禁止し復旧処理を実行するとともに、復旧完了
後該復旧メツセージ(55)を応答し、復旧不能のとき
は該禁止手段(39)を解除する復旧処理部(38)と
、 該リセット信号(54)出力後各部の正常性を検証し、
正常と判別したとき該復旧メツセージ(55)を送出す
るリセット処理部(40)とをそれぞれのプロセッサユ
ニット(CPU1.CPU2 )に設けたものである。
For the above purpose, the abnormality monitoring system of the present invention sends out a break signal (52) when monitoring data is not received within a predetermined time, as shown in FIG. 55)
a break signal sending means (35) that stops sending the break signal when the received break signal (35) is received;
52), and when the first set value is reached, an interrupt signal (53) is activated to start the recovery processing section (38).
); and a first counting means (36) that counts the bit length and resets each part when a second set value is reached, which is set to a value that is less than or equal to the first set value. a second counting means (37) that outputs a reset signal (54); and a prohibition means (3) that prohibits output of the reset signal (54).
9), and instructing the inhibiting means (39) to send the reset signal (54).
a recovery processing unit (38) that prohibits the output of and executes a recovery process, responds with the recovery message (55) after the recovery is completed, and cancels the prohibition means (39) when recovery is impossible; and the reset signal. (54) Verify the normality of each part after output,
Each processor unit (CPU1, CPU2) is provided with a reset processing section (40) that sends out the recovery message (55) when it is determined to be normal.

〔作用〕[Effect]

所定時間内に監視データの応答がないとき、スペースの
連続したブレーク信号52を送出し、このブレーク信号
52を受信したCPUは、そのビット長を計数する。
When there is no response to the monitoring data within a predetermined time, a break signal 52 with consecutive spaces is sent out, and the CPU that receives this break signal 52 counts its bit length.

第1の計数手段36は所定ビット長を計数したとき(第
1の設定値)割込み信号53を発生し、第2の計数手段
37はこれより長く設定されたビット長(第2の設定値
)を計数してリセット信号54を出力する。
The first counting means 36 generates an interrupt signal 53 when counting a predetermined bit length (first setting value), and the second counting means 37 generates an interrupt signal 53 when counting a predetermined bit length (second setting value). is counted and a reset signal 54 is output.

上記割込み信号53を受けたプロセッサは現在の処理状
態を退避して復旧処理部38に復旧処理を依願する。
Upon receiving the interrupt signal 53, the processor saves the current processing state and requests the recovery processing unit 38 to perform recovery processing.

復旧処理部38では、リセット信号54の出力を禁止し
て再試行等の復旧処理を行い、復旧した場合は復旧メツ
セージ55を応答してプロセッサに制御を返す(リター
ン)。
The recovery processing unit 38 prohibits the output of the reset signal 54 and performs recovery processing such as retrying, and when recovery is achieved, returns a recovery message 55 to return control to the processor (return).

これにより、ブレーク信号52が停止し、処理が再開さ
れる。
As a result, the break signal 52 is stopped and processing is restarted.

上記復旧処理で復旧不能のときはリセット信号54の出
力禁止を解除し、リセット信号54を出力せしめる。
If recovery is not possible in the above recovery process, the inhibition of output of the reset signal 54 is canceled and the reset signal 54 is output.

割込み信号53が受付けられないときも同様にリセット
信号54が出力される。
Similarly, a reset signal 54 is output when the interrupt signal 53 is not accepted.

リセット後は各部をテストし、異常がなければ復旧メツ
セージ55を応答して、復旧する。
After resetting, each part is tested, and if there is no abnormality, a recovery message 55 is returned to restore the system.

なお、所定時間までに復旧メツセージ55の応答がなけ
れば、正常側のCPUにより切り離しが行われる。
Note that if there is no response to the recovery message 55 within a predetermined time, the CPU on the normal side performs the disconnection.

以上により、異常を検知したCPUは、切り離しを行う
前にブレーク信号52を送信し、異常CPUに復旧処理
させるものである。
As described above, a CPU that detects an abnormality transmits a break signal 52 before disconnecting, and causes the abnormal CPU to perform recovery processing.

〔実施例〕〔Example〕

本発明の実施例を第1図、第2図および第3図を参照し
つつ説明する。
Embodiments of the present invention will be described with reference to FIGS. 1, 2, and 3.

、 第2図は実施例のCPUブロック図である。, FIG. 2 is a CPU block diagram of the embodiment.

CPU1およびCPU2は同一構成であり、第2図は、
一方のプロ七゛ンサユニットCPUの要部を示したもの
である。図中、 20はシリアルインタフェース(IF)制御部、21は
プロセッサ、 31は監視データブレーク信号送信部でブレーク信号送
出手段35に対応し、定期的に監視データ50.51の
やりとりをシリアルインタフェース制御部20を介して
行うとともに、図示省略したタイマーにより、所定時間
(tl)応答がないときブレーク信号52を送信し、復
旧メツセージ55を受信したときそのブレーク信号52
の送出を停止するもの、 24はカウンタ(第1の計数手段)で、受信したブレー
ク信号52のビット長を所定長(時間L2とする)計数
したときラッチ回路26を通じて割込み信号53をプロ
セッサ21に出力するもの、26はカウンタ(第2の計
数手段)で、受信したブレーク信号52を所定長(時間
L3とする。t3〉t2)計数しアンドゲート28を介
してリセット信号54を出力するもの、 27は、リセット信号54の出力を禁止するデータを書
込む禁止レジスタ(禁止手段39)、29はリセット信
号54の出力状態をセントするラッチ回路、 40はリセット処理部であって、リセット後に起動され
、ラッチ回路29にリセット出力がセットされていると
き各部をテストし、正常ならば復旧メツセージ55を応
答するもの、 100はアドレスバス、データバス等で構成されるバス
線である。
CPU1 and CPU2 have the same configuration, and FIG.
This figure shows the main parts of one of the processor unit CPUs. In the figure, 20 is a serial interface (IF) control unit, 21 is a processor, and 31 is a monitoring data break signal transmitting unit, which corresponds to the break signal sending means 35 and periodically exchanges monitoring data 50 and 51 with the serial interface control unit. 20, and a timer (not shown) transmits a break signal 52 when there is no response for a predetermined time (tl), and when a recovery message 55 is received, the break signal 52 is transmitted.
24 is a counter (first counting means) which transmits an interrupt signal 53 to the processor 21 through the latch circuit 26 when it counts the bit length of the received break signal 52 for a predetermined length (time L2). 26 is a counter (second counting means) that counts the received break signal 52 for a predetermined length (time L3, t3>t2) and outputs a reset signal 54 via an AND gate 28; 27 is a prohibition register (inhibition means 39) in which data for prohibiting the output of the reset signal 54 is written; 29 is a latch circuit that stores the output state of the reset signal 54; and 40 is a reset processing section which is activated after reset. , which tests each part when the reset output is set in the latch circuit 29, and responds with a recovery message 55 if it is normal. 100 is a bus line composed of an address bus, a data bus, etc.

上記構成のCPUにおいて、監視データブレーク信号発
生部31は正常時に動作し、第2図中点線で示したブレ
ーク信号処理手段22はブレーク信号を受信したときに
動作する。
In the CPU having the above configuration, the supervisory data break signal generating section 31 operates normally, and the break signal processing means 22 shown by the dotted line in FIG. 2 operates when a break signal is received.

なお以下の動作説明では、正常側をCPUI。In the following operation explanation, the normal side will be referred to as the CPUI.

異常側をCPU2とし、第2図の符号はCPU2とする
。またCPU1側を示す場合は(CPUI)を付して区
別する。
The abnormal side is CPU2, and the reference numeral in FIG. 2 is CPU2. When indicating the CPU1 side, (CPUI) is added to distinguish it.

また、CPU以外の符号は第3図に記載のものを使用す
る。
Further, the symbols other than the CPU are those shown in FIG. 3.

以下第1回申)を参照しつつ、復旧動作を説明する。The recovery operation will be explained below with reference to the first report.

CPUIとCPU2とは、それぞれ監視データブレーク
信号送出部32より定期的に監視データ50 (CPU
I)および51  (CPU2)をシリアルインタフェ
ース制御部20.20 (CPUI)を介して互いに送
信する。
The CPU I and the CPU 2 each periodically receive the monitoring data 50 (CPU
I) and 51 (CPU2) to each other via the serial interface control unit 20.20 (CPUI).

CPU1がCPU2からの監視データ51を所定時間内
(tl)に受信しないとき、監視データブレーク信号送
信部32 (CPUI)よりCPU2にブレーク信号5
2を送出する。
When the CPU 1 does not receive the monitoring data 51 from the CPU 2 within a predetermined time (tl), the monitoring data break signal transmitter 32 (CPUI) sends a break signal 5 to the CPU 2.
Send 2.

ブレーク信号52は、前述したように、スペース(“0
”データ)が連続したもので、このブレーク信号52を
受信したCPU2では、カウンタ24.25が、ブレー
ク信号52をイネーブル信号として、シリアルインタフ
ェース制御部20の内部クロック56を計数し、カウン
タ24が所定値(t2)を計数したとき、キャリー出力
Cをラッチ回路26にラッチして、割込み信号53をプ
ロセッサ21に出力する。
As mentioned above, the break signal 52 is a space (“0
In the CPU 2 that receives the break signal 52, the counters 24 and 25 count the internal clock 56 of the serial interface control unit 20 using the break signal 52 as an enable signal, and the counter 24 counts the internal clock 56 of the serial interface control unit 20. When the value (t2) is counted, the carry output C is latched in the latch circuit 26 and an interrupt signal 53 is output to the processor 21.

これにより、プロセッサ21は、現在の処理状態を退避
し復旧処理部31を起動する。
Thereby, the processor 21 saves the current processing state and starts the recovery processing section 31.

復旧処理部31は、禁止レジスフ28をセットしてカウ
ンタ25の出力、即ちリセット信号54の出力を禁止し
、復旧処理を実行する。
The recovery processing unit 31 sets the prohibition register 28 to prohibit the output of the counter 25, that is, the output of the reset signal 54, and executes the recovery process.

復旧処理が完了すると復旧メツセージ55をCPUIに
送信してプロセッサ21に制御を返す(リターン)と、
ブレーク信号が停止するとともに退避したデータに基づ
き異常発生時より動作が再開される。
When the recovery process is completed, a recovery message 55 is sent to the CPUI and control is returned to the processor 21 (return).
When the break signal is stopped, the operation is resumed from the time the abnormality occurred based on the saved data.

復旧不可能の場合は禁止レジスタ28をリセットしてリ
セット出力を許可すると、カウンタ25によって所定時
間後(t3)にリセット信号54が出力され、CPtJ
2は初期状態に戻る。
If recovery is not possible, the prohibition register 28 is reset to permit reset output, and the counter 25 outputs the reset signal 54 after a predetermined time (t3), and the CPtJ
2 returns to the initial state.

リセットされたCPU2ではリセット処理部40が起動
され、ランチ回路29を読取り、リセット出力がセット
されていれば異常検出されたことを認識して各部をテス
トし、正常ならばCPUIに復旧メツセージ55を送出
する。
In the reset CPU 2, the reset processing section 40 is activated, reads the launch circuit 29, and if the reset output is set, it recognizes that an abnormality has been detected and tests each section, and if normal, sends a recovery message 55 to the CPUI. Send.

以上のごとく、割込み信号53およびリセット信号54
により復旧処理を行うが、復旧処理不能のときは、CP
UIにより切り離しが行われる。
As described above, the interrupt signal 53 and the reset signal 54
However, if the recovery process is not possible, the CP
Detachment is performed by the UI.

即ち、CPU1はブレーク信号52の送信が一定時間′
m続したとき切換部13に指令し、I10装置15をC
PUI側に切換える。
That is, the CPU 1 transmits the break signal 52 for a certain period of time.
When the connection continues, the switching section 13 is commanded to switch the I10 device 15 to C.
Switch to PUI side.

なお、図示省略したが、シリアルデータが“1”の状態
でカウンタ24,25はリセットされる。
Although not shown, the counters 24 and 25 are reset when the serial data is "1".

以上のごとく、切り離しを行う前にブレーク信号52を
送出し、異常側はこのブレーク信号に基づいて復旧処理
を行うもので、ソフトウェア等の暴走による一時的障害
を復旧させることができる。
As described above, the break signal 52 is sent before disconnection, and the abnormal side performs recovery processing based on this break signal, making it possible to recover from a temporary failure due to software runaway.

(発明の効果〕 以上説明したように、本発明は異常を検出したCPUが
ブレーク信号を発信して自動復旧させる方式を提供する
ものであるから、2組のブロモ・ノサを備えたデータ処
理装置における性能低下を防止する効果は極めて多大で
ある。
(Effects of the Invention) As explained above, the present invention provides a system in which a CPU that detects an abnormality issues a break signal and automatically recovers. The effect of preventing performance deterioration in is extremely large.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図(a)は本発明の原理説明図(その1)、第1図
(b)は本発明の原理説明図(その2)、第2図は実施
例のCPUブロック図、 第3図(a)は従来のI10コントローラブロック図、 第3図(blは従来の異常監視方式説明図、である。図
中、 1.2はプロセッサユニットCPU。 3は切換部、 6.11はシリアルインタフェース(IF)制御部、 14、工5はI10装置、 20はシリアルインタフェース(IF)制御部21はプ
ロセッサ、 24.25はカウンタ、26はラッチ回路、27は禁止
レジスタ、  28はアンドゲート、29はラッチ回路
、 31は監視データブレーク信号送信部、35はブレーク
信号送出手段、 36は第1の計数手段、37は第2の計数手段38は復
旧処理部、  39は禁止手段、40はリセット処理部
、 50.51は監視データ、 52はブレーク信号、 53は割込み信号、 54はリセット信号、 55は復旧メツセージ、 56は内部クロック、 である。
FIG. 1(a) is a diagram explaining the principle of the present invention (part 1), FIG. 1(b) is a diagram explaining the principle of the present invention (part 2), FIG. 2 is a CPU block diagram of the embodiment, and FIG. (a) is a block diagram of a conventional I10 controller, and FIG. 3 (bl is an explanatory diagram of a conventional abnormality monitoring system). In the figure, 1.2 is a processor unit CPU. 3 is a switching unit, and 6.11 is a serial interface. (IF) control unit, 14, 5 is an I10 device, 20 is a serial interface (IF) control unit 21 is a processor, 24.25 is a counter, 26 is a latch circuit, 27 is an inhibit register, 28 is an AND gate, 29 is a A latch circuit, 31 is a monitoring data break signal transmitting section, 35 is a break signal sending means, 36 is a first counting means, 37 is a second counting means 38 is a recovery processing section, 39 is an inhibiting means, and 40 is a reset processing section. , 50.51 is monitoring data, 52 is a break signal, 53 is an interrupt signal, 54 is a reset signal, 55 is a recovery message, and 56 is an internal clock.

Claims (1)

【特許請求の範囲】 シリアルインタフェースを介して監視データ(50、5
1)をやりとりして相互に監視するとともにそれぞれ異
常を検知したとき切り離しする2組のプロセッサユニッ
ト(CPU1、CPU2)を備えた処理装置において、 該監視データを所定時間内に受信しないときブレーク信
号(52)を送出するとともに、復旧メッセージ(55
)を受信したとき該ブレーク信号の送出を停止するブレ
ーク信号送出手段(35)と、受信した該ブレーク信号
(52)のビット長を計数し、第1の設定値に達したし
たとき復旧処理部(38)を起動する割込み信号(53
)を発生する第1の計数手段(36)と、 該ビット長を計数し、少なくとも第1の設定値以上の値
に設定された第2の設定値に達したとき、各部をリセッ
トするリセット信号(54)を出力する第2の計数手段
(37)と、 該リセット信号(54)の出力を禁止する禁止手段(3
9)と、 該禁止手段(39)に指示して該リセット信号(54)
の出力を禁止し復旧処理を実行するとともに、復旧完了
後該復旧メッセージ(55)を応答し、復旧不能のとき
は該禁止手段(39)を解除する復旧処理部(38)と
、 該リセット信号(54)出力後各部の正常性を検証し、
正常と判別したとき該復旧メッセージ(55)を送出す
るリセット処理部(40)と をそれぞれのプロセッサユニット(CPU1、CPU2
)に設け、異常状態を検出したプロセッサユニットが該
ブレーク信号(52)を送出して復旧処理せしめること
を特徴とする異常監視方式。
[Claims] Monitoring data (50, 5
1) In a processing device equipped with two sets of processor units (CPU1, CPU2) that exchange and monitor each other and disconnect when each detects an abnormality, a break signal ( 52) and also sends a recovery message (55
); and a recovery processing unit that counts the bit length of the received break signal (52) and when it reaches a first set value. An interrupt signal (53) that activates (38)
); and a reset signal that counts the bit length and resets each part when a second set value set to at least the first set value is reached. (54), a second counting means (37) that outputs the reset signal (54), and a prohibition means (3) that prohibits the output of the reset signal (54).
9), and instructing the inhibiting means (39) to send the reset signal (54).
a recovery processing unit (38) that prohibits the output of and executes a recovery process, responds with the recovery message (55) after the recovery is completed, and cancels the prohibition means (39) when recovery is impossible; and the reset signal. (54) Verify the normality of each part after output,
A reset processing unit (40) that sends out the recovery message (55) when it is determined to be normal is connected to each processor unit (CPU1, CPU2).
), wherein a processor unit that detects an abnormal state sends out the break signal (52) to perform recovery processing.
JP61220405A 1986-09-18 1986-09-18 Abnormality monitor system Pending JPS6375843A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61220405A JPS6375843A (en) 1986-09-18 1986-09-18 Abnormality monitor system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61220405A JPS6375843A (en) 1986-09-18 1986-09-18 Abnormality monitor system

Publications (1)

Publication Number Publication Date
JPS6375843A true JPS6375843A (en) 1988-04-06

Family

ID=16750600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61220405A Pending JPS6375843A (en) 1986-09-18 1986-09-18 Abnormality monitor system

Country Status (1)

Country Link
JP (1) JPS6375843A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6148415A (en) * 1993-06-11 2000-11-14 Hitachi, Ltd. Backup switching control system and method
JP2019016218A (en) * 2017-07-07 2019-01-31 富士通株式会社 Information processing device, control device, and control method of information processing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6148415A (en) * 1993-06-11 2000-11-14 Hitachi, Ltd. Backup switching control system and method
JP2019016218A (en) * 2017-07-07 2019-01-31 富士通株式会社 Information processing device, control device, and control method of information processing device

Similar Documents

Publication Publication Date Title
JP3047275B2 (en) Backup switching control method
US7437598B2 (en) System, method and circuit for mirroring data
CN101714108A (en) Synchronization control apparatus, information processing apparatus, and synchronization management method
JP2004094774A (en) Looped interface failure analyzing method and system with failure analyzing function
JPH11203157A (en) Redundancy device
JP2773424B2 (en) Network system and connection computer switching method
JPS6375843A (en) Abnormality monitor system
JP3266841B2 (en) Communication control device
JP3313667B2 (en) Failure detection method and method for redundant system
JP3420919B2 (en) Information processing device
JP2004013723A (en) Device and method for fault recovery of information processing system adopted cluster configuration using shared memory
JP3363579B2 (en) Monitoring device and monitoring system
JPH06197112A (en) Management system
JPH04360242A (en) Device and method for switching systems in duplexed system
JP2001175545A (en) Server system, fault diagnosing method, and recording medium
JP3093546B2 (en) System operation information management mechanism that can restore system operation information
JP2007026038A (en) Path monitoring system, path monitoring method and path monitoring program
JP3169488B2 (en) Communication control device
JPH1196034A (en) Active/reserve switching device and method therefor
JPS634210B2 (en)
JPH0463419B2 (en)
JP2815730B2 (en) Adapters and computer systems
JPH0454747A (en) Data transfer system
JPS6388947A (en) Trouble processing method for exchanging system
JPH1049450A (en) Recovery system for abnormal time of remote monitor system