JP5625949B2 - System monitoring apparatus and system monitoring method - Google Patents

System monitoring apparatus and system monitoring method Download PDF

Info

Publication number
JP5625949B2
JP5625949B2 JP2011012948A JP2011012948A JP5625949B2 JP 5625949 B2 JP5625949 B2 JP 5625949B2 JP 2011012948 A JP2011012948 A JP 2011012948A JP 2011012948 A JP2011012948 A JP 2011012948A JP 5625949 B2 JP5625949 B2 JP 5625949B2
Authority
JP
Japan
Prior art keywords
instruction
transfer
reset timer
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011012948A
Other languages
Japanese (ja)
Other versions
JP2012155454A (en
Inventor
孝史 佛木
孝史 佛木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011012948A priority Critical patent/JP5625949B2/en
Publication of JP2012155454A publication Critical patent/JP2012155454A/en
Application granted granted Critical
Publication of JP5625949B2 publication Critical patent/JP5625949B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、システム監視装置及びシステム監視方法に関し、特にウォッチドッグタイマー機能を用いたシステム監視装置及びシステム監視方法に関する。   The present invention relates to a system monitoring apparatus and a system monitoring method, and more particularly to a system monitoring apparatus and a system monitoring method using a watchdog timer function.

コンピュータシステムの正常動作を監視する装置として、ウォッチドッグタイマー機能を用いた監視装置が、広く採用されている。   As a device for monitoring the normal operation of a computer system, a monitoring device using a watchdog timer function is widely adopted.

この監視装置は、例えば、システム内においてシステム動作とは独立した監視専用のプロセッサ(以後、監視プロセッサと呼ぶ)内部に、ウォッチドッグタイマー(以後、WDT(WatchDog Timer)とも呼ぶ)と呼ばれるタイマーを実装した装置である。   This monitoring device, for example, implements a timer called a watch dog timer (hereinafter also referred to as WDT (Watch Dog Timer)) inside a dedicated processor (hereinafter referred to as a monitoring processor) that is independent of system operation in the system. Device.

WDTは、例えば、常にタイマー値の減算(加算でもよい)を繰り返し、タイマー値が0(予め定められた値でもよい)になったとき、即ちタイムアウトしたとき、タイムアウト信号を出力する。このタイムアウト信号は、監視プロセッサの監視対象であるシステムに対して、NMI(Non−Maskable Interrupt)信号やリセット指示信号として出力される。また、WDTは、リセットを指示する信号を受け取ると、タイマー値を予め定められた値(0でもよい)に再設定する。   For example, the WDT always repeats subtraction (may be addition) of the timer value, and outputs a timeout signal when the timer value becomes 0 (may be a predetermined value), that is, when a time-out occurs. This timeout signal is output as an NMI (Non-Maskable Interrupt) signal or a reset instruction signal to the system to be monitored by the monitoring processor. When the WDT receives a signal instructing resetting, the WDT resets the timer value to a predetermined value (may be 0).

このような監視装置で監視されるシステムは、一定時間(WDTがタイムアウトする時間に比べて十分に短い時間)毎に、監視プロセッサにWDTのリセットを行うことを指示(例えば、システム側から監視プロセッサをポーリング)する。この指示を受けた、監視プロセッサは、WDTにリセットを指示する信号を出力する。従って、システムが正常な場合、WDTは、リセットを指示する信号に基づいて、タイムアウトする前にタイマー値を再設定するため、タイムアウトすることはない。   A system monitored by such a monitoring device instructs the monitoring processor to reset the WDT at a certain time (a time sufficiently shorter than the time when WDT times out) (for example, the monitoring processor from the system side). Polling). Upon receiving this instruction, the monitoring processor outputs a signal instructing the WDT to reset. Therefore, when the system is normal, the WDT resets the timer value before timing out based on a signal instructing resetting, so that the timer does not time out.

このように、WDT機能を使った監視装置は、WDTが常に更新(タイマー値を再設定)され続け、タイムアウトが発生しないことによって、システムが正常動作していることを監視する。   As described above, the monitoring device using the WDT function monitors whether the system is operating normally by continuously updating the WDT (resetting the timer value) and causing no timeout.

特許文献1は、上述のWDT機能を使った監視装置の一例である、ウォッチドッグタイマ制御装置を開示している。   Patent Document 1 discloses a watchdog timer control device which is an example of a monitoring device using the above-described WDT function.

このウォッチドッグタイマ制御装置は、温度監視部とウォッチドッグタイマ部とを有し、以下のように動作する。まず、ウォッチドッグタイマ部は、カウンタを有し、このカウンタの値は一定時間毎に減算される。ウォッチドッグタイマ部は、このカウンタの値が0になると、カウンタ0検出信号を出力する。また、温度監視部は、被監視対象であるCPU(Central Processing Unit)から一定時間毎に受信する要求信号に同期して、ウォッチドッグタイマ部にカウンタ初期設定命令を指令する。   This watchdog timer control device has a temperature monitoring unit and a watchdog timer unit, and operates as follows. First, the watchdog timer unit has a counter, and the value of this counter is subtracted at regular intervals. The watchdog timer unit outputs a counter 0 detection signal when the value of the counter becomes zero. Further, the temperature monitoring unit instructs the counter initial setting command to the watch dog timer unit in synchronization with a request signal received at regular intervals from a CPU (Central Processing Unit) to be monitored.

特開2009−205276号公報JP 2009-205276 A

しかしながら、上述した先行技術文献に記載された技術においては、正常な状態にある被監視対象のシステムに対して、NMI信号やリセット指示信号が発行され、システム運用に支障をきたす場合があるという問題点がある。   However, in the technology described in the above-mentioned prior art documents, there is a problem that an NMI signal or a reset instruction signal is issued to a monitored system in a normal state, which may hinder system operation. There is a point.

その理由は、タイマーのリセットの指示(カウンタ初期設定命令)を受け取るインタフェース上において障害があったり、監視プロセッサ(ウォッチドッグタイマ制御装置)自身の動作に異常があったりすると、タイマーの更新(カウンタの初期設定)が失敗し、WDTがタイムアウトに至ってしまうケースがあるからである。   The reason for this is that if there is a failure on the interface that receives the timer reset instruction (counter initial setting command) or if the monitoring processor (watchdog timer control device) operates abnormally, the timer is updated (counter This is because there is a case where the initial setting) fails and the WDT times out.

本発明の目的は、上述した問題点を解決するシステム監視装置及びシステム監視方法を提供することにある。   An object of the present invention is to provide a system monitoring apparatus and a system monitoring method that solve the above-described problems.

本発明のシステム監視装置は、予め定められた時間を計時するとタイムアウト信号を出力するWDTと、
前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する指示受領部と、を含む監視プロセッサと、
前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記指示受領部に転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力する指示転送部と、
前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止するフィルタ部と、を有する。
The system monitoring apparatus of the present invention includes a WDT that outputs a time-out signal when measuring a predetermined time;
An instruction receiving unit that receives a first reset timer instruction for instructing resetting of the WDT and outputs a reset timer signal to the WDT;
A reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT is transferred to the instruction receiving unit as the first reset timer instruction, and a transfer failure of the first reset timer instruction is detected. An instruction transfer unit that outputs information on the first transfer failure when
And a filter unit that prohibits transmission of the timeout signal based on the information on the first transfer failure.

本発明のシステム監視方法は、予め定められた時間を計時するとタイムアウト信号を出力するWDTを含むシステム監視装置の監視プロセッサが、前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置が、前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記監視プロセッサに転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力し、前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する。
In the system monitoring method of the present invention, a monitoring processor of a system monitoring apparatus including a WDT that outputs a time-out signal when measuring a predetermined time receives a first reset timer instruction that instructs resetting of the WDT, Output reset timer signal to WDT,
The system monitoring apparatus transfers a reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT to the monitoring processor as the first reset timer instruction, and the first reset timer instruction When the first transfer failure is detected, the first transfer failure information is output, and the transmission of the timeout signal is prohibited based on the first transfer failure information.

本発明は、被監視対象のシステムが正常な状態にあるにもかかわらず、WDTのタイムアウトが発生し、システム運用に支障をきたすことを防止することが可能になるという効果がある。   The present invention has an effect that it is possible to prevent a system operation from being hindered due to a time-out of WDT even though the system to be monitored is in a normal state.

本発明の第1の実施形態に係るシステム監視装置の構成を示すブロック図である。It is a block diagram which shows the structure of the system monitoring apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1乃至第4の実施形態におけるシステムの構成を示すブロック図である。It is a block diagram which shows the structure of the system in the 1st thru | or 4th embodiment of this invention. 本発明の第1の実施形態のフィルタ部の構成を示すブロック図である。It is a block diagram which shows the structure of the filter part of the 1st Embodiment of this invention. 本発明の第1の実施形態の指示転送部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the instruction transfer part of the 1st Embodiment of this invention. 本発明の第1の実施形態の監視プロセッサの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the monitoring processor of the 1st Embodiment of this invention. 本発明の第2の実施形態に係るシステム監視装置の構成を示すブロック図である。It is a block diagram which shows the structure of the system monitoring apparatus which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態のフィルタ部の構成を示すブロック図である。It is a block diagram which shows the structure of the filter part of the 2nd Embodiment of this invention. 本発明の第2の実施形態の指示転送部及び転送代替部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the instruction | indication transfer part of the 2nd Embodiment of this invention, and a transfer alternative part. 本発明の第2の実施形態の監視プロセッサの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the monitoring processor of the 2nd Embodiment of this invention. 本発明の第3の実施形態に係るシステム監視装置の構成を示すブロック図である。It is a block diagram which shows the structure of the system monitoring apparatus which concerns on the 3rd Embodiment of this invention. 本発明の第3の実施形態の監視プロセッサの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the monitoring processor of the 3rd Embodiment of this invention. 本発明の第4の実施形態に係るシステム監視装置の構成を示すブロック図である。It is a block diagram which shows the structure of the system monitoring apparatus which concerns on the 4th Embodiment of this invention.

次に、本発明の実施形態について図面を参照して詳細に説明する。   Next, embodiments of the present invention will be described in detail with reference to the drawings.

[第1の実施の形態]
図1は、本発明の第1の実施形態に係るシステム監視装置100の構成を示すブロック図である。
[First Embodiment]
FIG. 1 is a block diagram showing a configuration of a system monitoring apparatus 100 according to the first embodiment of the present invention.

図1を参照すると、本実施形態に係るシステム監視装置100は、指示転送部130とフィルタ部170と監視プロセッサ500とを含む。   Referring to FIG. 1, the system monitoring apparatus 100 according to the present embodiment includes an instruction transfer unit 130, a filter unit 170, and a monitoring processor 500.

図2は、システム監視装置100とシステム監視装置100の監視対象であるコンピュータシステム101とを含む、システムの構成を示すブロック図である。図2を参照すると、コンピュータシステム101は、リセットタイマー指示発行部102とシステム制御コントローラ103とを含む。   FIG. 2 is a block diagram showing a system configuration including the system monitoring apparatus 100 and the computer system 101 that is the monitoring target of the system monitoring apparatus 100. Referring to FIG. 2, the computer system 101 includes a reset timer instruction issuing unit 102 and a system control controller 103.

尚、システム監視装置100は、コンピュータシステム101に含まれていてもよく、指示転送部130やフィルタ部170は、コンピュータシステム101のシステム制御コントローラ103に含まれていてもよい。   The system monitoring apparatus 100 may be included in the computer system 101, and the instruction transfer unit 130 and the filter unit 170 may be included in the system control controller 103 of the computer system 101.

システム監視装置100において、指示転送部130は、リセットタイマー指示発行部102から発行される、WDT550の計時のリセットを指示する、リセットタイマー指示600を受け取る。続けて、指示転送部130は、受け取ったリセットタイマー指示600を第1のリセットタイマー指示601として指示受領部530に転送する。また、指示転送部130は、リセットタイマー指示601の転送が失敗したことを検出した場合に、フィルタオン信号621(第1の転送失敗の情報とも呼ばれる)を出力する。   In the system monitoring apparatus 100, the instruction transfer unit 130 receives a reset timer instruction 600 that is issued from the reset timer instruction issuing unit 102 and instructs to reset the time measurement of the WDT 550. Subsequently, the instruction transfer unit 130 transfers the received reset timer instruction 600 to the instruction reception unit 530 as the first reset timer instruction 601. When the instruction transfer unit 130 detects that the transfer of the reset timer instruction 601 has failed, the instruction transfer unit 130 outputs a filter-on signal 621 (also referred to as first transfer failure information).

指示転送部130と指示受領部530との間のインタフェースは、例えば、ハードウェア監視するための標準インタフェースであるIPMI(Intelligent Platform Management Interface)のKCS(Keyboard Controller Style)インタフェースである。   The interface between the instruction transfer unit 130 and the instruction reception unit 530 is, for example, an IPMI (Intelligent Platform Management Interface) KCS (Keyboard Controller Style) interface that is a standard interface for hardware monitoring.

フィルタ部170は、指示転送部130が出力するフィルタオン信号621に基づいて、タイムアウト信号611の伝達(通過)を禁止する。尚、フィルタ部170は、タイムアウト信号611の伝達を禁止しない場合は、タイムアウト信号611に基づいて、タイムアウト信号612を出力する。タイムアウト信号611及びタイムアウト信号612は、例えば「論理1」でタイムアウトが発生したことを示す。即ち、タイムアウト信号611を出力する、及びタイムアウト信号612を出力するとは、それぞれ、タイムアウト信号611を「論理1」にする、及びタイムアウト信号612を「論理1」にすることである。尚、タイムアウト信号611及びタイムアウト信号612は、他の形態(例えばパルス)であってもよい。   The filter unit 170 prohibits transmission (passing) of the timeout signal 611 based on the filter-on signal 621 output from the instruction transfer unit 130. Note that the filter unit 170 outputs a timeout signal 612 based on the timeout signal 611 when the transmission of the timeout signal 611 is not prohibited. The time-out signal 611 and the time-out signal 612 indicate that a time-out has occurred, for example, with “logic 1”. That is, outputting the timeout signal 611 and outputting the timeout signal 612 means that the timeout signal 611 is set to “logic 1” and the timeout signal 612 is set to “logic 1”, respectively. Note that the timeout signal 611 and the timeout signal 612 may have other forms (for example, a pulse).

監視プロセッサ500は、指示受領部530とWDT550とを含む。   The monitoring processor 500 includes an instruction receiving unit 530 and a WDT 550.

指示受領部530は、リセットタイマー指示601を受信し、WDT550にリセットタイマー信号602を出力する。リセットタイマー信号602は、例えば「論理1」のパルスである。尚、リセットタイマー信号は、他の形態(例えば「論理0」のパルス)であってもよい。   The instruction receiving unit 530 receives the reset timer instruction 601 and outputs a reset timer signal 602 to the WDT 550. The reset timer signal 602 is, for example, a “logic 1” pulse. The reset timer signal may be in another form (for example, a pulse of “logic 0”).

WDT550は、予め定められた時間(以下、タイムアウト時間と呼ぶ)を計時するとタイムアウト信号611を出力する。また、WDT550は、リセットタイマー信号602を受け取ると、その時点の計時時間をリセットし、タイムアウト時間の計時を最初からやり直す。タイムアウト時間は、例えば、リセットタイマー指示発行部102がリセットタイマー指示600を発行する間隔の時間(以後、リセットタイマー間隔時間と呼ぶ)の2倍の時間である。尚、タイムアウト時間は、リセットタイマー間隔時間の変動やリセットタイマー指示の転送遅延を考慮した、リセットタイマー信号602が出力される間隔を越えていれば任意の時間でよい。   The WDT 550 outputs a timeout signal 611 when measuring a predetermined time (hereinafter referred to as a timeout time). In addition, when WDT 550 receives reset timer signal 602, WDT 550 resets the time count at that time and restarts the time-out time count from the beginning. The timeout time is, for example, twice the interval time (hereinafter referred to as reset timer interval time) at which the reset timer instruction issuing unit 102 issues the reset timer instruction 600. The timeout time may be any time as long as it exceeds the interval at which the reset timer signal 602 is output, taking into account fluctuations in the reset timer interval time and transfer delay of the reset timer instruction.

コンピュータシステム101において、リセットタイマー指示発行部102は、予め定められたタイミングでリセットタイマー指示600を発行する。予め定められたタイミングとは、例えば、コンピュータシステム101が正常な状態において定期的に実行する処理を実行するタイミングである。この処理の実行間隔が、上述のリセットタイマー間隔時間となる。   In the computer system 101, the reset timer instruction issuing unit 102 issues a reset timer instruction 600 at a predetermined timing. The predetermined timing is, for example, a timing at which the computer system 101 executes processing that is periodically executed in a normal state. The execution interval of this process is the above-described reset timer interval time.

システム制御コントローラ103は、タイムアウト信号612を受け取り、これに基づいて、例えば、コンピュータシステム101のリセット処理やメモリダンプ処理を開始する。   The system controller 103 receives the time-out signal 612, and based on this, for example, reset processing and memory dump processing of the computer system 101 are started.

図3は、フィルタ部170の構成を示すブロック図である。図3は、タイムアウト信号611及びタイムアウト信号612が「論理1」でタイムアウトが発生したことを示す信号、及び、後述のフィルタオン信号621が「論理1」でフィルタをオンにする(即ち、タイムアウト信号611の伝達を禁止するようにする)ことを指示する信号である場合の、フィルタ部170を示す。   FIG. 3 is a block diagram illustrating a configuration of the filter unit 170. FIG. 3 shows that the timeout signal 611 and the timeout signal 612 are “logic 1” and that a timeout has occurred, and the filter-on signal 621 (to be described later) turns the filter on when “logic 1” (that is, the timeout signal). The filter unit 170 in the case of a signal instructing that the transmission of 611 is prohibited) is shown.

図3を参照すると、フィルタ部170は、アンド素子171と、インバータ素子172とを有している。   Referring to FIG. 3, the filter unit 170 includes an AND element 171 and an inverter element 172.

インバータ素子172は、フィルタオン信号621の論理を反転してアンド素子171に出力する。   The inverter element 172 inverts the logic of the filter on signal 621 and outputs the inverted signal to the AND element 171.

アンド素子171は、反転したフィルタオン信号621とタイムアウト信号611との論理積を、タイムアウト信号612として出力する。   The AND element 171 outputs a logical product of the inverted filter on signal 621 and the timeout signal 611 as the timeout signal 612.

次に、本実施形態の動作を図1〜5を参照して、以下の前提に基づいて、詳細に説明する。   Next, the operation of the present embodiment will be described in detail with reference to FIGS.

WDT550のタイムアウト時間は、4秒である。   The timeout time of WDT 550 is 4 seconds.

リセットタイマー指示発行部102は、2秒間隔でリセットタイマー指示600を発行する。尚、リセットタイマー指示600の発行間隔は、被監視システムの動作状態によって正常時においても変動するが、ここでは理解を容易にするため、一定間隔であるものとする。前提は以上である。   The reset timer instruction issuing unit 102 issues a reset timer instruction 600 at intervals of 2 seconds. It should be noted that the issuance interval of the reset timer instruction 600 varies even during normal operation depending on the operating state of the monitored system, but here it is assumed to be a constant interval for ease of understanding. That is the premise.

まず、システム監視装置100が正常な場合について説明する。   First, a case where the system monitoring apparatus 100 is normal will be described.

図4は、本実施形態の指示転送部130の動作を示すフローチャートである。   FIG. 4 is a flowchart showing the operation of the instruction transfer unit 130 of this embodiment.

図5は、本実施形態の監視プロセッサ500の動作を示すフローチャートである。   FIG. 5 is a flowchart showing the operation of the monitoring processor 500 of this embodiment.

コンピュータシステム101の状態が正常である場合、リセットタイマー指示発行部102は、2秒間隔でリセットタイマー指示600を発行する。   When the state of the computer system 101 is normal, the reset timer instruction issuing unit 102 issues a reset timer instruction 600 at intervals of 2 seconds.

図4において、指示転送部130は、このリセットタイマー指示600を受け取る(S701)。   In FIG. 4, the instruction transfer unit 130 receives the reset timer instruction 600 (S701).

次に、指示転送部130は、受け取ったリセットタイマー指示600に基づいて監視プロセッサ500の指示受領部530にリセットタイマー指示601を送信する(S702)。具体的には、リセットタイマー指示601の送信は、例えば、指示転送部130が指示受領部530にリセットタイマー指示601を含むコマンドを送信し、指示受領部530が指示転送部130に受信応答を送信する。   Next, the instruction transfer unit 130 transmits a reset timer instruction 601 to the instruction receiving unit 530 of the monitoring processor 500 based on the received reset timer instruction 600 (S702). Specifically, for example, the instruction transfer unit 130 transmits a command including the reset timer instruction 601 to the instruction reception unit 530, and the instruction reception unit 530 transmits a reception response to the instruction transfer unit 130. To do.

次に、指示転送部130は、受信応答を待つ(S703)。予め定められた時間(例えば、1ミリ秒)以内に受信応答を受信した場合(S703でYES)、処理は終了する。   Next, the instruction transfer unit 130 waits for a reception response (S703). If the reception response is received within a predetermined time (for example, 1 millisecond) (YES in S703), the process ends.

図5において、指示受領部530は、リセットタイマー指示601を受信し、これに基づいてWDT550にリセットタイマー信号602を出力する(S711)。   In FIG. 5, the instruction receiving unit 530 receives a reset timer instruction 601 and outputs a reset timer signal 602 to the WDT 550 based on the reset timer instruction 601 (S711).

次に、WDT550は、リセットタイマー信号602を受け取り、これに基づいて計時時間をリセットする(S712)。そして、WDT550は、タイムアウト時間の計時を最初からやり直す。   Next, the WDT 550 receives the reset timer signal 602 and resets the time measurement based on the reset timer signal 602 (S712). Then, the WDT 550 starts counting the timeout time from the beginning.

コンピュータシステム101及びシステム監視装置100が正常である場合、上述の処理が繰り返される。   When the computer system 101 and the system monitoring apparatus 100 are normal, the above process is repeated.

コンピュータシステム101の状態が異常(例えば、プログラムが暴走し、ストール状態である)である場合、リセットタイマー指示発行部102は、リセットタイマー指示600を発行しなくなる。従って、指示受領部530は、リセットタイマー信号602を出力しなくなる。   When the state of the computer system 101 is abnormal (for example, the program runs away and is in a stalled state), the reset timer instruction issuing unit 102 does not issue the reset timer instruction 600. Accordingly, the instruction receiving unit 530 does not output the reset timer signal 602.

このため、WDT550は、計時時間をリセットしないで、計時を継続する。その結果、計時時間がタイムアウト時間(4秒)に達する。WDT550は、計時時間がタイムアウト時間に達すると、タイムアウト信号611を「論理1」にする。   For this reason, the WDT 550 continues timing without resetting the timing. As a result, the timed time reaches the timeout time (4 seconds). When the timed time reaches the timeout time, the WDT 550 sets the timeout signal 611 to “logic 1”.

次に、フィルタ部170は、「論理1」のタイムアウト信号611を入力される。この時、フィルタオン信号621は「論理0(フィルタオン信号621が出力されていない)」である。従って、フィルタ部170は、「論理0」のフィルタオン信号621を反転した信号「論理1」と論理積を取り、タイムアウト信号612を「論理1」にする(タイムアウト信号612を出力する)。   Next, the filter unit 170 receives a timeout signal 611 of “logic 1”. At this time, the filter on signal 621 is “logic 0 (the filter on signal 621 is not output)”. Accordingly, the filter unit 170 performs a logical product with the signal “logic 1” obtained by inverting the filter ON signal 621 of “logic 0”, and sets the timeout signal 612 to “logic 1” (outputs the timeout signal 612).

次に、指示転送部130から指示受領部530まで間のいずれかで障害が発生した場合を説明する。   Next, a case where a failure occurs anywhere from the instruction transfer unit 130 to the instruction receiving unit 530 will be described.

コンピュータシステム101の状態は正常であり、リセットタイマー指示発行部102は、2秒間隔でリセットタイマー指示600を発行する。   The state of the computer system 101 is normal, and the reset timer instruction issuing unit 102 issues a reset timer instruction 600 at intervals of 2 seconds.

次に、指示転送部130は、リセットタイマー指示600を受け取り(S701)、これに基づいて監視プロセッサ500の指示受領部530にリセットタイマー指示601を送信する(S702)。   Next, the instruction transfer unit 130 receives the reset timer instruction 600 (S701), and based on this, transmits the reset timer instruction 601 to the instruction receiving unit 530 of the monitoring processor 500 (S702).

次に、指示転送部130は、受信応答を待つ(S703)。しかし、上述の障害のため、指示受領部530は、リセットタイマー指示601を含むコマンドを受信できず、受信応答を送信しない。   Next, the instruction transfer unit 130 waits for a reception response (S703). However, due to the above-described failure, the instruction receiving unit 530 cannot receive a command including the reset timer instruction 601 and does not transmit a reception response.

予め定められた時間(例えば、1ミリ秒)以内に受信応答を受信しなかった場合(S703でNO)、指示転送部130は、リセットタイマー指示601の転送が失敗したことを検出する(S704)。   When the reception response is not received within a predetermined time (for example, 1 millisecond) (NO in S703), the instruction transfer unit 130 detects that the transfer of the reset timer instruction 601 has failed (S704). .

次に、指示転送部130は、リセットタイマー指示601の転送失敗を検出したことに基づいて、フィルタオン信号621を「論理1」にする(S705)。   Next, the instruction transfer unit 130 sets the filter-on signal 621 to “logic 1” based on the detection of the transfer failure of the reset timer instruction 601 (S705).

フィルタ部170は、入力された「論理1」のフィルタオン信号621に基づいて、タイムアウト信号611の伝達を禁止する。   The filter unit 170 prohibits the transmission of the timeout signal 611 based on the input “logic 1” filter-on signal 621.

一方、指示受領部530は、リセットタイマー指示601を受け取れないため、リセットタイマー信号602の出力を行わない。   On the other hand, the instruction receiving unit 530 does not output the reset timer signal 602 because it cannot receive the reset timer instruction 601.

このため、WDT550は、計時時間をリセットしないで、計時を継続する。その結果、計時時間がタイムアウト時間に達する。WDT550は、計時時間がタイムアウト時間(4秒)に達すると、タイムアウト信号611を「論理1」にする。   For this reason, the WDT 550 continues timing without resetting the timing. As a result, the timekeeping time reaches the timeout time. When the timed time reaches the timeout time (4 seconds), the WDT 550 sets the timeout signal 611 to “logic 1”.

次に、フィルタ部170は、「論理1」のタイムアウト信号611を入力されるが、「論理1」のフィルタオン信号621を反転した「論理0」信号と論理積を取り、タイムアウト信号612は論理「0」のままとする(タイムアウト信号612を出力しない)。   Next, the filter unit 170 receives the time-out signal 611 of “logic 1”, takes a logical product with a “logic 0” signal obtained by inverting the filter-on signal 621 of “logic 1”, and the time-out signal 612 is logically It remains “0” (the timeout signal 612 is not output).

以上が、本実施形態の動作の説明である。   The above is the description of the operation of the present embodiment.

尚、指示転送部130は、フィルタオン信号621を「論理1」にした状態において、リセットタイマー指示601の転送が成功した場合、フィルタオン信号621を「論理0」(第1の転送成功の情報とも呼ばれる)にするようにしてもよい。即ち、指示転送部130は、指示転送部130から指示受領部530までのいずれかで発生した障害が復旧した場合、タイムアウト信号611の伝達を許可するようにしてもよい。   The instruction transfer unit 130 sets the filter on signal 621 to “logic 0” (first transfer success information) when the transfer of the reset timer instruction 601 is successful in the state where the filter on signal 621 is set to “logic 1”. May also be called). That is, the instruction transfer unit 130 may permit transmission of the timeout signal 611 when a failure that has occurred in any of the instruction transfer unit 130 to the instruction reception unit 530 is recovered.

また、指示転送部130は、転送がn(nは自然数)回以上失敗した場合に、タイムアウト信号611の伝達を禁止するようにしてもよい。この場合、タイムアウト時間は、リセットタイマー間隔時間のn倍以上である。   Further, the instruction transfer unit 130 may prohibit transmission of the timeout signal 611 when the transfer has failed n (n is a natural number) times or more. In this case, the timeout time is not less than n times the reset timer interval time.

上述した本実施形態における第1の効果は、被監視対象のシステムが正常な状態にあるにもかかわらず、WDT550のタイムアウトが発生し、システム運用に支障をきたすことを防止することが可能になる点である。   The first effect of the present embodiment described above is that it is possible to prevent a time-out of the WDT 550 from occurring even if the monitored system is in a normal state, thereby hindering system operation. Is a point.

その理由は、指示転送部130が、リセットタイマー指示601の転送失敗を検出し、フィルタ部170が、その転送失敗の情報に基づいて、タイムアウト信号611の伝達を禁止するようにしたからである。   This is because the instruction transfer unit 130 detects the transfer failure of the reset timer instruction 601 and the filter unit 170 prohibits the transmission of the timeout signal 611 based on the transfer failure information.

上述した本実施形態における第2の効果は、システム監視装置100による監視機能が有効でない期間を短縮できることである。   The 2nd effect in this embodiment mentioned above is that the period when the monitoring function by the system monitoring apparatus 100 is not effective can be shortened.

その理由は、指示転送部130が、リセットタイマー指示601の転送が成功した場合に、タイムアウト信号611の伝達を許可するようにしたからである。   The reason is that the instruction transfer unit 130 allows the transmission of the timeout signal 611 when the transfer of the reset timer instruction 601 is successful.

[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.

図6は、本発明の第2の実施形態に係るシステム監視装置200の構成を示すブロック図である。   FIG. 6 is a block diagram showing the configuration of the system monitoring apparatus 200 according to the second embodiment of the present invention.

図6を参照すると、本実施形態に係るシステム監視装置200は、指示転送部230と転送代替部240とフィルタ部270と監視プロセッサ502とを含む。   Referring to FIG. 6, the system monitoring apparatus 200 according to the present embodiment includes an instruction transfer unit 230, a transfer substitution unit 240, a filter unit 270, and a monitoring processor 502.

以下の説明では、図2を、図中のシステム監視装置100をシステム監視装置200と読み替えて、本実施形態のシステム監視装置200とシステム監視装置200の監視対象であるコンピュータシステム101とを含む、システムの構成を示すブロック図として参照する。   In the following description, FIG. 2 includes the system monitoring apparatus 200 of the present embodiment and the computer system 101 that is the monitoring target of the system monitoring apparatus 200 by replacing the system monitoring apparatus 100 in the figure with the system monitoring apparatus 200. Refer to it as a block diagram showing the system configuration.

システム監視装置200の指示転送部230は、第1の実施形態の指示転送部130の機能に加えて、リセットタイマー指示601の転送が失敗した場合、リセットタイマー指示601の代わりにリセットタイマー指示(第2のリセットタイマー指示とも呼ばれる)604を代替転送することを指示する、代替指示603を転送代替部240に出力する。   In addition to the function of the instruction transfer unit 130 of the first embodiment, the instruction transfer unit 230 of the system monitoring apparatus 200, when the transfer of the reset timer instruction 601 fails, uses a reset timer instruction (first operation) instead of the reset timer instruction 601. 2, which is also referred to as a reset timer instruction 2), is output to the transfer replacement unit 240.

転送代替部240は、代替指示603に基づいて、リセットタイマー指示604を代替指示受領部540に転送する。また、転送代替部240は、リセットタイマー指示604の転送が失敗したことを検出した場合に、フィルタオン信号622(第2の転送失敗の情報とも呼ばれる)を出力する。転送代替部240と代替指示受領部540との間のインタフェースは、例えば、LAN(Local Area Network)経由でIPMIによる制御を行うIPMI Over Lanである。   The transfer substitution unit 240 transfers the reset timer instruction 604 to the substitution instruction receiving unit 540 based on the substitution instruction 603. Further, when the transfer substitution unit 240 detects that the transfer of the reset timer instruction 604 has failed, it outputs a filter-on signal 622 (also referred to as second transfer failure information). The interface between the transfer substitution unit 240 and the substitution instruction reception unit 540 is, for example, IPMI Over Lan that performs control by IPMI via a LAN (Local Area Network).

フィルタ部270は、指示転送部230が検出した第1の転送失敗の情報、及び転送代替部240が出力した第2の転送失敗の情報に基づいて、タイムアウト信号611の伝達を禁止する。   The filter unit 270 prohibits transmission of the timeout signal 611 based on the first transfer failure information detected by the instruction transfer unit 230 and the second transfer failure information output by the transfer substitution unit 240.

監視プロセッサ502は、第1の実施形態の監視プロセッサ500に比べて、代替指示受領部540を更に含み、WDT550の動作が異なる。   The monitoring processor 502 further includes an alternative instruction receiving unit 540 and the operation of the WDT 550 is different from that of the monitoring processor 500 of the first embodiment.

代替指示受領部540は、リセットタイマー指示604を受信し、WDT550にリセットタイマー信号605を出力する。リセットタイマー信号605は、例えば「論理1」のパルスである。尚、リセットタイマー信号は、他の形態(例えば「論理0」のパルス)であってもよい。   The substitute instruction receiving unit 540 receives the reset timer instruction 604 and outputs a reset timer signal 605 to the WDT 550. The reset timer signal 605 is, for example, a “logic 1” pulse. The reset timer signal may be in another form (for example, a pulse of “logic 0”).

WDT550は、リセットタイマー信号602またはリセットタイマー信号605を受け取ると、その時点の計時時間をリセットし、タイムアウト時間の計時を最初からやり直す。この点が、第1の実施形態のWDT550と異なる。   When the WDT 550 receives the reset timer signal 602 or the reset timer signal 605, the WDT 550 resets the time measurement time at that time, and restarts the time-out time measurement from the beginning. This point is different from the WDT 550 of the first embodiment.

図7は、フィルタ部270の構成を示すブロック図である。図7は、タイムアウト信号611、タイムアウト信号612及びフィルタオン信号621は、第1の実施形態の信号と同様あり、後述のフィルタオン信号622が「論理1」でフィルタをオンにすることを指示する場合の、フィルタ部270を示す。   FIG. 7 is a block diagram illustrating a configuration of the filter unit 270. In FIG. 7, the timeout signal 611, the timeout signal 612, and the filter on signal 621 are the same as those of the first embodiment, and a filter on signal 622 (to be described later) instructs to turn on the filter with “logic 1”. In this case, the filter unit 270 is shown.

図7を参照すると、フィルタ部270は、アンド素子171と、ナンド素子273とを有している。   Referring to FIG. 7, the filter unit 270 includes an AND element 171 and a NAND element 273.

ナンド素子273は、フィルタオン信号621とフィルタオン信号622の論理積を反転した信号を、アンド素子171に出力する。   The NAND element 273 outputs a signal obtained by inverting the logical product of the filter ON signal 621 and the filter ON signal 622 to the AND element 171.

アンド素子171は、ナンド素子273の出力とタイムアウト信号611との論理積を、タイムアウト信号612として出力する。   The AND element 171 outputs a logical product of the output of the NAND element 273 and the timeout signal 611 as the timeout signal 612.

次に、本実施形態の動作を図6〜9を参照して、詳細に説明する。尚、前提は第1の実施形態の場合と同じである。   Next, the operation of the present embodiment will be described in detail with reference to FIGS. The premise is the same as that in the first embodiment.

まず、システム監視装置200が正常な場合の動作は、第1の実施形態で説明した動作と同じである。   First, the operation when the system monitoring apparatus 200 is normal is the same as the operation described in the first embodiment.

次に、指示転送部230から指示受領部530まで間のいずれかで障害が発生した場合を説明する。   Next, a case where a failure has occurred anywhere between the instruction transfer unit 230 and the instruction reception unit 530 will be described.

図8は、本実施形態の指示転送部230及び転送代替部240の動作を示すフローチャートである。S701〜S705の動作は、第1の実施形態で説明した動作と同じである。   FIG. 8 is a flowchart showing the operations of the instruction transfer unit 230 and the transfer alternative unit 240 of this embodiment. The operations in S701 to S705 are the same as the operations described in the first embodiment.

図9は、本実施形態の監視プロセッサ502の動作を示すフローチャートである。   FIG. 9 is a flowchart showing the operation of the monitoring processor 502 of this embodiment.

図8において、指示転送部230は、リセットタイマー指示601の転送失敗を検出したことに基づいて、代替指示603を出力する(S721)。   In FIG. 8, the instruction transfer unit 230 outputs an alternative instruction 603 based on the detection of the transfer failure of the reset timer instruction 601 (S721).

尚、フィルタ部270は、ステップS705において、「論理1」のフィルタオン信号621を入力される。しかし、フィルタ部270は、フィルタオン信号622が「論理0」であるため、タイムアウト信号611の伝達を禁止しない。   Note that the filter unit 270 receives the “logic 1” filter-on signal 621 in step S705. However, the filter unit 270 does not prohibit transmission of the timeout signal 611 because the filter-on signal 622 is “logic 0”.

一方、指示受領部530は、リセットタイマー指示601を受け取れないため、リセットタイマー信号602の出力を行わない。   On the other hand, the instruction receiving unit 530 does not output the reset timer signal 602 because it cannot receive the reset timer instruction 601.

次に、転送代替部240は、代替指示603に基づいて、代替指示受領部540にリセットタイマー指示604を送信する(S722)。具体的には、リセットタイマー指示604の送信は、例えば、転送代替部240が代替指示受領部540にリセットタイマー指示604を含むコマンドを送信し、代替指示受領部540が転送代替部240に受信応答を送信する。   Next, the transfer substitution unit 240 transmits a reset timer instruction 604 to the substitution instruction receiving unit 540 based on the substitution instruction 603 (S722). Specifically, the transmission of the reset timer instruction 604 is performed by, for example, the transfer substitution unit 240 sending a command including the reset timer instruction 604 to the substitution instruction receiving unit 540, and the substitution instruction receiving unit 540 receiving a response to the transfer substitution unit 240. Send.

次に、転送代替部240は、受信応答を待つ(S723)。予め定められた時間(例えば、2ミリ秒)以内に受信応答を受信した場合(S723でYES)、処理は終了する。   Next, the transfer substitution unit 240 waits for a reception response (S723). If the reception response is received within a predetermined time (for example, 2 milliseconds) (YES in S723), the process ends.

図9において、代替指示受領部540は、リセットタイマー指示604を受信し、これに基づいてWDT550にリセットタイマー信号605を出力する(S731)。   In FIG. 9, the substitute instruction receiving unit 540 receives the reset timer instruction 604 and outputs a reset timer signal 605 to the WDT 550 based on the reset timer instruction 604 (S731).

次に、WDT550は、リセットタイマー信号605を受け取り、これに基づいて計時時間をリセット(S732)。そして、WDT550は、タイムアウト時間の計時を最初からやり直す。   Next, the WDT 550 receives the reset timer signal 605 and resets the time measurement based on the reset timer signal 605 (S732). Then, the WDT 550 starts counting the timeout time from the beginning.

次に、上述の指示転送部230から指示受領部530まで間のいずれかで障害が発生した場合において、更に転送代替部240から代替指示受領部540までの間のいずれかで障害が発生した場合について説明する。   Next, when a failure occurs between any of the above-described instruction transfer unit 230 and the instruction reception unit 530, and further when a failure occurs between any of the transfer substitution unit 240 and the substitution instruction reception unit 540 Will be described.

転送代替部240は、代替指示603に基づいて、代替指示受領部540にリセットタイマー指示604を送信する(S722)。   The transfer substitution unit 240 transmits a reset timer instruction 604 to the substitution instruction receiving unit 540 based on the substitution instruction 603 (S722).

次に、転送代替部240は、受信応答を待つ(S723)。しかし、上述の障害のため、代替指示受領部540は、リセットタイマー指示604を含むコマンドを受信できず、受信応答を送信しない。   Next, the transfer substitution unit 240 waits for a reception response (S723). However, due to the above-described failure, the substitute instruction receiving unit 540 cannot receive a command including the reset timer instruction 604 and does not transmit a reception response.

予め定められた時間(例えば、1ミリ秒)以内に受信応答を受信しなかった場合(S703でNO)、転送代替部240は、リセットタイマー指示604の転送が失敗したことを検出する(S724)。   When the reception response is not received within a predetermined time (for example, 1 millisecond) (NO in S703), the transfer substitution unit 240 detects that the transfer of the reset timer instruction 604 has failed (S724). .

次に、転送代替部240は、リセットタイマー指示601の転送失敗を検出したことに基づいて、フィルタオン信号622を「論理1」にする(S725)。   Next, the transfer substitution unit 240 sets the filter-on signal 622 to “logic 1” based on the detection of the transfer failure of the reset timer instruction 601 (S725).

一方、代替指示受領部540は、リセットタイマー指示604を受け取れないため、リセットタイマー信号602の出力を行わない。また、上述の通り、指示受領部530も、リセットタイマー指示601を受け取れないため、リセットタイマー信号602の出力を行わない。   On the other hand, the substitute instruction receiving unit 540 does not receive the reset timer instruction 604 and does not output the reset timer signal 602. Further, as described above, the instruction receiving unit 530 does not receive the reset timer instruction 601 and therefore does not output the reset timer signal 602.

このため、WDT550は、計時時間をリセットしないで、計時を継続する。その結果、計時時間がタイムアウト時間に達する。WDT550は、計時時間がタイムアウト時間(4秒)に達すると、タイムアウト信号611を「論理1」にする。   For this reason, the WDT 550 continues timing without resetting the timing. As a result, the timekeeping time reaches the timeout time. When the timed time reaches the timeout time (4 seconds), the WDT 550 sets the timeout signal 611 to “logic 1”.

次に、フィルタ部270は、「論理1」のタイムアウト信号611を入力されるが、「論理1」のフィルタオン信号621と「論理1」のフィルタオン信号622との論理積を反転した「論理0」信号と論理積を取り、タイムアウト信号612は論理「0」のままとする(タイムアウト信号612を出力しない)。   Next, the filter unit 270 receives the “logic 1” timeout signal 611, but inverts the logical product of the “logic 1” filter on signal 621 and the “logic 1” filter on signal 622 to “logic”. The logical product of the “0” signal is obtained, and the timeout signal 612 remains at the logic “0” (the timeout signal 612 is not output).

以上が、本実施形態の動作の説明である。   The above is the description of the operation of the present embodiment.

尚、転送代替部240は、フィルタオン信号622を「論理1」にした状態において、リセットタイマー指示604の転送が成功した場合、フィルタオン信号622を「論理0」(第2の転送成功の情報とも呼ばれる)にするようにしてもよい。即ち、転送代替部240は、転送代替部240から代替指示受領部540までのいずれかで発生した障害が復旧した場合、タイムアウト信号611の伝達を許可するようにしてもよい。   When the transfer of the reset timer instruction 604 is successful in the state where the filter on signal 622 is set to “logic 1”, the transfer substitution unit 240 sets the filter on signal 622 to “logic 0” (second transfer success information). May also be called). That is, the transfer substitution unit 240 may permit the transmission of the timeout signal 611 when a failure that has occurred in any of the transfer substitution unit 240 to the substitution instruction reception unit 540 is recovered.

また、指示転送部230は、転送がn(nは自然数)回以上失敗した場合に、タイムアウト信号611の伝達を禁止するように、及び代替指示603を出すようにしてもよい。また、転送代替部240は、転送がn(nは自然数)回以上失敗した場合に、タイムアウト信号611の伝達を禁止するようにしてもよい。この場合、タイムアウト時間は、リセットタイマー間隔時間のn倍以上である。   In addition, the instruction transfer unit 230 may prohibit the transmission of the timeout signal 611 and issue an alternative instruction 603 when the transfer fails n (n is a natural number) times or more. Further, the transfer substitution unit 240 may prohibit the transmission of the timeout signal 611 when the transfer fails n (n is a natural number) times or more. In this case, the timeout time is not less than n times the reset timer interval time.

上述した本実施形態における第1の効果は、第1の実施形態の効果に加えて、指示転送部230から指示受領部530までのいずれかで障害が発生した場合でも、システム監視装置200の監視機能を有効にしておくことが可能になる点である。   The first effect of the present embodiment described above is that, in addition to the effect of the first embodiment, even if a failure occurs in any of the instruction transfer unit 230 to the instruction reception unit 530, the monitoring of the system monitoring apparatus 200 is performed. The point is that it is possible to keep the function valid.

その理由は、指示転送部230がリセットタイマー指示601の転送を失敗した場合、転送代替部240がリセットタイマー指示604を転送するようにしたからである。   The reason is that, when the instruction transfer unit 230 fails to transfer the reset timer instruction 601, the transfer substitution unit 240 transfers the reset timer instruction 604.

上述した本実施形態における第2の効果は、システム監視装置200による監視機能が有効でない期間を更に短縮できることである。   The second effect of the present embodiment described above is that the period during which the monitoring function by the system monitoring apparatus 200 is not valid can be further shortened.

その理由は、転送代替部240が、リセットタイマー指示604の転送が成功した場合にフィルタオン信号622を「論理0」にするようにしたからである。
This is because the transfer substitution unit 240 sets the filter-on signal 622 to “logic 0” when the transfer of the reset timer instruction 604 is successful.

[第3の実施の形態]
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
[Third Embodiment]
Next, a third embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.

図10は、本発明の第3の実施形態に係るシステム監視装置300の構成を示すブロック図である。   FIG. 10 is a block diagram showing a configuration of a system monitoring apparatus 300 according to the third embodiment of the present invention.

図10を参照すると、本実施形態に係るシステム監視装置300は、指示転送部130とフィルタ部170と監視プロセッサ503とを含む。   Referring to FIG. 10, the system monitoring apparatus 300 according to the present embodiment includes an instruction transfer unit 130, a filter unit 170, and a monitoring processor 503.

以下の説明では、図2を、図中のシステム監視装置100をシステム監視装置300に読み替えて、本実施形態のシステム監視装置300とシステム監視装置300の監視対象であるコンピュータシステム101とを含む、システムの構成を示すブロック図として参照する。   In the following description, FIG. 2 includes the system monitoring apparatus 300 of this embodiment and the computer system 101 that is the monitoring target of the system monitoring apparatus 300 by replacing the system monitoring apparatus 100 in the drawing with the system monitoring apparatus 300. Refer to it as a block diagram showing the system configuration.

システム監視装置300の指示転送部130は、第1の実施形態の指示転送部130と同じものである。更に、本実施形態において、指示転送部130は、フィルタオン信号621を「論理1」にした状態において、リセットタイマー指示601の転送が成功した場合、フィルタオン信号621を「論理0」にする。即ち、指示転送部130は、指示転送部130から指示受領部530までのいずれかで発生した障害が復旧した場合、タイムアウト信号611の伝達を許可する。
システム監視装置300のフィルタ部170は、第1の実施形態のフィルタ部170と同じものである。
The instruction transfer unit 130 of the system monitoring apparatus 300 is the same as the instruction transfer unit 130 of the first embodiment. Further, in this embodiment, the instruction transfer unit 130 sets the filter-on signal 621 to “logic 0” when the transfer of the reset timer instruction 601 is successful in a state where the filter-on signal 621 is set to “logic 1”. That is, the instruction transfer unit 130 permits transmission of the timeout signal 611 when a failure that has occurred in any of the instruction transfer unit 130 to the instruction reception unit 530 is recovered.
The filter unit 170 of the system monitoring apparatus 300 is the same as the filter unit 170 of the first embodiment.

監視プロセッサ503は、指示受領部530とWDT550と判定部510と発生履歴記憶部520と自己初期化部590とを含む。   The monitoring processor 503 includes an instruction receiving unit 530, a WDT 550, a determination unit 510, an occurrence history storage unit 520, and a self-initialization unit 590.

指示受領部530及びWDT550は、第1の実施形態の指示受領部530及びWDT550と同じものである。   The instruction receiving unit 530 and the WDT 550 are the same as the instruction receiving unit 530 and the WDT 550 of the first embodiment.

発生履歴記憶部520は、タイムアウト信号611の発生有無を記憶する。発生履歴記憶部520は、システム監視装置300の初期状態(例えば、システム監視装置300電源を投入された直後)においては、タイムアウトの発生無を記憶している。   The occurrence history storage unit 520 stores whether or not the timeout signal 611 is generated. The occurrence history storage unit 520 stores no occurrence of timeout in the initial state of the system monitoring apparatus 300 (for example, immediately after the system monitoring apparatus 300 is turned on).

判定部510は、タイムアウト信号611を受け取り、発生履歴記憶部520にタイムアウト信号611の発生有が記憶されている場合にタイムアウト信号613を出力する。また、判定部510は、発生履歴記憶部520にタイムアウト信号611の発生無が記憶されている場合、発生履歴記憶部520にタイムアウト信号611の発生有を記録し、自己初期化信号614を出力する。   The determination unit 510 receives the timeout signal 611 and outputs the timeout signal 613 when the occurrence history storage unit 520 stores the occurrence of the timeout signal 611. Further, when the occurrence history storage unit 520 stores the occurrence of the timeout signal 611, the determination unit 510 records the occurrence of the timeout signal 611 in the occurrence history storage unit 520 and outputs the self-initialization signal 614. .

自己初期化部590は、自己初期化信号614を受け取った場合、監視プロセッサ503自身を、発生履歴記憶部520を除いて、リセットする。   When the self-initialization unit 590 receives the self-initialization signal 614, the self-initialization unit 590 resets the monitoring processor 503 itself except for the occurrence history storage unit 520.

次に、本実施形態の動作を図10及び11を参照して、詳細に説明する。本実施形態は、第1の実施形態に比べて、判定部510、発生履歴記憶部520及び自己初期化部590が追加されており、この追加された部分に関連する動作が異なる。以下では、主に、この異なる動作について説明する。   Next, the operation of this embodiment will be described in detail with reference to FIGS. The present embodiment is different from the first embodiment in that a determination unit 510, an occurrence history storage unit 520, and a self-initialization unit 590 are added, and operations related to the added portion are different. In the following, this different operation will be mainly described.

図11は、WDT550がタイムアウト信号611を「論理1」にした場合の監視プロセッサ503の動作を示すフローチャートである。   FIG. 11 is a flowchart showing the operation of the monitoring processor 503 when the WDT 550 sets the timeout signal 611 to “logic 1”.

まず、判定部510は、タイムアウト信号611が「論理1」になったことを検出する(S741)。   First, the determination unit 510 detects that the timeout signal 611 has become “logic 1” (S741).

次に、判定部510は、発生履歴記憶部520がタイムアウト発生有を記憶しているか否かを確認する(S742)。   Next, the determination unit 510 checks whether or not the occurrence history storage unit 520 stores the occurrence of timeout (S742).

発生履歴記憶部520がタイムアウト発生無を記憶している場合(S742でNO)、判定部510は、発生履歴記憶部520にタイムアウト発生有を記録する(S743)。続けて、判定部510は、自己初期化部590に自己初期化信号614を出力する(S744)。   When the occurrence history storage unit 520 stores no occurrence of timeout (NO in S742), the determination unit 510 records the occurrence of timeout in the occurrence history storage unit 520 (S743). Subsequently, the determination unit 510 outputs a self-initialization signal 614 to the self-initialization unit 590 (S744).

発生履歴記憶部520がタイムアウト発生有を記憶している場合(S742でYES)、判定部510は、フィルタ部170にタイムアウト信号613を出力する(S745)。 上述した本実施形態における効果は、第1の実施形態の効果に加えて、監視プロセッサ503の障害を自動復旧することが可能になる点である。   When the occurrence history storage unit 520 stores the occurrence of timeout (YES in S742), the determination unit 510 outputs the timeout signal 613 to the filter unit 170 (S745). The effect of the present embodiment described above is that the failure of the monitoring processor 503 can be automatically recovered in addition to the effect of the first embodiment.

その理由は、最初のタイムアウトが発生した場合に、判定部510が自己初期化部590に自己初期化信号614を出力し、自己初期化部590が監視プロセッサ503を初期化するようにしたからである。   The reason is that when the first timeout occurs, the determination unit 510 outputs a self-initialization signal 614 to the self-initialization unit 590, and the self-initialization unit 590 initializes the monitoring processor 503. is there.

[第4の実施形態]
次に、本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
[Fourth Embodiment]
Next, a fourth embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.

図12は、本発明の第4の実施形態に係るシステム監視装置400の構成を示すブロック図である。   FIG. 12 is a block diagram showing a configuration of a system monitoring apparatus 400 according to the fourth embodiment of the present invention.

図12を参照すると、本実施形態に係るシステム監視装置400は、指示転送部230と転送代替部240とフィルタ部270と監視プロセッサ504とを含む。   Referring to FIG. 12, the system monitoring apparatus 400 according to the present embodiment includes an instruction transfer unit 230, a transfer substitution unit 240, a filter unit 270, and a monitoring processor 504.

本実施形態のシステム監視装置400は、第2の実施形態のシステム監視装置200と比べて、監視プロセッサ502の指示受領部530が、監視プロセッサ504の指示受領部534に置き換えられている。   In the system monitoring apparatus 400 of this embodiment, the instruction receiving unit 530 of the monitoring processor 502 is replaced with the instruction receiving unit 534 of the monitoring processor 504, compared to the system monitoring apparatus 200 of the second embodiment.

指示受領部534は、リセットタイマー信号605を受け取ると、自身をリセットする。   Upon receiving the reset timer signal 605, the instruction receiving unit 534 resets itself.

上述した本実施形態における効果は、第2の実施形態の効果に加えて、指示受領部530の障害を自動復旧することが可能になる点である。   The effect of the present embodiment described above is that the failure of the instruction receiving unit 530 can be automatically recovered in addition to the effect of the second embodiment.

その理由は、指示受領部534がリセットタイマー信号605を受け取ると、自身をリセットするようにしたからである。   The reason is that when the instruction receiving unit 534 receives the reset timer signal 605, it resets itself.

尚、上述の各実施形態は、任意に組み合わされてよい。   The above-described embodiments may be arbitrarily combined.

上述の各実施形態及び任意の実施形態を組み合わせた実施形態は、高可用性を求められるシステムに適したシステム監視装置及びシステム監視方法を提供することができる。その理由は、転送代替部が単一障害(リセットタイマー指示601の転送不可障害)によるWDTのタイムアウトを防止し、フィルタ部がシステム監視装置の障害によるWDTのタイムアウトをシステムに影響させないようにしたからである。   Embodiments combining the above-described embodiments and arbitrary embodiments can provide a system monitoring apparatus and a system monitoring method suitable for a system that requires high availability. The reason is that the transfer substitution unit prevents the WDT time-out due to a single failure (failure of transfer of the reset timer instruction 601), and the filter unit prevents the WDT time-out due to the failure of the system monitoring device from affecting the system. It is.

また、これらの実施形態は、システムの監視不可時間を低減すること、及び、保守介入の抑制によるシステムダウン時間を低減することを可能にする。その理由は、判定部と自己初期化部が監視プロセッサを自己復旧させ、代替指示受領部と指示受領部とが指示受領部を自己復旧させるようにしたからである。   These embodiments also reduce system downtime and system downtime due to reduced maintenance intervention. The reason is that the determination unit and the self-initialization unit self-recover the monitoring processor, and the substitute instruction receiving unit and the instruction receiving unit self-recover the instruction receiving unit.

以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されたり、1つの構成要素が複数のモジュールで実現されたりしてもよい。また、各構成要素は、ある構成要素が他の構成要素の一部であったり、ある構成要素の一部と他の構成要素の一部とが重複していたり、といったような構成であってもよい。   Each component described in each of the above embodiments does not necessarily have to be individually independent. For example, in each component, a plurality of components may be realized as one module, or one component may be realized as a plurality of modules. Each component is configured such that a component is a part of another component, or a part of a component overlaps a part of another component. Also good.

また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。   Further, in each of the embodiments described above, a plurality of operations are described in order in the form of a flowchart, but the described order does not limit the order in which the plurality of operations are executed. For this reason, when each embodiment is implemented, the order of the plurality of operations can be changed within a range that does not hinder the contents.

更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよい。   Furthermore, in each embodiment described above, a plurality of operations are not limited to being executed at different timings. For example, another operation may occur during the execution of a certain operation, or the execution timing of a certain operation and another operation may partially or entirely overlap.

更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作の全ての関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更されて良い。   Furthermore, in each of the embodiments described above, a certain operation is described as a trigger for another operation, but the description does not limit all relationships between the certain operation and the other operations. For this reason, when each embodiment is implemented, the relationship between the plurality of operations can be changed within a range that does not hinder the contents. The specific description of each operation of each component does not limit each operation of each component. For this reason, each specific operation | movement of each component may be changed in the range which does not cause trouble with respect to a functional, performance, and other characteristic in implementing each embodiment.

尚、以上説明した各実施形態における各構成要素は、必要に応じ可能であれば、ハードウェアで実現されても良いし、ソフトウェアで実現されても良いし、ハードウェアとソフトウェアの混在により実現されても良い。   Each component in each embodiment described above may be realized by hardware, software, or a mixture of hardware and software, if necessary. May be.

また、各構成要素の物理的な構成は、以上の実施形態の記載に限定されることはなく、独立して存在しても良いし、組み合わされて存在しても良いしまたは分離して構成されても良い。   Further, the physical configuration of each component is not limited to the description of the above embodiment, and may exist independently, may exist in combination, or may be configured separately. May be.

上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
予め定められた時間を計時するとタイムアウト信号を出力するウォッチドッグタイマー(WDT、WatchDog Timer)と、
前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する指示受領部と、を含む監視プロセッサと、
前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記指示受領部に転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力する指示転送部と、
前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止するフィルタ部と、
を有するシステム監視装置。
(付記2)
前記指示転送部は、前記第1のリセットタイマー指示の転送成功を検出した場合に第1の転送成功の情報を出力し、
前記フィルタ部は、前記第1の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする付記1記載のシステム監視装置。
(付記3)
前記監視プロセッサは、前記WDTのリセットを指示する第2のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する代替指示受領部を更に含み、
前記指示転送部は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、
前記代替指示に基づいて、前記第2のリセットタイマー指示を前記代替指示受領部に転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力する転送代替部を更に含み、
前記フィルタ部は、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する、
ことを特徴とする付記1または2記載のシステム監視装置。
(付記4)
前記転送代替部は、前記第2のリセットタイマー指示の転送成功を検出した場合に第2の転送成功の情報を出力し、
前記フィルタ部は、前記第1の転送成功の情報及び前記第2の転送成功の情報の少なくとも一方に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする付記3記載のシステム監視装置。
(付記5)
前記監視プロセッサは、前記タイムアウト信号の発生有無を記憶する発生履歴記憶部と、
前記タイムアウト信号を受け取った際、前記発生履歴記憶部に前記タイムアウト信号の発生有が記憶されている場合に前記タイムアウト信号を出力し、前記発生履歴記憶部に前記タイムアウト信号の発生無が記憶されている場合に自己初期化信号を出力する判定部と、
前記自己初期化信号を受け取って前記監視プロセッサを前記発生履歴記憶部を除いてリセットする自己初期化部と、を更に含む
ことを特徴とする付記2乃至4のいずれかに記載のシステム監視装置。
(付記6)
前記指示受領部は、前記代替指示受領部が第2のリセットタイマー指示を受信した場合に、前記指示受領部をリセットする
ことを特徴とする付記3乃至5のいずれかに記載のシステム監視装置。
(付記7)
予め定められた時間を計時するとタイムアウト信号を出力するWDTを含むシステム監視装置の監視プロセッサが、前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置が、前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記監視プロセッサに転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力し、前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する
システム監視方法。
(付記8)
前記システム監視装置は、前記第1のリセットタイマー指示の転送成功を検出した場合に第1の転送成功の情報を出力し、前記第1の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする付記7記載のシステム監視方法。
(付記9)
前記監視プロセッサは、前記WDTのリセットを指示する第2のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、前記代替指示に基づいて、前記第2のリセットタイマー指示を転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力し、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する
ことを特徴とする付記7または8記載のシステム監視方法。
(付記10)
前記システム監視装置は、前記第2のリセットタイマー指示の転送成功を検出した場合に第2の転送成功の情報を出力し、前記第1の転送成功の情報及び前記第2の転送成功の情報の少なくとも一方に基づいて、前記タイムアウト信号の伝達を許可する
ことを特徴とする付記7乃至9のいずれかに記載のシステム監視方法。
(付記11)
前記監視プロセッサは、前記タイムアウト信号の発生有無を記憶し、前記タイムアウト信号を受け取った際、前記タイムアウト信号の発生有が記憶されている場合に前記タイムアウト信号を出力し、前記タイムアウト信号の発生無が記憶されている場合に自己初期化信号を出力し、前記自己初期化信号に基づいて、前記監視プロセッサ自身を前記タイムアウト信号の発生有無の記憶を除いてリセットする
ことを特徴とする付記8乃至10のいずれかに記載のシステム監視方法。
A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.
(Appendix 1)
A watchdog timer (WDT, WatchDog Timer) that outputs a time-out signal when measuring a predetermined time;
An instruction receiving unit that receives a first reset timer instruction for instructing resetting of the WDT and outputs a reset timer signal to the WDT;
A reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT is transferred to the instruction receiving unit as the first reset timer instruction, and a transfer failure of the first reset timer instruction is detected. An instruction transfer unit that outputs information on the first transfer failure when
A filter unit for prohibiting transmission of the timeout signal based on the information on the first transfer failure;
A system monitoring device.
(Appendix 2)
The instruction transfer unit outputs information on the first transfer success when the transfer success of the first reset timer instruction is detected,
The filter unit permits transmission of the timeout signal based on the first transfer success information;
The system monitoring apparatus according to claim 1, wherein
(Appendix 3)
The monitoring processor further includes an alternative instruction receiving unit that receives a second reset timer instruction that instructs to reset the WDT and outputs a reset timer signal to the WDT,
The instruction transfer unit outputs a substitute instruction for instructing a substitute transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected. And
Based on the substitution instruction, the second reset timer instruction is transferred to the substitution instruction receiving unit, and a second transfer failure information is output when a transfer failure of the second reset timer instruction is detected. Further including an alternative part,
The filter unit prohibits transmission of the timeout signal based on the information on the first transfer failure and the information on the second transfer failure.
The system monitoring apparatus according to appendix 1 or 2, characterized in that:
(Appendix 4)
The transfer substitution unit outputs second transfer success information when detecting the transfer success of the second reset timer instruction,
The filter unit permits transmission of the timeout signal based on at least one of the first transfer success information and the second transfer success information.
The system monitoring device according to supplementary note 3, characterized by:
(Appendix 5)
The monitoring processor includes an occurrence history storage unit that stores presence / absence of occurrence of the timeout signal;
When the time-out signal is received, the time-out signal is output when the time-out signal is generated in the generation history storage unit, and the generation history storage unit stores the occurrence of the time-out signal is not stored. A determination unit that outputs a self-initialization signal when
The system monitoring apparatus according to any one of appendices 2 to 4, further comprising: a self-initialization unit that receives the self-initialization signal and resets the monitoring processor except for the occurrence history storage unit.
(Appendix 6)
The system monitoring device according to any one of appendices 3 to 5, wherein the instruction receiving unit resets the instruction receiving unit when the substitute instruction receiving unit receives a second reset timer instruction.
(Appendix 7)
A monitoring processor of a system monitoring apparatus including a WDT that outputs a timeout signal when a predetermined time is measured receives a first reset timer instruction that instructs resetting of the WDT, and outputs a reset timer signal to the WDT. ,
The system monitoring apparatus transfers a reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT to the monitoring processor as the first reset timer instruction, and the first reset timer instruction A system monitoring method that outputs information on the first transfer failure when the transfer failure is detected, and prohibits transmission of the timeout signal based on the information on the first transfer failure.
(Appendix 8)
The system monitoring device outputs first transfer success information when detecting transfer success of the first reset timer instruction, and transmits the timeout signal based on the first transfer success information. To give permission,
The system monitoring method according to appendix 7, wherein:
(Appendix 9)
The monitoring processor receives a second reset timer instruction for instructing reset of the WDT, and outputs a reset timer signal to the WDT;
The system monitoring device outputs an alternative instruction instructing an alternative transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected Then, based on the substitute instruction, the second reset timer instruction is transferred, and when the transfer failure of the second reset timer instruction is detected, the second transfer failure information is output, and the first The system monitoring method according to appendix 7 or 8, wherein transmission of the timeout signal is prohibited based on information on transfer failure and information on the second transfer failure.
(Appendix 10)
The system monitoring apparatus outputs second transfer success information when detecting the transfer success of the second reset timer instruction, and outputs the first transfer success information and the second transfer success information. The system monitoring method according to any one of appendices 7 to 9, wherein transmission of the timeout signal is permitted based on at least one of them.
(Appendix 11)
The monitoring processor stores whether or not the timeout signal is generated. When the timeout signal is received, the monitoring processor outputs the timeout signal when the occurrence of the timeout signal is stored. Appendix 8 to 10, wherein a self-initialization signal is output when stored, and based on the self-initialization signal, the monitoring processor itself is reset except for storage of the occurrence of the timeout signal. The system monitoring method according to any one of the above.

100 システム監視装置
101 コンピュータシステム
102 リセットタイマー指示発行部
103 システム制御コントローラ
130 指示転送部
170 フィルタ部
171 アンド素子
172 インバータ素子
200 システム監視装置
230 指示転送部
240 転送代替部
270 フィルタ部
273 ナンド素子
300 システム監視装置
400 システム監視装置
500 監視プロセッサ
502 監視プロセッサ
503 監視プロセッサ
504 監視プロセッサ
510 判定部
520 発生履歴記憶部
530 指示受領部
534 指示受領部
540 代替指示受領部
550 WDT
590 自己初期化部
600 リセットタイマー指示
601 リセットタイマー指示
602 リセットタイマー信号
603 代替指示
604 リセットタイマー指示
605 リセットタイマー信号
611 タイムアウト信号
612 タイムアウト信号
613 タイムアウト信号
614 自己初期化信号
621 フィルタオン信号
622 フィルタオン信号
DESCRIPTION OF SYMBOLS 100 System monitoring apparatus 101 Computer system 102 Reset timer instruction | indication part 103 System controller 130 Instruction transfer part 170 Filter part 171 And element 172 Inverter element 200 System monitoring apparatus 230 Instruction transfer part 240 Transfer substitution part 270 Filter part 273 Nand element 300 System Monitoring device 400 System monitoring device 500 Monitoring processor 502 Monitoring processor 503 Monitoring processor 504 Monitoring processor 510 Determination unit 520 Occurrence history storage unit 530 Instruction receiving unit 534 Instruction receiving unit 540 Alternative instruction receiving unit 550 WDT
590 Self-initialization unit 600 Reset timer instruction 601 Reset timer instruction 602 Reset timer signal 603 Substitution instruction 604 Reset timer instruction 605 Reset timer signal 611 Timeout signal 612 Timeout signal 613 Timeout signal 614 Self-initialization signal 621 Filter-on signal 622 Filter-on signal

Claims (10)

予め定められた時間を計時するとタイムアウト信号を出力するウォッチドッグタイマー(WDT、WatchDog Timer)と、
前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する指示受領部と、を含む監視プロセッサと、
前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記指示受領部に転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力する指示転送部と、
前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止するフィルタ部と、
を有するシステム監視装置。
A watchdog timer (WDT, WatchDog Timer) that outputs a time-out signal when measuring a predetermined time;
An instruction receiving unit that receives a first reset timer instruction for instructing resetting of the WDT and outputs a reset timer signal to the WDT;
A reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT is transferred to the instruction receiving unit as the first reset timer instruction, and a transfer failure of the first reset timer instruction is detected. An instruction transfer unit that outputs information on the first transfer failure when
A filter unit for prohibiting transmission of the timeout signal based on the information on the first transfer failure;
A system monitoring device.
前記指示転送部は、前記第1のリセットタイマー指示の転送成功を検出した場合に第1の転送成功の情報を出力し、
前記フィルタ部は、前記第1の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする請求項1記載のシステム監視装置。
The instruction transfer unit outputs information on the first transfer success when the transfer success of the first reset timer instruction is detected,
The filter unit permits transmission of the timeout signal based on the first transfer success information;
The system monitoring apparatus according to claim 1.
前記監視プロセッサは、前記WDTのリセットを指示する第2のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する代替指示受領部を更に含み、
前記指示転送部は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、
前記代替指示に基づいて、前記第2のリセットタイマー指示を前記代替指示受領部に転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力する転送代替部を更に含み、
前記フィルタ部は、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する、
ことを特徴とする請求項1または2記載のシステム監視装置。
The monitoring processor further includes an alternative instruction receiving unit that receives a second reset timer instruction that instructs to reset the WDT and outputs a reset timer signal to the WDT,
The instruction transfer unit outputs a substitute instruction for instructing a substitute transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected. And
Based on the substitution instruction, the second reset timer instruction is transferred to the substitution instruction receiving unit, and a second transfer failure information is output when a transfer failure of the second reset timer instruction is detected. Further including an alternative part,
The filter unit prohibits transmission of the timeout signal based on the information on the first transfer failure and the information on the second transfer failure.
The system monitoring apparatus according to claim 1 or 2, characterized in that
前記転送代替部は、前記第2のリセットタイマー指示の転送成功を検出した場合に第2の転送成功の情報を出力し、
前記フィルタ部は、前記指示転送部が前記第1のリセットタイマー指示の転送成功を検出した場合に出力する第1の転送成功の情報、及び前記第2の転送成功の情報の少なくとも一方に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする請求項3記載のシステム監視装置。
The transfer substitution unit outputs second transfer success information when detecting the transfer success of the second reset timer instruction,
The filter unit is based on at least one of the first transfer success information and the second transfer success information output when the instruction transfer unit detects the transfer success of the first reset timer instruction. Allow the transmission of the timeout signal,
The system monitoring apparatus according to claim 3.
前記指示受領部は、前記代替指示受領部が前記第2のリセットタイマー指示を受信した場合に、前記指示受領部をリセットする
ことを特徴とする請求項3または4記載のシステム監視装置。
The instruction receiving unit, the alternative when the instruction receiving unit receives the second reset timer instruction, the instruction receiving unit according to claim 3 or 4 SL mounting system monitoring device, characterized in that resetting the.
前記監視プロセッサは、前記タイムアウト信号の発生有無を記憶する発生履歴記憶部と、
前記タイムアウト信号を受け取った際、前記発生履歴記憶部に前記タイムアウト信号の発生有が記憶されている場合に前記タイムアウト信号を出力し、前記発生履歴記憶部に前記タイムアウト信号の発生無が記憶されている場合に自己初期化信号を出力する判定部と、
前記自己初期化信号を受け取って前記監視プロセッサを前記発生履歴記憶部を除いてリセットする自己初期化部と、を更に含む
ことを特徴とする請求項2乃至5のいずれか1項に記載のシステム監視装置。
The monitoring processor includes an occurrence history storage unit that stores presence / absence of occurrence of the timeout signal;
When the time-out signal is received, the time-out signal is output when the time-out signal is generated in the generation history storage unit, and the generation history storage unit stores the occurrence of the time-out signal is not stored. A determination unit that outputs a self-initialization signal when
System according to any one of claims 2 to 5, wherein the further comprising a self-initialization unit that the monitoring processor receives the self-initialization signal for resetting except the occurrence history storage unit, the Monitoring device.
予め定められた時間を計時するとタイムアウト信号を出力するWDTを含むシステム監視装置の監視プロセッサが、前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置が、前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記監視プロセッサに転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力し、前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する
システム監視方法。
A monitoring processor of a system monitoring apparatus including a WDT that outputs a timeout signal when a predetermined time is measured receives a first reset timer instruction that instructs resetting of the WDT, and outputs a reset timer signal to the WDT. ,
The system monitoring apparatus transfers a reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT to the monitoring processor as the first reset timer instruction, and the first reset timer instruction A system monitoring method that outputs information on the first transfer failure when the transfer failure is detected, and prohibits transmission of the timeout signal based on the information on the first transfer failure.
前記システム監視装置は、前記第1のリセットタイマー指示の転送成功を検出した場合に第1の転送成功の情報を出力し、前記第1の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする請求項7記載のシステム監視方法。
The system monitoring device outputs first transfer success information when detecting transfer success of the first reset timer instruction, and transmits the timeout signal based on the first transfer success information. To give permission,
The system monitoring method according to claim 7.
前記監視プロセッサは、前記WDTのリセットを指示する第2のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、前記代替指示に基づいて、前記第2のリセットタイマー指示を転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力し、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止し、前記第2のリセットタイマー指示の転送成功を検出した場合に第2の転送成功の情報を出力し、前記第1の転送成功の情報及び前記第2の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する
ことを特徴とする請求項7または8記載のシステム監視方法。
The monitoring processor receives a second reset timer instruction for instructing reset of the WDT, and outputs a reset timer signal to the WDT;
The system monitoring device outputs an alternative instruction instructing an alternative transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected Then, based on the substitute instruction, the second reset timer instruction is transferred, and when the transfer failure of the second reset timer instruction is detected, the second transfer failure information is output, and the first Based on the transfer failure information and the second transfer failure information, the transmission of the time-out signal is prohibited, and when the transfer success of the second reset timer instruction is detected, the second transfer success information is output. The transmission of the timeout signal is permitted based on the information on the success of the first transfer and the information on the success of the second transfer. System monitoring method described.
前記監視プロセッサは、前記タイムアウト信号の発生有無を記憶し、前記タイムアウト信号を受け取った際、前記タイムアウト信号の発生有が記憶されている場合に前記タイムアウト信号を出力し、前記タイムアウト信号の発生無が記憶されている場合に自己初期化信号を出力し、前記自己初期化信号に基づいて、前記監視プロセッサ自身を前記タイムアウト信号の発生有無の記憶を除いてリセットする
ことを特徴とする請求項8または9記載のシステム監視方法。
The monitoring processor stores whether or not the timeout signal is generated. When the timeout signal is received, the monitoring processor outputs the timeout signal when the occurrence of the timeout signal is stored. 9. A self-initialization signal is output when stored, and the supervisory processor is reset based on the self-initialization signal except for storing whether the time-out signal is generated or not. 9. The system monitoring method according to 9.
JP2011012948A 2011-01-25 2011-01-25 System monitoring apparatus and system monitoring method Expired - Fee Related JP5625949B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011012948A JP5625949B2 (en) 2011-01-25 2011-01-25 System monitoring apparatus and system monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011012948A JP5625949B2 (en) 2011-01-25 2011-01-25 System monitoring apparatus and system monitoring method

Publications (2)

Publication Number Publication Date
JP2012155454A JP2012155454A (en) 2012-08-16
JP5625949B2 true JP5625949B2 (en) 2014-11-19

Family

ID=46837141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011012948A Expired - Fee Related JP5625949B2 (en) 2011-01-25 2011-01-25 System monitoring apparatus and system monitoring method

Country Status (1)

Country Link
JP (1) JP5625949B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59119453A (en) * 1982-12-27 1984-07-10 Fujitsu Ltd Cpu run-away monitoring circuit
JPH06318159A (en) * 1993-05-10 1994-11-15 Nec Shizuoka Ltd Device abnormality detecting system
JP4613019B2 (en) * 2004-03-01 2011-01-12 三菱電機株式会社 Computer system
JP5476238B2 (en) * 2010-07-12 2014-04-23 ルネサスエレクトロニクス株式会社 Semiconductor device

Also Published As

Publication number Publication date
JP2012155454A (en) 2012-08-16

Similar Documents

Publication Publication Date Title
US5870301A (en) System control apparatus including a master control unit and a slave control unit which maintain coherent information
KR100566339B1 (en) Fault-tolerant computer system, re-synchronization method thereof and computer-readable storage medium having re-synchronization program thereof
WO2014161373A1 (en) System fault detection and processing method, device, and computer readable storage medium
JP2004046599A (en) Fault tolerant computer system, its resynchronization method, and resynchronization program
JP2010231340A (en) Computer and failure processing method for the same
WO2015128981A1 (en) Programmable controller system and controller therefor
US10042812B2 (en) Method and system of synchronizing processors to the same computational point
US8230446B2 (en) Providing a computing system with real-time capabilities
JP2006512634A (en) Method and circuit arrangement for synchronizing processing units synchronously or asynchronously clocked
EP2911058B1 (en) Methods and apparatuses for reducing common mode failures of nuclear safety-related software control systems
JP5625949B2 (en) System monitoring apparatus and system monitoring method
KR102438148B1 (en) Abnormality detection apparatus, system and method for detecting abnormality of embedded computing module
JP2012078166A (en) Control device and nuclear power plant control system
JP2010176345A (en) Multi-node system, node, memory dump processing method, and program
JP2010009258A (en) Fault detection device of software
KR20140092132A (en) Method for monitoring os task of twin micom in rtos
JP6187508B2 (en) Control device, bus circuit, method, and program
JP6654662B2 (en) Server device and server system
JP2007265157A (en) System and method for detecting fault of i/o device
JP2006172173A (en) Serial communication device, data communication device, copying machine and multifunction machine
JP4126849B2 (en) Multi-CPU system monitoring method
KR100291097B1 (en) Real-Time Clock-Related Fault Detection Device in Processor Board with Redundancy
US11764771B2 (en) Event detection control device and method for circuit system controlled by pulse wave modulation signal
JP5768434B2 (en) Mutual monitoring system
JP5082147B2 (en) Multi-node system, inter-node switch, and data relay method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140624

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140915

R150 Certificate of patent or registration of utility model

Ref document number: 5625949

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees