JP5625949B2 - System monitoring apparatus and system monitoring method - Google Patents
System monitoring apparatus and system monitoring method Download PDFInfo
- Publication number
- JP5625949B2 JP5625949B2 JP2011012948A JP2011012948A JP5625949B2 JP 5625949 B2 JP5625949 B2 JP 5625949B2 JP 2011012948 A JP2011012948 A JP 2011012948A JP 2011012948 A JP2011012948 A JP 2011012948A JP 5625949 B2 JP5625949 B2 JP 5625949B2
- Authority
- JP
- Japan
- Prior art keywords
- instruction
- transfer
- reset timer
- signal
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、システム監視装置及びシステム監視方法に関し、特にウォッチドッグタイマー機能を用いたシステム監視装置及びシステム監視方法に関する。 The present invention relates to a system monitoring apparatus and a system monitoring method, and more particularly to a system monitoring apparatus and a system monitoring method using a watchdog timer function.
コンピュータシステムの正常動作を監視する装置として、ウォッチドッグタイマー機能を用いた監視装置が、広く採用されている。 As a device for monitoring the normal operation of a computer system, a monitoring device using a watchdog timer function is widely adopted.
この監視装置は、例えば、システム内においてシステム動作とは独立した監視専用のプロセッサ(以後、監視プロセッサと呼ぶ)内部に、ウォッチドッグタイマー(以後、WDT(WatchDog Timer)とも呼ぶ)と呼ばれるタイマーを実装した装置である。 This monitoring device, for example, implements a timer called a watch dog timer (hereinafter also referred to as WDT (Watch Dog Timer)) inside a dedicated processor (hereinafter referred to as a monitoring processor) that is independent of system operation in the system. Device.
WDTは、例えば、常にタイマー値の減算(加算でもよい)を繰り返し、タイマー値が0(予め定められた値でもよい)になったとき、即ちタイムアウトしたとき、タイムアウト信号を出力する。このタイムアウト信号は、監視プロセッサの監視対象であるシステムに対して、NMI(Non−Maskable Interrupt)信号やリセット指示信号として出力される。また、WDTは、リセットを指示する信号を受け取ると、タイマー値を予め定められた値(0でもよい)に再設定する。 For example, the WDT always repeats subtraction (may be addition) of the timer value, and outputs a timeout signal when the timer value becomes 0 (may be a predetermined value), that is, when a time-out occurs. This timeout signal is output as an NMI (Non-Maskable Interrupt) signal or a reset instruction signal to the system to be monitored by the monitoring processor. When the WDT receives a signal instructing resetting, the WDT resets the timer value to a predetermined value (may be 0).
このような監視装置で監視されるシステムは、一定時間(WDTがタイムアウトする時間に比べて十分に短い時間)毎に、監視プロセッサにWDTのリセットを行うことを指示(例えば、システム側から監視プロセッサをポーリング)する。この指示を受けた、監視プロセッサは、WDTにリセットを指示する信号を出力する。従って、システムが正常な場合、WDTは、リセットを指示する信号に基づいて、タイムアウトする前にタイマー値を再設定するため、タイムアウトすることはない。 A system monitored by such a monitoring device instructs the monitoring processor to reset the WDT at a certain time (a time sufficiently shorter than the time when WDT times out) (for example, the monitoring processor from the system side). Polling). Upon receiving this instruction, the monitoring processor outputs a signal instructing the WDT to reset. Therefore, when the system is normal, the WDT resets the timer value before timing out based on a signal instructing resetting, so that the timer does not time out.
このように、WDT機能を使った監視装置は、WDTが常に更新(タイマー値を再設定)され続け、タイムアウトが発生しないことによって、システムが正常動作していることを監視する。 As described above, the monitoring device using the WDT function monitors whether the system is operating normally by continuously updating the WDT (resetting the timer value) and causing no timeout.
特許文献1は、上述のWDT機能を使った監視装置の一例である、ウォッチドッグタイマ制御装置を開示している。 Patent Document 1 discloses a watchdog timer control device which is an example of a monitoring device using the above-described WDT function.
このウォッチドッグタイマ制御装置は、温度監視部とウォッチドッグタイマ部とを有し、以下のように動作する。まず、ウォッチドッグタイマ部は、カウンタを有し、このカウンタの値は一定時間毎に減算される。ウォッチドッグタイマ部は、このカウンタの値が0になると、カウンタ0検出信号を出力する。また、温度監視部は、被監視対象であるCPU(Central Processing Unit)から一定時間毎に受信する要求信号に同期して、ウォッチドッグタイマ部にカウンタ初期設定命令を指令する。 This watchdog timer control device has a temperature monitoring unit and a watchdog timer unit, and operates as follows. First, the watchdog timer unit has a counter, and the value of this counter is subtracted at regular intervals. The watchdog timer unit outputs a counter 0 detection signal when the value of the counter becomes zero. Further, the temperature monitoring unit instructs the counter initial setting command to the watch dog timer unit in synchronization with a request signal received at regular intervals from a CPU (Central Processing Unit) to be monitored.
しかしながら、上述した先行技術文献に記載された技術においては、正常な状態にある被監視対象のシステムに対して、NMI信号やリセット指示信号が発行され、システム運用に支障をきたす場合があるという問題点がある。 However, in the technology described in the above-mentioned prior art documents, there is a problem that an NMI signal or a reset instruction signal is issued to a monitored system in a normal state, which may hinder system operation. There is a point.
その理由は、タイマーのリセットの指示(カウンタ初期設定命令)を受け取るインタフェース上において障害があったり、監視プロセッサ(ウォッチドッグタイマ制御装置)自身の動作に異常があったりすると、タイマーの更新(カウンタの初期設定)が失敗し、WDTがタイムアウトに至ってしまうケースがあるからである。 The reason for this is that if there is a failure on the interface that receives the timer reset instruction (counter initial setting command) or if the monitoring processor (watchdog timer control device) operates abnormally, the timer is updated (counter This is because there is a case where the initial setting) fails and the WDT times out.
本発明の目的は、上述した問題点を解決するシステム監視装置及びシステム監視方法を提供することにある。 An object of the present invention is to provide a system monitoring apparatus and a system monitoring method that solve the above-described problems.
本発明のシステム監視装置は、予め定められた時間を計時するとタイムアウト信号を出力するWDTと、
前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する指示受領部と、を含む監視プロセッサと、
前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記指示受領部に転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力する指示転送部と、
前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止するフィルタ部と、を有する。
The system monitoring apparatus of the present invention includes a WDT that outputs a time-out signal when measuring a predetermined time;
An instruction receiving unit that receives a first reset timer instruction for instructing resetting of the WDT and outputs a reset timer signal to the WDT;
A reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT is transferred to the instruction receiving unit as the first reset timer instruction, and a transfer failure of the first reset timer instruction is detected. An instruction transfer unit that outputs information on the first transfer failure when
And a filter unit that prohibits transmission of the timeout signal based on the information on the first transfer failure.
本発明のシステム監視方法は、予め定められた時間を計時するとタイムアウト信号を出力するWDTを含むシステム監視装置の監視プロセッサが、前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置が、前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記監視プロセッサに転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力し、前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する。
In the system monitoring method of the present invention, a monitoring processor of a system monitoring apparatus including a WDT that outputs a time-out signal when measuring a predetermined time receives a first reset timer instruction that instructs resetting of the WDT, Output reset timer signal to WDT,
The system monitoring apparatus transfers a reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT to the monitoring processor as the first reset timer instruction, and the first reset timer instruction When the first transfer failure is detected, the first transfer failure information is output, and the transmission of the timeout signal is prohibited based on the first transfer failure information.
本発明は、被監視対象のシステムが正常な状態にあるにもかかわらず、WDTのタイムアウトが発生し、システム運用に支障をきたすことを防止することが可能になるという効果がある。 The present invention has an effect that it is possible to prevent a system operation from being hindered due to a time-out of WDT even though the system to be monitored is in a normal state.
次に、本発明の実施形態について図面を参照して詳細に説明する。 Next, embodiments of the present invention will be described in detail with reference to the drawings.
[第1の実施の形態]
図1は、本発明の第1の実施形態に係るシステム監視装置100の構成を示すブロック図である。
[First Embodiment]
FIG. 1 is a block diagram showing a configuration of a
図1を参照すると、本実施形態に係るシステム監視装置100は、指示転送部130とフィルタ部170と監視プロセッサ500とを含む。
Referring to FIG. 1, the
図2は、システム監視装置100とシステム監視装置100の監視対象であるコンピュータシステム101とを含む、システムの構成を示すブロック図である。図2を参照すると、コンピュータシステム101は、リセットタイマー指示発行部102とシステム制御コントローラ103とを含む。
FIG. 2 is a block diagram showing a system configuration including the
尚、システム監視装置100は、コンピュータシステム101に含まれていてもよく、指示転送部130やフィルタ部170は、コンピュータシステム101のシステム制御コントローラ103に含まれていてもよい。
The
システム監視装置100において、指示転送部130は、リセットタイマー指示発行部102から発行される、WDT550の計時のリセットを指示する、リセットタイマー指示600を受け取る。続けて、指示転送部130は、受け取ったリセットタイマー指示600を第1のリセットタイマー指示601として指示受領部530に転送する。また、指示転送部130は、リセットタイマー指示601の転送が失敗したことを検出した場合に、フィルタオン信号621(第1の転送失敗の情報とも呼ばれる)を出力する。
In the
指示転送部130と指示受領部530との間のインタフェースは、例えば、ハードウェア監視するための標準インタフェースであるIPMI(Intelligent Platform Management Interface)のKCS(Keyboard Controller Style)インタフェースである。
The interface between the
フィルタ部170は、指示転送部130が出力するフィルタオン信号621に基づいて、タイムアウト信号611の伝達(通過)を禁止する。尚、フィルタ部170は、タイムアウト信号611の伝達を禁止しない場合は、タイムアウト信号611に基づいて、タイムアウト信号612を出力する。タイムアウト信号611及びタイムアウト信号612は、例えば「論理1」でタイムアウトが発生したことを示す。即ち、タイムアウト信号611を出力する、及びタイムアウト信号612を出力するとは、それぞれ、タイムアウト信号611を「論理1」にする、及びタイムアウト信号612を「論理1」にすることである。尚、タイムアウト信号611及びタイムアウト信号612は、他の形態(例えばパルス)であってもよい。
The
監視プロセッサ500は、指示受領部530とWDT550とを含む。
The
指示受領部530は、リセットタイマー指示601を受信し、WDT550にリセットタイマー信号602を出力する。リセットタイマー信号602は、例えば「論理1」のパルスである。尚、リセットタイマー信号は、他の形態(例えば「論理0」のパルス)であってもよい。
The
WDT550は、予め定められた時間(以下、タイムアウト時間と呼ぶ)を計時するとタイムアウト信号611を出力する。また、WDT550は、リセットタイマー信号602を受け取ると、その時点の計時時間をリセットし、タイムアウト時間の計時を最初からやり直す。タイムアウト時間は、例えば、リセットタイマー指示発行部102がリセットタイマー指示600を発行する間隔の時間(以後、リセットタイマー間隔時間と呼ぶ)の2倍の時間である。尚、タイムアウト時間は、リセットタイマー間隔時間の変動やリセットタイマー指示の転送遅延を考慮した、リセットタイマー信号602が出力される間隔を越えていれば任意の時間でよい。
The WDT 550 outputs a
コンピュータシステム101において、リセットタイマー指示発行部102は、予め定められたタイミングでリセットタイマー指示600を発行する。予め定められたタイミングとは、例えば、コンピュータシステム101が正常な状態において定期的に実行する処理を実行するタイミングである。この処理の実行間隔が、上述のリセットタイマー間隔時間となる。
In the
システム制御コントローラ103は、タイムアウト信号612を受け取り、これに基づいて、例えば、コンピュータシステム101のリセット処理やメモリダンプ処理を開始する。
The
図3は、フィルタ部170の構成を示すブロック図である。図3は、タイムアウト信号611及びタイムアウト信号612が「論理1」でタイムアウトが発生したことを示す信号、及び、後述のフィルタオン信号621が「論理1」でフィルタをオンにする(即ち、タイムアウト信号611の伝達を禁止するようにする)ことを指示する信号である場合の、フィルタ部170を示す。
FIG. 3 is a block diagram illustrating a configuration of the
図3を参照すると、フィルタ部170は、アンド素子171と、インバータ素子172とを有している。
Referring to FIG. 3, the
インバータ素子172は、フィルタオン信号621の論理を反転してアンド素子171に出力する。
The
アンド素子171は、反転したフィルタオン信号621とタイムアウト信号611との論理積を、タイムアウト信号612として出力する。
The AND
次に、本実施形態の動作を図1〜5を参照して、以下の前提に基づいて、詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to FIGS.
WDT550のタイムアウト時間は、4秒である。
The timeout time of
リセットタイマー指示発行部102は、2秒間隔でリセットタイマー指示600を発行する。尚、リセットタイマー指示600の発行間隔は、被監視システムの動作状態によって正常時においても変動するが、ここでは理解を容易にするため、一定間隔であるものとする。前提は以上である。
The reset timer
まず、システム監視装置100が正常な場合について説明する。
First, a case where the
図4は、本実施形態の指示転送部130の動作を示すフローチャートである。
FIG. 4 is a flowchart showing the operation of the
図5は、本実施形態の監視プロセッサ500の動作を示すフローチャートである。
FIG. 5 is a flowchart showing the operation of the
コンピュータシステム101の状態が正常である場合、リセットタイマー指示発行部102は、2秒間隔でリセットタイマー指示600を発行する。
When the state of the
図4において、指示転送部130は、このリセットタイマー指示600を受け取る(S701)。
In FIG. 4, the
次に、指示転送部130は、受け取ったリセットタイマー指示600に基づいて監視プロセッサ500の指示受領部530にリセットタイマー指示601を送信する(S702)。具体的には、リセットタイマー指示601の送信は、例えば、指示転送部130が指示受領部530にリセットタイマー指示601を含むコマンドを送信し、指示受領部530が指示転送部130に受信応答を送信する。
Next, the
次に、指示転送部130は、受信応答を待つ(S703)。予め定められた時間(例えば、1ミリ秒)以内に受信応答を受信した場合(S703でYES)、処理は終了する。
Next, the
図5において、指示受領部530は、リセットタイマー指示601を受信し、これに基づいてWDT550にリセットタイマー信号602を出力する(S711)。
In FIG. 5, the
次に、WDT550は、リセットタイマー信号602を受け取り、これに基づいて計時時間をリセットする(S712)。そして、WDT550は、タイムアウト時間の計時を最初からやり直す。
Next, the
コンピュータシステム101及びシステム監視装置100が正常である場合、上述の処理が繰り返される。
When the
コンピュータシステム101の状態が異常(例えば、プログラムが暴走し、ストール状態である)である場合、リセットタイマー指示発行部102は、リセットタイマー指示600を発行しなくなる。従って、指示受領部530は、リセットタイマー信号602を出力しなくなる。
When the state of the
このため、WDT550は、計時時間をリセットしないで、計時を継続する。その結果、計時時間がタイムアウト時間(4秒)に達する。WDT550は、計時時間がタイムアウト時間に達すると、タイムアウト信号611を「論理1」にする。
For this reason, the
次に、フィルタ部170は、「論理1」のタイムアウト信号611を入力される。この時、フィルタオン信号621は「論理0(フィルタオン信号621が出力されていない)」である。従って、フィルタ部170は、「論理0」のフィルタオン信号621を反転した信号「論理1」と論理積を取り、タイムアウト信号612を「論理1」にする(タイムアウト信号612を出力する)。
Next, the
次に、指示転送部130から指示受領部530まで間のいずれかで障害が発生した場合を説明する。
Next, a case where a failure occurs anywhere from the
コンピュータシステム101の状態は正常であり、リセットタイマー指示発行部102は、2秒間隔でリセットタイマー指示600を発行する。
The state of the
次に、指示転送部130は、リセットタイマー指示600を受け取り(S701)、これに基づいて監視プロセッサ500の指示受領部530にリセットタイマー指示601を送信する(S702)。
Next, the
次に、指示転送部130は、受信応答を待つ(S703)。しかし、上述の障害のため、指示受領部530は、リセットタイマー指示601を含むコマンドを受信できず、受信応答を送信しない。
Next, the
予め定められた時間(例えば、1ミリ秒)以内に受信応答を受信しなかった場合(S703でNO)、指示転送部130は、リセットタイマー指示601の転送が失敗したことを検出する(S704)。
When the reception response is not received within a predetermined time (for example, 1 millisecond) (NO in S703), the
次に、指示転送部130は、リセットタイマー指示601の転送失敗を検出したことに基づいて、フィルタオン信号621を「論理1」にする(S705)。
Next, the
フィルタ部170は、入力された「論理1」のフィルタオン信号621に基づいて、タイムアウト信号611の伝達を禁止する。
The
一方、指示受領部530は、リセットタイマー指示601を受け取れないため、リセットタイマー信号602の出力を行わない。
On the other hand, the
このため、WDT550は、計時時間をリセットしないで、計時を継続する。その結果、計時時間がタイムアウト時間に達する。WDT550は、計時時間がタイムアウト時間(4秒)に達すると、タイムアウト信号611を「論理1」にする。
For this reason, the
次に、フィルタ部170は、「論理1」のタイムアウト信号611を入力されるが、「論理1」のフィルタオン信号621を反転した「論理0」信号と論理積を取り、タイムアウト信号612は論理「0」のままとする(タイムアウト信号612を出力しない)。
Next, the
以上が、本実施形態の動作の説明である。 The above is the description of the operation of the present embodiment.
尚、指示転送部130は、フィルタオン信号621を「論理1」にした状態において、リセットタイマー指示601の転送が成功した場合、フィルタオン信号621を「論理0」(第1の転送成功の情報とも呼ばれる)にするようにしてもよい。即ち、指示転送部130は、指示転送部130から指示受領部530までのいずれかで発生した障害が復旧した場合、タイムアウト信号611の伝達を許可するようにしてもよい。
The
また、指示転送部130は、転送がn(nは自然数)回以上失敗した場合に、タイムアウト信号611の伝達を禁止するようにしてもよい。この場合、タイムアウト時間は、リセットタイマー間隔時間のn倍以上である。
Further, the
上述した本実施形態における第1の効果は、被監視対象のシステムが正常な状態にあるにもかかわらず、WDT550のタイムアウトが発生し、システム運用に支障をきたすことを防止することが可能になる点である。
The first effect of the present embodiment described above is that it is possible to prevent a time-out of the
その理由は、指示転送部130が、リセットタイマー指示601の転送失敗を検出し、フィルタ部170が、その転送失敗の情報に基づいて、タイムアウト信号611の伝達を禁止するようにしたからである。
This is because the
上述した本実施形態における第2の効果は、システム監視装置100による監視機能が有効でない期間を短縮できることである。
The 2nd effect in this embodiment mentioned above is that the period when the monitoring function by the
その理由は、指示転送部130が、リセットタイマー指示601の転送が成功した場合に、タイムアウト信号611の伝達を許可するようにしたからである。
The reason is that the
[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
図6は、本発明の第2の実施形態に係るシステム監視装置200の構成を示すブロック図である。 FIG. 6 is a block diagram showing the configuration of the system monitoring apparatus 200 according to the second embodiment of the present invention.
図6を参照すると、本実施形態に係るシステム監視装置200は、指示転送部230と転送代替部240とフィルタ部270と監視プロセッサ502とを含む。
Referring to FIG. 6, the system monitoring apparatus 200 according to the present embodiment includes an
以下の説明では、図2を、図中のシステム監視装置100をシステム監視装置200と読み替えて、本実施形態のシステム監視装置200とシステム監視装置200の監視対象であるコンピュータシステム101とを含む、システムの構成を示すブロック図として参照する。
In the following description, FIG. 2 includes the system monitoring apparatus 200 of the present embodiment and the
システム監視装置200の指示転送部230は、第1の実施形態の指示転送部130の機能に加えて、リセットタイマー指示601の転送が失敗した場合、リセットタイマー指示601の代わりにリセットタイマー指示(第2のリセットタイマー指示とも呼ばれる)604を代替転送することを指示する、代替指示603を転送代替部240に出力する。
In addition to the function of the
転送代替部240は、代替指示603に基づいて、リセットタイマー指示604を代替指示受領部540に転送する。また、転送代替部240は、リセットタイマー指示604の転送が失敗したことを検出した場合に、フィルタオン信号622(第2の転送失敗の情報とも呼ばれる)を出力する。転送代替部240と代替指示受領部540との間のインタフェースは、例えば、LAN(Local Area Network)経由でIPMIによる制御を行うIPMI Over Lanである。
The
フィルタ部270は、指示転送部230が検出した第1の転送失敗の情報、及び転送代替部240が出力した第2の転送失敗の情報に基づいて、タイムアウト信号611の伝達を禁止する。
The
監視プロセッサ502は、第1の実施形態の監視プロセッサ500に比べて、代替指示受領部540を更に含み、WDT550の動作が異なる。
The
代替指示受領部540は、リセットタイマー指示604を受信し、WDT550にリセットタイマー信号605を出力する。リセットタイマー信号605は、例えば「論理1」のパルスである。尚、リセットタイマー信号は、他の形態(例えば「論理0」のパルス)であってもよい。
The substitute
WDT550は、リセットタイマー信号602またはリセットタイマー信号605を受け取ると、その時点の計時時間をリセットし、タイムアウト時間の計時を最初からやり直す。この点が、第1の実施形態のWDT550と異なる。
When the
図7は、フィルタ部270の構成を示すブロック図である。図7は、タイムアウト信号611、タイムアウト信号612及びフィルタオン信号621は、第1の実施形態の信号と同様あり、後述のフィルタオン信号622が「論理1」でフィルタをオンにすることを指示する場合の、フィルタ部270を示す。
FIG. 7 is a block diagram illustrating a configuration of the
図7を参照すると、フィルタ部270は、アンド素子171と、ナンド素子273とを有している。
Referring to FIG. 7, the
ナンド素子273は、フィルタオン信号621とフィルタオン信号622の論理積を反転した信号を、アンド素子171に出力する。
The
アンド素子171は、ナンド素子273の出力とタイムアウト信号611との論理積を、タイムアウト信号612として出力する。
The AND
次に、本実施形態の動作を図6〜9を参照して、詳細に説明する。尚、前提は第1の実施形態の場合と同じである。 Next, the operation of the present embodiment will be described in detail with reference to FIGS. The premise is the same as that in the first embodiment.
まず、システム監視装置200が正常な場合の動作は、第1の実施形態で説明した動作と同じである。 First, the operation when the system monitoring apparatus 200 is normal is the same as the operation described in the first embodiment.
次に、指示転送部230から指示受領部530まで間のいずれかで障害が発生した場合を説明する。
Next, a case where a failure has occurred anywhere between the
図8は、本実施形態の指示転送部230及び転送代替部240の動作を示すフローチャートである。S701〜S705の動作は、第1の実施形態で説明した動作と同じである。
FIG. 8 is a flowchart showing the operations of the
図9は、本実施形態の監視プロセッサ502の動作を示すフローチャートである。
FIG. 9 is a flowchart showing the operation of the
図8において、指示転送部230は、リセットタイマー指示601の転送失敗を検出したことに基づいて、代替指示603を出力する(S721)。
In FIG. 8, the
尚、フィルタ部270は、ステップS705において、「論理1」のフィルタオン信号621を入力される。しかし、フィルタ部270は、フィルタオン信号622が「論理0」であるため、タイムアウト信号611の伝達を禁止しない。
Note that the
一方、指示受領部530は、リセットタイマー指示601を受け取れないため、リセットタイマー信号602の出力を行わない。
On the other hand, the
次に、転送代替部240は、代替指示603に基づいて、代替指示受領部540にリセットタイマー指示604を送信する(S722)。具体的には、リセットタイマー指示604の送信は、例えば、転送代替部240が代替指示受領部540にリセットタイマー指示604を含むコマンドを送信し、代替指示受領部540が転送代替部240に受信応答を送信する。
Next, the
次に、転送代替部240は、受信応答を待つ(S723)。予め定められた時間(例えば、2ミリ秒)以内に受信応答を受信した場合(S723でYES)、処理は終了する。
Next, the
図9において、代替指示受領部540は、リセットタイマー指示604を受信し、これに基づいてWDT550にリセットタイマー信号605を出力する(S731)。
In FIG. 9, the substitute
次に、WDT550は、リセットタイマー信号605を受け取り、これに基づいて計時時間をリセット(S732)。そして、WDT550は、タイムアウト時間の計時を最初からやり直す。
Next, the
次に、上述の指示転送部230から指示受領部530まで間のいずれかで障害が発生した場合において、更に転送代替部240から代替指示受領部540までの間のいずれかで障害が発生した場合について説明する。
Next, when a failure occurs between any of the above-described
転送代替部240は、代替指示603に基づいて、代替指示受領部540にリセットタイマー指示604を送信する(S722)。
The
次に、転送代替部240は、受信応答を待つ(S723)。しかし、上述の障害のため、代替指示受領部540は、リセットタイマー指示604を含むコマンドを受信できず、受信応答を送信しない。
Next, the
予め定められた時間(例えば、1ミリ秒)以内に受信応答を受信しなかった場合(S703でNO)、転送代替部240は、リセットタイマー指示604の転送が失敗したことを検出する(S724)。
When the reception response is not received within a predetermined time (for example, 1 millisecond) (NO in S703), the
次に、転送代替部240は、リセットタイマー指示601の転送失敗を検出したことに基づいて、フィルタオン信号622を「論理1」にする(S725)。
Next, the
一方、代替指示受領部540は、リセットタイマー指示604を受け取れないため、リセットタイマー信号602の出力を行わない。また、上述の通り、指示受領部530も、リセットタイマー指示601を受け取れないため、リセットタイマー信号602の出力を行わない。
On the other hand, the substitute
このため、WDT550は、計時時間をリセットしないで、計時を継続する。その結果、計時時間がタイムアウト時間に達する。WDT550は、計時時間がタイムアウト時間(4秒)に達すると、タイムアウト信号611を「論理1」にする。
For this reason, the
次に、フィルタ部270は、「論理1」のタイムアウト信号611を入力されるが、「論理1」のフィルタオン信号621と「論理1」のフィルタオン信号622との論理積を反転した「論理0」信号と論理積を取り、タイムアウト信号612は論理「0」のままとする(タイムアウト信号612を出力しない)。
Next, the
以上が、本実施形態の動作の説明である。 The above is the description of the operation of the present embodiment.
尚、転送代替部240は、フィルタオン信号622を「論理1」にした状態において、リセットタイマー指示604の転送が成功した場合、フィルタオン信号622を「論理0」(第2の転送成功の情報とも呼ばれる)にするようにしてもよい。即ち、転送代替部240は、転送代替部240から代替指示受領部540までのいずれかで発生した障害が復旧した場合、タイムアウト信号611の伝達を許可するようにしてもよい。
When the transfer of the
また、指示転送部230は、転送がn(nは自然数)回以上失敗した場合に、タイムアウト信号611の伝達を禁止するように、及び代替指示603を出すようにしてもよい。また、転送代替部240は、転送がn(nは自然数)回以上失敗した場合に、タイムアウト信号611の伝達を禁止するようにしてもよい。この場合、タイムアウト時間は、リセットタイマー間隔時間のn倍以上である。
In addition, the
上述した本実施形態における第1の効果は、第1の実施形態の効果に加えて、指示転送部230から指示受領部530までのいずれかで障害が発生した場合でも、システム監視装置200の監視機能を有効にしておくことが可能になる点である。
The first effect of the present embodiment described above is that, in addition to the effect of the first embodiment, even if a failure occurs in any of the
その理由は、指示転送部230がリセットタイマー指示601の転送を失敗した場合、転送代替部240がリセットタイマー指示604を転送するようにしたからである。
The reason is that, when the
上述した本実施形態における第2の効果は、システム監視装置200による監視機能が有効でない期間を更に短縮できることである。 The second effect of the present embodiment described above is that the period during which the monitoring function by the system monitoring apparatus 200 is not valid can be further shortened.
その理由は、転送代替部240が、リセットタイマー指示604の転送が成功した場合にフィルタオン信号622を「論理0」にするようにしたからである。
This is because the
[第3の実施の形態]
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
[Third Embodiment]
Next, a third embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
図10は、本発明の第3の実施形態に係るシステム監視装置300の構成を示すブロック図である。 FIG. 10 is a block diagram showing a configuration of a system monitoring apparatus 300 according to the third embodiment of the present invention.
図10を参照すると、本実施形態に係るシステム監視装置300は、指示転送部130とフィルタ部170と監視プロセッサ503とを含む。
Referring to FIG. 10, the system monitoring apparatus 300 according to the present embodiment includes an
以下の説明では、図2を、図中のシステム監視装置100をシステム監視装置300に読み替えて、本実施形態のシステム監視装置300とシステム監視装置300の監視対象であるコンピュータシステム101とを含む、システムの構成を示すブロック図として参照する。
In the following description, FIG. 2 includes the system monitoring apparatus 300 of this embodiment and the
システム監視装置300の指示転送部130は、第1の実施形態の指示転送部130と同じものである。更に、本実施形態において、指示転送部130は、フィルタオン信号621を「論理1」にした状態において、リセットタイマー指示601の転送が成功した場合、フィルタオン信号621を「論理0」にする。即ち、指示転送部130は、指示転送部130から指示受領部530までのいずれかで発生した障害が復旧した場合、タイムアウト信号611の伝達を許可する。
システム監視装置300のフィルタ部170は、第1の実施形態のフィルタ部170と同じものである。
The
The
監視プロセッサ503は、指示受領部530とWDT550と判定部510と発生履歴記憶部520と自己初期化部590とを含む。
The
指示受領部530及びWDT550は、第1の実施形態の指示受領部530及びWDT550と同じものである。
The
発生履歴記憶部520は、タイムアウト信号611の発生有無を記憶する。発生履歴記憶部520は、システム監視装置300の初期状態(例えば、システム監視装置300電源を投入された直後)においては、タイムアウトの発生無を記憶している。
The occurrence
判定部510は、タイムアウト信号611を受け取り、発生履歴記憶部520にタイムアウト信号611の発生有が記憶されている場合にタイムアウト信号613を出力する。また、判定部510は、発生履歴記憶部520にタイムアウト信号611の発生無が記憶されている場合、発生履歴記憶部520にタイムアウト信号611の発生有を記録し、自己初期化信号614を出力する。
The determination unit 510 receives the
自己初期化部590は、自己初期化信号614を受け取った場合、監視プロセッサ503自身を、発生履歴記憶部520を除いて、リセットする。
When the self-
次に、本実施形態の動作を図10及び11を参照して、詳細に説明する。本実施形態は、第1の実施形態に比べて、判定部510、発生履歴記憶部520及び自己初期化部590が追加されており、この追加された部分に関連する動作が異なる。以下では、主に、この異なる動作について説明する。
Next, the operation of this embodiment will be described in detail with reference to FIGS. The present embodiment is different from the first embodiment in that a determination unit 510, an occurrence
図11は、WDT550がタイムアウト信号611を「論理1」にした場合の監視プロセッサ503の動作を示すフローチャートである。
FIG. 11 is a flowchart showing the operation of the
まず、判定部510は、タイムアウト信号611が「論理1」になったことを検出する(S741)。
First, the determination unit 510 detects that the
次に、判定部510は、発生履歴記憶部520がタイムアウト発生有を記憶しているか否かを確認する(S742)。
Next, the determination unit 510 checks whether or not the occurrence
発生履歴記憶部520がタイムアウト発生無を記憶している場合(S742でNO)、判定部510は、発生履歴記憶部520にタイムアウト発生有を記録する(S743)。続けて、判定部510は、自己初期化部590に自己初期化信号614を出力する(S744)。
When the occurrence
発生履歴記憶部520がタイムアウト発生有を記憶している場合(S742でYES)、判定部510は、フィルタ部170にタイムアウト信号613を出力する(S745)。 上述した本実施形態における効果は、第1の実施形態の効果に加えて、監視プロセッサ503の障害を自動復旧することが可能になる点である。
When the occurrence
その理由は、最初のタイムアウトが発生した場合に、判定部510が自己初期化部590に自己初期化信号614を出力し、自己初期化部590が監視プロセッサ503を初期化するようにしたからである。
The reason is that when the first timeout occurs, the determination unit 510 outputs a self-
[第4の実施形態]
次に、本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
[Fourth Embodiment]
Next, a fourth embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
図12は、本発明の第4の実施形態に係るシステム監視装置400の構成を示すブロック図である。 FIG. 12 is a block diagram showing a configuration of a system monitoring apparatus 400 according to the fourth embodiment of the present invention.
図12を参照すると、本実施形態に係るシステム監視装置400は、指示転送部230と転送代替部240とフィルタ部270と監視プロセッサ504とを含む。
Referring to FIG. 12, the system monitoring apparatus 400 according to the present embodiment includes an
本実施形態のシステム監視装置400は、第2の実施形態のシステム監視装置200と比べて、監視プロセッサ502の指示受領部530が、監視プロセッサ504の指示受領部534に置き換えられている。
In the system monitoring apparatus 400 of this embodiment, the
指示受領部534は、リセットタイマー信号605を受け取ると、自身をリセットする。
Upon receiving the
上述した本実施形態における効果は、第2の実施形態の効果に加えて、指示受領部530の障害を自動復旧することが可能になる点である。
The effect of the present embodiment described above is that the failure of the
その理由は、指示受領部534がリセットタイマー信号605を受け取ると、自身をリセットするようにしたからである。
The reason is that when the instruction receiving unit 534 receives the
尚、上述の各実施形態は、任意に組み合わされてよい。 The above-described embodiments may be arbitrarily combined.
上述の各実施形態及び任意の実施形態を組み合わせた実施形態は、高可用性を求められるシステムに適したシステム監視装置及びシステム監視方法を提供することができる。その理由は、転送代替部が単一障害(リセットタイマー指示601の転送不可障害)によるWDTのタイムアウトを防止し、フィルタ部がシステム監視装置の障害によるWDTのタイムアウトをシステムに影響させないようにしたからである。 Embodiments combining the above-described embodiments and arbitrary embodiments can provide a system monitoring apparatus and a system monitoring method suitable for a system that requires high availability. The reason is that the transfer substitution unit prevents the WDT time-out due to a single failure (failure of transfer of the reset timer instruction 601), and the filter unit prevents the WDT time-out due to the failure of the system monitoring device from affecting the system. It is.
また、これらの実施形態は、システムの監視不可時間を低減すること、及び、保守介入の抑制によるシステムダウン時間を低減することを可能にする。その理由は、判定部と自己初期化部が監視プロセッサを自己復旧させ、代替指示受領部と指示受領部とが指示受領部を自己復旧させるようにしたからである。 These embodiments also reduce system downtime and system downtime due to reduced maintenance intervention. The reason is that the determination unit and the self-initialization unit self-recover the monitoring processor, and the substitute instruction receiving unit and the instruction receiving unit self-recover the instruction receiving unit.
以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されたり、1つの構成要素が複数のモジュールで実現されたりしてもよい。また、各構成要素は、ある構成要素が他の構成要素の一部であったり、ある構成要素の一部と他の構成要素の一部とが重複していたり、といったような構成であってもよい。 Each component described in each of the above embodiments does not necessarily have to be individually independent. For example, in each component, a plurality of components may be realized as one module, or one component may be realized as a plurality of modules. Each component is configured such that a component is a part of another component, or a part of a component overlaps a part of another component. Also good.
また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。 Further, in each of the embodiments described above, a plurality of operations are described in order in the form of a flowchart, but the described order does not limit the order in which the plurality of operations are executed. For this reason, when each embodiment is implemented, the order of the plurality of operations can be changed within a range that does not hinder the contents.
更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよい。 Furthermore, in each embodiment described above, a plurality of operations are not limited to being executed at different timings. For example, another operation may occur during the execution of a certain operation, or the execution timing of a certain operation and another operation may partially or entirely overlap.
更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作の全ての関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更されて良い。 Furthermore, in each of the embodiments described above, a certain operation is described as a trigger for another operation, but the description does not limit all relationships between the certain operation and the other operations. For this reason, when each embodiment is implemented, the relationship between the plurality of operations can be changed within a range that does not hinder the contents. The specific description of each operation of each component does not limit each operation of each component. For this reason, each specific operation | movement of each component may be changed in the range which does not cause trouble with respect to a functional, performance, and other characteristic in implementing each embodiment.
尚、以上説明した各実施形態における各構成要素は、必要に応じ可能であれば、ハードウェアで実現されても良いし、ソフトウェアで実現されても良いし、ハードウェアとソフトウェアの混在により実現されても良い。 Each component in each embodiment described above may be realized by hardware, software, or a mixture of hardware and software, if necessary. May be.
また、各構成要素の物理的な構成は、以上の実施形態の記載に限定されることはなく、独立して存在しても良いし、組み合わされて存在しても良いしまたは分離して構成されても良い。 Further, the physical configuration of each component is not limited to the description of the above embodiment, and may exist independently, may exist in combination, or may be configured separately. May be.
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
予め定められた時間を計時するとタイムアウト信号を出力するウォッチドッグタイマー(WDT、WatchDog Timer)と、
前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する指示受領部と、を含む監視プロセッサと、
前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記指示受領部に転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力する指示転送部と、
前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止するフィルタ部と、
を有するシステム監視装置。
(付記2)
前記指示転送部は、前記第1のリセットタイマー指示の転送成功を検出した場合に第1の転送成功の情報を出力し、
前記フィルタ部は、前記第1の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする付記1記載のシステム監視装置。
(付記3)
前記監視プロセッサは、前記WDTのリセットを指示する第2のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する代替指示受領部を更に含み、
前記指示転送部は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、
前記代替指示に基づいて、前記第2のリセットタイマー指示を前記代替指示受領部に転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力する転送代替部を更に含み、
前記フィルタ部は、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する、
ことを特徴とする付記1または2記載のシステム監視装置。
(付記4)
前記転送代替部は、前記第2のリセットタイマー指示の転送成功を検出した場合に第2の転送成功の情報を出力し、
前記フィルタ部は、前記第1の転送成功の情報及び前記第2の転送成功の情報の少なくとも一方に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする付記3記載のシステム監視装置。
(付記5)
前記監視プロセッサは、前記タイムアウト信号の発生有無を記憶する発生履歴記憶部と、
前記タイムアウト信号を受け取った際、前記発生履歴記憶部に前記タイムアウト信号の発生有が記憶されている場合に前記タイムアウト信号を出力し、前記発生履歴記憶部に前記タイムアウト信号の発生無が記憶されている場合に自己初期化信号を出力する判定部と、
前記自己初期化信号を受け取って前記監視プロセッサを前記発生履歴記憶部を除いてリセットする自己初期化部と、を更に含む
ことを特徴とする付記2乃至4のいずれかに記載のシステム監視装置。
(付記6)
前記指示受領部は、前記代替指示受領部が第2のリセットタイマー指示を受信した場合に、前記指示受領部をリセットする
ことを特徴とする付記3乃至5のいずれかに記載のシステム監視装置。
(付記7)
予め定められた時間を計時するとタイムアウト信号を出力するWDTを含むシステム監視装置の監視プロセッサが、前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置が、前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記監視プロセッサに転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力し、前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する
システム監視方法。
(付記8)
前記システム監視装置は、前記第1のリセットタイマー指示の転送成功を検出した場合に第1の転送成功の情報を出力し、前記第1の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする付記7記載のシステム監視方法。
(付記9)
前記監視プロセッサは、前記WDTのリセットを指示する第2のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力し、
前記システム監視装置は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、前記代替指示に基づいて、前記第2のリセットタイマー指示を転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力し、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する
ことを特徴とする付記7または8記載のシステム監視方法。
(付記10)
前記システム監視装置は、前記第2のリセットタイマー指示の転送成功を検出した場合に第2の転送成功の情報を出力し、前記第1の転送成功の情報及び前記第2の転送成功の情報の少なくとも一方に基づいて、前記タイムアウト信号の伝達を許可する
ことを特徴とする付記7乃至9のいずれかに記載のシステム監視方法。
(付記11)
前記監視プロセッサは、前記タイムアウト信号の発生有無を記憶し、前記タイムアウト信号を受け取った際、前記タイムアウト信号の発生有が記憶されている場合に前記タイムアウト信号を出力し、前記タイムアウト信号の発生無が記憶されている場合に自己初期化信号を出力し、前記自己初期化信号に基づいて、前記監視プロセッサ自身を前記タイムアウト信号の発生有無の記憶を除いてリセットする
ことを特徴とする付記8乃至10のいずれかに記載のシステム監視方法。
A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.
(Appendix 1)
A watchdog timer (WDT, WatchDog Timer) that outputs a time-out signal when measuring a predetermined time;
An instruction receiving unit that receives a first reset timer instruction for instructing resetting of the WDT and outputs a reset timer signal to the WDT;
A reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT is transferred to the instruction receiving unit as the first reset timer instruction, and a transfer failure of the first reset timer instruction is detected. An instruction transfer unit that outputs information on the first transfer failure when
A filter unit for prohibiting transmission of the timeout signal based on the information on the first transfer failure;
A system monitoring device.
(Appendix 2)
The instruction transfer unit outputs information on the first transfer success when the transfer success of the first reset timer instruction is detected,
The filter unit permits transmission of the timeout signal based on the first transfer success information;
The system monitoring apparatus according to claim 1, wherein
(Appendix 3)
The monitoring processor further includes an alternative instruction receiving unit that receives a second reset timer instruction that instructs to reset the WDT and outputs a reset timer signal to the WDT,
The instruction transfer unit outputs a substitute instruction for instructing a substitute transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected. And
Based on the substitution instruction, the second reset timer instruction is transferred to the substitution instruction receiving unit, and a second transfer failure information is output when a transfer failure of the second reset timer instruction is detected. Further including an alternative part,
The filter unit prohibits transmission of the timeout signal based on the information on the first transfer failure and the information on the second transfer failure.
The system monitoring apparatus according to appendix 1 or 2, characterized in that:
(Appendix 4)
The transfer substitution unit outputs second transfer success information when detecting the transfer success of the second reset timer instruction,
The filter unit permits transmission of the timeout signal based on at least one of the first transfer success information and the second transfer success information.
The system monitoring device according to supplementary note 3, characterized by:
(Appendix 5)
The monitoring processor includes an occurrence history storage unit that stores presence / absence of occurrence of the timeout signal;
When the time-out signal is received, the time-out signal is output when the time-out signal is generated in the generation history storage unit, and the generation history storage unit stores the occurrence of the time-out signal is not stored. A determination unit that outputs a self-initialization signal when
The system monitoring apparatus according to any one of appendices 2 to 4, further comprising: a self-initialization unit that receives the self-initialization signal and resets the monitoring processor except for the occurrence history storage unit.
(Appendix 6)
The system monitoring device according to any one of appendices 3 to 5, wherein the instruction receiving unit resets the instruction receiving unit when the substitute instruction receiving unit receives a second reset timer instruction.
(Appendix 7)
A monitoring processor of a system monitoring apparatus including a WDT that outputs a timeout signal when a predetermined time is measured receives a first reset timer instruction that instructs resetting of the WDT, and outputs a reset timer signal to the WDT. ,
The system monitoring apparatus transfers a reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT to the monitoring processor as the first reset timer instruction, and the first reset timer instruction A system monitoring method that outputs information on the first transfer failure when the transfer failure is detected, and prohibits transmission of the timeout signal based on the information on the first transfer failure.
(Appendix 8)
The system monitoring device outputs first transfer success information when detecting transfer success of the first reset timer instruction, and transmits the timeout signal based on the first transfer success information. To give permission,
The system monitoring method according to appendix 7, wherein:
(Appendix 9)
The monitoring processor receives a second reset timer instruction for instructing reset of the WDT, and outputs a reset timer signal to the WDT;
The system monitoring device outputs an alternative instruction instructing an alternative transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected Then, based on the substitute instruction, the second reset timer instruction is transferred, and when the transfer failure of the second reset timer instruction is detected, the second transfer failure information is output, and the first The system monitoring method according to appendix 7 or 8, wherein transmission of the timeout signal is prohibited based on information on transfer failure and information on the second transfer failure.
(Appendix 10)
The system monitoring apparatus outputs second transfer success information when detecting the transfer success of the second reset timer instruction, and outputs the first transfer success information and the second transfer success information. The system monitoring method according to any one of appendices 7 to 9, wherein transmission of the timeout signal is permitted based on at least one of them.
(Appendix 11)
The monitoring processor stores whether or not the timeout signal is generated. When the timeout signal is received, the monitoring processor outputs the timeout signal when the occurrence of the timeout signal is stored. Appendix 8 to 10, wherein a self-initialization signal is output when stored, and based on the self-initialization signal, the monitoring processor itself is reset except for storage of the occurrence of the timeout signal. The system monitoring method according to any one of the above.
100 システム監視装置
101 コンピュータシステム
102 リセットタイマー指示発行部
103 システム制御コントローラ
130 指示転送部
170 フィルタ部
171 アンド素子
172 インバータ素子
200 システム監視装置
230 指示転送部
240 転送代替部
270 フィルタ部
273 ナンド素子
300 システム監視装置
400 システム監視装置
500 監視プロセッサ
502 監視プロセッサ
503 監視プロセッサ
504 監視プロセッサ
510 判定部
520 発生履歴記憶部
530 指示受領部
534 指示受領部
540 代替指示受領部
550 WDT
590 自己初期化部
600 リセットタイマー指示
601 リセットタイマー指示
602 リセットタイマー信号
603 代替指示
604 リセットタイマー指示
605 リセットタイマー信号
611 タイムアウト信号
612 タイムアウト信号
613 タイムアウト信号
614 自己初期化信号
621 フィルタオン信号
622 フィルタオン信号
DESCRIPTION OF
590 Self-
Claims (10)
前記WDTのリセットを指示する第1のリセットタイマー指示を受信し、前記WDTにリセットタイマー信号を出力する指示受領部と、を含む監視プロセッサと、
前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記指示受領部に転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力する指示転送部と、
前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止するフィルタ部と、
を有するシステム監視装置。 A watchdog timer (WDT, WatchDog Timer) that outputs a time-out signal when measuring a predetermined time;
An instruction receiving unit that receives a first reset timer instruction for instructing resetting of the WDT and outputs a reset timer signal to the WDT;
A reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT is transferred to the instruction receiving unit as the first reset timer instruction, and a transfer failure of the first reset timer instruction is detected. An instruction transfer unit that outputs information on the first transfer failure when
A filter unit for prohibiting transmission of the timeout signal based on the information on the first transfer failure;
A system monitoring device.
前記フィルタ部は、前記第1の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする請求項1記載のシステム監視装置。 The instruction transfer unit outputs information on the first transfer success when the transfer success of the first reset timer instruction is detected,
The filter unit permits transmission of the timeout signal based on the first transfer success information;
The system monitoring apparatus according to claim 1.
前記指示転送部は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、
前記代替指示に基づいて、前記第2のリセットタイマー指示を前記代替指示受領部に転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力する転送代替部を更に含み、
前記フィルタ部は、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する、
ことを特徴とする請求項1または2記載のシステム監視装置。 The monitoring processor further includes an alternative instruction receiving unit that receives a second reset timer instruction that instructs to reset the WDT and outputs a reset timer signal to the WDT,
The instruction transfer unit outputs a substitute instruction for instructing a substitute transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected. And
Based on the substitution instruction, the second reset timer instruction is transferred to the substitution instruction receiving unit, and a second transfer failure information is output when a transfer failure of the second reset timer instruction is detected. Further including an alternative part,
The filter unit prohibits transmission of the timeout signal based on the information on the first transfer failure and the information on the second transfer failure.
The system monitoring apparatus according to claim 1 or 2, characterized in that
前記フィルタ部は、前記指示転送部が前記第1のリセットタイマー指示の転送成功を検出した場合に出力する第1の転送成功の情報、及び前記第2の転送成功の情報の少なくとも一方に基づいて、前記タイムアウト信号の伝達を許可する、
ことを特徴とする請求項3記載のシステム監視装置。 The transfer substitution unit outputs second transfer success information when detecting the transfer success of the second reset timer instruction,
The filter unit is based on at least one of the first transfer success information and the second transfer success information output when the instruction transfer unit detects the transfer success of the first reset timer instruction. Allow the transmission of the timeout signal,
The system monitoring apparatus according to claim 3.
ことを特徴とする請求項3または4記載のシステム監視装置。 The instruction receiving unit, the alternative when the instruction receiving unit receives the second reset timer instruction, the instruction receiving unit according to claim 3 or 4 SL mounting system monitoring device, characterized in that resetting the.
前記タイムアウト信号を受け取った際、前記発生履歴記憶部に前記タイムアウト信号の発生有が記憶されている場合に前記タイムアウト信号を出力し、前記発生履歴記憶部に前記タイムアウト信号の発生無が記憶されている場合に自己初期化信号を出力する判定部と、
前記自己初期化信号を受け取って前記監視プロセッサを前記発生履歴記憶部を除いてリセットする自己初期化部と、を更に含む
ことを特徴とする請求項2乃至5のいずれか1項に記載のシステム監視装置。 The monitoring processor includes an occurrence history storage unit that stores presence / absence of occurrence of the timeout signal;
When the time-out signal is received, the time-out signal is output when the time-out signal is generated in the generation history storage unit, and the generation history storage unit stores the occurrence of the time-out signal is not stored. A determination unit that outputs a self-initialization signal when
System according to any one of claims 2 to 5, wherein the further comprising a self-initialization unit that the monitoring processor receives the self-initialization signal for resetting except the occurrence history storage unit, the Monitoring device.
前記システム監視装置が、前記WDTの監視対象に含まれるリセットタイマー指示発行部から送信されるリセットタイマー指示を、前記第1のリセットタイマー指示として前記監視プロセッサに転送し、前記第1のリセットタイマー指示の転送失敗を検出した場合に第1の転送失敗の情報を出力し、前記第1の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止する
システム監視方法。 A monitoring processor of a system monitoring apparatus including a WDT that outputs a timeout signal when a predetermined time is measured receives a first reset timer instruction that instructs resetting of the WDT, and outputs a reset timer signal to the WDT. ,
The system monitoring apparatus transfers a reset timer instruction transmitted from a reset timer instruction issuing unit included in the monitoring target of the WDT to the monitoring processor as the first reset timer instruction, and the first reset timer instruction A system monitoring method that outputs information on the first transfer failure when the transfer failure is detected, and prohibits transmission of the timeout signal based on the information on the first transfer failure.
ことを特徴とする請求項7記載のシステム監視方法。 The system monitoring device outputs first transfer success information when detecting transfer success of the first reset timer instruction, and transmits the timeout signal based on the first transfer success information. To give permission,
The system monitoring method according to claim 7.
前記システム監視装置は、前記第1のリセットタイマー指示の転送失敗を検出した場合に前記第1のリセットタイマー指示の代わりに前記第2のリセットタイマー指示を代替転送することを指示する代替指示を出力し、前記代替指示に基づいて、前記第2のリセットタイマー指示を転送し、前記第2のリセットタイマー指示の転送失敗を検出した場合に第2の転送失敗の情報を出力し、前記第1の転送失敗の情報及び前記第2の転送失敗の情報に基づいて、前記タイムアウト信号の伝達を禁止し、前記第2のリセットタイマー指示の転送成功を検出した場合に第2の転送成功の情報を出力し、前記第1の転送成功の情報及び前記第2の転送成功の情報に基づいて、前記タイムアウト信号の伝達を許可する
ことを特徴とする請求項7または8記載のシステム監視方法。 The monitoring processor receives a second reset timer instruction for instructing reset of the WDT, and outputs a reset timer signal to the WDT;
The system monitoring device outputs an alternative instruction instructing an alternative transfer of the second reset timer instruction instead of the first reset timer instruction when a transfer failure of the first reset timer instruction is detected Then, based on the substitute instruction, the second reset timer instruction is transferred, and when the transfer failure of the second reset timer instruction is detected, the second transfer failure information is output, and the first Based on the transfer failure information and the second transfer failure information, the transmission of the time-out signal is prohibited, and when the transfer success of the second reset timer instruction is detected, the second transfer success information is output. The transmission of the timeout signal is permitted based on the information on the success of the first transfer and the information on the success of the second transfer. System monitoring method described.
ことを特徴とする請求項8または9記載のシステム監視方法。 The monitoring processor stores whether or not the timeout signal is generated. When the timeout signal is received, the monitoring processor outputs the timeout signal when the occurrence of the timeout signal is stored. 9. A self-initialization signal is output when stored, and the supervisory processor is reset based on the self-initialization signal except for storing whether the time-out signal is generated or not. 9. The system monitoring method according to 9.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011012948A JP5625949B2 (en) | 2011-01-25 | 2011-01-25 | System monitoring apparatus and system monitoring method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011012948A JP5625949B2 (en) | 2011-01-25 | 2011-01-25 | System monitoring apparatus and system monitoring method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012155454A JP2012155454A (en) | 2012-08-16 |
JP5625949B2 true JP5625949B2 (en) | 2014-11-19 |
Family
ID=46837141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011012948A Expired - Fee Related JP5625949B2 (en) | 2011-01-25 | 2011-01-25 | System monitoring apparatus and system monitoring method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5625949B2 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59119453A (en) * | 1982-12-27 | 1984-07-10 | Fujitsu Ltd | Cpu run-away monitoring circuit |
JPH06318159A (en) * | 1993-05-10 | 1994-11-15 | Nec Shizuoka Ltd | Device abnormality detecting system |
JP4613019B2 (en) * | 2004-03-01 | 2011-01-12 | 三菱電機株式会社 | Computer system |
JP5476238B2 (en) * | 2010-07-12 | 2014-04-23 | ルネサスエレクトロニクス株式会社 | Semiconductor device |
-
2011
- 2011-01-25 JP JP2011012948A patent/JP5625949B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012155454A (en) | 2012-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5870301A (en) | System control apparatus including a master control unit and a slave control unit which maintain coherent information | |
KR100566339B1 (en) | Fault-tolerant computer system, re-synchronization method thereof and computer-readable storage medium having re-synchronization program thereof | |
WO2014161373A1 (en) | System fault detection and processing method, device, and computer readable storage medium | |
JP2004046599A (en) | Fault tolerant computer system, its resynchronization method, and resynchronization program | |
JP2010231340A (en) | Computer and failure processing method for the same | |
WO2015128981A1 (en) | Programmable controller system and controller therefor | |
US10042812B2 (en) | Method and system of synchronizing processors to the same computational point | |
US8230446B2 (en) | Providing a computing system with real-time capabilities | |
JP2006512634A (en) | Method and circuit arrangement for synchronizing processing units synchronously or asynchronously clocked | |
EP2911058B1 (en) | Methods and apparatuses for reducing common mode failures of nuclear safety-related software control systems | |
JP5625949B2 (en) | System monitoring apparatus and system monitoring method | |
KR102438148B1 (en) | Abnormality detection apparatus, system and method for detecting abnormality of embedded computing module | |
JP2012078166A (en) | Control device and nuclear power plant control system | |
JP2010176345A (en) | Multi-node system, node, memory dump processing method, and program | |
JP2010009258A (en) | Fault detection device of software | |
KR20140092132A (en) | Method for monitoring os task of twin micom in rtos | |
JP6187508B2 (en) | Control device, bus circuit, method, and program | |
JP6654662B2 (en) | Server device and server system | |
JP2007265157A (en) | System and method for detecting fault of i/o device | |
JP2006172173A (en) | Serial communication device, data communication device, copying machine and multifunction machine | |
JP4126849B2 (en) | Multi-CPU system monitoring method | |
KR100291097B1 (en) | Real-Time Clock-Related Fault Detection Device in Processor Board with Redundancy | |
US11764771B2 (en) | Event detection control device and method for circuit system controlled by pulse wave modulation signal | |
JP5768434B2 (en) | Mutual monitoring system | |
JP5082147B2 (en) | Multi-node system, inter-node switch, and data relay method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140624 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5625949 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |