JP2002330191A - Method and system for detecting abnormality - Google Patents

Method and system for detecting abnormality

Info

Publication number
JP2002330191A
JP2002330191A JP2001133996A JP2001133996A JP2002330191A JP 2002330191 A JP2002330191 A JP 2002330191A JP 2001133996 A JP2001133996 A JP 2001133996A JP 2001133996 A JP2001133996 A JP 2001133996A JP 2002330191 A JP2002330191 A JP 2002330191A
Authority
JP
Japan
Prior art keywords
health check
cycle
abnormality detection
long
check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001133996A
Other languages
Japanese (ja)
Other versions
JP3875509B2 (en
Inventor
Hiroyuki Sawada
洋之 澤田
Hirobumi Nakayama
博文 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2001133996A priority Critical patent/JP3875509B2/en
Publication of JP2002330191A publication Critical patent/JP2002330191A/en
Application granted granted Critical
Publication of JP3875509B2 publication Critical patent/JP3875509B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

PROBLEM TO BE SOLVED: To detect abnormality of a system under monitoring at an early stage, in performing a health check, by which a monitor ascertains whether specified functions provided by the system under monitoring are normal, via a communication line in a predetermined cycle in order to detect abnormality of the system. SOLUTION: A cycle for health check is prescribed according to a time necessary for completing the health check. A long cycle health check, such that the time necessary for completing the health check is longer than a predetermined time, is performed in the predetermined cycle, and A short cycle health check, such that the same necessary time is shorter than the predetermined time, is performed in a cycle shorter than the predetermined cycle. Thus, before performing the health check, classifying into health check in a functioning ascertainment level, by which specified failures provided by system under monitoring are detected in a long cycle, and one in a communication preparedness ascertainment level, by which such as system down in the monitor is checked in a short cycle, enables the detection at an early stage of abnormality in a system under monitoring.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は異常検出方式、及
び、異常検出システムに関し、特に通信回線を介して接
続された複数の装置間でデータの送受信を行うシステム
において、一方の装置から他方の装置における機能動作
状況とその間の通信可否とをチェックする異常検出方
式、及び、異常検出システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an abnormality detection system and an abnormality detection system, and more particularly to a system for transmitting and receiving data between a plurality of devices connected via a communication line. The present invention relates to an abnormality detection method for checking the functional operation status and communication availability between them, and an abnormality detection system.

【0002】[0002]

【従来の技術】従来このような異常検出方法に関する技
術として、一定の周期で被監視装置が提供する特定の機
能が正常かどうかを監視装置から確認する、ヘルスチェ
ックを行う方法が知られている。この監視装置から被監
視装置に向けて行う動作確認のためのヘルスチェック
は、例えば特開平8−223191号公報、特開平10
−336177号公報、特開2000−115169号
公報に記載されている。
2. Description of the Related Art Conventionally, as a technique relating to such an abnormality detection method, there has been known a method of performing a health check by checking from a monitoring apparatus whether or not a specific function provided by a monitored apparatus is normal at a predetermined cycle. . A health check from the monitoring device to the monitored device for operation confirmation is performed, for example, in JP-A-8-223191,
-336177 and JP-A-2000-115169.

【0003】特開平8−223191号公報において
は、送信したヘルスチェックデータに対する応答が所定
待ち時間以内になければ、待ち時間を延長又は短縮して
更新することによって、処理負荷の大小を考慮して装置
の正常性を判断できるようにしている。特開平10−3
36177号公報においては、ヘルスチェックのトラフ
ィックを抑制して1回のヘルスチェックに要する時間を
短縮している。
In Japanese Patent Application Laid-Open No. 8-223191, if a response to transmitted health check data is not within a predetermined waiting time, the waiting time is extended or shortened and updated to take into account the magnitude of processing load. The system can determine the normality of the device. JP-A-10-3
In Japanese Patent No. 36177, the time required for one health check is reduced by suppressing the health check traffic.

【0004】特開2000−115169号公報におい
ては、ヘルスチェックのトラフィックを抑制するため
に、ノードに対するポーリングを一部省略している。以
上の各公報に記載されているようなヘルスチェックで
は、いずれの場合においても、監視装置が所定の間隔
で、1つ又は複数の被監視装置に信号を送信し、被監視
装置がその信号に応答して監視装置に応答信号を返信し
てくることを確認している。こうすることによって、被
監視装置が正常に稼働していることを判断する。
In Japanese Patent Application Laid-Open No. 2000-115169, polling for a node is partially omitted in order to suppress traffic of a health check. In the health check described in each of the above publications, in any case, the monitoring device transmits a signal to one or more monitored devices at a predetermined interval, and the monitored device transmits the signal to the signal. It is confirmed that a response signal is returned to the monitoring device in response. By doing so, it is determined that the monitored device is operating normally.

【0005】また、ヘルスチェックは前述した単純な方
法のみでなく、必要に応じて、機能動作確認レベル等の
様々なレベルで行われ、被監視装置が提供する特定の機
能の正常かどうかを確認することもできる。機能動作確
認レベルでのヘルスチェックを行うことにより、被監視
装置が提供する特定の機能障害検出が可能となる。しか
し、機能動作確認レベルでのヘルスチェックを行うと、
逆にヘルスチェック処理における負荷が増加してしま
う。
The health check is performed not only by the simple method described above but also at various levels such as a function operation check level as necessary, to check whether a specific function provided by the monitored device is normal. You can also. By performing a health check at the functional operation confirmation level, it is possible to detect a specific functional failure provided by the monitored device. However, if you perform a health check at the function operation confirmation level,
Conversely, the load in the health check process increases.

【0006】このような場合には、ヘルスチェック処理
がそれ以外の処理に対して影響を与えないような長周期
でヘルスチェックを行う必要がある。しかし、ヘルスチ
ェックを長周期で行うと、障害が発生した時点で直ちに
その障害を検出することが困難となり、障害発生から障
害の検出までの時間が長くなってしまう。
In such a case, it is necessary to perform the health check in a long cycle so that the health check process does not affect other processes. However, if the health check is performed in a long cycle, it becomes difficult to detect the fault immediately when the fault occurs, and the time from the occurrence of the fault to the detection of the fault becomes longer.

【0007】[0007]

【発明が解決しようとする課題】従来の異常検出方式に
おいて、機能動作確認レベルでのヘルスチェックを行う
場合には、ヘルスチェック処理がヘルスチェック以外の
処理に対して影響を与えないような長周期でヘルスチェ
ックを行う必要がある。一方、障害発生時の保守者への
通知は、障害発生時点からより短時間で行われることが
望ましい。
In the conventional abnormality detection method, when performing a health check at a function operation confirmation level, a long period in which the health check process does not affect processes other than the health check. Need to do a health check. On the other hand, it is desirable that the notification to the maintenance person at the time of occurrence of a failure be performed in a shorter time from the time of occurrence of the failure.

【0008】このように、従来の異常検出方式におい
て、機能動作確認レベルのヘルスチェックを行う場合、
単純にヘルスチェック周期を短縮しただけではシステム
のCPU負荷への影響が大きくなり、ヘルスチェック以
外の処理に対して影響を与えることになるため、障害発
生から障害検出までの時間が長くなってしまうという欠
点があった。このような欠点は、上述した各特許公報に
記載されている技術によっても解決することはできな
い。
As described above, in the case of performing a health check at a function operation confirmation level in the conventional abnormality detection method,
Simply shortening the health check cycle increases the effect on the CPU load of the system and affects processes other than the health check, so the time from failure occurrence to failure detection becomes longer. There was a disadvantage. Such a drawback cannot be solved even by the techniques described in the above-mentioned patent publications.

【0009】本発明は上述した従来技術の欠点を解決す
るためになされたものであり、その目的は被監視装置の
異常をより旱期に検出することのできる異常検出方式、
及び、異常検出システムを提供することである。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned drawbacks of the prior art, and an object of the present invention is to provide an abnormality detection method capable of detecting an abnormality of a monitored device in a dry season,
And to provide an abnormality detection system.

【0010】[0010]

【課題を解決するための手段】本発明の請求項1による
異常検出方式は、被監視装置の提供する特定の機能が正
常かどうかについて通信回線を介して監視装置が確認す
るヘルスチェックを所定周期で行うことによってシステ
ムの異常を検出する異常検出方式であって、前記ヘルス
チェックが完了するまでに必要な時間に応じて該ヘルス
チェックを行う周期を定めたことを特徴とする。
According to a first aspect of the present invention, there is provided an abnormality detection method, comprising: performing a health check in which a monitoring device checks via a communication line whether a specific function provided by a monitored device is normal; In this case, a cycle of performing the health check is determined according to a time required until the health check is completed.

【0011】本発明の請求項2による異常検出方式は、
請求項1において、前記ヘルスチェックが完了するまで
に必要な時間が所定時間よりも長い長周期ヘルスチェッ
クを第1の周期で行い、かつ、前記所定時間よりも短い
短周期ヘルスチェックを前記第1の周期より短い第2の
周期で行うことを特徴とする。本発明の請求項3による
異常検出方式は、請求項2において、前記長周期ヘルス
チェックは被監視装置が提供する特定の機能における機
能動作障害の有無を検出する機能動作確認レベルヘルス
チェックであり、前記短長周期ヘルスチェックは前記監
視装置と前記被監視装置との間の通信における障害の有
無を検出する通信可否確認レベルヘルスチェックである
ことを特徴とする。
[0011] The abnormality detection method according to claim 2 of the present invention comprises:
2. The health check system according to claim 1, wherein a long-period health check required for completing the health check is longer than a predetermined time in a first cycle, and a short-period health check shorter than the predetermined time is performed in the first cycle. Is performed in a second cycle shorter than the cycle of. In the abnormality detection method according to claim 3 of the present invention, in claim 2, the long-period health check is a function operation check level health check that detects the presence or absence of a function operation failure in a specific function provided by the monitored device. The short- and long-period health check is a communication health check level health check for detecting the presence or absence of a failure in communication between the monitoring device and the monitored device.

【0012】本発明の請求項4による異常検出システム
は、互いに異なる周期でヘルスチェックを行う第1及び
第2のヘルスチェック実行手段を含むことを特徴とす
る。本発明の請求項5による異常検出システムは、請求
項4において、前記第1及び第2のヘルスチェック実行
手段のうちの一方はヘルスチェックが完了するまでに必
要な時間が所定時間よりも長い長周期ヘルスチェックを
第1の周期で行い、かつ、前記第1及び第2のヘルスチ
ェック実行手段のうちの他方は前記所定時間よりも短い
短周期ヘルスチェックを前記第1の周期より短い第2の
周期で行うことを特徴とする請求項4記載の異常検出シ
ステム。
An abnormality detection system according to a fourth aspect of the present invention is characterized by including first and second health check executing means for performing health checks at mutually different periods. According to a fifth aspect of the present invention, in the abnormality detection system according to the fourth aspect, one of the first and second health check execution units has a length of time necessary for completing the health check being longer than a predetermined time. The periodic health check is performed in a first cycle, and the other of the first and second health check executing means performs a short-term health check shorter than the predetermined time in a second cycle shorter than the first cycle. 5. The abnormality detection system according to claim 4, wherein the abnormality detection is performed periodically.

【0013】本発明の請求項6による異常検出システム
は、請求項5において、前記長周期ヘルスチェックは被
監視装置が提供する特定の機能における機能動作障害の
有無を検出する機能動作確認レベルヘルスチェックであ
り、前記短長周期ヘルスチェックは前記監視装置と前記
被監視装置との間の通信における障害の有無を検出する
通信可否確認レベルヘルスチェックであることを特徴と
する。
According to a sixth aspect of the present invention, in the abnormality detection system according to the fifth aspect, the long-period health check is a function operation confirmation level health check for detecting the presence or absence of a function operation failure in a specific function provided by the monitored device. Wherein the short- and long-period health check is a communication availability confirmation level health check for detecting the presence or absence of a failure in communication between the monitoring device and the monitored device.

【0014】要するに本発明では、通信回線を介して接
続され、相互に通信を行うシステムにおいて、ヘルスチ
ェックが完了するまでに必要な時間に応じて、ヘルスチ
ェックを分類して実行する。すなわち、長周期で被監視
装置が提供する特定の機能障害を検出する、機能動作確
認レベルヘルスチェック(以降、長期ヘルスチェックと
呼ぶ)と、短周期で被監視装置がシステムダウンを起こ
していないか等をチェックする、通信可否確認レベルヘ
ルスチェック(以降、短期へルスチェックと呼ぶ)とに
分類して実行する。このように、ヘルスチェックが完了
するまでに必要な時間に応じてそのヘルスチェックを行
う周期を定めることにより、従来のヘルスチェックにお
ける前述の課題を解決し、被監視装置の異常を旱期に検
出できる。
In short, according to the present invention, in a system which is connected via a communication line and communicates with each other, the health checks are classified and executed according to the time required until the health check is completed. That is, a function operation check level health check (hereinafter referred to as a long-term health check) that detects a specific functional failure provided by the monitored device in a long cycle, and whether the monitored device has a system down in a short cycle. And the like, and a communication availability confirmation level health check (hereinafter referred to as a short-term health check) is executed. In this way, the above-mentioned problem in the conventional health check is solved by determining the cycle of performing the health check according to the time required until the health check is completed, and the abnormality of the monitored device is detected during the dry season. it can.

【0015】[0015]

【発明の実施の形態】次に、図面を参照して本発明の実
施の形態について説明する。なお、以下の説明において
参照する各図では、他の図と同等部分は同一符号によっ
て示されている。図1は本発明による異常検出方式を実
現するために監視装置に設けるべき構成を示すブロック
図である。同図に示されているように、本実施形態によ
る異常検出方式においては、短周期で被監視装置がシス
テムダウンを起こしていないか等をチェックする、通信
可否確認レベルヘルスチェックを行うためのヘルスチェ
ックデータを出力する短期ヘルスチェック実行部11
と、長周期で被監視装置が提供する特定の機能障害を検
出する、機能動作確認レベルヘルスチェックを行うため
のヘルスチェックデータを出力する長期ヘルスチェック
実行部12と、これら両実行部に入力される時刻データ
を出力するタイマ10と、ヘルスチェックデータを被監
視装置に送信すると共に被監視装置からの応答を受信す
る送受信部13とを含んで構成されている。
Next, an embodiment of the present invention will be described with reference to the drawings. In the drawings referred to in the following description, the same parts as those in the other drawings are denoted by the same reference numerals. FIG. 1 is a block diagram showing a configuration to be provided in a monitoring device to realize the abnormality detection method according to the present invention. As shown in the figure, in the abnormality detection method according to the present embodiment, a health level for performing a health check of a communication availability check level is to check whether or not a monitored device has a system down in a short cycle. Short-term health check execution unit 11 that outputs check data
A long-term health check execution unit 12 that detects a specific function failure provided by the monitored device in a long cycle, outputs health check data for performing a function operation check level health check, and is input to both of these execution units. 1 includes a timer 10 for outputting time data and a transmission / reception unit 13 for transmitting health check data to the monitored device and receiving a response from the monitored device.

【0016】このような構成において、短期ヘルスチェ
ック実行部11及び長期ヘルスチェック実行部12は、
タイマ10が出力する時刻データに応じてそれぞれ独立
した周期でヘルスチェックデータを出力する。つまり、
短期ヘルスチェック実行部11及び長期ヘルスチェック
実行部12は、互いに異なる周期でヘルスチェックを行
う。本例では、ヘルスチェックが完了するまでに必要な
時間が所定時間よりも長い長周期ヘルスチェックを長期
ヘルスチェック実行部12が第1の周期で行い、かつ、
所定時間よりも短い短周期ヘルスチェックを短期ヘルス
チェック実行部11が第1の周期より短い第2の周期で
行う。長期ヘルスチェック実行部12から出力されるヘ
ルスチェックデータ及び短期ヘルスチェック実行部11
から出力されるヘルスチェックデータは、送受信部13
によって伝送路網に送出され、被監視装置に送られるこ
とになる。
In such a configuration, the short-term health check execution unit 11 and the long-term health check execution unit 12
The health check data is output at an independent cycle in accordance with the time data output by the timer 10. That is,
The short-term health check execution unit 11 and the long-term health check execution unit 12 perform health checks at mutually different cycles. In this example, the long-term health check execution unit 12 performs a long-period health check in a first cycle, the time required for completing the health check is longer than a predetermined time, and
The short-term health check execution unit 11 performs a short-period health check shorter than a predetermined time in a second cycle shorter than the first cycle. Health check data output from the long-term health check execution unit 12 and the short-term health check execution unit 11
The health check data output from the
Is sent to the transmission path network and sent to the monitored device.

【0017】図2には、本発明による異常検出方式を通
信ネットワークシステムに採用した場合における、監視
装置と被監視装置との間のヘルスチェック動作イメージ
が示されている。同図に示されているように、監視装置
から被監視装置へのヘルスチェックには、比較的長い周
期で行われる長期ヘルスチェックL1,L2と、長期ヘ
ルスチェック同士の間に行われる短期ヘルスチェックS
1,…,Snとがある。
FIG. 2 shows an image of a health check operation between a monitoring device and a monitored device when the abnormality detection method according to the present invention is employed in a communication network system. As shown in the figure, the health check from the monitoring device to the monitored device includes long-term health checks L1 and L2 performed at a relatively long cycle and short-term health checks performed between the long-term health checks. S
1, ..., Sn.

【0018】ここで、長期ヘルスチェックのチェック範
囲は、長周期で被監視装置が提供する特定の機能障害を
検出する、被監視装置における機能動作状況である。一
方、短期ヘルスチェックのチェック範囲は、短周期で被
監視装置がシステムダウンを起こしていないか等をチェ
ックする、被監視装置のヘルスチェックプロセスによる
応答である。この短期ヘルスチェックは、例えば、周知
のPING(packet internet gro
per)コマンドによる確認に相当する。
Here, the check range of the long-term health check is a function operation status of the monitored device that detects a specific functional failure provided by the monitored device in a long cycle. On the other hand, the check range of the short-term health check is a response by the health check process of the monitored device, which checks in a short period whether the system of the monitored device has failed. This short-term health check is performed, for example, by using a well-known PING (packet internet gro).
(per) command.

【0019】長期ヘルスチェックに対する応答が返って
くるまでにはある程度時間が必要になるので、その時間
内に短期ヘルスチェックを行うことによって、システム
ダウン等の異常を早期に検出することができる。すなわ
ち、長期ヘルスチェックの場合よりもはるかに短時間で
応答が返ってくる短期ヘルスチェックを、長期ヘルスチ
ェックよりも短い周期で頻繁に行うので、システムダウ
ン等の重大な異常を早期に検出することができる。この
ように、本方式では、長期ヘルスチェックと短期ヘルス
チェックとに分類し、それぞれ異なる周期で行うことに
より、より早期に異常を検出することができるのであ
る。
Since it takes some time until a response to the long-term health check is returned, an abnormality such as a system down can be detected early by performing the short-term health check within that time. In other words, short-term health checks that return a response in a much shorter time than in the case of long-term health checks are performed more frequently in a shorter cycle than long-term health checks, so that serious abnormalities such as a system failure can be detected early. Can be. As described above, according to the present method, abnormalities can be detected earlier by classifying into long-term health checks and short-term health checks and performing them at different periods.

【0020】ここで、長期ヘルスチェックにおいては、
長期ヘルスチェック要求に対する応答がタイムアウトし
た時に異常を検出したとする。図3には、本発明におけ
る監視装置と被監視装置との間の長期ヘルスチェックに
よる異常検出動作が示されている。同図において、監視
装置によって長期ヘルスチェックL1,L2,L3…が
行われ、予め定められた時間内に被監視装置からの応答
がなかった場合(タイムアウトした場合)に、その被監
視装置に異常があると判断する。
Here, in the long-term health check,
Assume that an error is detected when the response to the long-term health check request times out. FIG. 3 shows an abnormality detection operation by a long-term health check between the monitoring device and the monitored device in the present invention. In the figure, a long-term health check L1, L2, L3,... Is performed by the monitoring device, and if there is no response from the monitored device within a predetermined time period (time-out), the monitored device becomes abnormal. Judge that there is.

【0021】一方、短期ヘルスチェックにおいては、短
期ヘルスチェック要求の応答がタイムアウトした時に異
常を検出したとする。図4には、本発明における監視装
置と被監視装置との間の短期ヘルスチェックによる異常
検出動作が示されている。図において、監視装置によっ
て短期ヘルスチェックS1,S2,S3…が行われ、予
め定められた時間内に被監視装置からの応答がなかった
場合に、その被監視装置に異常があると判断する。シス
テムダウン等を起こしている場合等、予め定められた時
間内に被監視装置からの応答がなかった場合(タイムア
ウトした場合)に、被監視装置に異常があると監視装置
は認識することができる。なお、システムの復旧を検出
した場合、その復旧が完了した旨を保守者に通知する。
この復旧通知は、すべての異常が復旧したことを検出し
た時に行う。
On the other hand, in the short-term health check, it is assumed that an abnormality is detected when the response to the short-term health check request times out. FIG. 4 shows an abnormality detection operation by a short-term health check between the monitoring device and the monitored device in the present invention. In the figure, a short-term health check S1, S2, S3... Is performed by the monitoring device, and if there is no response from the monitored device within a predetermined time, it is determined that the monitored device is abnormal. When there is no response from the monitored device within a predetermined period of time, such as when the system is down (timeout), the monitoring device can recognize that the monitored device is abnormal. . When the system recovery is detected, the maintenance person is notified that the recovery is completed.
This recovery notification is performed when it is detected that all abnormalities have been recovered.

【0022】図5は本発明による異常検出方式を適用し
たネットワーク構成の例を示すブロック図である。同図
に示されているネットワークは、伝送路網10を介して
接続された4つの装置1〜4を含んで構成されている。
このネットワークを構成する各装置1〜4は、相互にヘ
ルスチェックを行うように構成されている。ヘルスチェ
ックを行うため、各装置1〜4は、上述した図1に示さ
れている構成をそれぞれ有しているものとする。
FIG. 5 is a block diagram showing an example of a network configuration to which the abnormality detection system according to the present invention is applied. The network shown in FIG. 1 includes four devices 1 to 4 connected via a transmission line network 10.
The devices 1 to 4 constituting this network are configured to mutually perform a health check. In order to perform a health check, it is assumed that each of the devices 1 to 4 has the configuration shown in FIG. 1 described above.

【0023】なお、同図中の矢印は監視装置から被監視
装置への監視方向を示している。すなわち、同図中の矢
印の先端部分が被監視装置、矢印の根元部分が監視装置
である。同図において、装置1は装置2、装置4から上
述したヘルスチェック信号を受信する(監視方向、
)。監視装置である装置2、4は被監視装置1に対
し、図2に示されている動作のヘルスチェックを行う。
ここで行われるヘルスチェックは、上述した、図3及び
図4に示されている異常検出動作である。
The arrows in the figure indicate the monitoring direction from the monitoring device to the monitored device. That is, the tip of the arrow in the figure is the monitored device, and the root of the arrow is the monitoring device. In the figure, the device 1 receives the above-mentioned health check signals from the devices 2 and 4 (monitoring direction,
). The monitoring devices 2 and 4 perform a health check on the monitored device 1 in the operation illustrated in FIG.
The health check performed here is the abnormality detection operation described above and shown in FIGS.

【0024】また、被監視装置である装置1がシステム
ダウン等を起こしていると監視装置である装置2、4が
認識している場合は、監視装置である装置2、4は被監
視装置である装置1に対し、図4に示されている異常検
出動作の短期へルスチェックを行う。システムの復旧を
検出した場合、その復旧が完了した旨を保守端末5に通
知する。この復旧通知は、すべての異常が復旧したこと
を検出した時に行う。ここで、保守端末5は装置1のシ
ステム状態を監視する装置である。
If the monitoring apparatuses 2 and 4 recognize that the monitoring target apparatus 1 has a system down, etc., the monitoring apparatuses 2 and 4 are monitoring target apparatuses. A short-term health check of the abnormality detection operation shown in FIG. When the restoration of the system is detected, the maintenance terminal 5 is notified that the restoration is completed. This recovery notification is performed when it is detected that all abnormalities have been recovered. Here, the maintenance terminal 5 is a device that monitors the system state of the device 1.

【0025】装置2、装置3、装置4についても、以上
と同様にヘルスチェックが行われる(監視方向及び
、監視方向及び、監視方向及び)。要する
に、本例では、装置1〜4が監視装置又は被監視装置と
なり、相互にヘルスチェックを行うのである。また、保
守端末6,保守端末7,保守端末8は、装置2,装置
3,装置4のシステム状態をそれぞれ監視する装置であ
る。
The health check is also performed on the devices 2, 3, and 4 in the same manner as described above (monitoring direction, monitoring direction, monitoring direction, and the like). In short, in this example, the devices 1 to 4 are monitoring devices or monitored devices, and mutually perform a health check. The maintenance terminal 6, the maintenance terminal 7, and the maintenance terminal 8 are devices that monitor the system states of the devices 2, 3, and 4, respectively.

【0026】なお、図5に示されているネットワーク構
成以外のネットワーク構成についても、本発明が適用で
き、異常を検出できることはもちろんである。
The present invention can be applied to a network configuration other than the network configuration shown in FIG. 5, and it is needless to say that an abnormality can be detected.

【0027】[0027]

【発明の効果】以上説明したように本発明は、通信回線
を介して接続されデータの送受信を行う複数の装置が存
在する場合において、監視装置から被監視装置に向けて
行う、被監視装置が提供する特定の機能が正常かどうか
を確認する被監視装置についてのヘルスチェックを、長
周期で被監視装置が提供する特定の機能障害を検出する
機能動作確認レベルヘルスチェックと、短周期で監視装
置がシステムダウンを起こしていないか等をチェックす
る通信可否確認レベルヘルスチェックとに分類し、監視
装置が被監視装置に対して各々のヘルスチェックを実行
することにより、被監視装置の異常を旱期に検出できる
という効果がある。
As described above, according to the present invention, when there are a plurality of devices that are connected via a communication line and transmit and receive data, the monitored device to be monitored from the monitoring device to the monitored device can be used. A health check is performed on the monitored device to check whether the specific function provided is normal, a function operation check level health check that detects a specific functional failure provided by the monitored device over a long period, and a monitoring device is performed over a short period Is a communication availability check level that checks whether the system has failed or not.A health check is performed, and the monitoring device performs each health check on the monitored device to check for abnormalities in the monitored device. There is an effect that can be detected.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による異常検出方式を実現するために設
けるべき構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration to be provided to realize an abnormality detection method according to the present invention.

【図2】監視装置と被監視装置との間における、ヘルス
チェック動作を示す図である。
FIG. 2 is a diagram illustrating a health check operation between a monitoring device and a monitored device.

【図3】監視装置と被監視装置との間における、短期ヘ
ルスチェックによる異常検出動作を示す図である。
FIG. 3 is a diagram showing an abnormality detection operation by a short-term health check between a monitoring device and a monitored device.

【図4】監視装置と被監視装置との間における、長期ヘ
ルスチェックによる異常検出動作を示す図である。
FIG. 4 is a diagram showing an abnormality detection operation by a long-term health check between a monitoring device and a monitored device.

【図5】本発明による異常検出方式を適用したネットワ
ーク構成の一例を示すブロック図である。
FIG. 5 is a block diagram showing an example of a network configuration to which the abnormality detection method according to the present invention is applied.

【符号の説明】[Explanation of symbols]

1,2,3,4 装置 5,6,7,8 保守端末 10 タイマ 11 短期ヘルスチェック実行部 12 長期ヘルスチェック実行部 13 送受信部 1, 2, 3, 4 device 5, 6, 7, 8 maintenance terminal 10 timer 11 short-term health check execution unit 12 long-term health check execution unit 13 transmission / reception unit

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B089 GA21 GB02 HA01 JA35 JB16 KA12 5K035 AA03 BB03 DD01  ──────────────────────────────────────────────────続 き The continuation of the front page F term (reference) 5B089 GA21 GB02 HA01 JA35 JB16 KA12 5K035 AA03 BB03 DD01

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 被監視装置の提供する特定の機能が正常
かどうかについて通信回線を介して監視装置が確認する
ヘルスチェックを所定周期で行うことによってシステム
の異常を検出する異常検出方式であって、前記ヘルスチ
ェックが完了するまでに必要な時間に応じて該ヘルスチ
ェックを行う周期を定めたことを特徴とする異常検出方
式。
An abnormality detection method for detecting an abnormality in a system by performing a health check performed by a monitoring device via a communication line at a predetermined cycle to determine whether a specific function provided by the monitored device is normal. An abnormality detection method, wherein a cycle of performing the health check is determined according to a time required until the health check is completed.
【請求項2】 前記ヘルスチェックが完了するまでに必
要な時間が所定時間よりも長い長周期ヘルスチェックを
第1の周期で行い、かつ、前記所定時間よりも短い短周
期ヘルスチェックを前記第1の周期より短い第2の周期
で行うことを特徴とする請求項1記載の異常検出方式。
2. A long-period health check that takes a longer time to complete the health check than a predetermined time is performed in a first cycle, and a short-period health check that is shorter than the predetermined time is performed by the first health check. 2. The abnormality detection method according to claim 1, wherein the detection is performed in a second period shorter than the period.
【請求項3】 前記長周期ヘルスチェックは被監視装置
が提供する特定の機能における機能動作障害の有無を検
出する機能動作確認レベルヘルスチェックであり、前記
短長周期ヘルスチェックは前記監視装置と前記被監視装
置との間の通信における障害の有無を検出する通信可否
確認レベルヘルスチェックであることを特徴とする請求
項2記載の異常検出方式。
3. The long-period health check is a function operation confirmation level health check for detecting the presence or absence of a functional operation failure in a specific function provided by the monitored device. 3. The abnormality detection method according to claim 2, wherein the communication possibility confirmation level health check detects the presence or absence of a failure in communication with the monitored device.
【請求項4】 互いに異なる周期でヘルスチェックを行
う第1及び第2のヘルスチェック実行手段を含むことを
特徴とする異常検出システム。
4. An abnormality detection system comprising first and second health check executing means for performing health checks at mutually different periods.
【請求項5】 前記第1及び第2のヘルスチェック実行
手段のうちの一方はヘルスチェックが完了するまでに必
要な時間が所定時間よりも長い長周期ヘルスチェックを
第1の周期で行い、かつ、前記第1及び第2のヘルスチ
ェック実行手段のうちの他方は前記所定時間よりも短い
短周期ヘルスチェックを前記第1の周期より短い第2の
周期で行うことを特徴とする請求項4記載の異常検出シ
ステム。
5. One of the first and second health check execution means performs a long-period health check in which the time required until the health check is completed is longer than a predetermined time in a first cycle, and The other of the first and second health check executing means performs a short cycle health check shorter than the predetermined time in a second cycle shorter than the first cycle. Abnormality detection system.
【請求項6】 前記長周期ヘルスチェックは被監視装置
が提供する特定の機能における機能動作障害の有無を検
出する機能動作確認レベルヘルスチェックであり、前記
短長周期ヘルスチェックは前記監視装置と前記被監視装
置との間の通信における障害の有無を検出する通信可否
確認レベルヘルスチェックであることを特徴とする請求
項5記載の異常検出システム。
6. The long-period health check is a function operation check level health check for detecting the presence or absence of a functional operation failure in a specific function provided by the monitored device, and the short- and long-period health check is performed by the monitoring device and the monitoring device. 6. The abnormality detection system according to claim 5, wherein the communication possibility confirmation level health check detects presence or absence of a failure in communication with the monitored device.
JP2001133996A 2001-05-01 2001-05-01 Anomaly detection method and anomaly detection system Expired - Fee Related JP3875509B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001133996A JP3875509B2 (en) 2001-05-01 2001-05-01 Anomaly detection method and anomaly detection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001133996A JP3875509B2 (en) 2001-05-01 2001-05-01 Anomaly detection method and anomaly detection system

Publications (2)

Publication Number Publication Date
JP2002330191A true JP2002330191A (en) 2002-11-15
JP3875509B2 JP3875509B2 (en) 2007-01-31

Family

ID=18981762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001133996A Expired - Fee Related JP3875509B2 (en) 2001-05-01 2001-05-01 Anomaly detection method and anomaly detection system

Country Status (1)

Country Link
JP (1) JP3875509B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134830A (en) * 2006-11-28 2008-06-12 Hitachi Ltd Storage system having both power saving function and diagnostic function
JP2009501371A (en) * 2005-07-13 2009-01-15 トムソン ライセンシング Method for detecting device activity in a network of distributed stations and network station for carrying out this method
JP2012070033A (en) * 2010-09-21 2012-04-05 Nakayo Telecommun Inc Time server with terminal monitoring function

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009501371A (en) * 2005-07-13 2009-01-15 トムソン ライセンシング Method for detecting device activity in a network of distributed stations and network station for carrying out this method
JP4898804B2 (en) * 2005-07-13 2012-03-21 トムソン ライセンシング Method for detecting device activity in a network of distributed stations and network station for carrying out this method
US8335818B2 (en) 2005-07-13 2012-12-18 Thomson Licensing Method for detection of the activity of a device in a network of distributed stations, as well as a network station for carrying out the method
JP2008134830A (en) * 2006-11-28 2008-06-12 Hitachi Ltd Storage system having both power saving function and diagnostic function
US8219748B2 (en) 2006-11-28 2012-07-10 Hitachi, Ltd. Storage system comprising both power saving and diagnostic functions
JP2012070033A (en) * 2010-09-21 2012-04-05 Nakayo Telecommun Inc Time server with terminal monitoring function

Also Published As

Publication number Publication date
JP3875509B2 (en) 2007-01-31

Similar Documents

Publication Publication Date Title
US8665700B2 (en) Fault detection and mitigation for in-vehicle LAN network management
JP2002158668A (en) Abnormality detector of network system for vehicle
JP3454297B2 (en) Method and apparatus for testing a link between network switches
US5329528A (en) Duplex communication control device
JP2002330191A (en) Method and system for detecting abnormality
KR0129174B1 (en) Process for monitoring a computer
JP4099708B2 (en) Communication path failure detection apparatus and method
JP4692419B2 (en) Network device, redundant switching method used therefor, and program thereof
JP2004213412A (en) Duplex controller
JP3166135B2 (en) Redundant system
JP2006285845A (en) Information communication system having fault tolerance and information communication device having fault tolerance
JP3263932B2 (en) Data transmission equipment
JP2891135B2 (en) Software failure detection device and software failure detection method
JPH0730980A (en) Duplex control system
JP2001075935A (en) Inter-processor communication method
JP2004334548A (en) Failure monitoring system for distributed supervisory control system
JP5083069B2 (en) Transmission abnormality detection device for communication device
JPH10207745A (en) Method for confirming inter-processor existence
JP2004234183A (en) Bus check method and system for computer controller
JP2988127B2 (en) Communication control device
JP3239856B2 (en) Failure notification system and failure notification device for information processing device in local area network
JP2009015472A (en) Device monitor system for computer system
KR19990058381A (en) Network check device of distributed control system
JPH05153144A (en) Line deterioration diagnostic system for network
JPS6367842A (en) Load controlling system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061026

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees