JP2017107372A - Failure symptom detection system and failure symptom detection method - Google Patents
Failure symptom detection system and failure symptom detection method Download PDFInfo
- Publication number
- JP2017107372A JP2017107372A JP2015240182A JP2015240182A JP2017107372A JP 2017107372 A JP2017107372 A JP 2017107372A JP 2015240182 A JP2015240182 A JP 2015240182A JP 2015240182 A JP2015240182 A JP 2015240182A JP 2017107372 A JP2017107372 A JP 2017107372A
- Authority
- JP
- Japan
- Prior art keywords
- log
- detection
- failure
- failure sign
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
Description
この発明は、ソフトウェアの実行時に出力するシステムログ(以下、単にログという)の特徴から障害の予兆を検出することで、障害発生を未然に防止、もしくは早期発見する障害予兆検出システムおよびその方法に関するものである。 TECHNICAL FIELD The present invention relates to a failure sign detection system and method for detecting a failure sign from the characteristics of a system log (hereinafter simply referred to as a log) output during execution of software, thereby preventing the occurrence of a failure in advance or early detection. Is.
従来、ソフトウェアの障害検出においては、障害と紐づいたエラーログを予め定義し、ソフトウェアが稼働する現場では定義されたエラーログの発生を起因としてエラーと判定する(例えば、下記の特許文献1参照)。
Conventionally, in software fault detection, an error log associated with a fault is defined in advance, and an error is determined based on the occurrence of a defined error log at the site where the software is operating (see, for example,
列車の運行管理システムを例にとって説明すると、司令員が入力した列車番号がシステムに存在しないものである場合、システムは定義されたエラーログを出力するので、そのエラーログを確認していくことで障害の特定が行われる。 Taking the train operation management system as an example, if the train number entered by the commander does not exist in the system, the system will output a defined error log, so check the error log. Fault identification is performed.
従来のログによる障害検出方式は、このように障害に紐づいたエラーログを発生するので、エラーログが明示的に発生しない障害の場合にはその発見が遅れ、その結果、業務に支障をきたす可能性があるといった問題があった。 The failure detection method using the conventional log generates an error log linked to the failure in this way, so in the case of a failure that does not explicitly generate an error log, the discovery is delayed, resulting in trouble with business. There was a problem that there was a possibility.
この発明は、上記のような課題を解決するためになされたものであり、障害に紐づいたエラーログを明示的に発生する場合だけでなく、これに加えて、エラーログが明示的に発生しない場合でも障害予兆として検出できるようにして、より多くの障害に対して早期対応が可能となる障害予兆検出システムおよび障害予兆検出方法を提供することを目的とする。 The present invention has been made to solve the above-described problems. In addition to explicitly generating an error log associated with a failure, an error log is explicitly generated in addition to this. It is an object of the present invention to provide a failure sign detection system and a failure sign detection method that can be detected as a failure sign even when the failure is not detected, and can quickly cope with more failures.
この発明に係る障害予兆検出システムは、障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出するものであって、上記プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称と障害予兆の有無の判断に使うログを検出定義として予め作成して登録しておく検出定義作成装置と、上記ソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、上記検出定義作成装置で作成された検出定義に基づいて障害予兆を検出するログ解析装置とを備え、上記ログ解析装置は、プログラムの障害に紐づいたエラーログを検出するとともに、上記検出定義作成装置において予め作成された検出定義に基づき、プログラムの処理監視単位ごとに、本来正常な処理が実行された場合に発生すると予定されている検出ログの発生の有無を解析し、上記検出ログが発生しない場合には、これを障害予兆として検出することを特徴としている。 The failure sign detection system according to the present invention detects a failure sign based on a log output each time a software program to be analyzed for a failure is executed, and detects the failure sign of the program. A detection definition creation device that creates and registers as a detection definition the name of the process monitoring unit that defines the range and the log used to determine whether there is a sign of failure, and is output each time the software program is executed A log analysis device that acquires a log and detects a failure sign based on the detection definition created by the detection definition creation device for the acquired log, and the log analysis device is associated with a program failure. For each processing monitoring unit of the program based on the detection definition created in advance by the detection definition creation device. Analyzing the occurrence of the detection log which is scheduled the original occurs when normal processing is performed, if the detected log does not occur, is characterized by detecting this as a failure predictor.
また、この発明に係る障害予兆検出方法は、障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出するために、上記プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称と障害予兆の有無の判断に使うログを検出定義として予め作成して登録しておく第1のステップと、障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、予め作成された上記検出定義に基づいて障害予兆を検出し、障害予兆があればその旨を通知する第2のステップとを備え、上記第2のステップでは、上記ソフトウェアのプログラムの障害に紐づいたエラーログを検出した場合だけでなく、予め作成された上記検出定義に基づき、プログラムの処理監視単位ごとに処理の開始、終了を検出し、かつ本来正常な処理が実行された場合に発生すると予定されている検出ログが発生しない場合には、これを障害予兆として検出することを特徴としている。 In addition, the failure sign detection method according to the present invention detects a failure sign of the above-mentioned program in order to detect the failure sign based on a log that is output each time a software program to be analyzed for failure is executed. The first step of creating and registering as a detection definition the name of the process monitoring unit that defines the range and the log used to determine whether or not there is a sign of failure, and the software program to be analyzed for failure are executed A second step of acquiring a log output each time, detecting a failure sign for the acquired log based on the detection definition created in advance, and notifying the presence of a failure sign; In the second step, not only when an error log associated with a failure of the software program is detected, but also based on the detection definition created in advance. Detects the start and end of processing for each processing monitoring unit of the program, and detects this as a sign of failure when a detection log that is expected to occur when normal processing is executed does not occur It is characterized by that.
この発明によれば、障害に紐づいたエラーログを明示的に発生する場合だけでなく、これに加えて、エラーログが明示的に発生しない場合でも障害予兆として検出できるので、より多くの障害に対して早期対応が可能となる。 According to the present invention, not only when an error log associated with a failure is explicitly generated, but also when an error log is not explicitly generated, it can be detected as a failure sign. Early response is possible.
実施の形態1.
図1はこの発明の実施の形態1における障害予兆検出システムの構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a failure sign detection system according to
この発明の実施の形態1における障害予兆検出システム1は、検出定義作成装置100と、ログ解析装置200とにより構成される。検出定義作成装置100とログ解析装置200の間は図示しないが、ネットワーク接続もしくはCD等のメディアによりデータを受け渡すことができる。なお、各装置100、200は一般的な計算機によって構成される。
The failure
検出定義作成装置100は、障害の解析対象となるソフトウェア900について、そのプログラムが実行されるたびに出力されるログに基づいて障害予兆を検出するために、プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称や障害予兆の有無の判断に使うログなどを検出定義として予め作成して登録しておくために設けられており、定義入力部11と検出定義作成部12とからなる。
The detection
一方、ログ解析装置200は、障害の解析対象となるソフトウェア900において、そのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、検出定義作成装置100で作成された検出定義に基づいて障害予兆を検出し、障害予兆があれば、その旨を通知するものであり、ログ取得部21、ログ解析部22、検出定義管理部23、ログ状態管理部24、および障害予兆通知部25からなる。
On the other hand, the
次に、各装置100、200の具体的な構成について説明する。
Next, a specific configuration of each of the
検出定義作成装置100において、定義入力部11は、検出定義を作成するために必要となる情報を入力するインタフェースであり、例えばキーボートやマウス、タブレット端末などで構成される。検出定義作成部12は、定義入力部11から入力された情報を用いて検出定義を作成し、この検出定義の情報を図3(a)に示すような検出定義テーブルとして保持する。
In the detection
一方、ログ解析装置200において、ログ取得部21は、解析対象のソフトウェア900のプログラム実行時に発生する各種ログを取得する。また、検出定義管理部23は、検出定義作成装置100の検出定義作成部12で作成された検出定義を取得する。ログ解析部22は、ログ取得部21で取得されたログの内容を解析し、障害予兆を検出する。そのログ解析の際、ログ解析部22は、検出定義管理部23が保持する検出定義の情報を使用する。ログ状態管理部24は、ログ解析部22で解析中の状態を管理するためのメモリを備えており、ログ解析部22による解析結果を図3(b)に示すようなログ監視状態テーブルとして保持する。さらに、ログ解析部22は、ログ解析した結果、ログ状態管理部24に登録された情報に基づいて障害予兆の有無を判断し、障害予兆があると判断した場合には、その旨を障害予兆通知部25に通知する。障害予兆通知部25は、ログ解析部22からの障害予兆の通知に応じて、ログ解析装置200が備える図示しないCRTや液晶などの表画面上、あるいは外部の警報装置に対して障害予兆がある旨を通知する。
On the other hand, in the
次に、この障害予兆検出システム1の障害予兆の検出処理動作について、図2に示すフローチャートを参照して説明する。なお、符号Sは各処理ステップを意味する。
Next, the failure sign detection processing operation of the failure
この実施の形態1における処理動作は、図2(a)に示すように、検出定義を作成する作成フローS1と、図2(b)に示すように、検出定義と解析対象となるソフトウェアのログとに基づいて障害検出を実施する解析フローS2とに大別される。 The processing operation in the first embodiment includes a creation flow S1 for creating a detection definition, as shown in FIG. 2A, and a log of the software to be analyzed and the detection definition, as shown in FIG. 2B. And an analysis flow S2 for performing failure detection based on the above.
まず、作成フローS1については、定義入力部11から検出定義作成部12に対して障害予兆を検出するために必要な検出定義の情報を入力し(S11)、検出定義作成部12にその検出定義の情報を登録する(S12)。これにより、検出定義作成部12には、定義入力部11から入力された情報に基づいて、図3(a)に示すような検出定義テーブルが作成される。そして、検出定義作成部12で作成された図3(a)に示すような検出定義テーブルの情報は、ログ解析装置200の検出定義管理部23に転送されてここに登録される。
First, regarding the creation flow S1, detection definition information necessary for detecting a failure sign is input from the
図3(a)に示す検出定義テーブルの作成に際しては、障害予兆を検出する解析対象範囲としてプログラムの処理監視単位を設定して登録する。また、ソフトウェアは様々な処理の開始や実行にあたって処理が実行したことを示すトレースログを出力することが一般的である。そこで、このトレースログを利用して、処理監視単位ごとに、障害予兆の有無の判断に使うログを登録する。すなわち、処理監視単位ごとに、障害予兆検出を開始する目印となるログを開始ログ、終了時の目印となるログを終了ログとして登録する。さらに、正常に処理監視単位内のプログラムに基づく処理が正常に実行された場合に終了ログの発生直前に通常発生されるログを検出ログとして登録する。 When creating the detection definition table shown in FIG. 3A, the process monitoring unit of the program is set and registered as an analysis target range for detecting a failure sign. Further, it is common for software to output a trace log indicating that processing has been executed in starting and executing various processing. Therefore, using this trace log, a log used for determining whether there is a failure sign is registered for each process monitoring unit. That is, for each process monitoring unit, a log that serves as a mark for starting failure sign detection is registered as a start log, and a log that serves as a mark at the end is registered as a finish log. Furthermore, a log that is normally generated immediately before the end log is generated when the process based on the program in the process monitoring unit is normally executed is registered as a detection log.
一方、解析フローS2については、ログ取得部21が実行中のソフトウェアから開始ログを取得する。なお、解析対象となるソフトウェア900は、ここではプログラムの処理監視単位名ごとにマルチタクスで動作しているものとする。
On the other hand, for the analysis flow S2, the
ログ解析部22は、この開始ログが検出定義管理部23に移管されている検出定義テーブル(図3(a))に登録された開始ログに該当した場合、処理監視単位番号をキーとして、ログ状態管理部24が備える図3(b)に示すログ監視状態テーブルに対して、現在の状態を”開始”にセットする(S21)。
When this start log corresponds to the start log registered in the detection definition table (FIG. 3A) transferred to the detection
また、ログ解析部22は、ログ取得部21が取得する検出ログの発生を監視し、検出ログが発生した場合、ログ状態管理部24に設けられているログ監視状態テーブル(図3(b))に対して、検出ログの発生を”有”にセットする(S22)。
In addition, the
さらに、ログ解析部22は、ログ取得部21が取得する終了ログの発生を監視し、終了ログが発生した場合、ログ状態管理部24が備えるログ監視状態テーブル(図3(b))に対して、現在の状態を”終了”にセットする(S23)。
Further, the
そして、ログ解析部22は、ログ状態管理部24が備えるログ監視状態テーブル(図3(b))を参照して、ログ解析を行う(S24)。すなわち、終了ログの状態が”終了”になっている処理監視単位につき、検出ログの発生の有無を判断する(S25)。
Then, the
ログ解析部22は、終了ログが”終了”の状態になっているにもかかわらず、検出ログの発生が”有”でない場合、その処理監視単位のプログラムは、本来正常な処理が実行された場合に発生するはずの検出ログが発生し無かったので、その処理監視単位のプログラムには障害が有るものと判断し、障害予兆通知部25によりその旨をログ解析装置200が備える図示しないCRTや液晶などの表画面上、あるいは外部の警報装置に通知する(S26)。
The
上記処理の具体例として、図3(b)のログ監視状態テーブルにおいて、処理監視単位名が”10001”のプログラムについては、そのタスクが未だ完了していないので、開始ログの状態は”開始”のままになっていて、終了ログは未だ発生されていない。したがって、検出ログも発生されておらず、障害予兆通知部25からは障害予兆の通知は出力されない。
As a specific example of the above processing, in the log monitoring status table of FIG. 3B, for the program whose processing monitoring unit name is “10001”, the task has not yet been completed, so the status of the start log is “start”. The exit log has not been generated yet. Therefore, no detection log is generated, and no failure predictor notification is output from the failure
処理監視単位名が”10002”のプログラムについては、そのタスクが既に完了したので、終了ログが発生し、現在の状態は”終了”となっている。にもかかわらず、検出ログの発生状態は”無”なので、この場合には、処理監視単位名が”10002”のプログラム処理には障害が発生している可能性がある。このため、障害予兆通知部25から障害予兆の通知が出力される。
For the program whose process monitoring unit name is “10002”, since the task has already been completed, an end log is generated and the current state is “end”. Nevertheless, since the detection log generation state is “None”, in this case, there is a possibility that a failure has occurred in the program processing whose process monitoring unit name is “10002”. Therefore, a failure sign notification is output from the failure
一方、処理監視単位名が”10003”のプログラムについては、そのタスクが既に完了したので、終了ログが発生して現在の状態は”終了”となっている。また、検出ログが正常に発生されたので、その発生状態が”有”となっている。この場合には、処理監視単位名が”10003”のプログラム処理は正常に実行されたものと判断し、このため、障害予兆通知部25から障害予兆の通知は出力されない。
On the other hand, for the program whose process monitoring unit name is “10003”, since the task has already been completed, an end log is generated and the current state is “end”. In addition, since the detection log is generated normally, the generation state is “present”. In this case, it is determined that the program process having the process monitoring unit name “10003” has been normally executed, and therefore, the failure
なお、処理監視単位名が”10011”のプログラムについては、そのタスクの実行完了前にプログラムの明確な障害に紐づいたエラーログが発生されているので、その場合には検出ログの発生の有無にかかわらず、障害予兆通知部25から障害予兆の通知が出力される。
For the program whose process monitoring unit name is “10011”, an error log associated with a clear failure of the program is generated before the execution of the task is completed. Regardless, the failure
このように、この実施の形態1では、検出定義作成装置100において予め作成した検出定義に基づき、ログ解析装置200によりプログラムの処理監視単位ごとに処理の開始、終了を検出し、本来正常な処理が実行された場合に発生すると予定されている検出ログが発生しないことが分かった場合には、これを障害予兆として検出するようにした。その結果、障害に紐づいたエラーログを検出する場合に加えて、明示的にエラーログが発生しない場合でも、障害予兆を検出することができる。このため、より多くの障害に対して早期対応が可能となるという効果が得られる。
As described above, in the first embodiment, based on the detection definition created in advance by the detection
実施の形態2.
図4はこの実施の形態2における障害予兆検出システムの構成を示すブロック図であり、図1に示した実施の形態1の構成と対応する部分には同一の符号を付す。
FIG. 4 is a block diagram showing the configuration of the failure sign detection system according to the second embodiment, and parts corresponding to those of the configuration of the first embodiment shown in FIG.
この実施の形態2の特徴は、上記実施の形態1の構成に対して、試験情報解析装置300を追加し、これによって解析対象となるソフトウェア900の試験実施に伴って、図3(a)に示したような検出定義テーブルが簡便に作成できるようにしていることである。
The feature of the second embodiment is that a test
解析対象となるソフトウェア900がインストールされる製品は、製品の出荷前に当該ソフトウェア900が所定通りに動作するか否かが試験される。その試験に際しては、予め正常な結果が得られることが期待されるデータを入力するだけでなく、間違った結果が得られるデータを故意に入力してエラーを発生させ、ソフトウェア900が正しく動作することを確認する。
A product in which the
そこで、この実施の形態2では、試験情報解析装置300を、試験情報入力部31、試験情報解析部32、および試験情報送信部33で構成している。
Therefore, in the second embodiment, the test
ここに、試験情報入力部31は、試験内容を定義するために必要となる試験情報を入力するインタフェースであり、例えばキーボートやマウス、タブレット端末などで構成される。この場合、試験内容を定義するために必要となる試験情報としては、処理監視対象となる個々のプログラムに対応付けた試験番号、処理監視単位名、当該プログラムの試験結果を想定して正常/異常となる情報が入力される。
Here, the test
試験情報解析部32は、試験情報入力部31から入力された試験内容を定義した試験情報を、図5に示すような試験定義テーブルとしてメモリに保持するとともに、この試験定義テーブルに基づいて、ソフトウェア900のプログラムが処理監視単位ごとに所定通りに動作するか否かの試験が実施される際に、そのソフトウェア900の処理監視単位ごとのプログラム実行による試験結果が正常となる際に得られるログ情報を抽出する。
The test
すなわち、試験情報解析部32は、処理監視単位ごとに実行されたプログラムの処理結果が正常となる場合に得られる検出ログを抽出する。そして、試験情報解析部32は、こうして抽出した情報(処理監視単位名と検出ログ)を、試験情報送信部33を介して検出定義作成装置100に検出定義の情報として送信する。
That is, the test
そして、検出定義作成部12において、試験情報解析装置300から送られてくる検出定義の情報に、さらに開始ログと終了ログとを処理監視単位名ごとに人手で別途追加することで、図3(a)に示したような検出定義テーブルが完成される。
Then, the detection
これにより、図3(a)に示したような検出定義テーブルをソフトウェア900の試験を実施する際に簡便に作成できるので、障害予兆解析を行う上で必要な検出定義テーブルを検出定義作成装置100で独自に作成する場合に比べて、その手間や準備時間を削減することができるという効果が得られる。
なお、その他の構成および作用効果は、実施の形態1の場合と同様であるから、ここでは詳しい説明は省略する。
As a result, the detection definition table as shown in FIG. 3A can be easily created when the test of the
Since other configurations and operational effects are the same as those in the first embodiment, detailed description thereof is omitted here.
実施の形態3.
図6はこの発明の実施の形態3における障害予兆検出システムの構成を示すブロック図であり、図4に示した実施の形態2の構成と対応する部分には同一の符号を付す。
FIG. 6 is a block diagram showing the configuration of the failure sign detection system according to the third embodiment of the present invention, and the same reference numerals are given to the portions corresponding to the configuration of the second embodiment shown in FIG.
解析対象となるソフトウェア900のプログラム内の一部の処理範囲を実行する場合、その処理内容によっては、エラーログが発生されない限り、検出ログが発生されなくても全体の処理結果に影響を及ぼさない程度のもので、運用上、支障のないプログラムが存在することがある。
When a part of the processing range in the program of the
そこで、この実施の形態3では、上記実施の形態2の構成に対して、ログ解析装置200内に障害該当判定部26を追加し、この障害該当判定部26には、図7に示すように、検出ログが発生されなくても、障害予兆を殊更通知する必要がないことを定義できる障害判定テーブルを予め設定してメモリに登録している。
Therefore, in the third embodiment, a failure
例えば、図7に示す障害判定テーブルにおいて、処理監視単位名が”1001”や”1003”のプログラムについては、そのタスクが既に完了して現在の状態が”終了”となる場合に検出ログの発生が無ければ、障害予兆があるとして障害予兆通知部25による通知を許容(YES)するように予め設定しておく。
For example, in the failure determination table shown in FIG. 7, for a program whose process monitoring unit name is “1001” or “1003”, a detection log is generated when the task has already been completed and the current state is “finished” If there is no failure, it is set in advance to allow (YES) notification by the failure
これに対して、処理監視単位名が”1002”のプログラムについては、そのタスクが既に完了して現在の状態が”終了”となる場合に検出ログの発生がなくても、障害予兆通知部25による通知は不要(No)と予め設定しておく。
On the other hand, for the program whose process monitoring unit name is “1002”, the failure
したがって、前述の実施の形態1では、図3(b)に示したように、処理監視単位名が”1002”のプログラムについては、そのタスクが既に完了して現在の状態が”終了”となっている場合に検出ログの発生がなければ障害予兆通知部25による通知がなされるのに対して、この実施の形態3では、障害該当判定部26が図7に示した障害判定テーブルを参照することにより、検出ログの発生がない場合でも障害予兆通知部25による通知が抑止される。
Therefore, in the above-described first embodiment, as shown in FIG. 3B, for the program whose process monitoring unit name is “1002”, the task has already been completed and the current state becomes “finished”. In the third embodiment, the failure
このように、この実施の形態3では、障害該当判定部26を設け、プログラム内の一部の処理範囲を実行する際、その処理内容によって全体の処理結果に影響を及ぼさない程度のものである場合には、検出ログの発生がなくても運用上、特に支障はないと判断して障害予兆通知を抑止することが可能になる。これにより、各処理監視単位名のプログラムの全てについて通知の有無を確認する手間を省くことができ、特に確認数が多くなるような障害予兆通知がある場合に確認時間を削減できるという効果が得られる。
なお、その他の構成および作用効果は、実施の形態2の場合と同様であるから、ここでは詳しい説明は省略する。
As described above, in the third embodiment, the
Since other configurations and operational effects are the same as those in the second embodiment, detailed description thereof is omitted here.
実施の形態4.
図8はこの発明の実施の形態4における障害予兆検出システムの構成を示すブロック図であり、図6に示した実施の形態3の構成と対応する部分には同一の符号を付す。
Embodiment 4 FIG.
FIG. 8 is a block diagram showing the configuration of the failure sign detection system according to the fourth embodiment of the present invention, and parts corresponding to those of the configuration of the third embodiment shown in FIG.
この実施の形態4の特徴は、図8に示すように、上記実施の形態3の構成に対して、ログ追加処理部41とログ追加情報送信部42からなるソース管理装置400を追加し、これによって解析対象となるソフトウェア900の試験に伴って図3(a)に示したような検出定義テーブルが自動的に作成できるようにしていることである。
As shown in FIG. 8, the feature of the fourth embodiment is that a
ここに、ログ追加処理部41は、試験番号に対応した処理監視単位ごとのプログラムのソースコードの開始時点を示す開始ログと終了時点を示す終了ログの情報を入力し、ログ追加情報送信部42は、このログ追加処理部41で追加された開始ログと終了ログの情報を試験情報解析装置300に送信する。
Here, the log
このログ追加処理部41から送信された開始ログと終了ログの情報は、試験情報入力部31を介して試験情報解析部32に取り込まれるので、試験情報解析部32が備える試験定義テーブルには、図9に示すように、処理監視対象となる個々のプログラムに対応付けた試験番号、処理監視単位名、当該プログラムの試験結果が正常/異常となる情報(図5参照)だけでなく、さらに、試験番号に対応した処理監視単位ごとのプログラムのソースコード、そのソースコードの開始時点を示す開始ログと終了時点を示す終了ログの情報も併せて登録される。
Since the information of the start log and the end log transmitted from the log
試験情報解析装置300は、実施の形態2で説明したように、解析対象となるソフトウェア900のプログラムの処理監視単位ごとに所定通りに動作するか否かの試験が実施される際に、そのソフトウェア900の処理監視単位ごとのプログラム実行による試験結果が正常となる際に得られるログ情報を抽出する。この場合に抽出される情報としては、処理監視単位名、検出ログ、開始ログ、終了ログが含まれる。そして、こうして抽出した情報が検出定義作成装置100に対して検出定義として送信されるので、検出定義作成部12は、図3(a)に示したような検出定義テーブルが自動的に作成される。
As described in the second embodiment, the test
このように、この実施の形態4では、実施の形態3の構成に対してソース管理装置400を追加し、これによって解析対象となるソフトウェア900の試験に伴って図3(a)に示したような検出定義テーブルが自動的に作成されるため、障害予兆解析のために必要とする検出定義テーブルを検出定義作成装置100で独自に作成する場合に比べて、その手間や準備時間を大幅に削減できるという効果が得られる。
なお、その他の構成および作用効果は、実施の形態3の場合と同様であるから、ここでは詳しい説明は省略する。
As described above, in the fourth embodiment, the
Since other configurations and operational effects are the same as those in the third embodiment, detailed description thereof is omitted here.
実施の形態5.
図10はこの発明の実施の形態5における障害予兆検出システムの構成を示すブロック図であり、図8に示した実施の形態4の構成と対応する部分には同一の符号を付す。
Embodiment 5. FIG.
FIG. 10 is a block diagram showing the configuration of the failure sign detection system according to the fifth embodiment of the present invention. The same reference numerals are given to the portions corresponding to the configuration of the fourth embodiment shown in FIG.
この実施の形態5では、図10に示すように、上記実施の形態4の構成に対して、ソース管理装置400内に、影響通知部43を追加し、この影響通知部43には、図11に示すような、各処理監視単位名に関連するソースコードとその参照元や参照先のプログラムのソースコードとの関連を定義したソース参照関連管理テーブルを予めメモリに登録して保持している。そして、このソース参照関連管理テーブルの情報を障害該当判定部26に通知するようにしている。
In the fifth embodiment, as shown in FIG. 10, an
これにより、ログ解析部22のログ解析の結果、所定の処理監視単位名をもつプログラムのタスクが既に完了して現在の状態が”終了”となっているにもかかわらず、検出ログの発生がないと解析された場合であって、かつ、障害該当判定部26に予め登録されている図7に示した障害判定テーブルにより、検出ログ未発生時に障害予兆を通知することが許容(YES)されていると判定された場合、障害該当判定部26は、影響通知部43から通知された図11に示すソース参照関連管理テーブルを参照して、当該処理監視単位名をもつプログラムのソースコードとその参照元や参照先のプログラムのソースコードを、障害予兆通知部25を介して例えば図示しないCRTや液晶などの表画面上に通知する。
Thereby, as a result of the log analysis by the
例えば、処理監視単位名が”10001”をもつプログラムに障害予兆があると判定される場合、図11に示したソース参照関連管理テーブルに基づき、そのソースコード”AAA.c”と、その参照元であるプログラムのソースコード”main.c”や、参照先のプログラムのソースコード”AAA−1.c”や”AAA−2.c”が通知される。 For example, when it is determined that there is a failure sign in a program having the process monitoring unit name “10001”, the source code “AAA.c” and its reference source are based on the source reference relation management table shown in FIG. The source code “main.c” of the program and the source code “AAA-1.c” and “AAA-2.c” of the reference destination program are notified.
これにより、所定の処理監視単位名をもつプログラムについて、そのソースコードが変更された場合に検出ログが発生しなかった時には、その変更されたソースコードの参照元や参照先のプログラムのソースコードについても障害予兆発生の可能性ありとして、再度確認することができるので、ソースコードの変更に伴って発生する可能性のある周辺処理のプログラムについての障害予兆を漏らさず検出することができる。このため、より多くの障害に対して早期対応が可能となる効果が得られる。
なお、その他の構成および作用効果は、実施の形態4の場合と同様であるから、ここでは詳しい説明は省略する。
As a result, when a detection log does not occur when the source code of a program having a predetermined process monitoring unit name is changed, the source code of the changed source code reference source or the reference destination program Since it is possible to confirm again that there is a possibility that a failure sign has occurred, it is possible to detect a failure sign for a peripheral processing program that may occur in accordance with a change in the source code. For this reason, the effect that the early response | compatibility with respect to more faults is attained is acquired.
Other configurations and operational effects are the same as those of the fourth embodiment, and thus detailed description thereof is omitted here.
この発明は上記の実施の形態1〜5の構成のみに限定されるものではなく、この発明の趣旨を逸脱しない範囲において、各実施の形態1〜5の構成の一部に変形を加えたり、構成の一部を省略することができ、さらに、各実施の形態1〜5の構成を適宜組み合わせることが可能である。 The present invention is not limited to the configurations of the first to fifth embodiments described above, and may be modified to a part of the configurations of the first to fifth embodiments without departing from the spirit of the present invention. Part of the configuration can be omitted, and the configurations of the first to fifth embodiments can be combined as appropriate.
1 障害予兆検出システム、100 検出定義作成装置、11 定義入力部、
12 検出定義作成部、200 ログ解析装置、21 ログ取得部、22 ログ解析部、23 検出定義管理部、24 ログ状態管理部、25 障害予兆通知部、
26 障害該当判定部、300 試験情報解析装置、31 試験情報入力部、
32 試験情報解析部、33 試験情報送信部、400 ソース管理装置、
41 ログ追加処理部、42 ログ追加情報送信部、43 影響通知部。
1 failure sign detection system, 100 detection definition creation device, 11 definition input unit,
12 detection definition creation unit, 200 log analysis device, 21 log acquisition unit, 22 log analysis unit, 23 detection definition management unit, 24 log state management unit, 25 failure sign notification unit,
26 failure determination unit, 300 test information analyzer, 31 test information input unit,
32 test information analysis unit, 33 test information transmission unit, 400 source management device,
41 log addition processing unit, 42 log additional information transmission unit, 43 influence notification unit.
Claims (6)
上記プログラムの障害予兆を検出する範囲を規定する処理監視単位の名称と障害予兆の有無の判断に使うログを検出定義として予め作成して登録しておく検出定義作成装置と、上記ソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、上記検出定義作成装置で作成された検出定義に基づいて障害予兆を検出するログ解析装置とを備え、
上記ログ解析装置は、上記プログラムの障害に紐づいたエラーログを検出するとともに、上記検出定義作成装置において予め作成された検出定義に基づき、上記プログラムの処理監視単位ごとに、本来正常な処理が実行された場合に発生すると予定されている検出ログの発生の有無を解析し、上記検出ログが発生しない場合には、これを障害予兆として検出することを特徴とする障害予兆検出システム。 A failure sign detection system that detects a failure sign based on a log that is output each time a software program that is subject to failure analysis is executed,
A detection definition creation device for creating and registering as a detection definition a name of a process monitoring unit that defines a range in which a failure sign of the program is detected and a log used to determine whether or not there is a failure sign, and a program for the software A log analysis device that acquires a log that is output each time it is executed, and that detects a failure sign based on the detection definition created by the detection definition creation device for the acquired log;
The log analysis device detects an error log associated with the failure of the program, and performs normal processing for each processing monitoring unit of the program based on the detection definition created in advance by the detection definition creation device. A failure sign detection system that analyzes whether or not a detection log that is expected to occur when executed is detected, and detects the detection log as a failure sign when the detection log is not generated.
障害の解析対象となるソフトウェアのプログラムが実行されるたびに出力されるログを取得し、その取得したログに対して、予め作成された上記検出定義に基づいて障害予兆を検出し、障害予兆があればその旨を通知する第2のステップとを備え、
上記第2のステップでは、上記ソフトウェアのプログラムの障害に紐づいたエラーログを検出した場合だけでなく、予め作成された上記検出定義に基づき、プログラムの処理監視単位ごとに処理の開始、終了を検出し、かつ本来正常な処理が実行された場合に発生すると予定されている検出ログが発生しない場合には、これを障害予兆として検出することを特徴とする障害予兆検出方法。 In order to detect a failure sign based on a log that is output each time a software program that is subject to failure analysis is executed, the name of the process monitoring unit that defines the range in which the failure sign of the program is detected and the failure sign A first step of creating and registering a log used for determining whether or not there is a detection definition in advance;
Obtain a log that is output each time a software program that is subject to failure analysis is executed, detect a failure sign for the acquired log based on the detection definition created in advance, And a second step for notifying that if any,
In the second step, not only when an error log associated with a failure of the software program is detected, but also based on the detection definition created in advance, the start and end of processing for each process monitoring unit of the program. A failure sign detection method, wherein when a detection log that is detected and is expected to occur when normal processing is executed does not occur, this is detected as a failure sign.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015240182A JP6410705B2 (en) | 2015-12-09 | 2015-12-09 | Failure sign detection system and failure sign detection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015240182A JP6410705B2 (en) | 2015-12-09 | 2015-12-09 | Failure sign detection system and failure sign detection method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017107372A true JP2017107372A (en) | 2017-06-15 |
JP6410705B2 JP6410705B2 (en) | 2018-10-24 |
Family
ID=59059682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015240182A Expired - Fee Related JP6410705B2 (en) | 2015-12-09 | 2015-12-09 | Failure sign detection system and failure sign detection method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6410705B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113901295A (en) * | 2021-09-16 | 2022-01-07 | 苏州浪潮智能科技有限公司 | Automatic fault detail capturing method and equipment based on diag system and storage medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011159011A (en) * | 2010-01-29 | 2011-08-18 | Toshiba It Service Kk | System and program for monitoring job |
JP2012123783A (en) * | 2010-12-07 | 2012-06-28 | Internatl Business Mach Corp <Ibm> | Appropriate alert distribution method, system, and computer program |
JP2012168702A (en) * | 2011-02-14 | 2012-09-06 | Nippon Telegr & Teleph Corp <Ntt> | Log analysis device and log analysis method |
WO2012160637A1 (en) * | 2011-05-23 | 2012-11-29 | 富士通株式会社 | Message determination device and message determination program |
JP2015212857A (en) * | 2014-05-01 | 2015-11-26 | 日本電信電話株式会社 | Terminal log management system, terminal log management device, terminal log management method, and terminal log management program |
-
2015
- 2015-12-09 JP JP2015240182A patent/JP6410705B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011159011A (en) * | 2010-01-29 | 2011-08-18 | Toshiba It Service Kk | System and program for monitoring job |
JP2012123783A (en) * | 2010-12-07 | 2012-06-28 | Internatl Business Mach Corp <Ibm> | Appropriate alert distribution method, system, and computer program |
JP2012168702A (en) * | 2011-02-14 | 2012-09-06 | Nippon Telegr & Teleph Corp <Ntt> | Log analysis device and log analysis method |
WO2012160637A1 (en) * | 2011-05-23 | 2012-11-29 | 富士通株式会社 | Message determination device and message determination program |
JP2015212857A (en) * | 2014-05-01 | 2015-11-26 | 日本電信電話株式会社 | Terminal log management system, terminal log management device, terminal log management method, and terminal log management program |
Non-Patent Citations (1)
Title |
---|
外川 遼介 外1名: "「ログの出力パターンに基づく大規模システム向けログ分析手法の開発と評価」", 電子情報通信学会技術研究報告, vol. 第114巻,第390号, JPN6018033198, 8 January 2015 (2015-01-08), pages pp.13−18 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113901295A (en) * | 2021-09-16 | 2022-01-07 | 苏州浪潮智能科技有限公司 | Automatic fault detail capturing method and equipment based on diag system and storage medium |
CN113901295B (en) * | 2021-09-16 | 2024-02-02 | 苏州浪潮智能科技有限公司 | Automatic fault detail grabbing method, equipment and storage medium based on diag system |
Also Published As
Publication number | Publication date |
---|---|
JP6410705B2 (en) | 2018-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108683562B (en) | Anomaly detection positioning method and device, computer equipment and storage medium | |
US20130311977A1 (en) | Arrangement and method for model-based testing | |
WO2012157471A1 (en) | Fault sensing system for sensing fault in plurality of control systems | |
US20160077910A1 (en) | Supportability framework for mobile software applications | |
EP2073121A2 (en) | Analyzer and analyzing system, and computer program product | |
WO2012046293A1 (en) | Fault monitoring device, fault monitoring method and program | |
US10185612B2 (en) | Analyzing the availability of a system | |
WO2019000963A1 (en) | Pre-inspection method for service system, server, and computer readable storage medium | |
GB2440069A (en) | Monitoring simulating device, method, and program | |
JPWO2016135859A1 (en) | Supervisory control device | |
JP6238221B2 (en) | Apparatus, method and program for monitoring execution of software | |
JP6410705B2 (en) | Failure sign detection system and failure sign detection method | |
JP6375200B2 (en) | Apparatus and method for detecting abnormal signs of computer system | |
US9372746B2 (en) | Methods for identifying silent failures in an application and devices thereof | |
JP7131486B2 (en) | Control system, programmable logic controller and information processing method | |
JP2012146049A (en) | Batch job delay alarm automatic raising system, automatic alarm raising method and program therefor | |
JP2009059204A (en) | Computer remote control system | |
US10880151B2 (en) | Notification control device, notification control system, notification control method, and storage medium | |
JP2010055305A (en) | System, method and program for registering diagnostic item | |
JP5224759B2 (en) | Test formula creation support system, test formula creation support method, and test formula creation support program | |
CN107291588B (en) | Method and device for generating XM L log | |
CN114064341A (en) | Fault disposal method and system based on emergency plan | |
JP2018028798A (en) | Information processing apparatus and program | |
JP2017227973A (en) | Abnormality analysis support system and abnormality analysis support device | |
JP2015132908A (en) | Industrial computer monitoring apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180828 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180925 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6410705 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |