JP5267109B2 - Failure detection system verification apparatus, failure detection system verification method, and failure detection system verification control program - Google Patents

Failure detection system verification apparatus, failure detection system verification method, and failure detection system verification control program Download PDF

Info

Publication number
JP5267109B2
JP5267109B2 JP2008328429A JP2008328429A JP5267109B2 JP 5267109 B2 JP5267109 B2 JP 5267109B2 JP 2008328429 A JP2008328429 A JP 2008328429A JP 2008328429 A JP2008328429 A JP 2008328429A JP 5267109 B2 JP5267109 B2 JP 5267109B2
Authority
JP
Japan
Prior art keywords
failure
type
state
state model
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008328429A
Other languages
Japanese (ja)
Other versions
JP2010152539A (en
Inventor
知広 猪鹿倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008328429A priority Critical patent/JP5267109B2/en
Publication of JP2010152539A publication Critical patent/JP2010152539A/en
Application granted granted Critical
Publication of JP5267109B2 publication Critical patent/JP5267109B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

この発明は、障害発見システム検証装置、障害発見システム検証方法及び障害発見システム検証制御プログラムに係り、たとえばネットワークに接続されている複数の機器を組み合わせて所定のサービスを提供するシステムの動作を監視し、障害を発見したときに報告する機能を有する障害発見システムに対して、同障害発見システムで機能の調整が行われたときの調整結果の良否を検証し、管理者などに提示する場合に用いて好適な障害発見システム検証装置、障害発見システム検証方法及び障害発見システム検証制御プログラムに関する。   The present invention relates to a failure detection system verification device, a failure detection system verification method, and a failure detection system verification control program. For example, the present invention monitors the operation of a system that provides a predetermined service by combining a plurality of devices connected to a network. Used to verify the quality of the adjustment result when the function is adjusted in the fault detection system and report it to the administrator etc. The present invention relates to a fault detection system verification apparatus, a fault detection system verification method, and a fault detection system verification control program.

ネットワークに接続されている複数の機器を組み合わせて所定のサービスを提供するシステム(「サービス提供システム」という)が構築されているが、このサービス提供システムの動作を監視し、障害が発生したときに管理者に報告する障害発見システムがある。
この種の障害発見システムは、あらゆるサービス提供システムに合わせて常に適切に動作することは困難であるため、障害が発生したことを判断するための閾値の設定や原因の分析を行うためのルールの学習などを行い、監視の対象となるサービス提供システムに対応して随時調整を行う必要がある。また、障害発見システムを調整する場合、調整後の動作結果に基づいて、障害を正しく検出できること、及び、障害でないものを障害として誤検出することがないことを検証する必要がある。このため、障害発見システムの調整結果の良否を検証するための障害発見システム検証装置が要求されている。
A system that provides a predetermined service by combining multiple devices connected to the network (referred to as a “service provision system”) has been constructed. When a failure occurs, the operation of this service provision system is monitored. There is a fault detection system that reports to the administrator.
This kind of failure detection system is difficult to always operate properly for any service provision system, so the rules for setting thresholds and analyzing the cause of failure are determined. It is necessary to make adjustments from time to time in response to the service provision system to be monitored by learning and the like. Further, when adjusting the failure detection system, it is necessary to verify that a failure can be detected correctly and that a non-failure is not erroneously detected as a failure based on the adjusted operation result. For this reason, there is a demand for a failure detection system verification device for verifying the quality of the adjustment result of the failure detection system.

この種の関連する技術としては、たとえば、特許文献1に記載されたテストデータ管理システムがある。
このシステムは、図9に示すように、入力装置1と、出力装置2と、データ処理装置10と、記憶装置20とから構成されている。データ処理装置10は、条件設定部11と、試験用データ生成部12と、試験実施部13と、結果比較部14とから構成されている。記憶装置20は、試験用台帳部21と、システム状態蓄積データベース22とから構成されている。また、試験実施部13には、試験対象の障害発見システム30が接続されている。
As this type of related technology, for example, there is a test data management system described in Patent Document 1.
As shown in FIG. 9, this system includes an input device 1, an output device 2, a data processing device 10, and a storage device 20. The data processing apparatus 10 includes a condition setting unit 11, a test data generation unit 12, a test execution unit 13, and a result comparison unit 14. The storage device 20 includes a test ledger unit 21 and a system state storage database 22. The test execution unit 13 is connected with a failure detection system 30 to be tested.

このシステムでは、入力装置1により障害事例の種類が指定され、条件設定部11に設定される。また、試験用データ生成部12により、システム状態蓄積データベース22から、条件設定部11に設定された種類の障害が発生したときの過去のシステム状態が取得され、この障害発生時のシステム状態を模した試験用データが生成される。この試験用データは、試験実施部13により、障害発見システム30に与えられる。結果比較部14により、障害発見システム30が導き出した結論と、条件指定部11に設定された障害の種類とが等しいか否かが検証され、この検証結果が出力装置2に出力される。すなわち、障害発見システム30に対して、実際の障害事例のときのシステム状態を試験用データとしてかけることにより、同障害発見システム30の分析結果として障害と検出したか、また、この分析結果は実際に起きた障害と等しいものか否かを確認することで、障害発見システム30が正しく動作しているか否かが確認される。
特開2004−220356号公報(要約書、図1)
In this system, the type of failure case is designated by the input device 1 and set in the condition setting unit 11. Further, the test data generation unit 12 acquires from the system state accumulation database 22 the past system state when the type of failure set in the condition setting unit 11 occurs, and simulates the system state at the time of this failure occurrence. The test data is generated. The test data is given to the failure detection system 30 by the test execution unit 13. The result comparison unit 14 verifies whether the conclusion derived by the failure detection system 30 is equal to the type of failure set in the condition designating unit 11, and outputs the verification result to the output device 2. That is, the failure detection system 30 is detected as a failure as an analysis result of the failure detection system 30 by applying the system state at the time of an actual failure case as test data, or the analysis result is actually It is confirmed whether or not the failure detection system 30 is operating correctly by checking whether or not the failure is equal to the failure that occurred.
Japanese Unexamined Patent Publication No. 2004-220356 (Abstract, FIG. 1)

しかしながら、上記文献に記載の技術では、次のような問題点があった。
すなわち、図9のテストデータ管理システムでは、障害発見システム30のテストの精度を高める場合、大量のデータを用いてテストする必要があるが、この場合、同障害発見システム30の動作結果も大量になり、担当者による検証作業の負荷が大きくなる。このため、担当者は、障害発見システムの動作結果の検証を効率的に行うことができないという問題点がある。
However, the technique described in the above document has the following problems.
That is, in the test data management system of FIG. 9, in order to increase the test accuracy of the failure detection system 30, it is necessary to perform a test using a large amount of data. In this case, the operation result of the failure detection system 30 is also large. Thus, the burden of verification work by the person in charge increases. For this reason, there is a problem that the person in charge cannot efficiently verify the operation result of the failure detection system.

この発明は、上述の事情に鑑みてなされたもので、障害発見システムの調整結果の検証を効率的に行うための障害発見システム検証装置、障害発見システム検証方法及び障害発見システム検証制御プログラムを提供することを目的としている。   The present invention has been made in view of the above circumstances, and provides a failure detection system verification device, a failure detection system verification method, and a failure detection system verification control program for efficiently verifying the adjustment result of the failure detection system The purpose is to do.

上記課題を解決するために、この発明の第1の構成は、障害発見システム検証装置に係り、所定のサービスを提供するサービス提供システムの障害を検出して障害検出結果を出力する障害発見システムを試験対象とし、前記サービス提供システムの状態情報及び前記障害発見システムから出力される前記障害検出結果に基づいて、障害の種類毎に前記サービス提供システムの状態情報の統計データを示す障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する発見障害事例毎に、前記サービス提供システムの状態情報の前記障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示する構成とされていることを特徴としている。   In order to solve the above-described problem, a first configuration of the present invention relates to a failure detection system verification device, and relates to a failure detection system that detects a failure of a service providing system that provides a predetermined service and outputs a failure detection result. State model for each failure type indicating statistical data of the state information of the service providing system for each type of failure based on the state information of the service providing system and the failure detection result output from the failure discovery system as a test target For each discovered failure case that constitutes the failure detection result, a degree of deviation indicating the degree of deviation of the state information of the service providing system from the state model according to the failure type is obtained, and the degree of deviation is large. It is characterized in that the detection failure cases are presented in order.

この発明の第2の構成は、障害発見システム検証方法に係り、所定のサービスを提供するサービス提供システムの障害を検出して障害検出結果を出力する障害発見システムを試験対象とし、障害発見システム検証装置が、前記サービス提供システムの状態情報及び前記障害発見システムから出力される前記障害検出結果に基づいて、障害の種類毎に前記サービス提供システムの状態情報の統計データを示す障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する発見障害事例毎に、前記サービス提供システムの状態情報の前記障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示することを特徴としている。   A second configuration of the present invention relates to a failure detection system verification method, and a failure detection system that detects a failure of a service providing system that provides a predetermined service and outputs a failure detection result is tested. A state model for each failure type indicating statistical data of the state information of the service providing system for each type of failure based on the state information of the service providing system and the failure detection result output from the failure discovery system. For each discovered failure case that constitutes the failure detection result, the degree of deviation indicating the degree of deviation of the state information of the service providing system from the state model according to the failure type is obtained, and the order of the deviation from the largest The discovery failure case is presented.

この発明の第3の構成は、コンピュータ読み取り可能な障害発見システム検証制御プログラムに係り、所定のサービスを提供するサービス提供システムの障害を検出して障害検出結果を出力する障害発見システムを試験対象とし、コンピュータで構成された障害発見システム検証装置が、前記サービス提供システムの状態情報及び前記障害発見システムから出力される前記障害検出結果に基づいて、障害の種類毎に前記サービス提供システムの状態情報の統計データを示す障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する発見障害事例毎に、前記サービス提供システムの状態情報の前記障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示する処理を実行することを特徴としている。   A third configuration of the present invention relates to a computer-readable failure detection system verification control program, and targets a failure detection system that detects a failure of a service providing system that provides a predetermined service and outputs a failure detection result as a test target. The failure detection system verification device configured by a computer, based on the state information of the service providing system and the failure detection result output from the failure detection system, stores the state information of the service providing system for each type of failure. A failure type state model indicating statistical data is generated, and for each discovered failure case constituting the failure detection result, a degree of deviation indicating a degree of deviation of the state information of the service providing system from the state model by failure type is indicated. And processing for presenting the detected failure cases in descending order of the degree of deviation. It is characterized by rows.

この発明の構成によれば、同じ種類の障害と判断された他の検出事例と比べて、システムの状態が大きく乖離している障害検出事例が優先的に提示され、管理者は、検出結果に誤りがある可能性の高い障害検出事例を効率的に認識することができる。これにより、管理者は、障害発見システムの動作結果の検証を効率的に行うことができる。   According to the configuration of the present invention, a failure detection case in which the state of the system is greatly deviated from the other detection cases determined to be the same type of failure is preferentially presented, and the administrator can It is possible to efficiently recognize failure detection cases that are likely to have errors. Thereby, the administrator can efficiently verify the operation result of the failure detection system.

障害発見システムは、サービス提供システムの障害を発見するための所定の調整が行われる構成とされ、上記サービス提供システムの状態情報が集積されてなる試験用データが与えられた上記障害発見システムから出力される上記障害検出結果を障害の種類毎に分類し、上記試験用データに基づいて上記障害の種類毎に上記サービス提供システムの状態を示す各状態パラメータの統計データを求めて上記障害種類別状態モデルを生成すると共に、上記障害検出結果を構成する各発見障害事例毎に、上記試験用データから、各障害が発生した時刻及び場所に対応する上記サービス提供システムの状態情報を取り出し、該状態情報を上記発見障害事例の障害種類に対応する上記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に上記発見障害事例を提示する障害発見システム検証装置を提供する。   The failure detection system is configured to perform a predetermined adjustment for detecting a failure in the service providing system, and is output from the failure detection system to which test data in which status information of the service providing system is accumulated is given. The failure detection result is classified for each failure type, and statistical data of each state parameter indicating the state of the service providing system is obtained for each failure type based on the test data. A model is generated, and for each discovered failure case constituting the failure detection result, state information of the service providing system corresponding to the time and place where each failure occurs is extracted from the test data, and the state information is extracted. Is compared with the state model according to the failure type corresponding to the failure type of the detected failure case, the state model for the failure type Seek out level indicating the degree of release, to provide a trouble detection system verification device for presenting the discovery failure cases in order from the 該外Re degree large.

また、この発明の好適な形態では、障害発見システム検証装置は、上記試験用データに基づいて、上記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成すると共に、上記外れ度を求める際に、システム状態を構成する状態パラメータのうち、上記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び上記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを優先的に使用する構成とされている。   Also, in a preferred embodiment of the present invention, the failure detection system verification device obtains statistical data of each state parameter indicating a normal state of the service providing system based on the test data, and obtains a normal state model. When generating the above-mentioned degree of deviation, among the state parameters constituting the system state, the behavior in the state model by failure type is the state model by failure type other than the state model and the state model at normal time. The state model having characteristic parameters as compared with the above behavior is preferentially used.

また、この発明の好適な形態では、障害発見システム検証装置は、上記試験用データが与えられた上記障害発見システムから出力される上記障害検出結果を障害の種類毎に分類する障害種類分類手段と、上記試験用データに基づいて上記障害の種類毎に上記サービス提供システムの状態を示す各状態パラメータの統計データを求めて障害種類別状態モデルを生成する障害種類別状態モデル生成手段と、上記障害検出結果を構成する各発見障害事例毎に、上記試験用データから、各障害が発生した時刻及び場所に対応する上記サービス提供システムの状態情報を取り出し、該状態情報を上記発見障害事例の障害種類に対応する上記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求める外れ度計算手段と、上記外れ度の大きい上記発見障害事例から順に分類抽出して提示する分類抽出手段とを備えている。   According to a preferred aspect of the present invention, the failure detection system verification device includes failure type classification means for classifying the failure detection result output from the failure detection system to which the test data is given for each type of failure. A failure type state model generation means for obtaining statistical data of each state parameter indicating the state of the service providing system for each failure type based on the test data, and generating a failure type state model; and the failure For each detected failure case constituting the detection result, the state information of the service providing system corresponding to the time and place where each failure occurred is extracted from the test data, and the state information is used as the failure type of the detected failure case. Compared with the state model according to the failure type corresponding to the above, the deviance meter for calculating the degree of divergence indicating the degree of deviation from the state model according to the failure type And means, and a classifying extracting means for presenting classified extracted in order from the larger the discovery failure cases of the out-degree.

また、この発明の好適な形態では、障害発見システム検証装置は、上記試験用データ及び上記障害検出結果に基づいて、上記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成する正常時状態モデル生成手段と、システム状態を構成する状態パラメータのうち、上記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び上記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを特徴的状態モデルとして選定し、上記外れ度計算手段で上記外れ度を求める際に、上記特徴的状態モデルを優先的に使用させる障害種類別判定用パラメータ選定手段とが設けられている。   In a preferred embodiment of the present invention, the failure detection system verification device obtains statistical data of each state parameter indicating a normal state of the service providing system based on the test data and the failure detection result. The normal state model generation means for generating the normal state model, and the state model for the failure type among the state parameters constituting the system state, the state model for the failure type other than the state model and the normal state A state model having a characteristic parameter compared to the behavior of the state model is selected as a characteristic state model, and the characteristic state model is preferentially used when the degree of deviation is calculated by the degree of deviation calculation unit. Failure type-specific determination parameter selection means to be provided.

実施形態1Embodiment 1

図1は、この発明の第1の実施形態である障害発見システム検証装置の構成を示すブロック図である。
この形態の障害発見システム検証装置40は、同図に示すように、図9と同様の試験対象の障害発見システム30が接続され、また、表示装置50が接続されている。障害発見システム30は、所定のサービスを提供する図示しないサービス提供システムの障害を検出して障害検出結果を出力する。この障害発見システム30は、上記サービス提供システムの障害を発見するための所定の調整が行われる構成とされている。表示装置50は、たとえば液晶表示装置などで構成されている。
FIG. 1 is a block diagram showing the configuration of a failure detection system verification apparatus according to the first embodiment of the present invention.
As shown in the figure, the failure detection system verification device 40 of this embodiment is connected to the failure detection system 30 to be tested similar to that in FIG. 9 and is connected to the display device 50. The failure detection system 30 detects a failure in a service providing system (not shown) that provides a predetermined service, and outputs a failure detection result. The failure detection system 30 is configured to perform a predetermined adjustment for detecting a failure of the service providing system. The display device 50 is composed of, for example, a liquid crystal display device.

この障害発見システム検証装置40は、障害発見システム30を試験対象とし、上記サービス提供システムの状態情報が集積されて構成されている試験用データtdが与えられた同障害発見システム30から出力される発見障害リストta(障害検出結果)が入力される。そして、障害発見システム検証装置40は、試験用データtd及び発見障害リストtaに基づいて、障害の種類毎に上記サービス提供システムの状態情報の統計データを示す障害種類別状態モデルを生成すると共に、同発見障害リストtaを構成する各発見障害事例毎に、サービス提供システムの状態の上記障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、外れ度の大きいものから順に発見障害事例を提示して表示装置50に表示する。   The failure detection system verification device 40 outputs the failure detection system 30 to which the failure detection system 30 is given a test data td configured by integrating the status information of the service providing system. A discovered failure list ta (failure detection result) is input. Then, the failure detection system verification device 40 generates a failure type state model indicating statistical data of the state information of the service providing system for each failure type based on the test data td and the detected failure list ta. For each discovered failure case that constitutes the discovered failure list ta, the degree of divergence indicating the degree of deviation of the state of the service providing system from the state model by failure type is obtained, and the detected failure cases are presented in descending order of deviance. And displayed on the display device 50.

特に、この実施形態では、障害発見システム検証装置40は、障害発見システム検証制御プログラムに基づいて動作するコンピュータで構成され、システム状態受付部41と、発見障害リスト受付部42と、障害種類分類部43と、障害種類別状態モデル生成部44と、外れ度計算部45と、ソート部46と、出力部47とを備えている。システム状態受付部41は、障害発見システム30を動作させる場合に用いた試験用データtdをシステム状態リストsmとして受け付ける。発見障害リスト受付部42は、障害発見システム30が試験用データtdに基づいて動作した結果である発見障害リストtaを受け付けて発見障害リストtbとして出力する。障害種類分類部43(障害種類分類手段)は、発見障害リスト受付部42から出力された発見障害リストtbを、検出された障害の種類毎に分類し、障害別リストtcを出力する。   In particular, in this embodiment, the failure detection system verification device 40 is configured by a computer that operates based on a failure detection system verification control program, and includes a system state reception unit 41, a detection failure list reception unit 42, and a failure type classification unit. 43, a failure type-specific state model generation unit 44, a degree-of-displacement calculation unit 45, a sorting unit 46, and an output unit 47. The system state reception unit 41 receives the test data td used when operating the failure detection system 30 as the system state list sm. The discovered failure list accepting unit 42 accepts the discovered failure list ta that is a result of the failure discovery system 30 operating based on the test data td, and outputs it as the discovered failure list tb. The failure type classification unit 43 (failure type classification means) classifies the detected failure list tb output from the detected failure list reception unit 42 for each type of detected failure, and outputs a failure-specific list tc.

障害種類別状態モデル生成部44(障害種類別状態モデル生成手段)は、システム状態受付部41から送出されるシステム状態リストsm及び障害種類分類部43から送出される障害別リストtcに基づいて、障害の種類毎にサービス提供システムの状態を示す各状態パラメータの統計データを求めて障害種類別状態モデルsnを生成する。この場合、障害種類別状態モデル生成部44は、障害種類分類部43から送出される障害別リストtcについて、同リストに含まれている各事例に対して、障害が発生した時刻及び場所を求め、これに対応するシステムの状態を、システム状態受け付け部41から送出されたシステム状態リストsmから取り出すことで、各障害の種類に対して、そのときのシステムの状態のリストを作成する。さらに、障害種類別状態モデル生成部44は、このシステムの状態のリストから、システムの状態を示すさまざまなパラメータの統計的な振る舞いを示すモデル、すなわち、各パラメータがどのような確率でどのような値をとるかを示す障害種類別状態モデルsnを生成する。   The failure type-specific state model generation unit 44 (failure type-specific state model generation means) is based on the system state list sm sent from the system state reception unit 41 and the failure-specific list tc sent from the failure type classification unit 43. A state model sn for each failure type is generated by obtaining statistical data of each state parameter indicating the state of the service providing system for each type of failure. In this case, the failure type-specific state model generation unit 44 obtains the time and place where the failure occurred for each case included in the failure type list tc sent from the failure type classification unit 43. The system status corresponding to this is extracted from the system status list sm sent from the system status accepting unit 41, so that a list of system status at that time is created for each type of failure. Further, the state model generation unit 44 for each type of failure is a model showing the statistical behavior of various parameters indicating the system state from the list of system states, that is, what probability each parameter has at what probability. A fault type-specific state model sn indicating whether to take a value is generated.

外れ度計算部45(外れ度計算手段)は、発見障害リストtbを構成する各発見障害事例毎に、システム状態リストsm(試験用データtd)から、各障害が発生した時刻及び場所に対応する上記サービス提供システムの状態情報を取り出し、同状態情報を上記発見障害事例の障害種類に対応する障害種類別状態モデルsnと比較して、同障害種類別状態モデルsnに対する乖離の度合いを示す外れ度tfを求める。ソート部46(分類抽出手段)は、外れ度計算部45で計算された外れ度tfの大きい発見障害事例から順に分類抽出して提示用リストtmを作成する。出力部47は、ソート部46により作成された提示用リストtmを表示装置50に送出して表示させる。   The detachment degree calculation unit 45 (displacement degree calculation means) corresponds to the time and place where each failure occurs from the system state list sm (test data td) for each discovered failure case constituting the discovered failure list tb. The state information of the service providing system is extracted, and the state information is compared with the state model sn according to the failure type corresponding to the failure type of the detected failure case, and the degree of deviation indicating the degree of deviation from the state model sn according to the failure type tf is obtained. The sorting unit 46 (classification extracting unit) creates a presentation list tm by sequentially classifying and extracting from the detected failure cases having a large degree of detachment tf calculated by the degree of detachment calculating unit 45. The output unit 47 sends the presentation list tm created by the sorting unit 46 to the display device 50 for display.

図2は、図1の障害発見システム検証装置の動作を説明するフローチャートである。
この図を参照して、この形態の障害発見システム検証装置に用いられる障害発見システム検証方法の処理内容について説明する。
この障害発見システム検証装置では、サービス提供システムの状態情報が集積された試験用データtdが障害発見システム30に与えられ、出力される発見障害リストta(障害検出結果)が障害の種類毎に分類される。試験用データtdに基づいて障害の種類毎にサービス提供システムの状態を示す各状態パラメータの統計データが求められて障害種類別状態モデルsnが生成される。発見障害リストtaを構成する各発見障害事例毎に、試験用データtdから、各障害が発生した時刻及び場所に対応するサービス提供システムの状態情報が取り出され、同状態情報が発見障害事例の障害種類に対応する障害種類別状態モデルsnと比較されて外れ度tfが求められ、同外れ度tfの大きいものから順に発見障害事例が表示される。
FIG. 2 is a flowchart for explaining the operation of the failure detection system verification apparatus of FIG.
With reference to this figure, the processing content of the failure detection system verification method used for the failure detection system verification apparatus of this form is demonstrated.
In this failure detection system verification device, test data td in which status information of the service providing system is accumulated is given to the failure detection system 30 and the output failure list ta (failure detection result) is classified for each type of failure. Is done. Based on the test data td, statistical data of each state parameter indicating the state of the service providing system is obtained for each type of failure, and a state model sn for each failure type is generated. For each discovered failure case constituting the discovered failure list ta, the status information of the service providing system corresponding to the time and place where each failure occurred is extracted from the test data td, and the status information is the failure of the discovered failure case. Compared with the state model sn according to the type of failure corresponding to the type, an outlier tf is obtained, and found failure cases are displayed in descending order of the outlier tf.

すなわち、図2に示すように、試験用データtdを用いて、試験対象の障害発見システム30を動作させ、いつ、どこで、どのような障害が発生したかを示す動作結果のリスト(発見障害リストta)を生成する(ステップA1)。次に、発見障害リスト受付部42では、ステップA1で生成された動作結果のリスト(発見障害リストta)を受け取り(ステップA2)、一方、システム状態受付部41では、試験用データtdを受け取る(ステップA3)。障害種類分類部43では、ステップA2で取得された動作結果一覧(発見障害リストtb)を分析結果の障害の種類毎に分け(障害種類分類処理)、同じ種類の障害が発生した障害発生事例毎にまとめたリスト(障害別リストtc)を作成する(ステップA4)。また、障害種類別状態モデル生成部44では、ステップA4で分割した各障害の種類毎に、その動作結果事例全てについて、そのときのシステムの状態をステップA3で受け取った試験用データtd(システム状態リストsm)から取り出す(ステップA5)。さらに、障害種類別状態モデル生成部44では、ステップA5で取り出された障害の種類毎のシステム状態のリスト(システム状態リストsm)に基づいて、その障害が発生したときのシステムの状態の統計的な振る舞いを示すモデル(障害種類別状態モデルsn)を生成する(ステップA6、障害種類別状態モデル生成処理)。   That is, as shown in FIG. 2, a test result td is used to operate the test target fault detection system 30 and a list of operation results (discovery fault list) indicating when, where, and what fault has occurred. ta) is generated (step A1). Next, the discovered failure list reception unit 42 receives the list of operation results (discovery failure list ta) generated in step A1 (step A2), while the system state reception unit 41 receives test data td (step A2). Step A3). The failure type classification unit 43 divides the operation result list (discovered failure list tb) acquired in step A2 for each failure type of the analysis result (failure type classification process), and for each failure occurrence case in which the same type of failure has occurred. A list (fault-specific list tc) summarized in (1) is created (step A4). Further, the failure type-specific state model generation unit 44 provides, for each failure type divided in step A4, the test data td (system state) that received the system state at that time for all the operation result cases. Take out from list sm) (step A5). Further, the failure type-specific state model generation unit 44 uses the system state list (system state list sm) for each failure type extracted in step A5 to statistically analyze the system state when the failure occurs. A model (state model sn for each failure type) showing a behavior is generated (step A6, state model generation processing for each failure type).

次に、外れ度計算部45では、ステップA2で得られた動作結果のリスト(発見障害リストta)に含まれる個々の動作結果事例のうちの一つを取り出し(ステップA7)、ステップA7で取り出した動作結果事例の障害の種類に対応する、ステップA6にて生成された障害の種類毎のシステム状態のモデル(障害種類別状態モデルsn)を取り出す(ステップA8)。さらに、外れ度計算部45では、ステップA7で取り出した動作結果事例の発生時のシステム状態を、ステップA3で取得された試験用データtd(システム状態リストsm)から取り出し(ステップA9)、ステップA9で取り出したシステム状態とステップA8で取り出した障害の種類毎のシステム状態のモデル(障害種類別状態モデルsn)とを比較し、外れ度を計算する(ステップA10、外れ度計算処理)。そして、ステップA2で得られた動作結果リストの全ての動作事例に対して、ステップA7からステップA10までの処理を行う(ステップA11)。最後に、ソート部46では、ステップA10で計算された外れ度tfが大きい順に動作事例をソート(分類抽出)して提示用リストtmを作成し(ステップA12、分類抽出処理)、出力部47では、ステップA12でソートされた順に、提示用リストtmに基づいて動作事例を表示装置50に表示する(ステップA13)。   Next, the outlier calculation unit 45 extracts one of the individual operation result cases included in the operation result list (discovery failure list ta) obtained in step A2 (step A7), and extracts it in step A7. The system state model (failure type-specific state model sn) corresponding to the type of failure generated in step A6 corresponding to the type of failure in the operation result example is extracted (step A8). Further, the outlier calculation unit 45 extracts the system state at the time of occurrence of the operation result example extracted in step A7 from the test data td (system state list sm) acquired in step A3 (step A9), and step A9. The system state extracted in step A8 is compared with the system state model (failure type-specific state model sn) for each type of failure extracted in step A8, and the degree of deviation is calculated (step A10, degree of deviation calculation processing). Then, the processing from step A7 to step A10 is performed for all the operation cases in the operation result list obtained in step A2 (step A11). Finally, the sorting unit 46 sorts (classifies and extracts) the operation cases in descending order of the degree of detachment tf calculated in step A10 to create a presentation list tm (step A12, category extraction processing). The operation examples are displayed on the display device 50 based on the presentation list tm in the order sorted in step A12 (step A13).

以上のように、この第1の実施形態では、障害発見システム30から出力される発見障害リストtaを構成する各発見障害事例毎に、試験用データtdから、各障害が発生した時刻及び場所に対応するサービス提供システムの状態情報が取り出され、同状態情報が発見障害事例の障害種類に対応する障害種類別状態モデルsnと比較されて外れ度tfが求められ、同外れ度tfの大きいものから順に発見障害事例が表示されるので、同じ種類の障害と判断された他の検出事例と比べて、システムの状態が大きく乖離している障害検出事例が優先的に提示され、管理者は、検出結果に誤りがある可能性の高い障害検出事例を効率的に認識できる。   As described above, in the first embodiment, for each discovery failure case constituting the discovery failure list ta output from the failure discovery system 30, the test data td is used to indicate the time and place where each failure occurs. The state information of the corresponding service providing system is extracted, and the state information is compared with the state model sn for each failure type corresponding to the failure type of the found failure case to obtain the outlier tf. Since the detected failure cases are displayed in order, the failure detection cases whose system status is significantly different from other detection cases judged to be the same type of failure are preferentially presented. It is possible to efficiently recognize failure detection cases that are likely to have errors in the results.

実施形態2Embodiment 2

図3は、この発明の第2の実施形態である障害発見システム検証装置の構成を示すブロック図であり、第1の実施形態を示す図1中の要素と共通の要素には共通の符号が付されている。
この形態の障害発見システム検証装置40Aでは、同図3に示すように、図1中の障害発見システム検証装置40の構成に加え、正常時状態モデル生成部48と、障害種類別判定用パラメータ選定部49とが設けられている。正常時状態モデル生成部48(正常時状態モデル生成手段)は、システム状態受付部41から送出されるシステム状態リストsm(試験用データtd)及び発見障害リストtbに基づいて、サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルspを生成する。この場合、正常時状態モデル生成部48は、障害の起きていないとき、すなわち、発見障害リスト受付部42が受け取った発見障害リストtaに含まれない時刻及び場所についてのシステム状態を、システム状態受付部41が受け取った試験用データtdから取り出し、障害の起きていないときにおけるシステム状態の統計的モデル(正常時状態モデルsp)を作成する。
FIG. 3 is a block diagram showing the configuration of the failure detection system verification apparatus according to the second embodiment of the present invention. Elements common to the elements in FIG. 1 showing the first embodiment are denoted by common reference numerals. It is attached.
In the failure detection system verification device 40A of this embodiment, as shown in FIG. 3, in addition to the configuration of the failure detection system verification device 40 in FIG. 1, a normal state model generation unit 48 and failure type determination parameter selection A portion 49 is provided. The normal state state model generation unit 48 (normal state state model generation means) is configured so that the service providing system is normal based on the system state list sm (test data td) and the detected failure list tb transmitted from the system state reception unit 41. Statistical data of each state parameter indicating the state of the hour is obtained, and a normal state model sp is generated. In this case, the normal state state model generation unit 48 receives the system state information about the time and place that are not included in the discovery failure list ta received by the discovery failure list reception unit 42 when no failure has occurred. The unit 41 extracts from the test data td received, and creates a statistical model of the system state (normal state model sp) when no failure has occurred.

障害種類別判定用パラメータ選定部49(障害種類別判定用パラメータ選定手段)は、システム状態を構成する状態パラメータのうち、障害種類別状態モデルsnの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び正常時状態モデルspでの振る舞いと比較して特徴的なパラメータを有する状態モデルを特徴的状態モデルsqとして選定し、外れ度計算部45で外れ度tfを求める際に、同特徴的状態モデルsqを優先的に使用させる。他は、図1と同様の構成である。   The failure type determination parameter selection unit 49 (failure type determination parameter selection means) has a failure type state model sn behavior of a failure type other than the state model among the state parameters constituting the system state. When a state model having a characteristic parameter compared to the behavior of the model and the normal state model sp is selected as the characteristic state model sq, and the outlier calculation unit 45 obtains the outlier tf, the characteristic state The model sq is used preferentially. The other configuration is the same as that shown in FIG.

図4は、図3の障害発見システム検証装置の動作を説明するフローチャートである。
この図を参照して、この形態の障害発見システム検証装置に用いられる障害発見システム検証方法の処理内容について説明する。
この障害発見システム検証装置では、次の点が上記第1の実施形態と異なっている。
すなわち、発見障害事例提示処理では、試験用データtd及び発見障害リストtaに基づいて、サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルspが生成されると共に、システム状態を構成する状態パラメータのうち、障害種類別状態モデルsnでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び正常時状態モデルspでの振る舞いと比較して特徴的なパラメータを有する状態モデルが特徴的状態モデルsqとして選定され、外れ度計算部45で外れ度tfを求める際に、同特徴的状態モデルsqが優先的に使用される。
FIG. 4 is a flowchart for explaining the operation of the failure detection system verification apparatus of FIG.
With reference to this figure, the processing content of the failure detection system verification method used for the failure detection system verification apparatus of this form is demonstrated.
This failure detection system verification apparatus is different from the first embodiment in the following points.
That is, in the detected failure case presentation process, the normal state model sp is generated by obtaining statistical data of each state parameter indicating the normal state of the service providing system based on the test data td and the detected failure list ta. In addition, among the state parameters constituting the system state, the behavior in the state model sn for each failure type is a characteristic parameter compared with the behavior in the state model for each failure type other than the state model and the normal state model sp. Is selected as the characteristic state model sq, and the characteristic state model sq is preferentially used when the outlier calculation unit 45 calculates the outlier tf.

この場合、図4に示すように、ステップB1乃至ステップB6では、第1の実施形態を示す図2中のステップA1乃至ステップA6と同様の処理が行われる。この後、正常時状態モデル生成部48では、ステップB3で受け取った試験用データtdのうち、ステップB5で取り出したもの以外のシステム状態を用いて、正常時のシステム状態の統計的な振る舞いを示すモデル(正常時状態モデルsp)を生成する(ステップB7、正常時状態モデル生成処理)。次に、障害種類別判定用パラメータ選定部49では、ステップB6で生成した各障害の種類のモデルを一つ取り出し(ステップB8)、ステップB8で選択したモデルに対して、システム状態を構成するパラメータを一つ選択する(ステップB9)。   In this case, as shown in FIG. 4, in Steps B1 to B6, the same processing as Steps A1 to A6 in FIG. 2 showing the first embodiment is performed. Thereafter, the normal state model generation unit 48 uses the system state other than the data extracted in step B5 from the test data td received in step B3 to show the statistical behavior of the normal system state. A model (normal state model sp) is generated (step B7, normal state model generation process). Next, the failure type-specific determination parameter selection unit 49 extracts one model of each failure type generated in step B6 (step B8), and the parameters constituting the system state for the model selected in step B8. Is selected (step B9).

さらに、種類別判定用パラメータ選定部49では、ステップB9で選択したパラメータの統計的振る舞いを、ステップB8で選択した以外の障害の種類のモデル、及びステップB7で生成した正常時状態モデルspにおける同じパラメータの統計的振る舞いと比較し(ステップB10)、その統計的振る舞いに大きな差があれば(ステップB11)、ステップB9で選択したパラメータを、ステップB8で選択した障害の種類のモデルの評価用パラメータの一つとして指定する(ステップB12、障害種類別判定用パラメータ選定処理)。そして、システム状態を構成する全てのパラメータについて上記ステップB9からステップB12までの処理を実行する(ステップB13)。さらに、ステップB6で生成した全ての障害の種類の状態モデルに対して、ステップB8からステップB13までの処理を実行する(ステップB14)。   Further, in the type-specific determination parameter selection unit 49, the statistical behavior of the parameter selected in step B9 is the same in the model of the type of failure other than that selected in step B8 and the normal state model sp generated in step B7. If it is compared with the statistical behavior of the parameter (step B10) and there is a large difference in the statistical behavior (step B11), the parameter selected in step B9 is used as the parameter for evaluating the model of the type of fault selected in step B8. (Step B12, failure type-specific determination parameter selection process). Then, the processing from step B9 to step B12 is executed for all parameters constituting the system state (step B13). Further, the processing from step B8 to step B13 is executed for all the failure type state models generated in step B6 (step B14).

次に、外れ度計算部45では、ステップB2で得られた動作結果のリスト(発見障害リストta)に含まれる個々の動作結果事例のうち、一つを取り出し(ステップB15)、さらに、ステップB15で取り出した動作結果事例の障害の種類に対応する、ステップB6にて生成した障害の種類毎のシステム状態のモデルを取り出す(ステップA16)。さらに、外れ度計算部45は、ステップB15で取り出した、動作結果事例に対応するシステム状態を、ステップB3で取得した試験用データtdから取り出し(ステップB17)、ステップB17で取り出したシステム状態のうち、ステップB12で評価用パラメータとして指定されたパラメータを用いて、ステップB15で取り出した障害の種類毎のシステム状態のモデルとを比較し、外れ度tfを計算する(ステップA18)。ステップB2で得た動作結果リストの全ての動作事例に対して、ステップB15からステップB18までを行う(ステップB19)。最後に、ソート部46では、ステップB18で計算された外れ度tfが大きい順に動作事例をソート(分類抽出)して提示用リストtmを作成し(ステップB20)、出力部47では、ステップB20でソートされた順に、提示用リストtmに基づいて動作事例を表示装置50に表示する(ステップB21)。   Next, the outlier calculation unit 45 takes out one of the individual operation result cases included in the operation result list (discovery failure list ta) obtained in step B2 (step B15), and further performs step B15. The model of the system state for each type of failure generated in step B6 corresponding to the type of failure in the operation result example extracted in step S16 is extracted (step A16). Further, the detachment degree calculation unit 45 extracts the system state corresponding to the operation result example extracted in step B15 from the test data td acquired in step B3 (step B17), and out of the system states extracted in step B17. Then, using the parameter specified as the evaluation parameter in step B12, the model of the system state for each type of failure taken out in step B15 is compared, and the degree of deviation tf is calculated (step A18). Steps B15 to B18 are performed for all operation cases in the operation result list obtained in step B2 (step B19). Finally, the sorting unit 46 sorts the operation examples in descending order of the degree of detachment tf calculated in step B18 (classification extraction) to create a presentation list tm (step B20), and the output unit 47 performs step B20. In the sorted order, the operation examples are displayed on the display device 50 based on the presentation list tm (step B21).

以上のように、この第2の実施形態では、正常時状態モデル生成部48により正常時状態モデルspが生成されると共に、障害種類別判定用パラメータ選定部49により特徴的状態モデルsqが選定され、外れ度計算部45で外れ度tfを求める際に、同特徴的状態モデルsqが優先的に使用されるので、外れ度tfの計算結果が第1の実施形態よりも大きくなり、管理者は、検出結果に誤りがある可能性の高い障害検出事例を、より効率的に認識できる。   As described above, in the second embodiment, the normal state model sp is generated by the normal state model generation unit 48, and the characteristic state model sq is selected by the failure type determination parameter selection unit 49. Since the characteristic state model sq is preferentially used when the outlier calculation unit 45 calculates the outlier tf, the calculation result of the outlier tf becomes larger than that in the first embodiment, and the administrator Thus, it is possible to more efficiently recognize a failure detection case that is likely to have an error in the detection result.

実施形態3Embodiment 3

図5は、この発明の第3の実施形態である障害発見システム検証装置が用いられる環境を示す模式図であり、第1の実施形態を示す図1、及び第2の実施形態を示す図3中の要素と共通の要素には共通の符号が付されている。
この形態の環境では、同図5に示すように、サービス提供システム60と、システム状態情報保存DB(データベース)61と、障害発見システム30と、障害発見システム検証装置40(又は40A)と、表示装置50とが設けられている。サービス提供システム60は、たとえばネットワークに接続されている複数の機器を組み合わせて所定のサービスを提供する。このサービス提供システム60では、長期間にわたって複数回の障害が発生している。システム状態情報保存DB61は、試験対象の障害発見システム30が監視対象とするサービス提供システム60のシステム状態情報を定期的に収集して保存する。
FIG. 5 is a schematic diagram showing an environment in which the failure detection system verification apparatus according to the third embodiment of the present invention is used. FIG. 1 shows the first embodiment, and FIG. 3 shows the second embodiment. Elements common to the elements inside are given common reference numerals.
In the environment of this form, as shown in FIG. 5, a service providing system 60, a system state information storage DB (database) 61, a failure detection system 30, a failure detection system verification device 40 (or 40A), a display A device 50 is provided. The service providing system 60 provides a predetermined service by combining a plurality of devices connected to a network, for example. In the service providing system 60, a failure occurs a plurality of times over a long period of time. The system state information storage DB 61 periodically collects and stores system state information of the service providing system 60 to be monitored by the failure detection system 30 to be tested.

図6は、発見障害リストtaの例を示す図、図7は、発見障害リストtaとシステム状態情報DB61との対応付けを示す図、及び図8が、障害種類別状態モデルの例を示す図である。
これらの図を参照して、この形態の障害発見システム検証装置に用いられる障害発見システム検証方法の処理内容について説明する。
試験対象の障害発見システム30は、システム状態情報保存DB61に保存されているシステム状態情報(試験用データtd)に基づいて動作する。この結果、障害発見システム30は、システム状態情報保存DB61に保存された期間に起きた障害を発見し、この発見した障害のリストを発見障害リストtaとして取り出す。発見障害リストtaでは、たとえば図6に示すように、各発見障害事例が、各事例を特定する“ID”、“時刻”、“場所”及び“検出結果”で構成されている。
FIG. 6 is a diagram illustrating an example of the discovered failure list ta, FIG. 7 is a diagram illustrating an association between the discovered failure list ta and the system state information DB 61, and FIG. 8 is a diagram illustrating an example of a state model for each failure type. It is.
With reference to these drawings, processing contents of the fault detection system verification method used in the fault detection system verification apparatus of this embodiment will be described.
The failure detection system 30 to be tested operates based on the system state information (test data td) stored in the system state information storage DB 61. As a result, the failure discovery system 30 finds a failure that occurred during the period stored in the system state information storage DB 61, and takes out the list of discovered failures as a discovery failure list ta. In the discovered failure list ta, for example, as shown in FIG. 6, each discovered failure case includes “ID”, “time”, “location”, and “detection result” that identify each case.

システム状態情報保存DB61に保存されているシステム状態情報(試験用データtd)は、たとえば図7に示すように、各発見障害事例のIDに対応して、“CPU負荷”、“メモリ使用量”、“ネットワーク使用量”及び“ディスク使用量”で構成されている。障害発見システム検証装置40(40A)では、これらの障害発見事例に対応するシステム状態を障害の種類毎にまとめ、障害の種類毎のシステム状態の統計データ(障害種類別状態モデル)を作成する。たとえば、図6では、ID1,2,4が、同じ障害種類“障害イ”となっているので、一つのグループとしてまとめられ、また、ID3,6も、同じ障害種類“障害ロ”となっているので、一つのグループにまとめられる。そして、このような障害種類毎に障害種類別状態モデルが作成される。上記“障害イ”に対応する状態モデルは、図8(a),(b)に示すように、CPU負荷及びメモリ使用量が100%近辺に偏っている一方、図8(c),(d)に示すように、ネットワーク使用量やディスク使用量は広く分布しているので、“障害イ”においては、CPU負荷やメモリ使用量が特徴的であることがわかる。   The system state information (test data td) stored in the system state information storage DB 61 includes, for example, as shown in FIG. 7, “CPU load”, “memory usage” corresponding to the ID of each detected failure case. , “Network usage” and “disk usage”. The failure detection system verification device 40 (40A) collects system states corresponding to these failure detection cases for each type of failure and creates system state statistical data (failure type-specific state model) for each failure type. For example, in FIG. 6, IDs 1, 2, and 4 have the same failure type “Fault A”, so they are grouped together as one group, and IDs 3 and 6 also have the same failure type “Fault B”. Because it is, it is put together in one group. Then, a state model for each failure type is created for each failure type. As shown in FIGS. 8A and 8B, the state model corresponding to the above “failure B” has the CPU load and the memory usage amounting to near 100%, while FIGS. 8C and 8D. As shown in (2), the network usage and disk usage are widely distributed. Therefore, it is understood that the CPU load and the memory usage are characteristic in “failure B”.

この状態モデルと発見障害事例に対応するシステム状態とを比較すると、“障害イ”では、ID1,2は、状態モデルとの外れ度は大きくないが、CPU負荷が100%近辺に強く偏っている状態モデルと比較して、ID4におけるシステム状態のCPU負荷は、77%と高いものの、状態モデル分布からは外れている。つまり、ID4は、外れ度が大きくなっている。この結果、表示装置50には、ID4が先頭近くに表示され、障害発見システム30の管理者は、まず、このID4の発見障害事例が正しく分析されているか、つまり、図6中の“9/21,20:12”に、サーバDで“障害イ”が発生したか否かを実際の記録を見て確認する。このように、表示装置50に表示される発見障害リストの先頭に近いものほど分析結果が誤っている可能性が高くなっているため、管理者は、検証作業の早期に、問題点、つまり、障害発見システム30の検出結果と実際に起きた障害が異なる事例を発見することが可能になる。   Comparing this state model with the system state corresponding to the detected failure case, in “failure b”, IDs 1 and 2 are not greatly deviated from the state model, but the CPU load is strongly biased near 100%. Compared with the state model, the CPU load of the system state in ID4 is as high as 77%, but it is out of the state model distribution. That is, the degree of detachment of ID4 is large. As a result, ID 4 is displayed near the top on the display device 50, and the administrator of the failure detection system 30 first determines whether the detected failure case of ID 4 is correctly analyzed, that is, “9 /” in FIG. At 21, 20:12 ", whether or not" Fault A "has occurred in the server D is confirmed by checking the actual record. Thus, the closer to the top of the discovered failure list displayed on the display device 50, the higher the possibility that the analysis result is wrong. It is possible to find a case where the detection result of the failure detection system 30 is different from the actual failure.

以上のように、この第3の実施形態では、障害発見システム30による検出結果が膨大になった場合、管理者が、同検出結果に含まれる全ての障害の事例を予め知っていなくても、検証作業にかかる時間が少なくなり、同検証作業が効率的に行われる。   As described above, in this third embodiment, when the detection result by the failure detection system 30 becomes enormous, even if the administrator does not know all the failure cases included in the detection result in advance, The time required for the verification work is reduced, and the verification work is performed efficiently.

以上、この発明の実施形態を図面により詳述してきたが、具体的な構成は同実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更などがあっても、この発明に含まれる。
たとえば、上記各実施形態では、障害発見システム検証装置40,40Aは、コンピュータで構成されているが、内部を構成する各部が個別のユニットで構成されていても良い。また、障害発見システム検証装置40,40Aには、外れ度計算部45で計算された外れ度tfが所定の閾値よりも大きいときにアラームなどを発生する手段が設けられていても良い。
The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to the embodiment, and even if there is a design change without departing from the gist of the present invention, Included in the invention.
For example, in each of the embodiments described above, the failure detection system verification devices 40 and 40A are configured by a computer, but each unit configuring the inside may be configured by an individual unit. Further, the failure detection system verification devices 40 and 40A may be provided with a means for generating an alarm or the like when the detachment degree tf calculated by the detachment degree calculation unit 45 is larger than a predetermined threshold.

この発明は、監視対象となるサービス提供システムに対応して随時調整を必要とする障害発見システムの動作を検証する装置全般に適用でき、同障害発見システムの調整を効率的に行う場合に有効である。   The present invention can be applied to all devices for verifying the operation of a failure detection system that requires adjustment as needed in response to a service providing system to be monitored, and is effective in efficiently adjusting the failure detection system. is there.

この発明の第1の実施形態である障害発見システム検証装置の構成を示すブロック図である。It is a block diagram which shows the structure of the failure discovery system verification apparatus which is 1st Embodiment of this invention. 図1の障害発見システム検証装置の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the failure discovery system verification apparatus of FIG. この発明の第2の実施形態である障害発見システム検証装置の構成を示すブロック図である。It is a block diagram which shows the structure of the failure discovery system verification apparatus which is 2nd Embodiment of this invention. 図3の障害発見システム検証装置の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the failure discovery system verification apparatus of FIG. この発明の第3の実施形態である障害発見システム検証装置が用いられる環境を示す模式図である。It is a schematic diagram which shows the environment where the failure discovery system verification apparatus which is 3rd Embodiment of this invention is used. 発見障害リストtaの例を示す図である。It is a figure which shows the example of the discovery failure list | wrist ta. 発見障害リストtaとシステム状態情報DB61との対応付けを示す図である。It is a figure which shows matching with the discovery failure list | wrist ta and system status information DB61. 障害種類別状態モデルの例を示す図である。It is a figure which shows the example of the state model according to a failure type. テストデータ管理システムの構成図である。It is a block diagram of a test data management system.

符号の説明Explanation of symbols

30 障害発見システム
40,40A 障害発見システム検証装置
41 システム状態受付部(障害発見システム検証装置の一部)
42 発見障害リスト受付部(障害発見システム検証装置の一部)
43 障害種類分類部(障害種類分類手段、障害発見システム検証装置の一部)
44 障害種類別状態モデル生成部(障害種類別状態モデル生成手段、障害発見システム検証装置の一部)
45 外れ度計算部(外れ度計算手段、障害発見システム検証装置の一部)
46 ソート部(分類抽出手段の一部、障害発見システム検証装置の一部)
47 出力部(分類抽出手段の一部、障害発見システム検証装置の一部)
48 正常時状態モデル生成部(正常時状態モデル生成手段、障害発見システム検証装置の一部)
49 障害種類別判定用パラメータ選定部(障害種類別判定用パラメータ選定手段、障害発見システム検証装置の一部)
50 表示装置
60 サービス提供システム
30 Failure detection system 40, 40A Failure detection system verification device 41 System state reception unit (part of failure detection system verification device)
42 Discovery fault list reception part (part of fault discovery system verification device)
43 Failure type classification part (failure type classification means, part of failure detection system verification device)
44 Fault type-specific state model generation unit (failure type-specific state model generation means, part of fault detection system verification device)
45 Degree of calculation part (displacement degree calculation means, part of failure detection system verification device)
46 Sorting part (part of classification extraction means, part of fault detection system verification device)
47 Output unit (part of classification extraction means, part of fault detection system verification device)
48 Normal state model generation unit (normal state model generation means, part of fault detection system verification device)
49 Parameter selection unit for determination by type of failure (parameter selection means for determination by type of failure, part of failure detection system verification device)
50 display device 60 service providing system

Claims (15)

所定のサービスを提供するサービス提供システムの障害を検出して障害検出結果を出力する障害発見システムを試験対象とし、前記サービス提供システムの状態情報及び前記障害発見システムから出力される前記障害検出結果に基づいて、障害の種類毎に前記サービス提供システムの状態情報の統計データを示す障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する発見障害事例毎に、前記サービス提供システムの状態情報の前記障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示する構成とされていることを特徴とする障害発見システム検証装置。   A failure detection system that detects a failure of a service providing system that provides a predetermined service and outputs a failure detection result is used as a test target, and the status information of the service providing system and the failure detection result output from the failure detection system Based on the failure type, the state information of the service providing system is generated for each type of failure that constitutes the failure detection result. A failure discovery system verification device characterized in that a degree of deviation indicating a degree of deviation from the failure type state model is obtained, and the detected failure cases are presented in descending order of the degree of deviation. 前記障害発見システムは、前記サービス提供システムの障害を発見するための所定の調整が行われる構成とされ、
当該障害発見システム検証装置は、
前記サービス提供システムの状態情報が集積されてなる試験用データが与えられた前記障害発見システムから出力される前記障害検出結果を障害の種類毎に分類し、前記試験用データに基づいて前記障害の種類毎に前記サービス提供システムの状態を示す各状態パラメータの統計データを求めて前記障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する各発見障害事例毎に、前記試験用データから、各障害が発生した時刻及び場所に対応する前記サービス提供システムの状態情報を取り出し、該状態情報を前記発見障害事例の障害種類に対応する前記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示する構成とされていることを特徴とする請求項1記載の障害発見システム検証装置。
The failure detection system is configured such that a predetermined adjustment for detecting a failure of the service providing system is performed,
The fault detection system verification device
The failure detection results output from the failure detection system provided with test data in which status information of the service providing system is accumulated are classified for each type of failure, and based on the test data, the failure detection result is classified. For each type, the statistical data of each state parameter indicating the state of the service providing system is obtained to generate the state model for each failure type, and for each detected failure case constituting the failure detection result, from the test data The state information of the service providing system corresponding to the time and place where each failure has occurred is extracted, and the state information is compared with the state model for each failure type corresponding to the failure type of the detected failure case. The degree of deviation indicating the degree of deviation from another state model is obtained, and the detected failure cases are presented in descending order of the degree of deviation. And trouble detection system verification apparatus according to claim 1, wherein the are.
前記試験用データに基づいて、前記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成すると共に、前記外れ度を求める際に、システム状態を構成する状態パラメータのうち、前記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び前記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを優先的に使用する構成とされていることを特徴とする請求項2記載の障害発見システム検証装置。   Based on the test data, the service providing system obtains statistical data of each state parameter indicating a normal state, generates a normal state model, and configures a system state when determining the degree of detachment Among the state parameters, the behavior of the state model according to the failure type is preferential to the state model having a characteristic parameter compared to the state model according to the failure type other than the state model and the behavior of the normal state model. The failure detection system verification device according to claim 2, wherein the failure detection system verification device is used. 前記試験用データが与えられた前記障害発見システムから出力される前記障害検出結果を障害の種類毎に分類する障害種類分類手段と、
前記試験用データに基づいて前記障害の種類毎に前記サービス提供システムの状態を示す各状態パラメータの統計データを求めて障害種類別状態モデルを生成する障害種類別状態モデル生成手段と、
前記障害検出結果を構成する各発見障害事例毎に、前記試験用データから、各障害が発生した時刻及び場所に対応する前記サービス提供システムの状態情報を取り出し、該状態情報を前記発見障害事例の障害種類に対応する前記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求める外れ度計算手段と、
前記外れ度の大きい前記発見障害事例から順に分類抽出して提示する分類抽出手段とを備えてなることを特徴とする請求項2記載の障害発見システム検証装置。
Fault type classification means for classifying the fault detection results output from the fault detection system to which the test data is given for each type of fault;
State model generation means for each failure type that generates statistical data for each state parameter by obtaining statistical data of each state parameter indicating the state of the service providing system for each type of failure based on the test data;
For each discovered failure case constituting the failure detection result, the status information of the service providing system corresponding to the time and place where each failure occurred is extracted from the test data, and the status information is extracted from the detected failure case. Compared with the state model for each failure type corresponding to the failure type, an outlier calculation means for obtaining a degree of deviation indicating the degree of deviation from the state model for each failure type;
The failure detection system verification apparatus according to claim 2, further comprising: a category extraction unit that sequentially extracts and presents the found failure cases having a large degree of deviation.
前記試験用データ及び前記障害検出結果に基づいて、前記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成する正常時状態モデル生成手段と、
システム状態を構成する状態パラメータのうち、前記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び前記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを特徴的状態モデルとして選定し、前記外れ度計算手段で前記外れ度を求める際に、前記特徴的状態モデルを優先的に使用させる障害種類別判定用パラメータ選定手段とが設けられていることを特徴とする請求項4記載の障害発見システム検証装置。
Based on the test data and the failure detection result, a normal state model generation unit that generates a normal state model by obtaining statistical data of each state parameter indicating a normal state of the service providing system;
Among the state parameters constituting the system state, the behavior in the state model for each failure type has characteristic parameters as compared with the behavior in the state model for each failure type other than the state model and the normal state model. When selecting a state model as a characteristic state model, and determining the degree of deviation by the degree of deviation calculation means, there is provided a parameter selection means for determination by failure type that preferentially uses the characteristic state model. The fault detection system verification apparatus according to claim 4, wherein:
所定のサービスを提供するサービス提供システムの障害を検出して障害検出結果を出力する障害発見システムを試験対象とし、障害発見システム検証装置が、前記サービス提供システムの状態情報及び前記障害発見システムから出力される前記障害検出結果に基づいて、障害の種類毎に前記サービス提供システムの状態情報の統計データを示す障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する発見障害事例毎に、前記サービス提供システムの状態情報の前記障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示することを特徴とする障害発見システム検証方法。   A failure detection system that detects a failure of a service providing system that provides a predetermined service and outputs a failure detection result is a test target, and the failure detection system verification device outputs the status information of the service providing system and the failure detection system Based on the failure detection result to be generated, for each type of failure, to generate a state model for each failure type indicating the statistical data of the state information of the service providing system, for each discovery failure case constituting the failure detection result, A failure discovery system verification method characterized by obtaining a degree of deviation indicating a degree of deviation of the state information of the service providing system from the state model for each failure type, and presenting the detected failure cases in descending order of the degree of deviation . 前記障害発見システムが、前記サービス提供システムの障害を発見するための所定の調整が行われる構成とされ、前記障害発見システム検証装置が、前記サービス提供システムの状態情報が集積されてなる試験用データが与えられた前記障害発見システムから出力される前記障害検出結果を障害の種類毎に分類し、前記試験用データに基づいて前記障害の種類毎に前記サービス提供システムの状態を示す各状態パラメータの統計データを求めて前記障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する各発見障害事例毎に、前記試験用データから、各障害が発生した時刻及び場所に対応する前記サービス提供システムの状態情報を取り出し、該状態情報を前記発見障害事例の障害種類に対応する前記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示することを特徴とする請求項6記載の障害発見システム検証方法。   The failure detection system is configured to perform a predetermined adjustment for detecting a failure in the service providing system, and the failure detection system verification device includes test data in which status information of the service providing system is accumulated. Classifying the failure detection results output from the failure discovery system to each type of failure, and for each status parameter indicating the status of the service providing system for each type of failure based on the test data Providing the service corresponding to the time and place where each failure occurred from the test data for each detected failure case that constitutes the failure detection result while generating statistical data and generating a state model for each failure type State information of the system is extracted, and the state information corresponding to the failure type of the found failure case 7. The failure detection system verification according to claim 6, wherein a degree of deviation indicating a degree of divergence with respect to the state model for each failure type is obtained, and the detected failure cases are presented in descending order of the degree of deviation. Method. 前記障害発見システム検証装置が、前記試験用データに基づいて、前記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成すると共に、前記外れ度を求める際に、システム状態を構成する状態パラメータのうち、前記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び前記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを優先的に使用することを特徴とする請求項7記載の障害発見システム検証方法。   Based on the test data, the failure detection system verification device obtains statistical data of each state parameter indicating a normal state of the service providing system, generates a normal state model, and calculates the degree of detachment At the time, among the state parameters constituting the system state, the behavior in the state model according to the failure type is characteristic compared with the behavior in the state model according to the failure type other than the state model and the normal state model. The failure detection system verification method according to claim 7, wherein a state model having parameters is preferentially used. 前記試験用データが与えられた前記障害発見システムから出力される前記障害検出結果を障害の種類毎に分類する障害種類分類処理と、
前記試験用データに基づいて前記障害の種類毎に前記サービス提供システムの状態を示す各状態パラメータの統計データを求めて障害種類別状態モデルを生成する障害種類別状態モデル生成処理と、
前記障害検出結果を構成する各発見障害事例毎に、前記試験用データから、各障害が発生した時刻及び場所に対応する前記サービス提供システムの状態情報を取り出し、該状態情報を前記発見障害事例の障害種類に対応する前記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求める外れ度計算処理と、
前記外れ度の大きい前記発見障害事例から順に分類抽出して提示する分類抽出処理とを行うことを特徴とする請求項7記載の障害発見システム検証方法。
Fault type classification processing for classifying the fault detection results output from the fault detection system to which the test data is given for each fault type;
State model generation processing for each fault type for generating statistical data for each type of fault parameter by obtaining statistical data of each status parameter indicating the status of the service providing system for each type of fault based on the test data;
For each discovered failure case constituting the failure detection result, the status information of the service providing system corresponding to the time and place where each failure occurred is extracted from the test data, and the status information is extracted from the detected failure case. Compared with the state model for each failure type corresponding to the failure type, an outlier calculation process for obtaining a degree of deviation indicating the degree of deviation from the state model for each failure type;
The failure detection system verification method according to claim 7, wherein a classification extraction process is performed in which classification extraction is performed in order from the detected failure cases with a large degree of deviation.
前記試験用データ及び前記障害検出結果に基づいて、前記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成する正常時状態モデル生成処理と、
システム状態を構成する状態パラメータのうち、前記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び前記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを特徴的状態モデルとして選定し、前記外れ度計算処理で前記外れ度を求める際に、前記特徴的状態モデルを優先的に使用させる障害種類別判定用パラメータ選定処理とを行うことを特徴とする請求項9記載の障害発見システム検証方法。
Based on the test data and the failure detection result, a normal state model generation process for generating a normal state model by obtaining statistical data of each state parameter indicating the normal state of the service providing system;
Among the state parameters constituting the system state, the behavior in the state model for each failure type has characteristic parameters as compared with the behavior in the state model for each failure type other than the state model and the normal state model. A state model is selected as a characteristic state model, and when determining the degree of deviation in the degree of deviation calculation processing, a parameter selection process for determination by failure type that preferentially uses the characteristic state model is performed. The failure detection system verification method according to claim 9.
所定のサービスを提供するサービス提供システムの障害を検出して障害検出結果を出力する障害発見システムを試験対象とし、
コンピュータで構成された障害発見システム検証装置が、前記サービス提供システムの状態情報及び前記障害発見システムから出力される前記障害検出結果に基づいて、障害の種類毎に前記サービス提供システムの状態情報の統計データを示す障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する発見障害事例毎に、前記サービス提供システムの状態情報の前記障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示する処理を実行するためのコンピュータ読み取り可能な障害発見システム検証制御プログラム。
A failure detection system that detects a failure of a service providing system that provides a predetermined service and outputs a failure detection result is used as a test target.
A failure detection system verification device configured by a computer, based on the state information of the service providing system and the failure detection result output from the failure detection system, statistics of the state information of the service providing system for each type of failure A state model for each failure type indicating data is generated, and a degree of deviation indicating a degree of deviation of the state information of the service providing system from the state model for each failure type is obtained for each detected failure case constituting the failure detection result. A computer-readable failure detection system verification control program for executing processing for presenting the detected failure cases in descending order of the degree of deviation.
前記障害発見システムが、前記サービス提供システムの障害を発見するための所定の調整が行われる構成とされ、前記サービス提供システムの状態情報が集積されてなる試験用データが与えられた前記障害発見システムから出力される前記障害検出結果を障害の種類毎に分類し、前記試験用データに基づいて前記障害の種類毎に前記サービス提供システムの状態を示す各状態パラメータの統計データを求めて前記障害種類別状態モデルを生成すると共に、前記障害検出結果を構成する各発見障害事例毎に、前記試験用データから、各障害が発生した時刻及び場所に対応する前記サービス提供システムの状態情報を取り出し、該状態情報を前記発見障害事例の障害種類に対応する前記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求め、該外れ度の大きいものから順に前記発見障害事例を提示する処理を、前記障害発見システム検証装置に実行させるための請求項11記載の障害発見システム検証制御プログラム。   The failure detection system is configured such that a predetermined adjustment for detecting a failure in the service providing system is performed, and the failure detection system is provided with test data in which state information of the service providing system is integrated Classifying the failure detection results output from each failure type, and obtaining statistical data of each state parameter indicating the state of the service providing system for each failure type based on the test data; Generating another state model, and for each discovered failure case constituting the failure detection result, taking out the state information of the service providing system corresponding to the time and place where each failure occurred from the test data; Comparing the state information with the state model by failure type corresponding to the failure type of the detected failure case, the state model by failure type 12. The fault detection system verification control according to claim 11, wherein the fault detection system verification apparatus is configured to cause the fault detection system verification apparatus to execute a process of obtaining a faulty degree indicating a degree of divergence with respect to each other and presenting the detected fault cases in descending order of the deviation degree. program. 前記試験用データに基づいて、前記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成すると共に、前記外れ度を求める際に、システム状態を構成する状態パラメータのうち、前記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び前記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを優先的に使用する処理を、前記障害発見システム検証装置に実行させるための請求項12記載の障害発見システム検証制御プログラム。   Based on the test data, the service providing system obtains statistical data of each state parameter indicating a normal state, generates a normal state model, and configures a system state when determining the degree of detachment Among the state parameters, the behavior of the state model according to the failure type is preferential to the state model having a characteristic parameter compared to the state model according to the failure type other than the state model and the behavior of the normal state model. 13. The fault detection system verification control program according to claim 12, which causes the fault detection system verification apparatus to execute processing used for the fault detection system. 前記試験用データが与えられた前記障害発見システムから出力される前記障害検出結果を障害の種類毎に分類する障害種類分類処理と、
前記試験用データに基づいて前記障害の種類毎に前記サービス提供システムの状態を示す各状態パラメータの統計データを求めて障害種類別状態モデルを生成する障害種類別状態モデル生成処理と、
前記障害検出結果を構成する各発見障害事例毎に、前記試験用データから、各障害が発生した時刻及び場所に対応する前記サービス提供システムの状態情報を取り出し、該状態情報を前記発見障害事例の障害種類に対応する前記障害種類別状態モデルと比較して、該障害種類別状態モデルに対する乖離の度合いを示す外れ度を求める外れ度計算処理と、
前記外れ度の大きい前記発見障害事例から順に分類抽出して提示する分類抽出処理とを、前記障害発見システム検証装置に実行させるための請求項12記載の障害発見システム検証制御プログラム。
Fault type classification processing for classifying the fault detection results output from the fault detection system to which the test data is given for each fault type;
State model generation processing for each fault type for generating statistical data for each type of fault parameter by obtaining statistical data of each status parameter indicating the status of the service providing system for each type of fault based on the test data;
For each discovered failure case constituting the failure detection result, the status information of the service providing system corresponding to the time and place where each failure occurred is extracted from the test data, and the status information is extracted from the detected failure case. Compared with the state model for each failure type corresponding to the failure type, an outlier calculation process for obtaining a degree of deviation indicating the degree of deviation from the state model for each failure type;
13. The fault discovery system verification control program according to claim 12, wherein the fault discovery system verification control program causes the fault discovery system verification apparatus to execute classification extraction processing for classifying and presenting the detected fault cases in descending order of the degree of deviation.
前記試験用データ及び前記障害検出結果に基づいて、前記サービス提供システムが正常時の状態を示す各状態パラメータの統計データを求めて正常時状態モデルを生成する正常時状態モデル生成処理と、
システム状態を構成する状態パラメータのうち、前記障害種類別状態モデルでの振る舞いが、当該状態モデル以外の障害種類別状態モデル及び前記正常時状態モデルでの振る舞いと比較して特徴的なパラメータを有する状態モデルを特徴的状態モデルとして選定し、前記外れ度計算処理で前記外れ度を求める際に、前記特徴的状態モデルを優先的に使用させる障害種類別判定用パラメータ選定処理とを、前記障害発見システム検証装置に実行させるための請求項14記載の障害発見システム検証制御プログラム。
Based on the test data and the failure detection result, a normal state model generation process for generating a normal state model by obtaining statistical data of each state parameter indicating the normal state of the service providing system;
Among the state parameters constituting the system state, the behavior in the state model for each failure type has characteristic parameters as compared with the behavior in the state model for each failure type other than the state model and the normal state model. When selecting a state model as a characteristic state model and determining the degree of detachment in the detachment degree calculation process, a failure type determination parameter selection process that preferentially uses the characteristic state model, the failure discovery 15. The failure detection system verification control program according to claim 14, which is executed by a system verification device.
JP2008328429A 2008-12-24 2008-12-24 Failure detection system verification apparatus, failure detection system verification method, and failure detection system verification control program Active JP5267109B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008328429A JP5267109B2 (en) 2008-12-24 2008-12-24 Failure detection system verification apparatus, failure detection system verification method, and failure detection system verification control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008328429A JP5267109B2 (en) 2008-12-24 2008-12-24 Failure detection system verification apparatus, failure detection system verification method, and failure detection system verification control program

Publications (2)

Publication Number Publication Date
JP2010152539A JP2010152539A (en) 2010-07-08
JP5267109B2 true JP5267109B2 (en) 2013-08-21

Family

ID=42571577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008328429A Active JP5267109B2 (en) 2008-12-24 2008-12-24 Failure detection system verification apparatus, failure detection system verification method, and failure detection system verification control program

Country Status (1)

Country Link
JP (1) JP5267109B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377094B (en) * 2012-04-12 2016-08-03 金蝶软件(中国)有限公司 Method for monitoring abnormality and device
US10482000B2 (en) 2017-04-24 2019-11-19 Microsoft Technology Licensing, Llc Machine learned decision guidance for alerts originating from monitoring systems
JP2020201839A (en) * 2019-06-12 2020-12-17 富士通株式会社 Information collection program, information collection method, and information collection system
CN112782639B (en) * 2020-12-22 2022-09-13 国网浙江海宁市供电有限公司 Intelligent fault indication method and indicator for low-voltage metering box
CN112782638B (en) * 2020-12-22 2022-09-13 国网浙江海宁市供电有限公司 Fault diagnosis and maintenance method for electric energy meter in low-voltage metering box

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018530A (en) * 2006-09-11 2007-01-25 Nec Corp Forgetting histogram calculation device, and outlier degree calculation device using same
JP2008171104A (en) * 2007-01-10 2008-07-24 Nec Corp Monitoring apparatus, monitoring system, monitoring method and monitoring program for monitoring business service and system performance
JP4850733B2 (en) * 2007-01-26 2012-01-11 三菱電機株式会社 Health check device, health check method and program

Also Published As

Publication number Publication date
JP2010152539A (en) 2010-07-08

Similar Documents

Publication Publication Date Title
JP6828096B2 (en) Server hardware failure analysis and recovery
TWI632443B (en) Apparatus for determining importance of abnormal data and method for determining importance of abnormal data
US10346282B2 (en) Multi-data analysis based proactive defect detection and resolution
US6973415B1 (en) System and method for monitoring and modeling system performance
US8635498B2 (en) Performance analysis of applications
US7082381B1 (en) Method for performance monitoring and modeling
US20230401141A1 (en) Application state prediction using component state
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
CN107463161A (en) Predict the method and system and monitoring system of the failure in aircraft
JP5267109B2 (en) Failure detection system verification apparatus, failure detection system verification method, and failure detection system verification control program
US8448025B2 (en) Fault analysis apparatus, fault analysis method, and recording medium
CN107992410B (en) Software quality monitoring method and device, computer equipment and storage medium
US20140379714A1 (en) Detecting hardware and software problems in remote systems
JP5200970B2 (en) Quality control system, quality control device and quality control program
US7197428B1 (en) Method for performance monitoring and modeling
KR20190021560A (en) Failure prediction system using big data and failure prediction method
JP5387779B2 (en) Operation management apparatus, operation management method, and program
US9860109B2 (en) Automatic alert generation
US20220222545A1 (en) Generation method, non-transitory computer-readable storage medium, and information processing device
US9405657B2 (en) Application architecture assessment system
CN111555899B (en) Alarm rule configuration method, equipment state monitoring method, device and storage medium
JP6375200B2 (en) Apparatus and method for detecting abnormal signs of computer system
WO2020044898A1 (en) Device status monitoring device and program
US20140195679A1 (en) Monitoring Apparatus, Monitoring Method, And Non-Transitory Storage Medium
US9372746B2 (en) Methods for identifying silent failures in an application and devices thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110902

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130422

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5267109

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150