JP2018028778A - Pattern extraction and rule generation device, and method thereof - Google Patents

Pattern extraction and rule generation device, and method thereof Download PDF

Info

Publication number
JP2018028778A
JP2018028778A JP2016160030A JP2016160030A JP2018028778A JP 2018028778 A JP2018028778 A JP 2018028778A JP 2016160030 A JP2016160030 A JP 2016160030A JP 2016160030 A JP2016160030 A JP 2016160030A JP 2018028778 A JP2018028778 A JP 2018028778A
Authority
JP
Japan
Prior art keywords
failure
rule
fault
unique
events
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016160030A
Other languages
Japanese (ja)
Other versions
JP6637854B2 (en
Inventor
謙史 糸井
Kenji Itoi
謙史 糸井
大石 晴夫
Haruo Oishi
晴夫 大石
岡崎 勝彦
Katsuhiko Okazaki
勝彦 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016160030A priority Critical patent/JP6637854B2/en
Publication of JP2018028778A publication Critical patent/JP2018028778A/en
Application granted granted Critical
Publication of JP6637854B2 publication Critical patent/JP6637854B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To automatically generate and correct a rule by which it is possible to determine a place that caused a fault.SOLUTION: A pattern extraction and rule generation device of the present invention comprises: a database in which cause of fault information that includes a place that caused a fault and the cause of the fault, a fault event generated by the fault, and a rule ID corresponding to a rule that includes a condition part and a conclusion part are registered in association; a unique determination unit for generating all of possible combinations of fault events of new fault and extracting, for each fault, a unique pattern which is found to be a least occurred combination from a combination of fault events of new fault and a combination of fault events of old fault; and a rule generation and correction unit for generating or correcting the rule in accordance with a unique pattern that corresponds for each fault.SELECTED DRAWING: Figure 1

Description

この発明は、パターン抽出及びルール生成装置、及びその方法に関する。   The present invention relates to a pattern extraction and rule generation apparatus and method.

監視対象装置においてある障害により発生するイベント(以下、障害イベントと称する)を基にその障害要因を判定するIF−THENルールの作成に関する技術がある。この技術の文献は、例えば、特許文献1や特許文献2が知られている。   There is a technique related to creation of an IF-THEN rule for determining a failure factor based on an event (hereinafter referred to as a failure event) that occurs due to a certain failure in a monitoring target device. For example, Patent Literature 1 and Patent Literature 2 are known as documents of this technology.

特許文献1では、障害に関する知識を有する保守者がルールに定義すべき条件部(IF部)と障害の原因イベント(THEN部)を入力することをシステムが受けて、システムがルールを作成する。   In Patent Document 1, the system receives a condition part (IF part) to be defined in a rule and a cause event (THEN part) of a fault by a maintenance person having knowledge about the fault, and the system creates a rule.

一方、特許文献2では、ルール作成において、ルールの条件部のうち1つの障害イベントが結論部として定義される。   On the other hand, in Patent Document 2, one rule event is defined as a conclusion part in a rule condition part in rule creation.

国際公開第2014/068659号パンフレットInternational Publication No. 2014/068659 Pamphlet 特許第5684946号明細書Japanese Patent No. 5684946

しかしながら、ある障害において多種多様な種類の障害イベントが発生している場合、保守者が膨大な障害イベントの中からルールの条件部(IF部)に定義すべき障害イベントを検討し絞り込んだ上で入力することが必要となるため、障害イベントに関する知識と経験が必要であり、たとえ知識と経験があっても時間と労力が掛かるという課題がある。また、障害イベントの絞り込みを人間が検討するので、人為的な間違いが生じる可能性は常にある。さらに、日々様々なパターンの障害が発生する条件下においては、ルールを新規作成するだけではなく、過去に作成したルールの修正も併せて検討する必要が出てくることが想定され、その都度全ての既存ルールの条件部をルール作成者が見直し再検討することは困難であるという課題がある。   However, when a wide variety of types of failure events have occurred in a given failure, the maintenance person should examine and narrow down the failure events that should be defined in the rule condition part (IF unit) from a huge number of failure events. Since it is necessary to input, there is a problem that knowledge and experience regarding the failure event are necessary, and even if knowledge and experience are involved, it takes time and effort. In addition, since humans consider narrowing down failure events, there is always the possibility of human error. In addition, under conditions where various patterns of failures occur every day, it is assumed that it will be necessary not only to create a new rule, but also to modify a rule that has been created in the past. There is a problem that it is difficult for the rule creator to review and review the condition part of the existing rule.

また、障害要因が直接障害イベントに表れないようなケースの障害においては、引用文献2ではルールを作成することができないという課題がある。   Further, in the case of a failure in which the failure factor does not appear directly in the failure event, there is a problem that the cited document 2 cannot create a rule.

この発明は上記事情に着目してなされたもので、その目的とするところは、障害要因箇所を判定可能なルールを自動で作成及び修正する、パターン抽出及びルール生成装置、及びその方法を提供することにある。   The present invention has been made paying attention to the above circumstances, and an object thereof is to provide a pattern extraction and rule generation apparatus and method for automatically creating and correcting a rule capable of determining a failure factor location. There is.

上記目的を達成するためにこの発明の観点は、以下のような構成要素を備えている。すなわち、パターン抽出及びルール生成装置は、障害要因箇所及び障害要因を含む障害要因情報と、この障害により発生する障害イベントと、条件部と結論部を含むルールに対応付けられたルールIDと、を関連付けて登録しているデータベースと、新規の障害である新規障害の障害イベントの組合せを全通り生成し、新規障害の障害イベントの組合せと過去の障害である過去障害の障害イベントの組合せとから最も発生していない組合せと判定されるユニークパターンを障害ごとに抽出するユニーク判定部と、障害ごとに対応するユニークパターンに応じて、前記ルールを生成または修正するルール生成及び修正部と、を備える。   In order to achieve the above object, an aspect of the present invention includes the following components. That is, the pattern extraction and rule generation device includes failure factor information including a failure factor location and a failure factor, a failure event caused by the failure, and a rule ID associated with a rule including a condition part and a conclusion part. Generate all the combinations of the fault events of the new fault, which is the new fault, and the database registered in association with each other, and from the combination of the fault events of the new fault and the fault events of the past fault, which is the past fault, A unique determination unit that extracts, for each failure, a unique pattern that is determined to be a combination that has not occurred, and a rule generation and correction unit that generates or corrects the rule according to the unique pattern corresponding to each failure.

この発明によれば、障害要因箇所を判定可能なルールを自動で作成及び修正する、パターン抽出装置、ルール生成装置、及びその方法を提供することができる。   According to the present invention, it is possible to provide a pattern extraction device, a rule generation device, and a method for automatically creating and correcting a rule that can determine a failure factor location.

第1の実施形態に係るパターン抽出及びルール生成装置のブロック図。The block diagram of the pattern extraction and rule production | generation apparatus which concerns on 1st Embodiment. 図1のパターン抽出及びルール生成装置の方法を示すフロー図。The flowchart which shows the method of the pattern extraction and rule production | generation apparatus of FIG. 図1のパターン抽出及びルール生成装置とルールエンジンとを含むブロック図。The block diagram containing the pattern extraction and rule production | generation apparatus of FIG. 1, and a rule engine. 図3のブロックでのクラス図。The class diagram in the block of FIG. 図3のブロックでのフロー図。The flowchart in the block of FIG. 図5Aに続くフロー図。FIG. 5B is a flowchart following FIG. 5A. 図5Bに続くフロー図。The flowchart following FIG. 5B. IF−THENルールの一例を示す図。The figure which shows an example of an IF-THEN rule. 図5BでのステップSD4及びSD5での一例を示す図。The figure which shows an example in step SD4 and SD5 in FIG. 5B. 図5BでのステップSD4及びSD5での一例を示す図。The figure which shows an example in step SD4 and SD5 in FIG. 5B. 図5BでのステップSD4及びSD5での一例を示す図。The figure which shows an example in step SD4 and SD5 in FIG. 5B. 第2の実施形態に係るパターン抽出及びルール生成装置のブロック図。The block diagram of the pattern extraction and rule production | generation apparatus which concerns on 2nd Embodiment. 図10のパターン抽出及びルール生成装置の方法を示すフロー図。FIG. 11 is a flowchart showing a method of the pattern extraction and rule generation device of FIG. 10. 図10のパターン抽出及びルール生成装置とルールエンジンとを含むブロック図。FIG. 11 is a block diagram including the pattern extraction and rule generation device and rule engine of FIG. 10. 図12のブロックでのクラス図。The class diagram in the block of FIG. 図13のブロックでのフロー図。FIG. 14 is a flowchart in the block of FIG. 13. 図14Aに続くフロー図。FIG. 14B is a flowchart following FIG. 14A. 図14Bに続くフロー図。FIG. 14B is a flowchart following FIG. 14B. 図14BでのステップSD21及びSD22での一例を示す図。The figure which shows an example in step SD21 and SD22 in FIG. 14B. 図14BでのステップSD4及びSD5での一例を示す図。The figure which shows an example in step SD4 and SD5 in FIG. 14B. 図14BでのステップSD4及びSD5での一例を示す図。The figure which shows an example in step SD4 and SD5 in FIG. 14B. 図14BでのステップSD4及びSD5での一例を示す図。The figure which shows an example in step SD4 and SD5 in FIG. 14B.

以下、図面を参照してこの発明に係わる実施形態のパターン抽出及びルール生成装置、及びその方法を説明する。なお、以下の実施形態では、同一の番号を付した部分については同様の動作を行うものとして、重ねての説明を省略する。
[第1の実施形態]
第1の実施形態のパターン抽出及びルール生成装置100は、図1に示すように、障害イベント登録部101、ユニーク判定部102、ルール生成及び修正部103、過去障害再検証部104、及び障害事例データベース105を備えている。図1のブロック図、図2のパターン抽出及びルール生成装置100のフロー図を参照して説明する。
A pattern extraction and rule generation apparatus and method according to an embodiment of the present invention will be described below with reference to the drawings. Note that, in the following embodiments, the same numbered portions are assumed to perform the same operation, and repeated description is omitted.
[First Embodiment]
As shown in FIG. 1, the pattern extraction and rule generation apparatus 100 according to the first embodiment includes a failure event registration unit 101, a unique determination unit 102, a rule generation and correction unit 103, a past failure re-verification unit 104, and a failure example. A database 105 is provided. This will be described with reference to the block diagram of FIG. 1 and the flowchart of the pattern extraction and rule generation device 100 of FIG.

障害イベント登録部101は、新たに発生した障害(本障害、新規障害とも称す)に対応する1以上の障害イベントを、本障害の障害IDと、保守者が真の原因とその位置を特定した障害要因情報と、対応するルールIDとを関連付けて障害事例データベース105に登録する。障害IDは発生した障害ごとに付される。ルールIDはルールごとに付される。障害イベントは、障害IDに対応付けられ、障害IDに対応する障害により発生するイベントを示す。障害要因情報は、障害要因箇所の情報と、障害要因の情報とを含む。障害要因は障害が発生した原因を示し、障害要因箇所は障害が起きた位置(例えば装置ID)を示し、障害イベントは例えば、ある監視対象装置からのアラーム、ログ情報、閾値監視情報がある。障害要因箇所はある監視対象装置である。   The failure event registration unit 101 identifies one or more failure events corresponding to a newly occurring failure (this failure, also referred to as a new failure), the failure ID of the failure, the true cause, and the location thereof. The failure cause information and the corresponding rule ID are associated and registered in the failure case database 105. A failure ID is assigned to each failure that has occurred. A rule ID is assigned to each rule. The failure event is associated with the failure ID and indicates an event that occurs due to the failure corresponding to the failure ID. The failure factor information includes failure factor location information and failure factor information. The failure factor indicates the cause of the failure, the failure factor location indicates the location (for example, device ID) where the failure occurred, and the failure event includes, for example, an alarm, log information, and threshold value monitoring information from a certain monitoring target device. The failure factor is a certain monitoring target device.

なお、1以上の障害イベントを障害イベント群とも称す。1以上のルールをルールセットとも称す。ルールセットは、例えばルールエンジンが有しており、ルールは条件部と結論部を含んでいる。実施形態では、条件部は障害イベントであり、例えば装置IDとアラーム種別であり、結論部は障害要因情報であり装置IDと障害要因種別からなる。   One or more failure events are also referred to as failure event groups. One or more rules are also referred to as a rule set. For example, a rule engine has a rule set, and the rule includes a condition part and a conclusion part. In the embodiment, the condition part is a failure event, for example, a device ID and an alarm type, and the conclusion part is failure factor information, which includes a device ID and a failure factor type.

ユニーク判定部102は、本障害の障害イベント群から、本障害を特徴付けるユニークパターンの候補となる1以上の障害イベントを含む障害イベントの組合せを生成し障害事例データベース105に本障害の全通りの障害イベントの組合せを登録するとともに、障害事例データベース105に登録されている過去の全ての障害における障害イベントの組合せを参照し、これら全ての組合せから、それぞれの障害を特徴付ける障害イベントの組合せをユニークパターンとして障害(すなわち、障害ID)ごとに抽出し、障害IDに関連付けて障害事例データベース105にユニークパターンを登録する。障害イベントの組合せは、障害IDごとにその障害IDに対応付けられた全ての障害イベントの組合せである。ユニークパターンは、障害IDごとに障害イベントの組合せから所定の手法で算出され、障害IDごとに1つ算出される。そして、ユニークパターンはルールIDと一対一に対応している。また、障害対応において判定結果が正解の場合の障害イベント登録があるように(図2を参照)、1つのルールIDは複数の障害IDに登録される場合がある。さらに、1つのルールIDは、1以上の障害イベントに対応するので、多数の障害イベントと対応する場合もある。ユニークパターンの算出手法の一例は後に図7、図8、図9、図16、図17、及び図18を参照して説明する。   The unique determination unit 102 generates a combination of failure events including one or more failure events that are candidates for unique patterns that characterize the failure from the failure event group of the failure, and stores all the failures of the failure in the failure example database 105. In addition to registering a combination of events, reference is made to combinations of fault events in all past faults registered in the fault case database 105, and from these all combinations, combinations of fault events characterizing each fault are set as a unique pattern. Each fault (ie, fault ID) is extracted, and a unique pattern is registered in the fault case database 105 in association with the fault ID. The combination of failure events is a combination of all failure events associated with the failure ID for each failure ID. A unique pattern is calculated by a predetermined method from a combination of failure events for each failure ID, and one unique pattern is calculated for each failure ID. The unique pattern has a one-to-one correspondence with the rule ID. In addition, there is a case where one rule ID is registered in a plurality of failure IDs so that there is a failure event registration when the determination result is correct in handling a failure (see FIG. 2). Furthermore, since one rule ID corresponds to one or more failure events, it may correspond to many failure events. An example of the unique pattern calculation method will be described later with reference to FIGS. 7, 8, 9, 16, 17, and 18.

ルール生成及び修正部103は、本障害についてはユニーク判定部102で抽出されたユニークパターンを条件部として採用し、保守者により登録した障害要因情報を結論部として、ルールを新規生成しルールセットを改訂し、新たなルールIDを障害IDと関連付けて障害事例データベース105に登録する。   The rule generation and correction unit 103 adopts the unique pattern extracted by the unique determination unit 102 as a condition unit for this failure, and generates a new rule set by using the failure factor information registered by the maintenance person as a conclusion unit. Revise and register the new rule ID in the failure case database 105 in association with the failure ID.

一方、障害事例データベース105に登録されている過去のある一つの障害に対応する、ユニーク判定部102で抽出されたユニークパターンが、この障害IDに対応して登録されているルールの条件部に定義されている障害イベントの組合せと異なっている場合は、ルール生成及び修正部103はルールを修正する必要があると判断する。ルール生成及び修正部103が抽出したユニークパターンを条件部として採用し既存ルールを上書き修正し、障害事例データベース105に登録する。   On the other hand, the unique pattern extracted by the unique determination unit 102 corresponding to one past failure registered in the failure case database 105 is defined in the condition part of the rule registered corresponding to this failure ID. If the combination is different from the failure event combination, the rule generation and correction unit 103 determines that the rule needs to be corrected. The unique pattern extracted by the rule generation / correction unit 103 is used as a condition part to overwrite and correct the existing rule, and is registered in the failure case database 105.

過去障害再検証部104は、障害IDごとに、障害事例データベース105に登録されている障害イベント群の情報を基にルールエンジンによる再判定を行い、その判定結果である障害要因情報と、障害事例データベース105に登録されている障害要因情報(この情報は過去に保守者によって登録されたものである)とを照合し、照合して合致する場合(照合OKの場合)は、新たなルール追加が成功したとし、さらに既存ルールを上書き修正した場合にはルール修正も成功したとして、処理を終了する。一方、過去障害再検証部104は、照合して合致しない場合(照合NGの場合)はユニーク判定部102に戻って再び異なるユニークパターンを抽出する。過去障害再検証部104は、再検証であり、殆ど全ての場合で照合OKとなるが、希にデータが改変等されていて照合NGとなった場合にも対応するために設けられる。   The past failure re-verification unit 104 performs re-determination by the rule engine based on the information of the failure event group registered in the failure case database 105 for each failure ID, and the failure factor information as a result of the determination and the failure case If the failure cause information registered in the database 105 (this information has been registered by the maintainer in the past) is collated, and the collation matches (if collation is OK), a new rule is added. If it succeeds, and if the existing rule is overwritten and corrected, the rule is also corrected and the processing is terminated. On the other hand, the past failure re-verification unit 104 returns to the unique determination unit 102 and extracts a different unique pattern again when collation does not match (in the case of collation NG). The past failure re-verification unit 104 is re-verification, and the verification is OK in almost all cases. However, the past failure re-verification unit 104 is provided to cope with a case where the data is rarely modified or the verification results in a verification NG.

障害事例データベース105は、障害IDと、1つ以上の障害イベントと、障害要因情報と、障害イベントの組合せと、組合せのうちのユニークパターンと、ルールIDとを関連付けて登録している。障害事例データベース105は、通常、多数の障害IDについて上記の情報を関連付けて保存している。   The failure case database 105 registers a failure ID, one or more failure events, failure factor information, a combination of failure events, a unique pattern among the combinations, and a rule ID in association with each other. The failure case database 105 normally stores the above information in association with a number of failure IDs.

次にパターン抽出及びルール生成装置100の動作を図2を参照して説明する。
障害が発生したら、ルールエンジンが、障害に対応する1以上の障害イベント(例えば、装置IDとアラーム種別)を取得して、ネットワーク構成情報とルールセットを参照してルール判定を行い、どこで障害が発生したか及びどんな原因で障害が発生したかを示す判定結果を表示する。
Next, the operation of the pattern extraction and rule generation device 100 will be described with reference to FIG.
When a failure occurs, the rule engine acquires one or more failure events (for example, device ID and alarm type) corresponding to the failure, makes a rule determination with reference to the network configuration information and the rule set, and where the failure occurs. Displays the judgment result indicating whether the failure occurred and the cause of the failure.

その後、ルールエンジンが判定した判定結果と真因である障害対応結果とを保守者が比較して判定結果が正解であるどうかを判定する。判定結果が正解であると判定された場合にはこの障害イベントを障害事例データベース105に他の情報(上記の「障害事例データベース105」を参照)に関連付けて登録する。一方、判定結果が正解でないと判定された場合には、障害イベント登録部101が、保守者が障害対応によって真の原因とその位置を特定した障害要因情報をこの障害イベントに対応させて障害事例データベース105に他の情報に関連付けて新たに登録する(ステップS201)。   Thereafter, the maintenance person compares the determination result determined by the rule engine with the failure handling result that is the true cause, and determines whether or not the determination result is correct. If it is determined that the determination result is correct, the failure event is registered in the failure case database 105 in association with other information (see the above “failure case database 105”). On the other hand, if it is determined that the determination result is not correct, the failure event registration unit 101 causes the failure cause information that the maintenance person has identified the true cause and its position by handling the failure to correspond to the failure event, and the failure case It is newly registered in the database 105 in association with other information (step S201).

ステップS201の次に、ユニーク判定部102が、図1を参照して説明したように、本障害の障害IDに対して関連付けられている1以上の障害イベントを含む全通りの組合せを生成し、本障害に対応する障害イベントの組合せと、過去の全ての障害に対応する障害イベントの組合せ(過去分は、既に障害事例データベース105に登録されている)とから1つのユニークパターンを障害IDごとに抽出する(ステップS202)。抽出されたユニークパターンは、障害事例データベース105に他の情報と関連付けて登録される。一方、このユニークパターンが抽出できない場合には、ステップS205に進む。   After step S201, the unique determination unit 102 generates all combinations including one or more failure events associated with the failure ID of the failure, as described with reference to FIG. One unique pattern is combined for each failure ID from a combination of failure events corresponding to this failure and a combination of failure events corresponding to all past failures (the past is already registered in the failure case database 105). Extract (step S202). The extracted unique pattern is registered in the failure case database 105 in association with other information. On the other hand, if this unique pattern cannot be extracted, the process proceeds to step S205.

ステップS202でユニークパターンが抽出された場合は、ルール生成及び修正部103が本障害におけるユニークパターンを条件部として採用し、保守者により入力された障害要因情報を結論部として、ルールを新規生成し、障害事例データベース105に登録する(ステップS203)。ルール生成及び修正部103は生成したルールIDを障害事例データベースに登録する。また、障害事例データベースに登録されている過去のある障害において、登録されているルールの条件部に定義されている障害イベントの組合せが、ステップS202で抽出したユニークパターンと異なっている場合、該当障害のルールを修正し、障害事例データベース105に登録する(ステップS203)。   If a unique pattern is extracted in step S202, the rule generation and correction unit 103 adopts the unique pattern in this fault as a condition part, and generates a new rule using the fault factor information input by the maintenance person as a conclusion part. Then, it is registered in the failure case database 105 (step S203). The rule generation and correction unit 103 registers the generated rule ID in the failure case database. In addition, in the case of a past failure registered in the failure case database, if the combination of failure events defined in the condition part of the registered rule is different from the unique pattern extracted in step S202, the corresponding failure Are corrected and registered in the failure case database 105 (step S203).

過去障害再検証部104が、障害事例データベース105に登録されている全ての障害において、判定結果が正しく判定されるかルールエンジンを使用して再判定を行い、ルールセットの更新により判定精度が低下していないかを検証する(ステップS204)。過去のいずれかの障害において判定結果が不正解となった場合は、ステップS202に戻りユニーク判定部102が別の障害イベントの組合せを抽出することになる。またステップS204においてユニークパターンから生成したルールがいずれも過去障害再検証部104で照合NGとなった場合には、ステップS205へ進むことになる。一方、過去障害再検証部104で検証して照合OKとなって判定結果が正解となる場合には、新たなルール追加またはルール修正が成功したとして、処理を終了する。   The past failure re-verification unit 104 re-determines whether the determination result is correctly determined for all failures registered in the failure case database 105 using the rule engine, and the determination accuracy is reduced by updating the rule set It is verified whether it is not done (step S204). If the determination result is incorrect for any of the past failures, the process returns to step S202, and the unique determination unit 102 extracts another failure event combination. If any rule generated from the unique pattern in step S204 is collated NG in the past failure re-verification unit 104, the process proceeds to step S205. On the other hand, when the past failure re-verification unit 104 verifies and the verification result is OK, and the determination result is correct, the process ends, assuming that a new rule has been successfully added or modified.

ステップS205では、ユニーク判定部102において本障害を特徴付ける障害イベントが抽出できない場合であり、ルール化できない障害である旨を提示し、データをロールバックする。すなわち、この場合はユニーク判定部102が対応する本障害の障害IDに対応する障害イベントと保守者により登録した障害要因情報の登録をキャンセルする(ステップS205)。   In step S205, the unique determination unit 102 indicates that the failure event characterizing this failure cannot be extracted, presents that the failure cannot be ruled, and rolls back the data. That is, in this case, the registration of the failure event corresponding to the failure ID of the failure and the failure factor information registered by the maintenance person corresponding to the unique determination unit 102 is canceled (step S205).

次に本実施形態のパターン抽出及びルール生成装置100と、監視対象装置300と、ルールエンジン330と、保守者360との処理の流れを図3、図4、図5A、図5B及び図5Cを参照して説明する。なお、図4に記載の「*」はインスタンス数を示しゼロ以上の数値を意味する。
n個の監視対象装置300のうち1以上の装置で障害が発生するとする(ステップSA1)。その後、監視対象装置300が障害イベントをルールエンジン330に入力する(ステップSA2)。ここでの障害イベントは、例えば、IPアドレス、装置種別、及びアラーム種別を含む。なお、ここではアラーム種別はイベント種別の一種でありその下位概念として使用される。
Next, the processing flow of the pattern extraction and rule generation device 100, the monitoring target device 300, the rule engine 330, and the maintenance person 360 of the present embodiment is shown in FIGS. 3, 4, 5A, 5B, and 5C. The description will be given with reference. Note that “*” shown in FIG. 4 indicates the number of instances and means a numerical value of zero or more.
Assume that a failure occurs in one or more of the n monitoring target devices 300 (step SA1). Thereafter, the monitoring target device 300 inputs a failure event to the rule engine 330 (step SA2). The failure event here includes, for example, an IP address, a device type, and an alarm type. Here, the alarm type is a kind of event type and is used as a subordinate concept thereof.

ルールエンジン330は、障害イベントをパターン抽出及びルール生成装置100に通知する(ステップSB1)。この段階では、例えば、装置IDとアラーム種別を通知し、障害イベント登録部101はこの障害イベントを障害事例データベース105に登録する(ステップSD1)。   The rule engine 330 notifies the failure extraction event to the pattern extraction and rule generation device 100 (step SB1). At this stage, for example, the device ID and the alarm type are notified, and the failure event registration unit 101 registers this failure event in the failure case database 105 (step SD1).

また、ルールエンジン330ではネットワーク構成情報データベース332がネットワーク構成情報を外部から取得して外部情報と同期させておく。ネットワーク構成情報には、監視対象装置情報と、監視対象装置間接続情報がある。監視対象装置情報は図4に示すように、例えば、監視対象装置の装置ID、装置名、IPアドレス、装置種別を含む。監視対象装置間接続情報は図4に示すように、例えば、接続元装置IDと接続先装置IDとこの組の識別子を含む。図3及び図4の例では監視対象装置情報は、監視対象装置の数であるn個分ある。なお、監視対象装置間接続情報はn個分とは限らない。   In the rule engine 330, the network configuration information database 332 acquires the network configuration information from the outside and synchronizes with the external information. The network configuration information includes monitoring target device information and monitoring target device connection information. As shown in FIG. 4, the monitoring target device information includes, for example, a device ID, a device name, an IP address, and a device type of the monitoring target device. As shown in FIG. 4, the monitoring target device connection information includes, for example, a connection source device ID, a connection destination device ID, and an identifier of this set. In the example of FIGS. 3 and 4, there are n pieces of monitoring target device information, which is the number of monitoring target devices. Note that the monitoring target device connection information is not limited to n pieces.

さらに、ルールエンジン330では、障害イベント送受信部331が監視対象装置300から障害イベントを取得する。また、ルールエンジン330では、障害イベント群と障害要因情報を関連づけるIF−THENルールのセットを格納している。IF−THENルールは、前提又は条件を表すif部とif部が真である場合に結論又は動作を表すthen部から構成される(より詳しくは図6の説明を参照)。さらにルールエンジン330は、判定ロジック部333がある。判定ロジック部333は、ネットワーク構成情報と障害イベントとルールセットを受け取り、これらに基づいてどこで障害が発生したか(障害箇所)及びどんな原因で障害が発生したか(障害要因)を示す判定結果を得る(ステップSB2)。その後、判定ロジック部333は、判定結果(例えば、対応ルールID、装置ID及び/または装置名、障害要因種別)をパターン抽出及びルール生成装置100に送り、判定結果(例えば装置名、障害要因種別)を保守者360に送る(ステップSB3)。   Further, in the rule engine 330, the failure event transmission / reception unit 331 acquires a failure event from the monitoring target device 300. Further, the rule engine 330 stores a set of IF-THEN rules for associating a failure event group with failure factor information. The IF-THEN rule includes an “if” part representing a premise or condition and a “then” part representing a conclusion or an operation when the “if” part is true (see the description of FIG. 6 for more details). Further, the rule engine 330 includes a determination logic unit 333. The determination logic unit 333 receives the network configuration information, the failure event, and the rule set, and based on these, the determination result indicating where the failure has occurred (failure location) and for what cause the failure has occurred (failure factor). Obtain (step SB2). Thereafter, the determination logic unit 333 sends the determination result (for example, the corresponding rule ID, device ID and / or device name, failure factor type) to the pattern extraction and rule generation device 100, and the determination result (for example, the device name, failure factor type). ) Is sent to the maintenance person 360 (step SB3).

パターン抽出及びルール生成装置100では、障害イベント登録部101が障害事例データベース105に、判定ロジック部333からの判定結果(例えば、対応ルールID、装置ID及び/または装置名、障害要因種別)を登録する(ステップSD2)。   In the pattern extraction and rule generation device 100, the failure event registration unit 101 registers the determination result (for example, the corresponding rule ID, device ID and / or device name, failure factor type) from the determination logic unit 333 in the failure case database 105. (Step SD2).

保守者360は、ルールエンジン330が判定した判定結果を受け取り、内容を確認する(ステップSC1)。その後、保守者360が、ルールエンジン330が判定した判定結果と真因である障害対応結果を比較して判定結果が正解であるどうかを判定する(ステップSC2)。判定結果が正解であると判定された場合には、保守者360は何もせず終了となる。一方、判定結果が正解でないと判定された場合には保守者が障害対応によって真の原因とその位置を特定した障害要因情報をこの障害イベントに対応させて障害事例データベース105に障害イベント登録部101が登録する(ステップS201)。パターン抽出及びルール生成装置100は、特定された障害要因情報をこの障害イベントに対応させて障害事例データベース105に登録する(ステップSD3)。   The maintenance person 360 receives the determination result determined by the rule engine 330 and confirms the content (step SC1). After that, the maintenance person 360 compares the determination result determined by the rule engine 330 with the failure handling result that is the true cause to determine whether the determination result is correct (step SC2). If it is determined that the determination result is correct, the maintenance person 360 does nothing and ends. On the other hand, if it is determined that the determination result is not correct, the maintenance event is registered in the failure case database 105 in the failure event database 105 by associating the failure cause information that specifies the true cause and its location by handling the failure. Is registered (step S201). The pattern extraction and rule generation device 100 registers the specified failure factor information in the failure case database 105 in association with the failure event (step SD3).

その後は、パターン抽出及びルール生成装置100での処理が続く。ユニーク判定部102が本障害の障害イベント群から1以上の障害イベントを含む障害イベントの組合せを生成し障害事例データベース105に登録する(ステップSD4)。障害事例データベース105に登録されている全ての障害における障害イベントの組合せから、ユニーク判定部102が各障害を特徴付けるユニークパターンを抽出し、障害事例データベース105に登録する。また過去障害再検証部104が各障害における判定結果を再検証し照合NGとなった場合は、該当の障害において次にユニークな障害イベントの組合せをユニークパターンとして障害事例データベース105に登録する(ステップSD5)。ルール生成及び修正部103が、障害事例データベース105に登録されている過去のある障害において、登録されているルールの条件部に定義されている障害イベントの組合せと、これまでの処理にて登録したユニークパターンとを比較し異なっている場合は、ルールを修正する必要があると判断する(ステップSD6)。ルール生成及び修正部103は、本障害についてはユニークパターンを条件部として採用し、保守者360により登録した障害要因情報を結論部として、ルールを新規生成し、既存ルールの修正は、抽出したユニークパターンを条件部として上書き修正する(ステップSD7)。その後ルール生成及び修正部103が、障害事例データベース105に、生成されたルールのルールIDを上書き登録する(ステップSD8)。ルール生成及び修正部103は、生成及び修正されたルールをルールエンジン330にフィードバックする(ステップSD9)。ルールエンジン330は、生成及び修正されたルールを取り込んでルールセットを更新する(ステップSB4)。   Thereafter, the pattern extraction and rule generation apparatus 100 continues processing. The unique determination unit 102 generates a combination of failure events including one or more failure events from the failure event group of this failure and registers it in the failure case database 105 (step SD4). The unique determination unit 102 extracts a unique pattern characterizing each failure from combinations of failure events in all failures registered in the failure case database 105 and registers them in the failure case database 105. If the past failure re-verification unit 104 re-verifies the determination result for each failure and the result is collation NG, the next unique failure event combination for the corresponding failure is registered as a unique pattern in the failure case database 105 (step SD5). The rule generation / correction unit 103 has registered the failure event combination defined in the condition part of the registered rule and the processing so far in the past failure registered in the failure case database 105 If it is different from the unique pattern, it is determined that the rule needs to be corrected (step SD6). The rule generation and correction unit 103 adopts a unique pattern as a condition part for this fault, generates a new rule using the failure factor information registered by the maintenance person 360 as a conclusion part, and corrects the existing rule by extracting the unique The pattern is overwritten and corrected as a condition part (step SD7). Thereafter, the rule generation and correction unit 103 overwrites and registers the rule ID of the generated rule in the failure case database 105 (step SD8). The rule generation / correction unit 103 feeds back the generated and corrected rules to the rule engine 330 (step SD9). The rule engine 330 takes in the generated and modified rules and updates the rule set (step SB4).

パターン抽出及びルール生成装置100が、障害事例データベース105に登録されている全ての障害イベントを障害ID単位でルールエンジンに渡す(ステップSD10)。ルールエンジン330は、全ての障害イベントを受け取り、障害IDごとに入力された障害イベント群とネットワーク構成情報及びルールセットを基に、障害要因と障害要因箇所を判定する(ステップSB5)。そして、ルールエンジン330は、障害IDごとの判定結果(例えば、装置ID及び障害要因種別)をパターン抽出及びルール生成装置100に通知する(ステップSB6)。   The pattern extraction and rule generation device 100 passes all failure events registered in the failure case database 105 to the rule engine in units of failure IDs (step SD10). The rule engine 330 receives all the failure events, and determines a failure factor and a failure factor location based on the failure event group, network configuration information, and rule set input for each failure ID (step SB5). Then, the rule engine 330 notifies the pattern extraction and rule generation device 100 of the determination result (for example, device ID and failure factor type) for each failure ID (step SB6).

パターン抽出及びルール生成装置100では、過去障害再検証部104が障害IDごとに、ルールエンジン330から通知された判定結果(例えば、装置ID及び障害要因種別)と、障害事例データベース105に登録されている障害要因情報を照合する(ステップSD11)。照合がNGである障害IDがあった場合には、ステップSD5に戻り、ユニーク判定部102がユニークパターンを抽出し、ルール生成または修正を行う。一方、全ての障害イベントが照合OKである場合にはこの処理を終了する。   In the pattern extraction and rule generation device 100, the past failure re-verification unit 104 is registered for each failure ID in the determination result (for example, device ID and failure factor type) notified from the rule engine 330 and the failure case database 105. The failure factor information is collated (step SD11). If there is a failure ID whose collation is NG, the process returns to step SD5, where the unique determination unit 102 extracts a unique pattern and performs rule generation or correction. On the other hand, if all failure events are collation OK, this process ends.

ここで、ルールエンジン330で使用されるIF−THENルールについて図6を参照して簡単に説明する。
IF−THENルールは、ある事実から導出される結論というような推論知識や、ある条件が成立したときに行われる行動に関する知識を記述する。一般に「α→β」「if α then β」という形式で記述され、前提又は条件を表すif部と、if部が真である場合に実行される結論又は動作を表すthen部とから構成される。図6に示される例は、障害要因箇所を判定するルールであり、装置Aで障害イベントaが発生し装置Cで障害イベントcが発生している場合には、装置Bでは「device fail」になっていることを示している。
Here, the IF-THEN rule used in the rule engine 330 will be briefly described with reference to FIG.
The IF-THEN rule describes inference knowledge such as a conclusion derived from a certain fact and knowledge about an action performed when a certain condition is satisfied. Generally described in the form of “α → β” and “if α then β”, and is composed of an “if” portion representing a premise or condition and a “then” portion representing a conclusion or an action to be executed when the “if” portion is true. . The example shown in FIG. 6 is a rule for determining a failure factor location. When the failure event a occurs in the device A and the failure event c occurs in the device C, the device B sets “device fail”. It shows that it has become.

次に、パターン抽出及びルール生成装置100でのステップSD4及びSD5について具体例を挙げて説明する。図7、図8、及び図9を参照して説明する。
障害事例データベース105に登録されている全ての障害イベントから、ユニーク判定部102が各障害におけるユニークな障害イベントを抽出する処理について図7を参照して説明する。
障害事例データベース105には、左上図のように障害IDごとに障害イベントが対応付けられて登録されている。ここでの例では、障害イベントは装置IDとイベント種別を含んでいる。ユニーク判定部102はまず、各障害で取り得る障害イベントの組合せを生成する。この例では、障害ID=1では、(装置ID,イベント種別)=(sw1,a),(sw2,b)があり、全ての組合せは3組あり、(sw1,a)のみ(図では「sw1a」)、(sw2,b)のみ(図では「sw2b」)、(sw1,a)と(sw2,b)(図では「sw1a,sw2b」)である。障害ID=2では、(装置ID,イベント種別)=(sw1,a)、(sw3,c)があり、全ての組合せはsw1a、sw3c、及びsw1aとsw3cの3組ある。
Next, steps SD4 and SD5 in the pattern extraction and rule generation device 100 will be described with specific examples. This will be described with reference to FIGS. 7, 8, and 9. FIG.
A process in which the unique determination unit 102 extracts a unique failure event for each failure from all failure events registered in the failure case database 105 will be described with reference to FIG.
In the failure case database 105, failure events are registered in association with each failure ID as shown in the upper left diagram. In this example, the failure event includes a device ID and an event type. First, the unique determination unit 102 generates a combination of failure events that can be taken by each failure. In this example, when the failure ID = 1, there are (device ID, event type) = (sw1, a), (sw2, b), there are three combinations, and only (sw1, a) (“ sw1a "), (sw2, b) only (" sw2b "in the figure), (sw1, a) and (sw2, b) (" sw1a, sw2b "in the figure). For failure ID = 2, there are (device ID, event type) = (sw1, a), (sw3, c), and there are three combinations of sw1a, sw3c, and sw1a and sw3c.

その後、ユニーク判定部102はこれらの障害イベントの組合せから、ユニークパターン抽出ロジックに従ってユニークパターンを抽出する。ユニークパターン抽出ロジックはまず、障害イベントの組合せごとに他の障害IDでの登録率を全ての他の障害IDについて算出し、その後、障害イベントの組合せごとに登録率(他の障害IDが複数ある場合は複数ある)のうちの最大の登録率を決定する。ユニークパターン抽出ロジックは、次に、全ての障害イベントの組合せの最大登録率のうちの最小の値に対応する組合せをユニークパターンとして抽出する。   Thereafter, the unique determination unit 102 extracts a unique pattern from the combination of these failure events according to the unique pattern extraction logic. The unique pattern extraction logic first calculates the registration rate for other failure IDs for each failure event combination for all other failure IDs, and then registers the registration rate for each failure event combination (there are multiple other failure IDs). The maximum registration rate is determined. Next, the unique pattern extraction logic extracts a combination corresponding to the minimum value among the maximum registration rates of all the failure event combinations as a unique pattern.

ここで、登録率とは、障害イベントの組合せのイベント数を分母とし組合せのうちの他の障害イベント群に登録されている個数を分子として算出する。これによると登録率は、0から1までの値を取り、ある障害IDの障害イベントの1つの組合せが他のある障害IDにどの程度登録されているかを示す。例えば、登録率が1の場合は注目している障害IDの障害イベントの1つの組合せが他のある障害IDにおける障害イベント群に全て登録されていることを示し、登録率が0.5の場合は注目している障害IDの障害イベントの1つの組合せが他のある障害IDに半分のみ登録されていることを示し、登録率が0の場合は注目している障害IDの障害イベントの1つの組合せが他のある障害IDに全く登録されていないことを示す。また、ユニークパターンは、注目している障害IDの障害イベントの組合せのうち、他の障害IDの障害イベントの組合せで最も発生していない組合せ(換言すれば、最も他の障害IDの組合せと被らない組合せ、すなわち、ユニークな組合せ)であると言える。   Here, the registration rate is calculated by using the number of events of a combination of failure events as a denominator and the number registered in another failure event group of the combination as a numerator. According to this, the registration rate takes a value from 0 to 1, and indicates how much one combination of failure events of a certain failure ID is registered in another certain failure ID. For example, when the registration rate is 1, it indicates that one combination of failure events of the failure ID of interest is registered in the failure event group of another failure ID, and the registration rate is 0.5 Indicates that only one half of the combination of the failure event of the failure ID of interest is registered in another failure ID. If the registration rate is 0, one of the failure events of the failure ID of interest is Indicates that the combination is not registered at all for some other fault ID. Further, the unique pattern is a combination of failure events of the failure ID of interest that is least generated by a combination of failure events of other failure IDs (in other words, a combination of the failure event combination of the most other failure ID and It can be said that the combination is not unique, that is, a unique combination).

次に図7の下方の具体例を参照してユニークパターンの抽出を説明する。
図7の例では、障害ID=2の障害イベントの組合せは、上述したようにsw1a、sw3c、及びsw1aとsw3cの3組ある。また、この例では、障害IDは1と2の2つのみなので、ID=2の他の障害となるのはID=1のみとなる。
Next, extraction of a unique pattern will be described with reference to a specific example below in FIG.
In the example of FIG. 7, there are three combinations of failure events with failure ID = 2, sw1a, sw3c, and sw1a and sw3c as described above. In this example, since there are only two failure IDs 1 and 2, only ID = 1 is the other failure with ID = 2.

sw1aの場合は、他の障害ID=1でイベント群はsw1a、sw2bとなる。従って、障害イベント数はsw1aのみなので分母は1、sw1aは他の障害ID=1のイベント群に登録されているため分子は1となり、登録率は1/1=1.0になる。       In the case of sw1a, the other failure ID = 1 and the event groups are sw1a and sw2b. Therefore, since the number of failure events is only sw1a, the denominator is 1, and sw1a is registered in the event group of other failure ID = 1, so the numerator is 1, and the registration rate is 1/1 = 1.0.

sw3cの場合は、他の障害ID=1でイベント群はsw1a、sw2bとなる。従って、障害イベント数はsw3cのみなので分母は1、sw3cは他の障害ID=1のイベント群に登録されていないので分子は0となり、登録率は0/1=0.0になる。       In the case of sw3c, the other failure ID = 1 and the event groups are sw1a and sw2b. Therefore, since the number of failure events is only sw3c, the denominator is 1, and sw3c is not registered in the other event group of failure ID = 1, so the numerator is 0, and the registration rate is 0/1 = 0.0.

sw1a、sw3cの場合は、他の障害ID=1でイベント群はsw1a、sw2bとなる。従って、障害イベント数はsw1a及びsw3cなので分母は2、sw1a、sw3cは他の障害ID=1のイベント群に1つだけ登録されているので分子は1となり、登録率は1/2=0.5になる。       In the case of sw1a and sw3c, the other failure ID = 1 and the event group is sw1a and sw2b. Accordingly, since the number of failure events is sw1a and sw3c, the denominator is 2, and only one sw1a and sw3c are registered in the event group of other failure ID = 1, so the numerator is 1, and the registration rate is 1/2 = 0. 5

以上により最大登録率が最小なのは0.0であるのでその組合せはsw3cとなり、図7の例での障害ID=2のユニークパターンはsw3cである。   As described above, since the minimum registration rate is 0.0, the combination is sw3c, and the unique pattern with the failure ID = 2 in the example of FIG. 7 is sw3c.

次に、障害ID=1及び2が既に障害事例データベース105に登録されていて、新たに障害ID=3が発生した場合(既に登録している障害IDのユニークパターンが変更となるケース)について図8を参照して説明する。図8の下方が新たな障害が発生した場合の障害事例データベース105の内容を示している。   Next, a case where failure IDs 1 and 2 are already registered in the failure case database 105 and a new failure ID = 3 occurs (a case where the unique pattern of the already registered failure ID is changed) is illustrated. Explanation will be made with reference to FIG. The lower part of FIG. 8 shows the contents of the failure case database 105 when a new failure occurs.

このように1つの障害IDが増えると、追加した障害IDに対し障害イベントの組合せを新たに計算する。組合せは以前にあった障害IDごとで変化しない。しかし、ある障害IDのユニークパターンはその他の全ての障害IDが影響するので、以前からある障害IDのユニークパターンは障害IDが増えることにより変化することがある。例えば、図8の例では障害ID=2のユニークパターンは、sw3cからsw1a、sw3cに変化し、一方、障害ID=1のユニークパターンはsw2bと変化しない。   When one failure ID increases in this way, a combination of failure events is newly calculated for the added failure ID. The combination does not change for each previous failure ID. However, since the unique pattern of a certain failure ID is affected by all other failure IDs, the unique pattern of a certain failure ID may change as the number of failure IDs increases. For example, in the example of FIG. 8, the unique pattern with the failure ID = 2 changes from sw3c to sw1a and sw3c, while the unique pattern with the failure ID = 1 does not change with sw2b.

図8の下に記載の障害IDが3つある場合でのユニークパターンの算出について図9を参照して説明する。
図8の下方に記載の例(図9も同一)では、障害ID=2の障害イベントの組合せは、sw1a、sw3c、及びsw1aとsw3cの3組ある。また、この例では、障害IDは1、2、及び3の3つなので、ID=2の他の障害となるのはID=1,3となる。
The calculation of the unique pattern when there are three failure IDs described at the bottom of FIG. 8 will be described with reference to FIG.
In the example described in the lower part of FIG. 8 (FIG. 9 is the same), there are three combinations of failure events of failure ID = 2, sw1a, sw3c, and sw1a and sw3c. In this example, since there are three failure IDs 1, 2, and 3, ID = 1 and 3 are the other failures with ID = 2.

sw1aかつ他の障害ID=1の場合は、イベント群はsw1a、sw2bとなる。従って、障害イベント数はsw1aのみなので分母は1、sw1aは他の障害ID=1のイベント群に登録されているため分子は1となり、登録率は1/1=1.0になる。       When sw1a and other failure ID = 1, the event groups are sw1a and sw2b. Therefore, since the number of failure events is only sw1a, the denominator is 1, and sw1a is registered in the event group of other failure ID = 1, so the numerator is 1, and the registration rate is 1/1 = 1.0.

sw1aかつ他の障害ID=3の場合は、イベント群はsw3c、sw4dとなる。従って、障害イベント数はsw1aのみなので分母は1、sw1aは他の障害ID=3のイベント群に登録されていないので分子は0となり、登録率は0/1=0.0になる。
従って、障害イベントの組合せがsw1aの場合は最大登録率は1.0になる。
In the case of sw1a and another failure ID = 3, the event group is sw3c and sw4d. Accordingly, since the number of failure events is only sw1a, the denominator is 1, and sw1a is not registered in the other failure ID = 3 event group, so the numerator is 0, and the registration rate is 0/1 = 0.0.
Therefore, when the combination of failure events is sw1a, the maximum registration rate is 1.0.

sw3cかつ他の障害ID=1の場合は、イベント群はsw1a、sw2bとなる。従って、障害イベント数はsw3cのみなので1で分母は1、sw3cは他の障害ID=1のイベント群に登録されていないので分子は0となり、登録率は0/1=0.0になる。       When sw3c and other failure ID = 1, the event groups are sw1a and sw2b. Accordingly, since the number of failure events is only sw3c, the denominator is 1, and sw3c is not registered in the event group of other failure ID = 1, so the numerator is 0, and the registration rate is 0/1 = 0.0.

sw3cかつ他の障害ID=3場合は、イベント群はsw3c、sw4dとなる。従って、障害イベント数はsw3cのみなので1で分母は1、sw3cは他の障害ID=3のイベント群に登録されているため分子は1となり、登録率は1/1=1.0になる。
従って、障害イベントの組合せがsw3cの場合は最大登録率は1.0になる。
When sw3c and other failure ID = 3, the event groups are sw3c and sw4d. Therefore, since the number of failure events is only sw3c, the denominator is 1, and sw3c is registered in the event group of other failure ID = 3, so the numerator is 1, and the registration rate is 1/1 = 1.0.
Therefore, when the combination of failure events is sw3c, the maximum registration rate is 1.0.

sw1a、sw3cかつ他の障害ID=1の場合は、イベント群はsw1a、sw2bとなる。従って、障害イベント数はsw1a及びsw3cなので2で分母は2、sw1a、sw3cは他の障害ID=1のイベント群に1つだけ登録されているので分子は1となり、登録率は1/2=0.5になる。       When sw1a and sw3c and other failure IDs = 1, the event groups are sw1a and sw2b. Accordingly, since the number of failure events is sw1a and sw3c, the denominator is 2, and only one sw1a and sw3c are registered in other failure ID = 1 event groups, so the numerator is 1, and the registration rate is 1/2 = 0.5.

sw1a、sw3cかつ他の障害ID=3の場合は、イベント群はsw3c、sw4dとなる。従って、障害イベント数はsw1a及びsw3cなので2で分母は2、sw1a、sw3cは他の障害ID=3のイベント群に1つだけ登録されているので分子は1となり、登録率は1/2=0.5になる。
従って、障害イベントの組合せがsw1a、sw3cの場合は最大登録率は0.5になる。
When sw1a and sw3c and other failure ID = 3, the event group is sw3c and sw4d. Therefore, since the number of failure events is sw1a and sw3c, the denominator is 2, and only one sw1a and sw3c are registered in other failure ID = 3 event groups, so the numerator is 1, and the registration rate is 1/2 = 0.5.
Therefore, when the combination of failure events is sw1a and sw3c, the maximum registration rate is 0.5.

以上により最大登録率が最小なのは0.5であるのでその組合せはsw1a、sw3cとなり、図9の例での障害ID=2のユニークパターンはsw1a、sw3cである。   As described above, since the maximum registration rate is 0.5, the combination is sw1a and sw3c, and the unique pattern of failure ID = 2 in the example of FIG. 9 is sw1a and sw3c.

以上に説明した第1の実施形態によれば、保守者の障害に関する知識と経験に依らず、障害対応の結果明らかになった障害要因情報を入力するのみで、ルールの自動作成及び修正が可能になる。このため、ルール作成及び修正における時間と労力が大幅に削減される。また、保守者はルール作成のために入力に関係するだけなので、ルール作成における人為的なミスが軽減される。   According to the first embodiment described above, rules can be automatically created and modified only by inputting failure factor information that has been clarified as a result of failure handling, regardless of the maintenance person's knowledge and experience regarding failures. become. This greatly reduces the time and effort required to create and modify rules. Further, since the maintenance person is only concerned with input for rule creation, human error in rule creation is reduced.

さらに第1の実施形態によれば、障害対応の都度、システムが保持する全ての障害イベントを基に、ルールの新規生成だけでなく既存ルールの修正が行われるので、ルールが適正化されていく。また、障害要因情報を障害イベントとは切り離して保守者が入力することで、障害要因が障害イベントに直接表れないようなケースにおいても障害要因を判定可能なルールを作成することが可能になる。   Furthermore, according to the first embodiment, every time a failure is handled, not only a new rule is generated but also an existing rule is modified based on all failure events held by the system, so that the rule is optimized. . Further, by inputting the failure factor information separately from the failure event, the maintenance person inputs a rule that can determine the failure factor even in a case where the failure factor does not appear directly in the failure event.

[第2の実施形態]
第2の実施形態のパターン抽出及びルール生成装置1000は、図10に示すように、ルール生成及び修正部103の代わりにルール生成及び修正部1001を備え、障害事例データベース105の代わりに障害事例データベース1002を備え、さらに新たに相関アラーム登録部1003を備える点が第1の実施形態とは異なる。図10のブロック図、図11のパターン抽出及びルール生成装置1000のフロー図を参照して説明する。
[Second Embodiment]
As shown in FIG. 10, the pattern extraction and rule generation apparatus 1000 according to the second embodiment includes a rule generation and correction unit 1001 instead of the rule generation and correction unit 103, and a failure case database instead of the failure case database 105. The second embodiment is different from the first embodiment in that a correlation alarm registration unit 1003 is further provided. Description will be made with reference to the block diagram of FIG. 10 and the flowchart of the pattern extraction and rule generation apparatus 1000 of FIG.

相関アラーム登録部1003は、保守者が真の原因として特定した障害要因箇所の情報を起点とし、コンポーネント間接続関係で定義されている接続関係の情報を基に、相関のある装置から検出された障害イベントを抽出し、障害事例データベース1002の障害イベント群のデータを上書きする。また相関アラーム登録部1003は、障害イベントを抽出する際に使用したコンポーネント間接続関係の接続関係をそれぞれの障害イベントに紐付ける形で障害事例データベース1002に保存する。コンポーネント間接続関係は、障害イベント発生箇所と障害要因箇所との因果関係を示す情報である。   The correlation alarm registration unit 1003 is detected from a correlated device based on the information on the connection relationship defined in the inter-component connection relationship, starting from information on the cause of the failure identified as the true cause by the maintenance person The failure event is extracted, and the failure event group data in the failure case database 1002 is overwritten. Further, the correlation alarm registration unit 1003 stores the connection relation of the inter-component connection relation used when extracting the fault event in the fault case database 1002 in a form linked to each fault event. The inter-component connection relationship is information indicating a causal relationship between a failure event occurrence location and a failure factor location.

ネットワーク構成情報は、監視対象装置情報(IPアドレス、装置種別、等)と、監視対象装置間の接続情報を含んでいる。   The network configuration information includes monitoring target device information (IP address, device type, etc.) and connection information between the monitoring target devices.

ルール生成及び修正部1001は、本障害におけるユニークパターンを条件部として採用し、保守者により入力された障害要因情報を結論部として、ルールを新規生成する。併せてルール生成及び修正部1001は、条件部としたユニークパターンの障害イベントに紐付くコンポーネント間接続関係をルールに定義し、生成したルールIDを障害事例データベース1002に登録する。障害事例データベース1002に登録されている過去のある障害において、登録されているルールの条件部に定義されている障害イベントの組合せが、ユニーク判定部102が抽出したユニークパターンと異なっている場合、ルール生成及び修正部1001はルールを修正する必要があると判断する。ルール生成及び修正部1001が抽出したユニークパターンを条件部として採用し、採用した障害イベントに紐付くコンポーネント間接続関係と併せて既存ルールを上書き修正し、障害事例データベース1002に登録する。   The rule generation / correction unit 1001 adopts a unique pattern in this failure as a condition part, and newly generates a rule using the failure factor information input by the maintenance person as a conclusion part. In addition, the rule generation / correction unit 1001 defines a connection relation between components associated with the failure event of the unique pattern as the condition part in the rule, and registers the generated rule ID in the failure case database 1002. If there is a failure in the past registered in the failure case database 1002 and the combination of failure events defined in the condition part of the registered rule is different from the unique pattern extracted by the unique determination unit 102, the rule The generation and correction unit 1001 determines that the rule needs to be corrected. The unique pattern extracted by the rule generation and correction unit 1001 is adopted as a condition unit, and the existing rule is overwritten and corrected together with the connection relation between components linked to the adopted failure event, and is registered in the failure case database 1002.

障害事例データベース1002は、過去に発生した障害イベントとそれぞれの障害における障害要因情報及び対応ルールIDを含んでいる。なお、この障害イベントは本障害にて発生した障害イベントを含む。障害事例データベース1002は、障害事例データベース105が蓄積しているデータに加え、障害イベントが抽出される際に使用されたコンポーネント間接続関係の接続関係をそれぞれの障害要因情報に紐付ける。コンポーネント間接続関係は例えば、接続元装置種別と接続先装置種別とそれらの接続関係と識別子を含む。障害事例データベース1002は、障害IDと、1つ以上の障害イベントと、障害要因情報と、障害イベントの組合せと、組合せのうちのユニークパターンと、ルールIDと、コンポーネント間接続関係とを関連付けて登録している。障害事例データベース1002は、通常、多数の障害IDについて上記の情報を関連付けて保存している。   The failure case database 1002 includes failure events that occurred in the past, failure factor information and corresponding rule IDs for each failure. This failure event includes a failure event that has occurred due to this failure. The failure case database 1002 associates the connection relationship between the components used when the failure event is extracted in addition to the data accumulated in the failure case database 105 with each failure factor information. The inter-component connection relationship includes, for example, a connection source device type, a connection destination device type, their connection relationship, and an identifier. The failure case database 1002 registers a failure ID, one or more failure events, failure factor information, a combination of failure events, a unique pattern among the combinations, a rule ID, and an inter-component connection relationship. doing. The failure case database 1002 normally stores the above information in association with a number of failure IDs.

次にパターン抽出及びルール生成装置1000の動作について図11を参照して説明する。ステップS201までは第1の実施形態と同様であるので、次のステップS1101から説明する。   Next, the operation of the pattern extraction and rule generation apparatus 1000 will be described with reference to FIG. Since the process up to step S201 is the same as that of the first embodiment, the process will be described from the next step S1101.

相関アラーム登録部1003は、保守者が真の原因として特定した障害要因箇所の情報を起点とし、コンポーネント間接続関係で定義されている接続関係の情報を基に、相関のある装置から検出された障害イベントを抽出し、障害事例データベース1002の障害イベント群のデータを上書きする。また相関アラーム登録部1003は、障害イベントの抽出に使用したコンポーネント間接続関係の接続関係をそれぞれの障害情報に紐付ける形で障害事例データベース1002に登録する(ステップS1101)。ステップS1101の次はステップS202であり第1の実施形態に同様である。   The correlation alarm registration unit 1003 is detected from a correlated device based on the information on the connection relationship defined in the inter-component connection relationship, starting from information on the cause of the failure identified as the true cause by the maintenance person The failure event is extracted, and the failure event group data in the failure case database 1002 is overwritten. Further, the correlation alarm registration unit 1003 registers the connection relation of the inter-component connection relation used for extracting the fault event in the fault case database 1002 in a form linked to each fault information (step S1101). Following step S1101 is step S202, which is the same as in the first embodiment.

ステップS202でユニークパターンが抽出された場合は、ルール生成及び修正部1001が本障害におけるユニークパターンを条件部として採用し、保守者により入力された障害要因情報を結論部として、ルールを新規生成する(ステップS1102(ステップS203と同様))。併せてルール生成及び修正部1001は、条件部として採用したユニークパターンの障害イベントに紐付くコンポーネント間接続関係をルールに定義し、生成したルールIDを障害事例データベースに登録する(ステップS1102)。障害事例データベースに登録されている過去のある障害において、登録されているルールの条件部に定義されている障害イベントの組合せが、ユニーク判定部102で抽出したユニークパターンと異なっている場合、該当障害のルールを修正し、障害事例データベース1002に登録する(ステップS1102(ステップS203と同様))。以下のステップは第1の実施形態と同様である(例えば、図2参照)。   If a unique pattern is extracted in step S202, the rule generation and correction unit 1001 adopts the unique pattern in this fault as a condition part, and generates a new rule using the fault factor information input by the maintenance person as a conclusion part. (Step S1102 (same as Step S203)). At the same time, the rule generation and correction unit 1001 defines the connection relation between components associated with the failure event of the unique pattern adopted as the condition unit in the rule, and registers the generated rule ID in the failure case database (step S1102). In the case of a past failure registered in the failure case database, if the combination of failure events defined in the condition part of the registered rule is different from the unique pattern extracted by the unique determination unit 102, the corresponding failure Are corrected and registered in the failure case database 1002 (step S1102 (same as step S203)). The following steps are the same as those in the first embodiment (for example, see FIG. 2).

次に本実施形態のパターン抽出及びルール生成装置1000と、監視対象装置300と、ルールエンジン330と、保守者360との処理の流れを図12、図13、図14A、図14B及び図14Cを参照して説明する。なお、図13に記載の「*」はインスタンス数を示しゼロ以上の数値を意味する。なお、ステップSA1、SA2、ステップSB1〜SB6、ステップSC1、SC2、ステップSD1〜SD6、SD8〜SD11は第1の実施形態と同様であるので説明は省略する。
ステップSD3において、パターン抽出及びルール生成装置1000は特定された障害要因情報をこの障害イベントに対応させて障害事例データベース1002に登録した後、相関アラーム登録部1003は、障害事例データベース1002に登録した障害要因情報に含まれる障害要因箇所を起点とし、コンポーネント間接続関係で定義されている接続関係の情報を基に、相関のある装置から検出された障害イベントを抽出する(ステップSD21)。そして相関アラーム登録部1003が抽出した障害イベント群とそれぞれの障害イベントの抽出に使用したコンポーネント間接続関係を障害事例データベース1002に上書き登録する(ステップSD22)。
Next, the processing flow of the pattern extraction and rule generation apparatus 1000, the monitoring target apparatus 300, the rule engine 330, and the maintenance person 360 according to this embodiment is shown in FIGS. 12, 13, 14A, 14B, and 14C. The description will be given with reference. Note that “*” described in FIG. 13 indicates the number of instances and means a numerical value of zero or more. Steps SA1 and SA2, steps SB1 to SB6, steps SC1 and SC2, steps SD1 to SD6, and SD8 to SD11 are the same as those in the first embodiment, and a description thereof will be omitted.
In step SD3, the pattern extraction and rule generation apparatus 1000 registers the specified failure factor information in the failure case database 1002 in association with the failure event, and then the correlation alarm registration unit 1003 stores the failure registered in the failure case database 1002. A failure event detected from a correlated device is extracted based on the connection relationship information defined in the component connection relationship, starting from the failure factor location included in the factor information (step SD21). Then, the failure event group extracted by the correlation alarm registration unit 1003 and the inter-component connection relationship used for extracting each failure event are overwritten and registered in the failure case database 1002 (step SD22).

ユニーク判定部102が、本障害の障害イベント群から1以上の障害イベントを含む障害イベントの組合せを生成し障害事例データベース1002に登録し(ステップSD4)、障害事例データベース1002に登録されている全ての障害に対してユニークな障害イベントの組合せをユニークパターンとして障害事例データベース1002に登録する(ステップSD5)。そして、ルール生成及び修正部1001がルールを修正する必要があるかどうかを判断する(ステップSD6)。   The unique determination unit 102 generates a combination of failure events including one or more failure events from the failure event group of this failure, registers the combination in the failure case database 1002 (step SD4), and sets all the failure events registered in the failure case database 1002 A combination of failure events unique to the failure is registered in the failure case database 1002 as a unique pattern (step SD5). Then, the rule generation and correction unit 1001 determines whether or not the rule needs to be corrected (step SD6).

ルール生成及び修正部1001が、本障害についてはユニークパターンを条件部として採用し、保守者により登録した障害要因情報を結論部として、ルールを新規生成する。そしてルール生成及び修正部1001が併せて、条件部として採用したユニークパターンの障害イベントに紐付くコンポーネント間接続関係をルールに定義する。既存ルールの修正は、ルール生成及び修正部1001が抽出したユニークパターンを条件部として採用し、採用した障害イベントに紐付くコンポーネント間接続関係と併せて上書き修正する(ステップSD23)。以下ステップSD8以降は第1の実施形態と同様である。   The rule generation and correction unit 1001 adopts a unique pattern as a condition part for this failure, and newly generates a rule using the failure factor information registered by the maintainer as a conclusion part. The rule generation and correction unit 1001 also defines, in the rule, the inter-component connection relationship associated with the unique pattern failure event adopted as the condition unit. For the modification of the existing rule, the unique pattern extracted by the rule generation and modification unit 1001 is adopted as a condition part, and overwritten and corrected together with the inter-component connection relation associated with the adopted failure event (step SD23). The subsequent steps SD8 and thereafter are the same as those in the first embodiment.

図14BのステップSD21及びSD22について図15を参照して具体例を挙げて説明する。
相関アラーム登録部1003は、障害事例データベース1002に登録されている障害要因情報を参照し、障害イベント抽出の起点となる障害要因箇所を決定する。図15では障害要因箇所は、装置Bが対応する。そして、この例では障害要因である装置とその装置に隣接する装置を障害イベント群(障害ID=xに対応する)として抽出し(ステップSD21)、障害事例データベース1002に図15の障害IDがxの障害イベントの情報を上書きして登録する(ステップSD22)。なお、この例では、障害要因に相関のある装置は、障害要因である装置に隣接する装置のことを示すとしている。従って、この例では、(装置ID,イベント種別)=(D,d)、(H,d)は、障害事例データベース1002に登録されない。
Steps SD21 and SD22 of FIG. 14B will be described with a specific example with reference to FIG.
The correlation alarm registration unit 1003 refers to the failure factor information registered in the failure case database 1002 and determines a failure factor location that is a starting point for the failure event extraction. In FIG. 15, the failure factor location corresponds to the device B. In this example, the device that is the failure factor and the device adjacent to the device are extracted as a failure event group (corresponding to the failure ID = x) (step SD21), and the failure ID of FIG. The failure event information is overwritten and registered (step SD22). In this example, a device having a correlation with a failure factor indicates a device adjacent to the device that is the failure factor. Therefore, in this example, (device ID, event type) = (D, d), (H, d) is not registered in the failure case database 1002.

次に、パターン抽出及びルール生成装置1000でのステップSD4及びSD5について具体例を挙げて説明する。図16、図17及び図18を参照して説明する。
障害事例データベース1002に登録されている全ての障害イベントから、ユニーク判定部102が各障害におけるユニークな障害イベントを抽出する処理について図16を参照して説明する。
障害事例データベース1002には、左上図のように障害IDごとに障害イベントが対応付けられて登録されている。ここでの例では、障害イベントは装置IDとイベント種別を含んでいる。ユニーク判定部102はまず、各障害で取り得る障害イベントの組合せを生成する。この例では、障害ID=1では、(装置ID,イベント種別)=(sw1,a),(sw2,b)がある。
Next, steps SD4 and SD5 in the pattern extraction and rule generation apparatus 1000 will be described with specific examples. This will be described with reference to FIGS. 16, 17 and 18.
A process in which the unique determination unit 102 extracts unique fault events for each fault from all fault events registered in the fault case database 1002 will be described with reference to FIG.
In the failure case database 1002, failure events are registered in association with each failure ID as shown in the upper left diagram. In this example, the failure event includes a device ID and an event type. First, the unique determination unit 102 generates a combination of failure events that can be taken by each failure. In this example, when the failure ID = 1, there are (device ID, event type) = (sw1, a), (sw2, b).

第2の実施形態では、障害事例データベース1002は、抽出に使用したコンポーネント間接続関係の接続関係をそれぞれの障害イベントに紐付けており、障害イベントとその障害イベントに紐付く接続関係を条件部としてルールが定義される。従って、ユニーク判定においては、抽出するユニークパターンに含まれる障害イベントのイベント種別が決まれば、障害要因箇所を含む障害要因情報を結論部としたルールによる判定が可能となる。
第2の実施形態では、障害イベントの全ての組合せは3組あり、イベント種別aのみ(図では「a」)、イベント種別bのみ(図では「b」)、イベント種別aとイベント種別b(図では「a,b」)である。障害ID=2では、(装置ID,イベント種別)=(sw1,a)、(sw3,c)があり、全ての組合せはa、c、及びaとcの3組ある。
In the second embodiment, the failure case database 1002 associates the connection relationship of the inter-component connection relationship used for extraction with each failure event, and uses the failure event and the connection relationship associated with the failure event as a condition part. Rules are defined. Therefore, in the unique determination, if the event type of the failure event included in the unique pattern to be extracted is determined, the determination based on the rule using the failure factor information including the failure factor location as a conclusion part can be performed.
In the second embodiment, there are three combinations of failure events, only event type a (“a” in the figure), only event type b (“b” in the figure), event type a and event type b ( In the figure, “a, b”). For failure ID = 2, there are (device ID, event type) = (sw1, a), (sw3, c), and there are three combinations of a, c, and a and c.

その他は、障害イベントの組合せが障害ID=1では図7のsw1a、sw2b、及びsw1aとsw2bの3組がそれぞれ図16のa、b、及びaとbの3組に代り、障害ID=2では図7のsw1a、sw3c、及びsw1aとsw3cの3組がそれぞれ図16のa、c、及びaとcの3組に代る。従って、その後のユニーク判定部102が障害イベントの組合せからユニークパターンを抽出すると、図7を参照して説明したように、障害イベントの組合せがaの場合は、他の障害ID=1でイベント群はa、bとなり、登録率は1/1=1.0になる。障害イベントの組合せがcの場合は、他の障害ID=1でイベント群はa、bとなり、登録率は0/1=0.0になる。障害イベントの組合せがa、cの場合は、他の障害ID=1でイベント群はa、bとなり、登録率は1/2=0.5になる。   In other cases, when the failure event combination is failure ID = 1, sw1a, sw2b, and sw1a and sw2b in FIG. 7 are replaced with three pairs a and b, and a and b in FIG. Then, sw1a, sw3c, and three sets of sw1a and sw3c in FIG. 7 are replaced with three sets of a, c, and a and c in FIG. 16, respectively. Therefore, when the subsequent unique determination unit 102 extracts a unique pattern from the combination of failure events, as described with reference to FIG. 7, when the combination of failure events is a, the event group is set with other failure ID = 1. Becomes a and b, and the registration rate becomes 1/1 = 1.0. When the combination of failure events is c, the other failure ID = 1, the event groups are a, b, and the registration rate is 0/1 = 0.0. When the combination of failure events is a and c, the other failure ID = 1, the event groups are a and b, and the registration rate is 1/2 = 0.5.

以上により最大登録率が最小なのは0.0であるのでその組合せはcとなり、図16の例での障害ID=2のユニークパターンはcである。   As described above, since the maximum registration rate is 0.0, the combination is c, and the unique pattern of failure ID = 2 in the example of FIG. 16 is c.

次に、障害ID=1及び2が既に障害事例データベース1002に登録されていて、新たに障害ID=3が発生した場合について図17を参照して説明する。図17の下方が新たな障害が発生した場合の障害事例データベース1002の内容を示している。   Next, a case where failure IDs 1 and 2 are already registered in the failure case database 1002 and a failure ID = 3 newly occurs will be described with reference to FIG. The lower part of FIG. 17 shows the contents of the failure case database 1002 when a new failure occurs.

障害事例データベース1002は、抽出に使用したコンポーネント間接続関係の接続関係をそれぞれの障害イベントに紐付けてあるので、図16でのユニークな障害イベントを抽出する処理の場合と同様に、障害イベントの組合せを次のように変換すればよい。すなわち、障害ID=1ではsw1a、sw2b、及びsw1aとsw2bの3組をそれぞれa、b、及びaとbの3組に変換し、障害ID=2ではsw1a、sw3c、及びsw1aとsw3cの3組をそれぞれa、c、及びaとcの3組に変換すればよい。すると図8での例と同様に図17の例では、組合せは障害IDが新たに追加されても以前にあった障害IDの組合せは変化しない。しかし、ある障害IDのユニークパターンは、その他の全ての障害IDが影響するので、以前からある障害IDのユニークパターンは障害IDが増えることにより変化することがある。例えば、図17の例では障害ID=2のユニークパターンは、cからa、cに変化し、一方、障害ID=1のユニークパターンはbのままで変化しない。   Since the failure case database 1002 associates the connection relationship of the inter-component connection relationships used for the extraction with each failure event, the failure event database 1002 is similar to the case of the process of extracting a unique failure event in FIG. What is necessary is just to convert a combination as follows. That is, when failure ID = 1, three sets of sw1a, sw2b, and sw1a and sw2b are converted into three sets of a, b, and a and b, respectively, and when failure ID = 2, sw1a, sw3c, and sw1a and sw3c 3 What is necessary is just to convert a set into three sets of a, c, and a and c, respectively. Then, in the example of FIG. 17 as in the example of FIG. 8, even if a failure ID is newly added, the combination of previous failure IDs does not change. However, since the unique pattern of a certain failure ID is affected by all other failure IDs, the unique pattern of a certain failure ID may change as the number of failure IDs increases. For example, in the example of FIG. 17, the unique pattern with failure ID = 2 changes from c to a and c, while the unique pattern with failure ID = 1 remains b and does not change.

図17の下に記載の障害IDが3つある場合でのユニークパターンの算出について図18を参照して説明する。この場合も図16及び図17の場合と同様に、障害事例データベース1002は、抽出に使用したコンポーネント間接続関係の接続関係をそれぞれの障害イベントに紐付けてあるので、図16でのユニークな障害イベントを抽出する処理の場合と同様に、障害イベントの組合せを次のように変換すればよい。すなわち、障害ID=1ではsw1a、sw2b、及びsw1aとsw2bの3組をそれぞれa、b、及びaとbの3組に変換し、障害ID=2ではsw1a、sw3c、及びsw1aとsw3cの3組をそれぞれa、c、及びaとcの3組に変換し、障害ID=3ではsw1c、sw3d、及びsw1cとsw3dの3組をそれぞれc、d、及びcとdの3組に変換すればよい。   The calculation of the unique pattern when there are three failure IDs described in the lower part of FIG. 17 will be described with reference to FIG. Also in this case, as in the case of FIGS. 16 and 17, the failure case database 1002 associates the connection relationship of the inter-component connection relationship used for extraction with each failure event. Similar to the process of extracting events, the combination of failure events may be converted as follows. That is, when failure ID = 1, three sets of sw1a, sw2b, and sw1a and sw2b are converted into three sets of a, b, and a and b, respectively, and when failure ID = 2, sw1a, sw3c, and sw1a and sw3c 3 Each set is converted into 3 sets of a, c, and a and c. When failure ID = 3, 3 sets of sw1c and sw3d, and sw1c and sw3d are converted into 3 sets of c, d, and c and d, respectively. That's fine.

すると、最大登録率が最小なのは0.5であるのでその組合せはa、cとなり、図18の例での障害ID=2のユニークパターンはa、cとなる。   Then, since the maximum registration rate is 0.5, the combination is a and c, and the unique pattern of failure ID = 2 in the example of FIG. 18 is a and c.

以上に説明した第2の実施形態によれば、第1の実施形態と同様な効果を奏し、さらに第2の実施形態のパターン抽出及びルール生成装置では、障害イベントを抽出する際に使用したコンポーネント間接続関係の接続関係をそれぞれの障害イベントに紐付ける形で障害事例データベースに登録されていて、ルール生成及び修正部1001が条件部として採用したユニークパターンの障害イベントに紐付くコンポーネント間接続関係をルールに定義し、生成したルールIDを障害事例データベースに登録している。このように、第2の実施形態では、コンポーネント間接続関係の接続関係をそれぞれの障害イベントに紐付けているので、障害イベントの組合せはイベント種別のみで十分に表現できる。   According to the second embodiment described above, the same effects as those of the first embodiment can be obtained. Further, in the pattern extraction and rule generation device of the second embodiment, the components used when extracting the failure event The inter-component connection relation associated with the failure event of the unique pattern that is registered in the fault case database in the form of linking the inter-connection relation to the respective fault events, and that is adopted as the condition part by the rule generation and correction unit 1001 The rule ID defined in the rule is registered in the failure case database. As described above, in the second embodiment, the connection relationship between the components is associated with each failure event, so that the combination of failure events can be expressed sufficiently only by the event type.

なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。   Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Further, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.

100、1000…パターン抽出及びルール生成装置、101…障害イベント登録部、102…ユニーク判定部、103、1001…ルール生成及び修正部、104…過去障害再検証部、105、1002…障害事例データベース、300…監視対象装置、330…ルールエンジン、331…障害イベント送受信部、332…ネットワーク構成情報データベース、333…判定ロジック部、360…保守者、1003…相関アラーム登録部。 DESCRIPTION OF SYMBOLS 100, 1000 ... Pattern extraction and rule production | generation apparatus, 101 ... Failure event registration part, 102 ... Unique determination part, 103, 1001 ... Rule production | generation and correction part, 104 ... Past failure re-verification part, 105, 1002 ... Failure case database, 300 ... Monitoring target device, 330 ... Rule engine, 331 ... Fault event transmission / reception unit, 332 ... Network configuration information database, 333 ... Determination logic unit, 360 ... Maintenance person, 1003 ... Correlation alarm registration unit.

Claims (8)

障害ごとに、障害要因箇所及び障害要因を含む障害要因情報と、この障害により発生する障害イベントと、条件部と結論部を含むルールに対応付けられたルールIDと、を関連付けて登録しているデータベースと、
新規の障害である新規障害の障害イベントの組合せを全通り生成し、新規障害の障害イベントの組合せと過去の障害である過去障害の障害イベントの組合せとから最も発生していない組合せと判定されるユニークパターンを障害ごとに抽出するユニーク判定部と、
障害ごとに対応するユニークパターンに応じて、前記ルールを生成または修正するルール生成及び修正部と、を備えるパターン抽出及びルール生成装置。
For each failure, failure factor information including a failure factor location and a failure factor, a failure event caused by the failure, and a rule ID associated with a rule including a condition part and a conclusion part are registered in association with each other. A database,
All combinations of fault events for new faults that are new faults are generated, and it is determined that the combination is the least occurring from the combinations of fault events for new faults and past faults that are past faults. A unique judgment unit that extracts a unique pattern for each fault;
A pattern extraction and rule generation device comprising: a rule generation and correction unit that generates or corrects the rule according to a unique pattern corresponding to each failure.
前記ルール生成及び修正部は、前記新規障害の抽出されたユニークパターンを前記ルールの条件部として採用し、真の原因とその位置を特定した障害要因情報を前記ルールの結論部として採用して新しいルールを生成する請求項1に記載のパターン抽出及びルール生成装置。   The rule generation and correction unit adopts the unique pattern from which the new fault is extracted as a condition part of the rule, and adopts fault factor information specifying the true cause and its position as a conclusion part of the rule. The pattern extraction and rule generation device according to claim 1 which generates a rule. 障害ごとに、前記データベースに登録されている1以上の障害イベントの情報を基に障害ごとにルールエンジンによる再判定結果である障害要因情報と前記データベースに含まれる障害要因情報とが合致していない場合は、前記ユニーク判定部で抽出したユニークパターンとは異なるユニークパターンを再度抽出し、前記ルール生成及び修正部がこのユニークパターンを採用する請求項1に記載のパターン抽出及びルール生成装置。   For each failure, the failure factor information that is the result of re-determination by the rule engine for each failure based on the information of one or more failure events registered in the database does not match the failure factor information included in the database. 2. The pattern extraction and rule generation device according to claim 1, wherein a unique pattern different from the unique pattern extracted by the unique determination unit is extracted again, and the rule generation and correction unit adopts the unique pattern. 前記ルール生成及び修正部は、前記データベースに登録されている障害に対応して前記ユニーク判定部が抽出したユニークパターンが、この障害に対応するルールの条件部に定義されている障害イベントの組合せと異なる場合は、このルールの条件部を前記ユニークパターンで上書きすることでルールを修正する請求項1に記載のパターン抽出及びルール生成装置。   The rule generation and correction unit includes a combination of failure events defined in a condition part of a rule corresponding to the failure, wherein the unique pattern extracted by the unique determination unit corresponding to the failure registered in the database. The pattern extraction and rule generation device according to claim 1, wherein if different, the rule is corrected by overwriting a condition part of the rule with the unique pattern. 障害ごとに、障害要因箇所及び障害要因を含む障害要因情報と、この障害により発生する障害イベントと、条件部と結論部を含むルールに対応付けられたルールIDと、をデータベースに関連付けて登録し、
新規の障害である新規障害ごとに障害イベントの組合せを全通り生成し、新規障害の障害イベントの組合せと過去の障害である過去障害の障害イベントの組合せとから最も発生していない組合せと判定されるユニークパターンを障害ごとに抽出し、
障害ごとに対応するユニークパターンに応じて、前記ルールを生成または修正すること、を備えるパターン抽出及びルール生成方法。
For each failure, the failure factor information including the failure factor location and the failure factor, the failure event caused by this failure, and the rule ID associated with the rule including the condition part and the conclusion part are registered in association with the database. ,
All combinations of fault events are generated for each new fault that is a new fault, and the combination of fault events of a new fault and a fault event of a past fault that is a past fault is determined as the least occurring combination. Unique patterns are extracted for each fault,
A pattern extraction and rule generation method comprising: generating or correcting the rule according to a unique pattern corresponding to each failure.
前記ルールを生成または修正することは、前記新規障害の抽出されたユニークパターンを前記ルールの条件部として採用し、真の原因とその位置を特定した障害要因情報を前記ルールの結論部として採用して新しいルールを生成する請求項5に記載のパターン抽出及びルール生成方法。   Generating or modifying the rule adopts the extracted unique pattern of the new fault as a condition part of the rule, and uses fault factor information specifying the true cause and its position as a conclusion part of the rule. 6. The pattern extraction and rule generation method according to claim 5, wherein a new rule is generated. 障害ごとに、前記データベースに登録されている1以上の障害イベントの情報を基に障害ごとにルールエンジンによる再判定結果である障害要因情報と前記データベースに含まれる障害要因情報とが合致していない場合は、抽出した前記ユニークパターンとは異なるユニークパターンを再度抽出し、前記ルールを生成または修正することにおいてこのユニークパターンを採用する請求項5に記載のパターン抽出及びルール生成方法。   For each failure, the failure factor information that is the result of re-determination by the rule engine for each failure based on the information of one or more failure events registered in the database does not match the failure factor information included in the database. 6. The pattern extraction and rule generation method according to claim 5, wherein a unique pattern different from the extracted unique pattern is extracted again, and the unique pattern is adopted in generating or correcting the rule. 前記ルールを生成または修正することは、前記データベースに登録されている障害に対応して抽出された前記ユニークパターンが、この障害に対応するルールの条件部に定義されている障害イベントの組合せと異なる場合は、このルールの条件部を前記ユニークパターンで上書きすることでルールを修正する請求項5に記載のパターン抽出及びルール生成方法。   The generation or modification of the rule means that the unique pattern extracted corresponding to the fault registered in the database is different from the combination of fault events defined in the condition part of the rule corresponding to the fault. 6. The pattern extraction and rule generation method according to claim 5, wherein the rule is corrected by overwriting a condition part of the rule with the unique pattern.
JP2016160030A 2016-08-17 2016-08-17 Pattern extraction and rule generation apparatus and method Active JP6637854B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016160030A JP6637854B2 (en) 2016-08-17 2016-08-17 Pattern extraction and rule generation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016160030A JP6637854B2 (en) 2016-08-17 2016-08-17 Pattern extraction and rule generation apparatus and method

Publications (2)

Publication Number Publication Date
JP2018028778A true JP2018028778A (en) 2018-02-22
JP6637854B2 JP6637854B2 (en) 2020-01-29

Family

ID=61248408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016160030A Active JP6637854B2 (en) 2016-08-17 2016-08-17 Pattern extraction and rule generation apparatus and method

Country Status (1)

Country Link
JP (1) JP6637854B2 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109039446A (en) * 2018-07-22 2018-12-18 国网山东省电力公司信息通信公司 A kind of qualitative accuracy determination method of power telecom network alarm
WO2021033274A1 (en) * 2019-08-20 2021-02-25 日本電信電話株式会社 Pattern extraction and rule generation device, method, and program
JPWO2021059400A1 (en) * 2019-09-25 2021-04-01
JPWO2021079521A1 (en) * 2019-10-25 2021-04-29
US11681576B2 (en) 2019-09-25 2023-06-20 Nippon Telegraph And Telephone Corporation Anomaly coping support apparatus, method, and program
US11695617B2 (en) 2020-02-05 2023-07-04 Nippon Telegraph And Telephone Corporation Alarm monitoring system, alarm monitoring method, and program
WO2024013897A1 (en) * 2022-07-13 2024-01-18 日本電信電話株式会社 Pattern extraction and rule generation device, method, and computer program
US11892905B2 (en) 2019-09-26 2024-02-06 Nippon Telegraph And Telephone Corporation Abnormality handling support apparatus, method, and program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7392852B2 (en) 2020-06-12 2023-12-06 日本電信電話株式会社 Rule generation device, rule generation method and program
JPWO2022054269A1 (en) * 2020-09-14 2022-03-17

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008041041A (en) * 2006-08-10 2008-02-21 Hitachi Information Systems Ltd Log notification condition definition support device, log monitoring system, program, and log notification condition definition support method
JP2008198123A (en) * 2007-02-15 2008-08-28 Hitachi Information Systems Ltd Fault detection system and fault detection program
WO2013145584A1 (en) * 2012-03-26 2013-10-03 日本電気株式会社 Event correlation detection system
WO2014013603A1 (en) * 2012-07-20 2014-01-23 株式会社日立製作所 Monitoring system and monitoring program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008041041A (en) * 2006-08-10 2008-02-21 Hitachi Information Systems Ltd Log notification condition definition support device, log monitoring system, program, and log notification condition definition support method
JP2008198123A (en) * 2007-02-15 2008-08-28 Hitachi Information Systems Ltd Fault detection system and fault detection program
WO2013145584A1 (en) * 2012-03-26 2013-10-03 日本電気株式会社 Event correlation detection system
WO2014013603A1 (en) * 2012-07-20 2014-01-23 株式会社日立製作所 Monitoring system and monitoring program

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109039446A (en) * 2018-07-22 2018-12-18 国网山东省电力公司信息通信公司 A kind of qualitative accuracy determination method of power telecom network alarm
WO2021033274A1 (en) * 2019-08-20 2021-02-25 日本電信電話株式会社 Pattern extraction and rule generation device, method, and program
JPWO2021033274A1 (en) * 2019-08-20 2021-02-25
JP7322958B2 (en) 2019-09-25 2023-08-08 日本電信電話株式会社 Abnormal location estimation device, method and program
WO2021059400A1 (en) * 2019-09-25 2021-04-01 日本電信電話株式会社 Abnormal part estimation device, method, and program
US11681576B2 (en) 2019-09-25 2023-06-20 Nippon Telegraph And Telephone Corporation Anomaly coping support apparatus, method, and program
JPWO2021059400A1 (en) * 2019-09-25 2021-04-01
US11892905B2 (en) 2019-09-26 2024-02-06 Nippon Telegraph And Telephone Corporation Abnormality handling support apparatus, method, and program
JPWO2021079521A1 (en) * 2019-10-25 2021-04-29
WO2021079521A1 (en) * 2019-10-25 2021-04-29 日本電信電話株式会社 Rule generation device, method, and program
JP7334792B2 (en) 2019-10-25 2023-08-29 日本電信電話株式会社 RULE GENERATION DEVICE, METHOD AND PROGRAM
US11695617B2 (en) 2020-02-05 2023-07-04 Nippon Telegraph And Telephone Corporation Alarm monitoring system, alarm monitoring method, and program
WO2024013897A1 (en) * 2022-07-13 2024-01-18 日本電信電話株式会社 Pattern extraction and rule generation device, method, and computer program

Also Published As

Publication number Publication date
JP6637854B2 (en) 2020-01-29

Similar Documents

Publication Publication Date Title
JP6637854B2 (en) Pattern extraction and rule generation apparatus and method
US20180293547A1 (en) Methods and systems for employment and education verification using blockchain
US20200410142A1 (en) 3d model creation support system and 3d model creation support method
JP2012094046A (en) Device fault analysis apparatus, device fault analysis method and device fault analysis program
JP5651381B2 (en) Failure cause determination rule verification device and program
JP2010049551A (en) Failure monitoring apparatus and failure monitoring method
JP7156543B2 (en) Pattern extraction and rule generation device, method and program
CN110929309B (en) Automatic verification method for protection section list document in urban rail signal system
JP2011128951A (en) Test table generation device and test table generating method
JP6919438B2 (en) Fault analysis support device, incident management system, fault analysis support method and program
JP6647996B2 (en) Linked data verification device and linked data design verification system
JP5492593B2 (en) Operation deviation prevention support system, operation deviation prevention support method, and program therefor during IT system change work
JP2012174179A (en) Operation definition generation device for monitoring control system
JP6541903B2 (en) Attack / abnormality detection device, attack / abnormality detection method, and attack / abnormality detection program
JP2018206250A (en) Structuring system and structuring method for raster drawing
JP2016118886A (en) Data-related information processing device and program
US20230273850A1 (en) Rule generation apparatus, rule generation method, and program
CN111506487B (en) Method and system for recommending fault repairing means based on operation log
JP5210146B2 (en) Information control system and information control method
JP2015191278A (en) Information processing program, apparatus and method
US20220398143A1 (en) Network monitoring apparatus, method, and program
WO2024013897A1 (en) Pattern extraction and rule generation device, method, and computer program
JP2012168776A (en) Monitoring screen verification device
US10489235B2 (en) Analysis method of embedded system dysfunctions, associated computer program product and analysis device
US20200134353A1 (en) Monitoring-screen-data generation device, monitoring-screen-data generation method, and reecoridng medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180821

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191223

R150 Certificate of patent or registration of utility model

Ref document number: 6637854

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150