JP2015153078A - Employment history analysis device, method and program - Google Patents

Employment history analysis device, method and program Download PDF

Info

Publication number
JP2015153078A
JP2015153078A JP2014025536A JP2014025536A JP2015153078A JP 2015153078 A JP2015153078 A JP 2015153078A JP 2014025536 A JP2014025536 A JP 2014025536A JP 2014025536 A JP2014025536 A JP 2014025536A JP 2015153078 A JP2015153078 A JP 2015153078A
Authority
JP
Japan
Prior art keywords
operation history
feature amount
history
target device
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014025536A
Other languages
Japanese (ja)
Other versions
JP6078485B2 (en
Inventor
暁 渡邉
Akira Watanabe
暁 渡邉
達明 木村
Tatsuaki Kimura
達明 木村
剛 豊野
Takeshi Toyono
剛 豊野
西松 研
Ken Nishimatsu
研 西松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014025536A priority Critical patent/JP6078485B2/en
Publication of JP2015153078A publication Critical patent/JP2015153078A/en
Application granted granted Critical
Publication of JP6078485B2 publication Critical patent/JP6078485B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To perform classification for every employment history whose factor portion is common, with respect to employment histories whose users are not classified in detail.SOLUTION: The invention is configured so that: when a range of employment histories which requires classification of employment history is given, an aggregate of the employment histories corresponding to the range is acquired from an employment history DB storing the employment histories which were written in the past about employment object equipment, and a feature amount is extracted from the respective employment history, and the aggregate of the employment histories is classified based on similarity of the feature amount for every same factor portion.

Description

本発明は、運用履歴分析装置及び方法及びプログラムに係り、特に、システム運用におけるオペレータの業務内容を分析するための運用履歴分析装置及び方法及びプログラムに関する。   The present invention relates to an operation history analysis apparatus, method, and program, and more particularly, to an operation history analysis apparatus, method, and program for analyzing the business content of an operator in system operation.

今日、オペレータ業務の作業証跡、及び、オペレータの知見の蓄積を目的として、システム運用におけるインシデント発生時の状況と対応作業は運用履歴に記録され、一元的な管理が行われている。蓄積された運用履歴は、新たなインシデントの発生時に、過去の類似した履歴を検索し、過去の対応例を参照することで、同一インシデント発生時の対応検討に用いられる。そのため、同一のインシデントごとに、運用履歴を分類することは有用である。   Today, for the purpose of accumulating operator's work trail and operator's knowledge, the situation and response work at the time of incident occurrence in system operation are recorded in the operation history and integrated management is performed. The accumulated operation history is used for examining the response when the same incident occurs by searching the past similar history when a new incident occurs and referring to the past response example. Therefore, it is useful to classify the operation history for each identical incident.

本明細書では、運用管理の対象となるシステムにおいて、インシデントが発生した箇所を原因箇所と定義する。例えば、ITシステムの場合は、"ケーブル"、"CPU"、"インタフェースカード"などが原因箇所となり得る例として挙げられる。運用履歴は、運用管理の対象となるシステムにおいて発生したインシデントの種類と頻度の統計分析にも用いられるため、運用履歴を原因箇所ごとに分類することは、多くのニーズが存在する。しかしながら、運用履歴に原因箇所が項目として記録されているとは限らない。   In this specification, a location where an incident has occurred is defined as a cause location in a system that is a target of operation management. For example, in the case of an IT system, "cable", "CPU", "interface card", etc. can be cited as examples of possible causes. Since the operation history is also used for statistical analysis of the type and frequency of incidents that occur in a system to be managed, there are many needs to classify the operation history for each cause. However, the cause location is not always recorded as an item in the operation history.

こうした中で、運用履歴の作業記録に含まれる単語の類似性を用いて、運用履歴をキーワードごとに分類し、同時に分類の各クラスに対してキーワードをラベル付けするシステムがある(例えば、非特許文献1参照)。   Under such circumstances, there is a system that classifies operation history for each keyword using the similarity of words included in the operation history work record, and simultaneously labels the keywords for each class of classification (for example, non-patented). Reference 1).

また、運用履歴の統計的分析等を目的として、キーワードとなる単語を抽出した後、各キーワードが示すものが"原因箇所"、"故障を特定した方法"、"故障の解決方法"などいずれに該当するかをラベルとして、各キーワードに人手でラベルを付与する方法がある(例えば、非特許文献2参照)。   Also, for the purpose of statistical analysis of operational history, etc., after extracting the word that will be the keyword, what each keyword indicates is “cause location”, “method of identifying the failure”, “method of solving the failure”, etc. There is a method of manually assigning a label to each keyword by using the label as to whether it corresponds (for example, see Non-Patent Document 2).

Amelie Medem, Marc-Ismael Akodjenou, and Renata Teixeira, "TroubleMiner: Mining network trouble tickets", Integrated Network Management-Workshops, 113-119, 2009Amelie Medem, Marc-Ismael Akodjenou, and Renata Teixeira, "TroubleMiner: Mining network trouble tickets", Integrated Network Management-Workshops, 113-119, 2009 Potharaju Rahul, Navendu Jain, and Cristina Nita-Rotaru. "Juggling the jigsaw: Towards automated problem inference from network trouble tickets." Proceedings of the 10th USENIX conference on Networked Systems Design and Implementation. 2013.Potharaju Rahul, Navendu Jain, and Cristina Nita-Rotaru. "Juggling the jigsaw: Towards automated problem inference from network trouble tickets." Proceedings of the 10th USENIX conference on Networked Systems Design and Implementation. 2013. MeCab: Yet Another Part-of-Speech and Morphological Analyzer, http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html)MeCab: Yet Another Part-of-Speech and Morphological Analyzer, http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html) 木村達明, 渡邉暁, 豊野剛, 西松研, 塩本公平. "大規模ネットワークログ情報のオンライン・テンプレート抽出法". 電子情報通信学会ソサイエティ大会, 2013.Tatsuaki Kimura, Watanabe, Go Toyono, Ken Nishimatsu, Kohei Shiomoto. "Online template extraction method for large-scale network log information". Society Conference of IEICE, 2013.

しかしながら、上記の非特許文献1による分類は、クラスに含まれる運用履歴の共通点を表すキーワードが(インタフェースカード、ケーブルなど)、"故障発生機器"(ルータ、スイッチなど)、"発生理由"(メンテナンス、停電など)と多岐に亘るため、クラスごとに共通点の種類と情報の粒度が異なり、統計分析には用いられない。   However, the classification according to Non-Patent Document 1 described above is based on keywords that represent common points of operation histories included in a class (interface card, cable, etc.), “failure occurrence device” (router, switch, etc.), “reason for occurrence” ( Maintenance, power outages, etc.), so the types of common points and the granularity of information are different for each class and are not used for statistical analysis.

また、非特許文献2の方法では、人手の介在による利用者への負荷と新規機種導入時の追加作業負荷が避けられない。   Further, in the method of Non-Patent Document 2, a load on the user due to manual intervention and an additional work load when introducing a new model are unavoidable.

本発明は、上記の点に鑑みなされたもので、利用者が詳細な分類が行われていない運用履歴に対して、原因箇所が共通である運用履歴ごとに分類を行うことが可能な運用履歴分析装置及び方法及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and an operation history in which a user can perform classification for each operation history having a common cause with respect to an operation history in which detailed classification is not performed. An object is to provide an analysis apparatus, method, and program.

一態様によれば、運用対象機器のインシデントに対応するオペレータの実施作業を記録した運用履歴の集合からインシデントの原因箇所が共通である運用履歴ごとに分類する運用履歴分析装置であって、
運用履歴の分類を要する運用履歴の範囲が与えられると、運用対象機器について過去に記述された運用履歴を格納した運用履歴DBから、該範囲に該当する運用履歴を取得して、該運用履歴から特徴量を抽出する特徴量抽出手段と、
前記運用履歴の集合を同一の原因個所ごとに、前記特徴量の類似性により分類する分類手段と、を有する運用履歴分析装置が提供される。
According to one aspect, there is an operation history analysis device that classifies each operation history having a common cause of an incident from a set of operation histories in which the operations performed by the operator corresponding to the incident of the operation target device are recorded,
When a range of operation history requiring operation history classification is given, an operation history corresponding to the range is obtained from an operation history DB storing operation history described in the past for the operation target device, and the operation history is obtained from the operation history. A feature quantity extracting means for extracting a feature quantity;
There is provided an operation history analyzing apparatus having classification means for classifying the set of operation histories according to the similarity of the feature amounts for the same cause location.

一態様によれば、詳細な分類が行われていない運用履歴に対して、原因箇所が共通である運用履歴ごとに分類することにより、利用者の負荷が軽減できると共に、ネットワークシステム等の予防保存等の運用管理を可能とする。   According to one aspect, by classifying operation history that has not been classified in detail for each operation history having a common cause, the load on the user can be reduced and preventive storage of a network system or the like It is possible to manage such operations.

本発明の第1の実施の形態におけるシステム構成例である。It is an example of system configuration in a 1st embodiment of the present invention. 本発明の第1の実施の形態における運用履歴分析装置のフローチャートである。It is a flowchart of the operation log | history analysis apparatus in the 1st Embodiment of this invention. 本発明の第2の実施の形態におけるシステム構成例である。It is an example of system configuration in a 2nd embodiment of the present invention. 本発明の第3の実施の形態におけるシステム構成例である。It is an example of the system configuration | structure in the 3rd Embodiment of this invention.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

本発明は、運用履歴に紐付く様々なデータから共通の原因箇所を持つ運用履歴ごとに分類するものである。   The present invention classifies each operation history having a common cause from various data associated with the operation history.

[第1の実施の形態]
本実施の形態では、過去の運用履歴を原因箇所ごとに分類し、分類結果を利用者に提示、または、過去の運用履歴の追加項目として出力する場合について説明する。
[First Embodiment]
In the present embodiment, a case will be described in which the past operation history is classified for each cause location, and the classification result is presented to the user or output as an additional item of the past operation history.

図1は、本発明の第1の実施の形態におけるシステム構成例である。   FIG. 1 shows an example of a system configuration in the first embodiment of the present invention.

同図に示すシステムは、監視システム1、運用対象機器21〜2nからなる運用対象機器群、運用履歴DB3、システム状態情報DB4、利用者(端末)5、運用履歴分析装置10aを有する。 The system shown in FIG. 1 includes a monitoring system 1, an operation target device group including operation target devices 2 1 to 2 n , an operation history DB 3, a system state information DB 4, a user (terminal) 5, and an operation history analysis device 10a.

監視システム1は、各運用対象機器21〜2nから運用情報を収集し、システム状態情報DB4に出力する。また、監視システム1は、システム異常時にアラームメッセージの出力ログを運用履歴分析装置1aに出力する。 The monitoring system 1 collects operation information from each of the operation target devices 2 1 to 2 n and outputs it to the system status information DB 4. The monitoring system 1 also outputs an alarm message output log to the operation history analyzer 1a when the system is abnormal.

運用履歴DB3は、オペレータの実施作業を記録した運用履歴を格納する。   The operation history DB 3 stores an operation history that records the work performed by the operator.

システム状態情報DB4には、監視システム1から利用者(端末)5に対して発出されたアラームメッセージや運用対象機器2が出力するsyslogなどの文字列で表される情報を格納する。   The system status information DB 4 stores information represented by character strings such as alarm messages issued from the monitoring system 1 to the user (terminal) 5 and syslog output from the operation target device 2.

運用履歴分析装置10aは、特徴量取得部11、分類部12、ユーザインタフェース13を有する。   The operation history analysis apparatus 10 a includes a feature amount acquisition unit 11, a classification unit 12, and a user interface 13.

以下、図2のフローチャートに沿って運用履歴分析装置10aの処理を説明する。   Hereinafter, the process of the operation history analyzer 10a will be described with reference to the flowchart of FIG.

予め運用対象となる運用対象機器pの運用履歴が運用履歴DB3に、インシデントにおけるシステム状態情報がシステム状態情報DB4に蓄積されているものとする。   It is assumed that the operation history of the operation target device p to be operated is stored in the operation history DB 3 in advance, and the system state information regarding the incident is stored in the system state information DB 4.

ステップ101)ユーザインタフェース部13から利用者5によって指定された運用履歴の分類を要する運用履歴の範囲(例えば、No.0020〜No.0040まで)が指定されると、特徴量取得部11は、運用履歴DB3またはシステム状態情報DB4のいずれかまたは両方から情報を読み込む。   Step 101) When an operation history range (for example, No. 0020 to No. 0040) requiring classification of the operation history specified by the user 5 is specified from the user interface unit 13, the feature quantity acquisition unit 11 Information is read from either or both of the operation history DB 3 and the system status information DB 4.

ステップ102)まず、運用履歴DB3から特徴量を取得する場合について説明する。   Step 102) First, the case of acquiring feature values from the operation history DB 3 will be described.

運用履歴のタイトルや事象名などの要約情報の記述には、原因箇所が記述される場合が多く、また、全ての運用履歴に要約情報が存在するため、要約情報を用いることは全ての運用履歴の分類を可能にする利点がある。そこで、本実施の形態では、一例として、要約情報を特徴量として用いる。分類を行う運用履歴のうち、k番目の運用履歴をTkとする。Tkの事象名の文をSkとしたとき、Skに含まれる単語の集合Wk={wk1,wk2,…,wkn}とし、特徴量D(Tk)=Wkとする。SkからのWkの獲得は、形態素解析器Mecab(例えば、非特許文献3)等を用いる。 In the description of summary information such as operation history titles and event names, the cause is often described, and since summary information exists in all operation histories, using summary information for all operation histories There is an advantage that enables classification. Therefore, in this embodiment, summary information is used as a feature amount as an example. Of the operation histories to be classified, the k-th operation history is T k . When the sentence of the event name of T k is S k , a set of words W k = {w k1 , w k2 ,..., W kn } is included in S k , and feature quantity D (T k ) = W k To do. Acquisition of W k from S k is the morphological analyzer Mecab (e.g., Non-Patent Document 3) is used or the like.

また、運用履歴DB3の運用履歴に記載された他の項目を特徴量として用いることも可能である。例えば、運用対象機器pのインシデント発生機種、インシデントが発生した場所、インシデントが発生したサービス名、などである。これにより、任意の粒度での分類が可能となる。   In addition, other items described in the operation history of the operation history DB 3 can be used as the feature amount. For example, an incident occurrence model of the operation target device p, a location where the incident occurred, a service name where the incident occurred, and the like. Thereby, classification with an arbitrary granularity becomes possible.

ステップ103)次に、システム状態情報DB4から特徴量を取得する場合について説明する。   Step 103) Next, a case where a feature amount is acquired from the system state information DB 4 will be described.

運用対象となる運用対象機器p1〜pn自体、あるいは監視システム1によって、システム状態情報が利用者(端末)5に向けて出力される。システム状態情報の例としては、監視システム1のアラームメッセージ、syslog、MIB(Management Information Base)情報などが挙げられ、システム状態情報DB4に格納されているものとする。システム状態情報は原因箇所の状態に応じて出力され、運用履歴を記述する利用者5に依らないロバストな情報である。そこで、インシデント発生時のシステム状態を特徴量とする。 System status information is output to the user (terminal) 5 by the operation target devices p 1 to pn themselves to be operated or the monitoring system 1. Examples of the system status information include alarm messages, syslog, MIB (Management Information Base) information, etc. of the monitoring system 1 and are stored in the system status information DB 4. The system state information is output according to the state of the cause part and is robust information that does not depend on the user 5 describing the operation history. Therefore, the system state at the time of incident occurrence is used as a feature amount.

具体的には、1)システムメッセージを用いた特徴量を取得する方法と、2)システム数値情報を用いた特徴量を取得する方法がある。   Specifically, there are 1) a method for acquiring a feature value using a system message and 2) a method for acquiring a feature value using system numerical information.

1)システムメッセージを用いた特徴量を取得する場合:
運用履歴DB3の分類する運用履歴の集合の内、k番目の運用履歴をTkとし、Tkに記載された故障における、システムメッセージの集合Mkを特徴量として用いる。システムメッセージは、監視システムのアラームメッセージや運用対象のシステムの構成機器が出力するsyslogなど、文字列として観測されるものである。システムメッセージの獲得方法は、運用履歴DB3の運用履歴におけるシステムメッセージの記述欄を用いるか、または運用履歴に記載されたインシデント時刻の前後t分以内に出力されたシステムメッセージを獲得する、という方法が考えられる。時間幅tは利用者が定義する。システムメッセージを特徴量として用いる方法は、上記の運用履歴の特徴量を得る方法と同様に、システムメッセージに含まれる単語を特徴量とする方法と、非特許文献4のログテンプレート化手法などを用いて同様の意味を表すシステムメッセージに対して同一のIDを与え、IDの集合を特徴量とする方法が考えられる。IDを特徴量とする場合は、Tkに対応したシステムメッセージのIDの集合を特徴量とする方法が考えられる。IDを特徴量とする場合は、Tkに対応したシステムメッセージのIDの集合を、MIDkとし、D(Tk)=MIDkとする。
1) When acquiring feature values using system messages:
Of the set of operation histories classified by the operation history DB 3, the k-th operation history is set as T k, and the set M k of system messages in the failure described in T k is used as a feature amount. The system message is observed as a character string, such as an alarm message of the monitoring system or a syslog output from a component device of the operation target system. As a system message acquisition method, a system message description field in the operation history of the operation history DB 3 is used, or a system message output within t minutes before and after the incident time described in the operation history is acquired. Conceivable. The user defines the time span t. The method of using a system message as a feature value uses the method of using a word included in the system message as a feature value, the log template creation method of Non-Patent Document 4, and the like, similar to the method of obtaining the feature value of the operation history described above. In other words, a method may be considered in which the same ID is assigned to system messages representing the same meaning, and a set of IDs is used as a feature amount. When the ID is used as a feature value, a method using a set of system message IDs corresponding to T k as a feature value can be considered. When the ID is a feature amount, a set of system message IDs corresponding to T k is MID k, and D (T k ) = MID k .

2)システム数値情報を用いた特徴量を取得する場合:
システム状態情報DB4の運用対象となるシステム数値情報を特徴量として用いる。システム数値情報は、例えば、ネットワークシステムであれば、"パケット数"、"応答時間"、ITシステムであれば"接続ユーザ数"など、システム状態情報のうち、数値として観測される情報である。
2) When acquiring feature values using system numerical information:
System numerical information to be operated in the system state information DB 4 is used as a feature amount. The system numerical information is information observed as numerical values in the system status information such as “number of packets”, “response time” in the case of a network system, and “number of connected users” in the case of an IT system.

ステップ104)分類部12は、特徴量取得部11で運用履歴の特徴量を取得した場合には、運用履歴の集合を同一の原因個所ごとに分類する。運用履歴の分類手法は何でもよいが、以下の(1)〜(3)では、階層的クラスタリングを用いた場合について説明する。運用履歴を1つ以上要素に持つ集合を、「クラス」と呼ぶ。本発明では、分類の対象となる運用履歴の集合をクラスに分類する。   Step 104) When the feature amount acquisition unit 11 acquires the feature value of the operation history, the classification unit 12 classifies the set of operation history for each of the same cause locations. Any operation history classification method may be used. In the following (1) to (3), a case where hierarchical clustering is used will be described. A set having one or more operation histories as elements is called a “class”. In the present invention, a set of operation histories to be classified is classified into classes.

(1)クラスのセントロイドの定義:
クラスの集合のうち、i番目のクラスをCiとする。クラス間の結合において類似度を計算するため、クラスの代表値であるセントロイドを定義する。クラスCiに属する運用履歴をCi={Ti1,Ti2,…,TiK}としたとき、CiのセントロイドCdiの定義は、システムメッセージのような集合型の特徴量の場合には、例えば、以下のようなものが考えられる。
(1) Class centroid definition:
Let the i-th class in the set of classes be C i . In order to calculate the similarity in the connection between classes, a centroid that is a representative value of the class is defined. When the operation history belonging to the class C i is C i = {T i1 , T i2 , ..., T iK }, the definition of the centroid Cd i of C i is the case of a collective feature such as a system message For example, the following can be considered.

Cdi=D(Ti1)∪D(Ti2)∪…∪D(TiK)
また、システム数値情報のような数値型の特徴量の場合には、次のようなものが考えられる。
Cd i = D (T i1 ) ∪D (T i2 ) ∪… ∪D (T iK )
Further, in the case of a numerical feature quantity such as system numerical information, the following may be considered.

Cdi=(Σn(D(tin))/K
(2)クラス間の類似度の定義:
セントロイドを用いて、クラスのペア(Ci,Cj)間の類似度sim(Ci,Cj)を定義する。sim(Ci,Cj)は、集合型の特徴量については、例えば、次のようなJaccard係数に基づく定義が考えられる。
Cd i = (Σn (D (t in )) / K
(2) Definition of similarity between classes:
Using centroid, to define a class of pairs (C i, C j) between the similarity sim (C i, C j) . For sim (C i , C j ), for the collective feature quantity, for example, the following definition based on the Jaccard coefficient can be considered.

sim(Ci,Cj)=|Cdi∩Cdj|/|Cdi∪Cdj|
また、数値型の特徴量の場合には、次のようなものが考えられる。
sim (C i , C j ) = | Cd i ∩Cd j | / | Cd i ∪Cd j |
Further, in the case of a numerical feature quantity, the following can be considered.

sim(Ci,Cj)=√Σ(Cdi−Cdj)2
(3)分類の実施:
分類の対象となる全ての運用履歴を用いて、階層的クラスタリングを実施する。
sim (C i , C j ) = √Σ (Cd i −Cd j ) 2
(3) Implementation of classification:
Hierarchical clustering is performed using all operation histories to be classified.

全ての運用履歴について、運用履歴を唯一つ含むクラスを得る。上記の(2)で定義した運用履歴のクラス間の類似度を用いて、全クラスのペアのうち、最も類似度の高いクラスのペア(Cp',Cq')と、類似度sim(Cp',Cq')を獲得する。事前に定義した閾値をεとし、sim(Cp',Cq')<εであれば、存在する全てのクラスを分類結果としてステップ105に移行する。一方、sim(Cp',Cq')≧εであれば、Cp',Cq'をクラスの集合から取り除き、新たなクラスCp'q''=C p'∪C q'を作成する。その後、類似度の計算と最も類似度の高いクラスのペアを獲得する処理に戻り、存在するクラス数が1になるか、最大の類似度が閾値以下になって処理が終了するまで繰り返す。 For all operation histories, get a class that contains only one operation history. Using the similarity between the classes in the operation history defined in (2) above, the pair (C p ′ , C q ′ ) of the class with the highest similarity among the pairs of all classes and the similarity sim ( C p ′ , C q ′ ). If the threshold defined in advance is ε, and sim (C p ′ , C q ′ ) <ε, all existing classes are transferred to step 105 as classification results. On the other hand, if sim (C p ′ , C q ′ ) ≧ ε, C p ′ and C q ′ are removed from the set of classes, and a new class C p′q ′ '= C p ′ ∪C q' create. Thereafter, the process returns to the calculation of the similarity and the process of obtaining the class pair having the highest similarity, and the process is repeated until the number of existing classes becomes 1 or the maximum similarity is less than the threshold value and the process is terminated.

ステップ105) ステップ104の処理が終了したら、分類結果がユーザインタフェース13を介して利用者(端末)5に出力される。これを利用者5は統計分析の入力として用いる。   Step 105) When the process of Step 104 is completed, the classification result is output to the user (terminal) 5 via the user interface 13. The user 5 uses this as an input for statistical analysis.

[第2の実施の形態]
前述の第1の実施の形態では、過去の運用履歴について分類を行い、統計分析の入力としたが、本実施の形態では、新規に運用対象機器に発生したインシデントを含めた分類を行い、新規に発生したインシデントと同じクラスに分類される過去の運用履歴を提示する場合を説明する。
[Second Embodiment]
In the first embodiment described above, the past operation history is classified and used as an input for statistical analysis. However, in this embodiment, new incidents that occurred in the operation target device are classified and new The case where the past operation history classified into the same class as the incident that occurred is presented.

図3は、本発明の第2の実施の形態におけるシステム構成例を示す。同図において、図1と同一構成部分には同一符号を付し、その説明を省略する。   FIG. 3 shows an example of a system configuration in the second embodiment of the present invention. In the figure, the same components as those in FIG.

本実施の形態では、運用対象機器2で新たに発生したインシデントについて、利用者(端末)5あるいは監視システム1がシステム状態情報(アラームメッセージ)を運用履歴分析装置10bに与え、システム状態情報が最も類似している運用履歴のクラスと含まれる運用履歴を利用者(端末)5へ提示する場合を示している。図3のシステム構成では、システム状態情報が監視システム1から特徴量取得部11に与えられるため、システム状態情報DB4は不要となる。   In the present embodiment, the user (terminal) 5 or the monitoring system 1 gives the system status information (alarm message) to the operation history analyzer 10b for the incident newly generated in the operation target device 2, and the system status information is the most. The case where the similar operation history class and the included operation history are presented to the user (terminal) 5 is shown. In the system configuration of FIG. 3, since the system state information is given from the monitoring system 1 to the feature amount acquisition unit 11, the system state information DB 4 becomes unnecessary.

この場合、運用履歴分析装置10bには、ユーザインタフェース13を介して利用者(端末)5から分類を行う過去の運用履歴の範囲が指定され、監視システム1から新規に発生した故障におけるシステム状態情報が入力される。この新規に発生したインシデントが運用履歴の様式と持つとは限らないが、分類においてはシステム状態情報から分類が可能なため、運用履歴がないか未完成なシステム状態情報のみのデータを運用履歴と同等に扱う。これは、新規発生したインシデント対応時に、類似した運用履歴を参照する場合を想定している。対応中のインシデントは運用履歴が完成していない場合があり、この場合アラームメッセージ等「システム状態情報」のみから分類を実施する。運用履歴分析装置10bの分類部12は、利用者(端末)5からの範囲の入力によって、第1の実施の形態におけるステップ103の2)と同様の方法により、指定された範囲のシステム状態情報の分類を開始し、分類結果のうち、運用対象機器pで新規に発生したインシデントと同一のクラスに属する運用履歴を利用者(端末)5に提示する。   In this case, the operation history analysis apparatus 10b is designated with a range of past operation history to be classified from the user (terminal) 5 via the user interface 13, and system state information regarding a failure newly generated from the monitoring system 1 Is entered. Although this newly generated incident does not necessarily have a format of operation history, classification is possible from system state information in classification, so data with no operation history or only incomplete system state information is used as operation history. Treat equally. This assumes the case of referring to a similar operation history when dealing with a newly occurring incident. The incident that is being handled may not have a complete operation history. In this case, classification is performed only from "system status information" such as alarm messages. The classification unit 12 of the operation history analysis apparatus 10b receives the range input from the user (terminal) 5 and uses the same method as in step 103-2) of the first embodiment to specify the system state information in the specified range. In the classification result, the operation history belonging to the same class as the incident newly generated in the operation target device p is presented to the user (terminal) 5.

[第3の実施の形態]
前述の第1、第2の実施の形態では、共に対象とするインシデントを含めて分類を実施し、結果を活用したが、本実施の形態では、予め運用履歴を分類しておき、新たなインシデントに対して類似性の高いクラスを順に獲得し、関連性の高い運用履歴を順次参照してインシデントの根本原因分析に用いる場合について説明する。
[Third Embodiment]
In the first and second embodiments described above, classification is performed including incidents that are both targeted, and the results are used. However, in this embodiment, the operation history is classified in advance and a new incident is created. A case will be described in which classes with high similarity are acquired in order, and operation history with high relevance is sequentially referred to and used for root cause analysis of incidents.

図4は、本発明の第3の実施の形態におけるシステム構成例である。   FIG. 4 is a system configuration example according to the third embodiment of the present invention.

同図において、図1と同一構成部分には同一符号を付し、その説明を省略する。   In the figure, the same components as those in FIG.

同図の構成には、クラスDB6が設けられている。当該クラスDB6には、任意の手法(例えば、第1の実施の形態における図2のステップ104の処理)により運用情報DB3の運用情報に対して予め分類を実施した結果が格納される。   A class DB 6 is provided in the configuration of FIG. The class DB 6 stores a result of previously classifying the operation information in the operation information DB 3 by an arbitrary method (for example, the process of step 104 in FIG. 2 in the first embodiment).

運用履歴分析装置10cの特徴量取得部11は、入力されたシステム状態情報を特徴量に変換して分類部12に出力する。   The feature quantity acquisition unit 11 of the operation history analysis apparatus 10 c converts the input system state information into a feature quantity and outputs it to the classification unit 12.

運用履歴分析装置10cの分類部12は、利用者(端末)5から新たなインシデントのシステム状態情報が入力されると、クラスDB6の各クラスとの類似度を計算し、類似度の高いクラスから順に利用者(端末)5に提示する。   When the system state information of a new incident is input from the user (terminal) 5, the classification unit 12 of the operation history analysis apparatus 10 c calculates the similarity with each class of the class DB 6, and starts from the class with a high similarity. The information is presented to the user (terminal) 5 in order.

なお、上記の図1、3,4に示す運用履歴分析装置10a,10b,10cの各構成要素の処理をプログラムとして構築し、運用履歴分析装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。   In addition, the processing of each component of the operation history analysis apparatuses 10a, 10b, and 10c shown in FIGS. 1, 3 and 4 is constructed as a program and installed in a computer used as the operation history analysis apparatus, or is executed. It is possible to distribute through a network.

本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。   The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.

1 監視システム
2 運用対象装置
3 運用履歴DB
4 システム状態情報DB
5 利用者(端末)
6 クラスDB
10a,10b,10c 運用履歴分析装置
11 特徴量取得部
12 分類部
13 ユーザインタフェース
1 Monitoring System 2 Operation Target Device 3 Operation History DB
4 System status information DB
5 users (terminals)
6 Class DB
10a, 10b, 10c Operation history analyzer 11 Feature amount acquisition unit 12 Classification unit 13 User interface

Claims (7)

運用対象機器のインシデントに対応するオペレータの実施作業を記録した運用履歴の集合からインシデントの原因箇所が共通である運用履歴ごとに分類する運用履歴分析装置であって、
運用履歴の分類を要する運用履歴の範囲が与えられると、運用対象機器について過去に記述された運用履歴を格納した運用履歴DBから、該範囲に該当する運用履歴集合を取得して、各運用履歴から特徴量を抽出する特徴量抽出手段と、
前記運用履歴集合を同一の原因個所ごとに、前記特徴量の類似性により分類する分類手段と、
を有することを特徴とする運用履歴分析装置。
An operation history analyzer that classifies each operation history that has a common cause of an incident from a set of operation histories that record the operations performed by the operator corresponding to the incident of the operation target device.
When a range of operation history that requires operation history classification is given, an operation history set corresponding to the range is acquired from the operation history DB storing operation history described in the past for the operation target device, and each operation history is acquired. Feature amount extraction means for extracting feature amounts from
Classifying means for classifying the operation history set by the similarity of the feature amount for each same cause location;
An operation history analyzing apparatus characterized by comprising:
前記特徴量抽出手段は、
前記運用履歴に加えて、前記運用対象機器、または、該運用対象機器を監視するシステムから与えられたシステム状態情報の特徴量を抽出する手段を含む
請求項1記載の運用履歴分析装置。
The feature amount extraction means includes:
The operation history analysis apparatus according to claim 1, further comprising means for extracting a feature quantity of system state information given from the operation target device or a system that monitors the operation target device in addition to the operation history.
前記特徴量抽出手段は、
前記運用履歴の要約情報から前記特徴量を抽出する手段を含む
請求項1記載の運用履歴分析装置。
The feature amount extraction means includes:
The operation history analysis apparatus according to claim 1, further comprising means for extracting the feature amount from summary information of the operation history.
前記特徴量抽出手段は、
前記システム状態情報のシステムメッセージ、または、前記運用対象機器のシステム数値情報を用いて前記特徴量を抽出する手段を含む
請求項2記載の運用履歴分析装置。
The feature amount extraction means includes:
The operation history analysis apparatus according to claim 2, further comprising means for extracting the feature amount using a system message of the system state information or system numerical information of the operation target device.
前記分類手段は、
階層的クラスタリングを用いて、前記特徴量の類似度により分類する手段を含む
請求項1乃至4のいずれか1項に記載の運用履歴分析装置。
The classification means includes
5. The operation history analysis apparatus according to claim 1, further comprising means for classifying according to the similarity of the feature amount using hierarchical clustering.
運用対象機器のインシデントに対応するオペレータの実施作業を記録した運用履歴の集合からインシデントの原因箇所が共通である運用履歴ごとに分類する運用履歴分析方法であって、
運用履歴の分類を要する運用履歴の範囲が与えられると、運用対象機器について過去に記述された運用履歴を格納した運用履歴DBから、該範囲に該当する運用履歴集合を取得して、各運用履歴から特徴量を抽出する特徴量抽出ステップと、
前記運用履歴集合を同一の原因個所ごとに、前記特徴量の類似性により分類する分類ステップと、
を行うことを特徴とする運用履歴分析方法。
An operation history analysis method for classifying each operation history having a common cause of an incident from a set of operation histories in which the operations performed by the operator corresponding to the incident of the operation target device are recorded,
When a range of operation history that requires operation history classification is given, an operation history set corresponding to the range is acquired from the operation history DB storing operation history described in the past for the operation target device, and each operation history is acquired. A feature extraction step for extracting a feature from
A classification step of classifying the operation history set according to the similarity of the feature amount for each same cause location;
An operational history analysis method characterized by:
コンピュータを、
請求項1乃至5のいずれか1項に記載の運用履歴分析装置の各手段として機能させるための運用履歴分析プログラム。
Computer
The operation history analysis program for functioning as each means of the operation history analysis apparatus of any one of Claims 1 thru | or 5.
JP2014025536A 2014-02-13 2014-02-13 Operation history analysis apparatus, method, and program Active JP6078485B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014025536A JP6078485B2 (en) 2014-02-13 2014-02-13 Operation history analysis apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014025536A JP6078485B2 (en) 2014-02-13 2014-02-13 Operation history analysis apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2015153078A true JP2015153078A (en) 2015-08-24
JP6078485B2 JP6078485B2 (en) 2017-02-08

Family

ID=53895269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014025536A Active JP6078485B2 (en) 2014-02-13 2014-02-13 Operation history analysis apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP6078485B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017151776A (en) * 2016-02-25 2017-08-31 日本電信電話株式会社 Information management device, information management method and information management program
US10275457B2 (en) 2017-02-13 2019-04-30 Fujitsu Limited Information processing apparatus and control method for information processing apparatus
US10318371B2 (en) 2016-06-13 2019-06-11 Fujitsu Limited Apparatus and method to determine a setting item causing an incident based on action records therefor
US10664340B2 (en) 2017-02-16 2020-05-26 Fujitsu Limited Failure analysis program, failure analysis device, and failure analysis method

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175144A (en) * 1997-12-05 1999-07-02 Toshiba Corp Maintenance supporting device for plant equipment
JP2006276924A (en) * 2005-03-28 2006-10-12 Hitachi Ltd Equipment diagnostic device and equipment diagnostic program
WO2008149975A1 (en) * 2007-06-06 2008-12-11 Nec Corporation Communication network failure cause analysis system, failure cause analysis method, and failure cause analysis program
JP2010067088A (en) * 2008-09-11 2010-03-25 Toshiba Corp Error group generating apparatus, error group generating method, and error diagnostic system
US20100191731A1 (en) * 2009-01-23 2010-07-29 Vasile Rus Methods and systems for automatic clustering of defect reports
JP2011209908A (en) * 2010-03-29 2011-10-20 Hitachi Solutions Ltd Rule creation device in failure cause analysis system and its program
JP2013120547A (en) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd Discourse summary template creation system and discourse summary template creation program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175144A (en) * 1997-12-05 1999-07-02 Toshiba Corp Maintenance supporting device for plant equipment
JP2006276924A (en) * 2005-03-28 2006-10-12 Hitachi Ltd Equipment diagnostic device and equipment diagnostic program
WO2008149975A1 (en) * 2007-06-06 2008-12-11 Nec Corporation Communication network failure cause analysis system, failure cause analysis method, and failure cause analysis program
JP2010067088A (en) * 2008-09-11 2010-03-25 Toshiba Corp Error group generating apparatus, error group generating method, and error diagnostic system
US20100191731A1 (en) * 2009-01-23 2010-07-29 Vasile Rus Methods and systems for automatic clustering of defect reports
JP2011209908A (en) * 2010-03-29 2011-10-20 Hitachi Solutions Ltd Rule creation device in failure cause analysis system and its program
JP2013120547A (en) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd Discourse summary template creation system and discourse summary template creation program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
柳瀬 隆史、外2名: "保守事例分析を利用した保守業務支援システム", 電子情報通信学会技術研究報告, vol. 第105巻,第650号, JPN6016042780, 3 March 2006 (2006-03-03), JP, pages 31 - 36, ISSN: 0003473206 *
稗方 和夫、外5名: "インシデントレポートの自動分類とその分析環境の構築と評価", 2013年度人工知能学会全国大会, JPN7016003350, 3 March 2013 (2013-03-03), JP, pages 1 - 6, ISSN: 0003473205 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017151776A (en) * 2016-02-25 2017-08-31 日本電信電話株式会社 Information management device, information management method and information management program
US10318371B2 (en) 2016-06-13 2019-06-11 Fujitsu Limited Apparatus and method to determine a setting item causing an incident based on action records therefor
US10275457B2 (en) 2017-02-13 2019-04-30 Fujitsu Limited Information processing apparatus and control method for information processing apparatus
US10664340B2 (en) 2017-02-16 2020-05-26 Fujitsu Limited Failure analysis program, failure analysis device, and failure analysis method

Also Published As

Publication number Publication date
JP6078485B2 (en) 2017-02-08

Similar Documents

Publication Publication Date Title
US11928144B2 (en) Clustering of log messages
US11334602B2 (en) Methods and systems for alerting based on event classification and for automatic event classification
CN106055608B (en) The method and apparatus of automatic collection and analysis interchanger log
CN103827810A (en) Asset model import connector
JP6078485B2 (en) Operation history analysis apparatus, method, and program
CN101582811A (en) Method for establishing integration of network monitoring and operating management
US9922116B2 (en) Managing big data for services
CN114548706A (en) Early warning method for business risk and related equipment
CN108965049A (en) Method, equipment, system and the storage medium of cluster exception solution are provided
CN108390782A (en) A kind of centralization application system performance question synthesis analysis method
CN114528457A (en) Web fingerprint detection method and related equipment
US20160248724A1 (en) Social Message Monitoring Method and Apparatus
US11568344B2 (en) Systems and methods for automated pattern detection in service tickets
Zhao et al. Extracting log patterns from system logs in large
US10510032B2 (en) Automated configuration data collection for business applications using feedback
KR20190104759A (en) System and method for intelligent equipment abnormal symptom proactive detection
US11838171B2 (en) Proactive network application problem log analyzer
US11822578B2 (en) Matching machine generated data entries to pattern clusters
CN115408236A (en) Log data auditing system, method, equipment and medium
CN113704203A (en) Log file processing method and device
CN111143318B (en) Information processing method, device, electronic equipment and storage medium
CN114490246A (en) Monitoring method, monitoring device, electronic equipment and storage medium
CN112015623A (en) Method, device and equipment for processing report data and readable storage medium
da Silva Rocha et al. Aggregating data center measurements for availability analysis
JP6085574B2 (en) Work record content analysis apparatus, method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170116

R150 Certificate of patent or registration of utility model

Ref document number: 6078485

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150