JP4819014B2 - Log analysis method, log storage device, and program - Google Patents

Log analysis method, log storage device, and program Download PDF

Info

Publication number
JP4819014B2
JP4819014B2 JP2007243570A JP2007243570A JP4819014B2 JP 4819014 B2 JP4819014 B2 JP 4819014B2 JP 2007243570 A JP2007243570 A JP 2007243570A JP 2007243570 A JP2007243570 A JP 2007243570A JP 4819014 B2 JP4819014 B2 JP 4819014B2
Authority
JP
Japan
Prior art keywords
log
abnormality
occurrence
false alarm
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007243570A
Other languages
Japanese (ja)
Other versions
JP2009075817A5 (en
JP2009075817A (en
Inventor
友洋 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007243570A priority Critical patent/JP4819014B2/en
Publication of JP2009075817A publication Critical patent/JP2009075817A/en
Publication of JP2009075817A5 publication Critical patent/JP2009075817A5/ja
Application granted granted Critical
Publication of JP4819014B2 publication Critical patent/JP4819014B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、高信頼なコンピュータシステムを実現するために、異常検出もしくは異常予測を実現するログ解析技術に関する。   The present invention relates to a log analysis technique for realizing abnormality detection or abnormality prediction in order to realize a highly reliable computer system.

コンピュータシステムは、社会の様々な分野で利用され、社会活動に欠かせないものとなっている。それに伴って、コンピュータシステムの高信頼化に対する要求も高まっている。しかし、Web3層システム(業務システム)のような複数の計算機からなる複雑なシステムでは、高信頼化を実現する上で欠かせない、システムの異常の検出や予測の実現が難しくなっている。最近ではWeb3層等のシステムを構成するハードウェア及びソフトウェアのマルチベンダ化や処理の分散化によって、この傾向はますます強まっている。   Computer systems are used in various fields of society and are indispensable for social activities. Along with this, the demand for high reliability of computer systems is also increasing. However, in a complex system composed of a plurality of computers, such as a Web three-layer system (business system), it is difficult to realize system abnormality detection and prediction, which are indispensable for achieving high reliability. Recently, this trend has been further strengthened due to the multi-vendor of hardware and software constituting the system such as the Web 3-layer and the distribution of processing.

システムの異常を検出・予測するには、異常を検出するためのプローブをシステムに埋め込むか、システムから出力されるログから異常を検出するためのルールを用意するのが基本的な対策である。ところが、前記のようにシステムの複雑化やブラックボックス化によって、すべての異常に対してこのような対策がとれなくなっている。場合によっては、どのような異常が起こりえるかを列挙することも難しくなっている。しかしながら、コンピュータシステムの社会インフラストラクチャとしての重要性は増大しており、異常の検出・予測を迅速かつ正確に行う必要がある。   In order to detect and predict a system abnormality, a basic measure is to embed a probe for detecting an abnormality in the system or prepare a rule for detecting an abnormality from a log output from the system. However, due to the complexity of the system and the black box as described above, such countermeasures cannot be taken against all abnormalities. In some cases, it is also difficult to enumerate what anomalies can occur. However, the importance of computer systems as a social infrastructure is increasing, and it is necessary to detect and predict abnormalities quickly and accurately.

そこで、システムから出力されるログを、正常稼動時に出力されたログと比較して、変化が見られた場合に、システムの異常が起こった、もしくは起こる可能性があると判定する統計的手法を用いたログ解析技術を、異常の検出・予測に利用しようとする動きがある。例えば、非特許文献1や非特許文献2では、Webシステムのアクセスログに対して通常時のログと現在のログを比較して、Webシステムでの異常の発生を検出したり予測したりできることが開示されている。   Therefore, a statistical method for comparing the log output from the system with the log output during normal operation and determining that a system abnormality has occurred or is likely to occur when there is a change. There is a movement to use the log analysis technology used to detect and predict abnormalities. For example, in Non-Patent Document 1 and Non-Patent Document 2, it is possible to detect and predict the occurrence of an abnormality in the Web system by comparing the normal log and the current log against the access log of the Web system. It is disclosed.

非特許文献1や非特許文献2でも指摘されているが、このようなログ解析技術を利用したコンピュータシステムの異常の検出・予測では、フォールスポジティブ(以下では、誤報とフォールスポジティブを同義語とする)と呼ばれる現象が問題となることが知られている。フォールスポジティブとは、実際には異常が発生していないが、ログ解析結果では異常の発生を検出、もしくは予測してしまう現象である。フォールスポジティブが発生する理由はコンピュータシステムの構成や、ログ解析に利用するログの特性、ログ解析技術で利用するアルゴリズムなどにより異なり、様々であるが、大きく分けると以下の3つが挙げられる。
(A)時々現れる異常ではないイベントによってフォールスポジティブが発生する場合
(B)ログ解析で利用する入力データ(ログ)に含まれているノイズによってフォールスポジティブが発生する場合
(C)ログ解析で利用するアルゴリズムやデータの前処理に不適切なものが含まれてフォールスポジティブが発生する場合
これらに対して、部分的な解決策が従来技術により与えられている。(A)に対しては特許文献1および特許文献2が、(B)に対しては特許文献3が、(C)に対しては特許文献4、特許文献5および特許文献6がそれぞれ部分的な解決策を与えている。
As pointed out in Non-Patent Document 1 and Non-Patent Document 2, in the detection and prediction of abnormality of a computer system using such log analysis technology, false positives (hereinafter, misinformation and false positives are synonymous) ) Is known to be a problem. The false positive is a phenomenon in which no abnormality actually occurs, but the occurrence of abnormality is detected or predicted from the log analysis result. The reason for the occurrence of false positives varies depending on the configuration of the computer system, the characteristics of the log used for log analysis, the algorithm used for the log analysis technology, and the like, but there are three main categories.
(A) When a false positive occurs due to a non-abnormal event that appears occasionally (B) When a false positive occurs due to noise included in input data (log) used in log analysis (C) Used in log analysis When false positives occur due to improper algorithms or preprocessing of data, against these, partial solutions are provided by the prior art. Patent Document 1 and Patent Document 2 for (A), Patent Document 3 for (B), and Patent Document 4, Patent Document 5 and Patent Document 6 for (C), respectively. Has given a solution.

上記(A)の「時々現れる異常ではないイベントによってフォールスポジティブが発生する」問題に対しては、特許文献1の「時系列データ検索システム」(特開2003−132088)で開示されるように、ウェーブレット変換を利用してデータ波形の特徴を保存し検索する時系列データ検索システムにより、時々現れる異常ではないイベントのログの特徴抽出をすることで部分的な解決が実現できる。また特許文献2の「障害原因発見装置、障害原因対策装置、及びそれらの方法」(特開平7−311691)で開示されているように、環境情報の変化と異常の発生原因及び対策の情報の組を用意して、環境情報の変化から異常の検出、対策を実行する方法において、異常の発生原因に対して正常なイベントであると登録することで、時々現れる異常ではないイベントによるフォールスポジティブの発生を低減することができる。   With respect to the above-mentioned (A) problem that “false positive occurs due to an event that does not appear abnormal”, as disclosed in “Time-series data search system” (Japanese Patent Application Laid-Open No. 2003-132808) in Patent Document 1, A partial solution can be realized by extracting features of a log of events that do not appear abnormal from time to time by using a time-series data search system that stores and retrieves data waveform features using wavelet transform. Further, as disclosed in “Failure Cause Detecting Device, Failure Cause Countermeasure Device, and Their Methods” (Japanese Patent Laid-Open No. 7-311691) in Patent Document 2, changes in environmental information, occurrence of abnormality, and information on countermeasures are disclosed. By preparing a group and registering it as a normal event for the cause of the abnormality in the method of detecting abnormality and taking countermeasures from changes in environmental information, false positives due to non-abnormal events appearing from time to time Generation can be reduced.

上記(B)の「ログ解析で利用する入力データ(ログ)に含まれているノイズによってフォールスポジティブが発生する」問題に対しては、特許文献3の「状態変化検出装置」(特開平7−301544)で開示されているように、ログを取得するサンプリング間隔の連続2区間で状態変化を検出したらノイズの影響と判定してサンプリング間隔を調整する方法により、ノイズによるフォールスポジティブの発生を低減することができる。   With respect to the problem “False positive occurs due to noise included in input data (log) used in log analysis” in (B) above, the “state change detection device” disclosed in Japanese Patent Application Laid-Open No. HEI 7-7 As disclosed in US Pat. No. 301544), if a change in state is detected in two consecutive sampling intervals for acquiring a log, the occurrence of false positives due to noise is reduced by determining the influence of noise and adjusting the sampling interval. be able to.

上記(C)の「ログ解析で利用するアルゴリズムやデータの前処理に不適切なものが含まれてフォールスポジティブが発生する」問題に対しては、特許文献4の「異常診断装置、異常予兆診断装置、及び不要事象検出装置」(特開2003−271239)で開示されている、システムの正常時のパターンを覚えておいて正常時とのずれが一定量を超えたら異常と判定し、異常と判定されたときのパターンは記憶しない方法により、コンピュータシステムの異常を判定する学習アルゴリズムに異常時のログを学習させなくすることでフォールスポジティブの発生を低減することができる。また、特許文献5の「異常検出装置」(特開2001−74799)で開示されている、フーリエ変換を利用してデータの周波数成分の変化を検出して異常の有無を判定する方法により、時間成分に現れない異常を検出でき、検出アルゴリズムが改善され、フォールスポジティブの発生を低減することができる。さらに特許文献6の「ネットワーク監視システム及びその方法、プログラム」(特開2005−285040)で開示されているように、異常の予兆を検出する監視によりシステムの異常を予測すると、その内容に応じたルールに従って詳細な情報を収集し、その結果異常ではないと判定したらその監視を止める方法により、複数の監視レベルを設けて実際に異常が発生しているか否かを詳細に判定することで、フォールスポジティブの発生を低減することができる。
特開2003−132088 公報 特開平7−311691 公報 特開平7−301544 公報 特開2003−271239 公報 特開2001−74799 公報 特開2005−285040 公報 P. Bodik、 G. Friedman、 L. Biewald、 H. Levine、 G. Candea、 K. Patel、 G. Tolle、 J. Hui、 A. Fox、 M. I. Jordan and D. Patterson、 ”Combining Visualization and Statistical Analysis to Improve Operator Confidence and Efficiency for Failure Detection and Localization”、The 2nd IEEE International Conference on Autonomic Computing (ICAC '05)、 Seattle、 June 2005. 中村友洋、「Webアプリケーションの障害を予測する``アクセス時間解析方式''の提案」、 情報処理学会論文誌、情報処理学会発行、2006年9月、コンピューティングシステム、Vol.47、No. SIG12 (ACS15)、pp.349−357
The above-mentioned (C) “algorithm used in log analysis and improper data pre-processing includes false positives” problem is disclosed in Patent Document 4 “Abnormality diagnosis device, abnormal sign diagnosis” Device and Unnecessary Event Detection Device ”(Japanese Patent Application Laid-Open No. 2003-271239), remembering the normal pattern of the system, if the deviation from normal exceeds a certain amount, it is determined as abnormal, By not storing the pattern at the time of determination, it is possible to reduce the occurrence of false positives by preventing the learning algorithm for determining abnormality of the computer system from learning the log at the time of abnormality. Further, the method disclosed in “Abnormality Detection Device” (Japanese Patent Laid-Open No. 2001-74799) of Patent Document 5 uses a Fourier transform to detect a change in the frequency component of data and determine the presence or absence of an abnormality. Abnormalities that do not appear in the components can be detected, the detection algorithm is improved, and the occurrence of false positives can be reduced. Further, as disclosed in “Network Monitoring System and Method and Program” of Patent Document 6 (Japanese Patent Laid-Open No. 2005-285040), when an abnormality of the system is predicted by monitoring to detect a sign of abnormality, the content is determined according to the content. By collecting detailed information according to the rules and determining that there is no abnormality as a result, the monitoring is stopped and multiple monitoring levels are provided to determine in detail whether an abnormality has actually occurred. The occurrence of positives can be reduced.
JP 2003-13088 A JP 7-311691 A JP-A-7-301544 JP 2003-271239 A JP 2001-74799 A JP 2005-285040 A P. Bodik, G. Friedman, L. Biewald, H. Levine, G. Candea, K. Patel, G. Tolle, J. Hui, A. Fox, MI Jordan and D. Patterson, ”Combining Visualization and Statistical Analysis to Improve Operator Confidence and Efficiency for Failure Detection and Localization '', The 2nd IEEE International Conference on Autonomic Computing (ICAC '05), Seattle, June 2005. Tomohiro Nakamura, “Proposal of“ Access Time Analysis Method ”to Predict Web Application Failures”, IPSJ Transactions, IPSJ, September 2006, Computing System, Vol. 47, No. SIG12 (ACS15), pp. 349-357

本発明が対象とする、コンピュータシステムの高信頼化のための、ログ解析技術による異常の検出・予測では、異常の検出・予測の感度と精度のバランスをいかに取るかが課題となっている。一般に、異常の発生を逃さずに検出・予測しようとして検出・予測の感度を上げると、実際には異常が発生していない時にも異常の発生を検出したり予測したりしてしまうフォールスポジティブの発生が増加し、検出・予測の精度が低下してしまうというトレードオフが存在する。フォールスポジティブが増加するとログ解析技術を利用した異常の検出・予測に対する信頼が失われるため、フォールスポジティブを低減する必要がある。ただし、実際には異常が発生しているにも拘わらず異常の検出・予測がなされない状態をフォールスネガティブと呼ぶが、フォールスネガティブを発生させないことが前提となる。つまり、フォールスネガティブを発生させずに、いかにフォールスポジティブの発生を低減するかが課題である。   In the detection / prediction of abnormality by log analysis technology for the purpose of increasing the reliability of a computer system targeted by the present invention, how to balance the sensitivity and accuracy of detection / prediction of abnormality is an issue. In general, if the sensitivity of detection / prediction is increased in order to detect / predict without missing the occurrence of an abnormality, false positives will be detected / predicted even when no abnormality actually occurs. There is a trade-off in which occurrence increases and detection / prediction accuracy decreases. As false positives increase, confidence in the detection and prediction of abnormalities using log analysis technology is lost, so it is necessary to reduce false positives. However, a state in which abnormality is not detected / predicted even though an abnormality has actually occurred is called a false negative, but it is assumed that no false negative is generated. In other words, the issue is how to reduce the occurrence of false positives without generating false negatives.

背景技術の項で説明したように、フォールスポジティブが発生する原因は、大きく分けて以下の3つがある。
(A) 時々現れる異常ではないイベントによってフォールスポジティブが発生する場合
(B) ログ解析で利用する入力データ(ログ)に含まれているノイズによってフォールスポジティブが発生する場合
(C) ログ解析で利用するアルゴリズムやデータの前処理に不適切なものが含まれてフォールスポジティブが発生する場合
この中で、(B)、(C)に関しては、背景技術で示した従来技術によってほぼ解決されているが、(A)に関しては従来技術だけでは十分な解決ができていない。
As described in the background art section, the causes of false positives are roughly divided into the following three.
(A) When a false positive occurs due to a non-abnormal event that appears from time to time (B) When a false positive occurs due to noise included in the input data (log) used in log analysis (C) Used in log analysis When false positives occur due to improper algorithms or preprocessing of data, among these, (B) and (C) are mostly solved by the prior art shown in the background art. With regard to (A), the conventional technology alone is not sufficient solution.

そこで、本発明は、時々現れる異常ではないイベントによって発生するフォールスポジティブを低減し、異常の検出・予測に対する信頼を高めることを目的とする。   Therefore, an object of the present invention is to reduce false positives caused by non-abnormal events that appear from time to time, and to increase the reliability of abnormality detection / prediction.

本発明は、ログ解析技術を利用したコンピュータシステムの異常の検出・予測におけるフォールスポジティブの発生を低減する方法および装置で、従来の異常の検出・予測方法および装置に加える形で実現する。   The present invention is a method and apparatus for reducing the occurrence of false positives in computer system abnormality detection / prediction utilizing log analysis technology, and is realized in addition to the conventional abnormality detection / prediction method and apparatus.

すなわち、計算機から出力されるログを解析して、計算機の異常を検出もしくは予測するログ解析方法において、前記計算機からログを受け付け、記受け付けたログを解析して、前記計算機に異常が発生したことを検出、または前記計算機に異常の発生を予測し、前記ログと、予め設定した誤報のルールとを比較して、前記計算機の異常の検出または異常の予測において誤報の発生を判定し、前記誤報の発生が判定されたときには、前記計算機の異常発生の検出または前記計算機の異常発生の予測において誤報の発生を低減する。   In other words, in the log analysis method for analyzing or outputting the log output from the computer to detect or predict the abnormality of the computer, the log was received from the computer, the received log was analyzed, and the abnormality occurred in the computer Or the occurrence of an abnormality in the computer is predicted, the log is compared with a preset false alarm rule, the occurrence of an erroneous alarm is determined in the detection of an abnormality of the computer or the prediction of an abnormality, and the erroneous alarm is detected. When it is determined that an error has occurred, the occurrence of false alarms is reduced in detecting the occurrence of an abnormality in the computer or predicting the occurrence of an abnormality in the computer.

つまり、異常の検出・予測方法および装置の実現方法そのものは従来技術でよく、基本的にはどのようなログ解析技術を利用した異常の検出・予測方法であっても、本発明による方法および装置によってフォールスポジティブの発生を低減させることができる。   That is, the abnormality detection / prediction method and apparatus realization method itself may be a conventional technique, and basically the abnormality detection / prediction method using any log analysis technique is used. Can reduce the occurrence of false positives.

本発明により、従来技術で実現される異常の検出・予測方法および装置に加える部分は、大きく分けて5つのステップで構成される。5つのステップは必ずすべてが必要なわけではなく、一部だけでも本発明が解決しようとする課題の一部を解決できる。以下に5つのステップについて示す。   According to the present invention, the part added to the abnormality detection / prediction method and apparatus realized in the prior art is roughly divided into five steps. Not all of the five steps are necessarily required, and only a part can solve some of the problems to be solved by the present invention. The five steps are shown below.

[ステップ1] フォールスポジティブの発生の通知もしくはフォールスポジティブの発生パターンの登録。異常の検出・予測結果がフォールスポジティブであった場合に、フォールスポジティブの発生を通知して、どのような場合にフォールスポジティブが発生するかを登録する。もしくは、例えば周期的にフォールスポジティブ発生することがわかっているような場合に、その周期を登録する。   [Step 1] Notification of false positive occurrence or registration of false positive occurrence pattern. When the abnormality detection / prediction result is false positive, the occurrence of false positive is notified and the registration of when the false positive occurs is registered. Alternatively, for example, when it is known that false positives occur periodically, the cycle is registered.

[ステップ2] フォールスポジティブを起す状態の登録。フォールスポジティブが発生したときのログを登録する。登録するものは、ログそのものでなく、例えば通常時のログとの差分や、ログの発生頻度などの情報でもよい。またステップ1に示したフォールスポジティブの発生周期などの発生条件などでもよい。   [Step 2] Registration of a state that causes false positives. Register a log when a false positive occurs. What is registered is not the log itself, but may be information such as a difference from a normal log and the frequency of occurrence of the log. The generation conditions such as the false positive generation cycle shown in step 1 may be used.

[ステップ3] フォールスポジティブを起す状態の検出。フォールスポジティブ発生時のログや発生条件と、現在のログや状態を比較することで、フォールスポジティブの発生を検出・予測する。   [Step 3] Detection of a state that causes false positives. The occurrence of false positives is detected and predicted by comparing the current log and state with the log and occurrence conditions at the time of false positive occurrence.

[ステップ4] フォールスポジティブの発生可能性を低減する処理。例えば、フォールスポジティブの発生が検出・予測された場合に、ログ解析の結果を無効化したり、フォールスポジティブを起す可能性のあるログを削除したりする。   [Step 4] Processing to reduce the possibility of false positives. For example, when occurrence of a false positive is detected / predicted, the result of log analysis is invalidated or a log that may cause a false positive is deleted.

[ステップ5] 処理結果の通知。フォールスポジティブ発生可能性を低減する処理を行ったことを通知する。もしくは、フォールスポジティブ発生可能性を低減する処理を行った場合と、行わなかった場合の両方のログ解析結果を通知する。   [Step 5] Notification of processing results. Notify that processing that reduces the possibility of false positives has been performed. Alternatively, the log analysis result is notified both when the processing for reducing the possibility of occurrence of false positives is performed and when the processing is not performed.

したがって、課題を解決するための手段に示した5つのステップによれば、例えば、フォールスポジティブの発生時にフォールスポジティブを発生させたログの登録を行い、以降で同様のログが出力された場合にそれを検出し、そのログを削除することでログ解析結果がフォールスポジティブにならないようにすることが可能となる。つまり、本発明によれば、従来技術で実現されるログ解析技術を利用したコンピュータシステムの異常の検出・予測に関し、フォールスポジティブの発生を低減して異常の検出精度または予測精度を向上でき、ログ解析技術による異常の検出・予測に対する信頼を高め、コンピュータシステムの高信頼化を実現できる効果がある。   Therefore, according to the five steps shown in the means for solving the problem, for example, when a false positive occurs, the log that generated the false positive is registered, and if a similar log is output after that, It is possible to prevent the log analysis result from becoming false positive by detecting the log and deleting the log. That is, according to the present invention, it is possible to improve the detection accuracy or prediction accuracy of anomalies by reducing the occurrence of false positives and detecting and predicting anomalies in computer systems using log analysis technology realized in the prior art. There is an effect that the reliability of the detection and prediction of abnormality by the analysis technology can be increased and the reliability of the computer system can be increased.

さらに、ログ解析技術による異常の検出・予測の精度向上により、異常の検出・予測を全自動化もしくは半自動化することが可能となるので、従来よりもコンピュータシステムの運用管理に要するコストを低減できる。   Furthermore, since the accuracy of abnormality detection / prediction by the log analysis technology can be fully automated or semi-automated, the cost required for the operation management of the computer system can be reduced as compared with the prior art.

以下、本発明の一実施形態を添付図面に基づいて説明する。   Hereinafter, an embodiment of the present invention will be described with reference to the accompanying drawings.

本発明によるコンピュータシステムの異常検出における誤報発生(フォールスポジティブ)を低減するログ解析処理の一例を図1から図20を使って説明する。   An example of log analysis processing for reducing the occurrence of false alarms (false positives) in abnormality detection of a computer system according to the present invention will be described with reference to FIGS.

図1は、本発明を適用する計算機システムの基本的な構成を示すブロック図である。コンピュータシステム101は、異常の検出・予測を行う対象となるコンピュータシステムである。コンピュータシステム101は、1台以上の計算機102から構成される。計算機102は、演算処理を行うCPUと、プログラムやデータを格納するメモリを備え、コンピュータシステム101が提供するサービスを実現するための処理を実行する。各計算機102は、1つ以上のログ生成部103を持つ。各ログ生成部103は、各計算機102を構成するハードウェアやソフトウェアの実行状態や、実行した処理や発生したエラーなどのイベント履歴などをログとして生成する。ログ生成部103で生成されたログは、各計算機102や、コンピュータシステム101内外に記録される。このログの記録は、例えば、各計算機102のストレージ装置や、コンピュータシステム101内のストレージ装置、あるいはコンピュータシステム101に接続されたネットワーク上のストレージ装置などに適宜書き込むことで実現できる。   FIG. 1 is a block diagram showing a basic configuration of a computer system to which the present invention is applied. The computer system 101 is a computer system that is a target for detecting and predicting an abnormality. The computer system 101 includes one or more computers 102. The computer 102 includes a CPU that performs arithmetic processing and a memory that stores programs and data, and executes processing for realizing a service provided by the computer system 101. Each computer 102 has one or more log generation units 103. Each log generation unit 103 generates, as a log, an execution history of hardware and software constituting each computer 102, an event history such as an executed process and an error that has occurred. The log generated by the log generation unit 103 is recorded inside and outside each computer 102 and the computer system 101. This log recording can be realized, for example, by appropriately writing to a storage device of each computer 102, a storage device in the computer system 101, or a storage device on a network connected to the computer system 101.

ログ解析部105は、ログ生成部103で生成されたログをネットワーク104経由で取得し、ログを解析することで、コンピュータシステム101の異常の発生を検出または予測する。ログ解析部105は、取得したログからコンピュータシステム101の異常の検出または異常発生の予測を行う検出・予測部106と、コンピュータシステムの異常検出結果または異常の予測結果を出力する結果表示部111から構成される。なお、コンピュータシステム101の異常の検出とは、例えば、ハードウェアの停止や誤動作、ソフトウェアの停止や誤動作などの検出であり、異常の予測とは、例えば、ハードウェアリソースの不足(ストレージ装置やメモリの記憶領域の不足)やCPUやネットワークの過負荷、通常とは異なる処理の実行など、コンピュータシステム101の停止や誤動作を引き起こす可能性のある状態を判定するものである。   The log analysis unit 105 acquires the log generated by the log generation unit 103 via the network 104 and analyzes or analyzes the log, thereby detecting or predicting the occurrence of an abnormality in the computer system 101. The log analysis unit 105 detects an abnormality of the computer system 101 from the acquired log or predicts the occurrence of the abnormality, and a result display unit 111 that outputs the abnormality detection result or the abnormality prediction result of the computer system. Composed. The detection of an abnormality of the computer system 101 is, for example, detection of a hardware stop or malfunction, a software stop or malfunction, and the prediction of an abnormality is, for example, a lack of hardware resources (storage device or memory). In such a case, the computer system 101 may be stopped or malfunctioned, such as a storage area shortage), CPU or network overload, or execution of processing different from normal.

さらに、異常検出・予測部106は、ログ収集部107、異常判定部108、結果出力部109から構成される。ログ収集部107は、ネットワーク104を介して、コンピュータシステム101の各計算機102のログ生成部103で生成されたログを収集する。異常判定部108は、ログ収集部107が収集したログから、コンピュータシステム101に異常が発生しているか判定する。異常の発生の判定方法については、上述の非特許文献1や非特許文献2等に記載の公知または周知の方法の他に、異常判定ルールに基づいて判定する方法などがある。ただし、異常の発生の判定方法について、これらに限定するものではない。   Furthermore, the abnormality detection / prediction unit 106 includes a log collection unit 107, an abnormality determination unit 108, and a result output unit 109. The log collection unit 107 collects logs generated by the log generation unit 103 of each computer 102 of the computer system 101 via the network 104. The abnormality determination unit 108 determines whether an abnormality has occurred in the computer system 101 from the logs collected by the log collection unit 107. As a method for determining the occurrence of abnormality, there is a method for determining based on an abnormality determination rule in addition to the known or well-known methods described in Non-Patent Document 1, Non-Patent Document 2, and the like. However, the method for determining the occurrence of abnormality is not limited to these.

異常判定部108の判定結果は、結果出力部109から結果出力パス110を介して結果表示部111に伝達する。結果表示部111は、異常判定結果または異常の予測結果を表示する。   The determination result of the abnormality determination unit 108 is transmitted from the result output unit 109 to the result display unit 111 via the result output path 110. The result display unit 111 displays an abnormality determination result or an abnormality prediction result.

上記図1に示した構成は、コンピュータシステム101の異常の検出・予測を行うログ解析方法に関する、基本的な構成図であるが、本発明が対象とするログ解析方法は、この構成に限定するものではなく、コンピュータシステム101内で生成されたログを解析して異常の発生を検出・予測するすべての方法が対象となる。また、図1に示すログ解析部105は、後述の図20のように計算機で構成される。   The configuration shown in FIG. 1 is a basic configuration diagram relating to a log analysis method for detecting and predicting an abnormality in the computer system 101, but the log analysis method targeted by the present invention is limited to this configuration. Instead, all methods for analyzing and analyzing the log generated in the computer system 101 to detect and predict the occurrence of an abnormality are targeted. The log analysis unit 105 shown in FIG. 1 is configured by a computer as shown in FIG.

図2は、本発明の第1の実施形態による誤報発生時のログを利用した誤報発生の可能性を検出する方法を適用したコンピュータシステムの一例を示すブロック図である。   FIG. 2 is a block diagram showing an example of a computer system to which the method for detecting the possibility of misreporting using the log at the time of misreporting according to the first embodiment of the present invention is applied.

図2において、コンピュータシステム101は、図1に記載のコンピュータシステム101と同じであるが、コンピュータシステム101内に含まれる計算機102、ログ生成部103は図2では省略してある。以下の図でも同様に、コンピュータシステム101には、図1に示したように計算機102、ログ生成部103が含まれるものとする。   2, the computer system 101 is the same as the computer system 101 described in FIG. 1, but the computer 102 and the log generation unit 103 included in the computer system 101 are omitted in FIG. 2. Similarly in the following drawings, it is assumed that the computer system 101 includes the computer 102 and the log generation unit 103 as shown in FIG.

図2において、誤報検出部201は、コンピュータシステム101内で生成されたログを、ネットワーク104を介して取得し、誤報時ログ記憶部202に予め記録されている誤報発生時のログと照合することで、コンピュータシステム101の異常の検出・予測を行う、異常検出・予測部207の解析結果が誤報である可能性を検出する。   In FIG. 2, the misinformation detection unit 201 acquires a log generated in the computer system 101 via the network 104 and collates it with a log at the time of the misreport occurrence recorded in the misinformation log storage unit 202 in advance. Thus, the possibility that the analysis result of the abnormality detection / prediction unit 207 that detects and predicts the abnormality of the computer system 101 is a false alarm is detected.

より具体的には、誤報検出部201は、比較器205を含み、比較器205はネットワーク104から入力されるコンピュータシステム101の現在のログと、誤報時ログ記憶部202から誤報時ログパス203を介して入力される誤報時のログを比較し、両者が一致もしくは類似した場合に誤報検出結果パス204に誤報発生の可能性を出力する。なお、現在のログと誤報時のログの類似は、例えば、現在のログの発生パターンと、誤報時のログの発生パターンを比較して、パターンが一致したときに双方のログが類似していると判定することができる。異常検出・予測部207は、誤報検出結果パス204から誤報発生の可能性に関する情報を得て、誤報の発生を抑止したり、結果表示部111に対して誤報発生の可能性を通知したりする。誤報検出結果の利用方法については、後で実施例を述べる。   More specifically, the false alarm detection unit 201 includes a comparator 205, which compares the current log of the computer system 101 input from the network 104 and the false alarm log storage unit 202 via the false alarm log path 203. The logs at the time of misreporting are compared, and if both match or are similar, the possibility of misreporting is output to the misreport detection result path 204. Note that the similarity between the current log and the log at the time of misreporting is, for example, comparing the occurrence pattern of the current log with the occurrence pattern of the log at the time of misreporting, and both logs are similar when the patterns match. Can be determined. The anomaly detection / prediction unit 207 obtains information on the possibility of occurrence of false alarms from the false alarm detection result path 204 and suppresses the occurrence of false alarms or notifies the result display part 111 of the possibility of misreporting. . An example of how to use the false alarm detection result will be described later.

また、図2に示すログ解析部206は、後述の図20のように複数の計算機で構成することができる。そして、ログ解析部206は、図20のように誤報検出部を実行する計算機と、異常検出・予測部を実行する計算機を独立させても良いし、これら2つの機能を同一の計算機で実行するようにしてもよい。また、比較器205で使用する誤報時のログは、予め設定した誤報のルールを用いてもよい。さらに、誤報時ログ記憶部202は、誤報検出部202を実行する計算機のストレージ装置などに格納しておけばよい。   Also, the log analysis unit 206 shown in FIG. 2 can be composed of a plurality of computers as shown in FIG. Then, the log analysis unit 206 may make the computer that executes the false alarm detection unit and the computer that executes the abnormality detection / prediction unit independent of each other as shown in FIG. 20, or these two functions are executed by the same computer. You may do it. In addition, a misreporting log used in the comparator 205 may use a preset misreporting rule. Further, the misreport log storage unit 202 may be stored in a storage device of a computer that executes the misreport detection unit 202.

図3(A)、(B)は、本発明による図2に示した方法において、誤報発生時のログ(または誤報のルール)と現在のログとの比較方法の具体的な例を示す図である。まず、図3(A)に基づいて誤報時ログ記憶部202に記録する誤報時ログの例303〜306の生成方法について説明する。   FIGS. 3A and 3B are diagrams showing a specific example of a method for comparing a log at the time of occurrence of a false alarm (or a rule for false alarm) and a current log in the method shown in FIG. 2 according to the present invention. is there. First, a method for generating the misreporting log examples 303 to 306 recorded in the misreporting log storage unit 202 will be described with reference to FIG.

正常時のログ301は、コンピュータシステム101が正常に稼動しており、異常検出・予測部207での異常判定結果も誤報とならない場合のログの例である。この例では、ログはタイムスタンプとイベント名の組を1行で示しており、正常時のログ301では9:00:00から9:00:12までにイベントAとイベントBが交互に合計7回発生している場合を示している。一方、誤報発生時のログ302は、コンピュータシステム101は正常に稼動しているが、異常検出・予測部207での異常判定結果では異常の発生を検出もしくは予測された場合のログの例である。つまり、誤報が発生した際のログである。この例では、9:30:00から9:30:12までにイベントA、イベントB、イベントCの3種類のイベントが順次に発生している。   The normal log 301 is an example of a log in a case where the computer system 101 is operating normally and the abnormality determination result in the abnormality detection / prediction unit 207 does not become false information. In this example, the log shows a combination of a time stamp and an event name in one line, and in the normal time log 301, event A and event B are alternated from 9:00 to 9:00:12 in total 7 This shows the case where the error occurred. On the other hand, the log 302 at the time of misreporting is an example of a log when the computer system 101 is operating normally, but the occurrence of abnormality is detected or predicted from the abnormality determination result in the abnormality detection / prediction unit 207. . That is, it is a log when a false alarm occurs. In this example, three types of events, event A, event B, and event C, occur sequentially from 9:30: 00 to 9:30: 12.

誤報時ログ記憶部202には、正常時のログ301と誤報発生時のログ302から、例えば図中(例1)から(例4)に示すような誤報時ログ303〜306が登録される。   In the misreporting log storage unit 202, misreporting logs 303 to 306 as shown in (Example 1) to (Example 4) in the figure are registered from the normal log 301 and the misreporting log 302, for example.

(例1)誤報時ログ303は、特定の時刻におけるイベントCのログが誤報を発生させるログであることを示している。図3(A)の例では、毎時30分に起こるイベントCが誤報発生の原因である場合、XX=*(任意)、YY=30、ZZ=*(任意)として登録する。なお、XXは「時」を示し、YYは「分」を示し、「ZZ」は秒を示す。   (Example 1) The misreporting log 303 indicates that the log of the event C at a specific time is a log that causes misreporting. In the example of FIG. 3A, when the event C occurring at 30 minutes per hour is the cause of the false alarm, it is registered as XX = * (arbitrary), YY = 30, and ZZ = * (arbitrary). XX indicates “hour”, YY indicates “minute”, and “ZZ” indicates second.

(例2)誤報時ログ304は、4秒間隔でイベントCが発生すると誤報が発生する場合の登録方法である。   (Example 2) The misreporting log 304 is a registration method when a misreport occurs when an event C occurs at intervals of 4 seconds.

(例3)誤報時ログ305は、イベントA、イベントB、イベントCが順番に、それぞれの時間間隔が、イベントAの2秒後にイベントB、イベントBの1秒後にイベントCの場合にイベントCがあることによって誤報が発生する場合の登録方法である。図3(A)で記号#は、#のついたイベントが誤報を発生させる原因となっていることを示している。   (Example 3) The false alarm time log 305 indicates that the event A, the event B, and the event C are in order, and the time interval is the event C when the event B is 2 seconds after the event A and the event C is 1 second after the event B. This is a registration method when misinformation occurs due to In FIG. 3A, the symbol # indicates that an event with a # causes a false alarm.

(例4)誤報時ログ306は、時刻ではなく、ログに含まれるイベントA、イベントB、イベントCの比が、1:1:1の時に誤報が発生することを示している。ここで、各イベントの比は、例えば、各イベントA〜Cの出現頻度の比などとすればよい。   (Example 4) The misreporting log 306 indicates that a misreporting occurs when the ratio of event A, event B, and event C included in the log is not 1: 1, but 1: 1: 1. Here, the ratio of the events may be, for example, the ratio of the appearance frequencies of the events A to C.

次に、誤報検出部201での誤報検出方法の具体的な例について図3Bで説明する。ネットワーク104から入力される現在のログ307は、図3(B)において、10:20:30から10:20:38までのログで、7つのイベントを含んでいる。一方、誤報時ログ記憶部202から誤報時ログパス203を介して入力される誤報時ログ304は、イベントCが4秒間隔で発生したときに、誤報が発生することを示している。誤報検出部201では、誤報検出時ログ308に示すように、現在のログの中から4秒間隔で並ぶイベントCのログを比較器205によって検出して、10:20:33と10:20:37に誤報の発生可能性204を異常検出・予測部207へ出力する。誤報の発生可能性204を受信した異常検出・予測部207では、当該ログの無効化を行ってからログ解析を行って、コンピュータシステム101の異常の検出及び予測を行うことで、検出精度及び予測精度を向上させることができる。   Next, a specific example of a false alarm detection method in the false alarm detection unit 201 will be described with reference to FIG. 3B. The current log 307 input from the network 104 is a log from 10:20:30 to 10:20:38 in FIG. 3B and includes seven events. On the other hand, the misreporting log 304 input from the misreporting log storage unit 202 via the misreporting log path 203 indicates that a misreporting occurs when the event C occurs at intervals of 4 seconds. In the misreport detection unit 201, as shown in the misreport detection time log 308, the log of event C arranged at intervals of 4 seconds from the current log is detected by the comparator 205, and 10:20:33 and 10:20: 37, the possibility of occurrence of false alarm 204 is output to the abnormality detection / prediction unit 207. The abnormality detection / prediction unit 207 that has received the possibility of occurrence of misinformation 204 performs log analysis after invalidating the log, and detects and predicts the abnormality of the computer system 101, thereby detecting accuracy and prediction. Accuracy can be improved.

なお、図3(A),(B)に示した誤報時ログの例や誤報検出時ログなどは、一例を示したにすぎない。例えば、誤報時ログ記憶部202には、誤報が発生したときのログをそのまま登録するなどの方法も考えられる。   The examples of the misreporting log and the misreporting detection log shown in FIGS. 3A and 3B are merely examples. For example, a method of registering a log when a misreport occurs as it is in the misreport log storage unit 202 may be considered.

図4は、ログ解析部206で行われる処理の一例を示すフローチャートである。   FIG. 4 is a flowchart illustrating an example of processing performed by the log analysis unit 206.

最初にコンピュータシステム101から誤報検出部201でログを受信する(ステップ2302)。誤報検出部201は誤報時ログ記憶部202に記録されている誤報時ログと、ステップ2302で受信したログを比較して、誤報の発生可能性を検出する(ステップ2303)。   First, the error detection unit 201 receives a log from the computer system 101 (step 2302). The false alarm detection unit 201 compares the false alarm log recorded in the false alarm log storage unit 202 with the log received in step 2302 to detect the possibility of the false alarm (step 2303).

誤報の発生可能性の検出の有無によって処理が分岐する(ステップ2304)。誤報の発生可能性を検出しなかった場合は、異常検出・予測部207はログ収集部107でコンピュータシステム101からログを受信する(ステップ2305)。次に、異常検出・予測部207は異常判定部108で異常の発生の検出・予測を行う(ステップ2306)。異常検出・予測部207は結果出力部109で異常の発生の検出・予測結果を送信する(ステップ2307)。そして結果表示部111で異常の発生の検出・予測結果を表示する(ステップ2308)。   Processing branches depending on whether or not the possibility of occurrence of a false alarm has been detected (step 2304). When the possibility of occurrence of false alarms is not detected, the abnormality detection / prediction unit 207 receives a log from the computer system 101 by the log collection unit 107 (step 2305). Next, the abnormality detection / prediction unit 207 detects and predicts the occurrence of abnormality in the abnormality determination unit 108 (step 2306). The abnormality detection / prediction unit 207 transmits the detection / prediction result of occurrence of abnormality in the result output unit 109 (step 2307). Then, the detection / prediction result of occurrence of abnormality is displayed on the result display unit 111 (step 2308).

一方、ステップ2304の判定で誤報の発生可能性を検出した場合、ステップ2304に続いてステップ2309が実行される。つまり、異常検出・予測部207に誤報検出部201は誤報検出結果204を送信する(ステップ2309)。異常検出・予測部207は、誤報検出結果に応じて異常判定結果の出力の無効化や、処理の停止などを行う(ステップ2310)。以上の処理フローによって、誤報検出部201を利用した誤報の発生の低減が実現される。これにより、異常検出の精度と異常予測の精度を高めることが可能となる。   On the other hand, if it is determined in step 2304 that the possibility of misreporting has been detected, step 2309 is executed following step 2304. That is, the false alarm detection unit 201 transmits the false alarm detection result 204 to the abnormality detection / prediction unit 207 (step 2309). The abnormality detection / prediction unit 207 invalidates the output of the abnormality determination result, stops the processing, or the like according to the false alarm detection result (step 2310). With the above processing flow, it is possible to reduce the occurrence of false alarms using the false alarm detection unit 201. Thereby, it is possible to improve the accuracy of abnormality detection and the accuracy of abnormality prediction.

図5は、本発明による誤報発生条件を利用した誤報発生の可能性を検出する方法を適用したコンピュータシステムのブロック図である。上記図2に示した誤報検出方法とは別の方法であるが、図2と図5に示した方法を同時に利用することもできる。図2に示した方法との主な違いは、誤報検出部401と誤報検出部401への入力の1つである誤報発生条件記憶部402である。   FIG. 5 is a block diagram of a computer system to which the method for detecting the possibility of occurrence of false alarms using the false alarm occurrence conditions according to the present invention is applied. Although this is a different method from the false alarm detection method shown in FIG. 2, the methods shown in FIGS. 2 and 5 can be used simultaneously. The main difference from the method shown in FIG. 2 is an error report detection unit 401 and an error report occurrence condition storage unit 402 which is one of the inputs to the error report detection unit 401.

図5において、誤報検出部401は、コンピュータシステム101内で生成されたログを、ネットワーク104を介して取得し、誤報発生条件記憶部402に記録されている誤報条件と照合することで、コンピュータシステム101の異常の検出・予測を行う。より具体的には、誤報検出部401は、比較器408を含み、比較器408はネットワーク104から入力されるコンピュータシステム101の現在のログと、誤報発生条件記憶部402から誤報発生条件パス403を介して誤報発生条件を入力とする。ただし、現在のログについては、比較器入力パス407を介して比較器408へ入力する経路上にログ入力スイッチ406があり、誤報発生条件に含まれる誤報発生周期に関する情報によって、比較器408に現在のログ104を入力するか、しないかを選択できる。   In FIG. 5, the misinformation detection unit 401 obtains a log generated in the computer system 101 via the network 104 and collates it with the misreporting conditions recorded in the misreporting condition storage unit 402, so that the computer system 101 abnormality detection / prediction is performed. More specifically, the false alarm detection unit 401 includes a comparator 408, which compares the current log of the computer system 101 input from the network 104 and the false alarm occurrence condition path 403 from the false alarm occurrence condition storage unit 402. The conditions for generating false alarms are input. However, for the current log, there is a log input switch 406 on the path to be input to the comparator 408 via the comparator input path 407, and the comparator 408 is currently informed by information on the false alarm occurrence period included in the false alarm occurrence condition. Log 104 can be input or not.

誤報発生周期とは、例えば1日の中で午前0時から午前1時の間がコンピュータシステムの定期保守時間となっている場合、この1時間を除いた時間についてのみ、誤報検出を行いたい場合などに設定して利用する。これによって、誤報の発生可能性を検出する必要がない場合に、検出をしないようにすることができる。図5のその他の部分については、図2と同様の処理である。   The false alarm occurrence period is, for example, when the computer system's regular maintenance time is between midnight and 1:00 am in the day, and when it is desired to detect false alarms only for the time other than this one hour. Set and use. As a result, when it is not necessary to detect the possibility of occurrence of a false alarm, it is possible to prevent detection. The other parts in FIG. 5 are the same as those in FIG.

図6(A)、(B)は、本発明による図5に示した方法において、誤報発生条件と現在のログとの比較方法の具体的な例を示す図である。まず、誤報発生条件記憶部402に記録する誤報発生条件の例503〜506の生成方法について図6(A)を参照しながら説明する。定期的に発生するログ501は、毎時00分にだけイベントCが発生する例を示している。一定時間だけ発生するログ502は、午前0時から午前1時の間だけイベントCが発生する例を示している。いずれの例でも、イベントCは限られた回数もしくは時間帯にのみ発生するので、非特許文献1や非特許文献2に記載されているような、通常時のログと現在のログを比較して、その乖離が大きい場合に異常の発生を検出・予測するような手法では、イベントCによって異常の発生が検出されたり予測されたりすることが起こりえる。しかし、定期的に発生するログ501のような毎時00分にだけ発生するようなイベントは、例えば定期的なデータのバックアップや、キャッシュのクリアなどでよく見られるケースであるし、一定時間だけ発生するログ502も、例えば、毎晩実行される定期保守や、毎朝・毎夕実行される起動・終了処理などよく見られるケースである。このように、実際には異常は発生していないものの、ログ解析による異常の発生の検出・予測では異常と判定される可能性がある条件を記録しておくのが、誤報発生条件記憶部402である。   FIGS. 6A and 6B are diagrams showing a specific example of a method of comparing a false alarm occurrence condition and a current log in the method shown in FIG. 5 according to the present invention. First, a method of generating examples 503 to 506 of the false alarm occurrence conditions recorded in the false alarm occurrence condition storage unit 402 will be described with reference to FIG. A periodically generated log 501 shows an example in which an event C occurs only every hour at 00 minutes. A log 502 generated only for a predetermined time shows an example in which an event C occurs only between midnight and 1 am. In any example, since the event C occurs only in a limited number of times or time zones, the normal log and the current log as described in Non-Patent Document 1 and Non-Patent Document 2 are compared. In the method of detecting and predicting the occurrence of an abnormality when the deviation is large, the occurrence of the abnormality may be detected or predicted by the event C. However, events that occur only at the hour of the hour, such as the log 501 that occurs regularly, are often seen when, for example, periodic data backup or cache clearing occurs, and occur only for a certain period of time. The log 502 to be executed is also a common case such as periodic maintenance executed every night and start / end processing executed every morning / evening. In this way, although an abnormality does not actually occur, a condition that may be determined to be abnormal in the detection / prediction of the occurrence of abnormality by log analysis is recorded. It is.

(例1)誤報発生条件503は、特定の時刻に発生するイベントCを誤報発生条件として登録する例である。   (Example 1) The false alarm occurrence condition 503 is an example in which an event C that occurs at a specific time is registered as an erroneous alarm occurrence condition.

(例2)誤報発生条件504は、イベントBの前後で発生するイベントCを誤報発生条件として登録する例である。   (Example 2) The false alarm occurrence condition 504 is an example in which the event C that occurs before and after the event B is registered as the false alarm occurrence condition.

(例3)誤報発生条件505は、特定の時間帯(ここでは1時間)のイベントCを誤報発生条件として登録する例である。   (Example 3) The false alarm occurrence condition 505 is an example in which an event C in a specific time zone (here, 1 hour) is registered as an erroneous alarm occurrence condition.

(例4)誤報発生条件506は、イベントAに対してイベントCの発生回数が1%未満ならばイベントCが誤報を発生させる可能性があることを誤報発生条件として登録する例である。   (Example 4) The false alarm generation condition 506 is an example of registering, as an erroneous alarm generation condition, that an event C may generate an erroneous alarm if the number of occurrences of the event C with respect to the event A is less than 1%.

図6(A)で示す記号#は、#のついたイベントが誤報を発生させる原因となっていることを示している。次に、誤報検出部401での誤報検出方法の具体的な例について図6(B)で説明する。   A symbol # shown in FIG. 6A indicates that an event with # causes a false alarm. Next, a specific example of a false alarm detection method in the false alarm detection unit 401 will be described with reference to FIG.

ネットワーク104から入力される現在のログ507は、23:59:59から00:00:05までのログで、7つのイベントを含んでいる。一方、誤報発生条件記憶部402から誤報発生条件パス403を介して入力される誤報発生条件508は、午前0時から午前1時の時間帯に発生するイベントCは誤報を発生させる可能性があることを示している。逆にこの時間帯以外は、誤報の発生検出を行わなくても良いことになる。そこで、誤報発生周期パス405を介して、ログ入力スイッチ406を午前0時から午前1時までの間だけログを通す状態にする。すると誤報検出部401に入力される、選択されたログ509は6つのイベントだけになる。誤報検出部401では、誤報発生条件508に誤報を発生させる可能性のあるイベントとして登録されているイベントCを検出する。誤報検出部401は、誤報の発生可能性404を異常検出・予測部410へ出力する。誤報の発生可能性404を受信した異常検出・予測部410では、当該ログの無効化を行ってからログ解析を行って、コンピュータシステム101の異常の検出及び予測を行うことで、検出精度及び予測精度を向上させることができる。   A current log 507 input from the network 104 is a log from 23:59:59 to 00:00:05, and includes seven events. On the other hand, according to the false alarm occurrence condition 508 input from the false alarm occurrence condition storage unit 402 via the false alarm occurrence condition path 403, an event C that occurs in the time zone from midnight to 1:00 am may cause false alarms. It is shown that. Conversely, it is not necessary to detect the occurrence of false alarms outside of this time period. Therefore, the log input switch 406 is set to pass the log only from 0:00 am to 1:00 am through the false alarm generation cycle path 405. Then, the selected log 509 input to the false alarm detection unit 401 has only six events. The false alarm detection unit 401 detects an event C registered as an event that may cause a false alarm in the false alarm occurrence condition 508. The false alarm detection unit 401 outputs the misreporting possibility 404 to the abnormality detection / prediction unit 410. The abnormality detection / prediction unit 410 that has received the possibility of occurrence of false alarm 404 performs log analysis after invalidating the log, and detects and predicts abnormality of the computer system 101, thereby detecting accuracy and prediction. Accuracy can be improved.

なお、ログ入力スイッチ406を省略し、誤報検出部401で午前0時から午前1時までの間のログだけを誤報検出する方法でもよい。   Alternatively, the log input switch 406 may be omitted, and the misreport detection unit 401 may detect only the log between midnight and 1:00 am.

図7は、ログ解析部409で行われる処理の一例を示すフローチャートである。   FIG. 7 is a flowchart illustrating an example of processing performed by the log analysis unit 409.

最初にコンピュータシステム101から誤報検出部401でログを受信する(ステップ2402)。誤報検出部401は誤報発生条件記憶部402に記録されている誤報発生条件(誤報発生周期)と、ステップ2402で受信したログを比較して、誤報の発生可能性を検出する(ステップ2403)。受信したログが誤報発生条件403に合致していればステップ2404へ進み、合致していなければステップ2406に進む。   First, the error detection unit 401 receives a log from the computer system 101 (step 2402). The false alarm detection unit 401 compares the false alarm occurrence condition (false alarm occurrence cycle) recorded in the false alarm occurrence condition storage unit 402 with the log received in step 2402, and detects the possibility of misreporting (step 2403). If the received log matches the false alarm occurrence condition 403, the process proceeds to step 2404. If not, the process proceeds to step 2406.

誤報の発生可能性を検出しなかった場合は、異常検出・予測部410はログ収集部107でコンピュータシステム101からログを受信する(ステップ2406)。次に、異常検出・予測部410は異常判定部108で異常の発生の検出・予測を行う(ステップ2407)。異常検出・予測部410は結果出力部109で異常の発生の検出・予測結果を送信する(ステップ2408)。そして結果表示部111で異常の発生の検出・予測結果を表示する(ステップ2409)。   When the possibility of occurrence of the false alarm is not detected, the abnormality detection / prediction unit 410 receives the log from the computer system 101 by the log collection unit 107 (step 2406). Next, the abnormality detection / prediction unit 410 detects and predicts the occurrence of abnormality in the abnormality determination unit 108 (step 2407). The abnormality detection / prediction unit 410 transmits the detection / prediction result of occurrence of abnormality in the result output unit 109 (step 2408). Then, the result display unit 111 displays the detection / prediction result of occurrence of abnormality (step 2409).

一方、ステップ2403の判定で誤報の発生可能性を検出した場合、ステップ2403に続いてステップ2404が実行される。ステップ2404では、誤報検出部401が誤報発生条件記憶部402に記録されている誤報発生条件(誤報発生周期)と、ステップ2402で受信したログを比較して、誤報の発生可能性を検出する。誤報の発生可能性があればステップ2410ヘ進み、そうでなければステップ2406へ進む。   On the other hand, if it is determined in step 2403 that the possibility of false alarms is detected, step 2404 is executed following step 2403. In step 2404, the false alarm detection unit 401 compares the false alarm occurrence condition (false alarm occurrence period) recorded in the false alarm occurrence condition storage unit 402 with the log received in step 2402, and detects the possibility of misreporting. If there is a possibility that a false alarm will occur, the process proceeds to step 2410; otherwise, the process proceeds to step 2406.

ステップ2410では、誤報検出部401が異常検出・予測部410に誤報検出結果404を送信する(ステップ2410)。異常検出・予測部410は、誤報検出結果に応じて異常判定結果の出力の無効化や、処理の停止などを行う(ステップ2411)。以上の処理フローによって、誤報検出部401を利用した誤報の発生の低減が実現される。これにより、異常検出の精度と異常予測の精度を高めることが可能となる。   In step 2410, the false alarm detection unit 401 transmits the false alarm detection result 404 to the abnormality detection / prediction unit 410 (step 2410). The abnormality detection / prediction unit 410 invalidates the output of the abnormality determination result, stops the processing, or the like according to the false alarm detection result (step 2411). With the above processing flow, it is possible to reduce the occurrence of false alarms using the false alarm detection unit 401. Thereby, it is possible to improve the accuracy of abnormality detection and the accuracy of abnormality prediction.

図8は誤報発生可能性を検出した際に異常検出・予測処理を無効化する方法を適用したコンピュータシステムを示すブロック図である。図8で誤報検出部601は、図2の誤報検出部201や図5の誤報検出部401と同じ方法で誤報の発生可能性を検出する。また、誤報時ログ・誤報発生条件記憶部602も、図2の誤報時ログ記憶部202や図5の誤報発生条件記憶部402を併せたもので、誤報時のログと誤報発生条件を格納したものである。なお、誤報時のログと誤報発生条件は、誤報検出のルールとすることができる。   FIG. 8 is a block diagram showing a computer system to which a method for invalidating abnormality detection / prediction processing when the possibility of occurrence of false alarms is detected is applied. In FIG. 8, a false alarm detection unit 601 detects the possibility of false alarms by the same method as the false alarm detection unit 201 of FIG. 2 and the false alarm detection unit 401 of FIG. Further, the misreporting log / misreporting condition storage unit 602 is also a combination of the misreporting log storage unit 202 of FIG. 2 and the misreporting condition storage unit 402 of FIG. 5, and stores the misreporting log and misreporting conditions. Is. The log at the time of misreporting and the condition for generating misreports can be a rule for detecting misreports.

誤報検出部601で誤報の発生可能性が検出されると、誤報検出結果パス604を介して異常検出・予測部613に含まれる制御部605に誤報検出結果が通知される。制御部605は、異常検出・予測部613のログ収集部107、異常判定部108、結果出力部109のすべてもしくは一部に対して誤報検出結果に基づいて処理の中止や処理結果の無効化を行う。誤報の発生可能性が検出された場合、制御部605はログ収集部107に対して、例えば、ログの収集処理の中止や収集してあるログの廃棄を指示する。また、制御部605は異常判定部108に対して、例えば、異常判定結果の無効化を指示する。制御部605は結果出力部109に対して、出力しようとする結果が、異常が発生したと検出もしくは予測を示している場合、例えばそれを無効化する。以上のような方法で、誤報の発生可能性が検出された場合に、異常検出・予測部613が異常の発生と検出もしくは予測していたとしても、結果表示部においては、異常の発生を検出もしくは予測したとは表示されず、誤報の発生を抑止することができる。誤報検出結果パス604を介して誤報検出部601から制御部605に通知される誤報検出結果609については、ある時点に誤報の発生の可能性が検出されたと通知する方法の他に、図8に示した誤報検出結果(例1)610のように、ある時点から1時間の間、異常検出・予測部613での異常判定処理をストップする指示を通知してもよい。また、誤報検出結果(例2)611のように、ある時点から1時間の間、異常検出・予測部613で判定した異常度を半減させる支持を通知することで、異常検出・予測の感度を低くし、誤報の発生を低減する方法なども含まれる。   When the misreport detection unit 601 detects the possibility of misreporting, the misreport detection result is notified to the control unit 605 included in the abnormality detection / prediction unit 613 via the misreport detection result path 604. The control unit 605 cancels the processing or invalidates the processing result based on the false alarm detection result for all or a part of the log collection unit 107, the abnormality determination unit 108, and the result output unit 109 of the abnormality detection / prediction unit 613. Do. When the possibility of occurrence of a false alarm is detected, the control unit 605 instructs the log collection unit 107 to, for example, stop the log collection process or discard the collected log. In addition, the control unit 605 instructs the abnormality determination unit 108 to invalidate the abnormality determination result, for example. If the result to be output indicates detection or prediction that an abnormality has occurred, the control unit 605 invalidates the result output unit 109, for example. Even if the abnormality detection / prediction unit 613 detects or predicts the occurrence of an abnormality when the possibility of occurrence of a false alarm is detected by the above method, the result display unit detects the occurrence of the abnormality. Or, it is not displayed as predicted, and the occurrence of false alarms can be suppressed. In addition to the method of notifying that the possibility of the occurrence of a false alarm is detected at a certain time, the false alarm detection result 609 notified from the false alarm detector 601 to the controller 605 via the false alarm detection result path 604 is shown in FIG. An instruction to stop the abnormality determination process in the abnormality detection / prediction unit 613 may be notified for one hour from a certain time point, as shown in the false alarm detection result (example 1) 610 shown. In addition, as in the false alarm detection result (example 2) 611, for one hour from a certain point in time, notification of support for halving the degree of abnormality determined by the abnormality detection / prediction unit 613 increases the sensitivity of abnormality detection / prediction. A method of reducing the occurrence of false alarms is also included.

図9は図8に示した方法において、誤報発生可能性を検出した際に異常検出・予測処理を無効化する方法を示す処理フローである。最初にコンピュータシステム101から誤報検出部601でログを受信する(ステップ702)。誤報検出部601は誤報時ログ・誤報発生条件記憶部602に記録されている誤報時ログ・誤報発生条件と、ステップ702で受信したログを比較して、誤報の発生可能性を検出する(ステップ703)。誤報の発生可能性の検出の有無によって処理が分岐する(ステップ704)。誤報の発生可能性を検出しなかった場合は、異常検出・予測部613はログ収集部107でコンピュータシステムからログを受信する(ステップ705)。   FIG. 9 is a process flow showing a method of invalidating the abnormality detection / prediction process when the possibility of occurrence of false alarms is detected in the method shown in FIG. First, the error detection unit 601 receives a log from the computer system 101 (step 702). The false alarm detection unit 601 compares the false alarm log / false alarm occurrence condition recorded in the false alarm log / false alarm generation condition storage unit 602 with the log received in step 702 to detect the possibility of misreporting (step 702). 703). Processing branches depending on whether or not the possibility of occurrence of a false alarm has been detected (step 704). When the possibility of occurrence of the false alarm is not detected, the abnormality detection / prediction unit 613 receives a log from the computer system by the log collection unit 107 (step 705).

次に、異常検出・予測部613は異常判定部108で異常の発生の検出・予測を行う(ステップ706)。異常検出・予測部613は結果出力部109で異常の発生の検出・予測結果を送信する(ステップ707)。そして結果表示部111で異常の発生の検出・予測結果を表示する(ステップ708)。誤報の発生可能性を検出した場合、ステップ704に続いてステップ709が実行される。つまり、異常検出・予測部613に誤報検出部601は誤報検出結果を送信する(ステップ709)。異常検出・予測部613の制御部605は、誤報検出結果に応じて異常判定結果の出力の無効化や、処理の停止などを行う(ステップ710)。以上の処理フローによって、誤報検出部601を利用した誤報の発生の低減が実現される。   Next, the abnormality detection / prediction unit 613 detects and predicts the occurrence of abnormality in the abnormality determination unit 108 (step 706). The abnormality detection / prediction unit 613 transmits the detection / prediction result of occurrence of abnormality in the result output unit 109 (step 707). Then, the result display unit 111 displays the detection / prediction result of occurrence of abnormality (step 708). If the possibility of occurrence of a false alarm is detected, step 709 is executed following step 704. That is, the false alarm detection unit 601 transmits the false alarm detection result to the abnormality detection / prediction unit 613 (step 709). The control unit 605 of the abnormality detection / prediction unit 613 invalidates the output of the abnormality determination result, stops the processing, or the like according to the erroneous report detection result (step 710). With the above processing flow, reduction of the occurrence of false alarms using the false alarm detector 601 is realized.

図10は誤報発生可能性を検出した際に誤報発生を起す可能性のあるログを削除する方法を適用したコンピュータシステムを示すブロック図である。   FIG. 10 is a block diagram showing a computer system to which a method of deleting a log that may cause a false alarm when a possibility of a false alarm is detected is applied.

図10は、図8で示した方法と目的は同じであるが、別の方法で目的を達成する方法である。図10で誤報検出部801は、図2の誤報検出部201や図5の誤報検出部401と同じ方法で誤報の発生可能性を検知し、誤報時ログ・誤報発生条件記憶部802も、図2の誤報時ログ記憶部202や図5の誤報発生条件記憶部402と同じ方法で誤報時のログや誤報発生条件を格納したものである。   FIG. 10 is a method for achieving the object by another method, although the object is the same as that shown in FIG. In FIG. 10, the false alarm detection unit 801 detects the possibility of false alarms in the same manner as the false alarm detection unit 201 of FIG. 2 and the false alarm detection unit 401 of FIG. 5, and the false alarm log / false alarm occurrence condition storage unit 802 is also shown in FIG. 2 is stored in the same manner as the error report log storage unit 202 in FIG. 2 and the error report generation condition storage unit 402 in FIG. 5.

誤報検出部801で誤報の発生可能性が検出されると、誤報検出結果パス805を介してログ修正部804に誤報検出結果が通知される。ログ修正部804は、ネットワーク104を介してコンピュータシステム101内で生成されたログを受信するが、誤報検出結果に基づいてログの修正や削除を行う。例えば、ログに含まれる特定のイベントが誤報を発生する原因であることが、誤報時ログ・誤報発生条件記憶部802に記録されており、そのログの発生を誤報検出部801が検出した場合、誤報検出部801はそのログの削除をログ修正部804に対して指示し、ログ修正部804は該当するログの削除を実行する。修正後のログは異常検出・予測部807のログ収集部107に送信される。これにより、異常検出・予測部807では誤報を発生することがなくなり、異常検出の精度と異常予測の精度を高めることが可能となる。   When the misreport detection unit 801 detects the possibility of misreporting, the miscorrection detection result is notified to the log correction unit 804 via the misreport detection result path 805. The log correction unit 804 receives the log generated in the computer system 101 via the network 104, and corrects or deletes the log based on the false alarm detection result. For example, the fact that a specific event included in a log is a cause of generating a false alarm is recorded in the false alarm log / false alarm occurrence condition storage unit 802, and when the erroneous alarm detection unit 801 detects the occurrence of the log, The false alarm detection unit 801 instructs the log correction unit 804 to delete the log, and the log correction unit 804 executes deletion of the corresponding log. The corrected log is transmitted to the log collection unit 107 of the abnormality detection / prediction unit 807. As a result, the abnormality detection / prediction unit 807 does not generate a false alarm, and it is possible to improve the accuracy of abnormality detection and the accuracy of abnormality prediction.

図10では、ログ収集部107はコンピュータシステム101からネットワーク104を介して直接ログを受信できるパスと、ログ修正部804から修正後のログを受信できるパスの2つのパスが1つのパスにまとめて記載されているが、これは2つのパス別々でも問題なく、さらに、ログ修正部804からの修正後のログを受信するパスだけでも良い。異常検出・予測部807および結果表示部111の処理方法については、図2や図5に示した方法と同じである。以上のような方法で、誤報の発生可能性が検出された場合に、ログ修正部804によって、誤報を発生する可能性のあるログを修正・削除できるため、誤報の発生を抑止することができる。   In FIG. 10, the log collection unit 107 combines two paths, that is, a path that can directly receive a log from the computer system 101 via the network 104 and a path that can receive a corrected log from the log correction unit 804. Although described, there is no problem even if the two paths are separate, and only the path for receiving the corrected log from the log correcting unit 804 may be used. The processing methods of the abnormality detection / prediction unit 807 and the result display unit 111 are the same as the methods shown in FIGS. When the possibility of misreporting is detected by the method as described above, the log correcting unit 804 can correct / delete logs that may cause misreporting, so that the occurrence of misreporting can be suppressed. .

図11は図10に示した方法において、誤報発生可能性を検出した際に誤報発生を起す可能性のあるログを削除する方法を示す処理フローである。最初にコンピュータシステム101から誤報検出部801でログを受信する(ステップ902)。誤報検出部801は誤報時ログ・誤報発生条件記憶部802に記録されている誤報時ログ・誤報発生条件と、ステップ902で受信したログを比較して、誤報の発生可能性を検出する(ステップ903)。   FIG. 11 is a processing flow showing a method of deleting a log that may cause a false alarm when the possibility of a false alarm is detected in the method shown in FIG. First, the error detection unit 801 receives a log from the computer system 101 (step 902). The false alarm detection unit 801 compares the false alarm log / false alarm occurrence condition recorded in the false alarm log / false alarm occurrence condition storage unit 802 with the log received in step 902 to detect the possibility of the false alarm (step 903).

誤報の発生可能性の検出の有無によって処理が分岐する(ステップ904)。誤報の発生可能性を検出しなかった場合は、異常検出・予測部807はログ収集部107でコンピュータシステムからログを受信する(ステップ905)。ステップ905では、ログ修正部804からログを受信しても良い。なぜならば、ステップ905は、誤報の発生可能性を検出しなかった場合であるので、ログ修正部804からログを受信しても、ネットワーク104を介して直接コンピュータシステム101からログを受信しても、ログに相違がないからである。次に、異常検出・予測部807は異常判定部108で異常の発生の検出・予測を行う(ステップ906)。異常検出・予測部807は結果出力部109で異常の発生の検出・予測結果を送信する(ステップ907)。そして結果表示部111で異常の発生の検出・予測結果を表示する(ステップ908)。   The process branches depending on whether or not a possibility of occurrence of a false alarm is detected (step 904). When the possibility of occurrence of false alarms is not detected, the abnormality detection / prediction unit 807 receives a log from the computer system by the log collection unit 107 (step 905). In step 905, a log may be received from the log correction unit 804. This is because step 905 is a case where the possibility of occurrence of false alarms has not been detected. Therefore, even if a log is received from the log correction unit 804 or a log is directly received from the computer system 101 via the network 104. This is because there is no difference in the logs. Next, the abnormality detection / prediction unit 807 detects and predicts the occurrence of abnormality in the abnormality determination unit 108 (step 906). The abnormality detection / prediction unit 807 transmits the detection / prediction result of occurrence of abnormality in the result output unit 109 (step 907). Then, the result display unit 111 displays the detection / prediction result of occurrence of abnormality (step 908).

誤報の発生可能性を検出した場合、ステップ904に続いてステップ909が実行される。つまり、ログ修正部804に誤報検出部601は誤報検出結果を送信する(ステップ909)。ログ修正部804はコンピュータシステム101からログを受信し、誤報検出結果に応じてログを修正・削除する(ステップ910)。異常検出・予測部807のログ収集部107は、ログ修正部804からログを受信する(ステップ911)。ステップ911では、ネットワーク104を介してコンピュータシステム101からもログを受信してよい。続いてステップ912からステップ914で異常検出予測部807と結果表示部111は、異常の発生の検出・予測を行い、結果を表示する。ステップ912からステップ914は、ステップ906からステップ908と同じである。   If the possibility of occurrence of false alarms is detected, step 909 is executed following step 904. That is, the false alarm detection unit 601 transmits the false alarm detection result to the log correction unit 804 (step 909). The log correcting unit 804 receives the log from the computer system 101, and corrects and deletes the log according to the false alarm detection result (step 910). The log collection unit 107 of the abnormality detection / prediction unit 807 receives the log from the log correction unit 804 (step 911). In step 911, the log may also be received from the computer system 101 via the network 104. Subsequently, in step 912 to step 914, the abnormality detection prediction unit 807 and the result display unit 111 detect and predict the occurrence of the abnormality and display the result. Steps 912 to 914 are the same as steps 906 to 908.

以上の処理フローによって、誤報検出部801とログ修正部804を利用した誤報の発生の低減が実現される。   With the above processing flow, it is possible to reduce the occurrence of false alarms using the false alarm detection unit 801 and the log correction unit 804.

図12は誤報発生可能性を検出した際に誤報発生を起す可能性のあるログに印をつけて、異常検出・予測処理を変更する方法を適用したコンピュータシステムの一例を示すブロック図である。図12は、図10で示した方法と目的は同じであるが、別の方法で目的を達成する方法である。   FIG. 12 is a block diagram illustrating an example of a computer system to which a method of marking a log that may cause a misreport when a misreport occurrence possibility is detected and changing the abnormality detection / prediction process is applied. FIG. 12 is a method for achieving the object by another method, although the object is the same as that shown in FIG.

図12で誤報検出部1001は、図2の誤報検出部201や図5の誤報検出部401と同じ方法で、誤報時ログ・誤報発生条件記憶部1002も、図2の誤報時ログ記憶部202や図5の誤報発生条件記憶部402と同じ方法である。誤報検出部1001で誤報の発生可能性が検出されると、誤報検出結果パス1005を介してログ修正部1004に誤報検出結果が通知される。   12, the false alarm detection unit 1001 is the same method as the false alarm detection unit 201 of FIG. 2 and the false alarm detection unit 401 of FIG. 5, and the false alarm log / false alarm occurrence condition storage unit 1002 is also the erroneous alarm log storage unit 202 of FIG. And the same method as the false alarm occurrence condition storage unit 402 of FIG. When the misreport detection unit 1001 detects the possibility of misreporting, the log correction unit 1004 is notified of the misreport detection result via the misreport detection result path 1005.

ログ修正部1004は、ネットワーク104を介してコンピュータシステム101内で生成されたログを受信するが、誤報検出結果に基づいてログに印を付ける。例えば、ある時間帯のログが誤報を発生させる可能性が高い場合、誤報検出部1001はその時間帯に入ったことを検出し、誤報検出部1001はそのログに印を付けることをログ修正部1004に対して指示し、ログ修正部1004は該当するログに印を付ける。印は1種類である必要はなく、複数種類の印でも良い。   The log correction unit 1004 receives the log generated in the computer system 101 via the network 104, but marks the log based on the false alarm detection result. For example, if there is a high possibility that a log of a certain time zone will generate a false alarm, the false alarm detector 1001 detects that the time zone has been entered, and the log corrector detects that the misreport detector 1001 marks the log. Instructed to 1004, the log correcting unit 1004 marks the corresponding log. The mark need not be one type, and may be a plurality of types.

ログ修正部1004で修正後のログはログスイッチ1007に送信される。ログスイッチ1007は、ログに印が付いているか、いないかによって異常検出・予測部1010に含まれる複数のログ収集部107のいずれにログを転送するかを決定する。ログに付加した印に応じてどのログ収集部107に転送するかを決めるために、誤報検出部1001は誤報検出結果パス1006を介してログスイッチ1007に印と転送先のログ収集部107の関係について情報を送信する。これにより、異常検出・予測部1010では、誤報を起こす可能性のあるログと、それ以外のログで異常検出・予測の方法を変更したり、結果の出力を別々にしたりでき、誤報を起す可能性に応じて異常の発生の検出や予測の感度を変更したり、結果の表示方法を誤報の発生の可能性に応じて変更したりすることができ、誤報の発生を低減したり、誤報である可能性を通知したりすることができる。   The log corrected by the log correcting unit 1004 is transmitted to the log switch 1007. The log switch 1007 determines which of the plurality of log collection units 107 included in the abnormality detection / prediction unit 1010 is to transfer the log depending on whether or not the log is marked. In order to determine which log collection unit 107 to transfer to according to the mark added to the log, the false alarm detection unit 1001 connects the log to the log switch 1007 via the false alarm detection result path 1006 and the relationship between the log collection unit 107 of the transfer destination. Send information about. As a result, the abnormality detection / prediction unit 1010 can change the method of abnormality detection / prediction in a log that may cause a false alarm and other logs, or output the results separately, and may cause a false alarm. You can change the sensitivity of the detection and prediction of abnormalities according to the characteristics, and change the display method of results according to the possibility of the occurrence of false alarms. You can be notified of a possibility.

異常検出・予測部1010は、複数のログ収集部107、異常判定部108、結果出力部109を持つ。これらの一部は共用しても良い。それぞれのログ収集部107、異常判定部108、結果出力部109での処理方法については、図2や図5に示した方法と同じである。   The abnormality detection / prediction unit 1010 includes a plurality of log collection units 107, an abnormality determination unit 108, and a result output unit 109. Some of these may be shared. The processing method in each log collection unit 107, abnormality determination unit 108, and result output unit 109 is the same as the method shown in FIG. 2 or FIG.

以上のような方法で、誤報の発生可能性が検出された場合に、ログ修正部1004とログスイッチ1007によって、異常検出・予測部1010における異常検出・予測方法を変更したり、結果の出力方法を変更したりできるので、誤報の発生を抑止することができる。なお、図8、図10、図12で示した方法は、このうちの1つだけを利用しても良いし、複数を組み合わせて利用しても良い。   When the possibility of misreporting is detected by the above method, the abnormality detection / prediction method in the abnormality detection / prediction unit 1010 is changed by the log correction unit 1004 and the log switch 1007, or the result output method The occurrence of false alarms can be suppressed. Note that only one of the methods shown in FIGS. 8, 10, and 12 may be used, or a plurality of methods may be used in combination.

図13は図12に示した方法において、誤報発生可能性を検出した際に誤報発生を起す可能性のあるログに印をつけて、異常検出・予測処理を変更する方法を示す処理フローである。   FIG. 13 is a process flow showing a method of changing the abnormality detection / prediction process by marking a log that may cause a false alarm when the possibility of a false alarm is detected in the method shown in FIG. .

最初にコンピュータシステム101から誤報検出部1001でログを受信する(ステップ1102)。誤報検出部1001は、誤報時ログ・誤報発生条件記憶部1002に記録されている誤報時ログ及び誤報発生条件と、ステップ1102で受信したログを比較して、誤報の発生可能性を検出する(ステップ1103)。誤報の発生可能性の検出の有無によって処理が分岐する(ステップ1104)。誤報の発生可能性を検出しなかった場合は、異常検出・予測部1010はログ収集部107でコンピュータシステム101からログを受信する(ステップ1105)。次に、異常検出・予測部1010は異常判定部108で異常の発生の検出・予測を行う(ステップ1106)。異常検出・予測部1010は結果出力部109で異常の発生の検出・予測結果を送信する(ステップ1107)。そして結果表示部111で異常の発生の検出・予測結果を表示する(ステップ1108)。   First, the error detection unit 1001 receives a log from the computer system 101 (step 1102). The false alarm detection unit 1001 compares the false alarm log and the false alarm occurrence condition recorded in the false alarm log / false alarm occurrence condition storage unit 1002 with the log received in step 1102 to detect the possibility of misreporting ( Step 1103). The process branches depending on whether or not a possibility of occurrence of a false alarm is detected (step 1104). When the possibility of occurrence of misreporting is not detected, the abnormality detection / prediction unit 1010 receives a log from the computer system 101 by the log collection unit 107 (step 1105). Next, the abnormality detection / prediction unit 1010 detects and predicts the occurrence of abnormality in the abnormality determination unit 108 (step 1106). The abnormality detection / prediction unit 1010 transmits the detection / prediction result of occurrence of abnormality in the result output unit 109 (step 1107). Then, the result display unit 111 displays the detection / prediction result of occurrence of abnormality (step 1108).

誤報の発生可能性を検出した場合、ステップ1104に続いてステップ1109が実行される。つまり、ログ修正部1004とログスイッチ1007に誤報検出部1001は誤報検出結果を送信する(ステップ1109)。ログ修正部1004はコンピュータシステム101からログを受信し、誤報検出結果に応じてログに印を付ける(ステップ1110)。ログスイッチ1007はコンピュータシステム101とログ修正部1004からログを受信し、誤報検出結果とログに付いた印に応じて複数のログ収集部107の何れかひとつへログを転送する(ステップ1111)。ステップ1112からステップ1114は、ステップ1106からステップ1108と同じである。   If the possibility of occurrence of false alarms is detected, step 1109 is executed following step 1104. That is, the false alarm detection unit 1001 transmits the false alarm detection result to the log correction unit 1004 and the log switch 1007 (step 1109). The log correction unit 1004 receives the log from the computer system 101, and marks the log according to the false alarm detection result (step 1110). The log switch 1007 receives the logs from the computer system 101 and the log correction unit 1004, and transfers the logs to any one of the plurality of log collection units 107 in accordance with the erroneous report detection result and the mark attached to the log (step 1111). Steps 1112 to 1114 are the same as Steps 1106 to 1108.

以上の処理フローによって、誤報検出部1001とログ修正部1004、ログスイッチ1007を利用した誤報の発生の低減が実現される。   With the above processing flow, the occurrence of false alarms using the false alarm detection unit 1001, the log correction unit 1004, and the log switch 1007 is reduced.

図14は異常検出・予測結果が誤報であることを通知する処理と、誤報発生時のログを記録する方法を適用したコンピュータシステムを示すブロック図である。   FIG. 14 is a block diagram showing a computer system to which a process for notifying that an abnormality detection / prediction result is a false report and a method of recording a log when a false report occurs is applied.

図14で、誤報通知部1201は、誤報が発生した際に、誤報の発生を誤報記録部1203に通知する手段である。例えば、誤報が発生した時刻と、誤報の発生が終了した時刻を通知する方法などがある。誤報通知部1201では、どのような誤報であったかを通知内容に含めることもある。これは、同様の原因で発生した誤報に関して、誤報時ログをまとめて記録するのに利用できる。   In FIG. 14, a misreport notification unit 1201 is means for notifying the misreport recording unit 1203 of the occurrence of a misreport when a misreport occurs. For example, there is a method of notifying the time when the misreporting occurred and the time when the misreporting ended. The misreport notification unit 1201 may include the misreport information in the notification content. This can be used to collectively record a log at the time of false alarms regarding false alarms generated for the same reason.

誤報記録部1203は、コンピュータシステム101内で生成されたログを、ネットワーク104を介して受信する。さらに、誤報通知部1201から誤報通知パス1202を介して誤報の発生通知を受信し、誤報発生時には、受信しているログを利用して、誤報発生時のログを、誤報記録パス1204を介して誤報時ログ・誤報発生条件記憶部602に記録する。   The false alarm recording unit 1203 receives a log generated in the computer system 101 via the network 104. Furthermore, a misreport occurrence notification is received from the misreport notification section 1201 via the misreport notification path 1202, and when a misreport occurs, a log at the time of misreport occurrence is transmitted via the misreport recording path 1204 using the received log. Log in error report / error report occurrence condition storage unit 602.

誤報記録部1203の処理は、例えば、図3の説明で述べた、誤報時ログの生成方法である。図14で誤報検出部601や異常検出予測部613、結果表示部111の処理は、図8に示した方法と同じである。なお、図14では、図8の方法に対して、誤報通知部1201、誤報記録部1203などを加えた構成となっているが、図8に限らず、図10や図12の方法に対して誤報通知部1201、誤報記録部1203などを加えた構成も可能である。   The process of the misreport recording unit 1203 is, for example, the misreporting log generation method described in the description of FIG. In FIG. 14, the processes of the false alarm detection unit 601, the abnormality detection prediction unit 613, and the result display unit 111 are the same as the method illustrated in FIG. 8. In FIG. 14, the error notification unit 1201 and the error report recording unit 1203 are added to the method of FIG. 8, but not limited to FIG. 8, the method of FIGS. 10 and 12 is used. A configuration in which a misreport notification unit 1201, a misreport recording unit 1203, and the like are added is also possible.

図15は図14に示した方法において、異常検出・予測結果が誤報であることを通知する手段と、誤報発生時のログを記録する方法を示す処理フローである。   FIG. 15 is a processing flow showing a means for notifying that the abnormality detection / prediction result is a false report and a method for recording a log when a false report occurs in the method shown in FIG.

最初に誤報通知部1201で誤報の発生を通知する(ステップ1302)。誤報記録部1203は、誤報通知部1201から誤報の発生通知を受信すると、誤報発生時のログを誤報時ログ・誤報発生条件記憶部602に記録する(ステップ1303)。次にコンピュータシステム101から誤報検出部601でログを受信する(ステップ1304)。誤報検出部601は誤報時ログ・誤報発生条件記憶部602に記録されている誤報時ログ及び誤報発生条件と、ステップ1304で受信したログを比較して、誤報の発生可能性を検出する(ステップ1305)。誤報の発生可能性の検出の有無によって処理が分岐する(ステップ1306)。   First, the misreport notification unit 1201 notifies the occurrence of misreport (step 1302). When receiving the notification of the occurrence of the false alarm from the false alarm notifying part 1201, the false alarm recording part 1203 records the log at the time of the false alarm occurrence in the false alarm log / misreporting condition storage part 602 (step 1303). Next, a log is received from the computer system 101 by the false alarm detection unit 601 (step 1304). The false alarm detection unit 601 compares the false alarm log and the false alarm occurrence condition recorded in the false alarm log / false alarm occurrence condition storage unit 602 with the log received in step 1304 to detect the possibility of misreporting (step 1305). The process branches depending on whether or not the possibility of occurrence of a false alarm is detected (step 1306).

誤報の発生可能性を検出しなかった場合は、異常検出・予測部613はログ収集部107でコンピュータシステムからログを受信する(ステップ1307)。次に、異常検出・予測部613は異常判定部108で異常の発生の検出・予測を行う(ステップ1308)。異常検出・予測部613は結果出力部109で異常の発生の検出・予測結果を送信する(ステップ1309)。そして結果表示部111で異常の発生の検出・予測結果を表示する(ステップ1310)。   When the possibility of occurrence of false alarms is not detected, the abnormality detection / prediction unit 613 receives a log from the computer system by the log collection unit 107 (step 1307). Next, the abnormality detection / prediction unit 613 detects and predicts the occurrence of abnormality in the abnormality determination unit 108 (step 1308). The abnormality detection / prediction unit 613 transmits the detection / prediction result of occurrence of abnormality in the result output unit 109 (step 1309). Then, the detection / prediction result of occurrence of abnormality is displayed on the result display unit 111 (step 1310).

誤報の発生可能性を検出した場合、ステップ1306に続いてステップ1311が実行される。つまり、異常検出・予測部613に誤報検出部601は誤報検出結果を送信する(ステップ1311)。異常検出・予測部613の制御部605は、誤報検出結果に応じて異常判定結果の出力の無効化や、処理の停止などを行う(ステップ1312)。   If the possibility of occurrence of a false alarm is detected, step 1311 is executed following step 1306. That is, the false alarm detection unit 601 transmits the false alarm detection result to the abnormality detection / prediction unit 613 (step 1311). The control unit 605 of the abnormality detection / prediction unit 613 invalidates the output of the abnormality determination result, stops the processing, or the like according to the false alarm detection result (step 1312).

以上の処理フローによって、誤報検出部601を利用した誤報の発生の低減が実現される。   With the above processing flow, reduction of the occurrence of false alarms using the false alarm detector 601 is realized.

図16は異常検出・予測において誤報が発生する可能性のある条件を設定する処理を含むログ解析方法を適用したコンピュータシステムを示すブロック図である。   FIG. 16 is a block diagram showing a computer system to which a log analysis method including processing for setting a condition that may cause a false alarm in abnormality detection / prediction is applied.

図16で、誤報発生条件登録部1401は、誤報が発生した際もしくは、誤報の発生条件が分かっている場合に、誤報の発生条件を誤報発生条件記録部1403に通知する処理である。例えば、コンピュータシステム101の定期保守を特定の時間帯に行う場合、その時間帯には誤報が発生する可能性が高くなることを登録する方法などがある。誤報発生条件登録部1401では、どのような誤報であるかを通知内容に含めることもある。これは、同様の原因で発生する誤報に関して、誤報発生条件をまとめて記録するのに利用できる。   In FIG. 16, the misreport occurrence condition registration unit 1401 is a process of notifying the misreport occurrence condition to the misreport occurrence condition recording unit 1403 when the misreport occurs or when the misreport occurrence condition is known. For example, when the regular maintenance of the computer system 101 is performed in a specific time zone, there is a method of registering that there is a high possibility that a false alarm will occur in that time zone. The false alarm occurrence condition registration unit 1401 may include what kind of misinformation is in the notification content. This can be used to collectively record misreporting conditions regarding misinformation that occurs for the same reason.

誤報発生条件記録部1403は、誤報発生条件登録部1401から誤報発生条件通知パス1402を介して誤報の発生条件を受信し、誤報発生条件記録パス1404を介して誤報時ログ・誤報発生条件記憶部602に記録する。誤報発生条件登録部1401および誤報発生条件記録部1403の処理は、例えば、図6の説明で述べた、誤報発生条件の生成方法である。図16に示す誤報検出部601や異常検出予測部613、結果表示部111の処理は、図8に示した方法と同じである。なお、図16では、図8の方法に対して、誤報発生条件登録部1401、誤報発生条件記録部1403などを加えた構成となっているが、図8に限らず、図10や図12,図14の方法に対して誤報発生条件登録部1401、誤報発生条件記録部1403などを加えた構成も可能である。   The misreport occurrence condition recording unit 1403 receives the misreport occurrence condition from the misreport occurrence condition registration unit 1401 via the misreport occurrence condition notification path 1402, and the misreport occurrence log / misreport occurrence condition storage unit via the misreport occurrence condition record path 1404. Record at 602. The processing of the misreport occurrence condition registration unit 1401 and the misreport occurrence condition recording unit 1403 is, for example, the generation method of the misreport occurrence condition described in the explanation of FIG. The processing of the false alarm detection unit 601, the abnormality detection prediction unit 613, and the result display unit 111 illustrated in FIG. 16 is the same as the method illustrated in FIG. 8. In FIG. 16, the error report generation condition registration unit 1401 and the error report generation condition recording unit 1403 are added to the method of FIG. 8. However, the present invention is not limited to FIG. A configuration in which an error report occurrence condition registration unit 1401, an error report occurrence condition recording unit 1403, and the like are added to the method of FIG. 14 is also possible.

図17は図16に示した方法において、異常検出・予測において誤報が発生する可能性のある条件を設定する手段を含むログ解析方法を示す処理フローである。   FIG. 17 is a processing flow showing a log analysis method including means for setting conditions that may cause a false alarm in abnormality detection / prediction in the method shown in FIG.

最初に誤報発生条件登録部1401で誤報の発生条件を登録する(ステップ1502)。誤報発生条件記録部1403は、誤報発生条件登録部1401から誤報の発生条件を受信すると、誤報発生条件を誤報時ログ・誤報発生条件記憶部602に記録する(ステップ1503)。次にコンピュータシステム101から誤報検出部601でログを受信する(ステップ1504)。誤報検出部601は誤報時ログ・誤報発生条件記憶部602に記録されている誤報時ログ及び誤報発生条件と、ステップ1504で受信したログを比較して、誤報の発生可能性を検出する(ステップ1505)。誤報の発生可能性の検出の有無によって処理が分岐する(ステップ1506)。   First, a false alarm generation condition registration unit 1401 registers a false alarm generation condition (step 1502). When receiving the error report occurrence condition from the error report occurrence condition registration unit 1401, the error report occurrence condition recording unit 1403 records the error report occurrence condition in the error report log / error report occurrence condition storage unit 602 (step 1503). Next, the error detection unit 601 receives a log from the computer system 101 (step 1504). The false alarm detection unit 601 compares the false alarm log and the false alarm occurrence condition recorded in the false alarm log / false alarm occurrence condition storage unit 602 with the log received in step 1504 to detect the possibility of an erroneous alarm (step 1505). Processing branches depending on whether or not the possibility of occurrence of a false alarm has been detected (step 1506).

誤報の発生可能性を検出しなかった場合は、異常検出・予測部613はログ収集部107でコンピュータシステムからログを受信する(ステップ1507)。次に、異常検出・予測部613は異常判定部108で異常の発生の検出・予測を行う(ステップ1508)。異常検出・予測部613は結果出力部109で異常の発生の検出・予測結果を結果表示部111へ送信する(ステップ1509)。そして結果表示部111で異常の発生の検出・予測結果を表示する(ステップ1510)。   When the possibility of occurrence of the false alarm is not detected, the abnormality detection / prediction unit 613 receives a log from the computer system by the log collection unit 107 (step 1507). Next, the abnormality detection / prediction unit 613 detects and predicts the occurrence of abnormality in the abnormality determination unit 108 (step 1508). The abnormality detection / prediction unit 613 transmits the detection / prediction result of the occurrence of abnormality to the result display unit 111 in the result output unit 109 (step 1509). Then, the result display unit 111 displays the detection / prediction result of occurrence of abnormality (step 1510).

誤報の発生可能性を検出した場合、ステップ1506に続いてステップ1511が実行される。つまり、異常検出・予測部613に誤報検出部601は誤報検出結果を送信する(ステップ1511)。異常検出・予測部613の制御部605は、誤報検出結果に応じて異常判定結果の出力の無効化や、処理の停止などを行う(ステップ1512)。   If the possibility of occurrence of a false alarm is detected, step 1511 is executed following step 1506. That is, the false alarm detection unit 601 transmits the false alarm detection result to the abnormality detection / prediction unit 613 (step 1511). The control unit 605 of the abnormality detection / prediction unit 613 invalidates the output of the abnormality determination result, stops the processing, or the like according to the false alarm detection result (step 1512).

以上の処理フローによって、誤報検出部601を利用した誤報の発生の低減が実現される。   With the above processing flow, reduction of the occurrence of false alarms using the false alarm detector 601 is realized.

図18は異常検出・予測結果に、誤報発生を起す可能性を検出してログ修正したことを示す情報を付加する処理を含むログ解析方法を適用したコンピュータシステムを示すブロック図である。   FIG. 18 is a block diagram showing a computer system to which a log analysis method including processing for adding information indicating that a log correction is performed by detecting the possibility of occurrence of a false alarm to an abnormality detection / prediction result is applied.

図18で、誤報検出部801は、異常検出・予測部807の結果出力部1602に対して誤報検出結果パス1601を介して誤報の発生可能性を通知する。結果出力部1602は、誤報の発生可能性を受信すると、該当するログ解析の結果について、例えば誤報の発生可能性がある場合に、ログ修正部804でログが修正されたことを結果出力パス1603に出力する異常判定結果1605に含める。結果表示部1604は、異常判定結果がログ修正後の、つまり誤報の発生を低減させる処理を行った後の結果であることを表示する。以上の方法により、誤報検出部801とログ修正部804によって誤報の発生を低減させたことを結果表示部1604で確認することができるようになる。これによって誤報の発生を低減させる処理の妥当性の確認ができ、異常判定結果の精度をより高めることができる。図18に示す誤報検出部801やログ修正部804などの処理は、図10に示した方法と同じである。なお、図18では、図10の方法に対して、結果出力部1602に誤報検出結果パスを接続した構成となっているが、図10に限らず、図8や図12,図14の方法に対して変更を加えた構成も可能である。   In FIG. 18, the misinformation detection unit 801 notifies the result output unit 1602 of the abnormality detection / prediction unit 807 of the possibility of misreporting via the misreport detection result path 1601. When the result output unit 1602 receives the possibility of the occurrence of the false alarm, the result output path 1603 indicates that the log correction part 804 has corrected the log for the corresponding log analysis result, for example, when there is a possibility of the false alarm. Are included in the abnormality determination result 1605 to be output. The result display unit 1604 displays that the abnormality determination result is the result after the log correction, that is, after the processing for reducing the occurrence of false alarms. With the above method, it is possible to confirm on the result display unit 1604 that the occurrence of the misreport has been reduced by the misreport detection unit 801 and the log correction unit 804. As a result, it is possible to confirm the validity of the process for reducing the occurrence of false alarms and to further increase the accuracy of the abnormality determination result. The processes of the false alarm detection unit 801 and the log correction unit 804 shown in FIG. 18 are the same as the method shown in FIG. In FIG. 18, the error output detection result path is connected to the result output unit 1602 in the method of FIG. 10, but not limited to FIG. 10, the method of FIGS. 8, 12, and 14 is used. A configuration in which changes are made is also possible.

図19は誤報発生を起す可能性を検出してログ修正する処理を含む異常検出・予測結果と、ログ修正を行わずに異常検出・予測結果の両方を結果表示する処理を含むログ解析方法を適用したコンピュータシステムを示すブロック図である。図19で、異常検出・予測部1010は、ログ解析により異常の検出・予測を行うために少なくとも2つの検出部1702、1703を持ち、誤報検出部1001は、一方の検出部1702へはネットワーク104を介してコンピュータシステム101内で生成されたログを直接入力し、もう一方の検出部1703へは修正ログ入力パス1701を介してログ修正部1004で修正されたログが入力される。   FIG. 19 shows a log analysis method including an abnormality detection / prediction result including a process of correcting a log by detecting the possibility of occurrence of a false alarm, and a process of displaying both an abnormality detection / prediction result as a result without performing log correction. It is a block diagram which shows the applied computer system. In FIG. 19, the abnormality detection / prediction unit 1010 has at least two detection units 1702 and 1703 to detect and predict an abnormality by log analysis, and the false alarm detection unit 1001 connects to one detection unit 1702 via the network 104. The log generated in the computer system 101 is directly input via the log, and the log corrected by the log correction unit 1004 is input to the other detection unit 1703 via the correction log input path 1701.

結果出力部1706に対しては、検出部1702、1703毎に結果出力パス1704、1705が接続され、検出部1702、1703の両方の異常判定結果を表示することができる。以上の方法により、誤報検出部1001やログ修正部1004による誤報の発生を低減させる処理の有無による異常判定結果の差異を確認することができるようになる。   Result output paths 1704 and 1705 are connected to the result output unit 1706 for each of the detection units 1702 and 1703, and the abnormality determination results of both the detection units 1702 and 1703 can be displayed. By the above method, it becomes possible to confirm the difference in the abnormality determination result depending on the presence / absence of the process for reducing the occurrence of the false alarm by the false alarm detection unit 1001 and the log correction unit 1004.

これによって誤報の発生を低減させる処理の妥当性の確認ができ、異常判定結果の精度をより高めることができる。   As a result, it is possible to confirm the validity of the process for reducing the occurrence of false alarms and to further increase the accuracy of the abnormality determination result.

図19に示した誤報検出部1001やログ修正部1004などの処理は、図12に示した方法と同じである。なお、図19では、図12の方法に対して、複数の結果出力パスなどを接続した構成となっているが、図12に限らず、図8や図10,図14の方法に対して変更を加えた構成も可能である。   The processes of the false alarm detection unit 1001 and the log correction unit 1004 shown in FIG. 19 are the same as the method shown in FIG. In FIG. 19, a plurality of result output paths are connected to the method of FIG. 12, but the method is not limited to FIG. 12, but is changed to the methods of FIGS. 8, 10, and 14. It is also possible to add a configuration.

ここまで第1の実施形態について図1から図19を使って説明してきたが、本発明の方法は図1から図19までに示した方法すべてを同時に行う必要はない。例えば、誤報の検出方法については、図2と図5に示した方法のいずれか一方でも、両方同時に行ってもよい。誤報の検出結果を利用した誤報の発生を低減させる処理については、図8、図10、図12に示した方法のいずれか1つもしくは2つでも、すべて同時に行ってもよい。誤報時のログや誤報の発生条件の登録方法については、図14、図16に示した方法のいずれか一方でも、両方同時に行ってもよい。さらに誤報時のログや誤報の発生条件の登録は予め行っておき、後から登録しない方法、つまり図14に示した方法も図16に示した方法も含まれない方法も考えられる。異常判定結果の出力・表示方法も、図18、図19に示した方法のいずれか一方でも、両方同時に行ってもよい。本発明には、上記の組み合わせによる方法も含まれている。   Although the first embodiment has been described so far with reference to FIGS. 1 to 19, the method of the present invention does not need to perform all the methods shown in FIGS. 1 to 19 at the same time. For example, as for the method of detecting a false alarm, either one of the methods shown in FIGS. 2 and 5 may be performed at the same time. The process of reducing the occurrence of false alarms using the false alarm detection results may be performed simultaneously with any one or two of the methods shown in FIG. 8, FIG. 10, and FIG. As for the method of registering the log at the time of misreporting or the condition for generating misreporting, either one of the methods shown in FIGS. 14 and 16 may be performed at the same time. Further, a method of registering a log at the time of misreporting or an occurrence condition of misreporting in advance and not registering later, that is, a method not including the method shown in FIG. 14 or the method shown in FIG. The method for outputting / displaying the abnormality determination result may be either one of the methods shown in FIGS. 18 and 19 or both. The present invention also includes a method based on the above combination.

<第2実施形態>
本発明によるコンピュータシステムの異常検出における誤報発生を低減するログ解析装置の第2の実施形態を図20から図24を使って説明する。なお、ログ解析装置内部の処理方法については、前記第1実施形態に示した方法によって実施できるので、主に装置の外部仕様について説明する。
Second Embodiment
A second embodiment of a log analysis apparatus for reducing the occurrence of false alarms in the detection of abnormality in a computer system according to the present invention will be described with reference to FIGS. Since the processing method inside the log analysis apparatus can be implemented by the method shown in the first embodiment, the external specification of the apparatus will be mainly described.

図20は本発明のログ解析装置に関する基本的なシステム構成を示すブロック図である。計算機1801で生成されたログはネットワークパス1802、1804、ネットワーク装置1803を経由してログ解析装置1805に送られる。計算機1801は、CPU、メモリ、ディスク装置などのハードウェアコンポーネントと、OSやミドルウェア、アプリケーションソフトウェアなどのソフトウェアコンポーネントによって構成される装置である。計算機1801はハードウェアコンポーネントやソフトウェアコンポーネントの組み合わせによって、様々な種類のサービスを提供する。ネットワーク装置1803とは、接続されているネットワークパス間で、データやコマンドのやり取りを行う装置で、例えば、計算機から出力されたログを誤報検出装置1806に転送したりする。   FIG. 20 is a block diagram showing a basic system configuration relating to the log analysis apparatus of the present invention. The log generated by the computer 1801 is sent to the log analysis device 1805 via the network paths 1802 and 1804 and the network device 1803. The computer 1801 is a device that includes hardware components such as a CPU, a memory, and a disk device, and software components such as an OS, middleware, and application software. The computer 1801 provides various types of services by combining hardware components and software components. The network device 1803 is a device that exchanges data and commands between connected network paths. For example, a log output from a computer is transferred to the false alarm detection device 1806.

ログ解析装置1805は、誤報検出装置1806、異常検出・予測装置1808、異常検出・予測結果出力装置1810、誤報通知・登録インタフェース装置1811から構成される。誤報検出装置1806は、計算機1801と同様の構成を持つ装置で、CPU、メモリ1815とOS1816上に誤報検出ソフトウェア1817や、ログ修正ソフトウェア1818が動作しており、入出力インタフェース1813を介して、外部からのログや誤報発生条件などを入力したり、誤報検出結果や修正後のログを出力したりする。また、誤報時のログや、誤報発生条件を記憶するストレージ装置1814も含まれる。   The log analysis device 1805 includes an error report detection device 1806, an abnormality detection / prediction device 1808, an abnormality detection / prediction result output device 1810, and an error notification / registration interface device 1811. The false alarm detection device 1806 is a device having the same configuration as the computer 1801. The false alarm detection software 1817 and the log correction software 1818 are operating on the CPU, the memory 1815 and the OS 1816. Log, error report occurrence condition, etc., or output false alarm detection result and corrected log. Also included is a storage device 1814 that stores a log at the time of misreporting and conditions for the occurrence of misreporting.

誤報検出ソフトウェア1817は、例えば、図12の誤報検出部1001に示した方法を実現するソフトウェアである。ログ修正ソフトウェア1818は、例えば、図12のログ修正部1004に示した方法を実現するソフトウェアである。ストレージ装置1814は、例えば、図12の誤報時ログ・誤報発生条件記憶部1002を実現する装置である。図12のログスイッチ1007は、図20ではログ修正ソフトウェア1818に含めて実現しても、異常検出・予測装置1808上にソフトウェアで実現してもよい。   The false alarm detection software 1817 is, for example, software that realizes the method shown in the false alarm detection unit 1001 in FIG. The log correction software 1818 is, for example, software that implements the method shown in the log correction unit 1004 in FIG. The storage device 1814 is, for example, a device that implements the false alarm log / false alarm occurrence condition storage unit 1002 of FIG. The log switch 1007 of FIG. 12 may be realized by being included in the log correction software 1818 in FIG. 20 or may be realized by software on the abnormality detection / prediction device 1808.

異常検出・予測装置1808も誤報検出装置1806と同様に、CPU、メモリ、OS、入出力インタフェース、ストレージ装置などから成り、例えばOS上で異常検出・予測ソフトウェアが動作する。異常検出・予測ソフトウェアは、例えば、図12の異常検出・予測部1010を実現するソフトウェアである。   Similar to the false alarm detection device 1806, the abnormality detection / prediction device 1808 includes a CPU, a memory, an OS, an input / output interface, a storage device, and the like. For example, the abnormality detection / prediction software operates on the OS. The abnormality detection / prediction software is, for example, software that implements the abnormality detection / prediction unit 1010 of FIG.

異常検出・予測結果出力装置1810は、異常検出・予測装置1808で行うログ解析の結果出力を受けて異常通報の概要や詳細状況などを表示する装置である。例えば、図12の結果表示部111を実現する装置である。図20には記載されていないが、異常検出・予測結果出力装置1810に入出力装置を加えて、結果の表示方法を変更するなどできるようにすることも含まれる。   The abnormality detection / prediction result output device 1810 is a device that receives an output of the result of log analysis performed by the abnormality detection / prediction device 1808 and displays an outline or detailed status of the abnormality notification. For example, it is a device that implements the result display unit 111 of FIG. Although not described in FIG. 20, it also includes adding an input / output device to the abnormality detection / prediction result output device 1810 so as to change the result display method.

誤報通知・登録インタフェース装置1811は、誤報検出装置1806に誤報時ログや、誤報発生条件を登録するのに利用する。例えば、図14の誤報通知部1201や図16の誤報発生条件登録部1401を実現する装置である。図14の誤報記録部1203や図16の誤報発生条件記録部1403は、図20では誤報通知・登録インタフェース装置1811上にソフトウェアで実現しても、誤報検出装置1806上にソフトウェアで実現してもよい。   The misreport notification / registration interface device 1811 is used to register a misreport log or misreport occurrence conditions in the misreport detection device 1806. For example, it is a device that realizes the false alarm notification unit 1201 of FIG. 14 and the false alarm occurrence condition registration unit 1401 of FIG. The error report recording unit 1203 in FIG. 14 and the error report occurrence condition recording unit 1403 in FIG. 16 may be realized by software on the error notification / registration interface device 1811 in FIG. Good.

図20では、誤報検出装置1806、異常検出・予測装置1808などをそれぞれ1台ずつの計算機で実現しているが、これらを1台の計算機で実現してもよく、逆にそれぞれを複数台の計算機で実現してもよい。同様に、異常検出・予測結果出力装置1810と誤報通知・登録インタフェース装置1811も1台の装置で実現してもよい。   In FIG. 20, the false alarm detection device 1806, the anomaly detection / prediction device 1808, etc. are each realized by one computer, but these may be realized by one computer, and conversely each of a plurality of computers. You may implement | achieve with a computer. Similarly, the abnormality detection / prediction result output device 1810 and the false alarm notification / registration interface device 1811 may be realized by a single device.

各装置間のパスで通信されるデータは、以下の通りである。ネットワークパス1802、1804では、計算機1801で生成されたログデータが通信される。誤報検出結果ネットワークパス1807では、誤報検出装置1806の誤報検出ソフトウェア1817で検出された誤報検出結果と、ログ修正ソフトウェア1818で修正を行ったログデータが通信される。誤報検出結果の例としては、図8に示した誤報検出結果609などが挙げられる。異常判定結果ネットワークパス1809では、異常検出・予測装置1808でログ解析した結果である異常判定結果が通信される。異常判定結果の例としては、図18に示した異常判定結果1605などが挙げられる。誤報通知・登録ネットワークパス1812では、誤報発生を通知するデータや誤報発生条件が通信される。誤報発生を通知するデータとは、誤報が発生した時刻やその内容説明などであり、誤報発生条件の例としては、図6(A)、(B)に示した誤報発生条件503〜506などが挙げられる。   The data communicated by the path between each device is as follows. In the network paths 1802 and 1804, log data generated by the computer 1801 is communicated. In the false alarm detection result network path 1807, the false alarm detection result detected by the false alarm detection software 1817 of the false alarm detection device 1806 and the log data corrected by the log correction software 1818 are communicated. As an example of the false alarm detection result, the false alarm detection result 609 shown in FIG. In the abnormality determination result network path 1809, an abnormality determination result that is a result of log analysis performed by the abnormality detection / prediction device 1808 is communicated. Examples of the abnormality determination result include the abnormality determination result 1605 shown in FIG. In the misreport notification / registration network path 1812, data for notifying the occurrence of misreport and the misreport occurrence conditions are communicated. The data for notifying the occurrence of false alarms is the time when the false alarms occurred and the contents thereof, and examples of the false alarm occurrence conditions include the false alarm occurrence conditions 503 to 506 shown in FIGS. 6 (A) and 6 (B). Can be mentioned.

なお、以上で説明した内容は、あくまでも1つの実装例であり、計算機1801とネットワーク装置1803の接続方法や、ログ解析装置1805内の装置の構成などは図20に示した構成に限らない。   The contents described above are merely one implementation example, and the connection method between the computer 1801 and the network device 1803, the configuration of the devices in the log analysis device 1805, and the like are not limited to the configuration shown in FIG.

図21は誤報発生通知インタフェースを含むログ解析装置のユーザインタフェースの実施例を示す図である。図20に示した本発明のログ解析装置1805の構成において、異常検出・予測結果出力装置1810と誤報通知・登録インタフェース装置1811を1つの装置で実現した例である。   FIG. 21 is a diagram showing an embodiment of a user interface of the log analysis apparatus including a false alarm occurrence notification interface. In the configuration of the log analysis device 1805 of the present invention shown in FIG. 20, the abnormality detection / prediction result output device 1810 and the false alarm notification / registration interface device 1811 are realized by one device.

図21は、タッチパネル機能付き液晶ディスプレイなどの表示画面1901に以下の4つのインタフェースを表示した例である。異常通報概要ウィンドウ1902には、異常検出・予測装置1808から出力される異常判定結果を元にコンピュータシステムに異常が発生しているかいないかを表示する。さらに、異常通報詳細ウィンドウ1903には、異常判定結果を元に、どのような異常であるかなどの異常に関する詳細な情報を表示する。誤報発生通知ボタン1904は、表示された異常が誤報であることを通知する入力インタフェースである。   FIG. 21 shows an example in which the following four interfaces are displayed on a display screen 1901 such as a liquid crystal display with a touch panel function. The abnormality report summary window 1902 displays whether or not an abnormality has occurred in the computer system based on the abnormality determination result output from the abnormality detection / prediction device 1808. Further, the abnormality report detail window 1903 displays detailed information regarding the abnormality such as what kind of abnormality is based on the abnormality determination result. The false alarm occurrence notification button 1904 is an input interface for notifying that the displayed abnormality is false alarm.

誤報情報入力ボックス1905は、誤報の内容を入力するのに利用する入力インタフェースである。コンピュータシステムでの異常の発生を監視する際には、最初に異常通報概要ウィンドウ1902で異常の発生の検出・予測を確認し、その内容を異常通報詳細ウィンドウ1903で確認する。表示された異常が誤報であった場合には、誤報情報入力ボックス1905に誤報の内容を記入し、誤報発生通知ボタン1904を押すことで、誤報検出装置1806に誤報時ログや誤報発生条件が登録できる。   The misinformation information input box 1905 is an input interface used to input the contents of misinformation. When monitoring the occurrence of an abnormality in the computer system, first, the detection / prediction of the occurrence of the abnormality is confirmed in the abnormality report summary window 1902 and the content is confirmed in the abnormality report details window 1903. If the displayed anomaly is a false alarm, the error report input box 1905 is filled with the false alarm content, and a false alarm occurrence notification button 1904 is pressed. it can.

図22は誤報発生条件を登録するインタフェースを含むログ解析装置のユーザインタフェースの実施例を示す図である。図22は、ノートPCなどの入力インタフェース2001に誤報発生条件登録用のウィンドウ2002を表示した例である。誤報発生条件を入力するインタフェースとして、図22では大きく分けて以下の3つのウィンドウがある。時間指定ウィンドウ2003は、誤報が発生する時刻や発生の周期を登録する入力インタフェースである。発生条件ウィンドウ2004は、誤報を発生させるログ条件、ログの発生順序によって誤報が発生する場合のログ順序条件、ログに含まれるイベントの発生比率によって誤報が発生する場合のログ比率条件を登録する入力インタフェースである。操作対象ログウィンドウ2005は、誤報の発生可能性が検出された場合に修正や削除の対象となるログ種類を登録する入力インタフェースである。   FIG. 22 is a diagram showing an embodiment of a user interface of the log analysis apparatus including an interface for registering false alarm occurrence conditions. FIG. 22 shows an example in which a window 2002 for registering a false alarm condition is displayed on an input interface 2001 such as a notebook PC. As an interface for inputting a false alarm occurrence condition, there are the following three windows in FIG. The time designation window 2003 is an input interface for registering the time at which a false alarm occurs and the generation cycle. The occurrence condition window 2004 is an input for registering a log condition that causes a false alarm, a log order condition when a false alarm occurs due to the log generation order, and a log ratio condition when a false alarm occurs due to the occurrence ratio of events included in the log. Interface. The operation target log window 2005 is an input interface for registering a log type to be corrected or deleted when the possibility of occurrence of a false alarm is detected.

これらの入力インタフェースとしては、直接条件や値・文字列などを入力することのできる入力ボックス2006や、条件や値・文字列などを記入したファイルを指定して読み込む参照ボタン2007などがある。   As these input interfaces, there are an input box 2006 in which conditions, values, character strings, and the like can be directly input, and a reference button 2007 for specifying and reading a file in which conditions, values, character strings, etc. are written.

図23は異常検出・予測結果に、誤報発生を起す可能性を検出してログを修正したことを示す情報を付加して表示する手段を含むログ解析装置1805のユーザインタフェースの一例を示す図である。   FIG. 23 is a diagram showing an example of a user interface of a log analysis apparatus 1805 including means for adding and displaying information indicating that a log is corrected by detecting a possibility of occurrence of a false alarm in an abnormality detection / prediction result. is there.

図23は、液晶ディスプレイなどの表示画面2101に以下の4つのインタフェースを表示した例である。これらのインタフェースは、図18に示した誤報発生を起す可能性を検出してログ修正したことを示すインタフェースを含む例である。図23の例では、異常通報概要ウィンドウ2102に、異常検出・予測装置1808から出力された異常判定結果を元に、10:00:00から10:02:59までの間にコンピュータシステムに異常が発生しているかいないかを表示している。この例では異常の発生は無い。さらに、異常通報詳細ウィンドウ2103には、異常判定結果を元に、どのような異常であるかなどの異常に関する詳細な情報を表示している。   FIG. 23 shows an example in which the following four interfaces are displayed on a display screen 2101 such as a liquid crystal display. These interfaces are examples including the interface shown in FIG. 18 that indicates that the possibility of the occurrence of the false alarm is detected and the log is corrected. In the example of FIG. 23, in the abnormality report summary window 2102, an abnormality is detected in the computer system between 10:00 and 10:02:59 based on the abnormality determination result output from the abnormality detection / prediction device 1808. Whether or not it has occurred is displayed. In this example, no abnormality occurs. Further, in the abnormality report detail window 2103, detailed information regarding the abnormality such as what kind of abnormality is displayed based on the abnormality determination result.

この例では、コンピュータシステムの異常度を定量化し、時系列に表示したグラフを示している。誤報発生可能性検出結果ウィンドウ2104には、誤報検出装置1806で誤報発生の可能性が検出されたいないかを表示している。この例では10:02:00〜10:02:59に誤報の発生可能性が検出されたことを示している。誤報発生可能性によるログ修正ウィンドウ2105には、誤報検出装置1806でログ修正が実行されたかどうかを表示している。この例では、定期的なキャッシュクリアによって発生するログ種類Xのログを削除したことを表示している。   This example shows a graph in which the degree of abnormality of the computer system is quantified and displayed in time series. The misreport occurrence possibility detection result window 2104 displays whether or not the misreport occurrence device 1806 has detected the possibility of misreport occurrence. In this example, it is shown that the possibility of occurrence of false alarms was detected from 10:02:00 to 10:02:59. In the log correction window 2105 due to the possibility of erroneous report occurrence, it is displayed whether or not log correction is executed by the erroneous report detection apparatus 1806. In this example, it is displayed that the log of the log type X generated by periodic cache clearing is deleted.

図23に示したような表示インタフェースによって、異常の発生はないが、表示期間中に誤報の発生可能性を検出してログ修正をした結果として、異常の発生がないと検出・予測されていることを確認できる。   With the display interface as shown in FIG. 23, there is no abnormality, but it is detected and predicted that no abnormality has occurred as a result of correcting the log by detecting the possibility of misreporting during the display period. I can confirm that.

図24は誤報発生を起す可能性を検出してログを修正する手段を含む異常検出・予測結果と、ログの修正を行わない異常検出・予測結果の両方を表示する手段を含むログ解析装置のユーザインタフェースの実施例を示す図である。図24は、液晶ディスプレイなどの表示画面2201に大きく分けて以下の2つのインタフェースを表示した例である。これらのインタフェースは、図19に示した誤報発生を起す可能性を検出してログ修正した場合としなかった場合の両方の異常判定結果を示すインタフェースを含む例である。図24の例では、上側にログ修正をしなかった場合の異常判定結果を示すウィンドウ2202、下側に誤報の発生可能性を検出した場合にログ修正をした場合の異常判定結果を示すウィンドウ2203が表示されている。このウィンドウ2203には、図23に示した4つのインタフェースが含まれ、この例では10:02:00〜10:02:59に誤報の発生可能性が検出され、定期的なキャッシュクリアによって発生するログ種類Xのログを削除したこと、そしてその結果として10:00:00〜10:02:59の間にはコンピュータシステムに異常が発生していないと判定されたことを表示している。一方、ログ修正を行わなかった場合の異常判定結果を表示している上側のウィンドウ2202では、10:02:00に異常の発生が検出されたことが表示されている。図24に示したような表示インタフェースによって、異常の発生が検出・予測されたが、その検出結果は誤報である可能性があり、誤報の発生を低減させる処理によって異常が発生していないと判定されること、また誤報の原因が何であるかを理解することができる。   FIG. 24 is a diagram of a log analyzing apparatus including a means for displaying both an abnormality detection / prediction result including a means for correcting a log by detecting a possibility of occurrence of a false alarm and an abnormality detection / prediction result without performing log correction. It is a figure which shows the Example of a user interface. FIG. 24 shows an example in which the following two interfaces are displayed roughly on a display screen 2201 such as a liquid crystal display. These interfaces are examples including an interface showing both abnormality determination results in the case where the possibility of causing the false alarm occurrence shown in FIG. 19 is detected and the log is corrected or not. In the example of FIG. 24, a window 2202 showing an abnormality determination result when log correction is not performed on the upper side, and a window 2203 indicating an abnormality determination result when log correction is performed when the possibility of occurrence of a false alarm is detected on the lower side. Is displayed. This window 2203 includes the four interfaces shown in FIG. 23. In this example, the possibility of a false alarm is detected from 10:02:00 to 10:02:59, and is generated by periodic cache clearing. It is displayed that the log of the log type X has been deleted, and as a result, it has been determined that no abnormality has occurred in the computer system between 10:00:00 and 10:02:59. On the other hand, in the upper window 2202 displaying the abnormality determination result when the log correction is not performed, it is displayed that the occurrence of abnormality is detected at 10:02:00. Although the occurrence of an abnormality is detected and predicted by the display interface as shown in FIG. 24, the detection result may be a false alarm, and it is determined that no abnormality has occurred by the process of reducing the occurrence of the false alarm. And understand what caused the false alarm.

<補足>
請求項11乃至請求項13のいずれかひとつに記載のログ解析装置であって、前記誤報検出部は、前記誤報の発生を判定したときには、前記ログ解析部の解析を停止または解析結果を無効化することを特徴とするログ解析装置。
<Supplement>
14. The log analysis device according to claim 11, wherein when the erroneous report detection unit determines the occurrence of the erroneous report, the log analysis unit stops the analysis or invalidates the analysis result. A log analysis device characterized by:

本発明により、ログ解析技術を利用したコンピュータシステムの異常の検出・予測に関し、実際には異常が発生していないのに異常を検出・予測してしまうフォールスポジティブの発生を低減でき、検出・予測の精度を向上することができるので、ログ解析技術のコンピュータシステムの異常の検出・予測への適用範囲が広がり、結果としてコンピュータシステムの信頼度が向上する。本技術は、システム運用管理ツールの基盤技術として利用可能である。   According to the present invention, it is possible to reduce the occurrence of false positives that detect and predict abnormalities, even though no abnormalities actually occur, with regard to detection and prediction of abnormalities in computer systems using log analysis technology. Therefore, the scope of application of log analysis technology to computer system abnormality detection / prediction is expanded, and as a result, the reliability of the computer system is improved. This technology can be used as a basic technology for system operation management tools.

本発明の適用対象とするログ解析方法用いたコンピュータシステムに関する基本的な構成を示すブロック図である。It is a block diagram which shows the fundamental structure regarding the computer system using the log analysis method made into the application object of this invention. 本願発明の第1の実施形態を示し、誤報発生時のログを利用して誤報発生の可能性を検出するコンピュータシステムのブロック図である。1 is a block diagram of a computer system showing a first embodiment of the present invention and detecting the possibility of occurrence of a false alarm using a log when a false alarm occurs. FIG. 誤報発生時のログと現在のログとの比較方法の例を示す説明図で、(A)はログの内容と誤報時のログの内容を示し、(B)は誤報時のログを用いて現在のログから誤報発生の可能性を検出する例を示す。It is explanatory drawing which shows the example of the comparison method of the log at the time of misreporting, and the current log, (A) shows the contents of the log and the contents of the log at the time of misreporting, (B) is the present using the log at the time of misreporting An example of detecting the possibility of the occurrence of false alarms from the log will be shown. 誤報発生可能性を検出した際に異常検出・予測部へ誤報発生の可能性を通知する処理の一例を示すフローチャートである。It is a flowchart which shows an example of the process which notifies the possibility of a misreport generation to an abnormality detection and prediction part, when the possibility of a misreport generation | occurrence | production is detected. 本願発明の第1の実施形態の他の例を示し、誤報発生条件を利用して誤報発生の可能性を検出するコンピュータシステムのブロック図である。It is a block diagram of the computer system which shows the other example of 1st Embodiment of this invention, and detects the possibility of generation | occurrence | production of a misreport using a misreport generation condition. 誤報発生条件を用いて現在のログとの比較方法の例を示す説明図で、(A)はログの内容と誤報時のログの内容を示し、(B)は誤報時のログを用いて現在のログから誤報発生の可能性を検出する例を示す。It is explanatory drawing which shows the example of the comparison method with the present log using false alarm generation conditions, (A) shows the contents of the log and the contents of the log at the time of false alarm, (B) shows the present using the log at the time of false alarm An example of detecting the possibility of the occurrence of false alarms from the log will be shown. 誤報発生条件を用いて誤報発生可能性を検出した際に異常検出・予測部へ誤報発生の可能性を通知する処理の一例を示すフローチャートある。It is a flowchart which shows an example of the process which notifies the possibility of a misreport generation | occurrence | production to an abnormality detection and prediction part, when a misreport generation possibility is detected using a misreport generation condition. 本願発明の第1の実施形態の他の例を示し、誤報発生可能性を検出した際に異常検出・予測部を無効化するコンピュータシステムのブロック図である。It is a block diagram of the computer system which shows the other example of 1st Embodiment of this invention, and invalidates an abnormality detection and prediction part, when the possibility of misreporting is detected. 誤報発生可能性を検出した際に異常検出・予測部を無効化する場合の処理の一例を示すフローチャートである。It is a flowchart which shows an example of a process in the case of invalidating an abnormality detection and prediction part, when the possibility of misreport generation | occurrence | production is detected. 本願発明の第1の実施形態の他の例を示し、誤報発生可能性を検出した際に誤報発生を起す可能性のあるログを削除するコンピュータシステムのブロック図である。It is a block diagram of the computer system which shows the other example of 1st Embodiment of this invention, and deletes the log which may raise | generate a false alarm generation | occurrence | production when the possibility of a false alarm occurrence is detected. 誤報発生可能性を検出した際に誤報発生を起す可能性のあるログを削除する場合の処理の一例を示すフローチャートである。It is a flowchart which shows an example of a process in the case of deleting the log which may raise | generate an erroneous report generation | occurrence | production when the possibility of an erroneous report generation | occurrence | production is detected. 本願発明の第1の実施形態の他の例を示し、誤報発生可能性を検出した際に誤報発生を起す可能性のあるログに印をつけて、異常検出・予測部を変更するコンピュータシステムのブロック図である。Another example of the computer system according to the first embodiment of the present invention, in which a log that may cause a false alarm when a false alarm occurrence is detected is marked and the abnormality detection / prediction unit is changed. It is a block diagram. 誤報発生可能性を検出した際に誤報発生を起す可能性のあるログに印をつけて、異常検出・予測部を変更する場合の処理の一例を示すフローチャートである。It is a flowchart which shows an example of a process in the case of marking the log which may generate | occur | produce a misreport when the misreport generation possibility is detected, and changing an abnormality detection and prediction part. 本願発明の第1の実施形態の他の例を示し、異常検出・予測結果が誤報であることを通知し、誤報発生時のログを記録する方法を適用したコンピュータシステムを示すブロック図である。It is a block diagram which shows the other example of 1st Embodiment of this invention, notifies that an abnormality detection and prediction result is a misinformation, and applies the method of recording the log at the time of misreport occurrence. 誤報発生可能性を検出した際に誤報発生を起す可能性のあるログに印をつけて、異常検出・予測部を変更する場合の処理の一例を示すフローチャートである。It is a flowchart which shows an example of a process in the case of marking the log which may generate | occur | produce a misreport when the misreport generation possibility is detected, and changing an abnormality detection and prediction part. 本願発明の第1の実施形態の他の例を示し、異常検出・予測において誤報が発生する可能性のある条件を設定する方法を適用したコンピュータシステムを示すブロック図である。It is a block diagram which shows the other example of 1st Embodiment of this invention, and shows the computer system to which the method of setting the condition which may generate | occur | produce a false alarm in abnormality detection and prediction is applied. 異常検出・予測において誤報が発生する可能性のある条件を設定する場合の処理の一例を示すフローチャートである。It is a flowchart which shows an example of a process in the case of setting the conditions which may generate | occur | produce a misreport in abnormality detection and prediction. 本願発明の第1の実施形態の他の例を示し、異常検出・予測結果に、誤報発生を起す可能性を検出してログの修正を指令するコンピュータシステムを示すブロック図である。処理のしたことをIt is a block diagram which shows the other example of 1st Embodiment of this invention, and shows the computer system which instruct | indicates the correction | amendment of a log by detecting the possibility of causing misreporting to an abnormality detection and prediction result. What we did 誤報発生を起す可能性を検出してログ修正する手段を含む異常検出・予測結果と、ログ修正を含まない異常検出・予測結果の両方を結果表示する場合のログ解析方法を示すブロック図である。It is a block diagram showing a log analysis method when displaying both an abnormality detection / prediction result including means for correcting a log by detecting the possibility of occurrence of a false alarm and an abnormality detection / prediction result not including log correction . 本発明の第2の実施形態を示し、ログ解析装置のシステムに関する基本的な構成を示すブロック図である。It is a block diagram which shows the 2nd Embodiment of this invention and shows the fundamental structure regarding the system of a log analyzer. 誤報発生通知インタフェースを含むログ解析装置のユーザインタフェースの実施例を示す図である。It is a figure which shows the Example of the user interface of the log analysis apparatus containing a misreport generation notification interface. 誤報発生条件を登録するインタフェースを含むログ解析装置のユーザインタフェースの実施例を示す説明図である。It is explanatory drawing which shows the Example of the user interface of the log analysis apparatus containing the interface which registers a false alarm generation condition. 異常検出・予測結果に、誤報発生を起す可能性を検出してログ修を行うことを示す情報を付加して表示する手段を含むログ解析装置のユーザインタフェースの実施例を示す図である。It is a figure which shows the Example of the user interface of the log analysis apparatus containing the means which adds the information which detects the possibility that a misreport generation | occurrence | production generate | occur | produces to an abnormality detection and prediction result, and performs log repair, and displays it. 誤報発生を起す可能性を検出してログ修正する手段を含む異常検出・予測結果と、含まない異常検出・予測結果の両方を表示する手段を含むログ解析装置のユーザインタフェースの実施例を示す図である。The figure which shows the Example of the user interface of the log analysis apparatus containing the means to display both the abnormality detection / prediction result including the means for correcting the log by detecting the possibility of occurrence of the false alarm and the abnormality detection / prediction result not included It is.

符号の説明Explanation of symbols

101 コンピュータシステム
102 計算機
103 ログ生成部
105、206、409、612、806、1009、1205、1405、1606、1707 ログ解析部
106、207、410、613、807、1010 異常検出・予測部
107 ログ収集部
108 異常判定部
109、1602 結果出力部
111、1604、1706 結果表示部
201、401、601、801、1001 誤報検出部
202 誤報時ログ記憶部
203 誤報時ログパス
204、404、604、805、1005、1006、1601 誤報検出結果パス
205、408 比較器
301 正常時ログ
302 誤報発生時ログ
307、507 現在ログ
308、510 誤報検出時ログ
402 誤報発生条件記憶部
403 誤報発生条件パス
405 誤報発生周期パス
406 ログ入力スイッチ
101 Computer system 102 Computer 103 Log generation unit 105, 206, 409, 612, 806, 1009, 1205, 1405, 1606, 1707 Log analysis unit 106, 207, 410, 613, 807, 1010 Abnormality detection / prediction unit 107 Log collection Unit 108 abnormality determination unit 109, 1602 result output unit 111, 1604, 1706 result display unit 201, 401, 601, 801, 1001 error report detection unit 202 error report log storage unit 203 error report log path 204, 404, 604, 805, 1005 , 1006, 1601 False alarm detection result path 205, 408 Comparator 301 Normal log 302 False alarm log 307, 507 Current log 308, 510 False alarm log 402 False alarm condition storage unit 403 False alarm condition path 405 False alarm cycle 405 06 log input switch

Claims (7)

計算機から出力されるイベント発生のログを解析して、計算機の異常を検出もしくは予測するログ解析方法であって、
前記イベントを識別するためのイベント識別情報と、前記イベントが発生する時刻であるイベント発生時刻と、を対応付けて前記ログの少なくとも一部として保持するステップと、
前記計算機の異常の検出または異常の予測において誤報が発生した場合における前記イベントである第1のイベントを少なくとも1以上含む複数の前記イベントについて、前記イベント識別情報の比較と、前記イベント発生時刻の比較と、を行って、前記第1のイベントの前記イベント発生時刻に関する規則性を示す規則性情報を生成するステップと、
新たに前記計算機からログを受け付けるステップと、
前記新たに受け付けたログを解析して、前記計算機に異常が発生したことを検出、または前記計算機に異常が発生することを予測するステップと、
前記新たに受け付けた前記計算機の異常の検出または異常の予測を行ったログに含まれる前記イベント識別情報と前記イベント発生時刻と、を抽出するステップと、
前記規則性情報を参照し、前記抽出した前記イベント識別情報が前記第1のイベントの前記識別情報と同じで、且つ前記抽出した前記イベント発生時刻が前記規則性を有する場合に、前記計算機の異常の検出または異常の予測において誤報の発生を判定するステップと、
前記誤報が発生と判定されたときには、前記計算機の異常発生の検出または前記計算機の異常発生の予測において誤報の発生を低減するステップと、
を含むことを特徴とするログ解析方法。
It is a log analysis method that analyzes the event occurrence log output from a computer and detects or predicts an abnormality in the computer,
Holding the event identification information for identifying the event and the event occurrence time, which is the time at which the event occurs, in association with each other as at least a part of the log;
A comparison of the event identification information and a comparison of the event occurrence time for a plurality of the events including at least one first event that is the event when a false alarm occurs in the detection of abnormality of the computer or prediction of abnormality And generating regularity information indicating regularity related to the event occurrence time of the first event, and
Receiving a new log from the computer;
Analyzing the newly received log, detecting that an abnormality has occurred in the computer, or predicting that an abnormality has occurred in the computer;
Extracting the event identification information and the event occurrence time included in a log in which the abnormality of the newly received computer is detected or the abnormality is predicted;
If the extracted event identification information is the same as the identification information of the first event with reference to the regularity information, and the extracted event occurrence time has the regularity, the abnormality of the computer Determining the occurrence of false alarms in detecting or predicting anomalies;
When it is determined that the misinformation has occurred, the step of reducing the occurrence of misinformation in the detection of the occurrence of abnormality of the computer or the prediction of the occurrence of abnormality of the computer;
A log analysis method comprising:
請求項1に記載のログ解析方法であって、前記規則性情報が、誤報の発生周期を含む予め設定した発生条件であることを特徴とするログ解析方法。  The log analysis method according to claim 1, wherein the regularity information is a preset generation condition including a generation cycle of a false alarm. 請求項1又は2に記載のログ解析方法であって、前記誤報の発生を低減するステップは、  The log analysis method according to claim 1 or 2, wherein the step of reducing the occurrence of the false alarm includes:
前記誤報の発生が判定されたときには、前記異常の検出または予測の実行を停止し、もしくは、異常の検出結果もしくは予測結果を無効化することにより、誤報の発生を低減することを特徴とするログ解析方法。  When the occurrence of the false alarm is determined, a log that reduces the occurrence of the false alarm by stopping the execution of the abnormality detection or prediction or invalidating the abnormality detection result or the prediction result analysis method.
請求項1又は2に記載のログ解析方法であって、前記誤報の発生を低減するステップは、  The log analysis method according to claim 1 or 2, wherein the step of reducing the occurrence of the false alarm includes:
前記誤報の発生が判定されたときには、前記誤報の発生が予測されるログを前記ログの解析対象から除外することにより、誤報の発生を低減することを特徴とするログ解析方法。  A log analysis method characterized in that, when the occurrence of the false alarm is determined, the occurrence of the false alarm is reduced by excluding the log predicted to generate the false alarm from the analysis target of the log.
請求項1又は2に記載のログ解析方法であって、前記誤報の発生を低減するステップは、  The log analysis method according to claim 1 or 2, wherein the step of reducing the occurrence of the false alarm includes:
前記誤報の発生が判定されたときには、前記誤報を発生させる可能性のあるログに印を付加し、前記印に基づいて前記異常の検出または予測の実行を変更することにより、誤報の発生を低減することを特徴とするログ解析方法。  When the occurrence of the false alarm is determined, a mark is added to a log that may cause the false alarm, and the detection of the abnormality or the execution of the prediction is changed based on the mark to reduce the occurrence of the false alarm. A log analysis method characterized by:
イベント発生のログを出力する計算機と、  A computer that outputs an event occurrence log;
前記計算機から出力されるログを解析して、前記計算機の異常を検出もしくは予測するログ解析部と、を備えたログ解析装置であって、  A log analysis unit comprising: a log analysis unit that analyzes a log output from the computer and detects or predicts an abnormality of the computer;
前記イベントを識別するためのイベント識別情報と、前記イベントが発生する時刻であるイベント発生時刻と、を対応付けて前記ログの少なくとも一部として保持するログ生成手段と、  Log generation means for associating and holding event identification information for identifying the event and an event occurrence time that is a time at which the event occurs as at least a part of the log;
前記新たに受け付けたログを解析して、前記計算機に異常が発生したことを検出、または前記計算機に異常が発生することを予測する異常検出・予測手段と、  Analyzing the newly received log to detect that an abnormality has occurred in the computer, or to detect that an abnormality has occurred in the computer,
前記計算機の異常の検出または異常の予測において誤報が発生した場合における前記イベントである第1のイベントを少なくとも1以上含む複数の前記イベントについて、前記イベント識別情報の比較と、前記イベント発生時刻の比較と、を行って、前記第1のイベントの前記イベント発生時刻に関する規則性を示す規則性情報を記録する誤報ログと、  A comparison of the event identification information and a comparison of the event occurrence time for a plurality of the events including at least one first event that is the event when a false alarm occurs in the detection of abnormality of the computer or prediction of abnormality And a false alarm log that records regularity information indicating regularity related to the event occurrence time of the first event, and
前記計算機の異常の検出または異常の予測において誤報の発生を判定する誤報検出手段と、を備え  A false alarm detection means for determining the occurrence of false alarms in the detection of abnormality of the computer or prediction of abnormality;
前記誤報検出手段は、  The false alarm detection means includes
前記新たに受け付けた前記計算機の異常の検出または異常の予測を行ったログに含まれる前記イベント識別情報と前記イベント発生時刻と、を抽出し、  Extracting the event identification information and the event occurrence time included in the log that has been detected or predicted abnormality of the newly received computer,
前記規則性情報を参照し、前記抽出した前記イベント識別情報が前記第1のイベントの前記識別情報と同じで、且つ前記抽出した前記イベント発生時刻が前記規則性を有する場合に、前記計算機の異常の検出または異常の予測において誤報の発生を判定し、前記誤報が発生と判定されたときには、誤報の発生を低減するよう前記受け付けたログを修正し、または前記ログ解析部を制御することを特徴とするログ解析装置。  If the extracted event identification information is the same as the identification information of the first event with reference to the regularity information, and the extracted event occurrence time has the regularity, the abnormality of the computer The occurrence of a false alarm is determined in the detection of an error or the prediction of an abnormality, and when the false alarm is determined to occur, the received log is corrected or the log analysis unit is controlled to reduce the occurrence of a false alarm. Log analysis device.
計算機から出力されるイベント発生のログを解析して、計算機の異常を検出もしくは予測する処理をログ解析用計算機に実行させるためのプログラムであって、  It is a program for analyzing the event occurrence log output from the computer and causing the log analysis computer to execute processing for detecting or predicting an abnormality in the computer.
前記イベントを識別するためのイベント識別情報と、前記イベントが発生する時刻であるイベント発生時刻と、を対応付けて前記ログの少なくとも一部として保持する手順と、  A procedure for associating event identification information for identifying the event with an event occurrence time, which is a time at which the event occurs, as at least part of the log; and
前記計算機の異常の検出または異常の予測において誤報が発生した場合における前記イベントである第1のイベントを少なくとも1以上含む複数の前記イベントについて、前記イベント識別情報の比較と、前記イベント発生時刻の比較と、を行って、前記第1のイベントの前記イベント発生時刻に関する規則性を示す規則性情報を生成する手順と、  A comparison of the event identification information and a comparison of the event occurrence time for a plurality of the events including at least one first event that is the event when a false alarm occurs in the detection of abnormality of the computer or prediction of abnormality And generating regularity information indicating regularity regarding the event occurrence time of the first event, and
新たに前記計算機からログを受け付ける手順と、  A procedure for newly receiving a log from the computer;
前記新たに受け付けたログを解析して、前記計算機に異常が発生したことを検出、または前記計算機に異常の発生を予測する手順と、  Analyzing the newly received log, detecting that an abnormality has occurred in the computer, or predicting the occurrence of an abnormality in the computer;
前記新たに受け付けた前記計算機の異常の検出または異常の予測を行ったログに含まれる前記イベント識別情報と前記イベント発生時刻と、を抽出する手順と、  A procedure for extracting the event identification information and the event occurrence time included in the log in which the abnormality of the newly accepted computer is detected or the abnormality is predicted;
前記規則性情報を参照し、前記抽出した前記イベント識別情報が前記第1のイベントの前記識別情報と同じで、且つ前記抽出した前記イベント発生時刻が前記規則性を有する場合に、前記計算機の異常の検出または異常の予測において誤報の発生を判定する手順と、  If the extracted event identification information is the same as the identification information of the first event with reference to the regularity information, and the extracted event occurrence time has the regularity, the abnormality of the computer A procedure for determining the occurrence of false alarms in detecting or predicting anomalies,
前記誤報の発生が判定されたときには、前記計算機の異常発生の検出または前記計算機の異常発生の予測において誤報の発生を低減する手順と、  When the occurrence of the false alarm is determined, a procedure for reducing the occurrence of the false alarm in the detection of the abnormality occurrence of the computer or the prediction of the occurrence of the malfunction of the computer;
をログ解析用計算機に実行させるためのプログラム。  Is a program for executing the log analysis computer.
JP2007243570A 2007-09-20 2007-09-20 Log analysis method, log storage device, and program Expired - Fee Related JP4819014B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007243570A JP4819014B2 (en) 2007-09-20 2007-09-20 Log analysis method, log storage device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007243570A JP4819014B2 (en) 2007-09-20 2007-09-20 Log analysis method, log storage device, and program

Publications (3)

Publication Number Publication Date
JP2009075817A JP2009075817A (en) 2009-04-09
JP2009075817A5 JP2009075817A5 (en) 2010-04-02
JP4819014B2 true JP4819014B2 (en) 2011-11-16

Family

ID=40610726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007243570A Expired - Fee Related JP4819014B2 (en) 2007-09-20 2007-09-20 Log analysis method, log storage device, and program

Country Status (1)

Country Link
JP (1) JP4819014B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011125138A1 (en) * 2010-04-06 2011-10-13 株式会社日立製作所 Performance monitoring device, method, and program
JP5541130B2 (en) 2010-12-10 2014-07-09 富士通株式会社 Management device, management method, and management program
WO2013021530A1 (en) * 2011-08-11 2013-02-14 日本電気株式会社 Monitoring apparatus, monitoring method and program
JP5873832B2 (en) * 2013-04-24 2016-03-01 京セラドキュメントソリューションズ株式会社 Electronics
JP6008404B2 (en) * 2014-03-14 2016-10-19 Necフィールディング株式会社 Information management apparatus, information management method, and program
WO2016194212A1 (en) * 2015-06-04 2016-12-08 富士通株式会社 Storage processing device, storage device malfunction determination program, storage device malfunction determination method, and information processing system
US20180365124A1 (en) * 2015-12-14 2018-12-20 Nec Corporation Log analysis system, log analysis method, and log analysis program
CN107291911B (en) * 2017-06-26 2020-01-21 北京奇艺世纪科技有限公司 Anomaly detection method and device
US20210049477A1 (en) * 2018-01-22 2021-02-18 Nec Corporation Anomaly detection device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4892367B2 (en) * 2007-02-02 2012-03-07 株式会社日立システムズ Abnormal sign detection system

Also Published As

Publication number Publication date
JP2009075817A (en) 2009-04-09

Similar Documents

Publication Publication Date Title
JP4819014B2 (en) Log analysis method, log storage device, and program
Gu et al. Online anomaly prediction for robust cluster systems
US11243524B2 (en) System and method for unsupervised root cause analysis of machine failures
JP4859558B2 (en) Computer system control method and computer system
US9152530B2 (en) Telemetry data analysis using multivariate sequential probability ratio test
Tan et al. Adaptive system anomaly prediction for large-scale hosting infrastructures
US8214364B2 (en) Modeling user access to computer resources
US8046637B2 (en) Telemetry data filtering through sequential analysis
US8275735B2 (en) Diagnostic system
CN105512027B (en) Process status monitoring method and device
US11455230B2 (en) Event specific log file generation
US20090293121A1 (en) Deviation detection of usage patterns of computer resources
US9471655B2 (en) Enabling symptom verification
JP2010086099A (en) Log management method, log management device, information processor equipped with log management device, and program
JP2015203936A (en) State monitoring device
US11196613B2 (en) Techniques for correlating service events in computer network diagnostics
US8732525B2 (en) User-coordinated resource recovery
Li et al. Fighting the fog of war: Automated incident detection for cloud systems
US20210224383A1 (en) Abnormality detection device
CN113196311A (en) System and method for identifying and predicting abnormal sensing behavior patterns of a machine
Gabel et al. Latent fault detection in large scale services
KR101444250B1 (en) System for monitoring access to personal information and method therefor
JP2014120001A (en) Monitoring device, monitoring method of monitoring object host, monitoring program, and recording medium
US10474956B2 (en) Detecting deviations between event log and process model
US20170257304A1 (en) Systems and methods for monitoring system performance and availability

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110802

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110831

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees