JPWO2017085921A1 - Log analysis system, method and program - Google Patents

Log analysis system, method and program Download PDF

Info

Publication number
JPWO2017085921A1
JPWO2017085921A1 JP2017551530A JP2017551530A JPWO2017085921A1 JP WO2017085921 A1 JPWO2017085921 A1 JP WO2017085921A1 JP 2017551530 A JP2017551530 A JP 2017551530A JP 2017551530 A JP2017551530 A JP 2017551530A JP WO2017085921 A1 JPWO2017085921 A1 JP WO2017085921A1
Authority
JP
Japan
Prior art keywords
log
variable
unit
analysis
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017551530A
Other languages
Japanese (ja)
Other versions
JP6965748B2 (en
Inventor
遼介 外川
遼介 外川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2017085921A1 publication Critical patent/JPWO2017085921A1/en
Application granted granted Critical
Publication of JP6965748B2 publication Critical patent/JP6965748B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment

Abstract

本発明は、異常の原因を示す規則が定義されていないログに対しても、異常の原因を示唆する情報をユーザに対して出力するログ分析システム、方法およびプログラムを提供する。本発明の一実施形態に係るログ分析システム100は、ログの特性に基づいて予め決められた形式に基づいて分析対象ログ10から変数部分の値を抽出する変数抽出部としてのフォーマット判定部120と、前記変数部分の値に基づいて、前記分析対象ログの重み付けを行うログ分析部としての重み付け部140、を備える。
The present invention provides a log analysis system, method, and program for outputting information suggesting the cause of an abnormality to a user even for a log in which a rule indicating the cause of the abnormality is not defined. A log analysis system 100 according to an embodiment of the present invention includes a format determination unit 120 as a variable extraction unit that extracts a value of a variable portion from an analysis target log 10 based on a format determined in advance based on log characteristics And a weighting unit 140 as a log analysis unit for weighting the analysis target log based on the value of the variable part.

Description

本発明は、ログの分析を行うためのログ分析システム、方法およびプログラムに関する。   The present invention relates to a log analysis system, method, and program for performing log analysis.

一般的にコンピュータ上で実行されるシステムにおいては、複数の装置およびプログラムから、イベントの結果やメッセージ等を含むログが出力される。ログ分析システムは、出力されたログの中から所定の基準に従って異常なものを検出し、異常なログとしてユーザ(オペレータ等)に対して出力する。   Generally, in a system executed on a computer, logs including event results, messages, and the like are output from a plurality of devices and programs. The log analysis system detects an abnormal thing according to a predetermined standard from the outputted logs, and outputs it to a user (operator or the like) as an abnormal log.

システムにおいては複数の装置およびプログラムが協同して働いているため、単一の異常なログから異常の原因を直接特定できないことがある。その場合には、ユーザは多数のログを参照して異常の原因を探る必要がある。特に経験や知識の少ないユーザは、ログから異常の原因にたどり着くまでに多大な時間を要する。   Since a plurality of devices and programs work together in the system, the cause of the abnormality may not be directly identified from a single abnormal log. In that case, the user needs to search the cause of the abnormality by referring to a large number of logs. In particular, a user with little experience or knowledge takes a long time to reach the cause of the abnormality from the log.

特許文献1には、過去の知識に基づいて予めイベントパターンとその原因や対策方法とを関連付けて登録しておき、入力ログのイベントパターンに対する原因や対策方法を取得する技術が開示されている。特許文献1の技術を用いることによって、ユーザは登録済のイベントパターンに対する原因を素早く知ることができる。   Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for previously registering an event pattern and its cause and countermeasure method in association with each other based on past knowledge, and acquiring the cause and countermeasure method for the event pattern of the input log. By using the technique of Patent Document 1, the user can quickly know the cause for the registered event pattern.

また、特許文献2には、ログから構成部品を示す箇所を特定し、予め定められた影響度リストから該構成部品に対応する影響度を決定し、該影響度に基づいて該ログの重要度を設定する技術が開示されている。   Further, in Patent Document 2, a location indicating a component is specified from a log, an influence corresponding to the component is determined from a predetermined influence list, and the importance of the log is determined based on the influence. A technique for setting is disclosed.

特許第4318643号公報Japanese Patent No. 4318643 特開2013−030092号公報JP 2013-030092 A

しかしながら、特許文献1の技術は登録済のイベントパターンに対する原因を取得できるものの、登録されていないイベントパターンに対する原因を取得することができない。すなわち、特許文献1の技術は、知識に基づく規則を予め個別に定義することによって異常の原因を示すものであるため、異常の原因に関して予め定義された知識(情報)がないログに対して適用することができない。   However, although the technique of Patent Document 1 can acquire a cause for a registered event pattern, it cannot acquire a cause for an unregistered event pattern. That is, since the technique of Patent Document 1 indicates the cause of abnormality by defining rules based on knowledge individually in advance, it is applied to a log that does not have knowledge (information) defined in advance regarding the cause of abnormality. Can not do it.

また、特許文献2の技術は、影響度リストに構成部品毎の影響度が予め登録されている必要がある。そのため、特許文献2の技術は、構成部品毎に予め定義された知識(情報)が前提となっており、構成部品毎の知識がないログに対して適用することができない。   Further, the technique of Patent Document 2 requires that the degree of influence for each component is registered in advance in the degree of influence list. For this reason, the technique of Patent Document 2 is premised on knowledge (information) defined in advance for each component, and cannot be applied to a log having no knowledge for each component.

本発明は、上述の問題に鑑みて行われたものであって、異常の原因を示す規則が定義されていないログに対しても、異常の原因を示唆する情報をユーザに対して出力するログ分析システム、方法およびプログラムを提供することを目的とする。   The present invention has been made in view of the above-described problem, and a log that outputs information indicating the cause of an abnormality to a user even for a log in which a rule indicating the cause of the abnormality is not defined An object is to provide an analysis system, method and program.

本発明の第1の態様は、ログ分析システムであって、ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する変数抽出部と、前記変数部分の値に基づいて、前記分析対象ログの重み付けを行うログ分析部と、を備える。   A first aspect of the present invention is a log analysis system, comprising: a variable extraction unit that extracts a value of a variable part from an analysis target log based on a format determined in advance based on characteristics of the log; and A log analysis unit that weights the analysis target log based on the value.

本発明の第2の態様は、ログ分析方法であって、ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する工程と、前記変数部分の値に基づいて、前記分析対象ログの重み付けを行う工程と、を備える。   According to a second aspect of the present invention, there is provided a log analysis method, the step of extracting a value of a variable part from an analysis target log based on a format predetermined based on a characteristic of the log, and the value of the variable part. And a step of weighting the analysis target log.

本発明の第3の態様は、ログ分析プログラムであって、コンピュータに、ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する工程と、前記変数部分の値に基づいて、前記分析対象ログの重み付けを行う工程と、を実行させる。   According to a third aspect of the present invention, there is provided a log analysis program, comprising: extracting a value of a variable part from an analysis target log based on a format predetermined based on a log characteristic; And a step of weighting the analysis target log based on the value of.

本発明によれば、分析対象ログに含まれる変数部分の値に基づいて重み付けを行うため、ユーザが異常なログ又は異常なログに含まれる変数部分の値を参照して異常の原因を探ることが容易になる。   According to the present invention, since weighting is performed based on the value of the variable part included in the analysis target log, the user searches for the cause of the abnormality by referring to the abnormal log or the value of the variable part included in the abnormal log. Becomes easier.

第1の実施形態に係るログ分析システムのブロック図である。It is a block diagram of the log analysis system concerning a 1st embodiment. 第1の実施形態に係る分析対象ログの模式図である。It is a schematic diagram of the analysis object log which concerns on 1st Embodiment. 第1の実施形態に係るフォーマットの模式図である。It is a schematic diagram of a format according to the first embodiment. 第1の実施形態に係る重み付け結果の模式図である。It is a schematic diagram of the weighting result which concerns on 1st Embodiment. 第1の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 1st Embodiment. 第1の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 1st Embodiment. 第1の実施形態に係るログ分析システムの概略構成図である。1 is a schematic configuration diagram of a log analysis system according to a first embodiment. 第1の実施形態に係るログ分析システムを用いるログ分析方法のフローチャートを示す図である。It is a figure which shows the flowchart of the log analysis method using the log analysis system which concerns on 1st Embodiment. 第1の実施形態の変形例に係るログ分析システムのブロック図である。It is a block diagram of the log analysis system concerning the modification of a 1st embodiment. 第1の実施形態の変形例に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on the modification of 1st Embodiment. 第1の実施形態の変形例に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on the modification of 1st Embodiment. 第1の実施形態の変形例に係るログ分析システムのブロック図である。It is a block diagram of the log analysis system concerning the modification of a 1st embodiment. 第2の実施形態に係るログ分析システムのブロック図である。It is a block diagram of the log analysis system concerning a 2nd embodiment. 第2の実施形態に係る分布情報の模式図である。It is a schematic diagram of the distribution information which concerns on 2nd Embodiment. 第2の実施形態に係る分布情報の模式図である。It is a schematic diagram of the distribution information which concerns on 2nd Embodiment. 第2の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 2nd Embodiment. 第2の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 2nd Embodiment. 第2の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 2nd Embodiment. 第2の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 2nd Embodiment. 第3の実施形態に係るログ分析システムのブロック図である。It is a block diagram of the log analysis system concerning a 3rd embodiment. 第3の実施形態に係る組み合わせ情報の模式図である。It is a schematic diagram of the combination information which concerns on 3rd Embodiment. 第3の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 3rd Embodiment. 第3の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 3rd Embodiment. 第3の実施形態に係る重み付け結果の表示画面を示す模式図である。It is a schematic diagram which shows the display screen of the weighting result which concerns on 3rd Embodiment. 第3の実施形態の変形例に係るログ分析システムのブロック図である。It is a block diagram of the log analysis system concerning the modification of a 3rd embodiment. 各実施形態に係るログ分析システムの概略構成図である。1 is a schematic configuration diagram of a log analysis system according to each embodiment.

以下、図面を参照して、本発明の実施形態を説明するが、本発明は本実施形態に限定されるものではない。なお、以下で説明する図面で、同機能を有するものは同一符号を付け、その繰り返しの説明は省略することもある。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. However, the present invention is not limited to the embodiments. In the drawings described below, components having the same function are denoted by the same reference numerals, and repeated description thereof may be omitted.

(第1の実施形態)
図1は、本実施形態に係るログ分析システム100のブロック図である。図1において、矢印は主なデータの流れを示しており、図1に示したもの以外のデータの流れがあってよい。図1において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図1に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に別れて実装されてよい。ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。
(First embodiment)
FIG. 1 is a block diagram of a log analysis system 100 according to the present embodiment. In FIG. 1, arrows indicate main data flows, and there may be data flows other than those shown in FIG. In FIG. 1, each block shows a functional unit configuration, not a hardware (device) unit configuration. Therefore, the blocks shown in FIG. 1 may be implemented in a single device, or may be separately implemented in a plurality of devices. Data exchange between the blocks may be performed via any means such as a data bus, a network, a portable storage medium, or the like.

ログ分析システム100は、処理部として、ログ入力部110、フォーマット判定部120、ログ異常分析部130、重み付け部140および出力部150を備える。また、ログ分析システム100は、記憶部として、フォーマット記憶部161およびモデル記憶部162を備える。   The log analysis system 100 includes a log input unit 110, a format determination unit 120, a log abnormality analysis unit 130, a weighting unit 140, and an output unit 150 as processing units. In addition, the log analysis system 100 includes a format storage unit 161 and a model storage unit 162 as storage units.

ログ入力部110は、分析対象ログ10を取得し、ログ分析システム100に入力する。分析対象ログ10は、ログ分析システム100の外部から取得されてよく、あるいはログ分析システム100の内部に予め記録されたものを読み出すことにより取得されてよい。分析対象ログ10は、1つ以上の装置又はプログラムから出力される1つ以上のログを含む。分析対象ログ10は、任意のデータ形式(ファイル形式)で表されたログであり、例えばバイナリデータ又はテキストデータでよい。また、分析対象ログ10はデータベースのテーブルとして記録されてよく、あるいはテキストファイルとして記録されてよい。   The log input unit 110 acquires the analysis target log 10 and inputs it to the log analysis system 100. The analysis target log 10 may be acquired from the outside of the log analysis system 100, or may be acquired by reading what is recorded in advance in the log analysis system 100. The analysis target log 10 includes one or more logs output from one or more devices or programs. The analysis target log 10 is a log expressed in an arbitrary data format (file format), and may be binary data or text data, for example. The analysis target log 10 may be recorded as a database table or may be recorded as a text file.

図2Aは、例示的な分析対象ログ10の模式図である。本実施形態における分析対象ログ10は、装置又はプログラムから出力される1つのログを1単位とし、1つ以上の任意の数のログを含む。1つのログは1行の文字列でよく、あるいは複数行の文字列でよい。すなわち、分析対象ログ10は分析対象ログ10に含まれるログの総体を指し、ログは分析対象ログ10から抜き出された1つのログを指す。各ログは、タイムスタンプおよびメッセージ等を含む。ログ分析システム100は、特定の種類のログに限らず、広範な種類のログを分析対象とすることができる。例えば、syslog、イベントログ等のオペレーティングシステムから出力されるメッセージを記録するログを分析対象ログ10として用いることができる。また、IDS(Intrusion Detection System)やIPS(Intrusion Prevention System)等、ネットワーク上のセキュリティ装置のログも分析対象ログ10として用いることができる。   FIG. 2A is a schematic diagram of an exemplary analysis target log 10. The analysis target log 10 in this embodiment includes one log output from the apparatus or program as one unit, and includes one or more arbitrary numbers of logs. One log may be a single-line character string, or may be a multi-line character string. That is, the analysis target log 10 indicates the total number of logs included in the analysis target log 10, and the log indicates one log extracted from the analysis target log 10. Each log includes a time stamp and a message. The log analysis system 100 is not limited to a specific type of log, and can analyze a wide variety of logs. For example, a log that records a message output from an operating system such as a syslog or an event log can be used as the analysis target log 10. In addition, a log of a security device on the network such as IDS (Instruction Detection System) or IPS (Intrusion Prevention System) can also be used as the analysis target log 10.

フォーマット判定部120は、変数抽出部であり、分析対象ログ10に含まれる各ログに対して、フォーマット記憶部161に予め記録されているいずれのフォーマットに適合するかを判定し、適合するフォーマットを用いて各ログを変数部分と定数部分とに分離する。フォーマットとは、ログの特性に基づいて予め決められた、ログの形式である。ログの特性は、互いに類似するログ間で変化しやすい又は変化しづらいという性質や、ログ中で変化しやすい部分とみなせる文字列が記載されているという性質を含む。変数部分とはフォーマットの中で変化可能な部分であり、定数部分とはログのフォーマットの中で変化しない部分である。入力されたログ中の変数部分の値(数値、文字列およびその他のデータを含む)を変数値と呼ぶ。変数部分および定数部分はフォーマット毎に異なる。そのため、あるフォーマットでは変数部分として定義される部分が、別のフォーマットでは定数部分として定義されることや、その逆があり得る。本実施形態では、このようにログの特性に基づいて決められたフォーマットを用いてログの分析を行うため、異常の原因であるイベントパターンや構成部品等の知識がなくても、異常の原因を示唆する情報を提供することができる。   The format determination unit 120 is a variable extraction unit, determines which format recorded in advance in the format storage unit 161 for each log included in the analysis target log 10, and selects a compatible format. To separate each log into variable and constant parts. The format is a log format determined in advance based on log characteristics. The log characteristics include a property that it is easy or difficult to change between logs that are similar to each other, and a property that a character string that can be regarded as a portion that easily changes in the log is described. The variable portion is a changeable portion in the format, and the constant portion is a portion that does not change in the log format. The value of the variable part in the input log (including numerical values, character strings, and other data) is called a variable value. The variable part and the constant part are different for each format. Therefore, a part defined as a variable part in one format may be defined as a constant part in another format, and vice versa. In this embodiment, since the log is analyzed using the format determined based on the characteristics of the log in this way, the cause of the abnormality can be determined without knowledge of the event pattern or the component that is the cause of the abnormality. Suggestive information can be provided.

図2Bは、フォーマット記憶部161に記録される例示的なフォーマットの模式図である。フォーマットは、一意のIDに関連付けられたフォーマットを表す文字列を含む。フォーマットは、ログ中の変化可能な部分に所定の識別子を記載することによって変数部分として規定し、ログ中の変数部分以外の部分を定数部分として規定する。変数部分の識別子として、例えば「<変数:タイムスタンプ>」はタイムスタンプを表す変数部分を示し、「<変数:文字列>」は任意の文字列を表す変数部分を示し、「<変数:数値>」は任意の数値を表す変数部分を示し、「<変数:IP>」は任意のIPアドレスを表す変数部分を示す。変数の識別子はこれらに限られず、正規表現や、取り得る値のリスト等の任意の方法により定義されてよい。また、フォーマットは変数部分を含まずに定数部分のみによって構成されてよく、あるいは定数部分を含まずに変数部分のみによって構成されてよい。   FIG. 2B is a schematic diagram of an exemplary format recorded in the format storage unit 161. The format includes a character string that represents the format associated with the unique ID. The format is defined as a variable part by describing a predetermined identifier in a variable part in the log, and a part other than the variable part in the log is defined as a constant part. For example, “<variable: timestamp>” indicates a variable portion representing a time stamp, “<variable: character string>” indicates a variable portion representing an arbitrary character string, and “<variable: numerical value”. ">" Represents a variable part representing an arbitrary numerical value, and "<variable: IP>" represents a variable part representing an arbitrary IP address. Variable identifiers are not limited to these, and may be defined by an arbitrary method such as a regular expression or a list of possible values. Further, the format may be configured only by the constant part without including the variable part, or may be configured only by the variable part without including the constant part.

例えば、フォーマット判定部120は、図2Aの3行目のログを、図2BのIDが223であるフォーマットに適合すると判定する。そして、フォーマット判定部120は、判定されたフォーマットに基づいて該ログを処理し、タイムスタンプである「2015/08/17 08:29:59」、文字列である「SV008」およびIPアドレスである「192.168.1.23」を変数値として決定する。   For example, the format determination unit 120 determines that the log in the third row in FIG. 2A is compatible with the format whose ID is 223 in FIG. 2B. Then, the format determination unit 120 processes the log based on the determined format, and includes “2015/08/17 08:29:59” as a time stamp, “SV008” as a character string, and an IP address. “192.168.1.23” is determined as a variable value.

図2Bにおいて、フォーマットは視認性のために文字列のリストで表されているが、任意のデータ形式(ファイル形式)で表されてよく、例えばバイナリデータ又はテキストデータでよい。また、フォーマットはテキストファイルとしてフォーマット記憶部161に記録されてよく、あるいはデータベースのテーブルとしてフォーマット記憶部161に記録されてよい。   In FIG. 2B, the format is represented by a list of character strings for visibility, but may be represented in any data format (file format), for example, binary data or text data. The format may be recorded as a text file in the format storage unit 161 or may be recorded in the format storage unit 161 as a database table.

ログ異常分析部130は、フォーマット判定部120により判定されたログ中の変数値に対して、モデル記憶部162に予め記録されているモデルに基づいて異常か否かを判定する。モデルとは、ログの正常な振る舞いの定義である。モデル記憶部162には、1つ以上のモデルが予め記録されている。モデルは、例えばあるフォーマットにおいて数値の変数値が所定の範囲内であること、あるフォーマットにおいて文字列の変数値が登録済のものであること等である。モデルはこれに限られず、任意の定義でよい。   The log abnormality analysis unit 130 determines whether the variable value in the log determined by the format determination unit 120 is abnormal based on a model recorded in advance in the model storage unit 162. A model is a definition of the normal behavior of a log. One or more models are recorded in the model storage unit 162 in advance. The model is, for example, that a numeric variable value is within a predetermined range in a certain format, or that a character string variable value is already registered in a certain format. The model is not limited to this, and any definition may be used.

ログ異常分析部130は、入力されたログがモデル記憶部162中のいずれのモデルにも適合しない場合に該ログは異常であると判定し、異常ログとして次の重み付け部140に入力する。一方、ログ異常分析部130は、入力されたログがモデル記憶部162中のいずれかのモデルに適合する場合に該ログは正常ログであると判定し、重み付け部140に入力しない。   The log abnormality analysis unit 130 determines that the log is abnormal when the input log does not match any model in the model storage unit 162, and inputs the log to the next weighting unit 140 as an abnormality log. On the other hand, when the input log matches any model in the model storage unit 162, the log abnormality analysis unit 130 determines that the log is a normal log and does not input the log to the weighting unit 140.

重み付け部140は、ログ分析部であり、ログ異常分析部130から出力される異常ログに対して重み付けを行う。本実施形態において、重み付け部140は、まずログ異常分析部130から入力された複数の異常ログに含まれる変数値のうち、2つ以上の異常ログに共通して含まれる変数値を抽出する。2つ以上の異常ログに共通して含まれる変数値を、共通変数値と呼ぶ。さらに、重み付け部140は、各共通変数値が、ログ異常分析部130から入力された複数の異常ログの中に出現する数(頻度)を算出する。そして、重み付け部140は、共通変数値と算出された頻度とを関連付け、頻度が大きい共通変数値ほど上位になるように重み付けをして重み付け結果として出力する。換言すると、本実施形態においては、異常ログの一部である変数値が2つ以上の異常ログに含まれるか否か、およびその変数値の異常ログ中の出現頻度に基づいて、異常ログの重み付けを行う。複数の異常ログに含まれる変数値は異常の原因である又は異常と何らかの関係がある蓋然性が高い。そのため、ログ分析システム100はユーザにこのような変数値を知らせることによって、ユーザが異常の原因を特定することを容易にすることができる。   The weighting unit 140 is a log analysis unit, and weights the abnormality log output from the log abnormality analysis unit 130. In the present embodiment, the weighting unit 140 first extracts a variable value that is commonly included in two or more abnormality logs from among the variable values included in the plurality of abnormality logs input from the log abnormality analysis unit 130. A variable value that is commonly included in two or more abnormality logs is referred to as a common variable value. Furthermore, the weighting unit 140 calculates the number (frequency) at which each common variable value appears in the plurality of abnormality logs input from the log abnormality analysis unit 130. Then, the weighting unit 140 associates the common variable value with the calculated frequency, weights the common variable value with a higher frequency so as to be higher, and outputs the weighted result. In other words, in this embodiment, based on whether or not a variable value that is a part of the abnormality log is included in two or more abnormality logs, and the frequency of occurrence of the variable value in the abnormality log, Perform weighting. There is a high probability that the variable values included in the plurality of abnormality logs are the cause of the abnormality or have some relationship with the abnormality. Therefore, the log analysis system 100 can make it easier for the user to identify the cause of the abnormality by notifying the user of such a variable value.

図2Cは、重み付け部140による例示的な重み付け結果を示す模式図である。重み付け結果は、共通変数値と、算出された頻度と、頻度が大きい順に与えられた順位とを含む。図2Cにおいて、重み付け結果は視認性のために文字列および数値のリストで表されているが、任意のデータ形式(ファイル形式)で表されてよく、例えばバイナリデータ又はテキストデータでよい。   FIG. 2C is a schematic diagram illustrating an exemplary weighting result by the weighting unit 140. The weighting result includes a common variable value, a calculated frequency, and a ranking given in descending order of frequency. In FIG. 2C, the weighting result is represented by a list of character strings and numerical values for visibility, but may be represented in an arbitrary data format (file format), for example, binary data or text data.

出力部150は、重み付け部140による重み付け結果の出力を行う。本実施形態において、出力部150は表示装置20に重み付け結果を出力し、表示装置20はユーザに向けて重み付け結果を画像として表示する。表示装置20は、画像を表示するための液晶ディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等の表示部を備える。   The output unit 150 outputs the weighting result from the weighting unit 140. In the present embodiment, the output unit 150 outputs the weighting result to the display device 20, and the display device 20 displays the weighting result as an image for the user. The display device 20 includes a display unit such as a liquid crystal display or a CRT (Cathode Ray Tube) display for displaying an image.

図3A、3Bは、表示装置20を用いる例示的な重み付け結果の表示画面を示す模式図である。図3Aに示す画面Aは、重み付け部140による重み付け結果に従って並び替えられた共通変数値およびその順位を表示する。共通変数値は、順位が高い、すなわち頻度が大きいほど上位に表示される。さらに画面Aにおいて、最上位の変数値である「SV008」は、太字および下線によって強調表示されている。これにより、ユーザは異常の原因である蓋然性が高い変数値を容易に知ることができる。上位の変数値を強調するために、変数値の文字種、色、大きさ等を変化させてもよい。   FIGS. 3A and 3B are schematic diagrams illustrating exemplary weighting result display screens using the display device 20. Screen A shown in FIG. 3A displays the common variable values rearranged according to the weighting results by weighting section 140 and their ranks. The common variable value is displayed higher as the rank is higher, that is, as the frequency is higher. Furthermore, on the screen A, “SV008” which is the highest-order variable value is highlighted by bold and underline. Thereby, the user can easily know a variable value having a high probability of causing an abnormality. In order to emphasize the upper variable value, the character type, color, size, etc. of the variable value may be changed.

図3Bに示す画面Bは、重み付け部140による重み付け結果に従って並び替えられた共通変数値およびその順位に加え、ログ異常分析部130から出力される異常ログのうち該共通変数値を含むものを表示する。さらに画面Bにおいて、最上位の変数値である「SV008」は、異常ログ中で太字および下線によって強調表示されている。これにより、ユーザは異常の原因である蓋然性が高い変数値、およびそのログ中の出現箇所を容易に知ることができる。上位の変数値を強調するために、変数値の文字種、色、大きさ等を変化させてもよい。   Screen B shown in FIG. 3B displays the common variable values rearranged according to the weighting result by weighting unit 140 and their ranks, and the abnormality log output from log abnormality analysis unit 130 including the common variable value. To do. Further, on the screen B, “SV008” which is the highest variable value is highlighted in bold and underlined in the abnormality log. As a result, the user can easily know the variable value that is highly likely to cause an abnormality and the appearance location in the log. In order to emphasize the upper variable value, the character type, color, size, etc. of the variable value may be changed.

図3A、3Bに示す画面は一例であり、重み付け部140による重み付け結果がユーザにわかるようにログ又はログの一部である変数値を表示できれば、いずれの表示方法を用いてもよい。   The screens shown in FIGS. 3A and 3B are examples, and any display method may be used as long as the log or a variable value that is a part of the log can be displayed so that the weighting result by the weighting unit 140 can be understood by the user.

重み付け結果に含まれる共通変数値は、2つ以上の異常ログに含まれる。そのため、ユーザは図3A、3Bの画面に表示された共通変数値が異常の原因である蓋然性が高いと推測することができる。さらに、重み付け結果の中で上位の共通変数値ほど異常ログの中で出現頻度が大きいため、ユーザは画面に表示された共通変数値の中で上位のものが異常の原因である蓋然性が高いと推測することができる。   The common variable value included in the weighting result is included in two or more abnormality logs. Therefore, the user can estimate that the probability that the common variable value displayed on the screens of FIGS. 3A and 3B is the cause of the abnormality is high. Furthermore, since the higher common variable value in the weighting result has a higher appearance frequency in the abnormality log, the user has a higher probability that the upper one among the common variable values displayed on the screen is the cause of the abnormality. Can be guessed.

重み付け結果の出力方法は、ユーザに向けた画像表示に限られない。例えば、出力部150は重み付け結果をデータとして出力し、ログ分析システム100又はその他システムは出力部150からの重み付け結果のデータに対して分析処理、統計処理等を行ってもよい。ログ分析システム100又はその他システムは、出力部150からの重み付け結果のデータに基づいて、自動的に異常の原因を判定してもよい。   The output method of the weighting result is not limited to image display for the user. For example, the output unit 150 may output the weighting result as data, and the log analysis system 100 or other system may perform analysis processing, statistical processing, or the like on the weighting result data from the output unit 150. The log analysis system 100 or other system may automatically determine the cause of the abnormality based on the weighted result data from the output unit 150.

図4は、本実施形態に係るログ分析システム100の例示的な機器構成を示す概略構成図である。ログ分析システム100は、CPU(Central Processing Unit)101と、メモリ102と、記憶装置103と、通信インターフェース104とを備える。ログ分析システム100は、表示装置20に通信インターフェース104を介して接続されてよく、あるいは表示装置20を含んでよい。ログ分析システム100は独立した装置でよく、あるいは他の装置と一体に構成されてよい。   FIG. 4 is a schematic configuration diagram illustrating an exemplary device configuration of the log analysis system 100 according to the present embodiment. The log analysis system 100 includes a CPU (Central Processing Unit) 101, a memory 102, a storage device 103, and a communication interface 104. The log analysis system 100 may be connected to the display device 20 via the communication interface 104 or may include the display device 20. The log analysis system 100 may be an independent device or may be integrated with other devices.

通信インターフェース104は、データの送受信を行う通信部であり、有線通信および無線通信の少なくとも一方の通信方式を実行可能に構成される。通信インターフェース104は、該通信方式に必要なプロセッサ、電気回路、アンテナ、接続端子等を含む。通信インターフェース104は、CPU101からの信号に従って、該通信方式を用いてネットワークに接続され、通信を行う。通信インターフェース104は、例えば分析対象ログ10を外部から受信する。   The communication interface 104 is a communication unit that transmits and receives data, and is configured to be able to execute at least one communication method of wired communication and wireless communication. The communication interface 104 includes a processor, an electric circuit, an antenna, a connection terminal, and the like necessary for the communication method. The communication interface 104 is connected to a network using the communication method in accordance with a signal from the CPU 101 to perform communication. For example, the communication interface 104 receives the analysis target log 10 from the outside.

記憶装置103は、ログ分析システム100が実行するプログラムや、プログラムによる処理結果のデータ等を記憶する。記憶装置103は、読み取り専用のROM(Read Only Memory)や、読み書き可能のハードディスクドライブ又はフラッシュメモリ等を含む。また、記憶装置103は、CD−ROM等のコンピュータ読取可能な可搬記憶媒体を含んでもよい。メモリ102は、CPU101が処理中のデータや記憶装置103から読み出されたプログラムおよびデータを一時的に記憶するRAM(Random Access Memory)等を含む。   The storage device 103 stores a program executed by the log analysis system 100, data of a processing result by the program, and the like. The storage device 103 includes a read-only ROM (Read Only Memory), a readable / writable hard disk drive, a flash memory, or the like. The storage device 103 may include a computer-readable portable storage medium such as a CD-ROM. The memory 102 includes a RAM (Random Access Memory) that temporarily stores data being processed by the CPU 101, a program read from the storage device 103, and data.

CPU101は、処理に用いる一時的なデータをメモリ102に一時的に記録し、記憶装置103に記録されたプログラムを読み出し、該プログラムに従って該一時的なデータに対して種々の演算、制御、判別などの処理動作を実行する処理部としてのプロセッサである。また、CPU101は、記憶装置103に処理結果のデータを記録し、また通信インターフェース104を介して処理結果のデータを外部に送信する。   The CPU 101 temporarily records temporary data used for processing in the memory 102, reads a program recorded in the storage device 103, and performs various calculations, control, discrimination, etc. on the temporary data according to the program It is a processor as a process part which performs these processing operations. In addition, the CPU 101 records processing result data in the storage device 103 and transmits processing result data to the outside via the communication interface 104.

本実施形態においてCPU101は、記憶装置103に記録されたプログラムを実行することによって、図1のログ入力部110、フォーマット判定部120、ログ異常分析部130、重み付け部140および出力部150として機能する。また、本実施形態において記憶装置103は、図1のフォーマット記憶部161およびモデル記憶部162として機能する。   In this embodiment, the CPU 101 functions as the log input unit 110, the format determination unit 120, the log abnormality analysis unit 130, the weighting unit 140, and the output unit 150 in FIG. 1 by executing a program recorded in the storage device 103. . In the present embodiment, the storage device 103 functions as the format storage unit 161 and the model storage unit 162 in FIG.

ログ分析システム100は、図4に示す具体的な構成に限定されない。ログ分析システム100は、1つの装置に限られず、2つ以上の物理的に分離した装置が有線又は無線で接続されることにより構成されていてもよい。ログ分析システム100に含まれる各部は、それぞれ電気回路構成により実現されていてもよい。ここで、電気回路構成とは、単一のデバイス、複数のデバイス、チップセット又はクラウドを概念的に含む文言である。   The log analysis system 100 is not limited to the specific configuration shown in FIG. The log analysis system 100 is not limited to a single device, and may be configured by connecting two or more physically separated devices in a wired or wireless manner. Each unit included in the log analysis system 100 may be realized by an electric circuit configuration. Here, the electric circuit configuration is a term that conceptually includes a single device, a plurality of devices, a chipset, or a cloud.

また、ログ分析システム100の少なくとも一部がSaaS(Software as a Service)形式で提供されてよい。すなわち、ログ分析システム100を実現するための機能の少なくとも一部が、ネットワーク経由で実行されるソフトウェアによって実行されてよい。   In addition, at least a part of the log analysis system 100 may be provided in SaaS (Software as a Service) format. That is, at least a part of functions for realizing the log analysis system 100 may be executed by software executed via a network.

図5は、本実施形態に係るログ分析システム100を用いるログ分析方法のフローチャートを示す図である。まず、ログ入力部110は、分析対象ログ10を取得し、ログ分析システム100に入力する(ステップS101)。フォーマット判定部120は、ステップS101で入力された分析対象ログ10に含まれる1つのログを判定対象として、フォーマット記憶部161に記録されたいずれかのフォーマットに適合するか否かを判定する(ステップS102)。   FIG. 5 is a diagram illustrating a flowchart of a log analysis method using the log analysis system 100 according to the present embodiment. First, the log input unit 110 acquires the analysis target log 10 and inputs it to the log analysis system 100 (step S101). The format determination unit 120 determines whether one format included in the analysis target log 10 input in step S101 is a determination target, and is compatible with any of the formats recorded in the format storage unit 161 (step) S102).

ステップS102において判定対象のログがフォーマット記憶部161に記録されたいずれのフォーマットにも適合しない場合には(ステップS103のNO)、分析対象ログ10の次のログを判定対象としてステップS102〜S103を繰り返す。   If the determination target log does not conform to any format recorded in the format storage unit 161 in step S102 (NO in step S103), steps S102 to S103 are performed with the next log of the analysis target log 10 as the determination target. repeat.

ステップS102において判定対象のログがフォーマット記憶部161に記録されたいずれかのフォーマットに適合した場合には(ステップS103のYES)、フォーマット判定部120は、該フォーマットを用いて判定対象のログを変数部分と定数部分とに分離する(ステップS104)。フォーマット判定部120は、判定対象のログ中の変数値を記録する。   If the determination target log matches any format recorded in the format storage unit 161 in step S102 (YES in step S103), the format determination unit 120 uses the format to change the determination target log to a variable. A part and a constant part are separated (step S104). The format determination unit 120 records the variable value in the determination target log.

ログ異常分析部130は、ステップS104において取得された変数値に基づいて、判定対象のログがモデル記憶部162に記録されたいずれかのモデルに適合するか否かを判定する(ステップS105)。ログ異常分析部130は、判定対象のログがモデル記憶部162に記録されたいずれのモデルにも適合しない場合には、判定対象のログは異常ログであると判定する。一方、ログ異常分析部130は、判定対象のログがモデル記憶部162に記録されたいずれかのモデルに適合する場合には、判定対象のログは正常ログであると判定する。   The log abnormality analysis unit 130 determines whether or not the determination target log matches any model recorded in the model storage unit 162 based on the variable value acquired in step S104 (step S105). When the determination target log does not match any model recorded in the model storage unit 162, the log abnormality analysis unit 130 determines that the determination target log is an abnormality log. On the other hand, when the determination target log matches any model recorded in the model storage unit 162, the log abnormality analysis unit 130 determines that the determination target log is a normal log.

分析対象ログ10中の全てのログに対して分析が終了していない場合には(ステップS106のNO)、分析対象ログ10の次のログを判定対象としてステップS102〜S106を繰り返す。   If the analysis has not been completed for all the logs in the analysis target log 10 (NO in step S106), steps S102 to S106 are repeated with the next log of the analysis target log 10 as a determination target.

分析対象ログ10中の全てのログに対して分析が終了した場合には(ステップS106のYES)、重み付け部140は、ステップS105において判定された異常ログに含まれる変数値のうち、2つ以上の異常ログに共通して含まれる変数値(共通変数値)を抽出し、各共通変数値が異常ログの中に出現する数(頻度)を算出する。そして、重み付け部140は、取得された共通変数値と頻度とを関連付け、頻度が大きいほど上位になるように重み付けをして重み付け結果として出力する(ステップS107)。   When the analysis is completed for all the logs in the analysis target log 10 (YES in step S106), the weighting unit 140 selects two or more of the variable values included in the abnormality log determined in step S105. The variable values (common variable values) included in the abnormality log are extracted, and the number (frequency) at which each common variable value appears in the abnormality log is calculated. Then, the weighting unit 140 associates the acquired common variable value with the frequency, weights the higher so that the higher the frequency, and outputs the weighted result (step S107).

最後に、出力部150は、ステップS107で取得された重み付け結果を表示装置20に出力し、ユーザに向けて表示させる(ステップS108)。   Finally, the output unit 150 outputs the weighting result acquired in step S107 to the display device 20 and displays it for the user (step S108).

以上のように、ログ分析システム100は、複数の異常ログの中に共通して含まれている変数値に基づいて重み付けを行うことによって、ユーザに異常の原因である蓋然性の高い変数値を示す。これにより、ユーザが異常の原因を探ることを容易にすることができる。   As described above, the log analysis system 100 indicates a variable value having a high probability of causing an abnormality to the user by performing weighting based on a variable value that is commonly included in a plurality of abnormality logs. . This makes it easy for the user to search for the cause of the abnormality.

次に、第1の実施形態に係るログ分析システム100の変形例を説明する。図6は、第1の実施形態の第1の変形例に係るログ分析システム100−1のブロック図である。ログ分析システム100−1は、図1の構成に加えて、構成要素抽出部131および構成情報記憶部163を備える。   Next, a modified example of the log analysis system 100 according to the first embodiment will be described. FIG. 6 is a block diagram of a log analysis system 100-1 according to a first modification of the first embodiment. The log analysis system 100-1 includes a component extraction unit 131 and a configuration information storage unit 163 in addition to the configuration of FIG.

構成情報記憶部163は、分析対象ログ10を出力するシステムに係る構成情報を予め記録する。構成情報は、分析対象ログ10を出力するシステムに含まれる構成要素(例えばサーバ等の物理装置、仮想マシン等の仮想装置、各種プログラム等)、および構成要素間の依存関係(ネットワークによる接続関係、仮想装置やプログラムの主従関係等)を示す情報を含む。   The configuration information storage unit 163 records configuration information related to the system that outputs the analysis target log 10 in advance. The configuration information includes components included in the system that outputs the analysis target log 10 (for example, a physical device such as a server, a virtual device such as a virtual machine, various programs, and the like), and a dependency relationship between the components (a network connection relationship, Information indicating the master-slave relationship of virtual devices and programs).

構成要素抽出部131は、ログ異常分析部130から入力された異常ログに含まれる変数値のうち、構成情報記憶部163に記録された構成要素に合致する変数値を抽出する。すなわち、重み付け部140は、構成要素のうち、共通変数値に含まれるものを抽出して出力する。その後、重み付け部140は、構成要素抽出部131によって抽出された構成要素を示す変数値のみを用いて、異常ログに対して重み付けを行う。   The component extraction unit 131 extracts a variable value that matches the component recorded in the configuration information storage unit 163 from among the variable values included in the abnormality log input from the log abnormality analysis unit 130. That is, the weighting unit 140 extracts and outputs the constituent elements included in the common variable value. Thereafter, the weighting unit 140 weights the abnormality log using only the variable value indicating the component extracted by the component extraction unit 131.

図7A、7Bは、表示装置20を用いる例示的な重み付け結果の表示画面を示す模式図である。図7Aに示す画面Cは、構成要素抽出部131により抽出された構成要素を示す共通変数値およびその順位を含む順位表C1を表示する。順位表C1の中で最上位の変数値である「SV008」は、太字および下線によって強調表示されている。これにより、ユーザは異常の原因である蓋然性が高い変数値を容易に知ることができる。上位の変数値を強調するために、変数値の文字種、色、大きさ等を変化させてもよい。   7A and 7B are schematic diagrams illustrating exemplary weighting result display screens using the display device 20. A screen C shown in FIG. 7A displays a common variable value indicating a component extracted by the component extraction unit 131 and a rank table C1 including the rank. “SV008”, which is the highest variable value in the ranking table C1, is highlighted by bold and underline. Thereby, the user can easily know a variable value having a high probability of causing an abnormality. In order to emphasize the upper variable value, the character type, color, size, etc. of the variable value may be changed.

さらに画面Cは、構成情報記憶部163に記録された構成情報に基づいて、各構成要素およびそれらの間の関係を示す構成図C2を表示する。構成図C2には、各構成要素を示す記号(ここでは丸)と、構成要素間を接続する線とが示される。構成要素を示す記号の近傍には、該構成要素を示す文字列が表示される。構成図C2上には、最上位の共通変数値の構成要素が三重丸C3で強調され、その他の共通変数値の構成要素が二重丸C4で強調される。これにより、ユーザは異常の原因である蓋然性が高い構成要素を容易に知ることができる。上位の変数値の構成要素を強調するために、構成要素を示す記号又は文字列の種類、色、大きさ等を変化させてもよい。あるいは、上位の変数値の構成要素を点滅させてもよい。順位表C1と構成図C2との関係を明示にするために、順位表C1中の変数値の文字列の色と、構成図C2中の変数値の文字列の色とを同一にしてもよい。   Furthermore, the screen C displays a configuration diagram C2 showing each component and the relationship between them based on the configuration information recorded in the configuration information storage unit 163. In the configuration diagram C2, symbols (here, circles) indicating the respective components and lines connecting the components are shown. A character string indicating the component is displayed in the vicinity of the symbol indicating the component. On the configuration diagram C2, the constituent element of the highest common variable value is emphasized by a triple circle C3, and the constituent elements of other common variable values are emphasized by a double circle C4. Thereby, the user can easily know a component having a high probability of causing an abnormality. In order to emphasize the constituent element of the upper variable value, the type, color, size, etc. of the symbol or character string indicating the constituent element may be changed. Or you may blink the component of a high-order variable value. In order to clarify the relationship between the ranking table C1 and the configuration diagram C2, the color of the character string of the variable value in the ranking table C1 may be the same as the color of the character string of the variable value in the configuration diagram C2. .

図7Bに示す画面Dは、画面Cと同様の情報に加えて、構成要素間を接続する線のうち異常の原因である蓋然性の高い関係に該当するものを強調表示する。順位表D1は、共通変数値に加えて、両端が共通変数値となっている関係を表示する。すなわち、重み付け部140は、構成要素間の関係のうち、共通変数値に関連するものを抽出して出力する。例えば、「SV002」および「SV005」が共通変数値であるため、それらの間の関係も異常の原因である蓋然性が高いものとして表示する。特にネットワーク機器は明確なログを出力せずに故障する場合が多いため、このような表示を行うことによってネットワーク接続に問題がある可能性をユーザに示すことができる。   In addition to the same information as the screen C, the screen D shown in FIG. 7B highlights the lines connecting the components that correspond to the highly likely relationship that is the cause of the abnormality. The ranking table D1 displays a relationship in which both ends are common variable values in addition to the common variable values. That is, the weighting unit 140 extracts and outputs the relationship between the constituent elements related to the common variable value. For example, since “SV002” and “SV005” are common variable values, the relationship between them is also displayed as having a high probability of causing an abnormality. In particular, since network devices often fail without outputting a clear log, such a display can indicate to the user that there is a problem with the network connection.

さらに、構成図D2は、両端が共通変数値となっている関係を示す線を、破線D3により強調表示する。これにより、ユーザは異常の原因である蓋然性が高い構成要素間の関係を容易に知ることができる。このような構成要素間の関係を強調するために、線の種類、色、太さ等を変化させてもよい。また、線の近傍に「異常」等の文字列又は異常を示す記号を付してもよい。   Further, in the configuration diagram D2, a line indicating a relationship in which both ends are common variable values is highlighted by a broken line D3. Thereby, the user can easily know the relationship between components having a high probability of causing an abnormality. In order to emphasize the relationship between such components, the line type, color, thickness, and the like may be changed. Further, a character string such as “abnormal” or a symbol indicating abnormality may be attached in the vicinity of the line.

図7A、7Bの画面C、Dは、重み付け結果に含まれる全ての構成要素を表示してよく、あるいは重み付け結果に従って所定の数の構成要素のみ(例えば1位の構成要素のみ)を表示してもよい。   Screens C and D in FIGS. 7A and 7B may display all the components included in the weighting result, or display only a predetermined number of components (for example, only the first-ranked component) according to the weighting result. Also good.

以上のように、ログ分析システム100−1は、重み付けに構成要素に係る変数値のみを用いて重み付けを行い、重み付け結果の出力を行う。一般的に、異常の原因は構成要素であることが多い。そのため、ログ分析システム100−1は、構成要素に係る変数値のみを重み付け結果として出力することによって、ユーザが異常の原因を探ることをより容易にすることができる。   As described above, the log analysis system 100-1 performs weighting using only the variable values related to the components for weighting, and outputs the weighting result. In general, the cause of abnormality is often a component. Therefore, the log analysis system 100-1 can make it easier for the user to find the cause of the abnormality by outputting only the variable values related to the constituent elements as the weighting result.

図8は、第1の実施形態の第2の変形例に係るログ分析システム100−2のブロック図である。ログ分析システム100−2は、図1の構成に加えて、フォーマット学習部171およびモデル学習部172を備える。   FIG. 8 is a block diagram of a log analysis system 100-2 according to a second modification of the first embodiment. The log analysis system 100-2 includes a format learning unit 171 and a model learning unit 172 in addition to the configuration of FIG.

フォーマット学習部171は、フォーマット判定部120がフォーマットの判定を行う際、判定対象のログがフォーマット記憶部161に記録されているいずれのフォーマットにも適合しない場合に、新たなフォーマットを作成してフォーマット記憶部161に記録する。   When the format determination unit 120 determines the format, the format learning unit 171 creates a new format if the determination target log does not match any format recorded in the format storage unit 161. Records in the storage unit 161.

フォーマット学習部171がフォーマットを学習するための第1の方法として、フォーマット学習部171は、フォーマットが未知である複数のログを蓄積し、それらに対して統計的に変化する変数部分と変化しない定数部分とを分離することによって、新たなフォーマットとして定義することができる。フォーマット学習部171がフォーマットを学習するための第2の方法として、フォーマット学習部171は、既知の変数値のリストを読み込み、フォーマットが未知であるログの中で既知の変数値と一致する又は類似する部分を変数部分と判定し、それ以外の部分を定数部分と判定することによって、新たなフォーマットを定義することができる。既知の変数値として、値そのものを用いてよく、あるいは正規表現のようなパターンを用いてよい。フォーマットの学習方法はこれらに限られず、入力されたログに対して新たなフォーマットを定義することが可能な任意の学習アルゴリズムを用いてよい。   As a first method for the format learning unit 171 to learn the format, the format learning unit 171 accumulates a plurality of logs whose formats are unknown, and a variable part that changes statistically and a constant that does not change. By separating the part, it can be defined as a new format. As a second method for the format learning unit 171 to learn the format, the format learning unit 171 reads a list of known variable values and matches or resembles a known variable value in a log whose format is unknown. A new format can be defined by determining the part to be changed as a variable part and determining the other part as a constant part. As a known variable value, the value itself may be used, or a pattern such as a regular expression may be used. The format learning method is not limited to these, and any learning algorithm capable of defining a new format for the input log may be used.

モデル学習部172は、ログ異常分析部130がモデルの判定を行う際、判定対象のログがモデル記憶部162に記録されているいずれのモデルにも適合しない場合に、新たなモデルを作成してモデル記憶部162に記録する。   When the log abnormality analysis unit 130 determines a model, the model learning unit 172 creates a new model if the determination target log does not match any model recorded in the model storage unit 162. Record in the model storage unit 162.

通常、ログ異常分析部130はモデル記憶部162に予め記録されているいずれのモデルにも適合しないログを異常ログと判定するが、モデルが未知であるログであっても正常ログである場合がある。この場合に、ユーザは入力装置を介してモデル記憶部162のモデルに適合しないログが正常ログであるという指示を入力すると、モデル学習部172は当該ログのフォーマットおよび変数値に基づいて新たなモデルを作成し、モデル記憶部162に記録する。モデルの学習方法はこれに限られず、入力されたログから新たにモデルを定義することが可能な任意の学習アルゴリズムを用いてよい。   Normally, the log abnormality analysis unit 130 determines that a log that does not match any model recorded in the model storage unit 162 in advance is an abnormality log. However, even if the log is unknown, it may be a normal log. is there. In this case, when the user inputs an instruction that the log that does not match the model in the model storage unit 162 is a normal log via the input device, the model learning unit 172 creates a new model based on the format and variable value of the log. Is recorded in the model storage unit 162. The model learning method is not limited to this, and an arbitrary learning algorithm that can newly define a model from an input log may be used.

以上のように、ログ分析システム100−2は、フォーマットおよびモデルの学習部を備えるため、未知のフォーマットおよびモデルを含むログから新たにフォーマットおよびモデルを生成し、記録することができる。   As described above, since the log analysis system 100-2 includes the format and model learning unit, a new format and model can be generated and recorded from a log including an unknown format and model.

(第2の実施形態)
図9は、本実施形態に係るログ分析システム200のブロック図である。図9において、矢印は主なデータの流れを示しており、図9に示したもの以外のデータの流れがあってよい。図9において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図9に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に別れて実装されてよい。ブロック間のデータの授受はデータバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。ログ分析システム200は、図4と同様の又はその他の機器構成により実装されてよい。
(Second Embodiment)
FIG. 9 is a block diagram of the log analysis system 200 according to the present embodiment. In FIG. 9, arrows indicate main data flows, and there may be data flows other than those shown in FIG. In FIG. 9, each block shows a functional unit configuration, not a hardware (device) unit configuration. Therefore, the blocks shown in FIG. 9 may be implemented in a single device, or may be separately implemented in a plurality of devices. Data exchange between the blocks may be performed via any means such as a data bus, a network, a portable storage medium, or the like. The log analysis system 200 may be implemented with the same or other device configuration as in FIG.

ログ分析システム200は、処理部として、ログ入力部210、フォーマット判定部220、ログ異常分析部230、重み付け部240および出力部250を備える。また、ログ分析システム200は、記憶部として、フォーマット記憶部261、モデル記憶部262および分布情報記憶部263を備える。   The log analysis system 200 includes a log input unit 210, a format determination unit 220, a log abnormality analysis unit 230, a weighting unit 240, and an output unit 250 as processing units. The log analysis system 200 includes a format storage unit 261, a model storage unit 262, and a distribution information storage unit 263 as storage units.

ログ入力部210、フォーマット判定部220、ログ異常分析部230、フォーマット記憶部261およびモデル記憶部262の構成は、それぞれ第1の実施形態のログ入力部110、フォーマット判定部120、ログ異常分析部130、フォーマット記憶部161およびモデル記憶部162の構成と同様である。   The configuration of the log input unit 210, the format determination unit 220, the log abnormality analysis unit 230, the format storage unit 261, and the model storage unit 262 are respectively the log input unit 110, the format determination unit 120, and the log abnormality analysis unit of the first embodiment. The configuration is the same as that of the format storage unit 161 and the model storage unit 162.

重み付け部240は、ログ分析部であり、分布情報記憶部263に予め記録されている分布情報に基づいて、ログ異常分析部230から出力される異常ログに含まれる変数値の重み付けを行う。分布情報は、あるフォーマット中で変数値が通常取り得る範囲、すなわち分布幅を含む。変数値の分布幅は、複数の正常ログから変数値を抜き出し、該変数値の通常取り得る範囲を統計的に決定することによって分布情報記憶部263に記録されてよい。あるいは、変数値の分布幅は、ユーザが変数値の通常取り得る値を入力することによって分布情報記憶部263に記録されてよい。   The weighting unit 240 is a log analysis unit, and weights variable values included in an abnormality log output from the log abnormality analysis unit 230 based on distribution information recorded in advance in the distribution information storage unit 263. The distribution information includes a range in which a variable value can normally take in a certain format, that is, a distribution width. The distribution width of the variable value may be recorded in the distribution information storage unit 263 by extracting the variable value from a plurality of normal logs and statistically determining a range that the variable value can normally take. Alternatively, the distribution width of the variable value may be recorded in the distribution information storage unit 263 when the user inputs a value that the variable value can normally take.

図10A、10Bは、分布情報記憶部263に記録される例示的な分布情報の模式図である。分布情報は、一意のIDに関連付けられた、取り得る変数値の分布およびその分布幅を含む。図10Aの分布情報は取り得る変数値が文字列である場合を示しており、この場合には取り得る変数値の種類の数を分布幅としてよい。図10Aにおいて、例えばIDが1である分布は5種類の文字列を含むため、分布幅は5である。   10A and 10B are schematic diagrams of exemplary distribution information recorded in the distribution information storage unit 263. The distribution information includes a distribution of possible variable values associated with a unique ID and a distribution width thereof. The distribution information in FIG. 10A shows a case where the variable values that can be taken are character strings. In this case, the number of types of variable values that can be taken may be used as the distribution width. In FIG. 10A, for example, the distribution with ID 1 includes five types of character strings, and thus the distribution width is 5.

図10Bの分布情報は取り得る変数値が数値である場合を示しており、この場合には、取り得る変数値の最大値と最小値との差、平均値、分散値又はカイ二乗値等、数値の分布を表すことが可能な任意の数を分布幅としてよい。図10Bの分布情報では、分布幅として分散値を用いている。図10Bにおいて、例えばIDが1である分布は10、20、30、100の数値を含むため、分布幅は1250である。   The distribution information in FIG. 10B shows the case where the variable values that can be taken are numerical values. In this case, the difference between the maximum value and the minimum value of the variable values that can be taken, the average value, the variance value, the chi-square value, etc. Any number that can represent the distribution of numerical values may be used as the distribution width. In the distribution information of FIG. 10B, a variance value is used as the distribution width. In FIG. 10B, for example, a distribution whose ID is 1 includes numerical values of 10, 20, 30, and 100, and thus the distribution width is 1250.

図10A、10Bでは文字列の分布情報と数値の分布情報とを分けて記録しているが、一緒に記録してもよい。この場合には、文字列の分布幅および数値の分布幅を正規化し、互いに比較可能な値にすることが望ましい。   10A and 10B, the character string distribution information and the numerical value distribution information are recorded separately, but may be recorded together. In this case, it is desirable to normalize the distribution width of the character string and the distribution width of the numerical values so that they can be compared with each other.

分布情報のIDは、例えばフォーマット中の変数部分と分布情報とを関連付ける関連付けテーブルによって、フォーマット中の変数部分に関連付けられる。例えば、図2BのIDが039であるフォーマット中の「<変数:文字列>」が、図10AのIDが1である分布幅に関連付けられている場合には、その変数部分がSV001〜SV005のいずれかの値をとり、分布幅が5であることがわかる。   The ID of the distribution information is associated with the variable part in the format by, for example, an association table that associates the variable part in the format with the distribution information. For example, if “<variable: character string>” in the format whose ID is 039 in FIG. 2B is associated with the distribution width whose ID is 1 in FIG. 10A, the variable portion is SV001 to SV005. It can be seen that any value is taken and the distribution width is 5.

重み付け部240は、ログ異常分析部230から出力される異常ログに含まれる各変数値について、分布情報記憶部263から分布幅を取得する。そして、重み付け部240は、変数値と取得された分布幅とを関連付け、分布幅が小さいほど上位になるように重み付けをして重み付け結果として出力する。換言すると、本実施形態においては、異常ログの一部である変数値が取り得る分布幅に基づいて、異常ログの重み付けを行う。一般的に、分布幅が大きい変数部分は、システムが乱数的に生成している値や、大量のリストから割り当てている場合が多く、正常時から逸脱した値であっても異常としての深刻さは低く、異常の原因である蓋然性が低いと考えられる。一方、分布幅が小さい変数部分は、正常時における変動範囲が限られているため、変数値が正常時から逸脱している場合には異常としての深刻さが大きく、異常の原因である又は異常と関係があると考えられる。そこで、ログ分析システム200はユーザにこのような変数値を知らせることによって、ユーザが異常の原因を特定することを容易にすることができる。   The weighting unit 240 acquires the distribution width from the distribution information storage unit 263 for each variable value included in the abnormality log output from the log abnormality analysis unit 230. Then, the weighting unit 240 associates the variable value with the acquired distribution width, weights the distribution value so as to be higher as the distribution width is smaller, and outputs the weighted result. In other words, in the present embodiment, the abnormality log is weighted based on the distribution width that can be taken by the variable values that are part of the abnormality log. In general, the variable part with a large distribution width is often assigned by a random number from the system or a large number of lists. It is considered that the probability of being abnormal is low. On the other hand, the variable part with a small distribution width has a limited range of fluctuation in the normal state, so if the variable value deviates from the normal time, the severity of the abnormality is large and the cause of the abnormality or abnormal It seems to be related. Therefore, the log analysis system 200 can make it easier for the user to specify the cause of the abnormality by notifying the user of such a variable value.

別の方法として、重み付け部240は、ログ異常分析部230から出力される異常ログに含まれる各変数値について、分布情報記憶部263から取得した分布幅から逸脱した量に基づいて重み付けを行ってもよい。この場合には、変数値が分布幅の範囲外である場合に、該分布幅の最大値又は最小値と変数値の差(絶対値)が大きいほど、上位になるように重み付けをして重み付け結果として出力する。通常の変数値が分布幅から逸脱した変数値ほど異常として深刻であると考えられるため、重み付け部240はユーザにこのような変数値を知らせることができる。   As another method, the weighting unit 240 weights each variable value included in the abnormality log output from the log abnormality analysis unit 230 based on the amount deviating from the distribution width acquired from the distribution information storage unit 263. Also good. In this case, when the variable value is out of the range of the distribution width, weighting is performed so that the higher the difference (absolute value) between the maximum or minimum value of the distribution width and the variable value, the higher the value. Output as a result. Since a variable value whose normal variable value deviates from the distribution width is considered to be more serious as an abnormality, the weighting unit 240 can notify the user of such a variable value.

出力部250は、第1の実施形態の出力部150と同様に、重み付け部240による重み付け結果の出力を行う。図11A〜11Dは、例示的な重み付け結果の表示画面を示す模式図である。図11Aに示す画面Eは、重み付け部240による重み付け結果に従って並び替えられた変数値およびその順位を表示する。   The output unit 250 outputs the weighting result by the weighting unit 240 in the same manner as the output unit 150 of the first embodiment. 11A to 11D are schematic diagrams illustrating exemplary weighting result display screens. Screen E shown in FIG. 11A displays the variable values rearranged according to the weighting result by weighting section 240 and their ranks.

図11Bに示す画面Fは、分布幅を表す棒グラフF1とともに、異常ログ中の変数値の位置を表す矢印F2を表示する。図11Cに示す画面Gは、頻度分布のグラフG1とともに、異常ログ中の変数値の位置を表す矢印G2を表示する。図11Dに示す画面Hは、頻度分布の比率をリスト表示し、その中で異常ログ中の変数値を太字および下線により強調して表示する。頻度分布の比率の代わりに、頻度そのものを表示してもよい。変数値を強調するために、変数値の文字種、色、大きさ等を変化させてもよい。   A screen F shown in FIG. 11B displays an arrow F2 indicating the position of the variable value in the abnormality log, together with a bar graph F1 indicating the distribution width. The screen G shown in FIG. 11C displays an arrow G2 representing the position of the variable value in the abnormality log, along with the frequency distribution graph G1. A screen H shown in FIG. 11D displays a list of frequency distribution ratios, in which variable values in the abnormality log are highlighted with bold and underline. The frequency itself may be displayed instead of the frequency distribution ratio. In order to emphasize the variable value, the character type, color, size, etc. of the variable value may be changed.

ただし、画面Gおよび画面Hを表示するためには、変数部分の取り得る値だけでなく、その頻度が分布情報記憶部263に予め記録されている必要がある。画面F、画面Gおよび画面Hによれば、異常ログ中の変数値が分布幅からどれくらい逸脱しているかをユーザに視認しやすくできる。さらに、画面Hでは、文字列のような離散値であっても、異常ログ中の変数値と分布幅との関係を視認しやすくできる。これらに限らず、異常ログ中の変数値と分布幅との位置関係を示すことができる任意の表示方法を用いてよい。   However, in order to display the screen G and the screen H, not only the values that the variable portion can take, but also the frequency thereof must be recorded in the distribution information storage unit 263 in advance. According to the screen F, the screen G, and the screen H, the user can easily recognize how much the variable value in the abnormality log deviates from the distribution width. Further, on the screen H, even if the value is a discrete value such as a character string, the relationship between the variable value in the abnormality log and the distribution width can be easily recognized. Not limited to these, any display method that can indicate the positional relationship between the variable value and the distribution width in the abnormality log may be used.

本実施形態に係るログ分析システム200を用いるログ分析方法のフローチャートは、基本的に図5と同様であり、ステップS107の重み付けの処理のみ異なる。重み付け部240は、ステップS105において判定された異常ログに含まれる各変数値について、分布情報記憶部263から分布幅を取得する。そして、重み付け部240は、異常ログ中の変数値と取得された分布幅とを関連付け、分布幅が小さいほど上位になるように重み付けをして重み付け結果として出力する(ステップS107)。   The flowchart of the log analysis method using the log analysis system 200 according to the present embodiment is basically the same as that in FIG. 5, and only the weighting process in step S107 is different. The weighting unit 240 acquires the distribution width from the distribution information storage unit 263 for each variable value included in the abnormality log determined in step S105. Then, the weighting unit 240 associates the variable value in the abnormality log with the acquired distribution width, weights the distribution value so as to be higher as the distribution width is smaller, and outputs the weighted result (step S107).

以上のように、ログ分析システム200は、変数値の分布幅に基づいて異常ログの中に含まれている変数値の重み付けを行うことによって、ユーザに異常の原因である蓋然性の高い変数値を示すことができる。これにより、ユーザが異常の原因を探ることを容易にすることができる。   As described above, the log analysis system 200 weights the variable values included in the abnormality log based on the distribution range of the variable values, thereby giving the user variable values that have a high probability of causing an abnormality. Can show. This makes it easy for the user to search for the cause of the abnormality.

本実施形態に係る変形例として、図8のログ分析システム100−2と同様に、フォーマット学習部171およびモデル学習部172を備えてよい。   As a modified example according to the present embodiment, a format learning unit 171 and a model learning unit 172 may be provided as in the log analysis system 100-2 of FIG.

(第3の実施形態)
図12は、本実施形態に係るログ分析システム300のブロック図である。図12において、矢印は主なデータの流れを示しており、図12に示したもの以外のデータの流れがあってよい。図12において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図12に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に別れて実装されてよい。ブロック間のデータの授受はデータバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。ログ分析システム300は、図4と同様の又はその他の機器構成により実装されてよい。
(Third embodiment)
FIG. 12 is a block diagram of a log analysis system 300 according to the present embodiment. In FIG. 12, arrows indicate main data flows, and there may be data flows other than those shown in FIG. In FIG. 12, each block represents a functional unit configuration, not a hardware (device) unit configuration. Therefore, the blocks shown in FIG. 12 may be implemented in a single device, or may be separately implemented in a plurality of devices. Data exchange between the blocks may be performed via any means such as a data bus, a network, a portable storage medium, or the like. The log analysis system 300 may be implemented with the same or other device configuration as in FIG.

ログ分析システム300は、処理部として、ログ入力部310、フォーマット判定部320、ログ異常分析部330、重み付け部340および出力部350を備える。また、ログ分析システム300は、記憶部として、フォーマット記憶部361、モデル記憶部362および組み合わせ記憶部363を備える。   The log analysis system 300 includes a log input unit 310, a format determination unit 320, a log abnormality analysis unit 330, a weighting unit 340, and an output unit 350 as processing units. The log analysis system 300 includes a format storage unit 361, a model storage unit 362, and a combination storage unit 363 as storage units.

ログ入力部310、フォーマット判定部320、ログ異常分析部330、フォーマット記憶部361およびモデル記憶部362の構成は、それぞれ第1の実施形態のログ入力部110、フォーマット判定部120、ログ異常分析部130、フォーマット記憶部161およびモデル記憶部162の構成と同様である。   The configuration of the log input unit 310, the format determination unit 320, the log abnormality analysis unit 330, the format storage unit 361, and the model storage unit 362 are respectively the log input unit 110, the format determination unit 120, and the log abnormality analysis unit of the first embodiment. The configuration is the same as that of the format storage unit 161 and the model storage unit 162.

重み付け部340は、ログ分析部であり、組み合わせ記憶部363に予め記録されている組み合わせ情報に基づいて、ログ異常分析部330から出力される異常ログに含まれる変数値の重み付けを行う。組み合わせ情報は、1つのログに含まれる変数値の組み合わせを含む。組み合わせ情報は、正常ログから変数部分の値を抜き出すことによって組み合わせ記憶部363に記録されてよい。あるいは、組み合わせ情報は、ユーザが正常とみなしたい変数値の組み合わせを入力することによって組み合わせ記憶部363に記録されてよい。   The weighting unit 340 is a log analysis unit, and weights variable values included in an abnormality log output from the log abnormality analysis unit 330 based on combination information recorded in advance in the combination storage unit 363. The combination information includes a combination of variable values included in one log. The combination information may be recorded in the combination storage unit 363 by extracting the value of the variable part from the normal log. Alternatively, the combination information may be recorded in the combination storage unit 363 by inputting a combination of variable values that the user desires to be normal.

図13は、組み合わせ記憶部363に記録される例示的な組み合わせ情報の模式図である。組み合わせ情報は、一意のIDに関連付けられた変数値の組み合わせを含む。重み付け部340は、ログ異常分析部330から出力される1つの異常ログに含まれる変数値の組み合わせが、組み合わせ記憶部363に登録されたいずれかの組み合わせに一致するか否かを判定する。   FIG. 13 is a schematic diagram of exemplary combination information recorded in the combination storage unit 363. The combination information includes a combination of variable values associated with the unique ID. The weighting unit 340 determines whether or not a combination of variable values included in one abnormality log output from the log abnormality analysis unit 330 matches any combination registered in the combination storage unit 363.

重み付け部340は、ログ異常分析部330から出力される異常ログに含まれる変数値の組み合わせが組み合わせ記憶部363中のいずれの組み合わせにも一致しない場合には、その異常ログが上位になるように重み付けをして重み付け結果として出力する。一方、重み付け部340は、ログ異常分析部330から出力される異常ログに含まれる変数値の組み合わせが組み合わせ記憶部363中のいずれかの組み合わせに一致する場合には、その異常ログが下位になるように重み付けをして重み付け結果として出力する。すなわち、重み付け部340は、異常ログ中の変数値の組み合わせが組み合わせ記憶部363中に登録されていない場合に、組み合わせ記憶部363中に登録されている場合よりも上位になるように重み付けを行う。ここでは異常ログ中の変数値の組み合わせが組み合わせ記憶部363に登録されている場合に下位の順位としているが、該異常ログを正常ログとみなし、重み付け部340による重み付け結果から除外してもよい。   When the combination of the variable values included in the abnormality log output from the log abnormality analysis unit 330 does not match any combination in the combination storage unit 363, the weighting unit 340 makes the abnormality log higher. Weights and outputs as a weighting result. On the other hand, when the combination of the variable values included in the abnormality log output from the log abnormality analysis unit 330 matches any combination in the combination storage unit 363, the weighting unit 340 is in the lower order. Thus, the weighting is performed and the result is output as a weighting result. That is, when the combination of variable values in the abnormality log is not registered in the combination storage unit 363, the weighting unit 340 performs weighting so that the combination is higher than the case where it is registered in the combination storage unit 363. . Here, when the combination of the variable values in the abnormality log is registered in the combination storage unit 363, the lower rank is set. However, the abnormality log may be regarded as a normal log and excluded from the weighting result by the weighting unit 340. .

本実施形態では、ログ異常分析部330においてモデルに適合しないために異常ログと判定されたログであっても、登録済の変数値の組み合わせを含むログを、異常の原因である蓋然性が低いものとして重み付けを行う。一方、重み付け部340は、未知の変数値の組み合わせを含むログを、異常の原因である蓋然性が高いものとして重み付けを行う。このように、ログ分析システム300は異常ログ中の変数値の組み合わせが所定の組み合わせであるか否かに基づいて順位付けすることによって、ユーザが異常の原因を特定することを容易にすることができる。   In the present embodiment, even if the log abnormality analysis unit 330 determines that the log is abnormal because it does not conform to the model, a log including a combination of registered variable values is less likely to cause an abnormality. Is weighted. On the other hand, the weighting unit 340 weights a log including a combination of unknown variable values as having a high probability of causing an abnormality. As described above, the log analysis system 300 can make it easier for the user to identify the cause of the abnormality by ranking based on whether or not the combination of the variable values in the abnormality log is a predetermined combination. it can.

図14A、14Bは、表示装置20を用いる例示的な重み付け結果の表示画面を示す模式図である。図14Aに示す画面Jは、組み合わせ記憶部363中のいずれの組み合わせにも一致しない変数値の組み合わせに加え、異常ログのうち該組み合わせを含むものを表示する。ここでは、組み合わせ記憶部363中のいずれかの組み合わせに一致する変数値の組み合わせは表示されていないが、表示されてもよい。   14A and 14B are schematic diagrams illustrating exemplary weighting result display screens using the display device 20. A screen J shown in FIG. 14A displays a combination of variable values that do not match any combination in the combination storage unit 363 and that includes the abnormality log. Here, a combination of variable values that matches any combination in the combination storage unit 363 is not displayed, but may be displayed.

さらに画面Jにおいて、同種の変数値(すなわち、同じ変数部分の変数値)であるS2およびSjは太字および下線によって強調表示されている。変数値を強調するために、変数値の文字種、色、大きさ等を変化させてもよい。これにより、同種の変数値を容易に判別可能である。また、画面Jにおいて、ユーザがいずれかの変数値を選択すると、該変数値を含む組み合わせが上位になるように並び替えてもよい。これにより、ユーザは異常の原因である蓋然性が高い変数値の組み合わせを含むログを容易に知ることができる。   Further, on the screen J, S2 and Sj that are the same type of variable value (that is, the variable value of the same variable part) are highlighted by bold and underline. In order to emphasize the variable value, the character type, color, size, etc. of the variable value may be changed. As a result, the same type of variable value can be easily discriminated. Further, when the user selects any variable value on the screen J, the screen may be rearranged so that the combination including the variable value is higher. Thereby, the user can easily know a log including a combination of variable values having a high probability of causing an abnormality.

図14Bに示す画面Kは、変数値の組み合わせおよび該組み合わせを含む異常ログを記載した組み合わせ表K1を表示する。さらに画面Kは、変数値の組み合わせを二次元上に表現するマップK2を表示する。マップK2は、横軸に第1の変数部分(ここではサーバ名)、縦軸に第2の変数部分(ここではコンポーネント種類)をとり、それらのそれぞれの組み合わせを四角の記号により表す。組み合わせ記憶部363中のいずれの組み合わせにも一致しない変数値の組み合わせを表す四角K3は、黒塗りにより強調されている。一方、組み合わせ記憶部363中のいずれかの組み合わせに一致する変数値の組み合わせを表す四角K4は、斜線により強調されている。所定の組み合わせを強調するために、変数値の組み合わせを示す記号の形、色、大きさを変更したり、点滅等の動作を行ったりしてもよい。このような表示により、ユーザはどの変数値の組み合わせが異常であるかを容易に知ることができ、さらに異常の原因である又は異常に関係する変数値を推測することができる。   The screen K shown in FIG. 14B displays a combination table K1 in which variable value combinations and abnormality logs including the combinations are described. Furthermore, the screen K displays a map K2 that expresses a combination of variable values in two dimensions. The map K2 has a first variable part (here, a server name) on the horizontal axis and a second variable part (here, a component type) on the vertical axis, and each of these combinations is represented by a square symbol. A square K3 representing a combination of variable values that does not match any combination in the combination storage unit 363 is emphasized by black painting. On the other hand, a square K4 representing a combination of variable values that matches any combination in the combination storage unit 363 is emphasized by hatching. In order to emphasize a predetermined combination, the shape, color, and size of a symbol indicating a combination of variable values may be changed, or an operation such as blinking may be performed. With such a display, the user can easily know which combination of variable values is abnormal, and can estimate a variable value that is the cause of or related to the abnormality.

画面Kにおいて、マップK2の縦軸および横軸に表示する変数部分をユーザにより選択可能にしてよい。この場合には、画面K上に表示可能な変数部分を含むリストボックスやチェックボックスを表示し、ユーザによる選択を受け付ければよい。また、マップK2中の四角を選択することによって、該四角によって表される変数値を含む異常ログを組み合わせ表K1中で強調してもよく、あるいは該異常ログをポップアップ画面等によって表示してもよい。   On the screen K, variable portions to be displayed on the vertical axis and the horizontal axis of the map K2 may be selectable by the user. In this case, a list box or a check box including variable parts that can be displayed on the screen K may be displayed, and selection by the user may be accepted. Further, by selecting a square in the map K2, the abnormality log including the variable value represented by the square may be highlighted in the combination table K1, or the abnormality log may be displayed on a pop-up screen or the like. Good.

図14A、14Bに示す画面は一例であり、重み付け部340による重み付け結果がユーザにわかるように、ログ又はログの一部である変数値を表示できれば、いずれの表示方法を用いてもよい。   The screens shown in FIGS. 14A and 14B are examples, and any display method may be used as long as the variable value that is a log or a part of the log can be displayed so that the weighting result by the weighting unit 340 can be understood by the user.

図15は、本実施形態に係る別の重み付け結果の表示画面を示す模式図である。図15に示す画面Kは、図14Bの画面Kに加えて、変数値の順位K5、K6を表示する。順位K5、K6としては、変数値の組み合わせのうちどちらか1つ(図15ではSi)の順位が用いられるが、変数値の組み合わせの両方についての順位が用いられてもよい。順位K5は、組み合わせ表K1中で対応する変数値に付されて記載される。順位K6は、マップK2中で対応する変数値の四角K3の中に記載される。各変数値の順位は、上述の第1および第2の実施形態の重み付け方法の少なくとも一方により算出される。すなわち、本実施形態による2つの変数値の組み合わせによる重み付けと、第1および第2の実施形態による1つの変数値による重み付けとを組み合わせて用いてよい。   FIG. 15 is a schematic diagram showing another weighting result display screen according to the present embodiment. The screen K shown in FIG. 15 displays variable value ranks K5 and K6 in addition to the screen K of FIG. 14B. As the ranks K5 and K6, one of the variable value combinations (Si in FIG. 15) is used, but the ranks for both combinations of variable values may be used. The rank K5 is described by being attached to the corresponding variable value in the combination table K1. The rank K6 is described in the square K3 of the corresponding variable value in the map K2. The rank of each variable value is calculated by at least one of the weighting methods of the first and second embodiments described above. That is, weighting by a combination of two variable values according to the present embodiment and weighting by one variable value according to the first and second embodiments may be used in combination.

本実施形態に係るログ分析システム300を用いるログ分析方法のフローチャートは、基本的に図5と同様であり、ステップS107の重み付けの処理のみ異なる。重み付け部340は、ステップS105において判定された異常ログに含まれる変数値の組み合わせが、組み合わせ記憶部363に登録されたいずれかの組み合わせに一致するか否かを判定する。そして、重み付け部340は、異常ログ中の変数値の組み合わせが組み合わせ記憶部363に登録されたいずれかの組み合わせに一致する場合に下位になり、組み合わせ記憶部363に登録されたいずれの組み合わせにも一致しない場合に上位になるように重み付けをして重み付け結果として出力する(ステップS107)。   The flowchart of the log analysis method using the log analysis system 300 according to the present embodiment is basically the same as that in FIG. 5, and only the weighting process in step S107 is different. The weighting unit 340 determines whether or not the combination of the variable values included in the abnormality log determined in step S105 matches any combination registered in the combination storage unit 363. The weighting unit 340 is in the lower order when the combination of the variable values in the abnormality log matches any combination registered in the combination storage unit 363, and the weighting unit 340 applies any combination registered in the combination storage unit 363. If they do not match, weighting is performed so as to be higher, and the result is output as a weighting result (step S107).

以上のように、ログ分析システム300は、異常ログの中に含まれている変数値の組み合わせに基づいて重み付けを行うことによって、ユーザに異常の原因である蓋然性の高い変数値を示すことができる。これにより、ユーザが異常の原因を探ることを容易にすることができる。   As described above, the log analysis system 300 can indicate a variable value having a high probability of causing an abnormality to the user by performing weighting based on a combination of variable values included in the abnormality log. . This makes it easy for the user to search for the cause of the abnormality.

次に、第3の実施形態に係るログ分析システム300の変形例を説明する。第3の実施形態の第1の変形例に係るログ分析システム300−1では、重み付け部340がベクトルとして定義された変数値の組み合わせを用いて、異常ログの重み付けを行う。   Next, a modified example of the log analysis system 300 according to the third embodiment will be described. In the log analysis system 300-1 according to the first modification of the third embodiment, the weighting unit 340 performs weighting of the abnormality log using a combination of variable values defined as vectors.

組み合わせ記憶部363には、変数値の組み合わせベクトルが予め記録される。組み合わせベクトルは、1種類の変数部分を1次元として扱い、多次元のベクトルとして定義される。組み合わせベクトルの各次元(各種類)において、ある種類の変数部分が存在する場合は0とし、存在しない場合は該種類の変数部分において過去に観測された集合から一意に値を定義可能な数値をとるものとする。例えば、過去にある種類の変数部分がA〜Eの値で変動していた場合、それぞれの値に対応して1〜5の数値を用いる。さらに、各変数部分の重みとして、各変数値の分布幅を算出して記録する。分布幅の定義は、第2の実施形態と同様である。   In the combination storage unit 363, combination vectors of variable values are recorded in advance. A combination vector is defined as a multi-dimensional vector by treating one type of variable part as one dimension. In each dimension (each type) of the combination vector, 0 is set if a certain type of variable part exists, and if not, a numerical value that can uniquely define a value from a set observed in the past in the variable part of that type. Shall be taken. For example, when a certain type of variable portion has fluctuated with values of A to E in the past, numerical values of 1 to 5 are used corresponding to the respective values. Further, the distribution width of each variable value is calculated and recorded as the weight of each variable portion. The definition of the distribution width is the same as in the second embodiment.

重み付け部340は、ログ異常分析部330から出力される異常ログに含まれる変数値から、上述の組み合わせベクトルを作成する。そして、重み付け部340は、異常ログから作成された組み合わせベクトルと、組み合わせ記憶部363に予め記録される変数値の各組み合わせベクトルとの距離を算出する。そして、重み付け部340は、該距離が所定の閾値以上である場合に、該異常ログに含まれる変数値の組み合わせが上位であるものとして重み付けを行う。一方、重み付け部340は、該距離が所定の閾値未満である場合に、該異常ログに含まれる変数値の組み合わせが下位であるものとして重み付けを行う。   The weighting unit 340 generates the above-described combination vector from the variable values included in the abnormality log output from the log abnormality analysis unit 330. Then, the weighting unit 340 calculates the distance between the combination vector created from the abnormality log and each combination vector of variable values recorded in advance in the combination storage unit 363. Then, when the distance is equal to or greater than a predetermined threshold, the weighting unit 340 performs weighting assuming that the combination of variable values included in the abnormality log is higher. On the other hand, when the distance is less than a predetermined threshold, the weighting unit 340 performs weighting assuming that the combination of variable values included in the abnormality log is lower.

以上のように、ログ分析システム300−1は、変数値の組み合わせをベクトルとして定義し、ベクトル間の距離を用いて重み付けを行う。そのため、単に変数値の組み合わせが組み合わせ記憶部363に記録されているか否かを判定するよりも、演算や学習が容易になる。また、ベクトル化した情報をグループ化しておくことによって、グループ毎に代表となるベクトル(グループの特徴を示すベクトル、例えば平均のベクトル)のみを比較することができるため、処理性能が向上する。   As described above, the log analysis system 300-1 defines a combination of variable values as a vector and performs weighting using the distance between the vectors. Therefore, calculation and learning are easier than simply determining whether or not a combination of variable values is recorded in the combination storage unit 363. Further, by grouping vectorized information, only representative vectors (vectors indicating group characteristics, for example, average vectors) can be compared for each group, so that processing performance is improved.

図16は、第3の実施形態の第2の変形例に係るログ分析システム300−2のブロック図である。ログ分析システム300−2は、図12の構成に加えて、フォーマット学習部371、モデル学習部372および組み合わせ学習部373を備える。フォーマット学習部371およびモデル学習部372の構成は、それぞれ図8のフォーマット学習部171およびモデル学習部172の構成と同様である。   FIG. 16 is a block diagram of a log analysis system 300-2 according to a second modification of the third embodiment. The log analysis system 300-2 includes a format learning unit 371, a model learning unit 372, and a combination learning unit 373 in addition to the configuration of FIG. The configurations of the format learning unit 371 and the model learning unit 372 are the same as the configurations of the format learning unit 171 and the model learning unit 172 in FIG.

組み合わせ学習部373は、入力されたログ中の変数値の組み合わせを蓄積し、変数値の各組み合わせについて出現頻度を算出する。そして、組み合わせ学習部373は、変数値の組み合わせおよびその出現頻度に基づいて、該変数値の組み合わせを組み合わせ記憶部363に登録する。例えば、組み合わせ学習部373は、変数値の組み合わせの出現頻度が所定の閾値以上の場合に、該変数値の組み合わせを組み合わせ記憶部363に登録してよい。出現頻度は、入力されたログに含まれる組み合わせの総和のような単一の値でよく、あるいは入力されたログ中で組み合わせが出現する時間分布のような複数の値でよい。出現頻度として時間分布を用いる場合には、異常ログ中の変数値の組み合わせの出現時刻が過去の時間分布と一致しているか否かの判定が可能になる。また、組み合わせ学習部373は、ログ分析システム300−1の組み合わせベクトルを学習し、記録してもよい。その他、組み合わせの学習のために、入力されたログから変数値の組み合わせを学習することが可能な任意の学習アルゴリズムを用いてよい。   The combination learning unit 373 accumulates the combinations of the variable values in the input log, and calculates the appearance frequency for each combination of the variable values. Then, the combination learning unit 373 registers the combination of variable values in the combination storage unit 363 based on the combination of variable values and the appearance frequency thereof. For example, the combination learning unit 373 may register the combination of variable values in the combination storage unit 363 when the appearance frequency of the combination of variable values is equal to or greater than a predetermined threshold. The appearance frequency may be a single value such as the sum of combinations included in the input log, or may be a plurality of values such as a time distribution in which combinations appear in the input log. When the time distribution is used as the appearance frequency, it is possible to determine whether or not the appearance time of the combination of the variable values in the abnormality log matches the past time distribution. The combination learning unit 373 may learn and record the combination vector of the log analysis system 300-1. In addition, any learning algorithm capable of learning a combination of variable values from an input log may be used for learning the combination.

以上のように、ログ分析システム300−2は、フォーマット、モデルおよび変数値の組み合わせの学習部を備えるため、未知のフォーマット、モデル又は変数値の組み合わせを含むログから新たにフォーマット、モデル又は変数値の組み合わせを生成し、記録することができる。   As described above, since the log analysis system 300-2 includes a learning unit for a combination of a format, a model, and a variable value, a new format, model, or variable value is created from a log that includes a combination of an unknown format, model, or variable value. Can be generated and recorded.

(その他の実施形態)
図17は、上述の各実施形態に係るログ分析システム100、200、300の概略構成図である。図17には、ログ分析システム100、200、300がログ中の変数値に基づいてログの分析を行う装置として機能するための構成例が示されている。ログ分析システム100、200、300は、分析対象ログから予め決められた形式に基づいて変数部分の値を抽出する変数抽出部としてのフォーマット判定部120、220、320と、前記変数部分の値に基づいて、前記分析対象ログの重み付けを行うログ分析部としての重み付け部140、240、340と、を備える。
(Other embodiments)
FIG. 17 is a schematic configuration diagram of the log analysis systems 100, 200, and 300 according to the above-described embodiments. FIG. 17 illustrates a configuration example for the log analysis systems 100, 200, and 300 to function as an apparatus that performs log analysis based on variable values in the log. The log analysis systems 100, 200, and 300 include a format determination unit 120, 220, and 320 as a variable extraction unit that extracts a value of a variable part based on a predetermined format from an analysis target log, And weighting units 140, 240, and 340 as log analysis units that weight the analysis target log.

本発明は、上述の実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲において適宜変更可能である。   The present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the spirit of the present invention.

上述の実施形態の機能を実現するように該実施形態の構成を動作させるプログラム(より具体的には、図5に示す処理をコンピュータに実行させるプログラム)を記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記録媒体はもちろん、そのプログラム自体も各実施形態に含まれる。   A program that operates the configuration of the embodiment so as to realize the functions of the above-described embodiment (more specifically, a program that causes a computer to execute the processing illustrated in FIG. 5) is recorded on a recording medium, and the recording medium A processing method of reading a recorded program as a code and executing it on a computer is also included in the category of each embodiment. That is, a computer-readable recording medium is also included in the scope of each embodiment. In addition to the recording medium on which the above program is recorded, the program itself is included in each embodiment.

該記録媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。   As the recording medium, for example, a floppy (registered trademark) disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a magnetic tape, a nonvolatile memory card, and a ROM can be used. Further, the embodiment is not limited to the processing executed by a single program recorded in the recording medium, and the embodiments that execute processing by operating on the OS in cooperation with other software and the function of the expansion board are also described in each embodiment. Included in the category.

上述の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。   A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.

(付記1)
ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する変数抽出部と、
前記変数部分の値に基づいて、前記分析対象ログの重み付けを行うログ分析部と、
を備えるログ分析システム。
(Appendix 1)
A variable extraction unit that extracts the value of the variable part from the analysis target log based on a predetermined format based on the characteristics of the log;
A log analysis unit that weights the analysis target log based on the value of the variable part;
A log analysis system comprising:

(付記2)
前記ログ分析部は、前記分析対象ログのうち複数のログに共通して含まれる前記変数部分の値に重み付けする付記1に記載のログ分析システム。
(Appendix 2)
The log analysis system according to supplementary note 1, wherein the log analysis unit weights values of the variable part included in common among a plurality of logs among the analysis target logs.

(付記3)
前記分析対象ログを出力するシステムの構成要素を示す情報を含む構成情報を記録する構成情報記憶部をさらに備え、
前記ログ分析部は、前記構成情報記憶部から読み出した前記構成情報に基づき、前記変数部分の値に含まれる前記構成情報を抽出する付記1又は2に記載のログ分析システム。
(Appendix 3)
A configuration information storage unit that records configuration information including information indicating the components of the system that outputs the analysis target log;
The log analysis system according to appendix 1 or 2, wherein the log analysis unit extracts the configuration information included in a value of the variable portion based on the configuration information read from the configuration information storage unit.

(付記4)
前記構成情報は、前記構成要素の間の関係を示す情報をさらに含み、
前記ログ分析部は、前記構成情報記憶部から読み出した前記関係に基づき、前記変数部分の値に含まれる前記関係を抽出する付記3に記載のログ分析システム。
(Appendix 4)
The configuration information further includes information indicating a relationship between the components,
The log analysis system according to appendix 3, wherein the log analysis unit extracts the relationship included in the value of the variable portion based on the relationship read from the configuration information storage unit.

(付記5)
前記ログ分析部は、前記変数部分の分布幅に基づいて、前記変数部分の値に重み付けする付記1に記載のログ分析システム。
(Appendix 5)
The log analysis system according to supplementary note 1, wherein the log analysis unit weights the value of the variable part based on a distribution width of the variable part.

(付記6)
前記分布幅は、前記変数が取り得る値の幅を表す数値である付記5に記載のログ分析システム。
(Appendix 6)
The log analysis system according to appendix 5, wherein the distribution width is a numerical value indicating a range of values that the variable can take.

(付記7)
前記分布幅を記録する分布情報記憶部をさらに備え、
前記ログ分析部は、前記分布情報記憶部から読み出した前記分布幅に基づいて、前記変数部分の値に重み付けする付記5又は6に記載のログ分析システム。
(Appendix 7)
A distribution information storage unit for recording the distribution width;
The log analysis system according to appendix 5 or 6, wherein the log analysis unit weights the value of the variable portion based on the distribution width read from the distribution information storage unit.

(付記8)
前記ログ分析部は、前記分析対象ログのうち1つのログに含まれる複数の前記変数部分の値の組み合わせに基づいて、前記分析対象ログの重み付けを行う付記1に記載のログ分析システム。
(Appendix 8)
The log analysis system according to appendix 1, wherein the log analysis unit weights the analysis target log based on a combination of values of a plurality of the variable portions included in one log of the analysis target logs.

(付記9)
前記組み合わせを記録する組み合わせ記憶部をさらに備え、
前記ログ分析部は、前記変数抽出部により抽出された前記変数部分の値の前記組み合わせが、前記組み合わせ記憶部に記録されているか否かに基づいて、前記分析対象ログの重み付けを行う付記8に記載のログ分析システム。
(Appendix 9)
A combination storage unit for recording the combination;
The log analysis unit weights the analysis target log based on whether or not the combination of the values of the variable parts extracted by the variable extraction unit is recorded in the combination storage unit. The described log analysis system.

(付記10)
前記組み合わせを示すベクトルを記録する組み合わせ記憶部をさらに備え、
前記ログ分析部は、前記変数抽出部により抽出された前記変数部分の値の前記組み合わせを示す前記ベクトルと、前記組み合わせ記憶部に記録されている前記ベクトルとの間の距離に基づいて、前記分析対象ログの重み付けを行う付記8に記載のログ分析システム。
(Appendix 10)
A combination storage unit for recording a vector indicating the combination;
The log analysis unit is configured to perform the analysis based on a distance between the vector indicating the combination of the values of the variable parts extracted by the variable extraction unit and the vector recorded in the combination storage unit. The log analysis system according to appendix 8, which performs weighting of the target log.

(付記11)
前記変数抽出部により抽出された前記変数部分の値の前記組み合わせを前記組み合わせ記憶部に登録する組み合わせ学習部をさらに備える付記9又は10に記載のログ分析システム。
(Appendix 11)
The log analysis system according to appendix 9 or 10, further comprising a combination learning unit that registers the combination of values of the variable part extracted by the variable extraction unit in the combination storage unit.

(付記12)
前記分析対象ログに基づいて前記形式を生成するフォーマット学習部をさらに備える付記1〜11のいずれか一項に記載のログ分析システム。
(Appendix 12)
The log analysis system according to any one of appendices 1 to 11, further comprising a format learning unit that generates the format based on the analysis target log.

(付記13)
ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する工程と、
前記変数部分の値に基づいて、前記分析対象ログの重み付けを行う工程と、
を備えるログ分析方法。
(Appendix 13)
Extracting the value of the variable portion from the analysis target log based on a predetermined format based on the characteristics of the log; and
Weighting the analysis target log based on the value of the variable portion;
A log analysis method comprising:

(付記14)
コンピュータに、
ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する工程と、
前記変数部分の値に基づいて、前記分析対象ログの重み付けを行う工程と、
を実行させるログ分析プログラム。
(Appendix 14)
On the computer,
Extracting the value of the variable portion from the analysis target log based on a predetermined format based on the characteristics of the log; and
Weighting the analysis target log based on the value of the variable portion;
Log analysis program to execute

この出願は、2015年11月17日に出願された日本出願特願2015−224500を基礎とする優先権を主張し、その開示の全てをここに取り込む。

This application claims the priority on the basis of Japanese application Japanese Patent Application No. 2015-224500 for which it applied on November 17, 2015, and takes in those the indications of all here.

Claims (14)

ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する変数抽出部と、
前記変数部分の値に基づいて、前記分析対象ログの重み付けを行うログ分析部と、
を備えるログ分析システム。
A variable extraction unit that extracts the value of the variable part from the analysis target log based on a predetermined format based on the characteristics of the log;
A log analysis unit that weights the analysis target log based on the value of the variable part;
A log analysis system comprising:
前記ログ分析部は、前記分析対象ログのうち複数のログに共通して含まれる前記変数部分の値に重み付けする請求項1に記載のログ分析システム。   The log analysis system according to claim 1, wherein the log analysis unit weights the value of the variable part included in common among a plurality of logs among the analysis target logs. 前記分析対象ログを出力するシステムの構成要素を示す情報を含む構成情報を記録する構成情報記憶部をさらに備え、
前記ログ分析部は、前記構成情報記憶部から読み出した前記構成情報に基づき、前記変数部分の値に含まれる前記構成情報を抽出する請求項1又は2に記載のログ分析システム。
A configuration information storage unit that records configuration information including information indicating the components of the system that outputs the analysis target log;
The log analysis system according to claim 1, wherein the log analysis unit extracts the configuration information included in a value of the variable portion based on the configuration information read from the configuration information storage unit.
前記構成情報は、前記構成要素の間の関係を示す情報をさらに含み、
前記ログ分析部は、前記構成情報記憶部から読み出した前記関係に基づき、前記変数部分の値に含まれる前記関係を抽出する請求項3に記載のログ分析システム。
The configuration information further includes information indicating a relationship between the components,
The log analysis system according to claim 3, wherein the log analysis unit extracts the relationship included in the value of the variable portion based on the relationship read from the configuration information storage unit.
前記ログ分析部は、前記変数部分の分布幅に基づいて、前記変数部分の値に重み付けする請求項1に記載のログ分析システム。   The log analysis system according to claim 1, wherein the log analysis unit weights the value of the variable part based on a distribution width of the variable part. 前記分布幅は、前記変数部分が取り得る値の幅を表す数値である請求項5に記載のログ分析システム。   The log analysis system according to claim 5, wherein the distribution width is a numerical value indicating a range of values that the variable portion can take. 前記分布幅を記録する分布情報記憶部をさらに備え、
前記ログ分析部は、前記分布情報記憶部から読み出した前記分布幅に基づいて、前記変数部分の値に重み付けする請求項5又は6に記載のログ分析システム。
A distribution information storage unit for recording the distribution width;
The log analysis system according to claim 5 or 6, wherein the log analysis unit weights the value of the variable portion based on the distribution width read from the distribution information storage unit.
前記ログ分析部は、前記分析対象ログのうち1つのログに含まれる複数の前記変数部分の値の組み合わせに基づいて、前記分析対象ログの重み付けを行う請求項1に記載のログ分析システム。   The log analysis system according to claim 1, wherein the log analysis unit weights the analysis target log based on a combination of values of a plurality of the variable portions included in one of the analysis target logs. 前記組み合わせを記録する組み合わせ記憶部をさらに備え、
前記ログ分析部は、前記変数抽出部により抽出された前記変数部分の値の前記組み合わせが、前記組み合わせ記憶部に記録されているか否かに基づいて、前記分析対象ログの重み付けを行う請求項8に記載のログ分析システム。
A combination storage unit for recording the combination;
The log analysis unit weights the analysis target log based on whether or not the combination of values of the variable part extracted by the variable extraction unit is recorded in the combination storage unit. Log analysis system described in.
前記組み合わせを示すベクトルを記録する組み合わせ記憶部をさらに備え、
前記ログ分析部は、前記変数抽出部により抽出された前記変数部分の値の前記組み合わせを示す前記ベクトルと、前記組み合わせ記憶部に記録されている前記ベクトルとの間の距離に基づいて、前記分析対象ログの重み付けを行う請求項8に記載のログ分析システム。
A combination storage unit for recording a vector indicating the combination;
The log analysis unit is configured to perform the analysis based on a distance between the vector indicating the combination of the values of the variable parts extracted by the variable extraction unit and the vector recorded in the combination storage unit. The log analysis system according to claim 8, wherein weighting of the target log is performed.
前記変数抽出部により抽出された前記変数部分の値の前記組み合わせを前記組み合わせ記憶部に登録する組み合わせ学習部をさらに備える請求項9又は10に記載のログ分析システム。   The log analysis system according to claim 9 or 10, further comprising a combination learning unit that registers the combination of the values of the variable parts extracted by the variable extraction unit in the combination storage unit. 前記分析対象ログに基づいて前記形式を生成するフォーマット学習部をさらに備える請求項1〜11のいずれか一項に記載のログ分析システム。   The log analysis system according to claim 1, further comprising a format learning unit that generates the format based on the analysis target log. ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する工程と、
前記変数部分の値に基づいて、前記分析対象ログの重み付けを行う工程と、
を備えるログ分析方法。
Extracting the value of the variable portion from the analysis target log based on a predetermined format based on the characteristics of the log; and
Weighting the analysis target log based on the value of the variable portion;
A log analysis method comprising:
コンピュータに、
ログの特性に基づいて予め決められた形式に基づいて分析対象ログから変数部分の値を抽出する工程と、
前記変数部分の値に基づいて、前記分析対象ログの重み付けを行う工程と、
を実行させるログ分析プログラム。

On the computer,
Extracting the value of the variable portion from the analysis target log based on a predetermined format based on the characteristics of the log; and
Weighting the analysis target log based on the value of the variable portion;
Log analysis program to execute

JP2017551530A 2015-11-17 2016-11-10 Log analysis system, method and program Active JP6965748B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015224500 2015-11-17
JP2015224500 2015-11-17
PCT/JP2016/004858 WO2017085921A1 (en) 2015-11-17 2016-11-10 Log analysis system, method, and program

Publications (2)

Publication Number Publication Date
JPWO2017085921A1 true JPWO2017085921A1 (en) 2018-09-06
JP6965748B2 JP6965748B2 (en) 2021-11-10

Family

ID=58719136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017551530A Active JP6965748B2 (en) 2015-11-17 2016-11-10 Log analysis system, method and program

Country Status (2)

Country Link
JP (1) JP6965748B2 (en)
WO (1) WO2017085921A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020017037A1 (en) * 2018-07-20 2020-01-23 日本電気株式会社 Log analysis device, log analysis method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005209115A (en) * 2004-01-26 2005-08-04 National Institute Of Information & Communication Technology Log summarization device, log summarization program and recording medium
JP2011170802A (en) * 2010-02-22 2011-09-01 Fujitsu Ltd Trouble pattern creating program and trouble pattern creating apparatus
WO2012066650A1 (en) * 2010-11-17 2012-05-24 富士通株式会社 Information processing device, message extracting method and message extracting program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4483807B2 (en) * 2006-03-16 2010-06-16 日本電気株式会社 Log format conversion device, log format conversion method, and log format conversion program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005209115A (en) * 2004-01-26 2005-08-04 National Institute Of Information & Communication Technology Log summarization device, log summarization program and recording medium
JP2011170802A (en) * 2010-02-22 2011-09-01 Fujitsu Ltd Trouble pattern creating program and trouble pattern creating apparatus
WO2012066650A1 (en) * 2010-11-17 2012-05-24 富士通株式会社 Information processing device, message extracting method and message extracting program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
長尾真宏,外3名: "トラフィック異常検出における異常内容の識別のためのリアルタイムログ要約手法", マルチメディア,分散,協調とモバイル(DICOMO2006)シンポジウム論文集 情報処理学会シンポジ, vol. 第2006巻,第6号, JPN6017001966, 31 August 2006 (2006-08-31), JP, pages 909 - 912, ISSN: 0004532590 *

Also Published As

Publication number Publication date
JP6965748B2 (en) 2021-11-10
WO2017085921A1 (en) 2017-05-26

Similar Documents

Publication Publication Date Title
JP6741216B2 (en) Log analysis system, method and program
US10002144B2 (en) Identification of distinguishing compound features extracted from real time data streams
JP6233411B2 (en) Fault analysis apparatus, fault analysis method, and computer program
WO2017104119A1 (en) Log analysis system, method, and program
JPWO2017115458A1 (en) Log analysis system, method and program
JP6787340B2 (en) Log analysis system, log analysis method and program
CN108304318B (en) Device compatibility testing method and terminal device
JP6691082B2 (en) Index selection device and method thereof
WO2018122890A1 (en) Log analysis method, system, and program
CN112671767A (en) Security event early warning method and device based on alarm data analysis
JPWO2018069950A1 (en) Log analysis method, system and program
JPWO2018066661A1 (en) Log analysis method, system and recording medium
JP6741217B2 (en) Log analysis system, method and program
JP2010250864A (en) Information processing apparatus and program
WO2017085921A1 (en) Log analysis system, method, and program
JP6798504B2 (en) Log analysis system, log analysis method and program
JP6541903B2 (en) Attack / abnormality detection device, attack / abnormality detection method, and attack / abnormality detection program
JP6438346B2 (en) Operation support device, operation support program, and operation support method
US20190278871A1 (en) Data analysis system, data analysis method, and computer program product
JP6357028B2 (en) Management point search method and apparatus
JP2019219812A (en) Information processing apparatus, component selection method, and component selection program
JP6271971B2 (en) Risk analysis apparatus and risk analysis program
JPWO2017081866A1 (en) Log analysis system, method and program
JP6907689B2 (en) Defect search program, defect search method and defect search device
CN114880713A (en) User behavior analysis method, device, equipment and medium based on data link

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180126

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180413

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210818

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210818

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210824

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211004

R150 Certificate of patent or registration of utility model

Ref document number: 6965748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150