JP2009205372A - Information processor, information processing method and program - Google Patents

Information processor, information processing method and program Download PDF

Info

Publication number
JP2009205372A
JP2009205372A JP2008046220A JP2008046220A JP2009205372A JP 2009205372 A JP2009205372 A JP 2009205372A JP 2008046220 A JP2008046220 A JP 2008046220A JP 2008046220 A JP2008046220 A JP 2008046220A JP 2009205372 A JP2009205372 A JP 2009205372A
Authority
JP
Japan
Prior art keywords
event
attribute value
event type
column
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008046220A
Other languages
Japanese (ja)
Inventor
Takehiko Hosokawa
武彦 細川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2008046220A priority Critical patent/JP2009205372A/en
Publication of JP2009205372A publication Critical patent/JP2009205372A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a load in rule creation for extracting a business event from a system log. <P>SOLUTION: An identifier extraction part 0109 investigates relation between a value of a column selected by a user 0102 among columns included in a sample log 0103 and a value of the other column, and presents a candidate of a column used as an identifier when analyzing the sample log as an event identifier list 0110, the user selects the column used as the identifier as an identifier column based on the identifier list, an event correlation diagram generation part 0111 analyzes the sample log based on a value of the identifier column, derives a transition pattern between events, generates an event correlation diagram showing the transition pattern, and presents it to the user, the user derives correspondence relation between the business event and a log event from the event correlation diagram, and an extraction rule generation part 0113 generates an extraction rule from the correspondence relation between the business event and the log event. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、例えば、業務システムから得られるログイベントを元に業務分析を行う分析システムに関する。   The present invention relates to an analysis system that performs business analysis based on, for example, log events obtained from a business system.

従来の業務分析では、業務分析用のデータを取得するための機構を予め業務システムへ組み込む必要があったり、既存の業務システムのログを元に業務的な意味を持つイベント(業務イベント)を対応付けるためのルールを作成し、情報を収集/変換する必要があった(例えば、特許文献1、特許文献2)。
特開2006−004346号公報 特開2006−338305号公報
In conventional business analysis, it is necessary to incorporate a mechanism for acquiring data for business analysis into the business system in advance, or an event with a business meaning (business event) is associated based on the log of the existing business system It was necessary to create rules for collecting and converting / converting information (for example, Patent Document 1 and Patent Document 2).
JP 2006-004346 A JP 2006-338305 A

しかし、既存の業務システムのログと業務イベントを対応付け、業務イベントの抽出ルールを作成する作業は人手で実施しているため、ルール作成の負荷が高く、限られた技術者しか実施できないという課題がある。   However, the task of associating existing business system logs with business events and creating business event extraction rules is performed manually, so the burden of rule creation is high, and only a limited number of engineers can perform it. There is.

本発明は上記のような課題を解決することを主な目的の一つとしており、既存システムのログから業務イベントを抽出するためのルール作成を支援することにより、ルール作成の負荷を低減し、多くの技術者が業務イベントの抽出ルールを作成可能とすることを主な目的とする。   One of the main objects of the present invention is to solve the above-mentioned problems, and by supporting the creation of rules for extracting business events from the logs of existing systems, the load of rule creation is reduced, The main purpose is to enable many engineers to create business event extraction rules.

本発明に係る情報処理装置は、
複数のカラムが含まれるレコードを記憶装置から順次読み出すレコード読み出し部と、
前記複数のカラムのうちイベントの種類を表すイベント種別値が記述されるイベント種別値カラムを指定するイベント種別値カラム指定情報を入力する入力部と、
前記レコード読み出し部により読み出されたレコードを入力し、入力したレコードの複数のカラムのうちイベント種別値カラムを選別するとともに、イベント種別値カラム以外のカラムをイベントの属性を表す属性値が記述されている属性値カラムとし、イベント種別値カラムに記述されているイベント種別値と各属性値カラムに記述されている各属性値とを対比して属性値カラムごとにイベント種別値と属性値との組合せを調査し、イベント種別値と属性値との組合せにおいて新たな種類が出現する度に対応する属性値カラムについてイベント種別値と属性値との組合せ種類数を更新し、入力した複数のレコードにおけるイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数する算出処理部とを有することを特徴とする。
An information processing apparatus according to the present invention includes:
A record reading unit for sequentially reading records including a plurality of columns from the storage device;
An input unit for inputting event type value column specifying information for specifying an event type value column in which an event type value representing an event type among the plurality of columns is described;
The record read by the record reading unit is input, an event type value column is selected from a plurality of columns of the input record, and attribute values representing event attributes are described in columns other than the event type value column. The attribute type column and the event type value described in the event type value column and the attribute value described in each attribute value column are compared and the event type value and attribute value are Investigate the combination, update the number of types of combination of event type value and attribute value for the attribute value column corresponding to each time a new type appears in the combination of event type value and attribute value, And a calculation processing unit that counts the number of types of combinations of event type values and attribute values for each attribute value column.

本発明によれば、属性値カラムごとに組合せ種類数を計数するため、組合せ種類数の計数結果を反映させて、システムログの解析の際に識別子として利用するカラムの候補を提示することができ、これによりシステムログ解析によるイベント間遷移の導出を正確に行うことができ、業務イベント抽出のためのルール作成における負荷を低減することができる。   According to the present invention, since the number of combination types is counted for each attribute value column, it is possible to present column candidates to be used as identifiers when analyzing the system log, reflecting the result of counting the number of combination types. As a result, it is possible to accurately derive transitions between events by system log analysis, and to reduce the load in creating rules for extracting business events.

実施の形態1.
図1は、本実施の形態に係るシステム構成例を示す図である。
図1において、業務イベント抽出ルール作成支援装置(0101)は、ユーザ(0102)からの指示に従い、指定されたサンプルログ(0103)より、業務イベント抽出ルール(0104)を生成する機構である。
業務イベント抽出ルール作成支援装置(0101)は、情報処理装置の例である。
Embodiment 1 FIG.
FIG. 1 is a diagram illustrating a system configuration example according to the present embodiment.
In FIG. 1, a business event extraction rule creation support device (0101) is a mechanism for generating a business event extraction rule (0104) from a specified sample log (0103) in accordance with an instruction from a user (0102).
The business event extraction rule creation support device (0101) is an example of an information processing device.

レコード読み出し部(0114)は、記憶装置(0201)からサンプルログ(0103)のレコードを順次読み出す。なお、以下では、サンプルログ(0103)のレコードをログレコードともいう。
詳細は後述するが、サンプルログ(0103)は例えば図3(b)に示す情報である。
The record reading unit (0114) sequentially reads the records of the sample log (0103) from the storage device (0201). Hereinafter, the record of the sample log (0103) is also referred to as a log record.
Although details will be described later, the sample log (0103) is, for example, information shown in FIG.

フォーマット抽出部(0105)は、レコード読み出し部(0114)により読み出されたレコードについて、フォーマットリスト(0106)を自動的に作成し、出力する機構である。
詳細は後述するが、フォーマットリスト(0106)は例えば図5に示す情報である。
The format extraction unit (0105) is a mechanism that automatically creates and outputs a format list (0106) for the records read by the record reading unit (0114).
Although details will be described later, the format list (0106) is, for example, information shown in FIG.

イベント種別抽出部(0107)は、サンプルログ(0103)および、ユーザ(0102)から指定されたフォーマットに従い、イベント種別リスト(0108)を自動的に作成し、出力する機構である。
詳細は後述するが、イベント種別リスト(0108)は図7に示す情報である。
The event type extraction unit (0107) is a mechanism that automatically creates and outputs an event type list (0108) according to the format specified by the sample log (0103) and the user (0102).
Although details will be described later, the event type list (0108) is information shown in FIG.

識別子抽出部(0109)は、サンプルログ(0103)、フォーマットおよび、ユーザ(0102)から指定されたイベント種別に従い、イベント識別子リスト(0110)を自動的に生成し、出力する機構である。
詳細は後述するが、イベント識別子リスト(0110)は例えば図9に示す情報である。
また、識別子抽出部(0109)は、算出処理部の例である。
The identifier extraction unit (0109) is a mechanism that automatically generates and outputs an event identifier list (0110) in accordance with the sample log (0103), the format, and the event type specified by the user (0102).
Although details will be described later, the event identifier list (0110) is information shown in FIG. 9, for example.
The identifier extraction unit (0109) is an example of a calculation processing unit.

イベント相関図生成部(0111)は、サンプルログ(0103)、フォーマット、イベント種別および、ユーザ(0102)から指定されたイベント識別子に従い、イベント相関図情報(0112)(以下、単にイベント相関図ともいう)を作成し、出力する機構である。
詳細は後述するが、イベント相関図(0112)は例えば図11に示す情報である。
また、イベント相関図生成部(0111)は、イベント相関解析部の例である。
The event correlation diagram generation unit (0111) follows the event log specified by the sample log (0103), format, event type, and user (0102) and event correlation diagram information (0112) (hereinafter also simply referred to as an event correlation diagram). ) Is created and output.
Although details will be described later, the event correlation diagram (0112) is, for example, information shown in FIG.
The event correlation diagram generation unit (0111) is an example of an event correlation analysis unit.

抽出ルール生成部(0113)は、サンプルログ(0103)、フォーマット、イベント種別、イベント識別子および、ユーザ(0102)から指定された業務イベントとイベントログとの対応表から業務イベント抽出ルール(0104)を自動的に生成する機構である。
詳細は後述するが、業務イベント抽出ルール(0104)は例えば図14に示す情報である。
The extraction rule generation unit (0113) obtains the business event extraction rule (0104) from the sample log (0103), format, event type, event identifier, and correspondence table between the business event specified by the user (0102) and the event log. It is a mechanism that generates automatically.
Although details will be described later, the business event extraction rule (0104) is, for example, information shown in FIG.

フォーマットリスト(0106)、イベント種別リスト(0108)等の各情報は表示装置(0202)に表示され、ユーザ(0102)は表示された各種情報に対して、入力装置(0203)を用いて選択や修正等を業務イベント抽出ルール作成支援装置(0101)に指示する。
業務イベント抽出ルール作成支援装置(0101)では、入力部(0115)がユーザ(0102)からの指示を受け付ける。
Each information such as the format list (0106) and the event type list (0108) is displayed on the display device (0202), and the user (0102) can select various information displayed using the input device (0203). Instruct the business event extraction rule creation support device (0101) to make corrections.
In the business event extraction rule creation support device (0101), the input unit (0115) receives an instruction from the user (0102).

本実施の形態に係る業務イベント抽出ルール作成支援装置(0101)は、システムログから業務イベントを抽出するためのルール作成における負荷を低減するために、主に以下の動作を行う。   The business event extraction rule creation support apparatus (0101) according to the present embodiment mainly performs the following operations in order to reduce the load in creating rules for extracting business events from the system log.

フォーマット抽出部(0105)が、レコード読み出し部(0114)により読み出されたレコードを解析して、サンプルログ(0103)に存在するフォーマットを抽出し、表示装置(0202)を介して、抽出したフォーマットを示すフォーマットリスト(0106)をユーザ(0102)に提示する。
ユーザ(0102)は、入力装置(0203)及び入力部(0115)を介して、フォーマットの選択結果を通知する。
また、イベント種別抽出部(0107)は、ユーザが選択したフォーマットに合致するレコードの各カラムに記述されている値を抽出し、表示装置(0202)を介して、カラムごとに抽出された値を示すイベント種別リスト(0108)をユーザ(0102)に提示する。
ユーザ(0102)は、いずれかのカラムを選択し、入力装置(0203)及び入力部(0115)を介して、選択結果を通知する。
The format extraction unit (0105) analyzes the record read by the record reading unit (0114), extracts the format existing in the sample log (0103), and extracts the format via the display device (0202). Is displayed to the user (0102).
The user (0102) notifies the format selection result via the input device (0203) and the input unit (0115).
In addition, the event type extraction unit (0107) extracts the values described in each column of the record that matches the format selected by the user, and extracts the values extracted for each column via the display device (0202). An event type list (0108) to be shown is presented to the user (0102).
The user (0102) selects any column and notifies the selection result via the input device (0203) and the input unit (0115).

識別子抽出部(0109)は、ユーザ(0102)に指定されたフォーマットに合致するレコードに含まれるカラムのうちユーザにより選択されたカラムに記述されている値とその他のカラムに記述されている値における関係を調査し、サンプルログ(0103)を解析する際の識別子として用いるカラムの候補をイベント識別子リスト(0110)として表示装置(0202)を介してユーザに提示する。
ユーザは、イベント識別子リスト(0110)に基づき、識別子として用いるカラムを識別子カラムとして選択し、入力装置(0203)及び入力部(0115)を介して、識別子カラムを通知する。
イベント相関図生成部(0111)は、識別子カラムの値を基準にしてサンプルログ(0103)を解析し、イベント間の遷移パターンを導出し、遷移パターンを示すイベント相関図(0112)を生成し、表示装置(0202)を介して、ユーザに提示する。
また、ユーザは、イベント相関図から業務イベントとログイベントとの対応関係を導出し、入力装置(0203)及び入力部(0115)を介して、対応関係を通知する。
抽出ルール生成部(0113)は業務イベントとログイベントとの対応関係から業務イベント抽出ルール(0104)を生成する。
The identifier extraction unit (0109) uses the value described in the column selected by the user among the columns included in the record that matches the format specified by the user (0102) and the value described in the other columns. The relationship is investigated, and column candidates used as identifiers when analyzing the sample log (0103) are presented to the user as an event identifier list (0110) via the display device (0202).
Based on the event identifier list (0110), the user selects a column to be used as an identifier as an identifier column, and notifies the identifier column via the input device (0203) and the input unit (0115).
The event correlation diagram generation unit (0111) analyzes the sample log (0103) with reference to the value of the identifier column, derives a transition pattern between events, generates an event correlation diagram (0112) indicating the transition pattern, It is presented to the user via the display device (0202).
Further, the user derives the correspondence between the business event and the log event from the event correlation diagram, and notifies the correspondence via the input device (0203) and the input unit (0115).
The extraction rule generation unit (0113) generates a business event extraction rule (0104) from the correspondence between the business event and the log event.

図2は、実施の形態1に係る業務イベント抽出ルール作成支援装置(0101)の全体の処理の流れを表すフローチャートである。   FIG. 2 is a flowchart showing the overall processing flow of the business event extraction rule creation support apparatus (0101) according to the first embodiment.

先ず、S0101ステップにおいて、ユーザ(0102)はサンプルログ(0103)を指定して業務イベント抽出ルール作成支援装置(0101)を実行する。
S0102ステップにおいて、レコード読み出し部(0114)がサンプルログ(0103)のログレコードを順次読み出し、フォーマット抽出部(0105)が、レコード読み出し部(0114)が読み出したログレコードについて、フォーマットリスト(0106)を自動的に作成し、出力する(レコード読み出しステップ)。
S0103ステップにおいて、ユーザ(0102)はフォーマットリストからフォーマットを選択し、選択したフォーマットを示す情報を入力装置(0203)を用いて入力し、入力部(0115)が当該情報を受け付ける。
First, in step S0101, the user (0102) designates the sample log (0103) and executes the business event extraction rule creation support device (0101).
In step S0102, the record reading unit (0114) sequentially reads the log records of the sample log (0103), and the format extracting unit (0105) reads the format list (0106) for the log records read by the record reading unit (0114). Automatically create and output (record reading step).
In step S0103, the user (0102) selects a format from the format list, inputs information indicating the selected format using the input device (0203), and the input unit (0115) receives the information.

次に、S0104ステップにおいて、イベント種別抽出部(0107)は、サンプルログ(0103)および、ユーザ(0102)から指定されたフォーマットに従い、イベント種別リスト(0108)を自動的に作成し、表示装置(0202)に出力する。
次に、S0105ステップにおいて、ユーザ(0102)はイベント種別リスト(0108)から、イベント種別を抽出するカラム番号、およびイベントとして抽出する複数の値を選択し、選択した内容を示す情報(イベント種別値カラム指定情報)を入力装置(0203)を用いて入力し、入力部(0115)が当該情報を受け付ける(入力ステップ)。
詳細は後述するが、サンプルログ(0103)の各レコードには、複数のカラムが指定されており、ユーザはイベントの種類を表すイベント種別値が記述されているカラムを選択する。このユーザが指定したカラムをイベント種別値カラムという。また、イベント種別値カラム以外のカラムはイベントの属性値が記述されているカラムであり属性値カラムともいう。
Next, in step S0104, the event type extraction unit (0107) automatically creates an event type list (0108) according to the format specified by the sample log (0103) and the user (0102), and displays it on the display device (0108). 0202).
Next, in step S0105, the user (0102) selects from the event type list (0108) a column number from which the event type is extracted and a plurality of values to be extracted as events, and information indicating the selected contents (event type value) Column designation information) is input using the input device (0203), and the input unit (0115) receives the information (input step).
Although details will be described later, a plurality of columns are specified for each record of the sample log (0103), and the user selects a column in which an event type value indicating the type of event is described. This column designated by the user is called an event type value column. Also, columns other than the event type value column are columns in which attribute values of events are described and are also referred to as attribute value columns.

次に、S0106ステップにおいて、識別子抽出部(0109)は、サンプルログ(0103)、フォーマットおよび、ユーザ(0102)から指定されたイベント種別値カラムに従い、イベント識別子リスト(0110)を自動的に生成し、表示装置(0202)に出力する(算出処理ステップ)。
次に、S0107ステップにおいて、ユーザ(0102)はイベント識別子リスト(0110)からイベント間の対応付けを行うために使用する識別子のカラム番号を選択し、選択したカラム番号を示す情報を入力装置(0203)を用いて入力し、入力部(0115)が当該情報を受け付ける(入力ステップ)。
In step S0106, the identifier extraction unit (0109) automatically generates an event identifier list (0110) according to the sample log (0103), the format, and the event type value column specified by the user (0102). And output to the display device (0202) (calculation processing step).
Next, in step S0107, the user (0102) selects the column number of the identifier used for associating the events from the event identifier list (0110), and inputs information indicating the selected column number to the input device (0203). ) And the input unit (0115) receives the information (input step).

次に、S0108ステップにおいて、イベント相関図生成部(0111)は、サンプルログ(0103)、フォーマット、イベント種別値カラムおよび、ユーザ(0102)から指定されたイベント識別子に従い、イベント相関図(0112)を作成し、表示装置(0202)に出力する(イベント相関解析ステップ)。   Next, in step S0108, the event correlation diagram generation unit (0111) displays the event correlation diagram (0112) according to the sample log (0103), the format, the event type value column, and the event identifier specified by the user (0102). Create and output to the display device (0202) (event correlation analysis step).

次に、S0109ステップにおいて、ユーザ(0102)はイベント相関図(0112)および業務プロセスを参照して、業務イベントとログイベントの発生順序の対応付けを検討し、対応表を入力する。
次に、S0110ステップにおいて、抽出ルール生成部(0113)は、サンプルログ(0103)、フォーマット、イベント種別、イベント識別子および、ユーザ(0102)から指定された業務イベントとイベントログとの対応表から業務イベント抽出ルール(0104)を自動的に生成する。
Next, in step S0109, the user (0102) refers to the event correlation diagram (0112) and the business process, examines the correspondence between the business event and the log event generation order, and inputs a correspondence table.
Next, in step S0110, the extraction rule generation unit (0113) determines the business from the sample log (0103), format, event type, event identifier, and correspondence table between the business event specified by the user (0102) and the event log. An event extraction rule (0104) is automatically generated.

次に各ステップの詳細な動作について、各テーブル例、およびフローチャート(図3〜17)を用いて説明する。   Next, the detailed operation of each step will be described using each table example and flowcharts (FIGS. 3 to 17).

図3は、例として使用する業務プロセス(0204)およびサンプルログ(0103)である。
図3(a)は、コールセンターにおける業務プロセスの例を示している。
また、図3(b)のサンプルログ(0103)は、コールセンターの業務プロセスが遂行された際の処理の履歴が示される。
また、図3(b)のサンプルログ(0103)は、複数のカラムを有し、各カラムはカンマ(,)、ハイフォン(−)又はコロン(:)で他のカラムと区切られている。
FIG. 3 shows a business process (0204) and a sample log (0103) used as an example.
FIG. 3A shows an example of a business process in a call center.
In addition, the sample log (0103) in FIG. 3B shows a history of processing when the business process of the call center is performed.
The sample log (0103) in FIG. 3B has a plurality of columns, and each column is separated from other columns by a comma (,), a hyphen (-), or a colon (:).

S0102ステップの詳細な動作について、図4のフローチャート、および図5のフォーマットリスト例を用いて説明する。   The detailed operation of step S0102 will be described using the flowchart of FIG. 4 and the format list example of FIG.

まず、S0201ステップにおいて、レコード読み出し部(0114)がサンプルログを読み込む。
S0202ステップにおいて、読み込んでいないログレコードがあるか確認し、あればS0203へ進み、なければS0209へ進む。
S0202ステップにて読み込んでいないログレコードが存在していれば、S0203ステップにおいて、レコード読み出し部(0114)がログレコードを一行読み込む。
First, in step S0201, the record reading unit (0114) reads a sample log.
In step S0202, it is confirmed whether there is a log record that has not been read. If it exists, the process proceeds to S0203, and if not, the process proceeds to S0209.
If there is a log record that has not been read in step S0202, the record reading unit (0114) reads one line of the log record in step S0203.

次に、S0204ステップにおいて、フォーマット抽出部(0105)がログレコードを時刻、文字列、数字、記号などの字句に分割する。
次に、S0205ステップにおいて、フォーマット抽出部(0105)が字句のならびからフォーマットを作成する。作成されたフォーマットは、例えば、図5のフォーマットリスト例のフォーマットの欄に記載されたものとなる。
次に、S0206ステップにおいて、フォーマット抽出部(0105)は、作成したフォーマットがフォーマットリストにあるか確認し、なければS0207ステップに進み、あればS0208ステップに進む。
Next, in step S0204, the format extraction unit (0105) divides the log record into words such as time, character string, number, and symbol.
Next, in step S0205, the format extraction unit (0105) creates a format from the lexical arrangement. The created format is, for example, described in the format column of the format list example in FIG.
Next, in step S0206, the format extraction unit (0105) checks whether the created format is in the format list. If not, the process proceeds to step S0207. If there is, the process proceeds to step S0208.

作成したフォーマットがフォーマットリストにない場合は、S0207ステップにおいて、フォーマット抽出部(0105)はフォーマットリストにフォーマットとカラム数を追加する。
ここで、カラム数はフォーマットにより抽出される字句の数であり、例えば、図5のフォーマットリスト例のカラム数の欄に記載されたものとなる。
例えば、図3(b)の1行目のレコードでは、「2007/03/02 09:30:30」、「Ringing」、「803」、「xxxxxxxxxx」、「2」、「2271」、「024046」、「TD」、「2」、「DOW」、「5」というカラム構成になっており、図5のフォーマットリストの1行目のフォーマットに該当し、また、カラム数は11である。
If the created format is not in the format list, in step S0207, the format extraction unit (0105) adds the format and the number of columns to the format list.
Here, the number of columns is the number of lexical words extracted by the format, and for example, is described in the column number column of the format list example of FIG.
For example, in the record on the first line in FIG. 3B, “2007/03/02 09:30:30”, “Ringing”, “803”, “xxxxxxxx”, “2”, “2271”, “024046” ”,“ TD ”,“ 2 ”,“ DOW ”,“ 5 ”, which corresponds to the format of the first line in the format list of FIG. 5 and has 11 columns.

次に、S0208ステップにおいて、フォーマット抽出部(0105)はフォーマットリストの対応するフォーマットの回数を1増加させ、S0202ステップに戻る。
なお、フォーマット抽出部(0105)の内部又は外部にフォーマットの出現回数をカウントするカウンタを用意し、フォーマット抽出部(0105)はこのカウンタを増加させて回数を計数するようにしてもよい。
Next, in step S0208, the format extraction unit (0105) increments the number of formats corresponding to the format list by 1, and returns to step S0202.
Note that a counter that counts the number of appearances of the format may be prepared inside or outside the format extraction unit (0105), and the format extraction unit (0105) may increase this counter to count the number of times.

また、S0202ステップでNOであった場合は、S0209ステップにおいて、フォーマット抽出部(0105)は、フォーマットリストを出現回数、カラム数の降順にソートし、フォーマット番号、回数、カラム数、フォーマットが示されるフォーマットリストを表示装置(0202)に出力する。
また、フォーマットリストは、図示していないメインメモリ、キャッシュメモリ、レジスタ等の記憶装置に記憶される。
If NO in step S0202, the format extraction unit (0105) sorts the format list in descending order of the number of appearances and the number of columns in step S0209, and the format number, the number of times, the number of columns, and the format are indicated. The format list is output to the display device (0202).
The format list is stored in a storage device (not shown) such as a main memory, a cache memory, and a register.

図3に記載のサンプルログ(0103)を元に生成されるフォーマットリストの例は、図5のフォーマットリスト例のようになる。   An example of the format list generated based on the sample log (0103) shown in FIG. 3 is as shown in the format list example of FIG.

次に、S0104ステップの詳細な動作について、図6のフローチャート、および図7のイベント種別リスト例を用いて説明する。   Next, the detailed operation of step S0104 will be described using the flowchart of FIG. 6 and the event type list example of FIG.

まず、S0301ステップにおいて、フォーマット抽出部(0105)は、S0103ステップでユーザ(0102)より指定されたフォーマットを読み込む。例えば、図5の番号1のフォーマットである。
次に、S0302ステップにおいて、レコード読み出し部(0114)が、サンプルログを読み込む。
次に、S0303ステップにおいて、レコード読み出し部(0114)が、読み込んでいないログレコードがあるか確認しあればS0304へ進み、なければS0312へ進む。
読み込んでいないレコードがあれば、S0304ステップにおいて、レコード読み出し部(0114)が、ログレコードを一行読み込む。
なお、ここで読み込むサンプルログは、図2のフローで読み込んだものと同一である。また、以降のフローチャートにおけるサンプルログの読み込み処理においても、図2のフローで読み込んだものと同一のサンプルログが読み込まれる。
First, in step S0301, the format extraction unit (0105) reads the format specified by the user (0102) in step S0103. For example, the format is number 1 in FIG.
Next, in step S0302, the record reading unit (0114) reads the sample log.
Next, in step S0303, if the record reading unit (0114) confirms whether there is a log record that has not been read, the process proceeds to step S0304, and if not, the process proceeds to step S0312.
If there is a record that has not been read, the record reading unit (0114) reads one line of the log record in step S0304.
The sample log read here is the same as that read in the flow of FIG. Also, in the sample log reading process in the subsequent flowcharts, the same sample log as that read in the flow of FIG. 2 is read.

次に、S0305ステップにおいて、イベント種別抽出部(0107)は、ログレコードが、ユーザ(0102)により指定されたフォーマットにマッチするか確認し、マッチした場合はS0306ステップに進み、マッチしなかった場合は、S0303ステップに戻る。
S0305ステップでマッチしていた場合は、イベント種別抽出部(0107)は、S0306ステップにおいて、カラム毎にデータを抽出する。
S0307ステップにおいて、イベント種別抽出部(0107)は、処理を行ってないカラムがあるか確認し、あればS0308ステップへ進み、なければS0303ステップに戻る。
次に、S0308ステップにおいて、イベント種別抽出部(0107)は、カラムと値を選択する。
Next, in step S0305, the event type extraction unit (0107) checks whether the log record matches the format specified by the user (0102). If the log record matches, the process proceeds to step S0306. Returns to step S0303.
If there is a match in step S0305, the event type extraction unit (0107) extracts data for each column in step S0306.
In step S0307, the event type extraction unit (0107) checks whether there is a column that has not been processed, and if there is, proceeds to step S0308, otherwise returns to step S0303.
In step S0308, the event type extraction unit (0107) selects a column and a value.

次に、S0309ステップにおいて、イベント種別抽出部(0107)は、イベント種別リストの対応するカラムに値があるか(イベント種別リストに「Ringing」等が既に記述されているか)を確認し、なければ、S0310ステップに進み、あればS0311ステップに進む。
ステップS0309でイベント種別リストの対応するカラムに値がない場合は、イベント種別抽出部(0107)は、S0310ステップにおいて、イベント種別リストに値(「Ringing」等)を追加し、種類数を1増加させる。
また、ステップS0309でイベント種別リストの対応するカラムに値がある場合は、S0311ステップにおいて、イベント種別抽出部(0107)は、イベント種別リストの対応するカラム、値に対する回数を1増加させ、S0307ステップに戻る。
なお、イベント種別抽出部(0107)の内部又は外部に回数をカウントするカウンタを用意し、イベント種別抽出部(0107)はこのカウンタを増加させて回数を計数するようにしてもよい。
Next, in step S0309, the event type extraction unit (0107) checks whether there is a value in the corresponding column of the event type list (whether “Ringing” or the like is already described in the event type list). , The process proceeds to step S0310. If there is, the process proceeds to step S0311.
If there is no value in the corresponding column of the event type list in step S0309, the event type extraction unit (0107) adds a value (such as “Ringing”) to the event type list and increases the number of types by 1 in step S0310. Let
If there is a value in the corresponding column of the event type list in step S0309, in step S0311, the event type extraction unit (0107) increments the number of times corresponding to the column and value in the event type list by one, and step S0307 Return to.
Note that a counter that counts the number of times may be prepared inside or outside of the event type extraction unit (0107), and the event type extraction unit (0107) may increase the counter to count the number of times.

次に、S0312ステップにおいて、イベント種別抽出部(0107)は、イベント種別リストをカラム(番号)の昇順にソートし、値を回数の降順でソートし、カラム(番号)、種類(数)、値(リスト)のリストを表示装置(0202)に出力する。
また、イベント種別リストは、図示していないメインメモリ、キャッシュメモリ、レジスタ等の記憶装置に記憶される。
Next, in step S0312, the event type extraction unit (0107) sorts the event type list in ascending order of the column (number), sorts the values in descending order of the number of times, column (number), type (number), and value. The list of (list) is output to the display device (0202).
The event type list is stored in a storage device such as a main memory, a cache memory, and a register (not shown).

図3に記載のサンプルログ(0103)を元に生成されるイベント種別リストの例は、図7のイベント種別リスト例のようになる。   An example of the event type list generated based on the sample log (0103) shown in FIG. 3 is as shown in the event type list example of FIG.

また、上述の例ではフォーマットを1つ用いる場合を用いたが、複数選択可能としても良い。その場合は、S0305〜S0311ステップまでを選択されたフォーマット毎に行い、S0312ステップで出力するイベント種別リストの先頭にフォーマット番号を付加するように変更することにより、対応可能である。
なお、この点については、詳細を後述する。
In the above example, the case where one format is used is used, but a plurality of formats may be selectable. In this case, the steps from S0305 to S0311 are performed for each selected format, and the change can be made by adding a format number to the top of the event type list output in step S0312.
Details of this point will be described later.

次に、S0106ステップの詳細な動作について、図8のフローチャート、および図9のイベント識別子リスト例を用いて説明する。   Next, the detailed operation of step S0106 will be described using the flowchart of FIG. 8 and the event identifier list example of FIG.

まず、S0401ステップにおいて、識別子抽出部(0109)は、S0103ステップでユーザ(0102)より指定されたフォーマットを読み込む。例えば、図5の番号1のフォーマットである。
次に、S0402ステップにおいて、識別子抽出部(0109)は、S0105ステップでユーザ(0102)より指定されたカラム番号及びイベントリストを読み込む。
ここで、S0105ステップでユーザ(0102)より指定されたカラム番号とは、イベント種別値カラムのカラム番号である。イベント属性値カラムはイベントカラムとも表記する。また、識別子抽出部(0109)は、イベント種別値カラム以外のカラムはイベントの属性値が示される属性値カラムとして扱う。また、ユーザは、イベント種別値カラムに記述される複数のイベント種別値の中から特定のイベント種別値を選択する。このユーザに選択されたイベント種別値の集合をイベントリストという。
次に、S0403ステップにおいて、識別子抽出部(0109)は、カラム番号、およびイベントリストを元にフォーマットを変更する。
例えば、図5のフォーマット番号を1、図7のカラム番号を2、イベント種別値を(Ringing, Dialing, Established, Released, NotReady, Ready)として選択した場合には、以下に示すフォーマットに変換される。
「%時刻%,(Ringing|Dialing|Established|Released|NotReady|Ready)−%数値%,%文字列%,%数値%,%数値%,%数値%,%文字列%,%数値%,%文字列%,%数値%」
なお、上記の「Ringing」、「Dialing」、「Established」、「Released」、「NotReady」、「Ready」がイベントリストである。
図7では、理解を促すため、イベントリストに含まれるイベント種別値に下線を付している。
なお、ユーザは、イベントリストを選択しなくてもよい。つまり、イベント種別値カラムのみを選択し、イベント種別値カラムに記述されている個々の値の選択は行わなくてもよい。
First, in step S0401, the identifier extraction unit (0109) reads the format specified by the user (0102) in step S0103. For example, the format is number 1 in FIG.
Next, in step S0402, the identifier extraction unit (0109) reads the column number and event list specified by the user (0102) in step S0105.
Here, the column number designated by the user (0102) in step S0105 is the column number of the event type value column. The event attribute value column is also referred to as an event column. Further, the identifier extraction unit (0109) treats columns other than the event type value column as attribute value columns indicating event attribute values. Further, the user selects a specific event type value from a plurality of event type values described in the event type value column. A set of event type values selected by the user is called an event list.
Next, in step S0403, the identifier extraction unit (0109) changes the format based on the column number and the event list.
For example, when the format number in FIG. 5 is 1, the column number in FIG. 7 is 2, and the event type value is selected as (Ringing, Dialing, Established, Released, NotReady, Ready), it is converted into the following format: .
“% Time%, (Ring | Dialing | Established | Released | NotReady | Ready)-% numerical value%,% character string%,% numerical value%,% numerical value%,% numerical value%,% numerical value%,% character string%,% numerical value%,% Character string%,% numerical value% "
Note that “Ringing”, “Dialing”, “Established”, “Released”, “NotReady”, and “Ready” are the event list.
In FIG. 7, the event type values included in the event list are underlined to facilitate understanding.
Note that the user does not have to select the event list. That is, it is not necessary to select only the event type value column and select individual values described in the event type value column.

次に、S0404ステップにおいて、レコード読み込み部(0114)が、サンプルログを読み込む。
S0405ステップにおいて、レコード読み込み部(0114)は、読み込んでいないログレコードがあるか確認しあればS0406ステップへ進み、なければS0414ステップへ進む。
読み込んでいないログレコードがあれば、レコード読み込み部(0114)は、S0406ステップにおいてログレコードを一行読み込む。
次に、S0407ステップにおいて、識別子抽出部(0109)は、読み込んだログレコードが、S0403ステップにて変更したフォーマットにマッチするか確認し、マッチすればS0408ステップへ進み、マッチしなければS0405ステップへ戻る。
Next, in step S0404, the record reading unit (0114) reads the sample log.
In step S0405, the record reading unit (0114) proceeds to step S0406 if there is a log record that has not been read, and proceeds to step S0414 if there is no log record.
If there is an unread log record, the record reading unit (0114) reads one line of the log record in step S0406.
Next, in step S0407, the identifier extraction unit (0109) checks whether or not the read log record matches the format changed in step S0403. If there is a match, the process proceeds to step S0408, and if not, the process proceeds to step S0405. Return.

フォーマットにマッチする場合、S0408ステップにおいて、識別子抽出部(0109)は、イベントカラムの値を取り出し、値に対応するイベント数を1増加させる。
S0409ステップにおいて、識別子抽出部(0109)は、属性値カラム毎にデータを抽出する。
S0410ステップにおいて、識別子抽出部(0109)は、処理していない属性値カラムがあるかを確認し、あればS0411ステップへ進み、なければS0405ステップへ戻る。
処理していない属性値カラムがあれば、識別子抽出部(0109)は、S0411ステップにおいて、属性値カラムと値を選択する。
次に、識別子抽出部(0109)は、S0412ステップにおいて、イベント種別値、属性値カラムに対応する値があるかを確認し、なければS0413ステップへ進み、あればS0410ステップへ戻る。
S0412ステップでイベント種別値、属性値カラムに対応する値がなければ、S0413ステップにおいて、識別子抽出部(0109)は、イベント種別値、属性値カラムに対応する種類に値を追加し、種類数を1増加させる。
次に、S0414ステップにおいて、識別子抽出部(0109)は、イベント種別値、属性値カラム毎に種類数÷イベント数を算出する。
次に、S0415ステップにおいて、識別子抽出部(0109)は、算出した値の平均値の降順でソートしイベント識別子リストを出力する。
また、イベント識別子リストは、図示していないメインメモリ、キャッシュメモリ、レジスタ等の記憶装置に記憶される。
If the format matches, in step S0408, the identifier extraction unit (0109) extracts the event column value and increments the number of events corresponding to the value by one.
In step S0409, the identifier extraction unit (0109) extracts data for each attribute value column.
In step S0410, the identifier extraction unit (0109) checks whether there is an attribute value column that has not been processed, and if there is, proceeds to step S0411, and if not, returns to step S0405.
If there is an attribute value column that has not been processed, the identifier extraction unit (0109) selects an attribute value column and a value in step S0411.
Next, in step S0412, the identifier extraction unit (0109) checks whether there is a value corresponding to the event type value and attribute value column. If not, the process proceeds to step S0413. If there is, the process returns to step S0410.
If there is no value corresponding to the event type value and attribute value column in step S0412, in step S0413, the identifier extraction unit (0109) adds a value to the type corresponding to the event type value and attribute value column, and sets the number of types. Increase by one.
Next, in step S0414, the identifier extraction unit (0109) calculates the number of types / the number of events for each event type value and attribute value column.
In step S0415, the identifier extraction unit (0109) sorts the calculated values in descending order of the average value and outputs an event identifier list.
The event identifier list is stored in a storage device (not shown) such as a main memory, a cache memory, and a register.

図3に記載のサンプルログ(0103)を元に生成されるイベント種別リストの例は、図9のイベント識別子リスト例のようになる。   An example of the event type list generated based on the sample log (0103) shown in FIG. 3 is the example of the event identifier list of FIG.

図8の処理フローにおいて、識別子抽出部(0109)は、フォーマットにマッチするレコードを選択し(S0407)、選択した複数のレコードにおいて出現したイベント種別値の出現数を計数している(S0408)。このとき、イベント種別値の出現数はイベント種別値単位(「Ringing」、「Dialing」、「Established」「Released」、「NotReady」、「Ready」の各々に対して)で計数する。
また、識別子抽出部(0109)は、選択したレコードごとに、イベント種別値と各属性値カラムに記述されている各属性値(カラム3について「205」、「206」等、カラム4について「xxxxxxxxxx」、「yyyyyyyyyy」等)とを対比して属性値カラムごとにイベント種別値と属性値との組合せを調査し、イベント種別値と属性値との組合せにおいて新たな種類が出現する度に対応する属性値カラムについてイベント種別値と属性値との組合せ種類数を更新し、入力した複数のレコードにおけるイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数している(S0409〜S0413)。このとき、組合せ種類数は属性値カラムごとイベント種別値単位(「Ringing」、「Dialing」、「Established」「Released」、「NotReady」、「Ready」の各々に対して)で計数する。
そして、識別子抽出部(0109)は、属性値カラムごとに、イベント種別値の出現数に対する組合せ種類数の比率をイベント種別値単位で算出する。算出した比率は種類数比率という。
In the processing flow of FIG. 8, the identifier extraction unit (0109) selects a record that matches the format (S0407), and counts the number of event type values that have appeared in the selected records (S0408). At this time, the number of occurrences of the event type value is counted in units of event type values (for “Ringing”, “Dialing”, “Established”, “Released”, “NotReady”, and “Ready”).
In addition, the identifier extraction unit (0109) sets, for each selected record, the event type value and each attribute value described in each attribute value column (such as “205” and “206” for the column 3, “xxxxxxxxxxxx” for the column 4). ”,“ Yyyyyyyyy ”, etc.) and the combination of the event type value and the attribute value is investigated for each attribute value column, and it corresponds to the time when a new type appears in the combination of the event type value and the attribute value. The number of types of combinations of event type values and attribute values is updated for the attribute value column, and the number of types of combinations of event type values and attribute values in a plurality of input records is counted for each attribute value column (S0409 to S0413). ). At this time, the number of combination types is counted for each attribute value column in units of event type values (for “Ringing”, “Dialing”, “Established”, “Released”, “NotReady”, and “Ready”).
Then, the identifier extraction unit (0109) calculates, for each attribute value column, the ratio of the number of combination types to the number of appearances of event type values in units of event type values. The calculated ratio is referred to as the kind number ratio.

例えば、図3(b)のサンプルログにおいて、1行目のレコードは、変更後のフォーマット「%時刻%,(Ringing|Dialing|Established|Released|NotReady|Ready)−%数値%,%文字列%,%数値%,%数値%,%数値%,%文字列%,%数値%,%文字列%,%数値%」に合致するため、選択される(S0407)。
そして、このレコードに含まれているイベント種別値である「Ringing」の出現数を1増加する(S0408)。
図16は、イベント種別値の出現数の計数結果の例を示す。
図16に示すように、イベント種別値単位で出現回数が計数される。
For example, in the sample log of FIG. 3B, the record in the first line has the format “% time%, (Ringing | Dialing | Established | Released | NotReady | Ready) −% numerical value%,% character string%. ,% Numerical value%,% numerical value%,% numerical value%,% character string%,% numerical value%,% character string%,% numerical value% ”are selected (S0407).
Then, the number of occurrences of “Ringing”, which is the event type value included in this record, is increased by 1 (S0408).
FIG. 16 shows an example of a count result of the number of appearances of event type values.
As shown in FIG. 16, the number of appearances is counted in event type value units.

また、識別子抽出部(0109)は、属性値カラムに記述される属性値である「803」、「xxxxxxxxxx」、「2」、「2271」、「024046」、「TD」、「2」、「DOW」、「5」を順次抽出し(S0409〜S0411)、イベント属性値と各属性値との組合せ(「Ringing」と「803」との組合せ、「Ringing」と「xxxxxxxxxx」との組合せ等)が他のレコードにおいて既に出現しておりイベント識別子リストに登録済みとなっているかどうかを判断する(S0412)。
その組合せが初めて出現するのであれば(S0412でNO)、新たな組合せの種類なので、その組合せをイベント識別子リストに登録し、種類数を1増加する(S0413)。例えば、「Ringing」とカラム3の属性値の組合せとして、「Ringing」と「803」の組合せが初めて出現した際に、カラム3について種類数を1つ増加し、また、他のレコードにおいて「Ringing」と「505」の組合せが初めて出現した際に、更にカラム3について種類数を1つ増加する。同様に「Ringing」とカラム4の属性値の組合せとして、「Ringing」と「xxxxxxxxxx」の組合せが初めて出現した際に、カラム4について種類数を1つ増加し、また、他のレコードにおいて「Ringing」と「yyyyyyyyyy」の組合せが初めて出現した際に、更にカラム4について種類数を1つ増加する。
図17は、イベント種別値と属性値との組合せの種類数の計数結果の例を示す。
図17に示すように、属性値カラムごとに、イベント種別値単位で組合せの種類数が計数される。
In addition, the identifier extraction unit (0109) has attribute values described in the attribute value column “803”, “xxxxxxxx”, “2”, “2271”, “024046”, “TD”, “2”, “ “DOW” and “5” are sequentially extracted (S0409 to S0411), and a combination of the event attribute value and each attribute value (a combination of “Ringing” and “803”, a combination of “Ringing” and “xxxxxxxx”, etc.) Is already appearing in another record and it is determined whether it is already registered in the event identifier list (S0412).
If the combination appears for the first time (NO in S0412), it is a new combination type, so that combination is registered in the event identifier list and the number of types is incremented by 1 (S0413). For example, when the combination of “Ringing” and the attribute value of column 3 appears for the first time as a combination of “Ringing” and “803”, the number of types is increased by one for column 3, and “Ringing” is added to other records. ”And“ 505 ”when the combination appears for the first time, the number of types for the column 3 is further increased by one. Similarly, when a combination of “Ringing” and “xxxxxxxx” appears for the first time as a combination of attribute values of “Ringing” and column 4, the number of types is increased by one for column 4, and “Ringing” is added to other records. ”And“ yyyyyyyyyy ”appear for the first time, the number of types is further increased by one for the column 4.
FIG. 17 shows an example of the counting result of the number of types of combinations of event type values and attribute values.
As shown in FIG. 17, the number of types of combinations is counted for each attribute value column in units of event type values.

そして、識別子抽出部(0109)は、イベント種別値ごと、属性値カラムごとに、種類数÷イベント数により種類数比率を算出する。
図16及び図17の例では、例えば、カラム番号3と「Ringing」の種類数:40を「Ringing」の出現数:100で除算して、0.4という種類数比率を算出する。
その後、識別子抽出部(0109)は、算出した値の平均値の降順でソートしイベント識別子リストを図9に示すように表示装置(0202)に出力する。
なお、イベント識別子リストは属性値カラム比率情報の例である。
Then, the identifier extraction unit (0109) calculates the type ratio by the number of types / the number of events for each event type value and for each attribute value column.
In the example of FIGS. 16 and 17, for example, the type number ratio of 0.4 is calculated by dividing column number 3 and the number of types of “Ringing”: 40 by the number of occurrences of “Ringing”: 100.
Thereafter, the identifier extraction unit (0109) sorts the calculated average values in descending order and outputs an event identifier list to the display device (0202) as shown in FIG.
The event identifier list is an example of attribute value column ratio information.

イベント識別子リストは、各カラムの値が各イベントに対する識別子として、どの程度妥当かを示している。各イベントを個々の処理に対応付けるためには一意に特定するための識別子(受付番号や発注番号に相当するような値、ここではカラム4が電話番号に対応していて一意になることを想定)が必要である。
ここで、イベント毎に「xカラムの値の種類/イベントの発生数=1.0」であれば、xカラムに出現する属性値は相互に異なる値であり、xカラムの属性値を基準にしてログデータを時系列にトレースしていけばイベント間の遷移を完全に一意に特定できる。
しかし、ループ(変更や再提出など)があるため、完全には1.0とはならない。例えば「Ringing」が100回発生していて、「Ringing」のときのカラム4の種類が90種類であれば0.9となる。この値が1.0に近いほど識別子として妥当であり、1つまたは複数の組合せにより一意となることを想定している。
このため、識別子抽出部(0109)は、図9に示すように、算出した値の平均値が高い属性値カラムほど上位に配置するイベント識別子リストを表示装置(0202)に表示し、ユーザ(0102)は、イベント識別子リストの最上位の属性値カラムを選択する。
The event identifier list indicates how valid each column value is as an identifier for each event. An identifier for uniquely identifying each event to be associated with each process (a value corresponding to a reception number or order number, assuming that column 4 corresponds to a telephone number and is unique here) is required.
Here, if “value type of x column / number of occurrences of event = 1.0” for each event, the attribute values appearing in the x column are different from each other, and the attribute value of the x column is used as a reference. By tracing log data in chronological order, transitions between events can be identified completely uniquely.
However, due to loops (changes, resubmissions, etc.), it is not completely 1.0. For example, if “Ringing” occurs 100 times and the number of types of column 4 at the time of “Ringing” is 90, the value is 0.9. It is assumed that the closer this value is to 1.0, the more appropriate the identifier, and the uniqueness by one or more combinations.
For this reason, as shown in FIG. 9, the identifier extraction unit (0109) displays the event identifier list arranged higher in the attribute value column with the higher average value of the calculated values on the display device (0202), and the user (0102). ) Selects the highest attribute value column in the event identifier list.

また、本実施例ではイベントカラムを1つ用いる場合を用いたが、複数選択可能としても良い。その場合は、S0408ステップにおいて、イベントカラムの値の抽出を、複数のイベントカラムから値を抽出し、連結したものをイベント種別として管理するように変更することにより、対応可能である。
例えば、カラム1に「電話操作」、「メール操作」、「Web操作」等が記述され、カラム2に「イベント1」、「イベント2」等が記述されるようなフォーマットの場合、ユーザ(0102)はこれらカラム1及びカラム2をイベントカラムとして指定し(入力装置(0203)よりイベントカラムを指定する情報を入力し)、識別子抽出部(0109)は、イベントカラムとして指定されたカラム1及びカラム2のイベント種別値を結合することにより特定のイベントが特定できる。
この場合は、例えば、結合された「カラム1の値_カラム2の値」をイベント種別値として扱う。そして、属性値カラムごとに、「カラム1の値_カラム2の値」と属性値との組合せ種類数をカウントする。
以降の処理は、上記の説明の通りである。
In this embodiment, the case where one event column is used is used. However, a plurality of event columns may be selected. In that case, in step S0408, the extraction of the value of the event column can be dealt with by changing the extraction of values from a plurality of event columns and managing the concatenated values as event types.
For example, in a format in which “telephone operation”, “mail operation”, “Web operation”, etc. are described in column 1 and “event 1”, “event 2”, etc. are described in column 2, the user (0102) ) Specifies these columns 1 and 2 as event columns (inputs information specifying event columns from the input device (0203)), and the identifier extraction unit (0109) specifies the columns 1 and columns specified as event columns. A specific event can be specified by combining two event type values.
In this case, for example, the combined “value of column 1_value of column 2” is handled as the event type value. Then, for each attribute value column, the number of combinations of “value of column 1_value of column 2” and attribute value is counted.
The subsequent processing is as described above.

次に、S0108ステップの詳細な動作について、図10のフローチャート、および図11のイベント相関図例を用いて説明する。   Next, the detailed operation of step S0108 will be described using the flowchart of FIG. 10 and the event correlation diagram example of FIG.

まず、S0501ステップにおいて、イベント相関図生成部(0111)は、ユーザ(0102)より指定されたフォーマットを読み込む。
次に、S0502ステップにおいて、イベント相関図生成部(0111)は、ユーザ(0102)より指定されたカラム番号及びイベントリストを読み込む。
次に、S0503ステップにおいて、イベント相関図生成部(0111)は、カラム番号、およびイベントリストを元にフォーマットを変更する。
例えば、図5のフォーマット番号を1、図7のカラム番号を2、値を(Ringing, Dialing, Established, Released, NotReady, Ready)として選択した場合には、以下のようにフォーマットが変換される。
「%時刻%,(Ringing|Dialing|Established|Released|NotReady|Ready)−%数値%,%文字列%,%数値%,%数値%,%数値%,%文字列%,%数値%,%文字列%,%数値%」
First, in step S0501, the event correlation diagram generation unit (0111) reads the format specified by the user (0102).
In step S0502, the event correlation diagram generation unit (0111) reads the column number and event list specified by the user (0102).
In step S0503, the event correlation diagram generation unit (0111) changes the format based on the column number and the event list.
For example, when the format number of FIG. 5 is 1, the column number of FIG. 7 is 2, and the value is selected as (Ringing, Dialing, Established, Released, NotReady, Ready), the format is converted as follows.
“% Time%, (Ring | Dialing | Established | Released | NotReady | Ready)-% numerical value%,% character string%,% numerical value%,% numerical value%,% numerical value%,% numerical value%,% character string%,% numerical value%,% Character string%,% numerical value% "

次に、イベント相関図生成部(0111)は、S0504ステップにおいてユーザ(0102)より指定された識別子カラムを読み込む。この識別子カラムとは、図2のS0107ステップにおいて指定されたカラムであり、前述したように、通常はイベント識別子リスト(図9)の最上位のカラムである。
なお、ユーザ(0102)より指定された識別子カラムは、指定属性値カラムともいう。
Next, the event correlation diagram generation unit (0111) reads the identifier column designated by the user (0102) in step S0504. This identifier column is a column designated in step S0107 in FIG. 2, and as described above, it is usually the highest column in the event identifier list (FIG. 9).
The identifier column designated by the user (0102) is also referred to as a designated attribute value column.

次に、S0505ステップにおいて、レコード読み込み部(0114)がサンプルログを読み込む。
次に、S0506ステップにおいて、レコード読み込み部(0114)は、読み込んでいないログレコードがあるか確認しあればS0507ステップへ進み、なければS0513ステップへ進む。
読み込んでいないログレコードがあれば、S0507ステップにおいて、レコード読み込み部(0114)は、ログレコードを一行読み込む。
Next, in step S0505, the record reading unit (0114) reads the sample log.
Next, in step S0506, the record reading unit (0114) proceeds to step S0507 if it is confirmed that there is a log record that has not been read, and proceeds to step S0513 if there is no log record.
If there is an unread log record, in step S0507, the record reading unit (0114) reads one line of the log record.

次に、S0508ステップにおいて、イベント相関図生成部(0111)は、読み込まれたログレコードが、S0503ステップにて変更したフォーマットにマッチするか確認し、マッチすればS0509ステップに進み、しなければS0506ステップに戻る。
フォーマットにマッチする場合は、イベント相関図生成部(0111)は、S0509ステップにおいて、識別子カラム、イベントカラムの値を取り出す。
次に、S0510ステップにおいて、イベント相関図生成部(0111)は、識別子に対応する前回イベントがあるかを確認し、あればS0511ステップに進み、なければS0512ステップに進む。
ここで、前回イベントとは、新たに入力した新規入力レコード(つまり、現在S0509ステップの処理の対象となっているログレコード)の識別子カラム(指定属性値カラム)に記述されている属性値と共通の属性値が識別子カラム(指定属性値カラム)に記述されている入力済みのレコード(つまり、既にS0509ステップの処理が実施済のログレコード)の中で最後尾に位置するレコードに示されているイベント種別値(「Ringing」等)である。
例えば、識別子カラムがカラム4であり、新たに入力した新規入力レコードのカラム4に「xxxxxxxxxx」が記述されている場合は、入力済みのレコードのうち、カラム4に「xxxxxxxxxx」が記述されている最後尾のレコードのイベント種別値を前回イベントとする。
Next, in step S0508, the event correlation diagram generation unit (0111) checks whether the read log record matches the format changed in step S0503. If it matches, the process proceeds to step S0509. Return to step.
When the format matches, the event correlation diagram generation unit (0111) takes out the values of the identifier column and the event column in step S0509.
Next, in step S0510, the event correlation diagram generation unit (0111) checks whether there is a previous event corresponding to the identifier. If there is, the process proceeds to step S0511, and if not, the process proceeds to step S0512.
Here, the previous event is the same as the attribute value described in the identifier column (designated attribute value column) of the newly input new input record (that is, the log record currently being processed in step S0509). The attribute value is indicated in the record located at the end of the input records (that is, the log records that have already been processed in step S0509) described in the identifier column (specified attribute value column). Event type value (such as “Ringing”).
For example, when the identifier column is column 4 and “xxxxxxxxxxxx” is described in column 4 of the newly input new input record, “xxxxxxxxxxxx” is described in column 4 among the already input records. The event type value of the last record is the previous event.

次に、S0511ステップにおいて、イベント相関図生成部(0111)は、前回イベント、現在イベントの組に対応する回数を1増加させる。
現在イベントとは、新規入力レコードに示されるイベント種別値である。
Next, in step S0511, the event correlation diagram generation unit (0111) increments the number of times corresponding to the combination of the previous event and the current event by one.
The current event is an event type value indicated in the new input record.

例えば、カラム4を識別子カラムとしている場合に、属性値「xxxxxxxxx」に対してRinging→Establish→Releaseという順序でイベント種別値が検出され、属性値「yyyyyyyyyy」に対してRinging→Releaseという順序でイベント種別値が検出され、属性値「zzzzzzzzzz」に対してDiaring→Establish→Releaseという順序でイベント種別値が検出された場合は、以下のように計数される。
Ringing,Establish, 1
Ringing,Release, 1
Dialing,Establish, 1
Establish,Release, 2
For example, when column 4 is an identifier column, event type values are detected in the order of Ringing → Establish → Release for attribute value “xxxxxxxx”, and events in the order of Ringing → Release for attribute value “yyyyyyyyy”. When the type value is detected and the event type value is detected in the order of Dialing → Establish → Release with respect to the attribute value “zzzzzzzzz”, the count is performed as follows.
Ringing, Establish, 1
Ringing, Release, 1
Dialing, Establish, 1
Establish, Release, 2

次に、イベント相関図生成部(0111)は、S0512ステップにおいて、識別子に対応する前回イベントに、現在イベントを保存し、S0506ステップに戻る。
つまり、レコードの入力順序に従って、前回のイベント種別値と現在のイベント種別値を連結させる。
Next, in step S0512, the event correlation diagram generation unit (0111) stores the current event in the previous event corresponding to the identifier, and returns to step S0506.
That is, the previous event type value and the current event type value are linked in accordance with the record input order.

すべてのログレコードが読み込まれ、すべてのログレコードに対してS0507〜S0512の処理が行われた場合(S0506でNO)は、イベント相関図生成部(0111)は、S0513ステップにおいて、各イベントに対応するノードを生成する。
次に、イベント相関図生成部(0111)は、S0514ステップにおいて、前回イベント、現在イベントの組に対応するエッジを生成する。
このとき、前回イベント、現在イベントの組に対応する回数に応じて線の太さを変更する。
つまり、イベント相関図生成部(0111)は、連結したイベント種別値を解析して複数のイベント遷移パターンを導出し、イベント遷移パターンごとに、遷移元イベントを表す前回イベント(遷移元イベント種別値)と遷移先イベントを表す現在イベント(遷移先イベント種別値)の組合せの出現回数を抽出する。そして、各イベント遷移パターンをノードとエッジで示すとともに、各イベント遷移パターンにおいて前回イベントと現在イベントの組合せの出現回数を線の太さとして表すイベント相関図(0112)を生成する。
最後に、イベント相関図生成部(0111)は、S0515ステップにおいて、レイアウトを整えイベント相関図を表示装置(0202)に出力する。
また、イベント相関図は、図示していないメインメモリ、キャッシュメモリ、レジスタ等の記憶装置に記憶される。
When all the log records are read and the processing of S0507 to S0512 is performed on all the log records (NO in S0506), the event correlation diagram generation unit (0111) responds to each event in step S0513. Generate a node to do.
Next, the event correlation diagram generation unit (0111) generates an edge corresponding to the combination of the previous event and the current event in step S0514.
At this time, the line thickness is changed according to the number of times corresponding to the previous event and the current event group.
That is, the event correlation diagram generation unit (0111) analyzes the linked event type values to derive a plurality of event transition patterns, and the previous event (transition source event type value) representing the transition source event for each event transition pattern. And the number of appearances of the combination of the current event (transition destination event type value) representing the transition destination event. Then, each event transition pattern is indicated by a node and an edge, and an event correlation diagram (0112) is generated in which the number of appearances of the combination of the previous event and the current event is represented as a line thickness in each event transition pattern.
Finally, in step S0515, the event correlation diagram generation unit (0111) arranges the layout and outputs the event correlation diagram to the display device (0202).
In addition, the event correlation diagram is stored in a storage device such as a main memory, a cache memory, and a register (not shown).

図3(b)に記載のサンプルログ(0103)を元に生成されるイベント相関図の例は、図11のイベント相関図例のようになる。   An example of an event correlation diagram generated based on the sample log (0103) shown in FIG. 3B is as shown in the event correlation diagram of FIG.

また、本実施例では識別子カラムを1つ用いる場合を用いたが、複数選択可能としても良い。
その場合は、S0509ステップにおいて、識別子カラムの値の抽出を、複数の識別子カラムから値を抽出し、連結したものを識別子として管理するように変更することにより、対応可能である。
例えば、ユーザ(0102)は図7のカラム3とカラム4を識別子カラムとして指定し(入力装置(0203)より識別子カラムを指定する情報を入力し)、イベント相関図生成部(0111)は、新規入力レコードのカラム3とカラム4の値を調査し、新規入力レコードのカラム3の値と同じ値がカラム3に記述されカラム4の値と同じ値がカラム4に記述されている入力済みのレコードのうち、最後尾のレコードのイベント種別値を前回イベントとする。
そして、このように検索された前回イベントと現在イベントを連結する。
以降の処理は、上記の説明の通りである。
In this embodiment, the case where one identifier column is used is used. However, a plurality of identifier columns may be selected.
In that case, in step S0509, the extraction of the value of the identifier column can be dealt with by changing the extraction of values from a plurality of identifier columns and managing the concatenated values as identifiers.
For example, the user (0102) specifies columns 3 and 4 in FIG. 7 as identifier columns (inputs information specifying the identifier column from the input device (0203)), and the event correlation diagram generation unit (0111) Investigate the values in columns 3 and 4 of the input record, and the entered record where the same value as the value of column 3 in the new input record is described in column 3 and the same value as the value of column 4 is described in column 4 Among them, the event type value of the last record is set as the previous event.
Then, the previous event and the current event searched in this way are connected.
The subsequent processing is as described above.

また、本実施例では前回イベント、現在イベントの組に対応する回数に応じて線の太さを変更するように記載したが、太さのみではなく、線の種類や色などを変更しても良い。また、回数ではなく時間距離など他の値を用いても良い。   In this embodiment, the line thickness is changed according to the number of times corresponding to the previous event and the current event group. However, not only the thickness but also the line type and color can be changed. good. Also, other values such as a time distance may be used instead of the number of times.

また、本実施例では、S0513ステップではノードを生成するのみであるが回数やイベントの種類により、太さ、種類、色等を変更するようにしても良い。   In this embodiment, only the node is generated in step S0513, but the thickness, type, color, etc. may be changed depending on the number of times and the type of event.

図2のS0109ステップでは、ユーザ(0102)は、S0108ステップにより出力された図11のようなイベント相関図と図3(a)の業務プロセス(0204)を参照し、業務イベントとログイベントの発生順序の対応付けを検討する。
ここでは、図12の業務イベントとログイベントの発生順序の対応イメージのような対応とする。
ユーザ(0102)は、業務イベントとログイベントの発生順序の対応表を入力する。
In step S0109 of FIG. 2, the user (0102) refers to the event correlation diagram as shown in FIG. 11 output in step S0108 and the business process (0204) of FIG. Consider order mapping.
Here, the correspondence is as shown in the correspondence image of the occurrence order of the business event and the log event in FIG.
The user (0102) inputs a correspondence table of the order of occurrence of business events and log events.

図3に記載の業務プロセス(0204)、サンプルログ(0103)を元とした例では、図13の業務イベントとログイベント発生順序の対応表例のようになる。
この対応付けもユーザ(0102)が行う。
The example based on the business process (0204) and the sample log (0103) shown in FIG. 3 is an example of a correspondence table between the business event and the log event occurrence order shown in FIG.
This association is also performed by the user (0102).

次に、図2のS0110では、サンプルログ(0103)、フォーマット、イベント種別値、イベント識別子(識別子カラムの属性値)および、ユーザ(0102)から指定された業務イベントとイベントログとの対応表から、抽出ルール生成部(0113)が業務イベント抽出ルール(0104)を生成する。
図3に記載の業務プロセス(0204)、サンプルログ(0103)を元とした例では、図14の業務イベント抽出ルール例のようになる。
Next, in S0110 of FIG. 2, from the correspondence table between the sample log (0103), the format, the event type value, the event identifier (identifier column attribute value), and the business event specified by the user (0102) and the event log. The extraction rule generation unit (0113) generates a business event extraction rule (0104).
An example based on the business process (0204) and the sample log (0103) shown in FIG. 3 is the business event extraction rule example of FIG.

上記のような構成、動作とすることにより、既存システムのログを自動解析し、ログのフォーマットの候補、ログイベント種別の候補、ログイベント識別子の候補を順次提示し、使用者がそれらを選択することにより、業務プロセスと関係性の高い、ログイベントの相関を得ることが可能である。
また、ログイベントの発生順と業務イベントを対応付けることによりのログから業務イベントを自動的に抽出するための抽出ルールを半自動生成することが可能となるため、既存システムのログから業務イベントを抽出するためのルール作成を支援することにより、ルール作成の負荷を低減し、多くの技術者が業務イベントの抽出ルールを作成することが可能となる。
With the configuration and operation as described above, the log of the existing system is automatically analyzed, the log format candidates, the log event type candidates, and the log event identifier candidates are sequentially presented, and the user selects them. As a result, it is possible to obtain a correlation between log events that is highly related to the business process.
In addition, because it is possible to generate semi-automatic extraction rules for automatically extracting business events from the log by associating the order of occurrence of log events with business events, business events are extracted from the existing system log. By supporting the creation of rules for this purpose, the load of rule creation can be reduced, and many engineers can create business event extraction rules.

また、本実施の形態では、イベント相関図生成部により、イベント相関図を自動的に生成したが、抽出したイベント識別子毎のイベント発生順序から図15に示すイベントツリー例のような図を生成する方式であっても良い。   Further, in this embodiment, the event correlation diagram is automatically generated by the event correlation diagram generation unit, but a diagram like the event tree example shown in FIG. 15 is generated from the event occurrence order for each extracted event identifier. It may be a method.

なお、上記の説明では、複数種のフォーマットが含まれているサンプルログ(0103)を用いる場合を説明したが、フォーマットが1種類であれば、図2のS0102、S0103、図6のS0301、S0305、図8のS401等フォーマットの選択に関する処理は省略することができる。   In the above description, the case where the sample log (0103) including a plurality of formats is used has been described. However, if there is one format, S0102 and S0103 in FIG. The processing relating to the format selection such as S401 in FIG. 8 can be omitted.

実施の形態2.
実施の形態1では、識別子抽出部(0109)が、図9に例示のイベント識別子リストを表示装置(0202)に出力し、ユーザ(0102)がイベント識別子リストに示されるいずれかのカラムを識別子カラムとして指定し、イベント相関図生成部(0111)がユーザ(0102)から指定された識別子カラムを基準にしてサンプルログ(0103)を解析してイベント相関図を生成することとしていた。
これに代えて、識別子抽出部(0109)はイベント識別子リストを表示装置(0202)に出力せず、イベント相関図生成部(0111)がユーザ(0102)からの指定なしに識別子カラムを自ら指定してイベント相関図を生成するようにしてもよい。
Embodiment 2. FIG.
In the first embodiment, the identifier extraction unit (0109) outputs the event identifier list illustrated in FIG. 9 to the display device (0202), and the user (0102) displays any column indicated in the event identifier list as an identifier column. The event correlation diagram generation unit (0111) analyzes the sample log (0103) with reference to the identifier column designated by the user (0102) to generate an event correlation diagram.
Instead, the identifier extraction unit (0109) does not output the event identifier list to the display device (0202), and the event correlation diagram generation unit (0111) designates the identifier column by itself without designation from the user (0102). An event correlation diagram may be generated.

前述したように、種類数÷イベント数により算出される種類数比率が1.0に近いほど識別子カラムとして適当と考えられるため、本実施の形態では、イベント相関図生成部(0111)は、種類数比率の平均値が最も大きいカラムを識別子カラムとして選択し、選択した識別子カラムを基準にしてサンプルログ(0103)を解析してイベント相関図を生成する。   As described above, the closer the number ratio calculated by the number of types divided by the number of events is, the more appropriate the identifier column is. Therefore, in this embodiment, the event correlation diagram generation unit (0111) The column having the largest average number ratio is selected as the identifier column, and the event log is generated by analyzing the sample log (0103) based on the selected identifier column.

なお、本実施の形態では、イベント識別子リストを表示装置(0202)に出力せず、イベント相関図生成部(0111)が自ら識別子カラムを指定する点のみが実施の形態1と異なっており、他の処理は実施の形態1と同様である。
また、本実施の形態に係る業務イベント抽出ルール作成支援装置(0101)の構成も図1に示した通りである。
Note that the present embodiment is different from the first embodiment only in that the event identifier list is not output to the display device (0202) and the event correlation diagram generation unit (0111) specifies the identifier column by itself. This process is the same as in the first embodiment.
The configuration of the business event extraction rule creation support apparatus (0101) according to the present embodiment is also as shown in FIG.

実施の形態3.
実施の形態1では、識別子抽出部(0109)が、カラムごとに種類数÷イベント数により種類数比率を算出し、種類数比率を示すイベント識別子リストを生成していた。
これに代えて、識別子抽出部(0109)が、種類数比率ではなく、組合せ種類数自体を示すイベント識別子リストを生成するようにしてもよい。
Embodiment 3 FIG.
In Embodiment 1, the identifier extraction unit (0109) calculates the type number ratio by the number of types / the number of events for each column, and generates an event identifier list indicating the type number ratio.
Instead of this, the identifier extraction unit (0109) may generate an event identifier list indicating the number of types of combination itself, not the number of types ratio.

例えば、識別子抽出部(0109)が、図8の0413ステップまでの処理を行って、図16に示すように、イベント種別値ごと、カラムごとに種類数を計数した後、S0414ステップの種類数÷イベント数の算出を行わずに、種類数の平均値又は合計値によりイベント識別子リストをソートし、図18に示すような、イベント種別値ごと、カラムごとに種類数を示すイベント識別子リストを生成し、表示装置(0202)に出力するようにしてもよい。
この場合も、最も上位のカラムは種類数が最も多いことから識別子として最も適切なカラムであると考えられる。
For example, after the identifier extraction unit (0109) performs the processing up to step 0413 in FIG. 8 and counts the number of types for each event type value and for each column as shown in FIG. 16, the number of types in step S0414 / Without calculating the number of events, the event identifier list is sorted by the average value or the total value of the number of types, and an event identifier list indicating the number of types for each column is generated as shown in FIG. Alternatively, the data may be output to the display device (0202).
Also in this case, the highest column is considered to be the most appropriate column as an identifier because it has the largest number of types.

また、属性値カラムごとの組合せ種類数の合計値÷イベント種別値の出現回数の合計数の値をイベント識別子リストに示すことも可能である。
例えば、図16に示すイベント種別値ごとの出現数を総和すると、図19に示すように620となる(100+100+200+200+10+10=620)。
また、図17に示す組合せ種類数の属性値カラムごとの合計は、図20に示すように、カラム3:204、カラム4:466、カラム5:62となり、これらを図19に示す620で除算すると、カラム3:0.33、カラム4:0.75、カラム5:0.10となり、この比率の降順にカラムをソートしてイベント識別子リストとしてもよい(図20はソート後の状態を示している)。
It is also possible to indicate in the event identifier list the value of the total number of combination types for each attribute value column / the total number of occurrences of event type values.
For example, the total number of appearances for each event type value shown in FIG. 16 is 620 as shown in FIG. 19 (100 + 100 + 200 + 200 + 10 + 10 = 620).
In addition, the sum of the number of types of combinations shown in FIG. 17 for each attribute value column is, as shown in FIG. 20, column 3: 204, column 4: 466, column 5:62, and these are divided by 620 shown in FIG. Then, column 3: 0.33, column 4: 0.75, column 5: 0.10, and the columns may be sorted in descending order of this ratio to form an event identifier list (FIG. 20 shows the state after sorting). ing).

なお、本実施の形態では、上記した点のみが実施の形態1と異なっており、他の処理は実施の形態1と同様である。
また、本実施の形態に係る業務イベント抽出ルール作成支援装置(0101)の構成も図1に示した通りである。
In the present embodiment, only the points described above are different from those in the first embodiment, and other processes are the same as those in the first embodiment.
The configuration of the business event extraction rule creation support apparatus (0101) according to the present embodiment is also as shown in FIG.

また、実施の形態2と同様に、イベント識別子リストを表示装置(0202)に出力せずに、イベント相関図生成部(0111)が、種類数の平均値等が最も大きいカラムを識別子カラムとして選択し、選択した識別子カラムを基準にしてサンプルログ(0103)を解析してイベント相関図を生成するようにしてもよい。   As in the second embodiment, the event correlation diagram generation unit (0111) selects the column with the largest average number of types as the identifier column without outputting the event identifier list to the display device (0202). Then, the event log may be generated by analyzing the sample log (0103) based on the selected identifier column.

実施の形態4.
実施の形態1では、フォーマットを1つ用いる場合を説明したが、複数のフォーマットを利用してもよい。
Embodiment 4 FIG.
In Embodiment 1, the case where one format is used has been described, but a plurality of formats may be used.

具体的には、図6のS0305〜S0311ステップまでの処理を選択されたフォーマット毎に行い、S0312ステップで出力するイベント種別リストの先頭にフォーマット番号を付加するように変更することにより、対応可能である。
この場合、ユーザはフォーマットごとにイベント種別値カラムを選択する。
Specifically, the processing from step S0305 to step S0311 in FIG. 6 is performed for each selected format, and it is possible to cope with the change by adding a format number to the top of the event type list output in step S0312. is there.
In this case, the user selects an event type value column for each format.

また、図8のS0407以降の処理をフォーマットごとに行い、S0415で出力するイベント種別リストの先頭にフォーマット番号を付加する。
例えば、図21に示すように、イベント識別子リストにフォーマット番号を示す欄を設け、フォーマットごとにイベント識別子リストを出力する。
図21の例では、上段のイベント識別子リストは、フォーマット1についてのイベント識別子リストであり、下段のイベント識別子リストは、フォーマット5についてのイベント識別子リストである。
識別子抽出部(0109)は、フォーマットごとの複数のイベント識別子リストを表示装置(0202)に出力し、ユーザ(0102)にフォーマットごとに識別子カラムを選択させる。
ここで、ユーザ(0102)は、各フォーマットに対して共通の属性値(例えば、電話番号)が記述されているカラムを選択する必要がある。例えば、フォーマット1のカラム4に記述されている値が電話番号であり、ユーザがフォーマット1のカラム4を識別子カラムとして選択するのであれば、フォーマット5についても電話番号が記述されているカラムを識別子カラムとして選択する必要がある。
このため、ユーザが共通の属性値が記述されるカラムを判別しやすいように、図21の各イベント識別子リストに、属性値を例示する欄を追加してもよい。この場合には、例えば、上段のイベント識別子リストのカラム4に対して「xxxxxxxxxx」、「yyyyyyyyyy」等のカラム4に記述されている属性値を例示する。他のカラム、下段のイベント識別子リストについても同様に、属性値を例示する。
Further, the processing after S0407 in FIG. 8 is performed for each format, and the format number is added to the head of the event type list output in S0415.
For example, as shown in FIG. 21, a column indicating the format number is provided in the event identifier list, and the event identifier list is output for each format.
In the example of FIG. 21, the upper event identifier list is an event identifier list for format 1, and the lower event identifier list is an event identifier list for format 5.
The identifier extraction unit (0109) outputs a plurality of event identifier lists for each format to the display device (0202), and causes the user (0102) to select an identifier column for each format.
Here, the user (0102) needs to select a column in which a common attribute value (for example, telephone number) is described for each format. For example, if the value described in the column 4 of the format 1 is a telephone number and the user selects the column 4 of the format 1 as an identifier column, the column in which the telephone number is described for the format 5 is also an identifier. Must be selected as a column.
For this reason, a column exemplifying attribute values may be added to each event identifier list of FIG. 21 so that the user can easily determine the columns in which common attribute values are described. In this case, for example, the attribute values described in the column 4 such as “xxxxxxxx”, “yyyyyyyyy”, etc. are exemplified with respect to the column 4 of the upper event identifier list. Similarly, the attribute values are exemplified for the other column and lower event identifier lists.

また、図21の例を用いて説明すると、図10のS0503ステップにおいて、フォーマット1及びフォーマット5の各々に対してフォーマット変更を行い、S0508ステップにおいて、読み込まれたレコードのフォーマットが変更後のフォーマット1又は変更後のフォーマット5に合致すればYESとなる。
そして、S0510ステップで、識別子カラムにおいて属性値が共通する前回イベントを検索するが、これは、フォーマット1の識別子カラム、フォーマット5の識別子カラムのいずれもが検索の対象となる。
例えば、フォーマット1の識別子カラムがカラム4であり、フォーマット5の識別子カラムがカラム3である場合に、現在処理の対象となっているレコード(新規入力レコード)の識別子カラムの属性値が「xxxxxxxxxx」であれば、フォーマット1のレコードであってカラム4に「xxxxxxxxxx」が示されているレコード又はフォーマット5のレコードであってカラム3に「xxxxxxxxxx」が示されているレコードであって最後尾のレコードが連結の対象となる。
Further, using the example of FIG. 21, in step S0503 in FIG. 10, the format is changed for each of format 1 and format 5, and in step S0508, the format of the read record is changed to format 1 after change. Or, if it matches the format 5 after the change, it becomes YES.
In step S0510, the previous event having the same attribute value in the identifier column is searched, and both the identifier column of format 1 and the identifier column of format 5 are to be searched.
For example, when the identifier column of the format 1 is the column 4 and the identifier column of the format 5 is the column 3, the attribute value of the identifier column of the record currently being processed (new input record) is “xxxxxxxxxxxx” If so, it is a record of format 1 and “xxxxxxxxxxxx” is indicated in column 4 or a record of format 5 and “xxxxxxxxxxxx” is indicated in column 3 and is the last record. Are subject to consolidation.

実施の形態1では、同一フォーマットのみが連結の対象であった。このため、前回イベントと現在イベントの組は、例えば、「Receiving」と「Established」等に限定されていた。
本実施の形態では、異なるフォーマットも連結の対象となるため、前回イベントと現在イベントの組として、例えば「Established」(フォーマット1)と「ボタン1押」(フォーマット5)の組や、「画面2表示」(フォーマット5)と「Released」(フォーマット1)の組が抽出される。
そして、図10の全フローが完了した際には、例えば、図22に示すようなイベント相関図(0302)が生成される。
図22のイベント相関図(0302)では、フォーマット1のイベント及びフォーマット5のイベント間の遷移が示される。
In the first embodiment, only the same format is to be linked. For this reason, the set of the previous event and the current event is limited to “Receiving”, “Established”, and the like, for example.
In this embodiment, since different formats are also subject to concatenation, as a set of the previous event and the current event, for example, a set of “Established” (format 1) and “button 1 pressed” (format 5) or “screen 2” A set of “display” (format 5) and “Released” (format 1) is extracted.
When the entire flow of FIG. 10 is completed, for example, an event correlation diagram (0302) as shown in FIG. 22 is generated.
In the event correlation diagram (0302) of FIG. 22, transitions between events of format 1 and events of format 5 are shown.

なお、上記の説明では、図21に示すように、複数のフォーマットのイベント識別子リストを表示装置(0202)に出力し、ユーザ(0102)がフォーマットごとに識別子カラムを指定する例を説明したが、実施の形態2と同様に、イベント識別子リストを表示装置(0202)に出力せずに、イベント相関図生成部(0111)が、フォーマットごとに識別子カラムを選択し、選択した識別子カラムを基準にしてサンプルログ(0103)を解析してイベント相関図を生成するようにしてもよい。
この場合にも、イベント相関図生成部(0111)は、各フォーマットに対して共通の属性値(例えば、電話番号)が記述されているカラムを選択する必要がある。
In the above description, as shown in FIG. 21, an example in which an event identifier list of a plurality of formats is output to the display device (0202) and the user (0102) specifies an identifier column for each format has been described. As in the second embodiment, the event correlation diagram generation unit (0111) selects the identifier column for each format without outputting the event identifier list to the display device (0202), and uses the selected identifier column as a reference. The event log may be generated by analyzing the sample log (0103).
Also in this case, the event correlation diagram generation unit (0111) needs to select a column in which a common attribute value (for example, telephone number) is described for each format.

ここで、実施の形態1〜4で説明した業務イベント抽出ルール作成支援装置の主な特徴を再言する。   Here, the main features of the business event extraction rule creation support device described in the first to fourth embodiments will be restated.

実施の形態1〜4では、業務システムから得られるログイベントを元に業務分析を行う分析システムにおいて、
ログからフォーマットを自動抽出する、フォーマット抽出部、
前記情報、およびフォーマットからイベント種別を自動抽出する、イベント種別抽出部と、
前記情報、およびイベント種別からイベント識別子を自動抽出する、イベント識別子抽出部と、
前記情報、およびイベント識別子からイベント相関図を自動抽出する、イベント相関図生成部と、
前記情報、および業務イベントとログイベント発生順序の対応から業務イベント抽出ルールを自動生成する、抽出ルール生成部と、
を有する業務イベント抽出ルール作成支援装置について説明した。
In the first to fourth embodiments, in an analysis system that performs business analysis based on log events obtained from the business system,
Format extractor that automatically extracts formats from logs,
An event type extraction unit that automatically extracts an event type from the information and the format;
An event identifier extraction unit that automatically extracts an event identifier from the information and the event type;
An event correlation diagram generator for automatically extracting an event correlation diagram from the information and the event identifier;
An extraction rule generation unit that automatically generates a business event extraction rule from the correspondence between the information and the business event and the log event occurrence order;
The business event extraction rule creation support apparatus having the above has been described.

また、実施の形態1〜4では、イベント識別子を複数指定することにより、1つのカラムのみではイベント間の関係を対応付けられない場合にも対応できる業務イベント抽出ルール作成支援装置について説明した。   Further, in the first to fourth embodiments, the business event extraction rule creation support device has been described that can cope with the case where the relationship between events cannot be associated with only one column by specifying a plurality of event identifiers.

また、実施の形態1〜4では、イベント種別を複数指定することにより、1つのカラムのみではイベントを特定できない場合にも対応できる業務イベント抽出ルール作成支援装置について説明した。   Further, in the first to fourth embodiments, the business event extraction rule creation support device has been described that can cope with a case where an event cannot be specified by only one column by specifying a plurality of event types.

また、実施の形態1〜4では、フォーマットを複数指定することにより、1つのログレコードのみではイベントを特定できない場合にも対応できる業務イベント抽出ルール作成支援装置について説明した。   In the first to fourth embodiments, the business event extraction rule creation support device has been described that can cope with a case where an event cannot be specified by only one log record by specifying a plurality of formats.

最後に、実施の形態1〜4に示した業務イベント抽出ルール作成支援装置(0101)のハードウェア構成例について説明する。
図23は、実施の形態1〜4に示す業務イベント抽出ルール作成支援装置(0101)のハードウェア資源の一例を示す図である。
なお、図23の構成は、あくまでも業務イベント抽出ルール作成支援装置(0101)のハードウェア構成の一例を示すものであり、業務イベント抽出ルール作成支援装置(0101)のハードウェア構成は図23に記載の構成に限らず、他の構成であってもよい。
Finally, a hardware configuration example of the business event extraction rule creation support apparatus (0101) shown in the first to fourth embodiments will be described.
FIG. 23 is a diagram illustrating an example of hardware resources of the business event extraction rule creation support apparatus (0101) illustrated in the first to fourth embodiments.
The configuration in FIG. 23 is merely an example of the hardware configuration of the business event extraction rule creation support apparatus (0101), and the hardware configuration of the business event extraction rule creation support apparatus (0101) is described in FIG. It is not limited to this configuration, and other configurations may be used.

図23において、業務イベント抽出ルール作成支援装置(0101)は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力装置の一例である。
In FIG. 23, the business event extraction rule creation support device (0101) includes a CPU 911 (also called a central processing unit, a central processing unit, a processing unit, an arithmetic unit, a microprocessor, a microcomputer, and a processor) that executes a program. .
The CPU 911 is connected to, for example, a ROM (Read Only Memory) 913, a RAM (Random Access Memory) 914, a communication board 915, a display device 901, a keyboard 902, a mouse 903, and a magnetic disk device 920 via a bus 912. Control hardware devices.
Further, the CPU 911 may be connected to an FDD 904 (Flexible Disk Drive), a compact disk device 905 (CDD), a printer device 906, and a scanner device 907. Further, instead of the magnetic disk device 920, a storage device such as an optical disk device or a memory card (registered trademark) read / write device may be used.
The RAM 914 is an example of a volatile memory. The storage media of the ROM 913, the FDD 904, the CDD 905, and the magnetic disk device 920 are an example of a nonvolatile memory. These are examples of the storage device.
A communication board 915, a keyboard 902, a mouse 903, a scanner device 907, an FDD 904, and the like are examples of input devices.
The communication board 915, the display device 901, the printer device 906, and the like are examples of output devices.

通信ボード915は、ネットワークに接続されている。例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)などに接続されていても構わない。   The communication board 915 is connected to the network. For example, the communication board 915 may be connected to a LAN (local area network), the Internet, a WAN (wide area network), or the like.

磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
The magnetic disk device 920 stores an operating system 921 (OS), a window system 922, a program group 923, and a file group 924.
The programs in the program group 923 are executed by the CPU 911 using the operating system 921 and the window system 922.

また、RAM914には、CPU911に実行させるオペレーティングシステム921のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
The RAM 914 temporarily stores at least part of the operating system 921 program and application programs to be executed by the CPU 911.
The RAM 914 stores various data necessary for processing by the CPU 911.

また、ROM913には、BIOS(Basic Input Output System)プログラムが格納され、磁気ディスク装置920にはブートプログラムが格納されている。
業務イベント抽出ルール作成支援装置(0101)の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
The ROM 913 stores a BIOS (Basic Input Output System) program, and the magnetic disk device 920 stores a boot program.
When starting up the business event extraction rule creation support device (0101), the BIOS program in the ROM 913 and the boot program in the magnetic disk device 920 are executed, and the operating system 921 is started up by the BIOS program and the boot program.

上記プログラム群923には、実施の形態1〜4の説明において「〜部」として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。   The program group 923 stores a program for executing the function described as “˜unit” in the description of the first to fourth embodiments. The program is read and executed by the CPU 911.

ファイル群924には、実施の形態1〜4の説明において、「〜の判断」、「〜の抽出」、「〜の算出」、「〜の比較」、「〜の対比」、「〜の変更」、「〜の更新」、「〜の設定」、「〜の計数」、「〜の連結」、「〜の登録」、「〜の選択」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態1〜4で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
In the file group 924, in the description of the first to fourth embodiments, “determination of”, “extraction of”, “calculation of”, “comparison of”, “contrast of”, “change of” ”,“ Update of ”,“ setting of ”,“ counting of ”,“ concatenation of ”,“ registration of ”,“ selection of ”, etc. Data, signal values, variable values, and parameters are stored as items of “˜file” and “˜database”.
The “˜file” and “˜database” are stored in a recording medium such as a disk or a memory. Information, data, signal values, variable values, and parameters stored in a storage medium such as a disk or memory are read out to the main memory or cache memory by the CPU 911 via a read / write circuit, and extracted, searched, referenced, compared, and calculated. Used for CPU operations such as calculation, processing, editing, output, printing, and display.
Information, data, signal values, variable values, and parameters are stored in the main memory, registers, cache memory, and buffers during the CPU operations of extraction, search, reference, comparison, calculation, processing, editing, output, printing, and display. It is temporarily stored in a memory or the like.
In addition, arrows in the flowcharts described in the first to fourth embodiments mainly indicate input / output of data and signals, and the data and signal values are the RAM 914 memory, the FDD 904 flexible disk, the CDD 905 compact disk, and the magnetic field. Recording is performed on a recording medium such as a magnetic disk of the disk device 920, other optical disks, mini disks, DVDs, and the like. Data and signals are transmitted online via a bus 912, signal lines, cables, or other transmission media.

また、実施の形態1〜4の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、実施の形態1〜4の「〜部」としてコンピュータを機能させるものである。あるいは、実施の形態1〜4の「〜部」の手順や方法をコンピュータに実行させるものである。   In addition, what is described as “to part” in the description of the first to fourth embodiments may be “to circuit”, “to device”, “to device”, and “to step”, It may be “˜procedure” or “˜processing”. That is, what is described as “˜unit” may be realized by firmware stored in the ROM 913. Alternatively, it may be implemented only by software, only hardware such as elements, devices, substrates, wirings, etc., or a combination of software and hardware, and further a combination of firmware. Firmware and software are stored as programs in a recording medium such as a magnetic disk, a flexible disk, an optical disk, a compact disk, a mini disk, and a DVD. The program is read by the CPU 911 and executed by the CPU 911. That is, the program causes the computer to function as “to part” in the first to fourth embodiments. Alternatively, the computer executes the procedure and method of “to unit” in the first to fourth embodiments.

このように、実施の形態1〜4に示す業務イベント抽出ルール作成支援装置(0101)は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータであり、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。   As described above, the business event extraction rule creation support device (0101) shown in the first to fourth embodiments outputs a CPU as a processing device, a memory as a storage device, a magnetic disk, etc., a keyboard as an input device, a mouse, a communication board, etc. The computer includes a display device, a communication board, and the like, and implements the functions indicated as “to unit” using the processing device, the storage device, the input device, and the output device as described above.

実施の形態1に係る業務イベント抽出ルール作成支援装置の構成例を示す図。FIG. 3 is a diagram illustrating a configuration example of a business event extraction rule creation support device according to the first embodiment. 実施の形態1に係る業務イベント抽出ルール作成支援方法の例を示すフローチャート図。FIG. 3 is a flowchart showing an example of a business event extraction rule creation support method according to the first embodiment. 実施の形態1に係る業務イベント及びサンプルログの例を示す図。The figure which shows the example of the business event and sample log which concern on Embodiment 1. FIG. 実施の形態1に係るフォーマット抽出フローの例を示すフローチャート図。FIG. 3 is a flowchart showing an example of a format extraction flow according to the first embodiment. 実施の形態1に係るフォーマットリストの例を示す図。FIG. 6 is a diagram showing an example of a format list according to the first embodiment. 実施の形態1に係るイベント種別抽出フローの例を示すフローチャート図。FIG. 3 is a flowchart showing an example of an event type extraction flow according to the first embodiment. 実施の形態1に係るイベント種別リストの例を示す図。FIG. 6 is a diagram showing an example of an event type list according to the first embodiment. 実施の形態1に係るイベント識別子抽出フローの例を示すフローチャート図。FIG. 4 is a flowchart showing an example of an event identifier extraction flow according to the first embodiment. 実施の形態1に係るイベント識別子リストの例を示す図。FIG. 6 shows an example of an event identifier list according to the first embodiment. 実施の形態1に係るイベント相関図生成フローの例を示すフローチャート図。FIG. 3 is a flowchart showing an example of an event correlation diagram generation flow according to the first embodiment. 実施の形態1に係るイベント相関図の例を示す図。FIG. 4 shows an example of an event correlation diagram according to the first embodiment. 実施の形態1に係る業務イベントとログイベントの発生順序の対応イメージ例を示す図。The figure which shows the example of a response | compatibility image of the generation | occurrence | production order of the business event which concerns on Embodiment 1, and a log event. 実施の形態1に係る業務イベントとログイベント発生順序の対応表例を示す図。The figure which shows the example of a correspondence table of the business event which concerns on Embodiment 1, and a log event generation order. 実施の形態1に係る業務イベント抽出ルールの例を示す図。FIG. 5 is a diagram showing an example of a business event extraction rule according to the first embodiment. 実施の形態1に係るイベントツリーの例を示す図。FIG. 3 shows an example of an event tree according to the first embodiment. 実施の形態1に係るイベント出現数の計数結果の例を示す図。FIG. 6 is a diagram showing an example of a result of counting the number of event appearances according to the first embodiment. 実施の形態1に係る組合せ種類数の計数結果の例を示す図。FIG. 6 is a diagram showing an example of a counting result of the number of combination types according to the first embodiment. 実施の形態3に係るイベント識別子リストの例を示す図。FIG. 10 shows an example of an event identifier list according to the third embodiment. 実施の形態3に係るイベント出現数の総数の例を示す図。FIG. 10 is a diagram showing an example of the total number of event appearances according to the third embodiment. 実施の形態3に係るイベント識別子リストの例を示す図。FIG. 10 shows an example of an event identifier list according to the third embodiment. 実施の形態4に係るイベント識別子リストの例を示す図。FIG. 10 shows an example of an event identifier list according to the fourth embodiment. 実施の形態4に係るイベント相関図の例を示す。An example of an event correlation diagram according to the fourth embodiment is shown. 実施の形態1〜4に係る業務イベント抽出ルール作成支援装置の構成例を示す図。The figure which shows the structural example of the business event extraction rule creation assistance apparatus which concerns on Embodiment 1-4.

符号の説明Explanation of symbols

0101 業務イベント抽出ルール作成支援装置、0102 ユーザ 0103 サンプルログ、0104 業務イベント抽出ルール、0105 フォーマット抽出部、0106 フォーマットリスト、0107 イベント種別抽出部、0108 イベント種別リスト、0109 識別子抽出部、0110 イベント識別子リスト、0111 イベント相関図生成部、0112 イベント相関図、0113 抽出ルール生成部、0114 レコード読み出し部、0115 入力部、0201 記憶装置、0202 表示装置、0203 入力装置。   0101 business event extraction rule creation support device, 0102 user 0103 sample log, 0104 business event extraction rule, 0105 format extraction unit, 0106 format list, 0107 event type extraction unit, 0108 event type list, 0109 identifier extraction unit, 0110 event identifier list , 0111 event correlation diagram generation unit, 0112 event correlation diagram, 0113 extraction rule generation unit, 0114 record reading unit, 0115 input unit, 0201 storage device, 0202 display device, 0203 input device.

Claims (23)

複数のカラムが含まれるレコードを記憶装置から順次読み出すレコード読み出し部と、
前記複数のカラムのうちイベントの種類を表すイベント種別値が記述されるイベント種別値カラムを指定するイベント種別値カラム指定情報を入力する入力部と、
前記レコード読み出し部により読み出されたレコードを入力し、入力したレコードの複数のカラムのうちイベント種別値カラムを選別するとともに、イベント種別値カラム以外のカラムをイベントの属性を表す属性値が記述されている属性値カラムとし、イベント種別値カラムに記述されているイベント種別値と各属性値カラムに記述されている各属性値とを対比して属性値カラムごとにイベント種別値と属性値との組合せを調査し、イベント種別値と属性値との組合せにおいて新たな種類が出現する度に対応する属性値カラムについてイベント種別値と属性値との組合せ種類数を更新し、入力した複数のレコードにおけるイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数する算出処理部とを有することを特徴とする情報処理装置。
A record reading unit for sequentially reading records including a plurality of columns from the storage device;
An input unit for inputting event type value column specifying information for specifying an event type value column in which an event type value representing an event type among the plurality of columns is described;
The record read by the record reading unit is input, an event type value column is selected from a plurality of columns of the input record, and attribute values representing event attributes are described in columns other than the event type value column. The attribute type column and the event type value described in the event type value column and the attribute value described in each attribute value column are compared and the event type value and attribute value are Investigate the combination, update the number of types of combination of event type value and attribute value for the attribute value column corresponding to each time a new type appears in the combination of event type value and attribute value, And a calculation processing unit that counts the number of types of combinations of event type values and attribute values for each attribute value column. Management apparatus.
前記算出処理部は、
入力した複数のレコードにおけるイベント種別値の出現数を計数し、
属性値カラムごとに、イベント種別値の出現数に対する組合せ種類数の比率を種類数比率として算出することを特徴とする請求項1に記載の情報処理装置。
The calculation processing unit
Count the number of occurrences of event type values in multiple records entered,
The information processing apparatus according to claim 1, wherein a ratio of the number of types of combinations to the number of appearances of event type values is calculated as a type number ratio for each attribute value column.
前記算出処理部は、
組合せ種類数を属性値カラムごとイベント種別値単位で計数し、イベント種別値の出現数をイベント種別値単位で計数し、
種類数比率を属性値カラムごとイベント種別値単位で算出することを特徴とする請求項2に記載の情報処理装置。
The calculation processing unit
Count the number of combination types for each attribute value column in units of event type values, count the number of occurrences of event type values in units of event type values,
The information processing apparatus according to claim 2, wherein the type number ratio is calculated for each attribute value column in units of event type values.
前記算出処理部は、
種類数比率の比較を行い、
種類数比率が高い順に各属性値カラムをその種類数比率とともに示す属性値カラム比率情報を生成し、
表示装置に前記属性値カラム比率情報を出力することを特徴とする請求項2又は3に記載の情報処理装置。
The calculation processing unit
Compare the types ratio,
Generate attribute value column ratio information that shows each attribute value column along with its type ratio in descending order of type ratio,
The information processing apparatus according to claim 2, wherein the attribute value column ratio information is output to a display device.
前記入力部は、
前記算出処理部から前記属性値カラム比率情報が前記表示装置に出力された後に、複数の属性値カラムの中から特定の属性値カラムを指定属性値カラムとして指定する属性値カラム指定情報を入力し、
前記情報処理装置は、更に、
前記レコード読み出し部により読み出されたレコードを入力するとともに、入力したレコードの指定属性値カラムに記述されている属性値を調査し、指定属性値カラムに共通の属性値が記述されている複数のレコードのイベント種別値を、レコードの入力順序に従って連結し、連結したイベント種別値に基づきイベント間の相関を解析するイベント相関解析部とを有することを特徴とする請求項4に記載の情報処理装置。
The input unit is
After the attribute value column ratio information is output from the calculation processing unit to the display device, input attribute value column designation information for designating a specific attribute value column as a designated attribute value column from among a plurality of attribute value columns. ,
The information processing apparatus further includes:
A record read by the record reading unit is input, and an attribute value described in a specified attribute value column of the input record is examined, and a plurality of attribute values common to the specified attribute value column are described. 5. The information processing apparatus according to claim 4, further comprising: an event correlation analysis unit that connects event type values of records in accordance with an input order of records and analyzes correlation between events based on the connected event type values. .
前記入力部は、
二以上の属性値カラムを前記指定属性値カラムとして指定する属性値カラム指定情報を入力し、
前記イベント相関解析部は、
前記レコード読み出し部により読み出されたレコードを入力するとともに、入力したレコードの各指定属性値カラムに記述されている属性値を調査し、同じ指定属性値カラムに共通の属性値が記述されている複数のレコードのイベント種別値を、レコードの入力順序に従って連結し、連結したイベント種別値に基づきイベント間の相関を解析することを特徴とする請求項5に記載の情報処理装置。
The input unit is
Enter attribute value column specification information specifying two or more attribute value columns as the specified attribute value column,
The event correlation analysis unit
The record read by the record reading unit is input, the attribute value described in each specified attribute value column of the input record is examined, and a common attribute value is described in the same specified attribute value column 6. The information processing apparatus according to claim 5, wherein event type values of a plurality of records are linked in accordance with an input order of records, and correlation between events is analyzed based on the linked event type values.
前記情報処理装置は、更に、
前記算出処理部により算出された種類数比率に基づき複数の属性値カラムの中から特定の属性値カラムを指定属性値カラムとして指定し、
前記レコード読み出し部により読み出されたレコードを入力するとともに、入力したレコードの指定属性値カラムに記述されている属性値を調査し、指定属性値カラムに共通の属性値が記述されている複数のレコードのイベント種別値を、レコードの入力順序に従って連結し、連結したイベント種別値に基づきイベント間の相関を解析するイベント相関解析部を有することを特徴とする請求項2又は3に記載の情報処理装置。
The information processing apparatus further includes:
A specific attribute value column is designated as a designated attribute value column from among a plurality of attribute value columns based on the type number ratio calculated by the calculation processing unit,
A record read by the record reading unit is input, and an attribute value described in a specified attribute value column of the input record is examined, and a plurality of attribute values common to the specified attribute value column are described. 4. The information processing according to claim 2, further comprising an event correlation analysis unit that connects event type values of records according to an input order of records and analyzes correlation between events based on the connected event type values. apparatus.
前記イベント相関解析部は、
二以上の属性値カラムを前記指定属性値カラムとして指定し、
前記イベント相関解析部は、
前記レコード読み出し部により読み出されたレコードを入力するとともに、入力したレコードの各指定属性値カラムに記述されている属性値を調査し、同じ指定属性値カラムに共通の属性値が記述されている複数のレコードのイベント種別値を、レコードの入力順序に従って連結し、連結したイベント種別値に基づきイベント間の相関を解析することを特徴とする請求項7に記載の情報処理装置。
The event correlation analysis unit
Specify two or more attribute value columns as the specified attribute value column,
The event correlation analysis unit
The record read by the record reading unit is input, the attribute value described in each specified attribute value column of the input record is examined, and a common attribute value is described in the same specified attribute value column The information processing apparatus according to claim 7, wherein event type values of a plurality of records are linked in accordance with an input order of records, and correlation between events is analyzed based on the linked event type values.
前記イベント相関解析部は、
特定のフォーマットを対象フォーマットとし、前記レコード読み出し部から読み出されたレコードを入力し、入力したレコードのフォーマットを検査し、対象フォーマットに合致するレコードを抽出し、
抽出したレコードの指定属性値カラムに記述されている属性値を調査し、指定属性値カラムに共通の属性値が記述されている複数のレコードのイベント種別値を、レコードの入力順序に従って連結し、連結したイベント種別値に基づきイベント間の相関を解析することを特徴とする請求項5〜8に記載の情報処理装置。
The event correlation analysis unit
The target format is a specific format, the record read from the record reading unit is input, the format of the input record is inspected, and the record that matches the target format is extracted.
Investigate the attribute value described in the specified attribute value column of the extracted record, concatenate the event type values of multiple records in which the common attribute value is described in the specified attribute value column according to the record input order, The information processing apparatus according to claim 5, wherein a correlation between events is analyzed based on the connected event type value.
前記イベント相関解析部は、
新たに入力した新規入力レコードの指定属性値カラムに記述されている属性値と共通の属性値が指定属性値カラムに記述されている入力済みのレコードの中で最後尾に位置するレコードを最後尾レコードとして検索し、
新規入力レコードのイベント種別値を最後尾レコードのイベント種別値に連結するとともに、新規入力レコードと最後尾レコードにおけるイベント種別値の組合せを調査し、イベント種別値の組合せごとに組合せの出現回数を計数することを特徴とする請求項5〜9のいずれかに記載の情報処理装置。
The event correlation analysis unit
The record that is located at the end of the already entered records in which the attribute value that is common to the attribute value described in the specified attribute value column of the newly input record is described in the specified attribute value column. Search as records,
Concatenates the event type value of the new input record with the event type value of the last record, investigates the combination of the event type value in the new input record and the last record, and counts the number of occurrences of each combination of event type values The information processing apparatus according to claim 5, wherein the information processing apparatus is an information processing apparatus.
前記イベント相関解析部は、
連結したイベント種別値を解析して複数のイベント遷移パターンを導出し、
イベント遷移パターンごとに、遷移元イベントを表す遷移元イベント種別値と遷移先イベントを表す遷移先イベント種別値の組合せの出現回数を抽出することを特徴とする請求項10に記載の情報処理装置。
The event correlation analysis unit
Analyzing concatenated event type values to derive multiple event transition patterns,
The information processing apparatus according to claim 10, wherein the number of appearances of a combination of a transition source event type value representing a transition source event and a transition destination event type value representing a transition destination event is extracted for each event transition pattern.
前記イベント相関解析部は、
複数のイベント遷移パターンを示すとともに、各々のイベント遷移パターンに対応させて、各々のイベント遷移パターンにおける遷移元イベント種別値と遷移先イベント種別値の組合せの出現回数を示すイベント相関図情報を生成し、
生成したイベント相関図情報を表示装置に出力することを特徴とする請求項11に記載の情報処理装置。
The event correlation analysis unit
In addition to showing multiple event transition patterns, event correlation diagram information indicating the number of occurrences of the combination of the transition source event type value and the transition destination event type value in each event transition pattern is generated in association with each event transition pattern ,
The information processing apparatus according to claim 11, wherein the generated event correlation diagram information is output to a display device.
前記入力部は、
二以上のカラムを前記イベント種別値カラムとして指定するイベント種別値カラム指定情報を入力し、
前記算出処理部は、
前記レコード読み出し部により読み出されたレコードを入力し、入力したレコードの複数のカラムのうち各イベント種別値カラムを選別するとともに、イベント種別値カラム以外のカラムを属性値カラムとし、各イベント種別値カラムに記述されているイベント種別値を結合し、結合後のイベント種別値と各属性値カラムに記述されている各属性値とを対比して属性値カラムごとに結合後のイベント種別値と属性値との組合せを調査し、結合後のイベント種別値と属性値との組合せにおいて新たな種類が出現する度に対応する属性値カラムについて結合後のイベント種別値と属性値との組合せ種類数を更新し、入力した複数のレコードにおける結合後のイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数することを特徴とする請求項1〜4のいずれかに記載の情報処理装置。
The input unit is
Enter event type value column designation information that designates two or more columns as the event type value column,
The calculation processing unit
The record read by the record reading unit is input, and each event type value column is selected from a plurality of columns of the input record, and each column other than the event type value column is set as an attribute value column. Combine event type values described in the column, compare the combined event type value with each attribute value described in each attribute value column, and combine the event type value and attribute after each attribute value column. Investigate the combination with the value, and for each attribute value column corresponding to the combination of the event type value and the attribute value after the combination, the number of combination types of the event type value and the attribute value after the combination is calculated. It is characterized by counting the number of combination types of event type values and attribute values after combining in multiple input records for each attribute value column. The information processing apparatus according to claim 1.
前記算出処理部は、
特定のフォーマットを対象フォーマットとし、前記レコード読み出し部から読み出されたレコードを入力し、入力したレコードのフォーマットを検査し、対象フォーマットに合致するレコードを抽出し、
抽出した複数のレコードにおけるイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数することを特徴とする請求項1〜13のいずれかに記載の情報処理装置。
The calculation processing unit
The target format is a specific format, the record read from the record reading unit is input, the format of the input record is inspected, and the record that matches the target format is extracted.
The information processing apparatus according to claim 1, wherein the number of types of combinations of event type values and attribute values in a plurality of extracted records is counted for each attribute value column.
前記算出処理部は、
特定の2以上のフォーマットを対象フォーマットとし、対象フォーマットごとに、合致するレコードを抽出し、
各対象フォーマットについて、抽出した複数のレコードにおけるイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数することを特徴とする請求項14に記載の情報処理装置。
The calculation processing unit
Specify two or more specific formats as target formats, and extract matching records for each target format.
The information processing apparatus according to claim 14, wherein the number of types of combinations of event type values and attribute values in a plurality of extracted records is counted for each attribute value column for each target format.
前記算出処理部は、
各対象フォーマットについて、抽出した複数のレコードにおけるイベント種別値の出現数を計数し、
各対象フォーマットについて、属性値カラムごとに、イベント種別値の出現数に対する組合せ種類数の比率を種類数比率として算出することを特徴とする請求項15に記載の情報処理装置。
The calculation processing unit
For each target format, count the number of occurrences of the event type value in the extracted records,
16. The information processing apparatus according to claim 15, wherein, for each target format, a ratio of the number of types of combinations to the number of appearances of event type values is calculated as a type number ratio for each attribute value column.
前記算出処理部は、
組合せ種類数を属性値カラムごとイベント種別値単位で計数し、イベント種別値の出現数をイベント種別値単位で計数し、
種類数比率を属性値カラムごとイベント種別値単位で算出することを特徴とする請求項16に記載の情報処理装置。
The calculation processing unit
Count the number of combination types for each attribute value column in units of event type values, count the number of occurrences of event type values in units of event type values,
The information processing apparatus according to claim 16, wherein the type number ratio is calculated for each attribute value column in units of event type values.
前記算出処理部は、
各対象フォーマットについて、種類数比率の比較を行い、
各対象フォーマットについて、種類数比率が高い順に各属性値カラムをその種類数比率とともに示す属性値カラム比率情報を生成し、
表示装置に各対象フォーマットの属性値カラム比率情報を出力することを特徴とする請求項16又は17に記載の情報処理装置。
The calculation processing unit
For each target format, compare the types ratio,
For each target format, generate attribute value column ratio information indicating each attribute value column along with its type ratio in descending order of type number ratio,
The information processing apparatus according to claim 16 or 17, wherein attribute value column ratio information of each target format is output to a display apparatus.
前記入力部は、
前記算出処理部から各対象フォーマットの属性値カラム比率情報が前記表示装置に出力された後に、対象フォーマットごとに複数の属性値カラムの中から特定の属性値カラムを指定属性値カラムとして指定する属性値カラム指定情報を入力し、
前記情報処理装置は、更に、
前記レコード読み出し部から読み出されたレコードを入力し、入力したレコードのフォーマットを検査し、対象フォーマットごとに合致するレコードを抽出し、抽出したレコードのフォーマットに従って当該レコードの指定属性値カラムを判別し、判別した指定属性値カラムに記述されている属性値を調査し、それぞれの指定属性値カラムに共通の属性値が記述されている複数のレコードのイベント種別値を、レコードの入力順序に従って連結し、連結したイベント種別値に基づきイベント間の相関を解析するイベント相関解析部とを有することを特徴とする請求項18に記載の情報処理装置。
The input unit is
An attribute that designates a specific attribute value column as a designated attribute value column from among a plurality of attribute value columns for each target format after attribute value column ratio information of each target format is output from the calculation processing unit to the display device Enter value column specification information,
The information processing apparatus further includes:
The record read from the record reading unit is input, the format of the input record is inspected, the record that matches each target format is extracted, and the specified attribute value column of the record is determined according to the format of the extracted record Investigate the attribute value described in the specified specified attribute value column, and concatenate the event type values of multiple records in which the common attribute value is described in each specified attribute value column according to the record input order. The information processing apparatus according to claim 18, further comprising: an event correlation analysis unit that analyzes a correlation between events based on the connected event type value.
前記情報処理装置は、更に、
前記算出処理部により算出された種類数比率に基づき対象フォーマットごとに複数の属性値カラムの中から特定の属性値カラムを指定属性値カラムとして指定し、
前記レコード読み出し部から読み出されたレコードを入力し、入力したレコードのフォーマットを検査し、対象フォーマットごとに合致するレコードを抽出し、抽出したレコードのフォーマットに従って当該レコードの指定属性値カラムを判別し、判別した指定属性値カラムに記述されている属性値を調査し、それぞれの指定属性値カラムに共通の属性値が記述されている複数のレコードのイベント種別値を、レコードの入力順序に従って連結し、連結したイベント種別値に基づきイベント間の相関を解析するイベント相関解析部を有することを特徴とする請求項16又は17に記載の情報処理装置。
The information processing apparatus further includes:
A specific attribute value column is designated as a designated attribute value column from a plurality of attribute value columns for each target format based on the type number ratio calculated by the calculation processing unit,
The record read from the record reading unit is input, the format of the input record is inspected, the record that matches each target format is extracted, and the specified attribute value column of the record is determined according to the format of the extracted record Investigate the attribute value described in the specified specified attribute value column, and concatenate the event type values of multiple records in which the common attribute value is described in each specified attribute value column according to the record input order. The information processing apparatus according to claim 16, further comprising an event correlation analysis unit that analyzes a correlation between events based on the connected event type value.
前記イベント相関解析部は、
新たに入力した新規入力レコードの指定属性値カラムに記述されている属性値と共通の属性値が指定属性値カラムに記述されている入力済みのレコードの中で最後尾に位置するレコードを最後尾レコードとして検索し、
新規入力レコードのイベント種別値を最後尾レコードのイベント種別値に連結するとともに、新規入力レコードと最後尾レコードにおけるイベント種別値の組合せを調査し、イベント種別値の組合せごとに組合せの出現回数を計数することを特徴とする請求項19又は20に記載の情報処理装置。
The event correlation analysis unit
The record that is located at the end of the already entered records in which the attribute value that is common to the attribute value described in the specified attribute value column of the newly input record is described in the specified attribute value column. Search as records,
Concatenates the event type value of the new input record with the event type value of the last record, investigates the combination of the event type value in the new input record and the last record, and counts the number of occurrences of each combination of event type values The information processing apparatus according to claim 19 or 20, characterized in that:
コンピュータによる情報処理方法であって、
複数のカラムが含まれるレコードを記憶装置から順次読み出すレコード読み出しステップと、
前記複数のカラムのうちイベントの種類を表すイベント種別値が記述されるイベント種別値カラムを指定するイベント種別値カラム指定情報を入力する入力ステップと、
前記レコード読み出しステップにより読み出されたレコードを入力し、入力したレコードの複数のカラムのうちイベント種別値カラムを選別するとともに、イベント種別値カラム以外のカラムをイベントの属性を表す属性値が記述されている属性値カラムとし、イベント種別値カラムに記述されているイベント種別値と各属性値カラムに記述されている各属性値とを対比して属性値カラムごとにイベント種別値と属性値との組合せを調査し、イベント種別値と属性値との組合せにおいて新たな種類が出現する度に対応する属性値カラムについてイベント種別値と属性値との組合せ種類数を更新し、入力した複数のレコードにおけるイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数する算出処理ステップとを有することを特徴とする情報処理方法。
An information processing method using a computer,
A record reading step of sequentially reading records including a plurality of columns from the storage device;
An input step of inputting event type value column specifying information for specifying an event type value column in which an event type value representing an event type is described among the plurality of columns;
The record read in the record reading step is input, and the event type value column is selected from the plurality of columns of the input record, and the attribute value indicating the event attribute is described in columns other than the event type value column. The attribute type column and the event type value described in the event type value column and the attribute value described in each attribute value column are compared and the event type value and attribute value are Investigate the combination, update the number of types of combination of event type value and attribute value for the attribute value column corresponding to each time a new type appears in the combination of event type value and attribute value, And a calculation processing step for counting the number of combinations of event type values and attribute values for each attribute value column. Information processing method to be.
複数のカラムが含まれるレコードを記憶装置から順次読み出すレコード読み出し処理と、
前記複数のカラムのうちイベントの種類を表すイベント種別値が記述されるイベント種別値カラムを指定するイベント種別値カラム指定情報を入力する入力処理と、
前記レコード読み出し処理により読み出されたレコードを入力し、入力したレコードの複数のカラムのうちイベント種別値カラムを選別するとともに、イベント種別値カラム以外のカラムをイベントの属性を表す属性値が記述されている属性値カラムとし、イベント種別値カラムに記述されているイベント種別値と各属性値カラムに記述されている各属性値とを対比して属性値カラムごとにイベント種別値と属性値との組合せを調査し、イベント種別値と属性値との組合せにおいて新たな種類が出現する度に対応する属性値カラムについてイベント種別値と属性値との組合せ種類数を更新し、入力した複数のレコードにおけるイベント種別値と属性値との組合せ種類数を属性値カラムごとに計数する算出処理とをコンピュータに実行させることを特徴とするプログラム。
A record read process for sequentially reading records including a plurality of columns from the storage device;
An input process for inputting event type value column specifying information for specifying an event type value column in which an event type value representing an event type among the plurality of columns is described;
The record read by the record reading process is input, the event type value column is selected from the plurality of columns of the input record, and attribute values representing the attribute of the event are described in columns other than the event type value column The attribute type column and the event type value described in the event type value column and the attribute value described in each attribute value column are compared and the event type value and attribute value are Investigate the combination, update the number of types of combination of event type value and attribute value for the attribute value column corresponding to each time a new type appears in the combination of event type value and attribute value, Let the computer execute a calculation process that counts the number of combinations of event type values and attribute values for each attribute value column. Program characterized.
JP2008046220A 2008-02-27 2008-02-27 Information processor, information processing method and program Pending JP2009205372A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008046220A JP2009205372A (en) 2008-02-27 2008-02-27 Information processor, information processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008046220A JP2009205372A (en) 2008-02-27 2008-02-27 Information processor, information processing method and program

Publications (1)

Publication Number Publication Date
JP2009205372A true JP2009205372A (en) 2009-09-10

Family

ID=41147571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008046220A Pending JP2009205372A (en) 2008-02-27 2008-02-27 Information processor, information processing method and program

Country Status (1)

Country Link
JP (1) JP2009205372A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160069351A (en) * 2014-12-08 2016-06-16 에스케이텔레콤 주식회사 Apparatus for Counting the Number of Large-Scale Data by Taking Account of Data Distribution and Computer-Readable Recording Medium with Program therefor
WO2023035330A1 (en) * 2021-09-13 2023-03-16 深圳前海环融联易信息科技服务有限公司 Long text event extraction method and apparatus, and computer device and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160069351A (en) * 2014-12-08 2016-06-16 에스케이텔레콤 주식회사 Apparatus for Counting the Number of Large-Scale Data by Taking Account of Data Distribution and Computer-Readable Recording Medium with Program therefor
KR102229311B1 (en) * 2014-12-08 2021-03-17 에스케이텔레콤 주식회사 Apparatus for Counting the Number of Large-Scale Data by Taking Account of Data Distribution and Computer-Readable Recording Medium with Program therefor
WO2023035330A1 (en) * 2021-09-13 2023-03-16 深圳前海环融联易信息科技服务有限公司 Long text event extraction method and apparatus, and computer device and storage medium

Similar Documents

Publication Publication Date Title
US20070168379A1 (en) Method and apparatus for cataloging screen shots of a program
JP2007025868A (en) Category setting support method and device
JP2008210308A (en) Log integrating managing device, log integrating managing method, and log integrating managing program
JP4832952B2 (en) Database analysis system, database analysis method and program
JP5675676B2 (en) Business analysis design support device, business analysis design support method, and business analysis design support program
JP6898542B2 (en) Information processing device, its control method, and program
JP2009116638A (en) System and method for supporting understanding of business specification
JP2009205372A (en) Information processor, information processing method and program
JP5661449B2 (en) File name creation device
JP2015204076A (en) Document difference display program and information processor
JP2020123321A (en) Method and apparatus for search processing based on clipboard data
JP2016057715A (en) Graphic type program analyzer
JP6677624B2 (en) Analysis apparatus, analysis method, and analysis program
JP4446715B2 (en) Document search device, document search method, and document search program
JP2005190212A (en) Database system, data processing method and program
WO2024047997A1 (en) Document analysis device and program for document analysis
US9990420B2 (en) Method of searching and generating a relevant search string
JP2010128894A (en) Database generation device, method of generating database, and computer program
JP2019101829A (en) Software component management system, computor, and method
US20230058327A1 (en) Information processing apparatus, flow generation method, and computer program product
US20230056860A1 (en) Information processing apparatus, flow generation method, and computer program product
JP2018185601A (en) Information processing apparatus and information processing program
JP5197128B2 (en) Dependency Estimation Device, Dependency Estimation Program, and Recording Medium
JP2008262324A (en) Information processor, information processing method and program
JP5202598B2 (en) Workflow management device and workflow management program