JP6047017B2 - パターン抽出装置および制御方法 - Google Patents
パターン抽出装置および制御方法 Download PDFInfo
- Publication number
- JP6047017B2 JP6047017B2 JP2013003111A JP2013003111A JP6047017B2 JP 6047017 B2 JP6047017 B2 JP 6047017B2 JP 2013003111 A JP2013003111 A JP 2013003111A JP 2013003111 A JP2013003111 A JP 2013003111A JP 6047017 B2 JP6047017 B2 JP 6047017B2
- Authority
- JP
- Japan
- Prior art keywords
- event
- adjacent
- events
- link
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
- G06V30/1983—Syntactic or structural pattern recognition, e.g. symbolic string recognition
- G06V30/1988—Graph matching
Description
イベントの時系列データから、イベントの出現するパターンを抽出するパターン抽出装置であって、
イベントの時系列データから隣接するイベントを取り出し、該隣接するイベントの各イベントをノードで表し、該隣接するイベント間の遷移方向と重みを有する有向リンクで前記ノードを接続し、同一のイベントを一つのノードで表し、同一の隣接するイベント間に複数の有向リンクがある場合にはそれらの重みを累積して一つの有向リンクとすることにより隣接イベントグラフを生成する生成手段と、
前記隣接イベントグラフにおいて、有向リンクの重みに基づいて得られる評価値が所定値以下の有向リンクを切断する切断手段と、を備える。
第一実施形態による頻出パターン抽出方法の例を図面に基づいて説明する。本実施形態では、イベントをファイル操作とし、ファイル管理システムの一機能として頻出パターン抽出機能を設ける。抽出した頻出パターンは、ユーザのファイル操作のレコメンドや、パターンの可視化による業務改善や、異常行動の検知などに利用することが可能である。なお、本実施形態では、イベントとして、ファイル操作を対象としているがそれに限定されない。系列データであれば、離散データでも、連続データでも、すべてイベントに見なすことにより本発明を適用することが可能である。例えば、連続データの場合は、連続値を適当な範囲で区切り、範囲毎に適当な識別子を振ることで離散データに変換することができる。他の頻出パターン抽出の利用例としては、工場の障害ログからの原因検知や、Web操作履歴からのユーザの振る舞い予測や、地震データの分析、侵入検知、撮像装置・印刷装置の操作履歴からの操作支援など多岐に渡る。
第一実施形態では、イベントをファイル操作とし、解析する時系列データとしてはイベントのタイプと発生時刻を含んでいたが、第二実施形態では、発生時刻を含んでいない場合への利用を説明する。この場合、ステップS501の隣接イベントグラフの生成の中で、イベント間のリンク強度を固定値(例えば、1.0)とすれば良い。つまり、イベント発生時刻のギャップ時間によらず、隣接したイベントは一律の相関があると見なせばよい。入力データが増えていくことで、何度も隣接したイベントはリンク強度が強まり、高い相関があると見なせるようになる。ギャップ時間によりリンク強度を変化させることは、データが少ないうちに有効であると考えられる。したがって、例えば、隣接イベントグラフの作成において、蓄積されているデータの数が所定の閾値より小さい場合には時間に依存したリンク強度を設定し、蓄積されているデータの数が所定の閾値以上の場合にはリンク強度に固定値を用いるようにしてもよい。
実施形態1では、ステップS501〜ステップS505までの処理をすべて実施したが、必ずしもすべての全ての処理を行わなければならないわけではない。たとえば、ステップS502、S504、S505を省略して、ステップS501(隣接イベントグラフの作成)とステップS503(ノイズリンクの切断)を実行することにより頻出パターンの抽出を行なってもよい。また、この場合、他のステップ(ステップS502、S504、S505)については、解析するデータと、そこに含まれていると予測されるパターンの特徴を踏まえることで選択するようにしてもよい。その場合、ユーザがステップS502、S504、S505のそれぞれの処理について実行するか否かを指定できるようにしてもよいし、時系列データの解析に基づいて制御部201が自動的に実行するか否かを設定できるようにしてもよい。
Claims (10)
- イベントの時系列データから、イベントの出現するパターンを抽出するパターン抽出装置であって、
イベントの時系列データから隣接するイベントを取り出し、該隣接するイベントの各イベントをノードで表し、該隣接するイベント間の遷移方向と重みを有する有向リンクで前記ノードを接続し、同一のイベントを一つのノードで表し、同一の隣接するイベント間に複数の有向リンクがある場合にはそれらの重みを累積して一つの有向リンクとすることにより隣接イベントグラフを生成する生成手段と、
前記隣接イベントグラフにおいて、有向リンクの重みに基づいて得られる評価値が所定値以下の有向リンクを切断する切断手段と、を備えることを特徴とするパターン抽出装置。 - 前記隣接イベントグラフにおいて、複数のパターンに含まれているノードを特定する特定手段と、
前記特定手段により特定されたノードを前記複数のパターンに応じた複数のノードに分離して前記隣接イベントグラフの有向リンクを更新する分離手段と、を更に備えることを特徴とする請求項1に記載のパターン抽出装置。 - 前記隣接イベントグラフの各ノードについて、接続されている有向リンクの重みに基づいてノイズスコアを計算する計算手段と、
前記計算手段により計算されたノイズスコアに従ってノイズと判断したノードを除去し、前記隣接イベントグラフを再構築する除去手段をさらに有する請求項1または2に記載のパターン抽出装置。 - 前記隣接イベントグラフの双方向に有向リンクを有する2つのノードを結合するか否かを、該双方向の有向リンクの重みに基づいて判定する判定手段と、
前記判定手段により結合すると判定された2つのノードを1つのノードに結合し、それぞれのノードが有していた隣接するノードへの有向リンクの重みを用いて該結合されたノードの有向リンクを設定することにより前記隣接イベントグラフを更新する結合手段をさらに有する請求項1乃至3のいずれか1項に記載のパターン抽出装置。 - 前記特定手段は、前記隣接イベントグラフのノードについて、そのノードと隣接するノードを含む隣接ノード集合を共起性による類似度によりグルーピングすることにより前記複数のパターンとそれらに含まれるノードを特定することを特徴とする請求項2に記載のパターン抽出装置。
- 前記切断手段で用いる前記評価値は、前記隣接イベントグラフにおける有向リンクの重み、または、有向リンクに接続するノードの出現回数に対する有向リンクの重みの割合、または、それらの両方を組み合わせて求めるスコアであることを特徴とする請求項1乃至5のいずれか1項に記載のパターン抽出装置。
- 前記生成手段は、イベント間の発生時刻の差分に基づいて該イベント間の有向リンクの重みを設定することを特徴とする請求項1乃至6のいずれか1項に記載のパターン抽出装置。
- 前記生成手段は、イベント間の有向リンクに固定値を設定することを特徴とする請求項1乃至6のいずれか1項に記載のパターン抽出装置。
- イベントの時系列データから、イベントの出現するパターンを抽出するパターン抽出装置の制御方法であって、
生成手段が、イベントの時系列データから隣接するイベントを取り出し、該隣接するイベントの各イベントをノードで表し、該隣接するイベント間の遷移方向と重みを有する有向リンクで前記ノードを接続し、同一のイベントを一つのノードで表し、同一の隣接するイベント間に複数の有向リンクがある場合にはそれらの重みを累積して一つの有向リンクとすることにより隣接イベントグラフを生成する生成工程と、
切断手段が、前記隣接イベントグラフにおいて、有向リンクの重みに基づいて得られる評価値が所定値以下の有向リンクを切断する切断工程と、を有することを特徴とするパターン抽出装置の制御方法。 - コンピュータを、請求項1乃至8のいずれか1項に記載のパターン抽出装置の各手段として機能させるためのプログラム
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013003111A JP6047017B2 (ja) | 2013-01-11 | 2013-01-11 | パターン抽出装置および制御方法 |
US14/146,371 US9792388B2 (en) | 2013-01-11 | 2014-01-02 | Pattern extraction apparatus and control method therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013003111A JP6047017B2 (ja) | 2013-01-11 | 2013-01-11 | パターン抽出装置および制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014134991A JP2014134991A (ja) | 2014-07-24 |
JP6047017B2 true JP6047017B2 (ja) | 2016-12-21 |
Family
ID=51165984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013003111A Active JP6047017B2 (ja) | 2013-01-11 | 2013-01-11 | パターン抽出装置および制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9792388B2 (ja) |
JP (1) | JP6047017B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5928165B2 (ja) * | 2012-06-01 | 2016-06-01 | 富士通株式会社 | 異常遷移パターン検出方法、プログラム及び装置 |
WO2015128896A1 (ja) * | 2014-02-26 | 2015-09-03 | 三菱電機株式会社 | 攻撃検知装置、攻撃検知方法、及び攻撃検知プログラム |
WO2016045734A1 (en) * | 2014-09-25 | 2016-03-31 | Siemens Aktiengesellschaft | Control apparatus of an automation system |
JP6511971B2 (ja) * | 2015-06-05 | 2019-05-15 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP6251216B2 (ja) * | 2015-06-15 | 2017-12-20 | 日本電信電話株式会社 | パターン検出装置、パターン検出方法およびパターン検出プログラム |
US10430721B2 (en) * | 2015-07-27 | 2019-10-01 | Pivotal Software, Inc. | Classifying user behavior as anomalous |
US10567479B2 (en) | 2015-08-05 | 2020-02-18 | Facebook, Inc. | Managing a device cloud |
US10348798B2 (en) * | 2015-08-05 | 2019-07-09 | Facebook, Inc. | Rules engine for connected devices |
US10541958B2 (en) | 2015-08-05 | 2020-01-21 | Facebook, Inc. | Controlling a device cloud |
US10412160B2 (en) | 2015-08-05 | 2019-09-10 | Facebook, Inc. | Controlling a device cloud |
US10425392B2 (en) | 2015-08-05 | 2019-09-24 | Facebook, Inc. | Managing a device cloud |
US10417224B2 (en) * | 2017-08-14 | 2019-09-17 | Palantir Technologies Inc. | Time series database processing system |
US20190114339A1 (en) * | 2017-10-17 | 2019-04-18 | Microsoft Technology Licensing, Llc | Identifying patterns within a set of events that includes time series data |
JP7040003B2 (ja) * | 2017-12-26 | 2022-03-23 | 富士通株式会社 | グラフ生成方法、情報処理装置およびグラフ生成プログラム |
US11354320B2 (en) * | 2018-10-11 | 2022-06-07 | International Business Machines Corporation | Determining causes of events in data |
JP7347547B2 (ja) | 2020-01-28 | 2023-09-20 | 日本電気株式会社 | イベント分析支援装置、イベント分析支援方法、及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5819266A (en) | 1995-03-03 | 1998-10-06 | International Business Machines Corporation | System and method for mining sequential patterns in a large database |
JP2004102681A (ja) * | 2002-09-10 | 2004-04-02 | Fujitsu Ltd | 行動データ表示方法および行動データ表示装置 |
JP4746850B2 (ja) * | 2004-06-21 | 2011-08-10 | 富士通株式会社 | パターン生成プログラム |
US8924794B2 (en) * | 2008-02-21 | 2014-12-30 | Hewlett-Packard Development Company, L.P. | Method and computer program product for forecasting system behavior |
US8200682B2 (en) * | 2008-04-22 | 2012-06-12 | Uc4 Software Gmbh | Method of detecting a reference sequence of events in a sample sequence of events |
US8122069B2 (en) * | 2008-07-09 | 2012-02-21 | Hewlett-Packard Development Company, L.P. | Methods for pairing text snippets to file activity |
US20100241647A1 (en) * | 2009-03-23 | 2010-09-23 | Microsoft Corporation | Context-Aware Query Recommendations |
US8689172B2 (en) * | 2009-03-24 | 2014-04-01 | International Business Machines Corporation | Mining sequential patterns in weighted directed graphs |
US8626835B1 (en) * | 2010-10-21 | 2014-01-07 | Google Inc. | Social identity clustering |
-
2013
- 2013-01-11 JP JP2013003111A patent/JP6047017B2/ja active Active
-
2014
- 2014-01-02 US US14/146,371 patent/US9792388B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014134991A (ja) | 2014-07-24 |
US9792388B2 (en) | 2017-10-17 |
US20140201133A1 (en) | 2014-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6047017B2 (ja) | パターン抽出装置および制御方法 | |
US11405301B1 (en) | Service analyzer interface with composite machine scores | |
CN104461842B (zh) | 基于日志相似性来处理故障的方法和装置 | |
CN102239458B (zh) | 可视化数据元素之间的关系 | |
JP5092165B2 (ja) | データ構築方法とシステム | |
JP6919569B2 (ja) | ログ分析システム、方法、及び記録媒体 | |
JP2013143039A (ja) | 頻出パターン抽出装置、頻出パターン抽出方法、及びプログラム | |
JP2011138422A (ja) | 行動パターン検出装置、行動パターン検出方法及び行動パターン検出プログラム | |
JP2009104591A (ja) | ウェブ文書クラスタリング方法およびシステム | |
JP7103496B2 (ja) | 関連スコア算出システム、方法およびプログラム | |
JP5588811B2 (ja) | データ分析支援システム及び方法 | |
WO2019225125A1 (ja) | データ処理装置およびデータ処理方法 | |
WO2014034383A1 (ja) | 情報処理装置、レコード位置情報特定方法および情報処理プログラム | |
JP2014164618A (ja) | 頻出パターン抽出装置、頻出パターン抽出方法及びプログラム | |
US9552415B2 (en) | Category classification processing device and method | |
JP2010033456A (ja) | 計算機システム、情報収集支援装置及び情報収集支援方法 | |
JP2019204246A (ja) | 学習データ作成方法及び学習データ作成装置 | |
Ting et al. | Constructing a cloud computing based social networks data warehousing and analyzing system | |
CN103020095B (zh) | 信息处理设备和信息处理方法 | |
JP2011100208A (ja) | 行動推定装置、行動推定方法および行動推定プログラム | |
JP5615593B2 (ja) | 電子文書管理装置、表示方法、表示プログラムおよび記録媒体 | |
JP2011248534A (ja) | グラフパターンを用いたネットワーク分析装置、ネットワーク分析方法、およびネットワーク分析用プログラム | |
US20150032749A1 (en) | Method of creating classification pattern, apparatus, and recording medium | |
CN107958022A (zh) | 一种万维网日志挖掘的方法 | |
WO2011016281A2 (ja) | ベイジアンネットワーク構造学習のための情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161021 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161118 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6047017 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |