JP4181193B2 - 時系列パターン検出装置及び方法 - Google Patents
時系列パターン検出装置及び方法 Download PDFInfo
- Publication number
- JP4181193B2 JP4181193B2 JP2006210202A JP2006210202A JP4181193B2 JP 4181193 B2 JP4181193 B2 JP 4181193B2 JP 2006210202 A JP2006210202 A JP 2006210202A JP 2006210202 A JP2006210202 A JP 2006210202A JP 4181193 B2 JP4181193 B2 JP 4181193B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- event
- series pattern
- candidate
- time series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 116
- 238000001514 detection method Methods 0.000 title claims description 96
- 238000013500 data storage Methods 0.000 claims description 38
- 239000000284 extract Substances 0.000 claims description 9
- 230000036772 blood pressure Effects 0.000 description 134
- 230000035622 drinking Effects 0.000 description 27
- 238000011156 evaluation Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 10
- 238000000354 decomposition reaction Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 235000013405 beer Nutrition 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000020083 shōchū Nutrition 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90348—Query processing by searching ordered data, e.g. alpha-numerically ordered data
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
…(1)
この支持度は、時系列パターンに含まれる部分時系列パターンに対して単調にその値が減少するといった性質があるため、小さな特徴的な時系列パターンを検出し、この検出された時系列パターンを組み合わせることによって候補時系列パターンを生成し、当該時系列パターンが特徴的かどうかを判定することにより、より大きなすべての特徴的な時系列パターンを効率的に検出することができる。
"Mining Sequential Patterns"(R. Agrawal and R. Srikant Proc. of the 11th Int. Conf.Data Engineering, 3-14, 1995) 「特徴的な時系列パターンの効率的な発見法」(櫻井茂明、折原良平、DEWS2006、7A-o6)
複数のイベントから構成される要素が時系列的に並べられた時系列データを格納する時系列データ格納手段と、
予めイベントを複数のグループに分類する属性情報を格納する属性情報格納手段と、
系列サイズ1で1個のイベントからなる特徴的なイベント集合を検出するイベント検出手段と、
前記イベント検出手段より検出される特徴的なイベント集合より系列サイズ1の1次時系列パターンを検出するイベント集合検出手段と、
前記イベント集合検出手段より検出される系列サイズ1の1次時系列パターンより特徴的な(i+1)次時系列パターンを検出する時系列パターン検出手段と、具備し、
前記イベント検出手段は、前記時系列データ格納手段より各イベントを取り出すとともに、これら取り出された各イベントの頻度を求め、該頻度に基づいて系列サイズ1で、1個のイベントからなる特徴的なイベント集合を判断する候補時系列パターン判定手段を有し、
前記イベント集合検出手段は、前記イベント検出手段により取得された特徴的イベント集合の任意の2つのイベント集合の組合せに基づいて候補イベント集合を生成する候補時系列パターン生成手段、前記属性情報格納手段に格納された属性情報を参照して候補時系列パターン生成手段で生成された前記候補イベント集合を構成する各イベントの属性に同一のイベントが存在するかを判定する属性情報判定手段及び該属性情報判定手段の判定結果から同じ属性を持つ候補イベント集合について前記時系列データ格納手段に格納される時系列データを参照して候補イベント集合が含まれる時系列データの頻度を求めるとともに、該頻度に基づいて系列サイズ1の1次時系列パターンとして特徴的なイベント集合を判断する候補時系列パターン判定手段を有し、
前記時系列パターン検出手段は、系列サイズi(ただしi=1,2,…)のi次時系列パターンの任意の2つの組合せに基づいて候補(i+1)次時系列パターンを生成する候補時系列パターン生成手段、前記属性情報格納手段に格納された属性情報を参照して前記候補時系列パターン生成手段で生成された候補(i+1)次時系列パターンを構成する各イベントの属性に同一のイベントが存在するかを判定する属性情報判定手段、該属性情報判定手段の判定結果から同じ属性を持つ候補(i+1)次時系列パターンについて前記時系列データ格納手段に格納される時系列データを参照して候補(i+1)次時系列パターンが含まれる時系列データの頻度を求めるとともに、該頻度に基づいて特徴的な(i+1)次時系列パターンを判断する候補時系列パターン判定手段を有する
ことを特徴としている。
複数のイベントから構成される要素が時系列的に並べられた時系列データを格納する時系列データ格納手段と、
予めイベントを複数のグループに分類する属性情報を格納する属性情報格納手段と、
系列サイズ1で1個のイベントからなる特徴的なイベント集合を検出するイベント検出手段と、
前記イベント検出手段より検出される特徴的なイベント集合より系列サイズ1の1次時系列パターンを検出するイベント集合検出手段と、
前記イベント集合検出手段より検出される系列サイズ1の1次時系列パターンより特徴的な(i+1)次時系列パターンを検出する時系列パターン検出手段と、を備えた時系列パターン検出装置の時系列パターン検出方法であって、
前記時系列データ格納手段より各イベントを取り出すとともに、これら取り出された各イベントの頻度を求め、該頻度に基づいて系列サイズ1で、1個のイベントからなる特徴的なイベント集合を取得する第1のステップと、
前記第1のステップにより取得された特徴的イベント集合の任意の2つのイベント集合の組合せに基づいて候補イベント集合を生成する第2のステップと、
前記属性情報格納手段に格納された属性情報を参照して前記第2のステップで生成された前記候補イベント集合を構成する各イベントの属性に同一のイベントが存在するかを判定する第3のステップと、
前記第3のステップの判定結果から同じ属性を持つ候補イベント集合について前記時系列データ格納手段に格納される時系列データを参照して候補イベント集合が含まれる時系列データの頻度を求めるとともに、該頻度に基づいて系列サイズ1の1次時系列パターンとして特徴的なイベント集合を判断する第4のステップと、
系列サイズi(ただしi=1,2,…)のi次時系列パターンの任意の2つの組合せに基づいて候補(i+1)次時系列パターンを生成する第5のステップと、
前記属性情報格納手段に格納された属性情報を参照して前記第5のステップで生成された候補(i+1)次時系列パターンを構成する各イベントの属性に同一のイベントが存在するかを判定する第6のステップと、
前記第6のステップの判定結果から同じ属性を持つ候補(i+1)次時系列パターンについて前記時系列データ格納手段に格納される時系列データを参照して候補(i+1)次時系列パターンが含まれる時系列データの頻度を求めるとともに、該頻度に基づいて特徴的な(i+1)次時系列パターンを判断する第7のステップと
を具備したことを特徴としている。
図1は、本発明の第1の実施の形態に係る時系列パターン検出装置の概略構成を示している。
上述した実施の形態では、属性情報格納部5に格納する属性としては、系列データの同一の列に対応するイベントに階層構造を規定することなしに属性を構成していたが、同一の列に対応するイベントに階層構造を規定して構成してもよい。例えば、属性「飲酒」の列に含まれるイベントが図20に示すように与えられており、イベント「飲酒=飲む:ビール」、「飲酒=飲む:ワイン」、「飲酒=飲む:日本酒」、「飲酒=飲む:焼酎」が同時に発生する可能性がある場合、図21に示すように属性を構成することができる。
300…時系列パターン検出部
1…時系列データ格納部、2…時系列データ分解部、
3…候補時系列パターン判定部、4…特徴時系列パターン格納部、
5…属性情報格納部、6…属性情報判定部、7…候補時系列パターン生成部。
Claims (8)
- 複数のイベントから構成される要素が時系列的に並べられた時系列データを格納する時系列データ格納手段と、
予めイベントを複数のグループに分類する属性情報を格納する属性情報格納手段と、
系列サイズ1で1個のイベントからなる特徴的なイベント集合を検出するイベント検出手段と、
前記イベント検出手段より検出される特徴的なイベント集合より系列サイズ1の1次時系列パターンを検出するイベント集合検出手段と、
前記イベント集合検出手段より検出される系列サイズ1の1次時系列パターンより特徴的な(i+1)次時系列パターンを検出する時系列パターン検出手段と、具備し、
前記イベント検出手段は、前記時系列データ格納手段より各イベントを取り出すとともに、これら取り出された各イベントの頻度を求め、該頻度に基づいて系列サイズ1で、1個のイベントからなる特徴的なイベント集合を判断する候補時系列パターン判定手段を有し、
前記イベント集合検出手段は、前記イベント検出手段により取得された特徴的イベント集合の任意の2つのイベント集合の組合せに基づいて候補イベント集合を生成する候補時系列パターン生成手段、前記属性情報格納手段に格納された属性情報を参照して候補時系列パターン生成手段で生成された前記候補イベント集合を構成する各イベントの属性に同一のイベントが存在するかを判定する属性情報判定手段及び該属性情報判定手段の判定結果から同じ属性を持つ候補イベント集合について前記時系列データ格納手段に格納される時系列データを参照して候補イベント集合が含まれる時系列データの頻度を求めるとともに、該頻度に基づいて系列サイズ1の1次時系列パターンとして特徴的なイベント集合を判断する候補時系列パターン判定手段を有し、
前記時系列パターン検出手段は、系列サイズi(ただしi=1,2,…)のi次時系列パターンの任意の2つの組合せに基づいて候補(i+1)次時系列パターンを生成する候補時系列パターン生成手段、前記属性情報格納手段に格納された属性情報を参照して前記候補時系列パターン生成手段で生成された候補(i+1)次時系列パターンを構成する各イベントの属性に同一のイベントが存在するかを判定する属性情報判定手段、該属性情報判定手段の判定結果から同じ属性を持つ候補(i+1)次時系列パターンについて前記時系列データ格納手段に格納される時系列データを参照して候補(i+1)次時系列パターンが含まれる時系列データの頻度を求めるとともに、該頻度に基づいて特徴的な(i+1)次時系列パターンを判断する候補時系列パターン判定手段を有する
ことを特徴とする時系列パターン検出装置。 - イベント検出手段は、前記時系列データ格納手段より取り出される各イベントの頻度に基づいて求められる支持度と、予め指定される最小支持度との比較結果から特徴的なイベント集合を検出することを特徴とする請求項1記載の時系列パターン検出装置。
- 前記イベント集合検出手段の前記候補時系列パターン生成手段は、前記イベント検出手段により取得された特徴的イベント集合より任意の2つのイベント集合の組合せを取り出すとともに、これらイベント集合の前方に配置されるイベント数よりも1つ小さな部分イベント集合の一致を判断し候補イベント集合を生成することを特徴とする請求項1記載の時系列パターン検出装置。
- 前記イベント集合検出手段の候補時系列パターン判定手段は、前記候補イベント集合が含まれる時系列データの頻度に基づいて求められる支持度と、予め指定される最小支持度との比較結果から特徴的なイベント集合を判断することを特徴とする請求項1記載の時系列パターン検出装置。
- 前記時系列パターン検出手段の前記候補時系列パターン生成手段は、系列サイズi(ただしi=1,2,…)のi次時系列パターンから任意の2つの組合せを取り出すとともに、i次時系列パターンの前方に配置される系列サイズよりも1つ小さな部分時系列パターンの一致を判断し候補(i+1)次時系列パターンを生成することを特徴とする請求項1記載の時系列パターン検出装置。
- 前記時系列パターン検出手段の候補時系列パターン判定手段は、前記候補(i+1)次時系列パターンが含まれる時系列データの頻度に基づいて求められる支持度と、予め指定される最小支持度との比較結果から特徴的な(i+1)次時系列パターンを判定することを特徴とする請求項1記載の時系列パターン検出装置。
- 前記時系列パターン検出手段は、前記候補(i+1)次時系列パターンの系列サイズが3以上で前記属性情報判定手段による属性情報の判定を行わないことを特徴とする請求項1記載の時系列パターン検出装置。
- 複数のイベントから構成される要素が時系列的に並べられた時系列データを格納する時系列データ格納手段と、
予めイベントを複数のグループに分類する属性情報を格納する属性情報格納手段と、
系列サイズ1で1個のイベントからなる特徴的なイベント集合を検出するイベント検出手段と、
前記イベント検出手段より検出される特徴的なイベント集合より系列サイズ1の1次時系列パターンを検出するイベント集合検出手段と、
前記イベント集合検出手段より検出される系列サイズ1の1次時系列パターンより特徴的な(i+1)次時系列パターンを検出する時系列パターン検出手段と、を備えた時系列パターン検出装置の時系列パターン検出方法であって、
前記時系列データ格納手段より各イベントを取り出すとともに、これら取り出された各イベントの頻度を求め、該頻度に基づいて系列サイズ1で、1個のイベントからなる特徴的なイベント集合を取得する第1のステップと、
前記第1のステップにより取得された特徴的イベント集合の任意の2つのイベント集合の組合せに基づいて候補イベント集合を生成する第2のステップと、
前記属性情報格納手段に格納された属性情報を参照して前記第2のステップで生成された前記候補イベント集合を構成する各イベントの属性に同一のイベントが存在するかを判定する第3のステップと、
前記第3のステップの判定結果から同じ属性を持つ候補イベント集合について前記時系列データ格納手段に格納される時系列データを参照して候補イベント集合が含まれる時系列データの頻度を求めるとともに、該頻度に基づいて系列サイズ1の1次時系列パターンとして特徴的なイベント集合を判断する第4のステップと、
系列サイズi(ただしi=1,2,…)のi次時系列パターンの任意の2つの組合せに基づいて候補(i+1)次時系列パターンを生成する第5のステップと、
前記属性情報格納手段に格納された属性情報を参照して前記第5のステップで生成された候補(i+1)次時系列パターンを構成する各イベントの属性に同一のイベントが存在するかを判定する第6のステップと、
前記第6のステップの判定結果から同じ属性を持つ候補(i+1)次時系列パターンについて前記時系列データ格納手段に格納される時系列データを参照して候補(i+1)次時系列パターンが含まれる時系列データの頻度を求めるとともに、該頻度に基づいて特徴的な(i+1)次時系列パターンを判断する第7のステップと
を具備したことを特徴とする時系列パターン検出方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006210202A JP4181193B2 (ja) | 2006-08-01 | 2006-08-01 | 時系列パターン検出装置及び方法 |
US11/725,696 US20080033895A1 (en) | 2006-08-01 | 2007-03-20 | Apparatus and method for detecting sequential pattern |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006210202A JP4181193B2 (ja) | 2006-08-01 | 2006-08-01 | 時系列パターン検出装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008040553A JP2008040553A (ja) | 2008-02-21 |
JP4181193B2 true JP4181193B2 (ja) | 2008-11-12 |
Family
ID=39030444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006210202A Active JP4181193B2 (ja) | 2006-08-01 | 2006-08-01 | 時系列パターン検出装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20080033895A1 (ja) |
JP (1) | JP4181193B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014208092A1 (ja) | 2013-06-28 | 2014-12-31 | 株式会社東芝 | 監視制御システム及び制御方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6003561B2 (ja) * | 2012-11-15 | 2016-10-05 | 富士通株式会社 | 抽出プログラム、抽出装置及び抽出方法 |
JP5962471B2 (ja) * | 2012-11-30 | 2016-08-03 | 富士通株式会社 | 抽出プログラム、抽出装置及び抽出方法 |
WO2016116958A1 (ja) * | 2015-01-19 | 2016-07-28 | 株式会社東芝 | 系列データ分析装置及プログラム |
US10241979B2 (en) * | 2015-07-21 | 2019-03-26 | Oracle International Corporation | Accelerated detection of matching patterns |
US10810073B2 (en) * | 2017-10-23 | 2020-10-20 | Liebherr-Werk Nenzing Gmbh | Method and system for evaluation of a faulty behaviour of at least one event data generating machine and/or monitoring the regular operation of at least one event data generating machine |
US20230333771A1 (en) * | 2022-04-19 | 2023-10-19 | Dell Products L.P. | Attribute-only reading of specified data |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5819266A (en) * | 1995-03-03 | 1998-10-06 | International Business Machines Corporation | System and method for mining sequential patterns in a large database |
US5742811A (en) * | 1995-10-10 | 1998-04-21 | International Business Machines Corporation | Method and system for mining generalized sequential patterns in a large database |
-
2006
- 2006-08-01 JP JP2006210202A patent/JP4181193B2/ja active Active
-
2007
- 2007-03-20 US US11/725,696 patent/US20080033895A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014208092A1 (ja) | 2013-06-28 | 2014-12-31 | 株式会社東芝 | 監視制御システム及び制御方法 |
JP2015011565A (ja) * | 2013-06-28 | 2015-01-19 | 株式会社東芝 | 監視制御システム |
Also Published As
Publication number | Publication date |
---|---|
US20080033895A1 (en) | 2008-02-07 |
JP2008040553A (ja) | 2008-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4181193B2 (ja) | 時系列パターン検出装置及び方法 | |
JP4504702B2 (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
CN107229627B (zh) | 一种文本处理方法、装置及计算设备 | |
US20090177466A1 (en) | Detection of speech spectral peaks and speech recognition method and system | |
US20180005087A1 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
JP2010044637A (ja) | データ処理装置、方法、及びプログラム | |
KR20160056983A (ko) | 미등록어 자동 추출에 기반한 형태소 사전 구축 시스템 및 방법 | |
JP6558863B2 (ja) | モデル作成装置、推定装置、方法、及びプログラム | |
KR100919546B1 (ko) | 음성 간의 유사도를 평가하는 방법 및 장치 | |
Van Balen et al. | Corpus Analysis Tools for Computational Hook Discovery. | |
KR20160066216A (ko) | 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체 | |
JP4985724B2 (ja) | 単語認識プログラム、単語認識方法、単語認識装置 | |
JP5189413B2 (ja) | 音声データ検索システム | |
JP2009223415A (ja) | 情報処理装置及び方法 | |
JP2017049911A (ja) | 文字認識装置、文字認識方法およびプログラム | |
JP6008067B2 (ja) | テキスト処理システム、テキスト処理方法およびテキスト処理プログラム | |
JP2007241636A (ja) | 文書データ解析装置および文書データ解析プログラム | |
JP2017033434A (ja) | 候補語評価装置、候補語評価システム、プログラム及び候補語評価方法 | |
Shen et al. | Emotion Neural Transducer for Fine-Grained Speech Emotion Recognition | |
JP2009140411A (ja) | 文章要約装置および文章要約方法 | |
JP6235368B2 (ja) | パターン認識装置、パターン認識方法およびプログラム | |
JP6374289B2 (ja) | 文字列検索装置および方法並びにプログラム | |
Damasceno et al. | Independent vector analysis with sparse inverse covariance estimation: An application to misinformation detection | |
WO2022259304A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP5450276B2 (ja) | 読み推定装置、読み推定方法、および読み推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080513 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080826 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080828 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4181193 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110905 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110905 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120905 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120905 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130905 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |