JP5060340B2 - 類似部分シーケンス検出方法、類似部分シーケンス検出プログラム、および、類似部分シーケンス検出装置 - Google Patents
類似部分シーケンス検出方法、類似部分シーケンス検出プログラム、および、類似部分シーケンス検出装置 Download PDFInfo
- Publication number
- JP5060340B2 JP5060340B2 JP2008042633A JP2008042633A JP5060340B2 JP 5060340 B2 JP5060340 B2 JP 5060340B2 JP 2008042633 A JP2008042633 A JP 2008042633A JP 2008042633 A JP2008042633 A JP 2008042633A JP 5060340 B2 JP5060340 B2 JP 5060340B2
- Authority
- JP
- Japan
- Prior art keywords
- partial sequence
- similar
- similarity score
- time warping
- similar partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
f(i,j)=‖xi−yj‖+min{f(i,j−1),f(i−1,j),
f(i−1,j−1)} ・・・式(10)
f(0,0)=0 ・・・式(11)
f(i,0)=f(0,j)=∞ ・・・式(12)
2つのデータストリームXとY、類似判定のための閾値ε、類似部分シーケンス長の下限値ζが与えられたとき、次の条件を満たす類似部分シーケンスペアX[is:ie]とY[js:je]を検出する。
1. X[is:ie]とY[js:je]の平均距離値はε以下である。
2. X[is:ie]とY[js:je]のシーケンス長はいずれもζ以上である。
ここで、平均距離値とは部分シーケンスX[is:ie]とY[js:je]の1要素あたりの距離値を意味し、X[is:ie]とY[js:je]の距離値/(X[is:ie]とY[js:je]のタイムワーピングパス長)により求めるものとする。
di,j(k,l)=‖xi+k−1−yj+l−1‖+min{di,j(k,l−1),di,j(k−1,l),di,j(k−1,l−1)} ・・・式(14)
di,j(0,0)=0 ・・・式(15)
di,j(k,0)=di,j(0,l)=∞ ・・・式(16)
d’=di,j(k,l)/W ・・・式(17)
また、本発明は、前記処理部が、前記2つのデータストリームの部分シーケンス同士の前記類似度スコアを算出するとき、2つの部分シーケンスX[i s :i e ]とY[j s :j e ]との類似度スコアS(X[i s :i e ],Y[j s :j e ])を、以下の式(1)〜式(5)により算出し、
S(X[i s :i e ],Y[j s :j e ])=s(i e ,j e ) ・・・式(1)
s(i,j)=max{0,2ε−‖x i −y j ‖+s best } ・・・式(2)
s best =max{s(i,j−1),s(i−1,j),s(i−1,j−1)}
・・・式(3)
s(i,0)=0 ・・・式(4)
s(0,j)=0 ・・・式(5)
前記タイムワーピング行列に記憶する前記部分シーケンスX[i s :i e ]の開始位置i s と、前記部分シーケンスY[j s :j e ]の開始位置j s とを示すp(i,j)を、以下の式(7)により算出し、
p(i,j)={p(i,j−1) (if s best =s(i,j−1)),
p(i−1,j) (if s best =s(i−1,j)),
p(i−1,j−1)(if s best =s(i−1,j−1)),
(i,j) (if s best =0)} ・・・式(7)
前記開始位置i s ,j s を、以下の式(8)により算出することを特徴とする。
(i s ,j s )=p(i e ,j e ) ・・・式(8)
ただし、i=1,2,…,n、j=1,2,…,m、‖x i −y j ‖はx i とy j との間の距離を示す。
また、本発明は、前記処理部が、前記記憶部のタイムワーピング行列に記憶された前記類似度スコアを用いて、類似する部分シーケンスのペアを検出して出力する場合、
類似度スコアの平均値s’を、以下の式(6)により算出し、
s’=s(i,j)/W ・・・式(6)
前記算出した類似度スコアの平均値s’が所定の閾値ε以上であり、かつ、前記類似度スコアの算出に使用した2つの部分シーケンスの長さがいずれも所定の長さζ以上であるとき、それらの2つの前記部分シーケンスを、類似する部分シーケンスのペアとして検出して出力することを特徴とする。
ただし、Wは部分シーケンスX[i s :i e ]と部分シーケンスY[j s :j e ]とのタイムワーピングパスの長さを示す。
また、かかる発明によれば、類似度スコアを具体的に適切に算出し、その類似度スコアと、その類似度スコアの算出に用いた2つの前記部分シーケンスの開始位置および終了位置と、を対応付けて前記タイムワーピング行列に記憶することができる。
また、かかる発明によれば、類似度スコアをその対応するタイムワーピングパスの長さで除算した平均値を用いることで、類似する部分シーケンスのペアをより正確に検出することができる。
図1は、第1実施形態の類似部分シーケンス検出装置の構成図である。類似部分シーケンス検出装置1は、コンピュータ装置であり、入力部11、処理部12、記憶部13および出力部14を備える。
s(i,j)=max{0,2ε−‖xi−yj‖+sbest} ・・・式(2)
sbest=max{s(i,j−1),s(i−1,j),s(i−1,j−1)}
・・・式(3)
s(i,0)=0 ・・・式(4)
s(0,j)=0 ・・・式(5)
s’=s(i,j)/W ・・・式(6)
p(i−1,j) (if sbest=s(i−1,j)),
p(i−1,j−1)(if sbest=s(i−1,j−1)),
(i,j) (if sbest=0)} ・・・式(7)
(is,js)=p(ie,je) ・・・式(8)
次に、データストリーム処理部121は、jの値を0にリセットする(ステップS12)。
次に、第2実施形態について説明する。前記した第1実施形態の類似部分シーケンス検出装置1によれば、類似部分シーケンスペア検出により出力される類似部分シーケンスペアには、タイムワーピングパスの少なくとも一部が重複するものも含まれる。例えば、図5で検出される類似部分シーケンスペアは、X[1:5]とY[4:7]のペア、X[1:6]とY[4:7]のペア、X[2:5]とY[1:4]のペア、X[2:6]とY[1:4]のペア、X[2:7]とY[1:4]のペアの5つであり、これらのタイムワーピングパスは図6のようになる。図6は、図5で検出される類似部分シーケンスペアのタイムワーピングパスを示す図である。
次に、第1実施形態の類似部分シーケンス検出装置1を用いた処理の実験結果について説明する。実験結果を視覚的に把握するため、ここでは、散布図を用いる。例えば、図8は、図13のシーケンス#1と#2から類似部分シーケンスペアを検出した結果を表す散布図である。図8の散布図は、シーケンス#1と#2における類似部分シーケンスペアであるX[is:ie]とY[js:je]における要素ieとjeを反映している。つまり、この図8における横軸はXの要素を、縦軸はYの要素を表し、部分シーケンスペアX[is:ie]とY[js:je]が類似している場合、散布図の(ie,je)の位置に点がプロットされる。
以下、図9〜図11について、同様にして散布図を作成することができる。
図9の(a)と(b)に示すように、Sines1とSines2は、含まれるサイン波の周期と、サイン波の現れる周期が、それぞれ異なっている。そして、図9(c)に示すように、本実施形態の類似部分シーケンス検出装置1によれば、すべてのサイン波と時間変化する周期性を完全に特定(表現)することができていることがわかる。つまり、Sines1にはサイン波が6つ、Sines2にはサイン波が5つあり、散布図には30個(=6×5)のプロット群が存在している。また、図9(c)の散布図において、各サイン波の周期の違いは傾きの違いとして表れていることが確認できる。
11 入力部
12 処理部
13 記憶部
14 出力部
111 検出条件入力部
112 データストリーム入力部
121 データストリーム処理部
131 検出条件記憶部
132 タイムワーピングデータ記憶部
133 類似部分シーケンス候補記憶部
141 類似部分シーケンス出力部
Claims (5)
- 2つのデータストリームから、類似する部分シーケンスのペアを、2つの前記部分シーケンス同士の類似度スコアを示すタイムワーピング行列を用いて検出する類似部分シーケンス検出装置による類似部分シーケンス検出方法であって、
前記類似部分シーケンス検出装置は、前記タイムワーピング行列を記憶する記憶部と、処理部と、を備えており、
前記処理部は、
前記2つのデータストリームのうちいずれかのデータストリームのデータの1つの要素を受信したとき、当該要素を含む前記データストリーム中の部分シーケンスと、他方の前記データストリーム中の部分シーケンスと、の類似度スコアを算出し、その際、
2つの部分シーケンスX[i s :i e ]とY[j s :j e ]との類似度スコアS(X[i s :i e ],Y[j s :j e ])を、以下の式(1)〜式(5)により算出し、
S(X[i s :i e ],Y[j s :j e ])=s(i e ,j e ) ・・・式(1)
s(i,j)=max{0,2ε−‖x i −y j ‖+s best } ・・・式(2)
s best =max{s(i,j−1),s(i−1,j),s(i−1,j−1)}
・・・式(3)
s(i,0)=0 ・・・式(4)
s(0,j)=0 ・・・式(5)
前記タイムワーピング行列に記憶する前記部分シーケンスX[i s :i e ]の開始位置i s と、前記部分シーケンスY[j s :j e ]の開始位置j s とを示すp(i,j)を、以下の式(7)により算出し、
p(i,j)={p(i,j−1) (if s best =s(i,j−1)),
p(i−1,j) (if s best =s(i−1,j)),
p(i−1,j−1)(if s best =s(i−1,j−1)),
(i,j) (if s best =0)} ・・・式(7)
前記開始位置i s ,j s を、以下の式(8)により算出し、
(i s ,j s )=p(i e ,j e ) ・・・式(8)
前記算出した類似度スコアと、その類似度スコアの算出に用いた2つの前記部分シーケンスの開始位置および終了位置と、を対応付けて前記記憶部の前記タイムワーピング行列に記憶し、
前記記憶部のタイムワーピング行列に記憶された前記類似度スコアを用いて、類似する部分シーケンスのペアを検出して出力し、その際、
類似度スコアの平均値s’を、以下の式(6)により算出し、
s’=s(i,j)/W ・・・式(6)
前記算出した類似度スコアの平均値s’が所定の閾値ε以上であり、かつ、前記類似度スコアの算出に使用した2つの部分シーケンスの長さがいずれも所定の長さζ以上であるとき、それらの2つの前記部分シーケンスを、類似する部分シーケンスのペアとして検出して出力する
ことを特徴とする類似部分シーケンス検出方法。
ただし、i=1,2,…,n、j=1,2,…,m、‖x i −y j ‖はx i とy j との間の距離を示す。
また、Wは部分シーケンスX[i s :i e ]と部分シーケンスY[j s :j e ]とのタイムワーピングパスの長さを示す。 - 前記処理部は、
前記算出した類似度スコアの平均値s’が所定の閾値ε以上であり、かつ、前記算出に使用した2つの部分シーケンスの長さがいずれも所定の長さζ以上である場合、
当該2つの部分シーケンスを、類似部分シーケンスペア候補として前記記憶部に記憶し、
前記記憶部に記憶された前記類似部分シーケンスペア候補のうち、前記タイムワーピングパスの少なくとも一部に重複しているものがあるとき、前記重複している類似部分シーケンスペア候補の中から、前記タイムワーピングパスが最長の類似部分シーケンスペア候補を選択し、当該選択した類似部分シーケンスペア候補である2つの前記部分シーケンスを、類似する部分シーケンスのペアとして出力する
ことを特徴とする請求項1に記載の類似部分シーケンス検出方法。 - 請求項1または請求項2に記載の類似部分シーケンス検出方法をコンピュータに実行させるための類似部分シーケンス検出プログラム。
- 2つのデータストリームから、類似する部分シーケンスのペアを、2つの前記部分シーケンス同士の類似度スコアを示すタイムワーピング行列を用いて検出する類似部分シーケンス検出装置であって、
前記タイムワーピング行列を記憶する記憶部と、
前記2つのデータストリームのうちいずれかのデータストリームのデータの1つの要素を受信したとき、当該要素を含む前記データストリーム中の部分シーケンスと、他方の前記データストリーム中の部分シーケンスと、の類似度スコアを算出し、その際、
2つの部分シーケンスX[i s :i e ]とY[j s :j e ]との類似度スコアS(X[i s :i e ],Y[j s :j e ])を、以下の式(1)〜式(5)により算出し、
S(X[i s :i e ],Y[j s :j e ])=s(i e ,j e ) ・・・式(1)
s(i,j)=max{0,2ε−‖x i −y j ‖+s best } ・・・式(2)
s best =max{s(i,j−1),s(i−1,j),s(i−1,j−1)}
・・・式(3)
s(i,0)=0 ・・・式(4)
s(0,j)=0 ・・・式(5)
前記タイムワーピング行列に記憶する前記部分シーケンスX[i s :i e ]の開始位置i s と、前記部分シーケンスY[j s :j e ]の開始位置j s とを示すp(i,j)を、以下の式(7)により算出し、
p(i,j)={p(i,j−1) (if s best =s(i,j−1)),
p(i−1,j) (if s best =s(i−1,j)),
p(i−1,j−1)(if s best =s(i−1,j−1)),
(i,j) (if s best =0)} ・・・式(7)
前記開始位置i s ,j s を、以下の式(8)により算出し、
(i s ,j s )=p(i e ,j e ) ・・・式(8)
前記算出した類似度スコアと、その類似度スコアの算出に用いた2つの前記部分シーケンスの開始位置および終了位置と、を対応付けて前記記憶部の前記タイムワーピング行列に記憶し、
前記記憶部のタイムワーピング行列に記憶された前記類似度スコアを用いて、類似する部分シーケンスのペアを検出して出力し、その際、
類似度スコアの平均値s’を、以下の式(6)により算出し、
s’=s(i,j)/W ・・・式(6)
前記算出した類似度スコアの平均値s’が所定の閾値ε以上であり、かつ、前記類似度スコアの算出に使用した2つの部分シーケンスの長さがいずれも所定の長さζ以上であるとき、それらの2つの前記部分シーケンスを、類似する部分シーケンスのペアとして検出して出力する処理部と、
を備えることを特徴とする類似部分シーケンス検出装置。
ただし、i=1,2,…,n、j=1,2,…,m、‖x i −y j ‖はx i とy j との間の距離を示す。
また、Wは部分シーケンスX[i s :i e ]と部分シーケンスY[j s :j e ]とのタイムワーピングパスの長さを示す。 - 前記処理部は、
前記算出した類似度スコアの平均値s’が所定の閾値ε以上であり、かつ、前記算出に使用した2つの部分シーケンスの長さがいずれも所定の長さζ以上である場合、
当該2つの部分シーケンスを、類似部分シーケンスペア候補として前記記憶部に記憶し、
前記記憶部に記憶された前記類似部分シーケンスペア候補のうち、前記タイムワーピングパスの少なくとも一部に重複しているものがあるとき、前記重複している類似部分シーケンスペア候補の中から、前記タイムワーピングパスが最長の類似部分シーケンスペア候補を選択し、当該選択した類似部分シーケンスペア候補である2つの前記部分シーケンスを、類似する部分シーケンスのペアとして出力する
ことを特徴とする請求項4に記載の類似部分シーケンス検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008042633A JP5060340B2 (ja) | 2008-02-25 | 2008-02-25 | 類似部分シーケンス検出方法、類似部分シーケンス検出プログラム、および、類似部分シーケンス検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008042633A JP5060340B2 (ja) | 2008-02-25 | 2008-02-25 | 類似部分シーケンス検出方法、類似部分シーケンス検出プログラム、および、類似部分シーケンス検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009199507A JP2009199507A (ja) | 2009-09-03 |
JP5060340B2 true JP5060340B2 (ja) | 2012-10-31 |
Family
ID=41142907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008042633A Expired - Fee Related JP5060340B2 (ja) | 2008-02-25 | 2008-02-25 | 類似部分シーケンス検出方法、類似部分シーケンス検出プログラム、および、類似部分シーケンス検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5060340B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5424269B2 (ja) * | 2010-09-10 | 2014-02-26 | 株式会社日立製作所 | 局所対応抽出装置及び局所対応抽出方法 |
EP3249549B1 (en) | 2015-01-22 | 2020-03-18 | Mitsubishi Electric Corporation | Time series data search device and time series data search program |
CN107305501B (zh) * | 2016-04-25 | 2020-11-17 | 百度在线网络技术(北京)有限公司 | 一种多流流式数据的处理方法和系统 |
JP7122960B2 (ja) | 2018-12-27 | 2022-08-22 | 三菱電機株式会社 | 異常検出装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000305940A (ja) * | 1999-04-21 | 2000-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 時系列データ検索方法及び装置及び時系列データ検索プログラムを格納した記憶媒体 |
-
2008
- 2008-02-25 JP JP2008042633A patent/JP5060340B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009199507A (ja) | 2009-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10895454B2 (en) | Movement line information generation system, movement line information generation method and movement line information generation program | |
KR101906859B1 (ko) | 이상 서브시퀀스 검출 장치 및 방법 | |
Hassani et al. | Towards a mobile health context prediction: Sequential pattern mining in multiple streams | |
JP2011252844A (ja) | データ処理装置、データ処理方法、およびプログラム | |
JP5060340B2 (ja) | 類似部分シーケンス検出方法、類似部分シーケンス検出プログラム、および、類似部分シーケンス検出装置 | |
JP2016110337A (ja) | 経路情報処理装置、方法、及びプログラム | |
JP4939349B2 (ja) | トレンド検出方法、トレンド検出プログラムおよびトレンド検出装置 | |
Kulkarni et al. | Mobidict: A mobility prediction system leveraging realtime location data streams | |
CN110992698A (zh) | 基于Apriori支持度与行驶距离加权计算交叉口间关联程度的方法 | |
US9674083B2 (en) | Path calculation order deciding method, program and calculating apparatus | |
JPWO2014087590A1 (ja) | 最適化装置、最適化方法および最適化プログラム | |
Zhang et al. | Lightweight and accurate DNN-based anomaly detection at edge | |
Sankararaman et al. | Computing similarity between a pair of trajectories | |
JP4801566B2 (ja) | データストリーム監視装置、データストリーム監視方法、そのプログラムおよび記録媒体 | |
CN116541721B (zh) | 一种面向信令数据的定位与路网匹配方法及系统 | |
JP2010198227A (ja) | 類似部分シーケンス検出装置、類似部分シーケンス検出方法、および、類似部分シーケンス検出プログラム | |
Li et al. | Similarity match in time series streams under dynamic time warping distance | |
Rafid et al. | The Effect of LAB Color Space with NASNetMobile Fine-tuning on Model Performance for Crowd Detection | |
Moghtasedi et al. | High-quality prediction of tourist movements using temporal trajectories in graphs | |
JP2014229110A (ja) | 検索装置、検索方法および検索プログラム | |
Truong et al. | Time series prediction using motif information | |
Li et al. | Efficient Multi-source Contact Event Query Processing for Moving Objects | |
Li et al. | Subspace estimation of distribution algorithms: To perturb part of all variables in estimation of distribution algorithms | |
Pehlivan et al. | Anchor-free action proposal network with uncertainty estimation | |
JP5786879B2 (ja) | 被写体追跡装置、被写体追跡方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100114 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110811 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120731 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120803 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |