JP6061714B2 - 類似系列区間検出装置および類似系列区間検出プログラム - Google Patents
類似系列区間検出装置および類似系列区間検出プログラム Download PDFInfo
- Publication number
- JP6061714B2 JP6061714B2 JP2013024166A JP2013024166A JP6061714B2 JP 6061714 B2 JP6061714 B2 JP 6061714B2 JP 2013024166 A JP2013024166 A JP 2013024166A JP 2013024166 A JP2013024166 A JP 2013024166A JP 6061714 B2 JP6061714 B2 JP 6061714B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- section
- similar
- series data
- series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
複数系列類似区間検出手段)2と、ROM(Read Only Memory)3と、RAM(Random Access Memory)(記録手段)4と、記録部(記録手段)5と、ディスプレイ部6と、操作部7とにより概略構成されている。
円状時系列データ:f(t) 但し、1≦t≦L
Lは、円状時系列データの全体長
円状であるため、f(L+t)=f(t)
入力データ:g(x) 但し、x=1,2,・・・,L−T
Tは、参照データの区間長
また、時間tにおいて、g(x)=f(t+x−1)
一方で、参照データZ(τ)は、区間長がTであるため、τが、1,2,・・・,Tとなる。
参照データ:Z(τ) 但し、τ=1,2,・・・,T
d(x,τ)=‖g(x)−Z(τ)‖
1≦x≦L−T,1≦τ≦t
但し、xまたはτが、連結前の複数の時系列データのいずれかのデータの終端点に該当する場合には、d(x,τ)=∞になるように設定が行われる。
rj:τ(j)→x(j),x(j)=rj(τ(j)),
r=(r1,r2,・・・,ri)
ここで、関数rの要素rjは、τ(j)からx(j)への写像を示している。従って、x(j)に対して、x(j)=rj(τ(j))の関係が成立する。
First,Z(1)=g(1)(=f(1))
Second,for x=1,2,・・・,L−T−1,g(x)=g(x+1)
Third,g(L−T)=Z(T)
Final,for τ=2,3,・・・,T,Z(τ)=Z(τ−1)
for x=1,2,・・・,L−T,d(x,1)=‖g(x)−Z(1)‖
For 1≦τ≦T,d(L−T,τ)=‖g(L−T)−Z(τ)‖
Local distance updating:
for τ=2,3,・・・,T,and x=1,2,・・・,L−T−1,
d(x,τ)=d(x+1,τ−1)
本実施の形態では、式(2)のような漸化式を用いるため、3τで割る処理を行っている。このように3τでD(x,τ)を割ることによって、参照データ内の長さが異なる区間長(部分長)の間で比較を行うことが可能となる。
更新されるので、漸化式における演算回数の総数は、{T×(L−T)}×Lとなる。ここで、Tの値は、それほど大きくない定数であるため、全体としての計算量は、Lの2乗オーダーの計算量(O(L×L))となる。
2 …CPU(演算手段、連結系列データ生成手段、円状系列データ生成手段、データ設定手段、局所距離算出手段、正規化処理手段、スポッティング点算出手段、部分類似区間検出手段、全体類似区間検出手段、円状類似区間検出手段、複数系列類似区間検出手段)
3 …ROM
4 …RAM(記録手段)
5 …記録部(記録手段)
6 …ディスプレイ部
7 …操作部
Claims (6)
- 複数n個の系列データSn(t)において、類似するデータを示す系列的な区間を、類似区間として検出する類似系列区間検出装置であって、
前記n個の系列データSn(t)を記録する記録手段と、
前記n個の系列データSn(t)を順番に連結して1つにまとめられた連結系列データを生成するとともに、該連結系列データの全体の系列的な長さLと、前記n個の系列データSn(t)の連結順番および連結位置に関する情報とを、前記記録手段に記録する連結系列データ生成手段と、
前記連結系列データの始点と終点とを連結して円状を成す円状系列データf(t)を生成する円状系列データ生成手段と、
該円状系列データf(t)において類似区間と想定され得る最大の区間長をTとして、前記円状系列データf(t)より区間[t−T,t−1]の範囲で遡って系列データを抽出することによって、参照データZ(τ)(1≦τ≦T)を設定するとともに、前記参照データZ(τ)以外の前記円状系列データf(t)の残りの区間[t,t+L−T−1]の系列データを入力データg(x)(1≦x≦L−T)として設定するデータ設定手段と、
前記参照データZ(τ)と前記入力データg(x)との局所距離d(x,τ)(=‖g(x)−Z(τ)‖)を、連続DP処理に基づいて求める局所距離算出手段と、
該局所距離算出手段により求められた局所距離d(x,τ)に基づいて、連続DP処理における漸化式を用いて、局所距離の最小値D(x,τ)を求めると共に、求められた局所距離の最小値D(x,τ)を傾斜制限に基づいて決定される漸化式の重み付け係数kとτとで除算することにより、前記最小値D(x,τ)を正規化したA(x,τ)(=D(x,τ)/(k×τ))を求める正規化処理手段と、
該A(x,τ)が予め設定される閾値h以下となるτ(x)を、xの前後αの区間[x−α,x+α]からなるxの局所間隔(local interval of x)で算出し、算出されたτ(x)に基づいて、前記参照データZ(τ)と前記入力データg(x)とにおけるスポッティング点(x*,τ*)を、類似区間の最小の区間長を定める係数τ0を用いて、
該スポッティング点(x*,τ*)に至る最適パスを、連続DP処理における累積値のバックトレース処理によって求めることにより、前記区間[x−α,x+α]において、前記参照データZ(τ)の区間[1,τ*]に類似する前記入力データg(x)の類似区間を求める部分類似区間検出手段と、
該部分類似区間検出手段により求められた区間[x−α,x+α]の入力データg(x)における類似区間を、全てのxについて求めることにより、xの全区間における入力データg(x)の類似区間を求める全体類似区間検出手段と、
前記円状系列データf(t)のtの値を、1からLへと順番に増加させることにより、前記データ設定手段において、全てのtに対応する参照データZ(τ)と入力データg(x)とを設定させると共に、前記全体類似区間検出手段において、全てのtに対応する入力データg(x)の類似区間を求めさせることにより、円状系列データの全ての区間において類似区間の検出を行う円状類似区間検出手段と、
該円状類似区間検出手段により検出された類似区間が、前記n個の系列データにおけるどの系列データのどの区間に該当するかを、前記記録手段に記録された前記連結順番および前記連結位置に関する情報に基づいて求めることにより、n個の系列データにおける類似区間の検出を行う複数系列類似区間検出手段と
を備えることを特徴とする類似系列区間検出装置。 - 前記局所距離算出手段は、前記局所距離d(x,τ)を求める場合において、前記記録手段に記録された前記n個の系列データにおける前記連結位置の情報に基づいて、前記局所距離d(x,τ)におけるxが、前記n個の系列データのいずれかの終端点xaに該当するか否かを判断し、xが終端点xaに該当する場合には、局所距離d(xa,τ)の値として∞を設定することを特徴とする請求項1に記載の類似系列区間検出装置。
- 複数n個の系列データSn(t)において、類似するデータを示す系列的な区間を、類似区間として検出する類似系列区間検出装置であって、
前記n個の系列データSn(t)のどの区間が、前記類似区間に該当するかを求める演算手段を備え、
該演算手段は、
前記n個の系列データSn(t)を順番に連結して1つにまとめた連結系列データの始点と終点とを連結して円状系列データf(t)を生成し、
該円状系列データf(t)に対して、tから区間長Tまで遡った範囲[t,t−T]の系列データを参照データZ(τ)(1≦τ≦T)として設定すると共に、該参照データZ(τ)以外の前記円状系列データf(t)の残りの区間[t,t+L−T−1]の系列データを入力データg(x)(1≦x≦L−T)として設定し、
連続DP処理を用いて、前記参照データZ(τ)と前記入力データg(x)とのスポッティング点(x*,τ*)を求め、
求められたスポッティング点に至る最適パスを、連続DP処理において用いられる累積値のバックトレース処理によって求めることにより、前記参照データZ(τ)の区間[1,τ*]の系列データに類似する前記入力データg(x)の類似区間を検出し、
tを1からLまで変化させて、全てのtに基づいて参照データと入力データとを設定して前記類似区間の検出処理を行うことにより、前記円状系列データの全ての区間における類似区間の検出を行い、
前記n個の系列データSn(t)を連結して前記円状系列データを生成したときの連結位置および連結順番に関する情報に基づいて、前記円状系列データにおいて検出された前記類似区間が、前記n個の系列データにおけるどの系列データのどの区間に該当するかを求める
ことを特徴とする類似系列区間検出装置。 - 複数n個の系列データSn(t)において、類似するデータを示す系列的な区間を、類似区間として検出する類似系列区間検出装置の類似系列区間検出プログラムであって、
連結系列データ生成手段に、記録手段に記録される前記n個の系列データSn(t)を順番に連結して1つにまとめられた連結系列データを生成させるともに、該連結系列データの全体の系列的な長さLと、前記n個の系列データSn(t)の連結順番および連結位置に関する情報とを、前記記録手段に記録させる連結系列データ生成ステップと、
円状系列データ生成手段に、前記連結系列データの始点と終点とを連結して円状を成す円状系列データf(t)を生成させる円状系列データ生成ステップと、
データ設定手段に、前記円状系列データf(t)において類似区間と想定され得る最大の区間長をTとして、前記円状系列データf(t)より区間[t−T,t−1]の範囲で遡って系列データを抽出させることによって、参照データZ(τ)(1≦τ≦T)を設定させるとともに、前記参照データZ(τ)以外の前記円状系列データf(t)の残りの区間[t,t+L−T−1]の系列データを入力データg(x)(1≦x≦L−T)として設定させるデータ設定ステップと、
局所距離算出手段に、前記参照データZ(τ)と前記入力データg(x)との局所距離d(x,τ)(=‖g(x)−Z(τ)‖)を、連続DP処理に基づいて求めさせる局所距離算出ステップと、
正規化処理手段に、前記局所距離算出ステップにおいて求められた局所距離d(x,τ)に基づいて、連続DP処理における漸化式を用いて、局所距離の最小値D(x,τ)を求めさせると共に、求められた局所距離の最小値D(x,τ)を傾斜制限に基づいて決定される漸化式の重み付け係数kとτとで除算することにより、前記最小値D(x,τ)を正規化したA(x,τ)(=D(x,τ)/(k×τ))を求めさせる正規化処理ステップと、
スポッティング点算出手段に、前記A(x,τ)が予め設定される閾値h以下となるτ(x)を、xの前後αの区間[x−α,x+α]からなるxの局所間隔(local interval of x)で算出させ、算出されたτ(x)に基づいて、前記参照データZ(τ)と前記入力データg(x)とにおけるスポッティング点(x*,τ*)を、類似区間の最小の区間長を定める係数τ0を用いて、
部分類似区間検出手段に、前記スポッティング点(x*,τ*)に至る最適パスを、連続DP処理における累積値のバックトレース処理によって求めさせることにより、前記区間[x−α,x+α]において、前記参照データZ(τ)の区間[1,τ*]に類似する前記入力データg(x)の類似区間を求めさせる部分類似区間検出ステップと、
全体類似区間検出手段により、前記部分類似区間検出ステップにおいて求められた前記区間[x−α,x+α]の前記入力データg(x)における類似区間を、全てのxについて求めさせることにより、xの全区間における前記入力データg(x)の類似区間を求めさせる全体類似区間検出ステップと、
円状類似区間検出手段に、前記円状系列データf(t)のtの値を、1からLへと順番に増加させることにより、前記データ設定ステップにおいて、全てのtに対応する参照データZ(τ)と入力データg(x)とを設定させると共に、前記全体類似区間検出ステップにおいて、全てのtに対応する入力データg(x)の類似区間を求めさせることにより、円状系列データの全ての区間において類似区間の検出を行わせる円状類似区間検出ステップと、
複数系列類似区間検出手段に、前記円状類似区間検出ステップにおいて検出された類似区間が、前記n個の系列データにおけるどの系列データのどの区間に該当するかを、前記記録手段に記録された前記連結順番および前記連結位置に関する情報に基づいて求めさせることにより、n個の系列データにおける類似区間の検出を行わせる複数系列類似区間検出ステップと
を実行させるための類似系列区間検出プログラム。 - 前記局所距離算出ステップにおいて、前記局所距離算出手段が、前記局所距離d(x,τ)を求める場合に、前記n個の系列データにおける前記連結位置の情報に基づいて、前記局所距離d(x,τ)におけるxが、前記n個の系列データのいずれかの終端点xaに該当するか否かを、前記局所距離算出手段に判断させ、xが終端点xaに該当する場合には、局所距離d(xa,τ)の値として∞を設定させるプログラムであることを特徴とする請求項4に記載の類似系列区間検出プログラム。
- 複数n個の系列データSn(t)において、類似するデータを示す系列的な区間を、類似区間として検出する類似系列区間検出装置の類似系列区間検出プログラムであって、
前記n個の系列データSn(t)のどの区間が、前記類似区間に該当するかを求める演算手段に、
前記n個の系列データSn(t)を順番に連結して1つにまとめた連結系列データの始点と終点とを連結して円状系列データf(t)を生成させるステップと
該円状系列データf(t)に対して、tから区間長Tまで遡った範囲[t,t−T]の系列データを参照データZ(τ)(1≦τ≦T)として設定させると共に、該参照データZ(τ)以外の前記円状系列データf(t)の残りの区間[t,t+L−T−1]の系列データを入力データg(x)(1≦x≦L−T)として設定させるステップと、
連続DP処理を用いて、前記参照データZ(τ)と前記入力データg(x)とのスポッティング点(x*,τ*)を求めさせるステップと、
求められたスポッティング点に至る最適パスを、連続DP処理において用いられる累積値のバックトレース処理によって求めさせることにより、前記参照データZ(τ)の区間[1,τ*]の系列データに類似する前記入力データg(x)の類似区間を検出させるステップと、
tを1からLまで変化させて、全てのtに基づいて参照データと入力データとを設定して前記類似区間の検出処理を行わせることにより、前記円状系列データの全ての区間における類似区間の検出を行わせるステップと、
前記n個の系列データSn(t)を連結して前記円状系列データを生成したときの連結位置および連結順番に関する情報に基づいて、前記円状系列データにおいて検出された前記類似区間が、前記n個の系列データにおけるどの系列データのどの区間に該当するかを求めさせるステップと
を実行させるための類似系列区間検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013024166A JP6061714B2 (ja) | 2013-02-12 | 2013-02-12 | 類似系列区間検出装置および類似系列区間検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013024166A JP6061714B2 (ja) | 2013-02-12 | 2013-02-12 | 類似系列区間検出装置および類似系列区間検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014153984A JP2014153984A (ja) | 2014-08-25 |
JP6061714B2 true JP6061714B2 (ja) | 2017-01-18 |
Family
ID=51575779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013024166A Active JP6061714B2 (ja) | 2013-02-12 | 2013-02-12 | 類似系列区間検出装置および類似系列区間検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6061714B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5033155B2 (ja) * | 2009-02-24 | 2012-09-26 | 日本電信電話株式会社 | 類似部分シーケンス検出装置、類似部分シーケンス検出方法、および、類似部分シーケンス検出プログラム |
WO2010097870A1 (ja) * | 2009-02-27 | 2010-09-02 | 三菱電機株式会社 | 音楽検索装置 |
JP5599363B2 (ja) * | 2011-05-02 | 2014-10-01 | 株式会社Photonic System Solutions | ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 |
-
2013
- 2013-02-12 JP JP2013024166A patent/JP6061714B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014153984A (ja) | 2014-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111324750B (zh) | 一种大规模文本相似度计算及文本查重方法 | |
JP6350251B2 (ja) | 経路情報処理装置、方法、及びプログラム | |
JP2009003534A (ja) | 時系列データ分類装置、時系列データ分類方法および時系列データ処理装置 | |
JP6301647B2 (ja) | 探索装置、探索方法およびプログラム | |
CN105447190A (zh) | 基于卷积神经网络的图片检索方法、装置和服务器 | |
US7584173B2 (en) | Edit distance string search | |
KR100978913B1 (ko) | Svm기반 복 수의 매칭 알고리즘을 결합한 음원 검색 시스템 및 방법 | |
CN112784009A (zh) | 一种主题词挖掘方法、装置、电子设备及存储介质 | |
JP6061714B2 (ja) | 類似系列区間検出装置および類似系列区間検出プログラム | |
CN110890086B (zh) | 一种基于贪心算法的语音相似度计算方法和装置 | |
JP2012063611A (ja) | 音声認識結果検索装置、音声認識結果検索方法および音声認識結果検索プログラム | |
JP4510792B2 (ja) | 所在地解析装置、所在地解析方法及びそのプログラム並びに記録媒体 | |
CN115409070A (zh) | 离散数据序列临界点的确定方法、装置以及设备 | |
CN110941730B (zh) | 基于人脸特征数据偏移的检索方法与装置 | |
JP5159277B2 (ja) | N文字索引生成装置、文書検索装置、n文字索引生成方法、文書検索方法、n文字索引生成プログラムおよび文書検索プログラム | |
JP4468736B2 (ja) | 類似画像検索装置,類似画像検索方法および類似画像検索プログラム | |
JP5866084B2 (ja) | 検索装置 | |
JP6139430B2 (ja) | 信号処理装置、方法及びプログラム | |
KR100978914B1 (ko) | Svr 기반 복 수의 매칭 알고리즘을 결합한 음원 검색 시스템 및 방법 | |
WO2022230115A1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP4510784B2 (ja) | 所在地解析装置、所在地解析方法及びそのプログラム並びに記録媒体 | |
JP6971835B2 (ja) | 要素類似判定装置、要素類似判定方法及び要素類似判定プログラム | |
JP2009116592A (ja) | ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体 | |
JP3802157B2 (ja) | パターン・マッチング処理方法および装置 | |
CN118447276A (zh) | 一种考虑特征曲线形状信息的相似性评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6061714 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |