JP2005031908A - Time series pattern generating apparatus and time series pattern generation method - Google Patents
Time series pattern generating apparatus and time series pattern generation method Download PDFInfo
- Publication number
- JP2005031908A JP2005031908A JP2003195174A JP2003195174A JP2005031908A JP 2005031908 A JP2005031908 A JP 2005031908A JP 2003195174 A JP2003195174 A JP 2003195174A JP 2003195174 A JP2003195174 A JP 2003195174A JP 2005031908 A JP2005031908 A JP 2005031908A
- Authority
- JP
- Japan
- Prior art keywords
- series pattern
- time series
- time
- partial data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、観測対象の複数の状態に対応する時系列データから各状態に固有の時系列パターンを生成する時系列パターン生成装置及び時系列パターン生成方法、並びに、時系列データから互いに類似しない時系列パターンを生成する時系列パターン生成方法に関する。
【0002】
【従来の技術】
センシング技術とプロセッサ技術の向上に伴い、センサは、低コスト化と相俟って、身近な存在になっている。例えば足にセンサを付け、その動作を時系列データとして取得することも可能になってきている。
【0003】
そこで、人にセンサを取り付けて時系列データを取得し、その人が何らかの動作を行った時に現れる特徴的な時系列パターンを、取得した時系列データから生成することが行われるようになってきている。また、その人がどのような動作をしているのか識別するために、各動作(時系列の状態)から得られた時系列データを用いて、各動作に固有の時系列パターンを生成することも要求されるようになってきている。
【0004】
しかし、一般に、取得される時系列パターンは膨大な量になることが多いため、時系列パターンを人の手で探すとなると非常に労力がかかるという問題点がある。
【0005】
また、上述した後者、つまり、各状態から得られた時系列データを用いて各動作に固有の時系列パターンを生成する方法は知られていない。
【0006】
一方、上述した前者、つまり、ある状態から得られた時系列データを用いてこの状態に特徴的な時系列パターンを生成することについては、これを実現する方法として、例えば時系列クラスタリングとルール分析(非特許文献2)を時系列に拡張したものがある。
【0007】
しかし、いずれにおいても、処理に当たって、時系列データを適当な基準で区間分け(セグメント化)する必要があるが、前者の時系列クラスタリングでは、区間の数(セグメント数)、つまり、パターン長は一定にする必要がある(固定である)という欠点がある。
【0008】
これに対し、後者のルール分析はパターン長を自動的に決定して効率よく時系列パターンを生成できるという利点があるが、パターン長の長い時系列パターンを生成する場合、パターン長が短い時系列パターンを組み合わせて長い時系列パターンを表現する。このため、各時系列パターンが平均化されてしまいやすい欠点がある。この理由は、短い時系列パターンは形状が単純であるために近似した時系列パターンが多数あることが多いというものである。よって、この手法ではパターン長が長くなったとき、複雑な形状の時系列パターンを扱えないという欠点がある。
【0009】
ところで、時系列パターンを生成する際には類似した時系列パターンが多数生成されない方が好ましく、従って、切り出した時系列データの類似判定が必要になる。類似判定では長さや高さが異なっていても形状が類似していれば同一のものであるとしたい(長さや高さの曖昧さを吸収したい)という要請があるが、上述の時系列クラスタリングでは長さの曖昧さしか吸収できないという欠点があった。一方、長さ、高さの曖昧さを共に吸収できる方法として時系列パターン発生モデルを使用する方法(非特許文献1)があるが、この方法では時系列の形状を保持せずに直線とみなすために複雑な形状同士を区別できないという欠点がある。
【0010】
【特許文献1】
特開平11−326542号公報
【特許文献2】
特開平9−34719号公報
【非特許文献1】
Xianping Ge and Padhraic Smyth, Deformable Markov Model Templates for Time−Series Pattern Matching, ACM SIGKDD(KDD−2000), pp.81−90, 2000
【非特許文献2】
Rakesh Agrawal, Tomasz Imielinski, Arun N. Swami, Mining Association Rules between Sets of Items in Large Databases, SIGMOD Conference 1993, pp.207−216, 1993
【0011】
【発明が解決しようとする課題】
上記のように、従来においては、各時系列の状態に対して他の時系列の状態と区別できる時系列パターンを自動的に生成できないという問題点があった。また、パターン長が大きくなった場合、複雑な形状を扱うことができないという問題点があった。さらに、長さと高さの曖昧さを吸収した、複雑な形状の類似判定ができないという問題点があった。
【0012】
本発明は、上記の事情を考慮してなされたものであり、各時系列の状態に対して他の時系列の状態と区別可能な、各時系列の状態に固有の時系列パターンを自動的に生成できる時系列パターン生成装置及び時系列パターン生成方法を提供することを目的とする。また、パターン長が大きくなっても複雑な形状を扱うことのできる時系列パターン生成方法を提供することを目的とする。さらに、本発明は、複雑な形状の類似判定を可能にし、これにより、長さ及び高さに加え、複雑な形状も考慮できる時系列パターン生成方法を提供することを目的とする。
【0013】
【課題を解決するための手段】
本発明の時系列パターン生成装置は、観測対象の複数の状態に対応する時系列データを用いて、各状態に固有の時系列パターンを生成する時系列パターン生成装置であって、複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成部と、前記時系列パターン生成部によって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準を用いて前記時系列パターン生成部に再度、前記時系列パターンを生成させるために、補正した前記類似度判別基準を前記時系列パターン生成部に出力する時系列パターン評価部と、を備えたことを特徴とする。
【0014】
本発明の時系列パターン生成方法は、観測対象の複数の状態に対応する時系列データを用いて、各状態に固有の時系列パターンを生成する時系列パターン生成方法であって、複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成ステップと、前記時系列パターン生成ステップによって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準によって前記時系列パターン生成ステップを再度行う時系列パターン評価ステップと、を備えたことを特徴とする。
【0015】
本発明の時系列パターン生成方法は、時系列データから互いに類似しない時系列パターンを生成する時系列パターン生成方法であって、前記時系列データをある基準でいくつかのセグメントに区切り、特定のセグメント長単位で、各前記時系列データからそれぞれ複数の前記部分データを切り出す部分データ切出しステップと、前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記部分データ群に含まれる前記部分データ数を出現頻度として含めた状態で、前記複数の部分データ群の各々に対応した前記時系列パターンを生成するモデル群生成ステップと、前記モデル群生成ステップにより生成された前記時系列パターンから、所定の削除閾値以下の前記出現頻度を有する前記時系列パターンを削除する時系列パターン削除ステップと、削除後に残った前記時系列パターンの数を評価して継続あるいは非継続の判断を下し、継続の場合は、削除後に残った前記時系列パターンを記憶するとともに、前記セグメント長を変えて前記各ステップ及び本ステップを行い、一方、非継続の場合は、記憶した前記セグメント長ごとの前記時系列パターンを出力する継続評価ステップと、を備えることを特徴とする。
【0016】
本発明の時系列パターン生成方法は、時系列データから切り出された複数の部分データを用いて、互いに類似しない時系列パターンを生成する時系列パターン生成方法であって、前記時系列パターンを生成するモデルとなる時系列パターン発生モデルを作成する新規モデル作成ステップと、前記時系列パターン発生モデルを修正するモデル再学習ステップとを備え、前記部分データの各前記時系列パターン発生モデルに対する尤度を、前記部分データの長さと、高さと、正規化により前記長さ及び前記高さによる影響を排除した形状との観点から計算するモデル尤度計算ステップと、各前記時系列パターン発生モデルに対して算出された前記尤度と、前記部分データと前記時系列パターン発生モデルとの類似度を判別するための類似度判別基準としての類似度パラメータとを用いて、前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行う尤度評価ステップであって、類似する前記時系列パターン発生モデルが存在しない場合は、前記新規モデル作成ステップを行って前記時系列パターン発生モデルを作成し、類似する前記時系列パターン発生モデルが存在する場合は、最も高い前記尤度を有する前記時系列パターン発生モデルを、前記モデル再学習ステップを行って修正する尤度評価ステップと、前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて繰り返すか否かを判断し、繰り返すと判断した場合は、前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて行い、繰り返さないと判断した場合は、最終状態の各前記時系列パターン発生モデルを各前記時系列パターンとして確定する継続処理ステップと、を備えることを特徴とする。
【0017】
【発明の実施の形態】
先ず、本実施の形態の特徴について簡単に説明しておく。
【0018】
図5は、歩行時に得られた時系列データと走行時に得られた時系列データとからなる時系列データ102を示す図である。この時系列データ102は、例えば、生体の足につけた加速度センサから取得されたものである。
【0019】
図中には、歩行ラベルと走行ラベルとからなる状態データ(ラベル)101が示されている。状態データ101は、後述するように、時系列データ102がどのような状態で取得されたのかを特定するために用いる。
【0020】
本実施の形態は、このような各状態(例:歩行、走行)の時系列データを用いて、各状態に固有の時系列パターンを生成しようとするものである。
【0021】
以下、図面を参照しながら、本発明の実施の形態について詳しく説明する。
【0022】
図1は、本発明の一実施形態に関わる時系列パターン生成装置の構成例を示す図である。
【0023】
図1に示すように、この時系列パターン生成装置は、時系列パターン生成部103と時系列パターン評価部105とを備える。
【0024】
時系列パターン生成部103は、入力された状態データ101(図5参照)及び時系列データ102(図5参照)を用いて、相互に類似しない種々のパターン長の(パターン長が非固定の)時系列パターンを生成する。相互に類似しない時系列パターンの生成は後述する類似度パラメータ106(類似度基準)を用いて行う。時系列パターン生成部103は、生成した時系列パターン群を出力時系列パターン104として出力する。
【0025】
後述する図9は、図5の時系列データ102から生成された時系列パターン例を示す図である。図9中には、パターン長が1の時系列パターン(上段)と、パターン長が2の時系列パターン(下段)が示されている。
【0026】
時系列パターン評価部105は、時系列パターン生成部103から出力された出力時系列パターン104を用いて出力時系列パターン104が所望の基準を満たしているか否かの評価を行う。
【0027】
より詳しくは、まず、時系列パターン評価部105は、出力時系列パターン104全体を評価するための時系列パターン全体評価値と、出力時系列パターン104を構成する各時系列パターンを個別に評価するための時系列パターン個別評価値とを、後述する手法を用いて、算出する。
【0028】
次に、時系列パターン評価部105は、時系列パターン全体評価値が所定の基準内にあるかどうかを判断し、所定の基準内にあると判断した場合は、次に、各時系列パターンの時系列パターン個別評価値が所定の基準内にあるかどうかを判断する。時系列パターン評価部105は、所定の基準外にある時系列パターン個別評価値が存在すると判断した場合は、その時系列パターン個別評価値を有する時系列パターンを出力時系列パターン104から削除する。時系列パターン評価部105は、この状態の出力時系列パターン104を、図1に示すように、最終時系列パターン107として出力する。
【0029】
一方、時系列パターン評価部105は、時系列パターン全体評価値が所定の基準外にあると判断した場合は、時系列パターン全体評価値あるいは各時系列パターン個別評価値を用いて上述の類似度パラメータ106を、より厳しい方向に、補正する。そして、時系列パターン評価部105は、図1に示すように、補正後の類似度パラメータ106を時系列パターン生成部104に送出して、再度、時系列パターン生成部103に補正後の類似度パラメータ106により出力時系列パターン104を出力させる。時系列パターン評価部105は、時系列パターン全体評価値が所定の基準内になるまで、類似度パラメータ106の補正を繰り返す。
【0030】
時系列パターン評価部105によって出力された最終時系列パターン107は、本手法によって最終的に得られる時系列パターン(例えば、歩行時に固有の時系列パターン、走行時に固有の時系列パターン)である。最終時系列パターン107の一例を、後述する図11に示す。これは、時系列パターン個別評価値が所定の基準外にあると判断された時系列パターン(パターン3)を、上述のようにして、図9の出力時系列パターン104から除去したものである。後述から明らかになるように、パターン1,2,12が歩行時に固有の時系列パターン、その他のパターン4,5,45が走行時に固有の時系列パターンである。尚、時系列パターン評価部105は、時系列パターン個別評価値が所定の基準内の時系列パターンが多数ある場合などは、そのうちの上位いくつか(例えば出現頻度が高いもの)だけを出力するようにしても良い。
【0031】
次に、時系列パターン生成部103および時系列パターン評価部105についてさらに詳しく説明する。
【0032】
まず、時系列パターン生成部103について説明する。
【0033】
図3は、時系列パターン生成部103の構成を詳細に示す図である。
【0034】
上述したように、時系列パターン生成部103は、時系列データ102と状態データ101とを用いて出力時系列パターン104を生成するものである。
【0035】
図3に示すように、この時系列パターン生成部103は、セグメント化部301、セグメント切出し部303、モデル群生成部306、時系列パターン削除部308、継続評価部311、および継続処理部312を備える。
【0036】
セグメント化部301は、入力された時系列データ102を所定の基準で複数の区間(セグメント)に分け(セグメント化)、区間ごとに、区間サイズ(1次元時系列の場合は長さ)と、区間の高さとを算出する。セグメント化部301は、区間ごとの区間サイズ及び区間の高さをセグメント情報302として出力する。セグメント化の例としては、区分線形近似(1次元時系列の場合は折れ線化)がある。
【0037】
図6は、歩行時および走行時の時系列データ(図5参照)をそれぞれセグメント化した状態を示す図である。
【0038】
図6において、上述のセグメント情報302は、(長さl、高さΔh)=(l1、Δh1)、(l2、Δh2)、・・・、(l10、Δh10)の全データである。ここで、高さΔh1,Δh2,・・・Δh10(図示せず)は、各対応する区間における最大の高さと、最小の高さとの差である。区間の高さとしては、この他、例えば、区間の初めと終わりにおける高さの差を取るようにしてもよい。
【0039】
図3に示すように、セグメント切出し部303は、上述のセグメント情報302を構成する各データに、各区間の形状データ及び入力された状態データを付加したセグメントデータ305(状態データについては図示せず)を生成する。図6の例では、セグメントデータ305は、(長さl、高さΔh、形状y)=(l1、Δh1、y1)、(l2、Δh2、y2)、・・・、(l10、Δh10、y10)の全データ(状態データは図示せず)である。形状データy1,y2・・・は、対応する区間の長さ及び高さも包含しているが、長さと高さのデータは、後述する計算において用いるため、形状データとは別個に取得している。セグメントデータ305を構成する1つ1つの各データ(長さl、高さΔh、形状y)(状態データは図示せず)は1セグメントデータ403と称される。
【0040】
モデル群生成部306は、セグメント切出し部303により生成されたセグメントデータ305と後述する類似度パラメータ106とを用いて、互いに類似しない、特定のパターン長(セグメント数)による時系列パターン(各状態の時系列データにおける出現頻度も含む)を生成する。モデル群生成部306は、生成した時系列パターン群を生成時系列パターン307として出力する。
【0041】
図7(a)及び図7(b)は、セグメントデータ305(図6参照)から生成された生成時系列パターン307例を示す図である。
【0042】
より詳しくは、図7(a)は、パターン長が1の場合に生成された生成時系列パターン307例を示す図である。図中に示すように、ここでは、5つの時系列パターン1〜5が生成されている。ここで、例えば、時系列パターン1の「参照:y1,y4」は、図6の形状y1,y4に対応することを示す。つまり、パターン1は、形状y1,y4から生成された時系列パターンである。
【0043】
一方、図7(b)は、パターン長が2の場合の生成時系列パターン例を示す図である。図中に示すように、パターン長が2の場合は、6つの時系列パターン12,23,31,45,53,34が生成されている。
【0044】
図3に示すように、時系列パターン削除部308は、生成時系列パターン307内の各時系列パターンのうち、出現頻度が削除閾値以下の時系列パターンを削除し、残りの時系列パターンを削除後残存時系列パターン309として出力する。これは、出現頻度の低い時系列パターンを削除して、後述する継続評価部311における計算効率を高めるためである。
【0045】
図8は、パターン長が2の生成時系列パターン307(図7(b)参照)に対して、削除閾値を1とした場合に得られた削除後残存時系列パターン309例を示す図である。
【0046】
図7(b)と図8とを対比して分かるように、図7(b)に示す6つの時系列パターンのうち、出現頻度が1である時系列パターン23,31,53,34が削除され、出現頻度が2であるパターン12,45が、削除後残存時系列パターン309として出力されている。
【0047】
継続評価部311は、時系列パターン削除部308により出力された削除後残存時系列パターン309内の時系列パターン数を調べる。継続評価部311は、削除後残存時系列パターン309内の時系列パターン数が0でないと判断すれば、つまり、さらに大きなパターン長の時系列パターンを生成できる可能性があると判断すれば、この削除後残存時系列パターン309を記憶した上で、継続処理部312へ処理を移行する。
【0048】
すなわち、継続処理部312は、パターン長を増加した(例えばパターン長を1から2に、あるいは2から3に増加した)セグメントデータ305を、時系列データ102を用いて生成する。この際、削除後残存時系列パターン309内の時系列パターンに対応する時系列データの部分を含んだ状態でセグメントデータ305を取得する。これは、あまり重要でないと思われるデータの抽出を抑えることにより、効率の良い処理を実現するためである。
【0049】
一方、継続評価部311は、削除後残存時系列パターン309内の時系列パターン数が0であると判断した場合は、つまり、さらに大きなパターン長の時系列パターンを生成できる可能性がないと判断した場合は、パターン長ごとの削除後残存時系列パターン309を出力時系列パターン104として出力する。
【0050】
先に簡単に説明した図9は、図5に示す時系列データ102から得られた出力時系列パターン104例を示す図である。
【0051】
以下、上述した時系列パターン生成部103による処理動作について、図5の時系列データ102から図9の出力時系列パターン104を生成する場合を例に、詳しく説明する。
【0052】
まず、図3に示すように、セグメント化部301は時系列データ102(図5参照)をセグメント化(図6参照)してセグメント情報302(長さl1、高さΔh)(長さl2、高さΔh2)・・・を生成し、セグメント切出し部303に送出する。
【0053】
セグメント切出し部303は、セグメント情報302を用いて、パターン長1によるセグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・を生成し、モデル群生成部306に送出する。
【0054】
モデル群生成部306は、セグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・を用いて、パターン長が1の、相互に類似しない時系列パターンからなる生成時系列パターン307(図7(a)参照)を生成し、時系列パターン削除部308に送出する。
【0055】
時系列パターン削除部308は、受け取った生成時系列パターン307から、出現頻度が1以下の時系列パターンを削除し、削除後残存時系列パターン309として継続評価部311に送出する(図9の上段参照)。
【0056】
継続評価部311は、削除後残存時系列パターン309内の時系列パターン数を判断する。この場合、パターン数は0ではないので(図9上段に示すようにパターン数は5)、この削除後残存時系列パターン309を内部に記憶するとともに、この削除後残存時系列パターン309を継続処理部312に送出する。
【0057】
継続処理部312は、受け取った削除後残存時系列パターン309と時系列データ102とを用いて、パターン長が2のセグメントデータ305を生成し、モデル群生成部306に送出する。
【0058】
モデル群生成部306は、受け取ったセグメントデータ305を用いて、パターン長が2の生成時系列パターン307を生成して(図7(b)参照)、時系列パターン削除部308に送出する。
【0059】
時系列パターン削除部308は、受け取った生成時系列パターン307から、出現頻度が1以下の時系列パターンを削除して(図9の下段参照)、削除後残存時系列パターン309として継続評価部311に送出する。
【0060】
継続評価部311は、この削除後残存時系列パターン309内の時系列パターン数を判断する。この場合、パターン数は0でないので(図9下段に示すようにパターン数は2)、この削除後残存時系列パターン309を記憶するとともに、この削除後残存時系列パターン309を継続処理部312に送出する。
【0061】
継続処理部312は、受け取った削除後残存時系列パターン309と時系列データ102とを用いて、パターン長を3としたセグメントデータ305を生成し、モデル群生成部306に送出する。
【0062】
モデル群生成部306は、受け取ったセグメントデータ305を用いて、パターン長が3の生成時系列パターン307を生成し(図示せず)、時系列パターン削除部308に送出する。
【0063】
時系列パターン削除部308は、受け取った生成時系列パターン307から出現頻度が1以下の時系列パターンを削除して、削除後残存時系列パターン309とし(図示せず)、継続評価部311に送出する。
【0064】
継続評価部311は、この削除後残存時系列パターン309内の時系列パターン数を判断する。時系列パターン数は0であるので(図示せず)、継続評価部311は、先に記憶したパターン長が1、2の削除後残存時系列パターン309(図9参照)を出力時系列パターン104として出力する。
【0065】
ここで、上述の時系列パターン生成部103を構成するモデル群生成部306(図3参照)についてさらに詳しく説明する。
【0066】
図4は、モデル群生成部306の構成例を詳細に示す図である。
【0067】
上述したように、モデル群生成部306は、セグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・から生成時系列パターン307を生成するものである。
【0068】
図4に示すように、このモデル群生成部306は、セグメント取出継続評価部401、1セグメント取出部402、モデル尤度計算部404、尤度評価部405、モデル再学習部406、および新規モデル作成部407を備える。
【0069】
セグメント取出継続評価部401は、セグメントデータ305内の全ての1セグメントデータ403(前述したようにセグメントデータ305を構成する各データ)が、次の1セグメント取出部402によって取り出されたかどうかを判断する。セグメント取出継続評価部401は、これ以上1セグメントデータ403を取り出せない、つまりセグメントデータ305内の全ての1セグメントデータ403が取り出されたと判断した場合は、本モデル群生成部306において生成された時系列パターン(図7(a)(b)参照)を図示しないバッファから取り出して、生成時系列パターン307として出力する。
【0070】
一方、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403がセグメントデータ305内にまだ存在していると判断した場合は、1セグメント取出部402へ処理を移行する。
【0071】
1セグメント取出部402は、セグメントデータ305から1セグメントデータ403を取り出して、モデル尤度計算部404に送出する。
【0072】
モデル尤度計算部404は、例えば次の(式1)に示す尤度関数
【数1】
を用いて、後述する各時系列パターン発生モデル409(途中段階としての時系列パターン)に対する1セグメントデータ403の尤度(適合度)をそれぞれ計算する。
【0073】
ここで、(式1)において、li、Δhi、yi(t)、μli、μΔhi、σli及びσΔhiは、時系列パターン発生モデル409のパラメータである。より詳しくは、liは、長さ、Δhiは高さ、yi(t)は形状データを示す。また、後述から明らかになるように、μli及σliは、長さの平均及び標準偏差、μΔhi及びσΔhiは、高さの平均及び標準偏差を示す。一方、l’i、Δh’i、y’i(t)は、1セグメントデータ403のパラメータである。また、gμ , σ(x)は平均をμ、標準偏差をσとした正規分布関数を表す。
【0074】
(式1)に示すように、この尤度関数は、1セグメントデータ403と各時系列パターン発生モデルとの適合度を、長さ、高さ及び形状の観点から求める。具体的には、尤度関数は、Σ内に3つの乗算項を有しており、一番左の乗算項が長さの適合度、2番目の乗算項が高さの適合度、3番目の乗算項が形状の適合度に対応する。形状の適合度は、1セグメントデータ403の形状データと時系列パターン発生モデル409の形状データをそれぞれ正規化した状態で(長さと高さの影響を排除した基準となるサイズに修正した状態で)求めている。従って、(式1)によれば、長さと高さが多少異なっていても、形状が類似していれば、高い適合性を示す尤度が算出される。但し、1セグメントデータ403の長さあるいは高さが時系列パターン発生モデル409とがあまりに大きく異なる場合は、形状が類似していても、一番左の乗算項と2番目の乗算項によって、低い適合性を示す尤度が算出される。
【0075】
モデル尤度計算部404は、(式1)を用いて算出した尤度のうち最大尤度と2番目の尤度を尤度データ408として、図4に示すように、1セグメントデータ403とともに、次の尤度評価部405に送出する。
【0076】
尤度評価部405は、モデル尤度計算部404で算出された最大尤度(maxQi)と2番目の尤度(secondQi)を元に、次の(式2)に示す尤度比算出式
【数2】
によって算出される尤度比Rを計算する。
【0077】
尤度評価部405は、算出した尤度比R=maxQi/secondQiを、入力された類似度パラメータ106(1セグメントデータ403と時系列パターン発生モデルとの類似度を判別する際の判別基準値)とを比較する。尤度評価部405は、尤度比R=maxQi/secondQiが類似度パラメータ106以下であると判断した場合は、この1セグメントデータに類似する時系列パターン発生モデル409は存在しないと判断し、この1セグメントデータ403を新規モデル作成部407に送出する。
【0078】
新規モデル作成部407は、受け取った1セグメントデータ403の長さ、高さ及び形状データと、長さおよび高さの平均(ここでは初期値として1セグメントデータの長さと高さそのものを用いる)と、長さ及び高さの標準偏差(ここでは初期値として0または既に得られている標準偏差の平均の30%など)とからなる、時系列パターン発生モデル409を作成する。新規モデル作成部407は、作成した時系列パターン発生モデル409を図示しないバッファに記憶するとともに、継続指示データ412をセグメント取出継続評価部401に送出して、セグメント継続評価部401に処理を移行する。
【0079】
一方、尤度評価部405は、算出した尤度比R=maxQi/secondQiが類似度パラメータ106よりも大きいと判断した場合は、この1セグメントデータ403は、最大尤度maxQiを持つ時系列パターン発生モデル409と類似していると判断する。尤度評価部405は、1セグメントデータ403と類似情報410(いずれの時系列パターン発生モデルに類似しているかを示す情報)とをモデル再学習部406に送出して、モデル再学習部406へ処理を移行する。
【0080】
モデル再学習部406は、類似情報410に指定された時系列パターン発生モデルを図示しないバッファから取り出し、以下の(式3)に示す平均・標準偏差更新関数に従って、この時系列パターン発生モデルのパラメータを学習(更新)する。
【数3】
【0081】
(式3)に示す通り、モデル再学習部406は、形状の学習を行わず、長さの平均と標準偏差、及び、高さの平均と標準偏差のみを更新する。モデル再学習部406は、更新後の時系列パターン発生モデル409を用いて、図示しないバッファ内の対応する時系列パターン発生モデル409を置き換える。一方、モデル再学習部406は、継続指示データ412をセグメント取出継続評価部401に送出して、セグメント取出継続評価部401に処理を移行する。
【0082】
以下、本モデル群生成部306による処理動作について、セグメント長が1の生成時系列パターン307(図7(a)参照)を生成する場合を例に説明する。
【0083】
まず、図4に示すように、セグメント取出継続評価部401は、セグメントデータ305(歩行時のもの)内に取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403は存在すると判断し、1セグメント取出部402に処理を移行する。
【0084】
1セグメント取出部402は、セグメントデータ305から1セグメントデータ403(図6における形状y1の区間参照)を取り出し、モデル尤度計算部404に送出する。
【0085】
モデル尤度計算部404は、時系列パターン発生モデル409が図示しないバッファ内にまだ存在しないので(尤度比Rを算出するためには少なくとも2つの時系列パターン発生モデルが必要)、尤度を算出することなく、受け取った1セグメントデータ403をそのまま尤度評価部405に送出する。
【0086】
尤度評価部405も、受け取った1セグメントデータ403をそのまま新規モデル作成部407に送出する。
【0087】
新規モデル作成部407は、受け取った1セグメントデータ403を用いて、形状データと、長さ及び高さと、長さおよび高さの平均及び標準偏差とを第1の時系列パターン発生モデル409として生成し、図示しないバッファ内に記憶する。また、新規モデル作成部407は、セグメント取出継続評価部401に継続指示データ412を送出する。
【0088】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0089】
1セグメント取出部402は、セグメントデータ305から次の1セグメントデータ403(図6における形状y2の区間参照)を取り出して、モデル尤度計算部404に送出する。
【0090】
モデル尤度計算部404は、上述同様、1セグメントデータ403をそのまま尤度評価部405に送出する。
【0091】
尤度評価部405も、受け取った1セグメントデータ403をそのまま新規モデル作成部407に送出する。
【0092】
新規モデル作成部407は、上述と同様にして、受け取った1セグメント403を用いて、第2の時系列パターン発生モデル409を生成して、図示しないバッファ内に記憶するとともに、セグメント取出継続評価部401に継続指示データ412を送出する。
【0093】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータが存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0094】
1セグメント取出部402は、セグメントデータ305内からさらに次の1セグメントデータ403(図6における形状y3の区間参照)を取り出して、モデル尤度計算部404に送出する。
【0095】
モデル尤度算出部404は、上述した図示しないバッファ内における第1の時系列パターン発生モデル409と、1セグメントデータとを尤度関数(式1)に入力して第1の時系列パターン発生モデル409に対する尤度を求める。また、モデル尤度算出部404は、上述した第2の時系列パターン発生モデル409と1セグメントデータとを尤度関数(式1)に入力して第2の時系列パターン発生モデル409に対する尤度を求める。モデル尤度算出部404は、算出した第1及び第2の時系列パターン発生モデル409に対する尤度(尤度データ408)と、1セグメント取出部402から受け取った1セグメントデータ403とを、尤度評価部405に送出する。
【0096】
尤度評価部405は、(式2)に従って、尤度データ408を用いて、尤度比Rを算出し、算出した尤度比Rを、入力された類似度パラメータ106と比較する。尤度評価部405は、ここでは、尤度比Rは類似度パラメータ106以下であると判断し(第1及び第2の時系列パターン発生モデル409のいずれにも類似していないと判断し)、1セグメントデータ403を新規モデル作成部407に送出する。
【0097】
新規モデル作成部407は、上述と同様にして、受け取った1セグメントデータ403を用いて、第3の時系列モデル発生モデル409を生成して図示しないバッファ内に記憶するとともに、セグメント取出継続評価部401に継続指示データ412を送出する。
【0098】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0099】
1セグメント取出部402は、セグメントデータ305内からさらに次の1セグメントデータ403(図6における形状y4の区間参照)を取り出し、モデル尤度計算部404に送出する。
【0100】
モデル尤度算出部404は、上述と同様に、第1、第2および第3の時系列パターン発生モデルに対する1セグメントデータ403の尤度を、尤度関数(式1)を用いて算出する。モデル尤度算出部404は、算出した3つの尤度のうち1番目及び2番目に大きいもの(尤度データ408)と、1セグメント取出部402から受け取った1セグメントデータ403とを、尤度評価部405に送出する。
【0101】
尤度評価部405は、受け取った尤度データ408を用いて、(式2)に従って、尤度比Rを算出する。尤度評価部405は、算出した尤度比Rと類似度パラメータ106とを比較する。尤度評価部405は、ここでは尤度比Rは類似度パラメータ106より大きいと判断する。尤度評価部405は、最大尤度を持つ時系列パターン発生モデル(ここでは第1の時系列パターン発生モデルとする)と1セグメントデータ403とは類似していると判断する。従って、尤度評価部405は、1セグメントデータ403と類似情報410とをモデル再学習部406に送出する。
【0102】
モデル再学習部406は、類似情報410に基づいて第1の時系列パターン発生モデル409を特定し、この第1の時系列パターン発生モデル409と1セグメントデータ403とを用いて、上述の(式3)に従って、第1の時系列パターン発生モデル409のパラメータを学習(更新)する。上述したように、形状の学習は行わず、長さと高さの平均及び標準偏差のみを更新する。パラメータを更新したモデル再学習部406は、セグメント取出継続評価部401に継続指示データ412を送出する。
【0103】
以上に説明した処理を、セグメントデータ305内の残りの他の1セグメントデータ403(図6における形状y5の区間参照)および走行時における各1セグメントデータ403(図6における形状y6〜y10の区間参照)についても行い、最終的に、パターン長が1である5つの時系列パターン発生モデル409(図7(a)参照)が取得される(図示しないバッファ内に格納される)。そして、セグメント取出継続評価部401は、セグメントデータ305内に取り出すべき1セグメントデータが存在しないと判断したら、上で取得された5つの時系列パターン発生モデル409をそれぞれ時系列パターンとして確定し、これらを生成時系列パターン307として出力する(図7(a)参照)。上述から分かるように、生成時系列パターン307を構成する各時系列パターンは、新規に時系列パターン発生モデルを生成する元となった1セグメントデータの長さ、高さ、形状と、上述した、長さ及び高さの平均及び標準偏差とを有する。なお、図7、図8、図9、図11及び図12に示される各時系列パターンに付された長さl、高さΔh及び形状yは、ここでは、この1セグメントデータの長さ、高さ、形状とする。
【0104】
以上では、パターン長が1の場合におけるモデル群生成部306の処理動作について説明したが、パターン長が2,3・・・の場合も同様にして行われる。
【0105】
次に、図1に示すように、時系列パターン評価部105について説明する。
【0106】
図2は、時系列パターン評価部105の構成を詳細に示す図である。
【0107】
上述したように、時系列パターン評価部105は、出力時系列パターン104が所望の基準を満たすか否かを判断し、満たす場合は、後述するようにして最終時系列パターン107を出力し、一方、満たさない場合は、類似度パラメータ106を補正する。
【0108】
図2に示すように、この時系列パターン評価部105は、出現確率計算部201、時系列パターン評価値計算部203、時系列パターン評価値評価部205および類似度パラメータ補正部206を備える。
【0109】
出現確率計算部201は、出力時系列パターン104を構成する各時系列パターン(図9参照)が、各時系列の状態(例えば歩行および走行)において出現する頻度(出現頻度)をそれぞれ調べる。そして、出現確率計算部201は、調べた結果を元に、各時系列パターンが、各状態において出現する確率(出現確率)を計算し、算出結果を出現確率202として時系列パターン評価値計算部203に送出する。
【0110】
図10は、図9の各時系列パターン1〜5,12,45(出力時系列パターン104)について算出した各状態における出現頻度(歩行時頻度及び走行時頻度)、各状態における出現確率202(歩行時確率及び走行時確率)及び時系列パターン評価値204(時系列パターン個別評価値の集合)を示した図表である。
【0111】
図10に示すように、各時系列パターン1〜5、12、45(図9参照)が、歩行時及び走行時のどちらに頻繁に現れるのかが分かる。例えば、時系列パターン1は、歩行時頻度が2、走行時頻度が0で、従って、歩行時確率は1、走行時確率は0である。
【0112】
時系列パターン評価値計算部203は、出現確率計算部201から受け取った出現確率202を用いて、各時系列パターンを評価するための時系列パターン個別評価値をそれぞれ算出し、算出した時系列パターン個別評価値を時系列パターン評価値204として時系列パターン評価値評価部205に送出する。ここで、時系列パターン個別評価値は、各時系列パターンの各状態への偏り具合状況を数値化して表したものである。
【0113】
図10に示す各時系列パターン個別評価値は、各時系列パターンの平均情報量(エントロピ)を元に算出したものである。この評価では、各時系列パターンは、平均情報量の値が低いほど各状態に偏った良い時系列パターンとなる。例えば、時系列パターン個別評価値が0のパターン1,2,4,5,12,45は、歩行時および走行時のいずれかにのみ出現する好ましい時系列パターンといえる。これに対し、時系列パターン個別評価値が0.150515のパターン3は、歩行時および走行時にそれぞれ同等の確率で出現しており、好ましくない時系列パターンであるといえる。
【0114】
時系列パターン評価値評価部205は、時系列パターン評価値計算部203から受け取った時系列パターン評価値204と入力された出力時系列パターン104とを用いて、出力時系列パターン104の評価を行う。
【0115】
より詳しくは、時系列パターン評価値評価部205は、時系列パターン評価値204を用いて出力時系列パターン104全体が所望の基準を満たすか否か評価するための時系列パターン全体評価値を算出する。
【0116】
時系列パターン評価値評価部205は、算出した時系列パターン全体評価値が所定の基準内にあれば、時系列パターン個別評価値が所定の基準外にある時系列パターンを除去したものを最終時系列パターン107として出力する。
【0117】
一方、時系列パターン評価値評価部205は、算出した時系列パターン全体評価値が所定の基準外ならば、時系列パターン評価値204を類似度パラメータ補正部206へ送出する。
【0118】
以下、出力時系列パターン104の評価について具体的に説明する。
【0119】
まず、図9〜図11を用いて、時系列パターン全体評価値が所定の基準内になる場合について説明する。
【0120】
時系列パターン評価値評価部205は、まず、時系列パターン評価値204の平均を算出し、これを時系列パターン全体評価値とする。時系列パターン評価値評価部205は、算出した時系列パターン全体評価値と、ユーザ等により設定された全体設定許容値0.11(ユーザにとって納得のいく出力時系列パターン104の水準を示し、好適には例えば0.15以下とする)とを比較する。つまり、時系列パターン評価値評価部205は、図10の時系列パターン評価値204の平均値0.022(=0.150515/7)と、全体設定許容値0.11とを比較する。平均値0.022は、全体設定許容値0.11よりも小さいので、時系列パターン評価値評価部205は、時系列パターン全体評価値は所定の基準内にあると判断する。時系列パターン評価値評価部205は、出力時系列パターン104を構成する各時系列パターン(図9参照)のうち、個別設定許容値(ユーザにとって納得のいく、各時系列パターンを評価する水準であり、ここでは全体設定許容値と同じ値0.11を有する)よりも高い時系列パターン個別評価値を有する時系列パターン(図10参照)が存在するか否かを判断する。そして、時系列パターン評価値評価部205は、そのような時系列パターンが存在すると判断した場合は、図9と図11とを比較して分かるように、その時系列パターン(図10の時系列パターン3)を出力時系列パターン104から除去する。そして、時系列パターン評価値評価部205は、除去後の出力時系列パターン104(図11参照)を最終時系列パターン107として出力する(図2参照)。
【0121】
上述では、全体設定許容値及び個別設定許容値としてそれぞれ同じ値を用いたが、それぞれ異なる値を設定してもよい。
【0122】
次に、図12および図13を用いて、時系列パターン評価値204から算出された時系列パターン全体評価値が所定の基準外になる場合について説明する。
【0123】
図12は、上述とは異なる値(上述よりも緩い値)を有する類似度パラメータ106によって時系列パターン生成部103(図1参照)において生成された出力時系列パターン104例を示す図である。この出力時系列パターン104は、上述と同様に、図5の時系列データ102から生成されたものである。
【0124】
図12に示すように、図9では異なる時系列パターンとして認識されていた時系列パターン12,45(図9参照)が、ここでは同一の時系列パターン12として認識されている。同様に、図9では異なる時系列パターンとして認識されていた時系列パターン1,4が、ここでは同一のパターン1として、また、図9では異なる時系列パターンとして認識されていた時系列パターン2,5が、ここでは、同一の時系列パターン2として認識されている。
【0125】
図13は、図12の各時系列パターンに対して上述と同様にして算出した各状態における出現頻度、各状態における出現確率202及び時系列パターン評価値204を示した図表である。
【0126】
ここで、出力時系列パターン104(図12参照)の評価について説明すると以下の通りである。
【0127】
上述と同様に、まず、時系列パターン評価値評価部205(図2参照)は、時系列パターン評価値204の平均(時系列パターン全体評価値)と、全体設定許容値0.11(所定の基準)とを比較する。時系列パターン評価値204の平均(時系列パターン全体評価値)は、図13から分かるように、0.150515であり、全体設定許容値0.11よりも大きい。従って、時系列パターン評価値評価部205は、時系列パターン全体評価値は所定の基準外にあると判断する。つまり、時系列パターン評価値評価部205は、図12の出力時系列パターン104は、目的を満たしていないと判断し、図2に示すように、時系列パターン評価値204を類似度パラメータ補正部206に送出する。
【0128】
類似度パラメータ補正部206は、時系列パターン評価値評価部205から受け取った時系列パターン評価値204を用いて類似度パラメータ206値を補正する(より厳しいものにする)。補正の例としては、時系列パターン評価値204の平均の前回との差分(初期値は例えば0とする)と、類似度パラメータ106の前回との差分(初期値は0とする)との比を定数倍し、今回の類似度パラメータ106からこれを減ずるなどがある。
【0129】
類似度パラメータ補正部206は、以上のようにして算出した補正後の類似度パラメータ106を、図1に示すように、時系列パターン生成部103に送出する。
【0130】
以上に説明したように、本実施の形態によれば、時系列データから、類似度パラメータで示される程度に相互に類似しない時系列パターンを、形状が複雑なものも含めて、パターン長を固定することなく、生成することができる。
【0131】
また、時系列データに加えて、時系列の状態も用いるようにしたので、各状態について、できるだけ他の状態には出現しない時系列パターンを生成することが可能となる。
【0132】
また、目的の基準に沿った時系列パターンが得られるまで、類似度パラメータを何度でも補正して、最終的に、時系列の状態全てに対して固有の時系列パターンを得ることができる。この際、効率よく類似パラメータを補正することで、より早く目的の基準に沿った時系列パターンを生成することが可能になる。
【0133】
また、生成された時系列パターンの各状態における出現確率を算出するようにしたので、時系列パターン個別評価値として、例えば平均情報量を用いることが可能となる。
【0134】
また、出現頻度が低い時系列パターンについては削除するようにしたので有効な時系列パターンの生成が可能となる。
【0135】
また、削除後残存時系列パターン内の各時系列パターンに対応する時系列データを含むように、パターン長増加後におけるセグメントデータの切出しを行うようにしたので、あまり重要でないセグメントデータの切出しを無視して、効率のよいセグメントデータの切出しが可能になる。
【0136】
また、セグメント情報(長さ及び高さ)のみではなく、正規化した形状をも用いて、時系列パターン発生モデルに対する尤度を計算するようにしたので、セグメントデータの形状が複雑な形状を保持していても、適正な類否判別が可能となる。つまり、セグメントデータが複雑な形状を保持していても、相互に類似しない時系列パターンを、長さと高さの曖昧さを吸収して、時系列データから効率よく生成することができる。
【0137】
また、得られた時系列パターンが目的に合うかどうかを評価し、目的に沿わない時系列パターンは除去するようにしたので、目的に沿った時系列パターンのみを確実に抽出することができる。
【0138】
また、各時系列の状態に偏った時系列パターンを抽出できるので、時系列パターンによるクラス分類も行うことができる。
【0139】
また、時系列パターン全体評価値(時系列パターン個別評価値の平均)と全体設定許容値(所定の基準)とを比較して出力時系列パターンを評価するようにしたので、ユーザにとって理解しやすい閾値設定を行うことが可能になる。
【0140】
また、各状態における時系列パターンの出現確率や、時系列パターン全体評価値、時系列パターン個別評価値等を画面上等に表示することで、ユーザが時系列パターンを自ら選択することもできる。
【0141】
【発明の効果】
本発明により、各状態に対して他の状態と区別することができる固有の時系列パターンを各状態から得られた時系列データに基づき自動的に生成できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に関わる時系列パターン生成装置の構成例を示す図。
【図2】時系列パターン生成装置における時系列パターン評価値評価部の構成例を示す図。
【図3】時系列パターン生成装置における時系列パターン生成部の構成例を示す図。
【図4】時系列パターン生成部におけるモデル群生成部の構成例を示す図。
【図5】状態データおよび時系列データを説明するための図。
【図6】セグメント情報、セグメントデータおよび1セグメントデータを説明するための図。
【図7】生成時系列パターンの例を示す図。
【図8】削除後残存時系列パターンの例(パターン長が2の場合)を示す図。
【図9】出力時系列パターンの例を示す図。
【図10】出現頻度、出現確率および時系列パターン個別評価値の例を示す図表。
【図11】最終時系列パターンの例を示す図。
【図12】途中段階での出力時系列パターンの例を示す図。
【図13】途中段階での出現確率および時系列パターン個別評価値の例を示す図表。
【符号の説明】
101 状態データ
102 時系列データ
103 時系列パターン生成部
104 出力時系列パターン
105 時系列パターン評価部
106 類似度パラメータ
107 最終時系列パターン
201 出現確率計算部
202 出現確率
203 時系列パターン評価値計算部
204 時系列パターン評価値
205 時系列パターン評価値評価部
206 類似度パラメータ補正部
301 セグメント化部
302 セメント情報
303 セグメント切出し部
305 セグメントデータ
306 モデル群生成部
307 生成時系列パターン
308 時系列パターン削除部
309 削除後残存時系列パターン
311 継続評価部
312 継続処理部
401 セグメント取出継続評価部
402 1セグメント取り出し部
403 1セグメントデータ
404 モデル尤度計算部
405 尤度評価部
406 モデル再学習部
407 新規モデル作成部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a time-series pattern generation apparatus and a time-series pattern generation method for generating a time-series pattern specific to each state from time-series data corresponding to a plurality of states to be observed, and time series data that are not similar to each other. The present invention relates to a time series pattern generation method for generating a series pattern.
[0002]
[Prior art]
With the improvement of sensing technology and processor technology, sensors have become familiar with the reduction in cost. For example, it has become possible to attach a sensor to the foot and acquire the operation as time-series data.
[0003]
Therefore, it is becoming possible to attach a sensor to a person to acquire time series data, and to generate a characteristic time series pattern that appears when the person performs some action from the acquired time series data. Yes. In addition, in order to identify what kind of action the person is doing, the time series data obtained from each action (time series state) is used to generate a time series pattern specific to each action. Has also become required.
[0004]
However, in general, the time series pattern to be acquired often has a huge amount, and there is a problem that it takes a lot of labor to search for the time series pattern by hand.
[0005]
Also, there is no known method for generating a time series pattern specific to each operation using the above-described latter, that is, time series data obtained from each state.
[0006]
On the other hand, with respect to the former, that is, to generate a time-series pattern characteristic of this state using time-series data obtained from a certain state, as a method for realizing this, for example, time-series clustering and rule analysis (Non-Patent Document 2) is extended in time series.
[0007]
However, in any case, it is necessary to divide the time series data into segments (segmentation) according to an appropriate standard for processing, but in the former time series clustering, the number of segments (number of segments), that is, the pattern length is constant. There is a drawback that it is necessary to be (fixed).
[0008]
On the other hand, the latter rule analysis has the advantage that the pattern length is automatically determined and the time series pattern can be generated efficiently. However, when generating a time series pattern with a long pattern length, the time series with a short pattern length is used. A long time series pattern is expressed by combining patterns. For this reason, there exists a fault which each time series pattern tends to be averaged. This is because a short time-series pattern is simple in shape, and thus there are many approximate time-series patterns in many cases. Therefore, this method has a drawback that it cannot handle time-series patterns having a complicated shape when the pattern length becomes long.
[0009]
By the way, when generating a time series pattern, it is preferable that a lot of similar time series patterns are not generated. Therefore, it is necessary to determine similarity of the extracted time series data. In the similarity determination, there is a request that it is the same if the shape is similar even if the length and height are different (to absorb the ambiguity of the length and height). There was a drawback that only the length ambiguity could be absorbed. On the other hand, there is a method using a time series pattern generation model (Non-patent Document 1) as a method that can absorb both ambiguity in length and height, but this method regards a straight line without retaining the shape of the time series. For this reason, there is a disadvantage that complicated shapes cannot be distinguished from each other.
[0010]
[Patent Document 1]
JP 11-326542 A
[Patent Document 2]
JP-A-9-34719
[Non-Patent Document 1]
Xianping Ge and Padhric Smith, Deformable Markov Model Templates for Time-Series Pattern Matching, ACM SIGKDD (KDD-2000), pp. 81-90, 2000
[Non-Patent Document 2]
Rakesh Agrawal, Tomasz Imielinski, Arun N .; Swami, Mining Association Rules between Sets of Items in Large Databases, SIGMOD Conference 1993, pp. 207-216, 1993
[0011]
[Problems to be solved by the invention]
As described above, conventionally, there has been a problem in that a time series pattern that can be distinguished from other time series states cannot be automatically generated for each time series state. In addition, when the pattern length is increased, there is a problem that a complicated shape cannot be handled. Furthermore, there is a problem that it is impossible to determine the similarity of a complicated shape that absorbs the ambiguity of length and height.
[0012]
The present invention has been made in consideration of the above-described circumstances, and each time-series state can be distinguished from other time-series states, and a time-series pattern unique to each time-series state is automatically generated. An object of the present invention is to provide a time-series pattern generation device and a time-series pattern generation method that can be generated easily. It is another object of the present invention to provide a time-series pattern generation method that can handle a complicated shape even when the pattern length increases. Furthermore, an object of the present invention is to provide a time-series pattern generation method that makes it possible to determine the similarity of complex shapes, thereby taking into account complex shapes in addition to length and height.
[0013]
[Means for Solving the Problems]
The time-series pattern generation device of the present invention is a time-series pattern generation device that generates a time-series pattern specific to each state using time-series data corresponding to a plurality of states to be observed, the plurality of time-series patterns A plurality of partial data groups having the same similarity from the plurality of partial data are extracted using a similarity determination criterion for cutting out a plurality of partial data from the series data and determining the similarity between the partial data. A time series pattern generation unit that extracts and generates a time series pattern corresponding to each of the plurality of partial data groups, and whether the time series pattern generated by the time series pattern generation unit conforms to a predetermined standard If within the predetermined criteria, the relationship between each of the time series patterns and the frequency of appearance of each of the time series patterns in each time series data The time series pattern is specified as one of the states based on the output time, and the specified time series pattern is output as a final time series pattern. And the corrected similarity determination criterion is output to the time-series pattern generation unit in order to cause the time-series pattern generation unit to generate the time-series pattern again using the corrected similarity determination criterion. And a time-series pattern evaluation unit.
[0014]
The time-series pattern generation method of the present invention is a time-series pattern generation method for generating a time-series pattern specific to each state using time-series data corresponding to a plurality of states to be observed. A plurality of partial data groups having the same similarity from the plurality of partial data are extracted using a similarity determination criterion for cutting out a plurality of partial data from the series data and determining the similarity between the partial data. A time series pattern generation step for extracting and generating a time series pattern corresponding to each of the plurality of partial data groups, and whether or not the time series pattern generated by the time series pattern generation step conforms to a predetermined standard Each time series pattern and each time series pattern occurrence in each time series data if within the predetermined criteria Based on the relationship with the degree, the time series pattern is specified as any of the states, and the specified time series pattern is output as a final time series pattern. A time series pattern evaluation step of correcting the similarity determination criterion and performing the time series pattern generation step again according to the corrected similarity determination criterion.
[0015]
The time-series pattern generation method of the present invention is a time-series pattern generation method for generating time-series patterns that are not similar to each other from time-series data, and the time-series data is divided into several segments based on a certain reference, and a specific segment From the plurality of partial data, using a partial data cutting step for cutting out each of the partial data from each of the time series data in a long unit and a similarity determination criterion for determining the similarity between the partial data The time series pattern corresponding to each of the plurality of partial data groups in a state in which a plurality of partial data groups having the same similarity relation are extracted and the number of partial data included in the partial data group is included as an appearance frequency From a model group generation step for generating the model group and the time series pattern generated by the model group generation step. A time-series pattern deletion step of deleting the time-series pattern having the appearance frequency equal to or lower than a threshold value, and evaluating the number of the time-series patterns remaining after the deletion to determine whether to continue or not. The time-series pattern remaining after deletion is stored, and the segment length is changed to perform the steps and the main step. On the other hand, in the case of non-continuation, the time-series pattern for each stored segment length is output. And a continuous evaluation step.
[0016]
The time series pattern generation method of the present invention is a time series pattern generation method for generating time series patterns that are not similar to each other using a plurality of partial data cut out from the time series data, and generates the time series pattern. A new model creation step for creating a time series pattern generation model to be a model, and a model relearning step for correcting the time series pattern generation model, and the likelihood of each of the partial data for the time series pattern generation model, Model likelihood calculation step for calculating from the viewpoint of the length and height of the partial data, and the shape excluding the influence of the length and the height by normalization, and calculation for each time series pattern generation model A similarity discriminator for discriminating between the likelihood and the similarity between the partial data and the time series pattern generation model A likelihood evaluation step for evaluating whether or not the time-series pattern generation model similar to the partial data exists using the similarity parameter as If not, perform the new model creation step to create the time series pattern generation model, and if there is a similar time series pattern generation model, the time series pattern generation model having the highest likelihood is A likelihood evaluation step for performing correction by performing the model relearning step, and determining whether or not to repeat the model likelihood calculation step and the likelihood evaluation step for the other partial data. The model likelihood calculation step and the likelihood evaluation step are performed on the other partial data and are not repeated. When determining is characterized by comprising a further processing step of each said time series pattern generation model of the final state is determined as each of said time-series pattern.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
First, features of the present embodiment will be briefly described.
[0018]
FIG. 5 is a diagram showing time-
[0019]
In the figure, state data (label) 101 including a walking label and a traveling label is shown. The
[0020]
In the present embodiment, a time series pattern specific to each state is generated using such time series data of each state (eg, walking, running).
[0021]
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0022]
FIG. 1 is a diagram illustrating a configuration example of a time-series pattern generation apparatus according to an embodiment of the present invention.
[0023]
As illustrated in FIG. 1, the time-series pattern generation device includes a time-series
[0024]
The time-series
[0025]
FIG. 9 to be described later is a diagram showing an example of a time series pattern generated from the
[0026]
The time series
[0027]
More specifically, first, the time series
[0028]
Next, the time-series
[0029]
On the other hand, when the time series
[0030]
The final
[0031]
Next, the time series
[0032]
First, the time series
[0033]
FIG. 3 is a diagram showing in detail the configuration of the time series
[0034]
As described above, the time series
[0035]
As shown in FIG. 3, the time series
[0036]
The
[0037]
FIG. 6 is a diagram showing a state in which time-series data (see FIG. 5) during walking and running are segmented.
[0038]
In FIG. 6, the
[0039]
As shown in FIG. 3, the
[0040]
The model
[0041]
FIGS. 7A and 7B are diagrams showing an example of a generated
[0042]
More specifically, FIG. 7A is a diagram illustrating an example of a generated
[0043]
On the other hand, FIG. 7B is a diagram showing an example of a generation time series pattern when the pattern length is 2. As shown in the figure, when the pattern length is 2, six time-
[0044]
As shown in FIG. 3, the time series pattern deletion unit 308 deletes time series patterns whose appearance frequency is equal to or less than the deletion threshold among the time series patterns in the generated
[0045]
FIG. 8 is a diagram illustrating an example of a post-deletion remaining
[0046]
As can be seen by comparing FIG. 7B and FIG. 8,
[0047]
The
[0048]
That is, the
[0049]
On the other hand, if the
[0050]
FIG. 9 briefly described above is a diagram showing an example of an output
[0051]
Hereinafter, the processing operation by the above-described time series
[0052]
First, as shown in FIG. 3, the segmenting
[0053]
The
[0054]
The model
[0055]
The time-series pattern deletion unit 308 deletes the time-series pattern having an appearance frequency of 1 or less from the received generated time-
[0056]
The
[0057]
The
[0058]
Using the received
[0059]
The time series pattern deletion unit 308 deletes the time series pattern having an appearance frequency of 1 or less from the received generated time series pattern 307 (see the lower part of FIG. 9), and continues the
[0060]
The
[0061]
The
[0062]
Using the received
[0063]
The time-series pattern deleting unit 308 deletes the time-series pattern having an appearance frequency of 1 or less from the received generated time-
[0064]
The
[0065]
Here, the model group generation unit 306 (see FIG. 3) constituting the time series
[0066]
FIG. 4 is a diagram illustrating a detailed configuration example of the model
[0067]
As described above, the model
[0068]
As shown in FIG. 4, the model
[0069]
The segment extraction
[0070]
On the other hand, when the segment extraction
[0071]
The one
[0072]
The model
[Expression 1]
Are used to calculate the likelihood (fitness) of the one
[0073]
Here, in (Equation 1), li, Δhi, Yi(T), μli, ΜΔhi, ΣliAnd σΔhiAre parameters of the time-series
[0074]
As shown in (Expression 1), this likelihood function obtains the degree of fit between the one-
[0075]
The model
[0076]
The
[Expression 2]
The likelihood ratio R calculated by is calculated.
[0077]
The
[0078]
The new
[0079]
On the other hand, the
[0080]
The
[Equation 3]
[0081]
As shown in (Expression 3), the
[0082]
Hereinafter, the processing operation by the model
[0083]
First, as shown in FIG. 4, the segment extraction
[0084]
The 1-
[0085]
Since the model
[0086]
The
[0087]
The new
[0088]
The segment extraction
[0089]
The 1-
[0090]
The model
[0091]
The
[0092]
The new
[0093]
The segment extraction
[0094]
The 1-
[0095]
The model
[0096]
The
[0097]
The new
[0098]
The segment extraction
[0099]
The 1-
[0100]
The model
[0101]
The
[0102]
The
[0103]
The processing described above is performed by using the remaining one
[0104]
The processing operation of the model
[0105]
Next, as shown in FIG. 1, the time series
[0106]
FIG. 2 is a diagram showing in detail the configuration of the time series
[0107]
As described above, the time series
[0108]
As illustrated in FIG. 2, the time series
[0109]
The appearance
[0110]
FIG. 10 shows the appearance frequency (walking frequency and running frequency) in each state calculated for each
[0111]
As shown in FIG. 10, it can be seen whether each time-series pattern 1-5, 12, 45 (see FIG. 9) appears frequently during walking or running. For example, the
[0112]
The time series pattern evaluation
[0113]
Each time series pattern individual evaluation value shown in FIG. 10 is calculated based on the average information amount (entropy) of each time series pattern. In this evaluation, each time series pattern becomes a good time series pattern that is biased to each state as the value of the average information amount is lower. For example, the
[0114]
The time series pattern evaluation
[0115]
More specifically, the time series pattern evaluation
[0116]
The time series pattern evaluation
[0117]
On the other hand, the time series pattern evaluation
[0118]
Hereinafter, the evaluation of the output
[0119]
First, the case where the entire time series pattern evaluation value falls within a predetermined standard will be described with reference to FIGS.
[0120]
First, the time-series pattern evaluation
[0121]
In the above description, the same value is used as the overall setting allowable value and the individual setting allowable value, but different values may be set.
[0122]
Next, a case where the time series pattern overall evaluation value calculated from the time series
[0123]
FIG. 12 is a diagram illustrating an example of the output
[0124]
As shown in FIG. 12, the
[0125]
FIG. 13 is a chart showing the appearance frequency in each state, the
[0126]
Here, the evaluation of the output time series pattern 104 (see FIG. 12) will be described as follows.
[0127]
Similarly to the above, first, the time series pattern evaluation value evaluation unit 205 (see FIG. 2) calculates the average of the time series pattern evaluation values 204 (time series pattern overall evaluation value) and the overall setting allowable value 0.11 (predetermined value). The standard). As can be seen from FIG. 13, the average of the time series pattern evaluation values 204 (time series pattern overall evaluation value) is 0.150515, which is larger than the overall setting allowable value 0.11. Therefore, the time-series pattern evaluation
[0128]
The similarity
[0129]
The similarity
[0130]
As described above, according to the present embodiment, the time length of the time series patterns that are not similar to each other as much as indicated by the similarity parameter is fixed from the time series data, including those having complicated shapes. Can be generated without.
[0131]
In addition to the time-series data, the time-series state is also used, so that it is possible to generate a time-series pattern that does not appear in other states as much as possible.
[0132]
Further, the similarity parameter can be corrected any number of times until a time series pattern that meets the target standard is obtained, and finally, a unique time series pattern can be obtained for all the time series states. At this time, it is possible to generate a time series pattern according to a target criterion earlier by efficiently correcting the similar parameters.
[0133]
Moreover, since the appearance probability in each state of the generated time series pattern is calculated, for example, an average information amount can be used as the time series pattern individual evaluation value.
[0134]
Further, since a time series pattern with a low appearance frequency is deleted, an effective time series pattern can be generated.
[0135]
In addition, segment data is extracted after the pattern length has been increased so that time series data corresponding to each time series pattern in the remaining time series pattern after deletion is included, so segmentation of less important segment data is ignored. Thus, efficient segment data can be extracted.
[0136]
In addition, not only segment information (length and height) but also the normalized shape is used to calculate the likelihood for the time-series pattern generation model, so the shape of the segment data retains a complex shape Even if this is done, it is possible to determine the appropriate similarity. That is, even if the segment data has a complicated shape, time series patterns that are not similar to each other can be efficiently generated from the time series data by absorbing the ambiguity of length and height.
[0137]
In addition, it is evaluated whether or not the obtained time series pattern meets the purpose, and the time series pattern that does not meet the purpose is removed, so that only the time series pattern that meets the purpose can be reliably extracted.
[0138]
Further, since a time series pattern biased to each time series state can be extracted, class classification based on the time series pattern can also be performed.
[0139]
In addition, since the time series pattern overall evaluation value (average of time series pattern individual evaluation values) is compared with the overall set allowable value (predetermined standard), the output time series pattern is evaluated, which is easy for the user to understand. It is possible to set a threshold value.
[0140]
In addition, by displaying the appearance probability of the time series pattern in each state, the entire time series pattern evaluation value, the time series pattern individual evaluation value, and the like on the screen or the like, the user can select the time series pattern himself.
[0141]
【The invention's effect】
According to the present invention, a unique time series pattern that can be distinguished from other states for each state can be automatically generated based on time series data obtained from each state.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration example of a time-series pattern generation apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating a configuration example of a time series pattern evaluation value evaluation unit in the time series pattern generation device.
FIG. 3 is a diagram illustrating a configuration example of a time series pattern generation unit in the time series pattern generation apparatus.
FIG. 4 is a diagram illustrating a configuration example of a model group generation unit in a time series pattern generation unit.
FIG. 5 is a diagram for explaining state data and time-series data.
FIG. 6 is a diagram for explaining segment information, segment data, and one-segment data.
FIG. 7 is a diagram showing an example of a generated time series pattern.
FIG. 8 is a diagram showing an example of a time series pattern remaining after deletion (when the pattern length is 2);
FIG. 9 is a diagram showing an example of an output time series pattern.
FIG. 10 is a chart showing an example of appearance frequency, appearance probability, and time-series pattern individual evaluation value.
FIG. 11 is a diagram showing an example of a final time series pattern.
FIG. 12 is a diagram showing an example of an output time-series pattern at an intermediate stage.
FIG. 13 is a chart showing an example of an appearance probability and a time-series pattern individual evaluation value at an intermediate stage.
[Explanation of symbols]
101 Status data
102 Time series data
103 Time-series pattern generator
104 Output time series pattern
105 Time-series pattern evaluation unit
106 Similarity parameter
107 Final time series pattern
201 Appearance probability calculator
202 Appearance probability
203 Time series pattern evaluation value calculator
204 Time series pattern evaluation value
205 Time-series pattern evaluation value evaluation unit
206 Similarity parameter correction unit
301 Segmentation part
302 Cement information
303 Segment cutout
305 segment data
306 Model group generator
307 Generation time series pattern
308 Time series pattern deletion part
309 Time series pattern remaining after deletion
311 Continuous Evaluation Department
312 Continuation processing section
401 Segment extraction continuation evaluation department
402 1 segment take-out part
403 1 segment data
404 Model likelihood calculator
405 Likelihood evaluation unit
406 Model re-learning section
407 New model creation department
Claims (25)
複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成部と、
前記時系列パターン生成部によって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準を用いて前記時系列パターン生成部に再度、前記時系列パターンを生成させるために、補正した前記類似度判別基準を前記時系列パターン生成部に出力する時系列パターン評価部と、
を備えたことを特徴とする時系列パターン生成装置。A time series pattern generation device that generates time series patterns specific to each state using time series data corresponding to a plurality of states to be observed,
A plurality of pieces of partial data are cut out from the plurality of pieces of time series data, and a plurality of pieces of partial data having the same similarity are used from the plurality of pieces of partial data by using a similarity determination criterion for determining the degree of similarity between the pieces of partial data. Extracting a partial data group and generating a time series pattern corresponding to each of the plurality of partial data groups; and
Evaluate whether or not the time series pattern generated by the time series pattern generation unit conforms to a predetermined standard, and if within the predetermined standard, each of the time series pattern and each of the time series pattern Based on the relationship with the appearance frequency in each of the time-series data, the time-series pattern is identified as one of the states, and the identified time-series pattern is output as a final time-series pattern, If it is not a predetermined criterion, the similarity determination criterion is corrected, and the time series pattern generation unit is corrected to generate the time series pattern again using the corrected similarity determination criterion. A time series pattern evaluation unit that outputs a similarity determination criterion to the time series pattern generation unit;
A time-series pattern generation device comprising:
各前記時系列パターンが各前記時系列データにおいてそれぞれ出現する確率を算出する出現確率計算部と、
算出された出現確率に基づき前記時系列パターンの全体を評価するための時系列パターン全体評価値を算出する時系列パターン評価値計算部と、
算出された前記時系列パターン全体評価値を全体設定許容値と比較し、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターンの前記出現確率が最も高い前記状態に各前記時系列パターンを特定する時系列パターン評価値評価部と、
算出された前記時系列パターン全体評価値が、前記全体設定許容値による基準外の場合には、前記時系列パターン全体評価値を用いて前記類似度判別基準を補正し、前記時系列パターン生成部に再度、補正後の前記類似度判別基準を用いて前記時系列パターンを生成させる類似度判別基準補正部と、
を備えることを特徴とする請求項1に記載の時系列パターン生成装置。The time-series pattern evaluation unit
An appearance probability calculating unit for calculating a probability that each time series pattern appears in each time series data;
A time-series pattern evaluation value calculation unit that calculates a time-series pattern overall evaluation value for evaluating the entire time-series pattern based on the calculated appearance probability;
The calculated time-series pattern overall evaluation value is compared with an overall setting allowable value, and when the time-series pattern overall evaluation value is within the criteria based on the overall setting allowable value, the appearance probability of the time-series pattern is the highest. A time series pattern evaluation value evaluation unit that identifies each time series pattern in the high state,
When the calculated time-series pattern overall evaluation value is outside the reference based on the overall setting allowable value, the time-series pattern generation unit corrects the similarity determination criterion using the time-series pattern overall evaluation value. Again, a similarity determination reference correction unit that generates the time series pattern using the corrected similarity determination reference,
The time series pattern generation device according to claim 1, comprising:
前記時系列パターン評価値評価部は、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターン個別評価値を個別設定許容値と比較し、前記時系列パターン個別評価値が、前記個別設定許容値による基準外の場合には、基準外の前記時系列パターン個別評価値に対応した前記時系列パターンを除去し、
前記類似度判別基準補正部は、前記時系列パターン全体評価値が前記全体設定許容値による基準外の場合には、前記時系列パターン個別評価値及び前記時系列パターン全体評価値の少なくともいずれかを用いて前記類似度判別基準を補正する、
ことを特徴とする請求項2に記載の時系列パターン生成装置。The time series pattern evaluation value calculation unit calculates a time series pattern individual evaluation value for evaluating the time series pattern for each time series pattern based on the calculated appearance probability,
The time series pattern evaluation value evaluation unit compares the time series pattern individual evaluation value with an individual setting allowable value when the time series pattern overall evaluation value is within a standard based on the overall setting allowable value, and the time series If the pattern individual evaluation value is outside the reference by the individual setting allowable value, the time series pattern corresponding to the time series pattern individual evaluation value outside the reference is removed,
The similarity determination reference correction unit, when the overall evaluation value of the time series pattern is outside the reference based on the overall setting allowable value, at least one of the individual evaluation value of the time series pattern and the overall evaluation value of the time series pattern To correct the similarity criterion,
The time-series pattern generation apparatus according to claim 2, wherein:
前記時系列データをある基準でいくつかのセグメントに区切り、特定のセグメント長単位で、各前記時系列データからそれぞれ複数の前記部分データを切り出す部分データ切出し部と、
複数の前記部分データから同一の類似関係にある前記複数の部分データ群を前記類似度判別基準に従って抽出し、前記部分データ群に含まれる前記部分データ数を出現頻度として含んだ状態で、前記複数の部分データ群の各々に対応する前記時系列パターンを生成するモデル群生成部と、
前記モデル群生成部によって生成された前記時系列パターンから、所定の削除閾値以下の前記出現頻度を有する前記時系列パターンを削除する時系列パターン削除部と、
削除後に残った前記時系列パターンの数を評価して継続あるいは非継続の判断を下し、継続の場合は、削除後に残った前記時系列パターンを記憶するとともに、前記部分データ切出し部に前記セグメント長を変えて前記部分データを切り出させ、一方、非継続の場合は、記憶した前記セグメント長ごとの前記時系列パターンを、前記時系列パターン評価部に送出する継続評価部と、
を備えることを特徴とする請求項1乃至3のいずれかに記載の時系列パターン生成装置。The time-series pattern generation unit
A partial data cutout unit that divides the time series data into several segments according to a certain standard, and cuts out a plurality of the partial data from each of the time series data in a specific segment length unit;
Extracting the plurality of partial data groups having the same similarity from the plurality of partial data according to the similarity determination criterion, and including the number of partial data included in the partial data group as an appearance frequency A model group generation unit that generates the time-series pattern corresponding to each of the partial data groups;
A time series pattern deletion unit that deletes the time series pattern having the appearance frequency equal to or lower than a predetermined deletion threshold from the time series pattern generated by the model group generation unit;
The number of the time series patterns remaining after the deletion is evaluated to make a continuation or non-continuation determination. In the case of the continuation, the time series patterns remaining after the deletion are stored, and the segment data extraction unit stores the segment. The partial data is cut out by changing the length, while in the case of non-continuation, the time series pattern for each of the stored segment lengths is sent to the time series pattern evaluation section,
The time series pattern generation device according to claim 1, comprising:
さらに、複数の前記部分データから前記部分データを取り出し、取り出した前記部分データの各前記時系列パターン発生モデルに対する尤度を、前記部分データの長さと、高さと、正規化により前記長さ及び前記高さによる影響を排除した形状との観点から計算するモデル尤度計算部と、
各前記時系列パターン発生モデルに対して算出された前記尤度と、前記部分データと前記時系列パターン発生モデルとの類似度を判別する前記類似度判別基準としての類似度パラメータとを用いて、取り出された前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行う尤度評価部であって、類似する前記時系列パターン発生モデルが存在しない場合は、前記新規モデル作成部に前記部分データを用いて前記時系列パターン発生モデルを作成させ、類似する前記時系列パターン発生モデルが存在する場合には、最も高い前記尤度を有する前記時系列パターン発生モデルを、前記モデル再学習部に前記部分データを用いて修正させる尤度評価部と、
前記モデル尤度計算部に複数の前記部分データからの前記部分データの取り出し処理を継続させるか否かの判断を行い、継続させない場合は、前記時系列パターン発生モデルを前記時系列パターンとして確定して前記時系列パターン削除部に出力する継続処理部と、
を備えることを特徴とする請求項4又は5に記載の時系列パターン生成装置。The model group generation unit includes a new model creation unit that creates a time series pattern generation model that is a model for generating the time series pattern, and a model re-learning unit that corrects the time series pattern generation model,
Further, the partial data is extracted from a plurality of the partial data, the likelihood for each time-series pattern generation model of the extracted partial data, the length and the height by the normalization of the partial data A model likelihood calculation unit for calculating from the viewpoint of the shape excluding the influence of height,
Using the likelihood calculated for each time series pattern generation model and the similarity parameter as the similarity determination criterion for determining the similarity between the partial data and the time series pattern generation model, A likelihood evaluation unit that evaluates whether or not the time series pattern generation model similar to the extracted partial data exists, and when the similar time series pattern generation model does not exist, the new model When the time series pattern generation model similar to the time series pattern generation model exists using the partial data in the creation unit, the time series pattern generation model having the highest likelihood is A likelihood evaluation unit that causes the model re-learning unit to correct the partial data using the partial data;
The model likelihood calculation unit determines whether to continue the process of extracting the partial data from the plurality of partial data. If not, the time series pattern generation model is determined as the time series pattern. A continuation processing unit that outputs to the time series pattern deletion unit,
The time-series pattern generation device according to claim 4, comprising:
前記モデル再学習部は、前記時系列パターン発生モデルが保有する、前記長さ及び高さの平均及び標準偏差を修正するものであり、
前記モデル尤度計算部は、各前記時系列パターン発生モデルに対する前記尤度の計算において、各前記時系列パターン発生モデルが保有する前記長さ及び高さの平均及び標準偏差を用いることを特徴とする請求項6又は7に記載の時系列パターン生成装置。The new model creation unit calculates the average and standard deviation of the length and height of the partial data as a part of the time-series pattern generation model to be created,
The model relearning unit corrects the average and standard deviation of the length and height possessed by the time-series pattern generation model,
The model likelihood calculation unit uses the average and standard deviation of the length and height held by each time series pattern generation model in calculating the likelihood for each time series pattern generation model, The time series pattern generation device according to claim 6 or 7.
複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成ステップと、
前記時系列パターン生成ステップによって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準によって前記時系列パターン生成ステップを再度行う時系列パターン評価ステップと、
を備えたことを特徴とする時系列パターン生成方法。A time series pattern generation method for generating a time series pattern specific to each state using time series data corresponding to a plurality of states to be observed,
A plurality of pieces of partial data are cut out from the plurality of pieces of time series data, and a plurality of pieces of partial data having the same similarity are used from the plurality of pieces of partial data by using a similarity determination criterion for determining the degree of similarity between the pieces of partial data. Extracting a partial data group and generating a time series pattern corresponding to each of the plurality of partial data groups; and
Evaluate whether the time series pattern generated by the time series pattern generation step conforms to a predetermined standard, and if within the predetermined standard, each of the time series pattern and each of the time series pattern Based on the relationship with the appearance frequency in each of the time-series data, the time-series pattern is identified as one of the states, and the identified time-series pattern is output as a final time-series pattern, If it is not a predetermined criterion, the similarity determination criterion is corrected, and the time series pattern generation step is performed again according to the corrected similarity determination criterion.
A time-series pattern generation method comprising:
各前記時系列パターンが各前記時系列データにおいてそれぞれ出現する確率を算出する出現確率計算ステップと、
算出された出現確率に基づき前記時系列パターンの全体を評価するための時系列パターン全体評価値を算出する時系列パターン評価値計算ステップと、
算出された前記時系列パターン全体評価値を全体設定許容値と比較し、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターンの前記出現確率が最も高い前記状態に各前記時系列パターンを特定し、特定された前記時系列パターンを前記最終時系列パターンとして出力する時系列パターン評価値評価ステップと、
算出された前記時系列パターン全体評価値が、前記全体設定許容値による基準外の場合には、前記時系列パターン全体評価値を用いて前記類似度判別基準を補正し、補正後の前記類似度判別基準により前記時系列パターン生成ステップを再度行う類似度判別基準補正ステップと、
を備えることを特徴とする請求項9に記載の時系列パターン生成方法。The time series pattern evaluation step includes:
An appearance probability calculating step for calculating a probability that each time series pattern appears in each of the time series data;
A time-series pattern evaluation value calculating step for calculating a time-series pattern overall evaluation value for evaluating the entire time-series pattern based on the calculated appearance probability;
The calculated time-series pattern overall evaluation value is compared with an overall setting allowable value, and when the time-series pattern overall evaluation value is within the criteria based on the overall setting allowable value, the appearance probability of the time-series pattern is the highest. A time series pattern evaluation value evaluation step for identifying each time series pattern in the high state and outputting the identified time series pattern as the final time series pattern;
When the calculated time-series pattern overall evaluation value is outside the reference based on the overall setting allowable value, the similarity determination criterion is corrected using the time-series pattern overall evaluation value, and the corrected similarity Similarity determination criterion correction step for performing the time series pattern generation step again according to the determination criterion;
The time series pattern generation method according to claim 9, further comprising:
前記時系列パターン評価値評価ステップは、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターン個別評価値を個別設定許容値と比較し、前記時系列パターン個別評価値が、前記個別設定許容値による基準外の場合には、基準外の前記時系列パターン個別評価値に対応した前記時系列パターンを除去し、
前記類似度判別基準補正ステップは、前記時系列パターン全体評価値が前記全体設定許容値による基準外の場合には、前記時系列パターン個別評価値及び前記時系列パターン全体評価値の少なくともいずれかを用いて前記類似度判別基準を補正する、
ことを特徴とする請求項10又は11に記載の時系列パターン生成方法。The time series pattern evaluation value calculation step calculates a time series pattern individual evaluation value for evaluating the time series pattern for each time series pattern based on the calculated appearance probability,
The time series pattern evaluation value evaluation step compares the time series pattern individual evaluation value with an individual setting allowable value when the time series pattern overall evaluation value is within a standard based on the overall setting allowable value, and the time series If the pattern individual evaluation value is outside the reference by the individual setting allowable value, the time series pattern corresponding to the time series pattern individual evaluation value outside the reference is removed,
In the similarity determination reference correction step, when the time series pattern overall evaluation value is outside the reference based on the overall setting allowable value, at least one of the time series pattern individual evaluation value and the time series pattern overall evaluation value is determined. To correct the similarity criterion,
The time-series pattern generation method according to claim 10 or 11, characterized in that
前記時系列データをある基準でいくつかのセグメントに区切り、特定のセグメント長単位で、各前記時系列データからそれぞれ複数の前記部分データを切り出す部分データ切出しステップと、
前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記部分データ群に含まれる前記部分データ数を出現頻度として含めた状態で、前記複数の部分データ群の各々に対応した前記時系列パターンを生成するモデル群生成ステップと、
前記モデル群生成ステップにより生成された前記時系列パターンから、所定の削除閾値以下の前記出現頻度を有する前記時系列パターンを削除する時系列パターン削除ステップと、
削除後に残った前記時系列パターンの数を評価して継続あるいは非継続の判断を下し、継続の場合は、削除後に残った前記時系列パターンを記憶するとともに、前記セグメント長を変えて前記各ステップ及び本ステップを行い、一方、非継続の場合は、記憶した前記セグメント長ごとの前記時系列パターンを出力する継続評価ステップと、
を備えることを特徴とする時系列パターン生成方法。A time series pattern generation method for generating time series patterns that are not similar to each other from time series data,
A partial data cutting step of dividing the time series data into a number of segments on a certain basis, and cutting out a plurality of the partial data from each of the time series data in a specific segment length unit;
A plurality of partial data groups having the same similarity relationship are extracted from the plurality of partial data using a similarity determination criterion for determining the similarity between the partial data, and the portions included in the partial data group A model group generation step for generating the time series pattern corresponding to each of the plurality of partial data groups in a state including the number of data as the appearance frequency;
A time series pattern deletion step of deleting the time series pattern having the appearance frequency equal to or lower than a predetermined deletion threshold from the time series pattern generated by the model group generation step;
The number of the time series patterns remaining after the deletion is evaluated to make a continuation or non-continuation determination.In the case of continuation, the time series patterns remaining after the deletion are stored, and the segment length is changed to change each of the time series patterns. On the other hand, in the case of non-continuation, a continuous evaluation step of outputting the time series pattern for each of the stored segment lengths,
A time-series pattern generating method comprising:
前記時系列パターンを生成するモデルとなる時系列パターン発生モデルを作成する新規モデル作成ステップと、前記時系列パターン発生モデルを修正するモデル再学習ステップとを備え、
前記部分データの各前記時系列パターン発生モデルに対する尤度を、前記部分データの長さと、高さと、正規化により前記長さ及び前記高さによる影響を排除した形状との観点から計算するモデル尤度計算ステップと、
各前記時系列パターン発生モデルに対して算出された前記尤度と、前記部分データと前記時系列パターン発生モデルとの類似度を判別するための類似度判別基準としての類似度パラメータとを用いて、前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行う尤度評価ステップであって、類似する前記時系列パターン発生モデルが存在しない場合は、前記新規モデル作成ステップを行って前記時系列パターン発生モデルを作成し、類似する前記時系列パターン発生モデルが存在する場合は、最も高い前記尤度を有する前記時系列パターン発生モデルを、前記モデル再学習ステップを行って修正する尤度評価ステップと、
前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて繰り返すか否かを判断し、繰り返すと判断した場合は、前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて行い、繰り返さないと判断した場合は、最終状態の各前記時系列パターン発生モデルを各前記時系列パターンとして確定する継続処理ステップと、
を備えることを特徴とする時系列パターン生成方法。A time series pattern generation method for generating time series patterns that are not similar to each other using a plurality of partial data extracted from time series data,
A new model creation step of creating a time series pattern generation model to be a model for generating the time series pattern, and a model relearning step of correcting the time series pattern generation model,
Model likelihood for calculating the likelihood of each partial data for each time-series pattern generation model from the viewpoint of the length and height of the partial data and the shape excluding the influence of the length and the height by normalization. A degree calculation step;
Using the likelihood calculated for each time series pattern generation model and a similarity parameter as a similarity determination criterion for determining the similarity between the partial data and the time series pattern generation model A likelihood evaluation step for evaluating whether or not the time series pattern generation model similar to the partial data exists, and when the similar time series pattern generation model does not exist, the new model creation step To create the time series pattern generation model, and when there is a similar time series pattern generation model, the time series pattern generation model having the highest likelihood is subjected to the model relearning step. A likelihood evaluation step to correct;
It is determined whether to repeat the model likelihood calculation step and the likelihood evaluation step for the other partial data, and if it is determined to repeat, the model likelihood calculation step and the likelihood evaluation step When it is determined that the partial data is not repeated, the continuous processing step of determining each time series pattern generation model in the final state as each time series pattern;
A time-series pattern generating method comprising:
前記モデル再学習ステップは、前記時系列パターン発生モデルが保有する、前記長さ及び高さの平均及び標準偏差を修正するものであり、
前記モデル尤度計算ステップは、各前記時系列パターン発生モデルに対する前記尤度の計算において、各前記時系列パターン発生モデルが保有する前記長さ及び高さの平均及び標準偏差を用いることを特徴とする請求項16又は17に記載の時系列パターン生成方法。The new model creation step calculates the average and standard deviation of the length and height of the partial data as a part of the time-series pattern generation model to be created,
The model relearning step corrects the average and standard deviation of the length and height possessed by the time series pattern generation model,
The model likelihood calculating step uses the average and standard deviation of the length and height possessed by each time series pattern generation model in the calculation of the likelihood for each time series pattern generation model. The time series pattern generation method according to claim 16 or 17.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003195174A JP3977782B2 (en) | 2003-07-10 | 2003-07-10 | Time-series pattern generation apparatus and time-series pattern generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003195174A JP3977782B2 (en) | 2003-07-10 | 2003-07-10 | Time-series pattern generation apparatus and time-series pattern generation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005031908A true JP2005031908A (en) | 2005-02-03 |
JP3977782B2 JP3977782B2 (en) | 2007-09-19 |
Family
ID=34206104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003195174A Expired - Lifetime JP3977782B2 (en) | 2003-07-10 | 2003-07-10 | Time-series pattern generation apparatus and time-series pattern generation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3977782B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11200632B2 (en) | 2018-11-09 | 2021-12-14 | Canon Kabushiki Kaisha | Image processing method and image processing apparatus |
US11455322B2 (en) | 2020-05-12 | 2022-09-27 | International Business Machines Corporation | Classification of time series data |
-
2003
- 2003-07-10 JP JP2003195174A patent/JP3977782B2/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11200632B2 (en) | 2018-11-09 | 2021-12-14 | Canon Kabushiki Kaisha | Image processing method and image processing apparatus |
US11455322B2 (en) | 2020-05-12 | 2022-09-27 | International Business Machines Corporation | Classification of time series data |
Also Published As
Publication number | Publication date |
---|---|
JP3977782B2 (en) | 2007-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021000958A1 (en) | Method and apparatus for realizing model training, and computer storage medium | |
JP6766950B2 (en) | Object detection device, object detection method and object detection program | |
CN107562772B (en) | Event extraction method, device, system and storage medium | |
CN104050556B (en) | The feature selection approach and its detection method of a kind of spam | |
EP3483747A1 (en) | Preserving and processing ambiguity in natural language | |
CN106469097A (en) | A kind of method and apparatus recalling error correction candidate based on artificial intelligence | |
RU2254610C2 (en) | Method for automated classification of documents | |
CN113012687B (en) | Information interaction method and device and electronic equipment | |
CN114036318A (en) | Public safety knowledge graph generation method facing to pan-aware data and based on time sequence diagram | |
JP3977782B2 (en) | Time-series pattern generation apparatus and time-series pattern generation method | |
CN111428487B (en) | Model training method, lyric generation method, device, electronic equipment and medium | |
JPH1166238A (en) | Handwritten character recognition method | |
CN115376054B (en) | Target detection method, device, equipment and storage medium | |
CN104200222B (en) | Object identifying method in a kind of picture based on factor graph model | |
KR100765749B1 (en) | Apparatus and method for binary image compression | |
CN114880584A (en) | Generator set fault analysis method based on community discovery | |
CN115544999A (en) | Domain-oriented parallel large-scale text duplicate checking method | |
JP2019185121A (en) | Learning device, learning method and program | |
Zalasiński et al. | Intelligent approach to the prediction of changes in biometric attributes | |
CN109299260B (en) | Data classification method, device and computer readable storage medium | |
JP2001126050A (en) | News article cutting device | |
KR101815968B1 (en) | Malicious code classification system for providing group dividing function and method thereof | |
KR20160069027A (en) | System and method for indexing image based on affect | |
CN116361470B (en) | Text clustering cleaning and merging method based on topic description | |
CN113064597B (en) | Redundant code identification method, device and equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070119 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070410 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070621 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |