JP2005031908A - Time series pattern generating apparatus and time series pattern generation method - Google Patents

Time series pattern generating apparatus and time series pattern generation method Download PDF

Info

Publication number
JP2005031908A
JP2005031908A JP2003195174A JP2003195174A JP2005031908A JP 2005031908 A JP2005031908 A JP 2005031908A JP 2003195174 A JP2003195174 A JP 2003195174A JP 2003195174 A JP2003195174 A JP 2003195174A JP 2005031908 A JP2005031908 A JP 2005031908A
Authority
JP
Japan
Prior art keywords
series pattern
time series
time
partial data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003195174A
Other languages
Japanese (ja)
Other versions
JP3977782B2 (en
Inventor
Shuichiro Imahara
原 修一郎 今
Makoto Sato
藤 誠 佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003195174A priority Critical patent/JP3977782B2/en
Publication of JP2005031908A publication Critical patent/JP2005031908A/en
Application granted granted Critical
Publication of JP3977782B2 publication Critical patent/JP3977782B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To automatically generate an unique time series pattern which can be discriminated from other time series for the status of each time series. <P>SOLUTION: A time series pattern generating part 103 generates time series patterns which are not similar to each other to such an extent as shown by a similarity parameter by using time series data corresponding to the plurality of statuses of an object to be observed, and outputs the time series pattern obtained by erasing a time series pattern whose frequency of appearance is low from among those generated time series patterns as an output time series pattern 104. A time series pattern evaluating part 105 performs the overall evaluation of the output time series pattern 104 generated by the time series pattern generating part 103, and when the overall evaluation is within a predetermined standard, the time series pattern evaluating part 105 evaluates each time series pattern, and outputs the time series pattern obtained by excluding a time series pattern which does not satisfy an individual reference as a final time series pattern 107. Whereas a time series pattern evaluating part 105 corrects the similarity parameter when the above overall evaluation is beyond the predetermined reference, and transmits it to the time series pattern generating part 103. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、観測対象の複数の状態に対応する時系列データから各状態に固有の時系列パターンを生成する時系列パターン生成装置及び時系列パターン生成方法、並びに、時系列データから互いに類似しない時系列パターンを生成する時系列パターン生成方法に関する。
【0002】
【従来の技術】
センシング技術とプロセッサ技術の向上に伴い、センサは、低コスト化と相俟って、身近な存在になっている。例えば足にセンサを付け、その動作を時系列データとして取得することも可能になってきている。
【0003】
そこで、人にセンサを取り付けて時系列データを取得し、その人が何らかの動作を行った時に現れる特徴的な時系列パターンを、取得した時系列データから生成することが行われるようになってきている。また、その人がどのような動作をしているのか識別するために、各動作(時系列の状態)から得られた時系列データを用いて、各動作に固有の時系列パターンを生成することも要求されるようになってきている。
【0004】
しかし、一般に、取得される時系列パターンは膨大な量になることが多いため、時系列パターンを人の手で探すとなると非常に労力がかかるという問題点がある。
【0005】
また、上述した後者、つまり、各状態から得られた時系列データを用いて各動作に固有の時系列パターンを生成する方法は知られていない。
【0006】
一方、上述した前者、つまり、ある状態から得られた時系列データを用いてこの状態に特徴的な時系列パターンを生成することについては、これを実現する方法として、例えば時系列クラスタリングとルール分析(非特許文献2)を時系列に拡張したものがある。
【0007】
しかし、いずれにおいても、処理に当たって、時系列データを適当な基準で区間分け(セグメント化)する必要があるが、前者の時系列クラスタリングでは、区間の数(セグメント数)、つまり、パターン長は一定にする必要がある(固定である)という欠点がある。
【0008】
これに対し、後者のルール分析はパターン長を自動的に決定して効率よく時系列パターンを生成できるという利点があるが、パターン長の長い時系列パターンを生成する場合、パターン長が短い時系列パターンを組み合わせて長い時系列パターンを表現する。このため、各時系列パターンが平均化されてしまいやすい欠点がある。この理由は、短い時系列パターンは形状が単純であるために近似した時系列パターンが多数あることが多いというものである。よって、この手法ではパターン長が長くなったとき、複雑な形状の時系列パターンを扱えないという欠点がある。
【0009】
ところで、時系列パターンを生成する際には類似した時系列パターンが多数生成されない方が好ましく、従って、切り出した時系列データの類似判定が必要になる。類似判定では長さや高さが異なっていても形状が類似していれば同一のものであるとしたい(長さや高さの曖昧さを吸収したい)という要請があるが、上述の時系列クラスタリングでは長さの曖昧さしか吸収できないという欠点があった。一方、長さ、高さの曖昧さを共に吸収できる方法として時系列パターン発生モデルを使用する方法(非特許文献1)があるが、この方法では時系列の形状を保持せずに直線とみなすために複雑な形状同士を区別できないという欠点がある。
【0010】
【特許文献1】
特開平11−326542号公報
【特許文献2】
特開平9−34719号公報
【非特許文献1】
Xianping Ge and Padhraic Smyth, Deformable Markov Model Templates for Time−Series Pattern Matching, ACM SIGKDD(KDD−2000), pp.81−90, 2000
【非特許文献2】
Rakesh Agrawal, Tomasz Imielinski, Arun N. Swami, Mining Association Rules between Sets of Items in Large Databases, SIGMOD Conference 1993, pp.207−216, 1993
【0011】
【発明が解決しようとする課題】
上記のように、従来においては、各時系列の状態に対して他の時系列の状態と区別できる時系列パターンを自動的に生成できないという問題点があった。また、パターン長が大きくなった場合、複雑な形状を扱うことができないという問題点があった。さらに、長さと高さの曖昧さを吸収した、複雑な形状の類似判定ができないという問題点があった。
【0012】
本発明は、上記の事情を考慮してなされたものであり、各時系列の状態に対して他の時系列の状態と区別可能な、各時系列の状態に固有の時系列パターンを自動的に生成できる時系列パターン生成装置及び時系列パターン生成方法を提供することを目的とする。また、パターン長が大きくなっても複雑な形状を扱うことのできる時系列パターン生成方法を提供することを目的とする。さらに、本発明は、複雑な形状の類似判定を可能にし、これにより、長さ及び高さに加え、複雑な形状も考慮できる時系列パターン生成方法を提供することを目的とする。
【0013】
【課題を解決するための手段】
本発明の時系列パターン生成装置は、観測対象の複数の状態に対応する時系列データを用いて、各状態に固有の時系列パターンを生成する時系列パターン生成装置であって、複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成部と、前記時系列パターン生成部によって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準を用いて前記時系列パターン生成部に再度、前記時系列パターンを生成させるために、補正した前記類似度判別基準を前記時系列パターン生成部に出力する時系列パターン評価部と、を備えたことを特徴とする。
【0014】
本発明の時系列パターン生成方法は、観測対象の複数の状態に対応する時系列データを用いて、各状態に固有の時系列パターンを生成する時系列パターン生成方法であって、複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成ステップと、前記時系列パターン生成ステップによって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準によって前記時系列パターン生成ステップを再度行う時系列パターン評価ステップと、を備えたことを特徴とする。
【0015】
本発明の時系列パターン生成方法は、時系列データから互いに類似しない時系列パターンを生成する時系列パターン生成方法であって、前記時系列データをある基準でいくつかのセグメントに区切り、特定のセグメント長単位で、各前記時系列データからそれぞれ複数の前記部分データを切り出す部分データ切出しステップと、前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記部分データ群に含まれる前記部分データ数を出現頻度として含めた状態で、前記複数の部分データ群の各々に対応した前記時系列パターンを生成するモデル群生成ステップと、前記モデル群生成ステップにより生成された前記時系列パターンから、所定の削除閾値以下の前記出現頻度を有する前記時系列パターンを削除する時系列パターン削除ステップと、削除後に残った前記時系列パターンの数を評価して継続あるいは非継続の判断を下し、継続の場合は、削除後に残った前記時系列パターンを記憶するとともに、前記セグメント長を変えて前記各ステップ及び本ステップを行い、一方、非継続の場合は、記憶した前記セグメント長ごとの前記時系列パターンを出力する継続評価ステップと、を備えることを特徴とする。
【0016】
本発明の時系列パターン生成方法は、時系列データから切り出された複数の部分データを用いて、互いに類似しない時系列パターンを生成する時系列パターン生成方法であって、前記時系列パターンを生成するモデルとなる時系列パターン発生モデルを作成する新規モデル作成ステップと、前記時系列パターン発生モデルを修正するモデル再学習ステップとを備え、前記部分データの各前記時系列パターン発生モデルに対する尤度を、前記部分データの長さと、高さと、正規化により前記長さ及び前記高さによる影響を排除した形状との観点から計算するモデル尤度計算ステップと、各前記時系列パターン発生モデルに対して算出された前記尤度と、前記部分データと前記時系列パターン発生モデルとの類似度を判別するための類似度判別基準としての類似度パラメータとを用いて、前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行う尤度評価ステップであって、類似する前記時系列パターン発生モデルが存在しない場合は、前記新規モデル作成ステップを行って前記時系列パターン発生モデルを作成し、類似する前記時系列パターン発生モデルが存在する場合は、最も高い前記尤度を有する前記時系列パターン発生モデルを、前記モデル再学習ステップを行って修正する尤度評価ステップと、前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて繰り返すか否かを判断し、繰り返すと判断した場合は、前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて行い、繰り返さないと判断した場合は、最終状態の各前記時系列パターン発生モデルを各前記時系列パターンとして確定する継続処理ステップと、を備えることを特徴とする。
【0017】
【発明の実施の形態】
先ず、本実施の形態の特徴について簡単に説明しておく。
【0018】
図5は、歩行時に得られた時系列データと走行時に得られた時系列データとからなる時系列データ102を示す図である。この時系列データ102は、例えば、生体の足につけた加速度センサから取得されたものである。
【0019】
図中には、歩行ラベルと走行ラベルとからなる状態データ(ラベル)101が示されている。状態データ101は、後述するように、時系列データ102がどのような状態で取得されたのかを特定するために用いる。
【0020】
本実施の形態は、このような各状態(例:歩行、走行)の時系列データを用いて、各状態に固有の時系列パターンを生成しようとするものである。
【0021】
以下、図面を参照しながら、本発明の実施の形態について詳しく説明する。
【0022】
図1は、本発明の一実施形態に関わる時系列パターン生成装置の構成例を示す図である。
【0023】
図1に示すように、この時系列パターン生成装置は、時系列パターン生成部103と時系列パターン評価部105とを備える。
【0024】
時系列パターン生成部103は、入力された状態データ101(図5参照)及び時系列データ102(図5参照)を用いて、相互に類似しない種々のパターン長の(パターン長が非固定の)時系列パターンを生成する。相互に類似しない時系列パターンの生成は後述する類似度パラメータ106(類似度基準)を用いて行う。時系列パターン生成部103は、生成した時系列パターン群を出力時系列パターン104として出力する。
【0025】
後述する図9は、図5の時系列データ102から生成された時系列パターン例を示す図である。図9中には、パターン長が1の時系列パターン(上段)と、パターン長が2の時系列パターン(下段)が示されている。
【0026】
時系列パターン評価部105は、時系列パターン生成部103から出力された出力時系列パターン104を用いて出力時系列パターン104が所望の基準を満たしているか否かの評価を行う。
【0027】
より詳しくは、まず、時系列パターン評価部105は、出力時系列パターン104全体を評価するための時系列パターン全体評価値と、出力時系列パターン104を構成する各時系列パターンを個別に評価するための時系列パターン個別評価値とを、後述する手法を用いて、算出する。
【0028】
次に、時系列パターン評価部105は、時系列パターン全体評価値が所定の基準内にあるかどうかを判断し、所定の基準内にあると判断した場合は、次に、各時系列パターンの時系列パターン個別評価値が所定の基準内にあるかどうかを判断する。時系列パターン評価部105は、所定の基準外にある時系列パターン個別評価値が存在すると判断した場合は、その時系列パターン個別評価値を有する時系列パターンを出力時系列パターン104から削除する。時系列パターン評価部105は、この状態の出力時系列パターン104を、図1に示すように、最終時系列パターン107として出力する。
【0029】
一方、時系列パターン評価部105は、時系列パターン全体評価値が所定の基準外にあると判断した場合は、時系列パターン全体評価値あるいは各時系列パターン個別評価値を用いて上述の類似度パラメータ106を、より厳しい方向に、補正する。そして、時系列パターン評価部105は、図1に示すように、補正後の類似度パラメータ106を時系列パターン生成部104に送出して、再度、時系列パターン生成部103に補正後の類似度パラメータ106により出力時系列パターン104を出力させる。時系列パターン評価部105は、時系列パターン全体評価値が所定の基準内になるまで、類似度パラメータ106の補正を繰り返す。
【0030】
時系列パターン評価部105によって出力された最終時系列パターン107は、本手法によって最終的に得られる時系列パターン(例えば、歩行時に固有の時系列パターン、走行時に固有の時系列パターン)である。最終時系列パターン107の一例を、後述する図11に示す。これは、時系列パターン個別評価値が所定の基準外にあると判断された時系列パターン(パターン3)を、上述のようにして、図9の出力時系列パターン104から除去したものである。後述から明らかになるように、パターン1,2,12が歩行時に固有の時系列パターン、その他のパターン4,5,45が走行時に固有の時系列パターンである。尚、時系列パターン評価部105は、時系列パターン個別評価値が所定の基準内の時系列パターンが多数ある場合などは、そのうちの上位いくつか(例えば出現頻度が高いもの)だけを出力するようにしても良い。
【0031】
次に、時系列パターン生成部103および時系列パターン評価部105についてさらに詳しく説明する。
【0032】
まず、時系列パターン生成部103について説明する。
【0033】
図3は、時系列パターン生成部103の構成を詳細に示す図である。
【0034】
上述したように、時系列パターン生成部103は、時系列データ102と状態データ101とを用いて出力時系列パターン104を生成するものである。
【0035】
図3に示すように、この時系列パターン生成部103は、セグメント化部301、セグメント切出し部303、モデル群生成部306、時系列パターン削除部308、継続評価部311、および継続処理部312を備える。
【0036】
セグメント化部301は、入力された時系列データ102を所定の基準で複数の区間(セグメント)に分け(セグメント化)、区間ごとに、区間サイズ(1次元時系列の場合は長さ)と、区間の高さとを算出する。セグメント化部301は、区間ごとの区間サイズ及び区間の高さをセグメント情報302として出力する。セグメント化の例としては、区分線形近似(1次元時系列の場合は折れ線化)がある。
【0037】
図6は、歩行時および走行時の時系列データ(図5参照)をそれぞれセグメント化した状態を示す図である。
【0038】
図6において、上述のセグメント情報302は、(長さl、高さΔh)=(l1、Δh1)、(l2、Δh2)、・・・、(l10、Δh10)の全データである。ここで、高さΔh1,Δh2,・・・Δh10(図示せず)は、各対応する区間における最大の高さと、最小の高さとの差である。区間の高さとしては、この他、例えば、区間の初めと終わりにおける高さの差を取るようにしてもよい。
【0039】
図3に示すように、セグメント切出し部303は、上述のセグメント情報302を構成する各データに、各区間の形状データ及び入力された状態データを付加したセグメントデータ305(状態データについては図示せず)を生成する。図6の例では、セグメントデータ305は、(長さl、高さΔh、形状y)=(l1、Δh1、y1)、(l2、Δh2、y2)、・・・、(l10、Δh10、y10)の全データ(状態データは図示せず)である。形状データy1,y2・・・は、対応する区間の長さ及び高さも包含しているが、長さと高さのデータは、後述する計算において用いるため、形状データとは別個に取得している。セグメントデータ305を構成する1つ1つの各データ(長さl、高さΔh、形状y)(状態データは図示せず)は1セグメントデータ403と称される。
【0040】
モデル群生成部306は、セグメント切出し部303により生成されたセグメントデータ305と後述する類似度パラメータ106とを用いて、互いに類似しない、特定のパターン長(セグメント数)による時系列パターン(各状態の時系列データにおける出現頻度も含む)を生成する。モデル群生成部306は、生成した時系列パターン群を生成時系列パターン307として出力する。
【0041】
図7(a)及び図7(b)は、セグメントデータ305(図6参照)から生成された生成時系列パターン307例を示す図である。
【0042】
より詳しくは、図7(a)は、パターン長が1の場合に生成された生成時系列パターン307例を示す図である。図中に示すように、ここでは、5つの時系列パターン1〜5が生成されている。ここで、例えば、時系列パターン1の「参照:y1,y4」は、図6の形状y1,y4に対応することを示す。つまり、パターン1は、形状y1,y4から生成された時系列パターンである。
【0043】
一方、図7(b)は、パターン長が2の場合の生成時系列パターン例を示す図である。図中に示すように、パターン長が2の場合は、6つの時系列パターン12,23,31,45,53,34が生成されている。
【0044】
図3に示すように、時系列パターン削除部308は、生成時系列パターン307内の各時系列パターンのうち、出現頻度が削除閾値以下の時系列パターンを削除し、残りの時系列パターンを削除後残存時系列パターン309として出力する。これは、出現頻度の低い時系列パターンを削除して、後述する継続評価部311における計算効率を高めるためである。
【0045】
図8は、パターン長が2の生成時系列パターン307(図7(b)参照)に対して、削除閾値を1とした場合に得られた削除後残存時系列パターン309例を示す図である。
【0046】
図7(b)と図8とを対比して分かるように、図7(b)に示す6つの時系列パターンのうち、出現頻度が1である時系列パターン23,31,53,34が削除され、出現頻度が2であるパターン12,45が、削除後残存時系列パターン309として出力されている。
【0047】
継続評価部311は、時系列パターン削除部308により出力された削除後残存時系列パターン309内の時系列パターン数を調べる。継続評価部311は、削除後残存時系列パターン309内の時系列パターン数が0でないと判断すれば、つまり、さらに大きなパターン長の時系列パターンを生成できる可能性があると判断すれば、この削除後残存時系列パターン309を記憶した上で、継続処理部312へ処理を移行する。
【0048】
すなわち、継続処理部312は、パターン長を増加した(例えばパターン長を1から2に、あるいは2から3に増加した)セグメントデータ305を、時系列データ102を用いて生成する。この際、削除後残存時系列パターン309内の時系列パターンに対応する時系列データの部分を含んだ状態でセグメントデータ305を取得する。これは、あまり重要でないと思われるデータの抽出を抑えることにより、効率の良い処理を実現するためである。
【0049】
一方、継続評価部311は、削除後残存時系列パターン309内の時系列パターン数が0であると判断した場合は、つまり、さらに大きなパターン長の時系列パターンを生成できる可能性がないと判断した場合は、パターン長ごとの削除後残存時系列パターン309を出力時系列パターン104として出力する。
【0050】
先に簡単に説明した図9は、図5に示す時系列データ102から得られた出力時系列パターン104例を示す図である。
【0051】
以下、上述した時系列パターン生成部103による処理動作について、図5の時系列データ102から図9の出力時系列パターン104を生成する場合を例に、詳しく説明する。
【0052】
まず、図3に示すように、セグメント化部301は時系列データ102(図5参照)をセグメント化(図6参照)してセグメント情報302(長さl1、高さΔh)(長さl2、高さΔh2)・・・を生成し、セグメント切出し部303に送出する。
【0053】
セグメント切出し部303は、セグメント情報302を用いて、パターン長1によるセグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・を生成し、モデル群生成部306に送出する。
【0054】
モデル群生成部306は、セグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・を用いて、パターン長が1の、相互に類似しない時系列パターンからなる生成時系列パターン307(図7(a)参照)を生成し、時系列パターン削除部308に送出する。
【0055】
時系列パターン削除部308は、受け取った生成時系列パターン307から、出現頻度が1以下の時系列パターンを削除し、削除後残存時系列パターン309として継続評価部311に送出する(図9の上段参照)。
【0056】
継続評価部311は、削除後残存時系列パターン309内の時系列パターン数を判断する。この場合、パターン数は0ではないので(図9上段に示すようにパターン数は5)、この削除後残存時系列パターン309を内部に記憶するとともに、この削除後残存時系列パターン309を継続処理部312に送出する。
【0057】
継続処理部312は、受け取った削除後残存時系列パターン309と時系列データ102とを用いて、パターン長が2のセグメントデータ305を生成し、モデル群生成部306に送出する。
【0058】
モデル群生成部306は、受け取ったセグメントデータ305を用いて、パターン長が2の生成時系列パターン307を生成して(図7(b)参照)、時系列パターン削除部308に送出する。
【0059】
時系列パターン削除部308は、受け取った生成時系列パターン307から、出現頻度が1以下の時系列パターンを削除して(図9の下段参照)、削除後残存時系列パターン309として継続評価部311に送出する。
【0060】
継続評価部311は、この削除後残存時系列パターン309内の時系列パターン数を判断する。この場合、パターン数は0でないので(図9下段に示すようにパターン数は2)、この削除後残存時系列パターン309を記憶するとともに、この削除後残存時系列パターン309を継続処理部312に送出する。
【0061】
継続処理部312は、受け取った削除後残存時系列パターン309と時系列データ102とを用いて、パターン長を3としたセグメントデータ305を生成し、モデル群生成部306に送出する。
【0062】
モデル群生成部306は、受け取ったセグメントデータ305を用いて、パターン長が3の生成時系列パターン307を生成し(図示せず)、時系列パターン削除部308に送出する。
【0063】
時系列パターン削除部308は、受け取った生成時系列パターン307から出現頻度が1以下の時系列パターンを削除して、削除後残存時系列パターン309とし(図示せず)、継続評価部311に送出する。
【0064】
継続評価部311は、この削除後残存時系列パターン309内の時系列パターン数を判断する。時系列パターン数は0であるので(図示せず)、継続評価部311は、先に記憶したパターン長が1、2の削除後残存時系列パターン309(図9参照)を出力時系列パターン104として出力する。
【0065】
ここで、上述の時系列パターン生成部103を構成するモデル群生成部306(図3参照)についてさらに詳しく説明する。
【0066】
図4は、モデル群生成部306の構成例を詳細に示す図である。
【0067】
上述したように、モデル群生成部306は、セグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・から生成時系列パターン307を生成するものである。
【0068】
図4に示すように、このモデル群生成部306は、セグメント取出継続評価部401、1セグメント取出部402、モデル尤度計算部404、尤度評価部405、モデル再学習部406、および新規モデル作成部407を備える。
【0069】
セグメント取出継続評価部401は、セグメントデータ305内の全ての1セグメントデータ403(前述したようにセグメントデータ305を構成する各データ)が、次の1セグメント取出部402によって取り出されたかどうかを判断する。セグメント取出継続評価部401は、これ以上1セグメントデータ403を取り出せない、つまりセグメントデータ305内の全ての1セグメントデータ403が取り出されたと判断した場合は、本モデル群生成部306において生成された時系列パターン(図7(a)(b)参照)を図示しないバッファから取り出して、生成時系列パターン307として出力する。
【0070】
一方、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403がセグメントデータ305内にまだ存在していると判断した場合は、1セグメント取出部402へ処理を移行する。
【0071】
1セグメント取出部402は、セグメントデータ305から1セグメントデータ403を取り出して、モデル尤度計算部404に送出する。
【0072】
モデル尤度計算部404は、例えば次の(式1)に示す尤度関数
【数1】

Figure 2005031908
を用いて、後述する各時系列パターン発生モデル409(途中段階としての時系列パターン)に対する1セグメントデータ403の尤度(適合度)をそれぞれ計算する。
【0073】
ここで、(式1)において、l、Δh、y(t)、μli、μΔhi、σli及びσΔhiは、時系列パターン発生モデル409のパラメータである。より詳しくは、lは、長さ、Δhは高さ、y(t)は形状データを示す。また、後述から明らかになるように、μli及σliは、長さの平均及び標準偏差、μΔhi及びσΔhiは、高さの平均及び標準偏差を示す。一方、l’、Δh’、y’(t)は、1セグメントデータ403のパラメータである。また、gμ σ(x)は平均をμ、標準偏差をσとした正規分布関数を表す。
【0074】
(式1)に示すように、この尤度関数は、1セグメントデータ403と各時系列パターン発生モデルとの適合度を、長さ、高さ及び形状の観点から求める。具体的には、尤度関数は、Σ内に3つの乗算項を有しており、一番左の乗算項が長さの適合度、2番目の乗算項が高さの適合度、3番目の乗算項が形状の適合度に対応する。形状の適合度は、1セグメントデータ403の形状データと時系列パターン発生モデル409の形状データをそれぞれ正規化した状態で(長さと高さの影響を排除した基準となるサイズに修正した状態で)求めている。従って、(式1)によれば、長さと高さが多少異なっていても、形状が類似していれば、高い適合性を示す尤度が算出される。但し、1セグメントデータ403の長さあるいは高さが時系列パターン発生モデル409とがあまりに大きく異なる場合は、形状が類似していても、一番左の乗算項と2番目の乗算項によって、低い適合性を示す尤度が算出される。
【0075】
モデル尤度計算部404は、(式1)を用いて算出した尤度のうち最大尤度と2番目の尤度を尤度データ408として、図4に示すように、1セグメントデータ403とともに、次の尤度評価部405に送出する。
【0076】
尤度評価部405は、モデル尤度計算部404で算出された最大尤度(maxQ)と2番目の尤度(secondQ)を元に、次の(式2)に示す尤度比算出式
【数2】
Figure 2005031908
によって算出される尤度比Rを計算する。
【0077】
尤度評価部405は、算出した尤度比R=maxQ/secondQを、入力された類似度パラメータ106(1セグメントデータ403と時系列パターン発生モデルとの類似度を判別する際の判別基準値)とを比較する。尤度評価部405は、尤度比R=maxQ/secondQが類似度パラメータ106以下であると判断した場合は、この1セグメントデータに類似する時系列パターン発生モデル409は存在しないと判断し、この1セグメントデータ403を新規モデル作成部407に送出する。
【0078】
新規モデル作成部407は、受け取った1セグメントデータ403の長さ、高さ及び形状データと、長さおよび高さの平均(ここでは初期値として1セグメントデータの長さと高さそのものを用いる)と、長さ及び高さの標準偏差(ここでは初期値として0または既に得られている標準偏差の平均の30%など)とからなる、時系列パターン発生モデル409を作成する。新規モデル作成部407は、作成した時系列パターン発生モデル409を図示しないバッファに記憶するとともに、継続指示データ412をセグメント取出継続評価部401に送出して、セグメント継続評価部401に処理を移行する。
【0079】
一方、尤度評価部405は、算出した尤度比R=maxQ/secondQが類似度パラメータ106よりも大きいと判断した場合は、この1セグメントデータ403は、最大尤度maxQを持つ時系列パターン発生モデル409と類似していると判断する。尤度評価部405は、1セグメントデータ403と類似情報410(いずれの時系列パターン発生モデルに類似しているかを示す情報)とをモデル再学習部406に送出して、モデル再学習部406へ処理を移行する。
【0080】
モデル再学習部406は、類似情報410に指定された時系列パターン発生モデルを図示しないバッファから取り出し、以下の(式3)に示す平均・標準偏差更新関数に従って、この時系列パターン発生モデルのパラメータを学習(更新)する。
【数3】
Figure 2005031908
【0081】
(式3)に示す通り、モデル再学習部406は、形状の学習を行わず、長さの平均と標準偏差、及び、高さの平均と標準偏差のみを更新する。モデル再学習部406は、更新後の時系列パターン発生モデル409を用いて、図示しないバッファ内の対応する時系列パターン発生モデル409を置き換える。一方、モデル再学習部406は、継続指示データ412をセグメント取出継続評価部401に送出して、セグメント取出継続評価部401に処理を移行する。
【0082】
以下、本モデル群生成部306による処理動作について、セグメント長が1の生成時系列パターン307(図7(a)参照)を生成する場合を例に説明する。
【0083】
まず、図4に示すように、セグメント取出継続評価部401は、セグメントデータ305(歩行時のもの)内に取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403は存在すると判断し、1セグメント取出部402に処理を移行する。
【0084】
1セグメント取出部402は、セグメントデータ305から1セグメントデータ403(図6における形状y1の区間参照)を取り出し、モデル尤度計算部404に送出する。
【0085】
モデル尤度計算部404は、時系列パターン発生モデル409が図示しないバッファ内にまだ存在しないので(尤度比Rを算出するためには少なくとも2つの時系列パターン発生モデルが必要)、尤度を算出することなく、受け取った1セグメントデータ403をそのまま尤度評価部405に送出する。
【0086】
尤度評価部405も、受け取った1セグメントデータ403をそのまま新規モデル作成部407に送出する。
【0087】
新規モデル作成部407は、受け取った1セグメントデータ403を用いて、形状データと、長さ及び高さと、長さおよび高さの平均及び標準偏差とを第1の時系列パターン発生モデル409として生成し、図示しないバッファ内に記憶する。また、新規モデル作成部407は、セグメント取出継続評価部401に継続指示データ412を送出する。
【0088】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0089】
1セグメント取出部402は、セグメントデータ305から次の1セグメントデータ403(図6における形状y2の区間参照)を取り出して、モデル尤度計算部404に送出する。
【0090】
モデル尤度計算部404は、上述同様、1セグメントデータ403をそのまま尤度評価部405に送出する。
【0091】
尤度評価部405も、受け取った1セグメントデータ403をそのまま新規モデル作成部407に送出する。
【0092】
新規モデル作成部407は、上述と同様にして、受け取った1セグメント403を用いて、第2の時系列パターン発生モデル409を生成して、図示しないバッファ内に記憶するとともに、セグメント取出継続評価部401に継続指示データ412を送出する。
【0093】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータが存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0094】
1セグメント取出部402は、セグメントデータ305内からさらに次の1セグメントデータ403(図6における形状y3の区間参照)を取り出して、モデル尤度計算部404に送出する。
【0095】
モデル尤度算出部404は、上述した図示しないバッファ内における第1の時系列パターン発生モデル409と、1セグメントデータとを尤度関数(式1)に入力して第1の時系列パターン発生モデル409に対する尤度を求める。また、モデル尤度算出部404は、上述した第2の時系列パターン発生モデル409と1セグメントデータとを尤度関数(式1)に入力して第2の時系列パターン発生モデル409に対する尤度を求める。モデル尤度算出部404は、算出した第1及び第2の時系列パターン発生モデル409に対する尤度(尤度データ408)と、1セグメント取出部402から受け取った1セグメントデータ403とを、尤度評価部405に送出する。
【0096】
尤度評価部405は、(式2)に従って、尤度データ408を用いて、尤度比Rを算出し、算出した尤度比Rを、入力された類似度パラメータ106と比較する。尤度評価部405は、ここでは、尤度比Rは類似度パラメータ106以下であると判断し(第1及び第2の時系列パターン発生モデル409のいずれにも類似していないと判断し)、1セグメントデータ403を新規モデル作成部407に送出する。
【0097】
新規モデル作成部407は、上述と同様にして、受け取った1セグメントデータ403を用いて、第3の時系列モデル発生モデル409を生成して図示しないバッファ内に記憶するとともに、セグメント取出継続評価部401に継続指示データ412を送出する。
【0098】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0099】
1セグメント取出部402は、セグメントデータ305内からさらに次の1セグメントデータ403(図6における形状y4の区間参照)を取り出し、モデル尤度計算部404に送出する。
【0100】
モデル尤度算出部404は、上述と同様に、第1、第2および第3の時系列パターン発生モデルに対する1セグメントデータ403の尤度を、尤度関数(式1)を用いて算出する。モデル尤度算出部404は、算出した3つの尤度のうち1番目及び2番目に大きいもの(尤度データ408)と、1セグメント取出部402から受け取った1セグメントデータ403とを、尤度評価部405に送出する。
【0101】
尤度評価部405は、受け取った尤度データ408を用いて、(式2)に従って、尤度比Rを算出する。尤度評価部405は、算出した尤度比Rと類似度パラメータ106とを比較する。尤度評価部405は、ここでは尤度比Rは類似度パラメータ106より大きいと判断する。尤度評価部405は、最大尤度を持つ時系列パターン発生モデル(ここでは第1の時系列パターン発生モデルとする)と1セグメントデータ403とは類似していると判断する。従って、尤度評価部405は、1セグメントデータ403と類似情報410とをモデル再学習部406に送出する。
【0102】
モデル再学習部406は、類似情報410に基づいて第1の時系列パターン発生モデル409を特定し、この第1の時系列パターン発生モデル409と1セグメントデータ403とを用いて、上述の(式3)に従って、第1の時系列パターン発生モデル409のパラメータを学習(更新)する。上述したように、形状の学習は行わず、長さと高さの平均及び標準偏差のみを更新する。パラメータを更新したモデル再学習部406は、セグメント取出継続評価部401に継続指示データ412を送出する。
【0103】
以上に説明した処理を、セグメントデータ305内の残りの他の1セグメントデータ403(図6における形状y5の区間参照)および走行時における各1セグメントデータ403(図6における形状y6〜y10の区間参照)についても行い、最終的に、パターン長が1である5つの時系列パターン発生モデル409(図7(a)参照)が取得される(図示しないバッファ内に格納される)。そして、セグメント取出継続評価部401は、セグメントデータ305内に取り出すべき1セグメントデータが存在しないと判断したら、上で取得された5つの時系列パターン発生モデル409をそれぞれ時系列パターンとして確定し、これらを生成時系列パターン307として出力する(図7(a)参照)。上述から分かるように、生成時系列パターン307を構成する各時系列パターンは、新規に時系列パターン発生モデルを生成する元となった1セグメントデータの長さ、高さ、形状と、上述した、長さ及び高さの平均及び標準偏差とを有する。なお、図7、図8、図9、図11及び図12に示される各時系列パターンに付された長さl、高さΔh及び形状yは、ここでは、この1セグメントデータの長さ、高さ、形状とする。
【0104】
以上では、パターン長が1の場合におけるモデル群生成部306の処理動作について説明したが、パターン長が2,3・・・の場合も同様にして行われる。
【0105】
次に、図1に示すように、時系列パターン評価部105について説明する。
【0106】
図2は、時系列パターン評価部105の構成を詳細に示す図である。
【0107】
上述したように、時系列パターン評価部105は、出力時系列パターン104が所望の基準を満たすか否かを判断し、満たす場合は、後述するようにして最終時系列パターン107を出力し、一方、満たさない場合は、類似度パラメータ106を補正する。
【0108】
図2に示すように、この時系列パターン評価部105は、出現確率計算部201、時系列パターン評価値計算部203、時系列パターン評価値評価部205および類似度パラメータ補正部206を備える。
【0109】
出現確率計算部201は、出力時系列パターン104を構成する各時系列パターン(図9参照)が、各時系列の状態(例えば歩行および走行)において出現する頻度(出現頻度)をそれぞれ調べる。そして、出現確率計算部201は、調べた結果を元に、各時系列パターンが、各状態において出現する確率(出現確率)を計算し、算出結果を出現確率202として時系列パターン評価値計算部203に送出する。
【0110】
図10は、図9の各時系列パターン1〜5,12,45(出力時系列パターン104)について算出した各状態における出現頻度(歩行時頻度及び走行時頻度)、各状態における出現確率202(歩行時確率及び走行時確率)及び時系列パターン評価値204(時系列パターン個別評価値の集合)を示した図表である。
【0111】
図10に示すように、各時系列パターン1〜5、12、45(図9参照)が、歩行時及び走行時のどちらに頻繁に現れるのかが分かる。例えば、時系列パターン1は、歩行時頻度が2、走行時頻度が0で、従って、歩行時確率は1、走行時確率は0である。
【0112】
時系列パターン評価値計算部203は、出現確率計算部201から受け取った出現確率202を用いて、各時系列パターンを評価するための時系列パターン個別評価値をそれぞれ算出し、算出した時系列パターン個別評価値を時系列パターン評価値204として時系列パターン評価値評価部205に送出する。ここで、時系列パターン個別評価値は、各時系列パターンの各状態への偏り具合状況を数値化して表したものである。
【0113】
図10に示す各時系列パターン個別評価値は、各時系列パターンの平均情報量(エントロピ)を元に算出したものである。この評価では、各時系列パターンは、平均情報量の値が低いほど各状態に偏った良い時系列パターンとなる。例えば、時系列パターン個別評価値が0のパターン1,2,4,5,12,45は、歩行時および走行時のいずれかにのみ出現する好ましい時系列パターンといえる。これに対し、時系列パターン個別評価値が0.150515のパターン3は、歩行時および走行時にそれぞれ同等の確率で出現しており、好ましくない時系列パターンであるといえる。
【0114】
時系列パターン評価値評価部205は、時系列パターン評価値計算部203から受け取った時系列パターン評価値204と入力された出力時系列パターン104とを用いて、出力時系列パターン104の評価を行う。
【0115】
より詳しくは、時系列パターン評価値評価部205は、時系列パターン評価値204を用いて出力時系列パターン104全体が所望の基準を満たすか否か評価するための時系列パターン全体評価値を算出する。
【0116】
時系列パターン評価値評価部205は、算出した時系列パターン全体評価値が所定の基準内にあれば、時系列パターン個別評価値が所定の基準外にある時系列パターンを除去したものを最終時系列パターン107として出力する。
【0117】
一方、時系列パターン評価値評価部205は、算出した時系列パターン全体評価値が所定の基準外ならば、時系列パターン評価値204を類似度パラメータ補正部206へ送出する。
【0118】
以下、出力時系列パターン104の評価について具体的に説明する。
【0119】
まず、図9〜図11を用いて、時系列パターン全体評価値が所定の基準内になる場合について説明する。
【0120】
時系列パターン評価値評価部205は、まず、時系列パターン評価値204の平均を算出し、これを時系列パターン全体評価値とする。時系列パターン評価値評価部205は、算出した時系列パターン全体評価値と、ユーザ等により設定された全体設定許容値0.11(ユーザにとって納得のいく出力時系列パターン104の水準を示し、好適には例えば0.15以下とする)とを比較する。つまり、時系列パターン評価値評価部205は、図10の時系列パターン評価値204の平均値0.022(=0.150515/7)と、全体設定許容値0.11とを比較する。平均値0.022は、全体設定許容値0.11よりも小さいので、時系列パターン評価値評価部205は、時系列パターン全体評価値は所定の基準内にあると判断する。時系列パターン評価値評価部205は、出力時系列パターン104を構成する各時系列パターン(図9参照)のうち、個別設定許容値(ユーザにとって納得のいく、各時系列パターンを評価する水準であり、ここでは全体設定許容値と同じ値0.11を有する)よりも高い時系列パターン個別評価値を有する時系列パターン(図10参照)が存在するか否かを判断する。そして、時系列パターン評価値評価部205は、そのような時系列パターンが存在すると判断した場合は、図9と図11とを比較して分かるように、その時系列パターン(図10の時系列パターン3)を出力時系列パターン104から除去する。そして、時系列パターン評価値評価部205は、除去後の出力時系列パターン104(図11参照)を最終時系列パターン107として出力する(図2参照)。
【0121】
上述では、全体設定許容値及び個別設定許容値としてそれぞれ同じ値を用いたが、それぞれ異なる値を設定してもよい。
【0122】
次に、図12および図13を用いて、時系列パターン評価値204から算出された時系列パターン全体評価値が所定の基準外になる場合について説明する。
【0123】
図12は、上述とは異なる値(上述よりも緩い値)を有する類似度パラメータ106によって時系列パターン生成部103(図1参照)において生成された出力時系列パターン104例を示す図である。この出力時系列パターン104は、上述と同様に、図5の時系列データ102から生成されたものである。
【0124】
図12に示すように、図9では異なる時系列パターンとして認識されていた時系列パターン12,45(図9参照)が、ここでは同一の時系列パターン12として認識されている。同様に、図9では異なる時系列パターンとして認識されていた時系列パターン1,4が、ここでは同一のパターン1として、また、図9では異なる時系列パターンとして認識されていた時系列パターン2,5が、ここでは、同一の時系列パターン2として認識されている。
【0125】
図13は、図12の各時系列パターンに対して上述と同様にして算出した各状態における出現頻度、各状態における出現確率202及び時系列パターン評価値204を示した図表である。
【0126】
ここで、出力時系列パターン104(図12参照)の評価について説明すると以下の通りである。
【0127】
上述と同様に、まず、時系列パターン評価値評価部205(図2参照)は、時系列パターン評価値204の平均(時系列パターン全体評価値)と、全体設定許容値0.11(所定の基準)とを比較する。時系列パターン評価値204の平均(時系列パターン全体評価値)は、図13から分かるように、0.150515であり、全体設定許容値0.11よりも大きい。従って、時系列パターン評価値評価部205は、時系列パターン全体評価値は所定の基準外にあると判断する。つまり、時系列パターン評価値評価部205は、図12の出力時系列パターン104は、目的を満たしていないと判断し、図2に示すように、時系列パターン評価値204を類似度パラメータ補正部206に送出する。
【0128】
類似度パラメータ補正部206は、時系列パターン評価値評価部205から受け取った時系列パターン評価値204を用いて類似度パラメータ206値を補正する(より厳しいものにする)。補正の例としては、時系列パターン評価値204の平均の前回との差分(初期値は例えば0とする)と、類似度パラメータ106の前回との差分(初期値は0とする)との比を定数倍し、今回の類似度パラメータ106からこれを減ずるなどがある。
【0129】
類似度パラメータ補正部206は、以上のようにして算出した補正後の類似度パラメータ106を、図1に示すように、時系列パターン生成部103に送出する。
【0130】
以上に説明したように、本実施の形態によれば、時系列データから、類似度パラメータで示される程度に相互に類似しない時系列パターンを、形状が複雑なものも含めて、パターン長を固定することなく、生成することができる。
【0131】
また、時系列データに加えて、時系列の状態も用いるようにしたので、各状態について、できるだけ他の状態には出現しない時系列パターンを生成することが可能となる。
【0132】
また、目的の基準に沿った時系列パターンが得られるまで、類似度パラメータを何度でも補正して、最終的に、時系列の状態全てに対して固有の時系列パターンを得ることができる。この際、効率よく類似パラメータを補正することで、より早く目的の基準に沿った時系列パターンを生成することが可能になる。
【0133】
また、生成された時系列パターンの各状態における出現確率を算出するようにしたので、時系列パターン個別評価値として、例えば平均情報量を用いることが可能となる。
【0134】
また、出現頻度が低い時系列パターンについては削除するようにしたので有効な時系列パターンの生成が可能となる。
【0135】
また、削除後残存時系列パターン内の各時系列パターンに対応する時系列データを含むように、パターン長増加後におけるセグメントデータの切出しを行うようにしたので、あまり重要でないセグメントデータの切出しを無視して、効率のよいセグメントデータの切出しが可能になる。
【0136】
また、セグメント情報(長さ及び高さ)のみではなく、正規化した形状をも用いて、時系列パターン発生モデルに対する尤度を計算するようにしたので、セグメントデータの形状が複雑な形状を保持していても、適正な類否判別が可能となる。つまり、セグメントデータが複雑な形状を保持していても、相互に類似しない時系列パターンを、長さと高さの曖昧さを吸収して、時系列データから効率よく生成することができる。
【0137】
また、得られた時系列パターンが目的に合うかどうかを評価し、目的に沿わない時系列パターンは除去するようにしたので、目的に沿った時系列パターンのみを確実に抽出することができる。
【0138】
また、各時系列の状態に偏った時系列パターンを抽出できるので、時系列パターンによるクラス分類も行うことができる。
【0139】
また、時系列パターン全体評価値(時系列パターン個別評価値の平均)と全体設定許容値(所定の基準)とを比較して出力時系列パターンを評価するようにしたので、ユーザにとって理解しやすい閾値設定を行うことが可能になる。
【0140】
また、各状態における時系列パターンの出現確率や、時系列パターン全体評価値、時系列パターン個別評価値等を画面上等に表示することで、ユーザが時系列パターンを自ら選択することもできる。
【0141】
【発明の効果】
本発明により、各状態に対して他の状態と区別することができる固有の時系列パターンを各状態から得られた時系列データに基づき自動的に生成できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に関わる時系列パターン生成装置の構成例を示す図。
【図2】時系列パターン生成装置における時系列パターン評価値評価部の構成例を示す図。
【図3】時系列パターン生成装置における時系列パターン生成部の構成例を示す図。
【図4】時系列パターン生成部におけるモデル群生成部の構成例を示す図。
【図5】状態データおよび時系列データを説明するための図。
【図6】セグメント情報、セグメントデータおよび1セグメントデータを説明するための図。
【図7】生成時系列パターンの例を示す図。
【図8】削除後残存時系列パターンの例(パターン長が2の場合)を示す図。
【図9】出力時系列パターンの例を示す図。
【図10】出現頻度、出現確率および時系列パターン個別評価値の例を示す図表。
【図11】最終時系列パターンの例を示す図。
【図12】途中段階での出力時系列パターンの例を示す図。
【図13】途中段階での出現確率および時系列パターン個別評価値の例を示す図表。
【符号の説明】
101 状態データ
102 時系列データ
103 時系列パターン生成部
104 出力時系列パターン
105 時系列パターン評価部
106 類似度パラメータ
107 最終時系列パターン
201 出現確率計算部
202 出現確率
203 時系列パターン評価値計算部
204 時系列パターン評価値
205 時系列パターン評価値評価部
206 類似度パラメータ補正部
301 セグメント化部
302 セメント情報
303 セグメント切出し部
305 セグメントデータ
306 モデル群生成部
307 生成時系列パターン
308 時系列パターン削除部
309 削除後残存時系列パターン
311 継続評価部
312 継続処理部
401 セグメント取出継続評価部
402 1セグメント取り出し部
403 1セグメントデータ
404 モデル尤度計算部
405 尤度評価部
406 モデル再学習部
407 新規モデル作成部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a time-series pattern generation apparatus and a time-series pattern generation method for generating a time-series pattern specific to each state from time-series data corresponding to a plurality of states to be observed, and time series data that are not similar to each other. The present invention relates to a time series pattern generation method for generating a series pattern.
[0002]
[Prior art]
With the improvement of sensing technology and processor technology, sensors have become familiar with the reduction in cost. For example, it has become possible to attach a sensor to the foot and acquire the operation as time-series data.
[0003]
Therefore, it is becoming possible to attach a sensor to a person to acquire time series data, and to generate a characteristic time series pattern that appears when the person performs some action from the acquired time series data. Yes. In addition, in order to identify what kind of action the person is doing, the time series data obtained from each action (time series state) is used to generate a time series pattern specific to each action. Has also become required.
[0004]
However, in general, the time series pattern to be acquired often has a huge amount, and there is a problem that it takes a lot of labor to search for the time series pattern by hand.
[0005]
Also, there is no known method for generating a time series pattern specific to each operation using the above-described latter, that is, time series data obtained from each state.
[0006]
On the other hand, with respect to the former, that is, to generate a time-series pattern characteristic of this state using time-series data obtained from a certain state, as a method for realizing this, for example, time-series clustering and rule analysis (Non-Patent Document 2) is extended in time series.
[0007]
However, in any case, it is necessary to divide the time series data into segments (segmentation) according to an appropriate standard for processing, but in the former time series clustering, the number of segments (number of segments), that is, the pattern length is constant. There is a drawback that it is necessary to be (fixed).
[0008]
On the other hand, the latter rule analysis has the advantage that the pattern length is automatically determined and the time series pattern can be generated efficiently. However, when generating a time series pattern with a long pattern length, the time series with a short pattern length is used. A long time series pattern is expressed by combining patterns. For this reason, there exists a fault which each time series pattern tends to be averaged. This is because a short time-series pattern is simple in shape, and thus there are many approximate time-series patterns in many cases. Therefore, this method has a drawback that it cannot handle time-series patterns having a complicated shape when the pattern length becomes long.
[0009]
By the way, when generating a time series pattern, it is preferable that a lot of similar time series patterns are not generated. Therefore, it is necessary to determine similarity of the extracted time series data. In the similarity determination, there is a request that it is the same if the shape is similar even if the length and height are different (to absorb the ambiguity of the length and height). There was a drawback that only the length ambiguity could be absorbed. On the other hand, there is a method using a time series pattern generation model (Non-patent Document 1) as a method that can absorb both ambiguity in length and height, but this method regards a straight line without retaining the shape of the time series. For this reason, there is a disadvantage that complicated shapes cannot be distinguished from each other.
[0010]
[Patent Document 1]
JP 11-326542 A
[Patent Document 2]
JP-A-9-34719
[Non-Patent Document 1]
Xianping Ge and Padhric Smith, Deformable Markov Model Templates for Time-Series Pattern Matching, ACM SIGKDD (KDD-2000), pp. 81-90, 2000
[Non-Patent Document 2]
Rakesh Agrawal, Tomasz Imielinski, Arun N .; Swami, Mining Association Rules between Sets of Items in Large Databases, SIGMOD Conference 1993, pp. 207-216, 1993
[0011]
[Problems to be solved by the invention]
As described above, conventionally, there has been a problem in that a time series pattern that can be distinguished from other time series states cannot be automatically generated for each time series state. In addition, when the pattern length is increased, there is a problem that a complicated shape cannot be handled. Furthermore, there is a problem that it is impossible to determine the similarity of a complicated shape that absorbs the ambiguity of length and height.
[0012]
The present invention has been made in consideration of the above-described circumstances, and each time-series state can be distinguished from other time-series states, and a time-series pattern unique to each time-series state is automatically generated. An object of the present invention is to provide a time-series pattern generation device and a time-series pattern generation method that can be generated easily. It is another object of the present invention to provide a time-series pattern generation method that can handle a complicated shape even when the pattern length increases. Furthermore, an object of the present invention is to provide a time-series pattern generation method that makes it possible to determine the similarity of complex shapes, thereby taking into account complex shapes in addition to length and height.
[0013]
[Means for Solving the Problems]
The time-series pattern generation device of the present invention is a time-series pattern generation device that generates a time-series pattern specific to each state using time-series data corresponding to a plurality of states to be observed, the plurality of time-series patterns A plurality of partial data groups having the same similarity from the plurality of partial data are extracted using a similarity determination criterion for cutting out a plurality of partial data from the series data and determining the similarity between the partial data. A time series pattern generation unit that extracts and generates a time series pattern corresponding to each of the plurality of partial data groups, and whether the time series pattern generated by the time series pattern generation unit conforms to a predetermined standard If within the predetermined criteria, the relationship between each of the time series patterns and the frequency of appearance of each of the time series patterns in each time series data The time series pattern is specified as one of the states based on the output time, and the specified time series pattern is output as a final time series pattern. And the corrected similarity determination criterion is output to the time-series pattern generation unit in order to cause the time-series pattern generation unit to generate the time-series pattern again using the corrected similarity determination criterion. And a time-series pattern evaluation unit.
[0014]
The time-series pattern generation method of the present invention is a time-series pattern generation method for generating a time-series pattern specific to each state using time-series data corresponding to a plurality of states to be observed. A plurality of partial data groups having the same similarity from the plurality of partial data are extracted using a similarity determination criterion for cutting out a plurality of partial data from the series data and determining the similarity between the partial data. A time series pattern generation step for extracting and generating a time series pattern corresponding to each of the plurality of partial data groups, and whether or not the time series pattern generated by the time series pattern generation step conforms to a predetermined standard Each time series pattern and each time series pattern occurrence in each time series data if within the predetermined criteria Based on the relationship with the degree, the time series pattern is specified as any of the states, and the specified time series pattern is output as a final time series pattern. A time series pattern evaluation step of correcting the similarity determination criterion and performing the time series pattern generation step again according to the corrected similarity determination criterion.
[0015]
The time-series pattern generation method of the present invention is a time-series pattern generation method for generating time-series patterns that are not similar to each other from time-series data, and the time-series data is divided into several segments based on a certain reference, and a specific segment From the plurality of partial data, using a partial data cutting step for cutting out each of the partial data from each of the time series data in a long unit and a similarity determination criterion for determining the similarity between the partial data The time series pattern corresponding to each of the plurality of partial data groups in a state in which a plurality of partial data groups having the same similarity relation are extracted and the number of partial data included in the partial data group is included as an appearance frequency From a model group generation step for generating the model group and the time series pattern generated by the model group generation step. A time-series pattern deletion step of deleting the time-series pattern having the appearance frequency equal to or lower than a threshold value, and evaluating the number of the time-series patterns remaining after the deletion to determine whether to continue or not. The time-series pattern remaining after deletion is stored, and the segment length is changed to perform the steps and the main step. On the other hand, in the case of non-continuation, the time-series pattern for each stored segment length is output. And a continuous evaluation step.
[0016]
The time series pattern generation method of the present invention is a time series pattern generation method for generating time series patterns that are not similar to each other using a plurality of partial data cut out from the time series data, and generates the time series pattern. A new model creation step for creating a time series pattern generation model to be a model, and a model relearning step for correcting the time series pattern generation model, and the likelihood of each of the partial data for the time series pattern generation model, Model likelihood calculation step for calculating from the viewpoint of the length and height of the partial data, and the shape excluding the influence of the length and the height by normalization, and calculation for each time series pattern generation model A similarity discriminator for discriminating between the likelihood and the similarity between the partial data and the time series pattern generation model A likelihood evaluation step for evaluating whether or not the time-series pattern generation model similar to the partial data exists using the similarity parameter as If not, perform the new model creation step to create the time series pattern generation model, and if there is a similar time series pattern generation model, the time series pattern generation model having the highest likelihood is A likelihood evaluation step for performing correction by performing the model relearning step, and determining whether or not to repeat the model likelihood calculation step and the likelihood evaluation step for the other partial data. The model likelihood calculation step and the likelihood evaluation step are performed on the other partial data and are not repeated. When determining is characterized by comprising a further processing step of each said time series pattern generation model of the final state is determined as each of said time-series pattern.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
First, features of the present embodiment will be briefly described.
[0018]
FIG. 5 is a diagram showing time-series data 102 composed of time-series data obtained during walking and time-series data obtained during travel. This time-series data 102 is obtained from, for example, an acceleration sensor attached to a biological foot.
[0019]
In the figure, state data (label) 101 including a walking label and a traveling label is shown. The state data 101 is used to specify in what state the time-series data 102 has been acquired, as will be described later.
[0020]
In the present embodiment, a time series pattern specific to each state is generated using such time series data of each state (eg, walking, running).
[0021]
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0022]
FIG. 1 is a diagram illustrating a configuration example of a time-series pattern generation apparatus according to an embodiment of the present invention.
[0023]
As illustrated in FIG. 1, the time-series pattern generation device includes a time-series pattern generation unit 103 and a time-series pattern evaluation unit 105.
[0024]
The time-series pattern generation unit 103 uses the input state data 101 (see FIG. 5) and time-series data 102 (see FIG. 5) to have various pattern lengths that are not similar to each other (the pattern length is unfixed). Generate a time series pattern. Generation of time series patterns that are not similar to each other is performed using a similarity parameter 106 (similarity criterion) described later. The time series pattern generation unit 103 outputs the generated time series pattern group as an output time series pattern 104.
[0025]
FIG. 9 to be described later is a diagram showing an example of a time series pattern generated from the time series data 102 of FIG. In FIG. 9, a time series pattern with a pattern length of 1 (upper stage) and a time series pattern with a pattern length of 2 (lower stage) are shown.
[0026]
The time series pattern evaluation unit 105 uses the output time series pattern 104 output from the time series pattern generation unit 103 to evaluate whether or not the output time series pattern 104 satisfies a desired criterion.
[0027]
More specifically, first, the time series pattern evaluation unit 105 individually evaluates the time series pattern overall evaluation value for evaluating the entire output time series pattern 104 and each time series pattern constituting the output time series pattern 104. The time series pattern individual evaluation value for this is calculated using a method described later.
[0028]
Next, the time-series pattern evaluation unit 105 determines whether or not the time-series pattern overall evaluation value is within a predetermined standard, and if it is determined that it is within the predetermined standard, next, It is determined whether or not the time series pattern individual evaluation value is within a predetermined standard. When the time-series pattern evaluation unit 105 determines that there is a time-series pattern individual evaluation value that is outside the predetermined reference, the time-series pattern evaluation unit 105 deletes the time-series pattern having the time-series pattern individual evaluation value from the output time-series pattern 104. The time series pattern evaluation unit 105 outputs the output time series pattern 104 in this state as a final time series pattern 107 as shown in FIG.
[0029]
On the other hand, when the time series pattern evaluation unit 105 determines that the overall time series pattern evaluation value is outside the predetermined reference, the above-described similarity is determined using the overall time series pattern evaluation value or each time series pattern individual evaluation value. The parameter 106 is corrected in a more severe direction. Then, as shown in FIG. 1, the time-series pattern evaluation unit 105 sends the corrected similarity parameter 106 to the time-series pattern generation unit 104 and again causes the time-series pattern generation unit 103 to correct the similarity after correction. The output time series pattern 104 is output by the parameter 106. The time series pattern evaluation unit 105 repeats the correction of the similarity parameter 106 until the time series pattern overall evaluation value falls within a predetermined standard.
[0030]
The final time series pattern 107 output by the time series pattern evaluation unit 105 is a time series pattern finally obtained by this method (for example, a time series pattern unique to walking, a time series pattern unique to running). An example of the final time series pattern 107 is shown in FIG. This is obtained by removing the time series pattern (pattern 3) in which the time series pattern individual evaluation value is determined to be outside the predetermined reference from the output time series pattern 104 of FIG. 9 as described above. As will be apparent from the description below, the patterns 1, 2, and 12 are time series patterns unique to walking, and the other patterns 4, 5, and 45 are time series patterns unique to running. Note that the time series pattern evaluation unit 105 outputs only some of the top ranks (for example, those having a high appearance frequency) when there are a large number of time series patterns whose time series pattern individual evaluation values are within a predetermined standard. Anyway.
[0031]
Next, the time series pattern generation unit 103 and the time series pattern evaluation unit 105 will be described in more detail.
[0032]
First, the time series pattern generation unit 103 will be described.
[0033]
FIG. 3 is a diagram showing in detail the configuration of the time series pattern generation unit 103.
[0034]
As described above, the time series pattern generation unit 103 generates the output time series pattern 104 using the time series data 102 and the state data 101.
[0035]
As shown in FIG. 3, the time series pattern generation unit 103 includes a segmentation unit 301, a segment cutout unit 303, a model group generation unit 306, a time series pattern deletion unit 308, a continuation evaluation unit 311, and a continuation processing unit 312. Prepare.
[0036]
The segmentation unit 301 divides the input time series data 102 into a plurality of sections (segments) on a predetermined basis (segmentation), and for each section, a section size (length in the case of a one-dimensional time series), Calculate the height of the section. The segmenting unit 301 outputs the section size and the section height for each section as segment information 302. As an example of segmentation, there is piecewise linear approximation (in the case of a one-dimensional time series, broken line).
[0037]
FIG. 6 is a diagram showing a state in which time-series data (see FIG. 5) during walking and running are segmented.
[0038]
In FIG. 6, the segment information 302 described above is all data of (length l, height Δh) = (l1, Δh1), (l2, Δh2),..., (L10, Δh10). Here, heights Δh1, Δh2,... Δh10 (not shown) are the differences between the maximum height and the minimum height in each corresponding section. As the height of the section, for example, a difference in height between the beginning and the end of the section may be taken.
[0039]
As shown in FIG. 3, the segment cutout unit 303 adds segment data 305 (state data is not shown) to each piece of data constituting the segment information 302 described above by adding shape data of each section and input state data. ) Is generated. In the example of FIG. 6, the segment data 305 includes (length l, height Δh, shape y) = (l1, Δh1, y1), (l2, Δh2, y2),..., (L10, Δh10, y10). ) Of all data (state data not shown). The shape data y1, y2... Includes the length and height of the corresponding section, but the length and height data are obtained separately from the shape data because they are used in calculations described later. . Each piece of data (length l, height Δh, shape y) (state data not shown) constituting the segment data 305 is referred to as one segment data 403.
[0040]
The model group generation unit 306 uses the segment data 305 generated by the segment cutout unit 303 and the similarity parameter 106 described later, and is not similar to each other, and a time-series pattern based on a specific pattern length (number of segments) (for each state) Including frequency of appearance in time series data). The model group generation unit 306 outputs the generated time series pattern group as a generation time series pattern 307.
[0041]
FIGS. 7A and 7B are diagrams showing an example of a generated time series pattern 307 generated from the segment data 305 (see FIG. 6).
[0042]
More specifically, FIG. 7A is a diagram illustrating an example of a generated time series pattern 307 generated when the pattern length is 1. As shown in the figure, here, five time series patterns 1 to 5 are generated. Here, for example, “Reference: y1, y4” of the time-series pattern 1 indicates that it corresponds to the shapes y1, y4 in FIG. That is, the pattern 1 is a time series pattern generated from the shapes y1 and y4.
[0043]
On the other hand, FIG. 7B is a diagram showing an example of a generation time series pattern when the pattern length is 2. As shown in the figure, when the pattern length is 2, six time-series patterns 12, 23, 31, 45, 53, and 34 are generated.
[0044]
As shown in FIG. 3, the time series pattern deletion unit 308 deletes time series patterns whose appearance frequency is equal to or less than the deletion threshold among the time series patterns in the generated time series pattern 307 and deletes the remaining time series patterns. The remaining time series pattern 309 is output. This is because the time series pattern with a low appearance frequency is deleted to increase the calculation efficiency in the continuation evaluation unit 311 described later.
[0045]
FIG. 8 is a diagram illustrating an example of a post-deletion remaining time series pattern 309 obtained when the deletion threshold is set to 1 with respect to the generation time series pattern 307 (see FIG. 7B) having a pattern length of 2. .
[0046]
As can be seen by comparing FIG. 7B and FIG. 8, time series patterns 23, 31, 53, and 34 having an appearance frequency of 1 are deleted from the six time series patterns shown in FIG. 7B. Then, the patterns 12 and 45 whose appearance frequency is 2 are output as the remaining time series pattern 309 after deletion.
[0047]
The continuous evaluation unit 311 examines the number of time series patterns in the post-deletion remaining time series pattern 309 output by the time series pattern deletion unit 308. If the continuous evaluation unit 311 determines that the number of time-series patterns in the remaining time-series pattern 309 after deletion is not 0, that is, if it is determined that there is a possibility that a time-series pattern having a larger pattern length can be generated, After the post-deletion remaining time series pattern 309 is stored, the process proceeds to the continuation processing unit 312.
[0048]
That is, the continuation processing unit 312 generates the segment data 305 having an increased pattern length (for example, increasing the pattern length from 1 to 2 or from 2 to 3) using the time-series data 102. At this time, the segment data 305 is acquired in a state including a portion of the time series data corresponding to the time series pattern in the remaining time series pattern 309 after deletion. This is to achieve efficient processing by suppressing the extraction of data that seems to be less important.
[0049]
On the other hand, if the continuation evaluation unit 311 determines that the number of time series patterns in the remaining time series pattern 309 after deletion is 0, that is, it is determined that there is no possibility of generating a time series pattern having a larger pattern length. In this case, the post-deletion remaining time series pattern 309 for each pattern length is output as the output time series pattern 104.
[0050]
FIG. 9 briefly described above is a diagram showing an example of an output time series pattern 104 obtained from the time series data 102 shown in FIG.
[0051]
Hereinafter, the processing operation by the above-described time series pattern generation unit 103 will be described in detail by taking as an example the case of generating the output time series pattern 104 of FIG. 9 from the time series data 102 of FIG.
[0052]
First, as shown in FIG. 3, the segmenting unit 301 segments the time-series data 102 (see FIG. 5) (see FIG. 6) to segment information 302 (length l1, height Δh) (length l2, Height Δh2)... Is generated and sent to the segment cutout unit 303.
[0053]
The segment cutout unit 303 uses the segment information 302 to generate segment data 305 (length 11, height Δh 1, shape y 1) (length 12, height Δh 2, shape y 2) (state data is not shown). )) Is generated and sent to the model group generation unit 306.
[0054]
The model group generation unit 306 uses the segment data 305 (length 11, height Δh 1, shape y 1) (length 12, height Δh 2, shape y 2) (state data not shown). A generated time-series pattern 307 (see FIG. 7A) consisting of time-similar patterns having a length of 1 and not similar to each other is generated and sent to the time-series pattern deleting unit 308.
[0055]
The time-series pattern deletion unit 308 deletes the time-series pattern having an appearance frequency of 1 or less from the received generated time-series pattern 307 and sends it to the continuous evaluation unit 311 as the remaining time-series pattern 309 after deletion (upper part of FIG. 9). reference).
[0056]
The continuous evaluation unit 311 determines the number of time-series patterns in the remaining time-series pattern 309 after deletion. In this case, since the number of patterns is not 0 (the number of patterns is 5 as shown in the upper part of FIG. 9), the post-deletion remaining time series pattern 309 is stored internally, and the post-deletion residual time series pattern 309 is continuously processed. To the unit 312.
[0057]
The continuation processing unit 312 generates segment data 305 having a pattern length of 2 using the received post-deletion remaining time-series pattern 309 and the time-series data 102 and sends the segment data 305 to the model group generation unit 306.
[0058]
Using the received segment data 305, the model group generation unit 306 generates a generation time series pattern 307 having a pattern length of 2 (see FIG. 7B) and sends it to the time series pattern deletion unit 308.
[0059]
The time series pattern deletion unit 308 deletes the time series pattern having an appearance frequency of 1 or less from the received generated time series pattern 307 (see the lower part of FIG. 9), and continues the evaluation unit 311 as the remaining time series pattern 309 after deletion. To send.
[0060]
The continuous evaluation unit 311 determines the number of time series patterns in the post-deletion remaining time series pattern 309. In this case, since the number of patterns is not 0 (the number of patterns is 2 as shown in the lower part of FIG. 9), the post-deletion remaining time series pattern 309 is stored, and the post-deletion remaining time series pattern 309 is stored in the continuation processing unit 312. Send it out.
[0061]
The continuation processing unit 312 generates segment data 305 with a pattern length of 3 using the received post-deletion remaining time-series pattern 309 and time-series data 102 and sends the segment data 305 to the model group generation unit 306.
[0062]
Using the received segment data 305, the model group generation unit 306 generates a generation time series pattern 307 having a pattern length of 3 (not shown) and sends it to the time series pattern deletion unit 308.
[0063]
The time-series pattern deleting unit 308 deletes the time-series pattern having an appearance frequency of 1 or less from the received generated time-series pattern 307 as a post-deletion remaining time-series pattern 309 (not shown) and sends it to the continuous evaluation unit 311. To do.
[0064]
The continuous evaluation unit 311 determines the number of time series patterns in the post-deletion remaining time series pattern 309. Since the number of time series patterns is 0 (not shown), the continuation evaluation unit 311 outputs the post-deletion remaining time series pattern 309 (see FIG. 9) having the previously stored pattern lengths 1 and 2 as the output time series pattern 104. Output as.
[0065]
Here, the model group generation unit 306 (see FIG. 3) constituting the time series pattern generation unit 103 will be described in more detail.
[0066]
FIG. 4 is a diagram illustrating a detailed configuration example of the model group generation unit 306.
[0067]
As described above, the model group generation unit 306 includes the segment data 305 (length 11, height Δh 1, shape y 1) (length 12, height Δh 2, shape y 2) (state data not shown). The generation time series pattern 307 is generated from the above.
[0068]
As shown in FIG. 4, the model group generation unit 306 includes a segment extraction continuation evaluation unit 401, a one segment extraction unit 402, a model likelihood calculation unit 404, a likelihood evaluation unit 405, a model relearning unit 406, and a new model. A creation unit 407 is provided.
[0069]
The segment extraction continuation evaluation unit 401 determines whether all the one segment data 403 in the segment data 305 (each data constituting the segment data 305 as described above) has been extracted by the next one segment extraction unit 402. . When the segment extraction continuation evaluation unit 401 determines that one segment data 403 cannot be extracted any more, that is, if all the one segment data 403 in the segment data 305 has been extracted, A series pattern (see FIGS. 7A and 7B) is taken out from a buffer (not shown) and output as a generation time series pattern 307.
[0070]
On the other hand, when the segment extraction continuation evaluation unit 401 determines that the one segment data 403 to be extracted still exists in the segment data 305, the process proceeds to the one segment extraction unit 402.
[0071]
The one segment extraction unit 402 extracts the one segment data 403 from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0072]
The model likelihood calculation unit 404 is, for example, a likelihood function shown in the following (Equation 1).
[Expression 1]
Figure 2005031908
Are used to calculate the likelihood (fitness) of the one segment data 403 for each time series pattern generation model 409 (time series pattern as an intermediate stage) to be described later.
[0073]
Here, in (Equation 1), li, Δhi, Yi(T), μli, ΜΔhi, ΣliAnd σΔhiAre parameters of the time-series pattern generation model 409. More specifically, liIs the length, ΔhiIs height, yi(T) shows shape data. Also, as will become clear from the following, μliAnd σliIs the mean and standard deviation of the length, μΔhiAnd σΔhiIndicates the mean and standard deviation of the height. On the other hand, l ’i, Δh ’i, Y ’i(T) is a parameter of the one-segment data 403. Gμ , σ(X) represents a normal distribution function in which the average is μ and the standard deviation is σ.
[0074]
As shown in (Expression 1), this likelihood function obtains the degree of fit between the one-segment data 403 and each time-series pattern generation model from the viewpoints of length, height, and shape. Specifically, the likelihood function has three multiplication terms in Σ, the leftmost multiplication term is the fitness of length, the second multiplication term is the fitness of height, the third Corresponds to the conformity of the shape. The conformity of the shape is obtained by normalizing the shape data of the one-segment data 403 and the shape data of the time-series pattern generation model 409 (in a state in which the size is corrected to a reference size excluding the influence of the length and height). Seeking. Therefore, according to (Equation 1), even if the length and height are somewhat different, if the shapes are similar, the likelihood indicating high suitability is calculated. However, when the length or height of the one-segment data 403 is very different from the time-series pattern generation model 409, even if the shapes are similar, the length is low depending on the leftmost multiplication term and the second multiplication term. A likelihood indicating suitability is calculated.
[0075]
The model likelihood calculation unit 404 uses the maximum likelihood and the second likelihood of the likelihoods calculated using (Equation 1) as the likelihood data 408, as shown in FIG. It is sent to the next likelihood evaluation unit 405.
[0076]
The likelihood evaluating unit 405 is configured to calculate the maximum likelihood (maxQ calculated by the model likelihood calculating unit 404).i) And second likelihood (secondQi) Based on the likelihood ratio calculation formula shown in the following (Formula 2)
[Expression 2]
Figure 2005031908
The likelihood ratio R calculated by is calculated.
[0077]
The likelihood evaluation unit 405 calculates the calculated likelihood ratio R = maxQi/ SecondQiIs compared with the input similarity parameter 106 (a determination reference value for determining the similarity between the one-segment data 403 and the time-series pattern generation model). Likelihood evaluation section 405 uses likelihood ratio R = maxQ.i/ SecondQiIs determined to be equal to or less than the similarity parameter 106, it is determined that there is no time-series pattern generation model 409 similar to the one-segment data, and the one-segment data 403 is sent to the new model creation unit 407.
[0078]
The new model creation unit 407 receives the length, height and shape data of the received one-segment data 403, and the average of the length and height (here, the length and height of the one-segment data are used as initial values) A time-series pattern generation model 409 is created which includes standard deviations of length and height (here, 0 as an initial value or 30% of the average of standard deviations already obtained). The new model creation unit 407 stores the created time-series pattern generation model 409 in a buffer (not shown), and sends the continuation instruction data 412 to the segment extraction continuation evaluation unit 401, and shifts the processing to the segment continuation evaluation unit 401. .
[0079]
On the other hand, the likelihood evaluation unit 405 calculates the calculated likelihood ratio R = maxQ.i/ SecondQiIs determined to be larger than the similarity parameter 106, the one-segment data 403 has a maximum likelihood maxQiIs determined to be similar to the time-series pattern generation model 409. Likelihood evaluation unit 405 sends 1-segment data 403 and similar information 410 (information indicating which time-series pattern generation model is similar) to model re-learning unit 406, to model re-learning unit 406. Migrate processing.
[0080]
The model re-learning unit 406 takes out the time-series pattern generation model specified in the similar information 410 from a buffer (not shown), and sets the parameters of this time-series pattern generation model according to the average / standard deviation update function shown in (Equation 3) below. Learn (update).
[Equation 3]
Figure 2005031908
[0081]
As shown in (Expression 3), the model re-learning unit 406 does not learn the shape, and updates only the average length and standard deviation, and the average height and standard deviation. The model relearning unit 406 uses the updated time series pattern generation model 409 to replace the corresponding time series pattern generation model 409 in a buffer (not shown). On the other hand, the model re-learning unit 406 sends the continuation instruction data 412 to the segment extraction continuation evaluation unit 401 and shifts the processing to the segment extraction continuation evaluation unit 401.
[0082]
Hereinafter, the processing operation by the model group generation unit 306 will be described by taking as an example a case where a generation time series pattern 307 (see FIG. 7A) having a segment length of 1 is generated.
[0083]
First, as shown in FIG. 4, the segment extraction continuation evaluation unit 401 determines whether or not one segment data 403 to be extracted exists in the segment data 305 (the one at the time of walking). Here, the segment extraction continuation evaluation unit 401 determines that there is one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0084]
The 1-segment extraction unit 402 extracts 1-segment data 403 (see the section of the shape y1 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0085]
Since the model likelihood calculation unit 404 does not yet have the time series pattern generation model 409 in the buffer (not shown) (at least two time series pattern generation models are required to calculate the likelihood ratio R), the likelihood is calculated. Without calculation, the received one-segment data 403 is sent to the likelihood evaluation unit 405 as it is.
[0086]
The likelihood evaluating unit 405 also sends the received one segment data 403 to the new model creating unit 407 as it is.
[0087]
The new model creation unit 407 uses the received 1-segment data 403 to generate shape data, length and height, and average and standard deviation of the length and height as the first time-series pattern generation model 409. And stored in a buffer (not shown). Also, the new model creation unit 407 sends continuation instruction data 412 to the segment extraction continuation evaluation unit 401.
[0088]
The segment extraction continuation evaluation unit 401 that has received the continuation instruction data 412 determines whether there is still one segment data 403 to be extracted in the segment data 305 (see FIG. 6). Here, the segment extraction continuation evaluation unit 401 determines that there is still one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0089]
The 1-segment extraction unit 402 extracts the next 1-segment data 403 (see the section of the shape y2 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0090]
The model likelihood calculation unit 404 sends the one segment data 403 to the likelihood evaluation unit 405 as it is, as described above.
[0091]
The likelihood evaluating unit 405 also sends the received one segment data 403 to the new model creating unit 407 as it is.
[0092]
The new model creation unit 407 generates a second time-series pattern generation model 409 using the received one segment 403 in the same manner as described above, stores it in a buffer (not shown), and extracts the segment extraction continuation evaluation unit. The continuation instruction data 412 is sent to 401.
[0093]
The segment extraction continuation evaluation unit 401 that has received the continuation instruction data 412 determines whether there is still one segment data to be extracted in the segment data 305 (see FIG. 6). Here, the segment extraction continuation evaluation unit 401 determines that there is still one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0094]
The 1-segment extraction unit 402 further extracts the next 1-segment data 403 (see the section of the shape y3 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0095]
The model likelihood calculating unit 404 inputs the first time-series pattern generation model 409 and the one-segment data in the above-described buffer (not shown) to the likelihood function (Equation 1), and inputs the first time-series pattern generation model. The likelihood for 409 is obtained. Further, the model likelihood calculating unit 404 inputs the above-described second time series pattern generation model 409 and one segment data into the likelihood function (Equation 1), and the likelihood for the second time series pattern generation model 409. Ask for. The model likelihood calculating unit 404 calculates the likelihood (likelihood data 408) for the calculated first and second time series pattern generation models 409 and the one segment data 403 received from the one segment extracting unit 402 as the likelihood. The data is sent to the evaluation unit 405.
[0096]
The likelihood evaluation unit 405 calculates a likelihood ratio R using the likelihood data 408 according to (Equation 2), and compares the calculated likelihood ratio R with the input similarity parameter 106. Here, the likelihood evaluation unit 405 determines that the likelihood ratio R is equal to or less than the similarity parameter 106 (determines that it is not similar to any of the first and second time-series pattern generation models 409). 1 segment data 403 is sent to the new model creation unit 407.
[0097]
The new model creation unit 407 generates a third time series model generation model 409 using the received 1-segment data 403 and stores it in a buffer (not shown) in the same manner as described above. The continuation instruction data 412 is sent to 401.
[0098]
The segment extraction continuation evaluation unit 401 that has received the continuation instruction data 412 determines whether there is still one segment data 403 to be extracted in the segment data 305 (see FIG. 6). Here, the segment extraction continuation evaluation unit 401 determines that there is still one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0099]
The 1-segment extraction unit 402 further extracts the next 1-segment data 403 (see the section of the shape y4 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0100]
The model likelihood calculation unit 404 calculates the likelihood of the one segment data 403 for the first, second, and third time series pattern generation models using the likelihood function (Equation 1), as described above. The model likelihood calculating unit 404 evaluates the likelihood of the first and second largest (likelihood data 408) of the calculated three likelihoods and the one segment data 403 received from the one segment extracting unit 402. To the unit 405.
[0101]
The likelihood evaluating unit 405 calculates a likelihood ratio R according to (Equation 2) using the received likelihood data 408. The likelihood evaluation unit 405 compares the calculated likelihood ratio R with the similarity parameter 106. Here, the likelihood evaluation unit 405 determines that the likelihood ratio R is larger than the similarity parameter 106. The likelihood evaluation unit 405 determines that the time series pattern generation model having the maximum likelihood (here, the first time series pattern generation model) is similar to the one segment data 403. Therefore, the likelihood evaluation unit 405 sends the one-segment data 403 and the similar information 410 to the model relearning unit 406.
[0102]
The model re-learning unit 406 identifies the first time-series pattern generation model 409 based on the similar information 410, and uses the first time-series pattern generation model 409 and the one-segment data 403, to According to 3), the parameters of the first time-series pattern generation model 409 are learned (updated). As described above, shape learning is not performed, and only the average of length and height and the standard deviation are updated. The model relearning unit 406 that has updated the parameters sends the continuation instruction data 412 to the segment extraction continuation evaluation unit 401.
[0103]
The processing described above is performed by using the remaining one segment data 403 in the segment data 305 (refer to the section of the shape y5 in FIG. 6) and the one segment data 403 at the time of traveling (refer to the sections of the shapes y6 to y10 in FIG. 6). ), And finally, five time-series pattern generation models 409 (see FIG. 7A) having a pattern length of 1 are acquired (stored in a buffer (not shown)). When the segment extraction continuation evaluation unit 401 determines that there is no one segment data to be extracted from the segment data 305, the five time-series pattern generation models 409 acquired above are determined as time-series patterns, respectively. Is generated as a generated time series pattern 307 (see FIG. 7A). As can be seen from the above, each time-series pattern constituting the generated time-series pattern 307 includes the length, height, and shape of the one-segment data from which the time-series pattern generation model is newly generated, With mean and standard deviation of length and height. The length l, the height Δh, and the shape y given to each time series pattern shown in FIGS. 7, 8, 9, 11, and 12 are the length of this one segment data, Height and shape.
[0104]
The processing operation of the model group generation unit 306 when the pattern length is 1 has been described above, but the same operation is performed when the pattern length is 2, 3,.
[0105]
Next, as shown in FIG. 1, the time series pattern evaluation unit 105 will be described.
[0106]
FIG. 2 is a diagram showing in detail the configuration of the time series pattern evaluation unit 105.
[0107]
As described above, the time series pattern evaluation unit 105 determines whether or not the output time series pattern 104 satisfies a desired criterion, and if so, outputs the final time series pattern 107 as described later, If not satisfied, the similarity parameter 106 is corrected.
[0108]
As illustrated in FIG. 2, the time series pattern evaluation unit 105 includes an appearance probability calculation unit 201, a time series pattern evaluation value calculation unit 203, a time series pattern evaluation value evaluation unit 205, and a similarity parameter correction unit 206.
[0109]
The appearance probability calculation unit 201 examines the frequency (appearance frequency) at which each time series pattern (see FIG. 9) constituting the output time series pattern 104 appears in each time series state (for example, walking and running). Then, the appearance probability calculation unit 201 calculates the probability (appearance probability) that each time series pattern appears in each state based on the result of the examination, and sets the calculation result as the appearance probability 202 to calculate the time series pattern evaluation value To 203.
[0110]
FIG. 10 shows the appearance frequency (walking frequency and running frequency) in each state calculated for each time series pattern 1 to 5, 12, 45 (output time series pattern 104) in FIG. 10 is a chart showing a walking probability and a running probability) and a time-series pattern evaluation value 204 (a set of time-series pattern individual evaluation values).
[0111]
As shown in FIG. 10, it can be seen whether each time-series pattern 1-5, 12, 45 (see FIG. 9) appears frequently during walking or running. For example, the time series pattern 1 has a walking frequency of 2 and a running frequency of 0, and thus the walking probability is 1 and the running probability is 0.
[0112]
The time series pattern evaluation value calculation unit 203 uses the appearance probability 202 received from the appearance probability calculation unit 201 to calculate each time series pattern individual evaluation value for evaluating each time series pattern, and calculates the calculated time series pattern. The individual evaluation value is sent to the time series pattern evaluation value evaluation unit 205 as the time series pattern evaluation value 204. Here, the time-series pattern individual evaluation value is a numerical representation of the state of bias of each time-series pattern to each state.
[0113]
Each time series pattern individual evaluation value shown in FIG. 10 is calculated based on the average information amount (entropy) of each time series pattern. In this evaluation, each time series pattern becomes a good time series pattern that is biased to each state as the value of the average information amount is lower. For example, the patterns 1, 2, 4, 5, 12, and 45 having the time series pattern individual evaluation value of 0 can be said to be preferable time series patterns that appear only when walking or running. On the other hand, the pattern 3 having the time series pattern individual evaluation value of 0.150515 appears at the same probability during walking and running, and can be said to be an unfavorable time series pattern.
[0114]
The time series pattern evaluation value evaluation unit 205 evaluates the output time series pattern 104 using the time series pattern evaluation value 204 received from the time series pattern evaluation value calculation unit 203 and the input output time series pattern 104. .
[0115]
More specifically, the time series pattern evaluation value evaluation unit 205 uses the time series pattern evaluation value 204 to calculate a time series pattern overall evaluation value for evaluating whether or not the entire output time series pattern 104 satisfies a desired criterion. To do.
[0116]
The time series pattern evaluation value evaluation unit 205 removes the time series pattern in which the time series pattern individual evaluation value is outside the predetermined reference if the calculated time series pattern overall evaluation value is within the predetermined reference. Output as a sequence pattern 107.
[0117]
On the other hand, the time series pattern evaluation value evaluation unit 205 sends the time series pattern evaluation value 204 to the similarity parameter correction unit 206 if the calculated time series pattern overall evaluation value is outside a predetermined reference.
[0118]
Hereinafter, the evaluation of the output time series pattern 104 will be specifically described.
[0119]
First, the case where the entire time series pattern evaluation value falls within a predetermined standard will be described with reference to FIGS.
[0120]
First, the time-series pattern evaluation value evaluation unit 205 calculates an average of the time-series pattern evaluation values 204 and sets this as the time-series pattern overall evaluation value. The time-series pattern evaluation value evaluation unit 205 calculates the calculated time-series pattern overall evaluation value and the overall setting allowable value 0.11 set by the user or the like (shows the level of the output time-series pattern 104 that is satisfactory to the user, For example, 0.15 or less). That is, the time-series pattern evaluation value evaluation unit 205 compares the average value 0.022 (= 0.150515 / 7) of the time-series pattern evaluation value 204 of FIG. 10 with the overall setting allowable value 0.11. Since the average value 0.022 is smaller than the overall setting allowable value 0.11, the time series pattern evaluation value evaluation unit 205 determines that the time series pattern overall evaluation value is within a predetermined standard. The time-series pattern evaluation value evaluation unit 205 is an individual setting allowable value (at a level for evaluating each time-series pattern that is satisfactory to the user among the time-series patterns constituting the output time-series pattern 104 (see FIG. 9). Yes, here, it is determined whether or not there is a time-series pattern (see FIG. 10) having a time-series pattern individual evaluation value higher than that having the same value 0.11 as the overall setting allowable value. When the time-series pattern evaluation value evaluating unit 205 determines that such a time-series pattern exists, the time-series pattern (the time-series pattern in FIG. 10) can be understood by comparing FIG. 9 and FIG. 3) is removed from the output time series pattern 104. Then, the time series pattern evaluation value evaluation unit 205 outputs the output time series pattern 104 after removal (see FIG. 11) as the final time series pattern 107 (see FIG. 2).
[0121]
In the above description, the same value is used as the overall setting allowable value and the individual setting allowable value, but different values may be set.
[0122]
Next, a case where the time series pattern overall evaluation value calculated from the time series pattern evaluation value 204 is outside a predetermined standard will be described with reference to FIGS. 12 and 13.
[0123]
FIG. 12 is a diagram illustrating an example of the output time series pattern 104 generated in the time series pattern generation unit 103 (see FIG. 1) by the similarity parameter 106 having a value different from the above (a value looser than the above). This output time series pattern 104 is generated from the time series data 102 of FIG. 5 as described above.
[0124]
As shown in FIG. 12, the time series patterns 12 and 45 (see FIG. 9) recognized as different time series patterns in FIG. 9 are recognized as the same time series pattern 12 here. Similarly, time series patterns 1 and 4 recognized as different time series patterns in FIG. 9 are the same pattern 1 here, and time series patterns 2 and 2 recognized as different time series patterns in FIG. 5 are recognized as the same time-series pattern 2 here.
[0125]
FIG. 13 is a chart showing the appearance frequency in each state, the appearance probability 202 in each state, and the time series pattern evaluation value 204 calculated in the same manner as described above for each time series pattern in FIG.
[0126]
Here, the evaluation of the output time series pattern 104 (see FIG. 12) will be described as follows.
[0127]
Similarly to the above, first, the time series pattern evaluation value evaluation unit 205 (see FIG. 2) calculates the average of the time series pattern evaluation values 204 (time series pattern overall evaluation value) and the overall setting allowable value 0.11 (predetermined value). The standard). As can be seen from FIG. 13, the average of the time series pattern evaluation values 204 (time series pattern overall evaluation value) is 0.150515, which is larger than the overall setting allowable value 0.11. Therefore, the time-series pattern evaluation value evaluation unit 205 determines that the overall time-series pattern evaluation value is outside a predetermined standard. That is, the time series pattern evaluation value evaluation unit 205 determines that the output time series pattern 104 in FIG. 12 does not satisfy the purpose, and converts the time series pattern evaluation value 204 to the similarity parameter correction unit as shown in FIG. To 206.
[0128]
The similarity parameter correction unit 206 corrects the similarity parameter 206 value (makes it stricter) using the time series pattern evaluation value 204 received from the time series pattern evaluation value evaluation unit 205. As an example of correction, the ratio of the difference between the average of the time-series pattern evaluation values 204 (the initial value is 0, for example) and the difference between the previous time of the similarity parameter 106 (the initial value is 0) Is multiplied by a constant, and this is subtracted from the similarity parameter 106 of this time.
[0129]
The similarity parameter correction unit 206 sends the corrected similarity parameter 106 calculated as described above to the time-series pattern generation unit 103 as shown in FIG.
[0130]
As described above, according to the present embodiment, the time length of the time series patterns that are not similar to each other as much as indicated by the similarity parameter is fixed from the time series data, including those having complicated shapes. Can be generated without.
[0131]
In addition to the time-series data, the time-series state is also used, so that it is possible to generate a time-series pattern that does not appear in other states as much as possible.
[0132]
Further, the similarity parameter can be corrected any number of times until a time series pattern that meets the target standard is obtained, and finally, a unique time series pattern can be obtained for all the time series states. At this time, it is possible to generate a time series pattern according to a target criterion earlier by efficiently correcting the similar parameters.
[0133]
Moreover, since the appearance probability in each state of the generated time series pattern is calculated, for example, an average information amount can be used as the time series pattern individual evaluation value.
[0134]
Further, since a time series pattern with a low appearance frequency is deleted, an effective time series pattern can be generated.
[0135]
In addition, segment data is extracted after the pattern length has been increased so that time series data corresponding to each time series pattern in the remaining time series pattern after deletion is included, so segmentation of less important segment data is ignored. Thus, efficient segment data can be extracted.
[0136]
In addition, not only segment information (length and height) but also the normalized shape is used to calculate the likelihood for the time-series pattern generation model, so the shape of the segment data retains a complex shape Even if this is done, it is possible to determine the appropriate similarity. That is, even if the segment data has a complicated shape, time series patterns that are not similar to each other can be efficiently generated from the time series data by absorbing the ambiguity of length and height.
[0137]
In addition, it is evaluated whether or not the obtained time series pattern meets the purpose, and the time series pattern that does not meet the purpose is removed, so that only the time series pattern that meets the purpose can be reliably extracted.
[0138]
Further, since a time series pattern biased to each time series state can be extracted, class classification based on the time series pattern can also be performed.
[0139]
In addition, since the time series pattern overall evaluation value (average of time series pattern individual evaluation values) is compared with the overall set allowable value (predetermined standard), the output time series pattern is evaluated, which is easy for the user to understand. It is possible to set a threshold value.
[0140]
In addition, by displaying the appearance probability of the time series pattern in each state, the entire time series pattern evaluation value, the time series pattern individual evaluation value, and the like on the screen or the like, the user can select the time series pattern himself.
[0141]
【The invention's effect】
According to the present invention, a unique time series pattern that can be distinguished from other states for each state can be automatically generated based on time series data obtained from each state.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration example of a time-series pattern generation apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating a configuration example of a time series pattern evaluation value evaluation unit in the time series pattern generation device.
FIG. 3 is a diagram illustrating a configuration example of a time series pattern generation unit in the time series pattern generation apparatus.
FIG. 4 is a diagram illustrating a configuration example of a model group generation unit in a time series pattern generation unit.
FIG. 5 is a diagram for explaining state data and time-series data.
FIG. 6 is a diagram for explaining segment information, segment data, and one-segment data.
FIG. 7 is a diagram showing an example of a generated time series pattern.
FIG. 8 is a diagram showing an example of a time series pattern remaining after deletion (when the pattern length is 2);
FIG. 9 is a diagram showing an example of an output time series pattern.
FIG. 10 is a chart showing an example of appearance frequency, appearance probability, and time-series pattern individual evaluation value.
FIG. 11 is a diagram showing an example of a final time series pattern.
FIG. 12 is a diagram showing an example of an output time-series pattern at an intermediate stage.
FIG. 13 is a chart showing an example of an appearance probability and a time-series pattern individual evaluation value at an intermediate stage.
[Explanation of symbols]
101 Status data
102 Time series data
103 Time-series pattern generator
104 Output time series pattern
105 Time-series pattern evaluation unit
106 Similarity parameter
107 Final time series pattern
201 Appearance probability calculator
202 Appearance probability
203 Time series pattern evaluation value calculator
204 Time series pattern evaluation value
205 Time-series pattern evaluation value evaluation unit
206 Similarity parameter correction unit
301 Segmentation part
302 Cement information
303 Segment cutout
305 segment data
306 Model group generator
307 Generation time series pattern
308 Time series pattern deletion part
309 Time series pattern remaining after deletion
311 Continuous Evaluation Department
312 Continuation processing section
401 Segment extraction continuation evaluation department
402 1 segment take-out part
403 1 segment data
404 Model likelihood calculator
405 Likelihood evaluation unit
406 Model re-learning section
407 New model creation department

Claims (25)

観測対象の複数の状態に対応する時系列データを用いて、各状態に固有の時系列パターンを生成する時系列パターン生成装置であって、
複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成部と、
前記時系列パターン生成部によって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準を用いて前記時系列パターン生成部に再度、前記時系列パターンを生成させるために、補正した前記類似度判別基準を前記時系列パターン生成部に出力する時系列パターン評価部と、
を備えたことを特徴とする時系列パターン生成装置。
A time series pattern generation device that generates time series patterns specific to each state using time series data corresponding to a plurality of states to be observed,
A plurality of pieces of partial data are cut out from the plurality of pieces of time series data, and a plurality of pieces of partial data having the same similarity are used from the plurality of pieces of partial data by using a similarity determination criterion for determining the degree of similarity between the pieces of partial data. Extracting a partial data group and generating a time series pattern corresponding to each of the plurality of partial data groups; and
Evaluate whether or not the time series pattern generated by the time series pattern generation unit conforms to a predetermined standard, and if within the predetermined standard, each of the time series pattern and each of the time series pattern Based on the relationship with the appearance frequency in each of the time-series data, the time-series pattern is identified as one of the states, and the identified time-series pattern is output as a final time-series pattern, If it is not a predetermined criterion, the similarity determination criterion is corrected, and the time series pattern generation unit is corrected to generate the time series pattern again using the corrected similarity determination criterion. A time series pattern evaluation unit that outputs a similarity determination criterion to the time series pattern generation unit;
A time-series pattern generation device comprising:
前記時系列パターン評価部は、
各前記時系列パターンが各前記時系列データにおいてそれぞれ出現する確率を算出する出現確率計算部と、
算出された出現確率に基づき前記時系列パターンの全体を評価するための時系列パターン全体評価値を算出する時系列パターン評価値計算部と、
算出された前記時系列パターン全体評価値を全体設定許容値と比較し、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターンの前記出現確率が最も高い前記状態に各前記時系列パターンを特定する時系列パターン評価値評価部と、
算出された前記時系列パターン全体評価値が、前記全体設定許容値による基準外の場合には、前記時系列パターン全体評価値を用いて前記類似度判別基準を補正し、前記時系列パターン生成部に再度、補正後の前記類似度判別基準を用いて前記時系列パターンを生成させる類似度判別基準補正部と、
を備えることを特徴とする請求項1に記載の時系列パターン生成装置。
The time-series pattern evaluation unit
An appearance probability calculating unit for calculating a probability that each time series pattern appears in each time series data;
A time-series pattern evaluation value calculation unit that calculates a time-series pattern overall evaluation value for evaluating the entire time-series pattern based on the calculated appearance probability;
The calculated time-series pattern overall evaluation value is compared with an overall setting allowable value, and when the time-series pattern overall evaluation value is within the criteria based on the overall setting allowable value, the appearance probability of the time-series pattern is the highest. A time series pattern evaluation value evaluation unit that identifies each time series pattern in the high state,
When the calculated time-series pattern overall evaluation value is outside the reference based on the overall setting allowable value, the time-series pattern generation unit corrects the similarity determination criterion using the time-series pattern overall evaluation value. Again, a similarity determination reference correction unit that generates the time series pattern using the corrected similarity determination reference,
The time series pattern generation device according to claim 1, comprising:
前記時系列パターン評価値計算部は、算出された前記出現確率に基づき、前記時系列パターンごとに、前記時系列パターンを評価するための時系列パターン個別評価値を算出し、
前記時系列パターン評価値評価部は、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターン個別評価値を個別設定許容値と比較し、前記時系列パターン個別評価値が、前記個別設定許容値による基準外の場合には、基準外の前記時系列パターン個別評価値に対応した前記時系列パターンを除去し、
前記類似度判別基準補正部は、前記時系列パターン全体評価値が前記全体設定許容値による基準外の場合には、前記時系列パターン個別評価値及び前記時系列パターン全体評価値の少なくともいずれかを用いて前記類似度判別基準を補正する、
ことを特徴とする請求項2に記載の時系列パターン生成装置。
The time series pattern evaluation value calculation unit calculates a time series pattern individual evaluation value for evaluating the time series pattern for each time series pattern based on the calculated appearance probability,
The time series pattern evaluation value evaluation unit compares the time series pattern individual evaluation value with an individual setting allowable value when the time series pattern overall evaluation value is within a standard based on the overall setting allowable value, and the time series If the pattern individual evaluation value is outside the reference by the individual setting allowable value, the time series pattern corresponding to the time series pattern individual evaluation value outside the reference is removed,
The similarity determination reference correction unit, when the overall evaluation value of the time series pattern is outside the reference based on the overall setting allowable value, at least one of the individual evaluation value of the time series pattern and the overall evaluation value of the time series pattern To correct the similarity criterion,
The time-series pattern generation apparatus according to claim 2, wherein:
前記時系列パターン生成部は、
前記時系列データをある基準でいくつかのセグメントに区切り、特定のセグメント長単位で、各前記時系列データからそれぞれ複数の前記部分データを切り出す部分データ切出し部と、
複数の前記部分データから同一の類似関係にある前記複数の部分データ群を前記類似度判別基準に従って抽出し、前記部分データ群に含まれる前記部分データ数を出現頻度として含んだ状態で、前記複数の部分データ群の各々に対応する前記時系列パターンを生成するモデル群生成部と、
前記モデル群生成部によって生成された前記時系列パターンから、所定の削除閾値以下の前記出現頻度を有する前記時系列パターンを削除する時系列パターン削除部と、
削除後に残った前記時系列パターンの数を評価して継続あるいは非継続の判断を下し、継続の場合は、削除後に残った前記時系列パターンを記憶するとともに、前記部分データ切出し部に前記セグメント長を変えて前記部分データを切り出させ、一方、非継続の場合は、記憶した前記セグメント長ごとの前記時系列パターンを、前記時系列パターン評価部に送出する継続評価部と、
を備えることを特徴とする請求項1乃至3のいずれかに記載の時系列パターン生成装置。
The time-series pattern generation unit
A partial data cutout unit that divides the time series data into several segments according to a certain standard, and cuts out a plurality of the partial data from each of the time series data in a specific segment length unit;
Extracting the plurality of partial data groups having the same similarity from the plurality of partial data according to the similarity determination criterion, and including the number of partial data included in the partial data group as an appearance frequency A model group generation unit that generates the time-series pattern corresponding to each of the partial data groups;
A time series pattern deletion unit that deletes the time series pattern having the appearance frequency equal to or lower than a predetermined deletion threshold from the time series pattern generated by the model group generation unit;
The number of the time series patterns remaining after the deletion is evaluated to make a continuation or non-continuation determination. In the case of the continuation, the time series patterns remaining after the deletion are stored, and the segment data extraction unit stores the segment. The partial data is cut out by changing the length, while in the case of non-continuation, the time series pattern for each of the stored segment lengths is sent to the time series pattern evaluation section,
The time series pattern generation device according to claim 1, comprising:
前記部分データ切出し部は、前記セグメント長の変更後における前記部分データの切出しでは、前回における削除後に残った前記時系列パターンに対応する前記部分データを、切り出す前記部分データの一部に含めることを特徴とする請求項4に記載の時系列パターン生成装置。The partial data cutout unit includes, in the partial data cutout after the segment length change, including the partial data corresponding to the time series pattern remaining after the previous deletion in a part of the partial data cut out. The time-series pattern generation device according to claim 4, wherein 前記モデル群生成部は、前記時系列パターンを生成するモデルとなる時系列パターン発生モデルを作成する新規モデル作成部と、前記時系列パターン発生モデルを修正するモデル再学習部とを備え、
さらに、複数の前記部分データから前記部分データを取り出し、取り出した前記部分データの各前記時系列パターン発生モデルに対する尤度を、前記部分データの長さと、高さと、正規化により前記長さ及び前記高さによる影響を排除した形状との観点から計算するモデル尤度計算部と、
各前記時系列パターン発生モデルに対して算出された前記尤度と、前記部分データと前記時系列パターン発生モデルとの類似度を判別する前記類似度判別基準としての類似度パラメータとを用いて、取り出された前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行う尤度評価部であって、類似する前記時系列パターン発生モデルが存在しない場合は、前記新規モデル作成部に前記部分データを用いて前記時系列パターン発生モデルを作成させ、類似する前記時系列パターン発生モデルが存在する場合には、最も高い前記尤度を有する前記時系列パターン発生モデルを、前記モデル再学習部に前記部分データを用いて修正させる尤度評価部と、
前記モデル尤度計算部に複数の前記部分データからの前記部分データの取り出し処理を継続させるか否かの判断を行い、継続させない場合は、前記時系列パターン発生モデルを前記時系列パターンとして確定して前記時系列パターン削除部に出力する継続処理部と、
を備えることを特徴とする請求項4又は5に記載の時系列パターン生成装置。
The model group generation unit includes a new model creation unit that creates a time series pattern generation model that is a model for generating the time series pattern, and a model re-learning unit that corrects the time series pattern generation model,
Further, the partial data is extracted from a plurality of the partial data, the likelihood for each time-series pattern generation model of the extracted partial data, the length and the height by the normalization of the partial data A model likelihood calculation unit for calculating from the viewpoint of the shape excluding the influence of height,
Using the likelihood calculated for each time series pattern generation model and the similarity parameter as the similarity determination criterion for determining the similarity between the partial data and the time series pattern generation model, A likelihood evaluation unit that evaluates whether or not the time series pattern generation model similar to the extracted partial data exists, and when the similar time series pattern generation model does not exist, the new model When the time series pattern generation model similar to the time series pattern generation model exists using the partial data in the creation unit, the time series pattern generation model having the highest likelihood is A likelihood evaluation unit that causes the model re-learning unit to correct the partial data using the partial data;
The model likelihood calculation unit determines whether to continue the process of extracting the partial data from the plurality of partial data. If not, the time series pattern generation model is determined as the time series pattern. A continuation processing unit that outputs to the time series pattern deletion unit,
The time-series pattern generation device according to claim 4, comprising:
前記尤度評価部は、各前記時系列パターン発生モデルに対して算出された前記尤度のうち最も高い尤度と次に高い尤度との比と、前記類似度パラメータとを比較することによって、前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行うことを特徴とする請求項6に記載の時系列パターン生成装置。The likelihood evaluation unit compares the similarity parameter with a ratio between the highest likelihood and the next highest likelihood among the likelihoods calculated for each time series pattern generation model. The time-series pattern generation apparatus according to claim 6, wherein the time-series pattern generation model similar to the partial data is evaluated for existence. 前記新規モデル作成部は、作成する前記時系列パターン発生モデルの一部として、前記部分データの長さ及び高さの平均及び標準偏差を算出し、
前記モデル再学習部は、前記時系列パターン発生モデルが保有する、前記長さ及び高さの平均及び標準偏差を修正するものであり、
前記モデル尤度計算部は、各前記時系列パターン発生モデルに対する前記尤度の計算において、各前記時系列パターン発生モデルが保有する前記長さ及び高さの平均及び標準偏差を用いることを特徴とする請求項6又は7に記載の時系列パターン生成装置。
The new model creation unit calculates the average and standard deviation of the length and height of the partial data as a part of the time-series pattern generation model to be created,
The model relearning unit corrects the average and standard deviation of the length and height possessed by the time-series pattern generation model,
The model likelihood calculation unit uses the average and standard deviation of the length and height held by each time series pattern generation model in calculating the likelihood for each time series pattern generation model, The time series pattern generation device according to claim 6 or 7.
観測対象の複数の状態に対応する時系列データを用いて、各状態に固有の時系列パターンを生成する時系列パターン生成方法であって、
複数の前記時系列データからそれぞれ複数の部分データを切り出し、各前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記複数の部分データ群の各々に対応する時系列パターンを生成する時系列パターン生成ステップと、
前記時系列パターン生成ステップによって生成された時系列パターンが所定の基準に適合しているかどうかを評価し、前記所定の基準内であれば、前記時系列パターンの各々と、前記時系列パターンの各々の各前記時系列データにおける出現頻度との関係に基づいて、前記時系列パターンを前記各状態のいずれかに特定し、特定された前記時系列パターンを最終時系列パターンとして出力し、一方、前記所定の基準外であれば、前記類似度判別基準を補正し、補正後の前記類似度判別基準によって前記時系列パターン生成ステップを再度行う時系列パターン評価ステップと、
を備えたことを特徴とする時系列パターン生成方法。
A time series pattern generation method for generating a time series pattern specific to each state using time series data corresponding to a plurality of states to be observed,
A plurality of pieces of partial data are cut out from the plurality of pieces of time series data, and a plurality of pieces of partial data having the same similarity are used from the plurality of pieces of partial data by using a similarity determination criterion for determining the degree of similarity between the pieces of partial data. Extracting a partial data group and generating a time series pattern corresponding to each of the plurality of partial data groups; and
Evaluate whether the time series pattern generated by the time series pattern generation step conforms to a predetermined standard, and if within the predetermined standard, each of the time series pattern and each of the time series pattern Based on the relationship with the appearance frequency in each of the time-series data, the time-series pattern is identified as one of the states, and the identified time-series pattern is output as a final time-series pattern, If it is not a predetermined criterion, the similarity determination criterion is corrected, and the time series pattern generation step is performed again according to the corrected similarity determination criterion.
A time-series pattern generation method comprising:
前記時系列パターン評価ステップは、
各前記時系列パターンが各前記時系列データにおいてそれぞれ出現する確率を算出する出現確率計算ステップと、
算出された出現確率に基づき前記時系列パターンの全体を評価するための時系列パターン全体評価値を算出する時系列パターン評価値計算ステップと、
算出された前記時系列パターン全体評価値を全体設定許容値と比較し、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターンの前記出現確率が最も高い前記状態に各前記時系列パターンを特定し、特定された前記時系列パターンを前記最終時系列パターンとして出力する時系列パターン評価値評価ステップと、
算出された前記時系列パターン全体評価値が、前記全体設定許容値による基準外の場合には、前記時系列パターン全体評価値を用いて前記類似度判別基準を補正し、補正後の前記類似度判別基準により前記時系列パターン生成ステップを再度行う類似度判別基準補正ステップと、
を備えることを特徴とする請求項9に記載の時系列パターン生成方法。
The time series pattern evaluation step includes:
An appearance probability calculating step for calculating a probability that each time series pattern appears in each of the time series data;
A time-series pattern evaluation value calculating step for calculating a time-series pattern overall evaluation value for evaluating the entire time-series pattern based on the calculated appearance probability;
The calculated time-series pattern overall evaluation value is compared with an overall setting allowable value, and when the time-series pattern overall evaluation value is within the criteria based on the overall setting allowable value, the appearance probability of the time-series pattern is the highest. A time series pattern evaluation value evaluation step for identifying each time series pattern in the high state and outputting the identified time series pattern as the final time series pattern;
When the calculated time-series pattern overall evaluation value is outside the reference based on the overall setting allowable value, the similarity determination criterion is corrected using the time-series pattern overall evaluation value, and the corrected similarity Similarity determination criterion correction step for performing the time series pattern generation step again according to the determination criterion;
The time series pattern generation method according to claim 9, further comprising:
前記時系列パターン評価値評価ステップは、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合であっても、複数の前記状態のうち、前記時系列パターンに対応づけられない前記状態が存在すると判断した場合は、前記最終時系列パターンを出力することなく、再度、前記類似度判別基準補正ステップを実行することを特徴とする請求項10に記載の時系列パターン生成方法。In the time series pattern evaluation value evaluation step, the time series pattern overall evaluation value is not associated with the time series pattern among a plurality of the states even if the time series pattern overall evaluation value is within a standard based on the overall setting allowable value. 11. The time series pattern generation method according to claim 10, wherein if it is determined that a state exists, the similarity determination reference correction step is executed again without outputting the final time series pattern. 前記時系列パターン評価値計算ステップは、算出された前記出現確率に基づき、前記時系列パターンごとに、前記時系列パターンを評価するための時系列パターン個別評価値を算出し、
前記時系列パターン評価値評価ステップは、前記時系列パターン全体評価値が前記全体設定許容値による基準内の場合には、前記時系列パターン個別評価値を個別設定許容値と比較し、前記時系列パターン個別評価値が、前記個別設定許容値による基準外の場合には、基準外の前記時系列パターン個別評価値に対応した前記時系列パターンを除去し、
前記類似度判別基準補正ステップは、前記時系列パターン全体評価値が前記全体設定許容値による基準外の場合には、前記時系列パターン個別評価値及び前記時系列パターン全体評価値の少なくともいずれかを用いて前記類似度判別基準を補正する、
ことを特徴とする請求項10又は11に記載の時系列パターン生成方法。
The time series pattern evaluation value calculation step calculates a time series pattern individual evaluation value for evaluating the time series pattern for each time series pattern based on the calculated appearance probability,
The time series pattern evaluation value evaluation step compares the time series pattern individual evaluation value with an individual setting allowable value when the time series pattern overall evaluation value is within a standard based on the overall setting allowable value, and the time series If the pattern individual evaluation value is outside the reference by the individual setting allowable value, the time series pattern corresponding to the time series pattern individual evaluation value outside the reference is removed,
In the similarity determination reference correction step, when the time series pattern overall evaluation value is outside the reference based on the overall setting allowable value, at least one of the time series pattern individual evaluation value and the time series pattern overall evaluation value is determined. To correct the similarity criterion,
The time-series pattern generation method according to claim 10 or 11, characterized in that
時系列データから互いに類似しない時系列パターンを生成する時系列パターン生成方法であって、
前記時系列データをある基準でいくつかのセグメントに区切り、特定のセグメント長単位で、各前記時系列データからそれぞれ複数の前記部分データを切り出す部分データ切出しステップと、
前記部分データ同士の類似度を判別するための類似度判別基準を用いて、複数の前記部分データから同一の類似関係にある複数の部分データ群を抽出し、前記部分データ群に含まれる前記部分データ数を出現頻度として含めた状態で、前記複数の部分データ群の各々に対応した前記時系列パターンを生成するモデル群生成ステップと、
前記モデル群生成ステップにより生成された前記時系列パターンから、所定の削除閾値以下の前記出現頻度を有する前記時系列パターンを削除する時系列パターン削除ステップと、
削除後に残った前記時系列パターンの数を評価して継続あるいは非継続の判断を下し、継続の場合は、削除後に残った前記時系列パターンを記憶するとともに、前記セグメント長を変えて前記各ステップ及び本ステップを行い、一方、非継続の場合は、記憶した前記セグメント長ごとの前記時系列パターンを出力する継続評価ステップと、
を備えることを特徴とする時系列パターン生成方法。
A time series pattern generation method for generating time series patterns that are not similar to each other from time series data,
A partial data cutting step of dividing the time series data into a number of segments on a certain basis, and cutting out a plurality of the partial data from each of the time series data in a specific segment length unit;
A plurality of partial data groups having the same similarity relationship are extracted from the plurality of partial data using a similarity determination criterion for determining the similarity between the partial data, and the portions included in the partial data group A model group generation step for generating the time series pattern corresponding to each of the plurality of partial data groups in a state including the number of data as the appearance frequency;
A time series pattern deletion step of deleting the time series pattern having the appearance frequency equal to or lower than a predetermined deletion threshold from the time series pattern generated by the model group generation step;
The number of the time series patterns remaining after the deletion is evaluated to make a continuation or non-continuation determination.In the case of continuation, the time series patterns remaining after the deletion are stored, and the segment length is changed to change each of the time series patterns. On the other hand, in the case of non-continuation, a continuous evaluation step of outputting the time series pattern for each of the stored segment lengths,
A time-series pattern generating method comprising:
前記部分データ切出しステップは、前記セグメント長の変更後における前記部分データの切出しでは、前回において削除後に残った前記時系列パターンに対応する前記部分データを、切り出す前記部分データの一部に含めることを特徴とする請求項13に記載の時系列パターン生成方法。The partial data extraction step includes including the partial data corresponding to the time-series pattern remaining after the previous deletion in the partial data to be extracted in the partial data extraction after the segment length change. The time-series pattern generation method according to claim 13, wherein 前記時系列パターン生成ステップは、請求項13又は14に記載の時系列パターン生成方法を用いることを特徴とする請求項9に記載の時系列パターン生成方法。The time series pattern generation method according to claim 9, wherein the time series pattern generation step uses the time series pattern generation method according to claim 13 or 14. 時系列データから切り出された複数の部分データを用いて、互いに類似しない時系列パターンを生成する時系列パターン生成方法であって、
前記時系列パターンを生成するモデルとなる時系列パターン発生モデルを作成する新規モデル作成ステップと、前記時系列パターン発生モデルを修正するモデル再学習ステップとを備え、
前記部分データの各前記時系列パターン発生モデルに対する尤度を、前記部分データの長さと、高さと、正規化により前記長さ及び前記高さによる影響を排除した形状との観点から計算するモデル尤度計算ステップと、
各前記時系列パターン発生モデルに対して算出された前記尤度と、前記部分データと前記時系列パターン発生モデルとの類似度を判別するための類似度判別基準としての類似度パラメータとを用いて、前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行う尤度評価ステップであって、類似する前記時系列パターン発生モデルが存在しない場合は、前記新規モデル作成ステップを行って前記時系列パターン発生モデルを作成し、類似する前記時系列パターン発生モデルが存在する場合は、最も高い前記尤度を有する前記時系列パターン発生モデルを、前記モデル再学習ステップを行って修正する尤度評価ステップと、
前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて繰り返すか否かを判断し、繰り返すと判断した場合は、前記モデル尤度計算ステップ及び前記尤度評価ステップを他の前記部分データについて行い、繰り返さないと判断した場合は、最終状態の各前記時系列パターン発生モデルを各前記時系列パターンとして確定する継続処理ステップと、
を備えることを特徴とする時系列パターン生成方法。
A time series pattern generation method for generating time series patterns that are not similar to each other using a plurality of partial data extracted from time series data,
A new model creation step of creating a time series pattern generation model to be a model for generating the time series pattern, and a model relearning step of correcting the time series pattern generation model,
Model likelihood for calculating the likelihood of each partial data for each time-series pattern generation model from the viewpoint of the length and height of the partial data and the shape excluding the influence of the length and the height by normalization. A degree calculation step;
Using the likelihood calculated for each time series pattern generation model and a similarity parameter as a similarity determination criterion for determining the similarity between the partial data and the time series pattern generation model A likelihood evaluation step for evaluating whether or not the time series pattern generation model similar to the partial data exists, and when the similar time series pattern generation model does not exist, the new model creation step To create the time series pattern generation model, and when there is a similar time series pattern generation model, the time series pattern generation model having the highest likelihood is subjected to the model relearning step. A likelihood evaluation step to correct;
It is determined whether to repeat the model likelihood calculation step and the likelihood evaluation step for the other partial data, and if it is determined to repeat, the model likelihood calculation step and the likelihood evaluation step When it is determined that the partial data is not repeated, the continuous processing step of determining each time series pattern generation model in the final state as each time series pattern;
A time-series pattern generating method comprising:
前記尤度評価ステップは、各前記時系列パターン発生モデルに対して算出された前記尤度のうち最も高い尤度と次に高い尤度との比を、前記類似度パラメータと比較することによって、前記部分データに類似する前記時系列パターン発生モデルが存在するか否かの評価を行うことを特徴とする請求項16に記載の時系列パターン生成方法。The likelihood evaluation step compares the ratio of the highest likelihood to the next highest likelihood among the likelihoods calculated for each time-series pattern generation model with the similarity parameter, The time series pattern generation method according to claim 16, wherein an evaluation is made as to whether or not the time series pattern generation model similar to the partial data exists. 前記新規モデル作成ステップは、作成する前記時系列パターン発生モデルの一部として、前記部分データの長さ及び高さの平均及び標準偏差を算出し、
前記モデル再学習ステップは、前記時系列パターン発生モデルが保有する、前記長さ及び高さの平均及び標準偏差を修正するものであり、
前記モデル尤度計算ステップは、各前記時系列パターン発生モデルに対する前記尤度の計算において、各前記時系列パターン発生モデルが保有する前記長さ及び高さの平均及び標準偏差を用いることを特徴とする請求項16又は17に記載の時系列パターン生成方法。
The new model creation step calculates the average and standard deviation of the length and height of the partial data as a part of the time-series pattern generation model to be created,
The model relearning step corrects the average and standard deviation of the length and height possessed by the time series pattern generation model,
The model likelihood calculating step uses the average and standard deviation of the length and height possessed by each time series pattern generation model in the calculation of the likelihood for each time series pattern generation model. The time series pattern generation method according to claim 16 or 17.
前記モデル群生成ステップは、請求項16乃至18のいずれかに記載の時系列パターン生成方法を用いることを特徴とする請求項13に記載の時系列パターン生成方法。The time series pattern generation method according to claim 13, wherein the model group generation step uses the time series pattern generation method according to claim 16. 前記時系列パターン生成ステップは、前記時系列パターンの生成に当たって、請求項16乃至18のいずれかに記載の時系列パターン生成方法を用いることを特徴とする請求項9に記載の時系列パターン生成方法。The time series pattern generation method according to claim 9, wherein the time series pattern generation step uses the time series pattern generation method according to any one of claims 16 to 18 in generating the time series pattern. . 前記時系列パターン評価ステップは、前記時系列パターン個別評価値の平均の前回との差分と、前記類似度パラメータの前回との差分の比を定数倍し、今回の前記類似度パラメータから減ずることによって前記類似度パラメータを補正することを特徴とする請求項20に記載の時系列パターン生成方法。In the time series pattern evaluation step, the ratio of the difference between the average of the time series pattern individual evaluation values and the previous time of the average and the difference of the similarity parameter is multiplied by a constant, and is subtracted from the current similarity parameter. 21. The time series pattern generation method according to claim 20, wherein the similarity parameter is corrected. 前記時系列パターン評価値計算ステップは、前記時系列パターンの各前記時系列データにおける前記出現確率を、最大の確率と、それ以外の確率の和として表し、前記最大の確率と前記確率の和とを用いて前記時系列パターンの平均情報量を計算し、各前記時系列パターンについて算出した前記平均情報量を用いて前記時系列パターン全体評価値を算出することを特徴とする請求項10又は11に記載の時系列パターン生成方法。The time-series pattern evaluation value calculating step represents the appearance probability in each time-series data of the time-series pattern as a maximum probability and a sum of other probabilities, and the maximum probability and the sum of the probabilities The average information amount of the time series pattern is calculated using the time series pattern, and the overall evaluation value of the time series pattern is calculated using the average information amount calculated for each of the time series patterns. A time-series pattern generation method described in 1. 前記時系列パターン評価値計算ステップは、前記時系列パターンの各前記時系列データにおける前記出現確率を、最大の確率と、それ以外の確率の和として表し、前記最大の確率と前記確率の和とを用いて前記時系列パターンの平均情報量を計算し、前記平均情報量を前記時系列パターン個別評価値とすることを特徴とする請求項12に記載の時系列パターン生成方法。The time-series pattern evaluation value calculating step represents the appearance probability in each time-series data of the time-series pattern as a maximum probability and a sum of other probabilities, and the maximum probability and the sum of the probabilities 13. The time series pattern generation method according to claim 12, wherein an average information amount of the time series pattern is calculated by using the average information amount as the time series pattern individual evaluation value. 前記時系列パターン評価値計算ステップは、前記時系列パターン全体評価値として、前記時系列パターン個別評価値の平均を用いることを特徴とする請求項12又は23に記載の時系列パターン生成方法。24. The time series pattern generation method according to claim 12, wherein the time series pattern evaluation value calculation step uses an average of the time series pattern individual evaluation values as the whole time series pattern evaluation value. 前記出現確率計算ステップで算出された前記出現確率、前記時系列パターン評価値計算ステップで算出された前記時系列パターン全体評価値、及び前記時系列パターン評価値計算ステップで算出された前記時系列パターン個別評価値の少なくともいずれかを出力部に出力するステップをさらに備えることを特徴とする請求項12,22乃至24のいずれかに記載の時系列パターン生成方法。The appearance probability calculated in the appearance probability calculation step, the entire time series pattern evaluation value calculated in the time series pattern evaluation value calculation step, and the time series pattern calculated in the time series pattern evaluation value calculation step The time series pattern generation method according to any one of claims 12, 22 to 24, further comprising a step of outputting at least one of the individual evaluation values to an output unit.
JP2003195174A 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method Expired - Lifetime JP3977782B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003195174A JP3977782B2 (en) 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003195174A JP3977782B2 (en) 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method

Publications (2)

Publication Number Publication Date
JP2005031908A true JP2005031908A (en) 2005-02-03
JP3977782B2 JP3977782B2 (en) 2007-09-19

Family

ID=34206104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003195174A Expired - Lifetime JP3977782B2 (en) 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method

Country Status (1)

Country Link
JP (1) JP3977782B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11200632B2 (en) 2018-11-09 2021-12-14 Canon Kabushiki Kaisha Image processing method and image processing apparatus
US11455322B2 (en) 2020-05-12 2022-09-27 International Business Machines Corporation Classification of time series data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11200632B2 (en) 2018-11-09 2021-12-14 Canon Kabushiki Kaisha Image processing method and image processing apparatus
US11455322B2 (en) 2020-05-12 2022-09-27 International Business Machines Corporation Classification of time series data

Also Published As

Publication number Publication date
JP3977782B2 (en) 2007-09-19

Similar Documents

Publication Publication Date Title
WO2021000958A1 (en) Method and apparatus for realizing model training, and computer storage medium
JP6766950B2 (en) Object detection device, object detection method and object detection program
CN107562772B (en) Event extraction method, device, system and storage medium
CN104050556B (en) The feature selection approach and its detection method of a kind of spam
EP3483747A1 (en) Preserving and processing ambiguity in natural language
CN106469097A (en) A kind of method and apparatus recalling error correction candidate based on artificial intelligence
RU2254610C2 (en) Method for automated classification of documents
CN113012687B (en) Information interaction method and device and electronic equipment
CN114036318A (en) Public safety knowledge graph generation method facing to pan-aware data and based on time sequence diagram
JP3977782B2 (en) Time-series pattern generation apparatus and time-series pattern generation method
CN111428487B (en) Model training method, lyric generation method, device, electronic equipment and medium
JPH1166238A (en) Handwritten character recognition method
CN115376054B (en) Target detection method, device, equipment and storage medium
CN104200222B (en) Object identifying method in a kind of picture based on factor graph model
KR100765749B1 (en) Apparatus and method for binary image compression
CN114880584A (en) Generator set fault analysis method based on community discovery
CN115544999A (en) Domain-oriented parallel large-scale text duplicate checking method
JP2019185121A (en) Learning device, learning method and program
Zalasiński et al. Intelligent approach to the prediction of changes in biometric attributes
CN109299260B (en) Data classification method, device and computer readable storage medium
JP2001126050A (en) News article cutting device
KR101815968B1 (en) Malicious code classification system for providing group dividing function and method thereof
KR20160069027A (en) System and method for indexing image based on affect
CN116361470B (en) Text clustering cleaning and merging method based on topic description
CN113064597B (en) Redundant code identification method, device and equipment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070410

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070621

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 3