JP3977782B2 - Time-series pattern generation apparatus and time-series pattern generation method - Google Patents

Time-series pattern generation apparatus and time-series pattern generation method Download PDF

Info

Publication number
JP3977782B2
JP3977782B2 JP2003195174A JP2003195174A JP3977782B2 JP 3977782 B2 JP3977782 B2 JP 3977782B2 JP 2003195174 A JP2003195174 A JP 2003195174A JP 2003195174 A JP2003195174 A JP 2003195174A JP 3977782 B2 JP3977782 B2 JP 3977782B2
Authority
JP
Japan
Prior art keywords
series pattern
time series
time
data
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003195174A
Other languages
Japanese (ja)
Other versions
JP2005031908A (en
Inventor
原 修一郎 今
藤 誠 佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003195174A priority Critical patent/JP3977782B2/en
Publication of JP2005031908A publication Critical patent/JP2005031908A/en
Application granted granted Critical
Publication of JP3977782B2 publication Critical patent/JP3977782B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、観測対象の複数の状態に対応する時系列データから各状態に固有の時系列パターンを生成する時系列パターン生成装置及び時系列パターン生成方法、並びに、時系列データから互いに類似しない時系列パターンを生成する時系列パターン生成方法に関する。
【0002】
【従来の技術】
センシング技術とプロセッサ技術の向上に伴い、センサは、低コスト化と相俟って、身近な存在になっている。例えば足にセンサを付け、その動作を時系列データとして取得することも可能になってきている。
【0003】
そこで、人にセンサを取り付けて時系列データを取得し、その人が何らかの動作を行った時に現れる特徴的な時系列パターンを、取得した時系列データから生成することが行われるようになってきている。また、その人がどのような動作をしているのか識別するために、各動作(時系列の状態)から得られた時系列データを用いて、各動作に固有の時系列パターンを生成することも要求されるようになってきている。
【0004】
しかし、一般に、取得される時系列パターンは膨大な量になることが多いため、時系列パターンを人の手で探すとなると非常に労力がかかるという問題点がある。
【0005】
また、上述した後者、つまり、各状態から得られた時系列データを用いて各動作に固有の時系列パターンを生成する方法は知られていない。
【0006】
一方、上述した前者、つまり、ある状態から得られた時系列データを用いてこの状態に特徴的な時系列パターンを生成することについては、これを実現する方法として、例えば時系列クラスタリングとルール分析(非特許文献2)を時系列に拡張したものがある。
【0007】
しかし、いずれにおいても、処理に当たって、時系列データを適当な基準で区間分け(セグメント化)する必要があるが、前者の時系列クラスタリングでは、区間の数(セグメント数)、つまり、パターン長は一定にする必要がある(固定である)という欠点がある。
【0008】
これに対し、後者のルール分析はパターン長を自動的に決定して効率よく時系列パターンを生成できるという利点があるが、パターン長の長い時系列パターンを生成する場合、パターン長が短い時系列パターンを組み合わせて長い時系列パターンを表現する。このため、各時系列パターンが平均化されてしまいやすい欠点がある。この理由は、短い時系列パターンは形状が単純であるために近似した時系列パターンが多数あることが多いというものである。よって、この手法ではパターン長が長くなったとき、複雑な形状の時系列パターンを扱えないという欠点がある。
【0009】
ところで、時系列パターンを生成する際には類似した時系列パターンが多数生成されない方が好ましく、従って、切り出した時系列データの類似判定が必要になる。類似判定では長さや高さが異なっていても形状が類似していれば同一のものであるとしたい(長さや高さの曖昧さを吸収したい)という要請があるが、上述の時系列クラスタリングでは長さの曖昧さしか吸収できないという欠点があった。一方、長さ、高さの曖昧さを共に吸収できる方法として時系列パターン発生モデルを使用する方法(非特許文献1)があるが、この方法では時系列の形状を保持せずに直線とみなすために複雑な形状同士を区別できないという欠点がある。
【0010】
【特許文献1】
特開平11-326542号公報
【特許文献2】
特開平9-34719号公報
【非特許文献1】
Xianping Ge and Padhraic Smyth, Deformable Markov Model Templates for Time-Series Pattern Matching, ACM SIGKDD(KDD-2000), pp.81-90, 2000
【非特許文献2】
Rakesh Agrawal, Tomasz Imielinski, Arun N. Swami, Mining Association Rules between Sets of Items in Large Databases, SIGMOD Conference
1993, pp.207-216, 1993
【0011】
【発明が解決しようとする課題】
上記のように、従来においては、各時系列の状態に対して他の時系列の状態と区別できる時系列パターンを自動的に生成できないという問題点があった。また、パターン長が大きくなった場合、複雑な形状を扱うことができないという問題点があった。さらに、長さと高さの曖昧さを吸収した、複雑な形状の類似判定ができないという問題点があった。
【0012】
本発明は、上記の事情を考慮してなされたものであり、各時系列の状態に対して他の時系列の状態と区別可能な、各時系列の状態に固有の時系列パターンを自動的に生成できる時系列パターン生成装置及び時系列パターン生成方法を提供することを目的とする。また、パターン長が大きくなっても複雑な形状を扱うことのできる時系列パターン生成方法を提供することを目的とする。さらに、本発明は、複雑な形状の類似判定を可能にし、これにより、長さ及び高さに加え、複雑な形状も考慮できる時系列パターン生成方法を提供することを目的とする。
【0013】
本発明の一態様としての時系列パターン生成装置は、
観測対象の複数の状態に対応する時系列データから各状態に固有の時系列パターンを生成するために用いる時系列パターン生成装置であって、
各前記時系列データをそれぞれある基準でいくつかのセグメントに区切り、特定のセグメント長で各前記時系列データからデータを切り出すデータ切出し部と、
データ同士の類似度を判別する類似度判別基準を用いて、各切り出されたデータを、同一の類似関係にある複数のデータ群に分割し、前記複数のデータ群の各々に対応する時系列パターンを生成するモデル群生成部と、
削除閾値以下の個数のデータからなるデータ群に対応する時系列パターンを削除する時系列パターン削除部と、
残った時系列パターンを記憶し、前記残った時系列パターンの個数が閾値より大きいとき前記データ切出し部に前記セグメント長を大きくすることを指示する継続評価部と、を備え、
前記データ切出し部は、前回のセグメント長で残った時系列パターンに対応するデータを一部に含むようにデータの切り出しを行う
ことを特徴とする
【0014】
本発明の一態様としての時系列パターン生成方法は、
観測対象の複数の状態に対応する時系列データから各状態に固有の時系列パターンを生成するために用いる時系列パターン生成方法であって、
各前記時系列データをそれぞれある基準でいくつかのセグメントに区切り、特定のセグメント長で各前記時系列データからデータを切り出すデータ切出しステップと、
データ同士の類似度を判別するための類似度判別基準を用いて、各切り出されたデータを、同一の類似関係にある複数のデータ群に分割し、前記複数のデータ群の各々に対応する時系列パターンを生成するモデル群生成ステップと、
削除閾値以下の個数のデータからなるデータ群に対応する時系列パターンを削除する時系列パターン削除ステップと、
残った時系列パターンを記憶し、前記残った時系列パターンの個数が閾値より大きいとき前記セグメント長を大きくして前記データ切出しステップを行うことを決定する継続評価ステップと、を備え、
前記データ切出しステップは、前回のセグメント長で残った時系列パターンに対応するデータを一部に含むようにデータの切り出しを行う
ことを特徴とする
【0015】
請求項14の方法は、前記時系列パターン評価値評価ステップは、各前記時系列パターンのいずれにも対応づけられない状態があるとき、前記各時系列パターンの出力を中止し、
前記類似度判別基準補正ステップは、前記時系列パターン全体評価値に基づき前記類似度判別基準を補正することを特徴とする。
【0017】
【発明の実施の形態】
先ず、本実施の形態の特徴について簡単に説明しておく。
【0018】
図5は、歩行時に得られた時系列データと走行時に得られた時系列データとからなる時系列データ102を示す図である。この時系列データ102は、例えば、生体の足につけた加速度センサから取得されたものである。
【0019】
図中には、歩行ラベルと走行ラベルとからなる状態データ(ラベル)101が示されている。状態データ101は、後述するように、時系列データ102がどのような状態で取得されたのかを特定するために用いる。
【0020】
本実施の形態は、このような各状態(例:歩行、走行)の時系列データを用いて、各状態に固有の時系列パターンを生成しようとするものである。
【0021】
以下、図面を参照しながら、本発明の実施の形態について詳しく説明する。
【0022】
図1は、本発明の一実施形態に関わる時系列パターン生成装置の構成例を示す図である。
【0023】
図1に示すように、この時系列パターン生成装置は、時系列パターン生成部103と時系列パターン評価部105とを備える。
【0024】
時系列パターン生成部103は、入力された状態データ101(図5参照)及び時系列データ102(図5参照)を用いて、相互に類似しない種々のパターン長の(パターン長が非固定の)時系列パターンを生成する。相互に類似しない時系列パターンの生成は後述する類似度パラメータ106(類似度基準)を用いて行う。時系列パターン生成部103は、生成した時系列パターン群を出力時系列パターン104として出力する。
【0025】
後述する図9は、図5の時系列データ102から生成された時系列パターン例を示す図である。図9中には、パターン長が1の時系列パターン(上段)と、パターン長が2の時系列パターン(下段)が示されている。
【0026】
時系列パターン評価部105は、時系列パターン生成部103から出力された出力時系列パターン104を用いて出力時系列パターン104が所望の基準を満たしているか否かの評価を行う。
【0027】
より詳しくは、まず、時系列パターン評価部105は、出力時系列パターン104全体を評価するための時系列パターン全体評価値と、出力時系列パターン104を構成する各時系列パターンを個別に評価するための時系列パターン個別評価値とを、後述する手法を用いて、算出する。
【0028】
次に、時系列パターン評価部105は、時系列パターン全体評価値が所定の基準内にあるかどうかを判断し、所定の基準内にあると判断した場合は、次に、各時系列パターンの時系列パターン個別評価値が所定の基準内にあるかどうかを判断する。時系列パターン評価部105は、所定の基準外にある時系列パターン個別評価値が存在すると判断した場合は、その時系列パターン個別評価値を有する時系列パターンを出力時系列パターン104から削除する。時系列パターン評価部105は、この状態の出力時系列パターン104を、図1に示すように、最終時系列パターン107として出力する。
【0029】
一方、時系列パターン評価部105は、時系列パターン全体評価値が所定の基準外にあると判断した場合は、時系列パターン全体評価値あるいは各時系列パターン個別評価値を用いて上述の類似度パラメータ106を、より厳しい方向に、補正する。そして、時系列パターン評価部105は、図1に示すように、補正後の類似度パラメータ106を時系列パターン生成部104に送出して、再度、時系列パターン生成部103に補正後の類似度パラメータ106により出力時系列パターン104を出力させる。時系列パターン評価部105は、時系列パターン全体評価値が所定の基準内になるまで、類似度パラメータ106の補正を繰り返す。
【0030】
時系列パターン評価部105によって出力された最終時系列パターン107は、本手法によって最終的に得られる時系列パターン(例えば、歩行時に固有の時系列パターン、走行時に固有の時系列パターン)である。最終時系列パターン107の一例を、後述する図11に示す。これは、時系列パターン個別評価値が所定の基準外にあると判断された時系列パターン(パターン3)を、上述のようにして、図9の出力時系列パターン104から除去したものである。後述から明らかになるように、パターン1,2,12が歩行時に固有の時系列パターン、その他のパターン4,5,45が走行時に固有の時系列パターンである。尚、時系列パターン評価部105は、時系列パターン個別評価値が所定の基準内の時系列パターンが多数ある場合などは、そのうちの上位いくつか(例えば出現頻度が高いもの)だけを出力するようにしても良い。
【0031】
次に、時系列パターン生成部103および時系列パターン評価部105についてさらに詳しく説明する。
【0032】
まず、時系列パターン生成部103について説明する。
【0033】
図3は、時系列パターン生成部103の構成を詳細に示す図である。
【0034】
上述したように、時系列パターン生成部103は、時系列データ102と状態データ101とを用いて出力時系列パターン104を生成するものである。
【0035】
図3に示すように、この時系列パターン生成部103は、セグメント化部301、セグメント切出し部303、モデル群生成部306、時系列パターン削除部308、継続評価部311、および継続処理部312を備える。
【0036】
セグメント化部301は、入力された時系列データ102を所定の基準で複数の区間(セグメント)に分け(セグメント化)、区間ごとに、区間サイズ(1次元時系列の場合は長さ)と、区間の高さとを算出する。セグメント化部301は、区間ごとの区間サイズ及び区間の高さをセグメント情報302として出力する。セグメント化の例としては、区分線形近似(1次元時系列の場合は折れ線化)がある。
【0037】
図6は、歩行時および走行時の時系列データ(図5参照)をそれぞれセグメント化した状態を示す図である。
【0038】
図6において、上述のセグメント情報302は、(長さl、高さΔh)=(l1、Δh1)、(l2、Δh2)、・・・、(l10、Δh10)の全データである。ここで、高さΔh1,Δh2,・・・Δh10(図示せず)は、各対応する区間における最大の高さと、最小の高さとの差である。区間の高さとしては、この他、例えば、区間の初めと終わりにおける高さの差を取るようにしてもよい。
【0039】
図3に示すように、セグメント切出し部303は、上述のセグメント情報302を構成する各データに、各区間の形状データ及び入力された状態データを付加したセグメントデータ305(状態データについては図示せず)を生成する。図6の例では、セグメントデータ305は、(長さl、高さΔh、形状y)=(l1、Δh1、y1)、(l2、Δh2、y2)、・・・、(l10、Δh10、y10)の全データ(状態データは図示せず)である。形状データy1,y2・・・は、対応する区間の長さ及び高さも包含しているが、長さと高さのデータは、後述する計算において用いるため、形状データとは別個に取得している。セグメントデータ305を構成する1つ1つの各データ(長さl、高さΔh、形状y)(状態データは図示せず)は1セグメントデータ403と称される。
【0040】
モデル群生成部306は、セグメント切出し部303により生成されたセグメントデータ305と後述する類似度パラメータ106とを用いて、互いに類似しない、特定のパターン長(セグメント数)による時系列パターン(各状態の時系列データにおける出現頻度も含む)を生成する。モデル群生成部306は、生成した時系列パターン群を生成時系列パターン307として出力する。
【0041】
図7(a)及び図7(b)は、セグメントデータ305(図6参照)から生成された生成時系列パターン307例を示す図である。
【0042】
より詳しくは、図7(a)は、パターン長が1の場合に生成された生成時系列パターン307例を示す図である。図中に示すように、ここでは、5つの時系列パターン1〜5が生成されている。ここで、例えば、時系列パターン1の「参照:y1,y4」は、図6の形状y1,y4に対応することを示す。つまり、パターン1は、形状y1,y4から生成された時系列パターンである。
【0043】
一方、図7(b)は、パターン長が2の場合の生成時系列パターン例を示す図である。図中に示すように、パターン長が2の場合は、6つの時系列パターン12,23,31,45,53,34が生成されている。
【0044】
図3に示すように、時系列パターン削除部308は、生成時系列パターン307内の各時系列パターンのうち、出現頻度が削除閾値以下の時系列パターンを削除し、残りの時系列パターンを削除後残存時系列パターン309として出力する。これは、出現頻度の低い時系列パターンを削除して、後述する継続評価部311における計算効率を高めるためである。
【0045】
図8は、パターン長が2の生成時系列パターン307(図7(b)参照)に対して、削除閾値を1とした場合に得られた削除後残存時系列パターン309例を示す図である。
【0046】
図7(b)と図8とを対比して分かるように、図7(b)に示す6つの時系列パターンのうち、出現頻度が1である時系列パターン23,31,53,34が削除され、出現頻度が2であるパターン12,45が、削除後残存時系列パターン309として出力されている。
【0047】
継続評価部311は、時系列パターン削除部308により出力された削除後残存時系列パターン309内の時系列パターン数を調べる。継続評価部311は、削除後残存時系列パターン309内の時系列パターン数が0でないと判断すれば、つまり、さらに大きなパターン長の時系列パターンを生成できる可能性があると判断すれば、この削除後残存時系列パターン309を記憶した上で、継続処理部312へ処理を移行する。
【0048】
すなわち、継続処理部312は、パターン長を増加した(例えばパターン長を1から2に、あるいは2から3に増加した)セグメントデータ305を、時系列データ102を用いて生成する。この際、削除後残存時系列パターン309内の時系列パターンに対応する時系列データの部分を含んだ状態でセグメントデータ305を取得する。これは、あまり重要でないと思われるデータの抽出を抑えることにより、効率の良い処理を実現するためである。
【0049】
一方、継続評価部311は、削除後残存時系列パターン309内の時系列パターン数が0であると判断した場合は、つまり、さらに大きなパターン長の時系列パターンを生成できる可能性がないと判断した場合は、パターン長ごとの削除後残存時系列パターン309を出力時系列パターン104として出力する。
【0050】
先に簡単に説明した図9は、図5に示す時系列データ102から得られた出力時系列パターン104例を示す図である。
【0051】
以下、上述した時系列パターン生成部103による処理動作について、図5の時系列データ102から図9の出力時系列パターン104を生成する場合を例に、詳しく説明する。
【0052】
まず、図3に示すように、セグメント化部301は時系列データ102(図5参照)をセグメント化(図6参照)してセグメント情報302(長さl1、高さΔh)(長さl2、高さΔh2)・・・を生成し、セグメント切出し部303に送出する。
【0053】
セグメント切出し部303は、セグメント情報302を用いて、パターン長1によるセグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・を生成し、モデル群生成部306に送出する。
【0054】
モデル群生成部306は、セグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・を用いて、パターン長が1の、相互に類似しない時系列パターンからなる生成時系列パターン307(図7(a)参照)を生成し、時系列パターン削除部308に送出する。
【0055】
時系列パターン削除部308は、受け取った生成時系列パターン307から、出現頻度が1以下の時系列パターンを削除し、削除後残存時系列パターン309として継続評価部311に送出する(図9の上段参照)。
【0056】
継続評価部311は、削除後残存時系列パターン309内の時系列パターン数を判断する。この場合、パターン数は0ではないので(図9上段に示すようにパターン数は5)、この削除後残存時系列パターン309を内部に記憶するとともに、この削除後残存時系列パターン309を継続処理部312に送出する。
【0057】
継続処理部312は、受け取った削除後残存時系列パターン309と時系列データ102とを用いて、パターン長が2のセグメントデータ305を生成し、モデル群生成部306に送出する。
【0058】
モデル群生成部306は、受け取ったセグメントデータ305を用いて、パターン長が2の生成時系列パターン307を生成して(図7(b)参照)、時系列パターン削除部308に送出する。
【0059】
時系列パターン削除部308は、受け取った生成時系列パターン307から、出現頻度が1以下の時系列パターンを削除して(図9の下段参照)、削除後残存時系列パターン309として継続評価部311に送出する。
【0060】
継続評価部311は、この削除後残存時系列パターン309内の時系列パターン数を判断する。この場合、パターン数は0でないので(図9下段に示すようにパターン数は2)、この削除後残存時系列パターン309を記憶するとともに、この削除後残存時系列パターン309を継続処理部312に送出する。
【0061】
継続処理部312は、受け取った削除後残存時系列パターン309と時系列データ102とを用いて、パターン長を3としたセグメントデータ305を生成し、モデル群生成部306に送出する。
【0062】
モデル群生成部306は、受け取ったセグメントデータ305を用いて、パターン長が3の生成時系列パターン307を生成し(図示せず)、時系列パターン削除部308に送出する。
【0063】
時系列パターン削除部308は、受け取った生成時系列パターン307から出現頻度が1以下の時系列パターンを削除して、削除後残存時系列パターン309とし(図示せず)、継続評価部311に送出する。
【0064】
継続評価部311は、この削除後残存時系列パターン309内の時系列パターン数を判断する。時系列パターン数は0であるので(図示せず)、継続評価部311は、先に記憶したパターン長が1、2の削除後残存時系列パターン309(図9参照)を出力時系列パターン104として出力する。
【0065】
ここで、上述の時系列パターン生成部103を構成するモデル群生成部306(図3参照)についてさらに詳しく説明する。
【0066】
図4は、モデル群生成部306の構成例を詳細に示す図である。
【0067】
上述したように、モデル群生成部306は、セグメントデータ305(長さ1l、高さΔh1、形状y1)(長さ12、高さΔh2、形状y2)(状態データは図示せず)・・・から生成時系列パターン307を生成するものである。
【0068】
図4に示すように、このモデル群生成部306は、セグメント取出継続評価部401、1セグメント取出部402、モデル尤度計算部404、尤度評価部405、モデル再学習部406、および新規モデル作成部407を備える。
【0069】
セグメント取出継続評価部401は、セグメントデータ305内の全ての1セグメントデータ403(前述したようにセグメントデータ305を構成する各データ)が、次の1セグメント取出部402によって取り出されたかどうかを判断する。セグメント取出継続評価部401は、これ以上1セグメントデータ403を取り出せない、つまりセグメントデータ305内の全ての1セグメントデータ403が取り出されたと判断した場合は、本モデル群生成部306において生成された時系列パターン(図7(a)(b)参照)を図示しないバッファから取り出して、生成時系列パターン307として出力する。
【0070】
一方、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403がセグメントデータ305内にまだ存在していると判断した場合は、1セグメント取出部402へ処理を移行する。
【0071】
1セグメント取出部402は、セグメントデータ305から1セグメントデータ403を取り出して、モデル尤度計算部404に送出する。
【0072】
モデル尤度計算部404は、例えば次の(式1)に示す尤度関数
【数1】

Figure 0003977782
を用いて、後述する各時系列パターン発生モデル409(途中段階としての時系列パターン)に対する1セグメントデータ403の尤度(適合度)をそれぞれ計算する。
【0073】
ここで、(式1)において、l、Δh、y(t)、μli、μΔhi、σli及びσΔhiは、時系列パターン発生モデル409のパラメータである。より詳しくは、lは、長さ、Δhは高さ、y(t)は形状データを示す。また、後述から明らかになるように、μli及σliは、長さの平均及び標準偏差、μΔhi及びσΔhiは、高さの平均及び標準偏差を示す。一方、l'、Δh'、y'(t)は、1セグメントデータ403のパラメータである。また、gμ , σ(x)は平均をμ、標準偏差をσとした正規分布関数を表す。
【0074】
(式1)に示すように、この尤度関数は、1セグメントデータ403と各時系列パターン発生モデルとの適合度を、長さ、高さ及び形状の観点から求める。具体的には、尤度関数は、Σ内に3つの乗算項を有しており、一番左の乗算項が長さの適合度、2番目の乗算項が高さの適合度、3番目の乗算項が形状の適合度に対応する。形状の適合度は、1セグメントデータ403の形状データと時系列パターン発生モデル409の形状データをそれぞれ正規化した状態で(長さと高さの影響を排除した基準となるサイズに修正した状態で)求めている。従って、(式1)によれば、長さと高さが多少異なっていても、形状が類似していれば、高い適合性を示す尤度が算出される。但し、1セグメントデータ403の長さあるいは高さが時系列パターン発生モデル409とがあまりに大きく異なる場合は、形状が類似していても、一番左の乗算項と2番目の乗算項によって、低い適合性を示す尤度が算出される。
【0075】
モデル尤度計算部404は、(式1)を用いて算出した尤度のうち最大尤度と2番目の尤度を尤度データ408として、図4に示すように、1セグメントデータ403とともに、次の尤度評価部405に送出する。
【0076】
尤度評価部405は、モデル尤度計算部404で算出された最大尤度(maxQi)と2番目の尤度(secondQi)を元に、次の(式2)に示す尤度比算出式
【数2】
Figure 0003977782
によって算出される尤度比Rを計算する。
【0077】
尤度評価部405は、算出した尤度比R=maxQi/secondQiを、入力された類似度パラメータ106(1セグメントデータ403と時系列パターン発生モデルとの類似度を判別する際の判別基準値)とを比較する。尤度評価部405は、尤度比R=maxQi/secondQiが類似度パラメータ106以下であると判断した場合は、この1セグメントデータに類似する時系列パターン発生モデル409は存在しないと判断し、この1セグメントデータ403を新規モデル作成部407に送出する。
【0078】
新規モデル作成部407は、受け取った1セグメントデータ403の長さ、高さ及び形状データと、長さおよび高さの平均(ここでは初期値として1セグメントデータの長さと高さそのものを用いる)と、長さ及び高さの標準偏差(ここでは初期値として0または既に得られている標準偏差の平均の30%など)とからなる、時系列パターン発生モデル409を作成する。新規モデル作成部407は、作成した時系列パターン発生モデル409を図示しないバッファに記憶するとともに、継続指示データ412をセグメント取出継続評価部401に送出して、セグメント継続評価部401に処理を移行する。
【0079】
一方、尤度評価部405は、算出した尤度比R=maxQi/secondQiが類似度パラメータ106よりも大きいと判断した場合は、この1セグメントデータ403は、最大尤度maxQiを持つ時系列パターン発生モデル409と類似していると判断する。尤度評価部405は、1セグメントデータ403と類似情報410(いずれの時系列パターン発生モデルに類似しているかを示す情報)とをモデル再学習部406に送出して、モデル再学習部406へ処理を移行する。
【0080】
モデル再学習部406は、類似情報410に指定された時系列パターン発生モデルを図示しないバッファから取り出し、以下の(式3)に示す平均・標準偏差更新関数に従って、この時系列パターン発生モデルのパラメータを学習(更新)する。
【数3】
Figure 0003977782
【0081】
(式3)に示す通り、モデル再学習部406は、形状の学習を行わず、長さの平均と標準偏差、及び、高さの平均と標準偏差のみを更新する。モデル再学習部406は、更新後の時系列パターン発生モデル409を用いて、図示しないバッファ内の対応する時系列パターン発生モデル409を置き換える。一方、モデル再学習部406は、継続指示データ412をセグメント取出継続評価部401に送出して、セグメント取出継続評価部401に処理を移行する。
【0082】
以下、本モデル群生成部306による処理動作について、セグメント長が1の生成時系列パターン307(図7(a)参照)を生成する場合を例に説明する。
【0083】
まず、図4に示すように、セグメント取出継続評価部401は、セグメントデータ305(歩行時のもの)内に取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403は存在すると判断し、1セグメント取出部402に処理を移行する。
【0084】
1セグメント取出部402は、セグメントデータ305から1セグメントデータ403(図6における形状y1の区間参照)を取り出し、モデル尤度計算部404に送出する。
【0085】
モデル尤度計算部404は、時系列パターン発生モデル409が図示しないバッファ内にまだ存在しないので(尤度比Rを算出するためには少なくとも2つの時系列パターン発生モデルが必要)、尤度を算出することなく、受け取った1セグメントデータ403をそのまま尤度評価部405に送出する。
【0086】
尤度評価部405も、受け取った1セグメントデータ403をそのまま新規モデル作成部407に送出する。
【0087】
新規モデル作成部407は、受け取った1セグメントデータ403を用いて、形状データと、長さ及び高さと、長さおよび高さの平均及び標準偏差とを第1の時系列パターン発生モデル409として生成し、図示しないバッファ内に記憶する。また、新規モデル作成部407は、セグメント取出継続評価部401に継続指示データ412を送出する。
【0088】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0089】
1セグメント取出部402は、セグメントデータ305から次の1セグメントデータ403(図6における形状y2の区間参照)を取り出して、モデル尤度計算部404に送出する。
【0090】
モデル尤度計算部404は、上述同様、1セグメントデータ403をそのまま尤度評価部405に送出する。
【0091】
尤度評価部405も、受け取った1セグメントデータ403をそのまま新規モデル作成部407に送出する。
【0092】
新規モデル作成部407は、上述と同様にして、受け取った1セグメント403を用いて、第2の時系列パターン発生モデル409を生成して、図示しないバッファ内に記憶するとともに、セグメント取出継続評価部401に継続指示データ412を送出する。
【0093】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータが存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0094】
1セグメント取出部402は、セグメントデータ305内からさらに次の1セグメントデータ403(図6における形状y3の区間参照)を取り出して、モデル尤度計算部404に送出する。
【0095】
モデル尤度算出部404は、上述した図示しないバッファ内における第1の時系列パターン発生モデル409と、1セグメントデータとを尤度関数(式1)に入力して第1の時系列パターン発生モデル409に対する尤度を求める。また、モデル尤度算出部404は、上述した第2の時系列パターン発生モデル409と1セグメントデータとを尤度関数(式1)に入力して第2の時系列パターン発生モデル409に対する尤度を求める。モデル尤度算出部404は、算出した第1及び第2の時系列パターン発生モデル409に対する尤度(尤度データ408)と、1セグメント取出部402から受け取った1セグメントデータ403とを、尤度評価部405に送出する。
【0096】
尤度評価部405は、(式2)に従って、尤度データ408を用いて、尤度比Rを算出し、算出した尤度比Rを、入力された類似度パラメータ106と比較する。尤度評価部405は、ここでは、尤度比Rは類似度パラメータ106以下であると判断し(第1及び第2の時系列パターン発生モデル409のいずれにも類似していないと判断し)、1セグメントデータ403を新規モデル作成部407に送出する。
【0097】
新規モデル作成部407は、上述と同様にして、受け取った1セグメントデータ403を用いて、第3の時系列モデル発生モデル409を生成して図示しないバッファ内に記憶するとともに、セグメント取出継続評価部401に継続指示データ412を送出する。
【0098】
継続指示データ412を受け取ったセグメント取出継続評価部401は、セグメントデータ305(図6参照)内にまだ取り出すべき1セグメントデータ403が存在するか否かを判断する。ここでは、セグメント取出継続評価部401は、取り出すべき1セグメントデータ403はまだ存在すると判断し、1セグメント取出部402に処理を移行する。
【0099】
1セグメント取出部402は、セグメントデータ305内からさらに次の1セグメントデータ403(図6における形状y4の区間参照)を取り出し、モデル尤度計算部404に送出する。
【0100】
モデル尤度算出部404は、上述と同様に、第1、第2および第3の時系列パターン発生モデルに対する1セグメントデータ403の尤度を、尤度関数(式1)を用いて算出する。モデル尤度算出部404は、算出した3つの尤度のうち1番目及び2番目に大きいもの(尤度データ408)と、1セグメント取出部402から受け取った1セグメントデータ403とを、尤度評価部405に送出する。
【0101】
尤度評価部405は、受け取った尤度データ408を用いて、(式2)に従って、尤度比Rを算出する。尤度評価部405は、算出した尤度比Rと類似度パラメータ106とを比較する。尤度評価部405は、ここでは尤度比Rは類似度パラメータ106より大きいと判断する。尤度評価部405は、最大尤度を持つ時系列パターン発生モデル(ここでは第1の時系列パターン発生モデルとする)と1セグメントデータ403とは類似していると判断する。従って、尤度評価部405は、1セグメントデータ403と類似情報410とをモデル再学習部406に送出する。
【0102】
モデル再学習部406は、類似情報410に基づいて第1の時系列パターン発生モデル409を特定し、この第1の時系列パターン発生モデル409と1セグメントデータ403とを用いて、上述の(式3)に従って、第1の時系列パターン発生モデル409のパラメータを学習(更新)する。上述したように、形状の学習は行わず、長さと高さの平均及び標準偏差のみを更新する。パラメータを更新したモデル再学習部406は、セグメント取出継続評価部401に継続指示データ412を送出する。
【0103】
以上に説明した処理を、セグメントデータ305内の残りの他の1セグメントデータ403(図6における形状y5の区間参照)および走行時における各1セグメントデータ403(図6における形状y6〜y10の区間参照)についても行い、最終的に、パターン長が1である5つの時系列パターン発生モデル409(図7(a)参照)が取得される(図示しないバッファ内に格納される)。そして、セグメント取出継続評価部401は、セグメントデータ305内に取り出すべき1セグメントデータが存在しないと判断したら、上で取得された5つの時系列パターン発生モデル409をそれぞれ時系列パターンとして確定し、これらを生成時系列パターン307として出力する(図7(a)参照)。上述から分かるように、生成時系列パターン307を構成する各時系列パターンは、新規に時系列パターン発生モデルを生成する元となった1セグメントデータの長さ、高さ、形状と、上述した、長さ及び高さの平均及び標準偏差とを有する。なお、図7、図8、図9、図11及び図12に示される各時系列パターンに付された長さl、高さΔh及び形状yは、ここでは、この1セグメントデータの長さ、高さ、形状とする。
【0104】
以上では、パターン長が1の場合におけるモデル群生成部306の処理動作について説明したが、パターン長が2,3・・・の場合も同様にして行われる。
【0105】
次に、図1に示すように、時系列パターン評価部105について説明する。
【0106】
図2は、時系列パターン評価部105の構成を詳細に示す図である。
【0107】
上述したように、時系列パターン評価部105は、出力時系列パターン104が所望の基準を満たすか否かを判断し、満たす場合は、後述するようにして最終時系列パターン107を出力し、一方、満たさない場合は、類似度パラメータ106を補正する。
【0108】
図2に示すように、この時系列パターン評価部105は、出現確率計算部201、時系列パターン評価値計算部203、時系列パターン評価値評価部205および類似度パラメータ補正部206を備える。
【0109】
出現確率計算部201は、出力時系列パターン104を構成する各時系列パターン(図9参照)が、各時系列の状態(例えば歩行および走行)において出現する頻度(出現頻度)をそれぞれ調べる。そして、出現確率計算部201は、調べた結果を元に、各時系列パターンが、各状態において出現する確率(出現確率)を計算し、算出結果を出現確率202として時系列パターン評価値計算部203に送出する。
【0110】
図10は、図9の各時系列パターン1〜5,12,45(出力時系列パターン104)について算出した各状態における出現頻度(歩行時頻度及び走行時頻度)、各状態における出現確率202(歩行時確率及び走行時確率)及び時系列パターン評価値204(時系列パターン個別評価値の集合)を示した図表である。
【0111】
図10に示すように、各時系列パターン1〜5、12、45(図9参照)が、歩行時及び走行時のどちらに頻繁に現れるのかが分かる。例えば、時系列パターン1は、歩行時頻度が2、走行時頻度が0で、従って、歩行時確率は1、走行時確率は0である。
【0112】
時系列パターン評価値計算部203は、出現確率計算部201から受け取った出現確率202を用いて、各時系列パターンを評価するための時系列パターン個別評価値をそれぞれ算出し、算出した時系列パターン個別評価値を時系列パターン評価値204として時系列パターン評価値評価部205に送出する。ここで、時系列パターン個別評価値は、各時系列パターンの各状態への偏り具合状況を数値化して表したものである。
【0113】
図10に示す各時系列パターン個別評価値は、各時系列パターンの平均情報量(エントロピ)を元に算出したものである。この評価では、各時系列パターンは、平均情報量の値が低いほど各状態に偏った良い時系列パターンとなる。例えば、時系列パターン個別評価値が0のパターン1,2,4,5,12,45は、歩行時および走行時のいずれかにのみ出現する好ましい時系列パターンといえる。これに対し、時系列パターン個別評価値が0.150515のパターン3は、歩行時および走行時にそれぞれ同等の確率で出現しており、好ましくない時系列パターンであるといえる。
【0114】
時系列パターン評価値評価部205は、時系列パターン評価値計算部203から受け取った時系列パターン評価値204と入力された出力時系列パターン104とを用いて、出力時系列パターン104の評価を行う。
【0115】
より詳しくは、時系列パターン評価値評価部205は、時系列パターン評価値204を用いて出力時系列パターン104全体が所望の基準を満たすか否か評価するための時系列パターン全体評価値を算出する。
【0116】
時系列パターン評価値評価部205は、算出した時系列パターン全体評価値が所定の基準内にあれば、時系列パターン個別評価値が所定の基準外にある時系列パターンを除去したものを最終時系列パターン107として出力する。
【0117】
一方、時系列パターン評価値評価部205は、算出した時系列パターン全体評価値が所定の基準外ならば、時系列パターン評価値204を類似度パラメータ補正部206へ送出する。
【0118】
以下、出力時系列パターン104の評価について具体的に説明する。
【0119】
まず、図9〜図11を用いて、時系列パターン全体評価値が所定の基準内になる場合について説明する。
【0120】
時系列パターン評価値評価部205は、まず、時系列パターン評価値204の平均を算出し、これを時系列パターン全体評価値とする。時系列パターン評価値評価部205は、算出した時系列パターン全体評価値と、ユーザ等により設定された全体設定許容値0.11(ユーザにとって納得のいく出力時系列パターン104の水準を示し、好適には例えば0.15以下とする)とを比較する。つまり、時系列パターン評価値評価部205は、図10の時系列パターン評価値204の平均値0.022(=0.150515/7)と、全体設定許容値0.11とを比較する。平均値0.022は、全体設定許容値0.11よりも小さいので、時系列パターン評価値評価部205は、時系列パターン全体評価値は所定の基準内にあると判断する。時系列パターン評価値評価部205は、出力時系列パターン104を構成する各時系列パターン(図9参照)のうち、個別設定許容値(ユーザにとって納得のいく、各時系列パターンを評価する水準であり、ここでは全体設定許容値と同じ値0.11を有する)よりも高い時系列パターン個別評価値を有する時系列パターン(図10参照)が存在するか否かを判断する。そして、時系列パターン評価値評価部205は、そのような時系列パターンが存在すると判断した場合は、図9と図11とを比較して分かるように、その時系列パターン(図10の時系列パターン3)を出力時系列パターン104から除去する。そして、時系列パターン評価値評価部205は、除去後の出力時系列パターン104(図11参照)を最終時系列パターン107として出力する(図2参照)。
【0121】
上述では、全体設定許容値及び個別設定許容値としてそれぞれ同じ値を用いたが、それぞれ異なる値を設定してもよい。
【0122】
次に、図12および図13を用いて、時系列パターン評価値204から算出された時系列パターン全体評価値が所定の基準外になる場合について説明する。
【0123】
図12は、上述とは異なる値(上述よりも緩い値)を有する類似度パラメータ106によって時系列パターン生成部103(図1参照)において生成された出力時系列パターン104例を示す図である。この出力時系列パターン104は、上述と同様に、図5の時系列データ102から生成されたものである。
【0124】
図12に示すように、図9では異なる時系列パターンとして認識されていた時系列パターン12,45(図9参照)が、ここでは同一の時系列パターン12として認識されている。同様に、図9では異なる時系列パターンとして認識されていた時系列パターン1,4が、ここでは同一のパターン1として、また、図9では異なる時系列パターンとして認識されていた時系列パターン2,5が、ここでは、同一の時系列パターン2として認識されている。
【0125】
図13は、図12の各時系列パターンに対して上述と同様にして算出した各状態における出現頻度、各状態における出現確率202及び時系列パターン評価値204を示した図表である。
【0126】
ここで、出力時系列パターン104(図12参照)の評価について説明すると以下の通りである。
【0127】
上述と同様に、まず、時系列パターン評価値評価部205(図2参照)は、時系列パターン評価値204の平均(時系列パターン全体評価値)と、全体設定許容値0.11(所定の基準)とを比較する。時系列パターン評価値204の平均(時系列パターン全体評価値)は、図13から分かるように、0.150515であり、全体設定許容値0.11よりも大きい。従って、時系列パターン評価値評価部205は、時系列パターン全体評価値は所定の基準外にあると判断する。つまり、時系列パターン評価値評価部205は、図12の出力時系列パターン104は、目的を満たしていないと判断し、図2に示すように、時系列パターン評価値204を類似度パラメータ補正部206に送出する。
【0128】
類似度パラメータ補正部206は、時系列パターン評価値評価部205から受け取った時系列パターン評価値204を用いて類似度パラメータ206値を補正する(より厳しいものにする)。補正の例としては、時系列パターン評価値204の平均の前回との差分(初期値は例えば0とする)と、類似度パラメータ106の前回との差分(初期値は0とする)との比を定数倍し、今回の類似度パラメータ106からこれを減ずるなどがある。
【0129】
類似度パラメータ補正部206は、以上のようにして算出した補正後の類似度パラメータ106を、図1に示すように、時系列パターン生成部103に送出する。
【0130】
以上に説明したように、本実施の形態によれば、時系列データから、類似度パラメータで示される程度に相互に類似しない時系列パターンを、形状が複雑なものも含めて、パターン長を固定することなく、生成することができる。
【0131】
また、時系列データに加えて、時系列の状態も用いるようにしたので、各状態について、できるだけ他の状態には出現しない時系列パターンを生成することが可能となる。
【0132】
また、目的の基準に沿った時系列パターンが得られるまで、類似度パラメータを何度でも補正して、最終的に、時系列の状態全てに対して固有の時系列パターンを得ることができる。この際、効率よく類似パラメータを補正することで、より早く目的の基準に沿った時系列パターンを生成することが可能になる。
【0133】
また、生成された時系列パターンの各状態における出現確率を算出するようにしたので、時系列パターン個別評価値として、例えば平均情報量を用いることが可能となる。
【0134】
また、出現頻度が低い時系列パターンについては削除するようにしたので有効な時系列パターンの生成が可能となる。
【0135】
また、削除後残存時系列パターン内の各時系列パターンに対応する時系列データを含むように、パターン長増加後におけるセグメントデータの切出しを行うようにしたので、あまり重要でないセグメントデータの切出しを無視して、効率のよいセグメントデータの切出しが可能になる。
【0136】
また、セグメント情報(長さ及び高さ)のみではなく、正規化した形状をも用いて、時系列パターン発生モデルに対する尤度を計算するようにしたので、セグメントデータの形状が複雑な形状を保持していても、適正な類否判別が可能となる。つまり、セグメントデータが複雑な形状を保持していても、相互に類似しない時系列パターンを、長さと高さの曖昧さを吸収して、時系列データから効率よく生成することができる。
【0137】
また、得られた時系列パターンが目的に合うかどうかを評価し、目的に沿わない時系列パターンは除去するようにしたので、目的に沿った時系列パターンのみを確実に抽出することができる。
【0138】
また、各時系列の状態に偏った時系列パターンを抽出できるので、時系列パターンによるクラス分類も行うことができる。
【0139】
また、時系列パターン全体評価値(時系列パターン個別評価値の平均)と全体設定許容値(所定の基準)とを比較して出力時系列パターンを評価するようにしたので、ユーザにとって理解しやすい閾値設定を行うことが可能になる。
【0140】
また、各状態における時系列パターンの出現確率や、時系列パターン全体評価値、時系列パターン個別評価値等を画面上等に表示することで、ユーザが時系列パターンを自ら選択することもできる。
【0141】
【発明の効果】
本発明により、各状態に対して他の状態と区別することができる固有の時系列パターンを各状態から得られた時系列データに基づき自動的に生成できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に関わる時系列パターン生成装置の構成例を示す図。
【図2】時系列パターン生成装置における時系列パターン評価値評価部の構成例を示す図。
【図3】時系列パターン生成装置における時系列パターン生成部の構成例を示す図。
【図4】時系列パターン生成部におけるモデル群生成部の構成例を示す図。
【図5】状態データおよび時系列データを説明するための図。
【図6】セグメント情報、セグメントデータおよび1セグメントデータを説明するための図。
【図7】生成時系列パターンの例を示す図。
【図8】削除後残存時系列パターンの例(パターン長が2の場合)を示す図。
【図9】出力時系列パターンの例を示す図。
【図10】出現頻度、出現確率および時系列パターン個別評価値の例を示す図表。
【図11】最終時系列パターンの例を示す図。
【図12】途中段階での出力時系列パターンの例を示す図。
【図13】途中段階での出現確率および時系列パターン個別評価値の例を示す図表。
【符号の説明】
101 状態データ
102 時系列データ
103 時系列パターン生成部
104 出力時系列パターン
105 時系列パターン評価部
106 類似度パラメータ
107 最終時系列パターン
201 出現確率計算部
202 出現確率
203 時系列パターン評価値計算部
204 時系列パターン評価値
205 時系列パターン評価値評価部
206 類似度パラメータ補正部
301 セグメント化部
302 セメント情報
303 セグメント切出し部
305 セグメントデータ
306 モデル群生成部
307 生成時系列パターン
308 時系列パターン削除部
309 削除後残存時系列パターン
311 継続評価部
312 継続処理部
401 セグメント取出継続評価部
402 1セグメント取り出し部
403 1セグメントデータ
404 モデル尤度計算部
405 尤度評価部
406 モデル再学習部
407 新規モデル作成部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a time-series pattern generation apparatus and a time-series pattern generation method for generating a time-series pattern specific to each state from time-series data corresponding to a plurality of states to be observed, and time series data that are not similar to each other. The present invention relates to a time series pattern generation method for generating a series pattern.
[0002]
[Prior art]
With the improvement of sensing technology and processor technology, sensors have become familiar with the reduction in cost. For example, it has become possible to attach a sensor to the foot and acquire the operation as time-series data.
[0003]
Therefore, it is becoming possible to attach a sensor to a person to acquire time series data, and to generate a characteristic time series pattern that appears when the person performs some action from the acquired time series data. Yes. In addition, in order to identify what kind of action the person is doing, the time series data obtained from each action (time series state) is used to generate a time series pattern specific to each action. Has also become required.
[0004]
However, in general, the time series pattern to be acquired often has a huge amount, and there is a problem that it takes a lot of labor to search for the time series pattern by hand.
[0005]
Also, there is no known method for generating a time series pattern specific to each operation using the above-described latter, that is, time series data obtained from each state.
[0006]
On the other hand, with respect to the former, that is, to generate a time-series pattern characteristic of this state using time-series data obtained from a certain state, as a method for realizing this, for example, time-series clustering and rule analysis There is a non-patent document 2 extended in time series.
[0007]
However, in any case, it is necessary to divide the time series data into segments (segmentation) according to an appropriate standard for processing, but in the former time series clustering, the number of segments (number of segments), that is, the pattern length is constant. There is a drawback that it is necessary to be (fixed).
[0008]
On the other hand, the latter rule analysis has the advantage that the pattern length is automatically determined and the time series pattern can be generated efficiently, but when generating a time series pattern with a long pattern length, the time series with a short pattern length A long time series pattern is expressed by combining patterns. For this reason, there exists a fault which each time series pattern tends to be averaged. This is because a short time-series pattern is simple in shape, and thus there are many approximate time-series patterns in many cases. Therefore, this method has a drawback that it cannot handle time-series patterns having a complicated shape when the pattern length becomes long.
[0009]
By the way, when generating a time series pattern, it is preferable that a lot of similar time series patterns are not generated. Therefore, it is necessary to determine similarity of the extracted time series data. In the similarity determination, there is a request that it is the same if the shape is similar even if the length and height are different (to absorb the ambiguity of the length and height). There was a drawback that only the length ambiguity could be absorbed. On the other hand, there is a method using a time series pattern generation model (Non-Patent Document 1) as a method that can absorb both ambiguity in length and height. In this method, the shape of the time series is not retained, and is regarded as a straight line. For this reason, there is a disadvantage that complicated shapes cannot be distinguished from each other.
[0010]
[Patent Document 1]
Japanese Patent Laid-Open No. 11-326542
[Patent Document 2]
JP-A-9-34719
[Non-Patent Document 1]
Xianping Ge and Padhraic Smyth, Deformable Markov Model Templates for Time-Series Pattern Matching, ACM SIGKDD (KDD-2000), pp.81-90, 2000
[Non-Patent Document 2]
Rakesh Agrawal, Tomasz Imielinski, Arun N. Swami, Mining Association Rules between Sets of Items in Large Databases, SIGMOD Conference
1993, pp.207-216, 1993
[0011]
[Problems to be solved by the invention]
As described above, conventionally, there has been a problem in that a time series pattern that can be distinguished from other time series states cannot be automatically generated for each time series state. In addition, when the pattern length is increased, there is a problem that a complicated shape cannot be handled. Furthermore, there is a problem that it is impossible to determine the similarity of a complicated shape that absorbs the ambiguity of length and height.
[0012]
The present invention has been made in consideration of the above-described circumstances, and each time-series state can be distinguished from other time-series states, and a time-series pattern unique to each time-series state is automatically generated. An object of the present invention is to provide a time-series pattern generation device and a time-series pattern generation method that can be generated easily. It is another object of the present invention to provide a time-series pattern generation method that can handle a complicated shape even when the pattern length increases. Furthermore, an object of the present invention is to provide a time-series pattern generation method that makes it possible to determine the similarity of complex shapes, thereby taking into account complex shapes in addition to length and height.
[0013]
  The time-series pattern generation device as one aspect of the present invention is
  A time-series pattern generation device used for generating a time-series pattern specific to each state from time-series data corresponding to a plurality of states to be observed,
  A data cutout unit that divides each time series data into several segments according to a certain standard, and cuts out data from each time series data with a specific segment length,
  A time series pattern corresponding to each of the plurality of data groups obtained by dividing each extracted data into a plurality of data groups having the same similarity using a similarity criterion for determining the similarity between data A model group generation unit for generating
  A time series pattern deleting unit that deletes a time series pattern corresponding to a data group composed of a number of data equal to or less than a deletion threshold;
  The remaining time series pattern is stored, and when the number of the remaining time series patterns is larger than a threshold value, the segment length is set in the data extraction unit.Instruct to enlargeA continuous evaluation department;With
  The data cutout unit cuts out data so as to partially include data corresponding to the time-series pattern remaining in the previous segment length.
  It is characterized by.
[0014]
  A time-series pattern generation method as one aspect of the present invention includes:
  A time series pattern generation method used to generate a time series pattern specific to each state from time series data corresponding to a plurality of states to be observed,
  A data extraction step of dividing each time series data into several segments according to a certain standard, and cutting out data from each time series data with a specific segment length,
  When each cut out data is divided into a plurality of data groups having the same similarity relationship by using a similarity determination criterion for determining the similarity between data, and corresponding to each of the plurality of data groups A model group generation step for generating a sequence pattern;
  A time series pattern deletion step of deleting a time series pattern corresponding to a data group consisting of a number of data equal to or less than a deletion threshold;
  The remaining time series pattern is stored, and when the number of the remaining time series patterns is larger than a threshold, the segment length is set.EnlargeA continuous evaluation step for determining to perform the data cutting step,
  In the data extraction step, the data is extracted so as to partially include data corresponding to the time series pattern remaining in the previous segment length.
It is characterized by.
[0015]
  Claim14In the method, the time series pattern evaluation value evaluation step stops outputting each time series pattern when there is a state that is not associated with any of the time series patterns.
  The similarity determination criterion correction step corrects the similarity determination criterion based on the overall evaluation value of the time series pattern.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
First, features of the present embodiment will be briefly described.
[0018]
FIG. 5 is a diagram showing time-series data 102 composed of time-series data obtained during walking and time-series data obtained during travel. This time-series data 102 is obtained from, for example, an acceleration sensor attached to a biological foot.
[0019]
In the figure, state data (label) 101 including a walking label and a traveling label is shown. The state data 101 is used to specify in what state the time-series data 102 has been acquired, as will be described later.
[0020]
In the present embodiment, a time series pattern specific to each state is generated using such time series data of each state (eg, walking, running).
[0021]
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0022]
FIG. 1 is a diagram illustrating a configuration example of a time-series pattern generation apparatus according to an embodiment of the present invention.
[0023]
As illustrated in FIG. 1, the time-series pattern generation device includes a time-series pattern generation unit 103 and a time-series pattern evaluation unit 105.
[0024]
The time-series pattern generation unit 103 uses the input state data 101 (see FIG. 5) and time-series data 102 (see FIG. 5) to have various pattern lengths that are not similar to each other (the pattern length is unfixed). Generate a time series pattern. Generation of time series patterns that are not similar to each other is performed using a similarity parameter 106 (similarity criterion) described later. The time series pattern generation unit 103 outputs the generated time series pattern group as an output time series pattern 104.
[0025]
FIG. 9 to be described later is a diagram showing an example of a time series pattern generated from the time series data 102 of FIG. In FIG. 9, a time series pattern with a pattern length of 1 (upper stage) and a time series pattern with a pattern length of 2 (lower stage) are shown.
[0026]
The time series pattern evaluation unit 105 uses the output time series pattern 104 output from the time series pattern generation unit 103 to evaluate whether or not the output time series pattern 104 satisfies a desired criterion.
[0027]
More specifically, first, the time series pattern evaluation unit 105 individually evaluates the time series pattern overall evaluation value for evaluating the entire output time series pattern 104 and each time series pattern constituting the output time series pattern 104. The time series pattern individual evaluation value for this is calculated using a method described later.
[0028]
Next, the time-series pattern evaluation unit 105 determines whether or not the time-series pattern overall evaluation value is within a predetermined standard, and if it is determined that it is within the predetermined standard, next, It is determined whether or not the time series pattern individual evaluation value is within a predetermined standard. When the time-series pattern evaluation unit 105 determines that there is a time-series pattern individual evaluation value that is outside the predetermined reference, the time-series pattern evaluation unit 105 deletes the time-series pattern having the time-series pattern individual evaluation value from the output time-series pattern 104. The time series pattern evaluation unit 105 outputs the output time series pattern 104 in this state as a final time series pattern 107 as shown in FIG.
[0029]
On the other hand, when the time series pattern evaluation unit 105 determines that the overall time series pattern evaluation value is outside the predetermined reference, the above-described similarity is determined using the overall time series pattern evaluation value or each time series pattern individual evaluation value. The parameter 106 is corrected in a more severe direction. Then, as shown in FIG. 1, the time-series pattern evaluation unit 105 sends the corrected similarity parameter 106 to the time-series pattern generation unit 104 and again causes the time-series pattern generation unit 103 to correct the similarity after correction. The output time series pattern 104 is output by the parameter 106. The time series pattern evaluation unit 105 repeats the correction of the similarity parameter 106 until the time series pattern overall evaluation value falls within a predetermined standard.
[0030]
The final time series pattern 107 output by the time series pattern evaluation unit 105 is a time series pattern finally obtained by this method (for example, a time series pattern unique to walking, a time series pattern unique to running). An example of the final time series pattern 107 is shown in FIG. This is obtained by removing the time series pattern (pattern 3) in which the time series pattern individual evaluation value is determined to be outside the predetermined reference from the output time series pattern 104 of FIG. 9 as described above. As will be apparent from the description below, the patterns 1, 2, and 12 are time series patterns unique to walking, and the other patterns 4, 5, and 45 are time series patterns unique to running. Note that the time series pattern evaluation unit 105 outputs only some of the top ranks (for example, those having a high appearance frequency) when there are a large number of time series patterns whose time series pattern individual evaluation values are within a predetermined standard. Anyway.
[0031]
Next, the time series pattern generation unit 103 and the time series pattern evaluation unit 105 will be described in more detail.
[0032]
First, the time series pattern generation unit 103 will be described.
[0033]
FIG. 3 is a diagram showing in detail the configuration of the time series pattern generation unit 103.
[0034]
As described above, the time series pattern generation unit 103 generates the output time series pattern 104 using the time series data 102 and the state data 101.
[0035]
As shown in FIG. 3, the time series pattern generation unit 103 includes a segmentation unit 301, a segment cutout unit 303, a model group generation unit 306, a time series pattern deletion unit 308, a continuation evaluation unit 311, and a continuation processing unit 312. Prepare.
[0036]
The segmentation unit 301 divides the input time series data 102 into a plurality of sections (segments) on a predetermined basis (segmentation), and for each section, a section size (length in the case of a one-dimensional time series), Calculate the height of the section. The segmenting unit 301 outputs the section size and the section height for each section as segment information 302. As an example of segmentation, there is piecewise linear approximation (in the case of a one-dimensional time series, broken line).
[0037]
FIG. 6 is a diagram showing a state in which time-series data (see FIG. 5) during walking and running are segmented.
[0038]
In FIG. 6, the segment information 302 described above is all data of (length l, height Δh) = (l1, Δh1), (l2, Δh2),..., (L10, Δh10). Here, heights Δh1, Δh2,... Δh10 (not shown) are the differences between the maximum height and the minimum height in each corresponding section. As the height of the section, for example, a difference in height between the beginning and the end of the section may be taken.
[0039]
As shown in FIG. 3, the segment cutout unit 303 adds segment data 305 (state data is not shown) to each piece of data constituting the segment information 302 described above by adding shape data of each section and input state data. ) Is generated. In the example of FIG. 6, the segment data 305 includes (length l, height Δh, shape y) = (l1, Δh1, y1), (l2, Δh2, y2),..., (L10, Δh10, y10). ) Of all data (state data not shown). The shape data y1, y2... Includes the length and height of the corresponding section, but the length and height data are obtained separately from the shape data because they are used in calculations described later. . Each piece of data (length l, height Δh, shape y) (state data not shown) constituting the segment data 305 is referred to as one segment data 403.
[0040]
The model group generation unit 306 uses the segment data 305 generated by the segment cutout unit 303 and the similarity parameter 106 described later, and is not similar to each other, and a time-series pattern based on a specific pattern length (number of segments) (for each state) Including frequency of appearance in time series data). The model group generation unit 306 outputs the generated time series pattern group as a generation time series pattern 307.
[0041]
FIGS. 7A and 7B are diagrams showing an example of a generated time series pattern 307 generated from the segment data 305 (see FIG. 6).
[0042]
More specifically, FIG. 7A is a diagram illustrating an example of a generated time series pattern 307 generated when the pattern length is 1. As shown in the figure, here, five time series patterns 1 to 5 are generated. Here, for example, “Reference: y1, y4” of the time-series pattern 1 indicates that it corresponds to the shapes y1, y4 in FIG. That is, the pattern 1 is a time series pattern generated from the shapes y1 and y4.
[0043]
On the other hand, FIG. 7B is a diagram showing an example of a generation time series pattern when the pattern length is 2. As shown in the figure, when the pattern length is 2, six time-series patterns 12, 23, 31, 45, 53, and 34 are generated.
[0044]
As shown in FIG. 3, the time series pattern deletion unit 308 deletes time series patterns whose appearance frequency is equal to or less than the deletion threshold among the time series patterns in the generated time series pattern 307 and deletes the remaining time series patterns. The remaining time series pattern 309 is output. This is because the time series pattern with a low appearance frequency is deleted to increase the calculation efficiency in the continuation evaluation unit 311 described later.
[0045]
FIG. 8 is a diagram illustrating an example of a post-deletion remaining time series pattern 309 obtained when the deletion threshold is set to 1 with respect to the generation time series pattern 307 (see FIG. 7B) having a pattern length of 2. .
[0046]
As can be seen by comparing FIG. 7B and FIG. 8, time series patterns 23, 31, 53, and 34 having an appearance frequency of 1 are deleted from the six time series patterns shown in FIG. 7B. Then, the patterns 12 and 45 whose appearance frequency is 2 are output as the remaining time series pattern 309 after deletion.
[0047]
The continuous evaluation unit 311 examines the number of time series patterns in the post-deletion remaining time series pattern 309 output by the time series pattern deletion unit 308. If the continuous evaluation unit 311 determines that the number of time-series patterns in the remaining time-series pattern 309 after deletion is not 0, that is, if it is determined that there is a possibility of generating a time-series pattern having a larger pattern length, After storing the remaining time series pattern 309 after deletion, the processing is shifted to the continuation processing unit 312.
[0048]
That is, the continuation processing unit 312 generates the segment data 305 having an increased pattern length (for example, increasing the pattern length from 1 to 2 or from 2 to 3) using the time-series data 102. At this time, the segment data 305 is acquired in a state including a portion of the time series data corresponding to the time series pattern in the remaining time series pattern 309 after deletion. This is to achieve efficient processing by suppressing the extraction of data that seems to be less important.
[0049]
On the other hand, if the continuation evaluation unit 311 determines that the number of time series patterns in the remaining time series pattern 309 after deletion is 0, that is, it is determined that there is no possibility of generating a time series pattern having a larger pattern length. In this case, the post-deletion remaining time series pattern 309 for each pattern length is output as the output time series pattern 104.
[0050]
FIG. 9 briefly described above is a diagram showing an example of an output time series pattern 104 obtained from the time series data 102 shown in FIG.
[0051]
Hereinafter, the processing operation by the above-described time series pattern generation unit 103 will be described in detail by taking as an example the case of generating the output time series pattern 104 of FIG. 9 from the time series data 102 of FIG.
[0052]
First, as shown in FIG. 3, the segmenting unit 301 segments the time-series data 102 (see FIG. 5) (see FIG. 6) to segment information 302 (length l1, height Δh) (length l2, Height Δh2)... Is generated and sent to the segment cutout unit 303.
[0053]
The segment cutout unit 303 uses the segment information 302 to generate segment data 305 (length 11, height Δh 1, shape y 1) (length 12, height Δh 2, shape y 2) (state data is not shown). )) Is generated and sent to the model group generation unit 306.
[0054]
The model group generation unit 306 uses the segment data 305 (length 11, height Δh 1, shape y 1) (length 12, height Δh 2, shape y 2) (state data not shown). A generated time-series pattern 307 (see FIG. 7A) consisting of time-similar patterns having a length of 1 and not similar to each other is generated and sent to the time-series pattern deleting unit 308.
[0055]
The time-series pattern deletion unit 308 deletes the time-series pattern having an appearance frequency of 1 or less from the received generated time-series pattern 307 and sends it to the continuous evaluation unit 311 as the remaining time-series pattern 309 after deletion (upper part of FIG. 9). reference).
[0056]
The continuous evaluation unit 311 determines the number of time-series patterns in the remaining time-series pattern 309 after deletion. In this case, since the number of patterns is not 0 (the number of patterns is 5 as shown in the upper part of FIG. 9), the post-deletion remaining time series pattern 309 is stored internally, and the post-deletion residual time series pattern 309 is continuously processed. To the unit 312.
[0057]
The continuation processing unit 312 generates segment data 305 having a pattern length of 2 using the received post-deletion remaining time-series pattern 309 and the time-series data 102 and sends the segment data 305 to the model group generation unit 306.
[0058]
Using the received segment data 305, the model group generation unit 306 generates a generation time series pattern 307 having a pattern length of 2 (see FIG. 7B) and sends it to the time series pattern deletion unit 308.
[0059]
The time series pattern deletion unit 308 deletes the time series pattern having an appearance frequency of 1 or less from the received generated time series pattern 307 (see the lower part of FIG. 9), and continues the evaluation unit 311 as the remaining time series pattern 309 after deletion. To send.
[0060]
The continuous evaluation unit 311 determines the number of time series patterns in the post-deletion remaining time series pattern 309. In this case, since the number of patterns is not 0 (the number of patterns is 2 as shown in the lower part of FIG. 9), the post-deletion remaining time series pattern 309 is stored, and the post-deletion remaining time series pattern 309 is stored in the continuation processing unit 312. Send it out.
[0061]
The continuation processing unit 312 generates segment data 305 with a pattern length of 3 using the received post-deletion remaining time-series pattern 309 and time-series data 102 and sends the segment data 305 to the model group generation unit 306.
[0062]
Using the received segment data 305, the model group generation unit 306 generates a generation time series pattern 307 having a pattern length of 3 (not shown) and sends it to the time series pattern deletion unit 308.
[0063]
The time-series pattern deleting unit 308 deletes the time-series pattern having an appearance frequency of 1 or less from the received generated time-series pattern 307 as a post-deletion remaining time-series pattern 309 (not shown) and sends it to the continuous evaluation unit 311. To do.
[0064]
The continuous evaluation unit 311 determines the number of time series patterns in the post-deletion remaining time series pattern 309. Since the number of time series patterns is 0 (not shown), the continuation evaluation unit 311 outputs the post-deletion remaining time series pattern 309 (see FIG. 9) having the previously stored pattern lengths 1 and 2 as the output time series pattern 104. Output as.
[0065]
Here, the model group generation unit 306 (see FIG. 3) constituting the time series pattern generation unit 103 will be described in more detail.
[0066]
FIG. 4 is a diagram illustrating a detailed configuration example of the model group generation unit 306.
[0067]
As described above, the model group generation unit 306 includes the segment data 305 (length 11, height Δh 1, shape y 1) (length 12, height Δh 2, shape y 2) (state data not shown). The generation time series pattern 307 is generated from the above.
[0068]
As shown in FIG. 4, the model group generation unit 306 includes a segment extraction continuation evaluation unit 401, a one segment extraction unit 402, a model likelihood calculation unit 404, a likelihood evaluation unit 405, a model relearning unit 406, and a new model. A creation unit 407 is provided.
[0069]
The segment extraction continuation evaluation unit 401 determines whether all the one segment data 403 in the segment data 305 (each data constituting the segment data 305 as described above) has been extracted by the next one segment extraction unit 402. . When the segment extraction continuation evaluation unit 401 determines that one segment data 403 cannot be extracted any more, that is, if all the one segment data 403 in the segment data 305 has been extracted, A series pattern (see FIGS. 7A and 7B) is taken out from a buffer (not shown) and output as a generation time series pattern 307.
[0070]
On the other hand, when the segment extraction continuation evaluation unit 401 determines that the one segment data 403 to be extracted still exists in the segment data 305, the process proceeds to the one segment extraction unit 402.
[0071]
The one segment extraction unit 402 extracts the one segment data 403 from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0072]
The model likelihood calculation unit 404 is, for example, a likelihood function shown in the following (Equation 1).
[Expression 1]
Figure 0003977782
Are used to calculate the likelihood (fitness) of the one segment data 403 for each time series pattern generation model 409 (time series pattern as an intermediate stage) to be described later.
[0073]
Here, in (Equation 1), li, Δhi, Yi(T), μli, ΜΔhi, ΣliAnd σΔhiAre parameters of the time-series pattern generation model 409. More specifically, liIs the length, ΔhiIs height, yi(T) shows shape data. Also, as will become clear from the following, μliAnd σliIs the mean and standard deviation of the length, μΔhiAnd σΔhiIndicates the mean and standard deviation of the height. On the other hand, l 'i, Δh ′i, Y 'i(T) is a parameter of the one-segment data 403. Gμ , σ(X) represents a normal distribution function in which the average is μ and the standard deviation is σ.
[0074]
As shown in (Expression 1), this likelihood function obtains the degree of fit between the one-segment data 403 and each time-series pattern generation model from the viewpoints of length, height, and shape. Specifically, the likelihood function has three multiplication terms in Σ, the leftmost multiplication term is the fitness of length, the second multiplication term is the fitness of height, the third Corresponds to the conformity of the shape. The conformity of the shape is obtained by normalizing the shape data of the one-segment data 403 and the shape data of the time-series pattern generation model 409 (in a state in which the size is corrected to a reference size excluding the influence of the length and height). Seeking. Therefore, according to (Equation 1), even if the length and height are somewhat different, if the shapes are similar, the likelihood indicating high suitability is calculated. However, when the length or height of the one-segment data 403 is very different from the time-series pattern generation model 409, even if the shapes are similar, the length is low depending on the leftmost multiplication term and the second multiplication term. A likelihood indicating suitability is calculated.
[0075]
The model likelihood calculation unit 404 uses the maximum likelihood and the second likelihood of the likelihoods calculated using (Equation 1) as the likelihood data 408, as shown in FIG. It is sent to the next likelihood evaluation unit 405.
[0076]
The likelihood evaluating unit 405 is configured to calculate the maximum likelihood (maxQ calculated by the model likelihood calculating unit 404).i) And second likelihood (secondQi) Based on the likelihood ratio calculation formula shown in the following (Formula 2)
[Expression 2]
Figure 0003977782
The likelihood ratio R calculated by is calculated.
[0077]
The likelihood evaluating unit 405 calculates the calculated likelihood ratio R = maxQi/ secondQiIs compared with the input similarity parameter 106 (a determination reference value for determining the similarity between the one-segment data 403 and the time-series pattern generation model). Likelihood evaluation section 405 uses likelihood ratio R = maxQ.i/ secondQiIs determined to be equal to or less than the similarity parameter 106, it is determined that there is no time-series pattern generation model 409 similar to the one-segment data, and the one-segment data 403 is sent to the new model creation unit 407.
[0078]
The new model creation unit 407 receives the length, height and shape data of the received one-segment data 403, and the average of the length and height (here, the length and height of the one-segment data are used as initial values) A time-series pattern generation model 409 is created which includes standard deviations of length and height (here, 0 as an initial value or 30% of the average of standard deviations already obtained). The new model creation unit 407 stores the created time-series pattern generation model 409 in a buffer (not shown), and sends the continuation instruction data 412 to the segment extraction continuation evaluation unit 401, and shifts the processing to the segment continuation evaluation unit 401. .
[0079]
On the other hand, the likelihood evaluation unit 405 calculates the calculated likelihood ratio R = maxQ.i/ secondQiIs determined to be larger than the similarity parameter 106, the one-segment data 403 is obtained from the maximum likelihood maxQiIs determined to be similar to the time-series pattern generation model 409. Likelihood evaluation unit 405 sends 1-segment data 403 and similar information 410 (information indicating which time-series pattern generation model is similar) to model re-learning unit 406, to model re-learning unit 406. Migrate processing.
[0080]
The model re-learning unit 406 takes out the time-series pattern generation model specified in the similar information 410 from a buffer (not shown), and sets the parameters of this time-series pattern generation model according to the average / standard deviation update function shown in (Equation 3) below. Learn (update).
[Equation 3]
Figure 0003977782
[0081]
As shown in (Expression 3), the model re-learning unit 406 does not learn the shape, and updates only the average length and standard deviation, and the average height and standard deviation. The model relearning unit 406 uses the updated time series pattern generation model 409 to replace the corresponding time series pattern generation model 409 in a buffer (not shown). On the other hand, the model re-learning unit 406 sends the continuation instruction data 412 to the segment extraction continuation evaluation unit 401 and shifts the processing to the segment extraction continuation evaluation unit 401.
[0082]
Hereinafter, the processing operation by the model group generation unit 306 will be described by taking as an example a case where a generation time series pattern 307 (see FIG. 7A) having a segment length of 1 is generated.
[0083]
First, as shown in FIG. 4, the segment extraction continuation evaluation unit 401 determines whether or not one segment data 403 to be extracted exists in the segment data 305 (the one at the time of walking). Here, the segment extraction continuation evaluation unit 401 determines that there is one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0084]
The 1-segment extraction unit 402 extracts 1-segment data 403 (see the section of the shape y1 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0085]
Since the model likelihood calculation unit 404 does not yet have the time series pattern generation model 409 in the buffer (not shown) (at least two time series pattern generation models are required to calculate the likelihood ratio R), the likelihood is calculated. Without calculation, the received one-segment data 403 is sent to the likelihood evaluation unit 405 as it is.
[0086]
The likelihood evaluating unit 405 also sends the received one segment data 403 to the new model creating unit 407 as it is.
[0087]
The new model creation unit 407 uses the received 1-segment data 403 to generate shape data, length and height, and average and standard deviation of the length and height as the first time-series pattern generation model 409. And stored in a buffer (not shown). Also, the new model creation unit 407 sends continuation instruction data 412 to the segment extraction continuation evaluation unit 401.
[0088]
The segment extraction continuation evaluation unit 401 that has received the continuation instruction data 412 determines whether there is still one segment data 403 to be extracted in the segment data 305 (see FIG. 6). Here, the segment extraction continuation evaluation unit 401 determines that there is still one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0089]
The 1-segment extraction unit 402 extracts the next 1-segment data 403 (see the section of the shape y2 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0090]
The model likelihood calculation unit 404 sends the one segment data 403 to the likelihood evaluation unit 405 as it is, as described above.
[0091]
The likelihood evaluating unit 405 also sends the received one segment data 403 to the new model creating unit 407 as it is.
[0092]
The new model creation unit 407 generates a second time-series pattern generation model 409 using the received one segment 403 in the same manner as described above, stores it in a buffer (not shown), and extracts the segment extraction continuation evaluation unit. The continuation instruction data 412 is sent to 401.
[0093]
The segment extraction continuation evaluation unit 401 that has received the continuation instruction data 412 determines whether there is still one segment data to be extracted in the segment data 305 (see FIG. 6). Here, the segment extraction continuation evaluation unit 401 determines that there is still one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0094]
The 1-segment extraction unit 402 further extracts the next 1-segment data 403 (see the section of the shape y3 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0095]
The model likelihood calculating unit 404 inputs the first time-series pattern generation model 409 and the one-segment data in the above-described buffer (not shown) to the likelihood function (Equation 1), and inputs the first time-series pattern generation model. The likelihood for 409 is obtained. Further, the model likelihood calculating unit 404 inputs the above-described second time series pattern generation model 409 and one segment data into the likelihood function (Equation 1), and the likelihood for the second time series pattern generation model 409. Ask for. The model likelihood calculation unit 404 calculates the likelihood (likelihood data 408) for the calculated first and second time-series pattern generation models 409 and the one-segment data 403 received from the one-segment extraction unit 402 as the likelihood. The data is sent to the evaluation unit 405.
[0096]
The likelihood evaluation unit 405 calculates a likelihood ratio R using the likelihood data 408 according to (Equation 2), and compares the calculated likelihood ratio R with the input similarity parameter 106. Here, the likelihood evaluation unit 405 determines that the likelihood ratio R is equal to or less than the similarity parameter 106 (determines that it is not similar to any of the first and second time-series pattern generation models 409). 1 segment data 403 is sent to the new model creation unit 407.
[0097]
The new model creation unit 407 generates a third time series model generation model 409 using the received 1-segment data 403 and stores it in a buffer (not shown) in the same manner as described above. The continuation instruction data 412 is sent to 401.
[0098]
The segment extraction continuation evaluation unit 401 that has received the continuation instruction data 412 determines whether there is still one segment data 403 to be extracted in the segment data 305 (see FIG. 6). Here, the segment extraction continuation evaluation unit 401 determines that there is still one segment data 403 to be extracted, and shifts the processing to the one segment extraction unit 402.
[0099]
The 1-segment extraction unit 402 further extracts the next 1-segment data 403 (see the section of the shape y4 in FIG. 6) from the segment data 305 and sends it to the model likelihood calculation unit 404.
[0100]
The model likelihood calculation unit 404 calculates the likelihood of the one segment data 403 for the first, second, and third time series pattern generation models using the likelihood function (Equation 1), as described above. The model likelihood calculating unit 404 evaluates the likelihood of the first and second largest (likelihood data 408) of the calculated three likelihoods and the one segment data 403 received from the one segment extracting unit 402. To the unit 405.
[0101]
The likelihood evaluating unit 405 calculates a likelihood ratio R according to (Equation 2) using the received likelihood data 408. The likelihood evaluation unit 405 compares the calculated likelihood ratio R with the similarity parameter 106. Here, the likelihood evaluation unit 405 determines that the likelihood ratio R is larger than the similarity parameter 106. The likelihood evaluation unit 405 determines that the time series pattern generation model having the maximum likelihood (here, the first time series pattern generation model) is similar to the one segment data 403. Therefore, the likelihood evaluation unit 405 sends the one-segment data 403 and the similar information 410 to the model relearning unit 406.
[0102]
The model re-learning unit 406 identifies the first time-series pattern generation model 409 based on the similar information 410, and uses the first time-series pattern generation model 409 and the one-segment data 403, to According to 3), the parameters of the first time-series pattern generation model 409 are learned (updated). As described above, shape learning is not performed, and only the average of length and height and the standard deviation are updated. The model relearning unit 406 that has updated the parameters sends the continuation instruction data 412 to the segment extraction continuation evaluation unit 401.
[0103]
The processing described above is performed by using the remaining one segment data 403 in the segment data 305 (refer to the section of the shape y5 in FIG. 6) and the one segment data 403 at the time of traveling (refer to the sections of the shapes y6 to y10 in FIG. 6). ), And finally, five time-series pattern generation models 409 (see FIG. 7A) having a pattern length of 1 are acquired (stored in a buffer (not shown)). When the segment extraction continuation evaluation unit 401 determines that there is no one segment data to be extracted from the segment data 305, the five time-series pattern generation models 409 acquired above are determined as time-series patterns, respectively. Is generated as a generated time series pattern 307 (see FIG. 7A). As can be seen from the above, each time-series pattern constituting the generated time-series pattern 307 includes the length, height, and shape of the one-segment data from which the time-series pattern generation model is newly generated, With mean and standard deviation of length and height. The length l, the height Δh, and the shape y given to each time series pattern shown in FIGS. 7, 8, 9, 11, and 12 are the length of this one segment data, Height and shape.
[0104]
The processing operation of the model group generation unit 306 when the pattern length is 1 has been described above, but the same operation is performed when the pattern length is 2, 3,.
[0105]
Next, as shown in FIG. 1, the time series pattern evaluation unit 105 will be described.
[0106]
FIG. 2 is a diagram showing in detail the configuration of the time series pattern evaluation unit 105.
[0107]
As described above, the time series pattern evaluation unit 105 determines whether or not the output time series pattern 104 satisfies a desired criterion, and if so, outputs the final time series pattern 107 as described later, If not satisfied, the similarity parameter 106 is corrected.
[0108]
As illustrated in FIG. 2, the time series pattern evaluation unit 105 includes an appearance probability calculation unit 201, a time series pattern evaluation value calculation unit 203, a time series pattern evaluation value evaluation unit 205, and a similarity parameter correction unit 206.
[0109]
The appearance probability calculation unit 201 examines the frequency (appearance frequency) at which each time series pattern (see FIG. 9) constituting the output time series pattern 104 appears in each time series state (for example, walking and running). Then, the appearance probability calculation unit 201 calculates the probability (appearance probability) that each time series pattern appears in each state based on the result of the examination, and sets the calculation result as the appearance probability 202 to calculate the time series pattern evaluation value To 203.
[0110]
FIG. 10 shows the appearance frequency (walking frequency and running frequency) in each state calculated for each time series pattern 1 to 5, 12, 45 (output time series pattern 104) in FIG. 10 is a chart showing a walking probability and a running probability) and a time-series pattern evaluation value 204 (a set of time-series pattern individual evaluation values).
[0111]
As shown in FIG. 10, it can be seen whether each time-series pattern 1-5, 12, 45 (see FIG. 9) appears frequently during walking or running. For example, the time series pattern 1 has a walking frequency of 2 and a running frequency of 0, and thus the walking probability is 1 and the running probability is 0.
[0112]
The time series pattern evaluation value calculation unit 203 uses the appearance probability 202 received from the appearance probability calculation unit 201 to calculate each time series pattern individual evaluation value for evaluating each time series pattern, and calculates the calculated time series pattern. The individual evaluation value is sent to the time series pattern evaluation value evaluation unit 205 as the time series pattern evaluation value 204. Here, the time-series pattern individual evaluation value is a numerical representation of the state of bias of each time-series pattern to each state.
[0113]
Each time series pattern individual evaluation value shown in FIG. 10 is calculated based on the average information amount (entropy) of each time series pattern. In this evaluation, each time series pattern becomes a good time series pattern that is biased to each state as the value of the average information amount is lower. For example, the patterns 1, 2, 4, 5, 12, and 45 having the time series pattern individual evaluation value of 0 can be said to be preferable time series patterns that appear only when walking or running. On the other hand, the pattern 3 having the time series pattern individual evaluation value of 0.150515 appears at the same probability during walking and running, and can be said to be an unfavorable time series pattern.
[0114]
The time series pattern evaluation value evaluation unit 205 evaluates the output time series pattern 104 using the time series pattern evaluation value 204 received from the time series pattern evaluation value calculation unit 203 and the input output time series pattern 104. .
[0115]
More specifically, the time series pattern evaluation value evaluation unit 205 uses the time series pattern evaluation value 204 to calculate a time series pattern overall evaluation value for evaluating whether or not the entire output time series pattern 104 satisfies a desired criterion. To do.
[0116]
The time series pattern evaluation value evaluation unit 205 removes the time series pattern in which the time series pattern individual evaluation value is outside the predetermined reference if the calculated time series pattern overall evaluation value is within the predetermined reference. Output as a sequence pattern 107.
[0117]
On the other hand, the time series pattern evaluation value evaluation unit 205 sends the time series pattern evaluation value 204 to the similarity parameter correction unit 206 if the calculated time series pattern overall evaluation value is outside a predetermined reference.
[0118]
Hereinafter, the evaluation of the output time series pattern 104 will be specifically described.
[0119]
First, the case where the entire time series pattern evaluation value falls within a predetermined standard will be described with reference to FIGS.
[0120]
First, the time-series pattern evaluation value evaluation unit 205 calculates an average of the time-series pattern evaluation values 204 and sets this as the time-series pattern overall evaluation value. The time-series pattern evaluation value evaluation unit 205 indicates the calculated time-series pattern overall evaluation value and the overall setting allowable value 0.11 set by the user or the like (shows the level of the output time-series pattern 104 that is satisfactory to the user, preferably For example, 0.15 or less). That is, the time series pattern evaluation value evaluation unit 205 compares the average value 0.022 (= 0.150515 / 7) of the time series pattern evaluation value 204 of FIG. 10 with the overall setting allowable value 0.11. Since the average value 0.022 is smaller than the overall setting allowable value 0.11, the time series pattern evaluation value evaluation unit 205 determines that the time series pattern overall evaluation value is within a predetermined standard. The time-series pattern evaluation value evaluation unit 205 is an individual setting allowable value (at a level for evaluating each time-series pattern that is satisfactory to the user among the time-series patterns constituting the output time-series pattern 104 (see FIG. 9). Yes, here, it is determined whether or not there is a time series pattern (see FIG. 10) having a time series pattern individual evaluation value higher than (the same value 0.11 as the overall setting allowable value). When the time-series pattern evaluation value evaluating unit 205 determines that such a time-series pattern exists, the time-series pattern (the time-series pattern in FIG. 10) can be understood by comparing FIG. 9 and FIG. 3) is removed from the output time series pattern 104. Then, the time series pattern evaluation value evaluation unit 205 outputs the output time series pattern 104 after removal (see FIG. 11) as the final time series pattern 107 (see FIG. 2).
[0121]
In the above description, the same value is used as the overall setting allowable value and the individual setting allowable value, but different values may be set.
[0122]
Next, a case where the time series pattern overall evaluation value calculated from the time series pattern evaluation value 204 is outside a predetermined standard will be described with reference to FIGS. 12 and 13.
[0123]
FIG. 12 is a diagram illustrating an example of the output time series pattern 104 generated in the time series pattern generation unit 103 (see FIG. 1) by the similarity parameter 106 having a value different from the above (a value looser than the above). This output time series pattern 104 is generated from the time series data 102 of FIG. 5 as described above.
[0124]
As shown in FIG. 12, the time series patterns 12 and 45 (see FIG. 9) recognized as different time series patterns in FIG. 9 are recognized as the same time series pattern 12 here. Similarly, time series patterns 1 and 4 recognized as different time series patterns in FIG. 9 are the same pattern 1 here, and time series patterns 2 and 2 recognized as different time series patterns in FIG. 5 are recognized as the same time-series pattern 2 here.
[0125]
FIG. 13 is a chart showing the appearance frequency in each state, the appearance probability 202 in each state, and the time series pattern evaluation value 204 calculated in the same manner as described above for each time series pattern in FIG.
[0126]
Here, the evaluation of the output time series pattern 104 (see FIG. 12) will be described as follows.
[0127]
Similar to the above, first, the time-series pattern evaluation value evaluation unit 205 (see FIG. 2) first calculates the average of the time-series pattern evaluation values 204 (time-series pattern overall evaluation value) and the overall setting allowable value 0.11 (predetermined standard). And compare. As can be seen from FIG. 13, the average of the time series pattern evaluation values 204 (time series pattern overall evaluation value) is 0.150515, which is larger than the overall setting allowable value 0.11. Therefore, the time-series pattern evaluation value evaluation unit 205 determines that the overall time-series pattern evaluation value is outside a predetermined standard. That is, the time series pattern evaluation value evaluation unit 205 determines that the output time series pattern 104 in FIG. 12 does not satisfy the purpose, and converts the time series pattern evaluation value 204 to the similarity parameter correction unit as shown in FIG. To 206.
[0128]
The similarity parameter correction unit 206 corrects the similarity parameter 206 value (makes it stricter) using the time series pattern evaluation value 204 received from the time series pattern evaluation value evaluation unit 205. As an example of correction, the ratio of the difference between the average of the time-series pattern evaluation values 204 (the initial value is 0, for example) and the difference between the previous time of the similarity parameter 106 (the initial value is 0) Is multiplied by a constant, and this is subtracted from the similarity parameter 106 of this time.
[0129]
The similarity parameter correction unit 206 sends the corrected similarity parameter 106 calculated as described above to the time-series pattern generation unit 103 as shown in FIG.
[0130]
As described above, according to the present embodiment, the time length of the time series patterns that are not similar to each other as much as indicated by the similarity parameter is fixed from the time series data, including those having complicated shapes. Can be generated without.
[0131]
In addition to the time-series data, the time-series state is also used, so that it is possible to generate a time-series pattern that does not appear in other states as much as possible.
[0132]
Further, the similarity parameter can be corrected any number of times until a time series pattern that meets the target standard is obtained, and finally, a unique time series pattern can be obtained for all the time series states. At this time, it is possible to generate a time series pattern according to a target criterion earlier by efficiently correcting the similar parameters.
[0133]
Moreover, since the appearance probability in each state of the generated time series pattern is calculated, for example, an average information amount can be used as the time series pattern individual evaluation value.
[0134]
Further, since a time series pattern with a low appearance frequency is deleted, an effective time series pattern can be generated.
[0135]
In addition, segment data is extracted after the pattern length has been increased so that time series data corresponding to each time series pattern in the remaining time series pattern after deletion is included, so segmentation of less important segment data is ignored. Thus, efficient segment data can be extracted.
[0136]
In addition, not only segment information (length and height) but also the normalized shape is used to calculate the likelihood for the time-series pattern generation model, so the shape of the segment data retains a complex shape Even if this is done, it is possible to determine the appropriate similarity. That is, even if the segment data has a complicated shape, time series patterns that are not similar to each other can be efficiently generated from the time series data by absorbing the ambiguity of length and height.
[0137]
In addition, it is evaluated whether or not the obtained time series pattern meets the purpose, and the time series pattern that does not meet the purpose is removed, so that only the time series pattern that meets the purpose can be reliably extracted.
[0138]
Further, since a time series pattern biased to each time series state can be extracted, class classification based on the time series pattern can also be performed.
[0139]
In addition, since the time series pattern overall evaluation value (average of time series pattern individual evaluation values) is compared with the overall set allowable value (predetermined standard), the output time series pattern is evaluated, which is easy for the user to understand. It is possible to set a threshold value.
[0140]
In addition, by displaying the appearance probability of the time series pattern in each state, the entire time series pattern evaluation value, the time series pattern individual evaluation value, and the like on the screen or the like, the user can select the time series pattern himself.
[0141]
【The invention's effect】
According to the present invention, a unique time series pattern that can be distinguished from other states for each state can be automatically generated based on time series data obtained from each state.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration example of a time-series pattern generation apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating a configuration example of a time series pattern evaluation value evaluation unit in the time series pattern generation device.
FIG. 3 is a diagram illustrating a configuration example of a time series pattern generation unit in the time series pattern generation apparatus.
FIG. 4 is a diagram illustrating a configuration example of a model group generation unit in a time series pattern generation unit.
FIG. 5 is a diagram for explaining state data and time-series data.
FIG. 6 is a diagram for explaining segment information, segment data, and one-segment data.
FIG. 7 is a diagram showing an example of a generated time series pattern.
FIG. 8 is a diagram showing an example of a time series pattern remaining after deletion (when the pattern length is 2);
FIG. 9 is a diagram showing an example of an output time series pattern.
FIG. 10 is a chart showing an example of appearance frequency, appearance probability, and time-series pattern individual evaluation value.
FIG. 11 is a diagram showing an example of a final time series pattern.
FIG. 12 is a diagram showing an example of an output time-series pattern at an intermediate stage.
FIG. 13 is a chart showing an example of an appearance probability and a time-series pattern individual evaluation value at an intermediate stage.
[Explanation of symbols]
101 Status data
102 Time series data
103 Time-series pattern generator
104 Output time series pattern
105 Time-series pattern evaluation unit
106 Similarity parameter
107 Final time series pattern
201 Appearance probability calculator
202 Appearance probability
203 Time series pattern evaluation value calculator
204 Time series pattern evaluation value
205 Time-series pattern evaluation value evaluation unit
206 Similarity parameter correction unit
301 Segmentation section
302 Cement information
303 Segment cutout
305 segment data
306 Model group generator
307 Generation time series pattern
308 Time series pattern deletion part
309 Time series pattern remaining after deletion
311 Continuous Evaluation Department
312 Continuation processing section
401 Segment extraction continuation evaluation department
402 1 segment take-out part
403 1 segment data
404 Model likelihood calculator
405 Likelihood evaluation unit
406 Model re-learning section
407 New model creation department

Claims (20)

観測対象の複数の状態に対応する時系列データから各状態に固有の時系列パターンを生成するために用いる時系列パターン生成装置であって、
各前記時系列データをそれぞれある基準でいくつかのセグメントに区切り、特定のセグメント長で各前記時系列データからデータを切り出すデータ切出し部と、
データ同士の類似度を判別する類似度判別基準を用いて、各切り出されたデータを、同一の類似関係にある複数のデータ群に分割し、前記複数のデータ群の各々に対応する時系列パターンを生成するモデル群生成部と、
削除閾値以下の個数のデータからなるデータ群に対応する時系列パターンを削除する時系列パターン削除部と、
残った時系列パターンを記憶し、前記残った時系列パターンの個数が閾値より大きいとき前記データ切出し部に前記セグメント長を大きくすることを指示する継続評価部と、を備え、
前記データ切出し部は、前回のセグメント長で残った時系列パターンに対応するデータを一部に含むようにデータの切り出しを行う
ことを特徴とする時系列パターン生成装置。
A time-series pattern generation device used for generating a time-series pattern specific to each state from time-series data corresponding to a plurality of states to be observed,
A data cutout unit that divides each time series data into several segments according to a certain standard, and cuts out data from each time series data with a specific segment length,
A time series pattern corresponding to each of the plurality of data groups obtained by dividing each extracted data into a plurality of data groups having the same similarity using a similarity criterion for determining the similarity between data A model group generation unit for generating
A time series pattern deleting unit that deletes a time series pattern corresponding to a data group composed of a number of data equal to or less than a deletion threshold;
A continuation evaluation unit that stores the remaining time series pattern, and instructs the data extraction unit to increase the segment length when the number of the remaining time series patterns is greater than a threshold ,
The data cutout unit cuts out data so as to partially include data corresponding to the time-series pattern remaining in the previous segment length.
A time-series pattern generating apparatus characterized by the above .
前記モデル群生成部は、
時系列パターンを生成するモデルとなる時系列パターン発生モデルを作成する新規モデル作成部と、
前記時系列パターン発生モデルを修正するモデル再学習部と、
前記データ切出し部によって切り出されたデータの各前記時系列パターン発生モデルに対する尤度を、前記データの長さと、高さと、形状との観点から計算するモデル尤度計算部と、
各計算された尤度から前記データに類似する時系列パターン発生モデルが存在するかどうかを評価し、存在しない場合は、前記新規モデル作成部に前記データを用いて時系列パターン発生モデルを作成することを指示し、存在する場合には前記データに最も類似する時系列パターン発生モデルを前記データにより修正することを前記モデル再学習部に指示する尤度評価部と、
を含むことを特徴とする請求項に記載の時系列パターン生成装置。
The model group generation unit includes:
A new model creation unit that creates a time series pattern generation model that is a model for generating a time series pattern,
A model relearning unit for correcting the time-series pattern generation model;
A model likelihood calculation unit that calculates the likelihood of each time-series pattern generation model of the data cut out by the data cut-out unit from the viewpoint of the length, height, and shape of the data;
Evaluate whether or not a time series pattern generation model similar to the data exists from each calculated likelihood, and if not, create a time series pattern generation model using the data in the new model creation unit A likelihood evaluation unit that instructs the model re-learning unit to correct a time-series pattern generation model that is most similar to the data, if present, with the data;
The time-series pattern generating apparatus according to claim 1 , comprising:
前記尤度評価部は、各計算された尤度のうち最も高い尤度と次に高い尤度との比があらかじめ与えられた類似度パラメータの値を満たすとき、前記最も高い尤度をもつ時系列パターン発生モデルに前記データが最も類似することを決定することを特徴とする請求項に記載の時系列パターン生成装置。The likelihood evaluation unit has the highest likelihood when the ratio of the highest likelihood to the next highest likelihood among the calculated likelihoods satisfies the value of the similarity parameter given in advance. 3. The time series pattern generation apparatus according to claim 2 , wherein it is determined that the data is most similar to a series pattern generation model. 前記新規モデル作成部は、前記時系列パターン発生モデルの作成として前記データの長さ、高さおよび形状を算出し、
前記モデル再学習部は、前記時系列パターン発生モデルの修正として、前記長さ及び高さの平均及び標準偏差を計算し、
前記モデル尤度計算部は、各前記時系列パターン発生モデルにおける前記長さ、高さおよび形状ならびに前記長さおよび高さの平均及び標準偏差と、前記データの長さ、高さおよび形状とから、各前記時系列パターン発生モデルに対する尤度を計算することを特徴とする請求項2又は3に記載の時系列パターン生成装置。
The new model creation unit calculates the length, height and shape of the data as creation of the time series pattern generation model,
The model relearning unit calculates the average and standard deviation of the length and height as a modification of the time-series pattern generation model,
The model likelihood calculation unit includes the length, height, and shape of each time series pattern generation model, the average and standard deviation of the length and height, and the length, height, and shape of the data. The time series pattern generation apparatus according to claim 2 , wherein a likelihood for each time series pattern generation model is calculated.
前記継続評価部によって記憶された各時系列パターンの各前記時系列データにおける出現頻度に基づいて前記各時系列パターンの集合を採用するかどうかを評価し、
前記集合を採用する場合は、前記集合に含まれる各時系列パターンの各前記時系列データにおける出現頻度に基づいて各時系列パターンを各前記状態のいずれかに特定し、状態の特定された各時系列パターンを出力し、
前記集合を採用しない場合は、前記類似度判別基準をより厳しい方向に補正することを前記モデル群生成部に指示する、
時系列パターン評価部、をさらに備えたことを特徴とする請求項1に記載の時系列パターン生成装置。
Evaluating whether to adopt the set of each time series pattern based on the appearance frequency in each time series data of each time series pattern stored by the continuation evaluation unit,
When adopting the set, specify each time series pattern to one of the states based on the appearance frequency in each time series data of each time series pattern included in the set, each specified state Output time series pattern,
If the set is not adopted, the model group generation unit is instructed to correct the similarity determination criterion in a stricter direction.
The time series pattern generation device according to claim 1, further comprising a time series pattern evaluation unit.
前記時系列パターン評価部は、
各前記時系列パターンが各前記時系列データに出現する出現確率をそれぞれ計算する出現確率計算部と、
各前記時系列パターンごとに計算された各出現確率を用いて、各前記時系列パターンの集合を採用するかどうかを評価するための時系列パターン全体評価値を算出する時系列パターン評価値計算部と、
前記時系列パターン全体評価値があらかじめ与えられた全体設定許容値を満たすとき、各前記時系列パターンを出現確率が最も高い状態に特定する時系列パターン評価値評価部と、
前記時系列パターン全体評価値が前記全体設定許容値を満たさないとき、前記時系列パターン全体評価値に基づき前記類似度判別基準を補正し、補正した類似度判別基準を前記モデル群生成部に指定する、類似度判別基準補正部と、
を備えたことを特徴とする請求項に記載の時系列パターン生成装置。
The time-series pattern evaluation unit
An appearance probability calculating unit for calculating an appearance probability of each time series pattern appearing in each time series data;
Using each occurrence probability calculated for each time series pattern, a time series pattern evaluation value calculation unit that calculates an entire time series pattern evaluation value for evaluating whether or not to adopt each time series pattern set. When,
When the time series pattern overall evaluation value satisfies a pre-set overall setting allowable value, a time series pattern evaluation value evaluation unit that identifies each time series pattern as having the highest appearance probability,
When the time series pattern overall evaluation value does not satisfy the overall setting allowable value, the similarity determination criterion is corrected based on the time series pattern overall evaluation value, and the corrected similarity determination criterion is designated in the model group generation unit A similarity determination reference correction unit,
The time-series pattern generation apparatus according to claim 5 , comprising:
前記時系列パターン評価値計算部は、各前記時系列パターンごとに前記時系列パターンの各前記時系列データに対する出現の偏りを評価するための時系列パターン個別評価値を計算し、各計算された時系列パターン個別評価値から前記時系列パターン全体評価値を算出し、
前記時系列パターン評価値評価部は、前記時系列パターン全体評価値が前記全体設定許容値を満たすとき、各前記時系列パターン個別評価値があらかじめ与えられた個別設定許容値を満たすかどうかを検査し、前記個別設定許容値を満たさない時系列パターン個別評価値をもつ前記時系列パターンを除去し、前記個別設定許容値を満たす時系列パターン個別評価値をもつ時系列パターンを出現確率が最も高い状態に特定し、
前記類似度判別基準補正部は、前記時系列パターン全体評価値が前記全体設定許容値を満たさないとき、前記時系列パターン個別評価値及び前記時系列パターン全体評価値の少なくともいずれかに基づき前記類似度判別基準を補正する、
ことを特徴とする請求項に記載の時系列パターン生成装置。
The time-series pattern evaluation value calculation unit calculates a time-series pattern individual evaluation value for evaluating a bias of appearance of each time-series pattern with respect to each time-series data for each time-series pattern. Calculate the time series pattern overall evaluation value from the time series pattern individual evaluation value,
The time-series pattern evaluation value evaluation unit inspects whether each time-series pattern individual evaluation value satisfies a predetermined individual setting allowable value when the entire time-series pattern evaluation value satisfies the total setting allowable value. The time series pattern having the time series pattern individual evaluation value that does not satisfy the individual setting allowable value is removed, and the time series pattern having the time series pattern individual evaluation value that satisfies the individual setting allowable value has the highest appearance probability. Specific to the state,
The similarity determination criterion correction unit, when the time series pattern overall evaluation value does not satisfy the overall setting allowable value, based on at least one of the time series pattern individual evaluation value and the time series pattern overall evaluation value Correct the degree criterion,
The time-series pattern generation apparatus according to claim 6 .
観測対象の複数の状態に対応する時系列データから各状態に固有の時系列パターンを生成するために用いる時系列パターン生成方法であって、
各前記時系列データをそれぞれある基準でいくつかのセグメントに区切り、特定のセグメント長で各前記時系列データからデータを切り出すデータ切出しステップと、
データ同士の類似度を判別するための類似度判別基準を用いて、各切り出されたデータを、同一の類似関係にある複数のデータ群に分割し、前記複数のデータ群の各々に対応する時系列パターンを生成するモデル群生成ステップと、
削除閾値以下の個数のデータからなるデータ群に対応する時系列パターンを削除する時系列パターン削除ステップと、
残った時系列パターンを記憶し、前記残った時系列パターンの個数が閾値より大きいとき前記セグメント長を大きくして前記データ切出しステップを行うことを決定する継続評価ステップと、を備え、
前記データ切出しステップは、前回のセグメント長で残った時系列パターンに対応するデータを一部に含むようにデータの切り出しを行う
ことを特徴とする時系列パターン生成方法。
A time series pattern generation method used to generate a time series pattern specific to each state from time series data corresponding to a plurality of states to be observed,
A data extraction step of dividing each time series data into several segments according to a certain standard, and cutting out data from each time series data with a specific segment length,
When each cut out data is divided into a plurality of data groups having the same similarity relationship by using a similarity determination criterion for determining the similarity between data, and corresponding to each of the plurality of data groups A model group generation step for generating a sequence pattern;
A time series pattern deletion step of deleting a time series pattern corresponding to a data group consisting of a number of data equal to or less than a deletion threshold;
Storing a remaining time series pattern, and when the number of the remaining time series patterns is larger than a threshold, a continuous evaluation step for determining to perform the data extraction step by increasing the segment length, and
In the data extraction step, the data is extracted so as to partially include data corresponding to the time series pattern remaining in the previous segment length.
A time-series pattern generation method characterized by that .
前記モデル群生成ステップは、
時系列パターンを生成するモデルとなる時系列パターン発生モデルを作成する新規モデル作成ステップと、
前記時系列パターン発生モデルを修正するモデル再学習ステップと、
前記データ切出しステップによって切り出されたデータの各前記時系列パターン発生モデルに対する尤度を、前記データの長さと、高さと、形状との観点から計算するモデル尤度計算ステップと、
各計算された尤度から前記データに類似する時系列パターン発生モデルが存在するかどうかを評価し、存在しない場合は、前記新規モデル作成ステップにより前記データから時系列パターン発生モデルを作成し、存在する場合には前記モデル再学習ステップにより前記データに最も類似する時系列パターン発生モデルを前記データに基づき修正する尤度評価ステップと、
を含むことを特徴とする請求項に記載の時系列パターン生成方法。
The model group generation step includes:
A new model creation step for creating a time series pattern generation model to be a model for generating a time series pattern;
A model relearning step for correcting the time-series pattern generation model;
A model likelihood calculation step for calculating the likelihood of each time-series pattern generation model of the data extracted by the data extraction step from the viewpoint of the length, height, and shape of the data;
Evaluate whether or not there is a time series pattern generation model similar to the data from each calculated likelihood, and if not, create a time series pattern generation model from the data by the new model creation step A likelihood evaluation step of correcting a time-series pattern generation model most similar to the data based on the data in the model relearning step,
The time series pattern generation method according to claim 8 , comprising:
前記尤度評価ステップは、各計算された尤度のうち最も高い尤度と次に高い尤度との比があらかじめ与えられた類似度パラメータの値を満たすとき、前記最も高い尤度をもつ時系列パターン発生モデルに前記データが最も類似することを決定することを特徴とする請求項に記載の時系列パターン生成方法。When the likelihood evaluation step has the highest likelihood when the ratio of the highest likelihood to the next highest likelihood among the calculated likelihoods satisfies the value of the similarity parameter given in advance. The time series pattern generation method according to claim 9 , wherein it is determined that the data is most similar to a series pattern generation model. 前記新規モデル作成ステップは、前記時系列パターン発生モデルの作成として前記データの長さ、高さおよび形状を算出し、
前記モデル再学習ステップは、前記時系列パターン発生モデルの修正として、前記長さ及び高さの平均及び標準偏差を計算し、
前記モデル尤度計算ステップは、各前記時系列パターン発生モデルにおける前記長さ、高さおよび形状ならびに前記長さおよび高さの平均及び標準偏差と、前記データの長さ、高さおよび形状とから、各前記時系列パターン発生モデルに対する尤度を計算することを特徴とする請求項9又は10に記載の時系列パターン生成方法。
The new model creation step calculates the length, height and shape of the data as the creation of the time series pattern generation model,
The model relearning step calculates the average and standard deviation of the length and height as a modification of the time series pattern generation model,
The model likelihood calculation step includes the length, height, and shape of each time series pattern generation model, the average and standard deviation of the length and height, and the length, height, and shape of the data. The method for generating a time series pattern according to claim 9 or 10 , wherein a likelihood for each time series pattern generation model is calculated.
前記継続評価ステップにより記憶された各時系列パターンの各前記時系列データにおける出現頻度に基づいて前記各時系列パターンの集合を採用するかどうかを評価し、
前記集合を採用する場合は、前記集合に含まれる各時系列パターンの各前記時系列データにおける出現頻度に基づいて各時系列パターンを各前記状態のいずれかに特定し、状態の特定された各時系列パターンを出力し、
前記集合を採用しない場合は、前記類似度判別基準をより厳しい方向に補正する、時系列パターン評価ステップ、
をさらに備えたことを特徴とする請求項に記載の時系列パターン生成方法。
Evaluating whether to adopt the set of each time series pattern based on the appearance frequency in each time series data of each time series pattern stored by the continuous evaluation step,
When adopting the set, specify each time series pattern to one of the states based on the appearance frequency in each time series data of each time series pattern included in the set, each specified state Output time series pattern,
If the set is not adopted, a time series pattern evaluation step for correcting the similarity determination criterion in a stricter direction,
The time series pattern generation method according to claim 8 , further comprising:
前記時系列パターン評価ステップは、
各前記時系列パターンが各前記時系列データに出現する出現確率をそれぞれ計算する出現確率計算ステップと、
各計算された出現確率から各前記時系列パターンの集合を採用するかどうかを評価するための時系列パターン全体評価値を算出する時系列パターン評価値計算ステップと、
前記時系列パターン全体評価値があらかじめ与えられた全体設定許容値を満たすとき、各前記時系列パターンを出現確率が最も高い状態に特定し、状態の特定された各時系列パターンを出力する時系列パターン評価値評価ステップと、
前記時系列パターン全体評価値が前記全体設定許容値を満たさないとき、前記時系列パターン全体評価値に基づいて前記類似度判別基準を補正する、類似度判別基準補正ステップと、
を備えたことを特徴とする請求項12に記載の時系列パターン生成方法。
The time series pattern evaluation step includes:
An appearance probability calculating step for calculating an appearance probability of each time series pattern appearing in each time series data;
A time series pattern evaluation value calculating step for calculating an entire time series pattern evaluation value for evaluating whether or not to adopt each time series pattern set from each calculated appearance probability;
When the time series pattern overall evaluation value satisfies a pre-set overall setting allowable value, each time series pattern is specified as a state having the highest appearance probability, and each time series pattern in which the state is specified is output. A pattern evaluation value evaluation step;
When the time-series pattern overall evaluation value does not satisfy the overall setting allowable value, the similarity determination criterion correction step for correcting the similarity determination criterion based on the time-series pattern overall evaluation value;
The time series pattern generation method according to claim 12 , further comprising:
前記時系列パターン評価値評価ステップは、各前記時系列パターンのいずれにも対応づけられない状態があるとき、前記各時系列パターンの出力を中止し、
前記類似度判別基準補正ステップは、前記時系列パターン全体評価値に基づき前記類似度判別基準を補正することを特徴とする請求項13に記載の時系列パターン生成方法。
In the time series pattern evaluation value evaluation step, when there is a state that is not associated with any of the time series patterns, the output of each time series pattern is stopped,
The time series pattern generation method according to claim 13 , wherein the similarity determination criterion correction step corrects the similarity determination criterion based on the overall evaluation value of the time series pattern.
前記時系列パターン評価値計算ステップは、各前記時系列パターンごとに前記時系列パターンの各前記時系列データにおける出現確率のうち最大の出現確率と、前記最大の出現確率を除くすべての出現確率の和とを求め、前記最大の出現確率と前記出現確率の和とを用いて平均情報量を計算し、各前記時系列パターンから得られた平均情報量を用いて前記時系列パターン全体評価値を算出することを特徴とする請求項13に記載の時系列パターン生成方法。The time series pattern evaluation value calculating step includes, for each time series pattern, a maximum appearance probability among the appearance probabilities in each time series data of the time series pattern and all appearance probabilities excluding the maximum appearance probability. And calculating the average information amount using the maximum appearance probability and the sum of the appearance probabilities, and using the average information amount obtained from each time series pattern, The time series pattern generation method according to claim 13 , wherein the time series pattern generation method is calculated. 前記時系列パターン評価値計算ステップは、各前記時系列パターンごとに前記時系列パターンの各前記時系列データに対する出現の偏りを評価するための時系列パターン個別評価値を計算し、各計算された時系列パターン個別評価値から前記時系列パターン全体評価値を算出し、
前記時系列パターン評価値評価ステップは、前記時系列パターン全体評価値が前記全体設定許容値を満たすとき、各前記時系列パターン個別評価値があらかじめ与えられた個別設定許容値を満たすかどうかを検査し、前記個別設定許容値を満たさない時系列パターン個別評価値をもつ前記時系列パターンを除去し、前記個別設定許容値を満たす時系列パターン個別評価値をもつ時系列パターンを出現確率が最も高い状態に特定し、
前記類似度判別基準補正ステップは、前記時系列パターン全体評価値が前記全体設定許容値を満たさないとき、前記時系列パターン個別評価値及び前記時系列パターン全体評価値の少なくともいずれかを用いて前記類似度判別基準を補正する、
ことを特徴とする請求項13に記載の時系列パターン生成方法。
The time series pattern evaluation value calculation step calculates a time series pattern individual evaluation value for evaluating a bias of appearance of each time series pattern with respect to each time series data for each time series pattern, Calculate the time series pattern overall evaluation value from the time series pattern individual evaluation value,
In the time series pattern evaluation value evaluation step, when the time series pattern overall evaluation value satisfies the overall setting allowable value, it is checked whether or not each time series pattern individual evaluation value satisfies a predetermined individual setting allowable value. The time series pattern having the time series pattern individual evaluation value that does not satisfy the individual setting allowable value is removed, and the time series pattern having the time series pattern individual evaluation value that satisfies the individual setting allowable value has the highest appearance probability. Specific to the state,
The similarity determination reference correction step uses the time series pattern individual evaluation value and the time series pattern overall evaluation value when the time series pattern overall evaluation value does not satisfy the overall setting allowable value. Correct the similarity criterion,
The time-series pattern generation method according to claim 13 .
前記時系列パターン評価値計算ステップは、前記時系列パターンの各前記時系列データにおける出現確率のうち最大の出現確率と、前記最大の出現確率を除くすべての出現確率の和とを求め、前記最大の出現確率と前記出現確率の和とを用いて平均情報量を計算し、前記平均情報量を前記時系列パターンの時系列パターン個別評価値として得ることを特徴とする請求項16に記載の時系列パターン生成方法。The time series pattern evaluation value calculation step obtains a maximum appearance probability among the appearance probabilities in each time series data of the time series pattern and a sum of all appearance probabilities excluding the maximum appearance probability, using the occurrence probability between the sum of the occurrence probability to calculate the average amount of information, when according to the average amount of information to claim 16, characterized in that to obtain a time series pattern individual evaluation value of the time series pattern Series pattern generation method. 前記時系列パターン評価値計算ステップは、各前記時系列パターンの時系列パターン個別評価値を平均することにより前記時系列パターン全体評価値を得ることを特徴とする請求項17に記載の時系列パターン生成方法。The time series pattern evaluation value according to claim 17 , wherein the time series pattern evaluation value calculation step obtains the time series pattern overall evaluation value by averaging the time series pattern individual evaluation values of the time series patterns. Generation method. 前記出現確率、前記時系列パターン全体評価値、及び前記時系列パターン個別評価値の少なくともいずれかを出力する出力ステップをさらに備えたことを特徴とする請求項16ないし18のいずれか一項に記載の時系列パターン生成方法。The occurrence probability, the time series pattern overall evaluation value, and according to any one of the time series pattern to claims 16, characterized in that further comprising an output step of outputting at least one of the individual evaluation value 18 Time series pattern generation method. 前記継続評価ステップによって記憶された各前記時系列パターンが各前記時系列データに出現する出現確率をそれぞれ計算する出現確率計算ステップと、
各前記時系列パターンごとに計算された各出現確率を用いて、各前記時系列パターンの各前記時系列データに対する出現の偏りを評価するための時系列パターン個別評価値を計算し、各計算された前記時系列パターン個別評価値から、前記継続評価ステップにより記憶された各前記時系列パターンの集合を採用するかどうかを評価するための時系列パターン全体評価値を算出する前記時系列パターン評価値計算ステップと、
前記時系列パターン全体評価値があらかじめ与えられた全体設定許容値を満たすとき、各前記時系列パターン個別評価値があらかじめ与えられた個別設定許容値を満たすかどうかを検査し、前記個別設定許容値を満たさない時系列パターン個別評価値をもつ前記時系列パターンを除去し、前記個別設定許容値を満たす時系列パターン個別評価値をもつ時系列パターンを出現確率が最も高い状態に特定する前記時系列パターン評価値評価ステップと、
前記時系列パターン全体評価値が前記全体設定許容値を満たさないとき、時系列パターン個別評価値の平均の前回との差分と、前記類似度パラメータの前回との差分とに基づき、前記類似度パラメータをより厳しい方向に補正する、類似度判別基準補正ステップと、
を備えた請求項10に記載の時系列パターン生成方法。
An appearance probability calculating step of calculating an appearance probability of each time series pattern stored in the continuous evaluation step appearing in each time series data;
Using each occurrence probability calculated for each time-series pattern, calculate a time-series pattern individual evaluation value for evaluating the bias of appearance of each time-series pattern with respect to each time-series data. Further, the time series pattern evaluation value for calculating the time series pattern overall evaluation value for evaluating whether or not to adopt the set of each time series pattern stored in the continuous evaluation step from the time series pattern individual evaluation value. A calculation step;
When the time series pattern overall evaluation value satisfies a predetermined overall setting allowable value, the time series pattern individual evaluation value is inspected to satisfy a predetermined individual setting allowable value, and the individual setting allowable value The time series pattern having a time series pattern individual evaluation value that does not satisfy the time series pattern is determined, and the time series pattern having a time series pattern individual evaluation value that satisfies the individual setting allowable value is identified as having the highest appearance probability. A pattern evaluation value evaluation step;
When the overall evaluation value of the time series pattern does not satisfy the overall setting allowable value, the similarity parameter is based on the difference between the average of the time series pattern individual evaluation values and the previous difference of the similarity parameter. A similarity criterion correction step for correcting the image in a stricter direction,
The time series pattern generation method according to claim 10 , comprising:
JP2003195174A 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method Expired - Lifetime JP3977782B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003195174A JP3977782B2 (en) 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003195174A JP3977782B2 (en) 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method

Publications (2)

Publication Number Publication Date
JP2005031908A JP2005031908A (en) 2005-02-03
JP3977782B2 true JP3977782B2 (en) 2007-09-19

Family

ID=34206104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003195174A Expired - Lifetime JP3977782B2 (en) 2003-07-10 2003-07-10 Time-series pattern generation apparatus and time-series pattern generation method

Country Status (1)

Country Link
JP (1) JP3977782B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11455322B2 (en) 2020-05-12 2022-09-27 International Business Machines Corporation Classification of time series data

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11200632B2 (en) 2018-11-09 2021-12-14 Canon Kabushiki Kaisha Image processing method and image processing apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11455322B2 (en) 2020-05-12 2022-09-27 International Business Machines Corporation Classification of time series data

Also Published As

Publication number Publication date
JP2005031908A (en) 2005-02-03

Similar Documents

Publication Publication Date Title
CN108921782A (en) A kind of image processing method, device and storage medium
KR102177412B1 (en) System and Method for Matching Similarity between Image and Text
CN106204646A (en) Multiple mobile object tracking based on BP neutral net
JP2019194857A (en) Object tracking method and device
JPH0916619A (en) Method and device for processing information
KR20060129366A (en) Continuous face recognition with online learning
JP6897793B2 (en) Person matching device, method, and program
JP2991779B2 (en) Character recognition method and device
CN111429341B (en) Video processing method, device and computer readable storage medium
Yang et al. Combination of manual and non-manual features for sign language recognition based on conditional random field and active appearance model
JP3977782B2 (en) Time-series pattern generation apparatus and time-series pattern generation method
CN114093021A (en) Dance video motion extraction method and device, computer equipment and storage medium
RU2254610C2 (en) Method for automated classification of documents
US11468267B2 (en) Apparatus and method for classifying image
JP7310904B2 (en) LEARNING DEVICE, LEARNING METHOD, AND PROGRAM
JP7073171B2 (en) Learning equipment, learning methods and programs
JPH1166238A (en) Handwritten character recognition method
KR102475004B1 (en) Method for mentality analysis based on object analysis on picture and apparuatus for performing the method
KR100765749B1 (en) Apparatus and method for binary image compression
JP5046148B2 (en) Image analysis apparatus and object recognition method
CN113661516A (en) Information processing apparatus, information processing method, and recording medium
JP2007334810A (en) Image area tracking device and method therefor
US9875252B2 (en) Data processing apparatus using calculation of histogram intersection
CN114511715A (en) Driving scene data mining method
JP2005074075A (en) Walking cycle measuring device, periodic image obtaining device, compression processor for moving object outline, and moving object discrimination system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070410

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070621

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 3