JP2014194762A - 次元削減に基づき時系列を処理するための方法および装置 - Google Patents

次元削減に基づき時系列を処理するための方法および装置 Download PDF

Info

Publication number
JP2014194762A
JP2014194762A JP2014043463A JP2014043463A JP2014194762A JP 2014194762 A JP2014194762 A JP 2014194762A JP 2014043463 A JP2014043463 A JP 2014043463A JP 2014043463 A JP2014043463 A JP 2014043463A JP 2014194762 A JP2014194762 A JP 2014194762A
Authority
JP
Japan
Prior art keywords
time
time series
series
segment
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014043463A
Other languages
English (en)
Inventor
Jianqiang Li
ジェンチャン リー
shun cheng Liu
シュンチェン リュウ
Bo Liu
ボ リウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2014194762A publication Critical patent/JP2014194762A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Software Systems (AREA)

Abstract

【課題】区分線分近似(PLA)により時系列を記憶するための記憶スペースを低減する次元削減に基づいて時系列を処理するための方法及び装置を提供する。
【解決手段】処理すべき時系列を少なくとも1つ取得し、区分線分近似(PLA)に基づき少なくとも1つの時系列を処理する。ここで、PLAにより処理された時間区分の時間長は、固定されておらず、予め設定された単位時間長の整数倍である。
【選択図】図1

Description

本発明は、コンピュータの技術分野に関し、特に、次元削減に基づき時系列を処理するための方法および装置に関する。
データベース技術の急速な発展に伴い、大量のデータから有益な情報を取得する方法について関心が高まりつつある。このようなデータ処理は、大規模データ解析と呼ばれている。この大規模データ解析は、実際には多くは時系列データを対象とするものがほとんどである。上記時系列データは、株式市場の取引データやセンサネットワークを介して収集されたステータスデータ、商店での消費者統計データ、電話の通信トラフィックの統計データのように、統一された指標で時系列に記録されたデータ列を示す。
時系列データは非常に大きい。時系列データの保存や検索を容易にするために、時系列データは、次元削減に基づくデータ処理が行われる。例えば、比較的多くの時点を有するデータを、時点が比較的少ないデータに圧縮する。区分線分近似(PLA)は、次元削減を行う一般的な方法である。PLAでは、時系列データが短い時間区分に分割され、各時間区分において、当該時間区分におけるデータがある傾きを持った線分で近似される。このようにして、各時間区分に対応した線分の開始時点および終了時点と、線分パラメータ(線分を表すの線形方程式の係数)とを記憶する構成とすることにより、処理後の時系列データを保存するための記憶スペースを効果的に低減することができる。
時系列データの類似性検索は大量のデータの解析に一般的に用いられる解析手法であり、以下に示すステップを含む。大きい時系列データを保存する際、当該大きい時系列データを、大量の同じ時間長の時系列に分割する。そして、保存された時系列から、目標時系列(目標時系列は保存された時系列と同じ時間長を有する。)と一致する時系列を検索する。例えば、心電図において所定の特徴的な波形の発生頻度が疾患を同定するために使用される。記録された心電図から特徴的な波形を検索し、当該検索結果に基づいて疾患の解析が行われるようにすることもできる。検索を容易にするために、保存された時系列と目標時系列とは、通常、固定長PLAに基づいて処理される。ここで、PLAに基づいて処理される時系列は、時間長が同じ複数の時間区分に区分される。
本発明者らは、現開示を実施する際、従来技術に少なくとも以下に示す課題が存在することを見極めた。
従来技術では、時系列を保存する場合、当該時系列が固定長PLAに基づき処理される。しかしながら、固定長PLAの場合、データの精度が時間区分の時間長を短くすることにより確保する必要があり、その結果、保存すべきデータ量が増大し記憶装置の記憶スペースをより多く消費してしまう。
従来技術の問題を解決するために、本実施形態では、時系列を記憶するための記憶スペースを低減する次元削減に基づいて時系列を処理するための方法および装置について開示する。この技術的解決方法は、以下の通りである。
一の観点から見た本発明に係る次元削減に基づいて時系列を処理するための方法は、
少なくとも1つの処理対象となる時系列を取得することと、
PLAにより処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することと、を含む。
他の観点から見た本発明に係る時系列を検索するための方法は、
次元削減に基づいて時系列を処理するための方法により処理された上で保存された時系列を検索する方法であって、
目標時系列の検索要求を受信することと、
次元削減に基づいて保存された時系列になされた処理と同じ方法により、次元削減に基づき目標時系列を処理することと、
保存された時系列から処理された目標時系列に一致する少なくとも1つの時系列を検索することと、を含む。
更に他の観点から見た本発明に係る次元削減に基づいて時系列を処理するための装置は、
少なくとも1つの処理対象となる時系列を取得するよう構成された取得部と、
PLAにより処理された時間区分の時間長が固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理するよう構成された処理部と、を備える。
更に他の観点から見た本発明に係る時系列を検索するための装置は、
次元削減に基づいて時系列を処理するための装置により処理された時系列を予め記憶するよう構成された記憶部と、
目標時系列の検索要求を受信するよう構成された受信部と、
次元削減に基づいて保存された時系列になされた処理と同じ処理手法により、次元削減に基づき目標時系列の処理を行うよう構成された処理部と、
保存された時系列から、処理された目標時系列と一致する少なくとも1つの時系列を検索するよう構成された検索部と、を備える。
本実施形態に示す技術的解決手段は、以下に示す効果を奏する。
本実施形態によれば、時間区分の時間長が固定されず、予め設定された単位時間長の整数倍となるようにして、時系列に対してPLAおよび次元削減に基づく処理が行われる。これにより、固定長PLAにおける複数の時間区分がPLAにおける1つの時間区分に置き換わるので、固定長PLAに比べて時系列を保存するための記憶スペースが削減される。
以下、本実施形態に係る技術的解決手段をより明確に説明するために使用する添付図面を示す。以下の説明における添付図面は、本発明の単なるいくつかの例示に過ぎない。この分野における当業者は、これらの添付図面から難なく導き出すことができる他の図面であってもよいことは言うまでもない。
本実施形態に係る次元圧縮に基づいて時系列を処理する方法を示すフローチャートである。 本実施形態に係る時系列を取得する方法を示すフローチャートである。 本実施形態に係る次元圧縮に基づいて時系列を処理する装置の概略構成図である。 本実施形態に係る時系列を取得する装置の概略構成図である。
本実施形態に係る目的、技術的解決方法および利点をより明確にするために、以下添付の図面を参照しながら詳細に説明する。
本実施形態では、次元削減に基づいて時系列を処理するための方法を開示している。本実施形態に係る方法は、数多くの時系列数を保存する必要があるデータベースに適用され、次元削減に基づいて時系列を処理し、処理された時系列を保存する。図1に示すように、上記方法は、以下に示すステップを含むものである。
ステップ101:処理すべき時系列を少なくとも1つ取得する。
ここでは、リアルタイムで生成される時系列データを保存するデータベースを例として取り上げる。新たな時系列データが時間の経過とともに連続的に生成され、所定の時間長(予め設定された時系列の時間長)が経過すると、この所定の時間長の時間内に生成された時系列データが、処理すべき時系列として取得される。続いて、次元削減処理が実行される。なお、このステップにおいて、データベースに予め保存された時系列を取得し、取得した時系列を処理すべき時系列として次元削減に基づく処理を行うようにしてもよい。また、このステップにおいて、時系列の検索に用いる目標時系列を取得し、続いて次元削減に基づく処理を行うようにしてもよい。
ステップ102:取得した時系列をPLAに基づいて処理する。ここで、当該PLAにより処理された時間区分の時間長は、固定されておらず、予め設定された単位時間長の整数倍である。
単位時間長は、時系列の長さの1/N(Nは任意の正の整数であり、Nの大きさは要求される精度および処理速度に応じて設定してもよい)となるように予め設定されている。各時間区分の時間長は単位時間長の整数倍(Nよりも小さい)である。この時間区分は、互いに異なる時間長を有してもよい。このように、PLAに基づく処理では、時間区分の時間長を自由に選択するようにしてもよい。これにより、PLAに基づく処理を、データの変動傾向に応じて分割するというPLAの原理を可能な限り反映したものとすることができる。即ち、時間区分は、データの変動傾向に沿って、データが変化する時点(例えば、増加傾向から減少傾向に変化する時点)にできるだけ近い時点において分割されている(これは、当初のPLAの原理に則るものであり、固定長PLAではいくらか犠牲となっている)。
上記方法では、更に、ステップ102の後に処理された時系列を保存するステップを含む。
処理された時系列は、PLAに基づいて処理されることにより次元削減がなされた時系列である。処理された時系列の内容は、開始時点と、経時的に並べられた時間区分の線形パラメータとを含むものであってもよい。時間区分の終了時点は次の時間区分の開始時点となっていることから、時間区分の終了時点は記録する必要がない。時間区分の線形パラメータは、時間区分に対応する線分が属する直線の関係式の係数、即ち、f(x)=ax+bのaおよびbから構成されていてもよい。ここでxは時間変数でありf(x)は当該時点xに対応するデータである。
本実施形態において、ステップ102における具体的な方法は様々である。以下、そのいくつかの方法について説明する。
第1の方法では、以下のステップが含まれる。
ステップ1:時間区分の時間長を予め設定された単位時間長として、取得した時系列をPLAに基づき処理する。ここで、時系列の時間長は予め設定された単位時間長の整数倍である。
この方法では、最初に時間区分の時間長を単位時間長として、時系列を固定長PLAに基づいて処理し、その後、時間系列を併合する。
ステップ2:経時的に連続した複数の時間区分に対応する線分が、予め設定した近似条件に適合する場合、当該経時的に連続した複数の時間区分を併合する。ここで、経時的に連続した複数の時間区分は、時間長が単位時間長である全ての時間区分の中に含まれる。
時間長が単位時間長である時間区分は、上記ステップ1において固定長PLAに基づいて分割された時間区分である。近似条件は、全ての時間区分内における近似度に関する要件である。そして、複数の経時的に連続した時間区分に対応する線分が所定の近似度に関する要件を満たす場合に、これらの時間区分が併合される。
併合処理は、以下に示すステップを含んでいてもよい。併合処理では、経時的に連続した複数の時間区分を併合して1つの時間区分にするとともに、併合することにより取得した時間区分に対応する線分を、複数の時間区分に対応する線分から構成される破線を近似的に表すために用いる。併合することにより取得した時間区分の2つの端点における時点が、当該時間区分の開始時点および終了時点であってもよい。併合することにより取得した時間区分の2つの端点におけるデータ値は開始時点および終了時点における時系列のデータ値から決定されてもよい。例えば、あるデータ値と開始時点におけるデータ値との差分が所定の閾値よりも小さい場合、当該データ値を第1端点におけるデータ値として選出し、あるデータ値と終了時点におけるデータ値との差分が所定の閾値よりも小さい場合、当該データ値を第2端点におけるデータ値として選出してもよい。併合することにより取得した時間区分の2つの端点におけるデータ値が、時系列の開始時点および終了時点におけるデータ値であることが好ましい。即ち、併合により取得した時間区分に対応する線分は、複数の経時的に連続した時間区分に対応する線分の端点のうち、最も外側にある2つの端点を結ぶ線である。
併合処理によれば、併合前の複数の時間区分に対応する複数のデータ群(各データ群は開始時点および線形パラメータを含んでいる)を、併合された時間区分に対応するデータ群に簡略化することができる。
具体的には、ステップ2は、以下に示すステップを含んでいてもよい。時間長が単位時間長に設定された全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分の傾きの差分絶対値が、予め設定された第1閾値よりも小さい場合、当該経時的に連続した複数の時間区分を併合する。ここにおいて、併合条件は、経時的に連続した複数の時間区分に対応する線分に含まれる2つの線分それぞれの傾きの差分絶対値が第1閾値よりも小さいということである。更に、このステップにおいて、以下に示すような方法を採用してもよい。
第1の方法は、具体的には以下に示すステップを含んでいてもよい。
ステップA:時系列の第1端点における時間区分が、第1参照時間区分として設定される。
時系列の2つの端点を第1端点および第2端点として定義してもよく、この場合、第1端点は時系列の先頭または最後尾のいずれであってもよい。
ステップB:第1参照時間区分が、時系列の第2端点における時間区分であるか否かを判定し、第1参照時間区分が上記第2端点における時間区分である場合、処理が終了する。一方、第1参照時間区分が上記第2端点における時間区分でない場合、第1参照時間区分に隣接する時間区分のうちの上記第2端点側の時間区分を、第2参照時間区分として設定する。
時系列の第1端点が時系列の先頭として定義されている場合、時系列の第2端点は時系列の最後尾となる。また、第1端点が時系列の最後尾として定義されている場合、時系列の第2端点は時系列の先頭となる。第2参照時間区分に隣接する時間区分のうちの上記第2端点側の時間区分は、第1参照時間区分に隣接する時間区分のうち、時系列の第2端点に最も近い時間区分である。
ステップC:ここでは、第1参照時間区分に対応する線分と、第2参照時間区分に対応する線分との間での傾きの差分絶対値が、予め設定された第1閾値よりも小さいか否かを判定する。上記差分絶対値が上記第1閾値よりも小さい場合、ステップDが実行される。一方、上記差分絶対値が上記第1閾値以上である場合、ステップEが実行される。
第1閾値の値は、要求される精度や記憶スペースの占有率、処理速度に応じて設定されるものであってもよい。2つの線分の傾きが近似しているということは、2つの線分を含む2つの直線が比較的近似していることを示している。そして、線分を併合する場合、データの精度にほとんど影響が出ないようにしつつデータの占有する記憶スペースを低減することができる。
ステップD:ここでは、第2参照時間区分が時系列の第2端点における時間区分であるか否かを判定する。第2参照時間区分が第2端点における時間区分である場合、第1参照時間区分から第2参照時間区分に亘って経時的に連続した複数の時間区分を併合し、処理を終了する。一方、第2参照時間区分が第2端点における時間区分でない場合、第2参照時間区分に隣接する時間区分のうち第2端点側の時間区分を、第2参照時間区分として設定し、ステップCを再び実行する。
具体的には、第1参照時間区分から第2参照時間区分に亘って経時的に連続した複数の時間区分を併合する際、第1参照時間区分と第2参照時間区分とが互いに隣接した時間区分である場合、第1参照時間区分と第2参照時間区分とは併合してもよい。また、第1参照時間区分と第2参照時間区分とが隣接していない場合、第1参照時間区分と第2参照時間区分とそれらの間に介在する時間区分とを併合してもよい。
ステップE:ここでは、第1参照時間区分が第2参照時間区分に隣接しているか否かを判定する。第1参照時間区分が第2参照時間区分に隣接している場合、第2参照時間区分が第1参照時間区分として設定され、ステップBが再び実行される。一方、第1参照時間区分が第2参照時間区分に隣接していない場合、第1参照時間区分と第2参照時間区分との間の時間区分、並びに第1参照時間区分を含む経時的に連続した複数の時間区分が併合されるとともに、第2参照時間区分が第1参照時間区分として設定される。そして、ステップBが再び実行される。
上記処理では、各時間区分における線分の傾きが、第1時間区分の一方の端点から他方の端点までの線分の傾きと順に比較されていく。比較対象となっている時間区分の傾きと第1時間区分の傾きとの差分が第1閾値に到達するまで、第1時間区分から比較対象となっている時間区分よりも前の時間区分に至るまでの時間区分が併合されていく。そして、時系列における他方の端点における時間区分に到達すると、現在の時間区分を第1の時間区分として用いて上記処理を繰り返す。
以下、上記処理について具体例を挙げながら説明する。ここでは、時系列が時間長が単位時間長である5つの時間区分に分割されているものとする。例えば、前から後に向かって時間区分1〜5に分割されているものとする。まず、時間区分2内の線分の傾きと時間区分1内の線分の傾きとを比較する。ここにおいて、傾きの差分が第1閾値よりも小さいとする。次に、時間区分3内の線分の傾きと時間区分1内の線分の傾きとを比較する。ここにおいて、傾きの差分は依然として第1閾値よりも小さいとする。続いて、時間区分4内の線分の傾きと時間区分1内の線分の傾きとを比較する。ここにおいて、傾きの差分が第1閾値よりも大きいとする。この場合、時間区分1、時間区分2および時間区分3が併合される。最後に、時間区分4から、時間区分5内の線分の傾きと時間区分4内の線分の傾きとを比較する。ここにおいて、傾きの差分が第1閾値よりも小さいとする。この場合、時間区分4および時間区分5が併合されてから処理が終了する。
第2の方法では、具体的には以下に示すステップを含んでいてもよい。
ステップH:時系列の第1端点における時間区分が、時間長が単位時間長である全ての時間区分のうちの第3参照時間区分として設定される。
ステップI:第3参照時間区分が時系列の第2端点における時間区分であるか否かを判定する。第3参照時間区分が第2端点における時間区分である場合、処理が終了する。一方、第3参照時間区分が第2端点における時間区分でない場合、ステップJが実行される。
ステップJ:ここでは、第3参照時間区分に隣接する時間区分のうちの第2端点側の時間区分に対応する線分と、第3参照時間区分に対応する線分との間における傾きの差分絶対値が、予め設定された第1閾値よりも小さいか否かを判定する。上記傾きの差分絶対値が第1閾値よりも小さい場合、ステップKが実行される。一方、上記傾きの差分絶対値が第1閾値以上である場合、ステップLが実行される。
第1閾値の大きさは、要求される精度や占有する記憶スペース、処理速度に応じて設定してもよい。
ステップK:第3参照時間区分に隣接する時間区分のうちの第2端点側の時間区分、並びに第3参照時間区分を含む経時的に連続した複数の時間区分が併合され、併合により得られる時間区分が第3参照時間区分として設定される。その後、ステップIが再び実行される。
ステップL:第3参照時間区分に隣接する時間区分のうちの第2端点側の時間区分を、第3参照時間区分として設定し、その後、ステップIを再び実行する。
上記の各ステップにおいて、時系列の一方の端点から他方の端点まで、各時間区分内の線分の傾きは1つずつ比較されていく。隣接する時間区分における傾きの差分が第1閾値よりも小さい場合、これらの時間区分は併合される。その後、併合された時間区分における線分の傾きと、当該併合された時間区分に隣接する時間区分における線分の傾きとが比較され、その後同様の処理が行われていく。
以下、上記処理について具体例を挙げて説明する。ここでは、時系列が時間長が単位時間長である5つの時間区分に分割されているものとする。例えば、前から後に向かって時間区分1〜5に分割されているものとする。まず、時間区分2内の線分の傾きと時間区分1内の線分の傾きとを比較する。ここで、傾きの差分が第1閾値よりも小さい場合、時間区分1と時間区分2を併合することにより時間区分2’を得る。次に、時間区分3内の線分の傾きと時間区分2’内の線分の傾きとを比較する。ここで、傾きの差分が依然として第1閾値よりも小さい場合、時間区分2’と時間区分3とを併合することにより時間区分3’を得る。続いて、時間区分4内の線分の傾きと時間区分3’内の線分の傾きとを比較する。ここで、傾きの差分が第1閾値よりも大きい場合、時間区分4から比較処理を実行していく。時間区分5内の線分の傾きと時間区分4内の線分の傾きとを比較する。ここで、傾きの差分が第1閾値よりも小さい場合、時間区分4および時間区分5が併合され、処理が終了する。
第2の方法は、以下に示すステップを含んでいてもよい。
ステップ1:各時点が、取得した時系列の時間長に対応する時間範囲内において決定されている。ここで、これらの時点(これらの時点を単位時点と称する。)から時系列の開始時点或いは時系列の終了時点までの時間長は、予め設定された単位時間長の整数倍であり、時系列の時間長が単位時間長の整数倍となっている。
時系列の時間長が単位時間長の整数倍であることにより、時系列の開始時点までの時間長が単位時間長の整数倍である時点から、時系列の終了時点までの時間長もまた単位時間長の整数倍となっている。
ステップ2:時間区分の少なくとも1つの境界時点を、時系列の波形における山と谷の時点に応じて、決定された時点から選出する。
具体的には、各山の時点について、山の時点それぞれまでの距離が予め設定された所定の時間長よりも短い1以上の時点を、決定された時点の中から選出する。各谷の時点について、谷の時点それぞれまでの距離が予め設定された所定の時間長よりも短い1以上の時点を、決定された時点の中から選出する。選出された時点は、時間区分の境界時点として用いられる。このようにして時間区分の境界時点が選出されると、当該時間区分の境界時点に対してPLAに基づくデータ処理が行われる。これにより、時間区分を、可能な限りデータの変動傾向に応じて分割することができ、記憶スペースを節約しながらもデータの精度を確保することができる。
好ましくは、山の時点それぞれまでの距離が上記単位時間長よりも短い少なくとも1つの時点と、谷の時点それぞれまでの距離が上記単位時間長よりも短い少なくとも1つの時点とを、決定された時点の中から選択し、時間区分の境界時点として用いるほうがよい。具体的には、各山の時点および各谷の時点までの距離が単位時間長よりも短い少なくとも1つの単位時点が、時間区分の境界時点として選出されるようにしてもよい。1つの山或いは1つの谷の時点が所定の単位時間内で重なっている場合、これらの単位時点のうち1つの山或いは1つの谷までの距離が単位時間長よりも短い時点が1つだけ存在する。例えば、重なっている時点である。この場合、この重なっている時点を時間区分の境界時点として選出してもよい。1つの山或いは1つの谷の時点が2つの単位時点の間に位置する場合、これらの時点の中には、当該1つの山の時点或いは当該1つの谷の時点までの距離が単位時間長に比べて小さい時点が2つ存在する。例えば、2つの単位時点が存在する場合である。この場合、2つの単位時点のうちの1つを時間区分の境界時点として選出してもよいし、両方を時間区分の境界時点として選出してもよい。
好ましくは、山までの距離が最小である少なくとも1つの時点、および谷までの距離が最小である少なくとも1つの時点を、決定された時点から選出し、選出した時点を、時間区分の境界時点として用いるほうがよい。具体的には、山および谷までの距離が最小である1つの単位時点を時間区分の境界時点として選出してもよい。このようにして時間区分の境界時点が選出され、当該境界時点がPLAに基づき処理されると、当該処理がなされた時系列のデータの精度がより効果的に確保することができる。
ステップ3:時系列を、選出された時間区分の境界時点に応じてPLAに基づき処理する。
この方法は簡単であり、ステップ102における処理効率を効果的に向上させることができる。
本実施形態では、更に、時系列を検索する方法も開示している。この方法では、まず、次元削減に基づいて処理された時系列が予め保存されている。ここで、次元削減の方法としては、従来のPLAや固定長PLAのような方法が挙げられる。好ましくは、上記実施形態に係る、上記の次元削減に基づいて時系列を処理する方法により、時系列が処理されているのがよい。この方法の具体的な処理内容は、前述のステップ102の詳細な説明を参照されたい。ここでは、この方法についての詳細な説明は省略する。図2に示すように、この方法は、以下に示すステップを含む。
ステップ201:目標時系列の検索要求を受信する。ここで、目標時系列の時間長は、保存された時系列の時間長と同じである。
ステップ202:目標時系列を次元削減に基づいてデータ処理する。ここでの処理は、次元削減に基づく保存された時系列のデータ処理と同じ手法で行われる。上記実施形態に係る次元削減に基づき時系列を処理する方法により、目標時系列について次元削減に基づく処理を行う場合における具体的な処理内容は、前述のステップ102の詳細な説明を参照されたい。ここでは、詳細な説明は省略する。
ステップ203:処理された目標時系列と一致する少なくとも1つの時系列が、保存された時系列から検索される。
処理された時系列と保存された時系列の両方が、線分のデータの系列とともに記録されているので、全ての時系列を破線で表すことができる。処理された目標時系列が保存されている時系列と一致するとは、即ち、データの近似度が所定の要件に適合している、或いは、処理された目標時系列および保存されている時系列それぞれに対応する破線の近似度が所定の要件に適合していることである。具体的には、時系列同士が一致しているか否かの判定は、処理された目標時系列と保存された時系列との間の距離の絶対値が予め設定された所定の距離閾値よりも小さいか否かを判定することにより行われる。上記距離の絶対値が所定の距離閾値より小さい場合、処理された目標時系列と保存されている時系列とが一致しており、上記距離の絶対値が所定の距離閾値以上の場合、それらが一致していない。
2つの時系列の間の距離の計算に用いる方法はいくつかある。以下に示すような方法で距離を計算するのが好ましい。処理された目標時系列および1つの時間長の範囲内に含まれる保存された時系列に対応する破線により形成される図形の面積を計算する。ここで、時系列間の距離は正であってもよく負であってもよい。これに応じて、図形の面積は正または負の値をとる。具体的には、図形の閉領域について、第1時系列の平均値が第2時系列の平均値よりも大きくなるように定義されている場合、この閉領域の面積が正となり、逆の場合、上記閉領域の面積が負となる。或いは、図形の閉領域について、第1時系列の平均値が第2時系列の平均値よりも大きくなるように定義されている場合、この閉領域の面積が負となり、逆の場合、上記閉領域の面積が正となる。図形の1つの閉領域について、当該閉領域の時間内において2つの時系列に対応する破線のうちの一方が他方よりも上方に位置する。従って、一方の破線に対応する時系列の平均値は他方の破線に対応する時系列の平均値よりも大きくなる。図形における各閉領域の面積(面積値は正または負の値をとる。)を計算した後、全ての閉領域の面積値を足し合わせることにより全ての図形の面積を取得することができる。図形の面積は2つの時系列の間の距離に相当する。
また、本実施形態では、保存されている時系列それぞれに対応する第1距離が記録されていてもよい。ここで、第1距離は、保存されている目標時系列それぞれと、予め設定された参照時系列との間の距離に相当する。また、この第1距離は、参照距離として定義されている。このことを踏まえて、ステップ203では、以下に示すステップを含んでいてもよい。処理された目標時系列と、上記参照時系列との間の距離に相当する第2距離を取得する(第2距離は、目標距離として定義される。)。対応する上記第1距離と、上記第2距離との間の差分が、予め設定された第2閾値よりも小さい時系列を、保存された時系列から取得する(即ち、上記参照距離と上記目標距離との差分が、予め設定された第2閾値よりも小さい時系列を取得する。)。そして、取得した時系列を、処理された目標時系列に一致する時系列として用いる。
参照時系列の時間長は保存されている時系列の時間長と同じであり、参照時系列の時系列データはランダムに設定してもよい。距離の計算を行い易くして処理効率を改善するために、参照時系列は、対応する線分の傾きがゼロである1つの時間区分のみ有するように設定するのが好ましい。参照距離は、目標時系列の検索処理中に計算を行うことにより取得するのではなく、処理された時系列がデータベースに保存された後に計算を行うことにより取得されるようにしてもよい。
参照距離と目標距離との差分は、対応する保存された時系列と、処理がされた目標時系列との間の距離である。対応する処理された時系列と、処理された時系列との間の距離は、検索処理中において単に参照距離それぞれと目標距離との差分を計算することにより決定されるものであってもよい。この距離を予め設定された第2閾値と比較した後、適当な時系列、例えば処理された目標時系列と一致する時系列、を決定するようにしてもよい。処理された目標時系列と保存された時系列との差分が、検索処理中にリアルタイムで計算される従来技術と比べて、本実施形態に係る方法では効果的に検索処理の効率を向上させることができる。
保存された時系列においてR木が構築されており、R木内の最小外接矩形(MBR)に対応する最小境界距離が記録されているのが好ましい。ここで、最小境界距離は、MBR内の各時系列の第1距離(参照距離)の最小値である。
R木は、木構造に基づいてデータを記述する方法であり、主にインデックスデータによりデータ検索の効率を改善するために用いられる。R木の核となる考え方は、類似するデータオブジェクトを一纏めにしてグループ化し、MBRを用いて、上位の階層のノード上のデータオブジェクトのグループそれぞれを記述することである。類似する全てのデータオブジェクトが1つのMBRに含まれる。従って、データベースから対象データオブジェクトに一致するデータオブジェクトの検索を行う場合、最上位層から始まって最下位層に至るまでの各層における対象データオブジェクトを含み得るMBRを検索し、その後、最下位層のMBRに存在するデータオブジェクトの中から対象データオブジェクトに一致するデータオブジェクトを検索することが必要となる。上記データオブジェクトは時系列であってもよく、R木がデータベースに含まれる時系列を記述するのに用いられるものであってもよい。参照距離および最小境界距離の両方がR木内に記録されていてもよい。
新たに処理がなされた時系列がデータベースに保存され所定のMBRの範囲内に追加された場合、この時系列の参照距離が計算されるようにしてもよい。そして、このMBRの最小境界距離が、計算して得られる上記参照距離に応じて、更新すべきか否かを判定するようにしてもよい。参照距離がこのMBRの最小境界距離よりも小さい場合、このMBRの最小境界距離が、計算して得られた上記参照距離の値で更新される。このMBRが一杯になると、当該MBRが2つのMBRに分割されるようにしてもよい。これにより、時系列は2つのMBRのうちの一方に挿入され、その後、2つのMBRそれぞれの最小境界距離が記録される。
保存された時系列から、対応する第1距離と第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つの時系列を取得し、取得した時系列を、R木および各MBRの最小境界距離に照らして、処理がなされた時系列に一致する時系列として用いる処理は、以下に示すステップを含む。保存された時系列から、対応する第1距離と第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つの時系列を、R木内のMBRに対応する上記記録された最小境界距離と上記時系列に対応する第1距離とに照らして、処理された目標時系列に一致する時系列として取得する。具体的には以下のステップを含む。最小境界距離と第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つのMBRを、上記R木から取得する。そして、対応する第1距離と第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つの時系列を、取得したMBRに含まれる時系列から取得する。そして、取得した時系列を、処理がなされた目標時系列に一致する時系列として使用する。
検索処理中では、最小境界距離と目標距離との差分が予め設定された第2閾値よりも小さい少なくとも1つのMBRが、R木の最上層から順に最下層までの各層において検索される。そして、検索が行われたMBRにおいて次の検索が行われる。そして、参照距離と目標距離との差分が予め設定された第2閾値よりも小さい少なくとも1つの時系列が、処理された目標時系列に一致する時系列として、R木の最下層から取得される。
検索処理中において、単にMBRの最小境界距離と参照距離との差分を計算するとともに、対応する参照距離と目標距離との差分を計算することにより、R木内の検索が行われるようにしてもよい。R木内の検索処理中にリアルタイムで各距離を計算する従来技術に係る方法と比べて、本実施形態に係る方法では、R木内における検索処理の効率を効果的に改善することができる。
この方法におけるR木内の検索処理は、以下に示すプログラムにより実現してもよい。
For a node N
if N is a leaf node
if Dist(N,Q)≦ε,result=result∪{N}
else//N is a MBR
if MinDist(N, b) XOR Dist(Q,b)≦ε
for each child N’of N
conducting the recursively search
ここで、Qは、PLAに基づいて処理がなされた目標時系列であり、εは予め設定された第2閾値であり、bは参照時系列である。result={ TS1、TS2、TS3、... 、TSn}は、このプログラムの出力結果である。
本実施形態では、時系列が、PLAに基づく次元削減に基づいて処理される。ここで、PLAでは、時間区分の時間長が固定されておらず、予め設定された単位時間長の整数倍となっている。この方法では、固定長PLAにおける複数の時間区分が1つの時間区分で置き換えることができるので、固定長PLAに比べて時間系列を保存するための記憶スペースを削減することができる。
図3に示すように、本実施形態では、上記と同様の技術的概念に基づいて、次元削減に基づいて時系列を処理するための装置を開示する。
この装置は、処理対象の時系列を少なくとも1つ取得するよう構成された取得部310と、PLAに基づいて、少なくとも1つの時系列を処理するよう構成された処理部320と、を備える。ここで、PLAでは、時間区分の時間長が固定されておらず、当該時間区分の時間長が予め設定された単位時間長の整数倍となっている。
処理部320は、特に、PLAで処理に基づいて少なくとも1つの時系列を処理するとともに、時間長が単位時間長である全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分が、予め設定された近似条件に適合する場合、当該経時的に連続した複数の時間区分を併合するように構成されているのが好ましい。ここで、PLAでは、時間区分の時間長が予め設定された単位時間長であり、時系列の時間長が単位時間長の整数倍となっている。
処理部320は、特に、時間長が単位時間長である全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分の傾きの差分絶対値が、予め設定された第1閾値よりも小さい場合、当該経時的に連続した複数の時間区分を併合するよう構成されていることが好ましい。
処理部320は、特に、時系列の時間長に対応する時間範囲内に存在し且つ開始時点または終了時点までの時間長が予め設定された単位時間長の整数倍である少なくとも1つの時点を決定し、
時系列の波形の山と谷の時点に応じて決定された時点から、時間区分の境界時点を少なくとも1つ選出し、
選出された時間区分の境界時点に従って、PLAに基づき少なくとも1つの時系列を処理するよう構成されていることが好ましい。
処理部320は、特に、各山の時点までの距離が単位時間長よりも小さい少なくとも1つの時点と、各谷の時点までの距離が単位時間長よりも小さい少なくとも1つの時点とを、決定された時点から、選出し、選出した時点を時間区分の境界時点として使用するよう構成されていることが好ましい。
処理部320は、特に、各山の時点までの距離が最小である少なくとも1つの時点と、各谷の時点までの距離が最小である少なくとも1つの時点とを、決定された時点から選出し、選出した時点を時間区分の境界時点として使用するよう構成されていることが好ましい。
本装置は、更に、処理された時系列を記憶するよう構成された記憶部を備えていることが好ましい。
図4に示すように、本実施形態では、上記と同様の技術的概念に基づいて、時系列を取得する装置を開示する。
この装置は、従来のPLAや固定長PLAのような次元削減に基づき処理された時系列を予め記憶しておくよう構成された記憶部410と、
目標時系列を含む検索要求を受信するよう構成された受信部420と、
次元削減に基づいて目標時系列を処理するとともに、次元削減に基づいて保存された時系列を同様の方法により処理するよう構成された処理部430と、
保存された時系列から、処理がなされた目標時系列に一致する時系列を少なくとも1つ検索するよう構成された検索部440と、を備える。
ここで、記憶部410は、次元削減に基づき時系列を処理する装置により処理がなされた時系列を予め記憶しておくよう構成されていることが好ましい。
記憶部410は、更に、保存された時系列それぞれに対応する第1距離を記録するよう構成されていることが好ましい。ここで、第1距離は、保存された時系列と予め設定された参照時系列との間の距離である。
検索部440は、処理された目標時系列から予め設定された参照時系列までの距離である第2距離を取得し、
保存された時系列から、少なくとも1つの時系列に対応する第1距離と、第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つの時系列を取得し、取得した時系列を、処理された目標時系列に一致する時系列として使用するよう構成されていることが好ましい。
記憶部410は、更に、保存された時系列に対してR木を確立し、R木における各MBRに対応する最小境界距離を記録するよう構成されているのが好ましい。ここで、最小境界距離は、MBRにおける各時系列の第1距離の最小値である。
検索部440は、保存された時系列から、少なくとも1つの時系列に対応する第1距離と、第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つの時系列を取得し、取得した時系列を、R木内のMBRに対応する、記録された最小境界距離、および上記少なくとも1つの時系列に対応する第1距離に応じて、処理された目標時系列に一致する時系列として使用するよう構成されている。
検索部440は、R木から、最小境界距離と第2距離との差分が第2閾値よりも小さい少なくとも1つのMBRを取得し、
取得したMBRの中の時系列から、対応する第1距離と、第2距離との差分が、予め設定された第2閾値よりも小さい少なくとも1つの時系列を、処理された目標時系列と一致する時系列として取得するよう構成されていることが好ましい。
本実施形態では、時系列が次元削減およびPLAに基づき処理される。ここで、PLAでは、時系列の時間長が固定されておらず、予め設定された単位時間長の整数倍となっている。固定長PLAと比較した場合、このような固定長PLAにおける複数の時間区分が、PLAにおける1つの時間区分に置き換えることができるので、時系列を保存するための記憶スペースを削減することができる。
上記実施形態では、次元削減に基づいて時系列を処理する装置が、次元削減に基づき時系列を処理する場合にのみ、例に示すように上記各機能部に分割されるように示されていることに留意すべきである。しかしながら、実際には、上記機能は、実際に必要とされる機能に応じて異なる機能部により実現される。即ち、装置の内部構造は、上記機能の全部または一部を実現するために格別の機能部に分割されていてもよい。また、上記実施形態に示す次元削減に基づき時系列を処理する装置、および、時系列を次元削減に基づき処理する方法は、同じ発明概念に基づくものである。具体的な方法は、実施形態に記載されているので、詳細な説明はしない。
この分野の当業者であれば、上記実施形態のステップの全部または一部がハードウェアや関連するハードウェアに指示を出すプログラムにより実現されることを当然に理解できる。プログラムは、コンピュータで読み取り可能な記憶媒体に記録されていてもよい。ここで言う記憶媒体とは、読み出し専用メモリや磁気ディスク、光ディスク等である。
前述では、本発明における好ましい実施形態のみを示しており、本発明の範囲がこれに限定されるわけではない。これらの実施形態について、本発明の本質から逸脱しない範囲内において修正がなされたり、同等の構成により置き換えたり或いは改良されたりしたものは、本発明の保護範囲内に含まれる。
(付記1)
少なくとも1つの処理対象となる時系列を取得すること、
区分線分近似(PLA)により処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理すること、を含む、
次元削減に基づいて時系列を処理するための方法。
(付記2)
PLAにより処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することは、
時間区分の時間長が予め設定された単位時間長であり、前記時系列の時間長が前記単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することと、
時間長が単位時間長である全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分が、予め設定された近似条件を満たす場合、前記経時的に連続した複数の時間区分を併合すること、を含む、
付記1に記載の方法。
(付記3)
時間長が単位時間長である全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分が、予め設定された近似条件を満たす場合、前記経時的に連続した複数の時間区分を併合することは、
時間長が単位時間長である全ての時間区分の中の、前記経時的に連続した複数の時間区分に対応する線分の傾きの差分絶対値が、予め設定された第1閾値より小さい場合、前記経時的に連続した複数の時間区分を併合すること、を含む、
付記2に記載の方法。
(付記4)
PLAにより処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することは、
時系列の時間長に対応する時間範囲内において、時系列の開始時点または終了時点までの時間長が、予め設定された単位時間長の整数倍であり、且つ時系列の時間長が単位時間長の整数倍である時点を少なくとも1つ決定することと、
時系列の波形における山と谷の時点に応じて、決定された時点から時間区分の境界時点を少なくとも1つ選出することと、
時間区分における選出された境界時点に応じてPLAに基づき少なくとも1つの時系列を処理することと、を含む、
付記1に記載の方法。
(付記5)
時系列の波形における山と谷の時点に応じて、決定された時点から時間区分の境界時点を少なくとも1つ選出することは、
各山の時点までの距離が前記単位時間長よりも小さい少なくとも1つの時点、および各谷の時点までの距離が前記単位時間長よりも小さい少なくとも1つの時点を、前記決定された時点から選出することと、
選出した時点を時間区分の境界時点として用いることと、を含む、
付記4に記載の方法。
(付記6)
時系列の波形における山と谷の時点に応じて、決定された時点から時間区分の境界時点を少なくとも1つ選出することは、
各山の時点までの距離が最小である少なくとも1つの時点、および各谷の時点までの距離が最小である少なくとも1つの時点を、前記決定された時点から選出することと、
選出した時点を時間区分の境界時点として用いることと、を含む、
付記4に記載の方法。
(付記7)
PLAにより処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することは、
処理された時系列を保存すること、を更に含む、
付記1から付記6のいずれかに記載の方法。
(付記8)
目標時系列の検索要求を受信することと、
次元削減に基づいて保存された時系列になされた処理と同じ方法により、次元削減に基づき目標時系列を処理することと、
保存された時系列から、処理された目標時系列に一致する少なくとも1つの時系列を検索することと、を含む、
付記1から付記7のいずれかに記載された、次元削減に基づいて時系列を処理するための方法により処理された上で保存された時系列を検索するための方法。
(付記9)
前記方法は、更に、保存された時系列それぞれに対応する第1距離を記録すること、を含み、
前記第1距離は、前記保存された時系列から予め設定された参照時系列までの距離であり、
前記保存された時系列から、前記処理された目標時系列に一致する少なくとも1つの時系列を検索することは、
前記処理された目標時系列から前記予め設定された参照時系列までの距離である第2距離を取得することと、
前記保存された時系列から、少なくとも1つの時系列に対応する第1距離と第2距離との間の距離が予め設定された第2閾値よりも小さい前記少なくとも1つの時系列を取得し、前記取得した時系列を、前記処理された目標時系列と一致する前記時系列として使用することと、を含む、
付記8に記載の方法。
(付記10)
保存された時系列に対してR木を構築し、R木における各最小外接矩形(MBR)に対応し且つ前記MBRにおける各時系列の前記第1距離の最小値である最小境界距離を記録すること、を更に含み、
前記保存された時系列から、少なくとも1つの時系列に対応する第1距離と第2距離との間の距離が予め設定された第2閾値よりも小さい前記少なくとも1つの時系列を取得し、前記取得した時系列を、前記処理された目標時系列と一致する前記時系列として使用することは、
前記保存された時系列から、少なくとも1つの時系列に対応する第1距離と第2距離との間の距離が予め設定された第2閾値よりも小さい前記少なくとも1つの時系列を取得し、取得した時系列を、前記R木における前記MBRに対応する記録された前記最小境界距離および前記時系列に対応する前記第1距離に照らして、処理された目標時系列に一致する時系列として使用すること、を含む、
付記9に記載の方法。
(付記11)
保存された時系列から、少なくとも1つの時系列に対応する第1距離と第2距離との間の距離が予め設定された第2閾値よりも小さい前記少なくとも1つの時系列を取得し、取得した時系列を、前記R木における前記MBRに対応する記録された前記最小境界距離および前記時系列に対応する前記第1距離に照らして、処理された目標時系列に一致する時系列として使用することは、
R木から、前記最小境界距離と前記第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つのMBRを取得することと、
取得したMBR内の時系列から、少なくとも1つの時系列対応する第1距離と前記第2距離との差分が予め設定された第2閾値よりも小さい前記少なくとも1つの時系列を、処理された目標時系列に一致する時系列として取得することと、を含む、
付記10に記載の方法。
(付記12)
少なくとも1つの処理対象となる時系列を取得するよう構成された取得部と、
区分線分近似(PLA)により処理される時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理するよう構成された処理部と、を備える、
次元削減に基づいて時系列を処理するための装置。
(付記13)
前記処理部は、特に、
時間区分が時間長が予め設定された単位時間長であり、前記時系列の時間長が前記単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理し、
時間長が単位時間長である全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分が、予め設定された近似条件に適合する場合、前記経時的に連続した複数の時間区分を併合するよう構成された、
付記12に記載の装置。
(付記14)
前記処理部は、特に、
時間長が単位時間長である全ての時間区分の中の、前記経時的に連続した複数の時間区分に対応する線分の傾きの差分絶対値が、予め設定された第1閾値より小さい場合、前記経時的に連続した複数の時間区分を併合するよう構成された、
付記13に記載の装置。
(付記15)
前記処理部は、特に、
時系列の時間長に対応する時間範囲内において、時系列の開始時点または終了時点までの時間長が、予め設定された単位時間長の整数倍であり、且つ時系列の時間長が単位時間長の整数倍である時点を少なくとも1つ決定し、時系列の波形における山と谷の時点に応じて、決定された時点から時間区分の境界時点を少なくとも1つ選出し、時間区分における選出された境界時点に応じてPLAに基づき少なくとも1つの時系列を処理するよう構成された、
付記12に記載の装置。
(付記16)
前記処理部は、特に、
各山の時点までの距離が前記単位時間長よりも小さい少なくとも1つの時点、および各谷の時点までの距離が前記単位時間長よりも小さい少なくとも1つの時点を、前記決定された時点から選出し、
選出した時点を時間区分の境界時点として用いるよう構成された、
付記15に記載の装置。
(付記17)
前記処理部は、特に、
各山の時点までの距離が最小である少なくとも1つの時点、および各谷の時点までの距離が最小である少なくとも1つの時点を、前記決定された時点から選出し、
選出した時点を時間区分の境界時点として用いるよう構成された、
付記15に記載の装置。
(付記18)
前記処理された時系列を保存する記憶装置を、更に備える、
付記12から付記17のいずれかに記載の装置。
(付記19)
付記12から付記18のいずれかに記載の、次元削減に基づいて時系列を処理するための装置により処理された時系列を予め保存するよう構成された記憶部と、
目標時系列の検索要求を受信するよう構成された受信部と、
次元削減に基づいて保存された時系列になされた処理と同じ処理手法により、次元削減に基づき目標時系列の処理を行うよう構成された処理部と、
保存された時系列から、処理された目標時系列と一致する少なくとも1つの時系列を検索するよう構成された検索部と、を備える、
時系列を検索するための装置。
(付記20)
前記記憶部は、更に、保存された時系列それぞれに対応する第1距離を記録するよう構成され、
前記第1距離は、前記保存された時系列から予め設定された参照時系列までの距離であり、
前記検索部は、更に、処理された目標時系列から前記予め設定された参照時系列までの距離である第2距離を取得し、保存された時系列から、少なくとも1つの時系列に対応する第1距離と、第2距離との間の距離が予め設定された第2閾値よりも小さい少なくとも1つの時系列を取得し、取得した時系列を、前記処理された目標時系列と一致する時系列として使用するよう構成されている、
付記19に記載の装置。
(付記21)
前記記憶部は、更に、保存された時系列に対してR木を構築し、
R木における各最小外接矩形(MBR)に対応し且つ前記MBRにおける各時系列の前記第1距離の最小値である最小境界距離を記録し、
少なくとも1つの時系列に対応する前記第1距離と前記第2距離との差分が予め設定された第2閾値よりも小さい前記少なくとも1つの時系列を、保存された時系列から取得し、
取得した時系列を、前記R木における前記MBRに対応する記録された前記最小境界距離および前記時系列に対応する前記第1距離に照らして、処理された目標時系列に一致する時系列として使用するよう構成されている、
付記20に記載の装置。
(付記22)
前記検索部は、更に、R木から、前記最小境界距離と前記第2距離との差分が予め設定された第2閾値よりも小さい少なくとも1つのMBRを取得し、
取得したMBR内の時系列から、少なくとも1つの時系列に対応する第1距離と前記第2距離との差分が予め設定された第2閾値よりも小さい前記少なくとも1つの時系列を、処理された目標時系列に一致する時系列として取得するよう構成されている、
付記21に記載の装置。

Claims (10)

  1. 少なくとも1つの処理対象となる時系列を取得することと、
    区分線分近似(PLA)により処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することと、を含む、
    次元削減に基づいて時系列を処理するための方法。
  2. PLAにより処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することは、
    時間区分の時間長が予め設定された単位時間長であり、前記時系列の時間長が前記単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することと、
    時間長が単位時間長である全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分が、予め設定された近似条件を満たす場合、前記経時的に連続した複数の時間区分を併合すること、を含む、
    請求項1に記載の方法。
  3. 時間長が単位時間長である全ての時間区分の中の、経時的に連続した複数の時間区分に対応する線分が、予め設定された近似条件を満たす場合、前記経時的に連続した複数の時間区分を併合することは、
    時間長が単位時間長である全ての時間区分の中の、前記経時的に連続した複数の時間区分に対応する線分の傾きの差分絶対値が、予め設定された第1閾値より小さい場合、前記経時的に連続した複数の時間区分を併合すること、を含む、
    請求項2に記載の方法。
  4. PLAにより処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することは、
    時系列の時間長に対応する時間範囲内において、時系列の開始時点または終了時点までの時間長が、予め設定された単位時間長の整数倍であり、且つ時系列の時間長が単位時間長の整数倍である時点を少なくとも1つ決定することと、
    時系列の波形における山と谷の時点に応じて、決定された時点から時間区分の境界時点を少なくとも1つ選出することと、
    時間区分における選出された境界時点に応じてPLAに基づき少なくとも1つの時系列を処理することと、を含む、
    請求項1に記載の方法。
  5. 時系列の波形における山と谷の時点に応じて、決定された時点から時間区分の境界時点を少なくとも1つ選出することは、
    各山の時点までの距離が前記単位時間長よりも小さい少なくとも1つの時点、および各谷の時点までの距離が前記単位時間長よりも小さい少なくとも1つの時点を、前記決定された時点から選出することと、
    選出した時点を時間区分の境界時点として用いることと、を含む、
    請求項4に記載の方法。
  6. 時系列の波形における山と谷の時点に応じて、決定された時点から時間区分の境界時点を少なくとも1つ選出することは、
    各山の時点までの距離が最小である少なくとも1つの時点、および各谷の時点までの距離が最小である少なくとも1つの時点を、前記決定された時点から選出することと、
    選出した時点を時間区分の境界時点として用いることと、を含む、
    請求項4に記載の方法。
  7. PLAにより処理された時間区分の時間長が、固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理することは、
    処理された時系列を保存すること、を更に含む、
    請求項1から6のいずれか1項に記載の方法。
  8. 目標時系列の検索要求を受信することと、
    次元削減に基づいて保存された時系列になされた処理と同じ方法により、次元削減に基づき目標時系列を処理することと、
    保存された時系列から処理された目標時系列に一致する少なくとも1つの時系列を検索することと、を含む、
    請求項1から7のいずれか1項に記載された、次元削減に基づいて時系列を処理するための方法により処理された上で保存された時系列を検索するための方法。
  9. 少なくとも1つの処理対象となる時系列を取得するよう構成された取得部と、
    区分線分近似(PLA)により処理された時間区分の時間長が固定されず、予め設定された単位時間長の整数倍となるようにして、PLAに基づき前記少なくとも1つの時系列を処理するよう構成された処理部と、を備える、
    次元削減に基づいて時系列を処理するための装置。
  10. 請求項9に記載の、次元削減に基づいて時系列を処理するための装置により処理された時系列を予め保存するよう構成された記憶部と、
    目標時系列の検索要求を受信するよう構成された受信部と、
    次元削減に基づいて保存された時系列になされた処理と同じ処理手法により、次元削減に基づき目標時系列の処理を行うよう構成された処理部と、
    保存された時系列から、処理された目標時系列と一致する少なくとも1つの時系列を検索するよう構成された検索部と、を備える、
    時系列を検索するための装置。
JP2014043463A 2013-03-28 2014-03-06 次元削減に基づき時系列を処理するための方法および装置 Pending JP2014194762A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310105366.0 2013-03-28
CN201310105366.0A CN104077309B (zh) 2013-03-28 2013-03-28 一种对时序序列进行降维处理的方法和装置

Publications (1)

Publication Number Publication Date
JP2014194762A true JP2014194762A (ja) 2014-10-09

Family

ID=51598569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014043463A Pending JP2014194762A (ja) 2013-03-28 2014-03-06 次元削減に基づき時系列を処理するための方法および装置

Country Status (3)

Country Link
US (1) US9396247B2 (ja)
JP (1) JP2014194762A (ja)
CN (1) CN104077309B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016189747A1 (ja) * 2015-05-28 2016-12-01 三菱電機株式会社 分析装置及び分析方法及び分析プログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600449B (zh) * 2015-10-16 2021-03-16 国家电网公司 一种自动的功率趋势识别方法
CN106021579B (zh) * 2016-06-01 2019-11-08 南京国电南自维美德自动化有限公司 一种历史数据库的压缩方法
CN107391148B (zh) * 2017-07-28 2020-09-15 广州视源电子科技股份有限公司 视图元素保存方法、装置、电子设备及计算机存储介质
CN107918914A (zh) * 2017-11-02 2018-04-17 浙江富帝科技有限公司 一种金融软件中的时间序列数据分段方法
US10891335B2 (en) 2018-01-03 2021-01-12 International Business Machines Corporation Enhanced exploration of dimensionally reduced data
CN109376953B (zh) * 2018-11-21 2022-09-23 国网冀北电力有限公司 一种中长期电量预测方法及系统
CN110620586B (zh) * 2019-09-17 2021-07-13 河北省科学院应用数学研究所 数据压缩方法、装置和终端设备
CN111104966B (zh) * 2019-11-30 2023-04-18 西安外事学院 一种基于时间序列的二维封闭图形降维方法
US20230315079A1 (en) * 2022-03-31 2023-10-05 Johnson Controls Tyco IP Holdings LLP Building equipment control system with modular models
CN116269258B (zh) * 2023-02-22 2023-11-21 昆山市第一人民医院 一种枕式睡眠检测方法、装置及计算机设备
CN116383273A (zh) * 2023-04-04 2023-07-04 济南永信新材料科技有限公司 一种时间序列降维表示方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312505A (ja) * 2000-05-02 2001-11-09 Internatl Business Mach Corp <Ibm> データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
JP2007240382A (ja) * 2006-03-09 2007-09-20 Mitsubishi Electric Corp 追尾装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8111271B2 (en) * 2006-04-27 2012-02-07 Jasper Display Corporation Gray scale drive sequences for pulse width modulated displays
US20080071843A1 (en) * 2006-09-14 2008-03-20 Spyridon Papadimitriou Systems and methods for indexing and visualization of high-dimensional data via dimension reorderings
US8219574B2 (en) * 2009-06-22 2012-07-10 Microsoft Corporation Querying compressed time-series signals
CN101763417A (zh) * 2009-12-30 2010-06-30 北京世纪高通科技有限公司 一种数据查询方法及装置
CN102682573B (zh) * 2012-03-31 2016-08-03 上海海洋大学 一种基于时间序列分析的风暴潮灾害预警系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312505A (ja) * 2000-05-02 2001-11-09 Internatl Business Mach Corp <Ibm> データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
JP2007240382A (ja) * 2006-03-09 2007-09-20 Mitsubishi Electric Corp 追尾装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6015011842; 竹澤 哲矢、渡邊 豊英: '距離グラフを用いた時系列データからの参照系列抽出' 電子情報通信学会技術研究報告 Vol.105、No.64, 20050512, p.7-12, 社団法人電子情報通信学会 *
JPN6015011843; 熊谷 紀子、町田 直義、西谷 卓史: '間欠音を発する機器の一診断法' 日本音響学会誌 第50巻、第11号, 19941101, p.861-867, 社団法人日本音響学会 *
JPN6015011844; 森中 雄、吉川 正俊、天笠 俊之、植村 俊亮: '近似ファイルを用いた数値時系列データの類似検索の実装とその評価' 電子情報通信学会技術研究報告 Vol.100、No.351, 20001006, p.49-56, 社団法人電子情報通信学会 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016189747A1 (ja) * 2015-05-28 2016-12-01 三菱電機株式会社 分析装置及び分析方法及び分析プログラム
JPWO2016189747A1 (ja) * 2015-05-28 2017-10-05 三菱電機株式会社 分析装置及び分析方法及び分析プログラム
US10809977B2 (en) 2015-05-28 2020-10-20 Mitsubishi Electric Corporation Analysis device, analysis method, and computer readable medium

Also Published As

Publication number Publication date
US20140297606A1 (en) 2014-10-02
CN104077309B (zh) 2018-05-08
US9396247B2 (en) 2016-07-19
CN104077309A (zh) 2014-10-01

Similar Documents

Publication Publication Date Title
JP2014194762A (ja) 次元削減に基づき時系列を処理するための方法および装置
CN105912611B (zh) 一种基于cnn的快速图像检索方法
CN109189991B (zh) 重复视频识别方法、装置、终端及计算机可读存储介质
US8719884B2 (en) Video identification and search
CN103440313B (zh) 基于音频指纹特征的音乐检索系统
US8849044B2 (en) Method and apparatus for comparing videos
US9305264B2 (en) Method and system for improved pattern matching
US8477836B2 (en) System and method for comparing an input digital video to digital videos using extracted and candidate video features
KR100903961B1 (ko) 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템
WO2013129580A1 (ja) 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
US7643597B2 (en) Methods for selecting a subsequence of video frames from a sequence of video frames
CN116722876B (zh) 一种用于版式轻阅读的用户数据智能存储方法
JP2013206187A (ja) 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム
JP6434162B2 (ja) データ管理システム、データ管理方法およびプログラム
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
EP2661710A2 (en) Method and apparatus for comparing videos
CN111182364A (zh) 一种短视频版权检测方法及系统
CN111491175B (zh) 一种基于视频内容特征的边缘网络缓存方法和装置
KR20240128047A (ko) 비디오 생성 방법 및 장치, 전자 장치 및 판독 가능한 저장 매체
JP2004118290A (ja) 移動軌跡データ検索用インデックス生成装置及びその方法と、移動軌跡データ検索装置及びその方法と、移動軌跡データ検索用インデックス生成プログラム及びそのプログラムを記録した記録媒体と、移動軌跡データ検索プログラム及びそのプログラムを記録した記録媒体
CN116226468B (zh) 基于网格化终端业务数据存储管理方法
CN112989105B (zh) 一种音乐结构的分析方法及系统
JP2000285242A (ja) 信号処理方法及び映像音声処理装置
CN110032585B (zh) 一种时间序列双层符号化方法及装置
KR101615164B1 (ko) 엔-그램 기반의 질의 처리 장치 및 그 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150331

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20151006