JPWO2005083890A1 - 時系列データ次元圧縮装置 - Google Patents

時系列データ次元圧縮装置 Download PDF

Info

Publication number
JPWO2005083890A1
JPWO2005083890A1 JP2006519068A JP2006519068A JPWO2005083890A1 JP WO2005083890 A1 JPWO2005083890 A1 JP WO2005083890A1 JP 2006519068 A JP2006519068 A JP 2006519068A JP 2006519068 A JP2006519068 A JP 2006519068A JP WO2005083890 A1 JPWO2005083890 A1 JP WO2005083890A1
Authority
JP
Japan
Prior art keywords
time
time series
data
series data
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006519068A
Other languages
English (en)
Other versions
JP4298749B2 (ja
Inventor
高山 茂伸
茂伸 高山
辰輔 東
辰輔 東
佐藤 重雄
重雄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2005083890A1 publication Critical patent/JPWO2005083890A1/ja
Application granted granted Critical
Publication of JP4298749B2 publication Critical patent/JP4298749B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

時系列データ次元圧縮装置に係り、データの特徴を失わずに、時系列データの検索の効率をよくする次元圧縮を行うことを課題とする。また、決まった次元に圧縮し、そのなかにより多くの情報を抽出できるようにする。部分時系列作成部112は、時系列データ作成部110で生成した複数の時系列データについて、指定のセグメント幅に分割した部分時系列を作成する。特異値分解実行部113は、全ての部分時系列を対象として特異値分解を行い、次元圧縮時系列データ生成部114は、上位の特異値分解の成分を、部分時系列の代表値として次元圧縮時系列データを生成する。

Description

本発明は、時系列データの検索をより効率よく行うために、データの特徴を失わずに次元圧縮することを目的とする。また、圧縮効率をよくすることを目的とするのではなく、決まった次元に圧縮し、そのなかにより多くの情報を抽出することを目的とする。
時系列データの次元を減らす従来技術としては、例えば
E.Keogh,K.Chakrabarti,M.Pazzani,Mehrotra
“Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases.”Jounal of Knowledge and Information Systems,2000
に示されているPAA(Piesewise Aggregate Approximation)がある。
PAAでは、時系列データをセグメントに分割し、セグメントの平均値を各セグメントの代表値とすることで、時系列データを圧縮するものである。
平均値の計算はフーリエ変換や特異値分解に比べて簡単に実行でき、より高速に次元圧縮時系列データを生成することができる。
時系列データの次元を減らす他の従来技術としては、例えば、
F.Korn,H.V.Jagadish,C.Faloutsos”Efficienty Supporting Ad Hoc Queries in Large Datasets of Time Sequences”
Proceedings of SIGMOD ’97 pp289−300
に示されている特異値分解による方法もある。特異値分解による方法では、特異値分解後の全ての成分を用いるのではなく、主要な特異値(特異値の大きいもの)のみを採用することで時系列データを圧縮するものである。
特異値分解により次元を圧縮すると、データの形状を他の方法よりうまく抽出できるため、検索効率がよいという利点がある。
また、画像データの次元を減らす従来技術としては、例えば特開昭61−285870「変換符号化方式」がある。画像データをブロックに分割してブロックとに圧縮する。分割したブロックの圧縮では、DCT(Discrete Cosine Transform)と行列の縦・横の傾斜角度をあらわす変換との組合せを用いる。
このように2つの変換を組み合わせることで、ブロックごとにその特徴を抽出して最適な変換を選択することでより高い圧縮率を実現できる。
PAAは、各セグメントの平均値を代表値とすることで、より高速に次元圧縮ができるが、時系列データの検索時または類似検索時には次のような問題がある。時系列データの検索手順は、まず圧縮空間で解の候補を探し、各解の候補に対して実空間で最終的な解を検索する。したがって、圧縮空間では解の候補として選択されたが実空間で真の解とならないものが多いと検索効率が悪くなる。PAAの場合は平均値を各セグメントの代表値とするために、時系列の形状が消されるため圧縮後の情報が乏しくなり、上記で言う検索効率が悪いという問題がある。例えば、平らな時系列も右上がりの時系列も右下がりの時系列も平均値が同じになると、圧縮後の値は同じとなってしまう。
SVDは、特異値分解によりデータの形状をうまく抽出でき、上記で言う検索効率は高いものの、データ量が多くなると特異値分解にかかる時間が多くなり現実的な時間では特異値分解ができないという問題がある。
特開昭61−285870「変換符号化方式」は、圧縮率を向上することが目的であるが、時系列データの検索に用いる場合には以下の問題がある。時系列データの検索はまず解の候補を圧縮空間で探すために、全てのセグメント(ブロック)を同じ圧縮率で圧縮する必要があるが、上述の方式では各ブロックごとに異なる圧縮率となる。
本発明に係る時系列データ次元圧縮装置は、
以下の要素を有することを特徴とする
(1)時間軸に沿って一定間隔で測定された一連のデータである時系列元データに対して、時間軸上で所定間隔ずつ開始位置をずらして、指定の長さの時系列データを複数作成する時系列データ作成部
(2)複数の上記時系列データのそれぞれについて、指定のセグメント幅に分割した部分時系列を作成する部分時系列作成部
(3)上記分割した全ての部分時系列を対象として特異値分解を行う特異値分解実行部
(4)指定された数の上位の特異値分解の成分を、上記各セグメント幅に分解した部分時系列の代表値として、次元圧縮時系列データを生成する次元圧縮時系列データ生成部。
図1は、この発明の実施の形態1を示す構成図である。
図2は、時系列元データ150を表したグラフである。
図3は、時系列データ151の作成方法の図である。
図4は、時系列データ151の作成のためのフローチャートである。
図5は、時系列データ151のグラフである。
図6は時系列データをセグメントに分割した様子を示したものである。
図7は、開始位置t=k+2Nの部分時系列152を示したものである。
図8は、kから始まる時系列151とk+2Nから始める時系列251を示したものである。
図9は、SVD実行結果記憶部の内容で特異値分解の結果を示す図である。
図10は、代表値をプロットした次元圧縮時系列データ153のグラフの例である。
図11は、圧縮データ作成のフローチャートである。
図12は、この発明の実施の形態2を示す構成図である。
図13は、実施の形態2のフローチャートである。
図14は、セグメント幅を16にした場合と32にした場合の模式図である。
図15は、SVDの結果の第2成分まで用いる場合のSVD実行結果である。
図16は、この発明の実施の形態3を示す構成図である。
図17は、平均値計算実行部182の計算結果を模式的に新たしたものである。
図18は、中間時系列のグラフである。
図19は、圧縮後の次元を8次元にする場合のSVD実行結果である。
図20は、ハードウェア構成図である。
実施の形態1.
図1は、この発明の実施例を示す構成図である。図において、120は2次記憶装置もしくは1次記憶装置で、時系列元データ150を格納した時系列元データ格納部である。時系列データ作成部110は、時系列元データ格納部120から時系列元データ150を読み込み、時系列データ151を作成する。121は2次記憶装置もしくは1次記憶装置で110によって生成された複数の時系列データ151を格納する時系列データ格納部である。部分時系列作成部112は、時系列データ格納部121から時系列データ151を順次読込み、部分時系列152を作成し、部分時系列記憶部122に格納する。部分時系列記憶部122は、1次記憶装置もしくは2次記憶装置である。SVD実行部113は、部分時系列記憶部122から部分時系列152を読込み特異値分解を実行し、SVD実行結果記憶部124に格納する。SVD実行結果記憶部124は、1次記憶装置もしくは2次記憶装置である。次元圧縮時系列データ生成部114は、SVD実行結果記憶部124からSVDの結果を読込み、次元圧縮時系列データ153を作成し、次元圧縮時系列データ格納部123に格納する。次元圧縮時系列データ格納部123は、2次記憶装置もしくは1次記憶装置である。
図2は、時系列元データ150を表したグラフである。x軸が時刻t、y軸が時系列の値である。時刻tの取りうる値は1からmの間の自然数であり、m個のデータポイントがある。最初のデータポイントはt=1であらわし、最後のデータポイントはt=mとする。また、データポイントの数を長さと呼び、この場合の長さはm(時系列長 160)である。
図3は、時系列データ151の作成方法の図である。時系列データ作成部110は、時系列元データ格納部120から時系列元データ150を読み込み、長さnの時系列を時系列元データの開始ポイントの時刻tを一つづつずらすことで、m−n+1個作成する。ここでは、長さnはあらかじめ決めておくこととする。t=1から始める時系列が時系列1、t=2から始める時系列が時系列2、そしてt=m−n+1から始める時系列が時系列m−n+1である。t=m−n+1から始める時系列の終点はt=mとなり、これ以降のtの値から始めると長さがn未満となる。
さらに、部分時系列作成のことを考慮し、長さがn未満でN以上の時系列をその後にn−N個追加する。これを補填時系列とよぶ。開始時刻tの値が、m−n+2からm−N+1までの時系列であり、終点のtの値は全てmである。
m−n+2から始まる時系列は、長さがn−1であり、
m−n+3から始まる時系列は、長さがn−2であり、
m−N+1から始まる時系列は、長さがNである。
図4は、時系列データ151の作成のためのフローチャートである。S301にて、時系列元データにて時系列データの開始時刻t=1にセットする。S302においては、時系列長=nにセットする。S303にて、時系列元データを読み込む。S304では、時系列開始時刻と時系列長から時系列終了ポイントを計算し、m以下であるか調べる。時系列終了ポイントがm以下であれば時系列データを作成できるので、S305にすすむ。S305にて時系列開始時刻と時系列長をもとに、時系列元データから時系列データを作成する。S306では次の時系列データを作成するために開始ポイントtをインクリメントして、再びS303に戻る。S304にて、時系列の終了ポイントがmを超えている場合は、時系列長nの時系列データはこれ以上作成できないので、補填時系列データを作成するためにS308にすすむ。S308では、時系列長をディクリメントする。S309では、ディクリメントして時系列長がN以上であるか調べる。N以上であれば、S310にすすみ補填時系列データを作成する。S311では、開始ポイントをインクリメントして次の補填時系列データを作成するための準備をして、S307にすすむ。S307では時系列元データを読み込む。次に再びS308にすすむ。S309にて、時系列長がNより小さくなったら時系列データ作成は終了する。
図5は、時系列データ151のグラフである。開始位置はk、終了位置がk+n−1でn個のデータポイントで構成される。時系列データ151は長さがn(検索時系列長161)の時系列である。
図6は時系列データをセグメントに分割した様子を示したものである。各時系列データ151を長さN(セグメント幅 162)のセグメントに分割する。一つの時系列データ151はn/N 個のセグメントに分割される。それぞれの長さNのセグメントを部分時系列152とする。
図7は、開始位置t=k+2Nの部分時系列152をあらわす。部分時系列152はN個のデータポイントから構成され、長さはNである。
部分時系列作成部112は、それぞれの時系列データ151の最初のN個のデータのみを選択することで、部分時系列データ152を作成する。全ての時系列に対して実行することで開始位置がt=1からt=m−n+1の長さNの部分時系列を作成できる。さらに、時系列データ作成部110が作成した補填時系列についても最初のN個のデータを読み込みそれも補填部分時系列データとして作成し、あわせて部分時系列記憶部122に格納する。ここでセグメント幅Nはあらかじめ決めておくこととする。上記のようにすることで、時系列元データに対して、開始位置t=1からt=m−N+1までの長さNの全ての部分時系列を作成できる。
全ての時系列データがもともとは一つの時系列元データ150であったことから、各時系列データのいずれのセグメントも上記の部分時系列のいずれかと一致する。
図8に示すように、kから始まる時系列151の3番目のセグメントの部分時系列は、k+2Nから始める時系列251の最初のセグメントと同じである。つまり、時系列251から作成した部分時系列と一致する。
SVD実行部113は、部分時系列作成部112から部分時系列データ152を読込み、行数m−N+1、列数Nの行列として特異値分解を実行する。
特異値分解とは、任意のm×n行列Yを、以下のようにU,S,Vの3つの行列の積で表わすもので一般に良く知られている式である。
Figure 2005083890
ただし、r=rank(Y),
,s,…,s,はY Yの正の固有値の平方根(特異値という)で、s≧s≧…≧s
,v,…,vはn次のベクトルで、Y Yの固有値s ,s ,…,s に対応する固有ベクトル。
,v,…,vは大きさが1で互いに直交する。
,u,…,uはm次のベクトルで、
Figure 2005083890
Uはu,u,…,uを列にもつm×r行列、
Vはv,v,…,vを列にもつn×r行列、
Sはs,s,…,sを対角要素にもつr次の対角行列。
図9は、SVD実行結果記憶部の内容で特異値分解の結果を示す。特異値分解により、各行の代表値として上記uを抽出する。
すなわち特異値分解の対象となる行数m−N+1列数Nの行列に対して、行方向で見た場合に、r番目の行はu1ベクトルのr番目の成分とs1の積を代表値とする。
r番目の行は、開始位置のt=rで始まる部分時系列であり、その代表値がu1ベクトルのr番目の成分とs1の積である。SVD実行部は、全てのセグメント(全ての部分時系列)の代表値を作成する。
次に、次元圧縮時系列データ生成部は114 は、上記の特異値分解の第一成分を各セグメントの代表値として、次元圧縮時系列データを生成する。開始位置t=kで始まる部分時系列151は、以下の部分時系列で構成される。
開始位置t=k、k+N,k+2N,…。
したがって、その次元圧縮時系列データは、最初の代表値はu1ベクトルのk番目の成分とs1の積であり、次の代表値はu1ベクトルのk+N番目の成分とs1の積である。
図10は、上記の代表値をプロットした、次元圧縮時系列データ153のグラフの例である。
次元圧縮時系列データ153はn/N個のポイントで構成される。時系列データ151をセグメント分割したそれぞれの部分時系列データにたいして、SVDを実行してその第一成分をプロットしたものである。
図11は、圧縮データ作成のフローチャートである。時系列データ作成部110は、時系列元データ格納部120から時系列元データ150を読み込み、時系列データ151を作成し、時系列データ格納部121に格納する。次に、部分時系列作成部112は、時系列データ格納部121から時系列データ151を順次読込み、部分時系列152を作成し、部分時系列記憶部122に格納する。次に、SVD実行部113は、部分時系列記憶部122から部分時系列を読込み特異値分解を実行し、SVD実行結果記憶部124に格納する。次元圧縮時系列データ生成部114は、SVD実行結果記憶部124のデータを用いて次元圧縮時系列データ153を作成し、次元圧縮時系列データ格納部123に格納する。
上述のように時間軸に沿って一定間隔で測定された一連のデータに対して、指定の長さの時系列データを時間軸上で開始位置をずらして複数作成する手段と、上記指定の長さの各時系列データを指定のセグメント幅に分割した部分時系列を作成する手段と、上記分割した全ての部分時系列を対象として特異値分解を行う手段と、指定された数の上位の特異値分解の成分(この場合は第一成分までとした)を上記各セグメント幅に分解した部分時系列の代表値とする手段と、上記代表値を組み合わせることで上記指定の長さの時系列データの次元を圧縮する手段とを備えたことを特徴とする時系列データ次元圧縮方式について説明した。
実施の形態2.
図12は、この発明の実施例を示す構成図である。110、112、113、114、120、121、122、123、124は図1と同様である。データ解析部117は、時系列データ格納部121から時系列データ151を読み込み解析し、セグメント幅と特異値分解の結果のどの成分までを有効とするかを決めるものである。
図13は実施の形態2のフローチャートである。時系列データ作成部110は、時系列元データ格納部120から時系列元データ150を読み込み、時系列データ151を作成し、時系列データ格納部121に格納する。
次に、データ解析部117は時系列データ格納部121から時系列データを読込み解析を行う。解析の結果、検索時にヒット率が最も高くなるように、セグメント幅と特異値分解の結果のどの成分までを有効とするかを決める。この場合は、第2成分までを使用することとする。
部分時系列作成部112は、時系列データ格納部121から時系列データ151を順次読込み、部分時系列152を作成し、部分時系列記憶部122に格納する。この際に、部分時系列のセグメント幅はデータ解析部117が決めた値とする。次に、SVD実行部113は、部分時系列記憶部122から部分時系列を読込み特異値分解を実行する。実行した結果、SVDの結果のどの成分までを採用するかデータ解析部117が決めた値までをSVD実行結果記憶部に記憶する。この場合は第2成分までをSVD実行結果記憶部に格納する。次元圧縮時系列データ生成部114は、SVD実行結果記憶部の内容を用いて次元圧縮時系列データ153を作成し、次元圧縮時系列データ格納部123に格納する。
図14は、セグメント幅を16にした場合と32にした場合の模式図である。セグメント幅を16にして、SVDの第1成分まで使用した場合の圧縮後の次元は、以下より求まる。
セグメント数 128÷16=8、セグメント代表値=1
セグメント数×セグメント代表値=8
すなわち8次元に圧縮できる。
一方、セグメント幅を32にして、SVDの第2成分まで使用した場合の圧縮後の次元は、以下より求まる。
セグメント数 128÷32=4、セグメント代表値=2
セグメント数×セグメント代表値=8
すなわち8次元に圧縮できる。
圧縮後の次元を同じにする場合でも、セグメント幅とセグメント代表値の取り方にはいくつかの選択肢があり、そのなかでもっともヒット率が高くなるようにセグメント幅とセグメント代表値の数をきめるのがデータ解析部117の機能である。
図15は、SVDの結果の第2成分まで用いる場合のSVD実行結果記憶部の内容である。セグメントの第1成分が全セグメントでほぼ同じ値の場合には、セグメント幅を長くしてSVDの第2成分までを利用することでより詳細に時系列データの特徴を抽出でき、検索時のヒット率が向上する。
時系列データを解析して、上記時系列データを分割するセグメント幅および特異値分解のどの成分までを利用して上記部分時系列の代表値とするかを判断する手段をそなえた請求項1記載の時系列データ次元圧縮方式について説明した。
以上のように、この発明によれば、セグメント分割してSVDを実行することで、全データと比較した各セグメントの特徴を抽出できるために、検索効率の高い圧縮データを作成できる。また、単純にSVDを実行する場合に比べると、対象となる行列の行数は同じであるが列数がN/n になるためにより高速に実行できる。
実施の形態3.
図16は、この発明の実施例を示す構成図である。図において、110、114、120、121、123、124は図1と同様である。中間次元決定部181は、平均値を計算するための幅を決定する。平均値計算実行部182は中間次元決定部の指定した平均値幅で時系列データの平均値を計算し、結果を平均値計算結果記憶部191に格納する。中間時系列作成部183は、平均値幅の代表値をその平均値とすることで中間時系列155を作成して、中間時系列記憶部192に格納する。SVD実行部113は、中間時系列記憶部192に対して、特異値分解を実行する。
中間次元決定部181は、時系列元データを読込み解析して、中間次元pおよび平均をとるセグメント幅を決定する。平均をとる幅は、時系列データが単調に増加または減少する範囲内とする。
図17は、平均値計算実行部182の計算結果を模式的に新たしたものである。時系列151の長さをnとし、中間次元をpとすると、平均をとるセグメント幅はn/pとなる。例えば、時系列長が128で中間次元が32の場合は、平均をとるセグメント幅は128/32=4となる。平均値計算実行部182は、時系列元データ150に対して開始時刻tを一つづつずらしながら、データポイントごとに平均値を計算して結果を平均値計算結果記憶部191に格納する。
図18は、中間時系列のグラフである。中間時系列作成部183は、各時系列151を平均をとるセグメント幅に分解し、それぞれの代表値を平均値計算結果記憶部191の内容から取り出して、中間時系列155を作成して、中間時系列記憶部192に格納する。
図19は、圧縮後の次元を8次元にする場合のSVD実行結果記憶部124の内容である。SVD実行部113は、中間時系列記憶部192から中間時系列155を読込み、行数m−n+1、列数pの行列として特異値分解を実行し、結果をSVD実行結果記憶部124に格納する。圧縮後の次元を8次元にするために、第8成分の値までを格納している。
次に、次元圧縮時系列データ生成部は114は、上記の特異値分解の第8成分までを用いて次元圧縮時系列データを生成する。すなわち、各時系列151は以下の8つのデータで近似的に表し、次元圧縮時系列データを生成する。
(s,s,s,s,s,s,s,s
指定の長さの複数の時系列データに対して、平均をとるセグメント幅を決める手段と、上記の各時系列に対して平均をとるセグメント幅ごとに平均値を計算する手段と、平均値をセグメント代表値とした中間時系列を作成する手段と、それぞれの中間時系列を対象として特異値分解を行う手段と、指定された数の上位の特異値分解の成分を上記中間時系列の圧縮データとする手段とを備えたことを特徴とする時系列データ次元圧縮方式について説明した。
以上のように、この発明によれば、時系列データが単調に変化する幅で平均値をとることでデータの特質を失うことなくデータ量を削減できる。さらに、削減したデータ量に対してSVDを実行することで高速に特異値分解を実行でき、またデータの特徴も抽出することができる。
時系列データ次元圧縮装置は、コンピュータであり、各要素はプログラムにより処理を実行することができる。また、プログラムを記憶媒体に記憶させ、記憶媒体からコンピュータに読み取られるようにすることができる。
図20は、時系列データ次元圧縮装置のハードウエア構成例を示す図である。この例では、バスに、演算装置2001、メモリ2002、ハードディスク2003、表示装置2004が接続されている。プログラムは、例えばハードディスク2003に記憶されており、メモリ2002にロードされた状態で、順次演算装置2001に読み込まれ処理を行う。
データの特徴を失わずに、時系列データの検索の効率をよくする次元圧縮を行うことができる。また、決まった次元に圧縮し、そのなかにより多くの情報を抽出することがでる。

Claims (4)

  1. 以下の要素を有することを特徴とする時系列データ次元圧縮装置
    (1)時間軸に沿って一定間隔で測定された一連のデータである時系列元データに対して、時間軸上で所定間隔ずつ開始位置をずらして、指定の長さの時系列データを複数作成する時系列データ作成部
    (2)複数の上記時系列データのそれぞれについて、指定のセグメント幅に分割した部分時系列を作成する部分時系列作成部
    (3)上記分割した全ての部分時系列を対象として特異値分解を行う特異値分解実行部
    (4)指定された数の上位の特異値分解の成分を、上記各セグメント幅に分解した部分時系列の代表値として、次元圧縮時系列データを生成する次元圧縮時系列データ生成部。
  2. 時系列データ次元圧縮装置は、上記代表値を組み合わせることで上記指定の長さの時系列データの次元を圧縮することを特徴とする請求項1記載の時系列データ次元圧縮装置。
  3. 前記時系列データを解析して、当該時系列データを分割するセグメント幅および特異値分解について、どの成分までを利用して上記部分時系列の代表値とするかを判断するデータ解析部を備えることを特徴とする請求項1記載の時系列データ次元圧縮装置。
  4. 以下の要素を有することを特徴とする時系列データ次元圧縮装置
    (1)時間軸に沿って一定間隔で測定された一連のデータである時系列元データに対して、時間軸上で所定間隔ずつ開始位置をずらして、指定の長さの時系列データを複数作成する時系列データ作成部
    (2)複数の上記時系列データのそれぞれについて、前記指定の長さの複数の時系列データに対して、平均をとる為のセグメント幅を決める中間次元決定部
    (3)前記各時系列に対して、上記平均をとる為のセグメント幅ごとに平均値を計算する平均値計算実行部
    (4)計算した上記平均値をセグメント代表値とした中間時系列を作成する中間時系列作成部
    (5)それぞれの中間時系列を対象として特異値分解を行う特異値分解実行部
    (6)指定された数の上位の特異値分解の成分を上記中間時系列の圧縮データとする次元圧縮時系列データ生成部。
JP2006519068A 2004-02-26 2004-02-26 時系列データ次元圧縮装置 Expired - Fee Related JP4298749B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2004/002252 WO2005083890A1 (ja) 2004-02-26 2004-02-26 時系列データ次元圧縮装置

Publications (2)

Publication Number Publication Date
JPWO2005083890A1 true JPWO2005083890A1 (ja) 2007-08-30
JP4298749B2 JP4298749B2 (ja) 2009-07-22

Family

ID=34897914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006519068A Expired - Fee Related JP4298749B2 (ja) 2004-02-26 2004-02-26 時系列データ次元圧縮装置

Country Status (5)

Country Link
US (1) US7433527B2 (ja)
JP (1) JP4298749B2 (ja)
CN (1) CN1894856A (ja)
CA (1) CA2548461C (ja)
WO (1) WO2005083890A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4398777B2 (ja) * 2004-04-28 2010-01-13 株式会社東芝 時系列データ分析装置および方法
US7310652B1 (en) * 2005-08-08 2007-12-18 At&T Corp. Method and apparatus for managing hierarchical collections of data
JP5019071B2 (ja) 2007-09-05 2012-09-05 信越化学工業株式会社 新規光酸発生剤並びにこれを用いたレジスト材料及びパターン形成方法
US8886689B2 (en) * 2009-02-17 2014-11-11 Trane U.S. Inc. Efficient storage of data allowing for multiple level granularity retrieval
US8219574B2 (en) * 2009-06-22 2012-07-10 Microsoft Corporation Querying compressed time-series signals
US20110050702A1 (en) * 2009-08-31 2011-03-03 Microsoft Corporation Contribution based chart scaling
US8588587B2 (en) 2010-06-30 2013-11-19 International Business Machines Corporation Navigation interface with ghost region
JP5678620B2 (ja) * 2010-12-03 2015-03-04 株式会社日立製作所 データ処理方法、データ処理システム、及びデータ処理装置
CN102522999B (zh) * 2011-12-09 2014-06-25 电子科技大学 一种三维声波测井数据的实时压缩方法
US8972415B2 (en) 2012-04-30 2015-03-03 Hewlett-Packard Development Company, L.P. Similarity search initialization
US9702963B2 (en) 2012-05-30 2017-07-11 Nokia Technologies Oy Method, apparatus, and computer program product for high accuracy location determination
CN103794006B (zh) 2012-10-31 2016-12-21 国际商业机器公司 用于处理多个传感器的时序数据的方法和装置
CN103914449B (zh) * 2012-12-29 2017-06-16 上海可鲁系统软件有限公司 一种多源时间序列数据压缩存储方法
US9607067B2 (en) 2013-01-25 2017-03-28 International Business Machines Corporation Synchronization of time between different simulation models
US9201989B2 (en) 2013-01-25 2015-12-01 Globalfoundries Inc. Interpolation techniques used for time alignment of multiple simulation models
US9805143B2 (en) 2013-01-25 2017-10-31 International Business Machines Corporation Composite simulation modeling and analysis
US9755720B2 (en) * 2013-05-31 2017-09-05 Nokia Technologies Oy Calibration data
US9866653B2 (en) 2013-08-02 2018-01-09 Hitachi, Ltd. Data transfer system and method
US9361329B2 (en) 2013-12-13 2016-06-07 International Business Machines Corporation Managing time series databases
GB2521442A (en) 2013-12-19 2015-06-24 Nokia Corp Method, apparatus, and computer program product for location determination using WiFi
CN105260404B (zh) * 2015-09-22 2019-03-26 北京百度网讯科技有限公司 存储时间序列数据的方法和装置
US10685306B2 (en) * 2015-12-07 2020-06-16 Sap Se Advisor generating multi-representations of time series data
US11036715B2 (en) 2018-01-29 2021-06-15 Microsoft Technology Licensing, Llc Combination of techniques to detect anomalies in multi-dimensional time series
US10771088B1 (en) 2019-02-28 2020-09-08 International Business Machines Corporation Optimal multi-dimensional data compression by tensor-tensor decompositions tensor
CN110620586B (zh) * 2019-09-17 2021-07-13 河北省科学院应用数学研究所 数据压缩方法、装置和终端设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61285870A (ja) 1985-06-13 1986-12-16 Toshiba Corp 変換符号化方式
JPH0654500B2 (ja) 1985-07-25 1994-07-20 株式会社日立メデイコ デ−タ圧縮方法
JPH06139345A (ja) 1992-10-23 1994-05-20 Toshiba Corp 特異値展開符号化方式
JP2795119B2 (ja) * 1993-02-03 1998-09-10 日本ビクター株式会社 多次元画像圧縮伸張方式
US5905814A (en) * 1996-07-29 1999-05-18 Matsushita Electric Industrial Co., Ltd. One-dimensional time series data compression method, one-dimensional time series data decompression method
US5818463A (en) * 1997-02-13 1998-10-06 Rockwell Science Center, Inc. Data compression for animated three dimensional objects
JPH1128894A (ja) 1997-07-10 1999-02-02 Shinjirou Toyoshima 楕円形コンパス
JP2000048047A (ja) * 1998-01-19 2000-02-18 Asahi Glass Co Ltd 時系列デ―タの保存方法及び時系列デ―タベ―スシステム、時系列デ―タの処理方法及び時系列デ―タ処理システム、時系列デ―タ表示システム、並びに記録媒体
JP3767876B2 (ja) * 1998-04-03 2006-04-19 本田技研工業株式会社 音声認識装置
US6373986B1 (en) * 1998-04-08 2002-04-16 Ncr Corporation Compression of data transmission by use of prime exponents
EP0973129A3 (en) * 1998-07-17 2005-01-12 Matsushita Electric Industrial Co., Ltd. Motion image data compression system
US6486881B2 (en) * 2000-06-15 2002-11-26 Lifef/X Networks, Inc. Basis functions of three-dimensional models for compression, transformation and streaming
US6947045B1 (en) * 2002-07-19 2005-09-20 At&T Corporation Coding of animated 3-D wireframe models for internet streaming applications: methods, systems and program products
US7103222B2 (en) * 2002-11-01 2006-09-05 Mitsubishi Electric Research Laboratories, Inc. Pattern discovery in multi-dimensional time series using multi-resolution matching
US6871165B2 (en) * 2003-06-20 2005-03-22 International Business Machines Corporation Method and apparatus for classifying time series data using wavelet based approach
US7551785B2 (en) * 2003-07-03 2009-06-23 Canadian Space Agency Method and system for compressing a continuous data flow in real-time using cluster successive approximation multi-stage vector quantization (SAMVQ)

Also Published As

Publication number Publication date
CA2548461C (en) 2009-08-11
US20070147519A1 (en) 2007-06-28
CA2548461A1 (en) 2005-09-09
CN1894856A (zh) 2007-01-10
US7433527B2 (en) 2008-10-07
JP4298749B2 (ja) 2009-07-22
WO2005083890A1 (ja) 2005-09-09

Similar Documents

Publication Publication Date Title
JP4298749B2 (ja) 時系列データ次元圧縮装置
KR100545477B1 (ko) 거리 측정기를 사용한 이미지 검색법
JP4527322B2 (ja) 画像検索装置、画像検索方法、及び画像検索用プログラム
CN108052653A (zh) 图像特征描述符的获取方法、装置、存储介质、终端及图像检索方法
JP2006338313A (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
US20040049502A1 (en) Method of indexing and searching feature vector space
CN111445952B (zh) 超长基因序列的相似性快速比对方法及系统
Tombari et al. Full-search-equivalent pattern matching with incremental dissimilarity approximations
CN111859004A (zh) 检索图像的获取方法、装置、设备及可读存储介质
CN110909197A (zh) 一种高维特征的处理方法和装置
CN112364188A (zh) 一种遥感影像的索引建立方法、遥感影像检索方法及装置
KR100318512B1 (ko) 두그룹간의유사도계산방법
JP3545007B2 (ja) データベース検索システム
WO2004081819A1 (en) A method and system for pattern matching
US20070230831A1 (en) Method for efficient coding of shape descriptor parameters
CN108170664B (zh) 基于重点关键词的关键词拓展方法和装置
CN114357220A (zh) 一种基于局部敏感哈希算法的相似医学影像计算方法
CN111773700B (zh) 一种动画数据的处理方法和装置
CN111309984B (zh) 利用索引从数据库中进行节点向量检索的方法及装置
CN111026935B (zh) 基于自适应度量融合的跨模态检索重排序方法
JPH07200861A (ja) 中心線算出装置
JP3676577B2 (ja) ベクトル量子化装置および方法、記録媒体
JP4460277B2 (ja) 画像の対応点探索方法、対応点探索装置および対応点探索プログラム
US9350383B2 (en) Run total encoded data processing
JP4460274B2 (ja) 画像の対応点探索方法、対応点探索装置および対応点探索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090414

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090415

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees