JP2009187293A

JP2009187293A - 時系列データ解析システム、方法およびプログラム

Info

Publication number: JP2009187293A
Application number: JP2008026651A
Authority: JP
Inventors: Takayuki Nakada; 貴之中田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2008-02-06
Filing date: 2008-02-06
Publication date: 2009-08-20

Abstract

【課題】時系列データから簡潔な構造や関係性を効率的に抽出することができるデータ解析システムを提供する。
【解決手段】データ解析システムは、複数の時系列データのそれぞれを、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影して圧縮データを生成するデータ圧縮・変換部１０と、生成した圧縮データについて、部分空間上における頂点および辺として与えられる変数間の相関構造または相関関係を推定する構造関係推定部１１と、推定した相関構造または相関関係の時系列な変化を推定する時系列構造推定部１２と、推定した時系列な変化に基づいて相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、時系列データに内在する構造または関係性の変化を検出または予測する検出・予測部１３と、を有する。
【選択図】図１

Description

本発明は、観測対象について収集したログ情報（時系列の順序性のあるデータからなるデータログ）やセンサ情報（測定データ）などの時系列データ群から有用な情報を取得し、その取得情報に基づいて、観測対象の構造や関係性についての変化を検出または予測する技術に関する。

自動車、ネットワークシステム、自然現象などの関係性診断分野では、診断対象に関する時系列データとして入力される各センサ情報やログ情報について、それぞれ閾値を設定し、入力データがその閾値を超えた状態を、診断対象の障害として検出する方法が、一般に用いられている。

近年、障害診断の対象となるシステムから、センサ情報やログ情報として膨大なデータを取得できるようになり、そのような膨大なデータを利用して、診断対象の構造や関係性の変化を検出するための技術として、いくつかの関連技術が提案されている。関連技術の一例として、非特許文献１、２には、診断対象の構造や関係性の変化を検出する検出システムが記載されている。

非特許文献１に記載の関係性検出システムは、変化点検出手段、距離尺度定義手段および多次元データ圧縮手段を有する。この関係性検出システムでは、変化点検出手段が、大量の時系列データのそれぞれに対して変化度スコアを求め、距離尺度定義手段が、その変化度スコア列をベクトルとして、お互いのベクトル間の距離を定める。そして、多次元データ圧縮手段が、そのベクトルを多次元尺度法により低次元空間にマッピングする。このマッピングによれば、類似した時系列データは、低次元空間の近い位置にマッピングされる。

非特許文献２に記載の構造変化検出システムは、次元圧縮手段、時系列構造推定手段および変化度スコア計算手段を有する。この関係性検出システムでは、次元圧縮手段が、大量の時系列データに対して、低次元における隠れた共通の性質を持つ時系列データを計算し、時系列構造推定手段が、その時系列データの変化に応じてモデルを適応的に学習する。そして、変化度スコア計算手段が、新たなデータが入ってきた場合に、過去のモデルに対して大きく外れた状態を計算するための変化度スコアを求め、その変化度に応じて異常やモデルの変化を検出する。
Tsuyoshi Ide and Keisuke Inoue, "Knowledge Discovery from Heterogeneous Dynamic Systems using Change-Point Correlations" Proceedings of 2005 SIAM International Conference on Data Mining (SDM 05), April 21-23, 2005, pp.571-576. Spiros Papadimitriou, Jimeng Sun, Christos Faloutsos, Streaming Pattern Discovery in Multiple Time-Series, VLDB 2005.

しかしながら、非特許文献１、２に記載の検出システムにおいては、データ間の簡潔な相関構造や相関関係を抽出するためのデータ圧縮処理や計算上の工夫がなされていないため、複数の時系列データに内在する構造や関係性を効率的に予測または検出することは困難である。

また、複数の時系列データに内在する構造や関係性の時系列な依存関係を陽に表現するようには構成されていない。このため、検出結果から構造や関係性の時系列な依存関係をとらえることは困難である。

本発明の目的は、上記問題を解決することのできる、データ解析システム、方法およびプログラムを提供することにある。

上記目的を達成するため、本発明の時系列データ解析システムは、
複数の時系列データを入力とし、該入力時系列データのそれぞれを、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影して圧縮データを生成するデータ圧縮・変換部と、
前記データ圧縮・変換部で生成した圧縮データについて、前記部分空間上における前記複数の頂点および辺として与えられる変数間の相関構造または相関関係を推定する構造関係推定部と、
前記構造関係推定部で推定した前記相関構造または相関関係の時系列な変化を推定する時系列構造推定部と、
前記時系列構造推定部で推定した前記時系列な変化に基づいて前記相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、前記複数の時系列データに内在する構造または関係性の変化を検出または予測する検出・予測部と、を有することを特徴とする。

本発明の時系列データ解析方法は、
データ圧縮・変換部が、複数の時系列データのそれぞれを、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影して圧縮データを生成し、
構造関係推定部が、前記データ圧縮・変換部にて生成された圧縮データについて、前記部分空間上における前記複数の頂点および辺として与えられる変数間の相関構造または相関関係を推定し、
時系列構造推定部が、前記構造関係推定部で推定した前記相関構造または相関関係の時系列な変化を推定し、
検出・予測部が、前記時系列構造推定部で推定した前記時系列な変化に基づいて前記相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、前記複数の時系列データに内在する構造または関係性の変化を検出または予測する、ことを特徴とする。

本発明のプログラムは、
複数の時系列データのそれぞれを、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影して圧縮データを生成する第１の処理と、
前記第１の処理で生成された圧縮データについて、前記部分空間上における前記複数の頂点および辺として与えられる変数間の相関構造または相関関係を推定する第２の処理と、
前記第２の処理で推定した前記相関構造または相関関係の時系列な変化を推定する第３の処理と、
前記第３の処理で推定した前記時系列な変化に基づいて前記相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、前記複数の時系列データに内在する構造または関係性の変化を検出または予測する第４の処理と、をコンピュータに実行させることを特徴とする。

本発明によれば、複数の時系列データ（多次元データ）は、該データに内在する構造および関係性を表すことができる低次元の部分空間に射影されることで圧縮され、その圧縮データ（低次元データ）に基づいて、相関構造や相関関係が推定される。このような圧縮データに基づいて推定される相関構造や相関関係は、人間が理解できるような抽象化されたモデルとして扱うことができる。このように、複数の時系列データに内在する構造または関係性を、人間が理解できる形で抽出して提供できる。

また、多次元データを低次元データに圧縮することで、相関構造や相関関係を抽出する上で不要となるデータを削除する。これにより、多次元データに内在する構造や関係性を効率的に予測または検出することができる。

また、複数の時系列データに内在する構造や関係性の時系列な依存関係を陽に表現することができるので、検出または予測の結果から、構造や関係性の時系列な依存関係を容易にとらえることができる。

次に、本発明の実施形態について図面を参照して説明する。

図１は、本発明の一実施形態であるデータ解析システムの構成を示すブロック図である。

図１を参照すると、データ解析システム１００は、プログラムにより動作するコンピュータシステムであって、その主要部は、制御部１、通信部２、入力部３、出力部４、および記憶部５からなる。

記憶部５は、ハードディスクや半導体メモリなどの記憶装置より構成されるものであって、データ解析システム１００を動作させるためのプログラムやデータが格納される。プログラムとして、制御部１の各機能部を実現するためのプログラム５０が記憶部５に予め格納されている。プログラム５０は、記録媒体を通じてユーザに提供されてもよく、また、インターネットに代表されるネットワークを通じてユーザに提供されてもよい。

通信部２は、外部データベースシステムや、各種センサの測定データを取り込むための外部入力装置との接続を行うためのインタフェースを備える。外部データベースシステムは、観測対象に関するデータをログ情報として格納したシステムである。ログ情報は、外部データベースシステムから通信部２を通じて制御部１に供給される。外部入力装置は、観測対象に関する観測データを、通信部２を通じて制御部１に供給する。観測データは、例えば、環境調査を対象とする場合は、温度センサ、湿度センサ、騒音センサ、自動車の速度を測定する速度センサ等の複数のセンサにより得られた複数の時系列データ（多次元データ）である。

入力部３は、キーボードやマウスなどに代表される入力装置である。出力部４は、ディスプレイ装置やプリンタに代表される出力装置である。

制御部１は、記憶部５に格納されたプログラムに従って動作し、入力部３からの入力を受け付けて各部の動作を制御するとともに、データ解析処理に必要な機能を提供する。制御部１は、プログラム５０により提供される主要な機能部として、データ圧縮・変換部１０、構造・関係性推定部１１、時系列構造推定部１２、および検出・予測部１３を備える。

観測対象に関する複数の時系列データが外部データベースシステムまたは外部入力装置から通信部２を通じて制御部１に供給される。

データ圧縮・変換部１０は、通信部２を通じて入力された複数の時系列データ（多次元データ）を、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影する圧縮処理を行う。例えば、データ圧縮・変換部１０は、Ｋ次元の時系列データを、Ｌ（＜Ｋ）次元の部分空間に展開する圧縮処理を行う。このデータ圧縮・変換部１０による圧縮結果は、圧縮データ５１として記憶部５に格納される。

構造・関係性推定部１１は、記憶部５に格納された圧縮データ５１について、低次元の部分空間上における上記複数の頂点および辺として与えられる変数間の相関構造または相関関係を推定する。構造・関係性推定部１１による推定結果は、構造・関係性推定データ５２として記憶部５に格納される。

時系列構造推定部１２は、記憶部５に格納された構造・関係性推定データ５２に基づいて、相関構造または相関関係の時系列な変化を推定する。時系列構造推定部１２による推定結果は、推定・学習データ５３として記憶部５に格納される。

検出・予測部１３は、記憶部５に格納された推定・学習データ５３に基づいて相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、複数の時系列データに内在する構造または関係性の変化を検出または予測する。

検出・予測部１３は、構造変化検出・予測部１３ａおよび関係変化・予測部１３ｂを有する。構造変化検出・予測部１３ａは、記憶部５に格納された推定・学習データ５１に基づいて、構造パターンの変化を検出または予測する。この構造パターン変化の検出または予測の結果は、構造変化検出・予測部１３ａから出力部４に供給される。関係変化・予測部１３ｂは、記憶部５に格納された推定・学習データ５１に基づいて、関係パターンの変化を検出または予測する。この関係パターン変化の検出または予測の結果は、関係変化・予測部１３ｂから出力部４に供給される。

次に、本実施形態のデータ解析システムの動作について具体的に説明する。

図２は、図１に示したデータ解析システム１００にて行われるデータ解析処理の一手順を示すフローチャートである。以下、図１および図２を参照して、データ解析処理の手順を説明する。

まず、データ入力手段である通信部２により、観測対象に関する複数の時系列データを取り込む（ステップＡ１）。次に、データ圧縮・変換部１０が、入力された複数の時系列データを低次元の部分空間に射影する圧縮処理を行う（ステップＡ２）。この圧縮結果は、圧縮データ５１として記憶部５に格納される。

次に、構造・関係性推定部１１が、記憶部５に格納された圧縮データ５１に基づいて、低次元の部分空間上における頂点および辺として与えられる変数間の相関構造または相関関係を推定する（ステップＡ３）。例えば、構造関係推定部１１は、相関構造または相関関係を属性とする木構造で部分空間の分布を表した確率モデルを作成する。この構造・関係性推定部１１による推定結果（確率モデル）は、構造・関係性推定データ５２として記憶部５に格納される。

次に、時系列構造推定部１２が、記憶部５に格納された構造・関係性推定データ５２に基づいて、相関構造または相関関係の時系列な変化（時間的な変化）を推定する（ステップＡ４）。例えば、時系列構造推定部１２は、ステップＡ３にて構造関係推定部１１が作成した確率モデルに基づいて、相関構造または相関関係の出現パターンに関する時系列構造を推定する。時系列構造推定部１２による推定結果は、推定・学習データ５３として記憶部５に格納される。

次に、検出・予測部１３が、記憶部５に格納された推定・学習データ５３に基づいて、相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、複数の時系列データに内在する構造または関係性の変化を検出または予測する（ステップＡ５）。例えば、検出・予測部１３は、ステップＡ４にて時系列構造推定部１２が推定した時系列構造の出現確率を計算し、該結果に基づいて、複数の時系列データに内在する構造または関係性の変化を検出または予測する。このステップＡ５の構造・関係性の変化の検出・予測の処理は、構造変化検出・予測部１３ａが、構造パターンの変化を検出または予測する構造変化検出・予測処理と、関係変化検出・予測１３ｂが、関係パターンの変化を検出または予測する関係性変化検出・予測処理とを含む。

最後に、データ出力部４が、検出・予測部１３による検出または予測の結果を出力する（ステップＡ６）。このステップＡ６のデータ出力では、検出・予測結果は、例えば表示部またはプリンタにて出力される。

次に、本実施形態のデータ解析システムの特徴となる、データ圧縮・変換部１０、構造・関係性推定部１１、時系列構造推定部１２、および検出・予測部１３の動作を具体的に説明する。ここでは、Ｋ個のセンサの測定値がそれぞれ時系列な測定データとして制御部１に供給された場合の動作を例に挙げて説明する。

入力される測定値の時系列をＫ次元のベクトルにしたものをｙ_tと表す。ここで、ｔは時刻を表す。データ圧縮・変換部１０は、この測定値ベクトル系列ｙ_t（ｔ=１・・・Ｔ）をＬ次元の部分空間ｘ_tに射影する。このとき、測定値ベクトル系列ｙ_tと部分空間ｘ_tとの間のＫ×Ｌ変換行列をＡで表し、センサの測定値に対するノイズ項をε_tとし、平均０、共分散行列Λの正規分布に従うとする。つまり、「ε_t〜N(0，Λ)」の条件に従う。このときの測定値ベクトル系列ｙ_tの確率分布は、
P(y_t |x_t) = N(y_t |Ax_t,Λ)
と表すことができる。これは、部分空間ｘ_tが平均０、共分散行列Ｉ（単位行列）の分布に従うとすると、因子分析と同じモデルとなる。また、ノイズ項を無視すると主成分分析と同じモデルとなる。ここで、因子分析は、観測値が複数の値からなる多変量データを統計的に解析する多変量解析の１つである。主成分分析も、多変量解析の１つであって、複数の変数間の共分散（相関）を少数の合成変数で表す。ノイズ項は、センサの測定精度の誤差や、測定データに基づく読み取り精度の誤差等に相当する項目である。

次に、構造・関係性推定部１１による、効率的かつ確率的な構造（ネットワーク構造）および関係性を求める処理について説明する。ここでは、部分空間ｘ_tの分布において、Ｌ個の各変数が、独立ではなく、相関構造を持つと仮定する。この相関構造の表現式としては、色々考えられるが、ここでは、Chow-Liu Tree構造を用いる。

Chow-Liu Tree構造を用いた場合、部分空間ｘ_tの確率分布は、以下のように書くことができる。

T(x_t)=Π_(u,v)∈_E T_uv(x_t ^u,x_t ^v) / T_u(x_t ^u) T_v(x_t ^v) Π_v∈_V T_v(x_t ^v)
Chow-Liu Tree構造は、相関構造の計算速度にすぐれ、また、適切な事前分布を設定することで、森（Forest）構造を表すことができる。これは、複数の互いに相関のある部分相関構造を用いることで、全体の相関構造を表すことができることを意味する。部分相関構造をクラスタとみなせば、多数の変数をクラスタリングすることに相当する。

Chow-Liu式では、一つの全体相関構造しか表すことができないが、複数のグラフの組み合わせ（混合モデル）を考えることで、より複雑な全体相関構造の確率モデルを表すことができる。この混合モデルの状態を離散状態ｓ_tで表すと、部分空間ｘ_tの分布は、
P(x_t|s_t) = T(x_t|s_t,θ)
と表すことができる。ここで、θは、Chow-Liu Tree構造を表すパラメータである。

次に、時系列構造推定部１２による時系列な構造の推定処理について具体的に説明する。この推定処理では、上述のようにして計算した構造および関係性について、時系列な変化を計算する。離散状態にマルコフ性を考慮すると、
P(s_t|s_t-1)= a_t,t-1
となる。ここで、a_t,t-1は遷移確率である。

以上の処理により得られたモデルをまとめると、
P(y)=Σ_s∫p(y|x)p(x|s)p(s)dx
となる。検出・予測部１３は、このモデル計算式に基づき、ＥＭ（Expectation Maximization）アルゴリズムにより推定・学習することで、複数の時系列データに内在する構造または関係性の変化の検出または予測を行う。推定・学習を行うことにより、パラメータを含む確率モデル（グラフ）が求まり、その出現確率を計算することで、構造パターンの変化の検出または予測、関係パターンの変化の検出または予測を行うことができる。ＥＭアルゴリズムは、繰り返し演算により最尤推定を求めるアルゴリズムである。パラメータは、グラフの各頂点の値（測定値の平均値や分散値）、頂点を結合する辺の大きさ（重み）、ノイズの大きさ等である。

以下に、検出・予測部１３による出現確率の計算について説明する。

上記のモデル計算式において、高次元のデータを射影するための低次元の部分空間の分布は「p(y|x)」の項目により規定される。図３に、低次元の部分空間の分布を模式的に示す。図３を参照すると、時系列データｙ（測定値ベクトル系列）を射影するための低次元の部分空間の分布は、複数の頂点ｘ¹〜ｘ³とその頂点間を結ぶ辺によって表される。頂点ｘ¹〜ｘ³のそれぞれの値と、辺による頂点の接続関係を表す関係性とを適宜に設定することで、複数のグラフ（混合モデル）を作成することができる。

混合モデルは、「p(x|s)」の項目により規定される。図４に、混合グラフの一例を示す。図４を参照すると、混合グラフは、頂点ｘ¹〜ｘ³とその頂点間を結ぶ辺によって表される、二つのグラフＧ１、Ｇ２を含む。グラフＧ１においては、頂点ｘ¹と頂点ｘ²が結合され、頂点ｘ²と頂点ｘ³が結合されている。グラフＧ２においては、頂点ｘ¹と頂点ｘ³が結合され、頂点ｘ³と頂点ｘ²が結合されている。これらグラフにおいて、頂点ｘ¹〜ｘ³とペアとなる頂点間を結ぶ辺について変数が設定される。例えば、グラフＧ２においては、変数として、頂点ｘ¹〜ｘ³のそれぞれに、平均値２、４、３が設定され、頂点ｘ¹と頂点ｘ³の辺に、重み１０が設定され、頂点ｘ³と頂点ｘ²の辺に、重み２０が設定されている。このグラフＧ２によれば、平均が２の確率分布に従うとき、２程度の値が出てくると予測することができる。

「p(x|s)」の項目により規定された混合グラフについて、「p(s)」の項目により規定された遷移確率に従って、どのグラフがどういった形（変数の値）で出てくるかを予測する。図５に、グラフ遷移の模式図を示す。図５を参照すると、図４に示したグラフＧ１、Ｇ２について、時刻ｔから時刻ｔ＋１の時区間におけるグラフ遷移の確率が示されている。時刻ｔにおいてグラフＧ１が検出された場合において、グラフＧ１が時刻ｔ＋１においても検出される確率をｐとすると、グラフＧ２が時刻ｔ＋１において検出される確率は（１−ｐ）である。一方、時刻ｔにおいてグラフＧ２が検出された場合において、グラフＧ２が時刻ｔ＋１においても検出される確率をｑとすると、グラフＧ１が時刻ｔ＋１において検出される確率は（１−ｑ）である。確率ｐが小さい場合は、時刻ｔ＋１においてグラフＧ２が出現すると予測することができる。また、確率ｑが小さい場合は、時刻ｔ＋１においてグラフＧ１が出現すると予測することができる。このようにして、出現確率に基づいて、グラフの構造パターンや関係パターンの変化の検出または予測を行うことができる。

以上説明した本実施形態のデータ解析システムにおいて、データ圧縮・変換部１０が、大量の多次元データを低次元の部分空間に射影しつつ、構造・関係性推定部１１が、低次元の部分空間上における変数間の相関構造または相関関係を推定する。さらに、構造・関係性推定部１１が、その推定された相関構造または相関関係の時系列な変化を推定する。そして、検出・予測部１３が、その推定した時系列な変化に基づいて相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、多次元データに内在する構造または関係性の変化を検出または予測する。

この構成によれば、複数の時系列データ（多次元データ）は、該データに内在する構造および関係性を表すことができる低次元の部分空間に射影されることで圧縮され、その圧縮データ（低次元データ）に基づいて、相関構造や相関関係が推定される。このような圧縮データに基づいて推定される相関構造や相関関係は、人間が理解できるような抽象化されたモデルとして扱うことができる。このように、複数の時系列データに内在する構造または関係性を、人間が理解できる形で抽出して提供できる。

また、多次元データに内在する構造や関係性の時系列な依存関係を陽に表現することができるので、検出または予測の結果から、構造や関係性の時系列な依存関係を容易にとらえることができる。

例えば、多次元データとして、自動車の状態を観測した時系列データ（燃焼温度、速度、燃料消費量等の時系列データ）を取り扱う場合、本発明によれば、この多次元データに基づいて、構造や関係性の時系列な依存関係をとらえることで、アクセルの踏み具合についての予測結果を得られる。

また、高速道路上における渋滞情報を提供するシステムに本発明を適用した場合、各出口の道路上に一定の間隔で配置された複数の車両検出センサからの測定値が時系列データとして制御部１に供給される。多次元データに基づく、構造や関係性の時系列な依存関係をとらえることで、出口Ａにおける渋滞を予測するとともに、その出口Ａに隣接する出口Ｂにおける渋滞を予測することが可能である。このように、連動した渋滞の予測を行うことができる。

本発明によれば、自動車などの機械システムや、複数のコンピュータがネットワークにより接続された情報処理システムにおける、構造や関係性の変化の検出および予測といった用途に適用できる。また、道路やビルなどに設置されたセンサや気象観測所の観測システムから得られるデータ間の構造や関係性の変化検出および予測といった用途にも適用可能である。

本発明の一実施形態であるデータ解析システムの構成を示すブロック図である。図１に示すデータ解析システムにて行われるデータ解析処理の一手順を示すフローチャートである。低次元の部分空間の分布の一例を示す模式図である。混合グラフの一例を示す模式図である。グラフ遷移の一例を示す模式図である。

符号の説明

１制御部
２通信部
３入力部
４出力部
５記憶部
１０データ圧縮・変換部
１１構造・関係性推定部
１２時系列構造推定部
１３検出・予測部
１３ａ構造変化検出・予測部
１３ｂ関係変化検出・予測部
１００データ解析システム

Claims

複数の時系列データを入力とし、該入力時系列データのそれぞれを、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影して圧縮データを生成するデータ圧縮・変換部と、
前記データ圧縮・変換部で生成した圧縮データについて、前記部分空間上における前記複数の頂点および辺として与えられる変数間の相関構造または相関関係を推定する構造関係推定部と、
前記構造関係推定部で推定した前記相関構造または相関関係の時系列な変化を推定する時系列構造推定部と、
前記時系列構造推定部で推定した前記時系列な変化に基づいて前記相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、前記複数の時系列データに内在する構造または関係性の変化を検出または予測する検出・予測部と、を有する、時系列データ解析システム。
前記構造関係推定部は、前記相関構造または相関関係を属性とする木構造で前記部分空間の分布を表した確率モデルを作成し、
前記時系列構造推定部は、前記構造関係推定部で作成した確率モデルに基づいて前記相関構造または相関関係の出現パターンに関する時系列構造を推定し、
前記検出・予測部は、前記時系列構造推定部で推定した時系列構造の出現確率を計算し、該結果に基づいて、前記複数の時系列データに内在する構造または関係性の変化を検出または予測する、請求項１に記載の時系列データ解析システム。
データ圧縮・変換部が、複数の時系列データのそれぞれを、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影して圧縮データを生成し、
構造関係推定部が、前記データ圧縮・変換部にて生成された圧縮データについて、前記部分空間上における前記複数の頂点および辺として与えられる変数間の相関構造または相関関係を推定し、
時系列構造推定部が、前記構造関係推定部で推定した前記相関構造または相関関係の時系列な変化を推定し、
検出・予測部が、前記時系列構造推定部で推定した前記時系列な変化に基づいて前記相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、前記複数の時系列データに内在する構造または関係性の変化を検出または予測する、時系列データ解析方法。
複数の時系列データのそれぞれを、独立して区別可能な複数の頂点の集合とそれら頂点間を結合する辺の集合とで定義される低次元の部分空間に射影して圧縮データを生成する第１の処理と、
前記第１の処理で生成された圧縮データについて、前記部分空間上における前記複数の頂点および辺として与えられる変数間の相関構造または相関関係を推定する第２の処理と、
前記第２の処理で推定した前記相関構造または相関関係の時系列な変化を推定する第３の処理と、
前記第３の処理で推定した前記時系列な変化に基づいて前記相関構造または相関関係の出現パターンを学習し、該学習結果に基づいて、前記複数の時系列データに内在する構造または関係性の変化を検出または予測する第４の処理と、をコンピュータに実行させるプログラム。