WO2014141344A1

WO2014141344A1 - データ予測装置

Info

Publication number: WO2014141344A1
Application number: PCT/JP2013/007424
Authority: WO
Inventors: 裕志吉田
Original assignee: 日本電気株式会社
Priority date: 2013-03-14
Filing date: 2013-12-18
Publication date: 2014-09-18
Also published as: JP6337881B2; US20160042101A1; JPWO2014141344A1

Abstract

　本発明のデータ予測装置は、時系列データの値を観測するデータ観測手段と、定常状態モデルと非定常状態モデルとを観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定するモデル同定手段と、定常状態モデルと非定常状態モデルとの尤もらしさを表す値である尤度をそれぞれ算出する尤度算出手段と、定常状態モデルと非定常状態モデルとのそれぞれの尤度に基づいて定常状態モデルと非定常状態モデルとの混合比を算出する混合比算出手段と、混合比に従って定常状態モデルと非定常状態モデルとを混合して得られる予測モデルに基づいて時系列データの確率分布を予測する確率分布予測手段と、を備える。

Description

データ予測装置

　本発明は、データ予測装置にかかり、特に、時系列データの値を予測するデータ予測装置に関する。

　クラウドサービスの普及により、インターネット網やモバイルパケット網などの通信ネットワークを介した通信量が増加している。そして、通信ネットワークでは、主にベストエフォート型で通信サービスが提供されるが、クロストラヒックや電波状態によって、単位時間あたりに配信（伝送）されるデータサイズ（データの量）である通信スループットを激しく変動しうる。このため、例えば、サービス事業者側では、通信スループットを予測して事前に対策を行う必要があり、このような通信スループットを予測する通信スループット予測装置が開発されている。

　この種の通信スループット予測装置の１つとして、特許文献１に記載されている予測装置がある。この予測装置では、過去の時系列データから数学モデル（線形・非線形混合モデル）のモデルパラメータを決定し、当該数学モデルに基づいて予測値を算出する。

　また、別の通信スループット予測装置の１つとして、非特許文献１に記載されている通信スループット予測装置がある。この予測装置では、通信スループットの変動過程（定常過程／非定常過程）を判別し、かかる判別履歴に基づいて、定常過程モデルと非定常過程モデルを混合した混合モデルを構築し、当該混合モデルに基づいて未来の通信スループットの確率分布（確率密度関数）を算出し、かかる確率密度関数から未来の通信スループットの確率的な広がり（確率的拡散）を算出する。

特開２０１２－１２２８５号公報

吉田裕志，里田浩三，「アプリケーションレベルでのＴＣＰスループットの定常性解析と予測モデル構築」，信学技報，ｖｏｌ．１１２，ｎｏ．３５２，ＩＮ２０１２－１２８，ｐｐ．３９－４４，２０１２年１２月．

　ところで、ＴＣＰ／ＩＰ（Ｔｒａｎｓｍｉｓｓｉｏｎ　Ｃｏｎｔｒｏｌ　Ｐｒｏｔｏｃｏｌ／Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）に従った通信に係る通信スループットは、様々な要因（例えば，Ｅｎｄ－ｔｏ－Ｅｎｄ遅延、パケットロス、クロストラヒック、及び無線通信における電波強度等）が複雑に作用することによって、時々刻々変動する。

　このような状況に対して、上記特許文献１では、過去の時系列データから数学モデル（線形・非線形混合モデル）のモデルパラメータを決定し、当該数学モデルに基づいて予測値を算出する。また、上記非特許文献１では、上述のように時々刻々変動する通信スループットの変動過程（定常過程／非定常過程）を、観測された過去の通信スループットの時系列データに基づいて判別し、観測された過去の通信スループットの時系列データ及び判別履歴に基づいて定常過程モデルと非定常過程モデルを混合した混合モデルを構築し、当該混合モデルに基づいて未来の通信スループットの確率分布（確率密度関数）を予測することができる。

　しかしながら、上記のいずれの予測技術も、予測モデルとして漸化式（差分方程式）で記述された時系列モデルを用いている。このため、観測された過去の通信スループットの時系列データの各点の時間間隔が等間隔でなければ、正確に予測モデルを構築できない、という問題がある。従って、通信スループットの過去の時系列データが不等間隔であった場合には、正確に未来の通信スループットを予測することができない。また、かかる問題は、通信スループットの予測に限らず、あらゆる時系列データの値を予測する場合も同様に生じる。

　このため、本発明の目的は、上述した課題である、時系列データの値の予測を高精度に行うことができない、という問題を解決することにある。

　本発明の一形態であるデータ予測装置は、
　時系列データの値を観測するデータ観測手段と、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定するモデル同定手段と、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出する尤度算出手段と、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出する混合比算出手段と、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する確率分布予測手段と、
を備えた、
という構成をとる。

　また、本発明の他の形態であるプログラムは、
　情報処理装置に、
　時系列データの値を観測するデータ観測手段と、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定するモデル同定手段と、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出する尤度算出手段と、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出する混合比算出手段と、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する確率分布予測手段と、
を実現させるためのプログラムである。

　また、本発明の他の形態であるデータ予測方法は、
　時系列データの値を観測し、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定し、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出し、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出し、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する、
という構成をとる。

　本発明は、以上のように構成されることにより、時系列データの値を高精度に予測することができる。

本発明の実施形態１におけるデータ予測装置の構成を示す機能ブロック図である。図１に開示した尤度比検定部において仮説検定に用いる帰無分布（累積分布関数）のグラフである。図１に開示したデータ予測装置で予測した未来のデータの確率分布の模式図である。本発明の実施形態１におけるデータ予測装置におけるデータ予測精度と、他の技術におけるデータ予測精度と、を比較したグラフである。本発明の付記１におけるデータ予測装置の構成を示すブロック図である。

　＜実施形態１＞
　本発明の第１の実施形態を、図１乃至図４を参照して説明する。図１は、データ予測装置の構成を示す機能ブロック図である。図２は、データ予測装置で使用する情報を示すグラフである。図３は、予測するデータの確率分布を示す模式図である。図４は、本実施形態におけるデータ予測精度と他の技術におけるデータ予測精度とを比較したグラフである。

　本発明におけるデータ予測装置１は、演算装置と記憶装置とを備えた一般的な情報処理装置である。そして、データ予測装置１は、図１に示すように、演算装置にプログラムが組み込まれることで構築された、データ観測部１１、定常確率微分方程式モデル同定部１２、非定常確率微分方程式モデル同定部１３、尤度算出部１４、尤度比検定部１５、混合比算出部１６、確率分布予測部１７、を備えている。以下、各構成及びその動作について説明する。

　［データ観測部１１］
　データ観測部１１（データ観測手段）は、対象となる時系列データ｛ｘ_ｔ｝を観測する。時系列データとは、時間経過によって変動する確率変数の観測されたデータ列のことである。例えば、対象となる時系列データが通信スループットであって、時刻ｔ＝０［秒］，ｔ＝１．５［秒］、ｔ＝４．１［秒］に、それぞれｘ＝５［Ｍｂｐｓ］、ｘ＝３［Ｍｂｐｓ］、ｘ＝７［Ｍｂｐｓ］、という数値が観測された場合、観測された時系列データは、｛ｘ_０＝５，ｘ_１．５＝３，ｘ_４．１＝７｝となる。なお、データ予測装置において対象となる時系列データは、通信スループットであることに限定されず、いかなる時系列データであってもよい。

　ここで、従来のデータ予測装置においては、観測された時系列データの隣接するデータ間の時間間隔が等間隔である必要があった。しかしながら、本発明におけるデータ予測装置は、上述の例のように隣接するデータ間の時間間隔が不等であってもよい。このことは、後述するように、所定の時間におけるデータのモデルを、確率微分方程式モデルで同定していることによる。

　［定常確率微分方程式モデル同定部１２］
　定常確率微分方程式モデル同定部１２（モデル同定手段）は、上述したデータ観測部１１で観測された時系列データに基づいて、当該時系列データの変動過程が定常過程である場合における時系列データを表す確率微分方程式モデル（定常確率微分方程式モデル（定常状態モデル））を同定する。

　ここで、本実施形態では、時系列データを表す確率微分方程式モデルとして、数１で記述される確率微分方程式モデルを用いる。

　上記ｘ_ｔは、対象とする確率変数を示す。また、上記ａ，ｂは実定数、σは正の定数、Ｂ_ｔは標準ブラウン運動、である。数１は、上述した非特許文献１の漸化式（差分方程式）で記述された時系列モデルに対して、差分を微分に置き換えた確率微分方程式モデルである。このように、時系列モデルの時間間隔を無限小に近づけることで、観測された時系列データが不等であっても、より正確なデータ予測値を得ることができる。

　数１で表された確率微分方程式モデルは、実定数ａが、ａ＞０のとき定常過程となり、ａ≦０のとき、非定常過程となることが知られている。このため、定常確率微分方程式モデル同定部１２は、数１においてａ＞０の定常確率微分方程式モデルを同定する。これは、数１の定常確率微分方程式モデルのパラメータであるａ，ｂ，σを推定することに等しい。以下，定常確率微分方程式モデルの同定方法について詳細に説明する。

　数１で表される確率微分方程式モデルは、Ｏｒｎｓｔｅｉｎ－Ｕｈｌｅｎｂｅｃｋ過程と呼ばれる確率過程であり、特に、ａ，ｂ，σが定数であるとき、Ｖａｓｉｃｅｋモデルと呼ばれ、一般解が得られている。時刻ｓでｘ_ｓが観測された時、その後の時刻ｔ（＞ｓ）におけるｘ_ｔの一般解は、数２で表される。

　数２の一般解から、同じく時刻ｓでｘ_ｓが観測された時、その後の時刻ｔ（＞ｓ）におけるｘ_ｔの条件付き期待値及び条件付き分散は、それぞれ数３、数４で計算される。

　Ｏｒｎｓｔｅｉｎ－Ｕｈｌｅｎｂｅｃｋ過程は、ガウス過程のクラスであるから、数２で表される一般解の各時刻における確率分布はガウス分布になる。したがって、数３のＥ［ｘ_ｔ｜ｘ_ｓ］及び数４のＶ［ｘ_ｔ｜ｘ_ｓ］を、改めてμ_ｔ，ｓ及びσ^２ _ｔ，ｓとおくと、時刻ｓでｘ_ｓが観測された時、その後の時刻ｔ（＞ｓ）におけるｘ_ｔの条件付き確率密度関数は数５で表される。

　上述したとおり、定常確率微分方程式モデル同定部１２は、モデルパラメータであるａ，ｂ，σを推定することを目的とする。本実施形態では、最尤推定法を用いて上記モデルパラメータａ，ｂ，σを推定する方法について説明する。

　まず、ｎ個の過去の時系列データ｛ｘ_ｔ１，ｘ_ｔ２，…，ｘ_ｔｎ｝（ｔ_１＜ｔ_２＜…＜ｔ_ｎ）が観測されたとする。隣接するデータ間の時間間隔ｔ_ｉ＋１－ｔ_ｉ（ｉ＝１，２，…，ｎ－１）は不等でもよい。定常確率微分方程式モデルの一般解の条件付き確率密度関数は、数５で表されるため、上記ｎ個の過去の時系列データが観測されたときの尤度関数Ｌは、数６のようになる。

　上記数６におけるμ_{ｔｉ，ｔｉ－１}及びσ_{ｔｉ，ｔｉ－１}は、それぞれ数３及び数４で表されるとおりａ，ｂ，σの関数であるため、尤度関数Ｌもａ，ｂ，σの関数である。最尤推定法では、この尤度関数Ｌを最大にするａ，ｂ，σを求める。

　しかしながら、解析的には尤度関数Ｌを最大にするａ，ｂ，σを求めることは困難であるため、本実施形態では数値的に尤度関数Ｌを最大にするａ，ｂ，σを求める方法について説明する。

　まず，数６の尤度関数Ｌの対数ｌｎＬを求めると、数７のようになる。ただし、Δｔ_ｉ＝ｔ_ｉ－ｔ_ｉ－１とおいた。

　尤度関数Ｌを最大にすることと、尤度関数Ｌの対数であるｌｎＬを最大にすることとは等しい。数７の右辺第一項は、ａ，ｂ，σに無関係な項であるため、第二項と第三項の和を最大化すればよい。

　ここで，数７の右辺第二項及び第三項それぞれについて、「－１／２」を除いた関数を数８及び数９で定義する。

　結局，尤度関数Ｌを最大することは、上記Ｆ＋Ｇを最小にすることに等しい。Ｆ＋Ｇを最小にするａ，ｂ，σを算出する方法として、本実施形態では準ニュートン法を用いる。具体的な準ニュートンの処理ステップは、以下のとおりである。

（準備）θ＝［ａ　ｂ　σ］^Ｔ　（Ｔは転置を表す）とおく。
（ステップ０）適当な初期値θ０を与え，初期Ｂ０は３×３の単位行列とする。
（ステップ１）数１０で表される連立一次方程式を解いて探索方向ベクトルｄを求める。

ただし、∇（Ｆ＋Ｇ）は数１１で定義される。

（ステップ２）以下のステップ２．１からステップ２．４で示したＡｒｍｉｊｏ条件に従って探索のステップ幅を求める。
（ステップ２．１）β_ｋ，０＝１，ｉ＝０，０＜ξ＜１，０＜τ＜１とおく。
（ステップ２．２）数１２で表されるＡｒｍｉｊｏ条件を満足するならステップ２．４へ。それ以外は２．３へ。

（ステップ２．３）β_{ｋ，ｉ＋１}＝τβ_ｋ，ｉ，ｉ：＝ｉ＋１とおいてステップ２．２へ戻る。
（ステップ２．４）α_ｋ＝β_ｋ，ｉとおく。
（ステップ３）数１３でθを更新する。

（ステップ４）停止条件が満足されれば終了。それ以外はステップ５へ。停止条件としては、数１４や数１５がある。

（ステップ５）数１６及び数１７を計算する。

（ステップ６）数１８（ＢＦＧＳ公式）を用いて、行列Ｂ_ｋを更新する。

（ステップ７）ｋ：＝ｋ＋１とおいてステップ１に戻る。

　以上のステップ１からステップ７を実施することで、Ｆ＋Ｇを最小にするθ＝［ａ　ｂ　σ］^Ｔを算出することができる．

　上記の準ニュートン法では、ステップ２において探索のステップ幅を求めるのにＡｒｍｉｊｏ条件を用いたが、Ｗｏｌｆｅ条件を用いても良い。また、ＢＦＧＳ公式の行列Ｂ_ｋの代わりに、Ｂｋの逆行列Ｈ_ｋに基づいて計算するＨ公式を用いても良い。

　［非定常確率微分方程式モデル同定部１３］
　非定常確率微分方程式モデル同定部１３（モデル同定手段）は、上述したデータ観測部１１で観測された時系列データに基づいて、当該時系列データの変動過程が非定常過程である場合における時系列データを表す確率微分方程式モデルである非定常確率微分方程式モデル（非定常状態モデル））を同定する。つまり、非定常確率微分方程式モデルのモデルパラメータを推定する。

　ここで、上述したとおり、時系列データのモデルのベースとなる確率微分方程式は、数１であり、この確率微分方程式が非定常となるのは、ａ≦０のときである。しかし、ａ＜０の領域は、急速に無限大に発散する過程となるため、ほとんどの有界な時系列データの予測には不適である。そのため、非定常確率微分方程式モデルとしては、ａ＝０のときのみを考えれば良い。このとき、非定常確率微分方程式モデルは数１９のようになる。

　数１９の確率微分方程式モデルは、ブラウン運動モデルに等しく、モデルパラメータはσの一つだけである。そのため、非定常確率微分方程式モデルを同定するためには、σを推定すればよい。ここでも、定常確率微分方程式モデル同定部１２と同様に、最尤推定法を用いてσを推定する。なお、数１９の非定常確率微分方程式モデルの一般解は、数２０である。

　時刻ｓでｘ_ｓが観測された後の時刻ｔ（＞ｓ）におけるｘ_ｔの条件付き期待、条件付き分散、条件付き確率密度関数は、数２１，２２，２３のようになる。

　このとき，ｎ個の過去の時系列データ｛ｘ_ｔ１，ｘ_ｔ２，…，ｘ_ｔｎ｝（ｔ_１＜ｔ_２＜…＜ｔ_ｎ）が観測されたときの尤度関数Ｌは、数２４のようになる。ただし、Δｔ_ｉ＝ｔ_ｉ－ｔ_ｉ－１とおいた。

　数２４の尤度関数Ｌの対数ｌｎＬを最大化するσを算出する。当該σは、解析的に求まり、数２５のようになる。

　［尤度算出部１４］
　尤度算出部１４（尤度算出手段）は、上記定常確率微分方程式モデル同定部１２及び上記非定常確率微分方程式モデル同定部１３で同定した各確率微分方程式モデルの尤もらしさを表す値である尤度を、観測された時系列データに基づいてそれぞれ算出する。定常確率微分方程式モデルの尤度は数６、非定常確率微分方程式モデルの尤度は数２４、に基づいてそれぞれ計算することで得られる。

　［尤度比検定部１５］
　尤度比検定部１５（検定手段）は、上記尤度算出部１４で算出した定常確率微分方程式モデルの尤度と、非定常確率微分方程式モデルの尤度と、の比に基づいて、観測された時系列データが、定常確率微分方程式モデルに適合するか非定常確率微分方程式モデルに適合するか仮説検定にかける。

　本実施形態では、「観測された時系列データは、非定常確率微分方程式モデルから生成されたデータである」という仮説を、帰無仮説において検定する。このとき、対立仮説は、「観測された時系列データは定常確率微分方程式モデルから生成されたデータである」となる。

　具体的に、本実施形態では、以下で定義する尤度比Λ（数２６）の対数に－２をかけたＲ（数２７）を検定に用いる、ただし、Ｌ_ｓは、定常確率微分方程式モデルの尤度（数６）であり、ｓｕｐ｛Ｌ_ｓ｝は、その上限である。また、Ｌ_ｎは、非定常確率微分方程式モデルの尤度（数２４）であり、ｓｕｐ｛Ｌ_ｎ｝は、その上限である。

　ｓｕｐ｛Ｌ_ｓ｝及びｓｕｐ｛Ｌ_ｎ｝は、それぞれ尤度比検定部１５で算出した尤度を用いればよい。なぜなら、尤度比検定部１５で算出した尤度は、各尤度関数（数６と数２４）を最大にするモデルパラメータに基づいて算出される尤度であり、当該尤度は上限と考えてよいからである。

　定常確率微分方程式モデルの尤度の上限ｓｕｐ｛Ｌ_ｓ｝は、必ず非定常確率微分方程式モデルの尤度の上限ｓｕｐ｛Ｌ_ｎ｝以上の値となる（ｓｕｐ｛Ｌ_ｓ｝≧ｓｕｐ｛Ｌ_ｎ｝）。これは、定常確率微分方程式モデルのモデルパラメータが３つ（ａとｂとσ）であるのに対し、非定常確率微分方程式モデルのモデルパラメータは１つ（σのみ）だからである。従って、数２８のように、統計量Ｒは非負の実数となる。

　尤度比検定では、帰無仮説（非定常確率微分方程式モデルであるという仮説）が誤りの場合には、定常確率微分方程式モデルの尤度ｓｕｐ｛Ｌ_ｓ｝が非定常確率微分方程式モデルの尤度ｓｕｐ｛Ｌ_ｎ｝に比べて大きくなり、その結果、統計量Ｒの値が大きくなることを利用し、統計量Ｒが所定の値よりも大きくなれば、帰無仮説を棄却して対立仮説（定常確率微分方程式モデルであるという仮説）を採択する。一方、統計量Ｒが所定の値以下になれば、帰無仮説は棄却できずに容認することになる。

　帰無仮説を棄却するか否かの閾値は、帰無仮説が正しい場合の統計量Ｒの分布（これは帰無分布と呼ばれる）と所定の有意水準によって定まる。帰無分布を解析的に求めることは困難であるため、本実施形態では、モンテカルロ・シミュレーションにて求めた分布を用いる。図２に、モンテカルロ・シミュレーションで求めた帰無分布（累積分布関数）を示す。上記帰無分布は、帰無仮説（非定常確率微分方程式モデル）の下で１００点の時系列データを生成して統計量Ｒを算出するという試行を３００万回繰り返して得られた分布である。有意水準０．１の場合はＲ＞７．６、有意水準０．０５の場合はＲ＞９．２、有意水準０．０１の場合はＲ＞１２．８、で帰無仮説を棄却できる。

　尤度比検定部１５は、予め上記帰無分布と有意水準、もしくは帰無分布と有意水準に基づいて得られた閾値（例えば有意水準０．１とき閾値は７．６）を用意しておき、観測された時系列データから数２６，数２７に基づいて統計量Ｒを計算し、当該統計量Ｒと上記閾値に基づいて、定常確率微分方程式モデルであるという仮説を採択するか、非定常確率微分方程式モデルであるという仮定を容認する。

　［混合比算出部１６］
　混合比算出部１６（混合比算出手段）、上記尤度比検定部１５の検定結果の履歴に基づいて、定常確率微分方程式モデル同定部１２で同定した定常確率微分方程式モデルと、上記非定常確率微分方程式モデル同定部１３で同定した非定常確率微分方程式モデルと、を混合する割合を表す混合比を算出する。

　上記尤度比検定部１５にて検定した結果、定常確率微分方程式モデルであることが採択された場合に「０」、非定常確率微分方程式モデルが容認された場合に「１」、をとるような確率変数ｕ_ｔを定義する（数２９）。

　本実施形態では、数３０のように、上記ｕ_ｔの指数荷重移動平均λ_ｔを混合比に採用する。ただし、γは指数荷重移動の平滑化係数であり、０≦γ≦１である。

　得られた混合比λ_ｔに基づいて、定常確率微分方程式モデルと非定常確率微分方程式モデルとを混合する。数２９の定義より、非定常確率微分方程式モデルの割合がλ_ｔに一致する。

　［確率分布予測部１７］
　確率分布予測部１７（確率分布予測手段）は、上記混合比算出部１６で算出した混合比と、当該混合比に基づいて定常確率微分方程式モデル同定部１２で同定した定常確率微分方程式モデルと、非定常確率微分方程式モデル同定部１３で同定した非定常確率微分方程式モデルとから、未来のデータの確率分布を予測する。

　数５で表される定常確率微分方程式モデルにおける確率変数の確率密度関数を改めてｆ（ｘ_ｔ）とおき、数２３で表される非定常確率微分方程式モデルにおける確率変数の確率密度関数を改めてｇ（ｘ_ｔ）とおく。すると、上記混合比算出部１６で算出した混合比λ_ｔに基づいて、混合したモデルにおける確率変数ｘ_ｔの確率密度関数ｈ（ｘ_ｔ）は、数３１で表され、これが未来のデータの確率分布である。

　数３１は二つの正規分布が混合された混合正規分布であり、期待値Ｅ_ｍｉｘ［ｘ_ｔ］及び分散Ｖ_ｍｉｘ［ｘ_ｔ］は、数３２，数３３のように計算される。ただし、Ｅ_ｓ［ｘ_ｔ］及びＶ_ｓ［ｘ_ｔ］は、定常確率微分方程式モデルにおけるｘ_ｔの期待値及び分散であり、Ｅ_ｎ［ｘ_ｔ］及びＶ_ｎ［ｘ_ｔ］は、非定常確率微分方程式モデルにおけるｘ_ｔの期待値及び分散である。

　［発明の効果］
　ここで、未来のデータの値を予測する場合、未来のデータが確率的にどの程度の幅に存在するかという目安が分かれば便利なことがある。この確率的な変動幅を確率的拡散と呼び、数３４で定義する。

　数３４で表される確率的拡散は、期待値から標準偏差の定数倍（α倍）だけ加減した値である。図３は、当該予測モデルの確率密度関数、期待値、確率的拡散を示した模式図である。確率的拡散は、時間経過に従って広がっており、これは時間経過に伴うデータの予測値の不確かさを表す。確率的拡散は、非定常確率微分方程式モデルの割合が高いほど広がりが大きくなり、定常確率微分方程式モデルの割合が高いほど広がりは小さくなる。

　上記確率的拡散の予測精度について、本発明の実施形態の確率微分方程式モデルでの予測方法にて予測した確率的拡散と、従来技術である時系列モデル（漸化式）で予測した確率的拡散との予測精度を、図４に示した。実際のデータ値のばらつきのヒストグラムから拡散値を求め、予測した確率的拡散との誤差（％）を１００％から減じた値を予測値とした。予測対象のデータはモバイルネットワークにおける通信スループットの時系列データであり、各データの時間間隔は平均２秒の指数分布に従う不等間隔時系列データである。確率微分方程式モデルでの予測方法の方が、予測精度が高くなっていることがわかる。

　＜付記＞
　上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明におけるデータ予測装置（図５参照）、プログラム、データ予測方法の構成の概略を説明する。但し、本発明は、以下の構成に限定されない。

（付記１）
　時系列データの値を観測するデータ観測手段１０１と、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定するモデル同定手段１０２と、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出する尤度算出手段１０３と、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出する混合比算出手段１０４と、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する確率分布予測手段１０５と、
を備えたデータ予測装置１００。

（付記２）
　付記１に記載のデータ予測装置であって、
　前記モデル同定手段は、前記定常状態モデルと前記非定常状態モデルとをそれぞれ異なる確率微分方程式モデルで同定する、
データ予測装置。

（付記３）
　付記１又は２に記載のデータ予測装置であって、
　前記モデル同定手段は、前記定常状態モデルをＶａｓｉｃｅｋモデルで同定し、前記定常状態モデルをブラウン運動モデルで同定する、
データ予測装置。

（付記４）
　付記１乃至３のいずれかに記載のデータ予測装置であって、
　前記定常状態モデルの前記尤度と前記非定常状態モデルの前記尤度との比に基づいて、観測された時系列データが前記定常状態モデルと前記非定常状態モデルとのいずれに適合するかを検定する検定手段を備え、
　前記混合比算出手段は、前記検定の結果に基づいて前記定常状態モデルと前記非定常状態モデルとの前記混合比を算出する、
データ予測装置。

（付記５）
　付記４に記載のデータ予測装置であって、
　前記検定手段は、観測された時系列データが前記非定常状態モデルに適合することを帰無仮説とし、観測された時系列データが前記定常状態モデルに適合することを対立仮説とする仮説検定を行う、
データ予測装置。

（付記６）
　付記４又は５に記載のデータ予測装置であって、
　前記混合比算出手段は、前記検定の結果、前記定常状態モデルに適合した場合に「０」となり、前記非定常状態モデルに適合した場合に「１」となる変数を設定し、当該変数を平滑化した値を前記混合比として算出する、
データ予測装置。

（付記７）
　情報処理装置に、
　時系列データの値を観測するデータ観測手段と、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定するモデル同定手段と、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出する尤度算出手段と、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出する混合比算出手段と、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する確率分布予測手段と、
を実現させるためのプログラム。

（付記８）
　付記７に記載のプログラムであって、
　前記モデル同定手段は、前記定常状態モデルをＶａｓｉｃｅｋモデルで同定し、前記定常状態モデルをブラウン運動モデルで同定する、
プログラム。

（付記９）
　時系列データの値を観測し、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定し、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出し、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出し、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する、
データ予測方法装置。

（付記１０）
　付記９に記載のデータ予測方法であって、
　前記定常状態モデルをＶａｓｉｃｅｋモデルで同定し、前記定常状態モデルをブラウン運動モデルで同定する、
データ予測方法。

　なお、上述したプログラムは、記憶装置に記憶されていたり、コンピュータが読み取り可能な記録媒体に記録されている。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。

　以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。

　なお、本発明は、日本国にて２０１３年３月１４日に特許出願された特願２０１３－０５１２０５の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。

１　データ予測装置
１１　データ観測部
１２　定常確率微分方程式モデル同定部
１３　非定常確率微分方程式モデル同定部
１４　尤度算出部
１５　尤度比検定部
１６　混合比算出部
１７　確率分布予測部
１００　データ予測装置
１０１　データ観測手段
１０２　モデル同定手段
１０３　尤度算出手段
１０４　混合比算出手段
１０５　確率分布予測手段

Claims

　時系列データの値を観測するデータ観測手段と、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定するモデル同定手段と、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出する尤度算出手段と、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出する混合比算出手段と、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する確率分布予測手段と、
を備えたデータ予測装置。
　請求項１に記載のデータ予測装置であって、
　前記モデル同定手段は、前記定常状態モデルと前記非定常状態モデルとをそれぞれ異なる確率微分方程式モデルで同定する、
データ予測装置。
　請求項１又は２に記載のデータ予測装置であって、
　前記モデル同定手段は、前記定常状態モデルをＶａｓｉｃｅｋモデルで同定し、前記定常状態モデルをブラウン運動モデルで同定する、
データ予測装置。
　請求項１乃至３のいずれかに記載のデータ予測装置であって、
　前記定常状態モデルの前記尤度と前記非定常状態モデルの前記尤度との比に基づいて、観測された時系列データが前記定常状態モデルと前記非定常状態モデルとのいずれに適合するかを検定する検定手段を備え、
　前記混合比算出手段は、前記検定の結果に基づいて前記定常状態モデルと前記非定常状態モデルとの前記混合比を算出する、
データ予測装置。
　請求項４に記載のデータ予測装置であって、
　前記検定手段は、観測された時系列データが前記非定常状態モデルに適合することを帰無仮説とし、観測された時系列データが前記定常状態モデルに適合することを対立仮説とする仮説検定を行う、
データ予測装置。
　請求項４又は５に記載のデータ予測装置であって、
　前記混合比算出手段は、前記検定の結果、前記定常状態モデルに適合した場合に「０」となり、前記非定常状態モデルに適合した場合に「１」となる変数を設定し、当該変数を平滑化した値を前記混合比として算出する、
データ予測装置。
　情報処理装置に、
　時系列データの値を観測するデータ観測手段と、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定するモデル同定手段と、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出する尤度算出手段と、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出する混合比算出手段と、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する確率分布予測手段と、
を実現させるためのプログラム。
　請求項７に記載のプログラムであって、
　前記モデル同定手段は、前記定常状態モデルをＶａｓｉｃｅｋモデルで同定し、前記定常状態モデルをブラウン運動モデルで同定する、
プログラム。
　時系列データの値を観測し、
　時系列データの変動過程が定常過程である場合における当該時系列データを表す定常状態モデルと、時系列データの変動過程が非定常過程である場合における当該時系列データを表す非定常状態モデルとを、観測された過去の時系列データに基づいてそれぞれ確率微分方程式モデルで同定し、
　前記定常状態モデルと前記非定常状態モデルとの尤もらしさを表す値である尤度を、観測された過去の時系列データに基づいてそれぞれ算出し、
　前記定常状態モデルと前記非定常状態モデルとのそれぞれの前記尤度に基づいて、前記定常状態モデルと前記非定常状態モデルとの混合比を算出し、
　前記混合比に従って前記定常状態モデルと前記非定常状態モデルとを混合して得られる予測モデルに基づいて、時系列データの確率分布を予測する、
データ予測方法装置。
　請求項９に記載のデータ予測方法であって、
　前記定常状態モデルをＶａｓｉｃｅｋモデルで同定し、前記定常状態モデルをブラウン運動モデルで同定する、
データ予測方法。