JP2017151497A - 時系列モデルパラメータの推定方法 - Google Patents
時系列モデルパラメータの推定方法 Download PDFInfo
- Publication number
- JP2017151497A JP2017151497A JP2016030599A JP2016030599A JP2017151497A JP 2017151497 A JP2017151497 A JP 2017151497A JP 2016030599 A JP2016030599 A JP 2016030599A JP 2016030599 A JP2016030599 A JP 2016030599A JP 2017151497 A JP2017151497 A JP 2017151497A
- Authority
- JP
- Japan
- Prior art keywords
- data
- time
- series
- difference
- time series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Complex Calculations (AREA)
Abstract
【課題】単位時間に対して取得されていないデータを有する時系列データであっても、時系列モデルパラメータの推定ができる時系列モデルパラメータの推定方法を提供する。【解決手段】時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎の当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、これらの時系列データに共通する最小単位時間に基づいて、時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、差分毎に、当該差分を求めたときのデータと一つ前に取得されたデータとの最小単位時間に基づく時間間隔、及び、複数系列のうち、異なる2つの系列毎の差分の重複する最小単位時間に基づく時間間隔により、差分時系列データの尤度関数を決定し、この尤度関数の値を最大化する平均及び分散共分散行列を求める。【選択図】図4
Description
本発明は、時系列モデルパラメータの推定方法に関する。
多次元時系列データ(系列数=n、時間数=T)から時系列モデルパラメータを推定する手法については、欠損が無いケースでは、広く知られている時系列分析手法(Auto Regressive Integrated Moving Average モデル)がある(例えば、特許文献1参照)。この手法は、時系列データの差分(系列数=n、時間数=T−1)が多変量正規分布に従うことにより、標本である差分データから多変量正規分布の母数(平均、分散、共分散)を推定するものである。具体的には、
1.n次元データが多変量正規分布に従うことから尤度を計算
2.時間毎のn次元データが独立で同一な分布に従うことから、時間毎に計算された(T−1)個の尤度の積を計算
3.この積を最大化するような多変量正規分布の母数(平均、分散、共分散)を計算し、推定値とする
の手順を経る。平均、分散、共分散の推定値は、それぞれ標本平均、標本分散、標本共分散に一致し、数式で表せることがわかっている。標本平均がドリフト項、標本分散及び標本共分散が拡散項を表すパラメータの推定値となる。
1.n次元データが多変量正規分布に従うことから尤度を計算
2.時間毎のn次元データが独立で同一な分布に従うことから、時間毎に計算された(T−1)個の尤度の積を計算
3.この積を最大化するような多変量正規分布の母数(平均、分散、共分散)を計算し、推定値とする
の手順を経る。平均、分散、共分散の推定値は、それぞれ標本平均、標本分散、標本共分散に一致し、数式で表せることがわかっている。標本平均がドリフト項、標本分散及び標本共分散が拡散項を表すパラメータの推定値となる。
多次元時系列データに欠損がないときは上述した方法によりパラメータの推定値を求めることができるが、実際のデータには、系列毎に様々な欠損が発生する場合や、サンプリング間隔が系列毎やサンプリング毎に異なる場合がある。このような場合、各系列で存在するデータの時間が不揃いとなり、n個のデータの組みの間だけの相関を考慮すればよいという仮定が成立しないため、欠損を伴う(T−1)個のn次元データから多変量正規分布の母数の推定に上述した1〜3の従来技術の手順をそのまま適用することができないという課題があった。なお、以降の説明において、サンプリング間隔が異なる場合であって、最小単位時間で計測した場合に、データが存在しない場合も「欠損」と呼ぶこととする。
本発明はこのような課題に鑑みてなされたものであり、欠損を伴う多次元時系列データであっても、時系列モデルパラメータの推定ができる時系列モデルパラメータ推定方法を提供することを目的とする。
前記課題を解決するために、第1の本発明に係る時系列モデルパラメータの推定方法は、時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、前記複数系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記時系列データの差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記差分時系列データの尤度関数を決定し、前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求めることを特徴とする。
また、第2の本発明に係る時系列モデルパラメータの推定方法は、時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、前記複数系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記時系列データの差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記差分時系列データの尤度関数を決定するステップと、前記複数系列の時系列データにおいて、前記最小単位時間で前記データが取得されたと仮定したときと、取得された前記時系列データとを比較して、前記データが取得されていない欠損部分にデータを補填して、前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求めるステップと、を有することを特徴とする。
また、第3の本発明に係る時系列モデルパラメータの推定方法は、時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、前記複数系列のうち、一部の系列の差分時系列データを取り出し、前記一部の系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記差分時系列データの前記差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記一部の系列の尤度関数を決定し、当該尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第1のステップと、前記複数の系列のうち、残りの未知の平均、分散共分散行列の要素が1つ以上含まれるように、一部の系列の差分時系列データを前記第1のステップと同様に取り出し、前記第1のステップで取得された前記平均及び前記分散共分散行列を既知として尤度関数を決定し、当該尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第2のステップと、を有し、全ての系列の差分時系列データに対する平均及び分散共分散行列が求まるまで、前記第2のステップを繰り返すことを特徴とする。
また、第4の本発明に係る時系列モデルパラメータの推定方法は、時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、前記複数系列のうち、一部の系列の差分時系列データを取り出し、前記一部の系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記差分時系列データの前記差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記一部の系列の尤度関数を決定し、前記一部の系列の時系列データにおいて、前記最小単位時間で前記データが取得されたと仮定したときと、取得された前記時系列データとを比較して、前記データが取得されていない欠損部分にデータを補填して、前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第1のステップと、前記複数の系列のうち、残りの未知の平均、分散共分散行列の要素が1つ以上含まれるように、一部の系列の差分時系列データを前記第1のステップと同様に取り出し、前記第1のステップで取得された前記平均及び前記分散共分散行列を既知として尤度関数を決定し、前記残りの系列の一部の系列の時系列データにおいて、前記最小単位時間で前記データが取得されたと仮定したときと、取得された前記時系列データとを比較して、前記データが取得されていない欠損部分にデータを補填して、前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第2のステップと、を有し、全ての系列の差分時系列データに対する平均及び分散共分散行列が求まるまで、前記第2のステップを繰り返すことを特徴とする。
本発明に係る時系列モデルパラメータの推定方法を以上のように構成すると、単位時間に対して取得されていないデータを有する多次元時系列データであっても、時系列モデルパラメータの推定ができる。
以下、本発明の好ましい実施形態について図面を参照して説明する。
1.時系列データ{yi,t}の定義
まず、系列n、時間数Tとするときの時系列データを{yi,t}(i=1〜n、t=1〜T)とすると、この時系列データ{yi,t}の隣接するデータ同士の差分データ(差分時系列データ)である{xi,t}(i=1〜n、t=1〜(T−1))を、xi,t=yi,(t+1)−yi,tと定義する。ここで、tは最小単位時間に基づいて振り出されている。時系列データが、対数を取るなど所定の変換をした結果として「拡散項が正規分布に従うドリフト(定数)項付きランダムウォークモデル」に従う場合には、以下に示す式(1)が成立する。ここで、xは差分時系列データであり、Nは正規分布であり、μは平均であり、Σは分散共分散行列である。
まず、系列n、時間数Tとするときの時系列データを{yi,t}(i=1〜n、t=1〜T)とすると、この時系列データ{yi,t}の隣接するデータ同士の差分データ(差分時系列データ)である{xi,t}(i=1〜n、t=1〜(T−1))を、xi,t=yi,(t+1)−yi,tと定義する。ここで、tは最小単位時間に基づいて振り出されている。時系列データが、対数を取るなど所定の変換をした結果として「拡散項が正規分布に従うドリフト(定数)項付きランダムウォークモデル」に従う場合には、以下に示す式(1)が成立する。ここで、xは差分時系列データであり、Nは正規分布であり、μは平均であり、Σは分散共分散行列である。
このような差分時系列データから、全てのi,j,t,uに対して、平均E、分散V及び共分散Covについては、以下に示す式(2)〜(5)が成立する。なお、jはiとは異なる系列(i≠j)を示している。
2.欠損データがある場合について
次に、i番目(i=1〜n)のデータの一部に欠損があるときの差分時系列データについて説明する。図1は、yi,t(s)とyi,t(s+1)の間のデータが欠損している場合を示している。ここで、sは非欠損データだけを並べた際に、何番目であるかを示し、t(s)はsの関数でs番目の時刻を表している。例えば、この図1においては、yi,t(s)の次にyi,t(s+1)が取得できたことを示している。このとき、欠損データ間の差分データは取得することができず、yi,t(s)とyi,t(s+1)の差分データ(xi,s *とする)だけを取得することができる。すなわち、欠損データがあるときの差分時系列データ(xi,s *)は、以下に示す式(6)で表される。
次に、i番目(i=1〜n)のデータの一部に欠損があるときの差分時系列データについて説明する。図1は、yi,t(s)とyi,t(s+1)の間のデータが欠損している場合を示している。ここで、sは非欠損データだけを並べた際に、何番目であるかを示し、t(s)はsの関数でs番目の時刻を表している。例えば、この図1においては、yi,t(s)の次にyi,t(s+1)が取得できたことを示している。このとき、欠損データ間の差分データは取得することができず、yi,t(s)とyi,t(s+1)の差分データ(xi,s *とする)だけを取得することができる。すなわち、欠損データがあるときの差分時系列データ(xi,s *)は、以下に示す式(6)で表される。
ここで、式(7)に示すように、差分データの和の期待値Eは、各々の差分データの期待値の和で表され、また、差分データの和の分散Vは、各々の差分データの和とそれらの差分データの共分散で表される。上述した式(2)〜(5)の性質を用いると、以下に示す式(7)、(8)が成立する。
この式(7)、(8)の関係より、上述した式(6)で表される差分時系列データの平均E及び分散Vはそれぞれ、式(9)、(10)で表される。
また、欠損を伴う2つの時系列データにおいて、差分時系列データの共分散は、以下に示す式(11)で表される。ここで、2つの時系列データをi,jとし、非欠損データの順番をs,uで表すものとする。なお、式(11)において、時刻tのときが重複しており、(t−1),(t+1)のときは重複していないことを示している。また、時刻の異なるデータの共分散の値は0となる。
この式(11)より、欠損を伴う2つの時系列データそれぞれの差分時系列データ(xi,s *とxj,u *)間の共分散は、以下に示す式(12)で表される。
したがって、式(9)、(10)、(12)より、欠損を伴う2つの時系列データの差分時系列データは、式(13)に示す正規分布に従うことになる。
3.欠損がある差分時系列データからのモデルパラメータの最尤推定
上述したように、本実施形態においては、差分時系列データが多変量正規分布に従うことから、当該正規分布の確率密度関数は、当該データを既知とした場合のモデルパラメータの関数(尤度関数)とみることができる。したがって、これを最大化するモデルパラメータ(μi,σi 2,σij)の値を求めることで、最尤推定量が得られる。なお、差分データの系列間は、系列数を次元とする多変量正規分布に従うことから、式(1)に示す分散共分散行列Σ(={σi 2,σij})が半正定値行列でなければならない。つまり、Σの全固有値が非負となる条件下で上記尤度関数を最大化することになる。
上述したように、本実施形態においては、差分時系列データが多変量正規分布に従うことから、当該正規分布の確率密度関数は、当該データを既知とした場合のモデルパラメータの関数(尤度関数)とみることができる。したがって、これを最大化するモデルパラメータ(μi,σi 2,σij)の値を求めることで、最尤推定量が得られる。なお、差分データの系列間は、系列数を次元とする多変量正規分布に従うことから、式(1)に示す分散共分散行列Σ(={σi 2,σij})が半正定値行列でなければならない。つまり、Σの全固有値が非負となる条件下で上記尤度関数を最大化することになる。
上述した欠損がある差分時系列データについて、図2に示すように、3次元の4時刻分を例にして説明する。ここでは、x、y、zの3つの系列があり、上段に示すように、それぞれ4時刻分のデータが発生するが、下段に示すように、一部のデータに欠損が発生している。具体的には、系列xでは、x1が取得できずにx1及びx2の合計であるx1 *が取得され、x3が取得できずにx3及びx4の合計であるx2 *が取得されている。また、系列yでは、y1はy1 *として取得されているが、y2が取得できずにy2及びy3の合計であるy2 *が取得され、y4がy3 *として取得されている。また、系列zでは、z1はz1 *として取得されているが、z2〜z4が取得できずにz2〜z4の合計であるz2 *が取得されている。
上述した欠損を含む差分時系列データをXとし、平均をμとし、分散共分散行列をΣとすると、差分時系列データXは、平均μ及び分散共分散行列Σの正規分布に従い、以下に示す式(14)で表される。
ここで、差分時系列データXは、取得された全てのデータのベクトルである。そして、平均μは、式(9)を用いて説明したように、各系列の平均(例えば、系列xにおけるμx)に各時刻の長さ(個数)をかけた値である。具体的には、図2に示すように、データx1 *は、x11とx12に対応しているため、その時刻の長さ(個数)は「2」となり、その平均は2μxとなる。他のデータについても同様である。
次に、分散共分散行列Σは、式(13)を用いて説明したように、分散は、平均と同様に、各系列の分散(例えば、系列xにおけるσx 2)に各時刻の長さ(個数)をかけた値である。具体的には、図2に示すように、x1 *の分散は2σx 2となる。また、共分散は、重複する時刻がないときは「0」となり、重複する時刻があるときは、共分散の値に重複する時刻の長さ(個数)をかけたものである。具体的には、図2に示すように、x1 *とy3 *とは重複する時刻がないため「0」となり、x1 *とy2 *とは2番目の時刻のデータが重複するため、系列xと系列yとの共分散σxyにその重複する時刻の長さ(個数)である「1」をけたσxyとなる。
以上より求められた平均μ及び分散共分散行列Σより、尤度関数Lを求めると、以下に示す式(15)で表され、また、対数尤度LLは式(16)で表され、この対数尤度LLを最大化する平均μ及び分散共分散行列Σを求めることで時系列モデルパラメータの値を決定することができる。なお、式(15)及び式(16)の第1項の「7」は、図2に示すように、取得されたデータが、x1 *〜z2 *の数が7個であることが理由である。
なお、系列数3を次元とする多変量正規分布の分散共分散行列は、以下に示す式(17)で表され、この分散共分散行列の固有値が非負となる条件下での尤度関数Lの最大化を行うことが必要である。
4.欠損が全くない場合
ここまで説明したように、時系列データに欠損がある場合でも、得られた差分データから時系列モデルパラメータを推定することができる。そこで、この方法が、欠損が全くない場合でも適用可能なことについて説明する。
ここまで説明したように、時系列データに欠損がある場合でも、得られた差分データから時系列モデルパラメータを推定することができる。そこで、この方法が、欠損が全くない場合でも適用可能なことについて説明する。
欠損を考慮した場合の差分時系列データxi,t(s)において、欠損がないときはt(s)=sとなる。したがって、欠損がないときの差分時系列データをxi,s(i=1〜N,s=1〜S(=T−1))とおくと、差分時系列データX、平均μは以下に示す式(18)、(19)で表される。なお、mは推定された平均を示す。
また、推定されるべき分散共分散行列を以下の式(20)に示すVとすると、全体の分散共分散行列Σは式(21)で表される。なお、Oは0行列である。
以上より、対数尤度LLは以下に示す式(22)で表される。
この式(22)は、多変量正規分布に従うN次元ベクトルがS個あって、それらが独立である場合の対数尤度LLにほかならない。この場合の平均m及び推定された分散共分散行列Vにかかる最尤推定量については、解析解が知られており、以下の式(23)、(24)で示される通り、標本平均、標本分散共分散行列に一致する。また、この標本分散共分散行列が半正定値行列となることも知られている。
5.一次元の場合
ここまでの説明では複数の系列の時系列データについて説明してきたが、ここでは1次元の場合について説明する。上述した式(6)より、1次元の差分データxis *は、以下に示す式(25)のように正規分布に従う。なお、1次元であるため、i=1となる。また、差分時系列データX、平均μ及び分散共分散行列Σも示す。
ここまでの説明では複数の系列の時系列データについて説明してきたが、ここでは1次元の場合について説明する。上述した式(6)より、1次元の差分データxis *は、以下に示す式(25)のように正規分布に従う。なお、1次元であるため、i=1となる。また、差分時系列データX、平均μ及び分散共分散行列Σも示す。
そして、この式(25)より、尤度関数L及び対数尤度LLは式(26)、(27)で表される。
ここで、式(27)に示される対数尤度LLを最大化する平均μi及びσi 2は、解析的に求めることができ、最尤推定量は、式(28)、(29)となる。なお、もし欠損が全くない場合には、以下の式(28),(29)は標本平均、標本分散に一致する。
6.導出した尤度関数を最大化するモデルパラメータの計算手法(一括使用による解法)
以上のようにして導出された尤度関数に基づいて、この尤度関数を最大化するモデルパラメータ(平均、分散、共分散)を求める方法として、まず、一括使用による解法を説明する。この一括使用による解法では、尤度関数から数理最適化手法(例えば、準ニュートン法等)を用いてモデルパラメータを求める方法である。但し、制約条件(半正定値条件)及び目的関数(対数尤度最大化)がともに非線形となるため、モデルパラメータを直接変えながらモデルパラメータの最尤推定量を探索するのではなく、欠損部分に入れるデータを変化させながら、都度見かけ上欠損を無くし、その上で、式(23),(24)に示した解析解に従って計算し、しかる後、欠損を考慮した尤度関数の値を計算することを繰り返しながら探索する。なお、この一括使用による解法では、式(24)が半正定値行列であることから、半正定値条件を充足しながら、対数尤度を最大化するモデルパラメータを探索することができる。
以上のようにして導出された尤度関数に基づいて、この尤度関数を最大化するモデルパラメータ(平均、分散、共分散)を求める方法として、まず、一括使用による解法を説明する。この一括使用による解法では、尤度関数から数理最適化手法(例えば、準ニュートン法等)を用いてモデルパラメータを求める方法である。但し、制約条件(半正定値条件)及び目的関数(対数尤度最大化)がともに非線形となるため、モデルパラメータを直接変えながらモデルパラメータの最尤推定量を探索するのではなく、欠損部分に入れるデータを変化させながら、都度見かけ上欠損を無くし、その上で、式(23),(24)に示した解析解に従って計算し、しかる後、欠損を考慮した尤度関数の値を計算することを繰り返しながら探索する。なお、この一括使用による解法では、式(24)が半正定値行列であることから、半正定値条件を充足しながら、対数尤度を最大化するモデルパラメータを探索することができる。
7.導出した尤度関数を最大化するモデルパラメータの計算手法(逐次使用による解法)
ここでは、n個の系列の中から一部の系列を抜き出して、モデルパラメータを計算し、ついで、残りの未知のパラメータが1つ以上含まれるように一部の系列を前回同様に抜き出し、既に計算されているモデルパラメータを固定値として未知のパラメータを計算し、上記の処理を繰り返して全てのモデルパラメータを計算するという方法である。なお、この方法の場合、全てのモデルパラメータが得られた後、そのモデルパラメータにより半正定値条件を満足するか否かを確認し、半正定値条件を満たしていない場合は、モデルパラメータから定まる分散共分散行列が半正定値条件を満たすように変形し補正解を求めることが必要である。
ここでは、n個の系列の中から一部の系列を抜き出して、モデルパラメータを計算し、ついで、残りの未知のパラメータが1つ以上含まれるように一部の系列を前回同様に抜き出し、既に計算されているモデルパラメータを固定値として未知のパラメータを計算し、上記の処理を繰り返して全てのモデルパラメータを計算するという方法である。なお、この方法の場合、全てのモデルパラメータが得られた後、そのモデルパラメータにより半正定値条件を満足するか否かを確認し、半正定値条件を満たしていない場合は、モデルパラメータから定まる分散共分散行列が半正定値条件を満たすように変形し補正解を求めることが必要である。
例えば、まず、n個の系列を個々に1次元系列ととらえ、上述した式(28),(29)により、平均と分散の最尤推定量を計算し、ついで、n個の系列から2系列を取り出す全ての組み合わせを考え、それぞれの組み合わせを2次元系列ととらえ、1次元系列として得た平均と分散の推定値を固定した対数尤度から、共分散の最尤推定量を計算し、最後に、半正定値条件を確認し、この条件を満たしていない場合には適宜変形するという方法がある。なお、このような解析的な計算方法の代わりに、上述した数理最適化手法による計算方法を用いることも可能である。
なお、半正定値条件を満たさない場合の変形方法としては、上述の方法により得られた分散共分散行列において、条件を満たさない推定分散共分散行列に対し、条件を満たす分散共分散行列を別に考え、両者の差(例えば、何らかの行列ノルム)が最小となるものを見いだす方法がある。あるいは、上述の方法により得られた分散共分散行列において、条件を満たさない推定分散共分散行列を固有値分解し、対角行列の対角成分の値を非負となるよう調整し、分解式に当てはめて分散共分散行列を修正するという方法がある。
8.時系列モデルパラメータ推定システム
次に、これまで説明した時系列モデルパラメータの推定を行う時系列モデルパラメータ推定システム100について図3及び図4を用いて説明する。この時系列モデルパラメータ推定システム100は、図3に示すように、CPUやRAM、ROM等を有し、プログラムを実行することにより時系列モデルパラメータの推定を行う処理部110と、所定の情報を入力する入力部120と、推定結果等を記憶するためのメモリーやハードディスク等からなる記憶部130と、推定結果等を出力する出力部140と、を有して構成されている。
次に、これまで説明した時系列モデルパラメータの推定を行う時系列モデルパラメータ推定システム100について図3及び図4を用いて説明する。この時系列モデルパラメータ推定システム100は、図3に示すように、CPUやRAM、ROM等を有し、プログラムを実行することにより時系列モデルパラメータの推定を行う処理部110と、所定の情報を入力する入力部120と、推定結果等を記憶するためのメモリーやハードディスク等からなる記憶部130と、推定結果等を出力する出力部140と、を有して構成されている。
図4を用いて、処理部110で実行される処理について説明する。処理部110は、時系列モデルパラメータ推定処理が実行されると、まず、差分時系列データ(欠損を含む場合がある)を読み込む(ステップS200)。なお、予め時系列データ(例えば、取得時刻と取得されたデータの組み合わせ)を記憶部130に記憶しておいてこれを読み込むように構成してもよいし、時系列データを読み込んで、この時系列データから差分時系列データを生成するように構成してもよい。そして、一括使用か逐次使用かを判断する(ステップS202)。どちらの方法を選択するかを予め記憶部130に設定しておいてもよいし、入力部120からの入力により選択するように構成してもよい。
ステップS202において、一括使用が選択された場合には、上述したように、欠損が無い状態での時系列データから求められる差分時系列データを生成し(ステップS204)、この欠損のない時系列データから求められる差分時系列データから平均、分散、共分散を計算し(ステップS206)、その結果から尤度(対数尤度)を計算する(ステップS208)。このステップS204〜S208の処理を、欠損データを代えて繰り返し実行し、尤度が最大になったか否かを判断し(ステップS210)、最大になったと判断したときは、そのときの平均、分散、共分散を時系列モデルパラメータの推定値として出力する(ステップS224)。出力方法として、ディスプレイやプリンタ等からなる出力部140に出力(表示)してもよいし、記憶部130に記憶させてもよい。
一方、ステップS202において、逐次使用が選択された場合には、全系列データから一部の系列データを抜き出し、その系列に対して、上述したように、時系列モデルパラメータ(平均、分散共分散行列)を計算する(ステップS212)。ついで、残りの未知のパラメータが1つ以上含まれるように一部の系列を前回同様に抜き出し(ステップS214)、既に計算されている系列の時系列モデルパラメータを既知の値として未知の時系列モデルパラメータを計算し(ステップS216)、全ての系列の計算が終了するまでステップS214〜S216を繰り返す(ステップS218)。そして、全ての系列が計算されたと判断すると、上述した処理により算出された最終的な時系列モデルパラメータが半正定値条件を満たすか否かを判断し(ステップS220)、満たさないときは補正解を算出して補正し(ステップS222)、結果を平均、分散、共分散を時系列モデルパラメータの推定値として出力する(ステップS224)。
それでは、具体的な実施例として、下記の表1に示すように、x,y,zの3つの系統における7時刻分の時系列データに対し、上述した一括使用による解法及び逐次使用による解法に基づいて時系列モデルパラメータを求める場合について説明する。なお、以下の表1において、「?」はそのデータが欠損していることを示している。また、各系列における「差」の値は、当該時刻におけるデータと、一つ前に取得されたデータとの差分を示している。
また、この表1に示す時系列データ(差分時系列データ)に対して、全ての差分を、ベクトルにした差分時系列データX、並びに、この差分時系列データXから求められる平均μ及び分散共分散行列Σは以下のように表される。なお、Dは差分時系列データXのデータ数を示している(xtに対して4個の差分データが取得され、ytに対して6個の差分データが取得され、ztに対して5個の差分データが取得されているため、合計でD=15となる)。
また、以降の説明において、対数尤度LLを、データ数Dと差分時系列データXをパラメータに有する、平均μ及び分散共分散行列Σの関数として以下のように定義し、この対数尤度LLが最大になる時系列モデルパラメータを求めるものとする。
但し、この対数尤度LLにおいて、系列xt〜ztの3系列(3次元)の多変量正規分布の分散共分散行列をVとしたとき、この分散共分散行列Vは、次式のように表され、その固有値が非負となる(すなわち、半正定値行列となる)条件下での対数尤度LLの最大化を行う。
(第1の実施例)
まず、第1の実施例として、上述した差分時系列データXに対し、一括解法(一括使用による解法)で、時系列モデルパラメータを推定する場合について説明する。
まず、第1の実施例として、上述した差分時系列データXに対し、一括解法(一括使用による解法)で、時系列モデルパラメータを推定する場合について説明する。
対数尤度LLの最大化にあたって、上述した分散共分散行列Vの半正定値条件を充足させるために、欠損した時系列データに対して何らかの値を与えて欠損無しの状態を生成し、この場合に理論的に得られる平均μ及び分散共分散行列Vの推定値を用いて対数尤度LLを求める。ここで、欠損無しの場合の理論値は必ず半正定値条件を満たすことから、欠損を補填する値を変えて計算を行うことで、対数尤度LLを最大とする平均μ及び分散共分散行列Vを見いだすことにすれば、半正定値条件の下で対数尤度LLの最大化を行うこととなる。
まず、表1の値より、x、y、z各系列の平均μx、μy、μz、並びに、分散共分散行列Vの値を、式(23)、(24)を用いて求める。
上述したように、欠損データであるx3,x4,z4を変化させながら、対数尤度LLが最大となる平均μ及び分散共分散行列Vを求める。
(第2の実施例)
次に、第2の実施例として、逐次解法(逐次使用による解法)で、時系列モデルパラメータを推定する場合について説明する。ここでは、xt、yt、ztからなる系列数3の時系列データに対し、それぞれ1次元データとしてモデルパラメータを算出し、次に、3つの系列から2つの系列を選択し、1次元の結果を用いることで、2次元データとしてモデルパラメータを算出し、それらの結果から、最終的なモデルパラメータの推定値を求める場合について説明する。
次に、第2の実施例として、逐次解法(逐次使用による解法)で、時系列モデルパラメータを推定する場合について説明する。ここでは、xt、yt、ztからなる系列数3の時系列データに対し、それぞれ1次元データとしてモデルパラメータを算出し、次に、3つの系列から2つの系列を選択し、1次元の結果を用いることで、2次元データとしてモデルパラメータを算出し、それらの結果から、最終的なモデルパラメータの推定値を求める場合について説明する。
[1]xtだけの一次元データとしたときのモデルパラメータ
以下の表3は、表1から系列xtだけの時系列データ及びその差分を抽出したものである。
以下の表3は、表1から系列xtだけの時系列データ及びその差分を抽出したものである。
この表2から、式(28)(29)により系列xtの平均μx及び分散σ2 xを求める。これをmx及びsx 2(但しsx≧0)とする。
[2]ytだけの一次元データとしたときのモデルパラメータ
表1から系列ytだけの時系列データ及びその差分を抽出し、[1]と同様の手法により平均μy及び分散σy 2を求める。これをmy及びsy 2(但しsy≧0)とする。
表1から系列ytだけの時系列データ及びその差分を抽出し、[1]と同様の手法により平均μy及び分散σy 2を求める。これをmy及びsy 2(但しsy≧0)とする。
[3]ztだけの一次元データとしたときのモデルパラメータ
表1から系列ztだけの時系列データ及びその差分を抽出し、[1]と同様の手法により平均μz及び分散σz 2を求める。これをmz及びsz 2(但しsz≧0)とする。
表1から系列ztだけの時系列データ及びその差分を抽出し、[1]と同様の手法により平均μz及び分散σz 2を求める。これをmz及びsz 2(但しsz≧0)とする。
[4]xt,ytの二次元データとしたときのモデルパラメータ
以下の表3は、表1から系列xt,ytの時系列データ及びその差分を抽出したものである。
以下の表3は、表1から系列xt,ytの時系列データ及びその差分を抽出したものである。
系列xt,ytにおいて、差分データをベクトル化したものをXxyとし、そのときの平均をμxy、分散共分散行列をΣxyとすると、以下のように表される。ここで、μx、μy、σx 2、σy 2は、一次元のデータとして求められた値を使用する。また、系列xt,ytにおいては、5個の差分データが取得されているため、D=10となる。
そして、LL=LL(μxy,Σxy;10,Xxy)が最大となるσxyを求める。なお、系列
xt及び系列ytの2系列(2次元)多変量正規分布の分散共分散行列Vxyは、以下のように表される。
xt及び系列ytの2系列(2次元)多変量正規分布の分散共分散行列Vxyは、以下のように表される。
ここで、分散共分散行列Vxyが半正定値行列、すなわち、σxyが次式の範囲であることが必要である。
以上より、(μx、μy、σx 2、σy 2)を(mx、my、sx 2、sy 2)に固定し、σxyを前式の範囲で変化させながら、対数尤度LLが最大となるσxyを求める。これをsxyとする。
[5]xt,ztの二次元データとしたときのモデルパラメータ
表1から系列xt,ztの時系列データ及びその差分を抽出し、[4]と同様の手法により共分散σxzを求める。これをsxzとする。
表1から系列xt,ztの時系列データ及びその差分を抽出し、[4]と同様の手法により共分散σxzを求める。これをsxzとする。
[6]yt,ztの二次元データとしたときのモデルパラメータ
表1から系列yt,ztの時系列データ及びその差分を抽出し、[4]と同様の手法により共分散σyzを求める。これをsyzとする。
表1から系列yt,ztの時系列データ及びその差分を抽出し、[4]と同様の手法により共分散σyzを求める。これをsyzとする。
[7]推定値の補正
上述した(1)〜(6)から、本実施例における時系列モデルパラメータの推定値は以下のようになる。
上述した(1)〜(6)から、本実施例における時系列モデルパラメータの推定値は以下のようになる。
ここで、分散共分散行列Vを固有値分解すると以下のようになる。
この分散共分散行列Vにおいて、右辺の2番目の行列には、対角成分に固有値が並んでいるが、負となる成分が1つ以上ある場合には、この分散共分散行列Vは半正定値行列となっていない。このため、半正定値行列となるように、負の成分を補正する。以下の例は、正の微小数ε(=0.0001)に補正した場合を示している(補正後の分散共分散行列をV*とする)。
このが最終的な推定値となる。
以上のように、本実施形態に係る時系列モデルパラメータの推定方法によれば、多次元時系列データの一部に欠損があったとしても、差分データのパターンに応じた同時分布を生成できるようになったため、尤度さらにはこれを最大化する母数の値を計算することが可能になった。これにより、欠損を伴う多次元時系列データであっても、欠損していない残りの全てのデータを使用した時系列モデルパラメータの推定が可能となる。なお、欠損を伴う多次元時系列データだけでなく、最小単位時間は共通するが、この最小単位時間の整数倍(系列毎に倍数が異なる場合や、1つの系列内でも倍数が一定でない場合、及びその組み合わせも含む)でデータが取得される時系列データに対しても、単位時間に対して取得されていないデータを上記欠損と考えれば、本発明を適用することができる。
100 時系列モデルパラメータ推定システム
110 処理部
120 入力部
130 記憶部
140 表示部
110 処理部
120 入力部
130 記憶部
140 表示部
Claims (6)
- 時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、
前記複数系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記時系列データの差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記差分時系列データの尤度関数を決定し、
前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求めることを特徴とする時系列モデルパラメータの推定方法。 - 時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、
前記複数系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記時系列データの差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記差分時系列データの尤度関数を決定するステップと、
前記複数系列の時系列データにおいて、前記最小単位時間で前記データが取得されたと仮定したときと、取得された前記時系列データとを比較して、前記データが取得されていない部分にデータを補填して、前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求めるステップと、を有することを特徴とする時系列モデルパラメータの推定方法。 - 時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、
前記複数系列のうち、一部の系列の差分時系列データを取り出し、前記一部の系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記差分時系列データの前記差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記一部の系列の尤度関数を決定し、当該尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第1のステップと、
前記複数の系列のうち、残りの未知の平均、分散共分散行列の要素が1つ以上含まれるように、一部の系列の差分時系列データを前記第1のステップと同様に取り出し、前記第1のステップで取得された前記平均及び前記分散共分散行列を既知として尤度関数を決定し、当該尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第2のステップと、を有し、
全ての系列の差分時系列データに対する平均及び分散共分散行列が求まるまで、前記第2のステップを繰り返すことを特徴とする時系列モデルパラメータの推定方法。 - 時間順で取得された複数系列の時系列データにおいて、取得されたデータ毎に、当該データと一つ前に取得されたデータとの差分からなる差分時系列データ、及び、前記複数系列の時系列データに共通する最小単位時間に基づいて、前記時系列データの時系列モデルパラメータを推定する時系列モデルパラメータの推定方法であって、
前記複数系列のうち、一部の系列の差分時系列データを取り出し、前記一部の系列の系列数に対応する多変量正規分布の平均及び分散共分散行列、並びに、前記差分時系列データの前記差分毎に、当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔、及び、前記複数系列のうち、異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔により、前記一部の系列の尤度関数を決定し、前記一部の系列の時系列データにおいて、前記最小単位時間で前記データが取得されたと仮定したときと、取得された前記時系列データとを比較して、前記データが取得されていない部分にデータを補填して、前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第1のステップと、
前記複数の系列のうち、残りの未知の平均、分散共分散行列の要素が1つ以上含まれるように、一部の系列の差分時系列データを前記第1のステップと同様に取り出し、前記第1のステップで取得された前記平均及び前記分散共分散行列を既知として尤度関数を決定し、前記残りの系列の一部の系列の時系列データにおいて、前記最小単位時間で前記データが取得されたと仮定したときと、取得された前記時系列データとを比較して、前記データが取得されていない部分にデータを補填して、前記尤度関数の値を最大化する前記差分時系列データの平均及び分散共分散行列を求める第2のステップと、を有し、
全ての系列の差分時系列データに対する平均及び分散共分散行列が求まるまで、前記第2のステップを繰り返すことを特徴とする時系列モデルパラメータの推定方法。 - 前記全ての系列の差分時系列データに対する前記差分時系列データの平均及び分散共分散行列が半正定値条件を満たしていないときは、半正定値条件を満たすように、前記平均及び前記分散共分散行列を補正することを特徴する請求項3または4に記載の時系列モデルパラメータの推定方法。
- 前記差分時系列データの平均は、前記系列毎の平均と前記差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔との積であり、
前記差分時系列データの分散は、前記系列数に対応する多変量正規分布の分散と当該差分を求めたときの前記データと前記一つ前に取得されたデータとの前記最小単位時間に基づく時間間隔との積であり、
前記差分時系列データの共分散のうち、前記異なる2つの系列の同一の時刻の値は、前記系列数に対応する多変量正規分布の共分散と前記異なる2つの系列毎の前記差分の重複する前記最小単位時間に基づく時間間隔との積であり、
前記差分時系列データの共分散のうち、前記異なる2つの系列の異なる時刻の値は0であることを特徴とする請求項1〜5のいずれか一項に記載の時系列モデルパラメータの推定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016030599A JP2017151497A (ja) | 2016-02-22 | 2016-02-22 | 時系列モデルパラメータの推定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016030599A JP2017151497A (ja) | 2016-02-22 | 2016-02-22 | 時系列モデルパラメータの推定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017151497A true JP2017151497A (ja) | 2017-08-31 |
Family
ID=59740857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016030599A Pending JP2017151497A (ja) | 2016-02-22 | 2016-02-22 | 時系列モデルパラメータの推定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017151497A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110032670A (zh) * | 2019-04-17 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 时序数据的异常检测方法、装置、设备及存储介质 |
JP2020035146A (ja) * | 2018-08-29 | 2020-03-05 | 株式会社東芝 | 情報処理装置、情報処理システム及び情報処理方法 |
CN116698323A (zh) * | 2023-08-07 | 2023-09-05 | 四川华腾公路试验检测有限责任公司 | 一种基于pca和扩展卡尔曼滤波的桥梁健康监测方法及系统 |
-
2016
- 2016-02-22 JP JP2016030599A patent/JP2017151497A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020035146A (ja) * | 2018-08-29 | 2020-03-05 | 株式会社東芝 | 情報処理装置、情報処理システム及び情報処理方法 |
US11216534B2 (en) | 2018-08-29 | 2022-01-04 | Kabushiki Kaisha Toshiba | Apparatus, system, and method of covariance estimation based on data missing rate for information processing |
JP7101084B2 (ja) | 2018-08-29 | 2022-07-14 | 株式会社東芝 | 情報処理装置、情報処理システム及び情報処理方法 |
CN110032670A (zh) * | 2019-04-17 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 时序数据的异常检测方法、装置、设备及存储介质 |
CN110032670B (zh) * | 2019-04-17 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 时序数据的异常检测方法、装置、设备及存储介质 |
CN116698323A (zh) * | 2023-08-07 | 2023-09-05 | 四川华腾公路试验检测有限责任公司 | 一种基于pca和扩展卡尔曼滤波的桥梁健康监测方法及系统 |
CN116698323B (zh) * | 2023-08-07 | 2023-10-13 | 四川华腾公路试验检测有限责任公司 | 一种基于pca和扩展卡尔曼滤波的桥梁健康监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Le Montagner et al. | An unbiased risk estimator for image denoising in the presence of mixed Poisson–Gaussian noise | |
Hyvärinen et al. | Estimation of a structural vector autoregression model using non-gaussianity. | |
Hoff | Separable covariance arrays via the Tucker product, with applications to multivariate relational data | |
Dattalo | A demonstration of canonical correlation analysis with orthogonal rotation to facilitate interpretation | |
Dette et al. | A measure of stationarity in locally stationary processes with applications to testing | |
US10613960B2 (en) | Information processing apparatus and information processing method | |
Bolck et al. | Evaluating score-and feature-based likelihood ratio models for multivariate continuous data: applied to forensic MDMA comparison | |
Greenewald et al. | Robust kronecker product PCA for spatio-temporal covariance estimation | |
Shinde et al. | Preimages for variation patterns from kernel PCA and bagging | |
JP2017151497A (ja) | 時系列モデルパラメータの推定方法 | |
Scott | Outlier detection and clustering by partial mixture modeling | |
Pendse et al. | A simple and objective method for reproducible resting state network (RSN) detection in fMRI | |
Fiche et al. | Features modeling with an α-stable distribution: Application to pattern recognition based on continuous belief functions | |
Adragni et al. | ldr: An R software package for likelihood-based sufficient dimension reduction | |
Vallejos | Testing for the absence of correlation between two spatial or temporal sequences | |
Fan et al. | Robust estimation of high-dimensional mean regression | |
Roelant et al. | Multivariate generalized S-estimators | |
Li et al. | Bayesian Lasso with neighborhood regression method for Gaussian graphical model | |
Irigoien et al. | The depth problem: identifying the most representative units in a data group | |
Zamani Mehreyan et al. | Separated hypotheses testing for autoregressive models with non-negative residuals | |
An et al. | Hypothesis testing for band size detection of high-dimensional banded precision matrices | |
Hasija et al. | Bootstrap-based detection of the number of signals correlated across multiple data sets | |
Heiden | Pitfalls of the Cholesky decomposition for forecasting multivariate volatility | |
Açıkgöz | Parameter estimation with profile likelihood method and penalized EM algorithm in normal mixture distributions | |
Yarmohammadi | A filter based Fisher g-test approach for periodicity detection in time series analysis |