JP5956359B2 - パラメータ推定方法、装置、及びプログラム - Google Patents

パラメータ推定方法、装置、及びプログラム Download PDF

Info

Publication number
JP5956359B2
JP5956359B2 JP2013020698A JP2013020698A JP5956359B2 JP 5956359 B2 JP5956359 B2 JP 5956359B2 JP 2013020698 A JP2013020698 A JP 2013020698A JP 2013020698 A JP2013020698 A JP 2013020698A JP 5956359 B2 JP5956359 B2 JP 5956359B2
Authority
JP
Japan
Prior art keywords
parameter
value
matrix
hyperparameter
updated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013020698A
Other languages
English (en)
Other versions
JP2014153767A (ja
Inventor
裕之 進藤
裕之 進藤
永田 昌明
昌明 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013020698A priority Critical patent/JP5956359B2/ja
Publication of JP2014153767A publication Critical patent/JP2014153767A/ja
Application granted granted Critical
Publication of JP5956359B2 publication Critical patent/JP5956359B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、パラメータ推定方法、装置、及びプログラムに係り、特に、未観測の潜在クラスから観測データを生成する確率的潜在クラスモデルで用いられるパラメータを推定するパラメータ推定方法、装置、及びプログラムに関する。
確率的潜在クラスモデルとは、未観測の潜在クラスZから観測データXを生成する確率モデルp(X;Z;θ)のことをいう。ただし、θは確率モデルのパラメータである。確率的潜在クラスモデルの例として、隠れマルコフモデル(HMM)や混合分布モデルなどが知られている。英語や日本語などのテキストデータでは、観測データXを単語列とし、潜在クラスZをXに対応する品詞列として、確率的潜在クラスモデルが利用される。
また、モーメント法とは、独立同分布(i.i.d.)に従う観測データの系列{X}=X1,X2,...を入力とし、{X}を生成する確率的潜在クラスモデルの尤もらしいパラメータθを推定する方法である。モーメント法では、観測データ系列{X}の期待値(モーメント)を計算し、モーメントと最も合致するパラメータを最適なパラメータとして推定する方法である。モーメント法による確率的潜在クラスモデルのパラメータ推定方法の詳細は、非特許文献1に開示されている。
A method of moments for mixture models and hidden Markov models. Anima Anandkumar, Daniel Hsu, and Sham M. Kakade. Twenty-Fifth Annual Conference on Learning Theory, 2012.
上記の非特許文献1に開示されている、モーメント法による確率的潜在クラスモデルのパラメータ推定方法は、パラメータθ の事前確率分布p (θ;φ)の形式で与えられる、パラメータθに関する事前知識を考慮した推定ができない、という問題がある。ただし、φは、事前確率分布p(θ;φ)のパラメータで、ハイパーパラメータと呼ばれる。したがって、上記の非特許文献1に開示されている方法でパラメータの推定を行った場合、パラメータθの事前確率分布p(θ;φ)に従わない不適切なパラメータを推定してしまう可能性がある。
本発明は、上記問題点を解決するために成されたものであり、パラメータθの事前確率分布p(θ;φ)を考慮して、確率的潜在クラスモデルのパラメータを精度よく推定することができるパラメータ推定方法、装置、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明のパラメータ推定方法は、観測値xの系列である観測データXに基づいて、未観測の潜在クラスZから観測データXを生成する確率的潜在クラスモデルの確率モデルp(X、Z;θ)で用いられるパラメータθを推定するパラメータ推定装置におけるパラメータ推定方法であって、モーメント計算手段によって、前記観測データXの各観測値xについて、モーメントに関する行列Bxを計算し、パラメータ初期化手段によって、前記パラメータθ、前記パラメータθを用いて予め定められた前記パラメータθの事前確率分布p(θ;φ)のハイパーパラメータφ、及び前記パラメータθと前記事前確率分布p(θ;φ)に基づいて求められる前記パラメータθとの差分を用いて表される不一致度uの各々を初期化し、パラメータ更新手段によって、前記モーメント計算手段によって計算された各観測値xの前記行列Bxと、前回更新された前記パラメータθ又は前記パラメータθの初期値と、前回更新された前記パラメータθに基づいて計算される前記不一致度u又は前記不一致度uの初期値とに基づいて、前記計算された各観測値xの前記行列Bxと、前記パラメータθに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新し、ハイパーパラメータ更新手段によって、前回更新された前記ハイパーパラメータφ又は前記ハイパーパラメータφの初期値に基づいて、前記事前確率分布p(θ;φ)における、前記パラメータ更新手段によって更新された前記パラメータθの値に対する確率が最大となるように、前記ハイパーパラメータφを更新し、収束判定手段によって、収束条件を満たすまで、前記パラメータ更新手段による更新及び前記ハイパーパラメータ更新手段による更新を繰り返す。
本発明に係るパラメータ推定装置は、観測値xの系列である観測データXに基づいて、未観測の潜在クラスZから観測データXを生成する確率的潜在クラスモデルの確率モデルp(X、Z;θ)で用いられるパラメータθを推定するパラメータ推定装置であって、前記観測データXの各観測値xについて、モーメントに関する行列Bxを計算するモーメント計算手段と、前記パラメータθ、前記パラメータθを用いて予め定められた前記パラメータθの事前確率分布p(θ;φ)のハイパーパラメータφ、及び前記パラメータθと前記事前確率分布p(θ;φ)に基づいて求められる前記パラメータθとの差分を用いて表される不一致度uの各々を初期化するパラメータ初期化手段と、前記モーメント計算手段によって計算された各観測値xの前記行列Bxと、前回更新された前記パラメータθ又は前記パラメータθの初期値と、前回更新された前記パラメータθに基づいて計算される前記不一致度u又は前記不一致度uの初期値とに基づいて、前記計算された各観測値xの前記行列Bxと、前記パラメータθに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新するパラメータ更新手段と、前回更新された前記ハイパーパラメータφ又は前記ハイパーパラメータφの初期値に基づいて、前記事前確率分布p(θ;φ)における、前記パラメータ更新手段によって更新された前記パラメータθの値に対する確率が最大となるように、前記ハイパーパラメータφを更新するハイパーパラメータ更新手段と、収束条件を満たすまで、前記パラメータ更新手段による更新及び前記ハイパーパラメータ更新手段による更新を繰り返す収束判定手段とを含んで構成されている。
また、本発明のプログラムは、コンピュータに、上記のパラメータ推定方法の各ステップを実行させるためのプログラムである。
以上説明したように、本発明のパラメータ推定方法、装置、及びプログラムによれば、各観測値xのモーメントに関する行列Bxと、パラメータθに基づいて計算される各観測値xの行列Bxの予測値との差分絶対値から、不一致度uを減算した値が最小となるように、パラメータθを更新すると共に、事前確率分布p(θ;φ)における、更新されたパラメータθの値に対する確率が最大となるように、ハイパーパラメータφを更新することを、収束条件を満たすまで繰り返すことにより、パラメータθの事前確率分布p(θ;φ)を考慮して、確率的潜在クラスモデルのパラメータを精度よく推定することができる、という効果が得られる。
本発明の実施の形態のパラメータ推定装置の機能構成を示すブロック図である。 本発明の実施の形態のパラメータ推定装置のパラメータ・ハイパーパラメータ最適化部の機能構成を示すブロック図である。 本発明の実施の形態のパラメータ推定装置におけるパラメータ推定処理ルーチンの内容を示すフローチャートである。 本発明の実施の形態のパラメータ推定装置におけるパラメータ最適化過程を示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<パラメータ推定装置の構成>
本実施の形態のパラメータ推定装置100は、CPUと、RAMと、後述するパラメータ推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。このパラメータ推定装置100は、機能的には、図1に示すように、入力部10と、訓練データ記憶部20と、演算部30と、出力部40とを備えている。
入力部10は、キーボードなどの入力装置から、訓練データとして、任意の実数値または離散値の集合である観測データ系列{X}を受け付ける。なお、入力部10は、ネットワーク等を介して外部から入力されたものを受け付けるようにしてもよい。
観測データXは、例えば日本語や英語の文の各単語を離散シンボル化した系列や、画像の系列などである。
訓練データ記憶部20には、訓練データとして、入力された観測データ系列が記憶される。また、訓練データ記憶部20には、パラメータθの事前確率分布が予め記憶されている。例えば、パラメータθが多項分布にしたがう場合、パラメータθの事前確率分布として、ハイパーパラメータφを持つディリクレ分布が予め記憶されている。
パラメータθが多項分布にしたがう場合、θは(d×k)次元のベクトルであり、θ={θi,j}と表すことができる。このとき、観測データの生成確率は、

となる。
また、パラメータθの事前確率分布が、ハイパーパラメータφを持つディリクレ分布の場合、事前確率分布は以下の式で表される。

ただし、θi,j={θ1,j,θ2,j,...,θd,j},φi,j={φ1,j,φ2,j,...,φd,j}である。
演算部30は、モーメント計算部31及びパラメータ・ハイパーパラメータ最適化部32を備えている。
モーメント計算部31は、訓練データ記憶部20に記憶されている訓練データが与えられた下で、訓練データのモーメントに関する行列を計算する。パラメータ・ハイパーパラメータ最適化部32は、訓練データのモーメントに関する行列が与えられた下で、確率的潜在クラスモデルのパラメータ及び事前確率分布のハイパーパラメータを推定する。したがって、モーメント計算部31とパラメータ・ハイパーパラメータ最適化部32によって、観測データ系列から、確率的潜在クラスモデルのパラメータ及び事前確率分布のハイパーパラメータを推定することができる。
<モーメント計算部>
以降、任意の行列Mに関して、転置行列をMと表す。また、M∈Rm×nは、行列の各要素が実数値であり、行数がm、列数がnであることを表す。また、任意の実数正方行列Mに関して、逆行列をM-1と表す。また、diag(m) ∈Rk×kは、ベクトルm∈2Rkを対角要素とする対角行列を表す。
モーメント計算部31では、訓練データ系列{X}を入力とし、以下の式に定義されるモーメントに関する行列Bx∈Rk×kを、各観測値xごとにそれぞれ計算し、出力する。
ただし、行列Pairs∈Rd×d、行列Triplesx∈Rd×d、行列U∈Rd×k、行列V∈Rd×kであり、dは、観測値xの次元を表している。また、行列Pairsと行列Triplesxの各(i,j)要素は、以下のように定義される。
また、UとVは、それぞれPairsの右特異ベクトルで構成される行列、左特異ベクトルで構成される行列である。すなわち、Pairs=UΣVと特異値分解できる。Pr[xt=i,xt+1=j]は、観測データ系列{X}中のシンボルxt,xt+1の連接頻度(バイグラム頻度)であり、観測データ系列から計算することができる。Pr[xt=i,xt+1=j,xt+2=x] も同様である。
<パラメータ・ハイパーパラメータ最適化部>
パラメータ・ハイパーパラメータ最適化部32は、モーメント計算部31によって計算されるモーメントに関する行列の集合{B}を入力とし、確率的潜在変数モデルp(X;θ)のパラメータθと、事前確率分布p (θ;φ)のハイパーパラメータφとを、予め定められた収束条件を満たすまで繰り返し逐次更新することで、{B}と合致する最適なパラメータ^θ及び最適なハイパーパラメータ^θを求める。以下、パラメータ及びハイパーパラメータの初期値をθ(0)及びφ(0)とし、t回目の更新後のパラメータ及びハイパーパラメータをθ(t)及びφ(t)と表記する。また、確率的潜在クラスモデルに基づくパラメータθの推定値と、事前確率分布に基づくパラメータθの推定値との差分を用いて表される不一致度を表す値をuとし、uの初期値をu(0)、t回目の更新後のuの値をu(t)と表記する。
また、確率的潜在クラスモデルのパラメータθは、確率的潜在クラスモデルの確率モデルp(X,Z;θ)の形式に応じて、値、ベクトル、及び行列のうちの何れかの形式である。事前確率分布p (θ;φ)のハイパーパラメータφは、事前確率分布p (θ;φ) の形式に応じて、値、ベクトル、及び行列のうちの何れかの形式である。
パラメータ・ハイパーパラメータ最適化部32は、図2に示すように、パラメータ及びハイパーパラメータを初期化するパラメータ・ハイパーパラメータ初期化部321と、現在のパラメータ値に基づいて新たなパラメータを更新するパラメータ更新部322と、現在のハイパーパラメータ値に基づいて新たなハイパーパラメータを更新するハイパーパラメータ更新部323と、パラメータ及びハイパーパラメータ推定処理を終了するか否かを判定する収束判定部324と、を含んだ構成で表すことができる。
パラメータ・ハイパーパラメータ初期化部321は、確率的潜在クラスモデルの確率モデルp(X,Z;θ)のパラメータθの初期値と、事前確率分布p(θ;φ)のハイパーパラメータφの初期値を設定する。初期値として、確率的潜在クラスモデルが許容する任意のパラメータ値および事前確率分布が許容する任意のハイパーパラメータ値を設定することができるが、ここでは、乱数によってランダムに決定することとする。また、パラメータ・ハイパーパラメータ初期化部321は、不一致度の初期値をu(0)=0と設定する。
パラメータ更新部322は、前回更新された、繰り返し回数t回目のパラメータθ(t)及び不一致度u(t)から、以下の(1)式に従って、新たなパラメータθ(t+1)を生成して更新する。
ただし、行列M∈Rd×k は、確率的潜在クラスモデルの確率分布を行列形式で表現したものであり、行i、列jの要素Mi,jは、

で表される。パラメータθが多項分布にしたがう場合、単にMi,j=θi,jである。また、Mはパラメータθを用いて表される関数であることを表すため、M(θ)と表記している。
確率的潜在クラスモデルが隠れマルコフモデルや混合分布のときの具体的なMについては、非特許文献1に詳細が開示されている。上記の(1)式は、モーメント計算部31で計算されるモーメントに関する行列と、確率的潜在クラスモデルから予測されるモーメントに関する行列とを合致させる効果がある。
上記(1)式は、準ニュートン法を用いて計算することができる。準ニュートン法の詳細は、非特許文献(Byrd,R. H.; Nocedal, J.; Schnabel, R. B. (1994). Representations of Quasi-Newton Matrices and their use in Limited Memory Methods. Mathematical Programming)に開示されている。
ハイパーパラメータ更新部323は、パラメータ更新部322と同様に、更新されたパラメータθ(t+1)と、前回更新されたハイパーパラメータφ(t)、不一致度u(t)とから、勾配法を用いて以下の(2)式に従って、新たなハイパーパラメータφ(t+1)を生成して更新する。
収束判定部324は、予め定められた収束条件を満たしたか否かを判定し、収束条件を満たすまで、パラメータ更新部322及びハイパーパラメータ更新部323の処理を繰り返す。収束判定部324は、前回算出した不一致度u(t)、パラメータ更新部322によって更新されたパラメータθ(t+1)、及びハイパーパラメータ更新部323によって更新されたハイパーパラメータφ(t+1)に基づいて、以下の式に従って、不一致度u(t+1)を算出し、適当な実数値ε(例えば0.001)を用いて、u(t+1)<εとなったときに収束したと判定し、そうでなければ未収束と判定する。
ただし、dは予め設定されたステップ幅を表し、実数値である。また、maxθp(θ;φ(t+1))では、ハイパーパラメータ更新部323によって更新されたハイパーパラメータφ(t+1)を用いた事前確率分布において、最大の確率を与えるパラメータθを求めており、このパラメータθと、パラメータ更新部322によって更新されたパラメータθ(t+1)との差分を用いて、不一致度u(t+1)が計算される。
収束と判定された場合、収束判定部324は、パラメータ更新部322によって更新されたパラメータθ(t+1)、及びハイパーパラメータ更新部323によって更新されたハイパーパラメータφ(t+1)を出力部40により出力してパラメータ・ハイパーパラメータ最適化部32の処理は終了する。未収束と判定された場合、収束判定部324は、t←t+1とし、パラメータθ(t)、ハイパーパラメータφ(t)、及び不一致度u(t)をパラメータ更新部322へ出力する。
<パラメータ推定装置の作用>
次に、本実施の形態に係るパラメータ推定装置100の作用について説明する。まず、訓練データとして、観測データ系列がパラメータ推定装置100に入力されると、パラメータ推定装置100は、観測データ系列を、訓練データ記憶部20に格納する。そして、パラメータ推定装置100のROMに記憶されたパラメータ推定プログラムを、CPUが実行することにより、図3に示すパラメータ推定処理ルーチンが実行される。
まず、ステップS1において、モーメント計算部31によって、訓練データ記憶部20に記憶された観測データ系列の各観測データについて、当該観測データの各観測値x毎に、モーメントに関する行列Bxを計算する。
そして、ステップS2において、パラメータ・ハイパーパラメータ最適化部32によって、上記ステップS1で各観測値x毎に計算されたモーメントに関する行列Bxと合致するように、パラメータθ及びハイパーパラメータφを最適化し、出力部40によりパラメータθ、ハイパーパラメータφを出力する。
上記ステップS2は、図4に示す処理ルーチンによって実現される。
まず、ステップS21で、パラメータθの初期値θ(0)、ハイパーパラメータφの初期値φ(0)、不一致度の初期値u(0)を設定する。
次に、ステップS22で、後述するステップS24で計算された不一致度u(t)又は不一致度の初期値u(0)と、前回更新されたパラメータθ(t)又はパラメータθの初期値θ(0)と、上記ステップS1で計算されたモーメントに関する行列Bxとに基づいて、上記(1)式に従って、パラメータθ(t+1)に更新する。
そして、ステップS23において、上記ステップS22で計算されたパラメータθ(t)と、前回更新されたハイパーパラメータφ(t)又はハイパーパラメータφの初期値φ(0)と、予め定められたパラメータθの事前確率分布とに基づいて、ハイパーパラメータφ(t+1)に更新する。
そして、ステップS24において、上記ステップS22で更新されたパラメータθ(t+1)と、上記ステップS23で更新されたハイパーパラメータφ(t+1)と、前回計算された不一致度u(t)又は不一致度の初期値u(0)とに基づいて、不一致度u(t+1)を算出し、算出した不一致度u(t+1)が閾値ε未満であるか否かを判定することにより、収束したか否かを判定する。u(t+1)≧εの場合には、ステップS25で、繰り返し回数tを1インクリメントして、ステップS22へ戻り、更新されたパラメータθ、ハイパーパラメータφ、及び不一致度uを用いて処理を繰り返す。一方、u(t+1)<εの場合には、更新されたパラメータθ、ハイパーパラメータφを最適なパラメータとし、パラメータ推定結果として出力部40により出力して、処理を終了する。
以上説明したように、本実施の形態のパラメータ推定装置によれば、観測データ系列の各観測値xのモーメントに関する行列Bxと、確率的潜在クラスモデルのパラメータθに基づいて計算される行列Bxの予測値との差分絶対値から、不一致度uを減算した値が最小となるように、パラメータθを更新すると共に、事前確率分布p(θ;φ)における、更新されたパラメータθの値に対する確率が最大となるように、ハイパーパラメータφを更新することを、収束条件を満たすまで繰り返すことにより、事前確率分布p(θ;φ)の形式で与えられるパラメータθの事前知識を考慮して、モーメント法による確率的潜在クラスモデルのパラメータθ及び事前確率分布のハイパーパラメータφの推定を行うことができる。
また、本実施の形態に係るパラメータ推定装置では、従来のモーメント法による確率的潜在クラスモデルのパラメータ推定方法に、事前確率分布のハイパーパラメータの推定を組み合わせ、確率的潜在モデルのパラメータθと、事前確率分布のハイパーパラメータφを交互に繰り返し最適化していくことにより、パラメータの事前確率分布に従う確率的潜在クラスモデルのパラメータθ及び事前確率分布のハイパーパラメータφを推定することができる。したがって、従来のモーメント法による確率的潜在モデルのパラメータ推定方法がパラメータに関する事前確率分布を考慮できないという問題を解決できる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述のパラメータ推定装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 入力部
20 訓練データ記憶部
30 演算部
31 モーメント計算部
32 パラメータ・ハイパーパラメータ最適化部
100 パラメータ推定装置
321 パラメータ・ハイパーパラメータ初期化部
322 パラメータ更新部
323 ハイパーパラメータ更新部
324 収束判定部

Claims (7)

  1. 観測値xの系列である観測データXに基づいて、未観測の潜在クラスZから観測データXを生成する確率的潜在クラスモデルの確率モデルp(X、Z;θ)で用いられるパラメータθを推定するパラメータ推定装置におけるパラメータ推定方法であって、
    モーメント計算手段によって、前記観測データXの各観測値xについて、モーメントに関する行列Bxを計算し、
    パラメータ初期化手段によって、前記パラメータθ、前記パラメータθを用いて予め定められた前記パラメータθの事前確率分布p(θ;φ)のハイパーパラメータφ、及び前記パラメータθと前記事前確率分布p(θ;φ)に基づいて求められる前記パラメータθとの差分を用いて表される不一致度uの各々を初期化し、
    パラメータ更新手段によって、前記モーメント計算手段によって計算された各観測値xの前記行列Bxと、前回更新された前記パラメータθ又は前記パラメータθの初期値と、前回更新された前記パラメータθに基づいて計算される前記不一致度u又は前記不一致度uの初期値とに基づいて、前記計算された各観測値xの前記行列Bxと、前記パラメータθに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新し、
    ハイパーパラメータ更新手段によって、前回更新された前記ハイパーパラメータφ又は前記ハイパーパラメータφの初期値に基づいて、前記事前確率分布p(θ;φ)における、前記パラメータ更新手段によって更新された前記パラメータθの値に対する確率が最大となるように、前記ハイパーパラメータφを更新し、
    収束判定手段によって、収束条件を満たすまで、前記パラメータ更新手段による更新及び前記ハイパーパラメータ更新手段による更新を繰り返す
    パラメータ推定方法。
  2. 前記パラメータ更新手段によって更新することは、前記計算された各観測値xの前記行列Bxと、前記パラメータθを用いて表わされる、前記確率モデルp(X、Z;θ)を表現する行列Mに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新する請求項1記載のパラメータ推定方法。
  3. 前記収束判定手段は、前回計算された前記不一致度u又は前記不一致度の初期値から、前記パラメータ更新手段によって更新された前記パラメータθと、前記事前確率分布p(θ;φ)における、前記ハイパーパラメータ更新手段によって更新された前記ハイパーパラメータφの値に対する確率が最大となる前記パラメータθとの差分に応じた値を減算して、前記不一致度uを算出し、前記算出した前記不一致度uが閾値未満となったときに、収束条件を満たしたと判定する請求項1又は2記載のパラメータ推定方法。
  4. 観測値xの系列である観測データXに基づいて、未観測の潜在クラスZから観測データXを生成する確率的潜在クラスモデルの確率モデルp(X、Z;θ)で用いられるパラメータθを推定するパラメータ推定装置であって、
    前記観測データXの各観測値xについて、モーメントに関する行列Bxを計算するモーメント計算手段と、
    前記パラメータθ、前記パラメータθを用いて予め定められた前記パラメータθの事前確率分布p(θ;φ)のハイパーパラメータφ、及び前記パラメータθと前記事前確率分布p(θ;φ)に基づいて求められる前記パラメータθとの差分を用いて表される不一致度uの各々を初期化するパラメータ初期化手段と、
    前記モーメント計算手段によって計算された各観測値xの前記行列Bxと、前回更新された前記パラメータθ又は前記パラメータθの初期値と、前回更新された前記パラメータθに基づいて計算される前記不一致度u又は前記不一致度uの初期値とに基づいて、前記計算された各観測値xの前記行列Bxと、前記パラメータθに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新するパラメータ更新手段と、
    前回更新された前記ハイパーパラメータφ又は前記ハイパーパラメータφの初期値に基づいて、前記事前確率分布p(θ;φ)における、前記パラメータ更新手段によって更新された前記パラメータθの値に対する確率が最大となるように、前記ハイパーパラメータφを更新するハイパーパラメータ更新手段と、
    収束条件を満たすまで、前記パラメータ更新手段による更新及び前記ハイパーパラメータ更新手段による更新を繰り返す収束判定手段と、
    を含むパラメータ推定装置。
  5. 前記パラメータ更新手段は、前記計算された各観測値xの前記行列Bxと、前記パラメータθを用いて表わされる、前記確率モデルp(X、Z;θを表現する行列Mに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新する請求項4記載のパラメータ推定装置。
  6. 前記収束判定手段は、前回計算された前記不一致度u又は前記不一致度の初期値から、前記パラメータ更新手段によって更新された前記パラメータθと、前記事前確率分布p(θ;φ)における、前記ハイパーパラメータ更新手段によって更新された前記ハイパーパラメータφの値に対する確率が最大となる前記パラメータθとの差分に応じた値を減算して、前記不一致度uを算出し、前記算出した前記不一致度uが閾値未満となったときに、収束条件を満たしたと判定する請求項4又は5記載のパラメータ推定装置。
  7. コンピュータに、請求項1〜請求項3の何れか1項記載のパラメータ推定方法の各ステップを実行させるためのプログラム。
JP2013020698A 2013-02-05 2013-02-05 パラメータ推定方法、装置、及びプログラム Active JP5956359B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013020698A JP5956359B2 (ja) 2013-02-05 2013-02-05 パラメータ推定方法、装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013020698A JP5956359B2 (ja) 2013-02-05 2013-02-05 パラメータ推定方法、装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014153767A JP2014153767A (ja) 2014-08-25
JP5956359B2 true JP5956359B2 (ja) 2016-07-27

Family

ID=51575624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013020698A Active JP5956359B2 (ja) 2013-02-05 2013-02-05 パラメータ推定方法、装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP5956359B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7006566B2 (ja) * 2018-10-31 2022-01-24 日本電信電話株式会社 最適化装置、誘導システム、最適化方法、及びプログラム
CN112274935B (zh) * 2020-11-20 2024-01-23 超参数科技(深圳)有限公司 Ai模型训练方法、使用方法、计算机设备及存储介质

Also Published As

Publication number Publication date
JP2014153767A (ja) 2014-08-25

Similar Documents

Publication Publication Date Title
EP3504666B1 (en) Asychronous training of machine learning model
WO2019157228A1 (en) Systems and methods for training generative machine learning models
JP6517537B2 (ja) 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム
Lye et al. An efficient and robust sampler for Bayesian inference: Transitional ensemble Markov chain Monte Carlo
Budanur et al. Periodic orbit analysis of a system with continuous symmetry—A tutorial
Sridharan et al. Reduced-complexity numerical method for optimal gate synthesis
JP5956359B2 (ja) パラメータ推定方法、装置、及びプログラム
JP5709179B2 (ja) 隠れマルコフモデルの推定方法,推定装置および推定プログラム
JP5068228B2 (ja) 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体
JP6190771B2 (ja) パラメータ推定方法、装置、及びプログラム
Villafuerte et al. Solving random differential equations by means of differential transform methods
Chamroukhi Non-normal mixtures of experts
Ono et al. Efficient constrained tensor factorization by alternating optimization with primal-dual splitting
Schmelzer et al. Data-driven deterministic symbolic regression of nonlinear stress-strain relation for rans turbulence modelling
CN111160487B (zh) 人脸图像数据集的扩充方法和装置
Sun et al. Self-active and recursively selective Gaussian process models for nonlinear distributed parameter systems
JP6114679B2 (ja) 制御方策決定装置、制御方策決定方法、制御方策決定プログラム、及び制御システム
JP5713877B2 (ja) 入出力モデル推定装置、方法、及びプログラム
JP4887661B2 (ja) 学習装置及び学習方法、並びにコンピュータ・プログラム
Buljak et al. Efficient methods for optimal space filling in model reduction techniques
JP6452580B2 (ja) パラメータ推定方法、装置、及びプログラム
Luopajärvi Estimation of the iVAE Model with Generative Adversarial Networks
US11704485B2 (en) Phrase vector learning device, method, and program
US20240127045A1 (en) Optimizing algorithms for hardware devices
Mogstad Mode Hunting and Density Estimation With the Focussed Information Criterion

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160616

R150 Certificate of patent or registration of utility model

Ref document number: 5956359

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150