JP5956359B2 - パラメータ推定方法、装置、及びプログラム - Google Patents
パラメータ推定方法、装置、及びプログラム Download PDFInfo
- Publication number
- JP5956359B2 JP5956359B2 JP2013020698A JP2013020698A JP5956359B2 JP 5956359 B2 JP5956359 B2 JP 5956359B2 JP 2013020698 A JP2013020698 A JP 2013020698A JP 2013020698 A JP2013020698 A JP 2013020698A JP 5956359 B2 JP5956359 B2 JP 5956359B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- value
- matrix
- hyperparameter
- updated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
本実施の形態のパラメータ推定装置100は、CPUと、RAMと、後述するパラメータ推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。このパラメータ推定装置100は、機能的には、図1に示すように、入力部10と、訓練データ記憶部20と、演算部30と、出力部40とを備えている。
となる。
また、パラメータθの事前確率分布が、ハイパーパラメータφを持つディリクレ分布の場合、事前確率分布は以下の式で表される。
ただし、→θi,j={θ1,j,θ2,j,...,θd,j},→φi,j={φ1,j,φ2,j,...,φd,j}である。
以降、任意の行列Mに関して、転置行列をMTと表す。また、M∈Rm×nは、行列の各要素が実数値であり、行数がm、列数がnであることを表す。また、任意の実数正方行列Mに関して、逆行列をM-1と表す。また、diag(m) ∈Rk×kは、ベクトルm∈2Rkを対角要素とする対角行列を表す。
パラメータ・ハイパーパラメータ最適化部32は、モーメント計算部31によって計算されるモーメントに関する行列の集合{Bx}を入力とし、確率的潜在変数モデルp(X;θ)のパラメータθと、事前確率分布p (θ;φ)のハイパーパラメータφとを、予め定められた収束条件を満たすまで繰り返し逐次更新することで、{Bx}と合致する最適なパラメータ^θ及び最適なハイパーパラメータ^θを求める。以下、パラメータ及びハイパーパラメータの初期値をθ(0)及びφ(0)とし、t回目の更新後のパラメータ及びハイパーパラメータをθ(t)及びφ(t)と表記する。また、確率的潜在クラスモデルに基づくパラメータθの推定値と、事前確率分布に基づくパラメータθの推定値との差分を用いて表される不一致度を表す値をuとし、uの初期値をu(0)、t回目の更新後のuの値をu(t)と表記する。
で表される。パラメータθが多項分布にしたがう場合、単にMi,j=θi,jである。また、Mはパラメータθを用いて表される関数であることを表すため、M(θ)と表記している。
次に、本実施の形態に係るパラメータ推定装置100の作用について説明する。まず、訓練データとして、観測データ系列がパラメータ推定装置100に入力されると、パラメータ推定装置100は、観測データ系列を、訓練データ記憶部20に格納する。そして、パラメータ推定装置100のROMに記憶されたパラメータ推定プログラムを、CPUが実行することにより、図3に示すパラメータ推定処理ルーチンが実行される。
20 訓練データ記憶部
30 演算部
31 モーメント計算部
32 パラメータ・ハイパーパラメータ最適化部
100 パラメータ推定装置
321 パラメータ・ハイパーパラメータ初期化部
322 パラメータ更新部
323 ハイパーパラメータ更新部
324 収束判定部
Claims (7)
- 観測値xの系列である観測データXに基づいて、未観測の潜在クラスZから観測データXを生成する確率的潜在クラスモデルの確率モデルp(X、Z;θ)で用いられるパラメータθを推定するパラメータ推定装置におけるパラメータ推定方法であって、
モーメント計算手段によって、前記観測データXの各観測値xについて、モーメントに関する行列Bxを計算し、
パラメータ初期化手段によって、前記パラメータθ、前記パラメータθを用いて予め定められた前記パラメータθの事前確率分布p(θ;φ)のハイパーパラメータφ、及び前記パラメータθと前記事前確率分布p(θ;φ)に基づいて求められる前記パラメータθとの差分を用いて表される不一致度uの各々を初期化し、
パラメータ更新手段によって、前記モーメント計算手段によって計算された各観測値xの前記行列Bxと、前回更新された前記パラメータθ又は前記パラメータθの初期値と、前回更新された前記パラメータθに基づいて計算される前記不一致度u又は前記不一致度uの初期値とに基づいて、前記計算された各観測値xの前記行列Bxと、前記パラメータθに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新し、
ハイパーパラメータ更新手段によって、前回更新された前記ハイパーパラメータφ又は前記ハイパーパラメータφの初期値に基づいて、前記事前確率分布p(θ;φ)における、前記パラメータ更新手段によって更新された前記パラメータθの値に対する確率が最大となるように、前記ハイパーパラメータφを更新し、
収束判定手段によって、収束条件を満たすまで、前記パラメータ更新手段による更新及び前記ハイパーパラメータ更新手段による更新を繰り返す
パラメータ推定方法。 - 前記パラメータ更新手段によって更新することは、前記計算された各観測値xの前記行列Bxと、前記パラメータθを用いて表わされる、前記確率モデルp(X、Z;θ)を表現する行列Mに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新する請求項1記載のパラメータ推定方法。
- 前記収束判定手段は、前回計算された前記不一致度u又は前記不一致度uの初期値から、前記パラメータ更新手段によって更新された前記パラメータθと、前記事前確率分布p(θ;φ)における、前記ハイパーパラメータ更新手段によって更新された前記ハイパーパラメータφの値に対する確率が最大となる前記パラメータθとの差分に応じた値を減算して、前記不一致度uを算出し、前記算出した前記不一致度uが閾値未満となったときに、収束条件を満たしたと判定する請求項1又は2記載のパラメータ推定方法。
- 観測値xの系列である観測データXに基づいて、未観測の潜在クラスZから観測データXを生成する確率的潜在クラスモデルの確率モデルp(X、Z;θ)で用いられるパラメータθを推定するパラメータ推定装置であって、
前記観測データXの各観測値xについて、モーメントに関する行列Bxを計算するモーメント計算手段と、
前記パラメータθ、前記パラメータθを用いて予め定められた前記パラメータθの事前確率分布p(θ;φ)のハイパーパラメータφ、及び前記パラメータθと前記事前確率分布p(θ;φ)に基づいて求められる前記パラメータθとの差分を用いて表される不一致度uの各々を初期化するパラメータ初期化手段と、
前記モーメント計算手段によって計算された各観測値xの前記行列Bxと、前回更新された前記パラメータθ又は前記パラメータθの初期値と、前回更新された前記パラメータθに基づいて計算される前記不一致度u又は前記不一致度uの初期値とに基づいて、前記計算された各観測値xの前記行列Bxと、前記パラメータθに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新するパラメータ更新手段と、
前回更新された前記ハイパーパラメータφ又は前記ハイパーパラメータφの初期値に基づいて、前記事前確率分布p(θ;φ)における、前記パラメータ更新手段によって更新された前記パラメータθの値に対する確率が最大となるように、前記ハイパーパラメータφを更新するハイパーパラメータ更新手段と、
収束条件を満たすまで、前記パラメータ更新手段による更新及び前記ハイパーパラメータ更新手段による更新を繰り返す収束判定手段と、
を含むパラメータ推定装置。 - 前記パラメータ更新手段は、前記計算された各観測値xの前記行列Bxと、前記パラメータθを用いて表わされる、前記確率モデルp(X、Z;θ)を表現する行列Mに基づいて計算される各観測値xの前記行列Bxの予測値との差分絶対値から、前記不一致度uを減算した値が最小となるように、前記パラメータθを更新する請求項4記載のパラメータ推定装置。
- 前記収束判定手段は、前回計算された前記不一致度u又は前記不一致度uの初期値から、前記パラメータ更新手段によって更新された前記パラメータθと、前記事前確率分布p(θ;φ)における、前記ハイパーパラメータ更新手段によって更新された前記ハイパーパラメータφの値に対する確率が最大となる前記パラメータθとの差分に応じた値を減算して、前記不一致度uを算出し、前記算出した前記不一致度uが閾値未満となったときに、収束条件を満たしたと判定する請求項4又は5記載のパラメータ推定装置。
- コンピュータに、請求項1〜請求項3の何れか1項記載のパラメータ推定方法の各ステップを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013020698A JP5956359B2 (ja) | 2013-02-05 | 2013-02-05 | パラメータ推定方法、装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013020698A JP5956359B2 (ja) | 2013-02-05 | 2013-02-05 | パラメータ推定方法、装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014153767A JP2014153767A (ja) | 2014-08-25 |
JP5956359B2 true JP5956359B2 (ja) | 2016-07-27 |
Family
ID=51575624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013020698A Active JP5956359B2 (ja) | 2013-02-05 | 2013-02-05 | パラメータ推定方法、装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5956359B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7006566B2 (ja) * | 2018-10-31 | 2022-01-24 | 日本電信電話株式会社 | 最適化装置、誘導システム、最適化方法、及びプログラム |
CN112274935B (zh) * | 2020-11-20 | 2024-01-23 | 超参数科技(深圳)有限公司 | Ai模型训练方法、使用方法、计算机设备及存储介质 |
-
2013
- 2013-02-05 JP JP2013020698A patent/JP5956359B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014153767A (ja) | 2014-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3504666B1 (en) | Asychronous training of machine learning model | |
WO2019157228A1 (en) | Systems and methods for training generative machine learning models | |
JP6517537B2 (ja) | 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム | |
Lye et al. | An efficient and robust sampler for Bayesian inference: Transitional ensemble Markov chain Monte Carlo | |
Budanur et al. | Periodic orbit analysis of a system with continuous symmetry—A tutorial | |
Sridharan et al. | Reduced-complexity numerical method for optimal gate synthesis | |
JP5956359B2 (ja) | パラメータ推定方法、装置、及びプログラム | |
JP5709179B2 (ja) | 隠れマルコフモデルの推定方法,推定装置および推定プログラム | |
JP5068228B2 (ja) | 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体 | |
JP6190771B2 (ja) | パラメータ推定方法、装置、及びプログラム | |
Villafuerte et al. | Solving random differential equations by means of differential transform methods | |
Chamroukhi | Non-normal mixtures of experts | |
Ono et al. | Efficient constrained tensor factorization by alternating optimization with primal-dual splitting | |
Schmelzer et al. | Data-driven deterministic symbolic regression of nonlinear stress-strain relation for rans turbulence modelling | |
CN111160487B (zh) | 人脸图像数据集的扩充方法和装置 | |
Sun et al. | Self-active and recursively selective Gaussian process models for nonlinear distributed parameter systems | |
JP6114679B2 (ja) | 制御方策決定装置、制御方策決定方法、制御方策決定プログラム、及び制御システム | |
JP5713877B2 (ja) | 入出力モデル推定装置、方法、及びプログラム | |
JP4887661B2 (ja) | 学習装置及び学習方法、並びにコンピュータ・プログラム | |
Buljak et al. | Efficient methods for optimal space filling in model reduction techniques | |
JP6452580B2 (ja) | パラメータ推定方法、装置、及びプログラム | |
Luopajärvi | Estimation of the iVAE Model with Generative Adversarial Networks | |
US11704485B2 (en) | Phrase vector learning device, method, and program | |
US20240127045A1 (en) | Optimizing algorithms for hardware devices | |
Mogstad | Mode Hunting and Density Estimation With the Focussed Information Criterion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5956359 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |