JP6740193B2 - パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム - Google Patents

パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム Download PDF

Info

Publication number
JP6740193B2
JP6740193B2 JP2017175061A JP2017175061A JP6740193B2 JP 6740193 B2 JP6740193 B2 JP 6740193B2 JP 2017175061 A JP2017175061 A JP 2017175061A JP 2017175061 A JP2017175061 A JP 2017175061A JP 6740193 B2 JP6740193 B2 JP 6740193B2
Authority
JP
Japan
Prior art keywords
parameter
gradient
vector
metric
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017175061A
Other languages
English (en)
Other versions
JP2019053349A (ja
Inventor
琢馬 大塚
琢馬 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017175061A priority Critical patent/JP6740193B2/ja
Publication of JP2019053349A publication Critical patent/JP2019053349A/ja
Application granted granted Critical
Publication of JP6740193B2 publication Critical patent/JP6740193B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラムに関する。
近年、大量のデータに対して統計的手法を用いることで、データ予測や分類、認識、知識発見等を行う統計的機械学習が知られている。統計的機械学習では、所与のデータに対して何等かの数学的な確率モデルを仮定して、この確率モデルの振る舞いからデータ予測や分類、認識、知識発見等を行う。このような確率モデルは、潜在変数やパラメータによって、その振る舞いが決定される。
ところで、統計的機械学習に用いられる確率モデルのパラメータは、所与のデータに適合するように、パラメータを繰り返し更新することで得られることが知られている。これに対して、統計的機械学習に用いられる確率モデルのパラメータと、所与のデータとの適合度合を測る尺度として変分下限が知られている(例えば非特許文献1)。
また、確率モデルのパラメータを少ない更新回数で改善可能にする自然勾配法(例えば非特許文献2)と、勾配に基づく各成分の更新量を自動設定する動的ステップサイズ法(例えば非特許文献3)とが知られている。更に、適用可能な確率モデルの種類が限られるものの、変分下限を用いて確率モデルのパラメータを計算する方法が知られている(例えば特許文献1)。
特開2015−162233号公報
M. I. Jordan et al.: An Introduction to Variational Methods for Graphical Models, Machine Learning 37, pp.183-233, 1999. S. Amari: Natural Gradient Works Efficiently in Learning, Neural Computation 10:2, pp.251-276, 1998. M. D. Zeiler: ADADELTA: An Adaptive Learning Rate Method, arxiv:1212.5701,2012.
しかしながら、従来では、例えば、確率モデルの種類によって、パラメータの更新を行うためのアルゴリズムが異なるという問題があった。また、例えば、通常の勾配を用いたパラメータの更新は非効率であるという問題があった。
本発明は、上記の点に鑑みてなされたもので、広汎な種類の確率モデルに対して、効率的にパラメータを推定することを目的とする。
上記目的を達成するため、本発明の実施の形態は、入力されたデータセットに対して、入力された確率モデルのパラメータを推定するパラメータ推定装置であって、前記パラメータと、前記データセットとが適合する方向を示す勾配ベクトルを計算する勾配計算手段と、前記パラメータが変化した場合に、前記確率モデルへの影響度合いを示す計量ベクトルを計算する計量計算手段と、前記勾配計算手段により計算された前記勾配ベクトルと、前記計量計算手段により計算された前記計量ベクトルとに基づいて、前記パラメータを更新するパラメータ更新手段と、前記パラメータ更新手段により前記パラメータが更新された場合、所定の終了条件を満たしているか否かを判定する終了条件判定手段と、を有し、前記終了条件判定手段により前記終了条件を満たしていると判定されるまで、前記勾配計算手段による前記勾配ベクトルの計算と、前記終了条件判定手段による前記計量ベクトルの計算と、前記パラメータ更新手段による前記パラメータの更新とを繰り返す、ことを特徴とする。
広汎な種類の確率モデルに対して、効率的にパラメータを推定することができる。
本発明の実施の形態におけるパラメータ推定装置の構成の一例を示す図である。 本発明の実施の形態におけるパラメータ推定装置のハードウェア構成の一例を示す図である。 本発明の実施の形態におけるパラメータ推定装置の機能構成の一例を示す図である。 本発明の実施の形態におけるパラメータ推定装置が実行する全体処理の一例を示すフローチャートである。 本発明の実施の形態におけるパラメータ推定処理の一例を示すフローチャートである。 本発明の効果の一例を説明する図である。
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。本発明の実施の形態では、データセットと確率モデルとが与えられた場合に、与えられたデータセットに適合するパラメータ(与えられた確率モデルのパラメータ)を推定するパラメータ推定装置10について説明する。
<パラメータ推定装置10の構成>
まず、本発明の実施の形態におけるパラメータ推定装置10の構成について、図1を参照しながら説明する。図1は、本発明の実施の形態におけるパラメータ推定装置10の構成の一例を示す図である。
図1に示すパラメータ推定装置10は、与えられたデータセットと確率モデルとに対して、当該確率モデルのパラメータを、当該データセットに適合するように推定するコンピュータである。図1に示すパラメータ推定装置10には、推定プログラム100がインストールされている。推定プログラム100は、複数のモジュールで構成されるプログラム群であっても良い。
図1に示すパラメータ推定装置10は、推定プログラム100により、データセットと確率モデルとを入力し、入力された確率モデルのパラメータを、入力されたデータセットに適合するように推定する。そして、図1に示すパラメータ推定装置10は、推定プログラム100により、推定されたパラメータを出力する。
なお、図1に示すパラメータ推定装置10の構成は一例であって、他の構成であっても良い。例えば、パラメータ推定装置10は、複数台のコンピュータで構成されていても良い。
<パラメータ推定装置10のハードウェア構成>
次に、本発明の実施の形態におけるパラメータ推定装置10のハードウェア構成について、図2を参照しながら説明する。図2は、本発明の実施の形態におけるパラメータ推定装置10のハードウェア構成の一例を示す図である。
図2に示すパラメータ推定装置10は、入力装置11と、表示装置12と、外部I/F13と、RAM(Random Access Memory)14と、ROM(Read Only Memory)15と、CPU(Central Processing Unit)16と、通信I/F17と、補助記憶装置18とを有する。これら各ハードウェアは、それぞれがバスBを介して通信可能に接続されている。
入力装置11は、例えばキーボードやマウス、タッチパネル等であり、ユーザが各種操作を入力するのに用いられる。表示装置12は、例えばディスプレイ等であり、パラメータ推定装置10の処理結果等を表示する。なお、パラメータ推定装置10は、入力装置11及び表示装置12の少なくとも一方を有していなくても良い。
外部I/F13は、外部装置とのインタフェースである。外部装置には、記録媒体13a等がある。パラメータ推定装置10は、外部I/F13を介して、記録媒体13a等の読み取りや書き込みを行うことができる。記録媒体13aには、推定プログラム100等が記憶されていても良い。
記録媒体13aには、例えば、フレキシブルディスク、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等がある。
RAM14は、プログラムやデータを一時保持する揮発性の半導体メモリである。ROM15は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリである。ROM15には、例えば、OS(Operating System)設定やネットワーク設定等が格納されている。
CPU16は、ROM15や補助記憶装置18等からプログラムやデータをRAM14上に読み出して処理を実行する演算装置である。
通信I/F17は、パラメータ推定装置10をネットワークに接続するためのインタフェースである。推定プログラム100は、通信I/F17を介して、所定のサーバ等から取得(ダウンロード)されても良い。
補助記憶装置18は、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)等であり、プログラムやデータを格納している不揮発性の記憶装置である。補助記憶装置18に格納されているプログラムやデータには、例えば、OS、当該OS上において各種機能を実現するアプリケーションプログラム、推定プログラム100等がある。
本発明の実施の形態におけるパラメータ推定装置10は、図2に示すハードウェア構成を有することにより、後述する各種処理を実現することができる。
<パラメータ推定装置10の機能構成>
次に、本発明の実施の形態におけるパラメータ推定装置10の機能構成について、図3を参照しながら説明する。図3は、本発明の実施の形態におけるパラメータ推定装置10の機能構成の一例を示す図である。
図3に示すパラメータ推定装置10は、入力部101と、初期化部102と、パラメータ推定部103と、出力部104とを有する。これら各部は、推定プログラム100がCPU16に実行させる処理により実現される。
また、図3に示すパラメータ推定装置10は、記憶部110を有する。記憶部110は、例えば補助記憶装置18を用いて実現可能である。なお、記憶部110は、例えば、パラメータ推定装置10とネットワークを介して接続される記憶装置等を用いて実現されていても良い。
入力部101は、データセットと、確率モデルとを入力する。以降では、入力部101により入力されるデータセットはN個のデータから構成されるものとし、データセットxを、
Figure 0006740193
と表す。なお、データセットxを構成する各データxのインデックスnを「データインデックス」とも表す。
また、入力部101により入力される確率モデルの潜在変数をzとし、確率モデルは以下の式1に示す分布に従うものと仮定する。
Figure 0006740193
これに対し、推定するパラメータをλとして、潜在変数zの分布をqλ(z)と仮定する。なお、パラメータλは、1次元のベクトル(スカラー)で表されても良いし、2次元以上のベクトルで表されても良い。
更に、本実施形態では、入力部101により入力されたデータセットxと、入力部101により入力された確率モデルのパラメータλとの適合度合いを、以下の式2に示す変分下限により定義する。
Figure 0006740193
このとき、本実施形態では、上記の式2に示す変分下限を最大化するパラメータλを推定する。
初期化部102は、入力部101により入力された確率モデルのパラメータλを、予め決められた或る初期値λに初期化する。
パラメータ推定部103は、データセットxに適合するパラメータλを推定する。ここで、パラメータ推定部103は、勾配計算部111と、計量計算部112と、パラメータ更新部113と、終了判定部114とを有する。
勾配計算部111は、確率モデルのパラメータλを、現在の値からデータセットxに適合するように改善する方向(すなわち、λに関する勾配)を計算する。
計量計算部112は、パラメータλの各成分が現在の値から変化した場合に、確率モデルに対してどの程度影響を与えるかを示す計量を計算する。
パラメータ更新部113は、勾配計算部111により計算された勾配と、計量計算部112により計算された計量とを用いて、パラメータλを更新する。
ここで、パラメータ推定部103は、パラメータλの初期値λから、所定の終了条件を満たすまで、以下の(1)〜(3)を繰り返し実行することで、データセットxに適合するパラメータλを推定する。以降では、tを、繰り返し回数を示すインデックスとする。なお、所定の終了条件としては、予め決められた回数を繰り返したこと、又は、パラメータ更新部113の更新前後におけるパラメータλの変化量が所定以下となったこと等が挙げられる。
(1)勾配計算部111により、パラメータλ=λにおける∇λL(qλ)の不偏推定量であるgを計算する。このgが勾配である。なお、∇λは、λに関する偏微分作用素である。
(2)計量計算部112により、以下の式3に示すフィッシャー情報行列の対角成分から成るベクトルmを計算する。このベクトルmが計量である。なお、ベクトルmは、パラメータλ=λにおいて評価する。
Figure 0006740193
(3)パラメータ更新部113により、勾配gと計量mとを用いて、パラメータλ=λをλt+1に更新する。
終了判定部114は、上記の(1)〜(3)の繰り返し(すなわち、パラメータ更新の繰り返し)の終了条件を満たすか否かを判定する。
出力部104は、パラメータ推定部103により推定されたパラメータλを出力する。なお、出力部104は、推定されたパラメータλの出力先として、例えば、記憶部110に記憶させても良いし、ネットワーク上のサーバ等に送信しても良い。又は、出力部104は、推定されたパラメータλの出力先として、表示装置12に表示しても良い。
記憶部110は、各種データを記憶する。記憶部110には、各tにおけるパラメータλ=λと、パラメータλ=λを更新するための所定のベクトル(後述するv及びΔ)とが記憶される。なお、記憶部110には、各tにおける勾配gと計量mとが記憶されていても良い。
<処理の詳細>
次に、本発明の実施の形態におけるパラメータ推定装置10が実行する全体処理について、図4を参照しながら説明する。図4は、本発明の実施の形態におけるパラメータ推定装置10が実行する全体処理の一例を示すフローチャートである。
ステップS101:入力部101は、データセットxと、確率モデルとを入力する。入力部101は、例えば、ユーザにより入力装置11を用いて作成されたデータセットxと確率モデルとを入力しても良いし、記録媒体13aや補助記憶装置18等に記憶されているデータセットxと確率モデルとを入力しても良いし、通信I/F17によりネットワーク上のサーバ等から取得(ダウンロード)したデータセットxと確率モデルとを入力しても良い。
なお、データセットxと確率モデルとの入力元が異なっていても良い。例えば、データセットxを補助記憶装置18から入力する一方で、確率モデルを入力装置11から入力しても良い。
ステップS102:初期化部102は、入力部101により入力された確率モデルのパラメータλを、予め決められた或る初期値λに初期化する。なお、パラメータλを初期化する必要が無い場合や既に初期化されている場合等には、本ステップの処理は不要である。
ステップS103:パラメータ推定部103は、データセットxに適合するパラメータλを推定する。
ここで、パラメータ推定部103によるパラメータ推定処理の詳細について、図5を参照しながら説明する。図5は、本発明の実施の形態におけるパラメータ推定処理の一例を示すフローチャートである。なお、図5に示すパラメータ推定処理が実行される前に、繰り返し回数tは、例えば、t=1に初期化される。
ステップS201:勾配計算部111は、パラメータλ=λに関する勾配gを計算する。
勾配計算部111は、上記の式2のλに関する勾配を計算することで、勾配gを計算する。このとき、データセットxを構成するN個のデータxに関する和と、潜在変数zに関する期待値Eqλとは、それぞれ次のように近似計算する。
すなわち、データセットxを構成するデータ全体x,・・・,xの評価は困難なため、以下の式4に示すように、M<N個のデータxを乱択する。このM個のデータxを「ミニバッチ」と称する。
Figure 0006740193
ミニバッチSはt回目におけるデータインデックスの集合で、|S|=Mである。ミニバッチSは、通常、データセットxを構成するデータxのデータインデックスの集合{1,・・・,N}からM個のデータインデックスを等確率で選択することで生成される。
また、潜在変数zに関する期待値の計算については、以下の式5に示すように、現在のパラメータλ=λの確率モデルから生成した潜在変数を用いる。
Figure 0006740193
このとき、勾配gを以下の式6により計算する。ただし、偏微分作用素∇λは、λ=λにおいて評価する。
Figure 0006740193
これにより、t回目におけるパラメータλ=λに関する勾配gが計算される。
なお、例えば、上記の式4において、ミニバッチSの選択に偏りがある方が良いパラメータλが得られる等の知見がある場合は、{1,・・・,N}からデータインデックスを選択する確率が等確率でなくても良い。この場合には、ミニバッチSの選択確率をP(S)として、上記の式6の代わりに、以下の式7により勾配gを計算する。
Figure 0006740193
ただし、U(M,N)=(M!(N−M)!)/N!である。「!」は階乗を表す。
ステップS202:計量計算部112は、パラメータλ=λの計量mを計算する。計量計算部112は、パラメータλ=λ及び勾配gと同じ長さのベクトルである計量mを以下の式8により計算する。
Figure 0006740193
これにより、t回目におけるパラメータλ=λの計量mが計算される。なお、上記の式8は、式3と同値である。
ここで、上記の式8における期待値Eの解析計算が困難な場合は、以下の式9により、逐次的な移動平均を用いて計量mを近似計算しても良い。なお、式9における計量mt−1は、t−1回目に算出され、記憶部110に記憶されているものを用いる。
Figure 0006740193
ただし、z^は上記の式5により生成される潜在変数であり、初期値mは零ベクトルを用いる。また、0<ρ<1は移動平均に用いる係数であり、後述する式10及び式12で用いるρと同一のものを用いる。
ステップS203:パラメータ更新部113は、勾配計算部111により計算された勾配gと、計量計算部112により計算された計量mとを用いて、パラメータλ=λを更新する。
パラメータ更新部113は、以下の式10によりvを計算して、記憶部110に記憶させる。そして、パラメータ更新部113は、以下の式11によりパラメータλ=λをλt+1に更新して、更新後のパラメータλ=λt+1を記憶部110に記憶させる。式11におけるΔt−1は、t−1回目の繰り返しにおいて算出され、記憶部110に記憶されているものを利用する。
Figure 0006740193
Figure 0006740193
ただし、vはパラメータλ=λと同次元のベクトルで、ベクトル同士の乗算、除算、平方根等の演算は要素毎に行うものとする。また、初期値vには零ベクトルを用いる。更に、アルゴリズムのハイパーパラメータであるρ及びεは、例えば、ρ=0.95、ε=10−6等の値を適宜設定する。
次に、パラメータ更新部113は、以下の式12によりΔを計算して、記憶部110に記憶させる。記憶部110に記憶されたΔは、t+1回目の繰り返しにおけるパラメータλ=λt+1の更新に用いられる。
Figure 0006740193
ただし、上記のvと同様に、Δはパラメータλ=λと同次元のベクトルで、ベクトル同士の乗算、除算、平方根等の演算は要素毎に行うものとする。また、初期値Δには零ベクトルを用いる。
なお、ハイパーパラメータρ及びεの値(特に、εの値)は、利用する確率モデルやミニバッチSの大きさMによっては変化させた方がより効率的に良いパラメータλが得られる場合がある。このような場合、少量のデータを用いて、例えば、ε={10−4,10−5,10−6,10−7}等から選択して設定しても良い。この選択の基準は、例えば、後述する式15等を尺度として用いれば良い。
ステップS204:終了判定部114は、予め決められた所定の終了条件を満たすか否かを判定する。終了条件には、例えば、繰り返し回数tが、予め決められた回数に達したことが挙げられる、又は、終了条件には、上記の式11によるパラメータλの更新前後での変化量(すなわち、λに対するλt+1の変化量)が所定以下となったことが挙げられる。
終了判定部114により終了条件を満たさないと判定された場合、パラメータ推定部103は、繰り返し回数tに「1」を加算した上で、ステップS201の処理を実行する。これにより、終了条件を満たすまで、上記のステップS201〜ステップS203の処理が繰り返し実行される。
一方で、終了判定部114により終了条件を満たすと判定された場合、パラメータ推定部103は、パラメータ更新処理を終了する。これにより、入力されたデータセットxに適合するパラメータλが推定される。
図4に戻る。ステップS104:出力部104は、パラメータ推定部103により推定されたパラメータλを出力する。
以上により、本発明の実施の形態におけるパラメータ推定装置10は、データセットxと確率モデルとが入力された場合に、この確率モデルのパラメータλであって、データセットxに適合するパラメータλを推定することができる。
しかも、本発明の実施の形態におけるパラメータ推定装置10は、勾配計算部111によって、広汎な種類の確率モデルのパラメータλを推定することができるようになる。また、本発明の実施の形態におけるパラメータ推定装置10は、計量計算部112とパラメータ更新部113とによって、例えば大量のデータにより構成されるデータセットxであっても、効率的にパラメータλを更新することができるようになる。
すなわち、本発明の実施の形態におけるパラメータ推定装置10は、自然勾配法と動的ステップサイズ法との両方の利点を有し、広汎な種類の確率モデルのパラメータを推定可能で、かつ、大量のデータに対しても効率的に計算を行うことができる。
<本発明の効果>
ここで、本発明の実施の形態におけるパラメータ推定装置10を2値判別問題に適用した場合における本発明の効果について説明する。確率モデルとしてはベイズ的ロジスティック回帰モデルを用いて、データセットxとしてはLIBSVMにより提供されるa9aを利用する。このデータセットは各データ(以降、「サンプル」と表す。)が2値のラベル及び123次元の特徴ベクトルにより構成される。この特徴ベクトルは、元は14成分の値だったものをカテゴリ毎に、{0,1}に書き換えて構成したものである。
すなわち、データセットxを、x={x}と表した場合、各サンプルxは、
Figure 0006740193
と表される。
パラメータλの推定は32,561個のサンプルを用いて行い、このサンプルとは別の16,281個の評価用データで評価を行った。
確率モデルは、以下の式13及び式14により表される。
Figure 0006740193
Figure 0006740193
ただし、zはwと同様に123次元のベクトルで、N(0,I)は標準正規分布である。
分布qλ(z)も正規分布N(m,diag(s))で構成する。すなわち、推定対象のパラメータλは、λ=(m,s)となる。ここで、m,sは123次元のベクトルで、diag(s)は、対角成分がベクトルsで構成される対角行列を表す。
このとき、本発明及び従来技術の対数尤度について、図6(a)に示す。図6(a)における対数尤度は、評価用データに関して、分布qλ(z)の平均であるmを用いて、
Figure 0006740193
の平均値を算出したものである。対数尤度が高い程、データセットxに適合した良いパラメータλである。一方で、図6(a)におけるパラメータ更新の繰り返し回数は、パラメータの更新について、データセットxを何周したかに対応する。
図6(a)に示すように、本発明では、従来技術と比較して、より少ない繰り返し回数で高い対数尤度となっていることがわかる。
また、本発明及び従来技術の判別誤り率について、図6(b)に示す。図6(b)における判別誤り率は、評価用データに関して、y mの符号が正の値のときを正しい判別とした場合に、誤った判別を行ったサンプル数の割合である。判別誤り率が低い程、データセットxに適合した良いパラメータλである。パラメータ更新の繰り返し回数は、図6(a)と同様である、
図6(b)に示すように、本発明では、従来技術と比較して、より少ない繰り返し回数で低い判別誤り率となっていることがわかる。
図6(a)及び図6(b)に示すように、本発明によれば、従来技術に比べて、より少ない繰り返し回数で(すなわち、より効率的に)、データセットxに適合した良いパラメータλを推定できる。
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
10 パラメータ推定装置
100 推定プログラム
101 入力部
102 初期化部
103 パラメータ推定部
104 出力部
111 勾配計算部
112 計量計算部
113 パラメータ更新部
114 終了判定部
110 記憶部

Claims (7)

  1. 入力されたデータセットに対して、入力された確率モデルのパラメータを推定するパラメータ推定装置であって、
    前記パラメータと、前記データセットとが適合する方向を示す勾配ベクトルを計算する勾配計算手段と、
    前記パラメータが変化した場合に、前記確率モデルへの影響度合いを示す計量ベクトルを計算する計量計算手段と、
    前記勾配計算手段により計算された前記勾配ベクトルと、前記計量計算手段により計算された前記計量ベクトルとに基づいて、前記パラメータを更新するパラメータ更新手段と、
    前記パラメータ更新手段により前記パラメータが更新された場合、所定の終了条件を満たしているか否かを判定する終了条件判定手段と、
    を有し、
    前記終了条件判定手段により前記終了条件を満たしていると判定されるまで、前記勾配計算手段による前記勾配ベクトルの計算と、前記終了条件判定手段による前記計量ベクトルの計算と、前記パラメータ更新手段による前記パラメータの更新とを繰り返す、ことを特徴とするパラメータ推定装置。
  2. 前記勾配計算手段は、
    前記パラメータにおける変分下限の勾配の不偏推定量を、前記勾配ベクトルとして計算し、
    前記計量計算手段は、
    前記確率モデルの潜在変数に関するフィッシャー情報行列の対角成分により構成されるベクトルを前記計量ベクトルとして計算する、又は、逐次的な移動平均により近似的に前記計量ベクトルを計算する、ことを特徴とする請求項1に記載のパラメータ推定装置。
  3. 前記パラメータ更新手段は、
    前記勾配計算手段により計算された前記勾配ベクトルと、前記計量計算手段により計算された前記計量ベクトルと、予め設定されたハイパーパラメータとに基づいて算出された更新量を、前記パラメータに加算することで、該パラメータを更新する、ことを特徴とする請求項1又は2に記載のパラメータ推定装置。
  4. 前記終了条件判定手段により前記終了条件を満たしていると判定された場合、前記パラメータ更新手段により更新されたパラメータを出力する出力手段を有する、ことを特徴とする請求項1乃至3の何れか一項に記載のパラメータ推定装置。
  5. 入力されたデータセットに対して、入力された確率モデルのパラメータを推定するパラメータ推定装置が、
    前記パラメータと、前記データセットとが適合する方向を示す勾配ベクトルを計算する勾配計算手順と、
    前記パラメータが変化した場合に、前記確率モデルへの影響度合いを示す計量ベクトルを計算する計量計算手順と、
    前記勾配計算手順により計算された前記勾配ベクトルと、前記計量計算手順により計算された前記計量ベクトルとに基づいて、前記パラメータを更新するパラメータ更新手順と、
    前記パラメータ更新手順により前記パラメータが更新された場合、所定の終了条件を満たしているか否かを判定する終了条件判定手順と、
    を有し、
    前記終了条件判定手順により前記終了条件を満たしていると判定されるまで、前記勾配計算手順による前記勾配ベクトルの計算と、前記終了条件判定手順による前記計量ベクトルの計算と、前記パラメータ更新手順による前記パラメータの更新とを繰り返す、ことを特徴とするパラメータ推定方法。
  6. 前記勾配計算手順は、
    前記パラメータにおける変分下限の勾配の不偏推定量を、前記勾配ベクトルとして計算し、
    前記計量計算手順は、
    前記確率モデルの潜在変数に関するフィッシャー情報行列の対角成分により構成されるベクトルを前記計量ベクトルとして計算する、又は、逐次的な移動平均により近似的に前記計量ベクトルを計算する、ことを特徴とする請求項5に記載のパラメータ推定方法。
  7. コンピュータを、請求項1乃至4の何れか一項に記載のパラメータ推定装置における各手段として機能させるためのパラメータ推定プログラム。
JP2017175061A 2017-09-12 2017-09-12 パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム Active JP6740193B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017175061A JP6740193B2 (ja) 2017-09-12 2017-09-12 パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017175061A JP6740193B2 (ja) 2017-09-12 2017-09-12 パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム

Publications (2)

Publication Number Publication Date
JP2019053349A JP2019053349A (ja) 2019-04-04
JP6740193B2 true JP6740193B2 (ja) 2020-08-12

Family

ID=66014855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017175061A Active JP6740193B2 (ja) 2017-09-12 2017-09-12 パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム

Country Status (1)

Country Link
JP (1) JP6740193B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6099099B2 (ja) * 2014-02-28 2017-03-22 日本電信電話株式会社 収束判定装置、方法、及びプログラム
US9553681B2 (en) * 2015-02-17 2017-01-24 Adobe Systems Incorporated Source separation using nonnegative matrix factorization with an automatically determined number of bases
JP6283331B2 (ja) * 2015-06-26 2018-02-21 日本電信電話株式会社 流れ推定装置、予測装置、及びプログラム

Also Published As

Publication number Publication date
JP2019053349A (ja) 2019-04-04

Similar Documents

Publication Publication Date Title
US20210019647A1 (en) Systems and methods for machine learning
Rosić et al. Parameter identification in a probabilistic setting
Yildirim et al. An online expectation–maximization algorithm for changepoint models
CN114462613B (zh) 量子计算机性能刻画方法及装置、电子设备和介质
US20190332933A1 (en) Optimization of model generation in deep learning neural networks using smarter gradient descent calibration
JP4265296B2 (ja) 変化点検出装置,変化点検出方法および変化点検出用プログラム
Bui et al. Gaussian process for predicting CPU utilization and its application to energy efficiency
WO2020116211A1 (ja) 推定装置、最適化装置、推定方法、最適化方法、及びプログラム
WO2020105468A1 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラムが格納された非一時的なコンピュータ可読媒体
JP6740193B2 (ja) パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム
Schäfer Particle algorithms for optimization on binary spaces
Frellsen et al. Bayesian generalised ensemble markov chain monte carlo
Mandal et al. l1 regularized multiplicative iterative path algorithm for non-negative generalized linear models
Wang et al. Constrained spline regression in the presence of AR (p) errors
JP6831307B2 (ja) 解算出装置、解算出方法及び解算出プログラム
JP5713877B2 (ja) 入出力モデル推定装置、方法、及びプログラム
WO2024084622A1 (ja) 軌跡データ予測装置、軌跡データ予測方法及びプログラム
WO2022074711A1 (ja) 学習方法、推定方法、学習装置、推定装置、及びプログラム
JP6837953B2 (ja) パラメータ推定装置、パラメータ推定方法及びプログラム
Kwasniok Semiparametric maximum likelihood probability density estimation
Rivier et al. Non‐parametric measure approximations for constrained multi‐objective optimisation under uncertainty
US20230101066A1 (en) Computer-readable recording medium storing optimization program, optimization method, and optimization apparatus
WO2023281579A1 (ja) 最適化方法、最適化装置、及びプログラム
JP2019113962A (ja) 解析装置、解析方法及びプログラム
JP2019095894A (ja) 推定装置、学習装置、学習済みモデル、推定方法、学習方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200721

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200722

R150 Certificate of patent or registration of utility model

Ref document number: 6740193

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150