JP6536157B2 - モデル推定システム、モデル推定方法およびモデル推定プログラム - Google Patents

モデル推定システム、モデル推定方法およびモデル推定プログラム Download PDF

Info

Publication number
JP6536157B2
JP6536157B2 JP2015091413A JP2015091413A JP6536157B2 JP 6536157 B2 JP6536157 B2 JP 6536157B2 JP 2015091413 A JP2015091413 A JP 2015091413A JP 2015091413 A JP2015091413 A JP 2015091413A JP 6536157 B2 JP6536157 B2 JP 6536157B2
Authority
JP
Japan
Prior art keywords
variable
component
parameter selection
probability
free parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015091413A
Other languages
English (en)
Other versions
JP2016207136A (ja
Inventor
優輔 村岡
優輔 村岡
遼平 藤巻
遼平 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2015091413A priority Critical patent/JP6536157B2/ja
Publication of JP2016207136A publication Critical patent/JP2016207136A/ja
Application granted granted Critical
Publication of JP6536157B2 publication Critical patent/JP6536157B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、多変量データに対する階層隠れ変数モデルを推定するモデル推定システム、モデル推定方法およびモデル推定プログラムに関する。
一般的な文書において、例えば話題の分野が同じ文書間の記述は、話題の分野が異なる文書間の記述に比べて似ている。また、小売店の特定商品の売り上げは、立地条件が同じであると似ている。立地条件は、例えば、その店舗がオフィス街にあるか、駅の近くにあるか、郊外にあるかという情報である。このように、実際に観測する変数(上記の「記述」または「売り上げ」)が、それ以外の観測できていない要因(上記の「話題」または「店舗の立地」)の値に応じて変化するデータは数多くある。
このようなデータの、観測できていない変数(隠れ変数、潜在変数)を推定することは、産業上の重要な場面に応用可能である。例えば、利用者は、話題が同じ文書を推定することで、検索結果の文書のうち検索意図に合致する文書群、意図と異なる文書群を特定し、より早く目的文書を揃えることができる。また、例えば、利用者は、店舗売り上げの要因が同じ店舗を推定することで、店舗の品ぞろえを考える際、特定の店舗で売り上げの良い商品をどの店舗で採用すると売れそうかを特定することができる。
このように、観測できていない要因を推定するため、一般的に、混合分布モデルが用いられる。混合分布モデルとは、観測変数が、複数の分布(コンポーネント)の重ね合わせによる分布から生成することを表現するモデルである。観測できない要因により、コンポーネントが選択され、そのコンポーネントから観測変数が生成するというモデルである。
また、特定のサンプルの集合ごとに観測変数の生成要因が似ている(例えば、文書ごとに似た要因がある、店舗ごとに似た要因がある)状況を表すために、混合分布のパラメータを階層的に用いたモデルが用いられる。例えば、自然文の場合、非特許文献1に記載されている”Latent Dirichlet Allocation(LDA)”と呼ばれるモデルが用いられる。
非特許文献1では、各文書が単語で表され(観測変数)、各文書中の単語に対しそれぞれ隠れ状態があり、文書ごとに設定されるパラメータが潜在変数の出現確率を定めている。非特許文献1では、さらにこのパラメータがどのように出現しやすいかが、文書全体で共通のパラメータを用いて表されている。非特許文献1では、このようにモデルを作ることにより、文書ごとに話題の傾向があることが表現されている。
非特許文献1では、予め、隠れ状態数を設定しなければ、パラメータ、隠れ状態を推定できないという課題がある。その問題を解決するため非特許文献2では、隠れ状態数とパラメータがDirichlet Processで生成するというモデルを仮定し推定が行われている。しかし、Dirichlet Processを用いたノンパラメトリックベイズ法は、計算量が非常に大きくなってしまうという課題がある。
Blei, David M., Andrew Y. Ng, and Michael I. Jordan. "Latent dirichlet allocation." the Journal of machine Learning research 3 (2003): 993-1022. Teh, Yee Whye, et al. "Hierarchical dirichlet processes." Journal of the american statistical association 101.476 (2006).
また、隠れ変数モデルの代表例である混合モデルに対して、完全周辺尤度関数を近似して、その下界(下限)を最大化することで、隠れ状態数を決定する方法が考えられる。この方法は、ノンパラメトリックベイズ法と比較して計算量を小さくすることが可能であり、高速に隠れ状態数、隠れ状態、パラメータを推定することができる。
しかし、コンポーネントのパラメータの次元が大きいモデルではこの方法は適用できない。なぜならば、この方法では、完全周辺尤度関数を近似するために、パラメータでの積分をラプラス近似により近似計算しているが、パラメータの次元が大きなモデルにおいては、近似誤差が非常に大きくなってしまうからである。LDAにおけるコンポーネントは、単語を生成する多項分布である。各単語にそれぞれ確率を割り振るため、コンポーネントの次元は単語の種類数となり、非常に大きい。
本発明は、コンポーネントのパラメータの次元が大きな隠れ変数モデルに対しても、理論的正当性を失うことなく、高速に隠れ状態数、隠れ状態、パラメータを推定することができるモデル推定システム、およびモデル推定方法およびモデル推定プログラムを提供することを目的とする。
本発明によるモデル推定システムは、隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力部と、状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定部と、潜在変数の変分確率、パラメータ、ハイパーパラメータ、コンポーネントの種類、および自由パラメータ選択変数の初期値を設定する初期化処理部と、観測値データ、ならびに初期化処理部が設定した潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理部と、観測値データ、ならびに初期化処理部が設定した潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適なコンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理部と、コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、ならびに潜在変数変分確率計算処理部が計算した潜在変数の変分確率を取得し、自由パラメータ選択変数を計算する自由パラメータ選択変数計算部と、観測値データ、コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、潜在変数変分確率計算処理部が計算した潜在変数の変分確率、ならびに自由パラメータ選択変数計算部が計算した自由パラメータ選択変数を取得し、自由度が限定された周辺化モデル事後確率の下界の最大化を継続するかを判定する最適性判断処理部と、潜在変数変分確率計算処理部が計算した潜在変数の変分確率、コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータを出力する結果出力部とを備えたことを特徴とする。
本発明によるモデル推定システムは、隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力部と、状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定部と、潜在変数の変分確率、パラメータ、コンポーネントの種類、自由パラメータ選択変数、および自由パラメータ選択変数分布のパラメータの初期値を設定する初期化処理部と、観測値データ、ならびに初期化処理部が設定した潜在変数の変分確率、コンポーネントの種類、パラメータ、自由パラメータ選択変数および自由パラメータ選択変数分布のパラメータを取得し、自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理部と、観測値データ、ならびに初期化処理部が設定した潜在変数の変分確率、コンポーネントの種類、パラメータ、ハイパーパラメータ、自由パラメータ選択変数および自由パラメータ選択変数分布のパラメータを取得し、隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適なコンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理部と、コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、ならびに潜在変数変分確率計算処理部が計算した潜在変数の変分確率を取得し、自由パラメータ選択変数を計算する自由パラメータ選択変数計算部と、自由パラメータ選択変数計算部が計算した自由パラメータ選択変数を取得し、自由パラメータ選択変数分布のパラメータを計算する自由パラメータ選択変数分布最適化処理部と、観測値データ、コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、潜在変数変分確率計算処理部が計算した潜在変数の変分確率、自由パラメータ選択変数計算部が計算した自由パラメータ選択変数、自由パラメータ選択変数分布最適化処理部が計算した自由パラメータ選択変数分布のパラメータを取得し、自由度が限定された周辺化モデル事後確率の下界の最大化を継続するかを判定する最適性判断処理部と、潜在変数変分確率計算処理部が計算した潜在変数の変分確率、コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータを出力する結果出力部とを備えたことを特徴とする。
本発明によるモデル推定方法は、隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得し、状態数候補集合のうちまだ計算が完了していない要素を状態数として設定し、潜在変数の変分確率、パラメータ、ハイパーパラメータ、コンポーネントの種類、および自由パラメータ選択変数の初期値を設定し、観測値データ、ならびに設定された潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるような潜在変数の変分確率を計算し、観測値データ、ならびに設定された潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適なコンポーネントの種類およびそのパラメータを推定し、推定されたコンポーネントの種類およびそのパラメータ、ならびに計算された潜在変数の変分確率を取得し、自由パラメータ選択変数を計算し、観測値データ、推定されたコンポーネントの種類およびそのパラメータ、計算された潜在変数の変分確率、ならびに計算された自由パラメータ選択変数を取得し、自由度が限定された周辺化モデル事後確率の下界の最大化を継続するかを判定し、計算された潜在変数の変分確率、推定されたコンポーネントの種類およびそのパラメータを出力することを特徴とする。
本発明によるモデル推定プログラムは、コンピュータに、隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力処理と、前記状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定処理と、潜在変数の変分確率、パラメータ、ハイパーパラメータ、前記コンポーネントの種類、および自由パラメータ選択変数の初期値を設定する初期化処理と、前記観測値データ、ならびに設定された潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理と、前記観測値データ、ならびに前記設定された潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、前記隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるように前記コンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理と、
前記推定されたコンポーネントの種類およびそのパラメータ、ならびに前記計算された潜在変数の変分確率を取得し、自由パラメータ選択変数を計算する自由パラメータ選択変数計算処理と、前記観測値データ、前記推定されたコンポーネントの種類およびそのパラメータ、前記計算された潜在変数の変分確率、ならびに前記計算された自由パラメータ選択変数を取得し、自由度が限定された周辺化モデル事後確率の下界の最大化を継続するかを判定する最適性判断処理と、計算された潜在変数の変分確率、推定された前記コンポーネントの種類およびそのパラメータを出力する結果出力処理とを実行させることを特徴とする。
本発明によれば、各コンポーネントのパラメータの次元が大きな隠れ変数モデルに対して、理論的正当性を失うことなく、高速に隠れ状態数、隠れ状態、パラメータを推定することができる。
本発明によるモデル推定システムの第1の実施形態の構成を示すブロック図である。 本発明によるモデル推定システムの第1の実施形態の動作を示すフローチャートである。 本発明によるモデル推定システムの第2の実施形態の構成を示すブロック図である。 本発明によるモデル推定システムの第2の実施形態の動作を示すフローチャートである。 本発明によるモデル推定システムの第3の実施形態の構成を示すブロック図である。 本発明によるモデル推定システムの第3の実施形態の動作を示すフローチャートである。 本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。
次に、本発明の実施の形態について、図面を参照して説明する。
各実施形態で推定の対象とするモデルを説明する。観測変数xは、式(1)のように表される。
Figure 0006536157
また、観測変数それぞれに対応する潜在変数zは、式(2)のように表される(Kは潜在状態の種類数)。
Figure 0006536157
また、観測変数xは、その潜在変数zの値により異なる正則モデルから生成されたものであるとする。この場合、xは式(3)のように表される。
Figure 0006536157
式(3)に示すPについてはいくつかのモデルの種類を仮定しており、その種類をHで表す。例えば、どのコンポーネントもM個のモデルの中から1つのモデルを選ぶと仮定し、1,..Kに1,..Mのいずれかを対応させる行列で表現する。本実施形態のモデル推定システムは、この仮定されたモデルのパラメータηの次元が大きい場合でも理論的正当性のあるモデル選択を実現することを目的としている。また、潜在変数zはある正則モデルから生成されるとする。この場合、zは、式(4)のように表される。
Figure 0006536157
上記のような混合モデルに対するモデル選択およびパラメータの推定を実現する方法を以下説明する。ここで新しい変数を導入する。各コンポーネントのj番目の次元のパラメータηkjについて、このパラメータをモデルのパラメータに含めるかを決める変数をξkj(自由パラメータ選択変数)とする。ξ(k),j=1ならばこのパラメータをモデルのパラメータとして扱うことにし、ξ(k),j=0ならば、パラメータをモデルのパラメータから除外し、ある定数を代入する。これを表現するため、パラメータを自由パラメータ選択変数で書き直しているとする。例えば、モデルが多項分布であった場合、各次元jの出現確率を以下の式(5)のように取り直す。ξkjφkjの形で書いていることにより、ξkj=0とした場合、φkjはモデルに影響を与えない。
なお、推定するモデルは隠れ変数モデルであればよく混合モデルに限られない。なお、以下の説明において潜在変数の変分確率を単に変分確率と記載することがある。
Figure 0006536157
実施形態1.
次に、本実施形態のモデル推定システムの構成を説明する。図1は、モデル推定システムの第1の実施形態の構成を示すブロック図である。モデル推定システムは、データ入力部101と、状態数設定部102と、初期化処理部103と、潜在変数変分確率計算処理部111と、コンポーネント最適化処理部112と、自由パラメータ選択変数計算部113と、最適性判断処理部114と、結果出力部121とを備える。モデル推定システムは、2つ以上の物理的に分離した装置が有線または無線で接続されている構成であってよい。この点は、後述の各実施形態において同様である。
図1に示す構成は、例えば、特定の演算処理等を行うよう設計されたハードウェア、またはプログラムに従って動作するCPU(Central Processing Unit)等の情報処理装置によって実現される。また、そのプログラムは、コンピュータが読み取り可能であって非一時的な情報記憶媒体に記憶される。
本実施形態では、モデルのパラメータ、潜在変数の変分確率を、自由度を限定したモデル事後確率の下界を最大化するように求める。自由度を限定したモデル事後確率は、以下の式(6)で表されるp(x|ξ,M)のことである。
Figure 0006536157
または、後述する第2の実施形態では、式(7)に示すようにξに分布を仮定する。その場合のモデル事後確率を、自由度を限定したモデル事後確率と呼ぶ。
Figure 0006536157
データ入力部101は、混合モデルの推定対象となる観測値データと、混合モデルを構成するコンポーネントの種類(種類候補)およびパラメータ、潜在変数が選択する状態数(隠れ状態数)の候補(候補値)の集合(状態数候補集合)、および収束判定の閾値を取得する。以下、混合モデルを構成するコンポーネントの種類を単にコンポーネントの種類と記載する。
状態数設定部102は、状態数候補集合のうち、まだ計算が完了していない要素の数を状態数として設定する。
初期化処理部103は、状態数設定部102が設定した状態数に応じて、推定のために、コンポーネントの種類および潜在変数の変分確率および各コンポーネントのパラメータ、ハイパーパラメータ、および自由パラメータ選択変数を初期化する。初期化処理部103は、例えば、コンポーネントの種類をランダムに選択する。また、初期化処理部103は、例えば、選択された種類に応じたパラメータの初期値、潜在変数の変分確率、および自由パラメータ選択変数の初期値をランダムに設定する。潜在変数の変分確率は、周辺化尤度を計算するための、潜在変数の事後確率の近似値である。
潜在変数変分確率計算処理部111は、現在設定されているコンポーネントの種類、およびパラメータ、自由パラメータ選択変数に基づき、潜在変数の変分確率を推定する。潜在変数変分確率計算処理部111は、具体的には、観測値データ、初期化処理部103が設定したコンポーネントの種類、モデルのパラメータ、潜在変数の変分確率、自由パラメータ選択変数を取得する。後述する収束判定処理において収束していないと判定され、再度の計算を行う場合は、潜在変数変分確率計算処理部111は、コンポーネント最適化処理部112が前に推定したコンポーネントの種類およびモデルのパラメータ、自らが前に計算した潜在変数の変分確率、自由パラメータ選択変数計算部113が前に出力した、自由パラメータ選択変数を取得する。潜在変数変分確率計算処理部111は、これら取得したデータを用いて、自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるように潜在変数の変分確率を計算する。モデル事後確率は、観測値を得た際のモデルの事後確率である。
潜在変数変分確率計算処理部111は、変分確率q(z)を、自由度を限定したモデル事後確率の下界の最大化によって計算する。まず自由度を限定したモデル事後確率の下界を説明する。自由度を限定したモデル事後確率は、以下の式(8)のようにあらわされる。
Figure 0006536157
また、式(8)の下界は、変分確率q(z)を用いて以下の式(9)のように表される。
Figure 0006536157
また、式(9)の右辺の積分にラプラス近似を適用すると以下の式(11)のように下界が得られる。Kは取りうる状態の数である。D(H,ξ)は、Hで各コンポーネントのモデルを選んだ場合のコンポーネントkのモデルの自由度であり式(10)のように表される。
Figure 0006536157
Figure 0006536157
さらに、対数関数が凹関数であることを利用すると、以下の式(12)のように下界が求められる。
Figure 0006536157
潜在変数変分確率計算処理部111は、この下界の関数を最大化するようにqを求める。この下界の関数を最適化基準と呼ぶ。q(チルダ付き)に関しては、qの前の更新時の値を用いると最大となるため、qの前の更新時の値を代入する。各変分確率、パラメータのt回目の更新時の値を、上付きの添え字で(t)と表すことにする。潜在変数変分確率計算処理部111は、変分確率の値を以下の式(13)のように計算する。
Figure 0006536157
コンポーネント最適化処理部112は、現在の潜在変数の変分確率に基づき、コンポーネントの種類およびパラメータを推定する。コンポーネント最適化処理部112は、具体的には、観測値データ、初期化処理部103に設定されたコンポーネントの種類、モデルのパラメータ、潜在変数の変分確率および自由パラメータ選択変数を取得する。後述する収束判定処理において収束していないと判定され、再度の計算を行う場合は、コンポーネント最適化処理部112は、自らが前に推定したコンポーネントの種類およびモデルのパラメータ、潜在変数変分確率計算処理部111が前に計算した潜在変数の変分確率、自由パラメータ選択変数計算部113が前に出力した、自由パラメータ選択変数を取得する。
コンポーネント最適化処理部112は、取得したデータを用いて、混合モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるようにコンポーネントの種類及びそのパラメータを最適化することにより最適な混合モデルおよびパラメータを推定する。コンポーネント最適化処理部112は、具体的には、コンポーネントの種類Hおよびパラメータφを、自由度を限定したモデル事後確率の下界の最大化によって計算する。潜在変数変分確率計算処理部111と同様に下界をもとめ、コンポーネントの種類およびパラメータを以下の式(14)のように計算する。この下界は、コンポーネントごとに計算できるため、コンポーネントの種類の組み合わせ全てに計算する必要がなくコンポーネントの種類まで最適化が可能である。
Figure 0006536157
自由パラメータ選択変数計算部113は、コンポーネント最適化処理部112の結果から、自由パラメータとして推定するパラメータを選択する。すなわち、自由パラメータ選択変数計算部113は、自由パラメータ選択変数を計算する。自由パラメータ選択変数計算部113は、具体的には、現在の潜在変数変分確率と、コンポーネントの種類及びパラメータを取得し、コンポーネントごとに観測値への寄与が大きいものだけ自由パラメータ選択変数に1を与えるよう推定する。
自由パラメータ選択変数計算部113は、例えば、各コンポーネントkごとに、変分確率が正のサンプルのみによりL1正則化項をつけてパラメータを推定し、パラメータjの絶対値が閾値以上のものだけξkj=1としてもよい。
最適性判断処理部114は、現在の潜在変数変分確率、コンポーネントの種類及びパラメータ、観測データおよび自由パラメータ選択変数をもとに、自由度を限定したモデル事後確率の最大化を継続するかを判断する。前回の更新での最適化基準との差分が十分小さくなったかどうかによって小さければ終了、大きければ継続と判断する。
最適性判断処理部114は、継続と判断した場合には、潜在変数変分確率、コンポーネントの種類及びパラメータを潜在変数変分確率計算処理部111に出力する。終了と判断した場合には、入力された状態数の候補集合で計算の終わっていない要素がある場合はそれらの計算を実施する。最適性判断処理部114は、すべての状態数の候補で計算が終わったならば、その中で最適化基準が最も大きい状態数での潜在変数変分確率、コンポーネントの種類及び各パラメータを結果出力部121に出力する。
本実施形態のモデル推定システムは、このように最適化基準が収束するまで、潜在変数変分確率とコンポーネントの種類、パラメータの計算処理を繰り返す。各処理で必ず最適化基準が増加する。
結果出力部121は、取得した潜在変数変分確率とコンポーネントの種類及び各パラメータを出力する。
なお、隠れ状態とは、潜在変数に設定される値を示す。隠れ状態数とは、潜在変数に設定される値の候補値の数を示す。利用者は、隠れ状態数、隠れ状態を潜在変数変分確率から求めることができる。例えば、利用者は、各サンプルに対応する複数の隠れ状態のうち、最も変分確率が大きい隠れ状態を選択する。また、利用者は、各サンプルにおける変分確率の和が正になる隠れ状態の個数を隠れ状態数とすることができる。
次に、本実施形態のモデル推定システムの動作を説明する。図2は、本実施形態のモデル推定システムの動作を示すフローチャートである。
まず、データ入力部101は、観測値データ、コンポーネントの種類候補、状態数の候補集合、収束判定基準を含むデータを取得する(ステップA1)。
次に、状態数設定部102は、状態数の候補集合のうちまだ計算されていない要素の数を状態数として設定する(ステップA2)。
次に、初期化処理部103は、状態数に応じて潜在変数変分確率およびコンポーネントの種類及びモデルのパラメータ、自由パラメータ選択変数を初期化する(ステップA3)。
次に、潜在変数変分確率計算処理部111は、自由度を限定したモデル事後確率の下界を最大化するよう、潜在変数変分確率を計算する(ステップA4)。
次に、コンポーネント最適化処理部112は、自由度を限定したモデル事後確率の下界を最大化するよう、モデルの種類(コンポーネントの種類)及びモデルのパラメータを計算する(ステップA5)。
次に、自由パラメータ選択変数計算部113が、自由パラメータ選択変数を計算する(ステップA6)。
次に、最適性判断処理部114が、最適化基準が収束したかどうかを判定する(ステップA7)。もし、最適化基準が収束していなければ(ステップA8のNO)、モデル推定システムは、ステップA4に戻りステップA4からステップA7までの処理を繰り返す。
もし、最適化基準が収束していれば(ステップA8のYES)、ステップA9に進む。
次に、最適性判断処理部114は、入力された状態数候補すべてについて計算を終えたかを判定する(ステップA9)。
終わっていなければ、モデル推定システムは、ステップA2に進み、ステップA2からステップA8までの処理を繰り返す。
終わっていれば、最適性判断処理部114が、これまでに計算したモデル選択結果のうち、最適化基準が最大のものを選択する(ステップA10)。結果出力部121は、選択された結果を出力する(ステップA11)。
このようにしてモデル選択およびそのモデルの推定が実現される。本実施形態では、潜在変数変分確率を先に計算し、その後コンポーネントの種類及びモデルのパラメータを推定し、その後自由パラメータ選択変数を計算するよう手順を説明したが、この3つの処理の順序は入れ替えてもよい。
また、利用者は、本実施形態のモデル推定システムを用いれば、隠れ状態数、隠れ状態を潜在変数変分確率から求めることができる。また、本実施形態のモデル推定システムは、自由変数パラメータを計算することにより、コンポーネントのパラメータの次元が大きくても、推定誤差を少なくすることができる。
実施形態2.
第2の実施形態(実施形態2)では、ξも含めてモデル化し、それを推定する方法を説明する。図3は、第2の実施形態のモデル推定システムの構成を示すブロック図である。以下、第1の実施形態と同じ構成の説明を省略する。
初期化処理部203は、潜在変数の変分確率、パラメータ、および自由パラメータ選択変数の初期値を設定する。初期化処理部203は、具体的には、状態数設定部102が設定した状態数に応じて、推定のために、コンポーネントの種類および潜在変数の変分確率および各コンポーネントのパラメータ、自由パラメータ選択変数、および自由パラメータ選択変数の分布のパラメータを初期化する。初期化処理部203は、例えば、コンポーネントの種類をランダムに選択する。また、初期化処理部203は、例えば、選択された種類に応じたパラメータ、潜在変数の変分確率、および自由パラメータ選択変数、および自由パラメータ選択変数分布のパラメータの初期値をランダムに設定する。
潜在変数変分確率計算処理部211は、現在設定されているコンポーネントの種類、およびパラメータ、自由パラメータ選択変数に基づき、潜在変数の変分確率を推定する。潜在変数変分確率計算処理部211は、具体的には、観測値データ、初期化処理部203が設定したコンポーネントの種類、モデルのパラメータ、潜在変数の変分確率、自由パラメータ選択変数、および自由パラメータ選択変数分布のパラメータを取得する。後述する収束判定処理において収束していないと判定され、再度の計算を行う場合は、潜在変数変分確率計算処理部211は、コンポーネント最適化処理部212が前に推定したコンポーネントの種類およびモデルのパラメータ、自らが前に計算した潜在変数の変分確率、自由パラメータ選択変数計算部213が前に出力した、自由パラメータ選択変数、自由パラメータ選択変数分布最適化処理部214が前に計算した自由パラメータ選択変数分布を取得する。潜在変数変分確率計算処理部211は、これら取得したデータを用いて、自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるように潜在変数の変分確率を計算する。
潜在変数変分確率計算処理部211は、変分確率q(z)を、自由度を限定したモデル事後確率の下界の最大化によって計算する。まず自由度を限定したモデル事後確率の下界を説明する。自由度を限定した対数モデル事後確率は、以下の式(15)のように表される。
Figure 0006536157
ただし、ここでp(ξ|β)は、予め任意に設定されたξの分布とする。
式(15)の下界は、変分確率q(z)とr(ξ)を用いて以下の式(16)のように表すことができる。
Figure 0006536157
また、式(16)の右辺の積分にラプラス近似を適用すると以下の式(17)のように下界が得られる。Kは取りうる状態の数である。D(H,ξ)は、Hで各コンポーネントのモデルを選んだ場合のコンポーネントkのモデルの自由度であり、式(10)のようにあらわされる。ただし、この方法に限らず、特定の事前分布を仮定し解析的に積分消去してもよい。
Figure 0006536157
さらに、対数関数が凹関数であることを利用すると、以下の式(18)のように下界が求まる。
Figure 0006536157
潜在変数変分確率計算処理部211は、この下界の関数を最大化するようにqを求める。この下界の関数を最適化基準と呼ぶ。q(チルダ付き)に関しては、qの前の更新時の値を用いると最大となるため、qの前の更新時の値を代入する。各変分確率、パラメータのt回目の更新時の値を、上付きの添え字で(t)と表すことにする。潜在変数変分確率計算処理部211は、変分確率の値を以下の式(19)のように計算する。
Figure 0006536157
コンポーネント最適化処理部212は、現在の潜在変数の変分確率に基づき、コンポーネントの種類およびパラメータを推定する。コンポーネント最適化処理部212は、具体的には、観測値データ、初期化処理部203に設定されたコンポーネントの種類、モデルのパラメータ、潜在変数の変分確率、自由パラメータ選択変数、および自由パラメータ選択変数分布のパラメータを取得する。後述する収束判定処理において収束していないと判定され、再度の計算を行う場合は、コンポーネント最適化処理部212は、自らが前に推定したコンポーネントの種類およびモデルのパラメータ、潜在変数変分確率計算処理部211が前に計算した潜在変数の変分確率、自由パラメータ選択変数計算部213が前に出力した、自由パラメータ選択変数、ならびに自由パラメータ選択変数分布最適化処理部214が前に計算した自由パラメータ選択変数分布を取得する。
コンポーネント最適化処理部212は、取得したデータを用いて、混合モデルのコンポーネントごとに分離され、自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるようにコンポーネントの種類及びそのパラメータを最適化することにより最適な混合モデルおよびパラメータを推定する。コンポーネント最適化処理部212は、コンポーネントの種類Hおよびパラメータφを、自由度を限定したモデル事後確率の下界の最大化によって計算する。潜在変数変分確率計算処理部の説明にあったように下界をもとめ、コンポーネントの種類およびパラメータを以下の式(20)のように計算する。この下界は、コンポーネントごとに計算できるため、コンポーネントの種類の組み合わせ全てに計算する必要がなくコンポーネントの種類まで最適化が可能である。
Figure 0006536157
自由パラメータ選択変数計算部213は、現在の潜在変数変分確率と、コンポーネントの種類及びパラメータを入力として、自由度を限定したモデル事後確率の下界の最大化によって自由パラメータ選択変数の変分確率を計算する(式(21)のrに関する値)。
また、自由パラメータ選択変数分布最適化処理部214は、自由パラメータ選択変数計算部213が計算した自由パラメータ選択変数の変分確率を取得し、自由パラメータ選択変数分布のパラメータを、自由度を限定したモデル事後確率の下界の最大化によって計算する(式(21)のβに関する値)。
Figure 0006536157
最適性判断処理部215は、現在の潜在変数変分確率、コンポーネントの種類及びパラメータ、観測データおよび自由パラメータ選択変数をもとに、自由度を限定したモデル事後確率の最大化を継続するかを判断する。前回の更新での最適化基準との差分が十分小さくなったかどうかによって小さければ終了、大きければ継続と判断する。
最適性判断処理部215は、継続と判断した場合には、潜在変数変分確率、コンポーネントの種類及びパラメータを潜在変数変分確率計算処理部211に入力する。終了と判断した場合には、入力された状態数の候補集合で計算の終わっていない要素がある場合はそれらの計算を実施する。最適性判断処理部215は、すべての状態数の候補で計算が終わったならば、その中で最適化基準が最も大きい状態数での潜在変数変分確率、コンポーネントの種類及び各パラメータを結果出力部121に出力する。
本実施形態のモデル推定システムは、このように最適化基準が収束するまで、潜在変数変分確率とコンポーネントの種類、各パラメータの計算処理を繰り返す。各処理で必ず最適化基準が増加する。
次に、第2の実施形態の動作を、図4に示すフローチャートを用いて説明する。
まず、データ入力部101は、観測値データ、コンポーネントの種類候補、状態数の候補集合、収束判定基準を入力する(ステップA1)。
次に、状態数設定部102は、状態数の候補集合のうちまだ計算されていない要素の数を状態数として設定する(ステップA2)。
次に、初期化処理部203は、状態数に応じて潜在変数変分確率およびコンポーネントの種類及びモデルのパラメータ、自由パラメータ選択変数を初期化する(ステップA3)。
次に、潜在変数変分確率計算処理部211は、自由度を限定したモデル事後確率の下界を最大化するよう、潜在変数変分確率を計算する(ステップA4)。
次に、コンポーネント最適化処理部212は、自由度を限定したモデル事後確率の下界を最大化するよう、コンポーネントの種類及びモデルのパラメータを計算する(ステップA5)。
自由パラメータ選択変数計算部213は、自由パラメータ選択変数の変分確率を計算する(ステップB1)。
次に、自由パラメータ選択変数分布最適化処理部214は、自由パラメータ選択変数分布のパラメータを計算する(ステップB2)。
次に、最適性判断処理部215が、最適化基準が収束したかどうかを判定する(ステップA7)。もし、最適化基準が収束していなければ(ステップA8のNO)、モデル推定システムは、ステップA4に戻りステップA4からステップA7までの処理を繰り返す。
もし、最適化基準が収束していれば(ステップA8のYES)、ステップA9に進む。
次に、最適性判断処理部215は、入力された状態数候補すべてについて計算を終えたかを判定する(ステップA9)。
終わっていなければ、モデル推定システムは、ステップA2に進み、ステップA2からステップA8までの処理を繰り返す。
終わっていれば、最適性判断処理部215が、これまでに計算したモデル選択結果のうち、最適化基準が最大のものを選択する(ステップA10)。結果出力部121は、選択された結果を出力する(ステップA11)。
このようにしてモデル選択およびそのモデルの推定が実現される。本実施形態のモデル推定システムは、モデル事後確率の最大化という潜在変数変分確率計算処理部211およびコンポーネント最適化処理部212と同じ方法で自由パラメータ選択を行うことができる。本実施形態では、潜在変数変分確率を先に計算し、その後コンポーネントの種類及びモデルのパラメータを計算、その後自由パラメータ選択変数の変分確率を計算、自由パラメータ選択変数の生成分布パラメータを計算するよう手順を説明したが、この4者の順序は入れ替えてもよい。
実施形態3.
図5は、第3の実施形態のモデル推定システムの構成を示すブロック図である。本実施形態のモデル推定システムは、図1に示す第1の実施形態の構成に加え、コンポーネント削除判定処理部315を備えている。本実施形態のモデル推定システムのコンポーネント削除判定処理部315以外の構成は、図1に示す第1の実施形態と同様であるため、説明を省略する。
コンポーネント削除判定処理部315は、コンポーネント最適化処理部112から出力された潜在変数変分確率をもとに、コンポーネントの潜在変数変分確率を全て0として推定するかどうかを決定する。
コンポーネント削除判定処理部315は、潜在変数の変分確率を取得し、各コンポーネントにおいて、変分確率の和が閾値よりも小さければ当該コンポーネントの変分確率を0とする。コンポーネント削除判定処理部315は、コンポーネントkが次の式(22)を満たすならば、そのコンポーネントの潜在変数の変分確率を全て0として推定する。
Figure 0006536157
図6は、本実施形態のモデル推定システムの動作を示すフローチャートである。図6に示すフローチャートは、ステップA6とステップA7の間にステップC1を含む点のみ、図2に示す第1の実施形態のフローチャートと異なる。よって、図2に示す第1の実施形態と同一の動作については、説明を省略する。
コンポーネント削除判定処理部315は、基準を満たすコンポーネントの変分確率を0に設定する(ステップC1)。
本実施形態のモデル推定システムは、コンポーネント削除判定処理部315を備えることにより、潜在変数の変分確率の和が0に収束するコンポーネントをより速く0に推定することができるため、より高速な推定が可能となる。
また、本実施形態のモデル推定システムは、第2の実施形態のモデル推定システムにコンポーネント削除判定処理部315を追加した構成であってもよい。その場合、本実施形態のモデル推定システムの動作は、図4に示すステップB2とステップA7の間にステップC1を挿入したフローチャートにより表される。
実施例1(Latent Dirichlet Allocation)
コンポーネントのパラメータの次元が非常に大きくなる代表的な例は、文書の生成モデルである。
非特許文献1のLatent Dirichlet Allocationのモデルにも、第1の実施形態から第3の実施形態のモデル推定システムを応用することが可能である。これにより、トピック数を手動でチューニングすることなく適切な基準のもと高速にモデル選択を実現することができる。
例えば、検索結果文書の集合をクラスタリングし、検索結果を一目で把握したい場合、検索結果集合ごとに、そのクラスタ数は異なる。第1の実施形態から第3の実施形態のモデル推定システムは、高速にトピック数をチューニングしてそれぞれの属するトピックを推定できるため、多くの文書集合に対しクラスタリングを実施する場合にも応用が可能である。
実施例2(売れ方の近い店舗のクラスタリング)
小売り店舗の商品配置を考える際、売れ行きの近い店舗の売上を参考に商品構成を考えることが有用であると予想される。売れ行きの近い店舗をクラスタリングするために、各店舗で商品の売り上げをモデル化した場合、商品の数が多いため、コンポーネントの次元が大きくなってしまう。このような場合でも、第1の実施形態から第3の実施形態のモデル推定システムによって店舗のクラスタ数を設定することなくクラスタリングを実施できる。
図7は、本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、ディスプレイ装置1005と、入力デバイス1006とを備える。
各実施形態のモデル推定システムは、コンピュータ1000に実装される。モデル推定システムの動作は、プログラム(モデル推定プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、そのプログラムに従って上記の処理を実行する。
補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、上記の処理を実行してもよい。
また、プログラムは、前述の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。
次に本発明の主要部の構成を説明する。本発明によるモデル推定システムは、主要な構成要素として、隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力部101と、状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定部102と、潜在変数の変分確率、パラメータ、ハイパーパラメータ、コンポーネントの種類、および自由パラメータ選択変数の初期値を設定する初期化処理部103と、観測値データ、ならびに初期化処理部103が設定した潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理部111と、観測値データ、ならびに初期化処理部103が設定した潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適なコンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理部112と、コンポーネント最適化処理部112が推定したコンポーネントの種類およびそのパラメータ、ならびに潜在変数変分確率計算処理部111が計算した潜在変数の変分確率を取得し、自由パラメータ選択変数を計算する自由パラメータ選択変数計算部113と、観測値データ、コンポーネント最適化処理部112が推定したコンポーネントの種類およびそのパラメータ、潜在変数変分確率計算処理部111が計算した潜在変数の変分確率、ならびに自由パラメータ選択変数計算部113が計算した自由パラメータ選択変数を取得し、自由度が限定された周辺化モデル事後確率の下界の最大化を継続するかを判定する最適性判断処理部114と、潜在変数変分確率計算処理部111が計算した潜在変数の変分確率、コンポーネント最適化処理部112が推定したコンポーネントの種類およびそのパラメータを出力する結果出力部121とを備えた。
また、上記の各実施形態には以下の(1)〜(3)に記載されたモデル推定システムも開示されている。
(1)隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力部101と、状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定部102と、潜在変数の変分確率、パラメータ、ハイパーパラメータ、コンポーネントの種類、自由パラメータ選択変数、および自由パラメータ選択変数分布のパラメータの初期値を設定する初期化処理部203と、観測値データ、ならびに初期化処理部203が設定した潜在変数の変分確率、コンポーネントの種類、パラメータ、自由パラメータ選択変数および自由パラメータ選択変数分布のパラメータを取得し、自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理部211と、観測値データ、ならびに初期化処理部203が設定した潜在変数の変分確率、コンポーネントの種類、パラメータ、自由パラメータ選択変数および自由パラメータ選択変数分布のパラメータを取得し、隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適なコンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理部212と、コンポーネント最適化処理部212が推定したコンポーネントの種類およびそのパラメータ、ならびに潜在変数変分確率計算処理部211が計算した潜在変数の変分確率を取得し、自由パラメータ選択変数を計算する自由パラメータ選択変数計算部213と、自由パラメータ選択変数計算部213が計算した自由パラメータ選択変数を取得し、自由パラメータ選択変数分布のパラメータを計算する自由パラメータ選択変数分布最適化処理部214と、観測値データ、コンポーネント最適化処理部212が推定したコンポーネントの種類およびそのパラメータ、潜在変数変分確率計算処理部211が計算した潜在変数の変分確率、自由パラメータ選択変数計算部213が計算した自由パラメータ選択変数、自由パラメータ選択変数分布最適化処理部214が計算した自由パラメータ選択変数分布のパラメータを取得し、自由度が限定された周辺化モデル事後確率の下界の最大化を継続するかを判定する最適性判断処理部215と、潜在変数変分確率計算処理部211が計算した潜在変数の変分確率、コンポーネント最適化処理部212が推定したコンポーネントの種類およびそのパラメータを出力する結果出力部121とを備えたことを特徴とするモデル推定システム。
(2)モデル推定システムは、潜在変数の変分確率を取得し、各コンポーネントにおいて、変分確率の和が閾値よりも小さければ当該コンポーネントの変分確率を0とするコンポーネント削除判定処理部(例えば、コンポーネント削除判定処理部315)を備えるように構成されていてもよい。
(3)モデル推定システムは、最適性判断処理部が、周辺化モデル事後確率の下界の最大化を継続すると判定した場合に、潜在変数変分確率計算処理部は、コンポーネント最適化処理部が前に推定したコンポーネントの種類およびパラメータならびに自らが前に計算した潜在変数の変分確率を取得し、再度、周辺化モデル事後確率の下界が最大となるように潜在変数の変分確率を計算し、コンポーネント最適化処理部は、自らが前に推定したコンポーネントの種類およびパラメータ、ならびに潜在変数変分確率計算処理部が前に計算した潜在変数の変分確率を取得し、再度、隠れ変数モデルのコンポーネントごとに分離された周辺化モデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定するように構成されていてもよい。
パラメータの数がサンプルと共に増大するような隠れ変数モデルの推定に適用できる。
101 データ入力部
102 状態数設定部
103、203 初期化処理部
111、211 潜在変数変分確率計算処理部
112、212 コンポーネント最適化処理部
113、213 自由パラメータ選択変数計算部
114、215 最適性判断処理部
121 結果出力部
214 自由パラメータ選択変数分布最適化処理部
315 コンポーネント削除判定処理部

Claims (9)

  1. 隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力部と、
    前記状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定部と、
    潜在変数の変分確率、パラメータ、ハイパーパラメータ、前記コンポーネントの種類、および自由パラメータ選択変数の初期値を設定する初期化処理部と、
    前記観測値データ、ならびに前記初期化処理部が初期値を設定した潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、当該自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理部と、
    前記観測値データ、ならびに前記初期化処理部が初期値を設定した潜在変数の変分確率、コンポーネントの種類、パラメータおよび自由パラメータ選択変数を取得し、前記隠れ変数モデルのコンポーネントごとに分離され当該自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるように前記コンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理部と、
    前記コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、ならびに前記潜在変数変分確率計算処理部が計算した潜在変数の変分確率を取得し、自由パラメータ選択変数を計算する自由パラメータ選択変数計算部と、
    前記観測値データ、前記コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、前記潜在変数変分確率計算処理部が計算した潜在変数の変分確率、ならびに前記自由パラメータ選択変数計算部が計算した自由パラメータ選択変数を取得し、自由度が限定されたモデル事後確率の下界の最大化を継続するかを判定する最適性判断処理部と、
    前記潜在変数変分確率計算処理部が計算した潜在変数の変分確率、前記コンポーネント最適化処理部が推定した前記コンポーネントの種類およびそのパラメータを出力する結果出力部とを備えた
    ことを特徴とするモデル推定システム。
  2. 隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力部と、
    前記状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定部と、
    潜在変数の変分確率、パラメータ、ハイパーパラメータ、前記コンポーネントの種類、自由パラメータ選択変数の変分確率、および自由パラメータ選択変数分布のパラメータの初期値を設定する初期化処理部と、
    前記観測値データ、ならびに前記初期化処理部が初期値を設定した潜在変数の変分確率、コンポーネントの種類、パラメータ、自由パラメータ選択変数および自由パラメータ選択変数分布のパラメータを取得し、当該自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理部と、
    前記観測値データ、ならびに前記初期化処理部が設定した潜在変数の変分確率、コンポーネントの種類、パラメータ、自由パラメータ選択変数および自由パラメータ選択変数分布のパラメータを取得し、前記隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるように前記コンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理部と、
    前記コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、ならびに前記潜在変数変分確率計算処理部が計算した潜在変数の変分確率を取得し、自由パラメータ選択変数の変分確率を計算する自由パラメータ選択変数計算部と、
    前記自由パラメータ選択変数計算部が計算した自由パラメータ選択変数の変分確率を取得し、自由パラメータ選択変数分布のパラメータを計算する自由パラメータ選択変数分布最適化処理部と、
    前記観測値データ、前記コンポーネント最適化処理部が推定したコンポーネントの種類およびそのパラメータ、前記潜在変数変分確率計算処理部が計算した潜在変数の変分確率、前記自由パラメータ選択変数計算部が計算した自由パラメータ選択変数の変分確率、前記自由パラメータ選択変数分布最適化処理部が計算した自由パラメータ選択変数分布のパラメータを取得し、自由度が限定されたモデル事後確率の下界の最大化を継続するかを判定する最適性判断処理部と、
    前記潜在変数変分確率計算処理部が計算した潜在変数の変分確率、前記コンポーネント最適化処理部が推定した前記コンポーネントの種類およびそのパラメータを出力する結果出力部とを備えた
    ことを特徴とするモデル推定システム。
  3. 潜在変数の変分確率を取得し、各コンポーネントにおいて、前記変分確率の和が閾値よりも小さければ当該コンポーネントの変分確率を0とするコンポーネント削除判定処理部を備えた
    請求項1または請求項2記載のモデル推定システム。
  4. 最適性判断処理部が、モデル事後確率の下界の最大化を継続すると判定した場合に、
    潜在変数変分確率計算処理部は、コンポーネント最適化処理部が前に推定したコンポーネントの種類およびパラメータ、自らが前に計算した潜在変数の変分確率、ならびに自由パラメータ選択変数計算部が前に計算した自由パラメータ選択変数を取得し、再度、モデル事後確率の下界が最大となるように潜在変数の変分確率を計算し、
    前記コンポーネント最適化処理部は、自らが前に推定したコンポーネントの種類およびパラメータ、前記潜在変数変分確率計算処理部が前に計算した潜在変数の変分確率、ならびに前記自由パラメータ選択変数計算部が前に計算した自由パラメータ選択変数を取得し、再度、隠れ変数モデルのコンポーネントごとに分離されたモデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定し、
    前記自由パラメータ選択変数計算部は、前記コンポーネント最適化処理部が前に推定したコンポーネントの種類およびパラメータ、ならびに前記潜在変数変分確率計算処理部が前に計算した潜在変数の変分確率を取得し、再度、自由パラメータ選択変数の変分確率を計算する
    請求項1記載のモデル推定システム。
  5. 最適性判断処理部が、モデル事後確率の下界の最大化を継続すると判定した場合に、
    潜在変数変分確率計算処理部は、コンポーネント最適化処理部が前に推定したコンポーネントの種類およびパラメータ、自らが前に計算した潜在変数の変分確率、自由パラメータ選択変数計算部が前に計算した自由パラメータ選択変数の変分確率、ならびに自由パラメータ選択変数分布最適化処理部が前に計算した自由パラメータ選択変数分布のパラメータを取得し、再度、モデル事後確率の下界が最大となるように潜在変数の変分確率を計算し、
    前記コンポーネント最適化処理部は、自らが前に推定したコンポーネントの種類およびパラメータ、前記潜在変数変分確率計算処理部が前に計算した潜在変数の変分確率、前記自由パラメータ選択変数計算部が前に計算した自由パラメータ選択変数の変分確率、ならびに前記自由パラメータ選択変数分布最適化処理部が前に計算した自由パラメータ選択変数分布のパラメータを取得し、再度、隠れ変数モデルのコンポーネントごとに分離されたモデル事後確率の下界が最大となるようにコンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定し、
    前記自由パラメータ選択変数計算部は、前記コンポーネント最適化処理部が前に推定したコンポーネントの種類およびパラメータ、ならびに前記潜在変数変分確率計算処理部が前に計算した潜在変数の変分確率を取得し、再度、自由パラメータ選択変数の変分確率を計算し、
    前記自由パラメータ選択変数分布最適化処理部は、前記自由パラメータ選択変数計算部が前に計算した自由パラメータ選択変数の変分確率を取得し、再度、自由パラメータ選択変数分布のパラメータを計算する
    請求項2記載のモデル推定システム。
  6. 隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得し、
    前記状態数候補集合のうちまだ計算が完了していない要素を状態数として設定し、
    潜在変数の変分確率、パラメータ、ハイパーパラメータ、前記コンポーネントの種類、および自由パラメータ選択変数の初期値を設定し、
    前記観測値データ、ならびに初期値が設定された前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータおよび前記自由パラメータ選択変数を取得し、前記自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるような潜在変数の変分確率を計算し、
    前記観測値データ、ならびに初期値が設定された前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータおよび前記自由パラメータ選択変数を取得し、前記隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるように前記コンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定し、
    推定された前記コンポーネントの種類およびそのパラメータ、ならびに計算された前記潜在変数の変分確率を取得し、自由パラメータ選択変数を計算し、
    前記観測値データ、推定された前記コンポーネントの種類およびそのパラメータ、計算された前記潜在変数の変分確率、ならびに計算された前記自由パラメータ選択変数を取得し、自由度が限定されたモデル事後確率の下界の最大化を継続するかを判定し、
    計算された前記潜在変数の変分確率、推定された前記コンポーネントの種類およびそのパラメータを出力する
    ことを特徴とするモデル推定方法。
  7. 隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得し、
    前記状態数候補集合のうちまだ計算が完了していない要素を状態数として設定し、
    潜在変数の変分確率、パラメータ、ハイパーパラメータ、前記コンポーネントの種類、自由パラメータ選択変数の変分確率、および自由パラメータ選択変数分布のパラメータの初期値を設定し、
    前記観測値データ、ならびに初期値が設定された前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータ、前記自由パラメータ選択変数および前記自由パラメータ選択変数分布のパラメータを取得し、前記自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるような潜在変数の変分確率を計算し、
    前記観測値データ、ならびに初期値が設定された前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータ、前記自由パラメータ選択変数および前記自由パラメータ選択変数分布のパラメータを取得し、前記隠れ変数モデルのコンポーネントごとに分離され前記自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるように前記コンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定し、
    推定された前記コンポーネントの種類およびそのパラメータ、ならびに計算された前記潜在変数の変分確率を取得し、自由パラメータ選択変数の変分確率を計算し、
    計算された前記自由パラメータ選択変数の変分確率を取得し、自由パラメータ選択変数分布のパラメータを計算し、
    前記観測値データ、推定された前記コンポーネントの種類およびそのパラメータ、計算された前記潜在変数の変分確率、計算された前記自由パラメータ選択変数の変分確率、計算された前記自由パラメータ選択変数分布のパラメータを取得し、自由度が限定されたモデル事後確率の下界の最大化を継続するかを判定し、
    計算された前記潜在変数の変分確率、推定された前記コンポーネントの種類およびそのパラメータを出力する
    ことを特徴とするモデル推定方法。
  8. コンピュータに、
    隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力処理と、
    前記状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定処理と、
    潜在変数の変分確率、パラメータ、ハイパーパラメータ、前記コンポーネントの種類、および自由パラメータ選択変数の初期値を設定する初期化処理と、
    前記観測値データ、ならびに初期値が設定された前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータおよび前記自由パラメータ選択変数を取得し、前記自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理と、
    前記観測値データ、ならびに初期値が設定された前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータおよび自由パラメータ選択変数を取得し、前記隠れ変数モデルのコンポーネントごとに分離され前記自由パラメータ選択変数により自由度が限定された周辺化モデル事後確率の下界が最大となるように前記コンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理と、
    推定された前記コンポーネントの種類およびそのパラメータ、ならびに計算された前記潜在変数の変分確率を取得し、自由パラメータ選択変数を計算する自由パラメータ選択変数計算処理と、
    前記観測値データ、推定された前記コンポーネントの種類およびそのパラメータ、計算された前記潜在変数の変分確率、ならびに計算された前記自由パラメータ選択変数を取得し、自由度が限定された周辺化モデル事後確率の下界の最大化を継続するかを判定する最適性判断処理と、
    計算された前記潜在変数の変分確率、推定された前記コンポーネントの種類およびそのパラメータを出力する結果出力処理と
    を実行させるためのモデル推定プログラム。
  9. コンピュータに、
    隠れ変数モデルの推定対象となる観測値データ、隠れ変数モデルを構成するコンポーネントの種類、およびその状態数候補集合を取得するデータ入力処理と、
    前記状態数候補集合のうちまだ計算が完了していない要素を状態数として設定する状態数設定処理と、
    潜在変数の変分確率、パラメータ、ハイパーパラメータ、前記コンポーネントの種類、自由パラメータ選択変数の変分確率、および自由パラメータ選択変数分布のパラメータの初期値を設定する初期化処理と、
    前記観測値データ、ならびに前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータ、前記自由パラメータ選択変数および前記自由パラメータ選択変数分布のパラメータを取得し、前記自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるような潜在変数の変分確率を計算する潜在変数変分確率計算処理と、
    前記観測値データ、ならびに前記潜在変数の変分確率、前記コンポーネントの種類、前記パラメータ、前記自由パラメータ選択変数および前記自由パラメータ選択変数分布のパラメータを取得し、前記隠れ変数モデルのコンポーネントごとに分離され自由パラメータ選択変数により自由度が限定されたモデル事後確率の下界が最大となるように前記コンポーネントの種類およびそのパラメータを最適化することにより最適な前記コンポーネントの種類およびそのパラメータを推定するコンポーネント最適化処理と、
    推定された前記コンポーネントの種類およびそのパラメータ、ならびに計算された潜在変数の変分確率を取得し、自由パラメータ選択変数の変分確率を計算する自由パラメータ選択変数計算処理と、
    計算された前記自由パラメータ選択変数の変分確率を取得し、自由パラメータ選択変数分布のパラメータを計算する自由パラメータ選択変数分布最適化処理と、
    前記観測値データ、推定された前記コンポーネントの種類およびそのパラメータ、計算された前記潜在変数の変分確率、計算された前記自由パラメータ選択変数の変分確率、計算された前記自由パラメータ選択変数分布のパラメータを取得し、自由度が限定されたモデル事後確率の下界の最大化を継続するかを判定する最適性判断処理と、
    計算された前記潜在変数の変分確率、推定された前記コンポーネントの種類およびそのパラメータを出力する結果出力処理と
    を実行させるためのモデル推定プログラム。
JP2015091413A 2015-04-28 2015-04-28 モデル推定システム、モデル推定方法およびモデル推定プログラム Active JP6536157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015091413A JP6536157B2 (ja) 2015-04-28 2015-04-28 モデル推定システム、モデル推定方法およびモデル推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015091413A JP6536157B2 (ja) 2015-04-28 2015-04-28 モデル推定システム、モデル推定方法およびモデル推定プログラム

Publications (2)

Publication Number Publication Date
JP2016207136A JP2016207136A (ja) 2016-12-08
JP6536157B2 true JP6536157B2 (ja) 2019-07-03

Family

ID=57490079

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015091413A Active JP6536157B2 (ja) 2015-04-28 2015-04-28 モデル推定システム、モデル推定方法およびモデル推定プログラム

Country Status (1)

Country Link
JP (1) JP6536157B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727768B (zh) * 2019-10-24 2022-10-11 中国科学院计算技术研究所 一种候选回答语句生成和自然语言选择方法及系统
CN111276183B (zh) * 2020-02-25 2023-03-21 云南大学 一种基于参数估计的张量分解处理海量基因序列的方法
CN113485269B (zh) * 2021-07-20 2023-01-03 浙江大学 一种基于隐变量模型的工业过程监测方法

Also Published As

Publication number Publication date
JP2016207136A (ja) 2016-12-08

Similar Documents

Publication Publication Date Title
Thornton et al. Auto-WEKA: Combined selection and hyperparameter optimization of classification algorithms
US10839314B2 (en) Automated system for development and deployment of heterogeneous predictive models
JP6443858B2 (ja) 算出装置、算出方法、学習装置、学習方法、及びプログラム
CA3088689C (en) Finite rank deep kernel learning for robust time series forecasting and regression
JP6299759B2 (ja) 予測関数作成装置、予測関数作成方法、及びプログラム
Dhar et al. Admm based scalable machine learning on spark
US20220138194A1 (en) Parameter optimization apparatus, method, and system
WO2018079225A1 (ja) 自動予測システム、自動予測方法および自動予測プログラム
JP6536157B2 (ja) モデル推定システム、モデル推定方法およびモデル推定プログラム
US9355196B2 (en) Model estimation device and model estimation method
Ver Steeg et al. Demystifying information-theoretic clustering
CA3119533C (en) Finite rank deep kernel learning with linear computational complexity
CA3119351C (en) Extending finite rank deep kernel learning to forecasting over long time horizons
JP6743902B2 (ja) マルチタスク関係学習システム、方法およびプログラム
Bonneuil et al. Viable ramsey economies
Friebe et al. Adaptive runtime estimate of task execution times using bayesian modeling
Hannah et al. Semiconvex regression for metamodeling-based optimization
JP6414321B2 (ja) 人数予測システム、人数予測方法および人数予測プログラム
JP6550899B2 (ja) モデル推定システム、モデル推定方法およびモデル推定プログラム
US9489632B2 (en) Model estimation device, model estimation method, and information storage medium
Oliveira et al. k-Nearest neighbor for short term water demand forecasting
JP5815468B2 (ja) スパム分類モデル生成装置及び方法及びプログラム
Vakilzadeh Stochastic model updating and model selection with application to structural dynamics
JPWO2011016281A1 (ja) ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
JP2009301557A (ja) 学習システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190520

R150 Certificate of patent or registration of utility model

Ref document number: 6536157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150