JP5970579B2 - 混合モデル決定用の装置、方法、およびプログラム - Google Patents

混合モデル決定用の装置、方法、およびプログラム Download PDF

Info

Publication number
JP5970579B2
JP5970579B2 JP2015051731A JP2015051731A JP5970579B2 JP 5970579 B2 JP5970579 B2 JP 5970579B2 JP 2015051731 A JP2015051731 A JP 2015051731A JP 2015051731 A JP2015051731 A JP 2015051731A JP 5970579 B2 JP5970579 B2 JP 5970579B2
Authority
JP
Japan
Prior art keywords
component
latent variable
indicates
sample data
objective function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015051731A
Other languages
English (en)
Other versions
JP2015179513A (ja
Inventor
ロ フン
ロ フン
シュンチェン リュウ
シュンチェン リュウ
遼平 藤巻
遼平 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2015179513A publication Critical patent/JP2015179513A/ja
Application granted granted Critical
Publication of JP5970579B2 publication Critical patent/JP5970579B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Description

本開示は、統計の技術分野に関する。特に、混合モデルのモデル選択用の方法と装置に関する。
統計的手法の継続的な発展に伴い、混合モデルは産業分野で幅広く利用されている。混合モデルは、データ分布を見積もり、複合分布又はデータクラスタリングの構築を完璧に行う、混合型の確率密度関数を採用する。例えば、テキストカテゴライゼイション、手書き認識、不明瞭画像の分割、行動検出等を、混合モデルを使用して達成することができる。混合モデルは、ガウス混合モデル、ストキャスティックリレーショナルモデル等を包含する確率モデル族を含む。どのタイプの混合モデルでもあろうと、混合モデルは、潜在変数の変分分布とモデルパラメータに応じて決定され得る。潜在変数は、直接観測できないがサンプルデータに基づく推論により取得される変数である。潜在変数の変分分布はサンプルデータがその対応するカテゴリにクラスタ化される確率を表す。モデルパラメータは、混合モデルを含む各サブモデルパラメータを表す。混合モデルがより幅広く適用されるようになったことに伴い、そのモデル選択の課題は話題の研究テーマになっている。
現在、ストキャスティック変分推論(Stochastic Variational Inference)[マット ホフマン(Matt Hoffman)他著、マシンラーニングリサーチジャーナル(Journal of Machine Learning Research)、2013年]の論文は、混合モデルのモデル選択の方法を提案している。この方法によれば、第一に、サンプルデータと潜在変数とモデルパラメータとに応じて決定された対数尤度(logarithm likelihood)と、潜在変数の変分分布(variational distribution)の対数と、が取得される。第二に、ストキャスティック平均場変分推論理論(stochastic mean-field variational inference theory)に基づいて、目的関数は、対数尤度と潜在変数の変分分布の対数とに応じて推論される。そして、第三に、いくつかの潜在変数とモデルパラメータとが選択され、サンプルセットから抽出されたサブサンプルのセットに応じて評価され、このようにすることは、目的関数の収束を保証するモデルパラメータと潜在変数の変分分布とを決定する助けとなる。そして、最後に、混合モデルが、目的関数の収束を可能にする潜在変数の変分分布とモデルパラメータとに応じて決定される。
本開示のプロセスにおいて、発明者は先行技術が以下のような課題を有することを見つける。
目的関数が対数尤度と潜在変数の変分分布の対数とに応じて決定されるため、目的関数に応じて決定される混合モデルは複雑である。
先行技術の技術的課題を解決するために、本開示の実施形態は、混合モデル決定用の方法及び装置を提供する。技術的解決方法は以下の通りである。
第1の観点によると、提供される混合モデル決定用の方法は、
サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度と正規化項と前記潜在変数の変分分布の対数とを取得し、前記対数尤度と前記正規化項と潜在変数の前記変分分布の対数とに応じて目的関数を決定すること、
前記サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする潜在変数の変分分布と前記コンポーネントパラメータとを決定し、前記目的関数の収束を可能にする前記潜在変数の変分分布と前記コンポーネントパラメータとに応じて混合モデルを決定すること、
を含む。
第1の観点に関し、第1の観点の第1の可能な実施方法において、
前記サンプルデータと前記潜在変数と前記コンポーネントパラメータとに応じて決定される前記対数尤度は、
Figure 0005970579
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、xは前記サンプルデータを示し、Nはサンプルデータの数を示し、Zは前記潜在変数を示し、θはコンポーネントパラメータのセットを示し、前記コンポーネントパラメータは、α、φを含み、αは前記コンポーネントの混合比を示し、φはコンポーネント用のモデルパラメータを示し、各コンポーネントは自身を表現するモデルパラメータのサブセットを有する。
第1の観点に関し、第1の観点の第2の第1の可能な実施方法において、前記サンプルデータと前記潜在変数と前記コンポーネントパラメータとに応じて決定される前記正規化項は、
Figure 0005970579
であって、Nはサンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは前記潜在変数を示し、
Figure 0005970579
は潜在変数の変分分布の近似値を示し、αはコンポーネントの混合比を示し、Dαはαの次元を示し、DはコンポーネントCの前記サブモデルパラメータの次元を示し、L(a、b)=logb+(a−b)/bであって、aは、
Figure 0005970579
を示し、bは
Figure 0005970579
を示す。
第1の観点に関し、第1の観点の第3の可能な実施方法において、前記サンプルデータと前記潜在変数と前記コンポーネントパラメータとに応じて決定される潜在変数の前記変分分布の対数はlogq(Z)であり、q(Z)は潜在変数Zの変分分布を示し、Nはサンプルデータの数を示す。
第1の観点の、第1の観点から第3の可能な実施方法までのいずれの可能な実施方法に関し、第1の観点の第4の可能な実施方法において、前記対数尤度と前記正規化項と前記潜在変数の前記変分分布の対数とに応じて目的関数を決定することは、
前記対数尤度の期待値と前記正規化項の期待値と潜在変数の前記変分分布の対数の期待値とに応じて、前記目的関数を決定することを含む。
第1の観点の第4の可能な実施方法に関し、第1の観点の第5の可能な実施方法において、前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布の対数の期待値とに応じて決定された前記目的関数
Figure 0005970579
は、
Figure 0005970579
である。
第1の観点の第5の可能な実施方法に関し、第1の観点の第6の実施方法において、前記サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする前記潜在変数の変分分布と前記コンポーネントパラメータとを決定することは、
前記サンプルセットから抽出された各サブサンプルデータに応じて、前記潜在変数の変分分布とコンポーネントパラメータとを取得すること、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、前記目的関数が収束するかどうかを判別し、前記目的関数が収束しない場合、前記目的関数の収束を可能にする潜在変数の前記変分分布と前記コンポーネントパラメータとを取得するまで、前記サンプルセットから抽出された前記各サブサンプルデータに応じて、前記潜在変数の前記変分分布と前記コンポーネントパラメータを再取得すること、
を含む。
第1の観点の第6の可能な実施方法に関して、第1の観点の第7の可能な実施方法において、前記サンプルセットから抽出された各サブサンプルデータに応じて、前記潜在変数の変分分布とコンポーネントパラメータを取得することは、
各サブサンプル用の前記潜在変分分布を、前記サンプルセットから抽出された前記サブサンプルデータに応じて、取得し、各コンポーネントパラメータの中間値を、前記各サブサンプルデータに対応する前記潜在変数の前記変分分布に応じて、取得すること、
前記コンポーネントパラメータのひとつの平均値を、前記サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて、決定し、前記コンポーネントパラメータの前記平均値に応じて前記コンポーネントパラメータを取得すること、
を含む。
第1の観点の第7の可能な実施方法に関して、第1の観点の第8の可能な実施方法において、各サブサンプル用の前記潜在変分分布は、次の数式
Figure 0005970579
を使用することにより、前記サンプルセットから抽出された前記各サブサンプルデータに応じて取得され、
前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値
Figure 0005970579

Figure 0005970579
とは、次の数式
Figure 0005970579
を使用することにより、各サブサンプル用の前記潜在変分分布に応じて取得され
前記コンポーネントパラメータの前記平均値
Figure 0005970579

Figure 0005970579
は、次の数式
Figure 0005970579
を使用することにより、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて決定され、
前記コンポーネントパラメータ
Figure 0005970579

Figure 0005970579
とは、次の数式
Figure 0005970579
を使用することにより、前記コンポーネントパラメータの前記平均値に応じて取得され、
tは現在の取得を示し、t−1は前回の取得又は初期設定を示し、ρは更新ステップを示し、
Figure 0005970579
は、c番目のコンポーネント内の第Iのサブサンプルデータに対応する前記潜在変分分布を示し、Sはサブサンプルデータセットを示し、
Figure 0005970579
は、前記サブサンプルデータセット内の第Iのサブサンプルデータを示し、αはc番目のコンポーネントパラメータαを示し、φはc番目のコンポーネントの前記コンポーネントパラメータφを示す。
第1の観点の第6の可能な実施方法から第8の可能な実施方法までのいずれかの可能な実施方法に関し、第1の観点の第9の可能な実施方法において、前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、前記目的関数が収束するかどうかを判別するステップは、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前回取得された前記潜在変数の変分分布とコンポーネントパラメータとに応じて決定される前回取得された目的関数の値と、の差(距離)がしきい値より小さいかどうかを判別すること、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前記前回取得された目的関数の値と、の差(距離)が前記しきい値より小さい場合、前記目的関数が収束していると判別すること、
を含む。
第2の観点によると、提供される混合モデル決定用の装置は、
サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度と正規化項と前記潜在変数の変分分布の対数とを取得するように構成された取得モジュールと、
前記対数尤度と前記正規化項と潜在変数の前記変分分布の対数とに応じて目的関数を決定するように構成された第1決定モジュールと、
サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする潜在変数の変分分布と前記コンポーネントパラメータとを決定するように構成された第2決定モジュールと、
前記目的関数の収束を可能にする潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、混合モデルを決定するように構成された第3決定モジュールと、
を含む。
第2の観点に関し、第2の観点の第1の実施方法において、前記取得モジュールにより取得される前記対数尤度は、
Figure 0005970579
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、xは前記サンプルデータを示し、Nはサンプルデータの数を示し、Zは前記潜在変数を示し、θはコンポーネントパラメータのセットを示し、前記コンポーネントパラメータは、α、φを含み、αはコンポーネントの混合比を示し、φはコンポーネント用のモデルパラメータを示し、各コンポーネントは、自身を表現するモデルパラメータのサブセットを有する。
第2の観点に関し、第2の観点の第2の実施方法において、前記取得モジュールにより取得される前記正規化項は、
Figure 0005970579
であって、Nは前記サンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは前記潜在変数を示し、
Figure 0005970579
は潜在変数の変分分布の近似値を示し、αはコンポーネントの混合比を示し、Dαはαの次元を示し、Dは前記コンポーネントcの前記サブモデルパラメータの次元を示し、L(a,b)=lоgb+(a−b)/bであり、aは
Figure 0005970579
を示し、bは、
Figure 0005970579
を示す。
第2の観点に関し、第2の観点の第3の実施方法において、前記取得モジュールによって取得される前記潜在変数の前記変分分布の対数は、logq(Z)であり、
q(Z)は潜在変数Zの変分分布を示し、Nはサンプルデータの数を示す。
第2の観点の第2の観点から第3の可能な実施方法までのいずれかの可能な実施方法に関し、第2の観点の第4の可能な実施方法において、前記第1決定モジュールは、前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布の対数の期待値とに応じて、前記目的関数を決定するように構成されている。
第2の観点の第4の可能な実施方法に関し、第2の観点の第5の実施方法において、前記第1決定モジュールにより決定される前記目的関数
Figure 0005970579
は、
Figure 0005970579
である。
第2の観点の第5の可能な実施方法に関し、第2の観点の第6の実施方法において、前記第2決定モジュールは、
前記サンプルセットから抽出された各サブサンプルデータに応じて、前記潜在変数の変分分布とコンポーネントパラメータとを取得するように構成された取得ユニットと、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、前記目的関数が収束するかどうかを判別するように構成された判別ユニットと、
前記目的関数が収束しない場合、前記目的関数の収束を可能にする潜在変数の前記変分分布と前記コンポーネントパラメータを取得するまで、前記サンプルセットから抽出された前記各サンプルデータに応じて、前記潜在変数の前記変分分布と前記コンポーネントパラメータとを再取得するように構成された取得ユニットと、
を含む。
第2の観点の第6の可能な実施方法に関し、第2の観点の第7の実施方法において、前記取得ユニットは、
各サブサンプルデータ用の前記潜在変分分布を、前記サンプルセットから抽出された前記各サブサンプルデータに応じて、取得するように構成された第1取得サブユニットと、
各コンポーネントパラメータの中間値を、前記各サブサンプルデータに対応する前記潜在変数の前記変分分布に応じて、取得するように構成された第2取得サブユニットと、
前記コンポーネントパラメータのひとつの平均値を、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて、決定するように構成された第1決定サブユニットと、
前記コンポーネントパラメータの前記平均値に応じて前記コンポーネントパラメータを取得するように構成された第3取得サブユニットと、
を含む。
第1の観点の第7の可能な実施方法に関し、第1の観点の第8の可能な実施方法において、前記第1取得サブユニットは、各サブサンプルデータ用の前記潜在変分分布を、次の数式
Figure 0005970579
を使用することにより、前記サンプルセットから抽出された前記各サブサンプルデータに応じて取得するように構成されており、
前記第2取得サブユニットは、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値
Figure 0005970579

Figure 0005970579
とを、次の数式
Figure 0005970579
を使用することにより、各サブサンプルデータ用の前記潜在変分分布に応じて取得するように構成されており、
前記第1決定サブユニットは、前記コンポーネントパラメータの前記平均値
Figure 0005970579

Figure 0005970579
とを、次の数式
Figure 0005970579
を使用することにより、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて取得するように構成されており、
前記第3取得サブユニットは、前記コンポーネントパラメータ
Figure 0005970579

Figure 0005970579
とを、次の数式
Figure 0005970579
を使用することにより、前記コンポーネントパラメータの前記中間値に応じて取得するように構成されており、
tは現在の取得を示し、t−1は前回の取得又は初期設定を示し、ρは更新ステップを示し、
Figure 0005970579
はc番目のコンポーネント内の第Imサブサンプルデータに対応する前記潜在変分分布を示し、Sはサブサンプルデータセットを示し、
Figure 0005970579
は、前記サブサンプルデータセット中の第Imサブサンプルデータを示し、αはc番目のコンポーネントのコンポーネントパラメータαを示し、φはc番目のコンポーネントのコンポーネントパラメータφを示す。
第2の観点の第6の可能な実施方法から第7の実施方法までのいずれかの可能な実施方法に関し、第2の観点の第9の可能な実施方法において、前記判別ユニットは、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前回取得された前記潜在変数の変分分布とコンポーネントパラメータとに応じて決定される前回取得された目的関数の値との差(距離)がしきい値より小さいかどうかを判別するように構成された比較サブユニットと、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前記前回取得された目的関数の値との差(距離)が前記しきい値より小さい場合、前記目的関数が収束していると決定する構成された、第2決定サブユニットと、
を含む。
本開示の実施形態において提供される技術的解決方法は、次のような有益な効果を得る。
目的関数は、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される、対数尤度と正規化項と潜在変数の変分分布の対数とに応じて決定される。混合モデルは、目的関数の収束を可能にする、潜在変数の変分分布とコンポーネントパラメータとに応じて決定される。正規化項が目的関数に導入されるので、混合モデルの複雑性が自動的に制御され、大規模なデータ処理に適用される。
本開示の実施形態における技術的解決方法をより良く理解するために、実施形態を記述するための添付図面は以下のように簡単に説明される。明らかに、以下の説明における添付図面は、本開示のいくつかの実施形態だけを説明し、当業者は、いかなる創造的な努力をすることもなく、これたの添付図面に基づいて、他の添付図面を導きだしてもよい。
本開示の実施形態1に係る混合モデル決定用の方法のフローチャートである。 本開示の実施形態2に係る混合モデル決定用の方法のフローチャートである。 本開示の実施形態3に係る混合モデル決定用の装置の概略構成図である。 本開示の実施形態3に係る第2決定モジュールの概略構成図である。 本開示の実施形態3に係る取得ユニットの概略構成図である。 本開示の実施形態3に係る判別ユニットの概略構成図である。
本開示の目的、技術的解決方法、及び利点をより明確するために、本開示の実施形態では、添付図面を参照して以下に詳細に説明する。
(実施形態1)
本開示の実施形態は、混合モデル決定用の方法を提供する。図1を参照し、方法は以下のステップを含む。
ステップ101:サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される、対数尤度と正規化項と潜在変数の変分分布の対数とを取得する。対数尤度と正規化項と潜在変数の変分分布の対数とに応じて目的関数を決定する。
任意の実施形態のように、
サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定された対数尤度は、
Figure 0005970579
であって、logp()は対数尤度を示し、pは同時確率密度関数を示し、xはサンプルデータを示し、Nはサンプルデータの数を示し、Zは潜在変数を示し、θはコンポーネントパラメータのセットを示し、コンポーネントパラメータは、α、φを含み、αはコンポーネントの混合比を示し、φはコンポーネントのモデルパラメータを示し、各コンポーネントは自身を表現するモデルパラメータのサブセットを有する。
任意の実施形態のように、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定された正規化項は、
Figure 0005970579
であって、Nはサンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは潜在変数を示し、
Figure 0005970579
は潜在変数の変分分布の近似値を示し、αはコンポーネントの混合比を示し、Dαはαの次元を示し、Dは、コンポーネントcのサブモデルパラメータの次元を示し、L(a、b)=logb+(a−b)/bであって、aは、
Figure 0005970579
を示し、bは
Figure 0005970579
を示す。
任意の実施形態のように、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定された潜在変数の変分分布の対数はlogq(Z)であり、q(Z)は潜在変数Zの変分分布を示し、Nはサンプルデータの数を示す。
任意の実施形態のように、対数尤度と正規化項と潜在変数の変分分布の対数とに応じて目的関数を決定することは、
対数尤度の期待値と正規化項の期待値と潜在変数の変分分布の対数の期待値とに応じて目的関数を決定することを含む。
任意の実施形態のように、目的関数
Figure 0005970579
は、対数尤度の期待値と正規化項の期待値と潜在変数の変分分布の対数の期待値とに応じて決定され、
Figure 0005970579
である。
ステップ102:サンプルセットから抽出されたサブサンプルデータに応じて、目的関数の収束を可能にする潜在変数の変分分布とコンポーネントパラメータとを決定する。目的関数の収束を可能にする潜在変数の変分分布とコンポーネントパラメータとに応じて混合モデルを決定する。
任意の実施形態のように、目的関数の収束を可能にする潜在変数の変分分布とコンポーネントパラメータを、サンプルセットから抽出されたサブサンプルデータに応じて決定することは、
サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータとを取得すること、
潜在変数の変分分布とコンポーネントパラメータとに応じて、目的関数が収束するかどうかを判別し、目的関数が収束しない場合、サンプルセットから抽出された各サブサンプルデータに応じて、目的関数の収束を可能にする潜在変数の変分分布とコンポーネントパラメータを取得するまで、潜在変数の変分分布とコンポーネントパラメータを再取得すること、
を含む。
任意の実施形態のように、サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータを取得することは、
サンプルセットから抽出された各サブサンプルデータに対応する潜在変数の変分分布を、各サブサンプルデータに応じて、取得し、各サブサンプルデータに対応するコンポーネントパラメータの中間値を、各サブサンプルデータに対応する潜在変数の変分分布に応じて、取得すること、
サブサンプルデータに対応するコンポーネントパラメータの中間値に応じて、コンポーネントパラメータのひとつの平均値を決定し、コンポーネントパラメータの平均値に応じてコンポーネントパラメータを取得すること、
を含む。
任意の実施形態のように、各サブサンプルに対応する潜在変数の変分分布は、次の数式を使用して、サンプルセットから抽出された各サブサンプルデータに応じて取得される。
Figure 0005970579
各サブサンプルデータに対応するコンポーネントパラメータの中間値
Figure 0005970579

Figure 0005970579
とは、次の数式を使用して、各サブサンプルデータに対応する潜在変数の変分分布に応じて取得される。
Figure 0005970579
コンポーネントパラメータの平均値
Figure 0005970579

Figure 0005970579
とは、次の数式を使用して、各サブサンプルデータに対応するコンポーネントパラメータの中間値に応じて、決定される。
Figure 0005970579
コンポーネントパラメータ
Figure 0005970579
と、
Figure 0005970579
とは、次の数式を使用し、コンポーネントパラメータの平均値に応じて、取得される。
Figure 0005970579
ここで、tは現在の取得を示し、t−1は前回の取得又は初期設定を示し、ρは更新ステップを示し、
Figure 0005970579
はc番目のコンポーネント内の第Iのサブサンプルデータに対応する潜在変数の変分分布を示し、Sはサブサンプルデータセットを示し、
Figure 0005970579
は、サブサンプルデータセット中の第Iのサブサンプルデータを示し、αはc番目のコンポーネントのコンポーネントパラメータαを示し、φはc番目のコンポーネントのコンポーネントパラメータφを示す。
任意の実施形態のように、潜在変数の変分分布とコンポーネントパラメータとに応じて、目的関数が収束するかどうかを判別することは、
潜在変数の変分分布とコンポーネントパラメータとに応じて決定された目的関数の値と、前回取得された潜在変数の変分分布とコンポーネントパラメータとに応じて決定される前回取得された目的関数の値と、の差(距離)がしきい値より小さいかどうかを判別すること、
潜在変数の変分分布とコンポーネントパラメータとに応じて決定された目的関数の値と、前回取得された目的関数の値との差(距離)がしきい値より小さい場合、目的関数が収束していると判別すること、
を含む。
本開示において提供される方法によれば、目的関数は、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される、対数尤度と正規化項と潜在変数の変分分布の対数とに応じて決定される。混合モデルは、目的関数の収束を可能にする潜在変数の変分分布とコンポーネントパラメータとに応じて決定される。正規化項が導入されるので、混合モデルの複雑性は自動的に制御され、大規模なデータ処理に適用される。さらに、潜在変数とコンポーネントパラメータとは互いに依存関係にあるため、潜在変数の変分分布とコンポーネントパラメータとの決定はより正確であり、混合モデルの決定もより正確である。
(実施形態2)
本開示の実施形態は混合モデル決定用の方法を提供する。上述の実施形態の説明に関し、この実施形態において提供する方法を詳細に説明する。図2を参照し、方法は以下のステップを含む。
ステップ201:サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される、対数尤度と正規化項と潜在変数の変分分布の対数とを取得する。
この実施形態は、サンプルデータの内容に何の限定も設けない。特定の実施例中、各サンプルデータは、1又は複数の特徴ベクトルを含む。
理解を容易にするために、説明は、一例として下記のサンプルデータを使用してなされる。サンプルデータはベクトル形式で表される。ベクトルの要素は、商品1から5を示す。ベクトル中のいずれかの要素xは商品jの特徴ベクトルを示し、x=(xj1,…,xjn)、1≦j≦5であり、jとnとはいずれも正の整数である。xjnは、温度、日付、商品の注文数量のようなアトリビュートを示してもよい。
Figure 0005970579
コンポーネントパラメータは、コンポーネント混合比、各コンポーネントのサブモデルパラメータ等を含むが、これらに限定されない。この実施形態は、コンポーネントパラメータの特定の内容に何の限定も設けない。一例として、ベクター形式のサンプルデータを使用する場合、コンポーネント混合比は、決定された混合モデルにおけるベクトルの要素の総数に対する、決定された混合モデルにおける各コンポーネント内の要素数の比である。各コンポーネントのサブモデルパラメータは、決定された混合モデルにおける各コンポーネントのデータ分布のパラメータである。
留意すべきは、潜在変数とコンポーネントパラメータとは互いに独立であってよい、又は、互いに依存関係にあってもよい。実際には、決定された混合モデルをより正確にするために、潜在変数とコンポーネントパラメータとは依存関係にあるので、この実施形態においては、潜在変数とコンポーネントパラメータとが依存関係にある場合を例に説明する。
さらに、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される、対数尤度と正規化項と潜在変数の変分分布の対数を取得するため、まず、同時確率密度関数がこの実施形態で提供される方法に導入される。
Figure 0005970579
ここで、pは同時確率密度関数を示し、xはサンプルデータを示し、Nはサンプルデータの数を示し、Zは潜在変数を示し、θはコンポーネントパラメータのセットを示す。コンポーネントパラメータはα、φを含み、αはコンポーネント混合比を示し、φはコンポーネントのモデルパラメータを示し、Cはコンポーネントの個数を示す。
混合モデルの確率密度分布は、上述の同時確率密度関数によって決定される。コンポーネントパラメータα、φと、同時確率密度関数中の潜在変数Zが一旦決定されると、混合モデルの確率密度分布が決定され、このようにして、混合モデルは決定される。同時確率密度関数を解けるようにするため、次のような対数尤度を取得するため、対数は関数の両端で分けられる。
Figure 0005970579
任意の実施形態のように、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度は、
Figure 0005970579
であって、lоgp()は対数尤度を示し、pは同時確率密度関数を示し、xはサンプルデータを示し、Nはサンプルデータの数を示し、Zは潜在変数を示し、θはコンポーネントパラメータのセットを示す。コンポーネントパラメータは、α、φを含み、αはコンポーネント混合比を示し、φはコンポーネントのためのモデルパラメータを示す。
具体的には、サンプルデータxがベクトル形式で表される場合、Nはベクトルの要素数を示し、Cはコンポーネントの個数を示す。Zは、N×Cの潜在変数の行列を示す、Zの各要素を考慮すると、
Figure 0005970579
であって、Znc=1の場合、要素は、サンプルデータxがc番目のコンポーネントに適切であることを示し、Znc=0の場合、要素は、サンプルデータxがc番目のコンポーネントに適切でないことを示す。コンポーネント混合比αは、サンプルデータ中のベクトルの要素の総数に対する、混合モデルの各コンポーネントの要素数の比である。ここで、各コンポーネントのサブモデルパラメータφは、混合モデル中の各コンポーネントのサンプルデータがコンポーネント内で従う分布のパラメータである。例えば、コンポーネントの各々のサンプルデータがガウス分布に従う場合、φはガウス分布の期待値μと分散δとを示す。例えば、コンポーネントの各々のサンプルデータがポアソン分布に従う場合、φはポアソン分布の期待値と分散λを示す。加えて、上述の分布、各コンポーネントのサンプルデータは他の分布に従ってもよいことに留意すべきであり、この実施形態ではこれらを限定しない。
任意の実施形態のように、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される正規化項は、
Figure 0005970579
であって、Nはサンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは潜在変数を示し、
Figure 0005970579
は、潜在変数の変分分布の近似値を示し、αはコンポーネントの混合比を示し、Dαはαの次元を示し、DはコンポーネントCのサブモデルパラメータの次元を示す。L(a,b)=lоgb+(a−b)/bであり、aは
Figure 0005970579
を示し、bは、
Figure 0005970579
を示す。
具体的には、Cが潜在変数の行列Z中のコンポーネントの個数を示す場合、Dα=D(α)=C−1である。各コンポーネントのサンプルデータがガウス分布に従うとき、ガウス分布の期待値と分散はそれぞれμとδであるため、ガウス分布は2つのパラメータを含み、Dα=D(α)=2である。各コンポーネントのサンプルデータがポアソン分布に従うとき、ポアソン分布の期待値と分散はいずれもλであり、言い換えれば、ポアソン分布はパラメータλのみを含み、Dα=D(α)=1である。
加えて、この実施形態では、潜在変数の変分分布の近似値
Figure 0005970579
には、何の限定も設けないものの、前回の取得又は初期設定において取得された更新された潜在変数の変分分布の値が含まれる。ただし、これに限られない。ここで、潜在変数の変分分布は目的関数の収束を可能にすることができない。理解を容易にするため、この実施形態は、前回の取得又は初期設定において取得された、更新された潜在変数の変分分布の値が、潜在変数の変分分布の近似値
Figure 0005970579
を示す例により、説明される。正規化項が最初に決定されるとき、潜在変数の変分分布の近似値が、潜在変数の変分分布の初期値とされる。正規化項が最初に決定されないとき、潜在変数の変分分布の近似値は、前回の取得の際に、更新された潜在変数の変分分布の値とされる。
正規化項を使用することにより、決定された混合モデルの複雑性が自動的に制御され、混合モデルの決定の効率が向上されることに留意すべきである。
任意の実施形態のように、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される潜在変数の変分分布の対数は、lоgq(Z)であって、q(Z)は潜在変数Zの変分分布を示し、Nはサンプルデータの数を示す。
具体的には、潜在変数Zの変分分布は、
Figure 0005970579
と示されてよい。
ステップ202:対数尤度の期待値と正規化項の期待値と潜在変数の変分分布の対数の期待値とに応じて目的関数を決定する。
ステップ201では、対数尤度は因数分解の形式で表されていた。対数を解けるようにするにあたり、対数のコンパクト(compact,タイト)な下界、言い換えれば以下に示す因子化情報量基準(Factorized Information Criterion)(FIC)、を取得するため各因数はラプラス近似に従う。
Figure 0005970579
ここで、
Figure 0005970579
は、FICが最大値を取ったときのθの値を示す。
さらに、FICがサンプルデータxと潜在変数Zとを含むため、通常は期待値最大化(Expectation Maximization)(EM)アルゴリズムを使用して解かねばならない。しかしながら、混合モデルは非独立の潜在変数に応じて決定されているため、従来のEMアルゴリズムは、FICの解の取得に適していない。FICを解けるようにするにあたり、この実施形態は、FICの漸近的一致性(asymtotically-consistent)下界FICLBを取得するため、FICの換算を採用し、FIC漸近的一致性(asymtotically-consistent)下界FICLBは決定された目的関数である。
したがって、任意の実施形態のように、対数の期待値と正規化項の期待値と潜在変数の変分分布の期待値とに応じて決定される目的関数
Figure 0005970579
は、
Figure 0005970579
である。
さらに、上述のステップを使用して、目的関数が決定される。目的関数を使用して混合モデルを決定するため、この実施形態が提供する方法はさらに次のステップを含む。
ステップ203:サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータとを取得する。
任意の実施形態のように、サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータとを取得することは、
サンプルセットから抽出された各サブサンプルデータに応じて、各サブサンプルデータ用の潜在変分分布を取得すること、各サブサンプルデータに対応するコンポーネントパラメータの中間値を、各サブサンプルデータに対応する潜在変分分布に応じて、取得すること、
コンポーネントパラメータのひとつの平均値を、各サブサンプルデータに対応するコンポーネントパラメータの中間値に応じて、決定すること、コンポーネントパラメータの平均値に応じてコンポーネントパラメータを取得すること、
を含む。ただし、これに限られない。
任意の実施形態のように、各サブサンプルデータに対応する潜在変分分布は、サンプルセットから抽出された各サブサンプルデータに応じて、次の数式を使用して、取得される。
Figure 0005970579
各サンプルデータに対応するコンポーネントパラメータの中間値
Figure 0005970579
と、
Figure 0005970579
とは、各サブサンプルデータに対応する潜在変分分布に応じて、次式を使用して取得される。
Figure 0005970579
コンポーネントパラメータの平均値
Figure 0005970579

Figure 0005970579
とは、各サブサンプルデータに対応するコンポーネントパラメータの中間値に応じて、次式を使用して決定される。
Figure 0005970579
コンポーネントパラメータ
Figure 0005970579

Figure 0005970579
とは、コンポーネントパラメータの平均値に応じて、次式を使用して求められる。
Figure 0005970579
ここで、tは現在の取得を示し、t−1は、前回の取得又は初期設定を示し、ρは更新ステップを示し、
Figure 0005970579

は、c番目のコンポーネント内の第Imサブサンプルデータに対応する潜在変分分布を示し、Sはサブサンプルデータセットを示し、
Figure 0005970579
は、サブサンプルデータセット中の第Imサブサンプルデータを示し、αはc番目のコンポーネントのコンポーネントパラメータαを示し、φはc番目のコンポーネントのコンポーネントパラメータφを示す。
具体的には、更新ステップρは、(t+τ)−k,τ≧0,k∈(0.5,1]により計算される。
初めて、潜在変数の変分分布とコンポーネントパラメータとを取得するため、ステップ203の数式が最初に使用されるとき、t−1は初期設定を示し、したがって、t−1に対応するパラメータは初期設定の値となる。例えば、ステップ203で最初に、潜在変分分布とコンポーネントパラメータとが取得されるとき、数式の、
Figure 0005970579
はαの初期値を示し、
Figure 0005970579
はφの初期値を示す。
潜在変数の変分分布とコンポーネントパラメータとを取得するため、最初にステップ203の数式が使用されないとき、t−1は前回の取得を示し、したがって、t−1に対応するパラメータは前回の取得された値となる。例えば、潜在変数の変分分布とコンポーネントパラメータとが3回目のステップ203で取得されたとき、数式の、
Figure 0005970579
は、潜在変数の変分分布とコンポーネントパラメータとが2回目に取得されたときのαの値を示し、
Figure 0005970579
は、潜在変数の変分分布とコンポーネントパラメータが2回目に取得されたときのφを示す。
計算の負荷を低減し、混合モデルの決定の効率を向上させるため、この実施形態で提供される方法において、サブサンプルデータはサンプルセットから抽出される。具体的には、サブサンプルデータは、無作為抽出法(manner of random extraction)によるサンプルセットから抽出されてもよい。しかしながら、上述のサブサンプルデータの抽出方法に加えて、他の方法が採用されてもよい。この実施形態は、サブサンプルデータの抽出の方法を限定しない。
さらに、この実施形態は、各サブサンプルデータに対応する潜在変分分布を取得する方法を限定しない。特定の実施例中、潜在変分分布を算出するために使用されるコンポーネントパラメータα、φは初期化される。この実施形態は、初期化の方法を限定しない。特定の実施例中、無作為法(random manner)、つまり、コンポーネントパラメータαとφの値をランダムに初期化すること、により初期化が実行されてもよい。しかしながら、上述の方法に加えて、他の方法が採用されてもよい。
理解を容易にするため、以下の説明では、一例として、サブサンプルデータのセットSに属するサンプルセットからランダムに抽出されたサブサンプルデータが使用される。この場合、各サンプルデータ
Figure 0005970579
は、1又は複数の特徴ベクトルを含み、対応する潜在変数
Figure 0005970579
はSに含まれるサンプルデータ
Figure 0005970579
の各々について計算される。すなわち、各サブサンプルデータに対応する潜在変分分布が取得される。したがって、各サブサンプルデータに対応するコンポーネントパラメータの中間値は、各サブサンプルデータに対応する潜在変分分布に応じて取得される。コンポーネントパラメータの平均値は、各サブサンプルデータに対応するコンポーネントパラメータの中間値に応じて決定される。コンポーネントパラメータは、コンポーネントパラメータの平均値に応じて取得される。
加えて、特定の実施例において、コンポーネントの個数Cが異なるように設定されてもよい。例えば、Cの最小値をCminとし、Cの最大値をCmaxとし、Cの値の範囲内で、Cのそれぞれの値について、潜在変数の変分分布とコンポーネントパラメータが取得される。
ステップ204:潜在変数の変分分布とコンポーネントパラメータとに応じて、目的関数が収束するかどうかを判別する。目的関数が収束しない場合、目的関数の収束を可能にする、潜在変数の変分分布とコンポーネントパラメータとを取得するまで、サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータとを再取得する。
目的関数が収束しないと判別したとき、サンプルセットから抽出された各サブサンプルデータに応じた潜在変数の変分分布とコンポーネントパラメータの他の取得のときに、サンプルセットから抽出された全てのサブサンプルデータは、サブサンプルデータセットを構成することに留意すべきである。サブサンプルデータセット中の全てのサブサンプルデータに対応する潜在変分分布は、潜在変数の変分分布のセットを構成する。毎回、サンプルセットから同じサブサンプルデータが抽出される場合、同じサブサンプルデータセットが取得され、取得された潜在変数の変分分布のセットとコンポーネントパラメータは同じである。よって、繰り返しの計算を避けるため、サンプルセットから抽出された各サブサンプルデータに応じた潜在変数の変分分布とコンポーネントパラメータの他の取得のときに、少なくとも1つの異なるサブサンプルデータが、今回抽出されたサブサンプルデータにより構成されるサブサンプルデータセットと、前回抽出されたサブサンプルデータにより構成されたサブサンプルデータセットと、の範囲に存在するようすべきである。例えば、サンプルデータがA、B、C、D、Eであり、サンプルセットから最初に抽出されたサブサンプルデータがA、B、Cである。サンプルセットから抽出された各サブサンプルデータに応じた潜在変数の変分分布とコンポーネントパラメータの他の取得のときに、抽出されたサブサンプルデータがサンプルデータB、C、Dであり、このように、取得された2つの潜在変数の変分分布のセットが異なる。
任意の実施形態のように、潜在変数の変分分布とコンポーネントパラメータとに応じて、目的関数が収束するかどうかを判別する前に、方法は、さらに、コンポーネントパラメータが収束するかどうかを判別することを含む。ただし、これに限られない。
コンポーネントパラメータが収束するかどうかを判別するため、サンプルセットから抽出されたサブサンプルデータと目的関数とに応じて決定された、コンポーネントパラメータに対応するストキャスティック関数が、はじめに求められてもよい。サブサンプルデータに対応するコンポーネントパラメータに応じて、各コンポーネントパラメータに対応するストキャスティック関数が収束するかどうかが判別される。コンポーネントパラメータに対応するストキャスティック関数が収束しない場合、コンポーネントパラメータは収束しないと判別される。コンポーネントに対応するストキャスティック関数が収束する場合、コンポーネントパラメータは収束すると判別される。
さらに、目的関数
Figure 0005970579
は、FLCLB(α)及びFLCLB(φ)に書き換えられてもよい。ここで、FLCLB(α)とFCLB(φ)とは、
Figure 0005970579
である。
FLCLB(α)とFLCLB(φ)は、極値法(extreme value method)を使用して、最大値が求められる。超大規模なサンプルデータに関し、全てのサンプルデータを使用してFLCLB(α)とFLCLB(φ)の最大値を求めることは効果が低い。したがって、この実施形態で提供される方法によれば、サブサンプルデータはサンプルセットから抽出され、つまり、不偏のノイズの推定は、サブサンプルデータに基づくFLCLB(α)とFLCLB(φ)の自然勾配とされる。ストキャスティック関数
Figure 0005970579
と、
Figure 0005970579
とは次のように求められる。
Figure 0005970579
ストキャスティック関数
Figure 0005970579
と、
Figure 0005970579
の自然勾配は、FLCLB(α)とFLCLB(φ)の自然勾配の不偏の推定である。FLCLB(α)とFLCLB(φ)は、目的関数
Figure 0005970579
に応じて書き換えられる。したがって、コンポーネントパラメータが収束するかどうかの判別に代わり、潜在変数の変分分布とコンポーネントパラメータとに応じて、目的関数が収束するかどうかが直接判別されてもよい。
任意の実施形態のように、潜在変数の変分分布とコンポーネントパラメータとに応じて、目的関数が収束するかどうかを判別することは、
潜在変数の変分分布に応じて決定された目的関数の値と、前回取得された潜在変数の変分分布とコンポーネントパラメータとに応じて決定される前回取得された目的関数の値と、の差(距離)がしきい値より小さいかどうかを判別すること、
潜在変数の変分分布とコンポーネントパラメータとに応じて決定された目的関数の値と、前回取得された目的関数の値との差(距離)がしきい値より小さい場合、目的関数が収束していると判別すること、
を含む。ただし、これに限られない。
具体的には、潜在変数の変分分布とコンポーネントパラメータとに応じた目的関数の決定のとき、目的関数における潜在変数の変分分布は、全てのサンプルデータに対応する潜在変数の変分分布を示す。したがって、目的関数は、全てのサンプルデータに対応する潜在変数の変分分布とコンポーネントパラメータとに応じて決定される必要がある。ステップ203では、潜在変数の変分分布の取得のときに、サンプルセットから抽出された各サブサンプルデータに対応する潜在変分分布が取得される。つまり、ステップ203において、取得された潜在変数の変分分布は、サンプルデータ中の一部のサンプルデータに対応する潜在変数の変分分布のみであり、全てのサンプルデータに対応する潜在変数の変分分布ではない。この実施形態で提供される方法では、全てのサンプルデータに対応する潜在変数の変分分布の取得のときに、サンプルセットから今回抽出されたサブサンプルデータに関し、サンプルセットから抽出された各サブサンプルデータに対応する潜在変分分布が上述のステップ203により取得される。サンプルセットから抽出されたことがないサブサンプルデータに関し、潜在変数に対応する変分分布に初期値が設定される。サンプルセットからすでに抽出されたサブサンプルデータであって、今回サンプルセットから抽出されたものではないものに関し、上述のステップ203によりごく最近取得された潜在変数の変分分布が、今回のこれらのサブサンプルデータに対応する潜在変数の変分分布として使用される。
理解を容易にするため、一例として、サンプルデータA、B、C、D、Eとする場合を説明する。全てのサンプルデータに対応する潜在変数の変分分布の最初の取得のとき、今回抽出されたサブサンプルデータが、サンプルデータA、Bである場合、抽出されなかったサブサンプルデータは、サンプルデータC、D、Eである。したがって、サンプルデータAとBに対応する潜在変数の変分分布は、上述のステップ203により取得される。サンプルデータC、D、Eのそれぞれには初期値が設定される。
全てのサンプルデータに対応する潜在変数の変分分布の2回目の取得のときに、サブサンプルデータはサンプルセットから再度抽出され、今回抽出されたサブサンプルデータが、サンプルデータB、Cであり、抽出されなかったサブサンプルデータはサンプルデータA、D、Eである。したがって、サンプルデータB、Cに対応する潜在変数の変分分布が、上述のステップ203により取得される。サンプルデータAは抽出されないが、前回抽出されていた場合、サンプルデータAの最初の抽出のときにステップ203で取得されたサンプルデータAに対応する潜在変数の変分分布は、今回のサンプルデータAに対応する潜在変数の変分分布として使用されてもよい。サンプルデータD、Eは一度も抽出されていないため、サンプルデータD、Eに対応する潜在変数の変分分布は、引き続き初期値である。
潜在変数の変分分布の3回目の取得のときに、サンプルセットD、Eからサブサンプルデータが再度抽出され、サンプルデータA、B、Cは抽出されなかったサブサンプルデータである。サンプルデータD、Eに関し、サンプルデータD、Eに対応する潜在変数の変分分布は上述のステップ203で取得される。サンプルデータAに関し、サンプルデータAの最初の抽出のときにステップ203で取得されたサンプルデータAに対応する潜在変数の変分分布は、今回のサンプルデータAに対応する潜在変数の変分分布として使用されてもよい。サンプルデータB、Cに関し、サンプルデータBの2回目の抽出のときに続くステップ203により取得されたサンプルデータBに対応する潜在変数の変分分布は、現在のサンプルデータBに対応する潜在変数の変分分布として使用されてもよい。サンプルデータCの2回目の抽出のときに、続くステップ203により取得されたサンプルデータCに対応する潜在変数の変分分布は、現在のサンプルデータCに対応する潜在変数の変分分布として使用されてもよい。目的関数の収束を可能にする潜在変数の変分分布まで、相似が推論される。
目的関数が収束しないと判別するとき、サンプルセットから抽出された各サブサンプルデータに応じた、潜在変数の変分分布とコンポーネントパラメータとの再取得のときに、処理がステップ203に戻り、ステップ203を通過し、サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータとが再取得されることに留意すべきである。サンプルセットから抽出された各サブサンプルデータに応じた、潜在変数の変分分布とコンポーネントパラメータの最初の取得のときに、ステップ203の数式のt−1は初期値を示す。ステップ203に戻ることにより、サンプルセットから抽出された各サブサンプルデータに応じた、潜在変数の変分分布とコンポーネントパラメータとが再取得されるときに、ステップ203の数式のt−1は前回の取得を示し、サブサンプルデータは、サンプルセットから再度抽出される必要がある。例えば、ステップ203の数式を使用した、潜在変数の変分分布とコンポーネントパラメータの最初の取得のときに、数式のt−1に対応するパラメータに初期値を使用し、最初に取得された潜在変数の変分分布とコンポーネントパラメータとが取得される。最初に取得された潜在変数の変分分布とコンポーネントパラメータとが、目的関数を収束することができない場合、最初に取得された潜在変数の変分分布とコンポーネントパラメータには、ステップ203のt−1に対応するパラメータの値が使用される。潜在変数の変分分布とコンポーネントパラメータとが、サンプルセットから抽出された各サブサンプルデータに応じて再度取得され、取得された潜在変数の変分分布とコンポーネントパラメータとが、目的関数を収束することが可能であるかどうかが判別される。目的関数の収束を可能にする潜在変数の変分分布とコンポーネントパラメータまで、相似が推論される。
さらに、上記説明したステップ203から204によって、目的関数を収束することが可能な潜在変数の変分分布とコンポーネントパラメータとが、サンプルセットから抽出されたサブサンプルに応じて決定される。混合モデルの決定を達成するために、この実施形態で提供される方法は、続くステップを含む。
ステップ205:目的関数を収束することが可能な、潜在変数の変分分布とコンポーネントパラメータとに応じて、混合モデルを決定する。
このステップでは、収束が対数尤度に近づくときの目的関数の値と混合モデルとが、目的関数の収束を可能にする潜在変数の変分分布とコンポーネントパラメータとに応じて決定されてもよい。
さらに、コンポーネントの個数Cが異なるように設定されてもよい。例えば、Cの最小値をCminとし、Cの最大値をCmaxとみなすと、Cの値の範囲内で、Cのそれぞれの値について、潜在変数の変分分布とコンポーネントパラメータとが、サンプルセットから抽出された各サブサンプルデータに応じて取得される。目的関数の収束を可能にすることのもとに、目的関数を最も高い値で収束させるCが選択されてもよい。混合モデルは、Cに応じて計算された、潜在変数の変分分布とコンポーネントパラメータとに応じて決定される。
コンポーネントのセット数Cは、決定された混合モデルにおけるコンポーネントの個数と同じであってもよいし、異なっていてもよい。つまり、混合モデルの決定のとき、混合モデルの構造は自動的に適合させられる。
決定されたリレーショナルモデルは、データクラスタリングのために、あるいは、データ分類のために使用される。決定された混合モデルがデータクラスタリングに使用されるとき、混合モデル決定のプロセスは、データクラスタリングのプロセスである。決定された混合モデルがデータ分類のために使用されるとき、決定された混合モデルは、さらに処理される必要がある。データクラスタリングとデータ分類の結果は、顧客分析、生物学的解析、地理的解析等のため使用されてもよく、巨大な社会価値と経済価値を作り出す。
本開示のこの実施形態で提供された方法では、目的関数は、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定された対数尤度と正規化項と潜在変数の変分分布の対数とに応じて決定される。混合モデルは、目的関数を収束することが可能な潜在変数の変分分布とコンポーネントパラメータとに応じて決定される。正規化項は、混合モデルの複雑性を自動的に制御し、大規模なデータ処理に適用できるよう、目的関数に導入される。さらに、潜在変数とコンポーネントパラメータとは、依存関係にあるため、潜在変数の変分分布とコンポーネントパラメータの決定とはより正確であり、混合モデルの決定もより正確である。
(実施形態3)
図3を参照して、本開示の実施形態は混合モデル決定用の装置装置は、
サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される、対数尤度と正規化項と潜在変数の変分分布の対数とを取得するように構成された取得モジュール301と、
対数尤度と正規化項と潜在変数の変分分布の対数とに応じて目的関数を決定するように構成された第1決定モジュール302と、
サンプルセットから抽出されたサブサンプルデータに応じて、目的関数を収束することが可能な潜在変数の変分分布とコンポーネントパラメータとを決定するように構成された第2決定モジュール303と、
目的関数を収束することが可能な潜在変数の変分分布とコンポーネントパラメータとに応じて混合モデルを決定するように構成された第3決定モジュール304と、
を含む。
任意の実施形態のように、取得モジュール301により取得される対数尤度は、
Figure 0005970579
であって、logp()は対数尤度を示し、pは同時確率密度関数を示し、xはサンプルデータを示し、Nはサンプルデータの数を示し、Zは潜在変数を示し、θはコンポーネントパラメータのセットを示す。コンポーネントパラメータはαとφを含み、αはコンポーネント混合比を示し、φはコンポーネントのモデルパラメータを示し、各コンポーネントは自身を表現するためのモデルパラメータのサブセットを有する。
任意の実施形態のように、取得モジュール301により取得された正規化項は、
Figure 0005970579
であって、Nはサンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは潜在変数を示し、
Figure 0005970579
は、潜在変数の変分分布の近似値を示し、αはコンポーネント混合比を示し、Dαはαの次元を示し、DはコンポーネントCのサブモデルパラメータの次元を示し、L(a,b)=logb+(a−b)/bであり、aは、
Figure 0005970579
を示し、bは
Figure 0005970579
を示す。
任意の実施形態のように、取得モジュール301により取得される潜在変数の変分分布の対数は、logq(Z)であり、q(Z)は潜在変数Zの変分分布であり、Nはサンプルデータの数を示す。
任意の実施形態のように、第1決定モジュール302は、対数尤度の期待値と正規化項の期待値と潜在変数の変分分布の対数の期待値とに応じて、目的関数を決定するように構成されている。
任意の実施形態のように、第1決定モジュール302により決定される目的関数
Figure 0005970579
は、
Figure 0005970579
である。
任意の実施形態のように、図4を参照し、第2決定モジュール303は、
サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータとを取得するように構成された取得ユニット3031と、
潜在変数の変分分布とコンポーネントパラメータとに応じて、目的関数が収束するかどうかを判別するように構成された判別ユニット3032と、
目的関数が収束しない場合、目的関数を収束することを可能にする潜在変数の変分分布とコンポーネントパラメータとを取得するまで、サンプルセットから抽出された各サブサンプルデータに応じて、潜在変数の変分分布とコンポーネントパラメータとを、再取得するように構成された取得ユニット3031と、
を含む。
任意の実施形態のように、図5を参照し、取得モジュール3031は、
サンプルセットから抽出された各サブサンプルセットに応じて、各サブサンプルデータに対応する潜在変分分布を取得するように構成された第1取得サブユニット30311と、
各サブサンプルデータに対応する潜在変分分布に応じて、各サブサンプルデータに対応するコンポーネントパラメータの中間値を取得するように構成された第2取得サブユニット30312と、
各サブサンプルデータに対応するコンポーネントパラメータの中間値に応じて、コンポーネントパラメータのひとつの平均値を決定するように構成された第1決定サブユニット30313と、
コンポーネントパラメータの平均値に応じてコンポーネントパラメータを取得するように構成された第3取得サブユニット30314と、
を含む。
任意の実施形態のように、第1取得サブユニット30311は、各サブサンプルデータに対応する潜在変分分布を、サンプルセットから抽出された各サブサンプルデータに応じて、次の数式を使用して、取得するように構成されている。
Figure 0005970579
第2取得サブユニット30312は、各サブサンプルデータに対応するコンポーネントパラメータの中間値
Figure 0005970579

Figure 0005970579
とを、各サブサンプルデータに対応する潜在変分分布に応じて、次式を使用して取得するように構成されている。
Figure 0005970579
第1決定サブユニット30313は、コンポーネントパラメータの平均値
Figure 0005970579
と、
Figure 0005970579
とを各サブサンプルデータに対応するコンポーネントパラメータの中間値に応じて、次式を使用して決定するように構成されている。
Figure 0005970579
第3取得サブユニット30314は、コンポーネントパラメータ
Figure 0005970579

Figure 0005970579
とを、コンポーネントパラメータの平均値に応じて、次の数式を使用して取得するように構成されている。
Figure 0005970579
ここで、tは、現在の取得を示し、t−1は前回の取得又は初期設定を示し、ρは更新ステップを示し、
Figure 0005970579
は、c番目のコンポーネント内の第Iサブサンプルデータに対応する潜在変分分布を示し、Sはサブサンプルデータセットを示し、
Figure 0005970579
はサブサンプルデータセット中の第Iのサブサンプルデータを示し、αはc番目のコンポーネントのコンポーネントパラメータαを示し、φは番目のコンポーネントのコンポーネントパラメータφを示す。
任意の実施形態によると、図6を参照し、判別ユニット3032は、
潜在変数の変分分布とコンポーネントパラメータとに応じて決定された目的関数の値と、前回取得された潜在変数とコンポーネントパラメータとに応じて決定される前回取得された目的関数と、の差(距離)がしきい値より小さいかどうかを決定するように構成された比較サブユニット30321と、
潜在変数の変分分布とコンポーネントパラメータとに応じて決定された目的関数の値と、前回取得された目的関数の値との差(距離)しきい値より小さい場合、目的関数が収束していると決定するように構成された第2決定サブユニット30322と、
を含む。
本開示の実施形態で提供される装置によれば、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される、対数尤度と正規化項と潜在変数の変分分布の対数とに応じて、目的関数が決定される。混合モデルは、目的関数を収束することが可能な、潜在変数の変分分布とコンポーネントパラメータに応じて決定される。正規化項は、混合モデルの複雑性を自動的に制御し、大規模なデータ処理に適用できるよう、目的関数に導入される。さらに、潜在変数とコンポーネントパラメータとは依存関係にあるため、潜在変数の変分分布とコンポーネントパラメータの決定は、より正確であり、混合モデルの決定もより正確である。
留意すべきは、上述の実施形態において提供された混合モデルの決定用の装置により、混合モデルを決定するとき、装置は、一例として、上記機能のモジュールの分割を用いて記述されているに過ぎない。実際に、機能は、要求される実施のための別の機能モジュールに割り当てられてもよい。具体的には、装置の内部構造は、上記機能の全部又は一部を実施するための異なる機能モジュールに分割される。加えて、混合モデル決定用の装置と、混合モデル決定用の方法は、同位置の技術的思想に関連する。なお、特定の実施例は、方法の実施形態において説明されるが、ここではこれ以上詳述しない。
本開示の上記の実施形態の連番は、説明を容易にするためのものに過ぎず、実施形態の優先度を示すものではない。
当業者は、前述の方法の全部又は一部のステップが、ハードウェア又はプログラムの指示に従うハードウェアによって実施されてよいことを理解すべきである。プログラムは非一時的なコンピュータ読み取り可能な記録媒体に格納されてよいし、少なくとも1つのプロセッサによって実行されてよい。記録媒体は、読み出し専用メモリ、磁気ディスク、又はコンパクトディスク読み出し専用メモリであってよい。
上記は、単に本開示の好ましい実施形態であって、本開示を限定するものではない。本開示の精神及び原理から逸脱すること無く行われる種々の修正、同等の置換、又は改良は本開示の保護範囲に含まれるべきである。
(付記1)
サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度と正規化項と前記潜在変数の変分分布の対数とを取得し、前記対数尤度と前記正規化項と前記潜在変数の前記変分分布の対数とに応じて目的関数を決定すること、
サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする前記潜在変数の変分分布と前記コンポーネントパラメータとを決定し、前記目的関数の収束を可能にする前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて混合モデルを決定すること、
を含む、
混合モデル決定用の方法。
(付記2)
前記サンプルデータと前記潜在変数と前記コンポーネントパラメータとに応じて決定される前記対数尤度は、
Figure 0005970579
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、xは前記サンプルデータを示し、Nはサンプルデータの数を示し、Zは前記潜在変数を示し、θはコンポーネントパラメータのセットを示し、前記コンポーネントパラメータは、α、φを含み、αはコンポーネントの混合比を示し、φはコンポーネント用のモデルパラメータを示し、各コンポーネントは自身を表現するモデルパラメータのサブセットを有する、
付記1に記載の方法。
(付記3)
前記サンプルデータと前記潜在変数と前記コンポーネントパラメータとに応じて決定される前記正規化項は、
Figure 0005970579
であって、Nはサンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは前記潜在変数を示し、
Figure 0005970579
は潜在変数の変分分布の近似値を示し、αはコンポーネントの混合比を示し、Dαはαの次元を示し、DはコンポーネントCのサブモデルパラメータの次元を示し、L(a、b)=logb+(a−b)/bであって、aは、
Figure 0005970579
を示し、bは
Figure 0005970579
を示す、
付記1に記載の方法。
(付記4)
前記サンプルデータと前記潜在変数と前記コンポーネントパラメータとに応じて決定される前記潜在変数の前記変分分布の対数はlogq(Z)であり、q(Z)は前記潜在変数Zの変分分布を示し、Nはサンプルデータの数を示す、
付記1に記載の方法。
(付記5)
前記対数尤度と前記正規化項と前記潜在変数の前記変分分布の対数とに応じて目的関数を決定するステップは、前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布の対数の期待値とに応じて、前記目的関数を決定することを含む、
付記1から4のいずれか1つに記載の方法。
(付記6)
前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布の対数の期待値とに応じて決定された前記目的関数
Figure 0005970579
は、
Figure 0005970579
である、
付記5に記載の方法。
(付記7)
前記サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする前記潜在変数の変分分布と前記コンポーネントパラメータとを決定するステップは、
前記サンプルセットから抽出された各サブサンプルデータに応じて、前記潜在変数の変分分布とコンポーネントパラメータとを取得すること、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、前記目的関数が収束するかどうかを判別し、前記目的関数が収束しない場合、前記目的関数の収束を可能にする前記潜在変数の前記変分分布と前記コンポーネントパラメータとを取得するまで、前記サンプルセットから抽出された前記各サブサンプルデータに応じて、前記潜在変数の前記変分分布と前記コンポーネントパラメータを再取得すること、
を含む、
付記6に記載の方法。
(付記8)
前記サンプルセットから抽出された各サブサンプルデータに応じて、前記潜在変数の変分分布とコンポーネントパラメータを取得するステップは、
前記各サブサンプルデータに対応する前記潜在変分分布を、前記サンプルセットから抽出された前記各サブサンプルデータに応じて、取得し、各サブサンプルデータに対応する各コンポーネントパラメータの中間値を、前記各サブサンプルデータに対応する前記潜在変分分布に応じて、取得すること、
前記コンポーネントパラメータのひとつの平均値を、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて、決定し、前記コンポーネントパラメータの前記平均値に応じて前記コンポーネントパラメータを取得すること、
を含む、
付記7に記載の方法。
(付記9)
前記各サブサンプルデータに対応する前記潜在変分分布は、次の数式
Figure 0005970579
を使用することにより、前記サンプルセットから抽出された前記各サブサンプルデータに応じて取得され、
前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値
Figure 0005970579

Figure 0005970579
とは、次の数式
Figure 0005970579
を使用することにより、前記各サブサンプルデータに対応する前記潜在変分分布に応じて取得され、
前記コンポーネントパラメータの前記平均値
Figure 0005970579

Figure 0005970579
とは、次の数式
Figure 0005970579
を使用することにより、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて決定され、
前記コンポーネントパラメータ
Figure 0005970579

Figure 0005970579
とは、次の数式
Figure 0005970579
を使用することにより、前記コンポーネントパラメータの前記平均値に応じて、取得され、
tは現在の取得を示し、t−1は前回の取得又は初期設定を示し、ρは更新ステップを示し、
Figure 0005970579
は、c番目のコンポーネント内の第Iのサブサンプルデータに対応する前記潜在変分分布を示し、Sはサブサンプルデータセットを示し、
Figure 0005970579
は、前記サブサンプルデータセット内の第Iのサブサンプルデータを示し、αはc番目のコンポーネントパラメータαを示し、φはc番目のコンポーネントの前記コンポーネントパラメータφを示す、
付記8に記載の方法。
(付記10)
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、前記目的関数が収束するかどうかを判別するステップは、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前回取得された前記潜在変数の変分分布とコンポーネントパラメータとに応じて決定される前回取得された目的関数の値と、の差(距離)がしきい値より小さいかどうかを判別すること、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前記前回取得された目的関数の値と、の差(距離)が前記しきい値より小さい場合、前記目的関数が収束していると判別すること、
を含む、
付記7から9のいずれか1つに記載の方法。
(付記11)
サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度と正規化項と前記潜在変数の変分分布の対数とを取得するように構成された取得モジュールと、
前記対数尤度と前記正規化項と前記潜在変数の前記変分分布の対数とに応じて目的関数を決定するように構成された第1決定モジュールと、
サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする前記潜在変数の変分分布と前記コンポーネントパラメータとを決定するように構成された第2決定モジュールと、
前記目的関数の収束を可能にする前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、混合モデルを決定するように構成された第3決定モジュールと、
を含む、
混合モデル決定用の装置。
(付記12)
前記取得モジュールにより取得される前記対数尤度は、
Figure 0005970579
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、xは前記サンプルデータを示し、Nはサンプルデータの数を示し、Zは前記潜在変数を示し、θはコンポーネントパラメータのセットを示し、前記コンポーネントパラメータは、α、φを含み、αはコンポーネントの混合比を示し、φはコンポーネント用のモデルパラメータを示し、各コンポーネントは、自身を表現するモデルパラメータのサブセットを有する、
付記11に記載の装置。
(付記13)
前記取得モジュールにより取得される前記正規化項は、
Figure 0005970579
であって、Nは前記サンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは前記潜在変数を示し、
Figure 0005970579
は潜在変数の変分分布の近似値を示し、αはコンポーネントの混合比を示し、Dαはαの次元を示し、Dはコンポーネントcのサブモデルパラメータの次元を示し、L(a,b)=lоgb+(a−b)/bであり、aは
Figure 0005970579
を示し、bは、
Figure 0005970579
を示す、
付記11に記載の装置。
(付記14)
前記取得モジュールによって取得される前記潜在変数の前記変分分布の対数は、logq(Z)であり、
q(Z)は前記潜在変数Zの変分分布を示し、Nはサンプルデータの数を示す、
付記11に記載の装置。
(付記15)
前記第1決定モジュールは、前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布の対数の期待値とに応じて、前記目的関数を決定するように構成されている、
付記11から14のいずれか1つに記載の装置。
(付記16)
前記第1決定モジュールにより決定される前記目的関数
Figure 0005970579
は、
Figure 0005970579
である、
付記15に記載の装置。
(付記17)
前記第2決定モジュールは、
前記サンプルセットから抽出された各サブサンプルデータに応じて、前記潜在変数の変分分布とコンポーネントパラメータとを取得するように構成された取得ユニットと、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて、前記目的関数が収束するかどうかを判別するように構成された判別ユニットと、
前記目的関数が収束しない場合、前記目的関数の収束を可能にする前記潜在変数の前記変分分布と前記コンポーネントパラメータを取得するまで、前記サンプルセットから抽出された前記各サンプルデータに応じて、前記潜在変数の前記変分分布と前記コンポーネントパラメータとを再取得するように構成された取得ユニットと、
を含む、
付記16に記載の装置。
(付記18)
前記取得ユニットは、
前記各サブサンプルデータに対応する変分分布を、前記サンプルセットから抽出された前記各サブサンプルデータに応じて、取得するように構成された第1取得サブユニットと、
各サブサンプルデータに対応する各コンポーネントパラメータの中間値を、前記各サブサンプルデータに対応する前記潜在変分分布に応じて、取得するように構成された第2取得サブユニットと、
前記コンポーネントパラメータのひとつの平均値を、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて、取得するように構成された第1決定サブユニットと、
前記コンポーネントパラメータの前記平均値に応じて前記コンポーネントパラメータを取得するように構成された第3取得サブユニットと、
を含む、
付記17に記載の装置。
(付記19)
前記第1取得サブユニットは、各サブサンプルデータに対応する前記潜在変分分布を、次の数式
Figure 0005970579
を使用することにより、前記サンプルセットから抽出された前記各サブサンプルデータに応じて取得するように構成されており、
前記第2取得サブユニットは、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値
Figure 0005970579

Figure 0005970579
とを、次の数式
Figure 0005970579
を使用することにより、前記各サブサンプルデータに対応する前記潜在変分分布に応じて取得するように構成されており、
前記第1決定サブユニットは、前記コンポーネントパラメータの前記平均値
Figure 0005970579

Figure 0005970579
とを、次の数式
Figure 0005970579
を使用することにより、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中間値に応じて決定するように構成されており、
前記第3取得サブユニットは、前記コンポーネントパラメータ
Figure 0005970579

Figure 0005970579
とを、次の数式
Figure 0005970579
を使用することにより、前記コンポーネントパラメータの前記平均値に応じて取得するように構成されており、
tは現在の取得を示し、t−1は前回の取得又は初期設定を示し、ρは更新ステップを示し、
Figure 0005970579
はc番目のコンポーネント内の第Imサブサンプルデータに対応する前記潜在変分分布を示し、Sはサブサンプルデータセットを示し、
Figure 0005970579
は、前記サブサンプルデータセット中の第Imサブサンプルデータを示し、αはc番目のコンポーネントのコンポーネントパラメータαを示し、φはc番目のコンポーネントのコンポーネントパラメータφを示す、
付記18に記載の装置。
(付記20)
前記判別ユニットは、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前回取得された前記潜在変数の変分分布とコンポーネントパラメータとに応じて決定される前回取得された目的関数の値との差(距離)がしきい値より小さいかどうかを判別するように構成された比較サブユニットと、
前記潜在変数の前記変分分布と前記コンポーネントパラメータとに応じて決定された前記目的関数の値と、前記前回取得された目的関数の値との差(距離)が前記しきい値より小さい場合、前記目的関数が収束していると決定するように構成された、第2決定サブユニットと、
を含む、
付記17から19のいずれか1つに記載の装置。

Claims (10)

  1. サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度と正規化項と前記潜在変数の変分分布関数の対数とを取得するように構成された取得モジュールと、
    前記取得された前記対数尤度と前記正規化項と前記潜在変数の前記変分分布関数の対数とに応じて目的関数を決定するように構成された第1決定モジュールと、
    サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする前記潜在変数の変分分布関数と前記コンポーネントパラメータとを決定するように構成された第2決定モジュールと、
    前記目的関数の収束を可能にする前記潜在変数の前記変分分布関数と前記コンポーネントパラメータとに応じて、混合モデルを決定するように構成された第3決定モジュールと、
    を含み、
    前記第1決定モジュールは、前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布関数の対数の期待値とに応じて、前記目的関数を決定するように構成されている、
    混合モデル決定用の装置。
  2. 前記取得モジュールにより取得される前記対数尤度は、
    Figure 0005970579
    であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、xは前記サンプルデータを示し、Nはサンプルデータの数を示し、Zは前記潜在変数を示し、θはコンポーネントパラメータのセットを示し、前記コンポーネントパラメータは、α、φを含み、αはコンポーネントの混合比を示し、φはコンポーネント用のモデルパラメータを示し、各コンポーネントは、自身を表現するモデルパラメータのサブセットを有する、
    請求項1に記載の装置。
  3. 前記取得モジュールにより取得される前記正規化項は、
    Figure 0005970579
    であって、Nは前記サンプルデータの数を示し、Cはコンポーネントの個数を示し、zncは前記潜在変数を示し、
    Figure 0005970579
    は潜在変数の変分分布関数の値を所定の近似手法により近似した近似値を示し、αはコンポーネントの混合比を示し、Dαはαの次元を示し、Dはコンポーネントcのサブモデルパラメータの次元を示し、L(a,b)=lоgb+(a−b)/bであり、aは
    Figure 0005970579
    を示し、bは、
    Figure 0005970579
    を示す、
    請求項1に記載の装置。
  4. 前記取得モジュールによって取得される前記潜在変数の前記変分分布関数の対数は、logq(Z)であり、
    q(Z)は前記潜在変数Zの変分分布関数を示し、Nはサンプルデータの数を示す、
    請求項1に記載の装置。
  5. 前記第1決定モジュールにより決定される前記目的関数
    Figure 0005970579
    は、
    Figure 0005970579
    である、
    請求項に記載の装置。
  6. 前記第2決定モジュールは、
    前記サンプルセットから抽出された各サブサンプルデータに応じて、前記潜在変数の変分分布関数とコンポーネントパラメータとを取得するように構成された取得ユニットと、
    前記潜在変数の前記変分分布関数と前記コンポーネントパラメータとに応じて、前記目的関数が収束するかどうかを判別するように構成された判別ユニットと、
    前記目的関数が収束しない場合、前記目的関数の収束を可能にする前記潜在変数の前記変分分布関数と前記コンポーネントパラメータを取得するまで、前記サンプルセットから抽出された前記各サンプルデータに応じて、前記潜在変数の前記変分分布関数と前記コンポーネントパラメータとを再取得するように構成された取得ユニットと、
    を含む、
    請求項に記載の装置。
  7. 前記取得ユニットは、
    前記各サブサンプルデータに対応する変分分布関数を、前記サンプルセットから抽出された前記各サブサンプルデータに応じて、取得するように構成された第1取得サブユニットと、
    各サブサンプルデータに対応する各コンポーネントパラメータの中央値を、前記各サブサンプルデータに対応する前記潜在変数の変分分布関数に応じて、取得するように構成された第2取得サブユニットと、
    前記コンポーネントパラメータのひとつの平均値を、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中央値に応じて、取得するように構成された第1決定サブユニットと、
    前記コンポーネントパラメータの前記平均値に応じて前記コンポーネントパラメータを取得するように構成された第3取得サブユニットと、
    を含む、
    請求項に記載の装置。
  8. 前記第1取得サブユニットは、各サブサンプルデータに対応する前記潜在変数の変分分布関数を、次の数式
    Figure 0005970579
    を使用することにより、前記サンプルセットから抽出された前記各サブサンプルデータに応じて取得するように構成されており、
    前記第2取得サブユニットは、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中央値
    Figure 0005970579

    Figure 0005970579
    とを、次の数式
    Figure 0005970579
    を使用することにより、前記各サブサンプルデータに対応する前記潜在変数の変分分布関数に応じて取得するように構成されており、
    前記第1決定サブユニットは、前記コンポーネントパラメータの前記平均値
    Figure 0005970579

    Figure 0005970579
    とを、次の数式
    Figure 0005970579
    を使用することにより、前記各サブサンプルデータに対応する前記コンポーネントパラメータの前記中央値に応じて決定するように構成されており、
    前記第3取得サブユニットは、前記コンポーネントパラメータ
    Figure 0005970579

    Figure 0005970579
    とを、次の数式
    Figure 0005970579
    を使用することにより、前記コンポーネントパラメータの前記平均値に応じて取得するように構成されており、
    tは現在の取得を示し、t−1は前回の取得又は初期設定を示し、ρは更新ステップを示し、
    Figure 0005970579
    はc番目のコンポーネント内の第Imサブサンプルデータに対応する前記潜在変数の変分分布関数を示し、Sはサブサンプルデータセットを示し、
    Figure 0005970579
    は、前記サブサンプルデータセット中の第Imサブサンプルデータを示し、αはc番目のコンポーネントのコンポーネントパラメータαを示し、φはc番目のコンポーネントのコンポーネントパラメータφを示す、
    請求項に記載の装置。
  9. 混合モデル決定用の装置が、サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度と正規化項と前記潜在変数の変分分布関数の対数とを取得する取得ステップ、
    前記装置が、前記取得された前記対数尤度と前記正規化項と前記潜在変数の前記変分分布関数の対数とに応じて目的関数を決定する第1決定ステップ、
    前記装置が、サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする前記潜在変数の変分分布関数と前記コンポーネントパラメータとを決定する第2決定ステップ、
    前記装置が、前記目的関数の収束を可能にする前記潜在変数の前記変分分布関数と前記コンポーネントパラメータとに応じて混合モデルを決定する第3決定ステップ、
    を含み、
    前記第1決定ステップでは、前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布関数の対数の期待値とに応じて、前記目的関数を決定する、
    混合モデル決定用の方法。
  10. コンピュータに、
    サンプルデータと潜在変数とコンポーネントパラメータとに応じて決定される対数尤度と正規化項と前記潜在変数の変分分布関数の対数とを取得する取得手順、
    前記取得された前記対数尤度と前記正規化項と前記潜在変数の前記変分分布関数の対数とに応じて目的関数を決定する第1決定手順、
    サンプルセットから抽出されたサブサンプルデータに応じて、前記目的関数の収束を可能にする前記潜在変数の変分分布関数と前記コンポーネントパラメータとを決定する第2決定手順、
    前記目的関数の収束を可能にする前記潜在変数の前記変分分布関数と前記コンポーネントパラメータとに応じて混合モデルを決定する第3決定手順、を実行させ、
    前記第1決定手順では、前記対数尤度の期待値と前記正規化項の期待値と前記潜在変数の前記変分分布関数の対数の期待値とに応じて、前記目的関数を決定する、
    混合モデル決定用のプログラム。
JP2015051731A 2014-03-18 2015-03-16 混合モデル決定用の装置、方法、およびプログラム Active JP5970579B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410101689.7 2014-03-18
CN201410101689.7A CN104933275A (zh) 2014-03-18 2014-03-18 混合模型的确定方法及装置

Publications (2)

Publication Number Publication Date
JP2015179513A JP2015179513A (ja) 2015-10-08
JP5970579B2 true JP5970579B2 (ja) 2016-08-17

Family

ID=54120441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015051731A Active JP5970579B2 (ja) 2014-03-18 2015-03-16 混合モデル決定用の装置、方法、およびプログラム

Country Status (2)

Country Link
JP (1) JP5970579B2 (ja)
CN (1) CN104933275A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918688B (zh) * 2016-10-10 2020-02-28 深圳云天励飞技术有限公司 场景模型动态估计方法、数据分析方法及装置、电子设备

Also Published As

Publication number Publication date
JP2015179513A (ja) 2015-10-08
CN104933275A (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
CN111523621B (zh) 图像识别方法、装置、计算机设备和存储介质
JP5506722B2 (ja) マルチクラス分類器をトレーニングするための方法
CN106897746B (zh) 数据分类模型训练方法和装置
CN110717099B (zh) 一种推荐影片的方法及终端
CN110765860A (zh) 摔倒判定方法、装置、计算机设备及存储介质
CN111127364B (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
US20230237771A1 (en) Self-supervised learning method and apparatus for image features, device, and storage medium
CN108228684B (zh) 聚类模型的训练方法、装置、电子设备和计算机存储介质
US10115208B2 (en) Image characteristic estimation method and device
CN113344016A (zh) 深度迁移学习方法、装置、电子设备及存储介质
CN114565807A (zh) 训练目标图像检索模型的方法和装置
CN110910325B (zh) 一种基于人工蝴蝶优化算法的医疗影像处理方法及装置
JP2014228995A (ja) 画像特徴学習装置、画像特徴学習方法及びプログラム
CN113408282B (zh) 主题模型训练和主题预测方法、装置、设备及存储介质
JP5970579B2 (ja) 混合モデル決定用の装置、方法、およびプログラム
JP5970578B2 (ja) リレーショナルモデルを決定するプログラムと装置
CN110929731B (zh) 一种基于探路者智能搜索算法的医疗影像处理方法及装置
JP6606849B2 (ja) 識別器生成装置、識別器生成方法、推定装置、推定方法、およびプログラム
US11688175B2 (en) Methods and systems for the automated quality assurance of annotated images
WO2017000118A1 (en) Method and apparatus for predicting attribute for image sample
CN113221662B (zh) 人脸识别模型的训练方法及装置、存储介质、终端
JP6047190B2 (ja) リレーショナルモデルを決定するプログラムと装置
JP7331938B2 (ja) 学習装置、推定装置、学習方法及び学習プログラム
CN111860556A (zh) 一种模型的处理方法、装置及存储介质
JP5118616B2 (ja) 顔画像検出装置及び顔画像検出プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160506

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160711

R150 Certificate of patent or registration of utility model

Ref document number: 5970579

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350