JP6172316B2 - 混合モデリングのための初期化方法及び初期化システム - Google Patents

混合モデリングのための初期化方法及び初期化システム Download PDF

Info

Publication number
JP6172316B2
JP6172316B2 JP2016040847A JP2016040847A JP6172316B2 JP 6172316 B2 JP6172316 B2 JP 6172316B2 JP 2016040847 A JP2016040847 A JP 2016040847A JP 2016040847 A JP2016040847 A JP 2016040847A JP 6172316 B2 JP6172316 B2 JP 6172316B2
Authority
JP
Japan
Prior art keywords
modeling
mixed
model
initialization
iterations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016040847A
Other languages
English (en)
Other versions
JP2016194911A (ja
Inventor
ホゥ ワン
ホゥ ワン
チュンチェン リウ
チュンチェン リウ
ルウ フオン
ルウ フオン
遼平 藤巻
遼平 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2016194911A publication Critical patent/JP2016194911A/ja
Application granted granted Critical
Publication of JP6172316B2 publication Critical patent/JP6172316B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本開示の様々な実施形態は、機械学習の分野に関し、より具体的には混合モデリングのための初期化方法及び初期化システムに関する。
混合モデルは、大きなグループ内でのサブグループの存在を表す確率モデルである。通常、大きなグループの観察結果の確率分布の混合分布に、混合モデルは一致する。混合モデルの例として、エキスパートの階層的混合(Hierarchical Mixture of Experts(HME))モデルが、例えば、電力需要や販売レベルの予測等の多くの事業レベル機械学習アプリケーションに広く適用されてきた。HMEは、一般的な線形モデルより柔軟で、また、HMEは、確率的な規則に基づいて特徴空間を分割することと、区分的ローカル線形エキスパートを採用することの重要な利点は残している。
HMEモデリングの課題は、HMEモデリングでは大量のパラメータと階層構造を学習する必要があるという点である。従来技術では、周辺対数尤度の解析近似を示す変分推理(variational inference(VI))が、HMEモデリングに効果的に適用されうる。しかし、「初期化に敏感ということ」が、HMEモデリングのVIの効果に影響を及ぼす障害になる。
従来技術の混合モデリングは、常に、ランダムな初期化手順、すなわち、ランダムにモデル構造とモデルパラメータを生成するということを採用する。その後、混合モデルを生成するために、トレーニング・データセットを使って、モデル構造とモデルパラメータとが学習される。初期化手順がランダムなので、望ましい結果は、長期の多くの試みを通じてのみ、導出されうる。
本開示の目的は、従来技術の上記課題の少なくとも一部を解決するために、混合モデリングのための初期化方法及び初期化システムを提供することを含む。
本開示の1つの観点によれば、混合モデリングのための複数の初期ポイントを生成することと、混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行することと、最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することと、を含む混合モデリングのための初期化方法が提供される。
本開示の代表的な実施形態によれば、前記混合モデリングは、エキスパートの階層的混合モデリングを含む。
本開示の代表的な実施形態によれば、前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む。
本開示の代表的な実施形態によれば、前記モデルの複雑性は、エキスパートの数の対数形式で表される。
本開示の代表的な実施形態によれば、最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することは、尤度に基づいて、前記混合モデルの各々の精度を見積もることと、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすことと、を更に含む。
本開示の代表的な実施形態によれば、前記方法は、前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることと、前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算することと、を更に含む。
本開示の代表的な実施形態によれば、前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もることを更に含む。
本開示の代表的な実施形態によれば、前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の前記繰り返し回数を、前記第2の有効な繰り返し回数とみなすことを更に含む。
本開示の他の観点によれば、混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュールと、混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュールと、対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行するように構成されたモデリング・モジュールと、最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュールと、を含む混合モデリングのための初期化システムが提供される。
本開示の代表的な実施形態によれば、前記混合モデリングは、エキスパートの階層的混合モデリングを含む。
本開示の代表的な実施形態によれば、前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む。
本開示の代表的な実施形態によれば、前記モデルの複雑性は、エキスパートの数の対数形式で表される。
本開示の代表的な実施形態によれば、前記選択モジュールは、更に、尤度に基づいて、前記混合モデルの各々の精度を見積もり、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすように構成されている。
本開示の代表的な実施形態によれば、前記システムは、前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュールと、前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、を更に含む。
本開示の代表的な実施形態によれば、前記第2の見積りモジュールは、更に、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もるように構成されている。
本開示の代表的な実施形態によれば、前記第2の見積りモジュールは、更に、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の前記繰り返し回数を、前記第2の有効な繰り返し回数とみなすように構成されている。
本開示の様々な実施形態の技術的解決方法では、初期化における混合モデリングの繰り返し回数は、モデルの複雑性に基づいて見積もられ、初期化に対するモデリング手順の感度を軽減できる。したがって、ランダムな初期化ストラテジーに比べ、モデリングの精度を高めることができる。また、モデルの複雑性と混合モデリングの最適化目的関数とを組み合わせた場合、モデリングの精度を更に高めることができる。
代表的な実施形態の以下の詳細な説明を、添付図面と合わせて読めば、上記及び他の目的と、特徴と、利点とが明らかになるだろう。
本開示の1つの実施形態による初期化方法を模式的に示すフロー図である。 繰り返し回数を見積もるステップを模式的に示すフロー図である。 本開示の1つの実施形態による初期化システムを模式的に示すブロック図である。 繰り返し回数見積りモジュールを模式的に示すブロック図である。
以下で、添付図面のいくつかの代表的な実施形態に関して、本開示の原理と方法とが述べられる。これらの実施形態は、当業者がより理解し、そして本開示を実施可能なように述べられただけであって、どの手法でも本開示の範囲を限定することを意図してはいないと理解されるべきである。
以下で、本開示による混合モデリングのための初期化方法を、図1と図2と合わせて説明する。
図1は、本開示の1つの実施形態による初期化方法のフロー図を模式的に示す。図1に見られるように、混合モデリングのための初期化方法は、一般に、ステップ102で混合モデリングのための複数の初期ポイントを生成することと、ステップ103で混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、ステップ104で対応する混合モデルを生成するために、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行することと、ステップ105で最良の精度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとして選択することと、を含んでも良い。
更に、本開示による初期化方法は、トレーニング・データセットを取得するステップ101も含んでも良い。ステップ101で取得したトレーニング・データセットを、ステップ103での混合モデリングの有効な繰り返し回数の見積りと、対応する混合モデルを生成するための、ステップ104での混合モデリングの実行に使用しても良い。本開示による初期化方法は、次のステップも含んでも良い。ステップ106では、ステップ105で取得した最適な初期化ポイントを使用して、混合モデルを初期化する。
1つの代表的な実施形態によれば、混合モデリングは、エキスパートの階層的混合(Hierarchical Mixture of Experts(HME))モデリング及びガウス混合モデリング等を含んでも良い。HMEモデリングとガウス混合モデリングとは、その道で知られた混合モデリング技術である。本開示は、それらの初期化手順を改善することを目的としている。初期化手順以外の他のステップは、ここでは詳述しない。
ステップ101では、初期ポイントの各々は、HMEモデルのモデルパラメータと変分分布確率とを含んでも良い。例えば、HMEモデリングのN1個の初期ポイントは、ランダムに生成されても良く、初期ポイントの各々は、HMEモデルのモデルパラメータθと変分分布確率qとを含む。ここで、m=1,・・・,N1である。
図2は、有効な繰り返し回数を見積もるステップ103のフロー図を模式的に示す。図2に見られるように、有効な繰り返し回数を見積もるステップ103は、モデルの複雑性に基づいて、ステップ201で第1の有効な繰り返し回数を見積もることと、ステップ202で混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることと、ステップ203で混合モデリングの繰り返し回数として、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を計算することと、を含んでも良い。
図2は、有効な繰り返し回数を見積もるステップ103の例を示すのみである。他の実施形態では、有効な繰り返し回数を、他の手法で見積もっても良い。例えば、ある実施形態では、ステップ201で、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることのみが許可され、第1の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。他の実施形態でも、ステップ202で、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることのみが許可され、第2の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。
代表的な実施形態によれば、HMEモデリングを初期化する場合、ステップ201のモデルの複雑性は、エキスパートの数の対数形式で表されても良い。例えば、完全学習手順における繰り返し回数の最大値は、N2に設定されても良い。期待値最大化(expectation maximization(EM))アルゴリズムでは、i回目のEM繰り返し後のモデルの複雑性C Mは、式(1)で表されても良い。
Figure 0006172316
ここで、i=1,2,・・・,N2であり、Eはエキスパートの数を示す。
代表的な実施形態によれば、201でのモデルの複雑性に基づいて第1の有効な繰り返し回数を見積もる方法は、式(2)で表されても良い。
Figure 0006172316
式(2)では、各モデルの複雑性C Mが平均され、次に、丸め演算
Figure 0006172316
で、平均値が処理されて、第1の有効な繰り返し回数gを取得する。
本開示の代表的な実施形態によれば、ステップ202で、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることは、最適化目的関数の目的値と、最適化目的関数の最大値と最小値の差との関係に基づいて、第2の有効な繰り返し回数を見積もることを更に含む。例えば、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。
例えば、最適化目的関数を、式(3)で定義しても良い。式(3)は従来技術で開示されている。その具体的な定義は、次の参考文献で述べられているであろう。2014年、人工知能と統計(Artificial Intelligence and Statistics(AISTATS))の第17回国際学会の会報「完全自動ベイズ的区分的まばら線形モデル」エトウ・R、フジマキ・R、サトシ・モリナガ、ヒロシ・タマノ
Figure 0006172316
ここで、
Figure 0006172316
である。
本開示の様々な実施形態では、様々な種類の混合モデリングのための最適化目的関数が採用されても良く、式(3)は本開示の原理の記述を容易にするための、ここでの単なる例である。
ステップ202では、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。例えば、式(4)に見られるアルゴリズムを、第2の有効な繰り返し回数を見積もるのに使用しても良い。
Figure 0006172316
式(4)の具体的なアルゴリズムは、iの値を最小にすることである。この手順においては、イテレーションが繰り返し実行される。iはイテレーションのステップ数を示し、最小のi値を取り、最小のi値が以下の要件:最適化目的関数FICの値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達する時、を満たす所で、FICの値は要件を満たしたと信じられている。したがって、式(4)から導き出された最小のi値は、第2の有効な繰り返し回数とみなされる。もちろん、第2の有効な繰り返し回数を見積もるのに、他の方法を採用しても良い。
式(2)と式(4)から第1の有効な繰り返し回数と第2の有効な繰り返し回数を取得した後、第1の有効な繰り返し回数と第2の有効な繰り返し回数のどちらか1つのみを、ステップ104で実行される混合モデリングの繰り返し回数として採用することが許可される。もちろん、例えば式(5)に見られる、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を、ステップ104で実行される混合モデリングの有効な繰り返し回数として採用しても良い。
Figure 0006172316
ここで、N3は混合モデリングの有効な繰り返し回数を示す。
ステップ104では、対応する混合モデルを生成するために、ステップ103で取得された有効な繰り返し回数に基づいて、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行する。
ステップ105では、尤度に基づいて、混合モデルの各々の精度を見積もり、最良の尤度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとみなす。
本開示による初期化方法の原理を、図1と図2で示された望ましい実施形態に関して上述した。しかし、本開示による初期化方法は、上記特定のステップに限定されず、請求項で限定された範囲まで適用されるということを当業者は理解しうる。様々な要求に応じて、1以上のステップを省略するか追加することを当業者は容易に想定する。
次に、本開示による混合モデリングのための初期化システムを、図3と図4を参照して説明する。
図3は、本開示の1つの実施形態による初期化システムのブロック図を模式的に示す。図3に見られるように、混合モデリングのための初期化システムは、混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュール302と、混合モデリングの有効な繰り返し回数を見積もるように構成された繰り返し回数見積りモジュール303と、対応する混合モデルを生成するために、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行するように構成されたモデリング・モジュール304と、最良の精度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュール305と、を通常含んでも良い。
更に、本開示による初期化システムは、トレーニング・データセットを取得するように構成された取得モジュール301も含んでも良い。取得モジュール301により取得されたトレーニング・データセットを、繰り返し回数見積りモジュール303で混合モデリングの有効な繰り返し回数を見積もることと、モデリング・モジュール104で対応する混合モデルを生成するために混合モデリングを実行することとに使用しても良い。本開示による初期化システムは、選択モジュール305で取得された最適な初期化ポイントを使用して混合モデルを初期化する初期化モジュール306も含んでも良い。
1つの代表的な実施形態によれば、混合モデリングは、エキスパートの階層的混合(Hierarchical Mixture of Experts(HME))モデリング及びガウス混合モデリング等を含んでも良い。HMEモデリングとガウス混合モデリングとは、その道で知られた混合モデリング技術である。本開示は、それらの初期化手順を改善することを目的としている。初期化手順以外の他のステップは、ここでは詳述しない。
取得モジュール301では、初期ポイントの各々は、HMEモデルのモデルパラメータと変分分布確率とを含んでも良い。例えば、HMEモデリングのN1個の初期ポイントは、ランダムに生成されても良く、初期ポイントの各々は、HMEモデルのモデルパラメータθと変分分布確率qとを含む。ここで、m=1,・・・,N1である。
図4は、繰り返し回数見積りモジュール303のブロック図を模式的に示す。図4で示されるように、繰り返し回数見積りモジュール303は、モデルの複雑性に基づいて、第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュール401と、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュール402と、混合モデリングの繰り返し回数として、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、を含んでも良い。
図4は、繰り返し回数見積りモジュール303の例を示すのみである。他の実施形態では、有効な繰り返し回数を、他の手法で見積もっても良い。例えば、ある実施形態では、第1の見積りモジュール401により、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることのみが許可され、第1の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。他の実施形態でも、第2の見積りモジュール402により、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることのみが許可され、第2の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。
代表的な実施形態によれば、第1の見積りモジュール401で、HMEモデリングを初期化する場合、モデルの複雑性は、エキスパートの数の対数形式で示されても良い。例えば、完全学習手順における繰り返し回数の最大値は、N2に設定されても良い。期待値最大化(expectation maximization(EM))アルゴリズムでは、i回目のEM繰り返し後のモデルの複雑性C Mは、式(1)で表されても良い。
代表的な実施形態によれば、第1の見積りモジュール401により、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もる方法は、式(2)で表されても良い。
本開示の代表的な実施形態によれば、第2の見積りモジュール402は、最適化目的関数の目的値と、最適化目的関数の最大値と最小値の差との関係に基づいて、第2の有効な繰り返し回数を見積もっても良い。例えば、第2の見積りモジュール402は、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。
例えば、最適化目的関数を式(3)で定義しても良い。本開示の様々な実施形態では、混合モデリングのための様々な種類の最適化目的関数を採用しても良く、式(3)は本開示の原理の記述を容易にするための、ここでの単なる例である。
第2の見積りモジュール402は、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。例えば、式(4)に見られるアルゴリズムを、第2の有効な繰り返し回数を見積もるのに使用しても良い。
式(2)と式(4)から第1の有効な繰り返し回数と第2の有効な繰り返し回数を取得した後、第1の有効な繰り返し回数と第2の有効な繰り返し回数のどちらか1つのみを、モデリング・モジュール304で実行される混合モデリングの繰り返し回数として採用することが許可される。もちろん、例えば式(5)に見られる、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を、モデリング・モジュール304で実行される混合モデリングの有効な繰り返し回数として採用しても良い。
モデリング・モジュール304は、対応する混合モデルを生成するために、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行するのに、繰り返し回数見積りモジュール303で取得された有効な繰り返し回数を採用しても良い。
選択モジュール305は、尤度に基づいて、混合モデルの各々の精度を見積もり、最良の尤度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとみなしても良い。
図3と図4に見られるシステムは、各々図1と図2に見られる方法に相当する。したがって、図1と図2に関する初期化方法の上記記載は、図3と図4で示された初期化システムに同様に当てはまるので、ここでは詳述しない。
本開示の様々な実施形態の技術的解決方法では、初期化における混合モデリングの繰り返し回数が、モデルの複雑性に基づいて見積もられ、それにより、初期化に対するモデリング手順の感度を軽減できる。したがって、ランダムな初期化戦略に比べ、モデリングの精度を高めることができる。また、モデルの複雑性と混合モデリングの最適化目的関数とを組み合わせた場合、モデリングの精度を更に高めることができる。
本発明の実施形態は、ソフトウェア、又はハードウェア、又はそれらの組み合わせで実現されうるという点に更に留意すべきである。ハードウェア部分は、特別なロジックにより実現可能であり、ソフトウェア部分は、メモリに格納され、マイクロプロセッサ又は専用に設計されたハードウェアなどの適切な指示実行システムにより実行されうる。上記方法及びシステムは、コンピュータ実行可能な指示、及び/又は、例えば、磁気ディスク又はCD又はDVD−ROMのようなベアラ媒体、又は読出し専用メモリ(ファームウェア)又は光学又は電子信号ベアラ等のデータ・ベアラのようなプログラム可能メモリで供給されるコードといった、プロセッサに含まれた制御コードで実現されうる、と、通常の当業者は理解しうる。本実施形態における装置及びその構成要素は、例えば、非常に大規模な集積回路又はゲートアレイ、又は論理チップ又はトランジスタのような半導体、又はフィールド・プログラマブル・ゲートアレイのようなプログラム可能なハードウェア・デバイス、又はプログラム可能な論理デバイスといったハードウェア電気回路構成により実現されても良く、又は様々な種類のプロセッサにより実行されるソフトウェアにより実現されても良く、又は例えばファームウェアといった上記ハードウェア電気回路構成とソフトウェアとの組み合わせ、により実現されても良い。
本発明による方法の動作は、図面中に特定の順序で表されているが、これは、それらの動作が当該特定の順序で実行されなければならないということを、又は望ましい結果は示された全ての動作が実行されてのみ成し遂げられうるということを、要求するものでも又は含むものでもない。寧ろ、フロー図で示されるステップは、異なる順序で実行されても良い。その上に、又は、代わりに、いくつかのステップを省略しても良く、及び/又は実行のために複数のステップを1つのステップに統合しても良く、及び/又は実行のために1つのステップを複数のステップに分解しても良い。
本発明を、目下考慮に入れた実施形態に関して記述したが、本発明は、開示された実施形態に限定されないと理解するべきである。それどころか、添付の請求項の趣旨及び範囲内に入る様々な修正及び等価な並べ替えに及ぶことを、本発明は意図する。添付の請求の範囲は、最も広い解釈に一致し、そのような修正と、等価な構造及び機能との全てに及ぶ。
(付記1)
混合モデリングのための複数の初期ポイントを生成することと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行することと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することと、
を含む混合モデリングのための初期化方法。
(付記2)
前記混合モデリングは、エキスパートの階層的混合モデリングを含む付記1に記載の初期化方法。
(付記3)
前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む付記2に記載の初期化方法。
(付記4)
前記モデルの複雑性は、エキスパートの数の対数形式で表される付記2または3に記載の初期化方法。
(付記5)
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することは、
尤度に基づいて、前記混合モデルの各々の精度を見積もることと、
最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすことと、
を更に含む付記1に記載の初期化方法。
(付記6)
前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることと、
前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算することと、
を更に含む付記1に記載の初期化方法。
(付記7)
前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もることを更に含む付記6に記載の初期化方法。
(付記8)
前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすことを更に含む付記7に記載の初期化方法。
(付記9)
混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュールと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュールと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行するように構成されたモデリング・モジュールと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュールと、
を含む混合モデリングのための初期化システム。
(付記10)
前記混合モデリングは、エキスパートの階層的混合モデリングを含む付記9に記載の初期化システム。
(付記11)
前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む付記10に記載の初期化システム。
(付記12)
前記モデルの複雑性は、エキスパートの数の対数形式で表される付記10または11に記載の初期化システム。
(付記13)
前記選択モジュールは、更に、尤度に基づいて、前記混合モデルの各々の精度を見積もり、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすように構成されている付記9に記載の初期化システム。
(付記14)
前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュールと、
前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、
を更に含む付記9に記載の初期化システム。
(付記15)
前記第2の見積りモジュールは、更に、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もるように構成されている付記14に記載の初期化システム。
(付記16)
前記第2の見積りモジュールは、更に、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすように構成されている付記15に記載の初期化システム。

Claims (9)

  1. 混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュールと、
    混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュールと、
    対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行するように構成されたモデリング・モジュールと、
    最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュールと、
    を含む混合モデリングのための初期化システム。
  2. 前記混合モデリングは、エキスパートの階層的混合モデリングを含む請求項1に記載の初期化システム。
  3. 前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む請求項2に記載の初期化システム。
  4. 前記モデルの複雑性は、エキスパートの数の対数形式で表される請求項2または3に記載の初期化システム。
  5. 前記選択モジュールは、更に、尤度に基づいて、前記混合モデルの各々の精度を見積もり、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすように構成されている請求項1に記載の初期化システム。
  6. 前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュールと、
    前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、
    を更に含む請求項1に記載の初期化システム。
  7. 前記第2の見積りモジュールは、更に、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もるように構成されている請求項6に記載の初期化システム。
  8. 前記第2の見積りモジュールは、更に、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすように構成されている請求項7に記載の初期化システム。
  9. 混合モデリングのための複数の初期ポイントを生成することと、
    混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、
    対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行することと、
    最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することと、
    を含む混合モデリングのための初期化方法。
JP2016040847A 2015-03-31 2016-03-03 混合モデリングのための初期化方法及び初期化システム Active JP6172316B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510147649.0 2015-03-31
CN201510147649.0A CN106156855A (zh) 2015-03-31 2015-03-31 用于混合建模的初始化方法和初始化系统

Publications (2)

Publication Number Publication Date
JP2016194911A JP2016194911A (ja) 2016-11-17
JP6172316B2 true JP6172316B2 (ja) 2017-08-02

Family

ID=57323682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016040847A Active JP6172316B2 (ja) 2015-03-31 2016-03-03 混合モデリングのための初期化方法及び初期化システム

Country Status (2)

Country Link
JP (1) JP6172316B2 (ja)
CN (1) CN106156855A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657802B (zh) * 2019-01-28 2020-12-29 清华大学深圳研究生院 一种混合专家强化学习方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07285439A (ja) * 1994-04-19 1995-10-31 Hitachi Ltd 遺伝的アルゴリズム/ニューロによる列車ダイヤ作成装置及び作成方法
JPH0962645A (ja) * 1995-08-22 1997-03-07 Nippon Telegr & Teleph Corp <Ntt> 専門家の階層混合モデルの構築的学習方法
JPH10149192A (ja) * 1996-09-20 1998-06-02 Nippon Telegr & Teleph Corp <Ntt> パターン認識方法、装置およびその記憶媒体

Also Published As

Publication number Publication date
JP2016194911A (ja) 2016-11-17
CN106156855A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
Chernozhukov et al. Anti-concentration and honest, adaptive confidence bands
Alaa et al. Limits of estimating heterogeneous treatment effects: Guidelines for practical algorithm design
Stitelman et al. Collaborative targeted maximum likelihood for time to event data
JP2020525872A (ja) インフルエンザ予測モデルの生成方法、装置及びコンピュータ可読記憶媒体
JP6172317B2 (ja) 混合モデル選択の方法及び装置
Makalic et al. Review of modern logistic regression methods with application to small and medium sample size problems
US20160358316A1 (en) Approximate message passing with universal denoising
WO2020263300A1 (en) Measuring quantum state purity
JP6172316B2 (ja) 混合モデリングのための初期化方法及び初期化システム
CN117115551A (zh) 一种图像检测模型训练方法、装置、电子设备及存储介质
JP6164320B2 (ja) 区分的線形モデル生成システム及び生成方法
KR20200019377A (ko) 측정 노이즈 추천을 통한 칼만 필터링 방법 및 이를 기록한 기록매체
US8344924B2 (en) Analog signal conversion
KR102559605B1 (ko) 함수 최적화 방법 및 장치
Watanabe A fuzzy RANSAC algorithm based on reinforcement learning concept
JPWO2020105144A1 (ja) 画像生成装置及び画像生成方法
JP6233432B2 (ja) 混合モデルの選択方法及び装置
JPWO2018198298A1 (ja) パラメータ推定装置、パラメータ推定方法、及びプログラム
Debbabi et al. A new unsupervised threshold determination for hybrid models
KR102635503B1 (ko) 마르코프 체인 몬테 카를로 샘플링의 초기값 결정 방법
Chen et al. Detecting change-points in epidemic models
Munoz-Minjares et al. Jitter representation in SCNA breakpoints using asymmetric exponential power distribution
WO2021111832A1 (ja) 情報処理方法、情報処理システム及び情報処理装置
US20230080028A1 (en) Supervised graph learning
Kinnear et al. Branching Subset Simulation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170619

R150 Certificate of patent or registration of utility model

Ref document number: 6172316

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150