JP6172316B2 - 混合モデリングのための初期化方法及び初期化システム - Google Patents
混合モデリングのための初期化方法及び初期化システム Download PDFInfo
- Publication number
- JP6172316B2 JP6172316B2 JP2016040847A JP2016040847A JP6172316B2 JP 6172316 B2 JP6172316 B2 JP 6172316B2 JP 2016040847 A JP2016040847 A JP 2016040847A JP 2016040847 A JP2016040847 A JP 2016040847A JP 6172316 B2 JP6172316 B2 JP 6172316B2
- Authority
- JP
- Japan
- Prior art keywords
- modeling
- mixed
- model
- initialization
- iterations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本開示の様々な実施形態は、機械学習の分野に関し、より具体的には混合モデリングのための初期化方法及び初期化システムに関する。
混合モデルは、大きなグループ内でのサブグループの存在を表す確率モデルである。通常、大きなグループの観察結果の確率分布の混合分布に、混合モデルは一致する。混合モデルの例として、エキスパートの階層的混合(Hierarchical Mixture of Experts(HME))モデルが、例えば、電力需要や販売レベルの予測等の多くの事業レベル機械学習アプリケーションに広く適用されてきた。HMEは、一般的な線形モデルより柔軟で、また、HMEは、確率的な規則に基づいて特徴空間を分割することと、区分的ローカル線形エキスパートを採用することの重要な利点は残している。
HMEモデリングの課題は、HMEモデリングでは大量のパラメータと階層構造を学習する必要があるという点である。従来技術では、周辺対数尤度の解析近似を示す変分推理(variational inference(VI))が、HMEモデリングに効果的に適用されうる。しかし、「初期化に敏感ということ」が、HMEモデリングのVIの効果に影響を及ぼす障害になる。
従来技術の混合モデリングは、常に、ランダムな初期化手順、すなわち、ランダムにモデル構造とモデルパラメータを生成するということを採用する。その後、混合モデルを生成するために、トレーニング・データセットを使って、モデル構造とモデルパラメータとが学習される。初期化手順がランダムなので、望ましい結果は、長期の多くの試みを通じてのみ、導出されうる。
本開示の目的は、従来技術の上記課題の少なくとも一部を解決するために、混合モデリングのための初期化方法及び初期化システムを提供することを含む。
本開示の1つの観点によれば、混合モデリングのための複数の初期ポイントを生成することと、混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行することと、最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することと、を含む混合モデリングのための初期化方法が提供される。
本開示の代表的な実施形態によれば、前記混合モデリングは、エキスパートの階層的混合モデリングを含む。
本開示の代表的な実施形態によれば、前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む。
本開示の代表的な実施形態によれば、前記モデルの複雑性は、エキスパートの数の対数形式で表される。
本開示の代表的な実施形態によれば、最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することは、尤度に基づいて、前記混合モデルの各々の精度を見積もることと、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすことと、を更に含む。
本開示の代表的な実施形態によれば、前記方法は、前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることと、前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算することと、を更に含む。
本開示の代表的な実施形態によれば、前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もることを更に含む。
本開示の代表的な実施形態によれば、前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の前記繰り返し回数を、前記第2の有効な繰り返し回数とみなすことを更に含む。
本開示の他の観点によれば、混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュールと、混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュールと、対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行するように構成されたモデリング・モジュールと、最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュールと、を含む混合モデリングのための初期化システムが提供される。
本開示の代表的な実施形態によれば、前記混合モデリングは、エキスパートの階層的混合モデリングを含む。
本開示の代表的な実施形態によれば、前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む。
本開示の代表的な実施形態によれば、前記モデルの複雑性は、エキスパートの数の対数形式で表される。
本開示の代表的な実施形態によれば、前記選択モジュールは、更に、尤度に基づいて、前記混合モデルの各々の精度を見積もり、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすように構成されている。
本開示の代表的な実施形態によれば、前記システムは、前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュールと、前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、を更に含む。
本開示の代表的な実施形態によれば、前記第2の見積りモジュールは、更に、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もるように構成されている。
本開示の代表的な実施形態によれば、前記第2の見積りモジュールは、更に、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の前記繰り返し回数を、前記第2の有効な繰り返し回数とみなすように構成されている。
本開示の様々な実施形態の技術的解決方法では、初期化における混合モデリングの繰り返し回数は、モデルの複雑性に基づいて見積もられ、初期化に対するモデリング手順の感度を軽減できる。したがって、ランダムな初期化ストラテジーに比べ、モデリングの精度を高めることができる。また、モデルの複雑性と混合モデリングの最適化目的関数とを組み合わせた場合、モデリングの精度を更に高めることができる。
代表的な実施形態の以下の詳細な説明を、添付図面と合わせて読めば、上記及び他の目的と、特徴と、利点とが明らかになるだろう。
以下で、添付図面のいくつかの代表的な実施形態に関して、本開示の原理と方法とが述べられる。これらの実施形態は、当業者がより理解し、そして本開示を実施可能なように述べられただけであって、どの手法でも本開示の範囲を限定することを意図してはいないと理解されるべきである。
以下で、本開示による混合モデリングのための初期化方法を、図1と図2と合わせて説明する。
図1は、本開示の1つの実施形態による初期化方法のフロー図を模式的に示す。図1に見られるように、混合モデリングのための初期化方法は、一般に、ステップ102で混合モデリングのための複数の初期ポイントを生成することと、ステップ103で混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、ステップ104で対応する混合モデルを生成するために、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行することと、ステップ105で最良の精度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとして選択することと、を含んでも良い。
更に、本開示による初期化方法は、トレーニング・データセットを取得するステップ101も含んでも良い。ステップ101で取得したトレーニング・データセットを、ステップ103での混合モデリングの有効な繰り返し回数の見積りと、対応する混合モデルを生成するための、ステップ104での混合モデリングの実行に使用しても良い。本開示による初期化方法は、次のステップも含んでも良い。ステップ106では、ステップ105で取得した最適な初期化ポイントを使用して、混合モデルを初期化する。
1つの代表的な実施形態によれば、混合モデリングは、エキスパートの階層的混合(Hierarchical Mixture of Experts(HME))モデリング及びガウス混合モデリング等を含んでも良い。HMEモデリングとガウス混合モデリングとは、その道で知られた混合モデリング技術である。本開示は、それらの初期化手順を改善することを目的としている。初期化手順以外の他のステップは、ここでは詳述しない。
ステップ101では、初期ポイントの各々は、HMEモデルのモデルパラメータと変分分布確率とを含んでも良い。例えば、HMEモデリングのN1個の初期ポイントは、ランダムに生成されても良く、初期ポイントの各々は、HMEモデルのモデルパラメータθmと変分分布確率qmとを含む。ここで、m=1,・・・,N1である。
図2は、有効な繰り返し回数を見積もるステップ103のフロー図を模式的に示す。図2に見られるように、有効な繰り返し回数を見積もるステップ103は、モデルの複雑性に基づいて、ステップ201で第1の有効な繰り返し回数を見積もることと、ステップ202で混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることと、ステップ203で混合モデリングの繰り返し回数として、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を計算することと、を含んでも良い。
図2は、有効な繰り返し回数を見積もるステップ103の例を示すのみである。他の実施形態では、有効な繰り返し回数を、他の手法で見積もっても良い。例えば、ある実施形態では、ステップ201で、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることのみが許可され、第1の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。他の実施形態でも、ステップ202で、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることのみが許可され、第2の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。
代表的な実施形態によれば、HMEモデリングを初期化する場合、ステップ201のモデルの複雑性は、エキスパートの数の対数形式で表されても良い。例えば、完全学習手順における繰り返し回数の最大値は、N2に設定されても良い。期待値最大化(expectation maximization(EM))アルゴリズムでは、i回目のEM繰り返し後のモデルの複雑性Ci Mは、式(1)で表されても良い。
ここで、i=1,2,・・・,N2であり、Eはエキスパートの数を示す。
本開示の代表的な実施形態によれば、ステップ202で、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることは、最適化目的関数の目的値と、最適化目的関数の最大値と最小値の差との関係に基づいて、第2の有効な繰り返し回数を見積もることを更に含む。例えば、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。
例えば、最適化目的関数を、式(3)で定義しても良い。式(3)は従来技術で開示されている。その具体的な定義は、次の参考文献で述べられているであろう。2014年、人工知能と統計(Artificial Intelligence and Statistics(AISTATS))の第17回国際学会の会報「完全自動ベイズ的区分的まばら線形モデル」エトウ・R、フジマキ・R、サトシ・モリナガ、ヒロシ・タマノ
ここで、
である。
本開示の様々な実施形態では、様々な種類の混合モデリングのための最適化目的関数が採用されても良く、式(3)は本開示の原理の記述を容易にするための、ここでの単なる例である。
ステップ202では、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。例えば、式(4)に見られるアルゴリズムを、第2の有効な繰り返し回数を見積もるのに使用しても良い。
式(4)の具体的なアルゴリズムは、iの値を最小にすることである。この手順においては、イテレーションが繰り返し実行される。iはイテレーションのステップ数を示し、最小のi値を取り、最小のi値が以下の要件:最適化目的関数FICの値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達する時、を満たす所で、FICの値は要件を満たしたと信じられている。したがって、式(4)から導き出された最小のi値は、第2の有効な繰り返し回数とみなされる。もちろん、第2の有効な繰り返し回数を見積もるのに、他の方法を採用しても良い。
式(2)と式(4)から第1の有効な繰り返し回数と第2の有効な繰り返し回数を取得した後、第1の有効な繰り返し回数と第2の有効な繰り返し回数のどちらか1つのみを、ステップ104で実行される混合モデリングの繰り返し回数として採用することが許可される。もちろん、例えば式(5)に見られる、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を、ステップ104で実行される混合モデリングの有効な繰り返し回数として採用しても良い。
ここで、N3は混合モデリングの有効な繰り返し回数を示す。
ステップ104では、対応する混合モデルを生成するために、ステップ103で取得された有効な繰り返し回数に基づいて、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行する。
ステップ105では、尤度に基づいて、混合モデルの各々の精度を見積もり、最良の尤度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとみなす。
本開示による初期化方法の原理を、図1と図2で示された望ましい実施形態に関して上述した。しかし、本開示による初期化方法は、上記特定のステップに限定されず、請求項で限定された範囲まで適用されるということを当業者は理解しうる。様々な要求に応じて、1以上のステップを省略するか追加することを当業者は容易に想定する。
次に、本開示による混合モデリングのための初期化システムを、図3と図4を参照して説明する。
図3は、本開示の1つの実施形態による初期化システムのブロック図を模式的に示す。図3に見られるように、混合モデリングのための初期化システムは、混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュール302と、混合モデリングの有効な繰り返し回数を見積もるように構成された繰り返し回数見積りモジュール303と、対応する混合モデルを生成するために、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行するように構成されたモデリング・モジュール304と、最良の精度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュール305と、を通常含んでも良い。
更に、本開示による初期化システムは、トレーニング・データセットを取得するように構成された取得モジュール301も含んでも良い。取得モジュール301により取得されたトレーニング・データセットを、繰り返し回数見積りモジュール303で混合モデリングの有効な繰り返し回数を見積もることと、モデリング・モジュール104で対応する混合モデルを生成するために混合モデリングを実行することとに使用しても良い。本開示による初期化システムは、選択モジュール305で取得された最適な初期化ポイントを使用して混合モデルを初期化する初期化モジュール306も含んでも良い。
1つの代表的な実施形態によれば、混合モデリングは、エキスパートの階層的混合(Hierarchical Mixture of Experts(HME))モデリング及びガウス混合モデリング等を含んでも良い。HMEモデリングとガウス混合モデリングとは、その道で知られた混合モデリング技術である。本開示は、それらの初期化手順を改善することを目的としている。初期化手順以外の他のステップは、ここでは詳述しない。
取得モジュール301では、初期ポイントの各々は、HMEモデルのモデルパラメータと変分分布確率とを含んでも良い。例えば、HMEモデリングのN1個の初期ポイントは、ランダムに生成されても良く、初期ポイントの各々は、HMEモデルのモデルパラメータθmと変分分布確率qmとを含む。ここで、m=1,・・・,N1である。
図4は、繰り返し回数見積りモジュール303のブロック図を模式的に示す。図4で示されるように、繰り返し回数見積りモジュール303は、モデルの複雑性に基づいて、第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュール401と、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュール402と、混合モデリングの繰り返し回数として、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、を含んでも良い。
図4は、繰り返し回数見積りモジュール303の例を示すのみである。他の実施形態では、有効な繰り返し回数を、他の手法で見積もっても良い。例えば、ある実施形態では、第1の見積りモジュール401により、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることのみが許可され、第1の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。他の実施形態でも、第2の見積りモジュール402により、混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることのみが許可され、第2の有効な繰り返し回数が混合モデリングの有効な繰り返し回数として使用される。
代表的な実施形態によれば、第1の見積りモジュール401で、HMEモデリングを初期化する場合、モデルの複雑性は、エキスパートの数の対数形式で示されても良い。例えば、完全学習手順における繰り返し回数の最大値は、N2に設定されても良い。期待値最大化(expectation maximization(EM))アルゴリズムでは、i回目のEM繰り返し後のモデルの複雑性Ci Mは、式(1)で表されても良い。
代表的な実施形態によれば、第1の見積りモジュール401により、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もる方法は、式(2)で表されても良い。
本開示の代表的な実施形態によれば、第2の見積りモジュール402は、最適化目的関数の目的値と、最適化目的関数の最大値と最小値の差との関係に基づいて、第2の有効な繰り返し回数を見積もっても良い。例えば、第2の見積りモジュール402は、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。
例えば、最適化目的関数を式(3)で定義しても良い。本開示の様々な実施形態では、混合モデリングのための様々な種類の最適化目的関数を採用しても良く、式(3)は本開示の原理の記述を容易にするための、ここでの単なる例である。
第2の見積りモジュール402は、最適化目的関数の目的値と最小値の差が最適化目的関数の最大値と最小値の差の半分に達した際の繰り返し回数を、第2の有効な繰り返し回数とみなしても良い。例えば、式(4)に見られるアルゴリズムを、第2の有効な繰り返し回数を見積もるのに使用しても良い。
式(2)と式(4)から第1の有効な繰り返し回数と第2の有効な繰り返し回数を取得した後、第1の有効な繰り返し回数と第2の有効な繰り返し回数のどちらか1つのみを、モデリング・モジュール304で実行される混合モデリングの繰り返し回数として採用することが許可される。もちろん、例えば式(5)に見られる、第1の有効な繰り返し回数と第2の有効な繰り返し回数の和を、モデリング・モジュール304で実行される混合モデリングの有効な繰り返し回数として採用しても良い。
モデリング・モジュール304は、対応する混合モデルを生成するために、トレーニング・データセットに対して、初期ポイントの各々から、それぞれ混合モデリングを実行するのに、繰り返し回数見積りモジュール303で取得された有効な繰り返し回数を採用しても良い。
選択モジュール305は、尤度に基づいて、混合モデルの各々の精度を見積もり、最良の尤度を有する混合モデルに対応する初期ポイントを、最適な初期化ポイントとみなしても良い。
図3と図4に見られるシステムは、各々図1と図2に見られる方法に相当する。したがって、図1と図2に関する初期化方法の上記記載は、図3と図4で示された初期化システムに同様に当てはまるので、ここでは詳述しない。
本開示の様々な実施形態の技術的解決方法では、初期化における混合モデリングの繰り返し回数が、モデルの複雑性に基づいて見積もられ、それにより、初期化に対するモデリング手順の感度を軽減できる。したがって、ランダムな初期化戦略に比べ、モデリングの精度を高めることができる。また、モデルの複雑性と混合モデリングの最適化目的関数とを組み合わせた場合、モデリングの精度を更に高めることができる。
本発明の実施形態は、ソフトウェア、又はハードウェア、又はそれらの組み合わせで実現されうるという点に更に留意すべきである。ハードウェア部分は、特別なロジックにより実現可能であり、ソフトウェア部分は、メモリに格納され、マイクロプロセッサ又は専用に設計されたハードウェアなどの適切な指示実行システムにより実行されうる。上記方法及びシステムは、コンピュータ実行可能な指示、及び/又は、例えば、磁気ディスク又はCD又はDVD−ROMのようなベアラ媒体、又は読出し専用メモリ(ファームウェア)又は光学又は電子信号ベアラ等のデータ・ベアラのようなプログラム可能メモリで供給されるコードといった、プロセッサに含まれた制御コードで実現されうる、と、通常の当業者は理解しうる。本実施形態における装置及びその構成要素は、例えば、非常に大規模な集積回路又はゲートアレイ、又は論理チップ又はトランジスタのような半導体、又はフィールド・プログラマブル・ゲートアレイのようなプログラム可能なハードウェア・デバイス、又はプログラム可能な論理デバイスといったハードウェア電気回路構成により実現されても良く、又は様々な種類のプロセッサにより実行されるソフトウェアにより実現されても良く、又は例えばファームウェアといった上記ハードウェア電気回路構成とソフトウェアとの組み合わせ、により実現されても良い。
本発明による方法の動作は、図面中に特定の順序で表されているが、これは、それらの動作が当該特定の順序で実行されなければならないということを、又は望ましい結果は示された全ての動作が実行されてのみ成し遂げられうるということを、要求するものでも又は含むものでもない。寧ろ、フロー図で示されるステップは、異なる順序で実行されても良い。その上に、又は、代わりに、いくつかのステップを省略しても良く、及び/又は実行のために複数のステップを1つのステップに統合しても良く、及び/又は実行のために1つのステップを複数のステップに分解しても良い。
本発明を、目下考慮に入れた実施形態に関して記述したが、本発明は、開示された実施形態に限定されないと理解するべきである。それどころか、添付の請求項の趣旨及び範囲内に入る様々な修正及び等価な並べ替えに及ぶことを、本発明は意図する。添付の請求の範囲は、最も広い解釈に一致し、そのような修正と、等価な構造及び機能との全てに及ぶ。
(付記1)
混合モデリングのための複数の初期ポイントを生成することと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行することと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することと、
を含む混合モデリングのための初期化方法。
混合モデリングのための複数の初期ポイントを生成することと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行することと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することと、
を含む混合モデリングのための初期化方法。
(付記2)
前記混合モデリングは、エキスパートの階層的混合モデリングを含む付記1に記載の初期化方法。
前記混合モデリングは、エキスパートの階層的混合モデリングを含む付記1に記載の初期化方法。
(付記3)
前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む付記2に記載の初期化方法。
前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む付記2に記載の初期化方法。
(付記4)
前記モデルの複雑性は、エキスパートの数の対数形式で表される付記2または3に記載の初期化方法。
前記モデルの複雑性は、エキスパートの数の対数形式で表される付記2または3に記載の初期化方法。
(付記5)
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することは、
尤度に基づいて、前記混合モデルの各々の精度を見積もることと、
最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすことと、
を更に含む付記1に記載の初期化方法。
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することは、
尤度に基づいて、前記混合モデルの各々の精度を見積もることと、
最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすことと、
を更に含む付記1に記載の初期化方法。
(付記6)
前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることと、
前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算することと、
を更に含む付記1に記載の初期化方法。
前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もることと、
前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算することと、
を更に含む付記1に記載の初期化方法。
(付記7)
前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もることを更に含む付記6に記載の初期化方法。
前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もることを更に含む付記6に記載の初期化方法。
(付記8)
前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすことを更に含む付記7に記載の初期化方法。
前記第2の有効な繰り返し回数を見積もることは、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすことを更に含む付記7に記載の初期化方法。
(付記9)
混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュールと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュールと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行するように構成されたモデリング・モジュールと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュールと、
を含む混合モデリングのための初期化システム。
混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュールと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュールと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行するように構成されたモデリング・モジュールと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュールと、
を含む混合モデリングのための初期化システム。
(付記10)
前記混合モデリングは、エキスパートの階層的混合モデリングを含む付記9に記載の初期化システム。
前記混合モデリングは、エキスパートの階層的混合モデリングを含む付記9に記載の初期化システム。
(付記11)
前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む付記10に記載の初期化システム。
前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む付記10に記載の初期化システム。
(付記12)
前記モデルの複雑性は、エキスパートの数の対数形式で表される付記10または11に記載の初期化システム。
前記モデルの複雑性は、エキスパートの数の対数形式で表される付記10または11に記載の初期化システム。
(付記13)
前記選択モジュールは、更に、尤度に基づいて、前記混合モデルの各々の精度を見積もり、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすように構成されている付記9に記載の初期化システム。
前記選択モジュールは、更に、尤度に基づいて、前記混合モデルの各々の精度を見積もり、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすように構成されている付記9に記載の初期化システム。
(付記14)
前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュールと、
前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、
を更に含む付記9に記載の初期化システム。
前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュールと、
前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、
を更に含む付記9に記載の初期化システム。
(付記15)
前記第2の見積りモジュールは、更に、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もるように構成されている付記14に記載の初期化システム。
前記第2の見積りモジュールは、更に、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もるように構成されている付記14に記載の初期化システム。
(付記16)
前記第2の見積りモジュールは、更に、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすように構成されている付記15に記載の初期化システム。
前記第2の見積りモジュールは、更に、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすように構成されている付記15に記載の初期化システム。
Claims (9)
- 混合モデリングのための複数の初期ポイントを生成するように構成された初期ポイント生成モジュールと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もるように構成された第1の見積りモジュールと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行するように構成されたモデリング・モジュールと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択するように構成された選択モジュールと、
を含む混合モデリングのための初期化システム。 - 前記混合モデリングは、エキスパートの階層的混合モデリングを含む請求項1に記載の初期化システム。
- 前記初期ポイントの各々は、エキスパートの階層的混合モデルのモデルパラメータと変分分布確率とを含む請求項2に記載の初期化システム。
- 前記モデルの複雑性は、エキスパートの数の対数形式で表される請求項2または3に記載の初期化システム。
- 前記選択モジュールは、更に、尤度に基づいて、前記混合モデルの各々の精度を見積もり、最良の尤度を有する前記混合モデルに対応する前記初期ポイントを、前記最適な初期化ポイントとみなすように構成されている請求項1に記載の初期化システム。
- 前記混合モデリングの最適化目的関数の曲線変化に基づいて、第2の有効な繰り返し回数を見積もるように構成された第2の見積りモジュールと、
前記混合モデリングの前記繰り返し回数として、前記第1の有効な繰り返し回数と前記第2の有効な繰り返し回数の和を計算するように構成された計算モジュールと、
を更に含む請求項1に記載の初期化システム。 - 前記第2の見積りモジュールは、更に、前記最適化目的関数の目的値と、前記最適化目的関数の最大値と最小値の差との関係に基づいて、前記第2の有効な繰り返し回数を見積もるように構成されている請求項6に記載の初期化システム。
- 前記第2の見積りモジュールは、更に、前記最適化目的関数の前記目的値と前記最小値の差が前記最適化目的関数の前記最大値と前記最小値の前記差の半分に達した際の繰り返し回数を、前記第2の有効な繰り返し回数とみなすように構成されている請求項7に記載の初期化システム。
- 混合モデリングのための複数の初期ポイントを生成することと、
混合モデリングの繰り返し回数として、モデルの複雑性に基づいて第1の有効な繰り返し回数を見積もることと、
対応する混合モデルを生成するために、トレーニング・データセットに対して、前記初期ポイントの各々から、それぞれ前記混合モデリングを実行することと、
最良の精度を有する前記混合モデルに対応する前記初期ポイントを、最適な初期化ポイントとして選択することと、
を含む混合モデリングのための初期化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510147649.0 | 2015-03-31 | ||
CN201510147649.0A CN106156855A (zh) | 2015-03-31 | 2015-03-31 | 用于混合建模的初始化方法和初始化系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016194911A JP2016194911A (ja) | 2016-11-17 |
JP6172316B2 true JP6172316B2 (ja) | 2017-08-02 |
Family
ID=57323682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016040847A Active JP6172316B2 (ja) | 2015-03-31 | 2016-03-03 | 混合モデリングのための初期化方法及び初期化システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6172316B2 (ja) |
CN (1) | CN106156855A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657802B (zh) * | 2019-01-28 | 2020-12-29 | 清华大学深圳研究生院 | 一种混合专家强化学习方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07285439A (ja) * | 1994-04-19 | 1995-10-31 | Hitachi Ltd | 遺伝的アルゴリズム/ニューロによる列車ダイヤ作成装置及び作成方法 |
JPH0962645A (ja) * | 1995-08-22 | 1997-03-07 | Nippon Telegr & Teleph Corp <Ntt> | 専門家の階層混合モデルの構築的学習方法 |
JPH10149192A (ja) * | 1996-09-20 | 1998-06-02 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法、装置およびその記憶媒体 |
-
2015
- 2015-03-31 CN CN201510147649.0A patent/CN106156855A/zh active Pending
-
2016
- 2016-03-03 JP JP2016040847A patent/JP6172316B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016194911A (ja) | 2016-11-17 |
CN106156855A (zh) | 2016-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chernozhukov et al. | Anti-concentration and honest, adaptive confidence bands | |
Alaa et al. | Limits of estimating heterogeneous treatment effects: Guidelines for practical algorithm design | |
Stitelman et al. | Collaborative targeted maximum likelihood for time to event data | |
JP2020525872A (ja) | インフルエンザ予測モデルの生成方法、装置及びコンピュータ可読記憶媒体 | |
JP6172317B2 (ja) | 混合モデル選択の方法及び装置 | |
Makalic et al. | Review of modern logistic regression methods with application to small and medium sample size problems | |
US20160358316A1 (en) | Approximate message passing with universal denoising | |
WO2020263300A1 (en) | Measuring quantum state purity | |
JP6172316B2 (ja) | 混合モデリングのための初期化方法及び初期化システム | |
CN117115551A (zh) | 一种图像检测模型训练方法、装置、电子设备及存储介质 | |
JP6164320B2 (ja) | 区分的線形モデル生成システム及び生成方法 | |
KR20200019377A (ko) | 측정 노이즈 추천을 통한 칼만 필터링 방법 및 이를 기록한 기록매체 | |
US8344924B2 (en) | Analog signal conversion | |
KR102559605B1 (ko) | 함수 최적화 방법 및 장치 | |
Watanabe | A fuzzy RANSAC algorithm based on reinforcement learning concept | |
JPWO2020105144A1 (ja) | 画像生成装置及び画像生成方法 | |
JP6233432B2 (ja) | 混合モデルの選択方法及び装置 | |
JPWO2018198298A1 (ja) | パラメータ推定装置、パラメータ推定方法、及びプログラム | |
Debbabi et al. | A new unsupervised threshold determination for hybrid models | |
KR102635503B1 (ko) | 마르코프 체인 몬테 카를로 샘플링의 초기값 결정 방법 | |
Chen et al. | Detecting change-points in epidemic models | |
Munoz-Minjares et al. | Jitter representation in SCNA breakpoints using asymmetric exponential power distribution | |
WO2021111832A1 (ja) | 情報処理方法、情報処理システム及び情報処理装置 | |
US20230080028A1 (en) | Supervised graph learning | |
Kinnear et al. | Branching Subset Simulation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6172316 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |