JP6172315B2 - Method and apparatus for mixed model selection - Google Patents

Method and apparatus for mixed model selection Download PDF

Info

Publication number
JP6172315B2
JP6172315B2 JP2016040843A JP2016040843A JP6172315B2 JP 6172315 B2 JP6172315 B2 JP 6172315B2 JP 2016040843 A JP2016040843 A JP 2016040843A JP 2016040843 A JP2016040843 A JP 2016040843A JP 6172315 B2 JP6172315 B2 JP 6172315B2
Authority
JP
Japan
Prior art keywords
candidate
model
latent variable
models
initial latent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016040843A
Other languages
Japanese (ja)
Other versions
JP2016194910A (en
Inventor
チュンチェン リウ
チュンチェン リウ
ホゥ ワン
ホゥ ワン
ルウ フオン
ルウ フオン
遼平 藤巻
遼平 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2016194910A publication Critical patent/JP2016194910A/en
Application granted granted Critical
Publication of JP6172315B2 publication Critical patent/JP6172315B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明の実施の形態は、機械学習に関し、特に、混合モデル選択の方法及び装置に関する。   Embodiments of the present invention relate to machine learning, and in particular, to a mixed model selection method and apparatus.

混合モデルは、混合分布を用いる密度推定に関する確率モデルの一種で、部分母集団から成る母集団を表す。混合モデルには、混合ガウスモデル、区分線形混合モデルなどが含まれ、文書の分類、手書き認識、ファジーイメージ分離などの広い分野に適用されている。   The mixed model is a kind of probability model related to density estimation using a mixed distribution, and represents a population composed of partial populations. Mixed models include mixed Gaussian models, piecewise linear mixed models, and the like, and are applied to a wide range of fields such as document classification, handwriting recognition, and fuzzy image separation.

混合モデルのモデル選択は、モデルパラメータのような、モデルの表現の最適化を含み、実行上、最も重要で困難な問題である。混合モデルのモデル選択はいくつか開示されている。その混合モデルのモデル選択の中で、局所的に対数尤度の近似を繰り返す変分推論法はより有効な方法である。しかし、変分推論法は、初期化による影響が大きい。変分推論法の初期化が適切でなければ、変分推論法の効果は低く、正確に、かつ、有効にモデルを推定できない。このため、初期化は、変分推定法の正確性、有効性に影響を与える重要な要素である。   Model selection for a mixed model involves optimization of the representation of the model, such as model parameters, and is the most important and difficult problem to implement. Several model selections for mixed models are disclosed. In the model selection of the mixed model, the variational reasoning method that repeats the log likelihood approximation locally is a more effective method. However, the variational reasoning method is greatly affected by initialization. If initialization of the variational reasoning method is not appropriate, the effect of the variational reasoning method is low, and the model cannot be estimated accurately and effectively. Therefore, initialization is an important factor that affects the accuracy and effectiveness of the variation estimation method.

近年、変分推論法の初期化方法として、例えば、ランダム初期化、クラスタベースの初期化などから構成されている。しかし、ランダム初期化は一般に初期化に多数のサンプルを使用するため長い処理時間を要し、モデル選択は低速度で実行される。また、クラスタベースの初期化は、クラスタ型の混合モデル(例えば、混合ガウスモデルなど)に対して有効に動作するが、認識/分類を目的とする混合モデルに対して適切な結果を得られない。このため、クラスタベースの初期化は汎用性が低い。   In recent years, initialization methods for variational reasoning methods include, for example, random initialization and cluster-based initialization. However, random initialization generally requires a long processing time because many samples are used for initialization, and model selection is performed at a low speed. In addition, cluster-based initialization works well for cluster-type mixed models (eg, mixed Gaussian models), but does not provide appropriate results for mixed models for recognition / classification purposes. . For this reason, cluster-based initialization is less versatile.

このため、混合モデルの選択において、処理時間が短く、汎用性の高い初期化方法が必要である。   For this reason, in selecting a mixed model, an initialization method with a short processing time and high versatility is required.

本発明の実施の形態は、混合モデル選択の技術的な解決法を提供することを目的とする。   Embodiments of the present invention aim to provide a technical solution for mixed model selection.

本発明の一つの観点において、混合モデルの選択方法を提供する。この混合モデルの選択方法は、
複数の第1の初期潜在変数の訓練により、候補モデルを複数生成する工程と、
複数の前記候補モデルに基づき複数の第2の初期潜在変数を決定する工程と、
前記第2の初期潜在変数に基づきターゲットモデルを決定する工程と、
を含む。
In one aspect of the present invention, a method for selecting a mixed model is provided. The method of selecting this mixed model is
Generating a plurality of candidate models by training a plurality of first initial latent variables;
Determining a plurality of second initial latent variables based on a plurality of said candidate models;
Determining a target model based on the second initial latent variable;
including.

また、本発明の他の観点において、混合モデルの選択装置を提供する。この混合モデルの選択装置は、
複数の第1の初期潜在変数の訓練により、候補モデルを複数生成する候補モデル生成部と、
複数の前記候補モデルに基づき第2の初期潜在変数を決定する第1決定部と、
前記第2の初期潜在変数に基づきターゲットモデルを決定する第2決定部と、
を備える。
In another aspect of the present invention, an apparatus for selecting a mixed model is provided. The selection device for this mixed model is
A candidate model generation unit that generates a plurality of candidate models by training a plurality of first initial latent variables;
A first determination unit for determining a second initial latent variable based on the plurality of candidate models;
A second determination unit for determining a target model based on the second initial latent variable;
Is provided.

本発明の実施の形態によれば、候補モデルの訓練結果を使用して、新しい初期潜在変数を生成する。この後、新しい初期潜在変数に基づき、混合モデルの種類に限定されることなく、新しいモデルを獲得する。それゆえ、本発明の解決法は、高い汎用性を有する。また、本発明の実施の形態によれば、局所的に最適化されたモデルに基づき、より確かな新しい初期潜在変数を獲得する。次に、新しい初期潜在変数に基づきターゲットモデルを獲得する。
上記のターゲットモデルを獲得する方法は、無作為に初期化されたいくつかの潜在変数を用いて直接ターゲットモデルを獲得する方法と比較し、同等の正確さを有しながら、処理時間が著しく短い。つまり、本発明に従う解決法は、高い実行速度を誇る。本発明の他の特徴、優位点については、後述する。
According to an embodiment of the present invention, the training results of the candidate model are used to generate a new initial latent variable. Thereafter, based on the new initial latent variable, a new model is obtained without being limited to the type of the mixed model. The solution of the present invention is therefore highly versatile. In addition, according to the embodiment of the present invention, a more reliable new initial latent variable is obtained based on a locally optimized model. Next, a target model is obtained based on the new initial latent variable.
The above target model acquisition method has a processing time significantly shorter than the method of acquiring the target model directly using some randomly initialized latent variables while having the same accuracy. . That is, the solution according to the invention boasts a high execution speed. Other features and advantages of the present invention will be described later.

この開示の上記または他の目的、特徴、優位点は、添付図面の中の本発明の実施の形態に関するより詳細な説明から、より明確になる。   The above and other objects, features, and advantages of this disclosure will become more apparent from the more detailed description of the embodiments of the present invention in the accompanying drawings.

本発明の実施の形態における混合モデル選択の方法の処理に関するフローチャートである。It is a flowchart regarding the process of the method of the mixed model selection in embodiment of this invention. 本発明の実施の形態における混合モデル選択の方法の処理に関するフローチャートである。It is a flowchart regarding the process of the method of the mixed model selection in embodiment of this invention. 本発明の実施の形態における第2の初期潜在変数を決定する方法の処理に関するフローチャートである。It is a flowchart regarding the process of the method of determining the 2nd initial latent variable in embodiment of this invention. 本発明の実施の形態における混合モデル選択の方法を説明するための概要図である。It is a schematic diagram for demonstrating the method of selection of the mixed model in embodiment of this invention. 本発明の実施の形態における混合モデル選択の装置のブロック図である。It is a block diagram of the apparatus of the mixed model selection in embodiment of this invention. 本発明の実施の形態の実行に適用可能なコンピュータシステムの一例のブロック図である。It is a block diagram of an example of a computer system applicable to execution of an embodiment of the invention.

図を通して、同一又は類似の数字は、同一又は類似の要素を表す。   Throughout the figures, the same or similar numbers represent the same or similar elements.

本発明の好適な実施の形態を、図面を参照して詳細に説明する。図面には、この開示の好適な実施の形態を示している。しかし、本開示は、種々の手法で実施しうるため、後述の実施の形態に限定されると解釈すべきではない。それどころか、この開示の完全な理解のために、実施の形態を示しており、当業者は本発明の範囲に関するすべてを理解することができる。   Preferred embodiments of the present invention will be described in detail with reference to the drawings. The drawings show preferred embodiments of the present disclosure. However, the present disclosure can be implemented by various methods and should not be construed as limited to the embodiments described below. On the contrary, the embodiments are shown for a thorough understanding of this disclosure, and a person skilled in the art can understand everything about the scope of the present invention.

本発明の方法と原理を詳細に説明する。特に明記しない限り、以下及び特許請求の範囲では、「基づき」の文言は「少なくとも部分的に基づき」を意味する。「構成する」の文言は、「限定されずに含む」を意味する。「複数の」の文言は、「二以上の」を意味する。「一実施の形態」の文言は、「少なくとも一実施の形態」を意味する。「他の一実施の形態」の文言は、「少なくとも他の一実施の形態」を意味する。関連する他の文言の定義は、以降の記述で示される。   The method and principle of the present invention will be described in detail. Unless stated otherwise, in the following and claims, the word “based” means “based at least in part”. The word “comprising” means “including but not limited to”. The word “plurality” means “two or more”. The phrase “one embodiment” means “at least one embodiment”. The phrase “another embodiment” means “at least another embodiment”. Definitions of other relevant language are given in the following description.

図1に、本発明の実施の形態に係る混合モデル選択の方法100の処理に関するフローチャートを示す。従来、変分推論法の初期化において、ランダム初期化、クラスタベース初期化などの手順が利用されている。しかし、これらの初期化方法には、一般に処理時間が長いこと、汎用性が低いことなどの問題がある。このような問題は、すべて混合モデル選択において生じる。この実施の形態に係る混合モデル選択の方法100は、後述するとおり、この問題を効率的に解決できる。   FIG. 1 shows a flowchart relating to the processing of the mixed model selection method 100 according to the embodiment of the present invention. Conventionally, in initialization of variational reasoning, procedures such as random initialization and cluster-based initialization are used. However, these initialization methods generally have problems such as a long processing time and low versatility. All of these problems arise in mixed model selection. The mixed model selection method 100 according to this embodiment can efficiently solve this problem, as will be described later.

図1に示すように、混合モデルの選択方法100は、最初に、ステップS110で複数の第1の初期潜在変数を用いた訓練により、複数の候補モデルを生成する。   As shown in FIG. 1, the mixed model selection method 100 first generates a plurality of candidate models by training using a plurality of first initial latent variables in step S110.

本発明の実施の形態において、「潜在変数」は、直接観測できないが、サンプルデータから取得可能な変数である。潜在変数の変分分布は、対応するカテゴリに対するクラスタ型サンプルデータの確率を表すのに使用しうる。本発明の実施の形態において、「潜在変数」は、一種類に限定せず、「潜在変数の変分分布」及び/又は他の適切な情報から構成されることに注意されたい。この開示において、潜在変数には、初期潜在変数、更新潜在変数などが含まれる。なお、初期潜在変数とは訓練用の潜在変数を表し、更新潜在変数は訓練の結果としての潜在変数を表す。   In the embodiment of the present invention, a “latent variable” is a variable that cannot be directly observed but can be acquired from sample data. The variational distribution of latent variables can be used to represent the probability of clustered sample data for the corresponding category. It should be noted that in the embodiment of the present invention, the “latent variable” is not limited to one type but is composed of “variation distribution of latent variables” and / or other appropriate information. In this disclosure, latent variables include initial latent variables, updated latent variables, and the like. The initial latent variable represents a latent variable for training, and the updated latent variable represents a latent variable as a result of training.

本発明の実施の形態において、「モデル」には、候補モデル、中間モデル、ターゲットモデルなどが含まれえる。モデルは、初期潜在変数を用いた訓練により、生成されえる。生成されたモデルは、モデル構造、モデルパラメータ、更新潜在変数の変分分布などの要素を有する。
モデルパラメータは、混合モデルの種類により異なる。一般的に混合モデルは、モデルの種類を表す用語で、混合モデルは複数の下位モデルから構成される場合もある。つまり、モデルパラメータは、混合モデルの特定の種類と関連している。例えば、混合ガウスモデルのモデルパラメータには、各下位モデルが持つガウス分布の平均と分散が含まれる。区分線形混合モデルのモデルパラメータには、ゲートノードの条件制御パラメータと、リーフノードの偏差と回帰係数が含まれる。
モデル構造も、特定の混合モデルの種類に関連している。例えば、混合ガウスモデルのモデル構造には、下位モデルの数と下位モデルの結合係数などが含まれる。区分線形混合モデルのモデル構造には、学習されたツリー構造が含まれる。
上記の例は単に説明のために示したもので、本発明の範囲を限定することを意図しない。
In the embodiment of the present invention, the “model” may include a candidate model, an intermediate model, a target model, and the like. The model can be generated by training with initial latent variables. The generated model has elements such as a model structure, model parameters, and variational distribution of update latent variables.
Model parameters vary depending on the type of mixed model. In general, the mixed model is a term representing the type of model, and the mixed model may be composed of a plurality of lower models. That is, model parameters are associated with a particular type of mixed model. For example, the model parameters of the mixed Gaussian model include the mean and variance of the Gaussian distribution possessed by each lower model. The model parameters of the piecewise linear mixed model include a gate node condition control parameter, a leaf node deviation, and a regression coefficient.
The model structure is also related to a particular mixed model type. For example, the model structure of the mixed Gaussian model includes the number of lower models and the coupling coefficients of the lower models. The model structure of the piecewise linear mixed model includes a learned tree structure.
The above examples are given for illustrative purposes only and are not intended to limit the scope of the present invention.

一実施の形態において、ステップS110において、訓練サンプルセットに基づき、複数の第1の初期潜在変数を決定する。
例えば、訓練サンプルセットから無作為にサンプルを集め、又は、サンプルをクラスタ化し、複数の第1の初期潜在変数を獲得する。第1の初期潜在変数は、行列、データセット、又はその他の適当な形式である。
一実施の形態において、第1の初期潜在変数をk×n次元の行列で表しうる。ここで、kは行列の行の数で、第1の初期潜在変数のサンプルグループの数を表し、nは行列の列の数で、訓練サンプルセットのサンプルの数を表す。また、行列の1行は1つのサンプルグループに対応する。各行の各々の要素の値は0又は1である。例えば、ある行におけるi番目の要素が1の場合は、この行に対応するサンプルグループは、訓練サンプルセットのi番目のサンプルを含むことを意味する。この行のj番目の要素が0の場合は、この行に対応するサンプルグループは、訓練サンプルセットのj番目のサンプルを含まないことを意味する。この行列における要素の値は、0又は1である必要はなく、他の適切な数字を用いてもよい。
上記の例は単に説明のために示したもので、本発明の範囲を限定しない。
他の実施の形態において、第1の初期潜在変数は、例えば、kのサンプルグループを含み、各々のサンプルグループが一つ以上のサンプルを持つような、データセットでもよい。
上記の例は単に説明のために示したもので、本発明の範囲を限定しない。当業者は、その他の適切な手法により、第1の初期潜在変数を獲得しうる。
In one embodiment, in step S110, a plurality of first initial latent variables are determined based on the training sample set.
For example, collect samples randomly from the training sample set, or cluster the samples to obtain a plurality of first initial latent variables. The first initial latent variable is a matrix, data set, or other suitable form.
In one embodiment, the first initial latent variable may be represented by a k × n dimensional matrix. Where k is the number of rows in the matrix, representing the number of sample groups of the first initial latent variable, and n is the number of columns in the matrix, representing the number of samples in the training sample set. One row of the matrix corresponds to one sample group. The value of each element in each row is 0 or 1. For example, if the i-th element in a row is 1, it means that the sample group corresponding to this row contains the i-th sample of the training sample set. If the jth element of this row is 0, it means that the sample group corresponding to this row does not include the jth sample of the training sample set. The element values in this matrix need not be 0 or 1, but other suitable numbers may be used.
The above examples are given for illustrative purposes only and do not limit the scope of the invention.
In other embodiments, the first initial latent variable may be, for example, a data set that includes k sample groups, each sample group having one or more samples.
The above examples are given for illustrative purposes only and do not limit the scope of the invention. One skilled in the art can obtain the first initial latent variable by other suitable techniques.

次に、複数の第1の初期潜在変数における各々の第1の初期潜在変数に関する訓練サンプルセットで学習し、各々の第1の初期潜在変数に対応する候補モデルを生成する。
例えば、各々の第1の初期潜在変数に関する訓練サンプルセットを使用した教師あり学習、又は、教師なし学習により、混合モデルのモデル構造、モデルパラメータ、更新潜在変数の変分分布を自動的に学習する。これにより、対応する候補モデルを獲得する。
Next, training is performed on a training sample set for each first initial latent variable in the plurality of first initial latent variables, and a candidate model corresponding to each first initial latent variable is generated.
For example, the supervised learning using the training sample set for each first initial latent variable or unsupervised learning automatically learns the model structure of the mixed model, the model parameters, and the variational distribution of the updated latent variables. . Thereby, a corresponding candidate model is obtained.

次に、方法100の処理はステップS120に進み、複数の候補モデルに基づき、第2の初期潜在変数を決定する。   Next, the process of method 100 proceeds to step S120, where a second initial latent variable is determined based on the plurality of candidate models.

本発明の実施の形態において、種々の手法で、複数の候補モデルに基づき、第2の初期潜在変数を決定しうる。一実施の形態において、複数の候補モデルを対に組み合わせ、この対の候補モデルに基づき、第2の初期潜在変数を決定する。
例えば、候補モデルが二つとすると、一対の候補モデルを形成し、この一対の候補モデルに基づき、第2の初期潜在変数を決定する。対に組み合わせた候補モデルが複数の場合、各々の対の候補モデルに基づき、第2の初期潜在変数を決定する。その結果、第2の初期潜在変数を複数獲得する。
In embodiments of the present invention, the second initial latent variable may be determined based on a plurality of candidate models in various ways. In one embodiment, a plurality of candidate models are combined in pairs, and a second initial latent variable is determined based on the pair of candidate models.
For example, if there are two candidate models, a pair of candidate models is formed, and a second initial latent variable is determined based on the pair of candidate models. If there are a plurality of candidate models combined in pairs, a second initial latent variable is determined based on each pair of candidate models. As a result, a plurality of second initial latent variables are obtained.

他の一実施の形態において、複数の候補モデルから、複数の候補モデルの性能に基づき、候補モデルを二つ以上選択する。モデルの性能には、精度、時間有効性などの種々の因子が含まれる。種々の方法で、例えば、二乗平方根誤差、平均絶対誤差、尤度比などを算出し、モデルの性能を決定しうる。
精度を例にすると、予測/分類の混合モデルでは、テストデータの予測/分類を利用し、対応する予測/分類に関する精度を獲得しうる。また、クラスタリングモデルでは、例えば、基準となる共通な情報などで、候補モデルの精度を算出しうる。
このモデルの性能を評価することで、複数の候補モデルから、より高い性能を持つ候補モデルを二つ以上選択しうる。この後、選択した二つ以上の候補モデルを対に組み合わせ、この対の候補モデルに基づき、第2の初期潜在変数を決定してもよい。
また、本発明のさらなる一実施の形態において、各々の対の候補モデルを成す候補モデルを第1の候補モデルと第2の候補モデルとすると、各々の対の候補モデルの第1の候補モデルの更新潜在変数と第2の候補モデルの更新潜在変数に基づき、第2の初期潜在変数を決定する。このようにして、一つ以上の対の候補モデルに基づき、第2の初期潜在変数を一つ以上決定してもよい。
In another embodiment, two or more candidate models are selected from a plurality of candidate models based on the performance of the plurality of candidate models. The performance of the model includes various factors such as accuracy and time effectiveness. In various ways, for example, the square root error, mean absolute error, likelihood ratio, etc. may be calculated to determine the performance of the model.
Taking accuracy as an example, in a mixed prediction / classification model, prediction / classification of test data can be used to obtain accuracy for the corresponding prediction / classification. In addition, in the clustering model, for example, the accuracy of the candidate model can be calculated by using common reference information.
By evaluating the performance of this model, two or more candidate models having higher performance can be selected from a plurality of candidate models. Thereafter, two or more selected candidate models may be combined in a pair, and the second initial latent variable may be determined based on the pair of candidate models.
In a further embodiment of the present invention, if the candidate models forming each pair of candidate models are a first candidate model and a second candidate model, the first candidate model of each pair of candidate models A second initial latent variable is determined based on the updated latent variable and the updated latent variable of the second candidate model. In this way, one or more second initial latent variables may be determined based on one or more pairs of candidate models.

また、本発明の実施の形態によれば、第2の初期在変数の決定を繰り返し、より性能の高いモデルを獲得してもよい。
一実施の形態において、次のi)〜iii)を1回又は繰り返し、実行してもよい。i)複数の第2の初期潜在変数を用いて訓練により、複数の中間モデルを獲得する。ii)複数の中間モデルに基づき、第3の初期潜在変数を決定する。iii)第3の初期潜在変数を用いて、第2の初期潜在変数を更新する。
この実施の形態では、複数の中間モデルに基づき第3の初期潜在変数を決定する方法は、複数の候補モデルに基づき第2の初期潜在変数を決定するステップS120と類似した方法を採用してもよい。この手法において、ある状態になるまで繰り返し、第2の初期潜在変数を決定する。この状態は、例えば、実行回数が予め定義された繰り返し回数に達した状態、第2の初期潜在変数の精度が予め定義された精度に達した状態、その他の類似した状態である。
According to the embodiment of the present invention, the determination of the second initial variable may be repeated to obtain a model with higher performance.
In one embodiment, the following i) to iii) may be executed once or repeatedly. i) Obtaining a plurality of intermediate models by training using a plurality of second initial latent variables. ii) Determine a third initial latent variable based on the plurality of intermediate models. iii) Update the second initial latent variable with the third initial latent variable.
In this embodiment, the method of determining the third initial latent variable based on the plurality of intermediate models may employ a method similar to step S120 of determining the second initial latent variable based on the plurality of candidate models. Good. In this method, the second initial latent variable is determined repeatedly until a certain state is reached. This state is, for example, a state in which the number of executions has reached a predefined number of repetitions, a state in which the accuracy of the second initial latent variable has reached a predefined accuracy, or other similar states.

さらに、図1に示すとおり、方法100の処理はステップS130に進み、第2の初期潜在変数に基づき、ターゲットモデルを決定する。   Further, as shown in FIG. 1, the process of method 100 proceeds to step S130, where a target model is determined based on the second initial latent variable.

本実施の形態において、ステップS120で、第2の初期潜在変数が一つ以上決定されうる。
一実施の形態において、ステップS120で決定された第2の初期潜在変数が一つとすると、ステップS130で第2の初期潜在変数の訓練により、獲得されたモデルを、ターゲットモデルとして決定する。
In the present embodiment, one or more second initial latent variables may be determined in step S120.
In one embodiment, assuming that there is one second initial latent variable determined in step S120, the acquired model is determined as a target model by training the second initial latent variable in step S130.

他の一実施の形態において、ステップS120で決定された第2の初期潜在変数が複数とすると、ステップS130で第2の初期潜在変数の訓練により、中間モデルを複数獲得し、複数の中間モデルの性能を決定し、この性能に基づき、複数の中間モデルから一つをターゲットモデルとして選択してもよい。   In another embodiment, if there are a plurality of second initial latent variables determined in step S120, a plurality of intermediate models are obtained by training the second initial latent variables in step S130, and a plurality of intermediate models are obtained. The performance may be determined, and one of a plurality of intermediate models may be selected as a target model based on the performance.

以上からわかるとおり、上記実施の形態は、混合モデルの特定の種類から生じる特徴に関係しないため、汎用性が高く、混合モデルの特定の種類に限定されない。また、性能に従い部分的に最適なモデルを決定し、このモデルに基づき、より確かな初期潜在変数を決定する。このため、より短い処理時間で、ターゲットモデルを算出することができ、効率的な解決法である。
さらに、図2に示した実施の形態を通して、本発明の実施の形態のさらなる利点を説明する。
As can be seen from the above, the above-described embodiment is not related to the characteristics resulting from a specific type of the mixed model, and thus is highly versatile and is not limited to the specific type of the mixed model. Also, a partially optimal model is determined according to the performance, and a more reliable initial latent variable is determined based on this model. For this reason, the target model can be calculated in a shorter processing time, which is an efficient solution.
Furthermore, further advantages of the embodiment of the present invention will be described through the embodiment shown in FIG.

図2に、本発明の実施の形態に係る混合モデル選択の方法200の処理に関するフローチャートを示す。混合モデル選択の方法200は、混合モデル選択の方法100の一実施の形態とみなされうる。複数の候補モデルから第2の初期潜在変数を決定する時、方法200は、最初に、高い性能の候補モデルを選択し、選択した候補モデルを対に組み合わせて、第2の初期潜在変数を決定する。この実施の形態は、単に説明のために示したもので、本発明の範囲を限定しない。   FIG. 2 shows a flowchart relating to the processing of the mixed model selection method 200 according to the embodiment of the present invention. The mixed model selection method 200 may be considered an embodiment of the mixed model selection method 100. When determining a second initial latent variable from a plurality of candidate models, the method 200 first selects a high performance candidate model and combines the selected candidate models in pairs to determine a second initial latent variable. To do. This embodiment is shown for illustrative purposes only and does not limit the scope of the present invention.

方法200は、最初に、ステップS210で訓練サンプルセットに基づき、複数の第1の初期潜在変数を決定する。   The method 200 first determines a plurality of first initial latent variables based on the training sample set in step S210.

図2に示す実施の形態において、訓練サンプルセットは、複数のサンプル(サンプルデータとも呼ばれる)から構成されるセットである。各サンプルは、複数のパラメータにより特徴付けられる。
サンプルは(x、y)のように表しうる。ここで、xはサンプルの特徴、yはサンプルによる推定値を表す。例えば、電力消費データのサンプルのxは今日の電力消費、気温、湿度などを含み、yは明日の電力消費の推定値である。言い換えれば、x=[今日の電力消費、気温、湿度・・・]、y=明日の電力消費となる。
以降では、前述のようにサンプルを一つ以上含むサンプルのグループを「サンプルグループ」という。
In the embodiment shown in FIG. 2, the training sample set is a set composed of a plurality of samples (also called sample data). Each sample is characterized by a number of parameters.
A sample can be expressed as (x, y). Here, x represents a feature of the sample, and y represents an estimated value by the sample. For example, x in a sample of power consumption data includes today's power consumption, temperature, humidity, etc., and y is an estimate of tomorrow's power consumption. In other words, x = [today's power consumption, temperature, humidity...], Y = tomorrow's power consumption.
Hereinafter, a group of samples including one or more samples as described above is referred to as a “sample group”.

本発明の実施の形態において、訓練サンプルセットから無作為に、第1の初期潜在変数を複数生成する。または、訓練サンプルセットのサンプルをクラスタ化し、第1の初期潜在変数を複数生成してもよい。または、当業者は、他の方法で、訓練サンプルセットに基づき、第1の初期潜在変数を決定してもよい。これらの例示した実施の形態は、本発明の範囲を限定しない。   In an embodiment of the present invention, a plurality of first initial latent variables are randomly generated from a training sample set. Alternatively, the samples of the training sample set may be clustered to generate a plurality of first initial latent variables. Alternatively, one skilled in the art may determine the first initial latent variable in other ways based on the training sample set. These illustrated embodiments do not limit the scope of the invention.

ステップS220において、複数の第1の初期潜在変数における各々の第1の初期潜在変数について、訓練サンプルセットで学習し、各々の第1の初期潜在変数に対応する候補モデルを生成する。   In step S220, each first initial latent variable in the plurality of first initial latent variables is learned with the training sample set, and a candidate model corresponding to each first initial latent variable is generated.

一実施の形態において、各々の第1の初期潜在変数について、訓練サンプルセットを用いた教師あり学習、又は、教師なし学習により、混合モデルのモデル構造、モデルパラメータ、更新潜在変数の変分分布を自動的に学習する。これにより、対応する候補モデルを獲得する。この手法で、複数の第1の初期潜在変数に対応する候補モデルを複数獲得する。   In one embodiment, for each first initial latent variable, the model structure of the mixed model, the model parameters, and the variational distribution of the updated latent variables are obtained by supervised learning using the training sample set or unsupervised learning. Learn automatically. Thereby, a corresponding candidate model is obtained. With this method, a plurality of candidate models corresponding to a plurality of first initial latent variables are obtained.

次に、方法200の処理はステップS230に進み、複数の候補モデルの性能に基づき、複数の候補モデルから候補モデルを二つ以上選択する。   Next, the process of method 200 proceeds to step S230, where two or more candidate models are selected from the plurality of candidate models based on the performance of the plurality of candidate models.

モデルの性能は、精度、時間有効性などを含む。予測/分類の混合モデルにおいては、候補モデルにおけるモデル構造、モデルパラメータ、更新潜在変数の変分分布を、テストデータの予側/分類に使用し、予測/分類の精度を獲得しうる。一方、クラスタリングモデルにおいては、基準となる共通の情報などで、候補モデルのクラスタリングの精度を算出しうる。精度に加えて、時間有効性などのモデルの他の関係する要素を決定することで、モデルの性能を獲得してもよい。前述の例は単に説明のために示したもので、本発明の範囲を限定しない。   Model performance includes accuracy, time effectiveness, and the like. In a mixed prediction / classification model, the model structure, model parameters, and variational distribution of updated latent variables in the candidate model can be used for test data prediction / classification to obtain prediction / classification accuracy. On the other hand, in the clustering model, the clustering accuracy of the candidate model can be calculated by using common reference information. In addition to accuracy, model performance may be obtained by determining other relevant elements of the model, such as time validity. The foregoing examples are given for illustrative purposes only and do not limit the scope of the invention.

候補モデルの選択において、複数の候補モデルから構成される大きなセットから小さなセットに減らして、より高い性能の候補モデルを選択し、初期潜在変数をさらに決定してもよい。
一実施の形態において、各々の候補モデルにおけるモデル構造、モデルパラメータ、更新潜在変数の変分分布に基づき、複数の候補モデルの中の各々の候補モデルの性能を決定する。この性能に基づき、候補モデルを順位付ける。例えば、複数の候補モデルを性能の高い順番に並べ、この順番に基づき、複数の候補モデルから候補モデルを二つ以上選択する。例えば、並べた複数の候補モデルから最初の二つ以上を選択し、より高い性能の候補モデルを選択する。
In selecting candidate models, a large set composed of a plurality of candidate models may be reduced to a small set, a candidate model with higher performance may be selected, and initial latent variables may be further determined.
In one embodiment, the performance of each candidate model among the plurality of candidate models is determined based on the model structure, model parameters, and variational distribution of updated latent variables in each candidate model. The candidate models are ranked based on this performance. For example, a plurality of candidate models are arranged in order of high performance, and two or more candidate models are selected from the plurality of candidate models based on this order. For example, the first two or more candidate models are selected from a plurality of arranged candidate models, and a candidate model with higher performance is selected.

ステップS240において、二つ以上の候補モデルを対に組み合わせる。   In step S240, two or more candidate models are combined in pairs.

対に組み合わせる方法には、種々の手法が存在する。
一実施の形態において、二つ以上の候補モデルのうち、それぞれ二つのモデルを一対として組み合わせる。例えば、候補モデルの数が四つのとき、順列組み合わせにより、6対の候補モデルが得られる。
他の一実施の形態において、候補モデルのうち、二つの候補モデルを選択し、一対に形成してもよい。例えば、候補モデルの数が四つのとき、1、2、・・・又は、6対の候補モデルが得られる。
There are various methods for combining the pairs.
In one embodiment, two models out of two or more candidate models are combined as a pair. For example, when the number of candidate models is four, six pairs of candidate models are obtained by permutation combination.
In another embodiment, two candidate models may be selected from the candidate models and formed as a pair. For example, when there are four candidate models, 1, 2,..., Or 6 pairs of candidate models are obtained.

前述の対に組み合わせる方法の他に、当業者は他の最適な方法を使用してもよい。前述の例は単に説明するために示したもので、本発明の範囲を限定しない。   In addition to the above paired methods, those skilled in the art may use other optimal methods. The foregoing examples are given for illustrative purposes only and do not limit the scope of the invention.

ステップS250において、対の候補モデルに基づき、第2の初期潜在変数を決定する。   In step S250, a second initial latent variable is determined based on the pair of candidate models.

第2の初期潜在変数も初期潜在変数であるが、第1の初期潜在変数とは異なる。本発明の実施の形態によれば、対に組み合わせた候補モデルにおける各々の対の候補モデルは第1の候補モデルと第2の候補モデルとから構成され、第1の候補モデルの更新潜在変数と、第2の候補モデルの更新潜在変数とに基づき、第2の初期潜在変数を一つ決定する。
この手法において、ステップS250では、第2の初期潜在変数を一つ以上決定する。なお、第2の初期潜在変数の数は、対の候補モデルの数に依存する。
The second initial latent variable is also an initial latent variable, but is different from the first initial latent variable. According to the embodiment of the present invention, each pair of candidate models in the candidate model combined with the pair includes a first candidate model and a second candidate model, and the update latent variable of the first candidate model includes: Then, one second initial latent variable is determined based on the updated latent variable of the second candidate model.
In this method, in step S250, one or more second initial latent variables are determined. Note that the number of second initial latent variables depends on the number of paired candidate models.

本発明の実施の形態によれば、種々の方法で、第2の初期潜在変数を決定しうる。
一実施の形態において、次のi)〜v)を1回または繰り返し、第2の初期潜在変数を決定する。i)各々の対の候補モデルを成す第1の候補モデルの更新潜在変数の中からサンプルグループを、第1のサンプルグループとして選択する。ii)第1のサンプルグループに基づき、各々の対の候補モデルを成す第2の候補モデルの更新潜在変数の中のサンプルグループから、第2のサンプルグループを決定する。iii)第1のサンプルグループと第2のサンプルグループとの交わりを決定する。iv)この交わりに基づき、第1のサンプルグループを、二のサブセットに分ける。v)二のサブセットに基づき、第2の初期潜在変数を構築する。この繰り返しを、予め定義された回数まで、又は、第2の初期潜在変数の構築完了まで行う。
図3に、一実施の形態における、第2の初期潜在変数を決定する方法300の処理に関するフローチャートを示す。
According to embodiments of the present invention, the second initial latent variable may be determined in various ways.
In one embodiment, the following i) to v) are performed once or repeatedly to determine a second initial latent variable. i) A sample group is selected as the first sample group from among the update latent variables of the first candidate model that forms each pair of candidate models. ii) Based on the first sample group, a second sample group is determined from the sample groups in the updated latent variables of the second candidate model forming each pair of candidate models. iii) Determine the intersection of the first sample group and the second sample group. iv) Based on this intersection, the first sample group is divided into two subsets. v) Build a second initial latent variable based on the two subsets. This is repeated until a predetermined number of times or until the construction of the second initial latent variable is completed.
FIG. 3 shows a flowchart for the processing of a method 300 for determining a second initial latent variable in one embodiment.

ステップS310において、各々の対の候補モデルを成す第1の候補モデルの更新潜在変数の中からサンプルグループを、第1のサンプルグループとして選択する。   In step S310, a sample group is selected as a first sample group from among the update latent variables of the first candidate model forming each pair of candidate models.

一実施の形態において、第1の候補モデルの更新潜在変数は、G1={I、・・・、Ig1}と表す。ここで、Iは第1の候補モデルの更新潜在変数の中のサンプルグループで、サンプルのグループを表す。また、g1は、第1の候補モデルの更新潜在変数におけるサンプルグループの数を表す。
同様に、第2の候補モデルの更新潜在変数を、G2={I’、・・・、I’g2}と表す。ここで、I’は、第2の候補モデルの更新潜在変数におけるサンプルグループを表す。g2は、第2の候補モデルの更新潜在変数におけるサンプルグループの数を表す。
例えば、ステップS310では、Gの中のサンプルグループ(例えば、I)を、第1のサンプルグループとして、選択する。
In one embodiment, the update latent variable of the first candidate model is represented as G1 = {I 1 ,..., I g1 }. Here, I is a sample group in the update latent variable of the first candidate model and represents a group of samples. G1 represents the number of sample groups in the update latent variable of the first candidate model.
Similarly, the update latent variable of the second candidate model is represented as G2 = {I ′ 1 ,..., I ′ g2 }. Here, I ′ represents a sample group in the update latent variable of the second candidate model. g2 represents the number of sample groups in the update latent variable of the second candidate model.
For example, in step S310, a sample group (eg, I 1 ) in G 1 is selected as the first sample group.

ステップS320において、第1のサンプルグループに基づき、各々の対の候補モデルを成す第2の候補モデルの更新潜在変数の中のサンプルグループから、第2のサンプルグループを決定する。   In step S320, based on the first sample group, a second sample group is determined from the sample groups in the update latent variables of the second candidate model forming each pair of candidate models.

本発明の実施の形態によれば、種々の方法で、第2のサンプルグループを決定しうる。
一実施の形態において、第1のサンプルグループと、第2の候補モデルの更新潜在変数の中の各々のサンプルグループとの交わりを算出する。そして、最も大きな交わりを有するサンプルグループを、第2のサンプルグループとして、決定する。
According to embodiments of the present invention, the second sample group may be determined in various ways.
In one embodiment, the intersection of the first sample group and each sample group in the updated latent variables of the second candidate model is calculated. Then, the sample group having the largest intersection is determined as the second sample group.

または、前述では最も大きな交わりを持つサンプルグループを第2のサンプルグループとする例を示したが、第1のサンプルグループとの交わりを有し、第2の候補モデルの更新潜在変数に含まれるサンプルグループを、第2のサンプルグループとして、決定してもよい。
前述の実施の形態は、単に説明のために示したもので、本発明の範囲を限定しない。
Alternatively, the example in which the sample group having the largest intersection is the second sample group has been described above, but the sample has an intersection with the first sample group and is included in the update latent variable of the second candidate model. The group may be determined as the second sample group.
The above-described embodiments are merely illustrative and do not limit the scope of the present invention.

ステップS330において、第1のサンプルグループと第2のサンプルグループとの交わりを決定する。   In step S330, the intersection of the first sample group and the second sample group is determined.

第2のサンプルグループが第1のサンプルグループと最も大きな交わりを持つとすると、以下の式により、第1のサンプルグループと第2のサンプルグループとの交わりInewを決定する。

Figure 0006172315
なお、Iは第1のサンプルグループを表し、第1の候補モデルの更新潜在変数におけるi番目のサンプルグループである。Iは、第2の候補モデルの更新潜在変数におけるj番目のサンプルグループを表す。G2は、第2の候補モデルの更新潜在変数を表す。 If the second sample group has the largest intersection with the first sample group, the intersection I new between the first sample group and the second sample group is determined by the following equation.
Figure 0006172315
Note that I i represents the first sample group and is the i-th sample group in the update latent variable of the first candidate model. I j represents the j th sample group in the update latent variable of the second candidate model. G2 represents an update latent variable of the second candidate model.

S340において、第1のサンプルグループを、交わりに基づき、2つのサブセットに分割する。   In S340, the first sample group is divided into two subsets based on the intersection.

一実施の形態において、第1のサンプルグループの第1のサブセットを、交わりとして決定する。第1のサンプルグループの中の交わり以外の部分を、第2のサブセットとして決定する。例えば、第1のサンプルグループIを、InewとI−Inewの二のサブセットに分割する。 In one embodiment, a first subset of the first sample group is determined as an intersection. The part other than the intersection in the first sample group is determined as the second subset. For example, the first sample group I i is divided into two subsets, I new and I i -I new .

ステップS350において、第2の初期潜在変数を、二のサブセットに基づき、構築する。   In step S350, a second initial latent variable is constructed based on the two subsets.

本発明の実施の形態によれば、第2の初期潜在変数は、複数のサンプルグループを含みうる。ステップS350において、第1のサンプルグループを分割した二のサブセットを、第2の初期潜在変数のサンプルグループとして使用し、第2の初期潜在変数を構築する。   According to an embodiment of the present invention, the second initial latent variable may include a plurality of sample groups. In step S350, the second subset obtained by dividing the first sample group is used as a sample group for the second initial latent variable to construct a second initial latent variable.

例えば、第2の初期潜在変数を空集合として初期化してもよい。言い換えれば、例えば、

Figure 0006172315
のように、第2の初期潜在変数はサンプルグループを含まない。なお、Sは第2の初期潜在変数を表す。また、ステップS350において、第1のサンプルグループを分割した二のサブセットを、第2の初期潜在変数のサンプルグループとして、使用する。つまり、S=S∪{Inew}∪{I−Inew}が得られる。 For example, the second initial latent variable may be initialized as an empty set. In other words, for example,
Figure 0006172315
As such, the second initial latent variable does not include a sample group. Note that S represents a second initial latent variable. In step S350, the two subsets obtained by dividing the first sample group are used as the sample group of the second initial latent variable. That is, S = S∪ {I new } ∪ {I i −I new } is obtained.

ステップS360において、第1のサンプルグループを、第1の候補モデルの更新潜在変数から、取り除く。これにより、後の過程において、第1のサンプルグループが繰り返し使用されない。   In step S360, the first sample group is removed from the updated latent variables of the first candidate model. Thereby, the first sample group is not repeatedly used in the subsequent process.

ステップS370において、第2の初期潜在変数の構築が完成しているかを判断する。   In step S370, it is determined whether the construction of the second initial latent variable is completed.

一実施の形態において、第2の初期潜在変数におけるサンプルグループの数(例えば、|S|と表される。)と、第1の候補モデルの更新潜在変数によるサンプルグループの数(例えば、|G1|と表される。)との総数が、予め定義された数(例えば、kと表される。)に達したかを判断することで、第2の初期潜在変数の構築完成を決定する。予め定義された数は、例えば、第1の初期潜在変数のサンプルグループの数としてもよい。総数が予め定義された数に届いていない場合、言い換えれば、|S|+|G1|<kの場合、方法300の処理はステップS380に進む。予め定義された数に総数が達した場合、言い換えれば、|S|+|G1|≧kの場合、第2の初期潜在変数の構築を完成したと、決定する。   In one embodiment, the number of sample groups in the second initial latent variable (e.g., represented as | S |) and the number of sample groups by the updated latent variable of the first candidate model (e.g., | G1). It is determined whether the construction of the second initial latent variable has been completed by determining whether the total number of the first initial latent variable has reached a predefined number (for example, represented by k). The predefined number may be, for example, the number of sample groups of the first initial latent variable. If the total number does not reach the predefined number, in other words, if | S | + | G1 | <k, the process of method 300 proceeds to step S380. When the total number reaches the predefined number, in other words, when | S | + | G1 | ≧ k, it is determined that the construction of the second initial latent variable is completed.

ステップS380において、第1の候補モデルの更新潜在変数におけるサンプルグループの数が0であるかを判断する。0でない場合は、方法300の処理はステップS310に戻り、繰り返し実行する。0の場合、構築された第2の初期潜在変数のサンプルグループの数が第1に初期潜在変数のサンプルグループの数より少ない場合で、第1の候補モデルの更新潜在変数におけるサンプルグループがないことを意味し、次のステップS381を行う。   In step S380, it is determined whether the number of sample groups in the update latent variable of the first candidate model is zero. If not, the process of method 300 returns to step S310 and is repeated. If 0, the number of sample groups of the second initial latent variable constructed is first less than the number of sample groups of the initial latent variable and there are no sample groups in the updated latent variable of the first candidate model And the next step S381 is performed.

ステップS381において、第2の初期潜在変数からサンプルグループを一つ選択する。   In step S381, one sample group is selected from the second initial latent variable.

ステップS310〜S380の結果、第2の初期潜在変数は、一つ以上のサンプルグループを含みうる。このため、ステップS381において、第2の初期潜在変数のサンプルグループから、サンプルグループを一つ選択する。
一実施の形態において、第2の初期潜在変数の中の最も大きな規模のサンプルグループを選択する。本発明の実施の形態によれば、最も大きな規模のサンプルグループを選択することは、最も多くのサンプル数を持つサンプルグループを選択することを意味する。
あるいは、予め定義された閾値に達するサンプルグループを選択してもよい。言い換えれば、ステップS381では、多くのサンプル数を持つサンプルグループを選択し、必ずしも最も大きな規模のサンプルグループを選択する必要はない。予め定義された閾値は、ここでは詳述しないが、システムの制限、モデルカテゴリ、実行速度要件のような、種々の要素に従い、決定される。
As a result of steps S310-S380, the second initial latent variable may include one or more sample groups. Therefore, in step S381, one sample group is selected from the sample groups of the second initial latent variable.
In one embodiment, select the largest sample group in the second initial latent variable. According to the embodiment of the present invention, selecting the largest sample group means selecting the sample group having the largest number of samples.
Alternatively, a sample group that reaches a predefined threshold may be selected. In other words, in step S381, a sample group having a large number of samples is selected, and it is not always necessary to select the largest sample group. The predefined threshold is determined according to various factors, such as system limitations, model categories, and execution speed requirements, which are not detailed here.

ステップS382において、選択したサンプルグループを二に分割し、第2の初期潜在変数のサンプルグループに含める。   In step S382, the selected sample group is divided into two and included in the sample group of the second initial latent variable.

本発明の実施の形態によれば、種々の方法で、選択したサンプルグループを分割しうる。
例えば、ステップS381で選択したサンプルグループは、無作為に、又は、均等に、二に分割してもよい。または、特定の要件に従って分割してもよい。
前述の分割方法は、単に例示したもので、本発明を限定しない。
According to the embodiment of the present invention, the selected sample group can be divided by various methods.
For example, the sample group selected in step S381 may be divided into two randomly or equally. Or it may be divided according to specific requirements.
The above dividing method is merely an example and does not limit the present invention.

ステップS383において、選択したサンプルグループを、第2の初期潜在変数から削除する。これにより、以降の過程で、分割されたサンプルグループは繰り返し使用されない。   In step S383, the selected sample group is deleted from the second initial latent variable. Thereby, the divided sample groups are not repeatedly used in the subsequent processes.

ステップS384において、第2の初期潜在変数の構築が完成したかを判断する。   In step S384, it is determined whether the construction of the second initial latent variable is completed.

一実施の形態において、ステップS384では、第2の初期潜在変数におけるサンプルグループの数が、第1に初期潜在変数のサンプルグループの数に達しているかを判断する。達していれば、第2の初期潜在変数の構築が完成したと判断する。達していなければ、方法300の処理はステップS381に戻り、処理を続ける。   In one embodiment, in step S384, it is first determined whether the number of sample groups in the second initial latent variable has reached the number of sample groups in the initial latent variable. If so, it is determined that the construction of the second initial latent variable has been completed. If not, the process of method 300 returns to step S381 and continues.

図3に示す実施の形態は、単に、第2の初期潜在変数を決定する手順を説明するためのもので、本発明の範囲を限定しない。
本実施の形態によれば、ステップS310〜S384は、第2の初期潜在変数を決定するために、必ずしも実行する必要はない。
例えば、他の一の実施の形態において、各々の対の候補モデルを成す第1の候補モデルの更新潜在変数に含まれる各々のサンプルグループについて、各々のサンプルグループの第1のサブセットを決定することもできる。各々の対の候補モデルにおける第2の候補モデルの更新潜在変数に含まれるサンプルグループから、第1の候補モデルの更新潜在変数に含まれる各々のサンプルグループと、最も大きな交わりを持つサンプルグループを決定し、この最も大きな交わりを第1のサブセットとして決定する。次に、各々のサンプルグループにおける第1のサブセットを除いた部分を第2のサブセットとして決定する。
この手法において、第1の候補モデルの更新潜在変数に含まれる各々のサンプルグループを、第1のサブセットと第2のサブセットに、分割する。第1の候補モデルの更新潜在変数の数をg1とすると、各々のサンプルグループを第1のサブセットと第2のサブセットに分割した後に、2g1の新しいサンプルセットを獲得する。
第1の初期潜在変数のサンプルグループの数をkと表し、もし、2g1>kならば、2g1の新しいサンプルセットの中の要素の少ない二のサンプルセットを一つのサンプルセットに併合する。新しいサンプルセットから併合された二つのサンプルセットを除き、併合したサンプルセットを含めることで、2g1−1のサンプルセットを獲得する。
以後、(2g1−1)>kならば、2g1の新しいサンプルセットに含まれる少ない要素の二のサンプルセットを一つのサンプルセットに併合し、併合したサンプルセットを含め、併合された二つのサンプルセットを除き、2g1−2のサンプルセットを、獲得する。得られたサンプルセットの数が、kと同じになるまで、この手順は繰り返す。この手法により、候補モデルにおける第1の候補モデルの更新潜在変数と候補モデルにおける第2の候補モデルの更新潜在変数とに基づき、第2の初期潜在変数を決定する。
The embodiment shown in FIG. 3 is merely for explaining the procedure for determining the second initial latent variable, and does not limit the scope of the present invention.
According to the present embodiment, steps S310 to S384 are not necessarily executed in order to determine the second initial latent variable.
For example, in another embodiment, determining a first subset of each sample group for each sample group included in the update latent variable of the first candidate model forming each pair of candidate models. You can also. A sample group having the largest intersection with each sample group included in the update latent variable of the first candidate model is determined from the sample group included in the update latent variable of the second candidate model in each pair of candidate models. The largest intersection is determined as the first subset. Next, a portion excluding the first subset in each sample group is determined as the second subset.
In this method, each sample group included in the update latent variable of the first candidate model is divided into a first subset and a second subset. Assuming that the number of update latent variables of the first candidate model is g1, a new sample set of 2g1 is obtained after dividing each sample group into a first subset and a second subset.
The number of sample groups of the first initial latent variable is represented by k, and if 2g1> k, the two sample sets with fewer elements in the new sample set of 2g1 are merged into one sample set. By removing the two merged sample sets from the new sample set and including the merged sample set, a 2g1-1 sample set is obtained.
Thereafter, if (2g1-1)> k, the two sample sets of the small elements included in the new sample set of 2g1 are merged into one sample set, and the two sample sets merged including the merged sample set A sample set of 2g1-2 is acquired. This procedure is repeated until the number of sample sets obtained is the same as k. By this method, the second initial latent variable is determined based on the update latent variable of the first candidate model in the candidate model and the update latent variable of the second candidate model in the candidate model.

次に、図2に示すように、方法200の処理はステップS260に進み、複数の第2の初期潜在変数の訓練により、中間モデルを複数獲得する。   Next, as shown in FIG. 2, the process of the method 200 proceeds to step S260, and a plurality of intermediate models are obtained by training a plurality of second initial latent variables.

一実施の形態において、第2の初期潜在変数における各々の第2の初期潜在変数について、訓練サンプルセットを用い、教師あり学習、又は、教師なし学習を実行し、混合モデルのモデル構造、モデルパラメータ、更新潜在変数の変分分布を自動的に学習し、各々の第2の初期潜在変数に対応するモデルを生成する。この生成したモデルを中間モデルという。この手法により、複数の第2の初期潜在変数に対応する複数の中間モデルを獲得する。   In one embodiment, supervised learning or unsupervised learning is performed for each second initial latent variable in the second initial latent variable using a training sample set, and the model structure of the mixed model, model parameters Automatically learning the variational distribution of the updated latent variables and generating a model corresponding to each second initial latent variable. This generated model is called an intermediate model. By this method, a plurality of intermediate models corresponding to a plurality of second initial latent variables are obtained.

ステップS270において、複数の中間モデルの性能を決定する。   In step S270, the performance of a plurality of intermediate models is determined.

モデルの性能は、精度、時間有効性などのような種々の因子を含み、種々の手段で決定しうる。例えば、精度を例にすると、予測/分類の混合モデルでは、中間モデルをテストデータの予測/分類のために使用し、予測/分類に関する精度を獲得しうる。また、クラスタリングモデルでは、基準となる共通の情報などで、中間モデルの精度を算出しうる。   The performance of the model can be determined by various means, including various factors such as accuracy, time validity, etc. For example, taking accuracy as an example, in a mixed prediction / classification model, an intermediate model may be used for prediction / classification of test data to obtain accuracy for prediction / classification. In the clustering model, the accuracy of the intermediate model can be calculated by using common information as a reference.

一実施の形態において、各々の中間モデルのモデル構造、モデルパラメータ、更新潜在変数の変分分布に基づき、各々の中間モデルの精度、時間有効性、その他の特徴を決定してもよい。この結果、各々の中間モデルの性能を獲得する。   In one embodiment, the accuracy, time validity, and other characteristics of each intermediate model may be determined based on the model structure, model parameters, and variational distribution of updated latent variables for each intermediate model. As a result, the performance of each intermediate model is acquired.

ステップS280において、複数の中間モデルから、性能に基づき、ターゲットモデルとして一つ選択する。   In step S280, one target model is selected from a plurality of intermediate models based on performance.

一実施の形態において、複数の中間モデルを、ステップS270で決定した性能により、順位付ける。例えば、複数の中間モデルを性能の高い順番に整理する。そして、複数の中間モデルの中から、最も高い性能の中間モデルを、ターゲットモデルとして選択する。   In one embodiment, the plurality of intermediate models are ranked according to the performance determined in step S270. For example, a plurality of intermediate models are arranged in descending order of performance. Then, the intermediate model having the highest performance is selected from the plurality of intermediate models as the target model.

ステップS280以降のステップとして、本発明の実施の形態に従い獲得したターゲットモデルを提供し、ユーザに使用させてもよい。   As a step after step S280, the target model acquired according to the embodiment of the present invention may be provided and used by the user.

図4に、本発明の一実施の形態に従う、混合モデル選択の方法に関する概要図400を示す。図4に示す混合モデル選択の方法は、図2のステップS210〜280に相当する。図4に示すように、最初に、訓練サンプルセットに基づき、それぞれ、Z、Z、・・・、Zk1で示されている複数の第1の初期潜在変数を決定する。Zは第1の初期潜在変数を表し、k1は決定された第1の初期潜在変数の数を表す。これは、訓練サンプルセットに基づき複数の第1の初期潜在変数を決定するステップS210に相当する。 FIG. 4 shows a schematic diagram 400 for a method of selecting a mixed model, according to one embodiment of the present invention. The method for selecting a mixed model shown in FIG. 4 corresponds to steps S210 to 280 in FIG. As shown in FIG. 4, first, based on the training sample set, a plurality of first initial latent variables denoted Z 1 , Z 2 ,..., Z k1 are determined. Z represents the first initial latent variable, and k1 represents the number of first initial latent variables determined. This corresponds to step S210 of determining a plurality of first initial latent variables based on the training sample set.

次に、図4に示すように、複数の第1の初期潜在変数Z、Z・・・、Zk1に関連する多くの候補モデル(k1の候補モデル)を生成する。ここで、候補モデル1、候補モデル2、・・・、候補モデルk1は、候補モデルを表す。これは、各々の第1の初期潜在変数に対応する候補モデルを生成するステップS220に相当する。 Next, as shown in FIG. 4, a large number of candidate models (k1 candidate models) related to a plurality of first initial latent variables Z 1 , Z 2 ..., Z k1 are generated. Here, candidate model 1, candidate model 2,..., Candidate model k1 represent candidate models. This corresponds to step S220 of generating a candidate model corresponding to each first initial latent variable.

さらに、図4に示すように、候補モデル1、候補モデル2、・・・、候補モデルk1から、候補モデル1、候補モデル5、候補モデル7、・・・を選択する。これは、複数の候補モデルの性能に基づき、複数の候補モデルから二つ以上の候補モデルを選択するステップS230に相当する。   Furthermore, as shown in FIG. 4, candidate model 1, candidate model 5, candidate model 7,... Are selected from candidate model 1, candidate model 2,. This corresponds to step S230 in which two or more candidate models are selected from the plurality of candidate models based on the performance of the plurality of candidate models.

次に、図4に示すように、候補モデル1と候補モデル7とを、候補モデル5と候補モデル7とを、候補モデル1と候補モデル5とを、各々を対に組み合わせる。これは、二つ以上の候補モデルを対に組み合わせるステップS240に相当する。なお、簡略化のため図示していないが、ステップS230で選択された他の候補モデルを、さらに対として組み合わせる。   Next, as shown in FIG. 4, candidate model 1 and candidate model 7, candidate model 5 and candidate model 7, and candidate model 1 and candidate model 5 are combined in pairs. This corresponds to step S240 in which two or more candidate models are combined in pairs. Although not shown for simplification, the other candidate models selected in step S230 are further combined as a pair.

次に、図4に示すように、候補モデル1、候補モデル5、候補モデル7などから、第2の初期潜在変数Z’、Z’、Z’、・・・、Z’k2を決定する。ここで、k2は、決定された第2の初期潜在変数の数を表す。これは、対の候補モデルに基づき、第2の初期潜在変数を決定するステップS250に相当する。 Next, as shown in FIG. 4, second initial latent variables Z ′ 1 , Z ′ 2 , Z ′ 3 ,..., Z ′ k2 are obtained from candidate model 1, candidate model 5, candidate model 7, and the like. decide. Here, k2 represents the determined number of second initial latent variables. This corresponds to step S250 for determining the second initial latent variable based on the pair of candidate models.

この後、図4に示すように、第2の初期潜在変数Z’、Z’、Z’、・・・、Z’k2から、中間モデル1、中間モデル2、中間モデル3、・・・、中間モデルk2を獲得する。これは、第2の初期潜在変数の訓練により、中間モデルを複数獲得するステップS260に相当する。 Thereafter, as shown in FIG. 4, from the second initial latent variables Z ′ 1 , Z ′ 2 , Z ′ 3 ,..., Z ′ k2 , intermediate model 1, intermediate model 2, intermediate model 3 ,.・ ・ Acquire intermediate model k2. This corresponds to step S260 in which a plurality of intermediate models are acquired by training the second initial latent variable.

最後に、図4に示すように、中間モデル1、中間モデル2、中間モデル3、・・・、中間モデルk2から、ターゲットモデルを決定する。これは、中間モデルの性能を決定し、この性能に基づき、複数の中間モデルからターゲットモデルを一つ選択するステップS270とS280に相当する。   Finally, as shown in FIG. 4, the target model is determined from the intermediate model 1, the intermediate model 2, the intermediate model 3,. This corresponds to steps S270 and S280 in which the performance of the intermediate model is determined and one target model is selected from a plurality of intermediate models based on this performance.

混合モデル選択の方法に関する概要図400は、単に例示したにすぎず、いかなる方法であっても、発明の範囲を限定しない。本発明の実施の形態によれば、必ずしも、候補モデル1、候補モデル2、・・・、候補モデルk1から候補モデル1、候補モデル5、候補モデル7等を選択した後に、対に組み合わせる必要はない。例えば、他の一実施の形態において、候補モデル1、候補モデル2、・・・、候補モデルk1を、直接的に対に組み合わせ、対の候補モデルに基づき、第2の初期潜在変数を決定してもよい。   The schematic diagram 400 for the method of selecting a mixed model is merely exemplary and does not limit the scope of the invention in any way. According to the embodiment of the present invention, it is not always necessary to select candidate model 1, candidate model 2,..., Candidate model 1, candidate model 5, candidate model 7, etc. from candidate model k1, and then combine them in pairs. Absent. For example, in another embodiment, candidate model 1, candidate model 2,..., Candidate model k1 are directly combined into a pair, and a second initial latent variable is determined based on the pair of candidate models. May be.

また、本発明の実施の形態によれば、必ずしも、ターゲットモデルは、中間モデル1、中間モデル2、中間モデル3、・・・、中間モデルk2から、直接的に決定する必要はない。
例えば、他の一実施の形態において、k2の中間モデルに基づき、第3の初期潜在変数を決定し、第3の初期潜在変数により第2の初期潜在変数を更新し、更新した第2の初期潜在変数に基づき、更新した中間モデルを獲得してもよい。この手順を、1回、又は数回、実行してもよい。例えば、実行回数を数え、予め定義された実行回数と比較し、予め定義された実行回数に達したときに手順を止めてもよい。あるいは、手順は、予め定義された要件を満足するまで、繰り返し実行してもよい。予め定義された要件は、例えば、更新した中間モデルが十分な性能を有していること、更新した中間モデルの数が予め定義された数に達することなど、種々の方法で定義しうる。
これらの実施の形態は単に例示したもので、発明の範囲を限定しない。当業者は、本発明の範囲の中で、本発明の実施の形態に種々の変更を加えうる。
Further, according to the embodiment of the present invention, the target model is not necessarily determined directly from the intermediate model 1, the intermediate model 2, the intermediate model 3, ..., the intermediate model k2.
For example, in another embodiment, based on the intermediate model of k2, a third initial latent variable is determined, the second initial latent variable is updated with the third initial latent variable, and the updated second initial variable is determined. An updated intermediate model may be obtained based on the latent variable. This procedure may be performed once or several times. For example, the number of executions may be counted and compared with a predefined number of executions, and the procedure may be stopped when a predefined number of executions is reached. Alternatively, the procedure may be repeated until a predefined requirement is satisfied. The predefined requirement can be defined in various ways, for example, that the updated intermediate model has sufficient performance, or that the number of updated intermediate models reaches a predefined number.
These embodiments are merely illustrative and do not limit the scope of the invention. Those skilled in the art can make various modifications to the embodiments of the present invention within the scope of the present invention.

図5に、本発明の実施の形態に係る混合モデルを選択する装置500のブロック図を示す。図5に示すように、装置500は、複数の第1の初期潜在変数の訓練により候補モデルを複数生成するための候補モデル生成部510と、複数の候補モデルに基づき第2の初期潜在変数を決定するための第1決定部520と、第2の初期潜在変数に基づき、ターゲットモデルを決定するための第2決定部530とから構成される。   FIG. 5 shows a block diagram of an apparatus 500 for selecting a mixed model according to an embodiment of the present invention. As illustrated in FIG. 5, the apparatus 500 includes a candidate model generation unit 510 for generating a plurality of candidate models by training a plurality of first initial latent variables, and a second initial latent variable based on the plurality of candidate models. The first determination unit 520 for determining and the second determination unit 530 for determining the target model based on the second initial latent variable are configured.

一実施の形態において、候補モデル生成部510を、訓練サンプルセットに基づき第1の初期潜在変数を複数決定するための「第1初期潜在変数決定部」と、複数の第1の初期潜在変数における各々の第1の初期潜在変数について、訓練サンプルセットで学習し、各々の第1の初期潜在変数に対応する候補モデルを生成するための「訓練部」と、から構成してもよい。   In one embodiment, the candidate model generation unit 510 includes a “first initial latent variable determination unit” for determining a plurality of first initial latent variables based on the training sample set, and a plurality of first initial latent variables. For each first initial latent variable, a training sample set may be used to learn, and a “training unit” for generating a candidate model corresponding to each first initial latent variable.

一実施の形態において、第1決定部520を、複数の候補モデルを対に組み合わせるための「組合せ部」と、対の候補モデルに基づき、第2の初期潜在変数を決定するための「第2初期潜在変数決定部」と、から構成してもよい。   In one embodiment, the first determination unit 520 includes a “combination unit” for combining a plurality of candidate models in pairs and a “second unit” for determining a second initial latent variable based on the pair of candidate models. An initial latent variable determination unit ”may be included.

一実施の形態において、第1決定部520を、複数の候補モデルの性能に基づき、複数の候補モデルから候補モデルを二つ以上選択するための「第1候補モデル選択部」と、二つ以上の候補モデルを対に組み合わせるための「組合せ部」と、対の候補モデルに基づき、第2の初期潜在変数を決定するための「第2初期潜在変数決定部」と、から構成してもよい。   In one embodiment, the first determination unit 520 includes two or more “first candidate model selection units” for selecting two or more candidate models from the plurality of candidate models based on the performance of the plurality of candidate models. A “combination unit” for combining the candidate models of the pair and a “second initial latent variable determination unit” for determining the second initial latent variable based on the pair of candidate models. .

一実施の形態において、第1決定部520の「第1候補モデル選択部」を、各々の候補モデルのモデル構造、モデルパラメータ、更新潜在変数の変分分布に基づき、複数の候補モデルにおける各々の候補モデルの性能を決定するための「第1性能決定部」と、決定された性能に基づき、候補モデルを順位づけるための「順位づけ部」と、順位づけに基づき、複数の候補モデルから候補モデルを二つ以上選択するための「第2候補モデル選択部」と、から構成してもよい。   In one embodiment, the “first candidate model selection unit” of the first determination unit 520 performs each of the plurality of candidate models based on the model structure, model parameters, and variational distribution of update latent variables of each candidate model. A “first performance determination unit” for determining the performance of the candidate model, a “ranking unit” for ranking the candidate models based on the determined performance, and a candidate from a plurality of candidate models based on the ranking You may comprise from the "2nd candidate model selection part" for selecting two or more models.

一実施の形態において、対の候補モデルにおける各々の対の候補モデルが第1の候補モデルと第2の候補モデルとから構成され、第1決定部520の「第2初期潜在変数決定部」が、さらに、各々の対の候補モデルにおける第1の候補モデルの潜在変数と第2の候補モデルの更新潜在変数に基づき、第2の初期潜在変数を決定してもよい。   In one embodiment, each pair of candidate models in the pair of candidate models is composed of a first candidate model and a second candidate model, and the “second initial latent variable determination unit” of the first determination unit 520 Furthermore, the second initial latent variable may be determined based on the latent variable of the first candidate model and the updated latent variable of the second candidate model in each pair of candidate models.

一実施の形態において、第1決定部520の「第2初期化潜在変数決定部」を、各々の対の候補モデルを成す第1の候補モデルの更新潜在変数の中からサンプルグループを、第1のサンプルグループとして選択するための「第1サンプルグループ決定部」と、第1のサンプルグループに基づき、各々の対の候補モデルを成す第2の候補モデルの更新潜在変数の中のサンプルグループから第2のサンプルグループを決定するための「第2サンプルグループ決定部」と、第1のサンプルグループと第2のサンプルグループの交わりを決定するための「交わり決定部」と、交わりに基づき、第1のサンプルグループを二のサブセットに分割するための「分割部」と、二のサブセットに基づき、第2の初期潜在変数を構築するための「第2初期潜在変数構築部」と、から構成してもよい。   In one embodiment, the “second initialization latent variable determining unit” of the first determining unit 520 performs the first group of updated latent variables of the first candidate model that forms each pair of candidate models, the first group, “First sample group determination unit” for selecting as a sample group of the second candidate model based on the first sample group, and the second from the sample group in the update latent variable of the second candidate model forming each pair of candidate models A "second sample group determining unit" for determining two sample groups, a "intersection determining unit" for determining the intersection of the first sample group and the second sample group, and the first based on the intersection A “divider” for dividing the sample group into two subsets, and a “second initial latent variable for constructing a second initial latent variable based on the two subsets”. And construction unit ", it may be constructed from.

一実施の形態において、第1決定部520の「第2初期潜在変数決定部」の「第2初期潜在変数構築部」を、構築された第2の初期潜在変数のサンプルグループの数が、第1の初期潜在変数のサンプルグループの数より少ない場合、構築された第2の初期潜在変数のサンプルグループが、第1の初期潜在変数のサンプルグループの数に等しくなるまで、次のi)〜iii)を繰り返し実行してもよい。i)第2の初期潜在変数のサンプルグループを選択する。ii)次に、選択されたサンプルグループを二のサブグループに分割し、二のサブグループを第2の初期潜在変数のサンプルグループに含める。iii)次に、第2の初期潜在変数から選択されたサンプルグループを削除する。   In one embodiment, the “second initial latent variable structuring unit” of the “second initial latent variable deciding unit” of the first determining unit 520 is the number of sample groups of the constructed second initial latent variables. If the number of sample groups of the first initial latent variable is less than the number of sample groups of the first initial latent variable, the following i) to iii ) May be repeated. i) Select a sample group for the second initial latent variable. ii) Next, the selected sample group is divided into two subgroups, and the two subgroups are included in the sample group of the second initial latent variable. iii) Next, delete the selected sample group from the second initial latent variable.

一実施の形態において、第1決定部520を、第2の初期潜在変数の訓練により、中間モデルを複数獲得するための「中間モデル生成部」と、中間モデルに基づき、第3の初期潜在変数を決定のための「第3初期潜在変数決定部」と、第3の初期潜在変数で第2の初期潜在変数を更新するための「更新部」と、から構成してもよい。   In one embodiment, the first determination unit 520 includes an “intermediate model generation unit” for acquiring a plurality of intermediate models by training the second initial latent variable, and a third initial latent variable based on the intermediate model. May be composed of a “third initial latent variable determining unit” for determining and an “updating unit” for updating the second initial latent variable with the third initial latent variable.

一実施の形態において、第2の初期潜在変数が複数存在し、第2決定部530を、第2の初期潜在変数の訓練により、中間モデルを複数獲得するための「中間モデル決定部」と、中間モデルの性能を決定するための「第2性能決定部」と、性能に基づき、中間モデルからターゲットモデルとして一つ選択するための「ターゲットモデル選択部」と、から構成してもよい。   In one embodiment, there are a plurality of second initial latent variables, and the second determining unit 530 obtains a plurality of intermediate models by training the second initial latent variables, You may comprise from the "2nd performance determination part" for determining the performance of an intermediate model, and the "target model selection part" for selecting one as a target model from an intermediate model based on performance.

図面を見やすくするため、図5において、装置500のオプション部と下位部を省略している。装置500を、種々の方法で、実装しうる。
例えば、装置500を、ソフトウェア、ファームウェア、又は、両方において、実装しうる。例えば、装置500を、コンピュータ可読媒体に格納したコンピュータプログラム製品として、実装しうる。この場合、各部はプログラムモジュールに対応し、このプログラムモジュールによるコンピュータ命令が各部の機能を実行する。
また、装置500を、例えば、集積回路(IC)、特定用途向け集積回路(ASIC)、システムオンチップ(SOC)などのハードウェアに基づき、部分的に又は完全に実装してもよい。その他、近年に知られ、又は、未来に開発され、適用可能なもので実装してもよい。
そして、この点において、本発明の範囲は限定されない。
In order to make the drawing easier to see, the option part and the lower part of the apparatus 500 are omitted in FIG. Apparatus 500 may be implemented in a variety of ways.
For example, the device 500 may be implemented in software, firmware, or both. For example, apparatus 500 may be implemented as a computer program product stored on a computer readable medium. In this case, each unit corresponds to a program module, and a computer instruction by the program module executes a function of each unit.
Device 500 may also be partially or fully implemented based on hardware such as, for example, an integrated circuit (IC), an application specific integrated circuit (ASIC), or a system on chip (SOC). In addition, it may be implemented by what is known in recent years or developed in the future and applicable.
In this respect, the scope of the present invention is not limited.

図6に、本発明の実施の形態の実装に適した一例のコンピュータシステム600のブロック図を示す。図6に示すように、コンピュータシステム600は、読取り専用メモリのROM602に保存されたプログラムに従い、又は、記憶部608からランダムアクセスメモリのRAM603に読み取られたプログラムに従い、中央処理装置のCPU601において種々のプロセスを実行する。
RAM603は、CPU601による種々のプロセスの実行中などに、要求に応じて、要求されたデータを保存する。
CPU601、ROM602、RAM603は、バス604を介して互いに接続されている。
入出力インタフェースのI/Oインタフェース605も、バス604と、接続されている。
FIG. 6 illustrates a block diagram of an example computer system 600 suitable for implementing embodiments of the present invention. As shown in FIG. 6, the computer system 600 performs various processes in the CPU 601 of the central processing unit according to a program stored in the ROM 602 of the read-only memory or according to a program read from the storage unit 608 to the RAM 603 of the random access memory. Run the process.
The RAM 603 stores requested data in response to a request during execution of various processes by the CPU 601.
The CPU 601, ROM 602, and RAM 603 are connected to each other via a bus 604.
An input / output interface I / O interface 605 is also connected to the bus 604.

キーボード、マウスなどの入力部606、ブラウン管ディスプレイ(CRT)や液晶ディスプレイ(LCD)などのディスプレイ、スピーカーなどの出力部607、ハードディスクなどの記憶部608、LANカードやモデムなどのようなネットワーク通信カードなどの通信部609は、I/Oインタフェース605に接続されている。
通信部609は、インターネットのようなネットワークを介して通信プロセスを実行する。
ドライブ610は、必要に応じて、I/Oインタフェース605に接続される。
磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなリムーバブルメディア611は、必要に応じて、ドライブ610に装置し、リムーバルメディア611から読み込まれたコンピュータプログラムは、必要に応じて、記憶部608にインストールされる。
Input unit 606 such as keyboard and mouse, display such as cathode ray tube display (CRT) and liquid crystal display (LCD), output unit 607 such as speaker, storage unit 608 such as hard disk, network communication card such as LAN card and modem The communication unit 609 is connected to the I / O interface 605.
The communication unit 609 executes a communication process via a network such as the Internet.
The drive 610 is connected to the I / O interface 605 as necessary.
A removable medium 611 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is installed in the drive 610 as necessary, and a computer program read from the removable medium 611 is stored in the storage unit 608 as necessary. To be installed.

特に、本発明の実施の形態に係る前述の手順を、コンピュータソフトウエアプログラムとして、実装しうる。例えば、一実施の形態は、上記手順を実装するプログラムコードを含み、機械可読媒体に実体的に保存されたコンピュータプログラムを組み込んだコンピュータ製品から構成される。この実施の形態において、通信部609を介してネットワークから、コンピュータプログラムをダウンロードしてもよい。また、コンピュータプログラムを、リムーバブルメディア611からインストールしてもよい。   In particular, the above-described procedure according to the embodiment of the present invention can be implemented as a computer software program. For example, one embodiment comprises a computer product that includes program code that implements the above procedures and that incorporates a computer program that is tangibly stored on a machine-readable medium. In this embodiment, a computer program may be downloaded from a network via the communication unit 609. Further, the computer program may be installed from the removable medium 611.

一般に、本発明の実施の形態に係る種々の方法を、ハードウェア、特定目的回路、ソフトウェア、論理回路、又はそれらの組み合わせの上で、実装しうる。ファームウェア又はソフトウェアを、コントローラ、マイクロプロセッサ、その他のコンピュータデバイスにより実行する限り、ハードウェアの上で実装されると言える。ブロック図、フローチャート、その他の描画として、本発明の実施の形態に係る種々の方法を説明し、記述する限りは、この中の記述されたブロック図、装置、システム、技術又は方法を、ハードウェア、ソフトウェア、ファームウェア、特定目的回路、論理回路、汎用ハードウェア、コントローラ、その他のコンピュータデバイス、それらの組み合わせなどで実行すると認識できるだろう。   In general, the various methods according to embodiments of the invention may be implemented on hardware, special purpose circuits, software, logic circuits, or combinations thereof. As long as the firmware or software is executed by a controller, microprocessor, or other computing device, it can be said to be implemented on hardware. Various methods according to embodiments of the present invention will be described as block diagrams, flowcharts, and other drawings, and as far as described, block diagrams, devices, systems, techniques or methods described herein may be used in hardware. , Software, firmware, special purpose circuits, logic circuits, general purpose hardware, controllers, other computer devices, combinations thereof, etc.

さらに、図示した種々のブロック部を、方法のステップと、コンピュータプログラムコードの実行内容と、又は、関連づけた機能を実行するために構成された複数の論理回路素子とみなしてもよい。例えば、一実施の形態に、前述の方法を実装するプログラムコードから構成され、機械可読媒体に実体的に保存されたコンピュータプログラムを組み込んだコンピュータ製品を含む。   Further, the various illustrated blocks may be considered as a plurality of logic circuit elements configured to perform method steps, computer program code execution, or associated functions. For example, an embodiment includes a computer product that incorporates a computer program that is constructed from program code that implements the above-described method and that is tangibly stored on a machine-readable medium.

機械可読媒体は、命令実行システム、装置又はデバイスに接続し、プログラムを保存する実体的な媒体でもよい。機械可読媒体には、機械可読信号媒体、機械可読記憶媒体を含む。機械可読媒体は、電気、磁気、光、電磁気、赤外線、半導体システム、装置、デバイス、それらの適切な組み合わせなどから構成され、媒体の種類に制限されない。機械可読記憶媒体の例として、ワイヤで電子接続する、可搬型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスク読み取り専用メモリ(CD−ROM)、光記憶装置、電磁記憶装置、これらの適切な組み合わせなどが含まれる。   A machine-readable medium may be a tangible medium that is connected to an instruction execution system, apparatus, or device and that stores a program. Machine-readable media include machine-readable signal media and machine-readable storage media. A machine-readable medium is composed of electrical, magnetic, optical, electromagnetic, infrared, semiconductor systems, apparatus, devices, suitable combinations thereof, etc., and is not limited to the type of medium. Examples of machine-readable storage media include portable computer disks, hard disks, random access memory (RAM), read-only memory (ROM), erasable programmable read-only memory (EPROM or flash memory), optical fiber, electronically connected by wire Portable compact disk read only memory (CD-ROM), optical storage devices, electromagnetic storage devices, suitable combinations thereof, and the like.

本発明の実施の形態に係る種々の方法を実行するためのコンピュータプログラムコードは、複数のプログラミング言語を組み合わせてもよい。コンピュータの処理装置、その他プログラマブルデータ処理装置上で、フローチャート、ブロック図の機能を実行するプログラムコードを、汎用コンピュータ、特殊コンピュータ、他のプログラマブルデータ処理装置に提供してもよい。このプログラムコードを、コンピュータ上で完全に、又は、部分的に、実行してもよい。また、単体のソフトウェアパッケージとして、ローカル及び遠隔のコンピュータ上でそれぞれ部分的に実行してもよく、遠隔のコンピュータ、サーバ上で完全に実行してもよい。   The computer program code for executing various methods according to embodiments of the present invention may combine a plurality of programming languages. Program codes for executing the functions of the flowcharts and block diagrams on the computer processing device and other programmable data processing devices may be provided to general-purpose computers, special computers, and other programmable data processing devices. This program code may be executed completely or partially on a computer. Further, as a single software package, it may be partially executed on a local computer and a remote computer, or may be completely executed on a remote computer or a server.

さらに、機能を個々の命令で示していたとしても、実装において、示された個々の命令、又は連続的な命令を実行するとは限らず、さらに、示したすべての機能を実行するとも限らない。多重タスク処理と並列処理が有利な場合もある。
また、前述の実施の形態で詳細な実装を記述したとしても、本発明の範囲を限定するものと解釈すべきではなく、その実施の形態において特有なものでしかない。
また、異なる実施の形態で記述されている内容を組み合わせて実行してもよい。
逆に、一実施の形態で示した内容を、並列に別々に、又は適切な部分を組み合わせて、実行してもよい。
Further, even if functions are indicated by individual instructions, the implementation does not necessarily execute the indicated individual instructions or consecutive instructions, and does not necessarily execute all the indicated functions. Multitasking and parallel processing may be advantageous.
Further, even if the detailed implementation is described in the above-described embodiment, it should not be construed as limiting the scope of the present invention, but only in the embodiment.
Further, the contents described in different embodiments may be combined and executed.
Conversely, the contents described in the embodiment may be executed separately in parallel or in combination with appropriate parts.

添付した図と前述の内容から、前述の実施の形態からの種々の修正、適用について、理解しうる。また、すべての修正は、本発明の範囲に含まれる。さらに、前述の説明と図面とから、本発明の範囲に含まれる他の一実施の形態に修正しうる。   Various modifications and applications from the above embodiments can be understood from the attached drawings and the above contents. All modifications are also included in the scope of the present invention. Furthermore, from the above description and drawings, the present invention can be modified to another embodiment included in the scope of the present invention.

本発明の実施の形態が前述した実施の形態に限定されず、変形とその他の実施の形態は、添付した特許請求の範囲に含まれることを認識しうる。また、この中の文言は、一般的で、記述的な観念で使用されたにすぎず、限定の目的はない。   It will be appreciated that embodiments of the invention are not limited to the embodiments described above, and that variations and other embodiments are within the scope of the appended claims. Moreover, the wording in this is only used in a general and descriptive notion, and has no limiting purpose.

(付記1)
複数の第1の初期潜在変数の訓練により、候補モデルを複数生成する工程と、
複数の前記候補モデルに基づき第2の初期潜在変数を決定する工程と、
前記第2の初期潜在変数に基づきターゲットモデルを決定する工程と、
を含むことを特徴とする混合モデルの選択方法。
(Appendix 1)
Generating a plurality of candidate models by training a plurality of first initial latent variables;
Determining a second initial latent variable based on a plurality of said candidate models;
Determining a target model based on the second initial latent variable;
A method for selecting a mixed model, comprising:

(付記2)
複数の第1の初期潜在変数の訓練により、候補モデルを複数生成する前記工程が、
訓練サンプルセットに基づき前記第1の初期潜在変数を複数決定する工程と、
複数の前記第1の初期潜在変数における各々の第1の初期潜在変数について、前記訓練サンプルセットで学習し、前記各々の第1の初期潜在変数に対応する前記候補モデルを生成する工程と、
を含むことを特徴とする付記1に記載の混合モデルの選択方法。
(Appendix 2)
Generating a plurality of candidate models by training a plurality of first initial latent variables;
Determining a plurality of said first initial latent variables based on a training sample set;
Learning for each first initial latent variable in a plurality of said first initial latent variables with said training sample set to generate said candidate model corresponding to each said first initial latent variable;
The method for selecting a mixed model according to appendix 1, wherein:

(付記3)
複数の前記候補モデルに基づき第2の初期潜在変数を決定する前記工程が、
前記複数の候補モデルを、対の候補モデルとして対に組み合わせる工程と、
前記対の候補モデルに基づき前記第2の潜在変数を決定する工程と、
を含むことを特徴とする付記1に記載の混合モデルの選択方法。
(Appendix 3)
Said step of determining a second initial latent variable based on a plurality of said candidate models;
Combining the plurality of candidate models as pairs of candidate models;
Determining the second latent variable based on the pair of candidate models;
The method for selecting a mixed model according to appendix 1, wherein:

(付記4)
複数の前記候補モデルに基づき第2の初期潜在変数を決定する前記工程が、
前記複数の候補モデルから、前記複数の候補モデルの性能に基づき候補モデルを二以上選択する工程と、
二以上の前記候補モデルを、対の候補モデルとして対に組み合わせる工程と、
前記対の候補モデルに基づき前記第2の初期潜在変数を決定する工程と、
を含むことを特徴とする付記1に記載の混合モデルの選択方法。
(Appendix 4)
Said step of determining a second initial latent variable based on a plurality of said candidate models;
Selecting two or more candidate models from the plurality of candidate models based on the performance of the plurality of candidate models;
Combining two or more candidate models as pairs of candidate models;
Determining the second initial latent variable based on the pair of candidate models;
The method for selecting a mixed model according to appendix 1, wherein:

(付記5)
前記複数の候補モデルから、前記複数の候補モデルの性能に基づき候補モデルを二以上選択する前記工程が、
前記複数の候補モデルにおける各々の候補モデルの性能を、前記各々の候補モデルのモデル構造、モデルパラメータ、及び更新潜在変数の変分分布に基づき、決定する工程と、
決定された前記性能に基づき前記複数の候補モデルを順位づける工程と、
順位づけの結果に基づき前記複数の候補モデルから候補モデルを二以上選択する工程と、
を含むことを特徴とする付記4に記載の混合モデルの選択方法。
(Appendix 5)
The step of selecting two or more candidate models based on the performance of the plurality of candidate models from the plurality of candidate models,
Determining the performance of each candidate model in the plurality of candidate models based on the model structure, model parameters and variational distribution of updated latent variables of each candidate model;
Ranking the plurality of candidate models based on the determined performance;
Selecting two or more candidate models from the plurality of candidate models based on the ranking results;
The method for selecting a mixed model according to appendix 4, characterized by comprising:

(付記6)
前記対の候補モデルにおける各々の対の候補モデルが、第1の候補モデルと第2の候補モデルとから構成され、前記対の候補モデルに基づき前記第2の初期潜在変数を決定する前記工程が、
前記各々の対の候補モデルにおける前記第1の候補モデルの更新潜在変数と前記第2の候補モデルの更新潜在変数とに基づき前記第2の初期潜在変数を決定する工程、
を含むことを特徴とする付記3又は4に記載の混合モデルの選択方法。
(Appendix 6)
Each of the pair of candidate models in the pair of candidate models includes a first candidate model and a second candidate model, and the step of determining the second initial latent variable based on the pair of candidate models includes: ,
Determining the second initial latent variable based on the updated latent variable of the first candidate model and the updated latent variable of the second candidate model in each pair of candidate models;
The method for selecting a mixed model according to Supplementary Note 3 or 4, characterized by comprising:

(付記7)
前記各々の対の候補モデルにおける前記第1の候補モデルの更新潜在変数と前記第2の候補モデルの更新潜在変数とに基づき前記第2の初期潜在変数を決定する前記工程が、
次のi)〜v)を1又は数回、実行する工程:
i)前記各々の対の候補モデルにおける前記第1の候補モデルの更新潜在変数からサンプルグループを第1のサンプルグループとして選択する工程、
ii)前記第1のサンプルグループに基づき、前記各々の対の候補モデルにおける前記第2の候補モデルの更新潜在変数の中のサンプルグループから第2のサンプルグループを決定する工程、
iii)前記第1のサンプルグループと前記第2のサンプルグループの交わりを決定する工程、
iv)前記交わりに基づき前記第1のサンプルグループを二のサブセットに分割する工程、
v)前記二のサブセットに基づき前記第2の初期潜在変数を構築する工程、
を含むことを特徴とする付記6に記載の混合モデルの選択方法。
(Appendix 7)
Determining the second initial latent variable based on the updated latent variable of the first candidate model and the updated latent variable of the second candidate model in each pair of candidate models;
The step of performing the following i) to v) one or several times:
i) selecting a sample group as a first sample group from the updated latent variables of the first candidate model in each pair of candidate models;
ii) determining, based on the first sample group, a second sample group from a sample group in an update latent variable of the second candidate model in each pair of candidate models;
iii) determining the intersection of the first sample group and the second sample group;
iv) dividing the first sample group into two subsets based on the intersection;
v) constructing the second initial latent variable based on the two subsets;
The method for selecting a mixed model according to appendix 6, characterized by comprising:

(付記8)
前記二のサブセットに基づき前記第2の初期潜在変数を構築する工程が、
構築した前記第2の初期潜在変数のサンプルグループの数が、前記第1の初期潜在変数のサンプルグループの数より少ない場合、前記第2の初期潜在変数のサンプルグループの数と前記第1の初期潜在変数のサンプルグループの数が一致するまで次のi)からiii)を実行する工程:
i)前記第2の初期潜在変数の中からサンプルグループを選択する工程、
ii)選択された前記サンプルグループを二のグループに分割し、分割された前記二のグループを前記第2の初期潜在変数に二のサンプルグループとして含める工程、
iii)前記第2の初期潜在変数のサンプルグループから選択された前記サンプルグループを削除する工程、
を含むことを特徴とする付記7に記載の混合モデルの選択方法。
(Appendix 8)
Constructing the second initial latent variable based on the two subsets;
If the number of sample groups of the second initial latent variable constructed is less than the number of sample groups of the first initial latent variable, the number of sample groups of the second initial latent variable and the first initial variable Performing the following i) to iii) until the number of sample groups of latent variables match:
i) selecting a sample group from the second initial latent variables;
ii) dividing the selected sample group into two groups, and including the divided two groups as second sample groups in the second initial latent variable;
iii) deleting the selected sample group from the sample group of the second initial latent variable;
The method for selecting a mixed model according to appendix 7, wherein

(付記9)
複数の前記候補モデルに基づき第2の初期潜在変数を決定する前記工程が、
次のi)からiii)を1又は数回、実行する工程:
i)複数の前記第2の初期潜在変数の訓練により、中間モデルを複数獲得する工程と、
ii)複数の前記中間モデルに基づき第3の初期潜在変数を決定する工程と、
iii)前記第3の初期潜在変数で前記第2の初期潜在変数を更新する工程と、
を含むことを特徴とする付記1に記載の混合モデルの選択方法。
(Appendix 9)
Said step of determining a second initial latent variable based on a plurality of said candidate models;
Performing the following i) to iii) one or several times:
i) obtaining a plurality of intermediate models by training a plurality of said second initial latent variables;
ii) determining a third initial latent variable based on a plurality of said intermediate models;
iii) updating the second initial latent variable with the third initial latent variable;
The method for selecting a mixed model according to appendix 1, wherein:

(付記10)
前記第2の初期潜在変数が複数存在し、前記第2の初期潜在変数に基づきターゲットモデルを決定する前記工程が、
複数の前記第2の初期潜在変数の訓練により、中間モデルを複数獲得する工程と、
複数の前記中間モデルの性能を決定する工程と、
前記性能に基づき複数の前記中間モデルから前記ターゲットモデルとして一を選択する工程と、
を含むことを特徴とする付記1に記載の混合モデルの選択方法。
(Appendix 10)
A plurality of the second initial latent variables, and the step of determining a target model based on the second initial latent variables includes:
Obtaining a plurality of intermediate models by training a plurality of said second initial latent variables;
Determining the performance of a plurality of said intermediate models;
Selecting one as the target model from a plurality of the intermediate models based on the performance;
The method for selecting a mixed model according to appendix 1, wherein:

(付記11)
複数の第1の初期潜在変数の訓練により、候補モデルを複数生成する候補モデル生成部と、
複数の前記候補モデルに基づき第2の初期潜在変数を決定する第1決定部と、
前記第2の初期潜在変数に基づきターゲットモデルを決定する第2決定部と、
を備えることを特徴とする混合モデルの選択装置。
(Appendix 11)
A candidate model generation unit that generates a plurality of candidate models by training a plurality of first initial latent variables;
A first determination unit for determining a second initial latent variable based on the plurality of candidate models;
A second determination unit for determining a target model based on the second initial latent variable;
An apparatus for selecting a mixed model, comprising:

(付記12)
前記候補モデル生成部が、
訓練サンプルセットに基づき前記複数の第1の初期潜在変数を決定する第1初期潜在変数決定部と、
前記複数の第1の初期潜在変数における各々の第1の初期潜在変数について、前記訓練サンプルセットを学習し、前記各々の第1の初期潜在変数に対応する前記候補モデルを生成する訓練部と、
を備えることを特徴とする付記11に記載の混合モデルの選択装置。
(Appendix 12)
The candidate model generation unit
A first initial latent variable determining unit that determines the plurality of first initial latent variables based on a training sample set;
A training unit that learns the training sample set for each first initial latent variable in the plurality of first initial latent variables and generates the candidate model corresponding to each first initial latent variable;
The mixed model selecting device according to claim 11, further comprising:

(付記13)
前記第1決定部が、
前記複数の候補モデルを、対の候補モデルとして対に組み合わせる組合せ部と、
前記対の候補モデルに基づき前記第2の初期潜在変数を決定する第2初期潜在変数決定部と、
を備えることを特徴とする付記11に記載の混合モデルの選択装置。
(Appendix 13)
The first determination unit is
A combination unit that combines the plurality of candidate models as a pair of candidate models;
A second initial latent variable determining unit that determines the second initial latent variable based on the pair of candidate models;
The mixed model selecting device according to claim 11, further comprising:

(付記14)
前記第1決定部が、
前記複数の候補モデルから、前記複数の候補モデルの性能に基づき候補モデルを二以上選択する第1候補モデル選択部と、
二以上の前記候補モデルを、対の候補モデルとして対に組み合わせる組合せ部と、
前記対の候補モデルに基づき前記第2の初期潜在変数を決定する第2初期潜在変数決定部と、
を備えることを特徴とする付記11に記載の混合モデルの選択装置。
(Appendix 14)
The first determination unit is
A first candidate model selection unit that selects two or more candidate models from the plurality of candidate models based on the performance of the plurality of candidate models;
A combination unit that combines two or more candidate models as a pair of candidate models;
A second initial latent variable determining unit that determines the second initial latent variable based on the pair of candidate models;
The mixed model selecting device according to claim 11, further comprising:

(付記15)
第1候補モデル選択部が、
前記複数の候補モデルにおける各々の候補モデルの性能を、前記各々の候補モデルのモデル構造、モデルパラメータ、及び更新潜在変数の変分分布に基づき、決定する第1性能決定部と、
決定された前記性能に基づき前記複数の候補モデルを順位づける順位づけ部と、
順位づけの結果に基づき前記複数の候補モデルから二以上選択する第2候補モデル選択部と、
を備えることを特徴とする付記14に記載の混合モデルの選択装置。
(Appendix 15)
The first candidate model selection unit
A first performance determination unit that determines the performance of each candidate model in the plurality of candidate models based on the model structure, model parameters, and variational distribution of updated latent variables of each candidate model;
A ranking unit that ranks the plurality of candidate models based on the determined performance;
A second candidate model selection unit that selects two or more from the plurality of candidate models based on the ranking result;
15. The mixed model selection apparatus according to appendix 14, characterized by comprising:

(付記16)
前記対の候補モデルの中の各々の対の候補モデルが、第1の候補モデルと第2の候補モデルとから構成され、
前記第2初期潜在変数決定部が、さらに、前記各々の対の候補モデルにおける前記第1の候補モデルの更新潜在変数と前記第2の候補モデルの更新潜在変数とに基づき前記第2の初期潜在変数を決定する、
ことを特徴とする付記13又は14に記載の混合モデルの選択装置。
(Appendix 16)
Each pair of candidate models in the pair of candidate models is composed of a first candidate model and a second candidate model;
The second initial latent variable determination unit further includes the second initial latent potential based on the update latent variable of the first candidate model and the update latent variable of the second candidate model in each pair of candidate models. Determine the variables,
15. The mixed model selection device according to appendix 13 or 14, characterized by:

(付記17)
前記第2初期潜在変数決定部が、
前記各々の対の候補モデルにおける前記第1の候補モデルの更新潜在変数からサンプルグループを第1のサンプルグループとして選択する第1サンプルグループ決定部と、
前記第1のサンプルグループに基づき、前記各々の対の候補モデルにおける前記第2の候補モデルの更新潜在変数の中のサンプルグループから第2のサンプルグループを決定する第2サンプルグループ決定部と、
前記第1のサンプルグループと前記第2のサンプルグループの交わりを決定する交わり決定部と、
前記交わりに基づき前記第1のサンプルグループを二のサブセットに分割する分割部と、
前記二のサブセットに基づき第2の初期潜在変数を構築する第2初期潜在変数構築部と、
を備えることを特徴とする付記16に記載の混合モデルの選択装置。
(Appendix 17)
The second initial latent variable determination unit
A first sample group determination unit that selects a sample group as a first sample group from the update latent variables of the first candidate model in each pair of candidate models;
A second sample group determining unit that determines a second sample group from the sample groups in the update latent variables of the second candidate model in each pair of candidate models based on the first sample group;
An intersection determining unit for determining an intersection of the first sample group and the second sample group;
A divider for dividing the first sample group into two subsets based on the intersection;
A second initial latent variable construction unit for constructing a second initial latent variable based on the two subsets;
The mixed model selecting device according to appendix 16, wherein the mixed model selecting device is provided.

(付記18)
前記第2初期潜在変数構築部が、
構築した前記第2の初期潜在変数のサンプルグループの数が、前記第1の初期潜在変数のサンプルグループの数より少ない場合、前記第2の初期潜在変数のサンプルグループの数が前記第1の初期潜在変数のサンプルグループの数に一致するまで次のi)からiii)を実行する、:i)前記第2の初期潜在変数の中からサンプルグループを選択し、ii)選択された前記サンプルグループを二のグループに分割し、分割された前記二のグループを前記第2の初期潜在変数に二のサンプルグループとして含め、iii)前記第2の初期潜在変数のサンプルグループから選択された前記サンプルグループを削除する、
ことを特徴とする付記17に記載の混合モデルの選択装置。
(Appendix 18)
The second initial latent variable construction unit
If the number of constructed sample groups of the second initial latent variable is less than the number of sample groups of the first initial latent variable, the number of sample groups of the second initial latent variable is the first initial variable. Perform the following i) to iii) until it matches the number of sample groups of latent variables: i) select a sample group from among the second initial latent variables, and ii) select the selected sample group Dividing into two groups, including the divided two groups as second sample groups in the second initial latent variable, and iii) selecting the sample group selected from the sample group of the second initial latent variable delete,
18. The mixed model selection device according to appendix 17, characterized in that.

(付記19)
前記第1決定部が、
前記複数の第2の初期潜在変数の訓練により、中間モデルを複数獲得する中間モデル生成部と、
複数の前記中間モデルに基づき第3の初期潜在変数を決定する第3初期潜在変数決定部と、
前記第3の初期潜在変数で前記第2の初期潜在変数を更新する更新部と、
を備えることを特徴とする付記11に記載の混合モデルの選択装置。
(Appendix 19)
The first determination unit is
An intermediate model generation unit for acquiring a plurality of intermediate models by training the plurality of second initial latent variables;
A third initial latent variable determining unit that determines a third initial latent variable based on the plurality of intermediate models;
An update unit for updating the second initial latent variable with the third initial latent variable;
The mixed model selecting device according to claim 11, further comprising:

(付記20)
前記第2の初期潜在変数が複数存在し、前記第2決定部が、
前記複数の第2の初期潜在変数の訓練により、中間モデルを複数獲得する中間モデル決定部と、
複数の前記中間モデルの性能を決定する第2性能決定部と、
前記性能に基づき前記複数の中間モデルから前記ターゲットモデルとして一を選択するターゲットモデル選択部と、
を備えることを特徴とする付記11に記載の混合モデルの選択装置。
(Appendix 20)
There are a plurality of the second initial latent variables, and the second determination unit includes:
An intermediate model determining unit for acquiring a plurality of intermediate models by training the plurality of second initial latent variables;
A second performance determining unit that determines the performance of the plurality of intermediate models;
A target model selection unit that selects one as the target model from the plurality of intermediate models based on the performance;
The mixed model selecting device according to claim 11, further comprising:

Claims (10)

複数の第1の初期潜在変数の訓練により、候補モデルを複数生成する候補モデル生成部と、
複数の前記候補モデルに基づき第2の初期潜在変数を決定する第1決定部と、
前記第2の初期潜在変数に基づきターゲットモデルを決定する第2決定部と、
を備えることを特徴とする混合モデルの選択装置。
A candidate model generation unit that generates a plurality of candidate models by training a plurality of first initial latent variables;
A first determination unit for determining a second initial latent variable based on the plurality of candidate models;
A second determination unit for determining a target model based on the second initial latent variable;
An apparatus for selecting a mixed model, comprising:
前記候補モデル生成部が、
訓練サンプルセットに基づき前記複数の第1の初期潜在変数を決定する第1初期潜在変数決定部と、
前記複数の第1の初期潜在変数における各々の第1の初期潜在変数について、前記訓練サンプルセットを学習し、前記各々の第1の初期潜在変数に対応する前記候補モデルを生成する訓練部と、
を備えることを特徴とする請求項1に記載の混合モデルの選択装置。
The candidate model generation unit
A first initial latent variable determining unit that determines the plurality of first initial latent variables based on a training sample set;
A training unit that learns the training sample set for each first initial latent variable in the plurality of first initial latent variables and generates the candidate model corresponding to each first initial latent variable;
The mixed model selection apparatus according to claim 1, further comprising:
前記第1決定部が、
前記複数の候補モデルを、対の候補モデルとして対に組み合わせる組合せ部と、
前記対の候補モデルに基づき前記第2の初期潜在変数を決定する第2初期潜在変数決定部と、
を備えることを特徴とする請求項1に記載の混合モデルの選択装置。
The first determination unit is
A combination unit that combines the plurality of candidate models as a pair of candidate models;
A second initial latent variable determining unit that determines the second initial latent variable based on the pair of candidate models;
The mixed model selection apparatus according to claim 1, further comprising:
前記第1決定部が、
前記複数の候補モデルから、前記複数の候補モデルの性能に基づき候補モデルを二以上選択する第1候補モデル選択部と、
二以上の前記候補モデルを、対の候補モデルとして対に組み合わせる組合せ部と、
前記対の候補モデルに基づき前記第2の初期潜在変数を決定する第2初期潜在変数決定部と、
を備えることを特徴とする請求項1に記載の混合モデルの選択装置。
The first determination unit is
A first candidate model selection unit that selects two or more candidate models from the plurality of candidate models based on the performance of the plurality of candidate models;
A combination unit that combines two or more candidate models as a pair of candidate models;
A second initial latent variable determining unit that determines the second initial latent variable based on the pair of candidate models;
The mixed model selection apparatus according to claim 1, further comprising:
前記第1候補モデル選択部が、
前記複数の候補モデルにおける各々の候補モデルの性能を、前記各々の候補モデルのモデル構造、モデルパラメータ、及び更新潜在変数の変分分布に基づき、決定する第1性能決定部と、
決定された前記性能に基づき前記複数の候補モデルを順位づける順位づけ部と、
順位づけの結果に基づき前記複数の候補モデルから二以上選択する第2候補モデル選択部と、
を備えることを特徴とする請求項4に記載の混合モデルの選択装置。
The first candidate model selection unit
A first performance determination unit that determines the performance of each candidate model in the plurality of candidate models based on the model structure, model parameters, and variational distribution of updated latent variables of each candidate model;
A ranking unit that ranks the plurality of candidate models based on the determined performance;
A second candidate model selection unit that selects two or more from the plurality of candidate models based on the ranking result;
The mixed model selection apparatus according to claim 4, further comprising:
前記対の候補モデルの中の各々の対の候補モデルが、第1の候補モデルと第2の候補モデルとから構成され、
前記第2初期潜在変数決定部が、さらに、前記各々の対の候補モデルにおける前記第1の候補モデルの更新潜在変数と前記第2の候補モデルの更新潜在変数とに基づき前記第2の初期潜在変数を決定する、
ことを特徴とする請求項3又は4に記載の混合モデルの選択装置。
Each pair of candidate models in the pair of candidate models is composed of a first candidate model and a second candidate model;
The second initial latent variable determination unit further includes the second initial latent potential based on the update latent variable of the first candidate model and the update latent variable of the second candidate model in each pair of candidate models. Determine the variables,
5. The mixed model selection apparatus according to claim 3, wherein the mixed model selection apparatus is provided.
前記第2初期潜在変数決定部が、
前記各々の対の候補モデルにおける前記第1の候補モデルの更新潜在変数からサンプルグループを第1のサンプルグループとして選択する第1サンプルグループ決定部と、
前記第1のサンプルグループに基づき、前記各々の対の候補モデルにおける前記第2の候補モデルの更新潜在変数の中のサンプルグループから第2のサンプルグループを決定する第2サンプルグループ決定部と、
前記第1のサンプルグループと前記第2のサンプルグループの交わりを決定する交わり決定部と、
前記交わりに基づき前記第1のサンプルグループを二のサブセットに分割する分割部と、
前記二のサブセットに基づき第2の初期潜在変数を構築する第2初期潜在変数構築部と、
を備えることを特徴とする請求項6に記載の混合モデルの選択装置。
The second initial latent variable determination unit
A first sample group determination unit that selects a sample group as a first sample group from the update latent variables of the first candidate model in each pair of candidate models;
A second sample group determining unit that determines a second sample group from the sample groups in the update latent variables of the second candidate model in each pair of candidate models based on the first sample group;
An intersection determining unit for determining an intersection of the first sample group and the second sample group;
A divider for dividing the first sample group into two subsets based on the intersection;
A second initial latent variable construction unit for constructing a second initial latent variable based on the two subsets;
The mixed model selecting apparatus according to claim 6, further comprising:
前記第1決定部が、
前記複数の第2の初期潜在変数の訓練により、中間モデルを複数獲得する中間モデル生成部と、
複数の前記中間モデルに基づき第3の初期潜在変数を決定する第3初期潜在変数決定部と、
前記第3の初期潜在変数で前記第2の初期潜在変数を更新する更新部と、
を備えることを特徴とする請求項1に記載の混合モデルの選択装置。
The first determination unit is
An intermediate model generation unit for acquiring a plurality of intermediate models by training the plurality of second initial latent variables;
A third initial latent variable determining unit that determines a third initial latent variable based on the plurality of intermediate models;
An update unit for updating the second initial latent variable with the third initial latent variable;
The mixed model selection apparatus according to claim 1, further comprising:
前記第2の初期潜在変数が複数存在し、前記第2決定部が、
前記複数の第2の初期潜在変数の訓練により、中間モデルを複数獲得する中間モデル決定部と、
複数の前記中間モデルの性能を決定する第2性能決定部と、
前記性能に基づき前記複数の中間モデルから前記ターゲットモデルとして一を選択するターゲットモデル選択部と、
を備えることを特徴とする請求項1に記載の混合モデルの選択装置。
There are a plurality of the second initial latent variables, and the second determination unit includes:
An intermediate model determining unit for acquiring a plurality of intermediate models by training the plurality of second initial latent variables;
A second performance determining unit that determines the performance of the plurality of intermediate models;
A target model selection unit that selects one as the target model from the plurality of intermediate models based on the performance;
The mixed model selection apparatus according to claim 1, further comprising:
複数の第1の初期潜在変数の訓練により、候補モデルを複数生成する工程と、
複数の前記候補モデルに基づき第2の初期潜在変数を決定する工程と、
前記第2の初期潜在変数に基づきターゲットモデルを決定する工程と、
を含むことを特徴とする混合モデルの選択方法。
Generating a plurality of candidate models by training a plurality of first initial latent variables;
Determining a second initial latent variable based on a plurality of said candidate models;
Determining a target model based on the second initial latent variable;
A method for selecting a mixed model, comprising:
JP2016040843A 2015-03-31 2016-03-03 Method and apparatus for mixed model selection Active JP6172315B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510149617.4A CN106156077A (en) 2015-03-31 2015-03-31 The method and apparatus selected for mixed model
CN201510149617.4 2015-03-31

Publications (2)

Publication Number Publication Date
JP2016194910A JP2016194910A (en) 2016-11-17
JP6172315B2 true JP6172315B2 (en) 2017-08-02

Family

ID=57322763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016040843A Active JP6172315B2 (en) 2015-03-31 2016-03-03 Method and apparatus for mixed model selection

Country Status (2)

Country Link
JP (1) JP6172315B2 (en)
CN (1) CN106156077A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102002732B1 (en) * 2018-09-20 2019-07-23 건국대학교 산학협력단 Deep neural network based data processing method and apparatus using ensemble model

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836792A (en) 2017-12-29 2021-05-25 华为技术有限公司 Training method and device of neural network model

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163395A (en) * 1998-11-30 2000-06-16 Nippon Telegr & Teleph Corp <Ntt> Maximum likelihood estimation for mixed model and recording medium where maximum likelihood estimation program for mixed model is recorded
US20120209880A1 (en) * 2011-02-15 2012-08-16 General Electric Company Method of constructing a mixture model

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102002732B1 (en) * 2018-09-20 2019-07-23 건국대학교 산학협력단 Deep neural network based data processing method and apparatus using ensemble model

Also Published As

Publication number Publication date
JP2016194910A (en) 2016-11-17
CN106156077A (en) 2016-11-23

Similar Documents

Publication Publication Date Title
US20230252327A1 (en) Neural architecture search for convolutional neural networks
US11610131B2 (en) Ensembling of neural network models
CN111602148B (en) Regularized neural network architecture search
US11853893B2 (en) Execution of a genetic algorithm having variable epoch size with selective execution of a training algorithm
CN111406264B (en) Neural architecture search
JP6172317B2 (en) Method and apparatus for mixed model selection
CN113544703A (en) Efficient off-policy credit allocation
US11262717B2 (en) Optimization device and control method of optimization device based on temperature statistical information
CN110462638B (en) Training neural networks using posterior sharpening
WO2019212006A1 (en) Phenomenon prediction device, prediction model generation device, and phenomenon prediction program
US11816185B1 (en) Multi-view image analysis using neural networks
Jabbari et al. Discovery of causal models that contain latent variables through Bayesian scoring of independence constraints
Ghanbari et al. Reconstruction of gene networks using prior knowledge
US20240005129A1 (en) Neural architecture and hardware accelerator search
JP6172315B2 (en) Method and apparatus for mixed model selection
JP6233432B2 (en) Method and apparatus for selecting mixed model
CN113822390B (en) User portrait construction method and device, electronic equipment and storage medium
Mameche et al. Learning causal models under independent changes
JP7384999B2 (en) Machine learning model determination system and machine learning model determination method
US20240321407A1 (en) Machine learning platform for predicted efficacy of untested pharmaceuticals
CN112348161A (en) Neural network training method, neural network training device and electronic equipment
US20240256879A1 (en) Training a neural network to perform an algorithmic task using a self-supervised loss
CN118378074B (en) Method and system for scheduling sorting algorithm in sparse matrix solving process
CN113688249B (en) Knowledge graph embedding method and system based on relational cognition
Mishra et al. Deep learning based continuous integration and continuous delivery software defect prediction with effective optimization strategy

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170619

R150 Certificate of patent or registration of utility model

Ref document number: 6172315

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150