JP5965011B2 - Method and apparatus for relational model determination - Google Patents

Method and apparatus for relational model determination Download PDF

Info

Publication number
JP5965011B2
JP5965011B2 JP2015051733A JP2015051733A JP5965011B2 JP 5965011 B2 JP5965011 B2 JP 5965011B2 JP 2015051733 A JP2015051733 A JP 2015051733A JP 2015051733 A JP2015051733 A JP 2015051733A JP 5965011 B2 JP5965011 B2 JP 5965011B2
Authority
JP
Japan
Prior art keywords
indicates
sample
latent variables
updated
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015051733A
Other languages
Japanese (ja)
Other versions
JP2015191667A (en
Inventor
ロ フン
ロ フン
シュンチェン リュウ
シュンチェン リュウ
遼平 藤巻
遼平 藤巻
慎二 中台
慎二 中台
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2015191667A publication Critical patent/JP2015191667A/en
Application granted granted Critical
Publication of JP5965011B2 publication Critical patent/JP5965011B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Description

本開示は、統計の技術分野に関する。特に、リレーショナルモデルのモデル選択用の方法と装置に関する。   The present disclosure relates to the technical field of statistics. In particular, it relates to a method and apparatus for model selection of a relational model.

統計的手法の継続的な発展に伴い、オブジェクト間のリレーショナル情報をモデリングすることは注目の話題になっている。オブジェクト間には様々なリレーショナル情報が存在し、例えば、調査対象の母集団に含まれる人々の間の連絡先情報、インターネット上のページ間のリンクのリレーショナル情報が存在する。様々なリレーショナル情報は、1つのカテゴリにおけるオブジェクト間又は複数のカテゴリにおけるオブジェクト間の相関を表現する。また、リレーショナル情報についての分析により、より価値のある情報が取得されてよい。このため、リレーショナル情報に基づく適用がますます勧められており、その1つはリレーショナル情報に応じた異なるサンプルデータ用にリレーションクラスタリングを行っている。しかしながら、リレーションクラスタリング中、通常、リレーショナルモデルが使用される。例えば、映画会社が、顧客の応答情報に基づいて現在上映中の映画シリーズに総合的な評価を与えることを望む場合、現在上映中の映画シリーズについてユーザのグループにより与えられたスコアを収集し、リレーショナルモデルを使用することによってユーザと映画を異なるサンプルカテゴリにグループ化する。このようにして、ユーザ、映画及びスコアについて同時クラスタリングが実現される。また、クラスタリング結果解析によって、その視聴者の特徴といった映画についての有益な情報が取得される。実際のクラスタリング中、リレーショナル情報と共に、属性情報のような非リレーショナル情報が一般的に使用される。そのため、現在、クラスタリングにおいてリレーショナル情報を非リレーショナル情報に連携させること(例えばリレーショナル情報及び非リレーショナル情報に応じてリレーショナルモデルを決定すること)は、リレーションクラスタリングについて学習するための重要な課題になっている。   With the continuous development of statistical methods, modeling relational information between objects has become a hot topic. Various relational information exists between the objects, for example, contact information between people included in the surveyed population, and relational information of links between pages on the Internet. Various relational information represents the correlation between objects in one category or between objects in multiple categories. Also, more valuable information may be acquired by analyzing relational information. For this reason, application based on relational information is increasingly recommended, one of which is relation clustering for different sample data according to relational information. However, during relation clustering, a relational model is usually used. For example, if a movie company wants to give a comprehensive rating to a currently playing movie series based on customer response information, it collects the score given by the group of users for the currently showing movie series, Group users and movies into different sample categories by using a relational model. In this way, simultaneous clustering is realized for users, movies and scores. In addition, useful information about the movie such as the characteristics of the viewer is acquired by the clustering result analysis. During actual clustering, non-relational information such as attribute information is commonly used along with relational information. Therefore, at present, linking relational information with non-relational information in clustering (for example, determining a relational model according to relational information and non-relational information) is an important issue for learning about relation clustering. .

実際には、リレーショナルモデルは、潜在変数及びモデルパラメータ、又は、潜在変数の変分分布及びモデルパラメータによって決定される。潜在変数は、直接観測できないがサンプルデータから導出できる変数のことである。潜在変数の変分分布は、対応するカテゴリにおけるクラスタリングサンプルデータの確率を記述するために使用される。一方、モデルパラメータは、各カテゴリ下のサブモデルのパラメータを記述するために使用される。現在、回帰に基づく潜在因子モデル(Regression-based latent factor models)[ディーパック アガーワル(Deepak Agarwal)他著、KDD’09会報、2009]という論文において、潜在変数及びモデルパラメータを決定する方法が提案されている。この方法において、第一に、サンプルデータ、2つのサンプル属性のグループ、2つの潜在変数のグループ、及びモデルパラメータに応じて対数尤度が取得される。第二に、目的関数が対数尤度に応じて与えられ、更に、目的関数の収束を可能にする潜在変数の各々及びモデルパラメータがサンプリング手段によって決定される。目的関数の収束を可能にする潜在変数及びモデルパラメータは、リレーショナルモデル決定用の潜在変数及びモデルパラメータとして機能してよい。   In practice, the relational model is determined by latent variables and model parameters, or variational distributions and model parameters of latent variables. A latent variable is a variable that cannot be observed directly but can be derived from sample data. The variational distribution of latent variables is used to describe the probability of clustering sample data in the corresponding category. On the other hand, the model parameter is used to describe the parameters of the sub model under each category. Currently, a paper called Regression-based latent factor models [Deepak Agarwal et al., KDD'09 Bulletin, 2009] proposes a method for determining latent variables and model parameters. ing. In this method, first, log likelihood is obtained according to sample data, two sample attribute groups, two latent variable groups, and model parameters. Secondly, an objective function is given as a function of log likelihood, and further, each of the latent variables and model parameters that enable convergence of the objective function are determined by the sampling means. Latent variables and model parameters that enable convergence of the objective function may function as latent variables and model parameters for relational model determination.

本開示の実施例中、発明者は、先行技術が少なくとも下記のような課題を有することを確認している。   In the examples of the present disclosure, the inventors have confirmed that the prior art has at least the following problems.

目的関数が対数尤度のみに応じて決定されるため、この目的関数によって決定されるリレーショナルモデルは最適なモデル構造及びパラメータを自動的に獲得することができない。また、モデル選択は非常に複雑である。加えて、目的関数の収束を可能にする潜在変数及びモデルパラメータがサンプリング手段によって決定されるときの効率が悪い。また、決定されたリレーショナルモデルの精度が低い。   Since the objective function is determined only depending on the log likelihood, the relational model determined by this objective function cannot automatically obtain the optimal model structure and parameters. Also, model selection is very complex. In addition, it is inefficient when the latent variables and model parameters that enable the convergence of the objective function are determined by the sampling means. Also, the accuracy of the determined relational model is low.

先行技術における課題を解決するために、本開示の実施形態は、リレーショナルモデル決定用の方法及び装置を提供する。技術的解決方法は具体的には下記の通りである。   In order to solve the problems in the prior art, embodiments of the present disclosure provide a method and apparatus for relational model determination. Specifically, the technical solution is as follows.

第1の観点によると、提供されるリレーショナルモデル決定用の方法は、
サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、前記潜在変数の各々の変分分布の対数と、を取得することと、
前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定することと、
前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定し、前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記モデルパラメータに応じてリレーショナルモデルを決定することと、
を備える。
According to a first aspect, the provided relational model determination method is:
Logarithmic likelihood determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters, a normalization term, and a logarithm of the variational distribution of each of the latent variables; Getting, and
Determining an objective function according to the log likelihood, the normalization term, and the logarithm of the variational distribution of each of the latent variables;
Determining a variational distribution and model parameters of each of the latent variables enabling convergence of the objective function, and depending on the variational distribution and model parameters of each of the latent variables enabling convergence of the objective function To determine the relational model
Is provided.

第1の観点に関し、第1の観点の第1の可能な実施例において、前記サンプルデータ、前記少なくとも2つのサンプル属性のグループ、前記少なくとも2つの潜在変数のグループ、及び前記モデルパラメータに応じて決定される前記対数尤度は、

Figure 0005965011
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
は前記サンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、前記モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示す。 Regarding the first aspect, in a first possible embodiment of the first aspect, determined according to the sample data, the group of at least two sample attributes, the group of at least two latent variables, and the model parameter The log likelihood to be
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents the sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column are shown, indicates the latent variable matrix Z R rows, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], α and β are the row and column mixing ratios, φ indicates the sub-model parameter in each sample category, η indicates the model parameter of the row sample attribute in each sample category, and ξ indicates the column in each sample category The model parameters of the sample attributes are shown.

第1の観点に関し、第1の観点の第2の可能な実施例において、前記サンプルデータ、前記少なくとも2つのサンプル属性のグループ、前記少なくとも2つの潜在変数のグループ、及び前記モデルパラメータに応じて決定される前記正規化項は、

Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は前記潜在変数の前記変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す。 With respect to the first aspect, in a second possible embodiment of the first aspect, determined according to the sample data, the group of at least two sample attributes, the group of at least two latent variables, and the model parameter The normalized term to be
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Indicates an approximation of the variational distribution of the latent variable,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β denotes the dimension of β, D pq denotes the dimension of the submodel parameter in the sample category of the pth row and the qth column, and η p denotes the model parameter of the sample attribute of the row in the sample category of the pth row. Show
Figure 0005965011
Denotes the dimension of η p , ξ q denotes the model parameter of the column sample attribute in the q-th column sample category,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicates.

第1の観点に関し、第1の観点の第3の可能な実施例において、前記サンプルデータ、前記少なくとも2つのサンプル属性のグループ、前記少なくとも2つの潜在変数のグループ、及び前記モデルパラメータに応じて決定される前記潜在変数の各々の前記変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数行列Zの前記変分分布を示し、q(Z)は列の潜在変数行列Zの前記変分分布を示す。 Regarding the first aspect, in a third possible embodiment of the first aspect, determined according to the sample data, the group of at least two sample attributes, the group of at least two latent variables, and the model parameter The logarithm of the variational distribution of each of the latent variables to be performed is logq (Z R ) and logq (Z c ), q (Z R ) denotes the variational distribution of the latent variable matrix Z R in a row, q (Z c ) represents the variational distribution of the column latent variable matrix Z c .

第1の観点の第3の可能な実施例に対する第1の観点の何れかに関し、第1の観点の第4の実施例において、前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定することは、前記対数尤度の期待値、前記正規化項の期待値、及び前記潜在変数の各々の前記変分分布の対数の期待値に応じて前記目的関数を決定することを含む。   With respect to any of the first aspects to the third possible embodiment of the first aspect, in the fourth embodiment of the first aspect, the log likelihood, the normalization term, and the latent variable Determining the objective function according to the logarithm of each of the variational distributions is the expected value of the log likelihood, the expected value of the normalization term, and the logarithm of the variational distribution of each of the latent variables. Determining the objective function in accordance with the expected value of.

第1の観点の第4の可能な実施例に関し、第1の観点の第5の実施例において、前記対数尤度の期待値、前記正規化項の期待値、及び前記潜在変数の各々の前記変分分布の対数の期待値に応じて決定された前記目的関数

Figure 0005965011
は、
Figure 0005965011
である。 With respect to a fourth possible embodiment of the first aspect, in the fifth embodiment of the first aspect, the expected value of the log likelihood, the expected value of the normalization term, and each of the latent variables The objective function determined according to the expected logarithm of the variation distribution
Figure 0005965011
Is
Figure 0005965011
It is.

第1の観点の第5の可能な実施例に関し、第1の観点の第6の実施例において、前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定することは、
前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて前記目的関数が収束するか否かを判別し、前記目的関数が収束しない場合には前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記モデルパラメータを取得するまで前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータを再取得することと、
を含む。
With respect to the fifth possible embodiment of the first aspect, in the sixth embodiment of the first aspect, the variation distribution and model parameters of each of the latent variables that allow convergence of the objective function are determined. That is
Obtaining an updated variation distribution and updated model parameters for each of the latent variables;
It is determined whether or not the objective function converges according to the updated variation distribution and the updated model parameter of each of the latent variables, and if the objective function does not converge, the objective function converges Re-acquiring the updated variation distribution and the updated model parameters for each of the latent variables until obtaining the variation distribution and the model parameters for each of the latent variables to allow
including.

第1の観点の第6の可能な実施例に関し、第1の観点の第7の実施例において、前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することは、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するまで、下記の式

Figure 0005965011
を使用することによって前記潜在変数の各々の前記変分分布を交互に更新することと、
下記の式
Figure 0005965011
ここで、
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記目的関数の収束を可能にする前記潜在変数の各々の前記更新された変分分布に応じて前記モデルパラメータを更新することと、
を含む。 Regarding the sixth possible embodiment of the first aspect, in the seventh embodiment of the first aspect, obtaining each updated variation distribution and updated model parameter of the latent variable comprises:
Until obtaining an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
Alternately updating the variational distribution of each of the latent variables by using
The following formula
Figure 0005965011
here,
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
Updating the model parameters in response to the updated variational distribution of each of the latent variables that enables convergence of the objective function by using
including.

第1の観点の第6の可能な実施例に関し、第1の観点の第8の実施例において、前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することは、
前記更新されたモデルパラメータを取得するために下記の式

Figure 0005965011
ここで、
Figure 0005965011
を使用することによって前記モデルパラメータを更新することと、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記更新されたモデルパラメータに応じて前記潜在変数の各々の前記変分分布を交互に更新することと、
を含む。 Regarding the sixth possible embodiment of the first aspect, in the eighth embodiment of the first aspect, obtaining an updated variation distribution and updated model parameters of each of the latent variables comprises:
In order to obtain the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
Updating the model parameters by using
To obtain an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
Alternately updating the variational distribution of each of the latent variables in response to the updated model parameters by using
including.

第1の観点の第6から8の実施例の何れかに関し、第1の観点の第9の実施例において、前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて前記目的関数が収束するか否かを判別することは、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と、前記潜在変数の各々の前回更新された変分分布及び前回更新されたモデルパラメータに応じて決定された前回取得された目的関数と、の間の距離が閾値より短いか否かを比較することと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と前記前回取得された目的関数との間の距離が前記閾値より短い場合には前記目的関数が収束すると判別することと、
を含む。
With respect to any of the sixth to eighth embodiments of the first aspect, in the ninth embodiment of the first aspect, the updated variation distribution and each of the updated model parameters of each of the latent variables In response to determining whether the objective function converges,
The objective function determined in response to the updated variation distribution and the updated model parameters of each of the latent variables; the last updated variation distribution and the last updated model of each of the latent variables; Comparing whether the distance between the objective function acquired last time determined according to the parameter is shorter than a threshold,
When the distance between the objective function determined in accordance with the updated variation distribution and the updated model parameter of each of the latent variables and the previously acquired objective function is shorter than the threshold value Determining that the objective function converges;
including.

第2の観点において、提供されるリレーショナルモデル決定用の装置は、
サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、前記潜在変数の各々の変分分布の対数と、を取得するように構成された取得モジュールと、
前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定するように構成された第1の決定モジュールと、
前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定するように構成された第2の決定モジュールと、
前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記モデルパラメータに応じてリレーショナルモデルを決定するように構成された第3の決定モジュールと、
を備える。
In a second aspect, provided apparatus for relational model determination is:
Logarithmic likelihood determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters, a normalization term, and a logarithm of the variational distribution of each of the latent variables; An acquisition module configured to acquire, and
A first determination module configured to determine an objective function according to the log likelihood, the normalization term, and the logarithm of the variational distribution of each of the latent variables;
A second determination module configured to determine a variational distribution and model parameters of each of the latent variables that allow convergence of the objective function;
A third determination module configured to determine a relational model as a function of the variational distribution and model parameters of each of the latent variables that allow convergence of the objective function;
Is provided.

第2の観点に関し、第2の観点の第1の可能な実施例において、前記取得モジュールによって取得される前記対数尤度は、

Figure 0005965011
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
は前記サンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、前記モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示す。 Regarding the second aspect, in the first possible embodiment of the second aspect, the log likelihood obtained by the acquisition module is:
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents the sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column are shown, indicates the latent variable matrix Z R rows, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], α and β are the row and column mixing ratios, φ indicates the sub-model parameter in each sample category, η indicates the model parameter of the row sample attribute in each sample category, and ξ indicates the column in each sample category The model parameters of the sample attributes are shown.

第2の観点に関し、第2の観点の第2の可能な実施例において、前記取得モジュールによって取得される前記正規化項は、

Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は前記潜在変数の前記変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す。 With respect to the second aspect, in a second possible embodiment of the second aspect, the normalization term obtained by the obtaining module is:
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Indicates an approximation of the variational distribution of the latent variable,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β denotes the dimension of β, D pq denotes the dimension of the submodel parameter in the sample category of the pth row and the qth column, and η p denotes the model parameter of the sample attribute of the row in the sample category of the pth row. Show
Figure 0005965011
Denotes the dimension of η p , ξ q denotes the model parameter of the column sample attribute in the q-th column sample category,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicates.

第2の観点に関し、第2の観点の第3の可能な実施例において、前記取得モジュールによって取得される前記潜在変数の各々の前記変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数Zの前記変分分布を示し、q(Z)は列の潜在変数Zの前記変分分布を示す。 Regarding the second aspect, in a third possible embodiment of the second aspect, the logarithm of the variational distribution of each of the latent variables acquired by the acquisition module is logq (Z R ) and logq (Z c Q (Z R ) denotes the variation distribution of the latent variable Z R in the row, and q (Z c ) denotes the variation distribution of the latent variable Z c in the column.

第2の観点の第3の可能な実施例に対する第2の観点の何れかに関し、第2の観点の第4の可能な実施例において、前記第1の決定モジュールは、前記対数尤度の期待値、前記正規化項の期待値、及び前記潜在変数の各々の前記変分分布の対数の期待値に応じて目的関数を決定するように構成されている。   With respect to any of the second aspects to the third possible embodiment of the second aspect, in the fourth possible embodiment of the second aspect, the first decision module expects the log likelihood The objective function is determined according to the value, the expected value of the normalization term, and the expected value of the logarithm of the variation distribution of each of the latent variables.

第2の観点の第4の可能な実施例に関し、第2の観点の第5の可能な実施例において、前記第1の決定モジュールによって決定された前記目的関数

Figure 0005965011
は、
Figure 0005965011
である。 With respect to a fourth possible embodiment of the second aspect, in the fifth possible embodiment of the second aspect, the objective function determined by the first determination module
Figure 0005965011
Is
Figure 0005965011
It is.

第2の観点の第5の可能な実施例に関し、第2の観点の第6の可能な実施例において、前記第2の決定モジュールは、
前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得するように構成された取得ユニットと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて前記目的関数が収束するか否かを判別するように構成された判別ユニットと、
を含み、
前記取得ユニットは、前記目的関数が収束しない場合には前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを取得するまで前記潜在変数の各々の前記変分分布及び前記更新されたモデルパラメータを再取得するように構成されている。
With respect to the fifth possible embodiment of the second aspect, in the sixth possible embodiment of the second aspect, the second determination module comprises:
An acquisition unit configured to acquire an updated variation distribution and updated model parameters of each of the latent variables;
A discriminating unit configured to discriminate whether or not the objective function converges according to the updated variation distribution and the updated model parameter of each of the latent variables;
Including
The acquisition unit is configured to acquire the variation distribution of each of the latent variables and the variation distribution of each of the latent variables until obtaining the variation distribution and model parameters of each of the latent variables that enable convergence of the objective function if the objective function does not converge. The updated model parameter is re-acquired.

第2の観点の第6の可能な実施例に関し、第2の観点の第7の可能な実施例において、前記取得ユニットは、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するまで、下記の式

Figure 0005965011
を使用することによって前記潜在変数の各々の前記変分分布を交互に更新するように構成された第1の更新サブユニットと、
更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
ここで、
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記目的関数の収束を可能にする前記潜在変数の各々の前記更新された変分分布に応じて前記モデルパラメータを更新するように構成された第2の更新サブユニットと、
を含む。 With respect to the sixth possible embodiment of the second aspect, in the seventh possible embodiment of the second aspect, the acquisition unit comprises:
Until obtaining an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
A first update subunit configured to alternately update the variational distribution of each of the latent variables by using
To get the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
A second update subunit configured to update the model parameters in response to the updated variational distribution of each of the latent variables that enables convergence of the objective function by using
including.

第2の観点の第6の可能な実施例に関し、第2の観点の第8の可能な実施例において、前記取得ユニットは、
前記更新されたモデルパラメータを取得するために下記の式

Figure 0005965011
ここで、
Figure 0005965011
を使用することによって前記モデルパラメータを更新するように構成された第3の更新サブユニットと、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記更新されたモデルパラメータに応じて前記潜在変数の各々の前記変分分布を交互に更新するように構成された第4の更新サブユニットと、
を含む。 With respect to the sixth possible embodiment of the second aspect, in the eighth possible embodiment of the second aspect, the acquisition unit comprises:
In order to obtain the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
A third update subunit configured to update the model parameters by using
To obtain an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
A fourth update subunit configured to alternately update the variational distribution of each of the latent variables in response to the updated model parameters by using
including.

第2の観点の第6から8の実施例に関し、第2の観点の第9の可能な実施例において、前記判別ユニットは、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と、前記潜在変数の各々の前回更新された変分分布及び前回更新されたモデルパラメータに応じて決定された前回取得された目的関数と、の間の距離が閾値より短いか否かを比較するように構成された比較サブユニットと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と前記前回取得された目的関数との間の距離が前記閾値より短い場合には前記目的関数が収束すると判別するように構成された判別サブユニットと、
を含む。
With respect to the sixth to eighth embodiments of the second aspect, in the ninth possible embodiment of the second aspect, the discrimination unit comprises:
The objective function determined in response to the updated variation distribution and the updated model parameters of each of the latent variables; the last updated variation distribution and the last updated model of each of the latent variables; A comparison subunit configured to compare whether the distance between the previously obtained objective function determined according to the parameter is shorter than a threshold value;
When the distance between the objective function determined in accordance with the updated variation distribution and the updated model parameter of each of the latent variables and the previously acquired objective function is shorter than the threshold value A discrimination subunit configured to determine that the objective function converges;
including.

本開示の実施形態によって提供される技術的解決方法は下記の利点を有する。   The technical solution provided by the embodiments of the present disclosure has the following advantages.

目的関数は、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、に応じて決定される。また、リレーショナルモデルは、目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じて決定される。このようにして、リレーショナルモデル決定の効率及び精度が改善される。更に、正規化項を使用することによって、モデルの複雑性が自動的に制御されてよい。その結果、モデル決定の効率が改善される。   The objective function includes sample data, a group of at least two sample attributes, a group of at least two latent variables, a log likelihood determined according to model parameters, a normalization term, and a variational distribution of each of the latent variables. Is determined according to the logarithm. The relational model is also determined according to the variational distribution and model parameters of each of the latent variables that enable the objective function to converge. In this way, the efficiency and accuracy of relational model determination is improved. Furthermore, the complexity of the model may be automatically controlled by using normalization terms. As a result, the efficiency of model determination is improved.

本開示の実施形態における技術的解決法をより明確に説明するために、実施形態を記述するために使用される添付の図面は、下記のように簡単に紹介される。明らかに、以下に記載の添付図面は本開示のいくつかの実施形態だけを示し、当業者は創造的な努力なしでこれらの添付図面から更に他の添付図面を導き出してよい。   In order to more clearly describe the technical solutions in the embodiments of the present disclosure, the accompanying drawings used to describe the embodiments are briefly introduced as follows. Apparently, the accompanying drawings described below show only some embodiments of the present disclosure, and those skilled in the art may derive still other attached drawings from these accompanying drawings without creative efforts.

本開示の実施形態1に係るリレーショナルモデル決定用の方法のフローチャートである。3 is a flowchart of a relational model determination method according to the first embodiment of the present disclosure. 本開示の実施形態2に係るリレーショナルモデル決定用の方法のフローチャートである。6 is a flowchart of a relational model determination method according to Embodiment 2 of the present disclosure. 本開示の実施形態3に係るリレーショナルモデル決定用の装置の概略構成図である。It is a schematic block diagram of the apparatus for relational model determination concerning Embodiment 3 of this indication. 本開示の実施形態3に係る第2の決定モジュールの概略構成図である。It is a schematic block diagram of the 2nd determination module which concerns on Embodiment 3 of this indication. 本開示の実施形態3に係る取得ユニットの概略構成図である。It is a schematic block diagram of the acquisition unit which concerns on Embodiment 3 of this indication. 本開示の実施形態3に係る別の取得ユニットの概略構成図である。It is a schematic block diagram of another acquisition unit which concerns on Embodiment 3 of this indication. 本開示の実施形態3に係る判別ユニットの概略構成図である。It is a schematic block diagram of the discrimination | determination unit which concerns on Embodiment 3 of this indication.

本開示の目的、技術的解決方法、及び利点をより明確にするために、本開示の実施形態では、添付図面を参照して以下に詳細に説明する。   In order to make the objectives, technical solutions, and advantages of the present disclosure clearer, the embodiments of the present disclosure are described in detail below with reference to the accompanying drawings.

(実施形態1)
本開示の実施形態は、リレーショナルモデル決定用の方法を提供する。図1を参照すると、方法は下記のステップを備える。
(Embodiment 1)
Embodiments of the present disclosure provide a method for relational model determination. Referring to FIG. 1, the method includes the following steps.

ステップ101:サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、を取得すること。   Step 101: logarithmic likelihood determined according to sample data, group of at least two sample attributes, group of at least two latent variables, and model parameters, normalization term, and variational distribution of each of the latent variables To get the logarithm.

任意の実施形態のように、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度は、

Figure 0005965011
であって、logp()は対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
はサンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性のモデルパラメータを示す。 As in any embodiment, the log likelihood determined as a function of sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters is:
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column shows, Z R indicates a potentially variable matrix row, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], alpha, β is the row / column mixing ratio, φ is the sub-model parameter for each sample category, η is the model parameter for the row sample attribute for each sample category, and ξ is the column sample attribute for each sample category The model parameters of are shown.

任意の実施形態のように、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される正規化項は、

Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は潜在変数の変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性のモデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す。 As in any embodiment, the normalization term determined in response to the sample data, the group of at least two sample attributes, the group of at least two latent variables, and the model parameter is:
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Is an approximation of the variational distribution of latent variables,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β indicates the dimension of β, D pq indicates the dimension of the sub-model parameter in the sample category of the p-th row and q-th column, and η p indicates the model parameter of the sample attribute of the row in the sample category of the p-th row ,
Figure 0005965011
Indicates the dimension of η p , ξ q indicates the model parameter of the column sample attribute in the sample category of column q,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicates.

任意の実施形態のように、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される潜在変数の各々の変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数Zの変分分布を示し、q(Z)は列の潜在変数Zの変分分布を示す。 As in any embodiment, the logarithm of the variational distribution of each of the sample data, the group of at least two sample attributes, the group of at least two latent variables, and the latent variable determined according to the model parameters is logq (Z a R) and logq (Z c), shows the variation distribution of the latent variables Z R of q (Z R) row, q (Z c) shows the variation distribution of the latent variables Z c columns.

ステップ102:対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、に応じて目的関数を決定すること。   Step 102: Determine an objective function according to the log likelihood, the normalization term, and the logarithm of each variational distribution of latent variables.

任意の実施形態のように、対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、に応じて目的関数を決定することは、対数尤度の期待値、正規化項の期待値、及び潜在変数の各々の変分分布の対数の期待値に応じて目的関数を決定することを含む。   As in any embodiment, determining the objective function according to the log likelihood, the normalization term, and the logarithm of each variational distribution of the latent variable is the expected value of the log likelihood, normalization Determining an objective function according to the expected value of the term and the expected value of the logarithm of each variational distribution of the latent variable.

任意の実施形態のように、対数尤度の期待値、正規化項の期待値、及び潜在変数の各々の変分分布の対数の期待値に応じて決定された目的関数

Figure 0005965011
は、
Figure 0005965011
である。 Objective function determined according to the expected value of the log likelihood, the expected value of the normalization term, and the expected value of the logarithm of each variational distribution of latent variables, as in any embodiment
Figure 0005965011
Is
Figure 0005965011
It is.

ステップ103:目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータを決定し、目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じてリレーショナルモデルを決定すること。   Step 103: Determine each variation distribution and model parameter of the latent variable that enables convergence of the objective function, and relational model according to each variation distribution and model parameter of the latent variable that enables convergence of the objective function To decide.

任意の実施形態のように、目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータを決定することは、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することと、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて目的関数が収束するか否かを判別し、目的関数が収束しない場合には目的関数の収束を可能にする潜在変数の各々の変分分布及び更新されたモデルパラメータを取得するまで潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを再取得することと、
を含む。
As in any embodiment, determining the variational distribution and model parameters of each of the latent variables that allow convergence of the objective function
Obtaining an updated variation distribution and updated model parameters for each of the latent variables;
A latent variable that determines whether or not the objective function converges according to each updated variation distribution and updated model parameter of the latent variable, and allows the objective function to converge if the objective function does not converge Reacquiring each updated variation distribution and updated model parameter of the latent variable until each variation distribution and updated model parameter of
including.

任意の実施形態のように、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することは、
目的関数の収束を可能にする潜在変数の各々の更新された変分分布を取得するまで、下記の式

Figure 0005965011
を使用することによって潜在変数の各々の変分分布を交互に更新することと、
更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
ここで、
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって目的関数の収束を可能にする潜在変数の各々の更新された変分分布に応じてモデルパラメータを更新することと、
を含む。 As in any embodiment, obtaining an updated variation distribution and updated model parameters for each of the latent variables
Until we get an updated variational distribution of each of the latent variables that enable the convergence of the objective function:
Figure 0005965011
Alternately updating the variational distribution of each of the latent variables by using
To get the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
Updating the model parameters in response to each updated variational distribution of the latent variables that enables convergence of the objective function by using
including.

任意の実施形態のように、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することは、
更新されたモデルパラメータを取得するために下記の式

Figure 0005965011
ここで、
Figure 0005965011
を使用することによってモデルパラメータを更新することと、
目的関数の収束を可能にする潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって更新されたモデルパラメータに応じて潜在変数の各々の変分分布を交互に更新することと、
を含む。 As in any embodiment, obtaining an updated variation distribution and updated model parameters for each of the latent variables
To get the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
Updating model parameters by using
To obtain an updated variational distribution of each of the latent variables that allow the objective function to converge:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
Alternately updating the variational distribution of each of the latent variables in response to the model parameters updated by using
including.

任意の実施形態のように、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて目的関数が収束するか否かを判別することは、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて決定された目的関数と、潜在変数の各々の前回更新された変分分布及び前回更新されたモデルパラメータに応じて決定された前回取得された目的関数と、の間の距離が閾値より短いか否かを比較することと、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて決定された目的関数と前回取得された目的関数との間の距離が閾値より短い場合には目的関数が収束すると判別することと、
を含む。
As in any embodiment, determining whether the objective function converges according to the updated variational distribution and updated model parameters of each of the latent variables is
Objective function determined according to each updated variation distribution and updated model parameter of latent variable, and determined according to last updated variation distribution and last updated model parameter of each latent variable Comparing whether the distance between the last obtained objective function is less than a threshold value,
It is determined that the objective function converges if the distance between the objective function determined according to each updated variation distribution of the latent variable and the updated model parameter and the objective function acquired last time is shorter than the threshold value. To do
including.

本開示のこの実施形態に応じた方法において、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、に応じて目的関数を決定し、目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じてリレーショナルモデルを決定することによって、リレーショナルモデル決定の効率及び精度は改善される。更に、正規化項の使用によってモデルの複雑性は自動的に制御されてよいので、モデル決定の効率は改善される。   In a method according to this embodiment of the present disclosure, a log likelihood determined as a function of sample data, a group of at least two sample attributes, a group of at least two latent variables, and a model parameter; and a normalization term; By determining the objective function according to the logarithm of each variational distribution of the latent variable and determining the relational model according to each variational distribution of the latent variable and the model parameters that enable convergence of the objective function The efficiency and accuracy of relational model determination is improved. In addition, the efficiency of model determination is improved because the complexity of the model may be automatically controlled through the use of normalization terms.

(実施形態2)
本開示の実施形態は、リレーショナルモデル決定用の方法を提供する。上記方法の実施形態の内容に関し、本開示のこの実施形態に応じた方法は詳細に記述される。図2を参照すると、方法は下記のステップを備える。
(Embodiment 2)
Embodiments of the present disclosure provide a method for relational model determination. With respect to the content of the above method embodiment, the method according to this embodiment of the present disclosure will be described in detail. Referring to FIG. 2, the method includes the following steps.

ステップ201:サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、を取得すること。   Step 201: logarithmic likelihood determined according to sample data, group of at least two sample attributes, group of at least two latent variables, and model parameters, normalization term, and variational distribution of each of the latent variables To get the logarithm.

サンプルデータの内容及び次元は、この実施形態において限定されない。特定の実施例中、サンプルデータは複数の映画ついての複数のユーザによって与えられたスコアであってよい。この場合、サンプルデータの次元は2でよい。つまり、スコアの統計は2次元(例えばユーザと映画)から行われる。それにもかかわらず、上記内容及び次元に加えて、サンプルデータは他の内容及び次元を有していて構わない。   The contents and dimensions of the sample data are not limited in this embodiment. In certain embodiments, the sample data may be scores provided by multiple users for multiple movies. In this case, the dimension of the sample data may be 2. That is, the statistics of scores are performed from two dimensions (for example, a user and a movie). Nevertheless, in addition to the above contents and dimensions, the sample data may have other contents and dimensions.

理解を容易にするために、サンプルデータは例として下記に示すように記述される。サンプルデータは、5×5の行列として表される。行列の行はユーザ1からユーザ5までを示し、一方で行列の列は映画1から映画5を示す。行列の任意の要素Xijはユーザiにより与えられた映画jについてのスコアを示す。なお、1≦i≦5、1≦j≦5、iとjはいずれも整数である。

Figure 0005965011
For ease of understanding, the sample data is described as an example below. Sample data is represented as a 5 × 5 matrix. The rows of the matrix show users 1 through 5 while the columns of the matrix show movies 1 through 5. An optional element X ij of the matrix indicates the score for movie j given by user i. 1 ≦ i ≦ 5, 1 ≦ j ≦ 5, i and j are both integers.
Figure 0005965011

サンプル属性は、これに限定されないが、行のサンプル属性、列のサンプル属性等を含む。サンプル属性の具体的内容はこの実施形態において限定されない。特定の実施例中、サンプル属性はサンプルデータに対応するオブジェクトの属性であってよい。理解を容易にするために、サンプルデータはまだ例として上記に示すように記述される。行のサンプル属性は行のサンプルデータに対応するユーザの属性(例えば、年齢、性別)であってよい。一方、列のサンプル属性は列のサンプルデータに対応する映画の属性(例えば、映画の種類、開始時間)であってよい。サンプル属性に応じて対数尤度、正規化項、及び潜在変数の各々の変分分布の対数を決定することによって、リレーショナル情報をクラスタリング用の非リレーショナル情報に連携させることが達成される。つまり、リレーショナルモデルは、リレーショナル情報及び非リレーショナル情報に応じて決定される。   Sample attributes include, but are not limited to, row sample attributes, column sample attributes, and the like. The specific content of the sample attribute is not limited in this embodiment. In certain embodiments, the sample attribute may be an attribute of an object corresponding to the sample data. For ease of understanding, the sample data is still described as shown above by way of example. The row sample attribute may be a user attribute (eg, age, gender) corresponding to the row sample data. On the other hand, the column sample attribute may be a movie attribute (eg, movie type, start time) corresponding to the column sample data. Linking relational information to non-relational information for clustering is accomplished by determining the logarithmic likelihood, normalization term, and logarithm of each variational distribution of latent variables according to sample attributes. That is, the relational model is determined according to relational information and non-relational information.

潜在変数は、これに限定されないが、行の潜在変数、列の潜在変数等を含む。潜在変数の具体的内容はこの実施形態において限定されない。特定の実施例中、潜在変数は、潜在変数行列Zであってよい。なお、行列において任意の要素Zipは、第i行のサンプルデータが第p行のサンプルカテゴリに従属することを示す。 Latent variables include, but are not limited to, row latent variables, column latent variables, and the like. The specific content of the latent variable is not limited in this embodiment. In certain embodiments, the latent variable may be a latent variable matrix Z. Note that an arbitrary element Z ip in the matrix indicates that the i-th row sample data is subordinate to the p-th row sample category.

モデルパラメータは、これに限定されないが、行の混合比、列の混合比、各サンプルカテゴリにおけるサブモデルパラメータ等を含む。モデルパラメータの具体的内容はこの実施形態において限定されない。行列形式のサンプルデータを例に取ると、行の混合比は、決定されたリレーショナルモデルにおける行列の行の総数に対する決定されたリレーショナルモデルの各サンプルカテゴリにおける行列の行の数の比である。列の混合比は、決定されたリレーショナルモデルにおける行列の列の総数に対する決定されたリレーショナルモデルの各サンプルカテゴリにおける行列の列の数の比である。また、各サンプルカテゴリにおけるサブモデルパラメータは、決定されたリレーショナルモデルの各サンプルカテゴリにおけるデータ分布のパラメータである。   Model parameters include, but are not limited to, row mix ratio, column mix ratio, sub-model parameters in each sample category, and the like. The specific contents of the model parameters are not limited in this embodiment. Taking sample data in matrix form as an example, the row mixing ratio is the ratio of the number of matrix rows in each sample category of the determined relational model to the total number of rows of the matrix in the determined relational model. The column mixing ratio is the ratio of the number of matrix columns in each sample category of the determined relational model to the total number of matrix columns in the determined relational model. The sub model parameters in each sample category are data distribution parameters in each sample category of the determined relational model.

潜在変数は、モデルパラメータから独立又はモデルパラメータに依存していてよいことに留意すべきである。実際には潜在変数とモデルパラメータとの間に依存性が存在するので、決定されたリレーショナルモデルをより正確にするために、本開示の実施形態は、潜在変数とモデルパラメータとの間に依存性が存在するシナリオを例として取ることによって記述される。   It should be noted that the latent variable may be independent of or dependent on the model parameters. In practice, there is a dependency between the latent variable and the model parameter, so in order to make the determined relational model more accurate, embodiments of the present disclosure provide a dependency between the latent variable and the model parameter. Is described by taking as an example a scenario.

この実施形態に応じた方法において、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、を取得するために、最初に下記に示す同時確率密度関数(joint probability density distribution)が演繹される。

Figure 0005965011
ここで、pは同時確率密度関数を示し、
Figure 0005965011
はサンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、モデルパラメータはα、β、φ、η及びξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性のモデルパラメータを示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、Xijは第i行第j列のサンプルデータを示し、φpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータを示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αは第p行のサンプルカテゴリの行の混合比を示し、βは第p列のサンプルカテゴリの列の混合比を示し、
Figure 0005965011
は第i行の行のサンプル属性を示し、
Figure 0005965011
は第j列の列のサンプル属性を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性のモデルパラメータを示す。 In a method according to this embodiment, a log likelihood determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters, a normalization term, and a latent variable To obtain the logarithm of each variational distribution, the joint probability density function shown below is first deduced.
Figure 0005965011
Where p is the joint probability density function,
Figure 0005965011
Represents sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column shows, Z R indicates a potentially variable matrix row, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include the alpha, beta, phi, eta and xi], alpha, β is the row / column mixing ratio, φ is the sub-model parameter for each sample category, η is the model parameter for the row sample attribute for each sample category, and ξ is the column sample attribute for each sample category Model parameters, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column, X ij indicates the sample data in the i-th row and j-th column, and φ pq Indicates the sub-model parameters in the sample category of the p-th row and the q-th column,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates a latent variable in the column for describing the membership of the sample data in the j-th column with respect to the sample category in the q-th column, α p indicates the mixing ratio of the rows in the sample category in the p-th row, and β p indicates the p-th Indicates the mixing ratio of the columns in the column sample category,
Figure 0005965011
Indicates the sample attribute of the row i,
Figure 0005965011
Indicates the sample attribute of the column in the j-th column, η p indicates the model parameter of the sample attribute of the row in the sample category of the p-th row, and ξ p indicates the model parameter of the sample attribute of the column in the sample category of the q-th column. Show.

上記同時確率密度関数は、リレーショナルモデルの確率密度分布を決定する。リレーショナルモデルの確率密度分布は、同時確率密度関数における潜在変数Z及びZと同様にモデルパラメータα、β、φ、η及びξを決定することによって決定されてよい。また、リレーショナルモデルはこのように決定される。同時確率密度関数を解けるようにするにあたり、下記の確率密度分布の等式の両辺の対数は、対数尤度を取得するために計算される。

Figure 0005965011
The joint probability density function determines the probability density distribution of the relational model. The probability density distribution of the relational model may be determined by determining the model parameters α, β, φ, η, and ξ as well as the latent variables Z R and Z c in the joint probability density function. The relational model is determined in this way. In order to be able to solve the joint probability density function, the logarithm of both sides of the following probability density distribution equation is calculated to obtain the log likelihood.
Figure 0005965011

任意の実施形態のように、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度は、

Figure 0005965011
であって、logp()は対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
はサンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性のモデルパラメータを示す。 As in any embodiment, the log likelihood determined as a function of sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters is:
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column shows, Z R indicates a potentially variable matrix row, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], alpha, β is the row / column mixing ratio, φ is the sub-model parameter for each sample category, η is the model parameter for the row sample attribute for each sample category, and ξ is the column sample attribute for each sample category The model parameters of are shown.

特に、サンプルデータ

Figure 0005965011
が行列形式で表される場合には、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、uは行のサンプル属性の次元を示し、vは列のサンプル属性の次元を示し、AはN*uの行列を示し、AはN*vの行列を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示す。ZはN*Kのブロック変数行列である。Zの各要素は
Figure 0005965011
である。
Figure 0005965011
の場合、それは第i行のサンプルデータが第p行のサンプルカテゴリに属することを示す。ZはN*Kのブロック変数行列である。Zの各要素は
Figure 0005965011
である。
Figure 0005965011
の場合、それは第j列のサンプルデータが第q列のサンプルカテゴリに属することを示す。行の混合比αは、サンプルデータ行列の行の総数に対するリレーショナルデータモデルの各サンプルカテゴリにおける行の数の比を示す。列の混合比βは、サンプルデータ行列の列の総数に対するリレーショナルデータモデルの各サンプルカテゴリにおける列の数の比を示す。各サブモデルにおけるモデルパラメータφは、リレーショナルモデルにおける各サンプルカテゴリのサンプルデータがサンプルカテゴリにおいて従う分布のパラメータを示す。例えば、各サンプルカテゴリにおけるサンプルデータがガウス分布に従う場合、φはガウス分布における期待値μ及び分散δを示す。他の例として、各サンプルカテゴリのサンプルデータがポアソン分布に従う場合、φは、ポアソン分布における期待値及び分散λを示す。ここで、各サンプルカテゴリにおけるサンプルデータは上記の分布以外の他の分布に従っていてよく、この実施形態において分布は限定されないことに留意すべきである。各サンプルカテゴリにおける行のサンプル属性のモデルパラメータηは各サンプルカテゴリにおけるサンプルに対応する行のオブジェクトの属性を示し、各サンプルカテゴリにおける列のサンプル属性のモデルパラメータξは各サンプルカテゴリにおけるサンプルに対応する列のオブジェクトの属性を示す。 In particular, sample data
Figure 0005965011
Is expressed in matrix form, N r indicates the number of samples in the row, N c indicates the number of samples in the column, u indicates the dimension of the sample attribute in the row, and v indicates the sample attribute in the column A R represents a matrix of N r * u, A C represents a matrix of N c * v, K r represents the number of sample categories in a row, and K c represents the number of sample categories in a column Indicates. Z R is a block variable matrix of N r * K r . Each element of the Z R is
Figure 0005965011
It is.
Figure 0005965011
, It indicates that the sample data in the i-th row belongs to the sample category in the p-th row. Z c is a block variable matrix of N c * K c . Each element of the Z c is
Figure 0005965011
It is.
Figure 0005965011
In the case of, it indicates that the sample data in the j-th column belongs to the sample category in the q-th column. The row mixing ratio α indicates the ratio of the number of rows in each sample category of the relational data model to the total number of rows in the sample data matrix. The column mixing ratio β indicates the ratio of the number of columns in each sample category of the relational data model to the total number of columns in the sample data matrix. The model parameter φ in each sub model indicates a distribution parameter that the sample data of each sample category in the relational model follows in the sample category. For example, when sample data in each sample category follows a Gaussian distribution, φ indicates an expected value μ and a variance δ in the Gaussian distribution. As another example, when sample data of each sample category follows a Poisson distribution, φ indicates an expected value and a variance λ in the Poisson distribution. Here, it should be noted that the sample data in each sample category may follow a distribution other than the above distribution, and the distribution is not limited in this embodiment. The model parameter η of the sample attribute of the row in each sample category indicates the attribute of the object of the row corresponding to the sample in each sample category, and the model parameter ξ of the sample attribute of the column in each sample category corresponds to the sample in each sample category Indicates the object attribute of the column.

任意の実施形態のように、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される正規化項は、

Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は潜在変数の変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性のモデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す。従って、正規化項は下記のように拡張されてよい。
Figure 0005965011
As in any embodiment, the normalization term determined in response to the sample data, the group of at least two sample attributes, the group of at least two latent variables, and the model parameter is:
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Is an approximation of the variational distribution of latent variables,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β indicates the dimension of β, D pq indicates the dimension of the sub-model parameter in the sample category of the p-th row and q-th column, and η p indicates the model parameter of the sample attribute of the row in the sample category of the p-th row ,
Figure 0005965011
Indicates the dimension of η p , ξ q indicates the model parameter of the column sample attribute in the sample category of column q,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicates. Thus, the normalization term may be extended as follows:
Figure 0005965011

特に、Kがブロック変数行列Zの行のサンプルカテゴリの数を示す場合には、Dα=D(α)=K−1である。Kがブロック変数行列Zの列のサンプルカテゴリの数を示す場合には、Dβ=D(β)=K−1である。各サンプルカテゴリにおけるサンプルデータがガウス分布に従い、ガウス分布の期待値と分散がそれぞれμとδ、即ち、ガウス分布が2つのパラメータを有する場合には、Dkl=D(φkl)=2である。各サンプルカテゴリにおけるサンプルデータがポアソン分布に従い、ポアソン分布の期待値と分散がいずれもλ、即ち、ポアソン分布が1つのパラメータλを有する場合には、Dkl=D(φkl)=1である。 In particular, when K r indicates the number of sample categories in the row of the block variable matrix Z R , D α = D (α) = K r −1. When K c indicates the number of sample categories in the column of the block variable matrix Z R , D β = D (β) = K c −1. If the sample data in each sample category follows a Gaussian distribution and the expected value and variance of the Gaussian distribution are μ and δ, that is, if the Gaussian distribution has two parameters, D kl = D (φ kl ) = 2. . If the sample data in each sample category follows a Poisson distribution and the expected value and variance of the Poisson distribution are both λ, ie, the Poisson distribution has one parameter λ, then D kl = D (φ kl ) = 1. .

更に、潜在変数の変分分布の近似値

Figure 0005965011
は、この実施形態において具体的に限定されず、前回更新された潜在変数又は初期設定から取得された更新された潜在変数の変分分布の値を含むがこれに限定されない。理解を容易にするために、この実施形態では、例として、前回更新された潜在変数又は潜在変数の変分分布の近似値
Figure 0005965011
である初期設定から取得された更新された潜在変数、の変分分布の値を採用することによって説明する。正規化項を初めて決定する場合、潜在変数の変数分布の近似値は、初期設定から取得された更新された潜在変数の変数分布の値であってよい。正規化項を決定することが初めてではない場合、潜在変数の変数分布の近似値は、前回更新された潜在変数の変分分布の値であってよい。 Furthermore, the approximate value of the variation distribution of the latent variable
Figure 0005965011
Is not specifically limited in this embodiment, and includes, but is not limited to, the previously updated latent variable or the value of the variation distribution of the updated latent variable obtained from the initial setting. In order to facilitate understanding, in this embodiment, as an example, the last updated latent variable or the approximate value of the variation distribution of the latent variable is used.
Figure 0005965011
This will be explained by adopting the variation distribution value of the updated latent variable acquired from the initial setting. When the normalization term is determined for the first time, the approximate value of the variable distribution of the latent variable may be the updated value of the variable distribution of the latent variable obtained from the initial setting. If it is not the first time to determine the normalization term, the approximate value of the variable distribution of the latent variable may be the value of the variational distribution of the latent variable updated last time.

ここで、正規化項を決定することによって、決定されたリレーショナルモデルの複雑性が自動的に制御されてよいし、リレーショナルモデルを決定することの効率が改善されることに留意すべきである。   It should be noted here that by determining the normalization term, the complexity of the determined relational model may be automatically controlled and the efficiency of determining the relational model is improved.

任意の実施形態のように、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される潜在変数の各々の変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数Zの変分分布を示し、q(Z)は列の潜在変数Zの変分分布を示す。 As in any embodiment, the logarithm of the variational distribution of each of the sample data, the group of at least two sample attributes, the group of at least two latent variables, and the latent variable determined according to the model parameters is logq (Z a R) and logq (Z c), shows the variation distribution of the latent variables Z R of q (Z R) row, q (Z c) shows the variation distribution of the latent variables Z c columns.

特に、Zの潜在変数の変分分布は下記のように表現されてよい。

Figure 0005965011
In particular, variation distribution of the latent variables Z R may be expressed as follows.
Figure 0005965011

の潜在変数の変分分布は下記のように表現されてよい。

Figure 0005965011
Variational distribution of the latent variables Z c may be expressed as follows.
Figure 0005965011

ステップ202:対数尤度の期待値、正規化項の期待値、及び潜在変数の各々の変分分布の対数の期待値に応じて目的関数を決定すること。   Step 202: Determine an objective function according to the expected value of the log likelihood, the expected value of the normalization term, and the expected value of the logarithm of each variation distribution of the latent variable.

対数尤度は、ステップ201において因子化された表現として記載されている。対数尤度を解けるようにするにあたり、下記に示す因子化情報量基準(Factorized Information Criterion)(FIC)を一例とするタイトな下界(tight lower bound)を取得するために、各因子にラプラス近似が行われる。

Figure 0005965011
ここで、
Figure 0005965011
FICが最大の場合、
Figure 0005965011
はθの値を示す。 The log likelihood is described as a factorized expression in step 201. In order to solve the log likelihood, Laplace approximation is applied to each factor in order to obtain a tight lower bound (Factorized Information Criterion) (FIC) as an example. Done.
Figure 0005965011
here,
Figure 0005965011
If FIC is the largest,
Figure 0005965011
Indicates the value of θ.

更に、FICがサンプルデータ

Figure 0005965011
と潜在変数Z及びZとを含むため、解答は、通常、期待値最大化(EM)アルゴリズムを介して行われる。しかしながら、リレーショナルモデルは、従属潜在変数によって決定されるので、従来のEMアルゴリズムは、FICの解法に適用できない。FICを解けるようにするにあたり、この実施形態は、FICの漸近的に一様な下界を取得するために、下記に示すスケーリングFICの方法を採用する。
Figure 0005965011
ここで、
Figure 0005965011
関数はL(a,b)=logb+(a−b)/bである。 In addition, FIC has sample data
Figure 0005965011
And the latent variables Z R and Z c , the answer is usually done via an Expectation Maximization (EM) algorithm. However, since the relational model is determined by the dependent latent variables, the conventional EM algorithm cannot be applied to the FIC solution. In order to be able to solve the FIC, this embodiment employs the scaling FIC method described below to obtain an asymptotically uniform lower bound of the FIC.
Figure 0005965011
here,
Figure 0005965011
The function is L (a, b) = logb + (ab) / b.

任意の実施形態のように、対数尤度の期待値、正規化項の期待値、及び潜在変数の各々の変分分布の対数の期待値に応じて決定された目的関数

Figure 0005965011
は、
Figure 0005965011
である。 Objective function determined according to the expected value of the log likelihood, the expected value of the normalization term, and the expected value of the logarithm of each variational distribution of latent variables, as in any embodiment
Figure 0005965011
Is
Figure 0005965011
It is.

更に、目的関数は、上記ステップによって決定される。目的関数を介してリレーショナル関数を決定するために、この実施形態に応じた方法は下記に示す後続のステップを更に含む。   Furthermore, the objective function is determined by the above steps. In order to determine the relational function via the objective function, the method according to this embodiment further includes the following steps shown below.

ステップ203:潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得すること。   Step 203: Obtain an updated variation distribution and updated model parameters for each of the latent variables.

任意の実施形態のように、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することは、
目的関数の収束を可能にする潜在変数の各々の更新された変分分布を取得するまで、下記の式

Figure 0005965011
を使用することによって潜在変数の各々の変分分布を交互に更新することと、
更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって目的関数の収束を可能にする潜在変数の各々の更新された変分分布に応じてモデルパラメータを更新することと、
を含む。 As in any embodiment, obtaining an updated variation distribution and updated model parameters for each of the latent variables
Until we get an updated variational distribution of each of the latent variables that enable the convergence of the objective function:
Figure 0005965011
Alternately updating the variational distribution of each of the latent variables by using
To get the updated model parameters:
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
Updating the model parameters in response to each updated variational distribution of the latent variables that enables convergence of the objective function by using
including.

初期設定の方法は、この実施形態に限定されない。特定の実施例において、初期設定は、確率論的な方法によって行われてよい。即ち、α、β、φ、η及びξの値は、確率論的に初期設定される。しかし、上記の方法に加えて、他の方法も可能である。   The initial setting method is not limited to this embodiment. In certain embodiments, initialization may be done by a probabilistic method. That is, the values of α, β, φ, η, and ξ are initialized stochastically. However, in addition to the above methods, other methods are possible.

更に、現在の潜在変数Zの変分分布が計算されるときに前回の潜在変数Zの変分分布が使用されるように、目的関数の収束を可能にする潜在変数の各々の更新された変分分布が取得されるまで、潜在変数の各々の変分分布を交互に更新すること、即ち、潜在変数Zの変分分布と潜在変数Zの変分分布とを交互に更新することが必要とされる。潜在変数の各々の変分分布を収束する条件は、この実施形態において限定されない。特定の実施例において、行の潜在変数Zについて、行の潜在変数の現在の変分分布と行の潜在変数の前回の変分分布との間のユークリッド距離が計算されてもよい。計算されたユークリッド距離が距離の閾値より短い場合には、行の潜在変数の現在の変分分布が収束していると判別される。距離の閾値の値は、実際の状態に応じて設定されてよいが、この実施形態において限定されない。 Further, variation distribution of the previous latent variable Z c is to be used, updated for each latent variable to allow the convergence of the objective function when the variation distribution of the current latent variable Z R is calculated was to variational distribution is obtained, updating the variational distribution of each latent variable alternately, i.e., updates the variation distribution of the latent variables Z R variational distribution of the latent variable Z c alternately Is needed. The condition for converging each variation distribution of the latent variable is not limited in this embodiment. In certain embodiments, the latent variable Z R of the line, the Euclidean distance between the previous variation distribution of current variation distribution and line latent variables latent variables line may be calculated. If the calculated Euclidean distance is shorter than the distance threshold, it is determined that the current variation distribution of the latent variable in the row has converged. The distance threshold value may be set according to the actual state, but is not limited in this embodiment.

それにもかかわらず、潜在変数の各々の更新された変分分布が収束しているか否かを判別する方法に加え、更新回数を設定する方法において潜在変数の各々の収束された変分分布が取得されてもよい。この方法において、特定の実施例中、更新回数が更新回数の閾値に達した場合には、潜在変数の各々の変分分布が収束すると判別され、目的関数の収束を可能にする潜在変数の各々の更新された変分分布が取得される。更新回数の閾値の設定は、この実施形態において限定されない。   Nevertheless, in addition to the method of determining whether each updated variation distribution of the latent variable has converged, the method of setting the number of updates obtains each converged variation distribution of the latent variable. May be. In this method, in a specific embodiment, when the update count reaches the update count threshold, it is determined that each variation distribution of the latent variable converges, and each of the latent variables that enable convergence of the objective function The updated variational distribution of is obtained. The setting of the threshold value for the number of updates is not limited in this embodiment.

任意の実施形態のように、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得する上記方法に加え、この実施形態において提供される方法は(潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得する下記の方法に限定されないが)、
更新されたモデルパラメータを取得するために下記の式

Figure 0005965011
を使用することによってモデルパラメータを取得することと、
目的関数の収束を可能にする潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって更新されたモデルパラメータに応じて潜在変数の各々の変分分布を交互に更新することと、
を更に含む。 In addition to the above method of obtaining an updated variational distribution and updated model parameters for each of the latent variables, as in any embodiment, the method provided in this embodiment is (updated for each of the latent variables. But not limited to the following methods of obtaining the variation distribution and updated model parameters),
To get the updated model parameters:
Figure 0005965011
Obtaining model parameters by using
To obtain an updated variational distribution of each of the latent variables that allow the objective function to converge:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
Alternately updating the variational distribution of each of the latent variables in response to the model parameters updated by using
Is further included.

ステップ203において上記の式を使用することにより潜在変数の各々の更新された変分分布及び更新されたモデルパラメータが初めて取得された場合、t−1が初期設定を示すので、t−1に対応するパラメータは初期値である。例えば、ステップ203において潜在変数の各々の更新された変分分布及び更新されたモデルパラメータが初めて取得された場合、上記の式における

Figure 0005965011
はαの初期値を示し、
Figure 0005965011
はβの初期値を示す。なお、初期設定の方法はこの実施形態において限定されない。特定の実施例において、確率論的な初期設定の方法は、q(Z)及びq(Z)を初期化するために使用されてよい。それにもかかわらず、確率論的な初期設定の方法に加え、他の方法も可能であってよい。 When the updated variation distribution and updated model parameters of each of the latent variables are obtained for the first time by using the above formula in step 203, t-1 represents the initial setting and corresponds to t-1. The parameters to be set are initial values. For example, if the updated variation distribution and updated model parameters of each of the latent variables are obtained for the first time in step 203,
Figure 0005965011
Indicates the initial value of α p ,
Figure 0005965011
Denotes the initial value of beta q. The initial setting method is not limited in this embodiment. In certain embodiments, a stochastic initialization method may be used to initialize q (Z R ) and q (Z C ). Nevertheless, in addition to the stochastic initialization method, other methods may be possible.

ステップ203において上記の式を使用することにより潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することが初めてではない場合、t−1は前回の更新を示すので、t−1に対応するパラメータは前回更新された値である。例えば、ステップ203において潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを3回取得した場合、上記の式における

Figure 0005965011
は潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを2回取得した場合に取得されたαの値を示し、
Figure 0005965011
は潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを2回取得した場合に取得されたβの値を示す。 If it is not the first time to obtain each updated variation distribution and updated model parameter of the latent variable by using the above equation in step 203, t-1 indicates the previous update, so t The parameter corresponding to -1 is the value updated last time. For example, if the updated variation distribution and updated model parameters of each latent variable are obtained three times in step 203,
Figure 0005965011
Indicates the updated variation distribution of each latent variable and the value of α p obtained when the updated model parameter is acquired twice,
Figure 0005965011
Indicates the updated variation distribution of each latent variable and the value of β q acquired when the updated model parameter is acquired twice.

更に、潜在変数の各々の変分分布が更新されたモデルパラメータに応じて更新された場合、目的関数の収束を可能にする潜在変数の各々の更新された変分分布が取得されるまで、潜在変数Zの変分分布と潜在変数Zの変分分布とを交互に更新することも必要とされる。 Furthermore, if each variation distribution of the latent variable is updated in response to the updated model parameters, the latent variation is acquired until each updated variation distribution of the latent variable that allows convergence of the objective function is obtained. It is also a need to update the variation distribution of the variational distribution and latent variables Z c of the variable Z R alternately.

加えて、特定の実施例において、行のサンプル成分の異なる数K及び列のサンプル成分の異なる数Kが設定されてよい。例えば、Kの最小値がKrminとして設定され、一方でKの最大値がKrmaxとして設定される。また、Kの最小値がKcminとして設定され、一方でKの最大値がKcmaxとして設定される。KとKの範囲内で、KとKの各値の組み合わせについて、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータが取得される。 In addition, in certain embodiments, a different number K r of sample components in a row and a different number K c of sample components in a column may be set. For example, the minimum value of K r is set as K rmin, whereas the maximum value of K r is set as K rmax at. The minimum value of K c is set as K cmin, whereas the maximum value of K c is set as K cmax with. Within the K r and K c, for each combination of values of K r and K c, each variation distribution and the updated model parameters are updated in the latent variable is obtained.

潜在変数の各々の更新された変分分布及び更新されたモデルパラメータの取得時において、目的関数の収束を可能にする潜在変数の各々の更新された変分分布が取得されるまで、潜在変数の各々の変分分布が最初に交互に更新されてよいこと、及び、更新されたモデルパラメータを取得するために、モデルパラメータが潜在変数の各々の更新された変分分布に応じて更新されることに留意すべきである。又は、更新されたモデルパラメータを取得するためにモデルパラメータが最初に更新されてよいこと、及び、目的関数の収束を可能にする潜在変数の各々の更新された変分分布を取得するために、潜在変数の各々の変分分布が更新されたモデルパラメータに応じて交互に更新されることに留意すべきである。つまり、潜在変数の各々の変分分布とモデルパラメータの更新順序はこの実施形態において限定されない。   At the time of obtaining each updated variation distribution and updated model parameter of the latent variable, until each updated variation distribution of the latent variable that enables convergence of the objective function is obtained, Each variation distribution may be updated alternately first and the model parameters are updated according to each updated variation distribution of the latent variables to obtain updated model parameters Should be noted. Or, to obtain updated model parameters, the model parameters may be updated first, and to obtain an updated variational distribution of each of the latent variables that enable convergence of the objective function, It should be noted that the variation distribution of each of the latent variables is updated alternately according to the updated model parameters. That is, the variation distribution of each latent variable and the update order of model parameters are not limited in this embodiment.

ステップ204:潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて目的関数が収束するか否かを判別し、目的関数が収束しない場合には目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータを取得するまで潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを再取得すること。   Step 204: It is determined whether or not the objective function converges according to each updated variation distribution of the latent variables and the updated model parameters. If the objective function does not converge, the objective function can be converged. Reacquiring each updated variation distribution and updated model parameter of the latent variable until each variation distribution and model parameter of the latent variable is acquired.

特に、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて目的関数が収束するか否かを判別することは、これに限定されないが、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて決定された目的関数と、潜在変数の各々の前回更新された変分分布及び前回更新されたモデルパラメータに応じて決定された前回取得された目的関数と、の間の距離が閾値より短いか否かを比較することと、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて決定された目的関数と前回取得された目的関数との間の距離が閾値より短い場合には目的関数が収束すると判別することと、
を含む。
In particular, it is not limited to determining whether the objective function converges according to each updated variation distribution of the latent variables and the updated model parameters,
Objective function determined according to each updated variation distribution and updated model parameter of latent variable, and determined according to last updated variation distribution and last updated model parameter of each latent variable Comparing whether the distance between the last obtained objective function is less than a threshold value,
It is determined that the objective function converges if the distance between the objective function determined according to each updated variation distribution of the latent variable and the updated model parameter and the objective function acquired last time is shorter than the threshold value. To do
including.

閾値の大きさはこの実施形態において限定されない。特定の実施例では、異なる閾値は、サンプルデータの容量に応じて設定されて構わない。目的関数は潜在変数の各々の更新された変分分布及び更新されたモデルパラメータによって決定されるので、目的関数は対数尤度に連続的に近似されてよい。目的関数が収束する場合、対数尤度の値は目的関数の値に近似されるので、解けない対数尤度は解ける対数尤度に変換されてよく、リレーショナルモデルの決定はこのように実現される。   The magnitude of the threshold is not limited in this embodiment. In a specific embodiment, different threshold values may be set according to the volume of sample data. Since the objective function is determined by each updated variation distribution of latent variables and the updated model parameters, the objective function may be continuously approximated to log likelihood. When the objective function converges, the log-likelihood value is approximated to the objective function value, so the log likelihood that cannot be solved may be converted into the log likelihood that can be solved, and the determination of the relational model is realized in this way .

目的関数が収束しないと判別された場合、及び潜在変数の各々の更新された変分分布及び更新されたモデルパラメータが再取得される場合、処理はステップ203に戻り、ステップ203に記述された方法において潜在変数の各々の更新された変分分布及び更新されたモデルパラメータが再取得される。潜在変数の更新された変分分布及び更新されたモデルパラメータが初めて取得された場合、ステップ203の式においてt−1は初期値を示す。しかしながら、潜在変数の更新された変分分布及び更新されたモデルパラメータを再取得するためにステップ203に戻った場合、ステップ203の式においてt−1は前回の更新を示す。例えば、ステップ203の式を使用することにより潜在変数の更新された変分分布及び更新されたモデルパラメータが初めて取得された場合、上記の式におけるt−1に対応するパラメータは初期値であり、初めて取得された潜在変数の更新された変分分布及び更新されたモデルパラメータが取得される。初めて取得された潜在変数の更新された変分分布及び更新されたモデルパラメータが目的関数を収束させられない場合、初めて取得された潜在変数の更新された変分分布及び更新されたモデルパラメータは、ステップ203においてt−1に対応するパラメータの値として使用される。それから、潜在変数の更新された変分分布及び更新されたモデルパラメータが再取得され、再取得された潜在変数の更新された変分分布及び更新されたモデルパラメータが目的関数を収束させられるか否かが判断される。更新は、収束を可能にする潜在変数の各々の変分分布及びモデルパラメータが取得されるまでこのような方法で繰り返される。   If it is determined that the objective function does not converge, and if the updated variational distribution and updated model parameters of each of the latent variables are reacquired, the process returns to step 203 and the method described in step 203 At which the updated variational distribution and updated model parameters of each of the latent variables are reacquired. When the updated variation distribution of the latent variable and the updated model parameter are acquired for the first time, t−1 indicates an initial value in the expression of Step 203. However, when returning to step 203 to reacquire the updated variation distribution of latent variables and the updated model parameters, t-1 in the equation of step 203 indicates the previous update. For example, when the updated variation distribution of latent variables and the updated model parameter are obtained for the first time by using the equation of step 203, the parameter corresponding to t-1 in the above equation is an initial value, The updated variation distribution of the latent variable acquired for the first time and the updated model parameter are acquired. If the updated variation distribution and updated model parameter of the latent variable acquired for the first time cannot converge the objective function, the updated variation distribution and updated model parameter of the latent variable acquired for the first time are In step 203, it is used as a parameter value corresponding to t-1. Then, the updated variation distribution of the latent variable and the updated model parameter are reacquired, and whether the updated variation distribution and the updated model parameter of the reacquired latent variable can converge the objective function. Is judged. The update is repeated in this manner until the variational distribution and model parameters of each of the latent variables that allow convergence are obtained.

ステップ205:目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じてリレーショナルモデルを決定すること。   Step 205: Determine a relational model according to the variational distribution and model parameters of each of the latent variables that enable convergence of the objective function.

このステップにおいて、収束時の目的関数の値が対数尤度に近似すると、目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じてリレーショナルモデルが決定されてよい。   In this step, when the value of the objective function at the time of convergence approximates the logarithmic likelihood, a relational model may be determined according to each variation distribution and model parameter of the latent variable that enables the objective function to converge.

更に、行のサンプルカテゴリの異なる数K及び列のサンプルカテゴリの異なる数Kが設定されてよい。また、KとKの各値の組み合わせについて、潜在変数の各々の更新された変分分布及び更新されたモデルパラメータが取得されると、目的関数の最大値を可能にするKとKは、目的関数の収束を可能にすることに基づいて選択されてよい。更に、リレーショナルモデルは、KとKの使用により計算された潜在変数の各々の変分分布及びモデルパラメータに応じて決定される。 Furthermore, the number K c of different sample categories number K r and column different sample categories of lines may be set. Also, K combinations of values of r and K c, as each updated variational distribution and updated model parameters of latent variables are acquired, K r and K that enables the maximum value of the objective function c may be selected based on enabling convergence of the objective function. Furthermore, the relational model is determined according to the variational distribution and the model parameters for each of the calculated latent variables by use of the K r and K c.

行のサンプルカテゴリの値K及び列のサンプルカテゴリの値Kは、決定されたリレーショナルモデルにおける行のサンプルカテゴリの値及び列のサンプルカテゴリの値と同じであってもよいし、異なっていてもよいことに留意すべきである。つまり、リレーショナルモデルの構造は、リレーショナルモデルを決定する処理の間に自動的に調整されてよい。 The row sample category value K r and the column sample category value K c may be the same as or different from the row sample category value and the column sample category value in the determined relational model. It should be noted that That is, the structure of the relational model may be automatically adjusted during the process of determining the relational model.

決定されたリレーショナルモデルは、データのクラスタリング及びデータのカテゴライゼーションに適用されてよい。決定されたリレーショナルモデルがデータのクラスタリングに適用された場合、リレーショナルモデルを決定する処理はクラスタリングデータの処理である。決定されたリレーショナルモデルがデータのカテゴライゼーションに適用された場合、リレーショナルモデルを決定するために更なる処理を行うことも必要とされる。データクラスタリング及びカテゴライゼーションの結果は顧客分析、生物分析、土地分析(geoanalysis)等に対して使用されてよいので、多くの社会的価値及び経済的価値が発生する。   The determined relational model may be applied to data clustering and data categorization. When the determined relational model is applied to data clustering, the process of determining the relational model is a process of clustering data. If the determined relational model is applied to data categorization, further processing is also required to determine the relational model. Since the results of data clustering and categorization may be used for customer analysis, biological analysis, geoanalysis, etc., many social and economic values are generated.

本開示のこの実施形態に応じた方法において、目的関数は、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、に応じて決定される。また、リレーショナルモデルは、目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じて決定される。この方法において、リレーショナルモデル決定の効率及び精度は改善される。更に、正規化項を使用することによってモデルの複雑性は自動的に制御されてよいので、モデル決定の効率は改善される。   In the method according to this embodiment of the present disclosure, the objective function includes: log data determined according to sample data, at least two sample attribute groups, at least two latent variable groups, and model parameters; And the logarithm of each variational distribution of the latent variable. The relational model is also determined according to the variational distribution and model parameters of each of the latent variables that enable the objective function to converge. In this way, the efficiency and accuracy of relational model determination is improved. Furthermore, the efficiency of model determination is improved because the complexity of the model may be automatically controlled by using the normalization term.

(実施形態3)
本開示の実施形態は、リレーショナルモデル決定用の装置を提供する。図3を参照すると、装置は、
サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、を取得するように構成された取得モジュール301と、
対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、に応じて目的関数を決定するように構成された第1の決定モジュール302と、
目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータを決定するように構成された第2の決定モジュール303と、
目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じてリレーショナルモデルを決定するように構成された第3の決定モジュール304と、
を備える。
(Embodiment 3)
Embodiments of the present disclosure provide an apparatus for relational model determination. Referring to FIG. 3, the device
Logarithmic likelihood determined according to sample data, at least two sample attribute groups, at least two latent variable groups, and model parameters, a normalization term, and a logarithm of each variational distribution of latent variables; An acquisition module 301 configured to acquire
A first determination module 302 configured to determine an objective function as a function of log likelihood, normalization term, and logarithm of each variational distribution of latent variables;
A second determination module 303 configured to determine variation distributions and model parameters of each of the latent variables that enable convergence of the objective function;
A third determination module 304 configured to determine a relational model as a function of each variational distribution of latent variables and model parameters that enable convergence of the objective function;
Is provided.

任意の実施形態のように、取得モジュール301によって取得される対数尤度は、

Figure 0005965011
であって、logp()は対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
はサンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性のモデルパラメータを示す。 As in any embodiment, the log likelihood obtained by the acquisition module 301 is
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column shows, Z R indicates a potentially variable matrix row, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], alpha, β is the row / column mixing ratio, φ is the sub-model parameter for each sample category, η is the model parameter for the row sample attribute for each sample category, and ξ is the column sample attribute for each sample category The model parameters of are shown.

任意の実施形態のように、取得モジュール301によって取得される正規化項は、

Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は潜在変数の変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性のモデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性のモデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す。 As in any embodiment, the normalization term obtained by the acquisition module 301 is
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Is an approximation of the variational distribution of latent variables,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β indicates the dimension of β, D pq indicates the dimension of the sub-model parameter in the sample category of the p-th row and q-th column, and η p indicates the model parameter of the sample attribute of the row in the sample category of the p-th row ,
Figure 0005965011
Indicates the dimension of η p , ξ q indicates the model parameter of the column sample attribute in the sample category of column q,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicates.

任意の実施形態のように、取得モジュール301によって取得される潜在変数の各々の変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数Zの変分分布を示し、q(Z)は列の潜在変数Zの変分分布を示す。 As in any embodiment, the logarithm of the variational distribution of each of the latent variables acquired by the acquisition module 301 is logq (Z R ) and logq (Z c ), where q (Z R ) is the row latent variable. shows the variation distribution of Z R, q (Z c) shows the variation distribution of the latent variables Z c columns.

任意の実施形態のように、第1の決定モジュール302によって決定された目的関数

Figure 0005965011
は、
Figure 0005965011
である。 Objective function determined by the first determination module 302, as in any embodiment
Figure 0005965011
Is
Figure 0005965011
It is.

任意の実施形態のように、図4を参照すると、第2の決定モジュール303は、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得するように構成された取得ユニット3031と、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて目的関数が収束するか否かを判別するように構成された判別ユニット3032と、
を含み、
取得ユニット3031は、目的関数が収束しない場合には目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータを取得するまで潜在変数の各々の変分分布及び更新されたモデルパラメータを再取得するように構成されている。
As in any embodiment, referring to FIG. 4, the second determination module 303
An acquisition unit 3031 configured to acquire an updated variation distribution and updated model parameters of each of the latent variables;
A discriminating unit 3032 configured to discriminate whether or not the objective function converges according to each updated variation distribution of the latent variables and the updated model parameters;
Including
The acquisition unit 3031 obtains each variation distribution and model parameter of each latent variable until obtaining each variation distribution and model parameter of the latent variable that enables convergence of the objective function if the objective function does not converge. Is configured to re-acquire.

任意の実施形態のように、図5を参照すると、取得ユニット3031は、
目的関数の収束を可能にする潜在変数の各々の更新された変分分布を取得するまで、下記の式

Figure 0005965011
を使用することによって潜在変数の各々の変分分布を交互に更新するように構成された第1の更新サブユニット30311と、
更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって目的関数の収束を可能にする潜在変数の各々の更新された変分分布に応じてモデルパラメータを更新するように構成された第2の更新サブユニット30312と、
を含む。 As in any embodiment, referring to FIG.
Until we get an updated variational distribution of each of the latent variables that enable the convergence of the objective function:
Figure 0005965011
A first update subunit 30311 configured to alternately update the variational distribution of each of the latent variables by using
To get the updated model parameters:
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
A second update subunit 30312 configured to update the model parameters in response to each updated variational distribution of the latent variable that enables convergence of the objective function by using
including.

任意の実施形態のように、図6を参照すると、取得ユニット3031は、
更新されたモデルパラメータを取得するために下記の式

Figure 0005965011
を使用することによってモデルパラメータを更新するように構成された第3の更新サブユニット30313と、
目的関数の収束を可能にする潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって更新されたモデルパラメータに応じて潜在変数の各々の変分分布を交互に更新するように構成された第4の更新サブユニット30314と、
を含む。 As in any embodiment, referring to FIG.
To get the updated model parameters:
Figure 0005965011
A third update subunit 30313 configured to update model parameters by using
To obtain an updated variational distribution of each of the latent variables that allow the objective function to converge:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
A fourth update subunit 30314 configured to alternately update the variational distribution of each of the latent variables in response to the model parameters updated by using
including.

任意の実施形態のように、図7を参照すると、判別ユニット3032は、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて決定された目的関数と、潜在変数の各々の前回更新された変分分布及び前回更新されたモデルパラメータに応じて決定された前回取得された目的関数と、の間の距離が閾値より短いか否かを比較するように構成された比較サブユニット30321と、
潜在変数の各々の更新された変分分布及び更新されたモデルパラメータに応じて決定された目的関数と前回取得された目的関数との間の距離が閾値より短い場合には目的関数が収束すると判別するように構成された判別サブユニット30322と、
を含む。
As in any embodiment, referring to FIG.
Objective function determined according to each updated variation distribution and updated model parameter of latent variable, and determined according to last updated variation distribution and last updated model parameter of each latent variable A comparison subunit 30321 configured to compare whether the distance between the previously obtained objective function is shorter than a threshold;
It is determined that the objective function converges if the distance between the objective function determined according to each updated variation distribution of the latent variable and the updated model parameter and the objective function acquired last time is shorter than the threshold value. A discrimination subunit 30322 configured to:
including.

結論として、本開示の実施形態に応じた装置において、目的関数は、サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、潜在変数の各々の変分分布の対数と、に応じて決定される。また、リレーショナルモデルは、目的関数の収束を可能にする潜在変数の各々の変分分布及びモデルパラメータに応じて決定される。この方法において、リレーショナルモデル決定の効率及び精度は改善される。更に、正規化項を使用することによってモデルの複雑性は自動的に制御されてよいので、モデル決定の効率は改善される。   In conclusion, in an apparatus according to an embodiment of the present disclosure, the objective function includes log data determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters. , Depending on the normalization term and the logarithm of each variational distribution of the latent variable. The relational model is also determined according to the variational distribution and model parameters of each of the latent variables that enable the objective function to converge. In this way, the efficiency and accuracy of relational model determination is improved. Furthermore, the efficiency of model determination is improved because the complexity of the model may be automatically controlled by using the normalization term.

上記実施形態によって提供されるリレーショナルモデル決定用の装置がリレーショナルモデルを決定する場合における上記全ての機能モジュールの分割は例にすぎないことに留意すべきである。実際には、上記機能は必要に応じて異なる機能モジュールに分散されていてよい、即ち、装置の内部構造は上述の全て又は一部の機能を実施するために異なる機能モジュールに分割されていてよい。加えて、上記実施形態において提供されるリレーショナルモデル決定用の装置及びリレーショナルモデル決定用の方法は同一の思想であり、装置の具体的な実施処理は方法の実施形態を参照するが、ここでは繰り返さない。   It should be noted that the division of all the functional modules in the case where the relational model determination apparatus provided by the above embodiment determines the relational model is only an example. In practice, the above functions may be distributed in different functional modules as required, i.e. the internal structure of the device may be divided into different functional modules to implement all or some of the functions described above. . In addition, the relational model determination apparatus and the relational model determination method provided in the above embodiment have the same idea, and the specific implementation process of the apparatus refers to the method embodiment, but is repeated here. Absent.

本開示の上記実施形態の連番は単に説明の目的で提供されたものにすぎず、実施形態の優先度を示すものではない。   The serial numbers of the above-described embodiments of the present disclosure are provided merely for the purpose of explanation, and do not indicate the priority of the embodiments.

当業者は、前述の方法のステップの全部又は一部がハードウェア又は関連付けられたハードウェアに指示するプログラムによって実行されてよいことを理解すべきである。プログラムは、コンピュータ読み取り可能な記録媒体に格納されてよい。記録媒体は、読み出し専用メモリ、磁気ディスク、光ディスク等であってよい。   One skilled in the art should understand that all or part of the method steps described above may be performed by a program that instructs the hardware or associated hardware. The program may be stored in a computer-readable recording medium. The recording medium may be a read only memory, a magnetic disk, an optical disk or the like.

上記は、単に本開示の好ましい実施形態であって、本発明を限定するものではない。本開示の精神及び原理から逸脱することなく行われる種々の修正、同等の置換、又は改良は、本発明の保護範囲内に含まれるべきである。   The above are merely preferred embodiments of the present disclosure and are not intended to limit the present invention. Various modifications, equivalent substitutions, or improvements made without departing from the spirit and principle of the present disclosure should be included in the protection scope of the present invention.

(付記1)
サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、前記潜在変数の各々の変分分布の対数と、を取得することと、
前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定することと、
前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定し、前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記モデルパラメータに応じてリレーショナルモデルを決定することと、
を備えるリレーショナルモデル決定用の方法。
(Appendix 1)
Logarithmic likelihood determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters, a normalization term, and a logarithm of the variational distribution of each of the latent variables; Getting, and
Determining an objective function according to the log likelihood, the normalization term, and the logarithm of the variational distribution of each of the latent variables;
Determining a variational distribution and model parameters of each of the latent variables enabling convergence of the objective function, and depending on the variational distribution and model parameters of each of the latent variables enabling convergence of the objective function To determine the relational model
A method for determining a relational model comprising:

(付記2)
前記サンプルデータ、前記少なくとも2つのサンプル属性のグループ、前記少なくとも2つの潜在変数のグループ、及び前記モデルパラメータに応じて決定される前記対数尤度は、

Figure 0005965011
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
は前記サンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、前記モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示す、
付記1に記載の方法。 (Appendix 2)
The log likelihood determined in response to the sample data, the at least two sample attribute groups, the at least two latent variable groups, and the model parameters is:
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents the sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column are shown, indicates the latent variable matrix Z R rows, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], α and β are the row and column mixing ratios, φ indicates the sub-model parameter in each sample category, η indicates the model parameter of the row sample attribute in each sample category, and ξ indicates the column in each sample category Indicates the model parameter of the sample attribute of
The method according to appendix 1.

(付記3)
前記サンプルデータ、前記少なくとも2つのサンプル属性のグループ、前記少なくとも2つの潜在変数のグループ、及び前記モデルパラメータに応じて決定される前記正規化項は、

Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は前記潜在変数の前記変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す、
付記1に記載の方法。 (Appendix 3)
The normalization term determined in response to the sample data, the at least two sample attribute groups, the at least two latent variable groups, and the model parameters,
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Indicates an approximation of the variational distribution of the latent variable,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β denotes the dimension of β, D pq denotes the dimension of the submodel parameter in the sample category of the pth row and the qth column, and η p denotes the model parameter of the sample attribute of the row in the sample category of the pth row. Show
Figure 0005965011
Denotes the dimension of η p , ξ q denotes the model parameter of the column sample attribute in the q-th column sample category,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Showing,
The method according to appendix 1.

(付記4)
前記サンプルデータ、前記少なくとも2つのサンプル属性のグループ、前記少なくとも2つの潜在変数のグループ、及び前記モデルパラメータに応じて決定される前記潜在変数の各々の前記変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数Zの前記変分分布を示し、q(Z)は列の潜在変数Zの前記変分分布を示す付記1に記載の方法。
(Appendix 4)
The logarithm of the variational distribution of each of the sample data, the at least two sample attribute groups, the at least two latent variable groups, and each of the latent variables determined according to the model parameters is logq (Z R ) And logq (Z c ), q (Z R ) denotes the variation distribution of the latent variable Z R in the row, and q (Z c ) denotes the variation distribution of the latent variable Z c in the column. The method described in 1.

(付記5)
前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定するステップは、前記対数尤度の期待値、前記正規化項の期待値及び前記潜在変数の各々の前記変分分布の対数の期待値に応じて前記目的関数を決定することを含む付記1乃至4の何れかに記載の方法。
(Appendix 5)
The step of determining an objective function according to the log likelihood, the normalization term, and the logarithm of the variational distribution of each latent variable includes the expected value of the log likelihood, the normalization term The method according to any one of appendices 1 to 4, further comprising: determining the objective function according to an expected value and an expected value of the logarithm of the variation distribution of each of the latent variables.

(付記6)
前記対数尤度の期待値、前記正規化項の期待値、及び前記潜在変数の各々の前記変分分布の対数の期待値に応じて決定された前記目的関数

Figure 0005965011
は、
Figure 0005965011
である付記5に記載の方法。 (Appendix 6)
The objective function determined according to the expected value of the log likelihood, the expected value of the normalization term, and the expected value of the logarithm of the variation distribution of each of the latent variables
Figure 0005965011
Is
Figure 0005965011
The method according to appendix 5, wherein

(付記7)
前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定するステップは、
前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得することと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて前記目的関数が収束するか否かを判別し、前記目的関数が収束しない場合には前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記更新されたモデルパラメータを取得するまで前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータを再取得することと、
を含む付記6に記載の方法。
(Appendix 7)
Determining a variational distribution and model parameters for each of the latent variables that allow convergence of the objective function;
Obtaining an updated variation distribution and updated model parameters for each of the latent variables;
It is determined whether or not the objective function converges according to the updated variation distribution and the updated model parameter of each of the latent variables, and if the objective function does not converge, the objective function converges Re-acquiring the updated variation distribution and the updated model parameters for each of the latent variables until obtaining the variation distribution and the updated model parameters for each of the latent variables. When,
The method according to appendix 6, comprising:

(付記8)
前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得するステップは、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するまで、下記の式

Figure 0005965011
を使用することによって前記潜在変数の各々の前記変分分布を交互に更新することと、
更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
ここで、
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記目的関数の収束を可能にする前記潜在変数の各々の前記更新された変分分布に応じて前記モデルパラメータを更新することと、
を含む付記7に記載の方法。 (Appendix 8)
Obtaining an updated variation distribution and an updated model parameter for each of the latent variables;
Until obtaining an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
Alternately updating the variational distribution of each of the latent variables by using
To get the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
Updating the model parameters in response to the updated variational distribution of each of the latent variables that enables convergence of the objective function by using
The method according to appendix 7, including:

(付記9)
前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得するステップは、
前記更新されたモデルパラメータを取得するために下記の式

Figure 0005965011
ここで、
Figure 0005965011
を使用することによって前記モデルパラメータを更新することと、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記更新されたモデルパラメータに応じて前記潜在変数の各々の前記変分分布を交互に更新することと、
を含む付記7に記載の方法。 (Appendix 9)
Obtaining an updated variation distribution and an updated model parameter for each of the latent variables;
In order to obtain the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
Updating the model parameters by using
To obtain an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
Alternately updating the variational distribution of each of the latent variables in response to the updated model parameters by using
The method according to appendix 7, including:

(付記10)
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて前記目的関数が収束するか否かを判別するステップは、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と、前記潜在変数の各々の前回更新された変分分布及び前回更新されたモデルパラメータに応じて決定された前回取得された目的関数と、の間の距離が閾値より短いか否かを比較することと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と前記前回取得された目的関数との間の距離が前記閾値より短い場合には前記目的関数が収束すると判別することと、
を含む付記7乃至9の何れかに記載の方法。
(Appendix 10)
Determining whether the objective function converges according to the updated variation distribution and the updated model parameters of each of the latent variables;
The objective function determined in response to the updated variation distribution and the updated model parameters of each of the latent variables; the last updated variation distribution and the last updated model of each of the latent variables; Comparing whether the distance between the objective function acquired last time determined according to the parameter is shorter than a threshold,
When the distance between the objective function determined in accordance with the updated variation distribution and the updated model parameter of each of the latent variables and the previously acquired objective function is shorter than the threshold value Determining that the objective function converges;
The method according to any one of appendices 7 to 9, including:

(付記11)
サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、前記潜在変数の各々の変分分布の対数と、を取得するように構成された取得モジュールと、
前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定するように構成された第1の決定モジュールと、
前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定するように構成された第2の決定モジュールと、
前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記モデルパラメータに応じてリレーショナルモデルを決定するように構成された第3の決定モジュールと、
を備えるリレーショナルモデル決定用の装置。
(Appendix 11)
Logarithmic likelihood determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters, a normalization term, and a logarithm of the variational distribution of each of the latent variables; An acquisition module configured to acquire, and
A first determination module configured to determine an objective function according to the log likelihood, the normalization term, and the logarithm of the variational distribution of each of the latent variables;
A second determination module configured to determine a variational distribution and model parameters of each of the latent variables that allow convergence of the objective function;
A third determination module configured to determine a relational model as a function of the variational distribution and model parameters of each of the latent variables that allow convergence of the objective function;
A device for determining a relational model.

(付記12)
前記取得モジュールによって取得される前記対数尤度は、

Figure 0005965011
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
は前記サンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、前記モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示す、
付記11に記載の装置。 (Appendix 12)
The log likelihood acquired by the acquisition module is:
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents the sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column are shown, indicates the latent variable matrix Z R rows, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], α and β are the row and column mixing ratios, φ indicates the sub-model parameter in each sample category, η indicates the model parameter of the row sample attribute in each sample category, and ξ indicates the column in each sample category Indicates the model parameter of the sample attribute of
The apparatus according to appendix 11.

(付記13)
前記取得モジュールによって取得される前記正規化項は、

Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は前記潜在変数の前記変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す、
付記11に記載の装置。 (Appendix 13)
The normalization term acquired by the acquisition module is:
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Indicates an approximation of the variational distribution of the latent variable,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β denotes the dimension of β, D pq denotes the dimension of the submodel parameter in the sample category of the pth row and the qth column, and η p denotes the model parameter of the sample attribute of the row in the sample category of the pth row. Show
Figure 0005965011
Denotes the dimension of η p , ξ q denotes the model parameter of the column sample attribute in the q-th column sample category,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Showing,
The apparatus according to appendix 11.

(付記14)
前記取得モジュールによって取得される前記潜在変数の各々の前記変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数Zの前記変分分布を示し、q(Z)は列の潜在変数Zの前記変分分布を示す付記11に記載の装置。
(Appendix 14)
The logarithm of the variation distribution of each of the latent variables acquired by the acquisition module is logq (Z R ) and logq (Z c ), where q (Z R ) is the variation of the latent variable Z R of the row. The apparatus according to claim 11, wherein the distribution indicates a distribution, and q (Z c ) indicates the variation distribution of the latent variable Z c of the column.

(付記15)
前記第1の決定モジュールは、前記対数尤度の期待値、前記正規化項の期待値、及び前記潜在変数の各々の前記変分分布の対数の期待値に応じて目的関数を決定するように構成されている付記11乃至14の何れかに記載の装置。
(Appendix 15)
The first determination module determines an objective function according to an expected value of the log likelihood, an expected value of the normalization term, and an expected value of the logarithm of the variation distribution of each of the latent variables. 15. The apparatus according to any one of appendices 11 to 14, which is configured.

(付記16)
前記第1の決定モジュールによって決定された前記目的関数

Figure 0005965011
は、
Figure 0005965011
である付記15に記載の装置。 (Appendix 16)
The objective function determined by the first determination module;
Figure 0005965011
Is
Figure 0005965011
The apparatus according to appendix 15, wherein

(付記17)
前記第2の決定モジュールは、
前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得するように構成された取得ユニットと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて前記目的関数が収束するか否かを判別するように構成された判別ユニットと、
を含み、
前記取得ユニットは、前記目的関数が収束しない場合には前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを取得するまで前記潜在変数の各々の前記変分分布及び前記更新されたモデルパラメータを再取得するように構成されている、
付記16に記載の装置。
(Appendix 17)
The second determination module is
An acquisition unit configured to acquire an updated variation distribution and updated model parameters of each of the latent variables;
A discriminating unit configured to discriminate whether or not the objective function converges according to the updated variation distribution and the updated model parameter of each of the latent variables;
Including
The acquisition unit is configured to acquire the variation distribution of each of the latent variables and the variation distribution of each of the latent variables until obtaining the variation distribution and model parameters of each of the latent variables that enable convergence of the objective function if the objective function does not converge. Configured to re-acquire the updated model parameters;
The apparatus according to appendix 16.

(付記18)
前記取得ユニットは、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するまで、下記の式

Figure 0005965011
を使用することによって前記潜在変数の各々の前記変分分布を交互に更新するように構成された第1の更新サブユニットと、
更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
ここで、
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記目的関数の収束を可能にする前記潜在変数の各々の前記更新された変分分布に応じて前記モデルパラメータを更新するように構成された第2の更新サブユニットと、
を含む付記17に記載の装置。 (Appendix 18)
The acquisition unit is
Until obtaining an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
A first update subunit configured to alternately update the variational distribution of each of the latent variables by using
To get the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
A second update subunit configured to update the model parameters in response to the updated variational distribution of each of the latent variables that enables convergence of the objective function by using
The apparatus according to appendix 17, comprising:

(付記19)
前記取得ユニットは、
前記更新されたモデルパラメータを取得するために下記の式

Figure 0005965011
ここで、
Figure 0005965011
を使用することによって前記モデルパラメータを更新するように構成された第3の更新サブユニットと、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記更新されたモデルパラメータに応じて前記潜在変数の各々の前記変分分布を交互に更新するように構成された第4の更新サブユニットと、
を含む付記17に記載の装置。 (Appendix 19)
The acquisition unit is
In order to obtain the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
A third update subunit configured to update the model parameters by using
To obtain an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
A fourth update subunit configured to alternately update the variational distribution of each of the latent variables in response to the updated model parameters by using
The apparatus according to appendix 17, comprising:

(付記20)
前記判別ユニットは、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と、前記潜在変数の各々の前回更新された変分分布及び前回更新されたモデルパラメータに応じて決定された前回取得された目的関数と、の間の距離が閾値より短いか否かを比較するように構成された比較サブユニットと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて決定された前記目的関数と前記前回取得された目的関数との間の距離が前記閾値より短い場合には前記目的関数が収束すると判別するように構成された判別サブユニットと、
を含む付記17乃至19の何れかに記載の装置。
(Appendix 20)
The discrimination unit is
The objective function determined in response to the updated variation distribution and the updated model parameters of each of the latent variables; the last updated variation distribution and the last updated model of each of the latent variables; A comparison subunit configured to compare whether the distance between the previously obtained objective function determined according to the parameter is shorter than a threshold value;
When the distance between the objective function determined in accordance with the updated variation distribution and the updated model parameter of each of the latent variables and the previously acquired objective function is shorter than the threshold value A discrimination subunit configured to determine that the objective function converges;
The device according to any one of appendices 17 to 19, including:

Claims (10)

サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、前記潜在変数の各々の変分分布の対数と、を取得するように構成された取得モジュールと、
前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定するように構成された第1の決定モジュールと、
前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定するように構成された第2の決定モジュールと、
前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記モデルパラメータに応じてリレーショナルモデルを決定するように構成された第3の決定モジュールと、
を備えるリレーショナルモデル決定用の装置。
Logarithmic likelihood determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters, a normalization term, and a logarithm of the variational distribution of each of the latent variables; An acquisition module configured to acquire, and
A first determination module configured to determine an objective function according to the log likelihood, the normalization term, and the logarithm of the variational distribution of each of the latent variables;
A second determination module configured to determine a variational distribution and model parameters of each of the latent variables that allow convergence of the objective function;
A third determination module configured to determine a relational model as a function of the variational distribution and model parameters of each of the latent variables that allow convergence of the objective function;
A device for determining a relational model.
前記取得モジュールによって取得される前記対数尤度は、
Figure 0005965011
であって、logp()は前記対数尤度を示し、pは同時確率密度関数を示し、
Figure 0005965011
は前記サンプルデータを示し、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Aは行のサンプル属性のセットを示し、Aは列のサンプル属性のセットを示し、Zは行の潜在変数行列を示し、Zは列の潜在変数行列を示し、θはモデルパラメータのセットを示し、前記モデルパラメータはα、β、φ、η、ξを含み、α、βはそれぞれ行と列の混合比であり、φは各サンプルカテゴリにおけるサブモデルパラメータを示し、ηは各サンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、ξは各サンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示す、
請求項1に記載の装置。
The log likelihood acquired by the acquisition module is:
Figure 0005965011
Where logp () indicates the log likelihood, p indicates the joint probability density function,
Figure 0005965011
Represents the sample data, the number of samples N r row, N c denotes the number of samples of the column, shows a set of sample attributes of A R rows, A C is the set of samples attribute column are shown, indicates the latent variable matrix Z R rows, Z c represents the latent variable matrix column, theta represents the set of model parameters, the model parameters include alpha, beta, phi, eta, and xi], α and β are the row and column mixing ratios, φ indicates the sub-model parameter in each sample category, η indicates the model parameter of the row sample attribute in each sample category, and ξ indicates the column in each sample category Indicates the model parameter of the sample attribute of
The apparatus of claim 1.
前記取得モジュールによって取得される前記正規化項は、
Figure 0005965011
であって、Nは行のサンプルの数を示し、Nは列のサンプルの数を示し、Kは行のサンプルカテゴリの数を示し、Kは列のサンプルカテゴリの数を示し、
Figure 0005965011
は前記潜在変数の前記変分分布の近似値を示し、
Figure 0005965011
は第p行のサンプルカテゴリに対する第i行のサンプルデータの会員を記述するための行の潜在変数を示し、
Figure 0005965011
は第q列のサンプルカテゴリに対する第j列のサンプルデータの会員を記述するための列の潜在変数を示し、αとβはそれぞれ行と列の混合比であり、Dαはαの次元を示し、Dβはβの次元を示し、Dpqは第p行第q列のサンプルカテゴリにおけるサブモデルパラメータの次元を示し、ηは第p行のサンプルカテゴリにおける行のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はηの次元を示し、ξは第q列のサンプルカテゴリにおける列のサンプル属性の前記モデルパラメータを示し、
Figure 0005965011
はξの次元を示し、L(a,b)=logb+(a−b)/bであり、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示し、
Figure 0005965011
においてaは
Figure 0005965011
を示し、bは
Figure 0005965011
を示す、
請求項1に記載の装置。
The normalization term acquired by the acquisition module is:
Figure 0005965011
Where N r indicates the number of samples in the row, N c indicates the number of samples in the column, K r indicates the number of sample categories in the row, K c indicates the number of sample categories in the column,
Figure 0005965011
Indicates an approximation of the variational distribution of the latent variable,
Figure 0005965011
Indicates a latent variable in the row for describing the membership of the sample data in row i for the sample category in row p,
Figure 0005965011
Indicates the latent variables of the column for describing the membership of the sample data of the j-th column for the sample category of the q-th column, α and β are the mixture ratio of rows and columns, respectively, and D α indicates the dimension of α , D β denotes the dimension of β, D pq denotes the dimension of the submodel parameter in the sample category of the pth row and the qth column, and η p denotes the model parameter of the sample attribute of the row in the sample category of the pth row. Show
Figure 0005965011
Denotes the dimension of η p , ξ q denotes the model parameter of the column sample attribute in the q-th column sample category,
Figure 0005965011
Indicates the dimension of ξ q , L (a, b) = logb + (ab −) / b,
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Indicate
Figure 0005965011
A is
Figure 0005965011
And b is
Figure 0005965011
Showing,
The apparatus of claim 1.
前記取得モジュールによって取得される前記潜在変数の各々の前記変分分布の対数はlogq(Z)及びlogq(Z)であり、q(Z)は行の潜在変数Zの前記変分分布を示し、q(Z)は列の潜在変数Zの前記変分分布を示す請求項1に記載の装置。 The logarithm of the variation distribution of each of the latent variables acquired by the acquisition module is logq (Z R ) and logq (Z c ), where q (Z R ) is the variation of the latent variable Z R of the row. The apparatus according to claim 1, wherein q is a distribution, and q (Z c ) is the variational distribution of the latent variable Z c of the column. 前記第1の決定モジュールは、前記対数尤度の期待値、前記正規化項の期待値、及び前記潜在変数の各々の前記変分分布の対数の期待値に応じて目的関数を決定するように構成されている請求項1乃至4の何れか一項に記載の装置。   The first determination module determines an objective function according to an expected value of the log likelihood, an expected value of the normalization term, and an expected value of the logarithm of the variation distribution of each of the latent variables. The device according to claim 1, wherein the device is configured. 前記第1の決定モジュールによって決定された前記目的関数
Figure 0005965011
は、
Figure 0005965011
である請求項5に記載の装置。
The objective function determined by the first determination module;
Figure 0005965011
Is
Figure 0005965011
6. The apparatus of claim 5, wherein
前記第2の決定モジュールは、
前記潜在変数の各々の更新された変分分布及び更新されたモデルパラメータを取得するように構成された取得ユニットと、
前記潜在変数の各々の前記更新された変分分布及び前記更新されたモデルパラメータに応じて前記目的関数が収束するか否かを判別するように構成された判別ユニットと、
を含み、
前記取得ユニットは、前記目的関数が収束しない場合には前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを取得するまで前記潜在変数の各々の前記変分分布及び前記更新されたモデルパラメータを再取得するように構成されている、
請求項6に記載の装置。
The second determination module is
An acquisition unit configured to acquire an updated variation distribution and updated model parameters of each of the latent variables;
A discriminating unit configured to discriminate whether or not the objective function converges according to the updated variation distribution and the updated model parameter of each of the latent variables;
Including
The acquisition unit is configured to acquire the variation distribution of each of the latent variables and the variation distribution of each of the latent variables until obtaining the variation distribution and model parameters of each of the latent variables that enable convergence of the objective function if the objective function does not converge. Configured to re-acquire the updated model parameters;
The apparatus according to claim 6.
前記取得ユニットは、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するまで、下記の式
Figure 0005965011
を使用することによって前記潜在変数の各々の前記変分分布を交互に更新するように構成された第1の更新サブユニットと、
更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
ここで、
Figure 0005965011
tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記目的関数の収束を可能にする前記潜在変数の各々の前記更新された変分分布に応じて前記モデルパラメータを更新するように構成された第2の更新サブユニットと、
を含む請求項7に記載の装置。
The acquisition unit is
Until obtaining an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
A first update subunit configured to alternately update the variational distribution of each of the latent variables by using
To get the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
t indicates the current update, t-1 indicates the previous update or initial setting,
A second update subunit configured to update the model parameters in response to the updated variational distribution of each of the latent variables that enables convergence of the objective function by using
The apparatus of claim 7 comprising:
前記取得ユニットは、
前記更新されたモデルパラメータを取得するために下記の式
Figure 0005965011
ここで、
Figure 0005965011
を使用することによって前記モデルパラメータを更新するように構成された第3の更新サブユニットと、
前記目的関数の収束を可能にする前記潜在変数の各々の更新された変分分布を取得するために下記の式
Figure 0005965011
ここで、tは現在の更新を示し、t−1は前回の更新又は初期設定を示す、
を使用することによって前記更新されたモデルパラメータに応じて前記潜在変数の各々の前記変分分布を交互に更新するように構成された第4の更新サブユニットと、
を含む請求項7に記載の装置。
The acquisition unit is
In order to obtain the updated model parameters:
Figure 0005965011
here,
Figure 0005965011
A third update subunit configured to update the model parameters by using
To obtain an updated variational distribution of each of the latent variables that allows convergence of the objective function:
Figure 0005965011
Here, t indicates the current update, t-1 indicates the previous update or initial setting,
A fourth update subunit configured to alternately update the variational distribution of each of the latent variables in response to the updated model parameters by using
The apparatus of claim 7 comprising:
サンプルデータ、少なくとも2つのサンプル属性のグループ、少なくとも2つの潜在変数のグループ、及びモデルパラメータに応じて決定される対数尤度と、正規化項と、前記潜在変数の各々の変分分布の対数と、を取得することと、
前記対数尤度と、前記正規化項と、前記潜在変数の各々の前記変分分布の対数と、に応じて目的関数を決定することと、
前記目的関数の収束を可能にする前記潜在変数の各々の変分分布及びモデルパラメータを決定し、前記目的関数の収束を可能にする前記潜在変数の各々の前記変分分布及び前記モデルパラメータに応じてリレーショナルモデルを決定することと、
を備えるリレーショナルモデル決定用の方法。
Logarithmic likelihood determined according to sample data, a group of at least two sample attributes, a group of at least two latent variables, and model parameters, a normalization term, and a logarithm of the variational distribution of each of the latent variables; Getting, and
Determining an objective function according to the log likelihood, the normalization term, and the logarithm of the variational distribution of each of the latent variables;
Determining a variational distribution and model parameters of each of the latent variables enabling convergence of the objective function, and depending on the variational distribution and model parameters of each of the latent variables enabling convergence of the objective function To determine the relational model
A method for determining a relational model comprising:
JP2015051733A 2014-03-28 2015-03-16 Method and apparatus for relational model determination Active JP5965011B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410124577.3A CN104951642A (en) 2014-03-28 2014-03-28 Method and device for determining relation model
CN201410124577.3 2014-03-28

Publications (2)

Publication Number Publication Date
JP2015191667A JP2015191667A (en) 2015-11-02
JP5965011B2 true JP5965011B2 (en) 2016-08-03

Family

ID=54166299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015051733A Active JP5965011B2 (en) 2014-03-28 2015-03-16 Method and apparatus for relational model determination

Country Status (2)

Country Link
JP (1) JP5965011B2 (en)
CN (1) CN104951642A (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043261B2 (en) * 2012-05-31 2015-05-26 Nec Corporation Latent variable model estimation apparatus, and method

Also Published As

Publication number Publication date
CN104951642A (en) 2015-09-30
JP2015191667A (en) 2015-11-02

Similar Documents

Publication Publication Date Title
Chen et al. Pairwise ranking aggregation in a crowdsourced setting
Cattaneo et al. Inference in regression discontinuity designs under local randomization
Zhang et al. Missing data imputation by utilizing information within incomplete instances
Constantin et al. A general Monte Carlo method for sample size analysis in the context of network models.
WO2017133615A1 (en) Service parameter acquisition method and apparatus
US20060282436A1 (en) Systems and methods for estimating functional relationships in a database
JP2017535857A (en) Learning with converted data
WO2018090545A1 (en) Time-factor fusion collaborative filtering method, device, server and storage medium
WO2013067461A2 (en) Identifying associations in data
WO2022179384A1 (en) Social group division method and division system, and related apparatuses
CN111242310A (en) Feature validity evaluation method and device, electronic equipment and storage medium
Panigrahi et al. Approximate selective inference via maximum likelihood
CN110163262A (en) Model training method, method for processing business, device, terminal and storage medium
Zhu et al. Portal nodes screening for large scale social networks
Cheng et al. Long-term effect estimation with surrogate representation
Guan A composite likelihood cross‐validation approach in selecting bandwidth for the estimation of the pair correlation function
JP6047190B2 (en) Program and apparatus for determining relational model
JP5970578B2 (en) Program and apparatus for determining relational model
Kuang et al. Weak signal asymptotics for sequentially randomized experiments
JP5965011B2 (en) Method and apparatus for relational model determination
Wei et al. Bayesian mixtures of common factor analyzers: Model, variational inference, and applications
Tang et al. Poststratification fusion learning in longitudinal data analysis
CN114491296A (en) Proposal affiliate recommendation method, system, computer device and readable storage medium
Zhang Epistatic clustering: a model-based approach for identifying links between clusters
JP2015201176A (en) Method and device for determining relational model

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160630

R150 Certificate of patent or registration of utility model

Ref document number: 5965011

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350