JP6660248B2 - Objective variable prediction device, method and program - Google Patents
Objective variable prediction device, method and program Download PDFInfo
- Publication number
- JP6660248B2 JP6660248B2 JP2016100885A JP2016100885A JP6660248B2 JP 6660248 B2 JP6660248 B2 JP 6660248B2 JP 2016100885 A JP2016100885 A JP 2016100885A JP 2016100885 A JP2016100885 A JP 2016100885A JP 6660248 B2 JP6660248 B2 JP 6660248B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- represented
- objective
- model function
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、機械学習の分野に関し、より詳細には、訓練データを用いて推定されたモデルを利用して特徴ベクトルに対応する目的変数を予測するための技術に関する。 The present invention relates to the field of machine learning, and more particularly, to a technique for predicting an objective variable corresponding to a feature vector using a model estimated using training data.
従来の統計的手法に基づく予測技術では、データと目的変数との依存関係を表すモデルを特徴ベクトルとモデルパラメータとの関数として与え、当該モデルを用いて特徴ベクトルに対する目的変数の値が推定される。一般に、当該モデルパラメータの値は目的変数が判明している訓練データを用いて求められる。 In a prediction technique based on a conventional statistical method, a model representing a dependency relationship between data and an objective variable is given as a function of a feature vector and a model parameter, and the value of the objective variable for the feature vector is estimated using the model. . Generally, the value of the model parameter is obtained using training data for which the objective variable is known.
2次特徴の組み合わせが扱えるモデルの例として、factorization machines(FM)がある(非特許文献1,2)。バイス項と1次特徴を除いて、FMでは以下のモデル関数が用いられる。
As an example of a model that can handle a combination of secondary features, there is factorization machines (FM) (
また、2次特徴の組み合わせと3次特徴の組み合わせとが扱えるモデルの例として、polynomial networks(PN)がある(非特許文献3)。PNでは、以下のモデル関数を用いる。 As an example of a model that can handle a combination of secondary features and a combination of tertiary features, there is polynomial networks (PN) (Non-Patent Document 3). In PN, the following model function is used.
上述した従来のFM及びPMでは、それぞれ2次と3次までの特徴の組み合わせしか扱うことができない。従って、より高い次数の特徴ベクトルの組み合わせを扱うことができると共に、少ない計算量でパラメータ値を求めることが可能なアルゴリズムが求められる。 The above-mentioned conventional FM and PM can only handle combinations of the second and third order features, respectively. Therefore, an algorithm is required that can handle combinations of feature vectors of higher orders and that can obtain parameter values with a small amount of calculation.
上述した問題点を鑑み、本発明の課題は、高い次数の特徴ベクトルの組み合わせに対するモデルを利用して、データに対応する目的変数を予測するための技術を提供することである。 In view of the above-described problems, an object of the present invention is to provide a technique for predicting an objective variable corresponding to data using a model for a combination of feature vectors of a high order.
上記課題を解決するため、本発明の一態様は、特徴ベクトルにより表現されるデータに対応する目的変数を予測する目的変数予測装置であって、前記目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定する推定部と、前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する予測部と、を有する目的変数予測装置に関する。 In order to solve the above-described problem, one embodiment of the present invention is a target variable prediction device that predicts a target variable corresponding to data represented by a feature vector, wherein the target variable is represented by a feature vector in which the target variable is known. An estimating unit for estimating a first parameter represented by a vector and a second parameter represented by a matrix in a model function for a combination of m-order features using training data obtained by And a prediction unit that predicts a target variable corresponding to unknown data by using a model function based on the first parameter and a second parameter.
本発明の他の態様は、特徴ベクトルにより表現されるデータに対応する目的変数を予測する目的変数予測装置であって、前記目的変数が判明している特徴ベクトルにより表現される(m−1)次以下の特徴の組み合わせに対する訓練データについて、前記訓練データの次数を拡大することによって取得された拡大された訓練データを利用して、m次特徴ベクトルの組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定する推定部と、前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する予測部と、を有する目的変数予測装置に関する。 Another aspect of the present invention is an objective variable predicting apparatus for predicting an objective variable corresponding to data represented by a feature vector, wherein the objective variable is represented by a feature vector for which the objective variable is known (m-1). For the training data for the following combination of features, the expanded training data obtained by expanding the degree of the training data is used, and the training data represented by the vector in the model function for the combination of the m-th feature vector is used. An estimation unit for estimating the first parameter and a second parameter represented by a matrix, and an objective variable corresponding to unknown data using a model function based on the estimated first parameter and the second parameter. And a prediction unit for predicting the target variable.
本発明の他の態様は、特徴ベクトルにより表現されるデータに対応する目的変数を予測する目的変数予測装置により実行される方法であって、前記目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定するステップと、前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測するステップと、を有する方法に関する。 Another aspect of the invention is a method performed by an objective variable prediction device for predicting an objective variable corresponding to data represented by a feature vector, wherein the objective variable is represented by a known feature vector. Estimating, using training data, a first parameter represented by a vector and a second parameter represented by a matrix in a model function for the m-th feature combination; and the estimated first parameter And predicting an objective variable corresponding to the unknown data using a model function based on the second parameter.
本発明によると、高い次数の特徴ベクトルの組み合わせに対するモデルを利用して、データに対応する目的変数を予測することができる。 According to the present invention, a target variable corresponding to data can be predicted using a model for a combination of high-order feature vectors.
以下、図面に基づいて本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
以下の実施例では、FM及びPNより高い次数の特徴ベクトルの組み合わせを処理可能な目的変数予測装置が開示される。すなわち、当該目的変数予測装置では、FM及びPMをより一般化したフレームワークが導入される。後述される実施例を概略すると、図1に示されるように、まず目的変数yが判明している特徴ベクトルxにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数のパラメータλ及びPが目的関数の凸性を利用したアルゴリズムに従って推定又は学習される。当該パラメータλ及びPは、線形時間の計算量で推定可能である。訓練データによる学習後、目的変数予測装置は、推定されたパラメータλ及びPによるモデル関数を利用して、未知のデータxの目的変数を予測する。このようにして、m次特徴の組み合わせを扱うことが可能なモデル関数のパラメータを少ない計算量で推定することができ、効率的に予測性能を向上させることが可能になる。 In the following embodiment, a target variable prediction device capable of processing a combination of feature vectors of higher order than FM and PN is disclosed. That is, in the objective variable prediction device, a framework that generalizes FM and PM is introduced. Briefly describing an embodiment described later, as shown in FIG. 1, first, using training data represented by a feature vector x for which a target variable y is known, a parameter of a model function for a combination of m-th features is used. λ and P are estimated or learned according to an algorithm using the convexity of the objective function. The parameters λ and P can be estimated by the amount of calculation in linear time. After learning based on the training data, the objective variable prediction device predicts the objective variable of the unknown data x using a model function based on the estimated parameters λ and P. In this way, the parameters of the model function that can handle the m-th feature combination can be estimated with a small amount of calculation, and the prediction performance can be efficiently improved.
まず、図2〜5を参照して、本発明の一実施例による目的変数予測装置を説明する。本実施例による目的変数予測装置は、特徴ベクトルにより表現されるデータに対応する目的変数を予測する。具体的には、訓練データの特徴ベクトル First, an objective variable prediction device according to an embodiment of the present invention will be described with reference to FIGS. The target variable prediction device according to the present embodiment predicts a target variable corresponding to data represented by a feature vector. Specifically, the feature vector of the training data
図2は、本発明の一実施例による目的変数予測装置の機能構成を示すブロック図である。図2に示されるように、目的変数予測装置100は、推定部110及び予測部120を有する。
FIG. 2 is a block diagram showing a functional configuration of the target variable prediction device according to one embodiment of the present invention. As shown in FIG. 2, the target
推定部110は、目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、式(3)に示されるm次特徴の組み合わせに対するモデル関数におけるパラメータを推定する。具体的には、推定部110は、後述される2つのカーネルを利用して、訓練データからベクトルλと行列Pとを推定又は学習する。
The estimating
第1のカーネルは、 The first kernel is
第2のカーネルは、 The second kernel is
ANOVAカーネルを用いたとき、式(4)から理解されるように、ANOVAカーネルを計算するコストは、 When the ANOVA kernel is used, as understood from Equation (4), the cost of calculating the ANOVA kernel is
なお、上述した同次多項式カーネルとANOVAカーネルとを式(3)に導入することによって、式(1)及び式(2)により表されるFM及びPNのモデル関数は、 By introducing the above-described homogeneous polynomial kernel and ANOVA kernel into equation (3), the FM and PN model functions represented by equations (1) and (2) are:
パラメータλ及びPを推定するため、推定部110は、
To estimate the parameters λ and P, the
一実施例では、モデル関数がANOVAカーネルを利用するとき、すなわち、 In one embodiment, when the model function utilizes an ANOVA kernel,
ここで、推定部110は、パラメータλをLassoアルゴリズムに従って学習し、パラメータPを座標降下法に従って学習してもよい。具体的には、推定部110は、
Here, the
他方、推定部110は、座標降下法に従ってパラメータPを推定する。すなわち、Pの要素が循環的に更新される。より詳細には、すべての
On the other hand, the estimating
式(6)を効率的に計算するためには、 To calculate equation (6) efficiently,
他の実施例では、モデル関数が同次多項式カーネルを利用するとき、すなわち、 In another embodiment, when the model function utilizes a homogeneous polynomial kernel,
まず、同次多項式カーネルを First, the homogeneous polynomial kernel is
一般に、任意の対称テンソル In general, any symmetric tensor
式(7)及び(8)を用いて、 Using equations (7) and (8),
多量凸目的関数を定式化するため、 To formulate a mass convex objective function,
m個の行列U1,...,Umを推定するため、推定部110は、 To estimate the m matrices U 1 ,..., U m ,
推定部110は、式(11)の目的関数に座標降下法を適用する。すなわち、m個の行列U1,...,Umの要素が循環的に更新される。より詳細には、すべての
The estimating
式(12)を効率的に計算するためには、 To calculate equation (12) efficiently,
上述した Mentioned above
具体的には、実用性の観点から、パラメータの推定時と推定されたパラメータによる予測時の双方において、データに常に1である特徴を加えることによって、次数を拡大する。これにより、1次の特徴からm次の特徴の組み合わせまでに対応した目的変数予測処理が可能になる。 More specifically, from the viewpoint of practicality, the order is expanded by adding a feature that is always 1 to the data at both the time of parameter estimation and the time of prediction with the estimated parameter. As a result, it is possible to perform a target variable prediction process corresponding to a combination of a primary feature to an m-th feature.
より詳細には、 More specifically,
あるいは、 Or,
次に、図6を参照して、本発明の一実施例によるパラメータ推定及び目的変数予測処理を説明する。当該処理は、目的変数予測装置100により実行される。図6は、本発明の一実施例によるパラメータ推定及び目的変数予測処理を示すフロー図である。
Next, with reference to FIG. 6, a description will be given of parameter estimation and target variable prediction processing according to an embodiment of the present invention. This process is executed by the target
図6に示されるように、ステップS101において、推定部110は、目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数におけるパラメータを推定する。
As shown in FIG. 6, in step S101, the estimating
具体的には、推定部110は、訓練データを用いて、式(3)に示されるモデル関数のパラメータλ及びPを推定する。例えば、モデル関数のカーネルがANOVAカーネルである場合、推定部110は、アルゴリズム1に従って、訓練データを利用して式(5)に示される目的関数を最小化するパラメータλ及びPを推定する。あるいは、モデル関数のカーネルが同次多項式カーネルである場合、推定部110は、アルゴリズム4に従って、訓練データを利用して式(11)に示される目的関数を最小化するパラメータUを推定する。
Specifically, the estimating
また、(m−1)次以下の特徴の組み合わせのデータに対して、推定部110は、データの次数を拡大し、拡大されたデータを利用してモデル関数のパラメータλ及びPを推定してもよい。例えば、モデル関数のカーネルがANOVAカーネルである場合、推定部110は、訓練データに常に1である特徴をm次元分加えることによって次元を拡大してもよい。あるいは、モデル関数のカーネルが同時多項式カーネルである場合、推定部110は、訓練データに常に1である特徴を1次元分加えることによって次元を拡大してもよい。
The estimating
ステップS102において、予測部120は、推定されたパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する。具体的には、ステップS101において推定されたパラメータλ及びPによる式(3)のモデル関数に未知のデータxを入力することによって、目的変数を予測してもよい。あるいは、ステップS101において推定されたパラメータUによる同次多項式カーネルによる式(3)のモデル関数に未知のデータxを入力することによって、目的変数を予測してもよい。
In step S102, the
また、(m−1)次以下の特徴の組み合わせのデータに対して、推定部110は、データの次元を拡大し、拡大されたデータを利用して目的変数を予測してもよい。例えば、モデル関数のカーネルがANOVAカーネルと同次多項式カーネルの何れである場合も、推定部110は、データに常に1である特徴を1次元分加えることによって次数を拡大してもよい。
In addition, the estimating
次に、図7を参照して、本発明の一実施例による目的変数予測装置のハードウェア構成を説明する。図7は、本発明の一実施例による目的変数予測装置のハードウェア構成を示すブロック図である。 Next, with reference to FIG. 7, the hardware configuration of the target variable prediction device according to one embodiment of the present invention will be described. FIG. 7 is a block diagram showing a hardware configuration of the target variable prediction device according to one embodiment of the present invention.
図7に示されるように、目的変数予測装置100は、典型的には、サーバにより実現されてもよく、例えば、バスを介し相互接続されるドライブ装置101、補助記憶装置102、メモリ装置103、プロセッサ104、インタフェース装置105及び通信装置106から構成される。目的変数予測装置100における上述した各種機能及び処理を実現するプログラムを含む各種コンピュータプログラムは、CD−ROM(Compact Disk−Read Only Memory)、DVD(Digital Versatile Disk)、フラッシュメモリなどの記録媒体107によって提供されてもよい。プログラムを記憶した記録媒体107がドライブ装置101にセットされると、プログラムが記録媒体107からドライブ装置101を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体107により行う必要はなく、ネットワークなどを介し何れかの外部装置からダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータなどを格納する。メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムやデータを読み出して格納する。プロセッサ104は、メモリ装置103に格納されたプログラムやプログラムを実行するのに必要なパラメータなどの各種データに従って、目的変数予測装置100の各種機能及び処理を実行する。インタフェース装置105は、ネットワーク又は外部装置に接続するための通信インタフェースとして用いられる。通信装置106は、インターネットなどのネットワークと通信するための各種通信処理を実行する。しかしながら、上述したハードウェア構成は単なる一例であり、目的変数予測装置100は、上述したハードウェア構成に限定されるものでなく、他の何れか適切なハードウェア構成により実現されてもよい。
As shown in FIG. 7, the objective
なお、上述した目的変数予測装置100の各部及びステップS101〜S102は、コンピュータのメモリ装置103に記憶されたプログラムをプロセッサ104が実行することによって実現されてもよい。
Note that each unit of the objective
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 As described above, the embodiments of the present invention have been described in detail. However, the present invention is not limited to the specific embodiments described above, and various modifications may be made within the scope of the present invention described in the appended claims.・ Change is possible.
100 目的変数予測装置
110 推定部
120 予測部
Claims (8)
前記目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定する推定部と、
前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する予測部と、
を有し、
前記モデル関数はANOVAカーネルを含み、
前記第1のパラメータはLassoアルゴリズムに従って学習され、前記第2のパラメータは座標降下法に従って学習され、
前記モデル関数を最適化するための目的関数は、前記第1のパラメータと前記第2のパラメータとに対して凸であり、
前記推定部は、前記目的関数が収束するまで、前記訓練データを用いて前記第1のパラメータと前記第2のパラメータとを繰り返し学習する目的変数予測装置。 An objective variable prediction device for predicting an objective variable corresponding to data represented by a feature vector,
Utilizing training data represented by a feature vector whose objective variable is known, a first parameter represented by a vector and a second parameter represented by a matrix in a model function for a combination of m-th features An estimator for estimating
A prediction unit that predicts a target variable corresponding to unknown data using a model function based on the estimated first parameter and the second parameter;
Have a,
The model function includes an ANOVA kernel,
The first parameter is learned according to a Lasso algorithm, the second parameter is learned according to a coordinate descent method,
An objective function for optimizing the model function is convex with respect to the first parameter and the second parameter,
The objective variable prediction device , wherein the estimation unit repeatedly learns the first parameter and the second parameter using the training data until the objective function converges .
前記目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定する推定部と、
前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する予測部と、
を有し、
前記モデル関数は、同次多項式カーネルを含み、
前記第1のパラメータと前記第2のパラメータとの推定が、m個の行列により表現される第3のパラメータに分解可能な対称テンソルの推定に変換され、
前記モデル関数を最適化するための目的関数は、前記第3のパラメータに対して凸であり、
前記推定部は、前記目的関数に座標降下法を適用することによって、前記訓練データを用いて前記第3のパラメータを学習し、
前記予測部は、前記第3のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する目的変数予測装置。 An objective variable prediction device for predicting an objective variable corresponding to data represented by a feature vector,
Utilizing training data represented by a feature vector whose objective variable is known, a first parameter represented by a vector and a second parameter represented by a matrix in a model function for a combination of m-th features An estimator for estimating
A prediction unit that predicts a target variable corresponding to unknown data using a model function based on the estimated first parameter and the second parameter;
Has,
The model function includes a homogeneous polynomial kernel,
Estimating the first parameter and the second parameter into a symmetric tensor estimate that can be decomposed into a third parameter represented by m matrices;
The objective function for optimizing the model function is convex with respect to the third parameter,
The estimating unit learns the third parameter using the training data by applying a coordinate descent method to the objective function,
The prediction unit, the third parameter by using the model function by the eye variables predictor you predict target variable corresponding to unknown data.
前記目的変数が判明している特徴ベクトルにより表現される(m−1)次以下の特徴の組み合わせに対する訓練データについて、前記訓練データの次数を拡大することによって取得された拡大された訓練データを利用して、m次特徴ベクトルの組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定する推定部と、
前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する予測部と、
を有する目的変数予測装置。 An objective variable prediction device for predicting an objective variable corresponding to data represented by a feature vector,
For training data for a combination of the following (m-1) -th features represented by a feature vector whose objective variable is known, expanded training data obtained by expanding the order of the training data is used. An estimating unit for estimating a first parameter represented by a vector and a second parameter represented by a matrix in a model function for a combination of m-th feature vectors;
A prediction unit that predicts a target variable corresponding to unknown data using a model function based on the estimated first parameter and the second parameter;
Variable prediction device having
前記拡大された訓練データは、m個の1の特徴によって前記訓練データの次元を拡大することによって取得され、
前記第1のパラメータはLassoアルゴリズムに従って学習され、前記第2のパラメータは座標降下法に従って学習され、
前記モデル関数を最適化するための目的関数は、前記第1のパラメータと前記第2のパラメータとに対して凸であり、
前記推定部は、前記目的関数が収束するまで、前記訓練データを用いて前記第1のパラメータと前記第2のパラメータとを繰り返し学習する、請求項3記載の目的変数予測装置。 The model function includes an ANOVA kernel,
The expanded training data is obtained by expanding a dimension of the training data by m one feature;
The first parameter is learned according to a Lasso algorithm, the second parameter is learned according to a coordinate descent method,
An objective function for optimizing the model function is convex with respect to the first parameter and the second parameter,
The objective variable prediction device according to claim 3 , wherein the estimating unit repeatedly learns the first parameter and the second parameter using the training data until the objective function converges.
前記拡大された訓練データは、1つの1の特徴によって前記訓練データの次元を拡大することによって取得され、
前記第1のパラメータと前記第2のパラメータとの推定が、m個の行列により表現される第3のパラメータに分解可能な対称テンソルの推定に変換され、
前記モデル関数を最適化するための目的関数は、前記第3のパラメータに対して凸であり、
前記推定部は、前記目的関数に座標降下法を適用することによって、前記訓練データを用いて前記第3のパラメータを学習し、
前記予測部は、前記第3のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する、請求項3記載の目的変数予測装置。 The model function includes a homogeneous polynomial kernel,
The expanded training data is obtained by expanding a dimension of the training data by one feature;
Estimating the first parameter and the second parameter into a symmetric tensor estimate that can be decomposed into a third parameter represented by m matrices;
The objective function for optimizing the model function is convex with respect to the third parameter,
The estimating unit learns the third parameter using the training data by applying a coordinate descent method to the objective function,
The prediction unit uses the model function by the third parameter to predict the target variable corresponding to unknown data, object variables predicting apparatus according to claim 3, wherein.
前記目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定するステップと、
前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測するステップと、
を有し、
前記モデル関数はANOVAカーネルを含み、
前記第1のパラメータはLassoアルゴリズムに従って学習され、前記第2のパラメータは座標降下法に従って学習され、
前記モデル関数を最適化するための目的関数は、前記第1のパラメータと前記第2のパラメータとに対して凸であり、
前記推定するステップは、前記目的関数が収束するまで、前記訓練データを用いて前記第1のパラメータと前記第2のパラメータとを繰り返し学習する方法。 A method performed by an objective variable prediction device that predicts an objective variable corresponding to data represented by a feature vector,
Utilizing training data represented by a feature vector whose objective variable is known, a first parameter represented by a vector and a second parameter represented by a matrix in a model function for a combination of m-th features Estimating
Estimating a target variable corresponding to unknown data using a model function based on the estimated first parameter and the second parameter;
Have a,
The model function includes an ANOVA kernel,
The first parameter is learned according to a Lasso algorithm, the second parameter is learned according to a coordinate descent method,
An objective function for optimizing the model function is convex with respect to the first parameter and the second parameter,
The estimating step is a method of repeatedly learning the first parameter and the second parameter using the training data until the objective function converges .
前記目的変数が判明している特徴ベクトルにより表現される訓練データを利用して、m次特徴の組み合わせに対するモデル関数におけるベクトルにより表現される第1のパラメータと行列により表現される第2のパラメータとを推定するステップと、 Utilizing training data represented by a feature vector whose objective variable is known, a first parameter represented by a vector and a second parameter represented by a matrix in a model function for a combination of m-th features Estimating
前記推定された第1のパラメータと第2のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測するステップと、 Estimating a target variable corresponding to unknown data using a model function based on the estimated first parameter and the second parameter;
を有し、Has,
前記モデル関数は、同次多項式カーネルを含み、 The model function includes a homogeneous polynomial kernel,
前記第1のパラメータと前記第2のパラメータとの推定が、m個の行列により表現される第3のパラメータに分解可能な対称テンソルの推定に変換され、 Estimating the first parameter and the second parameter into a symmetric tensor estimate that can be decomposed into a third parameter represented by m matrices;
前記モデル関数を最適化するための目的関数は、前記第3のパラメータに対して凸であり、 The objective function for optimizing the model function is convex with respect to the third parameter,
前記推定するステップは、前記目的関数に座標降下法を適用することによって、前記訓練データを用いて前記第3のパラメータを学習し、 The step of estimating learns the third parameter using the training data by applying a coordinate descent method to the objective function,
前記予測するステップは、前記第3のパラメータによるモデル関数を利用して、未知のデータに対応する目的変数を予測する方法。 The predicting step is a method of predicting a target variable corresponding to unknown data using a model function based on the third parameter.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016100885A JP6660248B2 (en) | 2016-05-19 | 2016-05-19 | Objective variable prediction device, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016100885A JP6660248B2 (en) | 2016-05-19 | 2016-05-19 | Objective variable prediction device, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017207987A JP2017207987A (en) | 2017-11-24 |
JP6660248B2 true JP6660248B2 (en) | 2020-03-11 |
Family
ID=60414975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016100885A Active JP6660248B2 (en) | 2016-05-19 | 2016-05-19 | Objective variable prediction device, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6660248B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7219180B2 (en) * | 2019-07-12 | 2023-02-07 | 株式会社奥村組 | Creation method of excavation prediction model in shield excavation method |
-
2016
- 2016-05-19 JP JP2016100885A patent/JP6660248B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017207987A (en) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11250308B2 (en) | Apparatus and method for generating prediction model based on artificial neural network | |
Tang et al. | Model predictive control of linear systems over networks with data quantizations and packet losses | |
JP2008003920A (en) | Device and program for prediction/diagnosis of time-series data | |
JP6782680B2 (en) | Systems and methods for instructional analysis | |
Van Antwerp et al. | Model predictive control of large scale processes | |
JP2021504836A5 (en) | ||
Fan et al. | Sparsity-promoting polynomial response surface: A new surrogate model for response prediction | |
WO2018144534A1 (en) | Hardware-based machine learning acceleration | |
WO2019193981A1 (en) | Data prediction device, method, and program | |
KR102142943B1 (en) | Cloud based artificial intelligence operation service method and apparatus performing the same | |
US20140058882A1 (en) | Method and Apparatus for Ordering Recommendations According to a Mean/Variance Tradeoff | |
CN110020877A (en) | The prediction technique of clicking rate, the determination method of clicking rate and server | |
CN114556299A (en) | Dynamically modifying parallelism of tasks in a pipeline | |
US20230154169A1 (en) | Video processing using delta distillation | |
JP2017049907A (en) | Neural network, learning method therefor and computer program | |
Ouhame et al. | Multivariate workload prediction using Vector Autoregressive and Stacked LSTM models | |
JP6660248B2 (en) | Objective variable prediction device, method and program | |
US20230409929A1 (en) | Methods and apparatuses for training prediction model | |
JP2011154554A (en) | Deficit value prediction device, deficit value prediction method, and deficit value prediction program | |
Erreygers et al. | Computing inferences for large-scale continuous-time Markov chains by combining lumping with imprecision | |
KR20200010644A (en) | Computer-enabled cloud-based ai computing service method | |
JP7310827B2 (en) | LEARNING DEVICE, LEARNING METHOD, AND PROGRAM | |
JP2004295638A (en) | Parameter estimating method, data predicting method, parameter estimating device, data predicting device, computer program, and recording medium | |
JP7330313B2 (en) | Arithmetic device and method | |
Li et al. | Maximum Accumulative Error Samplint Strategy for Approximation of Deterministic Engineering Simulations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190716 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6660248 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |