JP2018169999A - Model construction system and model construction method - Google Patents
Model construction system and model construction method Download PDFInfo
- Publication number
- JP2018169999A JP2018169999A JP2017249728A JP2017249728A JP2018169999A JP 2018169999 A JP2018169999 A JP 2018169999A JP 2017249728 A JP2017249728 A JP 2017249728A JP 2017249728 A JP2017249728 A JP 2017249728A JP 2018169999 A JP2018169999 A JP 2018169999A
- Authority
- JP
- Japan
- Prior art keywords
- model
- selected input
- variable
- deformation
- model construction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明の実施形態は、モデル構築システムおよびモデル構築方法に関する。 Embodiments described herein relate generally to a model construction system and a model construction method.
ある出力変数(目的変数)を、複数の入力変数(説明変数)を用いて予測することを目的として、複数の入力変数と出力変数との関係を表すモデルの構築が一般的に行われている。モデルを構築する際には、多数の入力変数の中から一部の入力変数を選択し、選ばれた入力変数と出力変数とを用いてモデルが構築される。例えば、入力変数は、出力変数に対する予測誤差が小さく、出力変数をより高精度に予測できるように選択される。 For the purpose of predicting a certain output variable (objective variable) using a plurality of input variables (explanatory variables), a model that represents the relationship between a plurality of input variables and output variables is generally constructed. . When building a model, some input variables are selected from a large number of input variables, and the model is built using the selected input variables and output variables. For example, the input variable is selected so that the prediction error with respect to the output variable is small and the output variable can be predicted with higher accuracy.
モデルについては、精度以外に、汎化能力が高いことが求められる。すなわち、ある範囲のデータ(既存のデータ)に基づいて構築されたモデルが、別の範囲のデータ(未知のデータ)に対しても、良好な精度を有することが求められる。しかし、既存のデータに対して高い精度を有するモデルが、高い汎化能力を有するとは限らない。また、既存のデータに対し精度が最も高いモデルより、ある程度精度が低いモデルの方が汎化能力では優れていることもある。このため、精度の低下を抑えつつ、汎化能力の高いモデルを構築できる技術の開発が望まれていた。 The model is required to have high generalization ability in addition to accuracy. That is, a model constructed based on a certain range of data (existing data) is required to have good accuracy with respect to another range of data (unknown data). However, a model having high accuracy with respect to existing data does not necessarily have high generalization ability. In addition, the generalization ability may be better for a model with a certain degree of accuracy than a model with the highest accuracy for existing data. For this reason, it has been desired to develop a technology capable of constructing a model having a high generalization ability while suppressing a decrease in accuracy.
本発明が解決しようとする課題は、精度の低下を抑制しつつ、汎化能力の高いモデルを構築できるモデル構築システムおよびモデル構築方法を提供することである。 The problem to be solved by the present invention is to provide a model construction system and a model construction method capable of constructing a model having a high generalization ability while suppressing a decrease in accuracy.
実施形態に係るモデル構築システムは、ベースモデル構築部と、類似度算出部と、変形モデル構築部と、汎化能力算出部と、を備える。前記ベースモデル構築部は、複数の入力変数から選択された選択入力変数と、出力変数と、の関係を表すベースモデルを構築する。前記類似度算出部は、前記複数の入力変数のうち前記選択入力変数以外の非選択入力変数と、前記選択入力変数と、の間の類似度を算出する。前記変形モデル構築部は、前記類似度に基づき、前記選択入力変数の少なくとも一部を、前記非選択入力変数と入れ換え、入れ換えた後の入力変数と出力変数との関係を表す変形モデルを構築する。前記汎化能力算出部は、前記ベースモデルおよび前記変形モデルの汎化能力を算出する。 The model construction system according to the embodiment includes a base model construction unit, a similarity calculation unit, a deformation model construction unit, and a generalization ability calculation unit. The base model construction unit constructs a base model representing a relationship between a selected input variable selected from a plurality of input variables and an output variable. The similarity calculation unit calculates a similarity between a non-selected input variable other than the selected input variable and the selected input variable among the plurality of input variables. The deformation model constructing unit replaces at least a part of the selected input variable with the non-selected input variable based on the similarity, and constructs a deformation model representing a relationship between the input variable and the output variable after the replacement. . The generalization ability calculation unit calculates the generalization ability of the base model and the deformation model.
以下に、本発明の各実施形態について図面を参照しつつ説明する。
また、本願明細書と各図において、既に説明したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
Embodiments of the present invention will be described below with reference to the drawings.
In the present specification and each drawing, the same elements as those already described are denoted by the same reference numerals, and detailed description thereof is omitted as appropriate.
図1は、実施形態に係るモデル構築システム1の構成を表すブロック図である。
図2および図3は、実施形態に係るモデル構築システム1による処理の一例を説明する図である。
FIG. 1 is a block diagram illustrating a configuration of a
2 and 3 are diagrams for explaining an example of processing by the
図1に表すように、モデル構築システム1は、取得部100、ベースモデル構築部102、モデル情報保存部104、類似度算出部106、類似度情報保存部108、変形モデル構築部110、汎化能力算出部112、外部出力部114、規定数データベース120、および変数データベース122を備える。
As illustrated in FIG. 1, the
規定数データベース120は、規定数を記憶する。規定数は、モデル構築システム1において構築されるモデルの数を表す。規定数は、例えば、予めユーザによって入力される。変数データベース122は、入力変数および出力変数に関して、それぞれの変数の実測値である変数データを記憶している。
The
取得部100は、規定数データベース120および変数データベース122から、それぞれ、規定数および変数データを取得する。取得部100は、取得した情報を、ベースモデル構築部102に出力する。
The
ベースモデル構築部102は、取得部100から出力された複数の入力変数から、一部の入力変数を選択する。ベースモデル構築部102は、取得部100によって取得された変数データを用いて、選択された入力変数と出力変数との関係を表すモデルを構築する。入力変数の選択およびモデルの構築は、例えば、Least Absolute Shrinkage and Selection Operator(Lasso)、Elastic Net、Ridge、Least Angle Regression(LARS)、Non Negative Garrote、またはSmoothly Clipped Absolute Deviation(SCAD)を用いて行うことができる。あるいは、入力変数の選択を、ステップワイズ、Variable Important in the Projection(VIP)、遺伝的アルゴリズム、およびNearest Correlation Louvain Method(NCLM)のいずれかを用いて行い、モデルの構築を、重回帰またはPartial Least Squares(PLS)を用いて行っても良い。
The base
以降では、ベースモデル構築部102によるモデル構築の際に選択された入力変数を「選択入力変数」と言う。、選択されなかった変数を「非選択入力変数」と言う。選択入力変数は、取得部100によって取得された複数の入力変数の一部である。非選択入力変数は、複数の入力変数の別の一部である。非選択入力変数は、選択入力変数と異なる。また、ベースモデル構築部102によって、選択入力変数を用いて構築されたモデルを「ベースモデル」と言う。ベースモデルは、複数の選択入力変数を含む入力変数群と、出力変数と、の関係を表す。
Hereinafter, the input variable selected at the time of model construction by the base
ベースモデル構築部102は、構築したベースモデルを、モデル情報保存部104に出力する。これにより、モデル情報保存部104に、モデル情報が保存される。また、ベースモデル構築部102は、ベースモデルを、類似度算出部106および変形モデル構築部110にも出力する。
The base
類似度算出部106は、ベースモデルに含まれる複数の選択入力変数のそれぞれと、複数の非選択入力変数のそれぞれと、の間の複数の類似度を算出する。例えば、相関係数、偏相関係数、正準相関、またはRidge決定係数などを類似度として用いることができる。類似度算出部106は、算出した類似度を、類似度情報保存部108に出力する。
The
変形モデル構築部110は、類似度情報保存部108から入力変数の類似度情報を取得する。変形モデル構築部110は、この類似度情報に基づいて、複数の選択入力変数の少なくとも一部を、複数の非選択入力変数の少なくとも一部と入れ替える。これにより、別の入力変数群が生成される。このとき、変形モデル構築部110は、ベースモデルに含まれる複数の選択入力変数の全てを、複数の非選択入力変数の少なくとも一部と入れ替えても良い。または、変形モデル構築部110は、ベースモデルに含まれる複数のの選択入力変数の一部を、複数の非選択入力変数の少なくとも一部と入れ替えても良い。変形モデル構築部110は、上記別の入力変数群と出力変数との関係を表すモデルを構築する。以降では、変形モデル構築部110によって構築されたこのモデルを「変形モデル」と言う。
The deformation
変形モデル構築部110によって構築された変形モデルのモデル情報は、モデル情報保存部104に保存される。また、変形モデル構築部110は、モデル構築システム1によって構築されたベースモデルと変形モデルの総数が規定数に達しているか判定する。構築されたモデルの総数が規定数に達していない場合、変形モデル構築部110は、変形モデルに含まれる変数を入れ換えながら、さらに他の変形モデルを繰り返し構築していく。
The model information of the deformed model constructed by the deformed
ベースモデルおよび変形モデルの総数が規定数に達すると、汎化能力算出部112によって、構築された各モデルの汎化能力が算出される。汎化能力算出部112は、モデル情報保存部104に保存されたモデル情報(ベースモデルおよび変形モデル)を取得し、変数データベース122から変数データを取得する。このとき、汎化能力算出部112は、ベースモデルおよび変形モデルの構築時とは異なる範囲の変数データ(未知のデータ)を取得する。例えば、汎化能力算出部112は、未知のデータの入力変数に対してベースモデルおよび変形モデルを適用する。汎化能力算出部112は、各モデルの予測値と出力変数の実測値とを比較し、予測の精度を各モデルの汎化能力として算出する。
When the total number of base models and deformation models reaches a specified number, the generalization
一例として、ベースモデルおよび変形モデルは、ある製造装置で得られた各種データ(温度や、圧力、出来栄え)を入力変数および出力変数として構築される。この場合、各モデルを、別の製造装置で得られた変数データに適用し、その精度を各モデルの汎化能力として算出する。
または、ベースモデルおよび変形モデルは、ある製造装置の所定期間に得られた変数データに基づいて構築される。この場合、各モデルを、当該装置の別の期間に得られたデータに適用し、その精度を各モデルの汎化能力として算出しても良い。
汎化能力は、例えば、Mean Square Error(MSE)、Root Mean Square Error(RMSE)、決定係数(R2)、相関係数、Akaike's Information Criterion(AIC)、またはBayesian Information Criterion(BIC)などを用いて算出される。汎化能力算出部112は、各モデルについての汎化能力の算出結果を、外部出力部114に出力する。
As an example, the base model and the deformation model are constructed by using various data (temperature, pressure, performance) obtained by a certain manufacturing apparatus as input variables and output variables. In this case, each model is applied to variable data obtained by another manufacturing apparatus, and the accuracy is calculated as the generalization ability of each model.
Alternatively, the base model and the deformation model are constructed based on variable data obtained during a predetermined period of a certain manufacturing apparatus. In this case, each model may be applied to data obtained in another period of the device, and the accuracy may be calculated as the generalization ability of each model.
Generalization ability uses, for example, Mean Square Error (MSE), Root Mean Square Error (RMSE), coefficient of determination (R 2 ), correlation coefficient, Akaike's Information Criterion (AIC), or Bayesian Information Criterion (BIC) Is calculated. The generalization
外部出力部114は、最も汎化能力が高かったベースモデルおよび変形モデルの1つを、ディスプレイ上でユーザに対して表示させ、または所定のファイル形式で出力させる。外部出力部114は、最も高い汎化能力を有するモデルを含む複数のモデルを出力しても良い。
The
ここで、図2および図3を参照しつつ、複数の具体的な例について説明する。
例えば、12個の入力変数Xi(i=1〜12の自然数)と出力変数Yとの変数データが変数データベース122に記憶されている。この場合、ベースモデル構築部102は、12個の入力変数の一部を選択する。ベースモデル構築部102は、12個の入力変数の一部と出力変数Yとの間で、例えば以下の式(1)で表されるベースモデルを作成する。ベースモデル構築部102は、このベースモデルを、モデル情報保存部104に保存する。
Y=b1X1+b2X2+b3X3+b0 (1)
Here, a plurality of specific examples will be described with reference to FIGS. 2 and 3.
For example, variable data of 12 input variables X i (i = 1 to 12 natural number) and output variable Y are stored in the
Y = b 1 X 1 + b 2 X 2 + b 3 X 3 + b 0 (1)
次に、類似度算出部106は、選択入力変数であるX1、X2、およびX3のそれぞれと、非選択入力変数であるX4〜X12のそれぞれと、の間で、図2(a)に表すように、類似度を算出する。図2(a)では、類似度として相関係数を用いた場合を例示している。
Next, the
1つ目の方法として、変形モデル構築部110は、例えば、予め設定された閾値を用いる。変形モデル構築部110は、それぞれの選択入力変数について、閾値以上の類似度を有する少なくとも1つの非選択入力変数を抽出する。
図2(b)に表した例では、閾値は80%に設定され、それぞれの選択入力変数に対して類似度の高い非選択入力変数が抽出されている。すなわち、この例では、変数X1に対しては、変数X4、X5、X6が抽出されている。変数X2に対しては、変数X7、X8、X9が抽出され、変数X3に対しては、変数X10、X11、X12が抽出されている。これにより、1つの選択入力変数と、当該1つの選択入力変数と類似度が高い非選択入力変数と、の組が複数作成される。図2(a)に表す例では、非選択入力変数X12の類似度は、選択入力変数X1およびX3の両方に対して80%以上である。この場合、非選択入力変数X12は、例えば、より類似度の高い選択入力変数X3に対して割り当てられる。
As a first method, the deformation
In the example shown in FIG. 2B, the threshold is set to 80%, and non-selected input variables having a high similarity to each selected input variable are extracted. That is, in this example, variables X 4 , X 5 , and X 6 are extracted for variable X 1 . For variables X 2, variable X 7, X 8, X 9 is extracted, for the variable X 3, variables X 10, X 11, X 12 are extracted. Thereby, a plurality of sets of one selected input variable and a non-selected input variable having a high degree of similarity with the one selected input variable are created. In the example depicted in FIG. 2 (a), the similarity of the non-selected input variable X 12 is 80% or more with respect to both the selected input variables X 1 and X 3. In this case, the non-selected input variable X 12 is assigned to the selected input variable X 3 having a higher similarity, for example.
変形モデル構築部110は、それぞれの組について、例えば、選択入力変数と非選択入力変数とを一様な確率で入れ換える。変形モデル構築部110は、入れ換え後の選択入力変数と非選択入力変数との群に基づいて変形モデルを構築する。変形モデル構築部110は、この変形モデルを、モデル情報保存部104に保存する。例えば、図2(a)および図2(b)に表した例において、変数X1およびX3が入れ換えられず、変数X2が変数X7に入れ換えられる。この場合、変形モデル構築部110は、これらの入力変数に基づいて以下の式(2)で表される変形モデルを構築し、モデル情報保存部104に保存する。
Y=b5X1+b6X7+b7X3+b4 (2)
For each pair, for example, the deformation
Y = b 5 X 1 + b 6 X 7 + b 7 X 3 + b 4 (2)
2つ目の方法として、変形モデル構築部110は、非選択入力変数の類似度に基づく確率を設定する。変形モデル構築部110は、この確率に従って、少なくとも1つの選択入力変数と少なくとも1つの非選択入力変数とを入れ換える。図2(c)は、図2(a)に表した類似度の算出結果を、各選択入力変数に対して類似度が高い非選択入力変数から順に並べたものである。各非選択入力変数の類似度を用いて、選択入力変数Xj(j=1、2、3)と、非選択入力変数Xk(k=4〜12)と、を入れ換える確率Pjkを、例えば、以下の式(3)のように設定される。αは、入れ換えをしない確率のために設定される数値である。
As a second method, the deformation
変形モデル構築部110は、式(3)で表される確率に従って選択入力変数と非選択入力変数とを入れ換える。変形モデル構築部110は、式(2)と同様に変形モデルを構築し、この変形モデルをモデル情報保存部104に保存する。この方法によれば、先に説明した方法に比べて、類似度がより忠実に反映されて変形モデルが構築される。従って、先の方法に比べて、より出力変数に対する予測誤差が小さい入力変数Xの組み合わせで変形モデルが構築され易くなる。
The deformation
あるいは、3つ目の方法として、変形モデル構築部110は、実験計画法を用いて変形モデルを構築しても良い。具体的には、変形モデル構築部110は、まず、図2(b)に表したように、それぞれの選択入力変数に対して類似度の高い非選択入力変数を抽出する。次に、変形モデル構築部110は、実験計画法を用いて、図3(a)に表すように直交表を作成し、この直交表に基づいて順番に変形モデルを構築していく。汎化能力算出部112は、直交表に基づいて構築されたそれぞれの変形モデルについて、図3(b)に表すように、汎化能力(MSE)を算出する。変形モデル構築部110は、汎化能力の算出結果を参照し、変数を入れ換えたことによる主効果を算出する。そして、変形モデル構築部110は、汎化能力が最も高くなるように、複数の選択入力変数の少なくとも一部を、主効果が最も大きい少なくとも1つの非選択入力変数と入れ換えて変形モデルを構築する。変形モデル構構築部110は、この変形モデルを外部へ出力する。
Alternatively, as a third method, the deformation
この方法において、変形モデル構築部110は、直交表を作成した際に、直交表に基づいて構築される変形モデルの数が、規定数以下か判定を行っても良い。構築される変形モデルの数が規定数以下である場合は、上述した方法に従って変形モデルの構築や主効果の算出を行う。構築される変形モデルの数が規定数を超える場合、モデル構築システム1は、例えば、外部出力部114からエラーを出力するか、1つ目か2つ目の方法に切り替えて変形モデルを構築していく。
In this method, the deformation
図4は、実施形態に係るモデル構築方法の一例を表すフローチャートである。
図5は、実施形態に係るモデル構築方法の別の一例を表すフローチャートである。
図4に表したフローチャートは、図2(a)〜図2(c)を用いて説明した1つ目および2つ目の方法に対応する。図5に表したフローチャートは、図3を用いて説明した3つ目の方法に対応する。
FIG. 4 is a flowchart illustrating an example of a model construction method according to the embodiment.
FIG. 5 is a flowchart illustrating another example of the model construction method according to the embodiment.
The flowchart shown in FIG. 4 corresponds to the first and second methods described with reference to FIGS. 2 (a) to 2 (c). The flowchart shown in FIG. 5 corresponds to the third method described with reference to FIG.
まず、図4に表したフローチャートについて説明する。
取得部100が、規定数データベース120および変数データベース122から、規定数および変数データを取得する(ステップS1)。ベースモデル構築部102が、複数の入力変数の一部を選択し、ベースモデルを構築する(ステップS2)。ベースモデル構築部102は、構築されたベースモデルのモデル情報を、モデル情報保存部104に保存する(ステップS3)。
First, the flowchart shown in FIG. 4 will be described.
The
類似度算出部106は、ベースモデルの構築のために選択された複数の選択入力変数のそれぞれと、選択されなかった複数の非選択入力変数のそれぞれと、の間の類似度を算出する(ステップS4)。類似度算出部106は、算出されたこれらの変数間の類似度を、類似度情報保存部108に保存する(ステップS5)。変形モデル構築部110は、少なくとも1つの選択入力変数を、当該少なくとも1つの選択入力変数と類似度が高い非選択入力変数と入れ換える。変形モデル構築部110は、入れ換え後の入力変数群に基づいて変形モデルを構築する(ステップS6)。
The
変形モデル構築部110は、構築された変形モデルのモデル情報を、モデル情報保存部104に保存する(ステップS7)。変形モデル構築部110は、構築されたモデル数が、ステップS1で取得された規定数に達したか判定する(ステップS8)。規定数に達していない場合、規定数に達するまで、ステップS6およびS7を繰り返し行う。
The deformation
構築されたモデル数が規定数に達すると、汎化能力算出部112は、構築されたモデルの汎化能力を算出するための変数データを、変数データベース122から取得する(ステップS9)。また、汎化能力算出部112は、モデル情報保存部104から、ベースモデルおよび変形モデルのモデル情報を取得し、各モデルの汎化能力を算出する(ステップS10)。外部出力部114は、汎化能力が高いモデルを選択し、外部に出力する(ステップS11)。
When the number of constructed models reaches the specified number, the generalization
次に、図5に表したフローチャートについて説明する。
ステップS1〜S5を、図4に表したフローチャートのステップS1〜S5と同様に実行する。変形モデル構築部110は、類似度情報保存部108に保存された類似度に基づいて、直交表を作成する(ステップS6)。変形モデル構築部110は、直交表に基づいて作成される変形モデルの数が、規定数以下か判定する(ステップS7)。変形モデルの数が規定数を超える場合、実験計画法を用いた変形モデルの構築を終了する。変形モデルの数が規定数以下の場合、変形モデル構築部110は、直交表に基づいて別の変形モデルを構築する(ステップS8)。
Next, the flowchart shown in FIG. 5 will be described.
Steps S1 to S5 are executed in the same manner as steps S1 to S5 in the flowchart shown in FIG. The deformation
変形モデル構築部110は、構築された変形モデルのモデル情報を、モデル情報保存部104に保存する(ステップS9)。汎化能力算出部112は、構築されたモデルの汎化能力を算出するための変数データを、変数データベース122から取得する(ステップS10)。また、汎化能力算出部112は、モデル情報保存部104から、ベースモデルおよび変形モデルのモデル情報を取得し、各モデルの汎化能力を算出する(ステップS11)。汎化能力算出部112は、汎化能力の算出結果を参照し、変数を入れ換えたことによる主効果を算出する(ステップS12)。変形モデル構築部110は、選択入力変数の少なくとも一部を、主効果が最も大きい少なくとも1つの非選択入力変数と入れ換えて、別の変形モデルを構築する(ステップS13)。外部出力部114は、ステップS13で構築された別の変形モデルを、最も汎化能力が高いモデルとして外部に出力する(ステップS14)。
The deformation
図6は、実施形態に係るモデル構築システム1を実現するためのモデル構築装置2の構成を例示するブロック図である。
モデル構築装置2は、例えば、入力装置200、出力装置202、およびコンピュータ204を備える。コンピュータ204は、例えば、ROM(Read Only Memory)206、RAM(Random Access Memory)208、CPU(Central Processing Unit)210、および記憶装置HDD(Hard Disk Drive)212を有する。
FIG. 6 is a block diagram illustrating a configuration of the
The
入力装置200は、ユーザがモデル構築装置2に対して情報の入力を行うためのものである。入力装置200は、キーボードまたはタッチパネルなどである。
出力装置202は、モデル構築システム1によって得られる出力結果を、ユーザに対して出力するためのものである。出力装置202は、ディスプレイまたはプリンタなどである。
The
The
ROM206は、モデル構築装置2の動作を制御するプログラムを格納している。ROM206は、コンピュータ204を、図1に表した、取得部100、ベースモデル構築部102、類似度算出部106、変形モデル構築部110、汎化能力算出部112、および外部出力部114として機能させるために必要なプログラムを格納している。
The
RAM208は、ROM206に格納されたプログラムが展開される記憶領域として機能する。CPU210は、ROM103に格納された制御プログラムを読み込み、当該制御プログラムに従ってコンピュータ204の動作を制御する。また、CPU210は、コンピュータ204の動作によって得られた様々なデータをRAM208に展開する。
The
HDD212は、図1に表した、規定数データベース120および変数データベース122を格納している。また、HDD212は、構築されたモデルや算出された類似度が保存される、モデル情報保存部104および類似度情報保存部108としても機能する。
The
ここで、以上で説明した実施形態の効果について説明する。
本実施形態に係るモデル構築システム1によれば、まず、ベースモデル構築部102によって、複数の選択入力変数を含む入力変数群を用いて、出力変数を精度良く予測できるベースモデルが構築される。さらに、変形モデル構築部110によって、複数の選択入力変数のそれぞれと複数の非選択入力変数のそれぞれとの間の類似度に基づき、複数の選択入力変数の少なくとも一部が複数の非選択入力変数の少なくとも一部と入れ換えられる。これにより、別の入力変数群が生成される。この別の入力変数群を用いて変形モデルが構築される。類似度を用いて複数の選択入力変数の少なくとも一部と複数の非選択入力変数の少なくとも一部とを入れ換えることで、上記別の入力変数群を用いて構築された変形モデルも、比較的高い精度で出力変数を予測することができる。そして、構築されたベースモデルおよび変形モデルは、汎化能力算出部112によって、汎化能力が算出される。このとき、汎化能力算出部112によって最も高い汎化能力が算出されたモデルは、上述の通り、出力変数を比較的高い精度で予測することが可能である。
すなわち、本実施形態によれば、精度の低下を抑制しつつ、汎化能力の高いモデルを構築することが可能となる。
Here, the effect of the embodiment described above will be described.
According to the
That is, according to the present embodiment, it is possible to construct a model with high generalization ability while suppressing a decrease in accuracy.
選択入力変数と非選択入力変数との入れ換えにおいては、例えば図2(a)および図2(b)に表したように、所定の閾値以上の非選択入力変数が抽出される。そして、抽出された非選択入力変数が、確率で選択入力変数と入れ換える。この方法によれば、選択入力変数と類似度の高い非選択入力変数のみが変形モデルの構築に用いられるため、変形モデルの精度の低下を抑えることができる。 In the replacement of the selected input variable and the non-selected input variable, for example, as illustrated in FIGS. 2A and 2B, a non-selected input variable equal to or greater than a predetermined threshold is extracted. Then, the extracted non-selected input variable is replaced with the selected input variable with probability. According to this method, only non-selected input variables having a high similarity to the selected input variable are used for constructing the deformation model, so that it is possible to suppress a decrease in accuracy of the deformation model.
または、図2(a)および図2(c)に表したように、全ての非選択入力変数について、類似度に基づく入れ換えの確率が設定される。この確率に従って複数の選択入力変数の少なくとも一部が複数の非選択入力変数の少なくとも一部と入れ換えられても良い。非選択入力変数の類似度が低いほど、選択入力変数が当該非選択入力変数と入れ換わる確率も低下する。このため、この方法においても、変形モデルの精度の低下を抑えることができる。また、この方法によれば、多様な変形モデルが構築されるため、より汎化能力の高いモデルを構築することが可能となる。 Alternatively, as shown in FIGS. 2A and 2C, replacement probabilities based on similarity are set for all non-selected input variables. According to this probability, at least some of the plurality of selected input variables may be replaced with at least some of the plurality of non-selected input variables. The lower the similarity of a non-selected input variable, the lower the probability that the selected input variable will be replaced with the non-selected input variable. For this reason, also in this method, a decrease in accuracy of the deformation model can be suppressed. Also, according to this method, since various deformation models are constructed, it is possible to construct a model with higher generalization ability.
あるいは、図3(a)および図3(b)に表したように、直交表に基づいて変数が入れ換えられ、汎化能力が算出されても良い。主効果が最も高くなるように複数の選択入力変数の一部が複数の非選択入力変数の少なくとも一部と入れ換えられて変形モデルが構築される。この方法によれば、精度の低下を抑制しつつ、より一層汎化能力の高いモデルを構築することが可能となる。また、この方法によれば、選択入力変数と抽出された非選択入力変数との全ての組み合わせについて変形モデルを構築する必要が無く、汎化能力の高い変形モデルをより短時間で効率的に構築することが可能となる。 Alternatively, as shown in FIG. 3A and FIG. 3B, the generalization ability may be calculated by exchanging variables based on the orthogonal table. A deformation model is constructed by replacing some of the plurality of selected input variables with at least some of the plurality of non-selected input variables so that the main effect is the highest. According to this method, it is possible to construct a model with higher generalization ability while suppressing a decrease in accuracy. In addition, according to this method, there is no need to construct a deformation model for all combinations of selected input variables and extracted non-selected input variables, and a deformation model with high generalization ability can be constructed more quickly and efficiently. It becomes possible to do.
以下で、具体的な実施例について説明する。 Hereinafter, specific examples will be described.
(第1実施例)
第1実施例では、電子機器の製造装置において、加工後のワークの出来栄えを出力変数としている。製造装置に設けられた各種センサのデータ(温度や圧力等)を入力変数としている。規定数は、100に設定した。複数の入力変数の選択およびベースモデルの構築は、Adaptive Lassoを用いた。類似度には、選択入力変数と非選択入力変数との間の相関係数を用いた。相関係数が0.5以上の非選択入力変数を抽出し、一様な確率で選択入力変数と入れ換えを行った。選択入力変数と非選択入力変数を入れ換えた後のモデルの構築は、重回帰を用いた。各モデルは、所定の構築期間T0における変数データに基づいて構築された。汎化能力の算出は、同じ製造装置において、構築期間T0の後のテスト期間T1〜T5の各期間の変数データを用いた。
(First embodiment)
In the first embodiment, in the electronic device manufacturing apparatus, the work quality after processing is used as an output variable. Data (temperature, pressure, etc.) of various sensors provided in the manufacturing apparatus are used as input variables. The specified number was set to 100. Adaptive Lasso was used to select multiple input variables and to build a base model. For the similarity, a correlation coefficient between a selected input variable and a non-selected input variable was used. A non-selected input variable having a correlation coefficient of 0.5 or more was extracted and replaced with a selected input variable with a uniform probability. Multiple regression was used to build the model after swapping selected and unselected input variables. Each model was constructed based on variable data in a predetermined construction period T0. For the calculation of the generalization ability, variable data for each period of the test periods T1 to T5 after the construction period T0 was used in the same manufacturing apparatus.
図7は、実施形態に係るモデル構築システム1を用いて構築したモデルの特性を例示するグラフである。
図7(a)は、各期間におけるR2を表している。図7(b)は、各期間におけるMSEを表している。
図7(a)および図7(b)では、ベースモデルと最も汎化能力の高い変形モデルのみを表している。ベースモデルの結果は、〇(白丸)で表されている。最も汎化能力の高い変形モデルの結果は、●(黒丸)で表されている。
FIG. 7 is a graph illustrating characteristics of a model constructed using the
FIG. 7A shows R 2 in each period. FIG. 7B shows the MSE in each period.
FIGS. 7A and 7B show only the base model and the deformation model having the highest generalization ability. The result of the base model is represented by ○ (white circle). The result of the deformation model with the highest generalization ability is represented by ● (black circle).
図7(a)および図7(b)の結果から、変形モデルは、ベースモデルと同様に、高いR2および小さいMSEが得られ、良好な精度を有することが分かる。テスト期間がより未来に移るに連れて、ベースモデルおよび変形モデルの精度は低下している。テスト期間T4およびT5では、変形モデルの精度の低下が、ベースモデルの精度の低下に比べて緩やかであり、より高い精度を有することが分かる。すなわち、この結果から、本実施形態によって得られた変形モデルは、ベースモデルとほぼ同等の精度を有することが分かる。さらに、変形モデルは、ベースモデルに比べて長期間の変数データに対してより高い精度を有し、高い汎化能力を備えていることがわかる。 From the results of FIG. 7A and FIG. 7B, it can be seen that the deformed model has a high R 2 and a small MSE, and has good accuracy, like the base model. As the test period moves to the future, the accuracy of the base model and the deformation model is decreasing. In the test periods T4 and T5, it can be seen that the decrease in accuracy of the deformed model is more gradual than the decrease in accuracy of the base model, and has higher accuracy. That is, it can be seen from this result that the deformation model obtained by the present embodiment has almost the same accuracy as the base model. Furthermore, it can be seen that the deformation model has higher accuracy for long-term variable data than the base model and has a high generalization capability.
(実施例2)
第2実施例では、電子機器の製造装置において、加工後のワークの出来栄えを出力変数としている。製造装置に設けられた各種センサのデータ(加工時温度や圧力等)を入力変数としている。出来栄えは、加工後のワークの寸法およびワークの加工レートの少なくともいずれかに基づく。規定数は、1000に設定した。複数の入力変数の選択およびベースモデルの構築は、Adaptive Lassoを用いた。類似度には、選択入力変数と非選択入力変数との間の相関係数を用いた。相関係数が0.5以上の非選択入力変数を抽出し、一様な確率で選択入力変数と入れ換えを行った。選択入力変数と非選択入力変数を入れ換えた後のモデルの構築は、重回帰を用いた。各モデルは、所定の構築期間T0における変数データに基づいて構築された。汎化能力の算出は、同じ製造装置において、構築期間T10の後のテスト期間T11〜T13の各期間の変数データを用いた。
(Example 2)
In the second embodiment, in the electronic device manufacturing apparatus, the work quality after processing is used as an output variable. Data of various sensors (such as processing temperature and pressure) provided in the manufacturing apparatus are used as input variables. The performance is based on at least one of the dimension of the workpiece after machining and the machining rate of the workpiece. The specified number was set to 1000. Adaptive Lasso was used to select multiple input variables and to build a base model. For the similarity, a correlation coefficient between a selected input variable and a non-selected input variable was used. A non-selected input variable having a correlation coefficient of 0.5 or more was extracted and replaced with a selected input variable with a uniform probability. Multiple regression was used to build the model after swapping selected and unselected input variables. Each model was constructed based on variable data in a predetermined construction period T0. For the calculation of the generalization ability, variable data for each period of the test periods T11 to T13 after the construction period T10 was used in the same manufacturing apparatus.
図8は、実施形態に係るモデル構築システム1を用いて構築したモデルの特性を例示するグラフである。
図8(a)は、各期間における各モデルのR2を表している。図8(b)は、各期間における各モデルのMSEを表している。
図8(a)および図8(b)では、ベースモデルと最も汎化能力の高い変形モデルのみを表している。ベースモデルの結果は、〇(白丸)で表されている。最も汎化能力の高い変形モデルの結果は、●(黒丸)で表されている。
FIG. 8 is a graph illustrating characteristics of a model constructed using the
FIG. 8A shows R 2 of each model in each period. FIG. 8B shows the MSE of each model in each period.
8A and 8B show only the base model and the deformation model having the highest generalization ability. The result of the base model is represented by ○ (white circle). The result of the deformation model with the highest generalization ability is represented by ● (black circle).
図8(a)および図8(b)の結果から、構築時においては、ベースモデルのR2およびMSEは、それぞれ、変形モデルのR2およびMSEとほぼ同じである。すなわち、変形モデルの精度は、ベースモデルの精度と同等である。
そして、ベースモデルについては、時間が経過するほど、R2が低下し、且つMSEが増大している。これに対して、変形モデルについては、R2の低下が期間T12からT13にかけて停止している。また、MSEは、期間T12からT13で低下している。これらの結果は、変形モデルが高い精度を有し、且つ変形モデルの汎化能力が、ベースモデルの汎化能力よりも高いことを示している。
From the results of FIGS. 8A and 8B, at the time of construction, R 2 and MSE of the base model are almost the same as R 2 and MSE of the deformation model, respectively. That is, the accuracy of the deformation model is equivalent to the accuracy of the base model.
As for the base model, as time elapses, R 2 decreases and MSE increases. In contrast, for the deformation model, reduction of R 2 is stopped from time T12 toward T13. In addition, MSE decreases from period T12 to T13. These results indicate that the deformation model has high accuracy, and the generalization ability of the deformation model is higher than the generalization ability of the base model.
以上、本発明のいくつかの実施形態を例示したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更などを行うことができる。これら実施形態やその変形例は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。また、前述の各実施形態は、相互に組み合わせて実施することができる。 As mentioned above, although several embodiment of this invention was illustrated, these embodiment is shown as an example and is not intending limiting the range of invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, changes, and the like can be made without departing from the spirit of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and equivalents thereof. Further, the above-described embodiments can be implemented in combination with each other.
1 モデル構築システム、 2 モデル構築装置、 100 取得部、 102 ベースモデル構築部、 104 モデル情報保存部、 106 類似度算出部、 108 類似度情報保存部、 110 変形モデル構築部、 112 汎化能力算出部、 114 外部出力部、 120 規定数データベース、 122 変数データベース
DESCRIPTION OF
Claims (6)
前記複数の入力変数のうち前記選択入力変数以外の非選択入力変数と、前記選択入力変数と、の間の類似度を算出する類似度算出部と、
前記類似度に基づき、前記選択入力変数の少なくとも一部を、前記非選択入力変数と入れ換え、入れ換えた後の入力変数と出力変数との関係を表す変形モデルを構築する変形モデル構築部と、
前記ベースモデルおよび前記変形モデルの汎化能力を算出する汎化能力算出部と、
を備えたモデル構築システム。 A base model construction unit that constructs a base model representing a relationship between a selected input variable selected from a plurality of input variables and an output variable;
A similarity calculation unit for calculating a similarity between a non-selected input variable other than the selected input variable among the plurality of input variables and the selected input variable;
Based on the similarity, at least a part of the selected input variable is replaced with the non-selected input variable, and a modified model construction unit that constructs a modified model representing the relationship between the input variable and the output variable after replacement,
A generalization ability calculator for calculating a generalization ability of the base model and the deformation model;
Model building system with
前記汎化能力算出部は、それぞれの前記変形モデルの汎化能力を算出し、
前記変形モデル構築部は、当該汎化能力の算出結果から、変数を入れ換えたことによる主効果を算出し、前記主効果が最も高くなるように、前記選択入力変数の少なくとも一部を前記主効果が最も大きい前記非選択入力変数に入れ換えて変形モデルを構築する請求項2記載のモデル構築システム。 The deformation model construction unit creates an orthogonal table using an experimental design from the selected input variable and the extracted non-selected input variable, and constructs a plurality of deformation models based on the orthogonal table,
The generalization ability calculator calculates the generalization ability of each of the deformation models,
The deformation model construction unit calculates a main effect by replacing the variable from the calculation result of the generalization ability, and at least a part of the selected input variable is the main effect so that the main effect becomes the highest. The model construction system according to claim 2, wherein a deformation model is constructed by replacing the non-selected input variable having the largest value.
それぞれの前記選択入力変数に対して、前記類似度に基づき、それぞれの前記非選択入力変数との入れ換えを行う確率を設定し、
前記確率に従って前記選択入力変数の少なくとも一部を前記非選択入力変数と入れ換えて、前記変形モデルを構築する
請求項1記載のモデル構築システム。 The deformation model construction unit
For each of the selected input variables, based on the similarity, set a probability of replacing each of the non-selected input variables,
The model construction system according to claim 1, wherein the deformation model is constructed by replacing at least a part of the selected input variables with the non-selected input variables according to the probability.
前記複数の入力変数のうち前記選択入力変数以外の非選択入力変数と、前記選択入力変数と、の間の類似度を算出し、
前記類似度に基づき、前記選択入力変数の少なくとも一部を、前記非選択入力変数と入れ換え、入れ換えた後の入力変数と出力変数との関係を表す変形モデルを構築し、
前記ベースモデルおよび前記変形モデルの汎化能力を算出するモデル構築方法。 Build a base model that represents the relationship between the selected input variable selected from multiple input variables and the output variable,
Calculating a similarity between a non-selected input variable other than the selected input variable among the plurality of input variables and the selected input variable;
Based on the similarity, at least a part of the selected input variable is replaced with the non-selected input variable, and a deformation model representing the relationship between the input variable after the replacement and the output variable is constructed,
A model construction method for calculating a generalization ability of the base model and the deformation model.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107106843A TWI677799B (en) | 2017-03-29 | 2018-03-01 | Model building system and method |
CN201810193409.8A CN108693787A (en) | 2017-03-29 | 2018-03-09 | Model construction system and model building method |
US15/922,262 US20180285317A1 (en) | 2017-03-29 | 2018-03-15 | Model generation system and model generation method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017064791 | 2017-03-29 | ||
JP2017064791 | 2017-03-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018169999A true JP2018169999A (en) | 2018-11-01 |
JP6767355B2 JP6767355B2 (en) | 2020-10-14 |
Family
ID=64018718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017249728A Active JP6767355B2 (en) | 2017-03-29 | 2017-12-26 | Model building system and model building method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6767355B2 (en) |
TW (1) | TWI677799B (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020213560A1 (en) * | 2019-04-15 | 2020-10-22 | 日本電信電話株式会社 | Model learning device, data analysis device, model learning method, and program |
CN115879586A (en) * | 2022-01-11 | 2023-03-31 | 北京中关村科金技术有限公司 | Complaint prediction optimization method and device based on ablation experiment and storage medium |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09167152A (en) * | 1995-12-19 | 1997-06-24 | Hitachi Ltd | Interactive model preparing method |
JP2015087973A (en) * | 2013-10-31 | 2015-05-07 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Generation device, generation method, and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4211706B2 (en) * | 2004-07-28 | 2009-01-21 | 株式会社日立製作所 | Traffic information provision device |
US7774670B2 (en) * | 2007-09-11 | 2010-08-10 | Globalfoundries Inc. | Method and apparatus for dynamically determining tester recipes |
JP5130851B2 (en) * | 2007-09-27 | 2013-01-30 | 富士通株式会社 | Model creation support system, model creation support method, model creation support program |
TWI649761B (en) * | 2013-03-15 | 2019-02-01 | 美商普羅托斯數位健康公司 | System for state characterization based on multi-variate data fusion techniques |
-
2017
- 2017-12-26 JP JP2017249728A patent/JP6767355B2/en active Active
-
2018
- 2018-03-01 TW TW107106843A patent/TWI677799B/en not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09167152A (en) * | 1995-12-19 | 1997-06-24 | Hitachi Ltd | Interactive model preparing method |
JP2015087973A (en) * | 2013-10-31 | 2015-05-07 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Generation device, generation method, and program |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020213560A1 (en) * | 2019-04-15 | 2020-10-22 | 日本電信電話株式会社 | Model learning device, data analysis device, model learning method, and program |
JP2020177290A (en) * | 2019-04-15 | 2020-10-29 | 日本電信電話株式会社 | Model learning device, data analysis device, model learning method, and program |
JP7151604B2 (en) | 2019-04-15 | 2022-10-12 | 日本電信電話株式会社 | Model learning device, data analysis device, model learning method, and program |
CN115879586A (en) * | 2022-01-11 | 2023-03-31 | 北京中关村科金技术有限公司 | Complaint prediction optimization method and device based on ablation experiment and storage medium |
CN115879586B (en) * | 2022-01-11 | 2024-01-02 | 北京中关村科金技术有限公司 | Complaint prediction optimization method and device based on ablation experiment and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP6767355B2 (en) | 2020-10-14 |
TW201837761A (en) | 2018-10-16 |
TWI677799B (en) | 2019-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6740157B2 (en) | Analysis device, analysis method, and program | |
US20180285317A1 (en) | Model generation system and model generation method | |
US9467567B1 (en) | System, method, and computer program for proactive customer care utilizing predictive models | |
JP5932612B2 (en) | Information processing apparatus, control method, program, and recording medium | |
JP2019135662A (en) | Leave-of-absence prediction system, leave-of-absence prediction method, and program | |
JP6299759B2 (en) | Prediction function creation device, prediction function creation method, and program | |
JPWO2016047118A1 (en) | Model evaluation apparatus, model evaluation method, and program recording medium | |
JP2018169999A (en) | Model construction system and model construction method | |
JPWO2016151618A1 (en) | Prediction model update system, prediction model update method, and prediction model update program | |
JP2017146888A (en) | Design support device and method and program | |
JP6178768B2 (en) | Quality control device and management method thereof | |
JP2018159992A (en) | Parameter adjustment device, learning system, parameter adjustment method and program | |
JP6992889B2 (en) | Judgment rule acquisition device, judgment rule acquisition method and judgment rule acquisition program | |
JPWO2016132684A1 (en) | Impact visualization system, method and program | |
JP3987059B2 (en) | Optimal value search support device, optimal value search support method, and recording medium | |
JP6627258B2 (en) | System model generation support device, system model generation support method, and program | |
Shu et al. | Computation of the run-length percentiles of CUSUM control charts under changes in variances | |
JP2022028611A (en) | Method, apparatus, device, and storage medium used for information processing | |
KR20180119443A (en) | Clustering method and apparatus using Gaussian Process Regression | |
US11768852B2 (en) | System and method for data analysis and presentation of data | |
JP6767356B2 (en) | Model building system and model building method | |
KR102269144B1 (en) | Machine tool vibration feature extraction device and method | |
WO2023007848A1 (en) | Data analysis device, data analysis method, and data analysis program | |
KR20190128783A (en) | Apparatus and method for processing time series data | |
US11443206B2 (en) | Adaptive filtering and modeling via adaptive experimental designs to identify emerging data patterns from large volume, high dimensional, high velocity streaming data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200917 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6767355 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |