JP2023063162A - Prediction model forming method and operating process condition setting method - Google Patents
Prediction model forming method and operating process condition setting method Download PDFInfo
- Publication number
- JP2023063162A JP2023063162A JP2021173506A JP2021173506A JP2023063162A JP 2023063162 A JP2023063162 A JP 2023063162A JP 2021173506 A JP2021173506 A JP 2021173506A JP 2021173506 A JP2021173506 A JP 2021173506A JP 2023063162 A JP2023063162 A JP 2023063162A
- Authority
- JP
- Japan
- Prior art keywords
- explanatory variables
- prediction model
- explanatory
- variable
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 230000008569 process Effects 0.000 title claims abstract description 60
- 238000012800 visualization Methods 0.000 claims abstract description 30
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- 238000004088 simulation Methods 0.000 description 17
- 238000003860 storage Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- General Factory Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、予測モデルの作成方法、操業プロセスの条件設定方法に関する。 TECHNICAL FIELD The present invention relates to a method for creating a prediction model and a method for setting operating process conditions.
製品の製造条件や製造環境の変化を考慮し、製品の品質を高精度に予測することは測定機器のIoT化などと相まって年々、重要性を増している。 Considering changes in product manufacturing conditions and manufacturing environment, highly accurate prediction of product quality is becoming more important year by year, coupled with the introduction of IoT in measuring equipment.
例えば、特許文献1には、過去に製造プロセスにて製造された製品群のデータを用いて、品質予測モデルを作成する品質予測装置が記載されている。
For example,
また、特許文献2には製造上重要なパラメータである高炉荷下り速度を予測する、高炉荷下り速度予測モデルの学習方法が開示されている。 Further, Patent Document 2 discloses a learning method of a blast furnace unloading speed prediction model for predicting the blast furnace unloading speed, which is an important parameter in manufacturing.
ところで、工業製品等を製造するための操業プロセスにおいては通常、原料のデータ、操業プロセスのデータや中間物の評価値などがデータとして採取される。最終特性や重要特性を目的変数とした予測モデルを作成する場合、該予測モデルは、上記データをパラメータ、すなわち説明変数として構築されることになる。 By the way, in the operation process for manufacturing industrial products, data on raw materials, data on the operation process, evaluation values of intermediates, and the like are usually collected as data. When creating a predictive model with final characteristics and important characteristics as objective variables, the predictive model is constructed using the above data as parameters, ie, explanatory variables.
そして、目的とする品質の製品を歩留まり良く製造する観点より、作成した予測モデルからフィードバックし、操業プロセスにおける上述のようなパラメータを算出し、設定できることが求められるようになっている。 From the viewpoint of manufacturing products of the desired quality with good yield, it is required to be able to feed back from the created prediction model and calculate and set the above-mentioned parameters in the operation process.
しかしながら、フィードバックを行い、操業プロセスにおけるパラメータを算出できる予測モデルの作成方法は提案されていなかった。 However, no method has been proposed for creating a predictive model that can be fed back to calculate parameters in the operational process.
そこで上記従来技術が有する問題に鑑み、本発明の一側面では、操業プロセスの説明変数にフィードバック可能な予測モデルを作成する予測モデルの作成方法を提供することを目的とする。 Therefore, in view of the above-described problems of the prior art, it is an object of one aspect of the present invention to provide a prediction model creation method for creating a prediction model that can be fed back to the explanatory variables of the operational process.
上記課題を解決するため本発明の一態様によれば、
操業プロセスに関する予め定めた目的変数を予測する予測モデルの作成方法であって、
前記目的変数についての複数の説明変数間の関係を、複数の前記説明変数間の相関係数を用いて可視化する可視化工程と、
前記可視化工程で可視化した前記説明変数間の関係を用いて、複数の前記説明変数を複数のクラスタに分割する分割工程と、
複数の前記クラスタから選択された1以上の前記クラスタにおいて、前記クラスタ毎に、前記クラスタに含まれる前記説明変数の中から、前記クラスタを代表する前記説明変数である、代表説明変数を選択する選択工程と、
前記選択工程で選択した前記代表説明変数を用いて、前記目的変数を予測する予測モデルを作成する予測モデル作成工程と、を有する予測モデルの作成方法を提供する。
In order to solve the above problems, according to one aspect of the present invention,
A method for creating a prediction model that predicts a predetermined objective variable related to an operating process,
a visualization step of visualizing the relationship between a plurality of explanatory variables for the objective variable using a correlation coefficient between the plurality of explanatory variables;
A division step of dividing the plurality of explanatory variables into a plurality of clusters using the relationships between the explanatory variables visualized in the visualization step;
In one or more of the clusters selected from the plurality of clusters, selecting a representative explanatory variable, which is the explanatory variable representing the cluster, from among the explanatory variables included in the cluster for each cluster. process and
and a prediction model creation step of creating a prediction model for predicting the objective variable using the representative explanatory variables selected in the selection step.
本発明の一態様によれば、操業プロセスの説明変数にフィードバック可能な予測モデルを作成する予測モデルの作成方法を提供することができる。 ADVANTAGE OF THE INVENTION According to 1 aspect of this invention, the preparation method of the prediction model which produces the prediction model which can be fed back to the explanatory variable of an operating process can be provided.
以下、本発明を実施するための形態について説明するが、本発明は、下記の実施形態に制限されることはなく、本発明の範囲を逸脱することなく、下記の実施形態に種々の変形および置換を加えることができる。
[予測モデルの作成方法]
本実施形態の予測モデルの作成方法について説明する。
Modes for carrying out the present invention will be described below, but the present invention is not limited to the following embodiments, and various modifications and variations can be made to the following embodiments without departing from the scope of the present invention. Substitutions can be added.
[Prediction model creation method]
A method for creating a prediction model according to this embodiment will be described.
本発明の発明者は、操業プロセスの説明変数にフィードバック可能な予測モデルを作成する予測モデルの作成方法について検討を行った。 The inventors of the present invention have studied a prediction model creation method that creates a prediction model that can be fed back to the explanatory variables of the operational process.
近年では操業プロセスは多工程に渡るプロセスとなっており、操業プロセスのパラメータも多くなっている。このように多工程に渡る操業プロセスにおいては、通常、原料のパラメータ、操業プロセスの各種パラメータや中間物の評価値などが、予測モデルの説明変数となりうる。しかしながら、多工程の場合、必然的にパラメータの種類が非常に多くなり、該パラメータを説明変数として予測モデルを作成した場合、フィードバックして、各説明変数の適切な値を求めることは非常に難しくなる。 In recent years, the operating process has become a multi-step process, and the number of operating process parameters has increased. In such a multi-step operation process, parameters of raw materials, various parameters of the operation process, evaluation values of intermediates, and the like can usually be explanatory variables of the prediction model. However, in the case of multiple processes, there are inevitably many types of parameters, and when a prediction model is created using the parameters as explanatory variables, it is very difficult to obtain appropriate values for each explanatory variable by providing feedback. Become.
例えば最終特性や重要特性である目的変数に関係するパラメータのみを説明変数として選択し、予測モデルを作成することも考えられる。しかし、原料のパラメータと中間物の評価値が無相関であるということは稀である。また、操業プロセスのパラメータも、各種のパラメータが連動して変化することが多く、互いに相関を持って動く量である。このため、予測モデルを作成する際に用いる説明変数を選択することは困難であった。 For example, it is conceivable to select only parameters related to objective variables, which are final characteristics and important characteristics, as explanatory variables to create a prediction model. However, it is rare that raw material parameters and intermediate evaluation values are uncorrelated. In addition, the parameters of the operating process often change in conjunction with each other, and are quantities that move in correlation with each other. Therefore, it has been difficult to select explanatory variables to be used when creating a prediction model.
そこで、本発明の発明者はさらに検討を行い、本発明の予測モデルの作成方法を完成させた。 Therefore, the inventors of the present invention conducted further studies and completed the method for creating a prediction model of the present invention.
本実施形態の予測モデルの作成方法は、操業プロセスに関する予め定めた目的変数を予測する予測モデルの作成方法であって、図1に示したフロー10の様に、以下の可視化工程S11、分割工程S12、選択工程S13、予測モデル作成工程S14を有することができる。
The method for creating a prediction model of the present embodiment is a method for creating a prediction model for predicting a predetermined target variable related to the operation process, and includes the following visualization step S11, division step, like the
なお、本実施形態の予測モデルの作成工程で作成する予測モデルの目的変数の種類は特に限定されず、例えば製造する製品について要求される最終特性や、特に重要な重要特性等が挙げられる。 The type of objective variable of the prediction model created in the prediction model creation process of the present embodiment is not particularly limited, and examples thereof include the final characteristics required for the product to be manufactured, particularly important characteristics, and the like.
可視化工程は、目的変数についての複数の説明変数間の関係を、複数の説明変数間の相関係数を用いて可視化できる。 The visualization step can visualize the relationship between a plurality of explanatory variables for the objective variable using correlation coefficients between the plurality of explanatory variables.
分割工程は、可視化工程で可視化した説明変数間の関係を用いて、複数の説明変数を複数のクラスタに分割できる。 The dividing step can divide the multiple explanatory variables into multiple clusters using the relationships between the explanatory variables visualized in the visualization step.
選択工程は、複数のクラスタから選択された1以上のクラスタにおいて、クラスタ毎に、クラスタに含まれる説明変数の中から、該クラスタを代表する説明変数である、代表説明変数を選択できる。 In one or more clusters selected from a plurality of clusters, the selecting step can select, for each cluster, a representative explanatory variable, which is an explanatory variable representing the cluster, from explanatory variables included in the cluster.
予測モデル作成工程は、選択工程で選択した代表説明変数を用いて、目的変数を予測する予測モデルを作成できる。
(1)各工程について
以下、各工程について説明する。
(1-1)可視化工程(S11)
可視化工程では、目的変数についての複数の説明変数間の関係を、複数の説明変数間の相関係数を用いて可視化できる。
The prediction model creation step can create a prediction model for predicting the objective variable using the representative explanatory variables selected in the selection step.
(1) About each process Hereinafter, each process is demonstrated.
(1-1) Visualization step (S11)
In the visualization step, the relationship between a plurality of explanatory variables for the objective variable can be visualized using correlation coefficients between the plurality of explanatory variables.
説明変数間の冗長性を削減する手法として、主成分分析などが一般的に用いられているが、フィードバック可能な予測モデルとするため、元の説明変数のまま扱うのが好ましい。 Although principal component analysis and the like are generally used as a technique for reducing redundancy between explanatory variables, it is preferable to treat the original explanatory variables as they are in order to create a predictive model that can be fed back.
そこで、本実施形態の予測モデルの作成方法では、説明変数間の相関係数に基づいて、相関係数の関係性を図示、すなわち可視化できる。 Therefore, in the prediction model creation method of the present embodiment, the relationship between the correlation coefficients can be illustrated, that is, visualized, based on the correlation coefficients between explanatory variables.
可視化工程では、まず作成する予測モデルの目的変数についての、操業プロセス中の説明変数を列挙できる。そして、列挙した全ての説明変数間の相関係数を求めることができる。この際、あわせて目的変数と説明変数との間の相関係数も合わせて求めておくこともできる。 In the visualization process, explanatory variables during the operation process can be enumerated for the target variable of the prediction model to be created first. Then, correlation coefficients between all enumerated explanatory variables can be obtained. At this time, a correlation coefficient between the objective variable and the explanatory variable can also be obtained together.
可視化に当たっては、相関係数をそのまま用いて図示することもできるが、例えば、説明変数間の相関係数をもとに距離を定義して、階層的クラスタリングを行う手法が好ましい。距離としては1-|r|などを用いることができる。なお、rは各説明変数同士の相関係数を意味する。 For visualization, the correlation coefficients can be used as they are, but it is preferable to define the distance based on the correlation coefficients between explanatory variables and perform hierarchical clustering. 1-|r| or the like can be used as the distance. In addition, r means the correlation coefficient between each explanatory variable.
作成する図は限定されず、説明変数と、該説明変数間の相関係数や、距離との関係が分かるような図とすることが好ましく、例えばデンドログラム(樹形図)等を作成できる。
(1-2)分割工程(S12)
分割工程では、可視化工程で可視化した説明変数間の関係を用いて、複数の説明変数を複数のクラスタ、すなわちグループに分割できる。
The diagram to be created is not limited, and it is preferable to create a diagram that shows the relationship between the explanatory variables, the correlation coefficients between the explanatory variables, and the distance. For example, a dendrogram (tree diagram) can be created.
(1-2) Division step (S12)
In the dividing step, the relationships between the explanatory variables visualized in the visualization step can be used to divide the plurality of explanatory variables into a plurality of clusters, ie, groups.
この際、分割するクラスタの数や、分割する条件は特に限定されないが、例えば上記相関係数や、距離について予め定めた閾値に基づいて分割できる。また、物理的意味付けを確認しながら、複数のクラスタに分割してもよい。 At this time, the number of clusters to be divided and conditions for division are not particularly limited. Also, it may be divided into a plurality of clusters while confirming the physical meaning.
なお、1つのクラスタに含まれる説明変数の数は特に限定されず、各クラスタは、任意の数の説明変数を含むことができる。また、クラスタ間で、含まれる説明変数の数が異なっていてもよい。
(1-3)選択工程(S13)
選択工程では、複数のクラスタから選択された1以上のクラスタにおいて、クラスタ毎に、クラスタに含まれる説明変数の中から、該クラスタを代表する説明変数である、代表説明変数を選択できる。
The number of explanatory variables included in one cluster is not particularly limited, and each cluster can include any number of explanatory variables. Also, the number of explanatory variables included may differ between clusters.
(1-3) Selection step (S13)
In the selection step, in one or more clusters selected from a plurality of clusters, a representative explanatory variable, which is an explanatory variable representing the cluster, can be selected from the explanatory variables included in each cluster.
既述のように、近年では操業プロセスが多工程化していることから、該操業プロセスに関する予測モデルを作成する場合、説明変数が非常に多くなる恐れがある。このため、該予測モデルについてフィードバックを行い、所望の目的変数を得るための説明変数を算出することが困難な場合があった。 As mentioned above, in recent years, the operating process has become multi-step, so there is a risk that the number of explanatory variables will be extremely large when creating a predictive model for the operating process. For this reason, it was sometimes difficult to feed back the predictive model and calculate explanatory variables for obtaining desired objective variables.
そこで、本実施形態の予測モデルの作成方法では、上記可視化工程、および分割工程で、関連性の高い説明変数をクラスタに分類し、選択された1以上のクラスタにおいて、各クラスタから代表的な説明変数を代表説明変数として選択し、予測モデルを作成できる。すなわち、類似する説明変数の変動を代表説明変数に代表させる予測モデルとすることができる。 Therefore, in the prediction model creation method of the present embodiment, in the visualization step and the division step, the explanatory variables with high relevance are classified into clusters, and in the selected one or more clusters, representative explanations from each cluster A variable can be selected as a representative explanatory variable to create a predictive model. That is, it is possible to obtain a prediction model in which fluctuations of similar explanatory variables are represented by representative explanatory variables.
このように関連性の高い説明変数をクラスタとして、該クラスタから代表値である代表説明変数を選択し、説明変数の数を絞ることで、目的変数からフィードバックを行い、説明変数を求めることが容易に行えるようになる。また、関連性の高い説明変数をクラスタとし、該クラスタから代表説明変数を選択するため、適切に説明変数を選択できる。
(1-3-1)代表説明変数の選択条件について
選択工程において、代表説明変数を選択する基準は特に限定されない。選択工程においては、予め定めた数の代表説明変数を、予め定めた条件により選択できる。
In this way, by clustering explanatory variables with high relevance and selecting a representative explanatory variable that is a representative value from the cluster and narrowing down the number of explanatory variables, it is easy to obtain explanatory variables by providing feedback from the objective variable. I will be able to do it. In addition, since explanatory variables with high relevance are clustered and representative explanatory variables are selected from the clusters, explanatory variables can be appropriately selected.
(1-3-1) Conditions for Selecting Representative Explanatory Variables In the selection process, the criteria for selecting representative explanatory variables are not particularly limited. In the selection step, a predetermined number of representative explanatory variables can be selected according to predetermined conditions.
該条件としては例えば、以下の条件1から条件4から選択された1種類以上とすることが好ましい。
(条件1)目的変数との相関係数が高い説明変数を選択する。
(条件2)操業プロセスのうち上流側の工程に関する説明変数を選択する。
(条件3)操業プロセスにおいて制御が容易な説明変数を選択する。
(条件4)クラスタに含まれる説明変数を用いて目的変数についての予測モデルを作成した場合に、目的変数に対する影響が高い説明変数を選択する。
As the conditions, for example, one or more selected from
(Condition 1) Select an explanatory variable with a high correlation coefficient with the objective variable.
(Condition 2) Select explanatory variables related to upstream processes in the operating process.
(Condition 3) Select explanatory variables that are easy to control in the operating process.
(Condition 4) When a prediction model for the objective variable is created using the explanatory variables included in the cluster, an explanatory variable having a high influence on the objective variable is selected.
なお、上記条件1~条件4は組み合わせて用いることもできる。また、例えばクラスタにより、条件を変更することもできる。
(条件1について)
目的変数との相関係数が高い説明変数を選択するとは、各クラスタを構成する説明変数と、目的変数との間の相関係数を求め、該相関係数が高い説明変数から順に、該クラスタから選択する説明変数の数にあわせて選択することを意味する。目的変数との間の相関係数が高い説明変数は、目的変数に大きな影響を与える変数であるから、上記条件で選択することで、特に適切な予測モデルとすることができる。
(条件2について)
操業プロセスのうち、上流側の工程に関する説明変数を選択するとは、クラスタを構成する説明変数を、関係する操業プロセスの上流側から順に並べ、該クラスタから選択する説明変数の数に応じて、該上流側から順に選択することを意味する。通常、変数間に相関がある場合、より操業プロセスの上流側を制御する方が妥当な場合が多いことから、上述の条件で選択することで、より適切な代表説明変数を選択できる。
(条件3について)
操業プロセスにおいて制御が容易な説明変数を選択するとは、例えば説明変数について、予め制御の容易さを数値化しておき、該クラスタから選択する説明変数の数に応じて、該数値に基づいて説明変数を選択することを意味する。予測モデルからフィードバックを行い、所望の目的物を得るための説明変数が得られた場合に、該説明変数が制御の容易なパラメータであれば、容易に操業プロセスを調整し、特に歩留まりを高められるからである。
(条件4について)
クラスタに含まれる説明変数を用いて目的変数についての予測モデルを作成した場合に、目的変数に対する影響が高い説明変数を選択する場合、まず代表説明変数の選択を行うクラスタに含まれる説明変数を用いて、目的変数についての予測モデルを作成する。そして、該予測モデルにおける、目的変数に対する影響度の高い説明変数を選択できる。具体的には例えば、説明変数について同じ変動幅とした場合に、目的変数の変動幅が大きい順に影響度の高い説明変数とすることができる。
(1-3-2)各クラスタから選択する代表説明変数の数について
選択工程において、各クラスタから選択する代表説明変数の数は特に限定されず、例えば各クラスタから選択する代表説明変数の数は1つであってもよく、複数であってもよい。また、クラスタ毎に選択する代表説明変数の数は異なっていてもよく、例えば重要度が低いと考えられるクラスタからは代表説明変数を1つも選択しなくてもよい。各クラスタから3つ以上の代表説明変数を選択することも可能であるが、フィードバックする際の手間が増加するため、各クラスタから選択される代表説明変数は2つ以下であることが好ましく、1つであることがより好ましい。
Note that
(Regarding Condition 1)
Selecting an explanatory variable with a high correlation coefficient with the objective variable means obtaining the correlation coefficient between the explanatory variables that make up each cluster and the objective variable, and determining the explanatory variables in descending order of the correlation coefficient. It means to select according to the number of explanatory variables to be selected from. An explanatory variable having a high correlation coefficient with the objective variable is a variable that greatly affects the objective variable, and therefore, by selecting the explanatory variable under the above conditions, a particularly appropriate prediction model can be obtained.
(Regarding Condition 2)
Selecting an explanatory variable related to the upstream process in the operating process means that the explanatory variables that make up the cluster are arranged in order from the upstream side of the related operating process, and the number of explanatory variables selected from the cluster is selected according to the number of explanatory variables. It means to select in order from the upstream side. Normally, when there is a correlation between variables, it is more appropriate to control the upstream side of the operating process in many cases, so by selecting under the above conditions, a more appropriate representative explanatory variable can be selected.
(Regarding condition 3)
Selecting an explanatory variable that is easy to control in the operating process means that, for example, for an explanatory variable, the ease of control is quantified in advance, and depending on the number of explanatory variables selected from the cluster, the explanatory variable is selected based on the numerical value. means to select When feedback is provided from the prediction model and explanatory variables for obtaining the desired target are obtained, if the explanatory variables are parameters that are easy to control, the operating process can be easily adjusted, especially yield can be increased. It is from.
(Regarding condition 4)
When creating a predictive model for the target variable using the explanatory variables included in the cluster, when selecting explanatory variables that have a high impact on the target variable, first use the explanatory variables included in the cluster for which the representative explanatory variable is selected. to create a predictive model for the target variable. Then, an explanatory variable having a high degree of influence on the objective variable can be selected in the prediction model. Specifically, for example, when the explanatory variables have the same fluctuation range, the explanatory variables with the highest degree of influence can be set in descending order of the fluctuation range of the objective variable.
(1-3-2) Number of representative explanatory variables selected from each cluster In the selection process, the number of representative explanatory variables selected from each cluster is not particularly limited. It may be one or plural. Also, the number of representative explanatory variables selected for each cluster may be different. For example, no representative explanatory variable may be selected from clusters considered to be of low importance. Although it is possible to select three or more representative explanatory variables from each cluster, it is preferable that the number of representative explanatory variables selected from each cluster is two or less. more preferably one.
代表説明変数は、全てのクラスタにおいて選択することも可能であるが、上述のようにクラスタによっては、代表説明変数を選択しないこともできるため、複数のクラスタから選択された1以上のクラスタで代表説明変数を選択できる。ただし、予測モデルを作成する際、代表説明変数は複数個あることが好ましいため、2以上のクラスタで代表説明変数を選択することがより好ましい。
(1-4)予測モデル作成工程(S14)
予測モデル作成工程では、選択工程で選択した代表説明変数を用いて、目的変数を予測する予測モデルを作成できる。
It is possible to select the representative explanatory variable in all clusters, but as described above, depending on the cluster, it is possible not to select the representative explanatory variable. You can select explanatory variables. However, since it is preferable to have a plurality of representative explanatory variables when creating a prediction model, it is more preferable to select representative explanatory variables in two or more clusters.
(1-4) Prediction model creation step (S14)
In the prediction model creation step, a prediction model for predicting the objective variable can be created using the representative explanatory variables selected in the selection step.
予測モデルは、線形回帰、ロジスティック回帰、ランダムフォレスト、ブースティング、ニューラルネットワーク等を用いて作成することができる。
(2)操業プロセスについて
本実施形態の予測モデルの作成方法を適用する操業プロセスは特に限定されず、任意の操業プロセスについて適用できる。
Prediction models can be created using linear regression, logistic regression, random forest, boosting, neural networks, and the like.
(2) Operation process The operation process to which the prediction model creation method of the present embodiment is applied is not particularly limited, and can be applied to any operation process.
以上に説明した本実施形態の予測モデルの作成方法により得られる予測モデルは、該予測モデルに用いられている代表説明変数は各クラスタを代表する重要な特徴量であり、その数も絞られている。このため、予測モデルをもとにその特徴量へフィードバックすることが容易に実行できる。 In the prediction model obtained by the prediction model creation method of the present embodiment described above, the representative explanatory variables used in the prediction model are important feature quantities representing each cluster, and the number of them is also narrowed down. there is Therefore, it is easy to feed back the feature amount based on the prediction model.
すなわち、本実施形態の予測モデルの作成方法によれば、操業プロセスの説明変数にフィードバック可能な予測モデルを作成できる。
[操業プロセスの条件設定方法]
本実施形態の操業プロセスの条件設定方法は、例えば、既述の予測モデルの作成方法により得られた予測モデルを用いて、複数の説明変数を設定することができる。
That is, according to the method of creating a prediction model of the present embodiment, it is possible to create a prediction model that can be fed back to the explanatory variables of the operational process.
[Method of setting operating process conditions]
The method of setting conditions for the operating process of the present embodiment can set a plurality of explanatory variables using, for example, the prediction model obtained by the above-described method of creating a prediction model.
具体的には、既述の予測モデルは目的変数と、該目的変数を予測するためのパラメータとして、代表説明変数を有している。このため、目的とする目的変数を定め、該予測モデルを逆算し、各代表説明変数を求めることができる。 Specifically, the prediction model described above has an objective variable and a representative explanatory variable as a parameter for predicting the objective variable. For this reason, it is possible to determine a target objective variable, back-calculate the prediction model, and obtain each representative explanatory variable.
そして、求めた代表説明変数により、操業プロセスの条件を設定できる。
[シミュレーション装置]
本実施形態のシミュレーション装置は、予測モデルを作成するためのシミュレーション装置である。このため、予測モデル作成装置ともいえ、以下の可視化部、分割部、選択部、予測モデル作成部を有することができる。
Then, the conditions of the operating process can be set by the obtained representative explanatory variables.
[Simulation device]
The simulation device of this embodiment is a simulation device for creating a prediction model. For this reason, it can be called a prediction model creation device, and can have the following visualization unit, division unit, selection unit, and prediction model creation unit.
なお、本実施形態のシミュレーション装置によれば、既述の予測モデルの作成方法を実施できる。このため、既に説明した事項については説明を一部省略する。 In addition, according to the simulation apparatus of this embodiment, the method of creating the prediction model described above can be carried out. For this reason, the explanation of the already explained matters will be partly omitted.
可視化部は、目的変数についての複数の説明変数間の関係を、複数の説明変数間の相関係数を用いて可視化できる。 The visualization unit can visualize the relationship between a plurality of explanatory variables for the objective variable using correlation coefficients between the plurality of explanatory variables.
分割部は、可視化部で可視化した説明変数間の関係を用いて、複数の説明変数を複数のクラスタに分割できる。 The dividing unit can divide the multiple explanatory variables into multiple clusters using the relationships between the explanatory variables visualized by the visualization unit.
選択部は、複数のクラスタから選択された1以上のクラスタにおいて、クラスタ毎に、クラスタに含まれる説明変数の中から、クラスタを代表する説明変数である、代表説明変数を選択できる。 The selection unit can select, for each cluster, a representative explanatory variable, which is an explanatory variable representing the cluster, from explanatory variables included in each cluster in one or more clusters selected from a plurality of clusters.
予測モデル作成部は、選択部で選択した代表説明変数を用いて、目的変数を予測する予測モデルを作成できる。 The prediction model creation unit can create a prediction model for predicting the objective variable using the representative explanatory variables selected by the selection unit.
図2に示したハードウェア構成図に示すように、本実施形態のシミュレーション装置20は、例えば、情報処理装置(コンピュータ)で構成され、物理的には、演算処理部であるCPU(Central Processing Unit:プロセッサ)21と、主記憶装置であるRAM(Random Access Memory)22やROM(Read Only Memory)23と、補助記憶装置24と、入出力インタフェース25と、出力装置である表示装置26等を含むコンピューターシステムとして構成できる。これらは、バス27で相互に接続されている。なお、補助記憶装置24や表示装置26は、外部に設けられていてもよい。
As shown in the hardware configuration diagram shown in FIG. 2, the
CPU21は、シミュレーション装置20の全体の動作を制御し、各種の情報処理を行う。CPU21は、ROM23または補助記憶装置24に格納された、例えば後述するプログラム(シュミレーションプログラム)を実行して、反射率等の算出を行うことができる。
The
RAM22は、CPU21のワークエリアとして用いられ、主要なパラメータや情報を記憶する不揮発RAMを含んでもよい。
The
ROM23は、プログラム(シュミレーションプログラム)等を記憶することができる。
The
補助記憶装置24は、SSD(Solid State Drive)や、HDD(Hard Disk Drive)等の記憶装置であり、シミュレーション装置の動作に必要な各種のデータ、ファイル等を格納できる。
The
入出力インタフェース25は、タッチパネル、キーボード、表示画面、操作ボタン等のユーザインタフェースと、外部のデータ収録サーバ等からの情報を取り込み、他の電子機器に解析情報を出力する通信インタフェースとの双方を含む。
The input/
表示装置26は、モニタディスプレイ等である。表示装置26では、解析画面が表示され、入出力インタフェース25を介した入出力操作に応じて画面が更新される。
The
図2に示したシミュレーション装置20の各機能は、例えばRAM22やROM23等の主記憶装置または補助記憶装置24からプログラム(シミュレーションプログラム)等を読み込ませ、CPU21により実行することにより、RAM22等におけるデータの読み出しおよび書き込みを行うと共に、入出力インタフェース25および表示装置26を動作させることで実現できる。
Each function of the
図3に、本実施形態のシミュレーション装置20の機能ブロック図を示す。
FIG. 3 shows a functional block diagram of the
図3に示すように、シミュレーション装置20は、受付部31、処理装置32、出力部33を有することができる。これらの各部は、シミュレーション装置20が有するCPU、記憶装置、各種インタフェース等を備えたパーソナルコンピュータ等の情報処理装置において、CPUが予め記憶されている例えば後述するプログラムを実行することでソフトウェアおよびハードウェアが協働して実現される。
As shown in FIG. 3 , the
各部の構成について以下に説明する。
(1)受付部
受付部31は、処理装置32で実行される処理に関係するユーザーからのコマンドやデータの入力を受け付ける。受付部31としてはユーザーが操作を行い、コマンド等を入力するキーボードやマウス、ネットワークを介して入力を行う通信装置、CD-ROM、DVD-ROM等の各種記憶媒体から入力を行う読み取り装置などが挙げられる。
The configuration of each part will be described below.
(1) Reception Unit The
受付部31は、例えば操業プロセスについての目的変数や、説明変数のリストや、相関係数を求めるための各説明変数のデータ等を受け付けることができる。
(2)処理装置
処理装置32は、可視化部321、分割部322、選択部323、予測モデル作成部324を有することができる。
(2-1)可視化部
可視化部321は、目的変数についての複数の説明変数間の関係を、複数の説明変数間の相関係数を用いて可視化できる。具体的には、入力された説明変数間の相関係数を求めて、該相関係数や、既述の距離を用いて、説明変数に関する図、例えばデンドログラムを作成し、可視化できる。
(2-2)分割部
分割部322では、可視化部で可視化した説明変数間の関係を用いて、複数の説明変数を複数のクラスタに分割できる。既述のように、説明変数について、上記相関係数や、距離について予め定めた閾値に基づいて分割できる。また、物理的意味付けを確認しながら、複数のクラスタに分割してもよい。
(2-3)選択部
選択部323は、複数のクラスタから選択された1以上のクラスタにおいて、クラスタ毎に、クラスタに含まれる説明変数の中から、クラスタを代表する説明変数である、代表説明変数を選択できる。代表説明変数の選択条件等については既に説明したため、ここでは説明を省略する。
(2-4)予測モデル作成部
予測モデル作成部324では、選択部で選択した代表説明変数を用いて、目的変数を予測する予測モデルを作成できる。
The receiving
(2) Processing Device The
(2-1) Visualization Unit The
(2-2) Division Unit The
(2-3) Selection unit The
(2-4) Prediction Model Creation Unit The prediction
予測モデルを作成する方法は特に限定されず、例えば線形回帰、ロジスティック回帰、ランダムフォレスト、ブースティング、ニューラルネットワークなどを用いて作成することができる。
(3)出力部
出力部33は、ディスプレイ等を有することができる。予測モデル作成部324で得られた予測モデルを出力部33に出力できる。
A method for creating a prediction model is not particularly limited, and can be created using, for example, linear regression, logistic regression, random forest, boosting, neural network, and the like.
(3) Output Unit The
以上に説明した本実施形態のシミュレーション装置によれば、操業プロセスの説明変数にフィードバック可能な予測モデルを作成できる。
[プログラム]
次に、本実施形態のプログラムについて説明する。
According to the simulation apparatus of this embodiment described above, it is possible to create a predictive model that can be fed back to the explanatory variables of the operating process.
[program]
Next, the program of this embodiment will be described.
本実施形態のプログラムは、予測モデルを作成するためのプログラムに関し、コンピュータを以下の可視化部、分割部、選択部、予測モデル作成部として機能させることができる。 The program of the present embodiment relates to a program for creating a prediction model, and can cause a computer to function as the following visualization unit, division unit, selection unit, and prediction model creation unit.
可視化部は、目的変数についての複数の説明変数間の関係を、複数の説明変数間の相関係数を用いて可視化できる。 The visualization unit can visualize the relationship between a plurality of explanatory variables for the objective variable using correlation coefficients between the plurality of explanatory variables.
分割部は、可視化部で可視化した説明変数間の関係を用いて、複数の説明変数を複数のクラスタに分割できる。 The dividing unit can divide the multiple explanatory variables into multiple clusters using the relationships between the explanatory variables visualized by the visualization unit.
選択部は、複数のクラスタから選択された1以上のクラスタにおいて、クラスタ毎に、クラスタに含まれる説明変数の中から、クラスタを代表する説明変数である、代表説明変数を選択できる。 The selection unit can select, for each cluster, a representative explanatory variable, which is an explanatory variable representing the cluster, from explanatory variables included in each cluster in one or more clusters selected from a plurality of clusters.
予測モデル作成部は、選択部で選択した代表説明変数を用いて、目的変数を予測する予測モデルを作成できる。 The prediction model creation unit can create a prediction model for predicting the objective variable using the representative explanatory variables selected by the selection unit.
本実施形態のプログラムは、例えば既述のシミュレーション装置のRAMやROM等の主記憶装置または補助記憶装置の各種記憶媒体に記憶させておくことができる。そして、係るプログラムを読み込ませ、CPUにより実行することにより、RAM等におけるデータの読み出しおよび書き込みを行うと共に、入出力インタフェースおよび表示装置を動作させて実行できる。このため、シミュレーション装置で既に説明した事項については説明を省略する。 The program of the present embodiment can be stored, for example, in various storage media such as the RAM, ROM, or other main storage device or auxiliary storage device of the aforementioned simulation device. By reading the program and executing it by the CPU, data can be read from and written to the RAM or the like, and the input/output interface and the display device can be operated. For this reason, the description of the items that have already been described in the simulation apparatus will be omitted.
上述した本実施形態のプログラムによれば、操業プロセスの説明変数にフィードバック可能な予測モデルを作成できる。 According to the program of the present embodiment described above, it is possible to create a predictive model that can be fed back to the explanatory variables of the operating process.
以下、実施例を参照しながら本発明をより具体的に説明する。但し、本発明は以下の実施例に限定されるものではない。
[実施例1]
以下の手順により、操業プロセスに関する目的変数を予測する予測モデルの作成を行った。
(可視化工程)
可視化工程では、図4の縦軸に特徴量として示した説明変数、および目的変数に関して、説明変数間、および説明変数と目的変数との間の相関係数を求め、図4に示したデンドログラムを作成した。
Hereinafter, the present invention will be described more specifically with reference to examples. However, the present invention is not limited to the following examples.
[Example 1]
A prediction model for predicting objective variables related to the operational process was created by the following procedure.
(Visualization process)
In the visualization step, the correlation coefficients between the explanatory variables and between the explanatory variables and the objective variables are obtained with respect to the explanatory variables and the objective variables shown as feature amounts on the vertical axis in FIG. 4, and the dendrogram shown in FIG. It was created.
デンドログラムを作成する際、相関係数をもとに定義した距離を用いた。距離は、1-|r|で定義される。なお、rは各説明変数同士の相関係数を意味する。
(分割工程)
可視化工程で得られたデンドログラムをもとに、説明変数を複数のクラスタに分割した。
When creating the dendrogram, we used the distance defined based on the correlation coefficient. The distance is defined as 1-|r|. In addition, r means the correlation coefficient between each explanatory variable.
(Dividing process)
Based on the dendrogram obtained in the visualization process, explanatory variables were divided into multiple clusters.
具体的には距離について、0.65を閾値の目安として、クラスタ41~クラスタ50の10個のクラスタに分割した。
(選択工程)
選択工程では、クラスタ毎に、クラスタに含まれる説明変数の中から、クラスタを代表する説明変数である代表説明変数B1~B8を選択した。選択する際、操業プロセスにおいて制御が容易な説明変数を選択した。なお、クラスタ46、クラスタ48、クラスタ50からは代表説明変数を選択しなかった。
(予測モデル作成工程)
予測モデル作成工程では、選択工程で選択した代表説明変数B1~B8を用いて、目的変数の予測モデルを作成した。
Specifically, the distance was divided into 10 clusters,
(Selection process)
In the selection step, for each cluster, representative explanatory variables B1 to B8, which are explanatory variables representing the cluster, were selected from the explanatory variables included in the cluster. When making a selection, we chose explanatory variables that are easy to control in the operating process. No representative explanatory variables were selected from
(Prediction model creation process)
In the prediction model creation step, the representative explanatory variables B1 to B8 selected in the selection step were used to create a prediction model for the objective variable.
予測モデルを作成した際に用いたデータであるフィッティングデータの実測値と、上記予測モデルを用いて算出した予測値とを図5に示す。 FIG. 5 shows the measured values of the fitting data, which is the data used when creating the prediction model, and the prediction values calculated using the prediction model.
また、予測モデルを作成する際に用いていないデータであるテストデータの実測値と、上記予測モデルを用いて算出した予測値とについても図5に示す。 FIG. 5 also shows measured values of test data, which are data not used in creating the prediction model, and predicted values calculated using the prediction model.
図5に示した結果によれば、テストデータ、フィッティングデータが、ほぼ同じ分布を示しており、適切な予測モデルを作成できたことを確認できる。 According to the results shown in FIG. 5, the test data and the fitting data show almost the same distribution, and it can be confirmed that an appropriate prediction model has been created.
また、本実施例の予測モデルでは、図4に示した28個の特徴量から8個の代表説明変数に絞り込んで用いている。すなわち、予測モデルで要するパラメータの数が少ないため、予測モデルから逆算してのフィードバックを容易に行えることが分かる。 Also, in the prediction model of this embodiment, the 28 feature quantities shown in FIG. 4 are narrowed down to 8 representative explanatory variables for use. That is, since the number of parameters required for the prediction model is small, it can be easily fed back by calculating backward from the prediction model.
S11 可視化工程
S12 分割工程
S13 選択工程
S14 予測モデル作成工程
S11 visualization step S12 division step S13 selection step S14 prediction model creation step
Claims (3)
前記目的変数についての複数の説明変数間の関係を、複数の前記説明変数間の相関係数を用いて可視化する可視化工程と、
前記可視化工程で可視化した前記説明変数間の関係を用いて、複数の前記説明変数を複数のクラスタに分割する分割工程と、
複数の前記クラスタから選択された1以上の前記クラスタにおいて、前記クラスタ毎に、前記クラスタに含まれる前記説明変数の中から、前記クラスタを代表する前記説明変数である、代表説明変数を選択する選択工程と、
前記選択工程で選択した前記代表説明変数を用いて、前記目的変数を予測する予測モデルを作成する予測モデル作成工程と、を有する予測モデルの作成方法。 A method for creating a prediction model that predicts a predetermined objective variable related to an operating process,
a visualization step of visualizing the relationship between a plurality of explanatory variables for the objective variable using a correlation coefficient between the plurality of explanatory variables;
A division step of dividing the plurality of explanatory variables into a plurality of clusters using the relationships between the explanatory variables visualized in the visualization step;
In one or more of the clusters selected from the plurality of clusters, selecting a representative explanatory variable, which is the explanatory variable representing the cluster, from among the explanatory variables included in the cluster for each cluster. process and
a predictive model creating step of creating a predictive model for predicting the objective variable using the representative explanatory variables selected in the selecting step.
前記条件が、前記目的変数との相関係数が高い前記説明変数を選択する、前記操業プロセスのうち上流側の工程に関する前記説明変数を選択する、前記操業プロセスにおいて制御が容易な前記説明変数を選択する、および前記クラスタに含まれる前記説明変数を用いて前記目的変数についての予測モデルを作成した場合に、前記目的変数に対する影響が高い前記説明変数を選択する、から選択された1種類以上である請求項1に記載の予測モデルの作成方法。 In the selection step, a predetermined number of the representative explanatory variables are selected according to predetermined conditions,
The condition selects the explanatory variable having a high correlation coefficient with the objective variable, selects the explanatory variable related to an upstream process in the operating process, and selects the explanatory variable that is easy to control in the operating process. and selecting the explanatory variable having a high influence on the objective variable when a predictive model for the objective variable is created using the explanatory variables included in the cluster. A method for creating a prediction model according to claim 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021173506A JP2023063162A (en) | 2021-10-22 | 2021-10-22 | Prediction model forming method and operating process condition setting method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021173506A JP2023063162A (en) | 2021-10-22 | 2021-10-22 | Prediction model forming method and operating process condition setting method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023063162A true JP2023063162A (en) | 2023-05-09 |
Family
ID=86270302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021173506A Pending JP2023063162A (en) | 2021-10-22 | 2021-10-22 | Prediction model forming method and operating process condition setting method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023063162A (en) |
-
2021
- 2021-10-22 JP JP2021173506A patent/JP2023063162A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6555061B2 (en) | Clustering program, clustering method, and information processing apparatus | |
JP4394728B2 (en) | Influence factor identification device | |
JP5956094B1 (en) | Manufacturing process analysis method | |
JP5068637B2 (en) | Operation and quality related analysis apparatus, analysis method, program, and computer-readable recording medium in manufacturing process | |
US11281937B2 (en) | Data analyzing device and data analyzing method | |
Dong et al. | Prognostic and health management for adaptive manufacturing systems with online sensors and flexible structures | |
JP2020086784A (en) | Manufacturing condition specification system and method | |
JP4852420B2 (en) | Tool and process design in molding technology | |
Ardakani et al. | Optimal features selection for designing a fault diagnosis system | |
Gámiz et al. | A machine learning algorithm for reliability analysis | |
KR20230066093A (en) | Abnormal diagnosis model construction method, abnormal diagnosis method, abnormal diagnosis model construction apparatus and abnormal diagnosis apparatus | |
WO2021157667A1 (en) | Prediction device, prediction method, and program | |
Chen et al. | Big data analytic for multivariate fault detection and classification in semiconductor manufacturing | |
Windt et al. | Exploring due date reliability in production systems using data mining methods adapted from gene expression analysis | |
JP2023063162A (en) | Prediction model forming method and operating process condition setting method | |
Ershadi et al. | An economic-statistical design of simple linear profiles with multiple assignable causes using a combination of MOPSO and RSM | |
Cheng et al. | A GA mechanism for optimizing the design of attribute double sampling plan | |
US8234001B2 (en) | Tool commonality and stratification analysis to enhance a production process | |
JP2020024542A (en) | Data analysis device and data analysis method | |
JP7396213B2 (en) | Data analysis system, data analysis method, and data analysis program | |
JP7031713B1 (en) | Abnormality diagnosis model construction method, abnormality diagnosis method, abnormality diagnosis model construction device and abnormality diagnosis device | |
US11443145B2 (en) | Data analyzing device and data analyzing method | |
WO2020189371A1 (en) | Parameter tuning apparatus, parameter tuning method, computer program, and recording medium | |
JP7223947B2 (en) | Manufacturing condition calculation device, manufacturing condition calculation method, and manufacturing condition calculation program | |
JP7468766B1 (en) | Driving assistance device, driving assistance method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240607 |