WO2023053918A1 - 予測モデル作成方法、予測方法、予測モデル作成装置、予測装置、予測モデル作成プログラム、予測プログラム - Google Patents
予測モデル作成方法、予測方法、予測モデル作成装置、予測装置、予測モデル作成プログラム、予測プログラム Download PDFInfo
- Publication number
- WO2023053918A1 WO2023053918A1 PCT/JP2022/034047 JP2022034047W WO2023053918A1 WO 2023053918 A1 WO2023053918 A1 WO 2023053918A1 JP 2022034047 W JP2022034047 W JP 2022034047W WO 2023053918 A1 WO2023053918 A1 WO 2023053918A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- prediction
- model
- clusters
- data set
- cluster
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 147
- 239000000463 material Substances 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 11
- 230000009897 systematic effect Effects 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 4
- 230000005484 gravity Effects 0.000 abstract description 4
- 238000013461 design Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 13
- 238000007637 random forest analysis Methods 0.000 description 9
- 230000000052 comparative effect Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000704 physical effect Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
Definitions
- the present disclosure relates to a prediction model creation method, a prediction method, a prediction model creation device, a prediction device, a prediction model creation program, and a prediction program that consider clustering and weights.
- Patent Document 1 discloses a base model that clusters training data and predicts a physical property value using a first predetermined number of training data in the vicinity of a representative vector in each cluster, and a second model in the vicinity of the representative vector. It has a correction model that predicts the reciprocal of the residual for each base model using a predetermined number of training data.
- a method of searching for a model, calculating the predicted value of the base model and the predicted value of the correction model, and calculating the predicted value of physical properties by multiplying the predicted value of the base model and the predicted value of the correction model by a predetermined constant. is disclosed.
- the present disclosure has been made in consideration of the above points, and aims to provide a prediction model creation method that uses training data thoroughly to improve prediction accuracy.
- the present invention has the following configurations.
- a method for creating a predictive model of material properties obtaining a training dataset; generating a trained clustering model using the training data set and the clustering model, and classifying the training data set into N clusters; calculating the distance between the centroids of each cluster; a step of calculating the weights between the clusters using the distance between the centroids of the clusters and parameters representing the features of the training data set; generating a learned prediction model ⁇ M i ⁇ 1 ⁇ i ⁇ N using the cluster and the weights for each of the clusters.
- a method for predicting material properties subsequent to the method for creating a predictive model described in 1 above obtaining data for prediction; using the learned clustering model to identify that the prediction data belongs to cluster p among N classified training data set clusters; and obtaining a predicted value using the predicted data as an input and using a trained prediction model M p corresponding to the cluster p.
- the method for creating a prediction model for material properties according to the preceding item 1 In the step of constructing the clustering model according to the preceding item 1, any one of the K-means method, the nearest neighbor method, the hierarchical clustering method, the Gaussian mixture method, the DBSCAN method, the t-SNE method, and the self-organizing map method A method of creating a predictive model for material properties, comprising using one or more clustering methods.
- the method for creating a prediction model for material properties according to the preceding item 1 In the step of calculating the distance between the centroids of the clusters according to 1 above, the Euclidean distance method, Manhattan distance method, Mahalanobis distance method, Minkowski distance method, cosine distance method, shortest distance method, longest distance method, centroid method, group average method, ward method, Kullback-Leibler divergence, Jensen-Shannon divergence, dynamic time warping, Earth mover's distance, which is characterized by calculating the distance using one or more combinations Predictive modeling method.
- the method for creating a prediction model for material properties according to the preceding item 1 any one of systematic error, standard deviation, variance, coefficient of variation, quantile, kurtosis, and skewness of the characteristic value of the learning data set as a parameter representing the characteristics of the learning data set, or A method of creating a predictive model for material properties, characterized by using a plurality of parameters.
- the method for creating a prediction model for material properties according to the preceding item 1 A method for creating a predictive model of material properties, wherein in the step of calculating the weights, one or a plurality of weighting functions selected from an exponential function type, a reciprocal type, and a reciprocal power type are used.
- a predictive model creation device for material properties A clustering model that generates a learned clustering model by inputting a learning data set and classifies the learning data set into N clusters; calculating the distance between the centroids of the classified clusters, and using the calculated distance between the centroids of the clusters and parameters representing the characteristics of the learning data set to calculate the weights between the clusters; a weight definition unit;
- a prediction model creation device comprising a prediction model ⁇ M i ⁇ 1 ⁇ i ⁇ N for generating a learned prediction model using the cluster and the weight for each of the clusters.
- a material property prediction device comprising: 8.
- a program for creating a predictive model of material properties obtaining a training data set; generating a trained clustering model using the training data set and the clustering model, and classifying the training data set into N clusters; calculating the distance between the centroids of each cluster; A step of calculating weights between the clusters using parameters representing the distance between the centroids of the clusters and the characteristics of the training data set; and generating a learned prediction model ⁇ M i ⁇ 1 ⁇ i ⁇ N for each cluster using the cluster and the weight.
- a material property prediction program comprising: obtaining data for prediction; Using the learned clustering model created by the prediction model creation program according to the preceding item 9, identifying that the prediction data belongs to cluster p among N classified learning data set clusters; 10.
- the predictive model created using the predictive model creation method of the present disclosure suppresses over-learning due to lack of data by using all the training data, and by introducing a weight that reflects the tendency of the data, Prediction accuracy can be improved.
- FIG. 10 is a flow chart showing the flow of normal random forest learning processing in a comparative example. 10 is a flow chart showing the flow of normal random forest prediction processing in a comparative example. It is a figure which shows an example of prediction accuracy.
- the predictive model generating apparatus will be described as an example of a predictive model generating apparatus that generates a predictive model using a learning data set that includes design conditions at the time of trial production and property values of the material produced as an experiment.
- the prediction device will be described as an example of a prediction device that predicts the characteristic values of a material to be prototyped under new design conditions using the learned prediction model created by the prediction model creation device.
- prediction model creation device and prediction device are not limited to the above applications, and may be used for purposes other than material design.
- FIG. 1 is a diagram showing an example of a functional configuration of a prediction model creation device in a learning phase and a prediction device in a prediction phase.
- a learning program is installed in the prediction model creation device 120, and by executing the program, the prediction model creation device 120 a clustering model 121; - Weight definition unit 122, a predictive model 123; (see FIG. 1(a)).
- the prediction model creation device 120 uses the learning data set 111 stored in the material data storage unit 110 to learn the clustering model 121 and the prediction model 123, and generates the learned clustering model 131 and the learned prediction model 132. do.
- the learning data set 111 includes "input data” and "correct data” as information items.
- "design condition 1" to “design condition n” are stored as “input data”
- "characteristic value 1" to “characteristic value n” are stored as "correct data”. It shows the stored case.
- the clustering model 121 outputs a learning data set cluster as output data by inputting "design conditions 1" to "design conditions n" stored in the "input data" of the learning data set 111. That is, by inputting the learning data set 111, the trained clustering model 131 and the learning data set 111 classified into the cluster i are generated.
- the number of clusters generated by the clustering model 121 is set to N.
- the clustering model 121 that the prediction model creation device 120 learns uses as a learning method, for example, "K-means method, Nearest Neighbor method, hierarchical clustering method, Gaussian mixture method, DBSCAN method, t-SNE method, self Organized map method", Suppose that it is a model in which learning is performed under any one or a plurality of learning methods among.
- the clustering model 121 assigns “design conditions 1” to “design conditions n” stored in the “input data” of the learning data set 111 to any cluster i (1 ⁇ i ⁇ N). Classify and output the barycentric coordinates of cluster i.
- the weight definition unit 122 calculates the weights ⁇ W ij ⁇ 1 ⁇ i ⁇ N, 1 ⁇ j ⁇ N used in the prediction model 123 using the distances between the classified clusters and the parameters representing the features of the learning data set 111. do.
- the distances ⁇ l ij ⁇ 1 ⁇ i ⁇ N and 1 ⁇ j ⁇ N between the classified clusters are represented by the distances between the barycentric coordinates described above, and are calculated in N(N-1)/2 ways.
- the distance between each cluster used in the weight definition unit 122 for example, "Euclidean distance method, Manhattan distance method, Mahalanobis distance method, Minkowski distance method, cosine distance method, shortest distance method, longest distance method, centroid method, group average method, ward method, Kullback-Leibler divergence, Jensen-Shannon divergence, Dynamic time warping, Earth mover's distance",
- the distance can be calculated using any one or a combination of:
- the weight calculated using the distance between the classified clusters and the parameter representing the feature of the learning data set 111 is represented by a weight function. type", defined using any one or more of
- the weight function W ij is
- Equation (1) It can be defined by an exponential function such as the Boltzmann type represented by Equation (1).
- l ij is the distance between each cluster
- ⁇ is a parameter representing the feature of the training data set
- ⁇ is an arbitrary constant
- the predictive model 123 receives a value obtained by multiplying the explanatory variable included in the learning data set cluster output by the clustering model 121 by the weight calculated by the weight definition unit 122, and the explanatory variable (design condition) used for input is It is generated by learning to output a characteristic value using the corresponding objective variable (characteristic value) as output data.
- the prediction model that the prediction model creation device 120 learns as a learning method, "Random Forest, Decision Trees, Gradient Boosting, Adaboost, Bagging, Linear, Partial Least Squares, Lasso, Linear Ridge, Elastic Net", Any one or a combination of the following may be used.
- the prediction model creation device 120 learns the prediction model 123
- the prediction model 123 ⁇ M i ⁇ 1 ⁇ i ⁇ N is learned for N clusters classified by the clustering model 121. . That is, cluster i is subjected to learning applying weight W ij to generate learned prediction models 132 ⁇ M i ⁇ 1 ⁇ i ⁇ N , respectively.
- One example of a weight-applied learning method is a method of inputting weights as parameters in the fit function of the random forest regression algorithm stored in scikit-learn.
- the prediction model creation device 120 generates a learned clustering model 131 and a learned prediction model 132. Also, the prediction model creation device 120 applies the generated learned clustering model 131 and learned prediction model 132 to the prediction device 130 .
- a prediction program is installed in the prediction device 130, and by executing the program, the prediction device 130 - Learned clustering model 131, - Learned prediction model 132, - output unit 133, (see FIG. 1(b)).
- the learned clustering model 131 is obtained by the prediction model creation device 120 learning the clustering model 121 using “design condition 1” to “design condition n” stored in the “input data” of the learning data set 111. generated by
- the learned clustering model 131 specifies that the learning data set 111 belongs to the cluster p among the N clusters by which the prediction data (design condition x) is input.
- the trained prediction model 132 is generated by the prediction model creation device 120 learning the prediction model 123 using N clusters into which the learning data set 111 is classified and the weights calculated by the weight definition unit 122. be done.
- the learned prediction model 132 is input with the design condition x and the classification p of the cluster output by the trained clustering model. is predicted, and the output unit 133 outputs the predicted characteristic value as prediction data.
- the prediction device 130 As a result, according to the prediction device 130, a sufficient prediction accuracy can be obtained by predicting the characteristic value using the cluster to which the design condition x belongs and the learned model learned using the weight according to the cluster. will be able to That is, according to this embodiment, prediction accuracy can be improved in a prediction device using a trained prediction model.
- ⁇ Hardware configuration of prediction model creation device and prediction device> Next, hardware configurations of the prediction model creation device 120 and the prediction device 130 will be described. Since the predictive model creation device 120 and the prediction device 130 have similar hardware configurations, the hardware configurations of the prediction model creation device 120 and the prediction device 130 will be collectively described here using FIG.
- FIG. 2 is a diagram showing an example of the hardware configuration of the learning device and prediction device.
- the learning device 120 and the prediction device 130 have a processor 201 , a memory 202 , an auxiliary storage device 203 , an I/F (Interface) device 204 , a communication device 205 and a drive device 206 .
- the hardware of the learning device 120 and the prediction device 130 are interconnected via a bus 207 .
- the processor 201 has various computing devices such as a CPU (Central Processing Unit) and a GPU (Graphics Processing Unit).
- the processor 201 reads various programs (for example, a learning program, a prediction program, etc.) onto the memory 202 and executes them.
- programs for example, a learning program, a prediction program, etc.
- the memory 202 has main storage devices such as ROM (Read Only Memory) and RAM (Random Access Memory).
- the processor 201 and the memory 202 form a so-called computer, and the processor 201 executes various programs read onto the memory 202, thereby realizing various functions of the computer.
- the auxiliary storage device 203 stores various programs and various data used when the various programs are executed by the processor 201 .
- the I/F device 204 is a connection device that connects with an external device (not shown).
- the communication device 205 is a communication device for communicating with an external device (for example, the material data storage unit 110) via a network.
- a drive device 206 is a device for setting a recording medium 210 .
- the recording medium 210 here includes media such as CD-ROMs, flexible disks, magneto-optical disks, etc. that record information optically, electrically, or magnetically.
- the recording medium 210 may also include a semiconductor memory or the like that electrically records information, such as a ROM or a flash memory.
- auxiliary storage device 203 Various programs to be installed in the auxiliary storage device 203 are installed by, for example, setting the distributed recording medium 210 in the drive device 206 and reading the various programs recorded in the recording medium 210 by the drive device 206. be done. Alternatively, various programs installed in the auxiliary storage device 203 may be installed by being downloaded from the network via the communication device 205 .
- FIG. 3 is a flowchart showing the flow of learning processing.
- step S301 the prediction model creation device 120 acquires the learning data set 111.
- step S302 the prediction model creation device 120 uses the acquired learning data set 111 to perform learning of the clustering model 121, generates a trained clustering model 131, Obtain cluster-classified training data set clusters.
- step S303 the weight defining unit 122 calculates distances ⁇ l ij ⁇ 1 ⁇ i ⁇ N and 1 ⁇ j ⁇ N between the centroids of the learning data set cluster i.
- step S304 the weight defining unit 122 determines the weights ⁇ W ij ⁇ 1 ⁇ i ⁇ N, 1 ⁇ j ⁇ N used in the prediction model 123 using the distance between the clusters and the parameters representing the features of the learning data set 111. calculate.
- step S305 the predictive model creation device 120 determines whether weights have been calculated for all clusters of the learning data set 111 classified into N clusters. If it is determined in step S305 that there are clusters for which weights have not been calculated (NO in step S305), the process returns to step S304.
- step S305 determines whether there is no cluster for which the weight has not been calculated (if YES in step S305). If it is determined in step S305 that there is no cluster for which the weight has not been calculated (if YES in step S305), the process proceeds to step S306.
- step S306 the prediction model creation device 120 uses the combination of the generated learning data set clusters and the corresponding weights to learn the prediction model 123 and generate the trained prediction model 132.
- step S307 the predictive model creation device 120 determines whether or not the predictive model 123 has been learned for all clusters of the learning data set 111 classified into N clusters. If it is determined in step S306 that there is a cluster for which a trained prediction model 132 has not been generated (NO in step S307), the process returns to step S306.
- FIG. 4 is a flowchart showing the flow of prediction processing.
- step S401 the prediction device 130 acquires prediction data (design condition x).
- step S402 the prediction device 130 inputs the obtained prediction data to the learned clustering model 131, and identifies that it belongs to cluster p among the learning data set clusters.
- step S403 the prediction device 130 acquires the trained prediction model 132M p corresponding to the specified cluster p, and predicts the characteristic value using the acquired prediction data as input.
- step S404 the prediction device 130 outputs the predicted characteristic value as prediction data for the input data (design condition x) to be predicted.
- the screen 500 in FIG. 5 is a GUI for selecting the manual setting of the number of clusters N or automatic setting by the elbow method, and selecting the type of parameter representing the characteristics of the learning data set 111 when generating the clustering model 121.
- the user selects the optimal number of clusters from the screen and selects parameters such as systematic error, standard deviation, variance, coefficient of variation, quartile, kurtosis, and skewness.
- FIG. 5 shows an example in which the automatic setting by the elbow method is selected as the method of setting the number of clusters, and the systematic error is selected as the parameter representing the characteristics of the learning data set 111 .
- the "prediction" button is pressed in the state of FIG. 5, the clustering model 121, the weight definition unit 122, and the prediction model 123 of the prediction model creation device 120 follow the procedure of the flowchart of FIG. Generate a finished predictive model 132 .
- the prediction device 130 has a trained clustering model 131 for clustering input data and a trained prediction model 132 corresponding to the cluster p. - Output the characteristic values predicted by the trained prediction model 132 under appropriate weights as prediction data.
- the prediction accuracy can be improved in the prediction device 130 using the learned prediction model 132.
- Example A specific example of the prediction method of the present invention will be described using a known data set. It should be noted that the property prediction according to the present invention can be applied not only to the field of materials.
- the material data storage unit 110 includes, for example, 506 data Boston Suppose we have a dataset about house prices.
- the processing is performed, for example, according to the following procedure.
- the Boston housing price data set was randomly divided into training data set/prediction data set at a ratio of 75%/25%.
- CRIM crime rate
- ZN proportion of large houses
- INDUS proportion of non-retail business
- CHAS CHAS
- NOX NOx concentration (0.1ppm unit)
- RM Average number of rooms” per unit
- AGE Proportion of old houses
- DIS Mainn distance to facilities
- RAD accessibility to major highways”
- TAX property tax rate
- PTRATIO student-teacher ratio” by town
- B black
- LSTAT proportion of low-income population
- MEDV medium value of “house price” (in units of 1000 dollars)
- Procedure 2 Using the training data set obtained in Procedure 1, learning was performed using the K-Means method, which is a clustering algorithm stored in scikit-learn, to obtain a trained clustering model.
- Prediction data was obtained from the prediction data set obtained in step 1. Next, using the trained clustering model learned in procedure 2, it was determined whether the prediction data belonged to cluster p among the clusters described in procedure 3.
- Procedure 8 Using the prediction data as input, the characteristic values are predicted using the trained prediction model M p created in step 6 corresponding to the cluster p to which the prediction data belongs, and the predicted characteristic values are output as prediction data.
- Prediction data was output in the same way for each of the remaining prediction data in the prediction data set.
- R 2 0.879 was obtained as the prediction accuracy of the example.
- R 2 0.868 was obtained as the prediction accuracy of the comparative example.
- the prediction accuracy of the random forest regression model which performs cluster classification as in this example and considers appropriate weights, is higher than that of the normal random forest regression model. It can be seen that the accuracy is higher than the accuracy.
- the prediction model creation device and the prediction device have been described as separate devices. However, the prediction model creation device and the prediction device may be configured as an integrated device.
- the method of calculating the distance between the centers of gravity was performed using the Euclidean distance, and other specific examples were not mentioned.
- methods for calculating the distance between centroids include, for example, the Manhattan distance method, the Mahalanobis distance method, the Minkowski distance method, the cosine distance method, the shortest distance method, the longest distance method, the centroid method, the group average method, the Ward method, and the Kullback-Leibler method. Divergence, Jensen-Shannon divergence, dynamic time warping, earth mover's distance, etc. may be used.
- the K-Means method and the random forest regression algorithm were used, and specific examples of other learning methods were not mentioned.
- the learning method used for learning the clustering model may be, for example, the Nearest Neighbor method, the hierarchical clustering method, the Gaussian mixture method, the DBSCAN method, the t-SNE method, the self-organizing map method, or the like. .
- the learning method used when learning the prediction model may be, for example, decision tree, gradient boosting, Adaboost, bagging, linear, partial least squares, Lasso, linear ridge, elastic net, and the like.
- the design conditions of materials whose properties are predicted by the prediction method of the present invention can also be used for manufacturing.
- a device that manufactures a material can acquire from the prediction device 130 information on the design conditions of the material whose properties are predicted by the prediction device 130, and use the acquired information on the design conditions to manufacture the material.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
[1]材料特性の予測モデル作成方法であって、
学習用データセットを取得するステップと、
前記学習用データセットとクラスタリングモデルを用いて、学習済みクラスタリングモデルを生成するとともに、前記学習用データセットをN個のクラスターに分類するステップと、
前記各クラスターの重心間の距離を算出するステップと、
前記クラスターの重心間の距離と前記学習用データセットの特徴を表すパラメータとを用いて、前記クラスター間の重みを算出するステップと、
前記クラスターごとに、クラスターと前記重みを用いて学習済み予測モデル{Mi}1≦i≦Nを生成するステップと、を有することを特徴とする材料特性の予測モデル作成方法。
[2]前項1に記載の予測モデル作成方法に引き続いて行う材料特性の予測方法であって、
予測用データを取得するステップと、
前記学習済みクラスタリングモデルを用いて、前記予測用データがN個に分類された学習用データセットクラスターのうちクラスターpに属することを特定するステップと、
前記予測用データを入力として、前記クラスターpに対応する学習済み予測モデルMpを用いて予測値を求めるステップと、を有することを特徴とする材料特性の予測方法。
[3]前項1に記載の材料特性の予測モデル作成方法であって、
前項1に記載のクラスタリングモデルを構築するステップにおいて、K-means法、Nearest Neighbor法、階層的クラスタリング法、混合ガウス法、DBSCAN法、t-SNE法、自己組織化マップ法のうち、いずれか1つまたは複数のクラスタリング手法を用いることを特徴とする材料特性の予測モデル作成方法。
[4]前項1に記載の材料特性の予測モデル作成方法であって、
前項1に記載のクラスターの重心間の距離を算出するステップにおいて、ユークリッド距離法、マンハッタン距離法、マハラノビス距離法、ミンコフスキー距離法、コサイン距離法、最短距離法、最長距離法、重心法、群平均法、ward法、Kullback-Leiblerダイバージェンス、Jensen―Shannonダイバージェンス、Dynamic time warping、Earth mover's distanceのうち、いずれか1つまたは複数の組合せを用いて距離を算出することを特徴とする材料特性の予測モデル作成方法。
[5]前項1に記載の材料特性の予測モデル作成方法であって、
前記学習用データセットの特徴を表すパラメータとして、前記学習用データセットの特性値に係る系統誤差、標準偏差、分散、変動係数、分位数、尖度、歪度のうち、いずれか1つまたは複数のパラメータを用いることを特徴とする材料特性の予測モデル作成方法。
[6]前項1に記載の材料特性の予測モデル作成方法であって、
前記重みを算出するステップにおいて、指数関数型、逆数型、逆数の累乗型のうち、いずれか1つまたは複数の重み関数を用いることを特徴とする材料特性の予測モデル作成方法。
[7]材料特性の予測モデル作成装置であって、
学習用データセットが入力されることで、学習済みクラスタリングモデルを生成するとともに、前記学習用データセットをN個のクラスターに分類するクラスタリングモデルと、
分類された前記各クラスターの重心間の距離を算出し、算出された各クラスターの重心間の距離と前記学習用データセットの特徴を表すパラメータとを用いて、前記各クラスター間の重みを算出する重み定義部と、
前記クラスターごとに、クラスターと前記重みを用いて学習済み予測モデルを生成する予測モデル{Mi}1≦i≦Nと、を有することを特徴とする予測モデル作成装置。
[8]材料特性の予測装置であって、
予測用データが入力されることで、前記予測用データがN個に分類されたクラスターのうちクラスターpに属することを特定する、前項7に記載の予測モデル作成装置により作成された学習済みクラスタリングモデルと、
特定された前記クラスターpに対応し、予測用データを入力として予測値を求める、前項7に記載の予測モデル作成装置により作成された学習済み予測モデルMpと、
求められた予測値を出力する出力部と、を有することを特徴とする材料特性の予測装置。
[9]材料特性の予測モデル作成プログラムであって、
学習用データセットを取得する工程と、
前記学習用データセットとクラスタリングモデルを用いて、学習済みクラスタリングモデルを生成するとともに、前記学習用データセットをN個のクラスターに分類する工程と、
前記各クラスターの重心間の距離を算出する工程と、
前記クラスターの重心間の距離と前記学習用データセットの特徴を表すパラメータを用いて、前記クラスター間の重みを算出する工程と、
前記クラスターごとに、クラスターと前記重みを用いて学習済み予測モデル{Mi}1≦i≦Nを生成する工程と、をコンピュータに実行させるための予測モデル作成プログラム。
[10]材料特性の予測プログラムであって、
予測用データを取得する工程と、
前項9に記載の予測モデル作成プログラムにより作成された学習済みクラスタリングモデルを用いて、前記予測用データがN個に分類された学習用データセットクラスターのうちクラスターpに属することを特定する工程と、
前記予測用データを入力として、特定された前記クラスターpに対応し、前項9に記載の予測モデルMpを用いて予測値を求める工程と、をコンピュータに実行させるための予測プログラム。
はじめに、予測モデル作成装置及び予測装置の機能構成について説明する。予測モデル作成装置は、試作時の設計条件と、試作した材料の特性値とを含む学習用データセットを用いて予測モデルの生成を行う予測モデル作成装置を例に説明する。また、予測装置は、予測モデル作成装置において作成された学習済み予測モデルを用いて新たな設計条件のもとで試作する材料の特性値を予測する予測装置を例に説明する。
・クラスタリングモデル121、
・重み定義部122、
・予測モデル123、
として機能する(図1(a)参照)。
のうちのいずれか1つまたは複数の学習手法のもとで学習が行われるモデルであるとする。
のうちのいずれか1つまたは複数の組合せを用いて距離を算出することができる。
のうちいずれか1つまたは複数を用いて定義される。
"ランダムフォレスト、決定木、勾配ブースティング、アダブースト、バギング、線形、部分最小二乗、ラッソ、線形リッジ、エラスティックネット"、
のうちのいずれか1つまたは複数の組合せを用いることができる。
・学習済みクラスタリングモデル131、
・学習済み予測モデル132、
・出力部133、
として機能する(図1(b)参照)。
<予測モデル作成装置及び予測装置のハードウェア構成>
次に、予測モデル作成装置120及び予測装置130のハードウェア構成について説明する。なお、予測モデル作成装置120及び予測装置130は、同様のハードウェア構成を有するため、ここでは、図2を用いて、予測モデル作成装置120及び予測装置130のハードウェア構成をまとめて説明する。
次に、学習処理の流れについて説明する。図3は、学習処理の流れを示すフローチャートである。
<予測処理の流れ>
次に、予測処理の流れについて説明する。図4は、予測処理の流れを示すフローチャートである。
以上の説明から明らかなように、実施形態に係る予測装置130は、
・入力データをクラスタリングするための学習済みクラスタリングモデル131と、クラスターpに対応した学習済み予測モデル132を有する。
・適切な重みのもとで、学習済み予測モデル132により予測された特性値を予測データとして、出力する。
本発明の予測方法の具体的な実施例を、公知のデータセットを用いて説明する。なお、本発明による特性予測は材料系分野に限らず適用が可能である。
(1)手順1
以下で学習手順の説明を行う。
手順1で得た学習用データセットを用いて、scikit-learnに格納されているクラスタリングアルゴリズムであるK―Means法を用いて学習を行い、学習済みクラスタリングモデルを得た。
手順2で学習した学習済みクラスタリングモデルを用い、学習用データセットを入力することで、N個にクラスター分類された学習用データセットクラスターを得た。ここでは、エルボー法で行った結果として、2個のクラスターを得た。
手順3でクラスター分類された学習用データセットクラスターに対し、各クラスター間の重心間の距離{lij}1≦i≦N,1≦j≦NをN(N-1)/2通り算出した。ここでは、各クラスター間の重心間の距離として、ユークリッド距離を用いた。
手順4で算出したクラスター間の距離{lij}1≦i≦N,1≦j≦Nと、学習用データセットの特徴を表すパラメータとを用いて、前記クラスター間の重み{Wij}1≦i≦N,1≦j≦Nを算出した。ここでは、学習用データセットの特徴を表すパラメータとして、学習用データセットのMEDVの標準偏差を用いた。また、クラスター間の重みとして下記式(1)で表される重み関数を用いた。なお、任意定数として、α=1.0を用いた。
手順2で生成した学習用データセットクラスターと手順5で生成した各クラスターごとの重みとを、scikit-learnに格納されているランダムフォレスト回帰アルゴリズムを予測モデルとして用い、各クラスターに対して予測モデルMiに学習させ、2つの学習済み予測モデルを得た。なお、ここでは、重みを適用した学習の方法として、scikit-learnに格納されているランダムフォレスト回帰アルゴリズムのfit関数内のパラメータに重みを入力した。
(7)手順7
以下で予測手順の説明を行う。
予測用データを入力として、手順6で作成した、予測用データの属するクラスターpに対応する学習済み予測モデルMpを用いて特性値を予測し、予測された特性値を予測データとして出力した。
本発明の予測方法の予測精度を求めた。予測精度は、下記式(2)によって定義されるR2値を評価指標とした。R2値は、1に近いほど予測精度が高い。
一方、比較例として、手順2のクラスタリングを行わず、手順5にある重みを用いないことを除いて、図6および図7のフローチャートに示すように、実施例と同様に予測モデルの作成の予測を行い、R2値を算出した。
上記各実施形態において、予測モデル作成装置と予測装置とは別体の装置として説明した。しかしながら、予測モデル作成装置と予測装置とは一体の装置により構成されてもよい。
120 :予測モデル作成装置
121 :クラスタリングモデル
122 :重み定義部
123 :予測モデル
130 :予測装置
131 :学習済みクラスタリングモデル
132 :学習済み予測モデル
133 :出力部
Claims (10)
- 材料特性の予測モデル作成方法であって、
学習用データセットを取得するステップと、
前記学習用データセットとクラスタリングモデルを用いて、学習済みクラスタリングモデルを生成するとともに、前記学習用データセットをN個のクラスターに分類するステップと、
前記各クラスターの重心間の距離を算出するステップと、
前記クラスターの重心間の距離と前記学習用データセットの特徴を表すパラメータとを用いて、前記クラスター間の重みを算出するステップと、
前記クラスターごとに、クラスターと前記重みを用いて学習済み予測モデル{Mi}1≦i≦Nを生成するステップと、を有することを特徴とする材料特性の予測モデル作成方法。 - 請求項1に記載の予測モデル作成方法に引き続いて行う材料特性の予測方法であって、
予測用データを取得するステップと、
前記学習済みクラスタリングモデルを用いて、前記予測用データがN個に分類された学習用データセットクラスターのうちクラスターpに属することを特定するステップと、
前記予測用データを入力として、前記クラスターpに対応する学習済み予測モデルMpを用いて予測値を求めるステップと、を有することを特徴とする材料特性の予測方法。 - 請求項1に記載の材料特性の予測モデル作成方法であって、
請求項1に記載のクラスタリングモデルを構築するステップにおいて、K-means法、Nearest Neighbor法、階層的クラスタリング法、混合ガウス法、DBSCAN法、t-SNE法、自己組織化マップ法のうち、いずれか1つまたは複数のクラスタリング手法を用いることを特徴とする材料特性の予測モデル作成方法。 - 請求項1に記載の材料特性の予測モデル作成方法であって、
請求項1に記載のクラスターの重心間の距離を算出するステップにおいて、ユークリッド距離法、マンハッタン距離法、マハラノビス距離法、ミンコフスキー距離法、コサイン距離法、最短距離法、最長距離法、重心法、群平均法、ward法、Kullback-Leiblerダイバージェンス、Jensen―Shannonダイバージェンス、Dynamic time warping、Earth mover's distanceのうち、いずれか1つまたは複数の組合せを用いて距離を算出することを特徴とする材料特性の予測モデル作成方法。 - 請求項1に記載の材料特性の予測モデル作成方法であって、
前記学習用データセットの特徴を表すパラメータとして、前記学習用データセットの特性値に係る系統誤差、標準偏差、分散、変動係数、分位数、尖度、歪度のうち、いずれか1つまたは複数のパラメータを用いることを特徴とする材料特性の予測モデル作成方法。 - 請求項1に記載の材料特性の予測モデル作成方法であって、
前記重みを算出するステップにおいて、指数関数型、逆数型、逆数の累乗型のうち、いずれか1つまたは複数の重み関数を用いることを特徴とする材料特性の予測モデル作成方法。 - 材料特性の予測モデル作成装置であって、
学習用データセットが入力されることで、学習済みクラスタリングモデルを生成するとともに、前記学習用データセットをN個のクラスターに分類するクラスタリングモデルと、
分類された前記各クラスターの重心間の距離を算出し、算出された各クラスターの重心間の距離と前記学習用データセットの特徴を表すパラメータとを用いて、前記各クラスター間の重みを算出する重み定義部と、
前記クラスターごとに、クラスターと前記重みを用いて学習済み予測モデルを生成する予測モデル{Mi}1≦i≦Nと、を有することを特徴とする予測モデル作成装置。 - 材料特性の予測装置であって、
予測用データが入力されることで、前記予測用データがN個に分類されたクラスターのうちクラスターpに属することを特定する、請求項7に記載の予測モデル作成装置により作成された学習済みクラスタリングモデルと、
特定された前記クラスターpに対応し、予測用データを入力として予測値を求める、請求項7に記載の予測モデル作成装置により作成された学習済み予測モデルMpと、
求められた予測値を出力する出力部と、を有することを特徴とする材料特性の予測装置。 - 材料特性の予測モデル作成プログラムであって、
学習用データセットを取得する工程と、
前記学習用データセットとクラスタリングモデルを用いて、学習済みクラスタリングモデルを生成するとともに、前記学習用データセットをN個のクラスターに分類する工程と、
前記各クラスターの重心間の距離を算出する工程と、
前記クラスターの重心間の距離と前記学習用データセットの特徴を表すパラメータを用いて、前記クラスター間の重みを算出する工程と、
前記クラスターごとに、クラスターと前記重みを用いて学習済み予測モデル{Mi}1≦i≦Nを生成する工程と、をコンピュータに実行させるための予測モデル作成プログラム。 - 材料特性の予測プログラムであって、
予測用データを取得する工程と、
請求項9に記載の予測モデル作成プログラムにより作成された学習済みクラスタリングモデルを用いて、前記予測用データがN個に分類された学習用データセットクラスターのうちクラスターpに属することを特定する工程と、
前記予測用データを入力として、特定された前記クラスターpに対応し、請求項9に記載の予測モデルMpを用いて予測値を求める工程と、をコンピュータに実行させるための予測プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP22875790.2A EP4411602A1 (en) | 2021-09-29 | 2022-09-12 | Prediction model creation method, prediction method, prediction model creation device, prediction device, prediction model creation program, and prediction program |
CN202280065867.8A CN118043826A (zh) | 2021-09-29 | 2022-09-12 | 预测模型制作方法、预测方法、预测模型制作装置、预测装置、预测模型制作程序、预测程序 |
JP2023524840A JP7384322B2 (ja) | 2021-09-29 | 2022-09-12 | 予測モデル作成方法、予測方法、予測モデル作成装置、予測装置、予測モデル作成プログラム、予測プログラム |
JP2023178718A JP2023182783A (ja) | 2021-09-29 | 2023-10-17 | 材料製造方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021159474 | 2021-09-29 | ||
JP2021-159474 | 2021-09-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023053918A1 true WO2023053918A1 (ja) | 2023-04-06 |
Family
ID=85782400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2022/034047 WO2023053918A1 (ja) | 2021-09-29 | 2022-09-12 | 予測モデル作成方法、予測方法、予測モデル作成装置、予測装置、予測モデル作成プログラム、予測プログラム |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4411602A1 (ja) |
JP (2) | JP7384322B2 (ja) |
CN (1) | CN118043826A (ja) |
WO (1) | WO2023053918A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086896A (ja) * | 2002-08-06 | 2004-03-18 | Fuji Electric Holdings Co Ltd | 適応的予測モデル構築方法及び適応的予測モデル構築システム |
JP2020187417A (ja) | 2019-05-10 | 2020-11-19 | 株式会社日立製作所 | 物性予測装置及び物性予測方法 |
JP2020533700A (ja) * | 2017-09-29 | 2020-11-19 | 日本電気株式会社 | 回帰装置、回帰方法、及びプログラム |
WO2020261449A1 (ja) * | 2019-06-26 | 2020-12-30 | 日本電信電話株式会社 | 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム |
JP2021159474A (ja) | 2020-04-01 | 2021-10-11 | 株式会社大一商会 | 遊技機 |
-
2022
- 2022-09-12 CN CN202280065867.8A patent/CN118043826A/zh active Pending
- 2022-09-12 EP EP22875790.2A patent/EP4411602A1/en active Pending
- 2022-09-12 WO PCT/JP2022/034047 patent/WO2023053918A1/ja active Application Filing
- 2022-09-12 JP JP2023524840A patent/JP7384322B2/ja active Active
-
2023
- 2023-10-17 JP JP2023178718A patent/JP2023182783A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086896A (ja) * | 2002-08-06 | 2004-03-18 | Fuji Electric Holdings Co Ltd | 適応的予測モデル構築方法及び適応的予測モデル構築システム |
JP2020533700A (ja) * | 2017-09-29 | 2020-11-19 | 日本電気株式会社 | 回帰装置、回帰方法、及びプログラム |
JP2020187417A (ja) | 2019-05-10 | 2020-11-19 | 株式会社日立製作所 | 物性予測装置及び物性予測方法 |
WO2020261449A1 (ja) * | 2019-06-26 | 2020-12-30 | 日本電信電話株式会社 | 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム |
JP2021159474A (ja) | 2020-04-01 | 2021-10-11 | 株式会社大一商会 | 遊技機 |
Also Published As
Publication number | Publication date |
---|---|
JP7384322B2 (ja) | 2023-11-21 |
JP2023182783A (ja) | 2023-12-26 |
JPWO2023053918A1 (ja) | 2023-04-06 |
EP4411602A1 (en) | 2024-08-07 |
CN118043826A (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7276757B2 (ja) | モデル公平性のためのシステムおよび方法 | |
Nyathi et al. | Comparison of a genetic algorithm to grammatical evolution for automated design of genetic programming classification algorithms | |
US7792353B2 (en) | Retraining a machine-learning classifier using re-labeled training samples | |
CN111241992B (zh) | 人脸识别模型构建方法、识别方法、装置、设备及存储介质 | |
CN113011529B (zh) | 文本分类模型的训练方法、装置、设备及可读存储介质 | |
US11663492B2 (en) | Alife machine learning system and method | |
Liou et al. | Applying data mining for the analysis of breast cancer data | |
CN113033090B (zh) | 推送模型训练方法、数据推送方法、装置及存储介质 | |
KR20200046189A (ko) | 생성적 적대 신경망에 기반한 협업 필터링을 위한 방법 및 시스템 | |
JP2023546021A (ja) | 機械学習モデルにおける反実仮想説明のためのシステム及び方法 | |
CN111783873A (zh) | 基于增量朴素贝叶斯模型的用户画像方法及装置 | |
CN113609337A (zh) | 图神经网络的预训练方法、训练方法、装置、设备及介质 | |
CN110334720A (zh) | 业务数据的特征提取方法、装置、服务器和存储介质 | |
JP4987282B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN115689443A (zh) | 基于波动性聚类和区块链的供应链管理方法及系统 | |
CN116249994A (zh) | 具有被配置为生成可解释结果的可分解分层的预测模型 | |
US11620550B2 (en) | Automated data table discovery for automated machine learning | |
WO2023053918A1 (ja) | 予測モデル作成方法、予測方法、予測モデル作成装置、予測装置、予測モデル作成プログラム、予測プログラム | |
CN111860556A (zh) | 一种模型的处理方法、装置及存储介质 | |
JPWO2016132683A1 (ja) | クラスタリングシステム、方法およびプログラム | |
CN113191527A (zh) | 一种基于预测模型进行人口预测的预测方法及装置 | |
JP7224263B2 (ja) | モデル生成方法、モデル生成装置及びプログラム | |
Dzemyda et al. | Data science: new issues, challenges and applications | |
JP7465497B2 (ja) | 学習装置、学習方法及びプログラム | |
JP7186200B2 (ja) | データ管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WWE | Wipo information: entry into national phase |
Ref document number: 2023524840 Country of ref document: JP |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22875790 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 18695515 Country of ref document: US |
|
WWE | Wipo information: entry into national phase |
Ref document number: 202280065867.8 Country of ref document: CN |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2022875790 Country of ref document: EP Effective date: 20240429 |