WO2024070169A1 - 試作条件提案システム、試作条件提案方法 - Google Patents

試作条件提案システム、試作条件提案方法 Download PDF

Info

Publication number
WO2024070169A1
WO2024070169A1 PCT/JP2023/027145 JP2023027145W WO2024070169A1 WO 2024070169 A1 WO2024070169 A1 WO 2024070169A1 JP 2023027145 W JP2023027145 W JP 2023027145W WO 2024070169 A1 WO2024070169 A1 WO 2024070169A1
Authority
WO
WIPO (PCT)
Prior art keywords
regression model
prototype
measurement data
weighting
characteristic measurement
Prior art date
Application number
PCT/JP2023/027145
Other languages
English (en)
French (fr)
Inventor
夏輝 伊藤
真吾 惣川
岡 柚希 橋本
Original Assignee
日本碍子株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本碍子株式会社 filed Critical 日本碍子株式会社
Publication of WO2024070169A1 publication Critical patent/WO2024070169A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass

Definitions

  • the present invention relates to a system and method for proposing material prototyping conditions to material developers.
  • Patent Document 1 discloses a system that estimates the production conditions for a material with optimal physical properties and structure from a data set that includes the production conditions for each of multiple substances used as samples, and material information that represents the physical properties and structure of each substance.
  • the characteristics of the material to be developed are first measured through various evaluation tests, and data representing the measurement results (hereinafter referred to as “measured characteristic data”).
  • the obtained measured characteristic data is then input into a computer to construct various trained machine learning models, and the conditions for prototyping the material (hereinafter referred to as “prototype conditions”) are estimated using the trained machine learning models.
  • the accuracy with which the computer estimates the prototyping conditions (hereinafter referred to as “estimation accuracy”) is determined by the accuracy of the trained machine learning model used in the process of estimating the prototyping conditions.
  • the accuracy of this trained machine learning model is largely determined by the number of measured characteristic data (hereinafter also referred to as "number of samples”) that were trained when the machine learning model was constructed, the degree of distribution variability, etc.
  • the characteristic measurement data (hereinafter also referred to as "learning data”) input to a computer to construct a machine learning model generally has the characteristic that it has an extremely large number of explanatory variables, but on the other hand, the number of samples is often small. If the amount of training data is small or if the distribution of the training data is biased, the computer cannot construct a highly accurate machine learning model. Therefore, in such cases, even if the computer is made to execute a process to estimate prototype conditions using the constructed machine learning model, there is a risk that sufficient estimation accuracy cannot be obtained.
  • the present invention aims to provide a technology that can accurately suggest optimal prototyping conditions for materials even when the amount of training data used to build a machine learning model is small or when the distribution of the training data is biased.
  • the prototype condition proposal system proposes prototype conditions for a material to a material developer, and includes a regression model construction processing unit and a prototype condition proposal processing unit.
  • the regression model construction processing unit executes a regression model construction process for property measurement data representing actual measurement results of the material's properties.
  • the prototype condition proposal processing unit searches for optimal prototype conditions for the material using the constructed regression model, and executes a prototype condition proposal process based on the search results.
  • the regression model construction process includes a process of calculating a weighting criterion that is a criterion for weighting the property measurement data, and a process of weighting the property measurement data based on the calculated weighting criterion.
  • a prototype condition proposing method is a method of proposing prototype conditions for a material to a material developer using a computer.
  • This prototype condition proposing method causes the computer to execute a regression model construction process and a prototype condition proposing process.
  • the regression model construction process represents a process of constructing a regression model for property measurement data representing actual measurement results of the properties of the material.
  • the prototype condition proposing process represents a process of searching for optimal prototype conditions for the material using the constructed regression model, and proposing prototype conditions for the material based on the search results.
  • the regression model construction process includes a process of calculating a weighting criterion that is a criterion for weighting the property measurement data, and a process of weighting the property measurement data based on the calculated weighting criterion.
  • the present invention even when the amount of training data used to construct a machine learning model is small or when the distribution of the training data is biased, it is possible to accurately propose optimal prototyping conditions for materials.
  • FIG. 1 is a schematic diagram showing an overview of a prototype condition proposal system according to an embodiment of the present invention
  • FIG. 1 is a diagram showing functional blocks of a prototype conditions proposal system according to an embodiment of the present invention.
  • 1 is a flowchart showing the overall processing flow of a prototype conditions proposal system according to an embodiment of the present invention.
  • 11 is a flowchart showing details of characteristic measurement data pre-processing.
  • 11 is a flowchart showing details of a regression model construction process.
  • FIG. 11 is a diagram showing a comparison of estimation accuracy before and after weighting.
  • 11 is a flowchart showing details of a prototype condition proposal process.
  • FIG. 1 is a schematic diagram showing an overview of a prototype condition proposal system according to one embodiment of the present invention.
  • the prototype condition proposal system 1 shown in FIG. 1 optimizes various prototype conditions to be considered when prototyping a material, such as the composition of the material and the firing conditions, and proposes the results to a material developer, who is the user of this system.
  • the optimization of the prototype conditions is performed using various machine learning algorithms based on actual characteristic measurement data representing the actual measurement results of the characteristics of the material.
  • GPR Gaussian Process Regression
  • SVR Support Vector Regression
  • Logistic Regression Logistic Regression
  • LASSO Regression Least Absolute Shrinkage and Selection Operator Regression
  • the prototype condition proposal system 1 when a user of the prototype condition proposal system 1 prototypes a material under the prototype conditions proposed by the prototype condition proposal system 1 and actually measures the properties of the resulting material, new property measurement data is generated that represents the evaluation value of the properties of the resulting product.
  • the prototype condition proposal system 1 learns this property measurement data as new learning data, the prototype condition proposal system 1 proposes more optimized prototype conditions to the user. Each time the user repeats this cycle, the prototype condition proposal system 1 of this embodiment can propose prototype conditions with more favorable predicted property values.
  • the prototype condition proposal system may include a function for prototyping a material and a function for actually measuring the properties of the material to be prototyped, or may be configured integrally with these functions.
  • the prototype conditions proposal system 1 of this embodiment is realized by a single general-purpose computer device, as shown in FIG. 1.
  • the prototype conditions proposal system 1 is assumed to be realized by a single general-purpose computer device that includes one or more processor devices, one or more storage devices, one or more input/output devices, and wired or wireless communication lines (none of which are shown) connecting them.
  • This computer device is installed as a terminal inside a laboratory, for example, and is connected to various other terminals installed inside and outside the laboratory, various terminals owned by each user such as laptop PCs, tablets, smartphones, etc. (hereinafter referred to as "user terminals"), and other devices such as server devices, via a communication network such as the Internet 400 or a dedicated line.
  • the computer device and the Internet 400 are connected by wire via well-known communication equipment (not shown), but may also be connected wirelessly.
  • FIG. 2 is a diagram showing the functional blocks of the prototype conditions proposal system according to one embodiment of the present invention. Note that each block described below shows a functional block, not a hardware-based configuration.
  • the prototype conditions proposal system 1 of this embodiment is configured to include a control unit 11, a memory unit 12, a user interface unit 13, and a communication unit 14.
  • the control unit 11 executes various data processing operations based on user operation input detected by the user interface unit 13, data acquired by the communication unit 14, and programs and data stored in the memory unit 12.
  • the control unit 11 also functions as an interface between the user interface unit 13, the communication unit 14, and the memory unit 12.
  • the control unit 11 has the functional blocks of a characteristic measurement data preprocessing unit 111, a regression model construction processing unit 112, and a prototype condition proposal processing unit 113.
  • the control unit 11 is configured using processor devices (hereinafter simply referred to as "processors") such as a CPU (Central Processing Unit) and various co-processors, and can realize these functional blocks by executing a predetermined program.
  • processors such as a CPU (Central Processing Unit) and various co-processors
  • the control unit 11 may also be configured using a logic circuit such as an FPGA (Field Programmable Gate Array).
  • the control unit 11 may also be configured by combining a processor and a logic circuit.
  • the program executed by the control unit 11 may be installed from a program source.
  • the program source may be, for example, a program distribution computer or a computer-readable recording medium.
  • the program executed by the control unit 11 may also be composed of device drivers, an operating system, various application programs located at higher layers, and libraries that provide common functions to these programs. Furthermore, two or more programs may be realized as one program, and one program may be realized as two or more programs.
  • the characteristic measurement data preprocessing unit 111 performs preprocessing on the characteristic measurement data in the so-called raw data state immediately after recording. This processing performed by the characteristic measurement data preprocessing unit 111 is called characteristic measurement data preprocessing.
  • the regression model construction processing unit 112 executes a process of constructing a regression model for the preprocessed characteristic measurement data. This process executed by the regression model construction processing unit 112 is referred to as the regression model construction process.
  • the prototype condition proposal processing unit 113 searches for optimal prototype conditions for the material using the regression model constructed by the regression model construction processing unit 112 for the preprocessed characteristic measurement data, and performs processing to propose prototype conditions for the material to the user based on the search results. This processing performed by the prototype condition proposal processing unit 113 is referred to as the prototype condition proposal processing.
  • the storage unit 12 is configured using a storage device such as a RAM or flash memory, and stores programs that supply various processing commands to the control unit 11, and data representing various information used in the processing executed by the control unit 11. For example, characteristic measurement data that has been preprocessed by the characteristic measurement data preprocessing unit 11 (hereinafter referred to as "preprocessed data") and data representing the regression model constructed by the regression model construction processing unit 112 are stored in the storage unit 12.
  • preprocessed data characteristic measurement data that has been preprocessed by the characteristic measurement data preprocessing unit 11
  • data representing the regression model constructed by the regression model construction processing unit 112 are stored in the storage unit 12.
  • the control unit 11 can realize the functional blocks of the characteristic measurement data preprocessing unit 111, the regression model construction processing unit 112, and the prototype condition proposal processing unit 113 described above by reading and writing this information in the storage unit 12.
  • the user interface unit 13 accepts input operations from the user, and is responsible for processing related to the user interface, such as image display and audio output.
  • the user interface unit 13 has the functional blocks of an input unit 131 and an output unit 132.
  • the input unit 131 detects various operations from the user.
  • the input unit 131 is configured using, for example, a keyboard, a pointing device, a touch panel, etc.
  • the output unit 132 executes screen display, audio output, etc. for the user.
  • the output unit 132 is configured using, for example, an LCD display, a touch screen, etc.
  • the communication unit 14 is responsible for processing communications with user terminals owned by each user and other devices such as server devices via the Internet 400.
  • the communication unit 14 is configured using, for example, a NIC (Network Interface Card) or an HBA (Host Bus Adapter).
  • the functions of the prototype conditions proposal system 1 have been described as being realized integrally by a single computer device. However, these functions may also be realized by multiple computers or server devices connected to each other. Furthermore, the prototype conditions proposal system 1 may be configured to include a general-purpose computer device such as a laptop PC and a web browser installed thereon, or may be configured to include a web server and various portable devices.
  • each function is just an example, and multiple functions may be combined into one function, or one function may be divided into multiple functions.
  • FIG. 3 is a flowchart showing the overall processing flow of the prototype conditions proposal system according to one embodiment of the present invention. Note that in the following description, the processing may be described with the aforementioned functions or programs as the subject, but the processing described with the function or program as the subject may also be processing performed by a processor or a device having that processor.
  • step S310 the control unit 11 executes characteristic measurement data preprocessing using the characteristic measurement data preprocessing unit 111.
  • the characteristic measurement data is preprocessed and becomes preprocessed data, making it possible to execute each subsequent process normally. Details of the characteristic measurement data preprocessing performed in step S310 will be explained later with reference to the flowchart in FIG. 4.
  • the control unit 11 proceeds to step S320.
  • step S320 the control unit 11 executes a regression model construction process using the regression model construction processing unit 112. As a result, a regression model is constructed for the preprocessed data. Details of the regression model construction process performed in step S320 will be described later with reference to the flowchart in FIG. 5. When the regression model construction process is completed, the control unit 11 proceeds to step S330.
  • step S330 the control unit 11 executes a regression model evaluation process.
  • the generalization performance which is an index representing the predictive accuracy of a regression model, is evaluated for each of the multiple regression models constructed as a result of each process up to step S320.
  • This evaluation is performed, for example, by performing cross validation with other regression models.
  • the evaluation results are visualized by graphs such as scatter plots and box plots. This allows the user to receive suggestions for prototyping conditions based on a regression model with good generalization performance.
  • the control unit 11 proceeds to step S340.
  • step S340 the control unit 11 executes a prototype condition proposal process by the prototype condition proposal processing unit 113.
  • the user of the prototype condition proposal system 1 can appropriately modify the prototype conditions of the material proposed by the prototype condition proposal system 1 to make them more preferable.
  • the control unit 11 obtains a predicted value of the material properties when prototyped under the prototype conditions modified by the user by applying it to the selected regression model, and presents it to the user. In other words, the user can interactively modify the prototype conditions while checking the predicted value.
  • the prototype condition proposal system 1 is a system that can incorporate the knowledge of the user, who is the developer of the material, into the prototype conditions of the material proposed to the user. Details of the prototype condition proposal process performed in step S340 will be described later with reference to the flowchart in FIG. 7.
  • the control unit 11 temporarily ends the process shown in the flowchart in FIG. 3.
  • the prototype condition proposal system 1 of this embodiment executes each process of steps S310 to S340 in FIG. 3 to propose favorable prototype conditions to the user. That is, in step S310, the prototype condition proposal system 1 of this embodiment automatically performs the necessary preprocessing on the characteristic measurement data in the raw data state. Therefore, each process of steps S320 to S340 can be executed without manually performing complicated preprocessing on the characteristic measurement data. Furthermore, in the prototype condition proposal system 1 of this embodiment, the user can select a regression model with good generalization performance. Therefore, the prototype condition proposal system 1 can propose prototype conditions with favorable predicted characteristic values to the user.
  • a user of the prototype conditions proposal system 1 can prototype a material under the prototype conditions proposed by the prototype conditions proposal system 1, measure the properties of the resulting product, and have the prototype conditions proposal system 1 learn the data representing the actual measurement results as new property measurement data, and then have the prototype conditions proposal system 1 execute the processes of steps S310 to S340 in FIG. 3 again.
  • the prototype conditions proposal system 1 can propose more optimized prototype conditions to the user.
  • the prototype conditions proposal system 1 of this embodiment can propose prototype conditions with better predicted property values each time it repeats the processes of steps S310 to S340 in FIG. 3 for the same prototype object.
  • Figure 4 is a flowchart showing the details of preprocessing of characteristic measurement data.
  • step S410 the control unit 11 causes the characteristic measurement data preprocessing unit 111 to accept input of characteristic measurement data from the user via the input unit 131 or the communication unit 14.
  • the characteristic measurement data input to the prototype condition proposal system 1 may be, for example, categorical data, continuous data, or discrete data.
  • the specific data format of the characteristic measurement data input to the prototype condition proposal system 1 may be appropriately determined.
  • step S420 the control unit 11 sets the type of variables for the characteristic measurement data input from the user in step S410 through the characteristic measurement data preprocessing unit 111.
  • an explanatory variable is a variable that is the basis for determining a predicted value of a characteristic.
  • the explanatory variables are the composition of the materials that make up the prototype conditions and the firing conditions.
  • the target variable is a variable that represents the characteristic value of the prototype material that is the subject of prediction.
  • the explanatory variables may be set as defaults, and a setting operation may be received from the user who wishes to change the target variable.
  • step S430 the control unit 11 determines whether or not there is an abnormal value in the characteristic measurement data for which one of the explanatory variables and the objective variable was set in step S420, by using the characteristic measurement data preprocessing unit 111.
  • the process of determining whether or not there is an abnormal value is performed, for example, by first displaying the characteristic measurement data in a histogram and determining whether or not there is an outlier that falls outside the range of the average value ⁇ 2 ⁇ , and then determining whether or not there was a data input error or a malfunction of the evaluation test machine when generating the characteristic measurement data for which it is determined that there is an outlier.
  • the control unit 11 deletes the abnormal value and sets it as a missing value, and proceeds to step S440. Furthermore, if the type of abnormal value contained in the characteristic measurement data is one of the objective variables when the explanatory variables completely overlap and there are different levels of the characteristics, the control unit 11 deletes the sample related to the abnormal value and proceeds to step S440. This is because, when all explanatory variables are duplicated and levels with different characteristics are treated as abnormal values, the level itself must be deleted, unlike when one explanatory variable is an abnormal value due to an input error, etc. On the other hand, if it is determined that the characteristic measurement data does not contain any abnormal values, the control unit 11 proceeds directly to step S440.
  • the prototype condition proposal system 1 of this embodiment can omit the process in step S430.
  • step S440 the control unit 11 determines whether or not there is a missing value in the characteristic measurement data by the characteristic measurement data preprocessing unit 111. This is because the characteristic measurement data may already contain missing values. If it is determined that the preprocessed data contains missing values, the control unit 11 complements the missing values and proceeds to step S450.
  • the missing value complementation process is performed, for example, by using the average value, median value, minimum value, maximum value, etc. of the characteristic measurement data excluding abnormal values as a value to complement the missing value.
  • the missing value may also be complemented by linear interpolation. Note that, for example, when the characteristic measurement data preprocessing unit 111 complements the missing value in step S440, it may display the complemented value in red to make it easier to identify.
  • the characteristic measurement data preprocessing unit 111 may delete the level itself without complementing the missing value. Furthermore, in the prototype condition proposal system 1 of this embodiment, the characteristic measurement data preprocessing unit 111 can delete the explanatory variables themselves when the explanatory variables have a large missing ratio, for example, when more than 50% of the data is missing. On the other hand, if it is determined that the characteristic measurement data does not contain missing values, the control unit 11 proceeds directly to step S450.
  • step S450 if the explanatory variables are categorical values rather than continuous values, the control unit 11 causes the characteristic measurement data preprocessing unit 111 to perform encoding processing on the explanatory variables and convert them into numerical data.
  • the characteristic measurement data preprocessing unit 111 executes this encoding processing by, for example, referring to records in a table that represents the correspondence between categorical data and numerical data, which is stored in the memory unit 12.
  • the control unit 11 completes the processing in step S450, it proceeds to step S460.
  • step S460 the control unit 11 determines whether the characteristic measurement data includes redundant explanatory variables through the characteristic measurement data preprocessing unit 111. This determination is based on whether a combination of explanatory variables with a correlation coefficient of a predetermined number or more, for example, 0.8 or more, can be extracted. If it is determined that the characteristic measurement data includes redundant explanatory variables, the control unit 11 deletes one of the redundant explanatory variables and proceeds to step S470. In the prototype condition proposal system 1 of this embodiment, combinations of explanatory variables with a correlation coefficient of 0.8 or more are visualized to the user through the output unit 132, and the user can select the explanatory variable to be deleted through the input unit 131. On the other hand, if it is determined that the characteristic measurement data does not include redundant explanatory variables, the control unit 11 proceeds directly to step S470.
  • step S470 the control unit 11 uses the characteristic measurement data preprocessing unit 111 to perform standardization processing on the characteristic measurement data as necessary.
  • the control unit 11 completes the processing in step S470, it stores the preprocessed data, which is the characteristic measurement data that has been preprocessed in steps S410 to S470 in FIG. 4, in the storage unit 12, and ends the characteristic measurement data preprocessing shown in the flowchart in FIG. 4.
  • the control unit 11 may use the characteristic measurement data preprocessing unit 111 to perform normalization processing on the characteristic measurement data as necessary. In such a case, the control unit 11 may execute each subsequent process without performing the standardization processing in S470.
  • Figure 5 is a flowchart showing the details of the regression model construction process.
  • step S510 the control unit 11 selects the implementation conditions of cross-validation for evaluating the regression model to be constructed for the preprocessed data by the regression model construction processing unit 112.
  • the prototyping condition proposal system 1 of this embodiment evaluates each regression model by K-fold cross validation.
  • the prototyping condition proposal system 1 evaluates the regression model by 10-fold cross validation.
  • the user can also select the implementation conditions of cross validation.
  • the regression model construction processing unit 112 can accept the implementation conditions of cross validation from the user via the input unit 131 or the communication unit 14.
  • step S520 the control unit 11 selects, by the regression model construction processing unit 112, a candidate regression model to be used as a predictive model in searching for prototype conditions.
  • the regression model construction processing unit 112 selects as a candidate a regression model for which a selection process has been accepted from the user via the input unit 131 or the communication unit 14.
  • the user can select as candidates a plurality of regression models from various regression models such as Gaussian process regression and the aforementioned linear regression, regression tree (including the case of the ensemble method), regression by neural network, support vector regression, logistic regression, and LASSO regression.
  • the control unit 11 proceeds to step S530.
  • step S530 the control unit 11 executes a process of calculating a weighting criterion, which is a criterion for weighting the actual property measurement data, by the regression model construction processing unit 112.
  • the weighting criterion is calculated based on the difference between the objective variable included in the actual property measurement data and the target characteristic that represents the target value of the material characteristic, or a statistic that represents the rarity of the explanatory variable included in the actual property measurement data (described in detail later). Note that a specific example of a statistic that represents the rarity of an explanatory variable is the occurrence probability of an explanatory variable that satisfies a predetermined condition.
  • step S540 the control unit 11 executes a process of weighting the actual characteristic measurement data based on the weighting criterion calculated in step S530 by the regression model construction processing unit 112.
  • the regression model construction processing unit 112 can also directly weight the regression model based on the weighting criterion calculated in step S530.
  • the process executed by the regression model construction processing unit 112 in step S540 based on the result of step S530 is specifically one of the following processes: a process of setting a loss function, which is a function that serves as an index of learning; an oversampling process of amplifying rare or important actual characteristic measurement data and adding it as learning data; and an undersampling process of deleting redundant or unimportant actual characteristic measurement data from the learning data (described in detail later).
  • a process of setting a loss function which is a function that serves as an index of learning
  • an oversampling process of amplifying rare or important actual characteristic measurement data and adding it as learning data and an undersampling process of deleting redundant or unimportant actual characteristic measurement data from the learning data (described in detail later).
  • step S550 the control unit 11 causes the regression model construction processing unit 112 to search for and set optimal hyperparameters for each regression model of each method selected as a candidate in step S520.
  • the regression model construction processing unit 112 automatically searches for all parameters for each regression model, and automatically sets those that will best improve the generalization performance of the regression model when set as hyperparameters during construction of the regression model.
  • the control unit 11 completes the processing in step S550, it proceeds to step S560.
  • step S560 the control unit 11 performs a process of creating a regression model for each method, with the optimal hyperparameters set, using the regression model construction processing unit 112.
  • the regression model construction processing unit 112 selects the regression model with the highest generalization performance from all the created regression models, and performs a process of determining the final regression model.
  • the control unit 11 ends the regression model construction process shown in the flowchart of FIG. 5.
  • the weighting criteria are calculated based on the difference between the objective variable included in the measured characteristic data and the target characteristic that represents the target value of the material's characteristics, or based on a statistic that represents the rarity of the explanatory variable included in the measured characteristic data.
  • step S530 The specific details of the process executed in step S530 when calculating the weighting criteria based on the difference between the objective variable included in the actual characteristic measurement data and the target characteristic that represents the target value of the material characteristic are shown below as steps S532 to S534.
  • step S532 the control unit 11 calculates the difference between the objective variable included in the characteristic measurement data and the target characteristic representing the target value of the material characteristic by the regression model construction processing unit 112. When the processing in step S532 is completed, the control unit 11 proceeds to step S534.
  • step S534 the control unit 11 determines the weighting criterion by the regression model construction processing unit 112 using a function of the difference between the objective variable and the target characteristic calculated in step S532.
  • this function include the absolute value or square value of the difference between the objective variable and the target characteristic, which represents the distance between the objective variable and the target characteristic.
  • step S530 when calculating the weighting criteria based on statistics that indicate the rarity of the explanatory variables contained in the characteristic measurement data, the specific content of the processing executed in step S530 is as shown below as steps S536 to S538.
  • step S536 the control unit 11 uses the regression model construction processing unit 112 to calculate the number of occurrences of explanatory variables that take a specific value or fall within a specific range. Specifically, for example, when the explanatory variables relate to the raw material ratios of various raw materials, the control unit 11 calculates the number of occurrences of explanatory variables that take a value greater than 0, in other words, that represent the raw material ratios that are actually used.
  • step S536 the control unit 11 proceeds to step S538.
  • step S538 the control unit 11 determines the weighting criterion by the regression model construction processing unit 112 using a function of the number of occurrences of the explanatory variable calculated in step S536.
  • This function is the probability of occurrence of the explanatory variable in the entire learning data.
  • the regression model construction processing unit 112 may also determine the number of occurrences of the explanatory variable as the weighting criterion, instead of using the probability of occurrence of the explanatory variable as the weighting criterion.
  • the reason that a criterion based on the explanatory variable is used is to incorporate the material science knowledge of the user, who is a material developer, particularly for important parameters that do not appear in the objective variables.
  • the regression model construction processing unit 112 performs weighting on the characteristic measured data or the regression model by executing one of the following processes: a process for setting a loss function; an oversampling process for amplifying rare or important characteristic measured data and adding it as learning data; and an undersampling process for deleting redundant or unimportant characteristic measured data from the learning data. That is, the regression model construction process further includes one of the following processes, which are executed based on the calculated weighting criterion: a process for setting a loss function; an oversampling process for amplifying rare or important characteristic measured data and adding it as learning data; and an undersampling process for deleting redundant or unimportant characteristic measured data from the learning data.
  • step S530 when setting the loss function based on the weighting criteria calculated in step S530 are described below as step S542.
  • step S542 the control unit 11 determines, through the regression model construction processing unit 112, machine learning based on the weighting criteria calculated in step S530 so as to reduce the prediction error of rare or important measured characteristic data. This process is performed by weighting the measured characteristic data with the loss function during learning.
  • step S538 the control unit 11 ends the process shown in step S540 of reflecting the weighting criteria in the learning data or regression model, and proceeds to step S550.
  • step S530 the specific content of the process called oversampling or upsampling, which is executed in step S530 when rare or important measured characteristic data is amplified based on the weighting criteria calculated in step S530 and added as learning data, is described below as step S544.
  • step S544 the control unit 11 causes the regression model construction processing unit 112 to copy the rare or important characteristic measurement data to be oversampled based on the weighting criteria calculated in step S530, and add it to the learning data.
  • the characteristic measurement data is copied until the number of copies reaches a predetermined threshold value or more.
  • the oversampling process may be performed by various methods such as SMOTE, ADASYN, Borderline-SMOTE, and Safe-level SMOTE. This adds rare or important characteristic measurement data to the learning data, improving the balance of the learning data.
  • Figure 6 shows a comparison of the estimation accuracy before and after the weighting process by oversampling performed in step S544.
  • Figure 6 shows a scatter plot of characteristic measurement data and its predicted value for bending strength, which is one of the characteristics of a ceramic composite material made from a number of raw materials.
  • FIG. 6 shows that weighting was performed on the actual characteristic data of a specific raw material, for which the raw material was used only a small number of times in the entire actual measurement data, resulting in insufficient estimation accuracy. As a result, the error between the estimated value and the actual measurement value for this composite material was reduced, or in other words, the estimation accuracy for this composite material was improved.
  • the control unit 11 ends the process of reflecting the weighting criteria in the learning data or regression model shown in step S540, and proceeds to step S550.
  • step S540 the specific content of the process called undersampling or downsampling, which is executed in step S540 when redundant or less important measured characteristic data is deleted from the learning data based on the weighting criteria calculated in step S530, is described below as step S546.
  • step S546 the control unit 11 causes the regression model construction processing unit 112 to delete redundant or unimportant measured characteristic data from the learning data. This improves the balance of the learning data because redundant or unimportant measured characteristic data is deleted from the learning data.
  • step S546 the control unit 11 ends the processing shown in step S540 for reflecting the weighting criteria in the learning data or regression model, and proceeds to step S550.
  • Figure 7 is a flowchart showing the details of the prototype condition proposal process.
  • step S710 the control unit 11 causes the prototyping condition proposal processing unit 113 to perform a prototyping condition search process based on the regression model constructed in step S560 of FIG. 5.
  • the prototyping condition proposal processing unit 113 executes this process by optimization processing.
  • the prototyping condition proposal system 1 of this embodiment is configured to be able to use various optimization processing methods such as mathematical optimization (MO), Bayesian optimization (BO), genetic algorithm (GA), Newton's method (NM), and simplex method (SM).
  • MO mathematical optimization
  • BO Bayesian optimization
  • GA genetic algorithm
  • NM Newton's method
  • SM simplex method
  • the prototyping condition proposal processing unit 113 performs a sensitivity analysis on the tentative prototyping condition to evaluate the importance of each explanatory variable constituting the tentative prototyping condition, and presents the evaluation result together.
  • the regression model used is Gaussian process regression, it is also possible to select the prototype conditions that maximize the acquisition function.
  • step S720 the control unit 11 accepts from the user a modification to the provisional prototyping conditions proposed to the user in step S710 by the prototyping condition proposal processing unit 113.
  • the prototyping condition proposal processing unit 113 accepts an input operation related to the modification of the values of the explanatory variables constituting the provisional prototyping conditions from the user via the input unit 131 or the communication unit 14, it modifies the provisional prototyping conditions according to the modification content.
  • the control unit 11 uses the prototyping condition proposal processing unit 113 to use a regression model to obtain a predicted value of the material characteristics when a prototype is produced under the modified provisional prototyping conditions, and presents the calculation result to the user.
  • the prototyping condition proposal processing unit 113 also performs a sensitivity analysis on the modified provisional prototyping conditions, as in step S710, to evaluate the importance of the explanatory variables constituting the modified provisional prototyping conditions, and presents the evaluation result together.
  • the evaluation result is updated every time the user modifies the provisional prototyping conditions, and the latest evaluation result is always presented to the user.
  • the control unit 11 proceeds to step S730.
  • step S730 the control unit 11, using the prototyping condition proposal processing unit 113, determines whether the predicted value of the characteristic obtained in step S720 for the revised tentative prototyping conditions is insufficient as the characteristic value of the material to be prototyped.
  • the regression model used is Gaussian process regression
  • this determination is made by obtaining an acquisition function (Acquisition Function) for each prototyping condition, which represents the expected value of improvement in the material characteristic when prototyped under that prototyping condition, for the revised tentative prototyping conditions, and determining whether the difference between the value of that acquisition function and the maximum value of the acquisition function is within a specified range.
  • the acquisition function is calculated based on the predicted value ⁇ of the material characteristic when prototyped under any prototyping condition, and the standard deviation ⁇ representing the variance of that predicted value. If it is determined that the predicted characteristic values are insufficient, the process returns to step S720 to again accept instructions from the user to modify the prototype conditions. If it is determined that the predicted characteristic values are not insufficient, the predicted values of the material characteristics when prototyping under the modified provisional prototype conditions are sufficient, so the provisional prototype conditions are finalized and proposed to the user as finalized prototype conditions. In other words, this determination process is repeated until it is determined that the predicted values of the material characteristics related to the provisional prototype conditions are not insufficient. When the process in step S730 is completed, the control unit 11 ends the prototype condition proposal process shown in the flowchart of FIG. 7.
  • the prototype condition proposal system 1 of this embodiment proposes more optimized prototype conditions to the user based on the newly input characteristic measurement data.
  • the control unit 11 of the prototype condition proposal system 1 determines whether the newly input characteristic measurement data contains missing values. If it is determined that a missing value is included, in order to complement the missing value, characteristic measurement data preprocessing is performed on the newly input characteristic measurement data by starting processing from step S440 of FIG. 4.
  • the control unit 11 determines whether or not the regression model needs to be updated. If it is determined that the regression model needs to be updated, the control unit 11 executes a regression model construction process for the newly input characteristic measurement data, starting from step S510 in FIG. 5, in order to construct a new regression model. On the other hand, if it is determined that the regression model does not need to be updated, the control unit 11 omits the regression model construction process and the regression model evaluation process, and performs a prototype condition proposal process for the newly input characteristic measurement data, starting from step S710 in FIG. 7, using the previously constructed regression model. Note that even if the newly input characteristic measurement data contains missing values, if the regression model does not need to be updated, the control unit 11 similarly omits the regression model construction process and the regression model evaluation process.
  • the prototype condition proposal system 1 is a system that proposes prototype conditions for a material to a material developer, and includes a regression model construction processing unit 112 and a prototype condition proposal processing unit 113.
  • the regression model construction processing unit 112 executes a regression model construction process for the characteristic measurement data that represents the actual measurement results of the characteristics of the material (step S320).
  • the prototype condition proposal processing unit 113 searches for optimal prototype conditions for the material using the constructed regression model, and executes a prototype condition proposal process based on the search results (step S340).
  • the regression model construction process (FIG.
  • step S530 includes a process of calculating a weighting criterion that is a criterion for weighting the characteristic measurement data (step S530), and a process of weighting the characteristic measurement data based on the calculated weighting criterion (step S540).
  • the weighting criteria are calculated based on the difference between the objective variables included in the characteristic measurement data and the target characteristics that represent the target values of the material characteristics (steps S532 to S534). In this way, even in material development where the weighting criteria cannot be determined based on the number of times the objective variable appears because regression problems are often solved, the weighting criteria can be determined based on the objective variables.
  • the weighting criteria are calculated based on statistics that indicate the rarity of the explanatory variables contained in the characteristic measurement data (steps S536 to S538). In this way, the weighting criteria can be calculated based on the explanatory variables. As a result, it is possible to incorporate the material science knowledge of the user, who is a material developer, especially for important parameters that do not appear in the objective variables.
  • the regression model construction process (FIG. 5) further includes a process (step S542) of setting a loss function based on the calculated weighting criteria. In this way, it is possible to reduce prediction errors for rare or important characteristic measurement data.
  • the regression model construction process (FIG. 5) further includes an oversampling process (step S544) that amplifies rare or important measured characteristic data based on the calculated weighting criteria and adds the data as training data. In this way, rare or important measured characteristic data is added to the training data. As a result, the sensitivity of rare or important measured characteristic data can be improved, improving the balance of the training data.
  • the regression model construction process (FIG. 5) further includes an undersampling process (step S546) that deletes redundant or unimportant characteristic measurement data from the training data based on the calculated weighting criterion.
  • an undersampling process (step S546) that deletes redundant or unimportant characteristic measurement data from the training data based on the calculated weighting criterion.
  • redundant or unimportant characteristic measurement data is deleted from the training data.
  • the sensitivity of redundant or unimportant characteristic measurement data can be reduced, improving the balance of the training data.
  • Prototype condition proposal system 11 Control unit 12: Storage unit 13: User interface unit 14: Communication unit 111: Property measurement data preprocessing unit 112: Feature quantity selection processing unit 113: Regression model construction processing unit 114: Prototype condition proposal processing unit 131: Input unit 132: Output unit 400: Internet

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

機械学習モデルの構築に使用される学習データの数が少ない場合や、学習データの分布に偏りがある場合にも、良好な材料の試作条件を精度よく提案可能な技術を提供する。試作条件提案システム1は、材料開発者に材料の試作条件を提案するシステムであって、回帰モデル構築処理部112と、試作条件提案処理部113とを備える。回帰モデル構築処理部112は、材料の特性の実測結果を表す特性実測データについて回帰モデル構築処理を実行する。試作条件提案処理部113は、構築された回帰モデルを用いて材料の最適な試作条件を探索し、探索結果に基づいて試作条件提案処理を実行する。回帰モデル構築処理は、特性実測データへの重みづけの基準である重み基準を算出する処理と、算出された重み基準に基づいて特性実測データに重みづけを行う処理とを含む。

Description

試作条件提案システム、試作条件提案方法
 本発明は、材料開発者に材料の試作条件を提案するシステムおよび方法に関する。
 材料(Materials)の研究開発を行う材料科学の分野では、今日、統計解析や機械学習等の情報技術(Informatics)を利用して材料の物性や構造等を効率よく予測する、マテリアルズ・インフォマティクス(Materials Informatics; MI)と呼ばれる手法が広く用いられている。このマテリアルズ・インフォマティクスを用いた材料の研究開発に関して、例えば特許文献1の技術が知られている。特許文献1には、試料とされる複数の物質それぞれの作製条件と、各物質の物性や構造を表す物質情報とを含むデータセットから、最適な物性や構造を有する物質の作製条件を推定するシステムが開示されている。
国際公開第2021/044913号明細書
 マテリアルズ・インフォマティクスを用いた材料開発の現場では、通例、まず、開発対象の材料の特性を各種の評価試験によって実測し、実測結果を表すデータ(以下、「特性実測データ」と称する)を取得する。そして、取得した特性実測データをコンピュータに入力して学習済みの各種機械学習モデルを構築し、構築した学習済みの機械学習モデルを使用して、当該材料を試作する際の条件(以下、「試作条件」と称する)を推定する。このときコンピュータが試作条件を推定する精度(以下、「推定精度」と称する)は、試作条件を推定する処理に用いられる、学習済みの機械学習モデルの精度より決まる。そして、この学習済みの機械学習モデルの精度は、当該機械学習モデルの構築時に学習させた特性実測データの数(以下、「サンプル数」とも称する)や分布のばらつきの度合等により概ね決定される。
 ここで、機械学習モデルの構築のためにコンピュータに入力する特性実測データ(以下、「学習データ」とも称する)は、一般に、説明変数の数がきわめて多く、その半面でサンプル数が少数であることが多い、という特徴を有する。そして、学習データの数が少ない場合や、学習データの分布に偏りがある場合には、コンピュータは、高精度な機械学習モデルを構築することができない。そのため、然様な場合には、構築した機械学習モデルを使用して試作条件を推定する処理をコンピュータに実行させても、十分な推定精度を得ることができないおそれがある。
 本発明は、上記の課題に鑑みて、機械学習モデルの構築に使用される学習データの数が少ない場合や、学習データの分布に偏りがある場合にも、材料の最適な試作条件を精度よく提案可能な技術を提供することを目的とする。
 本発明による試作条件提案システムは、材料開発者に材料の試作条件を提案するものであって、回帰モデル構築処理部と、試作条件提案処理部とを備える。回帰モデル構築処理部は、材料の特性の実測結果を表す特性実測データについて回帰モデル構築処理を実行する。試作条件提案処理部は、構築された回帰モデルを用いて材料の最適な試作条件を探索し、探索結果に基づいて試作条件提案処理を実行する。回帰モデル構築処理は、特性実測データへの重みづけの基準である重み基準を算出する処理と、算出された重み基準に基づいて特性実測データに重みづけを行う処理とを含む。
 また、本発明による試作条件提案方法は、コンピュータを用いて材料開発者に材料の試作条件を提案する方法である。この試作条件提案方法は、回帰モデル構築処理と、試作条件提案処理とをコンピュータに実行させる。回帰モデル構築処理は、材料の特性の実測結果を表す特性実測データについて回帰モデルを構築する処理を表す。試作条件提案処理は、構築された回帰モデルを用いて材料の最適な試作条件を探索し、探索結果に基づいて当該材料の試作条件を提案する処理を表す。回帰モデル構築処理は、特性実測データへの重みづけの基準である重み基準を算出する処理と、算出された重み基準に基づいて特性実測データに重みづけを行う処理とを含む。
 その他、本願が開示する課題とその解決方法は、発明を実施するための形態の欄、および図面の記載によって明らかにされる。
 本発明によれば、機械学習モデルの構築に使用される学習データの数が少ない場合や、学習データの分布に偏りがある場合にも、材料の最適な試作条件を精度よく提案することができる。
本発明の一実施形態に係る試作条件提案システムの概要を示す模式図。 本発明の一実施形態に係る試作条件提案システムの機能ブロックを示す図。 本発明の一実施形態に係る試作条件提案システムの処理全体の流れを示すフローチャート。 特性実測データ前処理の詳細を示すフローチャート。 回帰モデル構築処理の詳細を示すフローチャート。 重みづけの前後における推定精度の比較を示す図。 試作条件提案処理の詳細を示すフローチャート。
 以下、本実施形態を詳細に説明する。図1は、本発明の一実施形態に係る試作条件提案システムの概要を示す模式図である。図1に示す試作条件提案システム1は、材料の組成や焼成条件等といった、材料を試作する際に考慮するべき種々の試作条件をそれぞれ最適化し、その結果を本システムのユーザーである材料開発者に提案するものである。この試作条件の最適化は、当該材料の特性の実測結果を表す特性実測データを基に、各種の機械学習アルゴリズムを用いて行われる。また、このとき、予測モデルには、例えば、ガウス過程回帰(Gaussian Process Regression; GPR)や線形回帰(Linear Regression)、回帰木(Regression Tree; アンサンブル法による場合を含む)、ニューラルネットワークによる回帰(Neural Network Regression)、サポートベクター回帰(Support Vector Regression; SVR)、ロジスティック回帰(Logistic Regression)、LASSO回帰(Least Absolute Shrinkage and Selection Operator Regression)等の各種の回帰モデルが使用される。
 図1に示したように、試作条件提案システム1のユーザーが、試作条件提案システム1から提案された試作条件で材料の試作を行い、その成果物である材料の特性を実測すると、この成果物の特性の評価値を表す特性実測データが新たに生成される。この特性実測データを新たな学習データとして試作条件提案システム1に学習させると、試作条件提案システム1は、より最適化された試作条件をユーザーに提案する。本実施形態の試作条件提案システム1は、ユーザーがこのサイクルを繰り返す度に、特性の予測値がより好ましい試作条件を提案することができる。なお、試作条件提案システムが、材料を試作する機能や、試作対象の材料の特性を実測する機能を含んでいたり、これらの機能と一体的に構成されていたりしてもよい。
 本実施形態の試作条件提案システム1は、図1に示したように、一台の汎用コンピュータ装置によって実現される。以下の説明は、試作条件提案システム1が、一つ以上のプロセッサデバイス、一つ以上の記憶装置、一つ以上の入出力装置、およびそれらを連結する有線または無線の通信線(いずれも不図示)を備える一台の汎用コンピュータ装置により実現されているものとして行う。
 このコンピュータ装置は、例えば実験室の内部に端末として設置され、当該実験室の内外に設置されている他の各種端末や、各ユーザーが保有するラップトップPCやタブレット、スマートフォン等の各種端末(以下、「ユーザー端末」と称する)、サーバ装置等の他の機器と、インターネット400や専用線等の通信ネットワークを介して接続される。なお、当該コンピュータ装置とインターネット400とは、周知の通信用機器(不図示)を介して有線で接続されるが、無線で接続されてもよい。
 次に、試作条件提案システム1が備える各種機能について、図2を参照して説明する。図2は、本発明の一実施形態に係る試作条件提案システムの機能ブロックを示す図である。なお、以下に説明する各ブロックは、ハードウェア単位の構成ではなく、機能単位のブロックを示している。本実施形態の試作条件提案システム1は、図2に示すように、制御部11、記憶部12、ユーザーインターフェース部13、および通信部14を備えて構成される。
 制御部11は、ユーザーインターフェース部13が検出したユーザーの操作入力、通信部14により取得されたデータ、および記憶部12が記憶しているプログラムやデータに基づいて各種データ処理を実行する。制御部11は、ユーザーインターフェース部13、通信部14および記憶部12のインターフェースとしても機能する。
 制御部11は、特性実測データ前処理部111、回帰モデル構築処理部112および試作条件提案処理部113の各機能ブロックを有する。制御部11は、例えばCPU(Central Processing Unit)および各種コプロセッサ(Co-processor)等のプロセッサデバイス(以下、単に「プロセッサ」とも称する)を用いて構成され、所定のプログラムを実行することによって、これらの機能ブロックを実現することができる。なお、プロセッサの代わりに、例えばFPGA(Field Programmable Gate Array)等の論理回路を用いて制御部11を構成してもよい。また、プロセッサと論理回路との組合せによって制御部11を構成してもよい。
 制御部11が実行するプログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えばプログラム配布計算機や計算機が読み取り可能な記録媒体等であってもよい。また、制御部11が実行するプログラムは、デバイスドライバ、オペレーティングシステム、それらの上位層に位置する各種アプリケーションプログラム、また、これらのプログラムに共通機能を提供するライブラリによって構成されてもよい。さらに、二つ以上のプログラムが一つのプログラムとして実現されてもよいし、一つのプログラムが二つ以上のプログラムとして実現されてもよい。
 特性実測データ前処理部111は、記録直後のいわゆる生データの状態の特性実測データに対して前処理を施す。特性実測データ前処理部111が行うこの処理を、特性実測データ前処理と称する。
 回帰モデル構築処理部112は、前処理が施された特性実測データについて回帰モデルを構築する処理を実行する。回帰モデル構築処理部112が実行するこの処理を、回帰モデル構築処理と称する。
 試作条件提案処理部113は、前処理が施された特性実測データについて、回帰モデル構築処理部112が構築した回帰モデルを用いて前記材料の最適な試作条件を探索し、探索結果に基づいて材料の試作条件をユーザーに提案する処理を実行する。試作条件提案処理部113が実行するこの処理を、試作条件提案処理と称する。
 なお、これらの処理の具体的な内容については後述する。
 記憶部12は、例えばRAMやフラッシュメモリ等の記憶装置を用いて構成されており、制御部11に各種処理命令を供給するプログラム、および制御部11が実行する処理において用いられる各種情報を表すデータを記憶する。例えば、特性実測データ前処理部111により前処理が施された特性実測データ(以下、「前処理実施済データ」と称する)や、回帰モデル構築処理部112により構築された回帰モデルを表すデータ等が記憶部12に記憶される。制御部11は、これらの情報を記憶部12に読み書きすることで、前述の特性実測データ前処理部111、回帰モデル構築処理部112および試作条件提案処理部113の各機能ブロックを実現することができる。
 ユーザーインターフェース部13は、ユーザーからの入力操作を受け付けるほか、画像表示や音声出力等、ユーザーインターフェースに関する処理を担当する。ユーザーインターフェース部13は、入力部131および出力部132の各機能ブロックを有する。入力部131は、ユーザーからの各種操作を検出する。入力部131は、例えばキーボードやポインティングデバイス、タッチパネル等を用いて構成される。出力部132は、ユーザーに対して画面表示や音声出力等を実行する。出力部132は、例えば液晶ディスプレイやタッチスクリーン等を用いて構成される。
 通信部14は、インターネット400を介して行われる、各ユーザーが保有するユーザー端末や、サーバ装置等の他の機器との通信処理を担当する。通信部14は、例えばNIC(Network Interface Card)やHBA(Host Bus Adapter)等を用いて構成される。
 本実施形態では、試作条件提案システム1の各機能が一台のコンピュータ装置により一体的に実現されているものとして説明した。しかしながら、これらの各機能は相互に接続された複数台のコンピュータ装置またはサーバ装置によって実現されてもよい。また、試作条件提案システム1は、ラップトップPC等の汎用コンピュータ装置と、これにインストールされたウェブブラウザとを含む構成であってもよいし、ウェブサーバや各種携帯機器を含む構成であってもよい。
 また、各機能の説明は一例であり、複数の機能が一つの機能にまとめられたり、一つの機能が複数の機能に分割されたりしてもよい。
 次に、試作条件提案システム1の処理全体の流れについて、図3を参照して説明する。図3は、本発明の一実施形態に係る試作条件提案システムの処理全体の流れを示すフローチャートである。なお、以下の説明では、前述の各機能またはプログラムを主語として処理を説明する場合があるが、機能またはプログラムを主語として説明した処理は、プロセッサ、あるいはそのプロセッサを有する装置が行う処理としてもよい。
 ステップS310において、制御部11は、特性実測データ前処理部111により、特性実測データ前処理を実行する。これにより、特性実測データに前処理が施されて前処理実施済データとなり、以後の各処理を正常に実行することが可能になる。なお、ステップS310で行われる特性実測データ前処理の詳細は、後で図4のフローチャートを参照して説明する。制御部11は、特性実測データ前処理が完了すると、ステップS320に進む。
 ステップS320において、制御部11は、回帰モデル構築処理部112により、回帰モデル構築処理を実行する。これにより、前処理実施済データについて、回帰モデルが構築される。なお、ステップS320で行われる回帰モデル構築処理の詳細は、後で図5のフローチャートを参照して説明する。制御部11は、回帰モデル構築処理が完了すると、ステップS330に進む。
 ステップS330において、制御部11は、回帰モデル評価処理を実行する。この回帰モデル評価処理では、ステップS320までの各処理の結果構築された複数の回帰モデルの各々について、回帰モデルの予測精度を表す指標である汎化性能を評価する。この評価は、例えば、他の回帰モデルとの間で交差検証(Cross Validation)を行うことで行う。評価の結果は、例えば散布図や箱ひげ図等のグラフによって可視化される。これにより、ユーザーは、汎化性能が良好な回帰モデルに基づく試作条件の提案を受けることができる。制御部11は、回帰モデル評価処理が完了すると、ステップS340に進む。
 ステップS340において、制御部11は、試作条件提案処理部113により、試作条件提案処理を実行する。この試作条件提案処理では、試作条件提案システム1のユーザーが、試作条件提案システム1が提案した材料の試作条件を、さらに好ましいものとするために、適宜に修正することができる。制御部11は、ユーザーにより修正された試作条件で試作した場合の材料の特性の予測値を、選択した回帰モデルに当てはめることによって求め、ユーザーに提示する。すなわち、ユーザーは、この試作条件の修正作業を、当該予測値を確認しながら対話的に行うことができる。このように、試作条件提案システム1は、ユーザーに提案する材料の試作条件に、当該材料の開発者であるユーザーの知見を盛り込むことが可能なシステムとなっている。なお、ステップS340で行われる試作条件提案処理の詳細については、後で図7のフローチャートを参照して説明する。制御部11は、試作条件提案処理が完了すると、図3のフローチャートに示す処理を一旦終了する。
 本実施形態の試作条件提案システム1は、図3のステップS310~S340の各処理を実行して、良好な試作条件をユーザーに提案する。すなわち、本実施形態の試作条件提案システム1では、ステップS310において、生データの状態の特性実測データに対して必要な前処理が自動的に施される。そのため、特性実測データに対して繁雑な前処理を人手により行うことなく、ステップS320~S340の各処理を実行することができる。また、本実施形態の試作条件提案システム1では、ユーザーは、汎化性能が良好な回帰モデルを選択することができる。そのため、試作条件提案システム1は、ユーザーに対して、予測される特性値が良好な試作条件を提案することができる。
 なお、図1に関連して前述したように、試作条件提案システム1のユーザーは、試作条件提案システム1が提案した試作条件で材料の試作を行ってその成果物の特性を実測し、実測結果を表すデータを新たな特性実測データとして試作条件提案システム1に学習させたうえで、再度、試作条件提案システム1に図3のステップS310~S340の各処理を実行させることができる。この場合、試作条件提案システム1は、より最適化された試作条件をユーザーに提案することができる。すなわち、本実施形態の試作条件提案システム1は、同一の試作対象について図3のステップS310~S340の各処理を繰り返す度に、特性の予測値がより良好な試作条件を提案することができる。
 図4は、特性実測データ前処理の詳細を示すフローチャートである。
 ステップS410において、制御部11は、特性実測データ前処理部111により、ユーザーからの特性実測データの入力を、入力部131または通信部14を介して受け付ける。試作条件提案システム1に入力する特性実測データは、例えばカテゴリデータであってもよいし、連続データであってもよいし、離散データであってもよい。また、試作条件提案システム1に入力する特性実測データの具体的なデータ形式は、適宜に決定することができる。制御部11は、ステップS410における処理が完了すると、ステップS420に進む。
 ステップS420において、制御部11は、特性実測データ前処理部111により、ステップS410でユーザーから入力を受け付けた特性実測データについて、変数の種類を設定する。ここでは、説明変数および目的変数のいずれか一つが設定される。説明変数とは、特性の予測値を求める基となる変数のことである。本実施形態においては、試作条件を構成する材料の組成や焼成条件等が説明変数に該当する。また、目的変数とは、予測の対象となる、試作する材料の特性値を表す変数のことである。ステップS420における具体的な処理の例としては、説明変数がデフォルトで設定されており、目的変数に変更したいユーザーから設定操作を受け付けるとしてもよい。制御部11は、ステップS420における処理が完了すると、ステップS430に進む。
 ステップS430において、制御部11は、特性実測データ前処理部111により、ステップS420で説明変数および目的変数のいずれか一つが設定された特性実測データについて、異常値があるか否かを判定する。この異常値の有無の判定処理は、例えば、特性実測データをヒストグラムに表して平均値±2σの範囲外となる外れ値の有無をまず判定し、外れ値があると判定された特性実測データの生成時における、データ入力ミスの有無や、評価試験機の故障の有無等を判定することにより行う。当該特性実測データに異常値が含まれていると判定した場合、制御部11は、当該異常値を削除して欠損値とし、ステップS440に進む。また、制御部11は、当該特性実測データに含まれている異常値の類型が、説明変数が完全に重複していて特性が異なる水準がある場合における、一方の目的変数である場合には、この異常値に係るサンプルを削除して、ステップS440に進む。然様な、説明変数の全てが重複していて特性の異なる水準を異常値として扱う場合、入力ミス等に起因する説明変数の1か所が異常値である場合と異なり、当該水準自体を削除する必要があるためである。他方、当該特性実測データに異常値が含まれていないと判定した場合、制御部11は、そのままステップS440に進む。
 なお、上述した、説明変数の全てが重複していて特性の異なる水準があるような場合に、重複に意味があるとして、どちらの説明変数も残したいことがある。然様な場合、本実施形態の試作条件提案システム1では、ステップS430における処理を省略することができる。
 ステップS440において、制御部11は、特性実測データ前処理部111により、特性実測データについて、欠損値があるか否かを判定する。特性実測データが予め欠損値を含む場合があるためである。当該前処理実施済データに欠損値が含まれていると判定した場合、制御部11は、当該欠損値を補完してステップS450に進む。欠損値の補完処理は、例えば、異常値を除いた特性実測データの平均値や中央値、最小値、最大値等を、欠損値を補完する値として用いることにより行う。また、線形補間(Linear Interpolation)により欠損値の補完を行ってもよい。なお、特性実測データ前処理部111は、例えば、ステップS440において欠損値を補完した場合に、補完した値を識別しやすくするために、赤字で表示してもよい。また、特性実測データ前処理部111は、例えば、ステップS440において、当該欠損値を補完せずに水準自体を削除してもよい。さらに、本実施形態の試作条件提案システム1では、特性実測データ前処理部111は、説明変数の欠損割合が多い場合、例えばデータ数の5割以上が欠損している場合には、当該説明変数自体を削除することもできる。他方、当該特性実測データに欠損値が含まれていないと判定した場合、制御部11は、そのままステップS450に進む。
 ステップS450において、制御部11は、特性実測データ前処理部111により、説明変数が連続値でなくカテゴリ値である場合、当該説明変数についてエンコーディング処理を行い、数値データへと変換する。特性実測データ前処理部111は、このエンコーディング処理を、例えば記憶部12に記憶されている、カテゴリデータと数値データとの対応関係を表すテーブルのレコードを参照することによって実行する。制御部11は、ステップS450における処理が完了すると、ステップS460に進む。
 ステップS460において、制御部11は、特性実測データ前処理部111により、特性実測データに冗長な説明変数が含まれているか否かを判定する。この判定は、相関係数が所定の数以上、例えば0.8以上となる説明変数の組合せを抽出できるか否かを基準に行う。当該特性実測データに冗長な説明変数が含まれていると判定した場合、制御部11は、冗長な説明変数の一方を削除してステップS470に進む。なお、本実施形態の試作条件提案システム1では、相関係数が0.8以上となる説明変数の組合せが出力部132を通じてユーザーに可視化され、ユーザーは、削除する説明変数を、入力部131を通じて選択することができる。他方、当該特性実測データに冗長な説明変数が含まれていないと判定した場合、制御部11は、そのままステップS470に進む。
 ステップS470において、制御部11は、特性実測データ前処理部111により、必要に応じて特性実測データに対して標準化処理を施す。この標準化処理は、特性実測データのスケールを、平均=0、標準偏差(分散)=1となるように変換するものである。制御部11は、ステップS470における処理が完了すると、図4のステップS410~S470により前処理が施された特性実測データである前処理実施済データを記憶部12に格納して、図4のフローチャートに示す特性実測データ前処理を終了する。なお、制御部11は、特性実測データ前処理部111により、必要に応じて特性実測データに対して正規化処理を施してもよい。然様な場合、S470において標準化処理を施さずに、その後の各処理を実行してもよい。
 図5は、回帰モデル構築処理の詳細を示すフローチャートである。
 ステップS510において、制御部11は、回帰モデル構築処理部112により、前処理実施済データについて構築する回帰モデルの評価のための交差検証の実施条件を選択する。なお、本実施形態の試作条件提案システム1は、K‐分割交差検証(K-fold Cross Validation)によって回帰モデル毎の評価を行う。また、その実施条件として、K=10がデフォルト値に設定されている。この場合、試作条件提案システム1は、10分割交差検証によって回帰モデルの評価を行う。なお、本実施形態の試作条件提案システム1では、ユーザーが交差検証の実施条件を選択することもできる。すなわち、回帰モデル構築処理部112は、入力部131または通信部14を介してユーザーから交差検証の実施条件を受け付けることができる。制御部11は、ステップS510における処理が完了すると、ステップS520に進む。
 ステップS520において、制御部11は、回帰モデル構築処理部112により、試作条件の探索に予測モデルとして用いる回帰モデルの候補を選択する。このとき、回帰モデル構築処理部112は、入力部131または通信部14を介してユーザーから選択処理を受け付けた回帰モデルを候補として選択する。本実施形態の試作条件提案システム1では、ユーザーは、ガウス過程回帰と、前述した線形回帰、回帰木(アンサンブル法による場合を含む)、ニューラルネットワークによる回帰、サポートベクター回帰、ロジスティック回帰およびLASSO回帰等の各種の回帰モデルとから複数の回帰モデルを候補として選択することができる。制御部11は、ステップS520における処理が完了すると、ステップS530に進む。
 ステップS530において、制御部11は、回帰モデル構築処理部112により、特性実測データへの重みづけの基準である重み基準を算出する処理を実行する。重み基準は、特性実測データに含まれる目的変数と材料の特性の目標値を表す目標特性との差、あるいは、特性実測データに含まれる説明変数の希少性をあらわす統計量に基づいて算出される(詳細後述)。なお、説明変数の希少性をあらわす統計量の具体例としては、所定の条件を満たす説明変数の出現確率が挙げられる。制御部11は、ステップS530における処理が完了すると、ステップS540に進む。
 ステップS540において、制御部11は、回帰モデル構築処理部112により、ステップS530で算出された重み基準に基づいて、特性実測データに重みづけを行う処理を実行する。また、本実施形態の試作条件提案システム1では、回帰モデル構築処理部112は、ステップS530で算出された重み基準に基づいて、回帰モデルに対して直接重みづけをすることもできる。なお、回帰モデル構築処理部112がステップS530の結果を基にステップS540で実行する処理は、具体的には、学習の指標となる関数である損失関数を設定する処理と、希少または重要性の高い特性実測データを増幅して学習データとして追加するオーバーサンプリング処理と、冗長または重要性の低い特性実測データを学習データから削除するアンダーサンプリング処理とのいずれか一つの処理である(詳細後述)。これらの処理が実行されることにより、機械学習モデルの構築に使用される学習データの数が少ない場合や、学習データの分布に偏りがある場合にも、然様な学習データの重みが適宜に調整される。その結果、推定精度が向上し、良好な材料の試作条件を精度よく提案することができる。制御部11は、ステップS540における処理が完了すると、ステップS550に進む。
 ステップS550において、制御部11は、回帰モデル構築処理部112により、ステップS520で候補として選択された各手法の回帰モデルのそれぞれについて、最適なハイパーパラメータ(Hyperparameter)を探索して設定する。本実施形態の試作条件提案システム1では、回帰モデル毎に、回帰モデル構築処理部112が全てのパラメータを自動的に探索し、回帰モデルの構築時にハイパーパラメータとして設定したときにその回帰モデルの汎化性能を最も良くするものを自動的に設定する。制御部11は、ステップS550における処理が完了すると、ステップS560に進む。
 ステップS560において、制御部11は、回帰モデル構築処理部112により、それぞれ最適なハイパーパラメータが設定された各手法の回帰モデルを作成する処理を行う。回帰モデル構築処理部112は、各手法の回帰モデルを作成すると、作成した全ての回帰モデルから最も汎化性能が高い回帰モデルを選定して、最終的な回帰モデルを決定する処理を行う。制御部11は、ステップS560における処理が完了すると、図5のフローチャートに示す回帰モデル構築処理を終了する。
 なお、重み基準は、前述したように、特性実測データに含まれる目的変数と材料の特性の目標値を表す目標特性との差、あるいは、特性実測データに含まれる説明変数の希少性をあらわす統計量に基づいて算出される。
 このうち、特性実測データに含まれる目的変数と材料の特性の目標値を表す目標特性との差に基づいて重み基準を算出する場合にステップS530で実行される処理の具体的な内容は、以下にステップS532~S534として示す通りである。
 ステップS532において、制御部11は、回帰モデル構築処理部112により、特性実測データに含まれる目的変数と材料の特性の目標値を表す目標特性との差を算出する。制御部11は、ステップS532における処理が完了すると、ステップS534に進む。
 ステップS534において、制御部11は、回帰モデル構築処理部112により、ステップS532で算出された目的変数と目標特性との差の関数により、重み基準を決定する。この関数の具体例としては、当該目的変数と当該目標特性との距離を表す、当該目的変数と当該目標特性との差の絶対値や二乗値が挙げられる。なお、目的変数と目標特性との距離に基づいて重み基準を決定する理由は、材料開発では回帰問題を解くことが多いことから、分類問題において重み基準を決定する際に一般的に用いられる、目的変数の出現回数を使用することができないためである。そのため、本実施形態の試作条件提案システム1では、連続変数である目的変数に基づく重み基準が使用されている。制御部11は、ステップS534における処理が完了すると、ステップS530に示す重み基準を算出する処理を終了して、ステップS540に進む。
 他方、特性実測データに含まれる説明変数の希少性をあらわす統計量に基づいて重み基準を算出する場合にステップS530で実行される処理の具体的な内容は、以下にステップS536~S538として示す通りである。
 ステップS536において、制御部11は、回帰モデル構築処理部112により、特定値をとる、または特定範囲に入る説明変数の出現回数を算出する。具体的には、例えば、説明変数が各種原料の原料比に係る場合に、説明変数が0より大きい値をとるもの、換言すると、実際に使用されている原料比を表す当該説明変数の出現回数を算出する。制御部11は、ステップS536における処理が完了すると、ステップS538に進む。
 ステップS538において、制御部11は、回帰モデル構築処理部112により、ステップS536で算出された説明変数の出現回数の関数により、重み基準を決定する。この関数の具体例としては、学習データ全体における当該説明変数の出現確率が挙げられる。また、回帰モデル構築処理部112は、当該説明変数の出現確率を重み基準とする代わりに、当該説明変数の出現回数を重み基準に決定してもよい。なお、説明変数に基づく基準が使用されている理由は、特に、目的変数には表れない重要なパラメータについて、材料開発者であるユーザーの材料科学の知見を取り入れるためである。制御部11は、ステップS538における処理が完了すると、ステップS530に示す重み基準を算出する処理を終了して、ステップS540に進む。
 また、前述したように、回帰モデル構築処理部112は、ステップS540において、損失関数を設定する処理と、希少または重要性の高い特性実測データを増幅して学習データとして追加するオーバーサンプリング処理と、冗長または重要性の低い特性実測データを学習データから削除するアンダーサンプリング処理とのいずれか一つの処理を実行して、特性実測データまたは回帰モデルに対して重みづけを行う。すなわち、回帰モデル構築処理は、算出された重み基準に基づいて実行される、損失関数を設定する処理と、希少または重要性の高い特性実測データを増幅して学習データとして追加するオーバーサンプリング処理と、冗長または重要性の低い特性実測データを学習データから削除するアンダーサンプリング処理とのいずれか一つの処理をさらに含む。
 このうち、ステップS530で算出された重み基準に基づいて損失関数を設定する場合にステップS530で実行される処理の具体的な内容を、以下でステップS542として説明する。
 ステップS542において、制御部11は、回帰モデル構築処理部112により、ステップS530で算出された重み基準に基づいて、希少または重要性の高い特性実測データの予測誤差が小さくなるように機械学習を決定する。この処理は、学習時の損失関数で特性実測データを重みづけすることにより行う。制御部11は、ステップS538における処理が完了すると、ステップS540に示す、重み基準を学習データまたは回帰モデルに反映させる処理を終了して、ステップS550に進む。
 また、ステップS530で算出された重み基準に基づいて希少または重要性の高い特性実測データを増幅して学習データとして追加する場合にステップS530で実行される、オーバーサンプリング処理またはアップサンプリング処理とよばれる処理の具体的な内容を、以下でステップS544として説明する。
 ステップS544において、制御部11は、回帰モデル構築処理部112により、ステップS530で算出された重み基準に基づいて、オーバーサンプリングの対象である、希少または重要性の高い特性実測データを複製して、学習データに追加する。この場合、特性実測データは、その数が所定の閾値以上となるまで複製される。また、複製した特性実測データを学習データに追加する方法の他に、SMOTE、ADASYN、Borderline-SMOTE、Safe-level SMOTE等の各種方法によってオーバーサンプリング処理を実行してもよい。これにより、希少または重要性の高い特性実測データが学習データに追加されるため、学習データのバランスが改善される。ステップS544で実行される、オーバーサンプリングによる重みづけ処理の前後における、推定精度の比較を図6に示す。図6は、ある複数の原料により作成されるセラミックス複合材料に係る特性の一つである曲げ強度についての特性実測データとその予測値を散布図上に表したものである。実測データ全体の中で当該原料が使用される回数が少ないために推定精度が十分に得られていなかった、ある特定原料に係る特性実測データに対して、ステップS544で実行されるオーバーサンプリング処理によって重みづけがなされた結果、この複合材料について推定値と実測値との誤差を小さくできたこと、換言すると、この複合材料についての推定精度を向上させることができたことが図6に示されている。制御部11は、ステップS544における処理が完了すると、ステップS540に示す、重み基準を学習データまたは回帰モデルに反映させる処理を終了して、ステップS550に進む。
 また、ステップS530で算出された重み基準に基づいて冗長または重要性の低い特性実測データを学習データから削除する場合にステップS540で実行される、アンダーサンプリング処理またはダウンサンプリング処理とよばれる処理の具体的な内容を、以下でステップS546として説明する。
 ステップS546において、制御部11は、回帰モデル構築処理部112により、冗長または重要性の低い特性実測データを学習データから削除する。これにより、冗長または重要性の低い特性実測データが学習データから削除されるため、学習データのバランスが改善される。制御部11は、ステップS546における処理が完了すると、ステップS540に示す、重み基準を学習データまたは回帰モデルに反映させる処理を終了して、ステップS550に進む。
 図7は、試作条件提案処理の詳細を示すフローチャートである。
 ステップS710において、制御部11は、試作条件提案処理部113により、図5のステップS560で構築した回帰モデルに基づいて試作条件の探索処理を行う。試作条件提案処理部113は、この処理を最適化処理により実行する。なお、本実施形態の試作条件提案システム1は、数理最適化(Mathematical Optimization; MO)、ベイズ最適化(Bayesian Optimization; BO)、遺伝的アルゴリズム(Genetic Algorithm; GA)、ニュートン法(Newton’s Method; NM)および単体法(Simplex Method; SM)といった各種の最適化処理の手法を使用可能に構成されている。その結果、目的変数である特性の予測値が最良となるときの各説明変数が、当該探索処理の結果を表す仮試作条件としてユーザーに提案される。また、このとき、試作条件提案処理部113は、当該仮試作条件について感度解析を行って、当該仮試作条件を構成している各説明変数の重要度を評価し、評価結果を合わせて提示する。なお、本実施形態の試作条件提案システム1では、使用した回帰モデルがガウス過程回帰の場合には、獲得関数が最大になる試作条件を選択することもできる。制御部11は、ステップS710における処理が完了すると、ステップS720に進む。
 ステップS720において、制御部11は、試作条件提案処理部113により、ステップS710でユーザーに提案した仮試作条件に対する修正を、ユーザーから受け付ける。試作条件提案処理部113は、仮試作条件を構成している各説明変数の値の修正に係る入力操作を入力部131または通信部14を介してユーザーから受け付けると、修正内容に応じて仮試作条件を修正する。なお、このとき、制御部11は、試作条件提案処理部113により、回帰モデルを使用して、修正後の仮試作条件で試作した場合の材料の特性の予測値を求め、計算結果をユーザーに提示する。また、このとき、試作条件提案処理部113は、ステップS710と同様に、修正後の仮試作条件についても感度解析を行って、当該修正後の仮試作条件を構成している説明変数の重要度を評価し、評価結果を合わせて提示する。なお、この評価結果は、ユーザーが仮試作条件を修正する度に更新されて、常に最新の評価結果がユーザーに提示される。制御部11は、ステップS720における処理が完了すると、ステップS730に進む。
 ステップS730において、制御部11は、試作条件提案処理部113により、修正後の仮試作条件について、ステップS720で求めた特性の予測値が、試作対象の材料の特性値として不十分か否かを判定する。この判定は、例えば、使用する回帰モデルがガウス過程回帰の場合には、試作条件毎の、当該試作条件で試作した場合に材料の特性が改善される期待値を表す獲得関数(Acquisition Function)を修正後の仮試作条件について求め、当該獲得関数の値と、獲得関数の最大値との差が所定の範囲内にあるか否かを判定することによって行う。なお、獲得関数は、任意の試作条件で試作した場合の材料の特性の予測値μと、当該予測値のばらつきを表す標準偏差σとを基に計算される。予測される特性値が不十分であると判定した場合は、ステップS720に戻って再びユーザーから試作条件に対する修正指示を受け付け、予測される特性値が不十分でないと判定した場合は、当該修正後の仮試作条件で試作する場合の材料の特性の予測値は十分であるため、当該仮試作条件を確定させ、試作条件が確定したものとしてユーザーに提案する。すなわち、この判定処理は、仮試作条件に係る材料の特性の予測値が不十分でないと判定されるまで繰り返し行われる。制御部11は、ステップS730における処理が完了すると、図7のフローチャートに示す試作条件提案処理を終了する。
 なお、前述したように、本実施形態の試作条件提案システム1は、図7のステップS730で提案した試作条件に基づいてユーザーが材料の試作を行い、その成果物の特性の実測結果を表すデータが新たな特性実測データとして入力されると、当該新たに入力された特性実測データを基に、より最適化された試作条件をユーザーに提案する。この場合に、試作条件提案システム1の制御部11は、新たに入力された特性実測データに欠損値が含まれているか否かを判定する。欠損値が含まれていると判定した場合は、この欠損値を補完するため、図4のステップS440から処理を開始させる形で、当該新たに入力された特性実測データに対して特性実測データ前処理を施す。他方、欠損値が含まれていないと判定した場合は、当該新たに入力された特性実測データに対する特性実測データ前処理の実施は不要である。そのため、斯様な場合には、制御部11は、回帰モデルの更新の要否を判定する。回帰モデルの更新が必要と判定された場合、制御部11は、改めて回帰モデルを構築するため、図5のステップS510から処理を開始させる形で、当該新たに入力された特性実測データについて回帰モデル構築処理を実行する。他方、回帰モデルの更新が不要と判定された場合、制御部11は、回帰モデル構築処理および回帰モデル評価処理を省略し、前回構築した回帰モデルを使用して、図7のステップS710から処理を開始させる形で、当該新たに入力された特性実測データについて試作条件提案処理を行う。なお、新たに入力された特性実測データに欠損値が含まれている場合にも、回帰モデルの更新が不要な場合には、制御部11は、同様に、回帰モデル構築処理および回帰モデル評価処理を省略する。
 以上説明した本発明の実施形態によれば、以下のような作用効果を奏する。
(1)試作条件提案システム1は、材料開発者に材料の試作条件を提案するシステムであって、回帰モデル構築処理部112と、試作条件提案処理部113とを備える。回帰モデル構築処理部112は、材料の特性の実測結果を表す特性実測データについて回帰モデル構築処理を実行する(ステップS320)。試作条件提案処理部113は、構築された回帰モデルを用いて材料の最適な試作条件を探索し、探索結果に基づいて試作条件提案処理を実行する(ステップS340)。回帰モデル構築処理(図5)は、特性実測データへの重みづけの基準である重み基準を算出する処理(ステップS530)と、算出された重み基準に基づいて特性実測データに重みづけを行う処理(ステップS540)とを含む。このようにしたので、機械学習モデルの構築に使用される学習データの数が少ない場合や、学習データの分布に偏りがある場合にも、然様な学習データの重みが適宜に調整される。その結果、推定精度が向上し、良好な材料の試作条件を精度よく提案することができる。
(2)重み基準は、特性実測データに含まれる目的変数と、材料の特性の目標値を表す目標特性との差に基づいて算出される(ステップS532~S534)。このようにしたので、回帰問題を解くことが多いために目的変数の出現回数に基づいて重み基準を決定できない材料開発においても、目的変数に基づいて重み基準を決定することができる。
(3)重み基準は、特性実測データに含まれる説明変数の希少性をあらわす統計量に基づいて算出される(ステップS536~S538)。このようにしたので、説明変数に基づいて重み基準を算出できる。その結果、特に、目的変数には表れない重要なパラメータについて、材料開発者であるユーザーの材料科学の知見を取り入れることができる。
(4)回帰モデル構築処理(図5)は、算出された重み基準に基づいて損失関数を設定する処理(ステップS542)をさらに含む。このようにしたので、希少または重要性の高い特性実測データについて、予測誤差を小さくすることができる。
(5)回帰モデル構築処理(図5)は、算出された重み基準に基づいて希少または重要性の高い特性実測データを増幅し、学習データとして追加するオーバーサンプリング処理(ステップS544)をさらに含む。このようにしたので、希少または重要性の高い特性実測データが学習データに追加される。その結果、希少または重要性の高い特性実測データの感度を向上させることができるため、学習データのバランスが改善される。
(6)回帰モデル構築処理(図5)は、算出された重み基準に基づいて、冗長または重要性の低い特性実測データを学習データから削除するアンダーサンプリング処理(ステップS546)をさらに含む。このようにしたので、冗長または重要性の低い特性実測データが学習データから削除される。その結果、冗長または重要性の低い特性実測データの感度を低下させることができるため、学習データのバランスが改善される。
 なお、本発明は上記実施形態に限定されるものではなく、その要旨を逸脱しない範囲内で、任意の構成要素を用いて実施可能である。
 上記の実施形態や変形例はあくまで一例であり、発明の特徴が損なわれない限り、本発明はこれらの内容に限定されるものではない。また、上記では種々の実施形態や変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。
  1:試作条件提案システム
 11:制御部
 12:記憶部
 13:ユーザーインターフェース部
 14:通信部
111:特性実測データ前処理部
112:特徴量選択処理部
113:回帰モデル構築処理部
114:試作条件提案処理部
131:入力部
132:出力部
400:インターネット

Claims (7)

  1.  材料開発者に材料の試作条件を提案する試作条件提案システムであって、
     前記材料の特性の実測結果を表す特性実測データについて回帰モデル構築処理を実行する回帰モデル構築処理部と、
     前記構築された回帰モデルを用いて前記材料の最適な試作条件を探索し、探索結果に基づいて試作条件提案処理を実行する試作条件提案処理部と
    を備え、
     前記回帰モデル構築処理は、
      前記特性実測データへの重みづけの基準である重み基準を算出する処理と、
      前記算出された重み基準に基づいて前記特性実測データに重みづけを行う処理と
    を含む、試作条件提案システム。
  2.  請求項1に記載の試作条件提案システムにおいて、
     前記重み基準は、前記特性実測データに含まれる目的変数と、前記材料の特性の目標値を表す目標特性との差に基づいて算出される、試作条件提案システム。
  3.  請求項1に記載の試作条件提案システムにおいて、
     前記重み基準は、前記特性実測データに含まれる説明変数の希少性をあらわす統計量に基づいて算出される、試作条件提案システム。
  4.  請求項1に記載の試作条件提案システムにおいて、
     前記回帰モデル構築処理は、前記算出された重み基準に基づいて損失関数を設定する処理をさらに含む、試作条件提案システム。
  5.  請求項1に記載の試作条件提案システムにおいて、
     前記回帰モデル構築処理は、前記算出された重み基準に基づいて希少または重要性の高い特性実測データを増幅し、学習データとして追加するオーバーサンプリング処理をさらに含む、試作条件提案システム。
  6.  請求項1に記載の試作条件提案システムにおいて、
     前記回帰モデル構築処理は、前記算出された重み基準に基づいて、冗長または重要性の低い特性実測データを学習データから削除するアンダーサンプリング処理をさらに含む、試作条件提案システム。
  7.  コンピュータを用いて材料開発者に材料の試作条件を提案する試作条件提案方法であって、
     前記材料の特性の実測結果を表す特性実測データについて回帰モデルを構築する回帰モデル構築処理と、
     前記構築された回帰モデルを用いて前記材料の最適な試作条件を探索し、探索結果に基づいて当該材料の試作条件を提案する試作条件提案処理と
    をコンピュータに実行させ、
     前記回帰モデル構築処理は、
      前記特性実測データへの重みづけの基準である重み基準を算出する処理と、
      前記算出された重み基準に基づいて前記特性実測データに重みづけを行う処理と
    を含む、試作条件提案方法。
PCT/JP2023/027145 2022-09-29 2023-07-25 試作条件提案システム、試作条件提案方法 WO2024070169A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022-157142 2022-09-29
JP2022157142 2022-09-29

Publications (1)

Publication Number Publication Date
WO2024070169A1 true WO2024070169A1 (ja) 2024-04-04

Family

ID=90477067

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/027145 WO2024070169A1 (ja) 2022-09-29 2023-07-25 試作条件提案システム、試作条件提案方法

Country Status (1)

Country Link
WO (1) WO2024070169A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010092266A (ja) * 2008-10-08 2010-04-22 Nec Corp 学習装置、学習方法及びプログラム
JP2014063432A (ja) * 2012-09-24 2014-04-10 Nippon Telegr & Teleph Corp <Ntt> 欠損値予測装置、欠損値予測方法、欠損値予測プログラム
JP2019191769A (ja) * 2018-04-20 2019-10-31 富士通株式会社 データ判別プログラム、データ判別装置およびデータ判別方法
WO2020255299A1 (ja) * 2019-06-19 2020-12-24 日本電信電話株式会社 異常度推定装置、異常度推定方法、プログラム
JP2021111221A (ja) * 2020-01-14 2021-08-02 パナソニックIpマネジメント株式会社 計測装置、システム、計測方法、及びプログラム
JP2022092297A (ja) * 2020-12-10 2022-06-22 昭和電工マテリアルズ株式会社 設計支援装置、設計支援方法及び設計支援プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010092266A (ja) * 2008-10-08 2010-04-22 Nec Corp 学習装置、学習方法及びプログラム
JP2014063432A (ja) * 2012-09-24 2014-04-10 Nippon Telegr & Teleph Corp <Ntt> 欠損値予測装置、欠損値予測方法、欠損値予測プログラム
JP2019191769A (ja) * 2018-04-20 2019-10-31 富士通株式会社 データ判別プログラム、データ判別装置およびデータ判別方法
WO2020255299A1 (ja) * 2019-06-19 2020-12-24 日本電信電話株式会社 異常度推定装置、異常度推定方法、プログラム
JP2021111221A (ja) * 2020-01-14 2021-08-02 パナソニックIpマネジメント株式会社 計測装置、システム、計測方法、及びプログラム
JP2022092297A (ja) * 2020-12-10 2022-06-22 昭和電工マテリアルズ株式会社 設計支援装置、設計支援方法及び設計支援プログラム

Similar Documents

Publication Publication Date Title
Yang et al. Mathematical programming for piecewise linear regression analysis
Kaya et al. Process capability analyses based on fuzzy measurements and fuzzy control charts
JP4627674B2 (ja) データ処理方法及びプログラム
Buchholz et al. Comparison of procedures to assess non‐linear and time‐varying effects in multivariable models for survival data
US20200372342A1 (en) Systems and methods for predictive early stopping in neural network training
Gu et al. A novel recurrent neural network algorithm with long short-term memory model for futures trading
TW201717057A (zh) 製程異因分析方法與製程異因分析系統
CN115359846A (zh) 一种组学数据的批次矫正方法、装置、存储介质及电子设备
AU2022264302A1 (en) Industry specific machine learning applications
CN113919540A (zh) 一种生产过程运行状态的监测方法及相关设备
Rupšys New insights into tree height distribution based on mixed effects univariate diffusion processes
Zhou et al. Aero-engine prognosis strategy based on multi-scale feature fusion and multi-task parallel learning
KR102054500B1 (ko) 설계 도면 제공 방법
JPWO2016111240A1 (ja) 情報処理システム、変化点検出方法、およびプログラム
Yerlikaya-Özkurt et al. A review and new contribution on conic multivariate adaptive regression splines (CMARS): a powerful tool for predictive data mining
Thorson et al. The multivariate-Tweedie: a self-weighting likelihood for age and length composition data arising from hierarchical sampling designs
Ramlakhan et al. Building artificial intelligence and machine learning models: a primer for emergency physicians
Khodaygan et al. Fuzzy-based analysis of process capability for assembly quality assessment in mechanical assemblies
Li et al. A flexible joint model for multiple longitudinal biomarkers and a time‐to‐event outcome: With applications to dynamic prediction using highly correlated biomarkers
WO2024070169A1 (ja) 試作条件提案システム、試作条件提案方法
Zhou et al. Sparse polynomial chaos expansions for global sensitivity analysis with partial least squares and distance correlation
JP2021022051A (ja) 機械学習プログラム、機械学習方法および機械学習装置
CN116483817A (zh) 一种数据填补模型选择、健康评测方法及装置
WO2024070170A1 (ja) 試作条件提案システム、試作条件提案方法
JP4777941B2 (ja) 需要予測方法および装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23871412

Country of ref document: EP

Kind code of ref document: A1