WO2016047118A1 - モデル評価装置、モデル評価方法、及び、プログラム記録媒体 - Google Patents

モデル評価装置、モデル評価方法、及び、プログラム記録媒体 Download PDF

Info

Publication number
WO2016047118A1
WO2016047118A1 PCT/JP2015/004758 JP2015004758W WO2016047118A1 WO 2016047118 A1 WO2016047118 A1 WO 2016047118A1 JP 2015004758 W JP2015004758 W JP 2015004758W WO 2016047118 A1 WO2016047118 A1 WO 2016047118A1
Authority
WO
WIPO (PCT)
Prior art keywords
variable
model
control
degree
unit
Prior art date
Application number
PCT/JP2015/004758
Other languages
English (en)
French (fr)
Inventor
学 楠本
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to EP15845135.1A priority Critical patent/EP3200038A4/en
Priority to JP2016549949A priority patent/JPWO2016047118A1/ja
Publication of WO2016047118A1 publication Critical patent/WO2016047118A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B17/00Systems involving the use of models or simulators of said systems
    • G05B17/02Systems involving the use of models or simulators of said systems electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/25Pc structure of the system
    • G05B2219/25298System identification

Definitions

  • the present invention relates to a model evaluation apparatus, a model evaluation method, and a program recording medium, and in particular, a model evaluation apparatus, a model evaluation method, and a program recording that perform model evaluation effective when a model is selected from a plurality of models. It relates to the medium.
  • Predictive control is control that predicts the future controlled quantity based on the dynamic model of the process and determines the manipulated variable.
  • the features of predictive control are that multivariable control is easy, constraints are easily considered, and adjustment is easy and intuitive.
  • Predictive control has been used mainly for petrochemical industry plant control. With the recent improvement in computer capabilities, predictive control is applied not only to plant control in the petrochemical industry but also to mobile objects and robots with short control cycles.
  • a designer may describe a predictive control model in advance based on physical laws such as a motion equation, a heat equation, a mass conservation law, a momentum conservation law, and an energy conservation law.
  • physical laws such as a motion equation, a heat equation, a mass conservation law, a momentum conservation law, and an energy conservation law.
  • a plurality of operation variables such as an air conditioner temperature, an air conditioner air volume, a blind opening, and a window opening affect a plurality of control variables such as a room temperature and a room humidity.
  • control variables such as increasing the temperature and decreasing the humidity.
  • environmental variables such as the outside air temperature and the outside air humidity also affect the control variables. In this way, it is difficult for the designer to completely model the relationships that influence each other among the operation variables, control variables, and environment variables.
  • Non-Patent Document 1 discloses a method for obtaining a model showing the relationship between a control object and an operation variable or an environment variable.
  • Patent Document 1 discloses a device control method that creates a prediction model representing a relationship between an operation and a specified sensor by machine learning. This device refers to the created prediction model and determines an operation such that the output of the target sensor becomes a target value.
  • Patent Document 2 discloses a method of collecting past information for a subject that is difficult to model, such as the state of the immediately previous passenger, machine learning the information, and correcting the control expression.
  • Patent Document 3 discloses a performance prediction apparatus that adjusts model parameters based on a difference between a predicted output by a model and an actual output.
  • an apparatus that generates a model by machine learning generates a different model depending on given initial conditions and parameters.
  • an apparatus for generating a model by machine learning is a model created by machine learning based on an information criterion such as AIC (Akaike'sionInformation Criterion). Evaluate and select the model to use. That is, the apparatus selects a model to be used based on the balance between the number of variables and the likelihood of the model.
  • the operation variables that can be directly operated are limited to the temperature and air volume of the air conditioner.
  • a model composed only of environment variables that cannot be directly operated, such as outside air temperature, may be selected. This model has a problem that the controlled object cannot be controlled by operating the operation variable because the output of the model does not change even if the manipulated variable is operated.
  • An object of the present invention is to provide a model evaluation apparatus, a model evaluation method, and a program recording medium for evaluating the degree to which a model can control a controlled object by operating an operation variable in order to solve the above-described problems.
  • a model evaluation apparatus includes: a first variable that is an input parameter of control; a second variable that is an object of the control; and a third variable that represents an operating environment of the control.
  • Model storage means for storing a model indicating relevance, and relation calculation means for calculating a relation degree indicating the degree of influence of the first variable on the second variable in the model.
  • a model evaluation method includes: a first variable that is an input parameter of control; a second variable that is an object of the control; and a third variable that represents an operating environment of the control.
  • a model indicating relevance is stored, and a degree of relationship indicating the degree of influence of the first variable on the second variable in the model is calculated.
  • a program recording medium provides a computer with a first variable that is an input parameter of control, a second variable that is an object of the control, and a third variable that represents an operating environment of the control.
  • a program for executing a process for storing a model indicating a relationship with a variable and a process for calculating a relation level indicating the degree of influence of the first variable on the second variable in the model is recorded.
  • FIG. 1 is a block diagram illustrating an example of the configuration of the model evaluation apparatus according to the first embodiment.
  • FIG. 2 is a block diagram illustrating an example of the configuration of the model evaluation apparatus according to the second embodiment.
  • FIG. 3 is a block diagram illustrating an example of the configuration of the model evaluation apparatus according to the third embodiment.
  • FIG. 4 is a block diagram illustrating an example of the configuration of the model evaluation apparatus according to the fourth embodiment.
  • FIG. 5 is a flowchart illustrating an example of the operation of the learning generation unit.
  • FIG. 6 is a diagram illustrating an example of a model generated by the learning generation unit.
  • FIG. 7 is a block diagram illustrating an example of a hardware configuration of a computer apparatus 500 that implements the model evaluation apparatuses 100, 200, 300, and 400 described above.
  • FIG. 1 shows a configuration of a model evaluation apparatus 100 according to the first embodiment of the present invention.
  • the model evaluation apparatus 100 generates a model for predictive control of a variable to be controlled, for example, a room temperature, and outputs the model to, for example, a control apparatus (not shown).
  • the control device uses a model output from the model evaluation device 100 to control a control target device (not shown), for example, an air conditioner, a blind switch device, and a window switch device, and sets a control target variable to a target value. Move closer to.
  • the operation variable is an input parameter for controlling the control target variable.
  • the control device can input the value of the operation variable to the control target device.
  • the control device can only determine the value of this manipulated variable.
  • the control target variable is a room temperature
  • the control target devices are an air conditioner, a blind opening / closing device, and a window opening / closing device.
  • the operation variables are, for example, the temperature of the air conditioner, the air volume of the air conditioner, the degree of blind opening / closing, and the degree of opening of the window.
  • the model evaluation apparatus 100 includes an input unit 101, an information storage unit 102, a learning generation unit 103, a model storage unit 104, an accuracy calculation unit 105, a relationship calculation unit 106, a selection unit 107, and an output unit 108.
  • the input unit 101 acquires input data including the value of the control target variable, the value of the operation variable at that time, and other peripheral data that may be related to the value of the control target variable.
  • the peripheral data is, for example, the temperature and humidity of the outside air.
  • the input unit 101 obtains input data from, for example, a user interface device such as a keyboard, a mouse, or a touch panel, a storage medium such as a memory or a disk, or an external device via a network.
  • the input unit 101 stores the acquired input data in the information storage unit 102, for example, in time series. That is, the input unit 101 stores the history of input data in the information storage unit 102.
  • the learning generation unit 103 performs machine learning from the history data stored in the information storage unit 102 to create a model.
  • the model is an equation for calculating the value of the operation target variable at a certain time point t1 from the values of the past, current, and future operation variables as viewed from t1, and the past and current peripheral data.
  • the learning generation unit 103 captures the peripheral data into the model as the value of the environment variable. Based on the model, the control device can predict the operation variable from the value of the operation variable and the surrounding data.
  • the learning generation unit 103 may use any of them.
  • the learning generation unit 103 may use, for example, a method using a regression tree, a method using a support vector machine, a method using Bayesian linear regression, or a method using a heterogeneous mixed learning technique.
  • the learning generation unit 103 generates different models depending on the given initial conditions and the like. Therefore, the learning generation unit 103 generates a plurality of models by repeating machine learning based on history data stored in the information storage unit 102 while switching initial conditions and the like.
  • the learning generation unit 103 stores the created models in the model storage unit 104.
  • the accuracy calculation unit 105 and the relationship calculation unit 106 evaluate the model stored in the model storage unit 104.
  • the accuracy calculation unit 105 calculates the accuracy representing the accuracy of the model based on the information amount criterion.
  • the relationship calculation unit 106 calculates a degree of relationship that represents the degree of influence of the operation variable on the control target variable.
  • the accuracy calculation unit 105 calculates a model information criterion.
  • the accuracy calculation unit 105 may perform this calculation by any of the proposed methods including the AIC, Bayes information criterion, Akaike Bayes information criterion, minimum description length, and fractal information criterion.
  • the relationship calculation unit 106 quantifies the relationship between the operation variable and the control target variable.
  • the relationship calculation unit 106 may perform this evaluation by any of several methods.
  • the relational calculation unit 106 may count the types of operation variables included in the model variables and set the number as the degree of relation. The relation calculation unit 106 may add the points determined for each operation variable included in the model variables to obtain the degree of relation.
  • the relationship calculation unit 106 may determine whether the model is controllable and determine whether it can be controlled. The relationship calculation unit 106 may use the degree of change of the control target variable when the operation variable is changed in the model as the degree of relationship.
  • the relationship calculation unit 106 may obtain the degree of relationship by quantifying the relationship between the operation variable and the control target variable using another method.
  • the selection unit 107 selects a model with the best evaluation based on both the calculation result of the accuracy calculation unit 105 and the calculation result of the relational calculation unit 106, acquires the model from the model storage unit 104, and outputs it. That is, the selection unit 107 selects a model that is accurate and correctly reflects the behavior of the control target variable, and that the control device can control the control target variable by adjusting the operation variable.
  • the selection unit 107 performs an operation using two indexes that are the operation results of the accuracy operation unit 105 and the relationship operation unit 106, and selects a model based on the results.
  • the selection unit 107 may multiply the indices by weighting factors and add them together.
  • the selection unit 107 may multiply both indices. Further, the selection unit 107 may select the best one of the two indicators from the one in which one of the two indicators exceeds a certain number.
  • the selection unit 107 may perform calculations such as logarithm, average, and power using two indices, that is, calculate as an evaluation value using the indices, and select a model based on the result.
  • the output unit 108 outputs the model selected by the selection unit 107.
  • the output unit 108 transmits the model to, for example, the control device.
  • the output unit 108 may output the model to an output device such as a display or a printer, a storage device such as a memory or a disk, or a network.
  • the input unit 101, the learning generation unit 103, the accuracy calculation unit 105, the relation calculation unit 106, the selection unit 107, and the output unit 108 are configured by logic circuits.
  • the input unit 101, the learning generation unit 103, the accuracy calculation unit 105, the relation calculation unit 106, the selection unit 107, or the output unit 108 is a program executed by a processor (not shown) of the model evaluation apparatus 100 that is also a computer. It may be realized. In this case, the program is stored in a memory (not shown) of the model evaluation apparatus 100.
  • the information storage unit 102 and the model storage unit 104 are disk devices or storage media such as a semiconductor memory.
  • the model evaluation apparatus 100 can select a model from which a control apparatus can control a control target variable by adjusting an operation variable from among a plurality of models.
  • the reason is that the relationship calculation unit 106 calculates a relationship level indicating the degree of influence of the operation variable on the control target variable.
  • the model evaluation apparatus 100 can select a model that accurately reflects the behavior of the control target variable correctly.
  • the reason is that the accuracy calculation unit 105 calculates the accuracy representing the accuracy of the model based on the information amount criterion.
  • the model evaluation apparatus 100 may not include the input unit 101, the information storage unit 102, the learning generation unit 103, the accuracy calculation unit 105, the selection unit 107, or the output unit 108. Model generation, accuracy evaluation, and model selection may be performed by other devices.
  • the model evaluation device 100 receives a model created by another device and stores it in the model storage unit 104, the relationship calculation unit 106 calculates the relationship level, and outputs the relationship level to the other device. May be.
  • FIG. 2 shows a configuration of a model evaluation apparatus 200 according to the second embodiment.
  • the accuracy calculation unit 205 of the model evaluation apparatus 200 according to the present embodiment calculates the accuracy of the model by a method different from the accuracy calculation unit 105 according to the first embodiment.
  • the model evaluation apparatus 200 includes an input unit 101, an information storage unit 202, a learning generation unit 203, a model storage unit 104, an accuracy calculation unit 205, a relation calculation unit 106, a selection unit 107, and an output unit 108.
  • FIG. 2 shows the same numbers as those in FIG. 1 for performing almost the same operations as in the first embodiment. Description of these parts is omitted. The following is a description of parts that are different from the first embodiment.
  • the information storage unit 202 stores a history of two sets of input data. They are a model creation history and a model evaluation history. However, the two sets of histories are not necessarily physically separated into two. For example, there may be one history file, the history at odd times such as 1, 3 and 5 o'clock may be for creation, and the history at even times such as 2, 4 and 6 o'clock may be for evaluation.
  • the learning generation unit 203 performs the same operation as the learning generation unit 103 in the first embodiment. However, the learning generation unit 203 creates a model using the creation history in the data stored in the information storage unit 202. The learning generation unit 203 does not use an evaluation history.
  • the accuracy calculation unit 205 evaluates the model stored in the model storage unit 104 using the history for evaluation. Specifically, the accuracy calculation unit 205 extracts the values of the operation variable, the environment variable, and the control variable included in the calculation formula of the control target variable of the model from the evaluation history, and substitutes them in the calculation formula of the model. To calculate the predicted value of the controlled variable. Thereafter, the accuracy calculation unit 205 calculates an error between the predicted value of the variable to be controlled and the value of the control variable included in the evaluation history, for example, the reciprocal of the absolute value of the error is used as the accuracy of the model. .
  • the input unit 101, the learning generation unit 203, the accuracy calculation unit 205, the relation calculation unit 106, the selection unit 107, and the output unit 108 are configured by logic circuits.
  • the input unit 101, the learning generation unit 203, the accuracy calculation unit 205, the relation calculation unit 106, the selection unit 107, or the output unit 108 is a program executed by a processor (not shown) of the model evaluation apparatus 200 that is also a computer. It may be realized. In this case, the program is stored in a memory (not shown) of the model evaluation apparatus 200.
  • the information storage unit 202 and the model storage unit 104 are disk devices or storage media such as a semiconductor memory.
  • the model evaluation apparatus 200 can select a model from which a control apparatus can control a control target variable by adjusting an operation variable from among a plurality of models.
  • the reason is that the relationship calculation unit 106 calculates a relationship level indicating the degree of influence of the operation variable on the control target variable.
  • the model evaluation apparatus 200 of the present embodiment can select a model that accurately reflects the behavior of the variable to be controlled.
  • the reason is that the accuracy calculation unit 105 calculates the accuracy representing the accuracy of the model based on the error caused by the model.
  • the model evaluation apparatus 200 of the present embodiment can be modified in the same manner as the model evaluation apparatus 100 of the first embodiment.
  • the model evaluation apparatus 200 may include the accuracy calculation unit 105 according to the first embodiment in addition to the accuracy calculation unit 205.
  • the selection unit 107 selects a model based on the three evaluation values output from the accuracy calculation unit 205, the accuracy calculation unit 105, and the relationship calculation unit 106.
  • FIG. 3 shows a configuration of a model evaluation apparatus 300 according to the third embodiment.
  • the model evaluation apparatus 300 according to the present embodiment includes an operation amount determination unit 309 instead of the output unit 108 in the model evaluation apparatus 100 according to the first embodiment.
  • the operation amount determination unit 309 is connected to the control target device.
  • the operation amount determination unit 309 controls the control target device based on the model selected by the selection unit 107.
  • a target value of the control target variable is input from the outside to the operation amount determination unit 309.
  • the operation amount determination unit 309 calculates the change amount of the operation variable necessary for bringing the control target variable close to the target value, and outputs it to the control target device.
  • the operation amount determination unit 309 may calculate the change amount of the operation variable according to, for example, a control theory of PID (Proportional Integral Derivative) control, optimal regulator, or predictive control.
  • PID Proportional Integral Derivative
  • the operation amount determination unit 309 is configured with a logic circuit.
  • the operation amount determination unit 309 may be realized by a program executed by a processor (not shown) of the model evaluation apparatus 300 that is also a computer. In this case, the program is stored in a memory (not shown) of the model evaluation apparatus 300.
  • the model evaluation apparatus 300 can be used as a control apparatus that automatically generates an appropriate control model and operates a control target device according to the model.
  • the reason is that the operation amount determination unit 309 controls the control target device based on the model selected by the selection unit 107.
  • FIG. 4 shows a configuration of a model evaluation apparatus 400 according to the fourth embodiment.
  • the model evaluation apparatus 400 according to the present embodiment includes a model storage unit 404 and a relationship calculation unit 406.
  • the model accumulating unit 404 stores a model indicating a relationship between an operation variable that is an input parameter of control, a control target variable that is the purpose of the control, and an environment variable that represents the operation environment of the control.
  • the relationship calculation unit 406 calculates a relationship level indicating the degree of influence of the operation variable on the control target variable in the model.
  • the model evaluation apparatus 400 of the present embodiment can select a model from which a control apparatus can control a control target variable by adjusting an operation variable from among a plurality of models. This is because the relationship calculation unit 406 calculates a relationship level that represents the degree of influence of the operation variable on the control target variable.
  • the peripheral data at the time that is, the value of the environment variable is input to the input unit 101.
  • the values of the manipulated variables are values to be operated by the air conditioner such as the air volume of the air conditioning, the cooling intensity, the outside air intake amount, and the humidifying intensity.
  • the value of the control target variable is a value that the air conditioner wants to control, such as indoor temperature and indoor humidity.
  • the value of the environmental variable is a value that may be related to air conditioning such as the temperature of the outside air, the humidity of the outside air, the amount of solar radiation, the measured value of the human sensor, the time, and the day of the week.
  • air conditioning such as the temperature of the outside air, the humidity of the outside air, the amount of solar radiation, the measured value of the human sensor, the time, and the day of the week.
  • the input unit 101 sequentially stores the input data in the information storage unit 102. For example, input data for the past several months is stored in the information storage unit 102.
  • FIG. 5 is an operation flowchart of the learning generation unit 103.
  • the learning generation unit 103 acquires information necessary for machine learning from the information storage unit 102 in the learning data generation step. At this time, in addition to the value of the control target variable, the value of the operation variable, and the value of the environment variable at each time, the learning generation unit 103 sets the value of the operation variable at each time, the value of the control target variable, Let the value of a variable be a block of data. The learning generation unit 103 arranges the data blocks in order of time to form a data block group.
  • the learning generation unit 103 learns the relationship among the control target variable, the operation variable, and the environment variable from the data block.
  • the learning generation unit 103 stores the model obtained as a result of the machine learning in the model accumulation unit 104.
  • the learning generation unit 103 obtains an evaluation value of a model such as an information criterion as a result of machine learning, and stores the evaluation value in the model storage unit 104 at the same time.
  • FIG. 6 shows an example of a model generated by the learning generation unit 103.
  • the model includes an expression for calculating the value of the future controlled object variable from the value of the operation variable, the environment variable, or the controlled object variable.
  • the model may include a plurality of expressions obtained by dividing the case with some parameters and a branch condition for selecting the expression.
  • the branch condition includes several variables, for example, x a and x b and their threshold values ⁇ 1 and ⁇ 2 .
  • x is an operation variable, a control target variable, or an environment variable.
  • the control device using the model determines an expression used for the control at that time according to the conditional branch at every control timing.
  • Expression (1) shown below is an example of an expression included in the model.
  • y 1 is a future control target variable
  • x 1 to x n are operation variables, control target variables, or environment variables.
  • a 11 to a n1 are coefficients obtained by machine learning.
  • n is a natural number.
  • b 1 is a constant.
  • the learning generation unit 103 generates such a polynomial for each variable to be controlled.
  • the learning generation unit 103 changes the conditions and executes the machine learning step multiple times. For example, as illustrated in FIG. 5, the learning generation unit 103 repeats the machine learning step until the determination step satisfies the condition.
  • the learning generation unit 103 repeats the machine learning step until a model is generated based on all the sets of conditions.
  • the learning generation unit 103 may count the evaluation values above a certain value based on the evaluation values obtained by machine learning, and may repeat the machine learning step until the number exceeds a preset number. Further, the learning generation unit 103 may execute the determination step using a combination of these.
  • the model storage unit 104 stores a plurality of models generated by the learning generation unit 103.
  • the accuracy calculation unit 105 obtains an information criterion for each model.
  • the accuracy calculation unit 105 obtains, for example, FIC (factorized information information criterion).
  • the learning generation unit 103 calculates the FIC by the method of Non-Patent Document 1 when performing machine learning.
  • the accuracy calculation unit 105 extracts the result from the model storage unit 104 and outputs it as accuracy.
  • the relationship calculation unit 106 calculates the degree of relationship indicating the relationship between the manipulated variable and the controlled object.
  • the model is created by the method of Non-Patent Document 1, and as shown in FIG. 6 and Expression (1), includes a branch condition for selecting an expression and a coefficient to be multiplied to each variable in the expression.
  • the relational calculation unit 106 may count the number of manipulated variables used in the model and output the number as a relational value.
  • the operation variable used in the model is 1) an operation variable used in a conditional branch, or 2) an operation variable whose coefficient is not 0 in an expression included in the model.
  • the relational operation unit 106 counts 2 and further counts the number of manipulated variables that are included in the equation and whose coefficients are not 0.
  • the relational calculation unit 106 may sum the coefficients to be multiplied with the operation variables and output them. For example, when the equation is the above equation (1), the relationship calculating unit 106 adds the magnitude (absolute value) of the coefficient an n1 for each manipulated variable to obtain the relationship value.
  • the relational calculation unit 106 may add the points corresponding to the operation variables used in the model and output the total value as the relational value.
  • Manipulated variable corresponding scores c n for example, in accordance with the importance and operating costs as low as manipulated variables are preset to the model evaluation device 100 by the administrator.
  • the relational calculation unit 106 may simply add the points corresponding to the manipulated variable, or may add by weighting with a coefficient. Relation calculating unit 106, when weighted addition of the number c n with coefficients a n, the relationship value calculated is expressed by the following equation (2).
  • the relational calculation unit 106 sets a value as an operation variable, performs sensitivity analysis to determine how much the value of the control target variable changes when the value is changed, and outputs the degree of change as a relational value. Also good. For example, when the set value is changed, the relationship calculation unit 106 may count the number of operation variables whose control target variable value has changed, and output the count value as the relationship value. In this case, the relationship computing unit 106 determines to manipulated variables x n, the value v n and value v n + Delta] v n, whether substituted into the model equation, y n are changed.
  • the relational calculation unit 106 creates a coefficient matrix of the state equation with coefficients to be multiplied with the manipulated variable, determines the controllability of the state equation, and outputs 0 as the relational value if it is not 1 if controllable. good.
  • the relational operation unit 106 determines the controllability of the state equation depending on whether or not equation (4) holds.
  • u is an operation variable
  • l is the number of operation variables
  • x is a variable other than the operation variable (state variable)
  • m is the number thereof.
  • the selection unit 107 selects a model using the result of the accuracy calculation unit 105 and the result of the relation calculation unit 106.
  • the selection unit 107 adds the FIC result (first index) and the value obtained by multiplying the number of used operation variables (second index) by a coefficient (for example, FIC + (used operation).
  • the number of variables) * 500) is calculated, and the model having the highest added value is selected and output.
  • the selection unit 107 may select a model having the largest information criterion from among models whose result of the relational operation unit 106 exceeds a predetermined threshold.
  • the selection unit 107 may multiply the calculation result of the accuracy calculation unit 105 and the calculation result of the relation calculation unit 106 and select a model having the largest calculated value.
  • the selection unit 107 may rank the models according to the result of the accuracy calculation unit 105 and the result of the relationship calculation unit 106, and may select the model having the smallest result of combining the ranks.
  • the output unit 108 outputs the model selected by the selection unit 107 as a file.
  • model evaluation apparatus 200 is connected to a control target device to be controlled, like the model evaluation apparatus 300 according to the third embodiment.
  • the model evaluation apparatus 200 of this example includes an operation amount determination unit 309 instead of the output unit 108.
  • a sensor connected to the control target device, a sensor that acquires the surrounding environmental conditions, and the current input state of the control target device are input to the input unit 101 from the control target device or the peripheral device.
  • the input information is stored in the information storage unit 202.
  • the accumulated information includes two models for model creation and model evaluation. For example, in the accumulated information, data for the first 50 minutes of every hour is for creation, and data for the last 10 minutes of every hour is for evaluation.
  • the learning generation unit 203 creates a model based on the accumulated information.
  • the learning generation unit 203 performs the same operation as the learning generation unit 103 of the previous example. However, the learning generation unit 203 creates a model using only the data for creation, not all of the data stored in the information storage unit 102. The learning generation unit 203 does not use evaluation data.
  • the model evaluation apparatus 200 is connected to the control target device, and information is sequentially added. Therefore, the learning generation unit 203 creates a model with data from the past to a predetermined time. Since information is sequentially added, the learning generation unit 203 may create a model each time certain information is accumulated.
  • the learning generation unit 203 stores the created model in the model storage unit 104.
  • the accuracy calculation unit 205 inputs data for evaluation not used by the learning generation unit 203 from the data in the information storage unit 202 to the model, and obtains a predicted value of the control target variable in the model.
  • the accuracy calculation unit 205 compares the predicted value with the data stored in the information storage unit 102, obtains an error, and calculates the accuracy based on the error.
  • the accuracy is a value that increases as the error decreases.
  • the accuracy calculation unit 205 sums the squares of the errors, and uses the reciprocal as the accuracy.
  • the accuracy calculation unit 205 may add the absolute values of the errors and use the reciprocal thereof as the accuracy. Furthermore, the accuracy calculation unit 205 may use the reciprocal of the value with the smallest error as the accuracy.
  • the relationship calculation unit 106 performs the same operation as the previous example.
  • the selection unit 107 performs the same operation as the previous example. That is, the selection unit 107 selects a model from the result of the accuracy calculation unit 205 and the result of the relationship calculation unit 106. In the case of this example, the selection unit 107 selects a model with the smallest error from those in which the result of the relationship calculation unit 106 exceeds a certain value. The selection unit 107 performs model selection every time a new model is stored in the model storage unit 104, and selects the best model at that time.
  • the operation amount determination unit 309 determines the value of the operation variable based on the model selected by the selection unit 107 so that the value of the control target variable approaches the input target value, and outputs it to the control target device. To do.
  • the operation amount determining unit 309 may search for and output an optimal control input operation amount using a general optimization problem method.
  • the manipulated variable determination unit 309 creates a state equation based on the model, finds a controller using, for example, optimal control theory or H ⁇ (H-infinity) control theory, and obtains the controller, input data, The value of the manipulated variable may be determined from the value of the control target variable.
  • the operation amount determination unit 309 sends the value of this operation variable to the control target device to operate the control target device.
  • FIG. 7 is a block diagram illustrating an example of a hardware configuration of a computer apparatus 500 that implements the model evaluation apparatuses 100, 200, 300, and 400 described above.
  • the computer apparatus 500 includes a processor 510, a memory 520, a storage 530, and an interface 540.
  • the processor 510 is, for example, one or a plurality of CPUs (Central Processing Unit).
  • the memory 520 and the storage 530 store data.
  • the storage 530 may include a reader / writer for a removable recording medium such as an optical disk or a flexible disk.
  • the interface 540 exchanges data with an external device (control device, output device, etc.) directly or via a network.
  • the present invention is not limited to control of industrial processes, but can be applied to environmental control of buildings and living spaces, and environmental control of agriculture, forestry and fisheries, livestock industry, and the like.
  • the present invention can also be applied to actuation control of manipulators, land mobile bodies, water / underwater mobile bodies, air mobile bodies, and the like.
  • the present invention can be applied to uses such as communication, transportation, ordering, and financial transactions.
  • Model evaluation apparatus 101 Input unit 102, 202 Information storage unit 103, 203 Learning generation unit 104, 404 Model storage unit 105, 205 Accuracy calculation unit 106, 406 Relational calculation unit 107 Selection unit 108 Output unit 309 Operation amount determination unit

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

 予測制御モデルについて、操作変数の操作によって制御対象を制御できる度合を評価する。モデル評価装置は、制御の入力パラメータである第1の変数と、制御の目的である第2の変数と、制御の動作環境を表す第3の変数との関連性を示すモデルを格納するモデル蓄積手段と、モデルにおいて第1の変数が第2の変数に与える影響の度合を示す関係度を算出する関係演算手段と、を備える。

Description

モデル評価装置、モデル評価方法、及び、プログラム記録媒体
 本発明は、モデル評価装置、モデル評価方法、及び、プログラム記録媒体に関し、特に、複数のモデルからモデルを選択する際に有効なモデル評価を行う、モデル評価装置、モデル評価方法、及び、プログラム記録媒体に関する。
 予測制御は、プロセスの動的モデルに基づいて将来の被制御量を予測し、操作量を決定する制御である。予測制御の特徴は、多変数の制御が容易であること、制約の考慮が容易であること、及び、調整が容易で直感的であることである。
 予測制御は、石油化学産業のプラント制御を中心に利用されてきた。近年の計算機の能力向上に伴い、予測制御は、石油化学産業のプラント制御に限らず、制御サイクルが短い移動体及びロボットにも応用されている。
 予測制御においては、設計者が、予め、運動方程式、熱方程式、質量保存則、運動量保存則、エネルギー保存則等の物理法則に基づき、予測制御モデルを記述しても良い。しかし、設計者が、全ての物理法則を考慮して、現実世界の複雑な相関関係を完全に反映するように予測制御モデルを導出することは、困難である。
 例えば、部屋の空調制御の場合、空調機の温度、空調機の風量、ブラインド開度、及び、窓開度という複数の操作変数が、室内温度、室内湿度という複数の制御変数に影響を与える。また、一般的に、温度を上げると湿度が下がるというように、制御変数間には干渉が存在する。さらに、外気温度、外気湿度という環境変数も、制御変数に影響を与える。このように、設計者が、操作変数、制御変数、及び、環境変数の間で相互に影響を与え合う関係性を完全にモデル化することは、困難である。
 この問題を解決する為、予測制御モデルを機械学習により生成する方法が提案されている。例えば、非特許文献1は、制御対象と操作変数や環境変数の関係性を示したモデルを得る方法を開示する。
 特許文献1は、動作と、特定されたセンサとの関係を表す予測モデルを機械学習によって作成する機器制御方法を開示する。この装置は、作成した予測モデルを参照して、目標センサの出力が目標値になるような動作を決定する。
 特許文献2は、直前の搭乗者の状態など、モデル化が困難な対象に対し、過去の情報を集め、それらを機械学習させ、制御式を修正する方法を開示する。
 特許文献3は、モデルによる予測出力と、実際の出力との差異に基づいて、モデルのパラメータを調整する性能予測装置を開示する。
 機械学習によりモデルを生成する装置は、与えられた初期条件やパラメータによって、異なるモデルを生成する。そして、機械学習によりモデルを生成する装置は、特許文献2が開示するように、AIC(Akaike's Information Criterion:赤池情報量規準)をはじめとした情報量規準に基づいて、機械学習で作成したモデルの評価を行って、使用するモデルを選択する。すなわち、当該装置は、変数の数とモデルの尤度のバランスに基づいて使用するモデルを選択する。
国際公開第2005/083531号 特許第4821536号公報 国際公開第2013/183425号
"Fully-Automatic Bayesian Piecewise Sparse Linear Models," Riki Eto, Ryohei Fujimaki, Satoshi Morinaga, Hiroshi Tamano ; JMLR Workshop and Conference Proceedings vol.33 : p.238-246, 2014
 特許文献2が示すように、情報量規準を元にモデルを選んだ場合、制御対象を操作する操作変数がモデルに含まれないことがある。
 例えば、空調制御の場合、直接操作できる操作変数は、空調機の温度や風量などに限られる。しかし、情報量基準に基づいてモデルを選択した場合、外気温度などの直接操作できない環境変数のみで構成されたモデルが選択されることがある。このモデルは、動かせる操作変数を操作してもモデルの出力が変化しないため、操作変数の操作によって制御対象を制御できないという問題点を持っている。
 したがって、複数のモデルからモデルを選択して予測制御を行う為には、操作変数の操作によって制御対象を制御できるモデルを選択することが重要になる。
 本発明の目的は、上記課題を解決するため、モデルが操作変数の操作によって制御対象を制御できる度合を評価するモデル評価装置、モデル評価方法、及び、プログラム記録媒体を提供することにある。
 本発明の一実施形態にかかるモデル評価装置は、制御の入力パラメータである第1の変数と、前記制御の目的である第2の変数と、前記制御の動作環境を表す第3の変数との関連性を示すモデルを格納するモデル蓄積手段と、モデルにおいて第1の変数が第2の変数に与える影響の度合を示す関係度を算出する関係演算手段と、を備える。
 本発明の一実施形態にかかるモデル評価方法は、制御の入力パラメータである第1の変数と、前記制御の目的である第2の変数と、前記制御の動作環境を表す第3の変数との関連性を示すモデルを記憶し、モデルにおいて第1の変数が第2の変数に与える影響の度合を示す関係度を算出する。
 本発明の一実施形態にかかるプログラム記録媒体は、コンピュータに、制御の入力パラメータである第1の変数と、前記制御の目的である第2の変数と、前記制御の動作環境を表す第3の変数との関連性を示すモデルを記憶する処理と、モデルにおいて第1の変数が第2の変数に与える影響の度合を示す関係度を算出する処理とを実行させるためのプログラムを記録する。
 本発明によれば、予測制御モデルが操作変数の操作によって制御対象を制御できる度合を評価することができる。
図1は、第1の実施形態にかかるモデル評価装置の構成の一例を示すブロック図である。 図2は、第2の実施形態にかかるモデル評価装置の構成の一例を示すブロック図である。 図3は、第3の実施形態にかかるモデル評価装置の構成の一例を示すブロック図である。 図4は、第4の実施形態にかかるモデル評価装置の構成の一例を示すブロック図である。 図5は、学習生成部の動作の一例を示すフローチャートである。 図6は、学習生成部が生成したモデルの例を示す図である。 図7は、上述したモデル評価装置100、200、300、400を実現するコンピュータ装置500のハードウェア構成の一例を示すブロック図である。
 次に、発明を実施するための形態について図面を参照して詳細に説明する。
 なお、各図面は、本発明の実施形態を説明するものである。そのため、本発明は、各図面の記載に限られるわけではない。また、各図面の同様の構成には、同じ番号を付し、その繰り返しの説明を省略する場合がある。また、ブロック図の矢印の方向は、一例を示すものであり、ブロック間の信号の方向を限定する趣旨ではない。また、以下の説明に用いる図面において、本発明の説明に関係しない部分の構成については、記載を省略し、図示しない場合もある。
 <第1の実施の形態>
 図1は、本発明の第1の実施形態にかかるモデル評価装置100の構成を示す。
 モデル評価装置100は、制御対象変数、例えば部屋の温度、を予測制御するためのモデルを生成し、そのモデルを、例えば制御装置(図示されず)に出力する。制御装置は、モデル評価装置100が出力したモデルを使用して、制御対象機器(図示されず)、例えば、空調機、ブラインド開閉装置、窓開閉装置を制御して、制御対象変数を目的の値に近づける。
 操作変数は、制御対象変数を制御するための入力パラメータである。制御装置は、操作変数の値を制御対象機器に入力できる。制御装置が決定できるのは、この操作変数の値のみである。制御対象変数が部屋の温度である場合、制御対象機器は、空調機、ブラインド開閉装置、窓の開閉装置である。そして、操作変数は、例えば、空調機の温度、空調機の風量、ブラインド開閉度合、窓の開け具合である。
 モデル評価装置100は、入力部101、情報蓄積部102、学習生成部103、モデル蓄積部104、精度演算部105、関係演算部106、選択部107、及び、出力部108を備える。
 入力部101は、制御対象変数の値、その時の操作変数の値、その他、制御対象変数の値に関係する可能性のある周辺データを含む入力データを取得する。周辺データは、例えば、外気の温度、湿度である。
 入力部101は、例えば、キーボード、マウス、若しくは、タッチパネルといったユーザインターフェース装置、メモリ若しくはディスクといった記憶媒体、または、ネットワークを介した外部装置から入力データを取得する。入力部101は、取得した入力データを、例えば時系列に、情報蓄積部102に保存する。すなわち、入力部101は、入力データの履歴を情報蓄積部102に蓄積する。
 学習生成部103は、情報蓄積部102に保存された履歴データから、機械学習を行ってモデルを作成する。
 モデルは、ある時点t1の操作対象変数の値を、t1から見て過去、現在、未来の操作変数の値、及び、過去、現在の周辺のデータから計算する為の式である。学習生成部103は、周辺データを、環境変数の値としてモデルに取り込む。モデルにより、制御装置は、操作変数の値や、周辺のデータから操作対象変数がどうなるか予測できる。
 機械学習の様々な手法が提案されている。学習生成部103は、それらのどれを用いてもよい。学習生成部103は、例えば、回帰木を用いる方法、サポートベクターマシーンを用いる方法、ベイズ線形回帰を用いる方法、または、異種混合学習技術を用いる方法を使用しても良い。
 学習生成部103は、与えられる初期条件などに依存して、異なるモデルを生成する。そのため、学習生成部103は、初期条件などを切り替えながら、情報蓄積部102に蓄積された履歴データを元に機械学習を繰り返し、複数のモデルを生成する。
 学習生成部103は、作成した複数のモデルを、モデル蓄積部104に蓄積する。
 精度演算部105および関係演算部106は、モデル蓄積部104に蓄積されたモデルを評価する。精度演算部105は、情報量基準に基づいてモデルの正確度を表す精度を算出する。関係演算部106は、操作変数が制御対象変数に与える影響の度合を表す関係度を算出する。
 精度演算部105は、モデルの情報量基準を計算する。精度演算部105は、この計算を前述のAIC、ベイズ情報量規準、赤池ベイズ情報量規準、最小記述長、フラクタル情報量規準を含む、提案されている何れの方法で行っても良い。
 関係演算部106は、操作変数と制御対象変数の関係性を数値化する。関係演算部106は、この評価をいくつかある方法の何れかで行えば良い。
 関係演算部106は、モデルの変数中に含まれている操作変数の種類を数えて、その数を関係度とすれば良い。関係演算部106は、モデルの変数中に含まれている操作変数ごとに定められている点数を合計して関係度としても良い。
 また、関係演算部106は、モデルの可制御性の判定を行い、制御可能かどうかを関係度としても良い。関係演算部106は、モデルにおいて、操作変数を変化させたときの制御対象変数の変化の度合いを関係度としても良い。
 関係演算部106は、他の方法を用いて、操作変数と制御対象変数の関係性を数値化して関係度を求めても良い。
 選択部107は、精度演算部105の演算結果と、関係演算部106の演算結果の両方の結果を元に、最も評価の良いモデルを選択し、モデル蓄積部104から取得して出力する。すなわち、選択部107は、モデルが正確で制御対象変数の振る舞いを正しく反映しており、かつ、制御装置が操作変数の調整により制御対象変数を制御できるモデルを選択する。
 具体的には、選択部107は、精度演算部105及び関係演算部106の演算結果である2つの指標を用いた演算を行いその結果を元にモデルを選択する。選択部107は、指標にそれぞれ重み係数を乗じ、それらを足し合わせても良い。選択部107は、両指標を掛け合わせても良い。さらに、選択部107は、2つの指標の一方が一定数を超えたものの中から、もう一方の指標が最良のものを選んでも良い。
 選択部107は、2つの指標を用いて対数化や平均、累乗などの演算をし、すなわち指標を用いた評価値として計算を行い、その結果を元にモデルを選択しても良い。
 最後に、出力部108は、選択部107が選択したモデルを出力する。出力部108は、モデルを、例えば、制御装置に送信する。出力部108は、ディスプレイ、若しくは、プリンタなどの出力装置、メモリ若しくはディスクといった記憶装置、または、ネットワークへモデルを出力しても良い。
 入力部101、学習生成部103、精度演算部105、関係演算部106、選択部107、及び、出力部108は、論理回路で構成される。入力部101、学習生成部103、精度演算部105、関係演算部106、選択部107、または、出力部108は、コンピュータでもあるモデル評価装置100のプロセッサ(図示されず)により実行されるプログラムによって実現されても良い。この場合、当該プログラムは、モデル評価装置100のメモリ(図示されず)に格納される。
 情報蓄積部102、及び、モデル蓄積部104は、ディスク装置、または、半導体メモリ等の記憶媒体である。
 [効果の説明]
 本実施形態のモデル評価装置100は、複数のモデルの中から、制御装置が操作変数の調整により制御対象変数を制御できるモデルを選択できる。その理由は、関係演算部106が、操作変数が制御対象変数に与える影響の度合を表す関係度を算出するからである。
 本実施形態のモデル評価装置100は、上記に加え、正確で制御対象変数の振る舞いを正しく反映もしているモデルを選択できる。その理由は、精度演算部105が、情報量基準に基づいてモデルの正確度を表す精度を算出するからである。
 <第1の実施形態の変形>
 モデル評価装置100は、入力部101、情報蓄積部102、学習生成部103、精度演算部105、選択部107、または、出力部108を備えていなくても良い。モデルの生成、精度の評価、モデルの選択は、他の装置で行われても良い。
 この場合、モデル評価装置100は、他の装置で作成されたモデルを受信してモデル蓄積部104に格納し、関係演算部106が関係度を算出して、関係度を他の装置に出力しても良い。
 この場合、モデルの精度の計算や、精度と関係度に基づくモデルの選択は、他の装置が行う。
 <第2の実施の形態>
 図2は、第2の実施の形態にかかるモデル評価装置200の構成を示す。本実施の形態のモデル評価装置200の精度演算部205は、第1の実施形態の精度演算部105とは異なる方法で、モデルの精度を算出する。
 モデル評価装置200は、入力部101、情報蓄積部202、学習生成部203、モデル蓄積部104、精度演算部205、関係演算部106、選択部107、及び、出力部108を備える。
 図2は、第1の実施形態とほぼ同じ動作を行う部分を図1と同じ番号で示している。これらの部分についての説明は省略される。以下は、第1の実施の形態と差がある部分についての説明である。
 情報蓄積部202は、2セットの入力データの履歴を格納している。それらは、モデル作成用の履歴と、モデル評価用の履歴とである。ただし、2セットの履歴は、必ずしも、物理的に2つに分離されている必要はない。例えば、履歴ファイルは1つであり、1,3,5時等の奇数時刻の履歴は作成用、2,4,6時等の偶数時間の履歴は評価用というようになっていても良い。
 学習生成部203は、第1の実施形態における学習生成部103と同等の動作を行う。ただし、学習生成部203は、情報蓄積部202のデータのうち、作成用の履歴を用いてモデルを作成する。学習生成部203は、評価用の履歴は用いない。
 精度演算部205は、評価用の履歴を使用してモデル蓄積部104に蓄積されたモデルの評価を行う。具体的には、精度演算部205は、モデルの制御対象変数の計算式に含まれる操作変数、環境変数、及び制御変数の値を、評価用履歴から抽出して、モデルの計算式に代入して制御対象変数の予測値を計算する。その後、精度演算部205は、予測した制御対象変数の値と、評価用の履歴に含まれる当該制御変数の値との誤差を計算し、例えば、誤差の絶対値の逆数をモデルの精度とする。
 入力部101、学習生成部203、精度演算部205、関係演算部106、選択部107、及び、出力部108は、論理回路で構成される。入力部101、学習生成部203、精度演算部205、関係演算部106、選択部107、または、出力部108は、コンピュータでもあるモデル評価装置200のプロセッサ(図示されず)により実行されるプログラムによって実現されても良い。この場合、当該プログラムは、モデル評価装置200のメモリ(図示されず)に格納される。
 情報蓄積部202、及び、モデル蓄積部104は、ディスク装置、または、半導体メモリ等の記憶媒体である。
 [効果の説明]
 本実施形態のモデル評価装置200は、複数のモデルの中から、制御装置が操作変数の調整により制御対象変数を制御できるモデルを選択できる。その理由は、関係演算部106が、操作変数が制御対象変数に与える影響の度合を表す関係度を算出するからである。
 本実施形態のモデル評価装置200は、上記に加え、正確で制御対象変数の振る舞いを正しく反映もしているモデルを選択できる。その理由は、精度演算部105が、モデルが生ずる誤差に基づいてモデルの正確度を表す精度を算出するからである。
 <第2の実施形態の変形>
 本実施形態のモデル評価装置200も、第1の実施形態のモデル評価装置100と同様な変形が可能である。
 本実施形態のモデル評価装置200は、精度演算部205の他、第1の実施の形態における精度演算部105を備えていても良い。この場合、選択部107は、精度演算部205、精度演算部105、及び、関係演算部106の各々が出力する3つの評価値に基づいて、モデルを選択する。
 <第3の実施の形態>
 図3は、第3の実施の形態にかかるモデル評価装置300の構成を示す。本実施の形態のモデル評価装置300は、第1の実施の形態のモデル評価装置100における出力部108に代えて操作量決定部309を備える。操作量決定部309は、制御対象機器に接続される。
 操作量決定部309は、選択部107が選択したモデルを元に、制御対象機器の制御を行う。操作量決定部309には、制御対象変数の目標値が外部から入力される。操作量決定部309は、制御対象変数を目標値に近づけるために必要な操作変数の変更量を計算して、制御対象機器に出力する。このとき、操作量決定部309は、例えば、PID(Proportional Integral Derivative)制御、最適レギュレータ、または、予測制御の制御理論に従って操作変数の変更量を計算すれば良い。
 操作量決定部309は、論理回路で構成される。操作量決定部309は、コンピュータでもあるモデル評価装置300のプロセッサ(図示されず)により実行されるプログラムによって実現されても良い。この場合、当該プログラムは、モデル評価装置300のメモリ(図示されず)に格納される。
 本実施形態のモデル評価装置300は、適切な制御モデルを自動生成し、当該モデルにしたがって制御対象機器を操作する制御装置として利用できる。その理由は、操作量決定部309が、選択部107が選択したモデルを元に、制御対象機器の制御を行うからである。
 <第4の実施の形態>
 図4は、第4の実施の形態にかかるモデル評価装置400の構成を示す。本実施の形態のモデル評価装置400は、モデル蓄積部404と関係演算部406を備える。
 モデル蓄積部404は、制御の入力パラメータである操作変数と、前記制御の目的である制御対象変数と、前記制御の動作環境を表す環境変数との関連性を示すモデルを格納する。関係演算部406は、モデルにおいて操作変数が制御対象変数に与える影響の度合を示す関係度を算出する。
 本実施形態のモデル評価装置400は、複数のモデルの中から、制御装置が操作変数の調整により制御対象変数を制御できるモデルを選択できる。その理由は、関係演算部406が、操作変数が制御対象変数に与える影響の度合を表す関係度を算出するからである。
 <例に即した説明>
 <第1の実施形態についての例>
 次に、具体的な例を用いて第1の実施の形態にかかるモデル評価装置100を説明する。この例は、空調システムの制御に関する。
 まず、各時刻における操作変数の値、および制御対象変数の値の他に、当該時刻における周辺データ、すなわち環境変数の値が、入力部101に入力される。
 本例において、操作変数の値は、空調の風量、冷却の強度、外気の取り込み量、加湿の強度といったような空調機器で操作対象となる値である。また、制御対象変数の値は、室内の温度、室内の湿度といったような、空調機器が制御したい値である。
 環境変数の値は、外気の気温、外気の湿度、日射量、人感センサ測定値、時刻、曜日といった空調に関係性がある可能性のある値である。これらの入力データは、例えば、データが記録されたデータベースから入力される。
 入力部101は、入力されたデータを、順次、情報蓄積部102に蓄積する。例えば、過去数か月分の入力データが、情報蓄積部102に蓄積されている。
 次に、学習生成部103は、情報蓄積部102に蓄積されている入力データに基づいて、モデルを複数作成する。図5は、学習生成部103の動作フローチャートである。
 まず、学習生成部103は、学習データ生成ステップにおいて、情報蓄積部102から、機械学習に必要な情報を取得する。この時、学習生成部103は、各時刻の制御対象変数の値、操作変数の値、環境変数の値に加え、その前後の時間における各時刻の操作変数の値、制御対象変数の値、環境変数の値をひとまとまりのデータブロックとする。学習生成部103は、このデータブロックを各時刻順に並べ、データブロック群とする。
 次に、学習生成部103は、機械学習ステップにおいて、データブロックから、制御対象変数、操作変数、及び、環境変数の間の関係性を学習する。学習生成部103は、この機械学習の結果得られたモデルを、モデル蓄積部104に格納する。
 また、学習生成部103は、この時、機械学習の結果として、情報量規準などのモデルの評価値も同時に得て、この評価値もモデル蓄積部104に保存する。
 図6は、学習生成部103が生成したモデルの例を示す。モデルは、未来の制御対象変数の値を、操作変数、環境変数、または、制御対象変数の値から計算する為の式を含む。モデルは、いくつかのパラメータで場合分けされて得られる複数の式と、式を選択する為の分岐条件を含んでも良い。
 分岐条件は、いくつかの変数、例えば、xa及びxbと、それらの閾値α、αを含む。ここで、xは、操作変数、制御対象変数、または、環境変数である。モデルを使用する制御装置は、制御を行うタイミングごとに、条件分岐に従って、その時の制御に用いる式を決定する。
 以下に示す式(1)は、モデルに含まれる式の例である。
Figure JPOXMLDOC01-appb-I000001
 ここで、y1は、未来の制御対象変数であり、x1~xnは、操作変数、制御対象変数、または、環境変数である。a11~an1は機械学習で得られる係数である。nは自然数である。bは、定数である。学習生成部103は、このような多項式を制御対象変数ごとに生成する。
 学習生成部103は、条件を変えて、機械学習ステップを複数回実行する。例えば、図5が示すように、学習生成部103は、判定ステップで条件を満たすまで機械学習ステップを繰り返す。
 例えば、機械学習の条件が予め複数組与えられている場合、学習生成部103は、それらの条件の組すべてに基づいてモデルを生成するまで、機械学習ステップを繰り返す。学習生成部103は、機械学習で得られた評価値を元に、評価値が一定以上のものをカウントし、あらかじめ設定された数を超えるまで機械学習ステップを繰り返しても良い。また、学習生成部103は、これらの組み合わせで判定ステップを実行しても良い。
 学習生成部103が、機械学習ステップの繰り返しを終了した時、モデル蓄積部104には、学習生成部103が生成したモデルが複数蓄積される。
 次に、精度演算部105は、各モデルの情報量規準を求める。精度演算部105は、例えば、FIC(factorized information criterion)を求める。本例では、学習生成部103が、機械学習を行う際に、非特許文献1の方法でFICを計算している。精度演算部105は、その結果をモデル蓄積部104から取り出して、精度として出力する。
 次に関係演算部106は、操作変数と制御対象の関係を示す関係度を演算する。本例では、モデルは非特許文献1の方法で作成されており、図6及び式(1)に示したように、式選択の分岐条件と、式において各変数に掛け合わせる係数を包含する。
 関係演算部106は、モデルで使われている操作変数の数をカウントし、その数を関係値として出力しても良い。モデルで使用されている操作変数は、1)条件分岐で使用されている操作変数、または、2)モデルに含まれる式において係数が0ではない操作変数である。図6のモデルでは、関係演算部106は、xa及びxbが操作変数であれば、2をカウントし、さらに、その式に含まれる、係数が0でない操作変数の数をカウントする。
 関係演算部106は、操作変数に掛け合わせる係数を合計し、それを出力しても良い。例えば、式が上記の式(1)である場合、関係演算部106は、操作変数ごとの係数an1の大きさ(絶対値)を足し合わせて関係値を求める。
 関係演算部106は、モデルで使われている操作変数対応の点数を加算して、その合計値を関係値として出力しても良い。操作変数対応の点数cnは、例えば、操作変数の重要性や操作コストの低さに合わせて、管理者によってモデル評価装置100に予め設定されている。関係演算部106は、操作変数対応の点数を単純加算しても良いし、係数で重み付けして加算しても良い。関係演算部106が、点数cnを係数anで重み付け加算した場合、算出される関係値は以下の式(2)で表される。
Figure JPOXMLDOC01-appb-I000002
 関係演算部106は、値を操作変数に設定し、その値を変更したときに制御対象変数の値がどれだけ変化するかを判定する感度解析を行い、変化の度合いを関係値として出力しても良い。例えば、関係演算部106は、設定値を変化させたとき、制御対象変数の値が変化した操作変数の数をカウントし、そのカウント値を関係値として出力しても良い。この場合、関係演算部106は、操作変数xnに対し、値vnと値vn+Δvnを、モデルの式に代入し、ynが変化するかどうかを判定する。
 関係演算部106は、操作変数に掛け合わせる係数で、状態方程式の係数行列を作成し、状態方程式の可制御性を判定し、可制御であれば1なければ0を関係値として出力しても良い。モデルが、以下の式(3)で示す状態方程式を含んで与えられたとき、関係演算部106は、式(4)が成立するか否かで、状態方程式の可制御性を判定する。
Figure JPOXMLDOC01-appb-I000003
 ここで、操作変数をu、操作変数の数をl、操作変数以外の変数(状態変数)をx、その数をmとする。
Figure JPOXMLDOC01-appb-I000004
 次に、選択部107は、精度演算部105の結果、及び、関係演算部106の結果を用いて、モデルを選択する。選択部107は、FICの結果(第1の指標)と、使われている操作変数の数(第2の指標)に係数を掛けた値との加算値(例えば、FIC+(使われている操作変数の数)*500)を計算し、当該加算値が最も高いモデルを選択して出力する。
 選択部107は、関係演算部106の結果が所定の閾値を超えたモデルの中から、情報量規準の最も大きなモデルを選択しても良い。選択部107は、精度演算部105の演算結果と関係演算部106の演算結果を掛け合わせ、計算された値が最も大きなモデルを選択しても良い。選択部107は、精度演算部105の結果、及び、関係演算部106の結果の各々でモデルを順位づけし、順位を合成した結果が最小なモデルを選択しても良い。
 出力部108は、選択部107が選択したモデルをファイルとして出力する。
 <第2、第3の実施形態についての例>
 次に、具体的な例を用いて第2の実施の形態にかかるモデル評価装置200を説明する。本例では、モデル評価装置200は、第3の実施の形態にかかるモデル評価装置300と同様に、制御対象となる制御対象機器に接続されている。また、本例のモデル評価装置200は、出力部108の代わりに、操作量決定部309を備える。
 まず、制御対象機器に接続されたセンサ、周囲の環境状況を取得するセンサ、現在の制御対象機器の入力状態が、制御対象機器や周辺装置から入力部101に入力される。
 この入力された情報が情報蓄積部202に蓄積される。蓄積された情報は、モデル作成用とモデル評価用の2つを含む。例えば、蓄積された情報は、毎時間の最初50分間のデータが作成用であり、毎時間の最後10分間のデータが評価用である。
 つぎに、学習生成部203が蓄積された情報を元にモデルを作成する。学習生成部203は、先の例の学習生成部103と同じ動作を行う。ただし、学習生成部203は、情報蓄積部102に蓄積されているデータのすべてではなく、作成用のデータだけを使用してモデルを作成する。学習生成部203は、評価用のデータは使用しない。
 また、本例では、モデル評価装置200は、制御対象機器に接続されており、情報は逐次追加されている。そのため、学習生成部203は、過去から一定時間前までのデータでモデルを作成する。逐次情報が追加されるため、学習生成部203は、一定の情報が蓄積されるたびに、モデルを作成しても良い。
 学習生成部203は、作成したモデルをモデル蓄積部104に蓄積する。
 次に、精度演算部205は、情報蓄積部202のデータから、学習生成部203が用いていない評価用のデータをモデルに入力し、モデルにおける制御対象変数の予測値を得る。精度演算部205は、この予測値と情報蓄積部102に保存されたデータを比較し、その誤差を求め、誤差に基づいて精度を計算する。本例では、精度は、誤差が小さいほど大きくなる値とする。精度演算部205は、誤差の2乗を合計して、その逆数を精度とする。精度演算部205は、誤差の絶対値を合計してその逆数を精度としても良い。さらに、精度演算部205は、誤差の最も小さな値の逆数を精度としても良い。
 関係演算部106は、先の例と同じ動作をする。
 選択部107も先の例と同じ動作をする。すなわち、選択部107は、精度演算部205の結果と関係演算部106の結果から、モデルを選択する。本例の場合、選択部107は、関係演算部106の結果が一定値を超えたものの中から、誤差の最も小さいモデルを選択する。また、選択部107は、新たなモデルがモデル蓄積部104に蓄積されるたびにモデル選択を実施し、その時点で最も良いモデルを選択する。
 次に、操作量決定部309は、選択部107の選択したモデルを元に、制御対象変数の値が入力された目標値に近づくように、操作変数の値を決定し、制御対象機器に出力する。操作量決定部309は、一般的な最適化問題の方法を用いて、最適な制御入力操作量を探索し出力すれば良い。操作量決定部309は、モデルを元に状態方程式を作成し、例えば、最適制御理論、または、H∞(H-infinity)制御理論を用いて制御器を求め、求めた制御器、入力データ、制御対象変数の値から、操作変数の値を決定しても良い。
 最後に、操作量決定部309は、この操作変数の値を制御対象機器に送り、制御対象機器を動作させる。
 <モデル評価装置の構成例>
 図7は、上述したモデル評価装置100、200、300、400を実現するコンピュータ装置500のハードウェア構成の一例を示すブロック図である。コンピュータ装置500は、プロセッサ510と、メモリ520と、ストレージ530と、インタフェース540とを備える。
 プロセッサ510は、例えば、1又は複数のCPU(Central Processing Unit)である。メモリ520及びストレージ530は、データを記憶する。ストレージ530は、光ディスクやフレキシブルディスクなどの着脱可能な記録媒体のリーダ・ライタを含んでもよい。インタフェース540は、外部装置(制御装置、出力装置など)と直接に、又はネットワークを介してデータをやり取りする。
 本発明は、産業プロセスの制御に限らず、建物や居住空間等の環境制御、及び、農林水産業や畜産業等の環境制御に適用できる。また、本発明は、マニピュレータ、陸上移動体、水上・水中移動体、空中移動体等のアクチュエーションの制御にも適用できる。更に、本発明は、通信、交通、受発注、金融取引といった用途にも適用可能である。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2014年9月26日に出願された日本特許出願特願2014-197161を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 100、200、300、400  モデル評価装置
 101  入力部
 102、202  情報蓄積部
 103、203  学習生成部
 104、404  モデル蓄積部
 105、205  精度演算部
 106、406  関係演算部
 107  選択部
 108  出力部
 309  操作量決定部

Claims (10)

  1.  制御の入力パラメータである第1の変数と、前記制御の目的である第2の変数と、前記制御の動作環境を表す第3の変数との関連性を示すモデルを格納するモデル蓄積手段と、
     モデルにおいて第1の変数が第2の変数に与える影響の度合を示す関係度を算出する関係演算手段と、を備えるモデル評価装置。
  2.  前記モデル蓄積手段は、複数のモデルを格納し、
     前記モデル評価装置は、
     モデルの正しさの度合を示す精度を算出する精度演算手段と、
     関係度および精度に基づいて、前記複数のモデルから前記制御の為のモデルを選択する選択手段と、をさらに備える請求項1のモデル評価装置。
  3.  モデルは、第1の変数、第2の変数、及び、第3の変数を変数とし、第2の変数に関連付けられた多項式を含み、
     前記関係演算手段は、モデルの多項式に含まれる、係数がゼロでない第1の変数に基づいて関係度を算出する、請求項1又は2のモデル評価装置。
  4.  モデルは、制御対象変数に関連付けられた、第1の変数、第2の変数、及び、第3の変数を変数とし、第2の変数に関連付けられた多項式を含み、
     前記関係演算手段は、モデルの多項式に含まれる、第1の変数に代入される値を変化させたとき、当該多項式に関連付けられた第2の変数の変化の度合いに基づいて関係度を算出する、請求項1又は2のモデル評価装置。
  5.  モデルは、第2の変数に関連付けられた、第1の変数、第2の変数、及び、第3の変数を変数とし、第2の変数に関連付けられた一次多項式を含み、
     前記関係演算手段は、モデルの多項式に含まれる第1の変数の係数を抽出して、状態方程式の係数行列を作成し、作成した状態方程式に基づいて可制御性を判定し、可制御性の有無を関係度として出力する、請求項1乃至4の何れか1項のモデル評価装置。
  6.  前記モデル評価装置は、
     第1の変数、第2の変数、および、第3の変数を関連付けて格納する第1の履歴と第2の履歴を格納する情報蓄積手段と、
     前記第1の履歴に基づいて前記複数のモデルを作成して前記モデル蓄積手段に格納する学習生成手段と、をさらに備え、
     モデルは、第1の変数、第2の変数、及び、第3の変数を変数とし、第2の変数に関連付けられた多項式を含み、
     前記精度演算手段は、モデルの多項式と、前記第2の履歴に含まれる第1の変数、第2の変数、または、第3の変数の値とから、多項式に関連付けられた第2の変数の値を算出し、前記第2の履歴に含まれる当該第2の変数の値との誤差を算出して、精度として出力する、請求項2のモデル評価装置。
  7.  制御の入力パラメータである第1の変数と、前記制御の目的である第2の変数と、前記制御の動作環境を表す第3の変数との関連性を示すモデルを記憶し、
     モデルにおいて第1の変数が第2の変数に与える影響の度合を示す関係度を算出するモデル評価方法。
  8.  複数のモデルを記憶し、
     モデルの正しさの度合を示す精度を算出し、
     関係度および精度に基づいて、前記複数のモデルから前記制御の為のモデルを選択する請求項7のモデル評価方法。
  9.  モデルは、第1の変数、第2の変数、及び、第3の変数を変数とし、第2の変数に関連付けられた多項式を含み、
     モデルの多項式に含まれる、係数がゼロでない第1の変数に基づいて関係度を算出する、請求項7又は8のモデル評価方法。
  10.  コンピュータに、
     制御の入力パラメータである第1の変数と、前記制御の目的である第2の変数と、前記制御の動作環境を表す第3の変数との関連性を示すモデルを記憶する処理と、
     モデルにおいて第1の変数が第2の変数に与える影響の度合を示す関係度を算出する処理と
     を実行させるためのプログラムを記録したコンピュータ読み取り可能なプログラム記録媒体。
PCT/JP2015/004758 2014-09-26 2015-09-17 モデル評価装置、モデル評価方法、及び、プログラム記録媒体 WO2016047118A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP15845135.1A EP3200038A4 (en) 2014-09-26 2015-09-17 Model evaluation device, model evaluation method, and program recording medium
JP2016549949A JPWO2016047118A1 (ja) 2014-09-26 2015-09-17 モデル評価装置、モデル評価方法、及び、プログラム記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-197161 2014-09-26
JP2014197161 2014-09-26

Publications (1)

Publication Number Publication Date
WO2016047118A1 true WO2016047118A1 (ja) 2016-03-31

Family

ID=55580665

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/004758 WO2016047118A1 (ja) 2014-09-26 2015-09-17 モデル評価装置、モデル評価方法、及び、プログラム記録媒体

Country Status (3)

Country Link
EP (1) EP3200038A4 (ja)
JP (1) JPWO2016047118A1 (ja)
WO (1) WO2016047118A1 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018154663A1 (ja) * 2017-02-22 2018-08-30 日本電気株式会社 特徴選択システム、特徴選択方法および特徴選択プログラム
KR20190054541A (ko) * 2017-11-14 2019-05-22 한국 천문 연구원 Pid 제어기를 이용한 인공지능 시스템
JP2019114168A (ja) * 2017-12-26 2019-07-11 宇部興産株式会社 プラント管理システム、プラント管理サーバ、プラント管理装置、推定用モデルの生成方法、及び学習用データの生成方法
JP2019125322A (ja) * 2018-01-19 2019-07-25 Necソリューションイノベータ株式会社 ストレージ管理装置、ストレージ管理方法、及びプログラム
WO2019155928A1 (ja) * 2018-02-08 2019-08-15 東京エレクトロン株式会社 情報処理装置、プログラム、プロセス処理実行装置及び情報処理システム
JP2020016924A (ja) * 2018-07-23 2020-01-30 シンフォニアテクノロジー株式会社 制御装置
JP2020160716A (ja) * 2019-03-26 2020-10-01 シンフォニアテクノロジー株式会社 制御系設計装置及びそれを備えた試験装置
JP2021163207A (ja) * 2020-03-31 2021-10-11 月島機械株式会社 制御装置、制御方法、及びプログラム
WO2022091530A1 (ja) * 2020-11-02 2022-05-05 Soinn株式会社 推定装置、推定方法及びプログラムが格納された非一時的なコンピュータ可読媒体
JP2022069608A (ja) * 2017-12-26 2022-05-11 Ube株式会社 プラント管理システム、プラント管理サーバ、プラント管理装置、推定用モデルの生成方法、及び学習用データの生成方法
WO2023152877A1 (ja) * 2022-02-10 2023-08-17 日本電信電話株式会社 通信品質予測装置、通信品質予測システム、通信品質予測方法、及び通信品質予測プログラム
WO2023152879A1 (ja) * 2022-02-10 2023-08-17 日本電信電話株式会社 モデル設定装置、モデル設定システム、モデル設定方法、及びモデル設定プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019058508A1 (en) * 2017-09-22 2019-03-28 Nec Corporation ASSEMBLY REGULATION SYSTEM, ASSEMBLY REGULATION METHOD, AND ASSEMBLY REGULATION PROGRAM

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005083531A1 (ja) * 2004-02-27 2005-09-09 Matsushita Electric Industrial Co., Ltd. 機器制御方法および機器制御装置
JP4821536B2 (ja) * 2006-09-26 2011-11-24 株式会社デンソー 車両用空調装置及び車両用空調装置の制御方法
WO2013183425A1 (ja) * 2012-06-06 2013-12-12 日本電気株式会社 性能予測装置、性能予測方法及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070061144A1 (en) * 2005-08-30 2007-03-15 Caterpillar Inc. Batch statistics process model method and system
US8046090B2 (en) * 2007-01-31 2011-10-25 Honeywell International Inc. Apparatus and method for automated closed-loop identification of an industrial process in a process control system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005083531A1 (ja) * 2004-02-27 2005-09-09 Matsushita Electric Industrial Co., Ltd. 機器制御方法および機器制御装置
JP4821536B2 (ja) * 2006-09-26 2011-11-24 株式会社デンソー 車両用空調装置及び車両用空調装置の制御方法
WO2013183425A1 (ja) * 2012-06-06 2013-12-12 日本電気株式会社 性能予測装置、性能予測方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3200038A4 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2018154663A1 (ja) * 2017-02-22 2019-06-27 日本電気株式会社 特徴選択システム、特徴選択方法および特徴選択プログラム
WO2018154663A1 (ja) * 2017-02-22 2018-08-30 日本電気株式会社 特徴選択システム、特徴選択方法および特徴選択プログラム
KR102276654B1 (ko) 2017-11-14 2021-07-13 한국 천문 연구원 Pid 제어기를 이용한 인공지능 시스템
KR20190054541A (ko) * 2017-11-14 2019-05-22 한국 천문 연구원 Pid 제어기를 이용한 인공지능 시스템
JP2019114168A (ja) * 2017-12-26 2019-07-11 宇部興産株式会社 プラント管理システム、プラント管理サーバ、プラント管理装置、推定用モデルの生成方法、及び学習用データの生成方法
JP7339382B2 (ja) 2017-12-26 2023-09-05 Ube三菱セメント株式会社 プラント管理システム、プラント管理サーバ、プラント管理装置、推定用モデルの生成方法、及び学習用データの生成方法
JP2022069608A (ja) * 2017-12-26 2022-05-11 Ube株式会社 プラント管理システム、プラント管理サーバ、プラント管理装置、推定用モデルの生成方法、及び学習用データの生成方法
JP7043831B2 (ja) 2017-12-26 2022-03-30 宇部興産株式会社 プラント管理システム、プラント管理サーバ、プラント管理装置、推定用モデルの生成方法、及び学習用データの生成方法
JP2019125322A (ja) * 2018-01-19 2019-07-25 Necソリューションイノベータ株式会社 ストレージ管理装置、ストレージ管理方法、及びプログラム
WO2019155928A1 (ja) * 2018-02-08 2019-08-15 東京エレクトロン株式会社 情報処理装置、プログラム、プロセス処理実行装置及び情報処理システム
TWI774919B (zh) * 2018-02-08 2022-08-21 日商東京威力科創股份有限公司 資訊處理裝置、程式、製程處理執行裝置及資訊處理系統
US11619926B2 (en) 2018-02-08 2023-04-04 Tokyo Electron Limited Information processing device, program, process treatment executing device, and information processing system
US11237544B2 (en) 2018-02-08 2022-02-01 Tokyo Electron Limited Information processing device, program, process treatment executing device, and information processing system
JPWO2019155928A1 (ja) * 2018-02-08 2021-03-11 東京エレクトロン株式会社 情報処理装置、プログラム、プロセス処理実行装置及び情報処理システム
JP7183195B2 (ja) 2018-02-08 2022-12-05 東京エレクトロン株式会社 情報処理装置、プログラム、プロセス処理実行装置及び情報処理システム
JP2021182429A (ja) * 2018-07-23 2021-11-25 シンフォニアテクノロジー株式会社 制御装置
JP2020016924A (ja) * 2018-07-23 2020-01-30 シンフォニアテクノロジー株式会社 制御装置
JP2020160716A (ja) * 2019-03-26 2020-10-01 シンフォニアテクノロジー株式会社 制御系設計装置及びそれを備えた試験装置
JP7273292B2 (ja) 2019-03-26 2023-05-15 シンフォニアテクノロジー株式会社 制御系設計装置及びそれを備えた試験装置
JP2021163207A (ja) * 2020-03-31 2021-10-11 月島機械株式会社 制御装置、制御方法、及びプログラム
WO2022091530A1 (ja) * 2020-11-02 2022-05-05 Soinn株式会社 推定装置、推定方法及びプログラムが格納された非一時的なコンピュータ可読媒体
WO2023152877A1 (ja) * 2022-02-10 2023-08-17 日本電信電話株式会社 通信品質予測装置、通信品質予測システム、通信品質予測方法、及び通信品質予測プログラム
WO2023152879A1 (ja) * 2022-02-10 2023-08-17 日本電信電話株式会社 モデル設定装置、モデル設定システム、モデル設定方法、及びモデル設定プログラム

Also Published As

Publication number Publication date
EP3200038A1 (en) 2017-08-02
JPWO2016047118A1 (ja) 2017-07-06
EP3200038A4 (en) 2018-06-13

Similar Documents

Publication Publication Date Title
WO2016047118A1 (ja) モデル評価装置、モデル評価方法、及び、プログラム記録媒体
US11915142B2 (en) Creating equipment control sequences from constraint data
Porta et al. Point-based value iteration for continuous POMDPs
WO2017024583A1 (zh) 模型预测控制的方法和装置
US10048658B2 (en) Information processing device, predictive control method, and recording medium
JP6458403B2 (ja) 予測モデル生成装置、予測モデル生成方法及びプログラム
KR102225370B1 (ko) 학습을 통한 파라미터 개선 기반의 예측 시스템 및 방법
CN110781595B (zh) 能源使用效率pue的预测方法、装置、终端及介质
CN111612262A (zh) 一种基于分位数回归的风电功率概率预测方法
JP6901037B1 (ja) 制御装置、制御方法及びプログラム
JP2018528511A (ja) 生産システムにおける出力効率の最適化
Wu et al. Online detection of steady-state operation using a multiple-change-point model and exact Bayesian inference
CN113568379A (zh) 控制辅助装置、控制辅助方法、计算机可读介质及控制系统
JP2019520642A (ja) 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム
Zhai et al. Parameter estimation and modeling of nonlinear dynamical systems based on runge–kutta physics-informed neural network
Palm Multiple-step-ahead prediction in control systems with Gaussian process models and TS-fuzzy models
Lee et al. On-policy learning-based deep reinforcement learning assessment for building control efficiency and stability
JP5717950B2 (ja) モデル関数処理装置および方法
JP7262554B2 (ja) プロセス管理支援装置および方法
JP4301491B2 (ja) 電動機制御システムの自律設計方法及び自律設計装置並びに電動機制御システム
Mayfrank et al. End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear MPC
CN117273392B (zh) 家具生产决策方法、装置、电子设备及存储介质
Reichensdörfer et al. Grammatical evolution of robust controller structures using wilson scoring and criticality ranking
Prasad et al. Performance Analysis of Cascade Tank System Using Deep Learning Controller
JP7396478B2 (ja) モデル訓練プログラム、モデル訓練方法および情報処理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15845135

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016549949

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2015845135

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2015845135

Country of ref document: EP