WO2005083531A1 - 機器制御方法および機器制御装置 - Google Patents

機器制御方法および機器制御装置 Download PDF

Info

Publication number
WO2005083531A1
WO2005083531A1 PCT/JP2005/003020 JP2005003020W WO2005083531A1 WO 2005083531 A1 WO2005083531 A1 WO 2005083531A1 JP 2005003020 W JP2005003020 W JP 2005003020W WO 2005083531 A1 WO2005083531 A1 WO 2005083531A1
Authority
WO
WIPO (PCT)
Prior art keywords
sensor
model
output
target
value
Prior art date
Application number
PCT/JP2005/003020
Other languages
English (en)
French (fr)
Inventor
Koji Morikawa
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to JP2006510446A priority Critical patent/JP3954087B2/ja
Publication of WO2005083531A1 publication Critical patent/WO2005083531A1/ja
Priority to US11/448,341 priority patent/US20060229739A1/en

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Definitions

  • the present invention relates to a technology for autonomously controlling devices in a system having at least one device and a plurality of sensors, for example, a home robot, an information terminal, and a home electric appliance network in an intelligent house.
  • Technology for making device operation decisions based on prediction for example, a home robot, an information terminal, and a home electric appliance network in an intelligent house.
  • These devices are equipped with many sensors for acquiring various input signals in order to realize various functions. Then, it receives a predetermined input signal, performs a predetermined process, and determines an output.
  • Some of these devices have a learning function for adjusting an output corresponding to an input that adapts to changes in the external environment. For example, there is a method in which the input / output relationship is reproduced by learning, and when a certain input is received, output is performed according to the reproduced input / output relationship
  • some devices have a function of determining an output by prediction. This is to learn the result for each output, that is, what output is sent to the outside, how the outside changes, and as a result, what kind of feedback the system has. .
  • general methods such as neural networks and reinforcement learning are used.
  • a state evaluator is prepared to predict a future evaluation signal, and in which state and how much There is also a technique that predicts whether or not a reward is likely to be obtained (see Patent Document 2).
  • a method called reinforcement learning is used to maximize a reward signal, which is an evaluation signal from the outside, and an action is determined based on the magnitude of a reward expected for each action. ing.
  • Patent Document 1 JP-A-2002-59384
  • Patent Document 2 JP-A-2002-189502
  • a prediction model (predictor) to be learned plays an important role in determining behavior.
  • the input and output of the prediction model are designed by the system designer in advance, and learning is performed based on the input / output relationship.
  • the number of input / output combinations increases explosively.
  • the number of combinations of input and output of the prediction model also increases, so learning is likely to be difficult.
  • each device can recognize the operation status of other devices without the resident knowing the operation of each device. This means that there is a possibility that both comfort and energy saving can be realized by the cooperative operation of each device.
  • Devices and sensors related to the living environment such as temperature and humidity include, for example, air conditioners, sensors for detecting where people are, cookware, gas fan heaters, humidifiers Vessels, dehumidifiers, etc.
  • the various states include the operating state of each device, the output values of each sensor (such as the current room temperature and humidity, the presence or absence of a person in the room, etc.), the outside air temperature, and the time when people return home.
  • the configurations of devices and sensors included in the system are subject to change at any time without guarantee that they will be the same throughout the future. For example, new equipment that has not been developed at the time of system construction may frequently be added, removed due to a failure, or replaced with a new product. In such a case, it is extremely difficult for the system designer to set the input and output of the model in advance as in the past.
  • the present invention provides a system having a device and a sensor, even if it is difficult to predict in advance the relationship between input and output due to the large number of sensors. It is an object of the present invention to control a device autonomously so that the operation of the device can be appropriately determined even when the value changes.
  • Means for solving the problem in a system having at least one device and a plurality of sensors, as a method of controlling the device, an operation of the device is performed together with a change in an output value of each sensor during the operation.
  • a first step of recording in the storage unit a second step of identifying a sensor whose output value has been affected by the operation from the data recorded in the storage unit, the operation, and the operation.
  • a manner, in which the output of the target sensor has a fifth step of determining an operation such that the target value.
  • the operation of the device is recorded in the storage unit together with the change of the sensor output value during the operation, and the sensor whose output value is affected by the operation from the data recorded in the storage unit Is specified. Then, a prediction model representing the relationship between this operation and the specified sensor is created by learning. When deciding the operation, select the model that includes the target sensor from the created prediction models, and determine the operation based on the selected prediction model so that the output of the target sensor reaches the target value.
  • the sensor output only becomes noise for the operation determination. Therefore, regarding the operation of the device that is the output of the system, the relevant input, that is, the sensor output is specified from the past history, and the irrelevant input is excluded in advance. As a result, even in a large-scale system, the size of the prediction model can be made compact, learning can be enhanced, and the accuracy of the model can be improved. Therefore, it is possible to determine a more appropriate operation.
  • the present invention it is possible to detect a relationship between a device operation and a sensor value, which is hardly conceived in the related art, and to use the relationship as a prediction model.
  • the future change of the output value of the target sensor be determined when the operation is determined in the fifth step. This allows the environment and conditions to occur independently of the system. The operation can be determined in consideration of the change.
  • a compact and high-precision prediction model can be autonomously created without specifying an input in advance, so that a large-scale system having many inputs and outputs and a configuration change Even in a system with a large number of operations, it is possible to determine a more appropriate operation based on the prediction.
  • FIG. 1 is a conceptual diagram of an intelligent house as an example to which the present invention is applied.
  • FIG. 2 is a block diagram showing the internal configuration of the agent of FIG. 1.
  • FIG. 3 is a block diagram showing an internal configuration of an operation result prediction unit in FIG. 2.
  • FIG. 4 is a flowchart showing an entire flow of a device control method according to an embodiment of the present invention.
  • FIG. 5 is a flowchart showing an example of details of steps SI and S2 in FIG. 4.
  • Fig. 6 is a description example of a model using a neural network
  • Fig. 6 (b) is IF-THE
  • FIG. 7 is a diagram schematically showing data for learning the model of FIG. 6.
  • FIG. 8 is a flowchart showing an example of details of step S3 in FIG. 4.
  • FIG. 9 is a schematic diagram showing a target state in consideration of indoor comfort.
  • FIG. 10 is a flowchart showing an example of details of step S5 in FIG. 4.
  • FIG. 11 is a flowchart showing an operation when the configurations of the device and the sensor are changed.
  • FIG. 12 is a configuration diagram of an agent according to a second embodiment of the present invention.
  • FIG. 13 is a diagram showing devices, device operations, and sensors assumed in the simulation.
  • FIG. 14 is a diagram showing a relationship between a device operation set by a simulation and a sensor value.
  • FIG. 15 is a graph showing time-series changes in device operation and sensor values obtained by simulation.
  • FIG. 16 shows a correlation between device operation and sensor values obtained from the data in FIG. FIG.
  • an operation of the device is performed by an output value of each sensor during the operation.
  • a first step of recording in a storage unit along with the change a second step of identifying a sensor whose output value has been affected by the operation from the data recorded in the storage unit, and the operation and the operation.
  • the present invention provides a device control method according to a first aspect, in which it is determined whether or not a new prediction model has a necessary power.
  • a third aspect of the present invention provides the device control method according to the first aspect, wherein the specification of the sensor in the second step is performed by obtaining a correlation between an operation and a change in an output value of the sensor. .
  • a fourth aspect of the present invention provides the device control method according to the first aspect, wherein the specification of the sensor in the second step is performed using a neural network.
  • a fifth aspect of the present invention provides the device control method according to the first aspect, wherein the fifth step determines an operation in consideration of a future change in an output value of the target sensor.
  • the operation of the device is determined by the operation of each sensor during the operation.
  • a storage unit that stores the change in the output value together with the change in the output value, a sensor identification unit that identifies a sensor whose output value is affected by the operation from the data recorded in the storage unit, the operation, and the sensor identification for the operation.
  • a model creation unit that creates a prediction model representing the relationship with the sensor specified by the unit from the data recorded in the storage unit by learning, a target sensor that defines a target state, and a target value of its output.
  • a model selecting unit for selecting a model including the target sensor from the prediction models created by the model creating unit; And an operation determining unit that determines an operation such that the output of the target sensor becomes the target value based on the model.
  • a seventh aspect of the present invention provides the device control device according to the sixth aspect, which is included in any one of the devices.
  • the intelligent house refers to a house in which devices in the house are connected via a network and information can be exchanged between the devices.
  • Each device can also acquire information on other devices, and this information can also be used during operation.
  • FIG. 1 is a conceptual diagram showing an example of an intelligent house.
  • Figure 1 mainly shows equipment related to the control of the living environment such as temperature and humidity in the house.
  • equipment related to the control of the living environment such as temperature and humidity in the house.
  • various equipment such as equipment that handles video and audio and equipment related to meals are assumed.
  • only a part of the network configuration in the intelligent home is conceptually illustrated.
  • the intelligent house 10 includes an air conditioner 11, a human sensor 12 for detecting the presence or absence of a human, a cooking utensil 13 such as a stove, an automatic window 14 that can be opened and closed externally, a gas A fan heater 15, a humidifier 16 and a dehumidifier 17 are provided.
  • an agent 20 is provided as a device control device that can collect information from each device 11-117 and issue an operation command to each device 11-117.
  • FIG. 1B shows an example of a sensor included in each of the devices 11 to 17 of FIG. 1A and an executable operation.
  • Each of the devices 11 and 17 is provided with only a sensor required to operate independently, and has an output device (actuator) for performing its function.
  • the air conditioner 11 has a temperature sensor and a humidity sensor, and performs cold air blowing and dehumidification as operations.
  • FIG. 2 is a block diagram showing an internal configuration of the agent 20 of FIG.
  • an input unit 21 receives a signal from the outside.
  • an output signal of a sensor included in each device 11 to 117 such as an air conditioner 11 is input.
  • a signal indicating the operation content of each device 11-17 is input.
  • the output unit 22 instructs each device 11-117 to operate. For example, it instructs the gas fan heater 15 to turn on or off combustion.
  • the storage unit 23 stores various sensor signals detected by the input unit 21, the operation content instructed from the output unit 22 and the operation content received by the input unit 21, together with time data.
  • the signal identification unit 24 as a sensor identification unit analyzes the relationship between the sensor value stored in the storage unit 23 and the operation content, identifies and lists, for each operation, a sensor closely related to the operation.
  • the signal selection unit 25 extracts only the data related to the specified sensor from the data read from the storage unit 23 based on the information received from the signal identification unit 24.
  • the operation result prediction unit 30 creates a model representing the relationship between the operation and the change in the sensor value, selects an operation candidate for achieving the target state based on the created model, and executes the operation. Evaluate the results.
  • the operation determining unit 27 receives the output of the operation result predicting unit 30, determines an operation for approaching the target state, and transmits the content of the operation to the output unit 22.
  • FIG. 3 is a block diagram showing an internal configuration of the operation result prediction unit 30 in FIG.
  • the model creation unit 35 creates a prediction model using the data selected by the signal selection unit 25, and stores it in the model storage unit 31.
  • the model selection unit 32 receives the type of the target sensor indicating the target state and the target value of the output, selects a prediction model including the target sensor from the model storage unit 31, and transfers the prediction model to the prediction unit 33. There can be more than one model selected.
  • the prediction unit 33 performs prediction based on the model selected by the model selection unit 32, and searches for an operation candidate such that the output of the sensor can be a target value.
  • the evaluation unit 34 evaluates each operation candidate.
  • FIG. 4 is a flowchart showing an overall flow of the device control method according to the present embodiment.
  • the agent 20 records each operation of the plurality of devices 11 to 117 in the storage unit 23 together with a change in the output value of each sensor during the operation. For a while after the system starts operating, it is unknown which sensor signals are involved in each operation of the device, so a period of data acquisition is required. Then, when it is determined that sufficient data has been acquired in the storage unit 23, in step S2, the signal identification unit 24 determines whether or not each of the operations of the devices 11 to 17 has an effect on the sensor related to the operation, that is, the output value thereof. Identify the sensor that received it.
  • FIG. 5 is a flowchart showing an example of the details of steps SI and S2.
  • the steps Step Sl-S14 corresponds to step SI
  • steps S21-S23 correspond to step S2.
  • the operation of the device is determined (S11), and the determined operation is output to the outside (here, the living environment) (S12).
  • the agent 20 does not have an appropriate operation determination method! Therefore, the operation of the device is often determined by the operation of the user.
  • the agent 20 collects, from the input unit 21, a change in the output value of the sensor together with the operation instructed from the output unit 22, and stores the change in the storage unit 23 together with the time information.
  • the operation content of the device is received via the input unit 21 and recorded in the storage unit 23 together with the change in the output value of the sensor (S13).
  • Steps S11 to S13 are repeatedly executed until data representing the relationship between the device operation and the change in the sensor output value is accumulated a predetermined number of times (S14).
  • the process proceeds to the next step S21.
  • the process may proceed to the next step S21 in addition to whether or not the data has been stored a predetermined number of times, for example, when a predetermined time has elapsed, when a user instruction is given, or the like.
  • step S21 the signal identification unit 24 calculates a correlation between the operation and a change in the output value of the sensor using the data stored in the storage unit 23. Then, in step S22, from the results of the correlation calculation in step S21, a sensor having a high correlation with the operation is specified by, for example, threshold processing.
  • the signal identification unit 24 provides information on the specified sensor set to the signal selection unit 25.
  • a method of specifying a sensor related to an operation besides using a correlation calculation, for example, an operation and a change in a sensor value are learned by a -ural network, and a connection weight of the learned connection weight is learned. Based on the size, for example, a sensor with a small coupling load value may be considered to have no relation to its operation.
  • a prediction model representing the relationship between the operation and the sensor specified in step S2 for the operation is created by learning.
  • the model used here can express how the sensor value changes due to a certain operation of a certain device. Anything can be used. For example, IF-THEN rules, neural networks, clustering, etc. can be used.
  • FIG. 6 (a) is a description example of a model using a neural network, in which changes in output values of a temperature sensor and a humidity sensor with respect to the operation of a gas fan heater are modeled. If the ONZOFF operation of the gas fan heater is made to correspond to the inputs "1" and "0" and the change amount per unit time of the temperature sensor and the humidity sensor is output, as shown in Fig. -You need a neural network.
  • the range of the output value is, for example, “ ⁇ 1” ⁇ “+ 1” to indicate the degree of change between the temperature sensor value and the humidity sensor value.
  • FIG. 6 (b) is a description example of a model using the IF-THEN rule, in which the output value of the temperature sensor changes with respect to the operation of the air conditioner, and the output value of the humidity sensor with respect to the operation of the humidifier. It is a model of change.
  • FIG. 7 is a diagram schematically showing data for learning the model of FIG. Fig. 7
  • FIG. 6 (a) is data for learning model 1 in Fig. 6 (a)
  • Figs. 7 (b) and (c) are data for learning models 2 and 3 in Fig. 6 (b), respectively. is there.
  • FIG. 8 is a flowchart showing an example of the details of step S3.
  • the model creation unit 35 in the operation result prediction unit 30 prepares a model (S31).
  • a model (S31)
  • an unlearned model in which an operation is input and an output value of the specified sensor is output.
  • This model expresses what kind of change in sensor value can occur due to a certain operation, and is called a forward model.
  • the signal selection unit 25 reads, for example, one set of input / output relation data from the storage unit 23 (S32).
  • the input / output relation data refers to the operation of the device at a certain time and the change of the output value of each sensor at the time of the operation, and when read, the input / output relation data includes all the data of the system.
  • the sensor signal is included.
  • the signal selection unit 25 extracts only the data related to the sensor specified in step S2 based on the information received from the signal identification unit 24, and also extracts the input / output relation data power (S33). As a result, teacher data for learning the model prepared in step S31 is prepared.
  • the model creating unit 35 receives the above-described teacher data from the signal selecting unit 25, and performs learning using the teacher data (S34). All input / output-related data stored in the storage unit 23 is read. Steps S32-S34 are repeatedly executed until the error is detected (S35). As a result, a model is created that represents the relationship between the operation and the associated sensor values.
  • a so-called inverse model that uses a forward model in which an operation is an input and a sensor value is used as an output, and a force sensor value is used as an input and the operation is an output is also possible.
  • a forward model a change in sensor value is predicted by inputting various actions as candidates, and an action whose output sensor value is closest to a target value is determined as an action.
  • an inverse model a desired operation is output when a target sensor value is input.
  • a target sensor that defines a target state and a target value of the output are received from outside.
  • the target sensor and the target value may be determined according to a request of the user, or the system may observe the state of the user and autonomously determine and determine the target sensor and the target value.
  • a model including the target sensor is selected from the models created in step S3, and an operation is determined based on the selected model such that the output of the target sensor becomes a target value.
  • a state in which a user resident in intelligent house 10 can comfortably be set as a target state.
  • humans think that they feel comfortable when the indoor temperature and humidity are within a predetermined range, and use the temperature sensor and humidity sensor as target sensors to determine the ideal temperature and humidity ranges for resident users. , Temperature sensor and humidity sensor output.
  • the ideal temperature is 15-20 ° C. and humidity is 40-60%.
  • the temperature when it is higher than that, you feel heat, and when it is lower than that, you feel cold.
  • humidity in addition to comfort, consideration should also be given to occupant health, such as too low a temperature, which makes it easier for cold viruses to breed, and too high a temperature, which tends to cause mold and mite. May be. If it is too high, dew condensation tends to occur.
  • FIG. 9 is a schematic diagram showing a target state in consideration of the indoor comfort described above.
  • the portion TS marked with “No” and “Tsuchi” is the range where the user feels comfortable, that is, the target state.
  • the temperature is 15 ° C-20 ° C, humidity 40- Use the range of 60% as the target state TS.
  • the purpose of device control is to change the current state CP to this target state TS.
  • the range of the target state TS may be set appropriately according to the taste, time zone, season, and the like of each home.
  • FIG. 10 is a flowchart showing an example of the details of step S5.
  • the model selection unit 32 searches for a model including a target sensor from a plurality of models stored in the model storage unit 31 (S51). If the corresponding model is strong enough, the process is terminated (S52). Here, it is assumed that the following three types of models have been searched.
  • Model 1 Operation of gas fan heater 15 and temperature and humidity sensors
  • Model 2 Heating operation and temperature sensor of air conditioner 11
  • the prediction unit 33 searches for an operation in which the output of the sensor can be a target value based on the model selected by the model selection unit 32 (S53). For example, input a possible motion candidate for the model, and search for a motion candidate whose output matches or approaches the target value. If the corresponding action is not found, the processing ends (S53).
  • each operation candidate is It shall be evaluated from the viewpoint of one cost. That is, the evaluation unit 34 calculates the energy cost of each operation candidate, and the operation determination unit 27 selects an operation candidate with a lower energy cost.
  • the cost of calculating the gas consumption and the power consumption power of the gas fan heater 15 according to the candidate 1 and the power consumption of the air conditioner 11 and the power consumption power of the humidifier according to the candidate 2 are calculated. And the cost to be compared.
  • the operation relating to the candidate 1, that is, the operation of turning on the gas fan heater 15 is determined as the actual operation.
  • the operation determining unit 27 instructs the contents of the determined operation to the outside via the output unit 22 (S56).
  • the final control target is the ON operation of the gas fan heater 15, a control signal for turning on the switch is output to the gas fan heater 15.
  • the operating force of each device 11-17 is recorded in the storage unit 23 together with the change in the sensor output value during the operation, and the data recorded in the storage unit 23
  • the sensor whose output value is affected by the operation is specified. Then, it is created by model force learning representing the relationship between this operation and the specified sensor.
  • model force learning representing the relationship between this operation and the specified sensor.
  • the agent 20 controls each device in the intelligent house 10 as described above.
  • the device may control its own operation or the operation of the other device in the same manner as in the present embodiment, with reference to the sensor information of the other device.
  • the agent function that does not need to be independent may be implemented in a device connected to the network.
  • the gas fan heater 15 will be described as an example.
  • the relationship between the output and the sensor value is relatively simple, and the rise and fall of the temperature are determined by ONZOFF of the combustion switch. This is the range that can be designed in advance by the designer.
  • the gas fan heater 15 can also acquire a sensor signal from another device, the output values of many sensors change due to the combustion operation of the gas fan heater 15. Can be recognized. For example, if it is recognized that the output value of the humidity sensor increases, it is understood that the gas fan heater 15 can execute the humidity control in addition to the temperature control which is the original purpose. .
  • the operation may be performed as shown in FIG. That is, after executing the same processing as in steps S1 and S2 described above, it is determined whether or not a new model is necessary based on the processing result in step S2 (S61). This determination can be made by confirming, for a certain operation, whether or not there is a sensor whose output value is affected in addition to the already specified sensor. When it is determined that it is necessary, a new model is created by learning (S62). As a result, even when the configuration of the device or the sensor is changed, if the prediction model that has already been created is sufficient, the model creation processing is not required, and the processing amount is reduced.
  • the modeling process as shown in FIG. 11 may be performed not only when a new device or sensor is added, but also when there is a large change in the external environment.
  • changes in the external environment that greatly affect the temperature and humidity environment include changes in temperature and humidity due to seasonal differences, and changes in temperature and humidity during the day.
  • changes in temperature and humidity when a window is opened are considered to be opposite depending on the season, and the relationship between lighting equipment and a brightness sensor is also strongly affected by external brightness.
  • the second embodiment of the present invention is characterized in that in step S5 in the flow of FIG. 4, when deciding the operation based on the learned prediction model, a future change in the output value of the target sensor is taken into account. I do.
  • FIG. 12 is a configuration diagram of the agent 20A according to the present embodiment. 12, the same components as those in FIG. 1 are denoted by the same reference numerals, and detailed description thereof will be omitted. The difference from the configuration in FIG. 1 is that an environment predicting unit 28 that predicts a future change in the output value of the target sensor due to factors other than the operation of the device is provided.
  • the output value of the temperature sensor is changed by operating the gas fan heater 15, but the output value of the temperature sensor is also concretely changed by other external factors. Is affected, for example, by changes in outside temperature and the operation of other devices such as air conditioners. If future changes in the sensor output value due to these factors are predicted, more appropriate operation can be determined.
  • the environment prediction unit 28 recognizes that the cooking utensil 13 is currently in use, and predicts that the indoor temperature will increase. In this case, even if the combustion operation of the gas fan heater 15 is determined by the operation result predicting unit 30, the operation determining unit 27A can refrain from performing the operation.
  • a future change in the output value of the target sensor can be tasted, so that a more suitable operation can be determined.
  • the use in an intelligent house has been described as an example.
  • the present invention can be applied to other uses, and for example, can be applied to the creation of a behavior model of a home robot. it can.
  • a general home robot includes a visual sensor for video input, a sound sensor as an input sensor. Hearing sensor for voice input, tactile sensor and switch for detecting direct contact from the user to the robot, ultrasonic sensor for detecting distance and obstacles, encoder for detecting the angle of each joint, center of gravity And the like for detecting the movement of the robot. Actuators for actions include legs and tires for movement, hands for moving objects, around the head for expressing the direction of view and nodding, motor lights for creating facial expressions, A speaker for talking to the user is provided. In particular, multi-functional household mouth bots are equipped with dozens or more of sensors for input and actuators for output, and the number is expected to increase further in the future.
  • the model of the operation of the right-handed actuator is created using only the signal of the right-hand encoder from the relationship between the past operation and the change in the sensor output value.
  • the robot is composed of an actuator and a sensor, such as a forward movement and a visual sensor, and output of a synthesized voice from a speaker and sensing of a user's reaction. It can be said that there are countless causal relationships between According to the present embodiment, it is possible to extract a causal relationship between a past operation and a change in a sensor output value and to create a compact and accurate prediction model by learning. Action decisions can be made.
  • the present inventors simulated an intelligent house as shown in FIG. 1 and executed a simulation for specifying a sensor related to the operation of the equipment.
  • each device and sensor Since the sensors are connected via a network, the operation of each device and the operation state of the sensor can be grasped. As each device behaves differently, sensor values are also affected differently. In this, which device is related to which sensor is specified.
  • FIG. 13 is a diagram showing devices, device operations, and types of sensors assumed in the simulation. As shown in Fig. 13, we assumed five types of equipment related to temperature and humidity in intelligent homes: air conditioners (cooling), IH cookers, gas fan heaters, humidifiers, and dehumidifiers. Also, in addition to ONZOFF of each device, seven types of device operation were assumed, including the presence / absence of a person and the opening / closing of windows that change the status. As the sensors, eight types of sensors assumed to be mounted on each device were assumed.
  • FIG. 14 is a diagram showing the relationship between the device operation and the sensor set in the simulation.
  • two types of arrows also appear on the sensor side for the device operation side force, with the solid arrow indicating the effect of increase and the dotted arrow indicating the effect of decrease.
  • sensors include multiple sensors that measure humidity and temperature, the relationship between device operation and sensors also overlaps.
  • the target of learning is whether the sensor value, which is not the sensor value itself, is increasing or decreasing. With this, the model can be simplified, but the sensor value itself may be used as the learning target.
  • the purpose of the simulation is to extract the relationship between the operation of each device and the fluctuation of the sensor value of each sensor in such a setting.
  • FIG. 15 is a graph showing the result of simulating the relationship between the operation of the device and the sensor value in the settings of FIGS. 13 and 14.
  • Fig. 15 (a) shows the time-series change of each device operation. Here, in order to reproduce the situation where each device operation is executed in various combinations by various device operations, the operation of turning on / off a randomly selected device randomly was repeated 100 times.
  • FIG. 15B shows a time series change of the sensor value corresponding to the time series change of the operation of each device in FIG. 15B.
  • FIG. 15 (b) shows only the humidity sensor of the air conditioner, the temperature sensor of the air conditioner, and the human sensor among the eight types of sensors.
  • the value is 0 when the sensor value does not change, +1 when the sensor value increases, and 1 when the sensor value decreases.
  • the human sensor has a value of 1 when there is a person and 0 when there is no person.
  • the sensor values also fluctuate in accordance with the time-series changes in the operation of each device, as a component.
  • the graph in Fig. 15 was obtained when a random operation sequence was given based on the relationship in Fig. 14, but even in an actual intelligent house, each was determined according to the operating state of multiple devices. Is assumed to increase or decrease. Therefore, there is no problem assuming that the time series data similar to that in Fig. 15 can be obtained in the intelligent home control system.
  • FIG. 16 shows the result of correlation between the operation of each device and the change of the sensor value from the data of FIG.
  • combinations having a positive correlation, combinations having a negative correlation, and combinations having no correlation are classified and shown with ⁇ 0.2 as a threshold.
  • a relationship is found in which the values of the temperature sensor of the air conditioner, the temperature sensor of the IH cooker, the temperature sensor of the room, and the temperature sensor of the gas fan heater decrease when the air conditioner is turned on.
  • a model of the relationship can be described by extracting and learning only the air conditioner and these four sensors.
  • turning on the humidifier increases the values of the humidity sensor of the air conditioner, the humidity sensor of the humidifier, and the humidity sensor of the dehumidifier. Only the model needs to be extracted and modeled.
  • calculation time was compared between the case where the sensor related to the device operation was specified and the case where the sensor was not specified!
  • learning using a neural network as an example, learning after finding the relationship between device operation and sensor by correlation calculation as shown in Fig. 16, and learning directly from the data in Fig. 15 without performing correlation calculation And the calculation time was compared.
  • the learning method adopted Roh click propagation method, the computation termination condition, 50000 learning or mean square error is set to 10 5 or less.
  • the sensors of each device were mainly temperature sensors and humidity sensors, which were set to be uniformly affected by the operation of the devices.
  • the locations are different, for example, the temperature sensor of the air conditioner is installed near the ceiling, the temperature sensor of the gas fan heater is near the floor, the temperature sensor of the IH cooker is in the kitchen, and so on.
  • the effect of each device operation on the sensor will be different but not uniform. According to the present invention, even in such a case, a relationship that cannot be assumed in advance can be found, and it is considered that efficient model learning can be performed.
  • the temperature sensor A relationship such as an increase in the sensor value may be detected.
  • the desired room temperature can be maintained by controlling the operation of other devices that affect the temperature, such as reducing the output of the fan heater.
  • garbage disposal machines and the like are equipped with an odor sensor for detecting garbage.
  • this odor sensor when this odor sensor is connected to a network, the relationship is detected that the sensor value of the odor sensor increases when other equipment operates, for example, when the oil fan heater is turned off. Issued and learned as a model. According to this model, if the oil fan heater is OFF, it is assumed that the value of the sensor exceeds the specified range. In this case, the operation of opening the window and the sensor The control of starting the model with the sensor value decrease and opening the window can be realized automatically.
  • the configuration of the device group may vary depending on when the network processing system is set, such as purchasing a new device or launching a new device later. It is thought that it changes as it is difficult to determine. In such a case, a method of autonomously discovering the relationship between the device operation and the sensor value and modeling the relationship as in the present invention is considered to be particularly effective.
  • the relationship between the operation and the sensor output can be identified and the prediction model can be created autonomously without the need to design the input and output in advance. It is effective for systems with power and systems with many configuration changes. Specifically, for example, it is effective for a home appliance network in an intelligent house, an autonomous robot having many inputs and outputs, and the like. Further, the present invention is also applicable to creating an operation model of an actuator for a sensor network to which many sensors are connected.

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Air Conditioning Control Device (AREA)
  • Feedback Control In General (AREA)

Abstract

 記憶部(23)は、入力部(21)から得た各種センサ信号と、出力部(22)から指示した動作内容とを併せて、記憶する。信号識別部(24)は記憶部(23)を参照して、ある動作によって出力値が影響を受けたセンサを特定する。動作結果予測部(30)および動作決定部(27)は、動作と、特定されたセンサとの関係を表す予測モデルを学習によって作成し、作成した予測モデルを参照して、目標センサの出力が目標値になるような動作を決定する。

Description

明 細 書
機器制御方法および機器制御装置
技術分野
[0001] 本発明は、少なくとも 1つの機器と複数のセンサとを有するシステム、例えば、家庭 用ロボット、情報端末、知能化住宅における家電ネットワーク等において、機器を自 律的に制御する技術に関し、特に、予測による機器の動作決定を行う技術に関する 背景技術
[0002] 近年、家庭用ロボット、情報端末、家電機器等において、多機能化が進んでいる。
これらの機器は、多彩な機能を実現するために、多様な入力信号を取得するための センサを数多く搭載している。そして、所定の入力信号を受けて、所定の処理を行い 、出力を決定する。
[0003] また、これらの機器の中には、外部環境の変化に適応すベぐ入力に対する出力を 調整するための学習機能を持つものがある。例えば、学習によって入出力関係を再 現し、ある入力を受けると、再現した入出力関係に従って、出力を行う方法などがある
[0004] また、入出力関係の再現以上の能力を持たせるために、予測による出力決定機能 が搭載されたものもある。これは、各出力に対する結果、すなわちどのような出力を外 部に対して行ったら、外部がどのように変化して、結果としてシステムにどのようなフィ ードバックがある力、を学習するものである。この学習には、ニューラルネットワークや 強化学習などの一般的な手法が用いられる。
[0005] 従来の予測型技術としては、例えば、視覚センサと回転角度センサの出力値を入 力とし、次のステップにおける視覚センサの出力値の変化を予測するものがある(特 許文献 1参照)。ここでは、 1ステップ先の視覚センサの情報を予測して、ロボットの動 作と視覚センサの対応付けを学習している。学習手法としては、リカレント型の-ユー ラルネットワークが用いられて!/、る。
[0006] また、将来の評価信号を予測するために状態評価器を準備し、どの状態でどの程 度の報酬が得られそうかを予測するものもある(特許文献 2参照)。この例では、外部 からの評価信号である報酬信号を最大化するために強化学習という手法が用いられ ており、各行動に対して期待される報酬の大きさを基にして、行動決定がなされてい る。
特許文献 1:特開 2002— 59384号公報
特許文献 2:特開 2002-189502号公報
発明の開示
発明が解決しょうとする課題
[0007] 予測による出力決定機能では、学習を行う対象となる予測モデル (予測器)が、行 動決定のために重要な役割を果たしている。従来の予測型技術では、まず予測モデ ルに対する入力と出力をシステムの設計者が予め設計し、その入出力関係の下で学 習が行われていた。し力しながら、入力信号や出力動作の種類が増加するにつれて 、入力と出力の組合せの個数は爆発的に増大する。これに伴い、予測モデルの入出 力の組合せの数も同様に増大するため、学習が困難になる可能性が高い。
[0008] この点を、知能化住宅における家電ネットワークを例にとって説明する。
[0009] 近年、住宅に関して、快適な室内環境を求める声とともに、環境意識の高まりなど から省エネルギーの要求も高まっている。快適な室内環境の実現のためには、空調 機器や暖房 ·冷房機器など多くの機器を適切に稼動させて、室内の温度や湿度など を適度に保つ必要がある。し力しながら、多くの機器を稼動させることはエネルギー 消費の増大につながり、省エネルギーは達成できない。すなわち、住環境の快適性 と省エネルギーとはいわゆるトレードオフの関係にあり、両立させるためには何らかの 調停が必要になる。
[0010] 一方、最近の住宅では、各種のセンサや機器がネットワークで相互に接続され、機 器間で相互に情報を交換することが可能になりつつある。このような状況では、住人 が各機器の動作を把握しなくても、各機器は、他の機器の動作状況を認識できる。こ れは、各機器が協調的に動作することによって、快適性と省エネの両立を実現できる 可能性があることを意味する。温度や湿度等住環境に関する機器やセンサとしては、 例えば、エアコン、人の居場所を検出するセンサ、調理器具、ガスファンヒータ、加湿 器、除湿機等がある。
[0011] 快適性と省エネの両立を実現するためには、様々な状態において、各機器の動作 を的確に決定する必要がある。様々な状態とは、各機器の動作状態、各センサの出 力値 (現在の部屋の温度や湿度、室内の人の有無など)、外気温、人の帰宅時間な どを含む。これらを時系列で変化する複数の変数とみると、時々刻々と変化する膨大 な変数の中から適切な関係性を見出し、適切な機器に対して適切な制御指令を生 成する、という課題を解決する必要がある。
[0012] 例えば加湿器は、搭載された湿度センサの出力値を、所定値よりも下回れば ONに して、所定値を上回れば OFFにするといつた機能を有するものが多い。ところが、こ のような加湿器単独の制御だけでは、快適性と省エネの両立を実現することは困難 である。例えば、加湿器以外の機器であっても例えばガスファンヒータは、 ON動作の とき、燃焼時に発生する水蒸気によって湿度を上昇させてしまう。このような、機器が 本来持つ機能とは別の影響を及ぼしてしまう現象にっ 、て、これを加味した制御ル ールを予め設定することは極めて困難である。
[0013] また、家庭用ロボットや情報端末でも、搭載されるセンサの種類や提供できる機能 の個数は増加しており、動作ルールを設計者が予め記述するために、大量の作業が 必要になってきている。また、そのシステムの規模の大きさから、学習方法も適応が 困難になっている。
[0014] また、システムが有する機器やセンサの構成は、将来にわたってずっと同じもので ある保証はなぐ随時、変更されていく。例えば、システム構築時には未開発であつ た新たな機器が追加接続されたり、故障のために取り外されたり、新製品に買い換え られたりすることは頻繁に起こりうる。このような場合には、従来のように、システム設 計者がモデルの入出力を事前に設定する、ということ自体が極めて困難である。
[0015] 前記の問題に鑑み、本発明は、機器とセンサを有するシステムにおいて、センサの 個数が多いために入力と出力との関係を事前に想定するのが困難な場合でも、また 、機器構成が変化する場合でも、機器を自律的に制御し、機器の動作を適切に決定 可能にすることを課題とする。
課題を解決するための手段 [0016] 本発明は、少なくとも 1つの機器と複数のセンサとを有するシステムにおいて、前記 機器の制御を行う方法として、前記機器の動作を、その動作時における前記各セン サの出力値の変化とともに記憶部に記録する第 1のステップと、前記記憶部に記録さ れたデータから、前記動作によって出力値が影響を受けたセンサを特定する第 2のス テツプと、前記動作と、当該動作について前記第 2のステップにおいて特定されたセ ンサとの関係を表す予測モデルを、前記記憶部に記録されたデータ力 学習によつ て作成する第 3のステップと、 目標状態を規定する目標センサと、その出力の目標値 とを受ける第 4のステップと、前記第 3のステップにおいて作成された予測モデルの中 力 前記目標センサを含むものを選択し、選択されたモデルを基にして、前記目標セ ンサの出力が前記目標値になるような動作を決定する第 5のステップとを備えたもの である。
[0017] 本発明によると、機器の動作が、その動作時のセンサ出力値の変化とともに記憶部 に記録され、この記憶部に記録されたデータから、当該動作によって出力値が影響 を受けたセンサが特定される。そして、この動作と特定されたセンサとの関係を表す 予測モデルが学習によって作成される。動作決定の際には、作成された予測モデル の中から目標センサを含むものを選択し、選択した予測モデルを基にして、 目標セン サの出力が目標値になるような動作を決定する。
[0018] すなわち、複数のセンサのうち、その出力値の変化が当該動作と何の関係もないと き、そのセンサ出力は動作決定にとってノイズになるだけである。したがって、システ ムの出力となる機器の動作について、関係がある入力すなわちセンサ出力を過去の 履歴から特定し、関係のない入力を予め除外する。これにより、たとえ大規模なシス テムであつても、予測モデルのサイズがコンパクトになり学習のしゃすさが高まるととも に、モデルの精度も向上させることができる。したがって、より適切な動作を決定する ことが可能になる。
[0019] また、本発明により、従来では考えられな力つたような機器動作とセンサ値との関係 性も検出でき、予測モデルとして使用可能になる。
[0020] また、前記第 5のステップにおける動作決定の際に、 目標センサの出力値の将来変 化をカ卩味するのが好ましい。これにより、システムとは無関係に起きる環境や状況の 変化をも考慮した、動作決定を行うことができる。
発明の効果
[0021] 本発明によると、事前に入力を指定しなくても、自律的に、コンパクトで精度の高い 予測モデルを作成できるため、多くの入出力を持つ大規模なシステムや、構成の変 化が多いシステムであっても、予測に基づぐより適切な動作決定が可能になる。 図面の簡単な説明
[0022] [図 1]図 1は、本発明を適用する一例としての知能化住宅の概念図である。
[図 2]図 2は、図 1のエージェントの内部構成を示すブロック図である。
[図 3]図 3は、図 2の動作結果予測部の内部構成を示すブロック図である。
[図 4]図 4は、本発明の実施形態に係る機器制御方法の全体の流れを示すフローチ ヤートである。
[図 5]図 5は、図 4のステップ SI, S2の詳細の一例を示すフローチャートである。
[図 6]図 6 (a)は-ユーラルネットワークを用いたモデルの記述例、図 6 (b)は IF— THE
Nルールを用いたモデルの記述例である。
[図 7]図 7は、図 6のモデルを学習するためのデータを模式的に示す図である。
[図 8]図 8は、図 4のステップ S3の詳細の一例を示すフローチャートである。
[図 9]図 9は、室内の快適さを考慮した場合の目標状態を示す模式図である。
[図 10]図 10は、図 4のステップ S5の詳細の一例を示すフローチャートである。
[図 11]図 11は、機器およびセンサの構成が変更されたときの動作を示すフローチヤ ートである。
[図 12]図 12は、本発明の第 2の実施形態に係るエージェントの構成図である。
[図 13]図 13は、シミュレーションで想定した機器、機器動作およびセンサを示す図で ある。
[図 14]図 14は、シミュレーションで設定した機器動作とセンサ値との関係を示す図で ある。
[図 15]図 15は、シミュレーションによって得られた機器動作およびセンサ値の時系列 変化を示すグラフである。
[図 16]図 16は、図 15のデータから求めた機器動作とセンサ値との相関関係を示す 図である。
符号の説明
10 知能化住宅
11、 -17 機器
20, 20A エージェント (機器制御装置)
21 入力部
22 出力部
23 n己' 1思 ρβ
24 信号識別部 (センサ特定部)
25 信号選択部
27, 27Α 動作決定部
28 環境予測部
30 動作結果予測部
31 モデル記憶部
32 モデル選択部
33 予測部
34 評価部
35 モデル作成部
TS 目標状態
CP 現在状態
発明を実施するための最良の形態
本発明の第 1態様は、少なくとも 1つの機器と複数のセンサとを有するシステムにお いて、前記機器の制御を行う方法として、前記機器の動作を、その動作時における 前記各センサの出力値の変化とともに記憶部に記録する第 1のステップと、前記記憶 部に記録されたデータから、前記動作によって出力値が影響を受けたセンサを特定 する第 2のステップと、前記動作と当該動作について前記第 2のステップにおいて特 定されたセンサとの関係を表す予測モデルを、前記記憶部に記録されたデータから 学習によって作成する第 3のステップと、目標状態を規定する目標センサとその出力 の目標値とを受ける第 4のステップと、前記第 3のステップにおいて作成された予測モ デルの中から前記目標センサを含むものを選択し、選択されたモデルを基にして、前 記目標センサの出力が前記目標値になるような動作を決定する第 5のステップとを備 えたものを提供する。
[0025] 本発明の第 2態様は、前記システムが有する機器およびセンサの構成が変更され たとき、前記第 1および第 2のステップを実行し、かつ、前記第 2のステップの処理結 果から、新たな予測モデルが必要力否かを判断し、必要と判断したとき、新たな予測 モデルを学習によって作成する第 1態様の機器制御方法を提供する。
[0026] 本発明の第 3態様は、前記第 2のステップにおけるセンサの特定を、動作と、センサ の出力値の変化との相関を求めることによって、行う第 1態様の機器制御方法を提供 する。
[0027] 本発明の第 4態様は、前記第 2のステップにおけるセンサの特定を、ニューラルネッ トワークを用いて行う第 1態様の機器制御方法を提供する。
[0028] 本発明の第 5態様は、前記第 5のステップは、前記目標センサの出力値の将来変 化を加味して、動作の決定を行う第 1態様の機器制御方法を提供する。
[0029] 本発明の第 6態様は、少なくとも 1つの機器と複数のセンサとを有するシステムにお いて、前記機器の制御を行う装置として、前記機器の動作を、その動作時における 前記各センサの出力値の変化とともに記憶する記憶部と、前記記憶部に記録された データから、前記動作によって出力値が影響を受けたセンサを特定するセンサ特定 部と、前記動作と、当該動作について前記センサ特定部によって特定されたセンサと の関係を表す予測モデルを、前記記憶部に記録されたデータから学習によって作成 するモデル作成部と、目標状態を規定する目標センサと、その出力の目標値とを受 け、前記モデル作成部によって作成された予測モデルの中から、前記目標センサを 含むものを選択するモデル選択部と、前記モデル選択部によって選択されたモデル を基にして、前記目標センサの出力が前記目標値になるような動作を決定する動作 決定部とを備えたものを提供する。
[0030] 本発明の第 7態様は、前記機器のうちのいずれ力 1つに含まれている第 6態様の機 器制御装置を提供する。 [0031] 以下、本発明の実施の形態について、図面を参照しながら説明する。
[0032] (第 1の実施形態)
本発明の第 1の実施形態について、知能化住宅に設置された機器を例にとって説 明する。ここで、知能化住宅とは、住宅内にある機器がネットワークを介して接続され ており、機器同士で情報のやり取りが可能になっている状態の住宅のことをいう。各 機器は、他の機器力もの情報も取得可能であり、これらの情報も、動作の際に用いる ことがでさるちのとする。
[0033] 図 1は知能化住宅の例を示す概念図である。図 1では主に、住宅内の温度や湿度 という住環境の制御に関連した機器を示している。実際の知能化住宅では、住環境 の制御に関連した機器以外にも、映像や音響を扱う機器や食事に関する機器など様 々な機器が想定されるが、図 1では説明を簡単にするために、知能化住宅における ネットワークの一部の構成のみを概念的に図示している。
[0034] すなわち図 1 (a)では、知能化住宅 10は、エアコン 11、人間の有無を検出する人セ ンサ 12、コンロ等の調理器具 13、外部から開閉制御が可能な自動窓 14、ガスファン ヒータ 15、加湿器 16および除湿機 17を備えている。また、特定の機能は持たないが 、各機器 11一 17から情報を収集し、各機器 11一 17に動作指令を出すことができる 機器制御装置としてのエージェント 20を備えて 、る。
[0035] 図 1 (b)は図 1 (a)の各機器 11一 17が有するセンサと、実行可能な動作の例を示 す。各機器 11一 17は、単独で動作するために必要なセンサのみを搭載し、また、そ の役割を果たすための出力器 (ァクチユエータ)を有する。例えばエアコン 11は、温 度センサと湿度センサを有し、また動作として、冷風送風と除湿を行う。
[0036] 図 2は図 1のエージェント 20の内部構成を示すブロック図である。図 2において、入 力部 21は外部からの信号を受けるものであり、図 1の知能化住宅 10の例では、エア コン 11など各機器 11一 17が有するセンサの出力信号を入力する。また、各機器 11 一 17の動作内容を示す信号も入力する。出力部 22は、各機器 11一 17に対して動 作を指示する。例えばガスファンヒータ 15に対して、燃焼の ONや OFFを指示する。
[0037] 記憶部 23は、入力部 21において検出された各種センサ信号と、出力部 22から指 示した動作内容や入力部 21が受けた動作内容とを、併せて、時刻データとともに記 憶する。センサ特定部としての信号識別部 24は、記憶部 23に記憶されたセンサ値と 動作内容との関係を分析して、各動作について、それと関係の深いセンサを識別し てリストアップする。信号選択部 25は、信号識別部 24から受けた情報に基づいて、 記憶部 23から読み出したデータから、特定されたセンサに係るデータのみを抽出す る。
[0038] 動作結果予測部 30は、動作とセンサ値の変化との関係を表すモデルを作成し、作 成したモデルを基にして、目標状態を達成するための動作の候補を選び、その動作 の結果を評価する。動作決定部 27は動作結果予測部 30の出力を受けて、目標状 態に近づけるための動作を決定し、出力部 22にその動作の内容を伝達する。
[0039] 図 3は図 2の動作結果予測部 30の内部構成を示すブロック図である。図 3において 、モデル作成部 35は、信号選択部 25によって選択されたデータを用いて、予測モデ ルを作成し、モデル記憶部 31に格納する。モデル選択部 32は、目標状態を示す目 標センサの種類とその出力の目標値とを受け、目標センサを含む予測モデルをモデ ル記憶部 31から選択して、予測部 33に渡す。選択されるモデルは複数の場合もあり える。予測部 33は、モデル選択部 32によって選択されたモデルを基にして、予測を 行い、センサの出力が目標値になり得るような動作候補を検索する。評価部 34は、 各動作候補を評価する。
[0040] 本実施形態に係る機器制御方法について、説明する。ここでは、図 2および図 3に 示すエージェント 20において、当該方法が実行されるものとする。
[0041] 図 4は本実施形態に係る機器制御方法の全体の流れを示すフローチャートである 。まずステップ S1において、エージェント 20は、複数の機器 11一 17の各動作を、そ の動作時における各センサの出力値の変化とともに、記憶部 23に記録する。システ ムが動作し始めて力 しばらくの間は、機器の各動作にどのセンサ信号が関係する のか不明なので、データ取得の期間が必要になる。そして、記憶部 23に十分なデー タが取得されたと判断したとき、ステップ S2において、信号識別部 24が、機器 11一 1 7の各動作について、関係のあるセンサ、すなわちその出力値が影響を受けたセン サを特定する。
[0042] 図 5はステップ SI, S2の詳細の一例を示すフローチャートである。図 5では、ステツ プ Sl l— S14がステップ SIに該当し、ステップ S21— S23がステップ S2に該当して いる。
[0043] まず、機器の動作を決定し (S 11)、決定された動作を外部 (ここでは住環境)に対 して出力する(S12)。これは、エージヱント 20が動作を決定して、出力部 22を介して 動作指示を出し、指示を受けた機器が動作を行う場合だけでなぐユーザが機器を 操作した場合等も含む。特に最初は、エージェント 20は適当な動作決定方法を持た な!、ので、ユーザの操作によって機器の動作が決定される場合が多 、。
[0044] そしてエージェント 20は、出力部 22から指示した動作とともに、その後のセンサの 出力値の変化を入力部 21から収集して、記憶部 23に時刻情報とともに格納する。ュ 一ザが機器を操作した場合には、当該機器カゝら動作内容を入力部 21を介して受け、 センサの出力値の変化とともに記憶部 23に記録する(S 13)。
[0045] ステップ S11— S13を、機器動作とセンサ出力値の変化との関係を表すデータが 所定の回数だけ蓄積されるまで、繰り返し実行する (S14)。所定回数だけ蓄積され ると次ステップ S 21に進む。なお、データの蓄積が所定回数だけ行われたか否か以 外にも、例えば、所定時間が経過したとき、ユーザカゝら指示があつたときなどの場合 に、次ステップ S21に進むようにしてもよい。
[0046] ステップ S21では、信号識別部 24が、記憶部 23に蓄えられたデータを用いて、動 作と、センサの出力値の変化との相関を計算する。そしてステップ S22において、ス テツプ S21での相関計算の結果から、例えば閾値処理によって、当該動作と相関の 高いセンサを特定する。信号識別部 24は、特定したセンサの組に関する情報を信号 選択部 25に与える。
[0047] なお、動作と関係するセンサを特定する手法としては、相関計算を用いる以外にも 、例えば、動作とセンサ値の変化とを-ユーラルネットワークに学習させて、学習後の 結合荷重の大きさに基づき、例えば結合荷重の値が小さいセンサは、その動作とは 関係がないと判断するといつた手法も考えられる。
[0048] 図 4にもどり、次にステップ S3において、動作と、当該動作に対してステップ S2で特 定されたセンサとの関係を表す予測モデルを、学習によって作成する。ここで用いる モデルは、ある機器のある動作によって、センサ値がどのように変化するかを表現可 能なものであればよい。例えば、 IF— THENルールや、ニューラルネットワーク、クラ スタリングなどを用いることができる。
[0049] 図 6 (a)は-ユーラルネットワークを用いたモデルの記述例であり、ガスファンヒータ の動作に対する温度センサおよび湿度センサの出力値の変化をモデルィ匕したもの である。ガスファンヒータの ONZOFF動作を入力「1」「0」に対応させ、温度センサと 湿度センサの単位時間当たりの変化量を出力とすると、図 6 (a)に示すように、 1入力 2出力の-ユーラルネットワークが必要になる。ここで出力値の範囲は例えば、温度セ ンサ値と湿度センサ値の変化度合を示すために、「ー1」一「 + 1」とする。
[0050] 図 6 (b)は IF— THENルールを用いたモデルの記述例であり、エアコンの動作に対 する温度センサの出力値の変化、および、加湿器の動作に対する湿度センサの出力 値の変化をモデル化したものである。
[0051] また、図 7は図 6のモデルを学習するためのデータを模式的に示した図である。図 7
(a)は図 6 (a)のモデル 1を学習するためのデータであり、図 7 (b) , (c)は図 6 (b)のモ デル 2, 3をそれぞれ学習するためのデータである。
[0052] 図 8はステップ S3の詳細の一例を示すフローチャートである。まず、動作結果予測 部 30内のモデル作成部 35が、モデルを準備する(S31)。ここでは、動作を入力とし 、特定されたセンサの出力値を出力とする未学習のモデルを作成するものとする。こ のモデルは、ある動作によってどのようなセンサ値の変化がおき得るかを表現するも のであり、順モデルと呼ばれる。
[0053] そして、信号選択部 25が、記憶部 23から入出力関係データを例えば一組ずつ読 み出す (S32)。入出力関係データとは、ある時刻における機器の動作とその動作時 における各センサの出力値の変化のことであり、読み出されたときは、入出力関係デ 一タにはシステムが有する全てのセンサ信号が含まれている。読み出した後、信号選 択部 25は、信号識別部 24から受けた情報に基づいて、ステップ S2で特定されたセ ンサに係るデータのみを入出力関係データ力も抽出する(S33)。これによつて、ステ ップ S31で準備したモデルの学習のための教師データが準備されたことになる。
[0054] モデル作成部 35は、信号選択部 25から上述の教師データを受け、この教師デー タを用いて学習を行う(S34)。記憶部 23に蓄積された入出力関係データが全て読 み出されるまで、ステップ S32— S34を繰り返し実行する(S35)。この結果、動作と、 これに関連するセンサ値との関係を表すモデルが作成される。
[0055] なお、ここでは、動作を入力とし、センサ値を出力とする順モデルを用いるものとし た力 センサ値を入力とし、動作を出力とするいわゆる逆モデルを学習することも可 能である。順モデルを用いた場合、様々な動作を候補として入力してセンサ値の変 化を予測し、出力されたセンサ値が目標値に最も近いものを、動作として決定する。 一方、逆モデルを用いた場合、目標とするセンサ値を入力すると、望ましい動作が出 力される。一般に、逆モデルは、入力と出力とが一対一に対応していない場合は学 習が困難であり、順モデルの方力 応用範囲が広いという面では好ましいといえる。
[0056] 図 4に戻り、ステップ S4において、外部から、目標状態を規定する目標センサと、そ の出力の目標値とを受ける。ここでの目標センサおよび目標値は、ユーザの要求に よって決定される場合もあり、また、システムがユーザの状態を観察して自律的に判 断して決定する場合もある。そして、ステップ S5において、ステップ S3で作成したモ デルの中から目標センサを含むものを選択し、選択されたモデルを基にして、目標セ ンサの出力が目標値になるような動作を決定する。
[0057] ここでは、知能化住宅 10に居住するユーザが快適に過ごせる状態を目標状態とす るものとする。例えば、人間は、室内の温度と湿度が所定の範囲内にあるとき、快適 に感じると考え、温度センサおよび湿度センサを目標センサとし、居住するユーザに とって理想的な温度および湿度の範囲を、温度センサおよび湿度センサの出力の目 標値とする。
[0058] 一般には、温度は 15— 20°C、湿度は 40— 60%が理想的であるといわれている。
温度に関しては、それ以上のときは暑さを感じ、それ以下のときは寒さを感じる。また 湿度に関しては、快適さという側面以外にも、低すぎると風邪のウィルスが繁殖しや すくなり、一方、高すぎるとカビゃダニが発生しやすくなる、というような居住者の健康 面も考慮してもよい。また高すぎると、結露も起こりやすい。
[0059] 図 9は上述した室内の快適さを考慮したときの目標状態を示す模式図である。温度 を横軸に、湿度を縦軸にとったグラフにおいて、ノ、ツチを付した部分 TSが、ユーザが 快適に感じる範囲すなわち目標状態となる。図 9では、温度 15°C— 20°C、湿度 40— 60%の範囲を目標状態 TSとして ヽる。現在の状態 CPをこの目標状態 TSに変化さ せることが、機器制御の目的となる。なお、目標状態 TSの範囲は、各家庭の好み、 時間帯、季節等に応じて適当に設定すればよい。
[0060] 例えば、冬に外出先力 帰宅したときの室内の状態が座標点 CPであった場合、目 標状態 TSに変化させるためには、温度、湿度ともに高めなければならない。ところが
、システム内には複数の暖房手段や加湿手段があるため、これらの中から適切な機 器を選択して制御する必要がある。
[0061] 図 10はステップ S5の詳細の一例を示すフローチャートである。まず、モデル選択 部 32は、モデル記憶部 31に蓄えられた複数のモデルの中から、目標センサを含む モデルを検索する(S51)。該当するモデルが見つ力もな力つたときは処理を終了す る(S52)。ここでは、次の 3種類のモデルが検索されたものとする。
モデル 1:ガスファンヒータ 15の動作と、温度センサおよび湿度センサ
モデル 2:エアコン 11の暖房動作と温度センサ
モデル 3:加湿器 16の動作と湿度センサ
[0062] 次に、予測部 33は、モデル選択部 32によって選択されたモデルを基にして、セン サの出力が目標値になり得る動作を検索する(S53)。例えば、モデルに対して可能 な動作候補を入力し、得られた出力が目標値と一致する、または、目標値に近づく動 作候補を、探索する。該当する動作が見つからな力つたときは処理を終了する(S53
) o
[0063] ここでは、各モデル 1一 3を検討した結果、モデル 1を用いたときは温度、湿度ともに 目標値の範囲に入ることが分力つたものとする。また、モデル 2を用いた場合は温度 のみ、モデル 3を用いた場合は湿度のみしか制御できないが、モデル 2とモデル 3を 組み合わせて用いることによって、温度、湿度ともに目標値の範囲に制御可能である ことが分力つたものとする。この結果、次の 2つの候補が評価部 34に送られる。
候補 1:ガスファンヒータ ON (モデル 1)
候補 2:エアコン暖房 ON (モデル 2)と加湿器 ON (モデル 3)
[0064] 次に、評価部 34が各動作候補をそれぞれ評価し、その評価結果から、動作決定部 27が、実際に実行する動作を決定する(S55)。ここでは各動作候補を、省エネルギ 一コストの観点から評価するものとする。すなわち、評価部 34が各動作候補のェネル ギーコストを算出し、動作決定部 27が、エネルギーコストのより少ない動作候補を選 択する。
[0065] 具体的には、候補 1に係るガスファンヒータ 15のガス消費量と電力消費量力も算出 されるコストと、候補 2に係るエアコン 11の電力消費量と加湿器の電力消費量力 算 出されるコストとを比較する。ここで例えば、候補 1の方がエネルギーコストが低いもの とすると、候補 1に係る動作、すなわちガスファンヒータ 15を ONする動作が、実際の 動作として決定される。動作決定部 27は、決定した動作の内容を、出力部 22を介し て外部に指示する(S56)。ここでは、最終的な制御対象はガスファンヒータ 15の ON 動作であるので、ガスファンヒータ 15に対してそのスィッチを入れる制御信号を出力 する。
[0066] 以上のように本実施形態によると、各機器 11一 17の動作力 その動作時のセンサ 出力値の変化とともに記憶部 23に記録され、この記憶部 23に記録されたデータから 、当該動作によって出力値が影響を受けたセンサが特定される。そして、この動作と 特定されたセンサとの関係を表すモデル力 学習によって作成される。これにより、た とえ大規模なシステムであっても、予測モデルのサイズがコンパクトになり学習のしゃ すさが高まるとともに、予測モデルの精度も向上する。したがって、より適切な動作を 決定することが可能になる。
[0067] なお、本実施形態では、エージェント 20が知能化住宅 10内の各機器の制御を行う ものとして説明を行った力 これ以外の形態でも例えば、知能化住宅 10内のエージ ェント 20以外の機器が、他の機器のセンサ情報も参照して、本実施形態と同様にし て自己の動作または他の機器の動作を制御するようにしてもよい。つまり、エージェン トは独立である必要はなぐエージェントの機能はネットワークにつながった機器内に 実現されてもよい。
[0068] ガスファンヒータ 15を例にとって説明する。ガスファンヒータ 15が単独で動作する場 合、出力とセンサ値との関係は比較的単純であり、燃焼スィッチの ONZOFFによつ て温度の上昇 Z下降が決定される。これは、設計者によって予め設計できる範囲で ある。 [0069] ところが、知能化住宅 10において、ガスファンヒータ 15が他の機器からのセンサ信 号も取得できるようになると、ガスファンヒータ 15の燃焼動作によって、多くのセンサ の出力値が変化することを認識できる。例えば、湿度センサの出力値が上昇すること が認識できたとすると、これによつて、ガスファンヒータ 15は、本来の目的である温度 の制御以外にも、湿度の制御も実行可能ということが分かる。ガスファンヒータ 15の動 作と湿度センサ値の変化との関係を表す予測モデルが作成されると、「湿度を上げる 」という要求に対して、ガスファンヒータ 15の燃焼 ONという動作も選択肢として増える ことになる。このように、機器同士がネットワークで接続された構成では、当初想定し 得な力つたような予測モデルも作成できるので、ユーザの要求に対してより柔軟な応 答が可能になる。
[0070] また、新 ヽセンサや機器が追加されたときや、既に接続されて!ヽる機器やセンサ が外されたり交換されたりしたときなど、システムが有する機器やセンサの構成が変 更された場合には、図 11のように動作すればよい。すなわち、上述したステップ S1 および S2と同様の処理を実行した上で、ステップ S2の処理結果から、新たなモデル が必要カゝ否かを判断する(S61)。この判断は、ある動作に対して、既に特定されてい るセンサ以外に、出力値が影響を受けたセンサが存在する力否かを確認することに よって、行うことができる。そして、必要と判断したときは、新たなモデルを学習によつ て作成する(S62)。これにより、機器やセンサの構成が変更されたときでも、すで〖こ 作成済みの予測モデルで十分である場合には、モデル作成処理を行わずに済み、 処理量が軽減される。
[0071] また、図 11に示すようなモデルィ匕の処理は、新 、機器やセンサが追加されたとき 以外にも、外部環境の変化が大きいときにも行われるとよい。例えば、気温や湿度の 環境に大きな影響を及ぼす外部環境の変化としては、季節の違いによる気温や湿度 の変化や、一日のうちの気温や湿度の変動などが考えられる。例えば、窓を開けた 場合の温度や湿度の変化は季節によって正反対になると考えられるし、照明器具と 明るさのセンサとの関係も外の明るさの影響を強く受けると考えられる。
[0072] 一部の変動に対しては、外気温のセンサなどもネットワークに組み込むことで対応 が可能であると考えられるし、また大きな季節の変動に対しては、モデルの切換え等 も有効である。この場合は、複数のモデルセットを記憶する部分を準備して、季節に 応じてモデルセットを切り替えることで、最初力 の再学習を行うことなく対応が可能 になる。
[0073] (第 2の実施形態)
本発明の第 2の実施形態では、図 4のフローにおけるステップ S5において、学習し た予測モデルを基にして動作を決定する際に、目標センサの出力値の将来変化を 加味することを特徴とする。
[0074] 図 12は本実施形態に係るエージェント 20Aの構成図である。図 12において、図 1 と共通の構成要素には同一の符号を付しており、ここではその詳細な説明を省略す る。図 1の構成との相違は、機器の動作以外の要因による目標センサの出力値の将 来変化を予測する環境予測部 28を有する点である。
[0075] 実際のシステムでは、動作を決定するために、外的要因の予測も必要になる場合 がある。例えば、上述の知能化住宅 10の例では、ガスファンヒータ 15を動作させるこ とによって温度センサの出力値は変化するが、温度センサの出力値はそれ以外の外 的要因によっても、具体的には例えば、外気温変化やエアコン等の他の機器の動作 によって、影響を受ける。これらの要因によるセンサの出力値の将来変化が予測され ていれば、より適切な動作を決定することができる。
[0076] 例えば、温度の上昇を目的とする場合に、環境予測部 28が、調理器具 13が現在 使用中であることを認識して、室内の気温が上昇するであろうことを予測しているとき は、動作結果予測部 30によってガスファンヒータ 15の燃焼動作が決定されたとしても 、動作決定部 27Aがその動作を控える、といった制御も可能になる。
[0077] このように、環境予測部 28を設けることによって、目標センサの出力値の将来変化 をカロ味することができるので、より適した動作を決定することができる。
[0078] (第 3の実施形態)
上述の実施形態では、知能化住宅における利用を例にとって説明を行ったが、本 発明はそれ以外の用途にも適用可能であり、例えば、家庭用ロボットの行動モデル の作成にも応用することができる。
[0079] 一般的な家庭用ロボットは、入力センサとして、映像入力のための視覚センサ、音 声入力のための聴覚センサ、ユーザからのロボットへの直接の接触を検出するため の触覚センサやスィッチ、距離や障害物を検出するための超音波センサ、各関節の 角度を検出するエンコーダ、重心の移動を検出するセンサなどを備えている。また行 動のためのァクチユエータとして、移動用の脚やタイヤ、物を動かすためのハンド、見 る方向やうなずきなどを表現するための頭部周り、顔の表情を作るためのモータゃラ イト、ユーザに話しかけるためのスピーカなどを備えている。特に多機能な家庭用口 ボットに関しては、入力のためのセンサや出力のためのァクチユエータがそれぞれ数 十個以上も搭載されており、その個数は今後ますます増加することが予想される。
[0080] このような家庭用ロボットにおいて、従来のように入出力を固定し、予測モデルを学 習しょうとすると、学習が必ずしも収束しないという問題が生じる。
[0081] そこで、家庭用ロボットの制御においても、各出力(ァクチユエータによる動作)に対 して影響のあるセンサ信号のみを選択し、選択したセンサ信号を用いて予測モデル を作成することが望ましい。
[0082] 例えば、右手のァクチユエータに対して動作を指示したとき、右手にあるエンコーダ の信号はその動作に応じて変化するが、左手や脚部のエンコーダ力ものセンサ信号 は変化しな 、し、また聴覚センサや超音波センサの信号も変化しな 、と考えられる。 この点に着目し、本実施形態では、過去の動作とセンサ出力値の変化との関係から 、右手のァクチユエータの動作については、右手のエンコーダの信号のみを用いて モデルを作成する。
[0083] ここでは簡単のために分力りやすい例を挙げた力 他にも、前進という動作と視覚 センサ、スピーカからの合成音声の出力とユーザの反応のセンシングなど、ロボットは 、ァクチユエータとセンサとの間の無数の因果関係に包まれていると言える。本実施 形態によると、これらの因果関係を過去の動作とセンサ出力値の変化との関係力 抽 出して、コンパクトでかつ精度の良い予測モデルを学習によって作成することができ るので、より適切な動作決定を行うことができる。
[0084] <シミュレーション >
本願発明者らは、図 1に示すような知能化住宅を想定して、機器動作に関係するセ ンサを特定するためのシミュレーションを実行した。知能化住宅では、各機器やセン サがネットワークで接続されて 、るため、各機器の動作やセンサの動作状態は把握 できるものとする。各機器が様々に動作をすることによって、センサ値も様々な影響を 受ける。この中で、どの機器とどのセンサとが関係するかを特定する。
[0085] 図 13は本シミュレーションにおいて想定した機器、機器動作およびセンサの種類を 示す図である。図 13に示すように、機器としては、知能化住宅における温度や湿度 に関連する機器として、エアコン (冷房)、 IH調理器、ガスファンヒータ、加湿器および 除湿機の 5種類を想定した。また、機器動作として、各機器の ONZOFFに加えて、 状態の変化となる、人の有無および窓の開閉を含めて、 7種類を想定した。センサと しては、各機器に搭載されていると想定される 8種類のセンサを想定した。
[0086] 図 14は本シミュレーションにおいて設定した機器動作とセンサとの関係を示す図で ある。図 14において、機器動作側力もセンサ側に 2種類の矢印が出ており、実線の 矢印は増加の影響を示し、点線の矢印は減少の影響を示す。センサには、湿度と温 度を計測するものが複数含まれているため、機器動作とセンサとの関係も重複してい る。なお、本シミュレーションでは、センサ値そのものではなぐセンサ値が増加傾向 にある力、減少傾向にあるかを学習の対象にした。これによつて、モデルが簡略にで きるが、センサ値そのものを学習の対象としてもよい。
[0087] シミュレーションの目的は、このような設定において、各機器動作と各センサのセン サ値の変動との関係性を抽出することである。
[0088] 図 15は図 13および図 14の設定において、機器の動作とセンサ値との関係をシミュ レートした結果を示すグラフである。図 15 (a)は各機器動作の時系列変化である。こ こでは、各機器動作が様々な機器操作によって様々に組み合わさって実行される状 況を再現するために、ランダムに選択した機器をランダムに ON/OFFする操作を 1 00回にわたり繰り返し実行した。また図 15 (b)は図 15 (b)の各機器動作の時系列変 ィ匕に対応したセンサ値の時系列変化である。なお、図 15 (b)では、 8種類のセンサの うち、エアコンの湿度センサ、エアコンの温度センサ、および人センサのみを示してい る。湿度センサおよび温度センサについては、センサ値に変化がないときは 0、セン サ値が増加したときは + 1、センサ値が減少したときは 1の値を取っている。人セン サは、人がいるときは 1、人がいないときは 0の値を取っている。 [0089] 図 15をみると分力るように、各機器動作の時系列変化に対応して、センサ値も変動 している。図 15のグラフは、図 14の関係性に基づいてランダムな操作系列を与えた 場合に得られたものであるが、実際の知能化住宅においても、複数の機器の動作状 態に応じてそれぞれのセンサ値は増加したり減少したりすることが想定される。したが つて、知能化住宅の制御システムにおいて、図 15と同様の時系列データが得られる と考えて、問題ない。
[0090] 図 16は図 15のデータから、各機器動作とセンサ値の変化とについて、相関を取つ た結果である。図 16では、 ±0. 2を閾値にして、正の相関がある組合せ、負の相関 がある組合せ、相関がない組合せを、分類して示している。図 16から例えば、ェアコ ンの ONによって、エアコンの温度センサ、 IH調理器の温度センサ、室内の温度セン サ、およびガスファンヒータの温度センサの値は減少する、という関係性が見いだせ る。この場合、エアコンと、これら 4個のセンサのみを抽出して学習することによって、 関係のモデルが記述できる。また、加湿器の ONによって、エアコンの湿度センサ、 加湿器の湿度センサ、および除湿器の湿度センサの値が増加することが分力るので 、この場合も、エアコンと同様、これら 3個のセンサのみを抽出して、モデル化すれば よい。
[0091] このように、各機器動作と関係のあるセンサが特定された後は、図 6 (a)のような-ュ 一ラルネットワーク、図 6 (b)のような IF— THENルール、図 7のようなテーブルなど、 関係性を表現する各種の手法を用いることが可能になる。
[0092] また、機器動作と関係のあるセンサの特定を、実行する場合と実行しな!、場合とに ついて、計算時間の比較を行った。すなわち、ニューラルネットワークを用いた学習 を例にとって、図 16のような相関計算によって機器動作とセンサとの関係を求めた後 に学習する場合と、相関計算を行わずに図 15のデータから直接学習する場合とで、 計算時間を比較した。ニューラルネットワークとしては 3層の階層型を用い、学習法は ノ ックプロパゲーション法を採用し、計算終了条件としては、 50000回の学習または 平均二乗誤差が 10— 5以下と設定した。
[0093] この結果、相関計算を行った場合は、 372回の学習で学習完了となったのに対し て、相関計算を行わずに学習を行った場合は、 50000回の計算を行っても誤差が十 分に減少せず、学習が完了しな力つた。
[0094] このことは、機器動作と関係のあるセンサを特定することなぐ機器とセンサとの関係 を時系列データ力 そのまま学習する場合、機器やセンサがたとえ 7— 8個程度であ つても、学習が十分に困難である、ということを示している。機器やセンサの個数がさ らに増えた場合は、もちろん学習は実質的に不可能になる。従来は、この学習の困 難さのために、設計者が事前に機器とセンサとの関係性をルール等の形で与えるよ うにしていたが、上述したように、機器の追加や機器構成の変化には対応できない。 これに対して、本発明のように、機器動作と関係のあるセンサを特定した上で学習を 行う場合には、学習は容易に実行できるし、図 6および図 7のような簡潔な表現も使 用可能になる。さらに、機器の追加や機器構成の変化にも、対応できる。
[0095] なお、今回のシミュレーションでは、各機器が持つセンサは主に温度センサと湿度 センサであり、それらは一様に機器動作の影響を受けるものと設定したが、実際には 各センサの設置場所は異なっている、例えばエアコンの温度センサは天井近くに設 置されており、ガスファンヒータの温度センサは床面近くに、 IH調理器の温度センサ はキッチンに、という具合である。当然、各機器動作がセンサに与える影響も一様で はなぐそれぞれ違った強さで影響を受けることが予想される。本発明によると、この ような場合でも、事前には想定できないような関係性が発見できるの、効率のよいモ デル学習が可能になると考えられる。
[0096] 例えば、温度や湿度に関係しな!ヽ機器群も接続された知能化住宅にお!ヽて、ブラ ズマディスプレイ(PDP)等の映像デバイスの電源が ONの場合に、温度センサのセ ンサ値が上昇する、というような関係性が検出される可能性がある。この場合は例え ば、 PDPの電源が ONになった場合は、他の温度に影響を与える機器動作、例えば ファンヒーターの出力を低下させるなどの制御によって、所望の室内温度に保つこと ができる。
[0097] また、例えば近年家庭に導入が進んで!/、る生ごみ処理機などに、生ごみ検出のた めのにおいセンサが搭載されている場合がある。知能化住宅において、このにおい センサがネットワークに接続されている場合、他の機器の動作、例えば石油ファンヒ 一ターの OFF時には、においセンサのセンサ値が上昇する、というような関係性が検 出され、モデルとして学習される可能性がある。このモデルから、石油ファンヒーター OFFの場合はにお!/、センサの値が所定範囲を超えることが想定されるので、この場 合は、すでに獲得済である、窓を開ける動作とにおいセンサのセンサ値減少とののモ デルが起動され、窓を開ける、という制御を、自動的に実現することができる。
[0098] さらに、例えば空気清浄機が知能化住宅のネットワークに追加された場合、新種の センサである花粉センサがネットワークに追加されることも予想される。花粉センサの 追カロにより、すでに設置されている各機器の動作と花粉センサとの関係性を、新たに 検出することができる。これにより、例えば、においセンサの値を所定範囲にするため に、窓を開けるという制御が実行されていたところ、窓を開けると花粉センサ値が上昇 するという関係が新たに検出されたため、窓を開ける代わりに、空気清浄機を動作さ せる、という制御が選択されるようになる。
[0099] 本発明に対して、事前にルールを設定する従来手法では、 PDPと室温との関係の ような想定が困難な関係性の検出や、石油ファンヒーター OFFと生ごみ処理機のに おいセンサとの関係のような、事前には想定されていな力つた新たな種類のセンサが 加わった場合における、新たな関係性の検出はできな 、。
[0100] 機器をネットワークで接続する場合には、後カゝら機器を購入したり、後から新たな機 器が発売されたりと、機器群の構成はネットワークの処理体系を設定した時点では想 定が困難なほど変化していくものと考えられる。このような場合に、本発明のような、 機器動作とセンサ値との関係性を自律的に発見してモデルィ匕する手法は、特に有効 であると考えられる。
産業上の利用可能性
[0101] 本発明では、事前に入出力を設計しなくても、動作とセンサ出力との関係力 必要 なセンサのみを特定して、自律的に予測モデルを作成できるため、特に、多くの入出 力を持つシステムや、構成の変化が多いシステムに対して有効である。具体的には 例えば、知能化住宅における家電ネットワーク、多数の入出力を持つ自律型のロボッ ト等に有効である。また、多数のセンサが接続されたセンサネットワークに対するァク チユエータの動作モデルを作成する際にも、応用可能である。

Claims

請求の範囲
[1] 少なくとも 1つの機器と、複数のセンサとを有するシステムにおいて、前記機器の制 御を行う方法であって、
前記機器の動作を、その動作時における前記各センサの出力値の変化とともに、 記憶部に記録する第 1のステップと、
前記記憶部に記録されたデータから、前記動作によって、出力値が影響を受けた センサを特定する第 2のステップと、
前記動作と、当該動作について前記第 2のステップにおいて特定されたセンサとの 関係を表す予測モデルを、前記記憶部に記録されたデータから、学習によって作成 する第 3のステップと、
目標状態を規定する目標センサと、その出力の目標値とを受ける第 4のステップと、 前記第 3のステップにおいて作成された予測モデルの中から前記目標センサを含 むものを選択し、選択されたモデルを基にして、前記目標センサの出力が前記目標 値になるような動作を決定する第 5のステップとを備えた
ことを特徴とする機器制御方法。
[2] 請求項 1において、
前記システムが有する機器およびセンサの構成が変更されたとき、
前記第 1および第 2のステップを、実行し、かつ、
前記第 2のステップの処理結果から、新たな予測モデルが必要か否かを判断し、必 要と判断したとき、新たな予測モデルを学習によって作成する
ことを特徴とする機器制御方法。
[3] 請求項 1において、
前記第 2のステップにおけるセンサの特定を、動作と、センサの出力値の変化との 相関を求めることによって、行う
ことを特徴とする機器制御方法。
[4] 請求項 1において、
前記第 2のステップにおけるセンサの特定を、ニューラルネットワークを用いて、行う ことを特徴とする機器制御方法。
[5] 請求項 1において、
前記第 5のステップは、
前記目標センサの出力値の将来変化を加味して、動作の決定を行う
ことを特徴とする機器制御方法。
[6] 少なくとも 1つの機器と、複数のセンサとを有するシステムにおいて、前記機器の制 御を行う装置であって、
前記機器の動作を、その動作時における前記各センサの出力値の変化とともに、 記憶する記憶部と、
前記記憶部に記録されたデータから、前記動作によって、出力値が影響を受けた センサを特定するセンサ特定部と、
前記動作と、当該動作について前記センサ特定部によって特定されたセンサとの 関係を表す予測モデルを、前記記憶部に記録されたデータから、学習によって作成 するモデル作成部と、
目標状態を規定する目標センサと、その出力の目標値とを受け、前記モデル作成 部によって作成された予測モデルの中から、前記目標センサを含むものを選択する モデル選択部と、
前記モデル選択部によって選択されたモデルを基にして、前記目標センサの出力 が前記目標値になるような動作を決定する動作決定部とを備えた
ことを特徴とする機器制御装置。
[7] 請求項 6において、
前記機器のうちのいずれか 1つに、含まれている
ことを特徴とする機器制御装置。
PCT/JP2005/003020 2004-02-27 2005-02-24 機器制御方法および機器制御装置 WO2005083531A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006510446A JP3954087B2 (ja) 2004-02-27 2005-02-24 機器制御方法および機器制御装置
US11/448,341 US20060229739A1 (en) 2004-02-27 2006-06-07 Device control method and device control system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-054155 2004-02-27
JP2004054155 2004-02-27

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/448,341 Continuation US20060229739A1 (en) 2004-02-27 2006-06-07 Device control method and device control system

Publications (1)

Publication Number Publication Date
WO2005083531A1 true WO2005083531A1 (ja) 2005-09-09

Family

ID=34908784

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/003020 WO2005083531A1 (ja) 2004-02-27 2005-02-24 機器制御方法および機器制御装置

Country Status (3)

Country Link
US (1) US20060229739A1 (ja)
JP (1) JP3954087B2 (ja)
WO (1) WO2005083531A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008072430A (ja) * 2006-09-14 2008-03-27 Hitachi Ltd センサノードに接続されるセンサネットサーバ
JP2012221504A (ja) * 2011-04-08 2012-11-12 Fujitsu Ltd 外部情報に基づいた装置の挙動の調整
CN102799165A (zh) * 2012-08-19 2012-11-28 吉首大学 一种家庭用电、用气安全节能监控终端
CN102830687A (zh) * 2012-09-24 2012-12-19 杨炙龙 一种智能家居控制系统和方法
WO2016047118A1 (ja) * 2014-09-26 2016-03-31 日本電気株式会社 モデル評価装置、モデル評価方法、及び、プログラム記録媒体
WO2016051477A1 (ja) * 2014-09-29 2016-04-07 株式会社日立製作所 建物空調改善支援サービスシステム及び方法
JP2018140518A (ja) * 2017-02-27 2018-09-13 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成方法
JP2020161167A (ja) * 2017-03-21 2020-10-01 株式会社Preferred Networks サーバ装置、学習済モデル提供プログラム、学習済モデル提供方法及び学習済モデル提供システム

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7412842B2 (en) 2004-04-27 2008-08-19 Emerson Climate Technologies, Inc. Compressor diagnostic and protection system
US7275377B2 (en) 2004-08-11 2007-10-02 Lawrence Kates Method and apparatus for monitoring refrigerant-cycle systems
US8590325B2 (en) 2006-07-19 2013-11-26 Emerson Climate Technologies, Inc. Protection and diagnostic module for a refrigeration system
US20080216494A1 (en) 2006-09-07 2008-09-11 Pham Hung M Compressor data module
NZ554258A (en) * 2007-03-29 2009-01-31 Khipu Systems Ltd Predictive model implementation system and methodology
US20090037142A1 (en) 2007-07-30 2009-02-05 Lawrence Kates Portable method and apparatus for monitoring refrigerant-cycle systems
US8393169B2 (en) 2007-09-19 2013-03-12 Emerson Climate Technologies, Inc. Refrigeration monitoring system and method
US9140728B2 (en) 2007-11-02 2015-09-22 Emerson Climate Technologies, Inc. Compressor sensor module
KR20100048127A (ko) * 2008-10-30 2010-05-11 한국전자통신연구원 사용자 서비스 이용 패턴 모델링 장치 및 방법
CN101777362B (zh) * 2009-01-13 2013-05-08 鸿富锦精密工业(深圳)有限公司 自动播放媒体的系统及方法
US8660970B1 (en) * 2009-04-23 2014-02-25 The Boeing Company Passive learning and autonomously interactive system for leveraging user knowledge in networked environments
US20110112814A1 (en) * 2009-11-11 2011-05-12 Emerson Retail Services, Inc. Refrigerant leak detection system and method
US9015093B1 (en) 2010-10-26 2015-04-21 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US8775341B1 (en) 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US9285802B2 (en) 2011-02-28 2016-03-15 Emerson Electric Co. Residential solutions HVAC monitoring and diagnosis
JP5908676B2 (ja) * 2011-03-30 2016-04-26 ソニー株式会社 制御装置、制御方法、プログラムおよびシステム
US8964338B2 (en) 2012-01-11 2015-02-24 Emerson Climate Technologies, Inc. System and method for compressor motor protection
US9310439B2 (en) 2012-09-25 2016-04-12 Emerson Climate Technologies, Inc. Compressor having a control and diagnostic module
US9634899B2 (en) * 2012-09-28 2017-04-25 Panasonic Intellectual Property Management Co., Ltd. Function update method and function update system
US9803902B2 (en) 2013-03-15 2017-10-31 Emerson Climate Technologies, Inc. System for refrigerant charge verification using two condenser coil temperatures
US9551504B2 (en) 2013-03-15 2017-01-24 Emerson Electric Co. HVAC system remote monitoring and diagnosis
CN105074344B (zh) 2013-03-15 2018-02-23 艾默生电气公司 Hvac系统远程监测和诊断
EP2981772B1 (en) 2013-04-05 2022-01-12 Emerson Climate Technologies, Inc. Heat-pump system with refrigerant charge diagnostics
CN104102181B (zh) * 2013-04-10 2017-04-19 海尔集团公司 智能家居控制方法、装置及系统
US9679491B2 (en) 2013-05-24 2017-06-13 Qualcomm Incorporated Signaling device for teaching learning devices
US9747554B2 (en) * 2013-05-24 2017-08-29 Qualcomm Incorporated Learning device with continuous configuration capability
US9989942B2 (en) 2013-12-30 2018-06-05 Qualcomm Incorporated Preemptively triggering a device action in an Internet of Things (IoT) environment based on a motion-based prediction of a user initiating the device action
FI125053B (fi) * 2014-01-10 2015-05-15 Innohome Oy Menetelmä ja laite lieden turvallisen käytön valvomiseksi
EP3067763B1 (en) * 2015-03-11 2022-06-29 Siemens Aktiengesellschaft Assignment of sensors to machine parts
CN106647645A (zh) * 2015-11-02 2017-05-10 中兴通讯股份有限公司 一种家居控制调节的方法及系统
US20180284746A1 (en) 2016-05-09 2018-10-04 StrongForce IoT Portfolio 2016, LLC Methods and systems for data collection optimization in an industrial internet of things environment
US11327475B2 (en) 2016-05-09 2022-05-10 Strong Force Iot Portfolio 2016, Llc Methods and systems for intelligent collection and analysis of vehicle data
US11774944B2 (en) 2016-05-09 2023-10-03 Strong Force Iot Portfolio 2016, Llc Methods and systems for the industrial internet of things
KR102393418B1 (ko) * 2017-03-30 2022-05-03 삼성전자주식회사 데이터 학습 서버 및 이의 학습 모델 생성 및 이용 방법
US10921801B2 (en) 2017-08-02 2021-02-16 Strong Force loT Portfolio 2016, LLC Data collection systems and methods for updating sensed parameter groups based on pattern recognition
US10816693B2 (en) * 2017-11-21 2020-10-27 Reliance Core Consulting LLC Methods, systems, apparatuses and devices for facilitating motion analysis in a field of interest
JP2019100687A (ja) * 2017-12-08 2019-06-24 パナソニックIpマネジメント株式会社 空調制御方法及び空調制御装置
JP2022143520A (ja) * 2021-03-17 2022-10-03 株式会社東芝 情報処理装置、情報処理方法、情報処理システム及びコンピュータプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266410A (ja) * 1993-03-11 1994-09-22 Toshiba Corp ビジュアルフィードバック制御装置
JP2001519556A (ja) * 1997-10-06 2001-10-23 ジェネラル サイバーネーション グループ インコーポレイテッド モデルフリー適応プロセス制御
JP2002287804A (ja) * 2001-03-28 2002-10-04 Seiko Instruments Inc 規範モデル適応型制御システムおよび規範モデル適応型制御方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5082173A (en) * 1989-02-22 1992-01-21 Mcmaster University Environmental controller for a sealed structure
GB2278207B (en) * 1993-05-17 1996-05-15 Ea Tech Ltd Heating control apparatus
DE69800898T2 (de) * 1997-01-25 2002-04-04 Toshiba Kawasaki Kk Anpassungsregelgenerierungsverfahren, Anpassungsregelgenerierungsgerät, Anpassungssteuerungsverfahren, und Anpassungssteuerungsgerät
JP3996428B2 (ja) * 2001-12-25 2007-10-24 松下電器産業株式会社 異常検知装置及び異常検知システム
KR100701110B1 (ko) * 2002-03-28 2007-03-30 로버트쇼 컨트롤즈 캄파니 에너지 관리 시스템 및 방법
US7298871B2 (en) * 2002-06-07 2007-11-20 Koninklijke Philips Electronics N.V. System and method for adapting the ambience of a local environment according to the location and personal preferences of people in the local environment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266410A (ja) * 1993-03-11 1994-09-22 Toshiba Corp ビジュアルフィードバック制御装置
JP2001519556A (ja) * 1997-10-06 2001-10-23 ジェネラル サイバーネーション グループ インコーポレイテッド モデルフリー適応プロセス制御
JP2002287804A (ja) * 2001-03-28 2002-10-04 Seiko Instruments Inc 規範モデル適応型制御システムおよび規範モデル適応型制御方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008072430A (ja) * 2006-09-14 2008-03-27 Hitachi Ltd センサノードに接続されるセンサネットサーバ
JP2012221504A (ja) * 2011-04-08 2012-11-12 Fujitsu Ltd 外部情報に基づいた装置の挙動の調整
CN102799165A (zh) * 2012-08-19 2012-11-28 吉首大学 一种家庭用电、用气安全节能监控终端
CN102830687A (zh) * 2012-09-24 2012-12-19 杨炙龙 一种智能家居控制系统和方法
CN102830687B (zh) * 2012-09-24 2015-03-25 杨炙龙 一种智能家居控制系统和方法
WO2016047118A1 (ja) * 2014-09-26 2016-03-31 日本電気株式会社 モデル評価装置、モデル評価方法、及び、プログラム記録媒体
WO2016051477A1 (ja) * 2014-09-29 2016-04-07 株式会社日立製作所 建物空調改善支援サービスシステム及び方法
JP2018140518A (ja) * 2017-02-27 2018-09-13 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成方法
JP2020161167A (ja) * 2017-03-21 2020-10-01 株式会社Preferred Networks サーバ装置、学習済モデル提供プログラム、学習済モデル提供方法及び学習済モデル提供システム

Also Published As

Publication number Publication date
JPWO2005083531A1 (ja) 2008-01-17
JP3954087B2 (ja) 2007-08-08
US20060229739A1 (en) 2006-10-12

Similar Documents

Publication Publication Date Title
JP3954087B2 (ja) 機器制御方法および機器制御装置
KR102553299B1 (ko) 데이터 학습 서버 및 이의 학습 모델 생성 및 이용 방법
JP6807556B2 (ja) 空調制御方法、空調制御装置及び空調制御プログラム
CN110410964B (zh) 空调器的控制方法及控制系统
WO2022218014A1 (zh) 用于家电控制的方法、装置和家电
CN104133427A (zh) 智能家居控制方法及其系统
CN112558491A (zh) 基于语音识别的家庭场景联动智能家居系统及其控制方法、控制装置
CN110736225B (zh) 空调的控制方法和装置
CN108181837B (zh) 控制方法及控制装置
CN106556111A (zh) 家电控制方法、装置、服务器和空调器
CN106885332B (zh) 室内环境的调控方法、装置以及音箱
JP2020060318A (ja) ネットワークシステム、サーバ、および情報処理方法
Abdo-Allah et al. Modeling, analysis, and design of a fuzzy logic controller for an ahu in the sj carew building at memorial university
CN111043733B (zh) 基于空间布局特征的空调器送风模式控制方法及空调器
CN110873446B (zh) 控制空调的方法及装置、存储介质、处理器
CN112594753A (zh) 用于油烟机的控制方法、控制装置、油烟机及处理器
CN116466594A (zh) 一种基于5g物联网的智能家居控制系统
CN117128624A (zh) 新风空调及空调管理系统的控制方法、装置和存储介质
Scarcello et al. Pursuing energy saving and thermal comfort with a human-driven DRL approach
CN116358107A (zh) 一种基于预调控的温感空调权重关系计算方法
WO2021234763A1 (ja) 室内温度推定装置、プログラム及び室内温度推定方法
CN114322260A (zh) 空调自动驾驶、模型训练和预测方法、装置及设备
Flessner et al. Perception based method for indoor air quality control
Cook et al. Smart homes
Bernard et al. Sensor-based management of energy and thermal comfort

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

DPEN Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed from 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006510446

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 11448341

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 11448341

Country of ref document: US

122 Ep: pct application non-entry in european phase