JP2014099113A - Electric appliance network system - Google Patents
Electric appliance network system Download PDFInfo
- Publication number
- JP2014099113A JP2014099113A JP2012251659A JP2012251659A JP2014099113A JP 2014099113 A JP2014099113 A JP 2014099113A JP 2012251659 A JP2012251659 A JP 2012251659A JP 2012251659 A JP2012251659 A JP 2012251659A JP 2014099113 A JP2014099113 A JP 2014099113A
- Authority
- JP
- Japan
- Prior art keywords
- home appliance
- home
- home appliances
- agents
- appliances
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2807—Exchanging configuration information on appliance services in a home automation network
- H04L12/281—Exchanging configuration information on appliance services in a home automation network indicating a format for calling an appliance service function in a home automation network
Abstract
Description
本発明は、複数の家電機器とその複数の家電機器を制御するマスター機器とが通信ネットワークを介して接続されたものにおいて、マスター機器が前記複数の家電機器を学習制御する家電ネットワークシステムに関するものである。 The present invention relates to a home appliance network system in which a plurality of home appliances and a master device that controls the plurality of home appliances are connected via a communication network, and the master device learns and controls the plurality of home appliances. is there.
従来の家電ネットワークシステムとしては、特許文献1に示すように、複数のセンサが存在する知能化住宅において、少なくとも1つの家電機器と、当該家電機器の制御を行う機器制御装置(エージェント)とを有するものが考えられている。具体的に機器制御装置は、任意の家電機器の制御に関して、その家電機器と相関関係の大きいセンサを特定し、ニューラルネットを用いて、特定されたセンサに対する制御を学習し、任意の家電機器の制御を最適化するように構成されている。 As a conventional home appliance network system, as shown in Patent Document 1, an intelligent house having a plurality of sensors includes at least one home appliance and an appliance control device (agent) that controls the home appliance. Things are being considered. Specifically, the device control device identifies a sensor having a large correlation with the home appliance with respect to the control of an arbitrary home appliance, learns control of the specified sensor using a neural network, Configured to optimize control.
しかしながら、特許文献1の家電ネットワークシステムでは、最適な制御を行うために、任意の家電機器との相関関係が大きいセンサを特定して、そのセンサに対する家電機器の最適な動作を学習させるものであり、各家電機器に対して相関関係の大きいセンサを抽出する必要があり、その抽出に必要な時系列データの保存や演算処理が必要であり効率的ではない。 However, in the home appliance network system of Patent Document 1, in order to perform optimal control, a sensor having a large correlation with an arbitrary home appliance is specified, and the optimum operation of the home appliance with respect to the sensor is learned. Therefore, it is necessary to extract a sensor having a large correlation with respect to each home appliance, and it is not efficient because it requires time series data storage and calculation processing necessary for the extraction.
また、さまざまな家電機器が乱立する環境においては、複数の家電機器それぞれにおいて相関関係の大きいセンサを抽出することが難しい。さらに言えば、全てのセンサが少なからず各家電機器と相関関係を持っている可能性があるので、相関関係の大きいセンサを抽出して制御するだけででは、家電機器の最適な制御を行うことが難しいことや、特定のセンサに関する制御に偏る可能性がある。 Moreover, in an environment where various home appliances are prone, it is difficult to extract a sensor having a large correlation in each of the plurality of home appliances. Furthermore, there is a possibility that all the sensors have a lot of correlation with each home appliance, so it is necessary to extract and control a sensor with a large correlation to perform optimal control of the home appliance. May be difficult or may be biased to control related to a specific sensor.
さらに、前記機器制御装置は、単一のエージェントを構成して、任意の家電機器の制御を集中的に学習させているので、他の機器制御装置に家電機器単位でのモデルを移行することが難しく、また、フォールトトレラント性が悪いという問題がある。 Furthermore, the device control device constitutes a single agent and intensively learns the control of any home appliance, so that the model in units of home appliances can be transferred to another device control device. There is a problem that it is difficult and fault tolerant.
そこで本発明は、上記課題を解決すべくなされたものであり、複数の家電機器を自律的分散的に学習制御するとともに、センサの抽出に伴う不具合を解消して、複数の家電機器の最適制御を可能にするだけでなく、家電機器単位のモデルを他のマスター機器に対して移行容易にすることを所期課題とするものである。 Therefore, the present invention has been made to solve the above-described problems, and learns and controls a plurality of home appliances in an autonomous and distributed manner, solves problems associated with sensor extraction, and controls a plurality of home appliances optimally. In addition to making it possible to make a model of home appliances easy to migrate to other master devices, it is an intended task.
すなわち本発明に係る家電ネットワークシステムは、それぞれ標準化された任意のプロトコルを有する複数の家電機器に通信ネットワークを介して接続され、前記複数の家電機器を制御するマスター機器を有する家電ネットワークシステムであって、前記マスター機器が、前記複数の家電機器それぞれに対応する複数の家電機器エージェントと、前記複数の家電機器エージェントそれぞれに対して、前記複数の家電機器から得られる機器情報を入力して、前記複数の家電機器エージェントから得られる制御コマンドを前記複数の家電機器に出力し、その結果、前記複数の家電機器から得られる状態変化量により報酬を算出し、当該報酬をパラメータとして前記複数の家電機器エージェントの価値関数を更新するエージェント管理部とを有することを特徴とする。 That is, the home appliance network system according to the present invention is a home appliance network system having a master device connected to a plurality of home appliances each having an arbitrary standardized protocol via a communication network and controlling the plurality of home appliances. The master device inputs a plurality of home appliance agents corresponding to the plurality of home appliances and device information obtained from the plurality of home appliances for each of the plurality of home appliance agents. The control command obtained from the home appliance agent is output to the plurality of home appliances, and as a result, a reward is calculated from the amount of state change obtained from the plurality of home appliances, and the plurality of home appliance agents is used with the reward as a parameter. An agent management unit that updates the value function of And wherein the door.
このようなものであれば、マスター機器が複数の家電機器それぞれに対応する複数の家電機器エージェントを有しており、エージェント管理部が各家電機器エージェントに複数の家電機器から得られる機器情報を入力して制御コマンドを生成しているので、複数の家電機器を自律的分散的に学習制御するとともに、センサの抽出に伴う不具合を解消して、複数の家電機器の最適制御を可能にすることができる。
また、エージェント管理部が、複数の家電機器から得られる状態変化量により報酬を算出し、当該報酬をパラメータとして前記複数の家電機器エージェントの価値関数を更新しているので、未知の環境においても学習することができ最適な動作を各家電機器に行わせることができる。
さらに、マスター機器が、複数の家電機器それぞれに対応する複数の家電機器エージェントを有しているので、一部のエージェントを他のマスター機器に移動させることが比較的容易であり、また、フォールトトレラント性に優れている。
If this is the case, the master device has a plurality of home appliance agents corresponding to the plurality of home appliances, and the agent management unit inputs device information obtained from the plurality of home appliances to each home appliance agent. Control commands are generated, and learning control of multiple home appliances is performed autonomously and distributed, and problems associated with sensor extraction can be resolved to enable optimal control of multiple home appliances. it can.
In addition, since the agent management unit calculates a reward based on the amount of state change obtained from a plurality of home appliances, and updates the value function of the plurality of home appliance agents using the reward as a parameter, learning is also possible in an unknown environment. It is possible to make each home appliance perform an optimal operation.
Furthermore, since the master device has a plurality of home appliance agents corresponding to the plurality of home appliances, it is relatively easy to move some agents to other master devices, and it is fault tolerant. Excellent in properties.
前記複数の家電機器それぞれに対応する複数の家電機器エージェントを生成するエージェント生成部を有することが望ましい。これならば、通信ネットワークを介して接続される家電機器を増やしても、その家電機器に対応する家電機器エージェントを自動的に生成することができる。 It is desirable to have an agent generation unit that generates a plurality of home appliance agents corresponding to each of the plurality of home appliances. In this case, even if the number of home appliances connected through the communication network is increased, a home appliance agent corresponding to the home appliance can be automatically generated.
前記エージェント管理部が、前記複数の家電機器から得られる状態変化量として電力消費量差を用いて報酬を算出し、当該報酬をパラメータとして、前記複数の家電機器における電力消費量を最小化すべく前記複数の家電機器エージェントの価値関数を更新するものであることが望ましい。 The agent management unit calculates a reward using a difference in power consumption as a state change amount obtained from the plurality of home appliances, and uses the reward as a parameter to minimize power consumption in the plurality of home appliances. It is desirable to update the value functions of multiple home appliance agents.
前記マスター機器が、家電機器により構成されていることが望ましい。これならば、別途機器制御用の制御装置を用意する必要が無い。 It is desirable that the master device is composed of home appliances. In this case, it is not necessary to prepare a separate control device for device control.
また本発明に係る家電制御プログラムは、それぞれ標準化された任意のプロトコルを有する複数の家電機器に通信ネットワークを介して接続され、前記複数の家電機器を制御するマスター機器を有する家電ネットワークシステムに用いられる家電制御プログラムであって、前記複数の家電機器それぞれに対応する複数の家電機器エージェントと、前記複数の家電機器エージェントそれぞれに対して、前記複数の家電機器から得られる機器情報を入力して、前記複数の家電機器エージェントから得られる制御コマンドを前記複数の家電機器に出力し、その結果、前記複数の家電機器から得られる状態変化量により報酬を算出し、当該報酬をパラメータとして前記複数の家電機器エージェントの価値関数を更新するエージェント管理部と、として機能を前記マスター機器に備えさせることを特徴とする。 The home appliance control program according to the present invention is connected to a plurality of home appliances each having an arbitrary standardized protocol via a communication network, and is used in a home appliance network system having a master device that controls the plurality of home appliances. A home appliance control program, a plurality of home appliance agents corresponding to each of the plurality of home appliances, and each of the plurality of home appliance agents, inputting device information obtained from the plurality of home appliances, A control command obtained from a plurality of home appliance agents is output to the plurality of home appliances, and as a result, a reward is calculated based on the amount of state change obtained from the plurality of home appliances, and the plurality of home appliances using the reward as a parameter As an agent manager that updates the agent value function, Characterized in that equip the ability to the master device.
このように構成した本発明によれば、複数の家電機器を自律的分散的に学習制御するとともに、センサの抽出に伴う不具合を解消して、複数の家電機器の最適制御を可能にするだけでなく、家電機器単位のモデルを他のマスター機器に対して移行容易にすることができる。 According to the present invention configured as described above, the learning control of a plurality of home appliances is performed autonomously and distributed, and the problem associated with the extraction of the sensor is solved to enable the optimal control of the plurality of home appliances. In addition, it is possible to easily transfer a model of a home appliance unit to another master device.
以下に本発明に係る家電ネットワークシステムの一実施形態について図面を参照して説明する。 Hereinafter, an embodiment of a home appliance network system according to the present invention will be described with reference to the drawings.
本実施形態に係る家電ネットワークシステム100は、図1〜図3に示すように、複数の家電機器2a〜2eに通信ネットワークNTを介して接続され、前記複数の家電機器2a〜2eを制御するマスター機器3を有するものである。 As shown in FIGS. 1 to 3, the home appliance network system 100 according to the present embodiment is connected to a plurality of home appliances 2a to 2e via a communication network NT and controls the plurality of home appliances 2a to 2e. The device 3 is included.
複数の家電機器2a〜2eは、それぞれ標準化された任意のプロトコルを有するものであり、例えばEchonet、Zigbee又はUPnP等の通信プロトコルを有するものである。また、複数の家電機器2a〜2eとして本実施形態では、冷蔵庫2a、BD(Blu−ray Disc)レコーダ2b、エアコン2c、洗濯機2d、電子レンジ2e等である。その他、例えばテレビ、ファンヒータ、空気清浄機、照明装置等の家電機器を有していても良い。 Each of the plurality of home appliances 2a to 2e has a standardized arbitrary protocol, and has a communication protocol such as Echonet, Zigbee, or UPnP, for example. In the present embodiment, the home appliances 2a to 2e are a refrigerator 2a, a BD (Blu-ray Disc) recorder 2b, an air conditioner 2c, a washing machine 2d, a microwave oven 2e, and the like. In addition, you may have household appliances, such as a television, a fan heater, an air cleaner, and an illuminating device, for example.
マスター機器3は、通信ネットワークNTを介して接続される複数の家電機器2a〜2eとの間で通信可能とするため、図3に示すように、複数の家電機器2a〜2eそれぞれのプロトコルの制御機能(例えば、Echonet、Zigbee又はUPnP等)を有するものである。本実施形態のマスター機器3は、例えばテレビやレコーダ等の家電機器により構成されており、CPU、メモリ、通信インターフェース等を有するコンピュータである。そして、このマスター機器3は、前記メモリの所定領域に格納してあるプログラムに基づいてCPUやその周辺機器が作動することにより、図4に示すように、通信プロトコル受信部31、通信プロトコル送信部32、入力変換部33、出力変換部34、プロトコル解析部35、エージェント生成部36、エージェント管理部37等として機能する。 In order to enable the master device 3 to communicate with the plurality of home appliances 2a to 2e connected via the communication network NT, as shown in FIG. 3, control of the protocol of each of the plurality of home appliances 2a to 2e. It has a function (for example, Echonet, Zigbee or UPnP). The master device 3 according to the present embodiment is configured by home appliances such as a television and a recorder, and is a computer having a CPU, a memory, a communication interface, and the like. As shown in FIG. 4, the master device 3 operates as a CPU and its peripheral devices based on a program stored in a predetermined area of the memory. 32, an input conversion unit 33, an output conversion unit 34, a protocol analysis unit 35, an agent generation unit 36, an agent management unit 37, and the like.
通信プロトコル受信部31は、複数の家電機器2a〜2eそれぞれからの入力プロトコルXa〜Xeを受信するものであり、通信プロトコル送信部32は、複数の家電機器2a〜2eそれぞれに出力プロトコルYa〜Yeを送信するものである。 The communication protocol receiving unit 31 receives the input protocols Xa to Xe from each of the plurality of home appliances 2a to 2e, and the communication protocol transmission unit 32 outputs the output protocols Ya to Ye to each of the plurality of home appliances 2a to 2e. Is to send.
入力変換部33は、前記通信プロトコル受信部31により受信された入力プロトコルXa〜Xeをプロトコル解析部35を利用してエージェント入力値に変換するものであり、出力変換部34は、後述する制御コマンド等の出力値をプロトコル解析部35を利用して出力プロトコルYa〜Yeに変換して通信プロトコル送信部32に出力するものである。 The input conversion unit 33 converts the input protocols Xa to Xe received by the communication protocol reception unit 31 into an agent input value using the protocol analysis unit 35. The output conversion unit 34 is a control command described later. Are converted into output protocols Ya to Ye using the protocol analysis unit 35 and output to the communication protocol transmission unit 32.
プロトコル解析部35は、入力プロトコルXa〜Xeを解析してエージェント入力値X1a〜X1eに変換するとともに、制御コマンド等の出力値を解析して出力プロトコルYa〜Yeに変換するものである。 The protocol analysis unit 35 analyzes the input protocols Xa to Xe and converts them into agent input values X1a to X1e, and analyzes the output values of control commands and the like to convert them into output protocols Ya to Ye.
エージェント生成部36は、複数の家電機器2a〜2eそれぞれに対応する解析モデルである複数の家電機器エージェント30a〜30eをマスター機器3の内部メモリに設定された仮想空間内に生成するものである。 The agent generation unit 36 generates a plurality of home appliance agents 30a to 30e, which are analysis models corresponding to the plurality of home appliances 2a to 2e, in a virtual space set in the internal memory of the master device 3.
エージェント管理部37は、複数の家電機器エージェント30a〜30eそれぞれに対して、複数の家電機器2a〜2eから得られるそれらの機器情報(例えば状態変化量)を示すエージェント入力値X1a〜X1eを入力して(図5参照)、複数の家電機器エージェント30a〜30eから得られる制御コマンドY1a〜Y1eを複数の家電機器2a〜2eに出力し、その結果、複数の家電機器2a〜2eから得られる状態変化量により報酬を算出し、当該報酬をパラメータとして複数の家電機器エージェント30a〜30eの価値関数を更新するものである。このようにエージェント管理部37は、強化学習を用いて複数の家電機器2a〜2eを学習制御するものである。 The agent management unit 37 inputs agent input values X1a to X1e indicating those pieces of device information (for example, state change amounts) obtained from the plurality of home appliances 2a to 2e for each of the plurality of home appliance agents 30a to 30e. (See FIG. 5), control commands Y1a to Y1e obtained from the plurality of home appliance agents 30a to 30e are output to the plurality of home appliances 2a to 2e, and as a result, state changes obtained from the plurality of home appliances 2a to 2e. The reward is calculated by the amount, and the value functions of the plurality of home appliance agents 30a to 30e are updated using the reward as a parameter. Thus, the agent management part 37 carries out learning control of the some household appliances 2a-2e using reinforcement learning.
なお、強化学習の学習法の詳細(価値関数の詳細)については、連続的な状態空間及び行動空間に適用できる学習法が望ましい。 In addition, about the details of the learning method of reinforcement learning (details of a value function), the learning method applicable to continuous state space and action space is desirable.
また、エージェント管理部37は、複数の家電機器2a〜2eから得られる状態変化量として電力消費量差を用いて報酬を算出し、当該報酬をパラメータとして、複数の家電機器2a〜2eにおける電力消費量を最小化すべく複数の家電機器エージェント30a〜30eの価値関数を更新する。 In addition, the agent management unit 37 calculates a reward using a difference in power consumption as a state change amount obtained from the plurality of home appliances 2a to 2e, and uses the reward as a parameter to consume power in the plurality of home appliances 2a to 2e. The value functions of the plurality of home appliance agents 30a to 30e are updated to minimize the amount.
以下、マスター機器3による複数の家電機器2a〜2eの制御手順について特に図6を参照して説明する。 Hereinafter, the control procedure of the plurality of home appliances 2a to 2e by the master device 3 will be described with reference to FIG.
まず、マスター機器3の通信プロトコル受信部31は、スレーブ機器である複数の家電機器2a〜2eから入力プロトコルXa〜Xeを受信する(ステップS1、図2参照)。この通信プロトコル受信部31により受信された入力プロトコルXa〜Xeは、入力変換部33に送信される。 First, the communication protocol receiving unit 31 of the master device 3 receives the input protocols Xa to Xe from the plurality of home appliances 2a to 2e that are slave devices (see step S1, FIG. 2). The input protocols Xa to Xe received by the communication protocol receiver 31 are transmitted to the input converter 33.
そして、入力変換部33は、プロトコル解析部35を利用して、入力プロトコルXa〜Xeを解析してエージェント入力値X1a〜X1eを得る(ステップS2)。そして、入力変換部33は、このエージェント入力値X1a〜X1eが、家電機器2a〜2eのプロファイル情報であるか、機器の状態変化に関連する状態変化情報であるかを判断し(ステップS3)、家電機器2a〜2eのプロファイル情報であれば、入力変換部33は、前記エージェント入力値X1a〜X1eをエージェント生成部36へ送信する(ステップS4)。 Then, the input conversion unit 33 uses the protocol analysis unit 35 to analyze the input protocols Xa to Xe to obtain agent input values X1a to X1e (step S2). And the input conversion part 33 judges whether this agent input value X1a-X1e is the profile information of household appliances 2a-2e, or the state change information relevant to the state change of an apparatus (step S3), If it is the profile information of the household electrical appliances 2a to 2e, the input conversion unit 33 transmits the agent input values X1a to X1e to the agent generation unit 36 (step S4).
プロファイル情報を示すエージェント入力値X1a〜X1eを受信したエージェント生成部36は、そのプロファイル情報に基づいて家電機器2a〜2eの仮想モデルであるエージェント30a〜30eを新規で生成する(ステップS5)。なお、通信ネットワークNTを介してマスター機器3に複数の家電機器2a〜2eを接続すると、上記のようにして、エージェント生成部36が、複数の家電機器2a〜2eそれぞれに対応する複数の家電機器エージェント30a〜30eを自動的に生成する。また、マスター機器3に複数の家電機器2a〜2eを接続した後にユーザにより入力される制御開始信号を受信した後に行うようにしても良い。 The agent generation unit 36 that has received the agent input values X1a to X1e indicating the profile information newly generates agents 30a to 30e that are virtual models of the home appliances 2a to 2e based on the profile information (step S5). When a plurality of home appliances 2a to 2e are connected to the master device 3 via the communication network NT, as described above, the agent generation unit 36 has a plurality of home appliances corresponding to each of the plurality of home appliances 2a to 2e. Agents 30a-30e are automatically generated. Moreover, you may make it perform after receiving the control start signal input by the user after connecting the several household appliances 2a-2e to the master apparatus 3. FIG.
また、プロファイル情報を示すエージェント入力値X1a〜X1eを受信したエージェント生成部36は、すでにその家電機器2a〜2eのエージェント30a〜30eを生成している場合には、前記プロファイル情報に基づいて家電機器エージェント30a〜30eの情報を変更する(ステップS5)。 In addition, when the agent generation unit 36 that has received the agent input values X1a to X1e indicating the profile information has already generated the agents 30a to 30e of the home appliances 2a to 2e, the home appliance based on the profile information. Information on the agents 30a to 30e is changed (step S5).
このようにして全ての家電機器2a〜2eの家電機器エージェント30a〜30eが生成された後、複数の家電機器2a〜2eからの状態変化情報(入力プロトコルXa〜Xe)の入力待ち状態となる。 After the home appliance agents 30a to 30e of all the home appliances 2a to 2e are generated in this way, the input wait state of the state change information (input protocols Xa to Xe) from the plurality of home appliances 2a to 2e is entered.
一方で、前記入力変換部33により得られたエージェント入力値X1a〜X1eが状態変化情報であれば、入力変換部33は、エージェント入力値X1a〜X1eをエージェント管理部37に送信する(ステップS6)。 On the other hand, if the agent input values X1a to X1e obtained by the input conversion unit 33 are state change information, the input conversion unit 33 transmits the agent input values X1a to X1e to the agent management unit 37 (step S6). .
状態変化情報を示すエージェント入力値X1a〜X1eを受信したエージェント管理部37は、その状態変化情報(エージェント入力値)が、エージェント30a〜30eの任意の行動に対する最適化要素(本実施形態では電力消費量)と判断した場合(ステップS7)には、最適化要素をその目標値に近ければ近いほど大きくなるような数値として報酬値を決定し、この報酬値をエージェント30a〜30eに与えて、そのエージェント30a〜30eの評価関数を更新する(ステップS8)。 Upon receiving the agent input values X1a to X1e indicating the state change information, the agent management unit 37 receives the state change information (agent input value) as an optimization factor for any action of the agents 30a to 30e (in this embodiment, power consumption). (Step S7), the reward value is determined as a numerical value that becomes larger as the optimization element is closer to the target value, and this reward value is given to the agents 30a to 30e. The evaluation functions of the agents 30a to 30e are updated (step S8).
状態変化情報(エージェント入力値)がそれ以外の要素、つまり最適化要素(電力消費量)以外の要素である場合には、単純な状態変化として全ての家電機器エージェント30a〜30eに入力し、それぞれの家電機器エージェント30a〜30eの価値関数から最適行動(制御コマンドY1a〜Y1e)を得る(ステップS9)。そして、この最適行動(制御コマンドY1a〜Y1e)を出力変換部34へ送信する。 When the state change information (agent input value) is an element other than that, that is, an element other than the optimization element (power consumption), it is input to all the home appliance agents 30a to 30e as simple state changes, The optimal behavior (control commands Y1a to Y1e) is obtained from the value functions of the home appliance agents 30a to 30e (step S9). Then, the optimal behavior (control commands Y1a to Y1e) is transmitted to the output conversion unit 34.
最適行動(制御コマンドY1a〜Y1e)を受信した出力変換部34は、プロトコル解析部35を利用して、複数の家電機器2a〜2eそれぞれの最適行動を示す出力プロトコルYa〜Yeに変換して、通信プロトコル送信部32に送信する(ステップS10)。 The output conversion unit 34 that has received the optimal behavior (control commands Y1a to Y1e) uses the protocol analysis unit 35 to convert the output behaviors Ya to Ye indicating the optimal behavior of each of the plurality of home appliances 2a to 2e, It transmits to the communication protocol transmission part 32 (step S10).
この出力プロトコルYa〜Yeを受信した通信プロトコル送信部32は、複数の家電機器2a〜2eそれぞれに、対応する出力プロトコルYa〜Yeを送信する(ステップS11)。 The communication protocol transmitting unit 32 that has received the output protocols Ya to Ye transmits the corresponding output protocols Ya to Ye to each of the plurality of home appliances 2a to 2e (step S11).
次に、簡単なモデルとして、スレーブ機器である冷蔵庫2a及びエアコン2cをマスター機器3により制御される場合において、当該マスター機器3の学習制御の要部について図7〜図10を参照して説明する。 Next, as a simple model, when the refrigerator 2a and the air conditioner 2c, which are slave devices, are controlled by the master device 3, the main part of the learning control of the master device 3 will be described with reference to FIGS. .
スレーブ機器である冷蔵庫2aにおいて任意の状態変化(動作)が発生した場合、図8に示すように、当該状態変化がEchonetによりマスター機器3に送信される。この状態変化を受信したマスター機器3は、状態変化を示す状態変化情報を、冷蔵庫エージェント30aに入力するだけでなく、エアコンエージェント30cに入力する。 When an arbitrary state change (operation) occurs in the refrigerator 2a, which is a slave device, the state change is transmitted to the master device 3 by Echonet as shown in FIG. The master device 3 that has received the state change not only inputs state change information indicating the state change to the refrigerator agent 30a but also inputs it to the air conditioner agent 30c.
そうすると、図9に示すように、この状態変化情報が入力された冷蔵庫エージェント30a及びエアコンエージェント30cにより最適行動を示す制御コマンドが得られる。そして、マスター機器3は、冷蔵庫エージェント30aから得られた制御コマンドをEchonetにより冷蔵庫2aに送信して制御するとともに、エアコンエージェント30cから得られた制御コマンドをEchonetによりエアコン2cに送信して制御する。 Then, as shown in FIG. 9, the control command indicating the optimum action is obtained by the refrigerator agent 30a and the air conditioner agent 30c to which the state change information is input. The master device 3 controls the control command obtained from the refrigerator agent 30a by transmitting it to the refrigerator 2a by Echonet, and transmits the control command obtained from the air conditioner agent 30c to the air conditioner 2c by Echonet.
次に、図10に示すように、前記制御により冷蔵庫2aが動作した結果、その制御に基づく冷蔵庫2aの電力消費情報がEchonetによりマスター機器3に送信される。また、前記制御によりエアコン2cが動作した結果、その制御に基づくエアコン2cの電力消費情報がEchonetによりマスター機器3に送信される。これらの電力消費情報を取得したマスター機器3は、その電力消費情報から得られる電力消費量差を用いて報酬値を算出し、この報酬値をパラメータとして冷蔵庫2a及びエアコン2cの価値関数を更新する。これらの制御により、冷蔵庫2a及びエアコン2cを強化学習を用いて最適制御することができる。 Next, as shown in FIG. 10, as a result of the operation of the refrigerator 2a by the control, the power consumption information of the refrigerator 2a based on the control is transmitted to the master device 3 by Echonet. As a result of the operation of the air conditioner 2c by the control, the power consumption information of the air conditioner 2c based on the control is transmitted to the master device 3 by the echonet. The master device 3 that has acquired the power consumption information calculates a reward value using the difference in power consumption obtained from the power consumption information, and updates the value functions of the refrigerator 2a and the air conditioner 2c using the reward value as a parameter. . With these controls, the refrigerator 2a and the air conditioner 2c can be optimally controlled using reinforcement learning.
このように構成した本実施形態によれば、マスター機器3が複数の家電機器2a〜2eそれぞれに対応する複数の家電機器エージェント30a〜30eを有しており、エージェント管理部37が各家電機器エージェント30a〜30eに複数の家電機器2a〜2eから得られる機器情報を入力して制御コマンドを生成しているので、複数の家電機器2a〜2eを自律的分散的に学習制御するとともに、センサの抽出に伴う不具合を解消して、複数の家電機器2a〜2eの最適制御を可能にすることができる。 According to the present embodiment configured as described above, the master device 3 includes the plurality of home appliance agents 30a to 30e corresponding to the plurality of home appliances 2a to 2e, respectively, and the agent management unit 37 includes each home appliance agent. Since the control information is generated by inputting the device information obtained from the plurality of home appliances 2a to 2e to 30a to 30e, the plurality of home appliances 2a to 2e are learned and controlled autonomously and distributed, and the sensor is extracted. It is possible to eliminate the problems associated with the above and to enable optimum control of the plurality of home appliances 2a to 2e.
また、エージェント管理部37が、複数の家電機器2a〜2eから得られる状態変化量により報酬を算出し、当該報酬をパラメータとして前記複数の家電機器エージェント30a〜30eの価値関数を更新しているので、未知の環境においても学習することができ最適な動作を各家電機器2a〜2eに行わせることができる。 In addition, since the agent management unit 37 calculates a reward based on the state change amounts obtained from the plurality of home appliances 2a to 2e, and updates the value functions of the plurality of home appliance agents 30a to 30e using the reward as a parameter. The home appliances 2a to 2e can be learned in an unknown environment and can be operated optimally.
さらに、マスター機器3が、複数の家電機器2a〜2eそれぞれに対応する複数の家電機器エージェント30a〜30eを有しているので、一部のエージェントを他のマスター機器に移動させることが比較的容易であり、また、フォールトトレラント性に優れている。 Furthermore, since the master device 3 has a plurality of home appliance agents 30a to 30e corresponding to the plurality of home appliances 2a to 2e, it is relatively easy to move some agents to other master devices. Moreover, it is excellent in fault tolerant property.
その上、エージェント生成部36により接続された家電機器2a〜2eに対応する家電機器エージェント30a〜30eを生成するので、通信ネットワークNTを介して接続される家電機器を増やしても、その家電機器に対応する家電機器エージェント30a〜30eを自動的に生成することができる。 In addition, since the home appliance agents 30a to 30e corresponding to the home appliances 2a to 2e connected by the agent generation unit 36 are generated, even if the number of home appliances connected via the communication network NT is increased, Corresponding home appliance agents 30a-30e can be automatically generated.
加えて、マスター機器が、テレビやBDレコーダ等の家電機器により構成されているので、別途機器制御用の制御装置を用意する必要が無い。 In addition, since the master device is composed of home appliances such as a television and a BD recorder, it is not necessary to prepare a separate control device for device control.
なお、本発明は前記実施形態に限られるものではない。 The present invention is not limited to the above embodiment.
例えば、前記実施形態では、マスター機器3の内部メモリ内の仮想空間内に複数の家電機器エージェントを形成しているが、その他、複数のマスター機器に複数の家電機器エージェントを分散して形成するようにしても良い。これならば、フォールトトレラント性をより一層向上させることができる。 For example, in the embodiment, a plurality of home appliance agents are formed in the virtual space in the internal memory of the master device 3, but a plurality of home appliance agents are distributed and formed in a plurality of master devices. Anyway. If it is this, fault tolerant property can be improved further.
その他、本発明は前記実施形態に限られず、その趣旨を逸脱しない範囲で種々の変形が可能であるのは言うまでもない。 In addition, it goes without saying that the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present invention.
100・・・家電ネットワークシステム
2a〜2e・・・家電機器
3・・・マスター機器
30a〜30e・・・家電機器エージェント
31・・・通信プロトコル受信部
32・・・通信プロトコル送信部
33・・・入力変換部
34・・・出力変換部
35・・・プロトコル解析部
36・・・エージェント生成部
37・・・エージェント管理部
DESCRIPTION OF SYMBOLS 100 ... Home appliance network system 2a-2e ... Home appliance 3 ... Master apparatus 30a-30e ... Home appliance agent 31 ... Communication protocol receiver 32 ... Communication protocol transmitter 33 ... Input conversion unit 34 ... output conversion unit 35 ... protocol analysis unit 36 ... agent generation unit 37 ... agent management unit
Claims (5)
前記マスター機器が、
前記複数の家電機器それぞれに対応する複数の家電機器エージェントと、
前記複数の家電機器エージェントそれぞれに対して、前記複数の家電機器から得られる機器情報を入力して、前記複数の家電機器エージェントから得られる制御コマンドを前記複数の家電機器に出力し、その結果、前記複数の家電機器から得られる状態変化量により報酬を算出し、当該報酬をパラメータとして前記複数の家電機器エージェントの価値関数を更新するエージェント管理部と、を有する家電ネットワークシステム。 A home appliance network system having a master device connected to a plurality of home appliances each having an arbitrary standardized protocol via a communication network and controlling the plurality of home appliances,
The master device is
A plurality of home appliance agents corresponding to each of the plurality of home appliances;
For each of the plurality of home appliance agents, input device information obtained from the plurality of home appliances, and output a control command obtained from the plurality of home appliance agents to the plurality of home appliances, as a result, A home appliance network system comprising: an agent management unit that calculates a reward based on a state change amount obtained from the plurality of home appliances, and updates a value function of the plurality of home appliance agents using the reward as a parameter.
前記複数の家電機器それぞれに対応する複数の家電機器エージェントと、
前記複数の家電機器エージェントそれぞれに対して、前記複数の家電機器から得られる機器情報を入力して、前記複数の家電機器エージェントから得られる制御コマンドを前記複数の家電機器に出力し、その結果、前記複数の家電機器から得られる状態変化量により報酬を算出し、当該報酬をパラメータとして前記複数の家電機器エージェントの価値関数を更新するエージェント管理部と、として機能を前記マスター機器に備えさせることを特徴とする家電制御プログラム。 A home appliance control program used in a home appliance network system having a master device that is connected to a plurality of home appliances each having a standardized arbitrary protocol via a communication network and controls the plurality of home appliances,
A plurality of home appliance agents corresponding to each of the plurality of home appliances;
For each of the plurality of home appliance agents, input device information obtained from the plurality of home appliances, and output a control command obtained from the plurality of home appliance agents to the plurality of home appliances, as a result, A reward is calculated from the amount of state change obtained from the plurality of home appliances, and the master device is provided with a function as an agent management unit that updates the value function of the plurality of home appliance agents using the reward as a parameter. A featured home appliance control program.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012251659A JP2014099113A (en) | 2012-11-15 | 2012-11-15 | Electric appliance network system |
KR1020130096111A KR20140063392A (en) | 2012-11-15 | 2013-08-13 | Home network system |
US14/081,285 US20140135952A1 (en) | 2012-11-15 | 2013-11-15 | Home network system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012251659A JP2014099113A (en) | 2012-11-15 | 2012-11-15 | Electric appliance network system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014099113A true JP2014099113A (en) | 2014-05-29 |
Family
ID=50891401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012251659A Pending JP2014099113A (en) | 2012-11-15 | 2012-11-15 | Electric appliance network system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2014099113A (en) |
KR (1) | KR20140063392A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017159067A1 (en) | 2016-03-15 | 2017-09-21 | オムロン株式会社 | Information processing apparatus and agent system |
JP2019046422A (en) * | 2017-09-07 | 2019-03-22 | 株式会社日立製作所 | Learning control system and learning control method |
CN110030263A (en) * | 2019-04-16 | 2019-07-19 | 青岛大学 | The displacement sensor fault-tolerant control system and method for Active Magnetic Bearing |
US11372379B2 (en) | 2016-10-14 | 2022-06-28 | Hitachi, Ltd. | Computer system and control method |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102055141B1 (en) * | 2018-12-31 | 2019-12-12 | 한국기술교육대학교 산학협력단 | System for remote controlling of devices based on reinforcement learning |
KR102173579B1 (en) * | 2019-12-02 | 2020-11-03 | 한국기술교육대학교 산학협력단 | System and method for controlling multi devices through federated reinforcement learning |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0984146A (en) * | 1995-09-20 | 1997-03-28 | Toshiba Corp | Electric power managing system of electric appliance using network |
JP2001289485A (en) * | 2000-01-31 | 2001-10-19 | Mitsubishi Electric Corp | Composite system and its operating method |
WO2004068399A1 (en) * | 2003-01-31 | 2004-08-12 | Matsushita Electric Industrial Co. Ltd. | Predictive action decision device and action decision method |
-
2012
- 2012-11-15 JP JP2012251659A patent/JP2014099113A/en active Pending
-
2013
- 2013-08-13 KR KR1020130096111A patent/KR20140063392A/en not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0984146A (en) * | 1995-09-20 | 1997-03-28 | Toshiba Corp | Electric power managing system of electric appliance using network |
JP2001289485A (en) * | 2000-01-31 | 2001-10-19 | Mitsubishi Electric Corp | Composite system and its operating method |
WO2004068399A1 (en) * | 2003-01-31 | 2004-08-12 | Matsushita Electric Industrial Co. Ltd. | Predictive action decision device and action decision method |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017159067A1 (en) | 2016-03-15 | 2017-09-21 | オムロン株式会社 | Information processing apparatus and agent system |
US10924297B2 (en) | 2016-03-15 | 2021-02-16 | Omron Corporation | Agent system including an information processing device for executing an agent |
US11372379B2 (en) | 2016-10-14 | 2022-06-28 | Hitachi, Ltd. | Computer system and control method |
JP2019046422A (en) * | 2017-09-07 | 2019-03-22 | 株式会社日立製作所 | Learning control system and learning control method |
US10768583B2 (en) | 2017-09-07 | 2020-09-08 | Hitachi, Ltd. | Learning control system and learning control method |
CN110030263A (en) * | 2019-04-16 | 2019-07-19 | 青岛大学 | The displacement sensor fault-tolerant control system and method for Active Magnetic Bearing |
CN110030263B (en) * | 2019-04-16 | 2021-04-16 | 青岛大学 | Fault-tolerant control system and method for displacement sensor of active electromagnetic bearing |
Also Published As
Publication number | Publication date |
---|---|
KR20140063392A (en) | 2014-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140135952A1 (en) | Home network system | |
JP2014099113A (en) | Electric appliance network system | |
Khamphanchai et al. | Conceptual architecture of building energy management open source software (BEMOSS) | |
CN111262761B (en) | Electronic device and method for operating electronic device | |
CN105830462B (en) | Gateway, administrative center, remote access system and remote access method | |
CN104976402B (en) | System and method for control valve | |
JP2004342081A (en) | Controller, electric apparatus, control system, control method, and control program | |
CN102736526A (en) | Control apparatus, control method, program and system | |
JP6171173B2 (en) | Electrical equipment control system | |
US20140188299A1 (en) | Display device, display method, and program product | |
Debono et al. | Implementation of a home automation system through a central FPGA controller | |
CN110036620B (en) | Household appliance with network interface | |
Vastardis et al. | A user behaviour-driven smart-home gateway for energy management | |
Khamphanchai et al. | An agent-based open source platform for building energy management | |
CN106165947A (en) | A kind of Intelligent bracelet with universal remote control function | |
KR101408862B1 (en) | Apparatus for controlling temperature in real time using dual processor | |
EP3209026B1 (en) | Control processing method, electric device, and control processing program | |
EP2819349A1 (en) | Communication device, communication method, and management device | |
JP6320569B2 (en) | Home control device and home control system | |
CN114072745A (en) | Method for operating a household appliance and household appliance | |
Conte et al. | Building simulation/emulation environments for home automation systems | |
KR101738689B1 (en) | A network system | |
CN113835353B (en) | Linkage method, device and equipment for working modes between kitchen appliances | |
US20150113507A1 (en) | Method for automatic grouping of interlinked graphical configuration elements and computer program product | |
Cami et al. | Towards a unified approach for Distributed Measurement System technologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160914 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170307 |