JP6915371B2 - Control device, control program, learning data creation method, and learning method - Google Patents
Control device, control program, learning data creation method, and learning method Download PDFInfo
- Publication number
- JP6915371B2 JP6915371B2 JP2017096165A JP2017096165A JP6915371B2 JP 6915371 B2 JP6915371 B2 JP 6915371B2 JP 2017096165 A JP2017096165 A JP 2017096165A JP 2017096165 A JP2017096165 A JP 2017096165A JP 6915371 B2 JP6915371 B2 JP 6915371B2
- Authority
- JP
- Japan
- Prior art keywords
- control
- target device
- learner
- learning
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title description 60
- 238000013528 artificial neural network Methods 0.000 claims description 193
- 238000012545 processing Methods 0.000 claims description 67
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000013480 data collection Methods 0.000 description 56
- 210000002569 neuron Anatomy 0.000 description 54
- 230000006870 function Effects 0.000 description 25
- 230000008569 process Effects 0.000 description 20
- 238000012937 correction Methods 0.000 description 14
- 238000010801 machine learning Methods 0.000 description 11
- 238000010304 firing Methods 0.000 description 10
- 230000010365 information processing Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Feedback Control In General (AREA)
- Air Conditioning Control Device (AREA)
Description
本発明は、制御装置、制御プログラム、学習データ作成方法、及び学習方法に関する。 The present invention relates to a control device, a control program, a learning data creation method, and a learning method.
近年、所望の装置の動作を制御する機能の習得に、ディープラーニング等の機械学習が用いられることがある。例えば、特許文献1では、ニューラル装置を利用したインテリジェント住宅システムが提案されている。具体的には、特許文献1では、アイデンティティ情報、座標情報、及び使用者が過去に電子装置を調節した制御情報を用いて、使用者の慣用の操作状態に当該電子装置を調節制御する機能を習得する機械学習を行うシステムが提案されている。
In recent years, machine learning such as deep learning may be used to acquire a function of controlling the operation of a desired device. For example,
上記のとおり、機械学習を利用すれば、所望の装置の動作を制御する機能を習得したシステムを容易に構築することができる。しかしながら、本件発明者は、制御対象装置の動作を制御する機能を機械学習により習得したシステムでは、次のような問題点が発生し得ることを見出した。 As described above, by using machine learning, it is possible to easily construct a system that has acquired the function of controlling the operation of a desired device. However, the present inventor has found that the following problems may occur in a system in which the function of controlling the operation of the controlled device is acquired by machine learning.
すなわち、制御対象装置の動作を制御する機能を機械学習により習得した複数の異なる学習器を利用する場合に、1又は複数の制御対象装置に対する複数の制御の間で競合が発生する可能性がある。例えば、各使用者に応じて構築した学習器を利用して同一の制御対象装置を制御する場合に、異なる使用者の学習器から異なる動作を実行させる制御指令が発行されると、当該制御対象装置の制御に競合が発生してしまう。また、例えば、各制御対象装置に応じて構築した学習器を利用して複数の制御対象装置を同時に制御する場合に、同一の場所に移動させる等の同時に実現できない動作を実行させる制御指令が発行されると、当該複数の制御対象装置の制御に競合が発生してしまう。このような制御の競合が発生した場合に、従来のシステムでは、制御対象装置が動作不能に陥ってしまう可能性があるという問題点を本件発明者は見出した。 That is, when a plurality of different learners who have acquired the function of controlling the operation of the controlled object device by machine learning are used, a conflict may occur between a plurality of controls for one or a plurality of controlled devices. .. For example, when the same controlled object device is controlled by using the learner constructed for each user, when a control command for executing a different operation is issued from the learner of a different user, the controlled object is controlled. Conflicts occur in the control of the device. Further, for example, when controlling a plurality of controlled object devices at the same time by using a learner constructed according to each controlled object device, a control command is issued to execute an operation that cannot be realized at the same time, such as moving to the same place. If this is done, a conflict will occur in the control of the plurality of controlled devices. The present inventor has found that when such a control conflict occurs, the controlled device may become inoperable in the conventional system.
本発明は、一側面では、このような実情を鑑みてなされたものであり、その目的は、複数の制御の間で競合が発生しても、制御対象装置が動作不能に陥らないようにする技術を提供することである。 The present invention, on the one hand, has been made in view of such circumstances, and an object of the present invention is to prevent the controlled device from becoming inoperable even if a conflict occurs between a plurality of controls. To provide technology.
本発明は、上述した課題を解決するために、以下の構成を採用する。 The present invention employs the following configuration in order to solve the above-mentioned problems.
すなわち、本発明の一側面に係る制御装置は、第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される制御値に基づいて、当該第1の制御対象装置の動作を制御する第1の制御処理部と、第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される制御値に基づいて、当該第2の制御対象装置の動作を制御する第2の制御処理部と、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、前記第1の制御対象装置及び前記第2の制御対象装置の制御を修正することで、当該競合を解消する競合解消部と、を備える。
That is, the control device according to one aspect of the present invention is based on the control value output from the learned first learner that has learned to control the operation of the first control target device. To the control value output from the first control processing unit that controls the operation of the
当該構成では、第1の制御処理部が、第1の学習器を利用して、第1の制御対象装置の動作を制御する。また、第2の制御処理部が、第2の学習器を利用して、第2の制御対象装置の動作を制御する。そして、第1の制御対象装置の制御と第2の制御対象装置の制御との間に競合が発生する場合には、競合解消部が、第1の制御対象装置及び第2の制御対象装置の制御を修正することで、当該競合を解消する。したがって、当該構成によれば、複数の制御の間で競合が発生しても、制御対象装置が動作不能に陥らないようにすることができる。なお、第1の制御対象装置及び第2の制御対象装置は、同一の制御対象装置であってもよいし、互いに異なる制御対象装置であってもよい。また、制御対象装置は、制御対象となり得るあらゆる種類の装置を含んでよく、例えば、空調装置、ロボット装置等であってよい。 In this configuration, the first control processing unit uses the first learner to control the operation of the first controlled device. Further, the second control processing unit controls the operation of the second controlled target device by using the second learning device. Then, when a conflict occurs between the control of the first control target device and the control of the second control target device, the conflict resolution unit determines the first control target device and the second control target device. The conflict is resolved by modifying the control. Therefore, according to the configuration, even if a conflict occurs between a plurality of controls, the controlled device can be prevented from becoming inoperable. The first control target device and the second control target device may be the same control target device or may be different control target devices from each other. Further, the control target device may include any kind of device that can be a control target, and may be, for example, an air conditioner, a robot device, or the like.
上記一側面に係る制御装置において、前記競合解消部は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を出力するように学習を行った学習済みの第3の学習器を利用して、前記競合を解消してもよい。当該構成によれば、制御対象装置の制御が複雑に競合し得る場合であっても、当該制御対象装置に生じ得る競合を容易に解消することができる。 In the control device according to the one aspect, the conflict resolving unit has the control value of the first controlled device output from the first learning device and the second learning device output from the second learning device. When the control value of the control target device is input, learning is performed so as to output the control value of the first control target device and the control value of the second control target device modified so as to eliminate the conflict. The conflict may be resolved by using the learned third learner. According to this configuration, even when the control of the controlled target device may conflict in a complicated manner, the conflict that may occur in the controlled target device can be easily eliminated.
上記一側面に係る制御装置は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値に基づいて、前記第1の制御対象装置及び前記第2の制御対象装置の制御がどのように競合するかを示す競合種別情報を特定する競合種別特定部を更に備えてよく、前記競合解消部は、特定された前記競合種別情報を前記第3の学習器に更に入力してもよい。当該構成によれば、競合の仕方(種別)に応じて、適した競合の解消方法を採用するようにすることができる。 The control device according to the one aspect is a control value of the first control target device output from the first learner and a control value of the second control target device output from the second learner. Based on the above, a conflict type identification unit that specifies conflict type information indicating how the controls of the first control target device and the second control target device compete with each other may be further provided, and the conflict resolution unit may be further provided. May further input the identified competition type information into the third learner. According to this configuration, it is possible to adopt a suitable conflict resolution method according to the competition method (type).
上記一側面に係る制御装置において、前記競合種別特定部は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合種別情報に対応する出力値を出力するように学習を行った学習済みの第4の学習器を利用して、前記競合種別情報を特定してもよい。当該構成によれば、制御対象装置の制御が複雑に競合し得る場合であっても、当該制御対象装置に生じ得る競合の種別を容易に特定することができる。 In the control device according to the one aspect, the competition type identification unit is the control value of the first control target device output from the first learning device and the second learning device output from the second learning device. When the control value of the control target device of is input, the conflict type information is specified by using the learned fourth learner which has been trained to output the output value corresponding to the conflict type information. May be good. According to this configuration, even when the control of the controlled target device may conflict in a complicated manner, the type of conflict that may occur in the controlled target device can be easily specified.
上記一側面に係る制御装置において、前記第1、第2、第3及び第4の学習器はそれぞれニューラルネットワークにより構成されてよい。当該構成によれば、制御対象装置の制御に生じ得る競合を解消可能な制御装置を簡易に実現することができる。 In the control device according to the one aspect, the first, second, third, and fourth learners may each be configured by a neural network. According to this configuration, it is possible to easily realize a control device capable of resolving a conflict that may occur in the control of the controlled device.
上記一側面に係る制御装置において、前記競合解消部は、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御、及び前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御のいずれか一方を優先することで、前記競合を解消してもよい。当該構成によれば、第1の学習器から出力される制御値及び第2の学習器から出力される制御値のいずれか一方を優先し、他方を無視することで、制御対象装置の制御に生じる競合を確実に解消することができる。 In the control device according to the one aspect, the conflict resolving unit controls the first controlled device based on the control value output from the first learner, and outputs from the second learner. The conflict may be resolved by giving priority to either one of the controls of the second controlled target device based on the control value. According to this configuration, one of the control value output from the first learner and the control value output from the second learner is prioritized and the other is ignored to control the controlled device. It is possible to surely eliminate the conflict that occurs.
上記一側面に係る制御装置において、前記第1の制御対象装置と前記第2の制御対象装置とは同一の制御対象装置であってよく、前記競合解消部は、前記第1の学習器から出力される制御値と前記第2の学習器から出力される制御値とを平均化することで、前記競合を解消してもよい。当該構成によれば、第1の学習器から出力される制御値及び第2の学習器から出力される制御値の平均値を採用することで、制御対象装置の制御に生じる競合を解消することができる。 In the control device according to the one aspect, the first control target device and the second control target device may be the same control target device, and the conflict resolving unit outputs from the first learner. The conflict may be eliminated by averaging the control value to be output and the control value output from the second learner. According to this configuration, by adopting the average value of the control value output from the first learner and the control value output from the second learner, the conflict that occurs in the control of the controlled device can be eliminated. Can be done.
なお、上記各形態に係る制御装置の別の形態として、以上の各構成を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記録したコンピュータその他装置、機械等が読み取り可能な記憶媒体であってもよい。ここで、コンピュータ等が読み取り可能な記録媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。 As another form of the control device according to each of the above forms, an information processing method that realizes each of the above configurations may be used, a program may be used, or a computer or other device that records such a program. , A storage medium that can be read by a machine or the like. Here, the recording medium that can be read by a computer or the like is a medium that stores information such as a program by electrical, magnetic, optical, mechanical, or chemical action.
例えば、本発明の一側面に係る制御プログラムは、第1の制御対象装置及び第2の制御対象装置の動作を制御するコンピュータに、前記第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される前記第1の制御対象装置を制御するための制御値を取得するステップと、前記第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される前記第2の制御対象装置を制御するための制御値を取得するステップと、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、当該競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を取得するステップと、取得された前記制御値に基づいて前記第1の制御対象装置及び前記第2の制御対象装置を制御するステップと、を実行させるためのプログラムである。
For example, in the control program according to one aspect of the present invention, the computer that controls the operation of the first control target device and the second control target device learns to control the operation of the first control target device. The step of acquiring the control value for controlling the first controlled target device output from the learned first learned device and the learning for controlling the operation of the second controlled target device are performed. The step of acquiring the control value for controlling the second controlled target device output from the second learned device that has been learned, and the first step based on the control value output from the first learner. When the control of the
また、本発明の一側面に係る学習データ作成方法は、第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される当該第1の制御対象装置を制御するための制御値を取得するステップと、第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される当該第2の制御対象装置を制御するための制御値を取得するステップと、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合するか否かを判定するステップと、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、当該競合を解消するように前記第1の制御対象装置及び前記第2の制御対象装置の制御値の修正値を決定するステップと、前記第1の学習器から得られた制御値及び前記第2の学習器から得られた制御値を入力データとし、決定された前記修正値を教師データとして、学習器の学習を行うための学習データを作成するステップと、を備える。当該構成によれば、制御対象装置の制御に生じ得る競合の解消に利用する上記第3の学習器を構築するための学習データを収集することができる。 Further, the learning data creation method according to one aspect of the present invention is the first control target output from the learned first learner that has learned to control the operation of the first control target device. The second control target device output from the learned second learner that has been trained to control the operation of the second control target device and the step of acquiring the control value for controlling the device. To the step of acquiring the control value for controlling, the control of the first control target device based on the control value output from the first learner, and the control value output from the second learner. The step of determining whether or not the control of the second control target device based on the above conflicts, the control of the first control target device based on the control value output from the first learner, and the second control of the first control target device. When the control of the second control target device based on the control value output from the learning device of the above conflicts with the control of the second control target device, the first control target device and the second control target device so as to eliminate the conflict. The step of determining the correction value of the control value, the control value obtained from the first learning device and the control value obtained from the second learning device are used as input data, and the determined correction value is used as teacher data. As a step, it is provided with a step of creating learning data for learning the learner. According to this configuration, it is possible to collect learning data for constructing the third learning device used for resolving the conflict that may occur in the control of the controlled device.
上記一側面に係る学習データ作成方法において、前記修正値は、オペレータの入力により決定されてよい。制御対象装置が人の利用する装置である場合に、制御対象装置の制御に生じ得る競合の解消に利用する第3の学習器の構築に最適な学習データを作成することができる。 In the learning data creation method according to the above aspect, the correction value may be determined by the input of the operator. When the controlled target device is a device used by a person, it is possible to create optimal learning data for constructing a third learning device used for resolving a conflict that may occur in the control of the controlled target device.
上記一側面に係る学習データ作成方法において、前記修正値は、所定の規則に従って決定されてよい。当該構成によれば、第3の学習器の構築に利用する学習データを簡易に作成することができる。 In the learning data creation method according to the above aspect, the modified value may be determined according to a predetermined rule. According to this configuration, learning data used for constructing the third learning device can be easily created.
また、本発明の一側面に係る学習方法は、上記いずれかの形態に係る学習データ作成方法により作成した前記学習データを取得するステップと、取得した前記学習データにより学習器の学習を行うステップと、を備える。当該構成によれば、制御対象装置の制御に生じ得る競合の解消に利用する上記第3の学習器を構築することができる。 Further, the learning method according to one aspect of the present invention includes a step of acquiring the learning data created by the learning data creating method according to any one of the above forms, and a step of learning the learning device using the acquired learning data. , Equipped with. According to this configuration, it is possible to construct the third learning device used for resolving the conflict that may occur in the control of the controlled device.
本発明によれば、複数の制御の間で競合が発生しても、制御対象装置が動作不能に陥らないようにする技術を提供することができる。 According to the present invention, it is possible to provide a technique for preventing a controlled device from becoming inoperable even if a conflict occurs between a plurality of controls.
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。 Hereinafter, embodiments according to one aspect of the present invention (hereinafter, also referred to as “the present embodiment”) will be described with reference to the drawings. However, the embodiments described below are merely examples of the present invention in all respects. Needless to say, various improvements and modifications can be made without departing from the scope of the present invention. That is, in carrying out the present invention, a specific configuration according to the embodiment may be appropriately adopted. Although the data appearing in the present embodiment is described in natural language, more specifically, it is specified in a pseudo language, a command, a parameter, a machine language, etc. that can be recognized by a computer.
§1 適用例
まず、図1を用いて、本発明が適用される場面の一例について説明する。図1は、本実施形態に係る制御装置1及び学習装置3の適用場面の一例を模式的に例示する。
§1 Application example First, an example of a situation in which the present invention is applied will be described with reference to FIG. FIG. 1 schematically illustrates an example of application situations of the
図1に示されるとおり、本実施形態に係る制御装置1は、複数の利用者(図1では、利用者A及びB)からの指示に従って、制御対象装置である空調装置4の動作を制御する情報処理装置である。空調装置4は、例えば、室内の温度を調節する公知のエア・コンディショナであり、本発明の「第1の制御対象装置」及び「第2の制御対象装置」に相当する。すなわち、本実施形態では、第1の制御対象装置及び第2の制御対象装置は同一である。ただし、第1の制御対象装置及び第2の制御対象装置は、このような例に限定されなくてもよく、異なる装置であってもよい。
As shown in FIG. 1, the
本実施形態に係る制御装置1は、空調装置4の動作を制御するための2つの学習器を備えている。第1の学習器(後述する第1のニューラルネットワーク5)は、利用者Aの好みに応じた空調装置4の動作の制御を予め学習済みである。一方、第2の学習器(後述する第2のニューラルネットワーク6)は、利用者Bの好みに応じた空調装置4の動作の制御を予め学習済みである。制御装置1は、第1の学習器及び第2の学習器それぞれから出力される制御値に基づいて、空調装置4の動作を制御する。
The
このとき、第1の学習器から出力される制御値と第2の学習器から出力される制御値とが相違する場合、空調装置4の動作の制御に競合が生じる可能性がある。例えば、室温が24度である状況で、第1の学習器から出力される制御値が室温を26度にする指令を構成しており、第2の学習器から出力される制御値が室温を22度にする指令を構成している場合、空調装置4の動作の制御に競合が生じる。
At this time, if the control value output from the first learner and the control value output from the second learner are different, there is a possibility that a conflict may occur in the control of the operation of the
そこで、本実施形態に係る制御装置1は、第1の学習器から出力される制御値に基づく空調装置4の制御と第2の学習器から出力される制御値に基づく空調装置4の制御とが競合する場合に、空調装置4の制御を修正することで当該競合を解消する。具体的には、本実施形態に係る制御装置1は、第3の学習器(後述する第3のニューラルネットワーク7)を利用して、空調装置4の制御の競合を解消する。
Therefore, the
第3の学習器は、第1の学習器及び第2の学習器それぞれから出力される制御値を入力すると、競合を解消するように修正された制御値(以下、「修正済み制御値」とも記載する)を出力するように予め学習済みである。そのため、制御装置1は、第1の学習器及び第2の学習器それぞれから得られる制御値を第3の学習器に入力することで、競合が生じないように修正された制御値を得ることができる。制御装置1は、このようにして得られる修正済み制御値に基づいて、空調装置4の動作を制御する。
When the control values output from the first learner and the second learner are input to the third learner, the control value modified so as to eliminate the conflict (hereinafter, also referred to as "corrected control value"). It has been learned in advance to output). Therefore, the
一方、本実施形態に係る学習装置3は、第3の学習器の機械学習を行う情報処理装置である。本実施形態に係る学習装置3は、データ収集用制御装置2を用いて、第3の学習器の機械学習に利用する学習データを収集する。データ収集用制御装置2は、制御装置1と同様に、第1の学習器及び第2の学習器を利用して、各利用者(A、B)の好みに適するように空調装置4の動作を制御する。ただし、データ収集用制御装置2は、空調装置4の制御の競合を解消しない(第3の学習器を利用しない)点で、制御装置1と相違する。
On the other hand, the
すなわち、データ収集用制御装置2による空調装置4の制御では、上記のような競合が生じ得る。そこで、データ収集用制御装置2は、第1の学習器から得られる制御値に基づく空調装置4の制御と第2の学習器から得られる制御値に基づく空調装置4の制御とが競合するか否かを判定する。第1の学習器から得られる制御値に基づく空調装置4の制御と第2の学習器から得られる制御値に基づく空調装置4の制御とが競合すると判定した場合、データ収集用制御装置2は、当該競合を解消するように制御値の修正値を決定する。
That is, in the control of the
例えば、データ収集用制御装置2は、第1の学習器及び第2の学習器それぞれから得られる制御値のうちのいずれか一方を優先する。すなわち、データ収集用制御装置2は、優先する方の制御値を修正済み制御値として取り扱う。また、例えば、データ収集用制御装置2は、第1の学習器及び第2の学習器それぞれから得られる制御値の平均値を修正済み制御値として算出する。これにより、データ収集用制御装置2は、上記競合を解消するように決定した修正済み制御値を取得することができる。
For example, the data
そして、データ収集用制御装置2は、第1の学習器及び第2の学習器それぞれから得た制御値を入力データとし、上記により得られる修正済み制御値を教師データとして、第3の学習器の機械学習に利用する学習データを作成する。つまり、データ収集用制御装置2は、修正前の各制御値と修正済みの制御値とを組にすることで、学習データを作成する。
Then, the data
学習装置3は、このようにして作成された学習データを取得し、取得した学習データを用いて第3の学習器の機械学習を行うことで、上記制御装置1で利用可能な学習済みの第3の学習器を構築する。なお、制御装置1は、例えば、ネットワークを介して、学習装置3から学習済みの第3の学習器を取得してもよい。また、制御装置1を製造する際に、組み込みデータとして、学習済みの第3の学習器は、制御装置1に組み込まれてもよい。
The
以上のとおり、本実施形態に係る制御装置1は、学習済みの第1の学習器及び第2の学習器を用いることで、各利用者(A、B)の好みに適するように空調装置4の動作を制御することができる。加えて、第1の学習器及び第2の学習器それぞれから得られる制御値に基づく空調装置4の制御に競合が生じる場合に、第3の学習器を利用して、当該競合を解消することができる。したがって、本実施形態によれば、各利用者(A、B)による制御の間で競合が発生しても、空調装置4が動作不能に陥らないようにすることができる。
As described above, the
§2 構成例
[ハードウェア構成]
<制御装置>
次に、図2を用いて、本実施形態に係る制御装置1のハードウェア構成の一例について説明する。図2は、本実施形態に係る制御装置1のハードウェア構成の一例を模式的に例示する。
§2 Configuration example [Hardware configuration]
<Control device>
Next, an example of the hardware configuration of the
図2に示されるとおり、本実施形態に係る制御装置1は、制御部11、記憶部12、及び外部インタフェース13が電気的に接続されたコンピュータである。なお、図2では、外部インタフェースを「外部I/F」と記載している。
As shown in FIG. 2, the
制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部12は、制御部11で実行される制御プログラム121、学習済みの第1の学習器に関する情報を示す第1動作制御学習結果データ122、学習済みの第2の学習器に関する情報を示す第2動作制御学習結果データ123、学習済みの第3の学習器に関する情報を示す競合解消学習結果データ124等を記憶する。
The
制御プログラム121は、後述する空調装置4の動作を制御する処理(図8)を制御部11に実行させるためのプログラムである。第1動作制御学習結果データ122は、学習済みの第1の学習器の設定に利用するデータである。第2動作制御学習結果データ123は、学習済みの第2の学習器の設定に利用するデータである。競合解消学習結果データ124は、学習済みの第3の学習器の設定に利用するデータである。詳細は後述する。
The
外部インタフェース13は、外部装置と接続するためのインタフェースであり、接続する外部装置に応じて適宜構成される。本実施形態では、制御装置1は、外部インタフェース13を介して、空調装置4に接続する。なお、制御装置1は、外部インタフェース13を介して、記憶媒体に記憶されたデータを読み込むためのドライブ装置等に接続されてもよい。この場合、制御装置1は、ドライブ装置を介して、上記制御プログラム121、第1動作制御学習結果データ122、第2動作制御学習結果データ123、及び競合解消学習結果データ124を取得してもよい。また、ドライブ装置を利用する場合、上記制御プログラム121、第1動作制御学習結果データ122、第2動作制御学習結果データ123、及び競合解消学習結果データ124は、記憶媒体に記憶されていてもよい。記憶媒体は、コンピュータその他装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。記憶媒体は、例えば、CD(Compact Disk)、DVD(Digital Versatile Disk)、フラッシュメモリ等である。
The
<データ収集用制御装置>
次に、図3を用いて、本実施形態に係るデータ収集用制御装置2のハードウェア構成の一例について説明する。図3は、本実施形態に係るデータ収集用制御装置2のハードウェア構成の一例を模式的に例示する。
<Control device for data collection>
Next, an example of the hardware configuration of the data
図3に示されるとおり、本実施形態に係るデータ収集用制御装置2は、学習データの収集の場面で利用される制御装置であり、上記制御装置1とほぼ同様に構成される。すなわち、データ収集用制御装置2は、制御部21、記憶部22、及び外部インタフェース23が電気的に接続されたコンピュータである。なお、図3では、上記図2と同様に、外部インタフェースを「外部I/F」と記載している。
As shown in FIG. 3, the data
制御部21、記憶部22及び外部インタフェース23は、上記制御装置1の制御部11、記憶部12及び外部インタフェース13と同様に構成される。ただし、記憶部22は、データ収集用制御プログラム221、第1動作制御学習結果データ122、第2動作制御学習結果データ123、データ収集用制御プログラム221を実行することで作成される学習データ223等を記憶する。
The
データ収集用制御プログラム221は、データ収集用制御装置2に後述する学習データの収集処理(図9)を実行させるためのプログラムである。学習データ223は、第1の学習器及び第2の学習器それぞれから出力される制御値を入力すると、競合を解消するように修正済みの制御値を出力するように第3の学習器の学習を行うためのデータである。詳細は後述する。
The data collection control program 221 is a program for causing the data
<学習装置>
次に、図4を用いて、本実施形態に係る学習装置3のハードウェア構成の一例を説明する。図4は、本実施形態に係る学習装置3のハードウェア構成の一例を模式的に例示する。
<Learning device>
Next, an example of the hardware configuration of the
図4に示されるとおり、本実施形態に係る学習装置3は、制御部31、記憶部32、通信インタフェース33、入力装置34、出力装置35、及びドライブ36が電気的に接続されたコンピュータである。なお、図4では、通信インタフェースを「通信I/F」と記載している。
As shown in FIG. 4, the
制御部31は、CPU、RAM、ROM等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部32は、制御部31で実行される学習プログラム321、第3の学習器の学習に利用する学習データ223、学習プログラム321を実行することで作成した競合解消学習結果データ124等を記憶する。学習プログラム321は、学習装置3に後述する学習処理(図10)を実行させるためのプログラムである。
The
通信インタフェース33は、例えば、有線LAN(Local Area Network)モジュール、無線LANモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。入力装置34は、例えば、マウス、キーボード等の入力を行うための装置である。出力装置35は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。
The
ドライブ36は、例えば、CDドライブ、DVDドライブ等であり、記憶媒体91に記憶されたプログラムを読み込むためのドライブ装置である。ドライブ36の種類は、記憶媒体91の種類に応じて適宜選択されてよい。上記学習プログラム321及び/又は学習データ223は、この記憶媒体91に記憶されていてもよい。
The
記憶媒体91は、コンピュータその他装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。学習装置3は、この記憶媒体91から、上記学習プログラム321及び/又は学習データ223を取得してもよい。
The
なお、図4では、記憶媒体91の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体91の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。
Note that FIG. 4 illustrates a disc-type storage medium such as a CD or DVD as an example of the
[機能構成]
<制御装置>
次に、図5を用いて、本実施形態に係る制御装置1の機能構成の一例を説明する。図5は、本実施形態に係る制御装置1の機能構成の一例を模式的に例示する。
[Functional configuration]
<Control device>
Next, an example of the functional configuration of the
制御装置1の制御部11は、記憶部12に記憶された制御プログラム121をRAMに展開する。そして、制御部11は、RAMに展開された制御プログラム121をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図5に示されるとおり、本実施形態に係る制御装置1は、第1の制御処理部111、第2の制御処理部112、及び競合解消部113を備えるコンピュータとして機能する。
The
第1の制御処理部111は、第1の学習器である第1のニューラルネットワーク5を利用して、空調装置4の動作を制御する。第1のニューラルネットワーク5は、利用者Aの好みに適した空調装置4の動作の制御を予め学習済みである。第1の制御処理部111は、利用者Aからの指示データ、位置情報等を第1のニューラルネットワーク5に入力することで、当該第1のニューラルネットワーク5から空調装置4に対する制御値を取得する。
The first
一方、第2の制御処理部112は、第2の学習器である第2のニューラルネットワーク6を利用して、空調装置4の動作を制御する。第2のニューラルネットワーク6は、利用者Bの好みに適した空調装置4の動作の制御を予め学習済みである。第2の制御処理部112は、利用者Bからの指示データ、位置情報等を第2のニューラルネットワーク6に入力することで、当該第2のニューラルネットワーク6から空調装置4に対する制御値を取得する。
On the other hand, the second
なお、第1のニューラルネットワーク5及び第2のニューラルネットワーク6に入力する情報(データ)の種類は、実施の形態に応じて適宜決定されてよい。利用者A及びBは、例えば、PC(Personal Computer)、携帯電話、リモートコントローラ等のユーザ端末を用いて、空調装置4に対して室温調整の要求を行ってもよい。これに応じて、制御装置1は、公知の無線又は有線のデータ通信により、各利用者(A、B)のユーザ端末から指示データを受信してもよい。
The type of information (data) to be input to the first
このとき、制御装置1は、ユーザ端末からの指示データに付随して、各ニューラルネットワーク(5、6)に入力する各種情報を取得してもよい。例えば、ユーザ端末が、GPS(Global Positioning System)信号の受信機を備える場合には、制御装置1は、各ニューラルネットワーク(5、6)に入力する情報として、各ユーザ端末から各利用者(A、B)の位置情報を取得してもよい。
At this time, the
また、制御装置1は、各利用者(A、B)の個人情報を記憶部12に予め保持していてもよい。この場合、制御部11は、各ユーザ端末から指示データを受信した際に、各ニューラルネットワーク(5、6)に入力する情報として、記憶部12から各利用者(A、B)の個人情報を取得してもよい。
Further, the
競合解消部113は、第1のニューラルネットワーク5から出力される制御値に基づく空調装置4の制御と第2のニューラルネットワーク6から出力される制御値に基づく空調装置4の制御とが競合する場合に、空調装置4の制御を修正することで、当該競合を解消する。本実施形態では、第3の学習器である第3のニューラルネットワーク7を利用して、当該競合の解消を行う。
When the
第3のニューラルネットワーク7は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから出力される制御値を入力すると、競合を解消するように修正済みの制御値を出力するように予め学習済みである。そのため、競合解消部113は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから出力される制御値を第3のニューラルネットワーク7に入力することで、競合を解消するように修正済みの制御値を第3のニューラルネットワーク7から取得することができる。
When the third neural network 7 inputs the control values output from each of the first
次に、各ニューラルネットワーク5〜7について説明する。図5に示されるとおり、第1のニューラルネットワーク5は、いわゆる深層学習に用いられる多層構造のニューラルネットワークであり、入力から順に、入力層51、中間層(隠れ層)52、及び出力層53を備えている。
Next, each
なお、図5の例では、第1のニューラルネットワーク5は、1層の中間層52を備えており、入力層51の出力が中間層52の入力となり、中間層52の出力が出力層53の入力となっている。ただし、中間層52の数は1層に限られなくてもよく、第1のニューラルネットワーク5は、2層以上の中間層52を備えてもよい。
In the example of FIG. 5, the first
各層51〜53は、1又は複数のニューロンを備えている。例えば、入力層51のニューロンの数は、入力に利用する情報の件数に応じて設定することができる。中間層52のニューロンの数は、実施の形態に応じて適宜設定することができる。また、出力層53のニューロンの数は、出力する制御値の種類数に応じて設定することができる。
Each layer 51-53 comprises one or more neurons. For example, the number of neurons in the
隣接する層のニューロン同士は適宜結合され、各結合には重み(結合荷重)が設定されている。図5の例では、各ニューロンは、隣接する層の全てのニューロンと結合されているが、ニューロンの結合は、このような例に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。 Neurons in adjacent layers are appropriately connected to each other, and a weight (connection load) is set for each connection. In the example of FIG. 5, each neuron is connected to all neurons in the adjacent layer, but the connection of neurons does not have to be limited to such an example and is appropriately set according to the embodiment. You can.
各ニューロンには閾値が設定されており、基本的には、各入力と各重みとの積の和が閾値を超えているか否かによって各ニューロンの出力が決定される。第1の制御処理部111は、このような第1のニューラルネットワーク5の入力層51に利用者Aからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、出力層53から制御値(出力値)を得ることができる。
A threshold is set for each neuron, and basically, the output of each neuron is determined by whether or not the sum of the products of each input and each weight exceeds the threshold. The first
なお、以上のような第1のニューラルネットワーク5の構成(例えば、ニューラルネットワークの層数、各層におけるニューロンの個数、ニューロン同士の結合関係、各ニューロンの伝達関数)、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報は、第1動作制御学習結果データ122に含まれている。第1の制御処理部111は、第1動作制御学習結果データ122を参照して、利用者Aの好みに適した空調装置4の動作の制御を学習済みの第1のニューラルネットワーク5の設定を行う。
The configuration of the first
第2のニューラルネットワーク6及び第3のニューラルネットワーク7も、第1のニューラルネットワーク5と同様に構成される。すなわち、第2のニューラルネットワーク6は、入力から順に、入力層61、中間層(隠れ層)62、及び出力層63を備えている。第3のニューラルネットワーク7は、入力から順に、入力層71、中間層(隠れ層)72、及び出力層73を備えている。各中間層(62、72)の数、各層(61〜63、71〜73)のニューロンの数、及び隣接する層のニューロンの結合は、実施の形態に応じて適宜設定されてよい。
The second
第2の制御処理部112は、第2のニューラルネットワーク6の入力層61に利用者Bからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、出力層63から制御値(出力値)を得ることができる。また、競合解消部113は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6の各出力層(53、63)から出力される制御値を入力層71に入力し、順伝搬の方向に各層71〜73に含まれる各ニューロンの発火判定を行うことで、出力層73から修正済みの制御値(出力値)を得ることができる。
The second
なお、以上のような第2のニューラルネットワーク6の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報は、第2動作制御学習結果データ123に含まれている。第2の制御処理部112は、第2動作制御学習結果データ123を参照して、利用者Bの好みに適した空調装置4の動作の制御を学習済みの第2のニューラルネットワーク6の設定を行う。
Information indicating the configuration of the second
同様に、以上のような第3のニューラルネットワーク7の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報は、競合解消学習結果データ124に含まれている。競合解消部113は、競合解消学習結果データ124を参照して、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから出力される制御値を入力すると、競合を解消するように修正済みの制御値を出力するように学習済みである第3のニューラルネットワーク7の設定を行う。
Similarly, the information indicating the configuration of the third neural network 7 as described above, the weight of the connection between each neuron, and the threshold value of each neuron is included in the conflict resolution learning
<データ収集用制御装置>
次に、図6を用いて、本実施形態に係るデータ収集用制御装置2の機能構成の一例を説明する。図6は、本実施形態に係るデータ収集用制御装置2の機能構成の一例を模式的に例示する。
<Control device for data collection>
Next, an example of the functional configuration of the data
データ収集用制御装置2の制御部21は、記憶部22に記憶されたデータ収集用制御プログラム221をRAMに展開する。そして、制御部21は、RAMに展開されたデータ収集用制御プログラム221をCPUにより解釈及び実行して、各構成要素を制御する。これにより、図6に示されるとおり、本実施形態に係るデータ収集用制御装置2は、第1の制御処理部211、第2の制御処理部212、修正値決定部213、及び学習データ作成部214を備えるコンピュータとして機能する。
The
第1の制御処理部211は、上記制御装置1の第1の制御処理部111と同様である。すなわち、第1の制御処理部211は、第1動作制御学習結果データ122を参照して、第1のニューラルネットワーク5の設定を行う。そして、第1の制御処理部211は、設定した第1のニューラルネットワーク5の入力層51に利用者Aからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、利用者Aの好みに応じた空調装置4に対する制御値(出力値)を出力層53から取得する。
The first control processing unit 211 is the same as the first
第2の制御処理部212は、上記制御装置1の第2の制御処理部112と同様である。すなわち、第2の制御処理部212は、第2動作制御学習結果データ123を参照して、第2のニューラルネットワーク6の設定を行う。そして、第2の制御処理部212は、設定した第2のニューラルネットワーク6の入力層61に利用者Bからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、利用者Bの好みに応じた空調装置4に対する制御値(出力値)を出力層63から取得する。
The second control processing unit 212 is the same as the second
データ収集用制御装置2は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから得られる制御値に基づいて、空調装置4の動作を制御する。ただし、空調装置4の動作を制御しようとした結果、空調装置4の制御に競合が生じる場合には、空調装置4は動作不能に陥る可能性がある。
The data
例えば、上記のとおり、室温が24度である状況で、第1のニューラルネットワーク5から出力される制御値が室温を26度に上げる指令を構成しており、第2のニューラルネットワーク6から出力される制御値が室温を22度に下げる指令を構成しているとする。このような場合、空調装置4の制御に競合が生じてしまい、データ収集用制御装置2は、室温を上げるように空調装置4の動作を制御すればよいのか、室温を下げるように空調装置4の動作を制御すればよいのか判断できなくなってしまう。
For example, as described above, in a situation where the room temperature is 24 degrees, the control value output from the first
そこで、空調装置4の動作を制御しようとした結果、空調装置4の制御に競合が生じる場合には、修正値決定部213が、当該競合を解消するように制御値の修正値を決定する。そして、学習データ作成部214は、各ニューラルネットワーク(5、6)から得られる制御値を入力データとし、修正値決定部213により決定された修正済みの制御値を教師データとして、第3のニューラルネットワーク7を構築するための学習データ223を作成する。
Therefore, when a conflict occurs in the control of the
<学習装置>
次に、図7を用いて、本実施形態に係る学習装置3の機能構成の一例を説明する。図7は、本実施形態に係る学習装置3の機能構成の一例を模式的に例示する。
<Learning device>
Next, an example of the functional configuration of the
学習装置3の制御部31は、記憶部32に記憶された学習プログラム321をRAMに展開する。そして、制御部31は、RAMに展開された学習プログラム321をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図7に示されるとおり、本実施形態に係る学習装置3は、学習データ取得部311及び学習処理部312を備えるコンピュータとして機能する。
The
学習データ取得部311は、上記により作成された学習データ223を取得する。学習処理部312は、取得した学習データ223及び学習用のニューラルネットワーク8を利用して、上記制御装置1で利用する第3のニューラルネットワークの構築を行う。すなわち、学習処理部312は、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、競合を解消するように修正済みの制御値を出力するようにニューラルネットワーク8を学習させる。
The learning data acquisition unit 311 acquires the learning
学習対象となるニューラルネットワーク8は、第3のニューラルネットワーク7と同様に構成される。すなわち、学習用のニューラルネットワーク8は、入力層81、中間層(隠れ層)82、及び出力層83を備え、各層81〜83は、上記第3のニューラルネットワーク7の各層71〜73と同様に構成される。
The
学習処理部312は、ニューラルネットワークの学習処理により、各ニューラルネットワーク(5、6)から得られる制御値を入力層81に入力すると、競合を解消するように修正済みの制御値を出力層83から出力するニューラルネットワーク8を構築する。これにより構築されたニューラルネットワーク8は、学習済みの第3のニューラルネットワーク7として利用可能である。学習処理部312は、構築したニューラルネットワーク8の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報を競合解消学習結果データ124として記憶部32に格納する。
When the
<その他>
制御装置1、データ収集用制御装置2、及び学習装置3の各機能に関しては後述する動作例で詳細に説明する。なお、本実施形態では、制御装置1、データ収集用制御装置2、及び学習装置3の各機能がいずれも汎用のCPUにより実現される例について説明した。しかしながら、以上の機能の一部又は全部が、1又は複数の専用のハードウェアプロセッサにより実現されてもよい。また、制御装置1、データ収集用制御装置2、及び学習装置3それぞれの機能構成に関して、実施形態に応じて、適宜、機能の省略、置換及び追加が行われてもよい。
<Others>
Each function of the
§3 動作例
[制御装置]
次に、図8を用いて、制御装置1の動作例を説明する。図8は、制御装置1の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
§3 Operation example [Control device]
Next, an operation example of the
(起動)
まず、制御装置1及び空調装置4を含むシステムを適宜起動する。システムを起動すると、制御装置1は、制御プログラム121を読み込んで、初期設定の処理を実行する。具体的には、制御部11は、各学習結果データ122〜124を参照して、各ニューラルネットワーク5〜7の構造、各ニューロン間の結合の重み及び各ニューロンの閾値の設定を行う。そして、制御部11は、以下の処理手順に従って、空調装置4の動作を制御する。
(Start-up)
First, the system including the
(ステップS101)
ステップS101では、制御部11は、空調装置4の動作の制御に利用する各種情報、換言すると、空調装置4の動作を決定する要因となる情報を各利用者(A、B)から取得する。上記のとおり、空調装置4の動作の制御に利用する情報の種類は、実施の形態に応じて適宜決定されてよい。各利用者(A、B)は、例えば、PC(Personal Computer)、携帯電話、リモートコントローラ等のユーザ端末を用いて、空調装置4に対して室温調整の要求を行ってもよい。これに応じて、制御部11は、公知の無線又は有線のデータ通信により、空調装置4の動作の制御に利用する指示データ、位置情報等の各種情報をユーザ端末から取得してもよい。また、制御部11は、空調装置4の動作の制御に利用する情報として、各利用者(A、B)の個人情報を記憶部12から取得してもよい。
(Step S101)
In step S101, the
(ステップS102)
次のステップS102では、制御部11は、第1の制御処理部111として機能し、利用者Aから取得した指示データ、位置情報等の各種情報を第1のニューラルネットワーク5に入力する。第1のニューラルネットワーク5は、利用者Aから取得した各種情報を入力すると、利用者Aの好みに応じた空調装置4に対する制御値を出力するように予め学習済みである。そのため、制御部11は、利用者Aから取得した各種情報を入力層51の各ニューロンに入力し、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、利用者Aの好みに応じた空調装置4に対する制御値を出力層53の各ニューロンから取得することができる。
(Step S102)
In the next step S102, the
また、制御部11は、第2の制御処理部112として機能し、利用者Bから取得した指示データ、位置情報等の各種情報を第2のニューラルネットワーク6に入力する。第2のニューラルネットワーク6は、利用者Bから取得した各種情報を入力すると、利用者Bの好みに応じた空調装置4に対する制御値を出力するように予め学習済みである。そのため、制御部11は、利用者Bから取得した各種情報を入力層61の各ニューロンに入力し、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、利用者Bの好みに応じた空調装置4に対する制御値を出力層63の各ニューロンから取得することができる。
Further, the
(ステップS103)
次のステップS103では、制御部11は、競合解消部113として機能し、各ニューラルネットワーク(5、6)から得られた制御値を第3のニューラルネットワーク7の入力層71に入力する。そして、制御部11は、順伝搬の方向に各層71〜73に含まれる各ニューロンの発火判定を行うことで、第3のニューラルネットワーク7の出力層73から競合を解消するように修正済みの制御値を取得する。これにより、本実施形態では、各ニューラルネットワーク(5、6)を利用した空調装置4の制御に競合が発生する場合に、当該競合を解消するように空調装置4の制御を修正することができる。
(Step S103)
In the next step S103, the
ここで、本ステップS103では、ステップS102で取得した各制御値により空調装置4の制御に競合が発生するか否かを区別せずに、第3のニューラルネットワーク7に当該各制御値を入力している。つまり、ステップS102で取得した各制御値により空調装置4の制御に競合が発生しない場合にも、当該ステップS102で取得した各制御値を第3のニューラルネットワーク7に入力している。
Here, in this step S103, each control value is input to the third neural network 7 without distinguishing whether or not a conflict occurs in the control of the
このとき、第3のニューラルネットワーク7は、ステップS102で取得した各制御値により空調装置4の制御に競合が発生しない場合、各制御値をそのまま出力するように学習されていてもよいし、競合が発生する場合と同様に修正済みの制御値を出力するように学習されていてもよい。なお、以下では、入力された制御値を修正せずに第3のニューラルネットワーク7からそのまま出力される制御値も「修正済みの制御値(修正済み制御値)」と称する。
At this time, the third neural network 7 may be learned to output each control value as it is when the control values of the
(ステップS104)
次のステップS104では、制御部11は、上記ステップS103において第3のニューラルネットワーク7から取得した修正済み制御値に基づいて、空調装置4の動作を制御する。制御値は、例えば、空調装置4を動作させることで達成すべき所望の室温を示す。制御部11は、制御値に示される所望の室温と現状の室温とを比較し、所望の室温になるように空調装置4の冷暖房の動作を制御する。
(Step S104)
In the next step S104, the
以上により、制御部11は、本動作例に係る処理を終了する。制御部11は、以上のステップS101〜S104の処理を定期的又は不定期的に繰り返し実行してもよい。これにより、制御装置1は、各利用者(A、B)の好みに応じた空調装置4の動作の制御を継続的に実施することができる。
As described above, the
[データ収集用制御装置]
次に、図9を用いて、データ収集用制御装置2の動作例を説明する。図9は、データ収集用制御装置2の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は、本発明の「学習データ作成方法」に相当する。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
[Control device for data collection]
Next, an operation example of the data
(起動)
上記と同様に、データ収集用制御装置2及び空調装置4を含むシステムを適宜起動する。システムを起動すると、データ収集用制御装置2は、データ収集用制御プログラム221を読み込んで、初期設定の処理を実行する。すなわち、制御部21は、各学習結果データ(122、123)を参照して、各ニューラルネットワーク(5、6)の構造、各ニューロン間の結合の重み及び各ニューロンの閾値の設定を行う。そして、制御部21は、以下の処理手順に従って、第3のニューラルネットワーク7を構築するための学習データ223を作成する。
(Start-up)
In the same manner as described above, the system including the data
(ステップS201及びS202)
ステップS201では、制御部21は、上記ステップS101と同様に、各ニューラルネットワーク(5、6)に入力する各種情報を各利用者(A、B)から取得する。
(Steps S201 and S202)
In step S201, the
次のステップS202では、制御部21は、上記ステップS102と同様に、第1の制御処理部211として機能し、利用者Aから取得した各種情報を第1のニューラルネットワーク5の入力層51に入力する。そして、制御部21は、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、第1のニューラルネットワーク5の出力層53から出力される利用者Aの好みに応じた空調装置4に対する制御値を取得する。
In the next step S202, the
また、制御部21は、第2の制御処理部212として機能し、利用者Bから取得した各種情報を第2のニューラルネットワーク6の入力層61に入力する。そして、制御部21は、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、第2のニューラルネットワーク6の出力層63から出力される利用者Bの好みに応じた空調装置4に対する制御値を取得する。
Further, the
(ステップS203及びS204)
次のステップS203では、制御部21は、上記ステップS202で各ニューラルネットワーク(5、6)から取得した各制御値に基づいて、制御対象装置である空調装置4の動作を制御する。そして、ステップS204では、制御部21は、空調装置4の制御に競合が発生するか否かを判定する。
(Steps S203 and S204)
In the next step S203, the
このとき、制御部21は、ステップS203において空調装置4を実際に動作させて、各ニューラルネットワーク(5、6)から取得した各制御値が競合を発生させるか否かを判定してもよい。また、制御部21は、ステップS203において空調装置4を実際には動作させず、各ニューラルネットワーク(5、6)から取得した各制御値に基づいて、空調装置4の動作をシミュレートすることで、競合が発生するか否かを判定してもよい。
At this time, the
競合が発生するか否かを判定する方法は、実施の形態に応じて適宜設定されてよい。例えば、各ニューラルネットワーク(5、6)から取得した各制御値に基づいた空調装置4の制御を同時に実行できない場合に、制御部21は、空調装置4の制御に競合が発生すると判定してもよい。空調装置4の制御に競合が発生すると判定した場合には、制御部21は、次のステップS205に処理を進める。一方、空調装置4の制御に競合が発生しないと判定した場合には、制御部21は、本動作例に係る処理を終了する。
The method for determining whether or not a conflict occurs may be appropriately set according to the embodiment. For example, if the control of the
(ステップS205)
次のステップS205では、制御部21は、修正値決定部213として機能し、空調装置4の制御に生じた競合を解消するように、各ニューラルネットワーク(5、6)から取得した各制御値の修正値を決定する。これにより、制御部21は、競合を解消するように修正済みの制御値を取得する。
(Step S205)
In the next step S205, the
制御値の修正方法は、実施の形態に応じて適宜選択されてよい。例えば、制御部21は、所定の規則に従って修正値を決定してもよい。この場合、利用者A及びBのいずれか一方を優先することが所定の規則として定められているときには、制御部21は、各ニューラルネットワーク(5、6)から取得した制御値のうちいずれか一方を優先する。すなわち、制御部21は、優先する方の制御値を修正済み制御値として取り扱う。また、利用者A及びBを共に平等に扱うことが所定の規則として定められているときには、制御部21は、各ニューラルネットワーク(5、6)から取得した制御値を平均化することで、修正済みの制御値を取得する。
The method for modifying the control value may be appropriately selected according to the embodiment. For example, the
なお、所定の規則は、このような例に限定されなくてもよい。例えば、所定の規則として、利用者A及びBそれぞれに優先度が設定されている場合には、制御部21は、各ニューラルネットワーク(5、6)から取得した制御値の加重平均を修正済みの制御値として取得してもよい。
It should be noted that the predetermined rule does not have to be limited to such an example. For example, when the priority is set for each of the users A and B as a predetermined rule, the
また、例えば、制御部21は、修正値の入力をオペレータから受け付けてもよい。すなわち、制御部21は、オペレータからの入力に基づいて修正済みの制御値を決定してもよい。この場合、データ収集用制御装置2は、外部インタフェース23を介して、キーボード、マイクロフォン等の入力装置に接続していてもよい。これにより、オペレータは、キーボード入力、音声入力等により、修正済みの制御値を入力することができる。
Further, for example, the
(ステップS206)
次のステップS206では、制御部21は、学習データ作成部214として機能し、ステップS202で各ニューラルネットワーク(5、6)から取得した制御値と、ステップS205で決定した修正済みの制御値とを組にする。これにより、制御部21は、修正前の各制御値を入力データとし、修正済みの制御値を教師データとする学習データ223を作成する。そして、制御部21は、作成した学習データ223を記憶部22に保存する。
(Step S206)
In the next step S206, the
以上により、制御部21は、本動作例に係る処理を終了する。制御部21は、上記ステップS201〜S206の一連の処理を繰り返し実行することで、複数件の学習データ223を収集することができる。
As described above, the
なお、空調装置4の制御に競合が発生しない場合に、各制御値をそのまま出力する第3のニューラルネットワーク7を構築するときには、制御部21は、ステップS204で競合が発生しないと判定した際の各制御値を入力データ及び教師データとして学習データ223を作成してもよい。
When constructing a third neural network 7 that outputs each control value as it is when there is no conflict in the control of the
また、空調装置4の制御に競合が発生しない場合でも、各ニューラルネットワーク(5、6)から得られる制御値を修正する第3のニューラルネットワーク7を構築するときには、制御部21は、ステップS204で競合が発生しないと判定した際にも、上記ステップS205及びS206の処理を実行してもよい。
Further, when constructing the third neural network 7 that modifies the control values obtained from the respective neural networks (5, 6) even when there is no conflict in the control of the
この場合、制御部21は、オペレータからの入力を受け付けて、利用者A及びBの両方の好みに適した修正済みの制御値が得られるように修正値を決定してもよい。これにより、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、利用者A及びBの両方の好みに適した修正済みの制御値を出力する第3のニューラルネットワーク7の構築に利用可能な学習データ223を作成することができる。
In this case, the
[学習装置]
次に、図10を用いて、学習装置3の動作例を説明する。図10は、学習装置3の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
[Learning device]
Next, an operation example of the
(ステップS301)
ステップS301では、制御部31は、学習データ取得部311として機能し、上記データ収集用制御装置2により作成された学習データ223を取得する。
(Step S301)
In step S301, the
データ収集用制御装置2により作成した学習データ223を学習装置3に転送する方法は、実施の形態に応じて適宜選択されてよい。例えば、学習装置3とデータ収集用制御装置2とがネットワークを介して接続している場合には、制御部31は、ネットワークを介してデータ収集用制御装置2にアクセスすることで、学習データ223を取得することができる。また、例えば、データ収集用制御装置2で作成された学習データ223は、NAS(Network Attached Storage)等のその他の情報処理装置(記憶装置)に格納されていてもよい。この場合、制御部31は、当該その他の情報処理装置にアクセスすることで、学習データ223を取得することができる。また、例えば、データ収集用制御装置2で作成された学習データ223は、記憶媒体91に格納されていてもよい。この場合、制御部31は、ドライブ36を介して記憶媒体91から学習データ223を取得することができる。なお、本ステップS301で取得する学習データ223の件数は、学習用のニューラルネットワーク8の学習を行うことができるように、実施の形態に応じて適宜決定されてよい。
The method of transferring the learning
(ステップS302)
次のステップS302では、制御部31は、学習処理部312として機能し、ステップS301で取得した学習データ223を用いて、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、競合を解消するように修正済みの制御値を出力するように学習用のニューラルネットワーク8の学習を行う。
(Step S302)
In the next step S302, the
具体的には、まず、制御部31は、学習処理を行う対象となる学習用のニューラルネットワーク8を用意する。用意するニューラルネットワーク8の構成、各ニューロン間の結合の重みの初期値、及び各ニューロンの閾値の初期値は、テンプレートにより与えられてもよいし、オペレータの入力により与えられてもよい。また、再学習を行う場合には、制御部31は、再学習を行う対象となる競合解消学習結果データ124に基づいて、学習用のニューラルネットワーク8を用意してもよい。
Specifically, first, the
次に、制御部31は、ステップS301で取得した学習データ223に含まれる各ニューラルネットワーク(5、6)から得られた制御値を入力データとし、修正済みの制御値を教師データとして、ニューラルネットワーク8の学習を行う。このニューラルネットワーク8の学習には、勾配降下法、確率的勾配降下法等が用いられてよい。
Next, the
例えば、制御部31は、学習データ223に含まれる各ニューラルネットワーク(5、6)から得られた制御値を入力層81に入力して、学習用のニューラルネットワーク8の順伝播方向の演算処理を行う。これにより、制御部31は、学習用のニューラルネットワーク8の出力層83から出力値を得る。次に、制御部31は、出力層83から出力された出力値を学習データ223に含まれる修正済みの制御値との誤差を算出する。続いて、制御部31は、誤差逆伝搬法により、算出した出力値の誤差を用いて、各ニューロン間の結合の重み及び各ニューロンの閾値それぞれの誤差を算出する。そして、制御部31は、算出した各誤差に基づいて、各ニューロン間の結合の重み及び各ニューロンの閾値それぞれの値の更新を行う。
For example, the
制御部31は、各件の学習データ223について、出力層83から出力される出力値が対応する修正済みの制御値と一致するまでこの一連の処理を繰り返すことにより、ニューラルネットワーク8の学習を行う。これにより、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、競合を解消するように修正済みの制御値を出力するニューラルネットワーク8を構築することができる。
The
(ステップS303)
次のステップS303では、制御部31は、学習処理部312として機能して、構築したニューラルネットワーク8の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報を競合解消学習結果データ124として記憶部32に格納する。これにより、制御部31は、本動作例に係る学習処理を終了する。
(Step S303)
In the next step S303, the
なお、学習装置3と制御装置1とがネットワークを介して接続可能な場合、制御部31は、上記ステップS303の処理が完了した後に、作成した競合解消学習結果データ124を制御装置1に適宜転送してもよい。また、制御部31は、上記ステップS301〜S303の学習処理を定期的又は不定期的に実行することで、競合解消学習結果データ124を定期的に又は不定期的に更新してもよい。そして、制御部31は、作成した競合解消学習結果データ124を当該学習処理の実行毎に制御装置1に転送することで、制御装置1の保持する競合解消学習結果データ124を定期的に又は不定期的に更新してもよい。
When the
[作用・効果]
以上のように、本実施形態では、各ニューラルネットワーク(5、6)によって、各利用者(A、B)の好みに適するように空調装置4の動作を制御することができる。ただし、両者から相反する指示がなされた場合等には、空調装置4の制御に競合が発生し得る。これに対して、本実施形態では、各ニューラルネットワーク(5、6)から得られた制御値を、上記ステップS103の処理で利用する第3のニューラルネットワーク7によって、当該競合を解消するように修正することができる。したがって、本実施形態によれば、各利用者(A、B)による制御の間で競合が発生しても、空調装置4が動作不能に陥らないようにすることができる。
[Action / Effect]
As described above, in the present embodiment, the operation of the
§4 変形例
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。
§4 Modifications Although the embodiments of the present invention have been described in detail above, the above description is merely an example of the present invention in all respects. Needless to say, various improvements and modifications can be made without departing from the scope of the present invention. For example, the following changes can be made. In the following, the same reference numerals will be used for the same components as those in the above embodiment, and the same points as in the above embodiment will be omitted as appropriate. The following modifications can be combined as appropriate.
<4.1>
上記実施形態では、制御装置1により制御される制御対象装置として空調装置を例示している。しかしながら、制御対象装置の種類は、空調装置に限られなくてもよく、実施の形態に応じて適宜選択されてよい。制御対象装置は、例えば、ロボット装置等であってもよい。
<4.1>
In the above embodiment, an air conditioner is exemplified as a controlled object device controlled by the
また、上記実施形態では、第1のニューラルネットワーク5及び第2のニューラルネットワーク6は、同一の制御対象装置(空調装置4)を制御対象としている。しかしながら、第1のニューラルネットワーク5が制御対象とする制御対象装置と第2のニューラルネットワーク6が制御対象とする制御対象装置とは異なっていてもよい。
Further, in the above embodiment, the first
例えば、第1のニューラルネットワーク5は、第1の制御対象装置として、第1のロボット装置を制御対象としてもよい。そして、第2のニューラルネットワーク6は、第2の制御対象装置として、第1のロボット装置とは異なる第2のロボット装置を制御対象としてもよい。この場合、例えば、第1のロボット装置及び第2のロボット装置に同じタイミングで同じ位置に移動する制御指令が発行されたときに、両ロボット装置の制御の間で競合が発生し得る。
For example, in the first
また、上記実施形態では、制御対象装置の動作を制御する制御値を発行する学習器として2つの学習器(第1のニューラルネットワーク5及び第2のニューラルネットワーク6)が利用されている。しかしながら、制御対象装置の動作を制御する制御値を発行する学習器の数は、2つに限られなくてもよく、3つ以上であってもよい。
Further, in the above embodiment, two learning devices (first
<4.2>
上記制御装置1、データ収集用制御装置2、及び学習装置3それぞれの具体的なハードウェア構成に関して、実施の形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部11は、複数のプロセッサを含んでもよい。制御装置1及びデータ収集用制御装置2は、通信インタフェースを備え、ネットワークを介して他の情報処理装置とデータのやりとりが可能に構成されてもよい。制御装置1、データ収集用制御装置2、及び学習装置3はそれぞれ、複数台のコンピュータで構成されてもよい。
<4.2>
Regarding the specific hardware configurations of the
また、制御装置1及びデータ収集用制御装置2はそれぞれ、提供されるサービス専用に設計されたECU(Electronic Control Unit)等の情報処理装置の他、制御する対象となる制御対象装置に応じて、汎用のデスクトップPC、タブレットPC、携帯電話等が適宜用いられてもよい。また、学習装置3は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、デスクトップPC等が用いられてもよい。
Further, each of the
<4.3>
また、上記実施形態では、図5〜図7に示されるとおり、各ニューラルネットワーク5〜8として、多層構造を有する一般的な順伝播型ニューラルネットワークを用いている。しかしながら、各ニューラルネットワーク5〜8の種類は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、入力データとして画像を用いる場合、各ニューラルネットワーク5〜8には、畳み込み層及びプーリング層を備える畳み込みニューラルネットワークを用いてもよい。また、例えば、入力データとして時系列データを用いる場合、各ニューラルネットワーク5〜8には、中間層から入力層等のように出力側から入力側に再帰する結合を有する再帰型ニューラルネットワークが用いられてもよい。なお、各ニューラルネットワーク5〜8の層数、各層におけるニューロンの個数、ニューロン同士の結合関係、及び各ニューロンの伝達関数は、実施の形態に応じて適宜決定されてよい。
<4.3>
Further, in the above embodiment, as shown in FIGS. 5 to 7, a general feedforward neural network having a multi-layer structure is used as each
<4.4>
また、上記ステップS103では、空調装置4の制御に競合を発生させるか否かを区別せずに、ステップS102で各ニューラルネットワーク(5、6)から取得した制御値を第3のニューラルネットワーク7に入力している。しかしながら、制御装置1の処理手順は、このような例に限定されなくてもよい。ステップS102で各ニューラルネットワーク(5、6)から取得した制御値が空調装置4の制御に競合を発生させる場合にのみ、制御部11は、当該ステップS102で取得した制御値を第3のニューラルネットワーク7に入力してもよい。この場合、ステップS102で各ニューラルネットワーク(5、6)から取得した制御値が空調装置4の制御に競合を発生させないときには、制御部11は、上記ステップS103を省略して、次のステップS104の処理を実行することで、各ニューラルネットワーク(5、6)から取得した制御値をそのまま空調装置4の制御に利用してもよい。
<4.4>
Further, in step S103, the control values acquired from each neural network (5, 6) in step S102 are transferred to the third neural network 7 without distinguishing whether or not a conflict occurs in the control of the
また、上記ステップS103では、第3のニューラルネットワーク7を用いて、空調装置4の制御に生じる競合の解消を行っている。しかしながら、空調装置4の制御に生じる競合の解消を行う方法は、このような例に限定されなくてもよい。ニューラルネットワークを用いずに、空調装置4の制御に生じる競合の解消が行われてもよい。
Further, in step S103, the third neural network 7 is used to eliminate the conflict that occurs in the control of the
図11は、本変形例に係る制御装置1Aを模式的に例示する。制御装置1Aは、競合解消学習結果データ124を保持せず、ニューラルネットワークを利用しない競合解消部113Aを備える点を除き、上記制御装置1と同様に構成されている。この場合、制御部11は、上記ステップS103において、競合解消部113Aとして機能し、各ニューラルネットワーク(5、6)から取得した制御値により空調装置4の制御に競合が発生するか否かを判定する。例えば、制御部11は、空調装置4の動作をシミュレートすることで、当該空調装置4の制御に競合が発生するか否かを判定する。
FIG. 11 schematically illustrates the
そして、空調装置4の制御に競合が発生しないと判定した場合には、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値に基づいて空調装置4の動作を制御する。一方、空調装置4の制御に競合が発生すると判定した場合には、制御部11は、競合を解消するように、各ニューラルネットワーク(5、6)から取得した制御値を修正し、修正した制御値に基づいて空調装置4の動作を制御する。
Then, when it is determined that there is no conflict in the control of the
なお、制御値の修正方法は、上記ステップS205と同様に、実施の形態に応じて適宜選択されてよい。例えば、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値のうちいずれか一方を優先することで、修正済みの修正値を決定してもよい。また、例えば、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値を平均化することで、修正済みの制御値を決定してもよい。
The method for modifying the control value may be appropriately selected according to the embodiment, as in step S205. For example, the
<4.5>
また、上記実施形態では、制御部11は、空調装置4の制御にどのような競合を発生させるかを特定せずに、各ニューラルネットワーク(5、6)から取得した制御値を第3のニューラルネットワーク7に入力している。しかしながら、制御装置1の処理手順は、このような例に限定されなくてもよく、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値が空調装置4の制御にどのような競合を発生させるかを特定してもよい。
<4.5>
Further, in the above embodiment, the
図12は、本変形例に係る制御装置1Bを模式的に例示する。制御装置1Bは、各ニューラルネットワーク(5、6)から取得した制御値に基づいて、空調装置4の制御がどのように競合するかを示す競合種別情報125を特定する競合種別特定部114を備える点、特定した競合種別情報125を第3のニューラルネットワーク7の入力に利用する点を除き、上記制御装置1と同様に構成されている。
FIG. 12 schematically illustrates the
この場合、制御部11は、上記ステップS103を実行する前に、各ニューラルネットワーク(5、6)から取得した制御値に基づいて、空調装置4の制御がどのように競合するかを示す競合種別情報125を特定する。競合の種別(仕方)は、実施の形態に応じて適宜設定されてよい。そして、上記ステップS103において、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値及び競合種別情報125を第3のニューラルネットワーク7の入力層71に入力する。
In this case, the
これにより、制御装置1Bは、競合の種別に応じて制御値の修正方法を確実に変更することができる。例えば、利用者Aが利用者Bよりも高い室温を所望している場合に、第3のニューラルネットワーク7は、各ニューラルネットワーク(5、6)から取得した制御値の平均値を修正済み制御値として出力するようにしてもよい。そして、利用者Bが利用者Aよりも高い室温を所望している場合に、第3のニューラルネットワーク7は、ニューラルネットワーク5から取得した制御値を修正済み制御値として優先して出力するようにしてもよい。
As a result, the
なお、図13に例示するように、空調装置4の制御がどのように競合するかの特定には、ニューラルネットワーク等の学習器が利用されてもよい。図13は、本変形例に係る制御装置1Cを模式的に例示する。制御装置1Cは、第4のニューラルネットワーク115を利用して競合種別情報125を特定する競合種別特定部114Cを備える点を除き、上記制御装置1Bと同様に構成されている。第4のニューラルネットワーク115は、各ニューラルネットワーク(5、6)から出力される制御値を入力すると、競合種別情報125に対応する出力値を出力するように学習済みである。第4のニューラルネットワーク115は、例えば、各ニューラルネットワーク5〜7と同様に構成されてよい。上記処理手順において、システムを起動した際に、制御部11は、学習結果データ126を参照して、第4のニューラルネットワーク115の構造、各ニューロン間の結合の重み及び各ニューロンの閾値の設定を行う。これにより、空調装置4の制御に生じる競合を複雑に分類することができ、各分類に適切な解消方法を採用することができるようになる。
As illustrated in FIG. 13, a learning device such as a neural network may be used to identify how the controls of the
<4.6>
また、上記実施形態(及び変形例)では、各学習器は、ニューラルネットワークにより構成されている。しかしながら、各学習器の種類は、ニューラルネットワークに限られなくてもよく、実施の形態に応じて適宜選択されてよい。各学習器には、例えば、サポートベクターマシン、自己組織化マップ、強化学習により学習を行う学習器等が用いられてもよい。
<4.6>
Further, in the above embodiment (and modification), each learner is configured by a neural network. However, the type of each learner does not have to be limited to the neural network, and may be appropriately selected according to the embodiment. For each learning device, for example, a support vector machine, a self-organizing map, a learning device that learns by reinforcement learning, or the like may be used.
<4.7>
また、上記各ニューラルネットワーク(5、6)を作成するための学習装置を用意してもよい。例えば、機械学習に利用する学習データを上記学習データ223から各利用者(A、B)に適した制御を学習するための学習データに変更することで、上記学習装置3により、学習済みの各ニューラルネットワーク(5、6)を作成することができる。各利用者(A、B)に適した制御を学習させるための学習データは、各利用者(A、B)から取得した入力データとなる各種情報と、各利用者(A、B)の好みに適した教師データとなる本来の制御値とを組み合わせることで作成することができる。学習装置は、このような学習データを利用して、上記ステップS301〜303の処理を実行することで、学習済みの各ニューラルネットワーク(5、6)を構築し、各動作制御学習結果データ(122、123)を作成することができる。
<4.7>
Further, a learning device for creating each of the above neural networks (5, 6) may be prepared. For example, by changing the learning data used for machine learning from the learning
同様に、上記第4のニューラルネットワーク115を作成するための学習装置を用意してもよい。例えば、機械学習に利用する学習データを上記学習データ223から競合の種別の特定を学習するための学習データに変更することで、上記学習装置3により、学習済みの第4のニューラルネットワーク115を作成することができる。競合の種別の特定を学習するための学習データは、各ニューラルネットワーク(5、6)から取得される入力データとなる制御値と、教師データとなる競合種別情報125に対応する出力値とを組み合わせることで作成することができる。学習装置は、このような学習データを利用して、上記ステップS301〜303の処理を実行することで、学習済みの第4のニューラルネットワーク115を構築し、学習結果データ126を作成することができる。
Similarly, a learning device for creating the fourth
1・1A・1B・1C…制御装置、
11…制御部、12…記憶部、13…外部インタフェース、
111…第1の制御処理部、112…第2の制御処理部、
113・113A…競合解消部、
114・114C…競合種別特定部、
115…第4のニューラルネットワーク、
121…制御プログラム、122…第1動作制御学習結果データ、
123…第2動作制御学習結果データ、
124…競合解消学習結果データ、
125…競合種別情報、126…学習結果データ、
2…データ収集用制御装置、
21…制御部、22…記憶部、23…外部インタフェース、
211…第1の制御処理部、212…第2の制御処理部、
213…修正値決定部、214…学習データ作成部、
221…データ収集用制御プログラム、223…学習データ、
3…学習装置、
31…制御装置、32…記憶部、33…通信インタフェース、
34…入力装置、35…出力装置、36…ドライブ、
311…学習データ取得部、312…学習処理部、
321…学習プログラム、
5…第1のニューラルネットワーク、
51…入力層、52…中間層(隠れ層)、53…出力層、
6…第2のニューラルネットワーク、
61…入力層、62…中間層(隠れ層)、63…出力層、
7…第3のニューラルネットワーク、
71…入力層、72…中間層(隠れ層)、73…出力層、
8…学習用のニューラルネットワーク、
81…入力層、82…中間層(隠れ層)、83…出力層、
91…記憶媒体
1.1A, 1B, 1C ... Control device,
11 ... Control unit, 12 ... Storage unit, 13 ... External interface,
111 ... 1st control processing unit, 112 ... 2nd control processing unit,
113 / 113A ... Conflict Resolution Department,
114 / 114C ... Competitive type identification part,
115 ... Fourth neural network,
121 ... control program, 122 ... first motion control learning result data,
123 ... Second motion control learning result data,
124 ... Conflict resolution learning result data,
125 ... Competitive type information, 126 ... Learning result data,
2 ... Data collection control device,
21 ... Control unit, 22 ... Storage unit, 23 ... External interface,
211 ... 1st control processing unit, 212 ... 2nd control processing unit,
213 ... Correction value determination unit, 214 ... Learning data creation unit,
221 ... Data collection control program, 223 ... Learning data,
3 ... Learning device,
31 ... control device, 32 ... storage unit, 33 ... communication interface,
34 ... Input device, 35 ... Output device, 36 ... Drive,
311 ... Learning
321 ... Learning program,
5 ... First neural network,
51 ... Input layer, 52 ... Intermediate layer (hidden layer), 53 ... Output layer,
6 ... Second neural network,
61 ... Input layer, 62 ... Intermediate layer (hidden layer), 63 ... Output layer,
7 ... Third neural network,
71 ... Input layer, 72 ... Intermediate layer (hidden layer), 73 ... Output layer,
8 ... Neural network for learning,
81 ... Input layer, 82 ... Intermediate layer (hidden layer), 83 ... Output layer,
91 ... Storage medium
Claims (7)
第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される制御値に基づいて、当該第2の制御対象装置の動作を制御する第2の制御処理部と、
前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を出力するように学習を行った学習済みの第3の学習器を利用して、当該競合を解消する競合解消部と、
を備える、
制御装置。 A first control target device that controls the operation of the first control target device based on a control value output from a learned first learner that has been trained to control the operation of the first control target device. Control processing unit and
A second control target device that controls the operation of the second control target device based on a control value output from the learned second learner that has been trained to control the operation of the second control target device. Control processing unit and
The control of the first control target device based on the control value output from the first learner and the control of the second control target device based on the control value output from the second learner conflict with each other. In this case, when the control value of the first control target device output from the first learner and the control value of the second control target device output from the second learner are input, the control value of the second control target device is input. Using the trained third learner that has been trained to output the control value of the first control target device and the control value of the second control target device modified to eliminate the conflict. And the conflict resolution department that resolves the conflict,
To prepare
Control device.
前記競合解消部は、特定された前記競合種別情報を前記第3の学習器に更に入力する、
請求項1に記載の制御装置。 The first control is based on the control value of the first control target device output from the first learner and the control value of the second control target device output from the second learner. Further provided with a conflict type identification unit that specifies conflict type information indicating how the control of the target device and the second control target device conflicts with each other.
The conflict resolving unit further inputs the specified conflict type information to the third learner.
The control device according to claim 1.
請求項2に記載の制御装置。 The competition type identification unit inputs the control value of the first control target device output from the first learner and the control value of the second control target device output from the second learner. Then, the conflict type information is specified by using the learned fourth learner that has been trained to output the output value corresponding to the conflict type information.
The control device according to claim 2.
請求項3に記載の制御装置。 The first, second, third and fourth learners are each composed of a neural network.
The control device according to claim 3.
請求項1から4のいずれか1項に記載の制御装置。 The conflict resolving unit controls the first controlled device based on the control value output from the first learner, and the second control based on the control value output from the second learner. By giving priority to one of the controls of the target device, the conflict is resolved.
The control device according to any one of claims 1 to 4.
前記競合解消部は、前記第1の学習器から出力される制御値と前記第2の学習器から出力される制御値とを平均化することで、前記競合を解消する、
請求項1から5のいずれか1項に記載の制御装置。 The first control target device and the second control target device are the same control target device, and the first control target device and the second control target device are the same control target device.
The conflict resolving unit resolves the conflict by averaging the control value output from the first learner and the control value output from the second learner.
The control device according to any one of claims 1 to 5.
前記第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される前記第1の制御対象装置を制御するための制御値を取得するステップと、
前記第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される前記第2の制御対象装置を制御するための制御値を取得するステップと、
前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を出力するように学習を行った学習済みの第3の学習器から、修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を取得するステップと、
取得された前記制御値に基づいて前記第1の制御対象装置及び前記第2の制御対象装置を制御するステップと、
を実行させるための制御プログラム。
To the computer that controls the operation of the first controlled device and the second controlled device,
A step of acquiring a control value for controlling the first control target device output from the learned first learner that has learned to control the operation of the first control target device, and a step of acquiring the control value for controlling the first control target device.
A step of acquiring a control value for controlling the second control target device output from the learned second learner that has learned to control the operation of the second control target device, and a step of acquiring the control value for controlling the second control target device.
The control of the first control target device based on the control value output from the first learner and the control of the second control target device based on the control value output from the second learner conflict with each other. In this case, when the control value of the first control target device output from the first learner and the control value of the second control target device output from the second learner are input, the control value of the second control target device is input. Modified from the trained third learner that has been trained to output the control value of the first control target device and the control value of the second control target device modified to eliminate the conflict. The step of acquiring the control value of the first control target device and the control value of the second control target device, and
A step of controlling the first control target device and the second control target device based on the acquired control value, and
A control program for executing.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017096165A JP6915371B2 (en) | 2017-05-15 | 2017-05-15 | Control device, control program, learning data creation method, and learning method |
PCT/JP2018/016703 WO2018211927A1 (en) | 2017-05-15 | 2018-04-25 | Control apparatus, control program, learning data creation method, and learning method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017096165A JP6915371B2 (en) | 2017-05-15 | 2017-05-15 | Control device, control program, learning data creation method, and learning method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018194932A JP2018194932A (en) | 2018-12-06 |
JP6915371B2 true JP6915371B2 (en) | 2021-08-04 |
Family
ID=62200496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017096165A Active JP6915371B2 (en) | 2017-05-15 | 2017-05-15 | Control device, control program, learning data creation method, and learning method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6915371B2 (en) |
WO (1) | WO2018211927A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7121500B2 (en) * | 2018-02-21 | 2022-08-18 | 清水建設株式会社 | Device control system and device control method |
JP2020063343A (en) | 2018-10-16 | 2020-04-23 | 日東シンコー株式会社 | Resin composition |
CN114675539B (en) * | 2022-03-29 | 2024-01-23 | 江苏希尔登家居有限公司 | Door and window intelligent control system capable of automatically learning |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6144989A (en) * | 1998-06-15 | 2000-11-07 | Dejima, Inc. | Adaptive agent-oriented software architecture |
WO2004018158A2 (en) * | 2002-08-21 | 2004-03-04 | Neal Solomon | Organizing groups of self-configurable mobile robotic agents |
KR20160030883A (en) * | 2013-07-12 | 2016-03-21 | 웬-성 리 | Smart house system and operation method therefor |
-
2017
- 2017-05-15 JP JP2017096165A patent/JP6915371B2/en active Active
-
2018
- 2018-04-25 WO PCT/JP2018/016703 patent/WO2018211927A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2018194932A (en) | 2018-12-06 |
WO2018211927A1 (en) | 2018-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6648352B2 (en) | Generating a general-purpose trained model | |
JP6915371B2 (en) | Control device, control program, learning data creation method, and learning method | |
KR102215619B1 (en) | Parallel neural processors for artificial intelligence | |
JP2019046390A (en) | Learning device, method for learning, and program | |
JP2017097585A (en) | Learning device, program, and learning method | |
JP5624562B2 (en) | Method and system for calculating website visitor ratings | |
TW202025800A (en) | System and method for disambiguation of internet-of-things devices | |
JP7172612B2 (en) | Data expansion program, data expansion method and data expansion device | |
CN114511472B (en) | Visual positioning method, device, equipment and medium | |
KR20180096469A (en) | Knowledge Transfer Method Using Deep Neural Network and Apparatus Therefor | |
JP6933167B2 (en) | Robot control device | |
JP7110884B2 (en) | LEARNING DEVICE, CONTROL DEVICE, LEARNING METHOD, AND LEARNING PROGRAM | |
CN112116589B (en) | Method, device, equipment and computer readable storage medium for evaluating virtual image | |
JP2019155561A (en) | Operation control device of robot | |
CN103218663A (en) | Information processing apparatus, information processing method, and program | |
CN111242176B (en) | Method and device for processing computer vision task and electronic system | |
WO2020202572A1 (en) | Image processing system, estimation device, processing method, and program | |
JP7556357B2 (en) | Information processing device, information processing method, and program | |
WO2022127603A1 (en) | Model processing method and related device | |
US11743396B2 (en) | Electronic album generating apparatus, electronic album generating method, and non-transitory computer-readable storage medium | |
JP2020112905A (en) | Property image classification device, property image classification method, learning method and program | |
Chatty et al. | The effect of learning by imitation on a multi-robot system based on the coupling of low-level imitation strategy and online learning for cognitive map building | |
JP2023009344A (en) | Generation method, information processing apparatus, program, and information processing system | |
JP5458791B2 (en) | Associative memory device, associative memory method, and program | |
JP7292980B2 (en) | Information management device, imaging device, control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200305 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6915371 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |