JP2018181184A - Evaluation device, evaluation method, and program therefor - Google Patents
Evaluation device, evaluation method, and program therefor Download PDFInfo
- Publication number
- JP2018181184A JP2018181184A JP2017083501A JP2017083501A JP2018181184A JP 2018181184 A JP2018181184 A JP 2018181184A JP 2017083501 A JP2017083501 A JP 2017083501A JP 2017083501 A JP2017083501 A JP 2017083501A JP 2018181184 A JP2018181184 A JP 2018181184A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- module
- learning module
- evaluation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 136
- 238000000034 method Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 28
- 230000006872 improvement Effects 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 description 48
- 238000004891 communication Methods 0.000 description 19
- 238000000605 extraction Methods 0.000 description 18
- 230000006866 deterioration Effects 0.000 description 10
- 238000004378 air conditioning Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 6
- 238000006731 degradation reaction Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000004088 simulation Methods 0.000 description 4
- 230000036772 blood pressure Effects 0.000 description 3
- 230000036760 body temperature Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
Description
本発明は、評価装置、評価方法及びそのプログラムに関する。 The present invention relates to an evaluation device, an evaluation method and a program thereof.
従来より、ニューラルネットワークの技術を用いてシステムの制御を行うことが知られている。例えば、特許文献1には、ニューラルネットワークを用いて、複数のかごの中から乗り場へ移動させるべき最適なかごを選択するエレベータシステムが開示されている。 It is known in the prior art to control a system using neural network technology. For example, Patent Document 1 discloses an elevator system that uses a neural network to select an optimal car to be moved from a plurality of cars to a landing.
また、引用文献2には、ニューラルネットワークを用いたパターン認識装置において誤認識を低減するために、ニューラルネットワークに対して追加学習を行う方法が開示されている。 Further, Patent Document 2 discloses a method of performing additional learning on a neural network in order to reduce erroneous recognition in a pattern recognition apparatus using the neural network.
ニューラルネットワークの技術を用いた制御システムでは、制御性能を向上等させるためにニューラルネットワークの追加学習を行うことがある。例えば、最初の学習時には、図11の時刻1から時刻2の期間に得られたデータからランダムに選択した学習データAを用い、その後、図11の時刻2から時刻3の期間に得られたデータからランダムに選択した学習データBを用いて追加学習を行う場合が考えられる。 In control systems using neural network technology, additional learning of neural networks may be performed to improve control performance. For example, at the time of the first learning, learning data A randomly selected from data obtained in the period of time 1 to time 2 in FIG. 11 is used, and then data obtained in the period of time 2 to time 3 in FIG. There may be a case where additional learning is performed using learning data B randomly selected from.
このような場合に、学習データの選択をランダムに行っていることに起因して、学習データBが不適切な学習データを含む場合がある。このように不適切な学習データを含む追加学習データBを用いて追加学習を行った場合、追加学習後のニューラルネットワークの制御性能は、追加学習以前のニューラルネットワークと比較して性能が劣化することがある。 In such a case, the learning data B may contain inappropriate learning data due to random selection of the learning data. As described above, when additional learning is performed using additional learning data B including inappropriate learning data, the control performance of the neural network after the additional learning is degraded compared to the neural network before the additional learning. There is.
また、時刻2から時刻3の期間において特殊なイベントが発生していた場合は、追加学習後のニューラルネットワークが、特殊なイベントに特化したものとなる可能性がある。その結果、追加学習後のニューラルネットワークの制御性能は、追加学習以前のニューラルネットワークと比較して性能が劣化してしまう恐れがある。 In addition, when a special event occurs in the period from time 2 to time 3, there is a possibility that the neural network after the additional learning becomes specialized for the special event. As a result, the control performance of the neural network after the additional learning may be degraded compared to the neural network before the additional learning.
そこで、本発明は、追加学習後に学習モジュールの制御性能が劣化した場合に対処し得る評価装置、評価方法及びそのプログラムを提供することを目的とする。 Then, this invention aims at providing the evaluation apparatus which can cope with the case where the control performance of a learning module deteriorates after additional learning, an evaluation method, and its program.
本発明の一態様に係る第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価装置は、第2の学習モジュールが達成すべき学習目標を受け付ける学習目標受付部と、少なくとも学習目標に含まれる評価項目について第2の学習モジュールの評価を行い、評価データを生成する評価部と、学習目標と評価データとを用いて、第2の学習モジュールが学習目標を達成したか否か判定する判定部と、学習目標を達成しないと判定される場合、少なくとも学習目標に基づいて、第2の学習モジュールと異なる第3の学習モジュールを取得する学習モジュール選択部とを備える。 An evaluation apparatus for evaluating a second learning module which additionally learns a first learning module according to an aspect of the present invention includes: a learning target receiving unit that receives a learning target to be achieved by the second learning module; Whether the second learning module has achieved the learning goal by using the evaluation unit that evaluates the second learning module about the evaluation items included in the goal and generates evaluation data, and the learning goal and the evaluation data A determination unit is provided, and a learning module selection unit that acquires a third learning module different from the second learning module based on at least the learning target when it is determined that the learning target is not achieved.
この態様によれば、追加学習後に学習モジュールの制御性能が学習目標を達成しなかった場合に、学習目標を達成しなかった学習モジュールを使用し続けることを回避することができるので、学習モジュールを用いるシステムの信頼性を高めることができる。例えば、学習目標を達成しなかった学習モジュールの使用を回避することで、システム全体の処理精度の低下を防ぐことができる。また、学習目標を達成しない場合に、少なくとも学習目標に基づいて、学習目標を達成しなかった学習モジュールと異なる学習モジュールを取得する構成により、学習モジュールを用いて制御を行う制御装置、評価を行う評価装置のいずれも複数の学習モジュールを保持する必要がないので、学習モジュールを記録するためのハードウェア資源を最小限にすることができる。 According to this aspect, if the control performance of the learning module does not achieve the learning goal after the additional learning, it is possible to avoid continuing to use the learning module that did not achieve the learning goal. The reliability of the system used can be increased. For example, by avoiding the use of a learning module that did not achieve the learning goal, it is possible to prevent a decrease in the processing accuracy of the entire system. In addition, when not achieving the learning goal, a control device that performs control using the learning module is evaluated, by using a configuration that acquires a learning module different from the learning module that did not achieve the learning goal based on at least the learning goal. Since none of the evaluation devices need to hold multiple learning modules, the hardware resources for recording learning modules can be minimized.
上記評価装置において、第3の学習モジュールは、第1の学習モジュールとしてもよい。この態様によれば、性能劣化前の学習モジュールを用いてシステムの制御を続行することができるので、学習モジュールを用いるシステムの安定性の低下を防ぐことができる。 In the evaluation device, the third learning module may be a first learning module. According to this aspect, since control of the system can be continued using the learning module prior to performance degradation, it is possible to prevent deterioration in the stability of the system using the learning module.
上記評価装置において、学習モジュールが学習目標を達成することができなかった要因を推定して、学習モジュールの追加学習に用いる学習データに関する要因改善データを生成する要因推定部をさらに備えてもよい。この態様によれば、性能劣化した学習モジュールから有益な情報を得ることができる。このような情報を活用することにより、学習モジュールの精度向上に必要となる学習データや処理を低減することができ、CPUの負荷を低減することができる。 The evaluation device may further include a factor estimation unit configured to estimate factor that the learning module could not achieve the learning target, and to generate factor improvement data related to learning data used for additional learning of the learning module. According to this aspect, useful information can be obtained from the degraded learning module. By utilizing such information, it is possible to reduce learning data and processing required to improve the accuracy of the learning module, and to reduce the load on the CPU.
上記評価装置において、学習モジュール選択部は、要因改善データに基づいて学習指示を生成してもよい。この態様によれば、性能劣化した学習モジュールが有する問題を克服し得る、効率的な追加学習を学習モジュールにさせることができる。この効率的な追加学習をさせた学習モジュールをシステムに用いることで、最短時間で、学習モジュールの更新による性能劣化を改善することができる。 In the above-described evaluation device, the learning module selection unit may generate a learning instruction based on the factor improvement data. According to this aspect, it is possible to cause the learning module to perform efficient additional learning, which can overcome the problem of the degraded learning module. By using the learning module that has been subjected to this efficient additional learning in the system, it is possible to improve the performance deterioration due to the updating of the learning module in the shortest time.
上記評価装置において、要因推定部は、推定した要因を出力し、推定した要因に関するユーザ入力を受信して、ユーザ入力に基づいて要因改善データを生成してもよい。この態様によれば、より信頼性の高い情報に基づいて、性能劣化要因に関する情報を生成することができる。 In the evaluation device, the factor estimation unit may output the estimated factor, receive a user input regarding the estimated factor, and generate factor improvement data based on the user input. According to this aspect, it is possible to generate the information on the performance deterioration factor based on the more reliable information.
本発明の他の態様に係る、第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価方法は、第2の学習モジュールが達成すべき学習目標を受け付ける工程と、少なくとも学習目標に含まれる評価項目について第2の学習モジュールの評価を行い、評価データを生成する工程と、学習目標と評価データとを用いて、第2の学習モジュールが学習目標を達成したか否か判定する工程と、学習目標を達成しないと判定される場合、少なくとも学習目標に基づいて、第2の学習モジュールと異なる第3の学習モジュールを取得する工程とを含む。 According to another aspect of the present invention, an evaluation method for evaluating a second learning module obtained by additionally learning a first learning module includes the steps of: receiving a learning target to be achieved by the second learning module; The second learning module is evaluated with respect to the evaluation items included in, and it is determined whether the second learning module has achieved the learning target, using the step of generating the evaluation data and the learning target and the evaluation data. And a step of acquiring a third learning module different from the second learning module based on at least the learning target if it is determined that the learning target is not achieved.
本発明の他の態様に係るプログラムは、コンピュータに、第1の学習モジュールを追加学習させた第2の学習モジュールを評価させるためのプログラムであって、第2の学習モジュールが達成すべき学習目標を受け付ける処理と、少なくとも学習目標に含まれる評価項目について第2の学習モジュールの評価を行い、評価データを生成する処理と、学習目標と評価データとを用いて、第2の学習モジュールが学習目標を達成したか否か判定する処理と、学習目標を達成しないと判定される場合、第2の学習モジュールと異なる第3の学習モジュールを取得する処理とを実行させる。 A program according to another aspect of the present invention is a program for causing a computer to evaluate a second learning module to which the first learning module is additionally learned, and a learning goal to be achieved by the second learning module. The second learning module uses the learning goal and the evaluation data to evaluate the second learning module for the process of accepting the second learning module for at least the evaluation item included in the learning goal, and the learning goal for the second learning module. And a process of acquiring a third learning module different from the second learning module when it is determined that the learning goal is not achieved.
本発明によれば、追加学習後に学習モジュールの制御性能が性能劣化した場合に対処し得る評価装置、評価方法及びそのプログラムを提供することができる。 According to the present invention, it is possible to provide an evaluation apparatus, an evaluation method, and a program thereof that can cope with the case where the control performance of the learning module degrades after the additional learning.
添付図面を参照して、本発明の実施形態について説明する。なお、以下の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施形態を採用することが可能であり、係る実施形態も本発明の範囲に含まれる。 Embodiments of the present invention will be described with reference to the accompanying drawings. The following embodiments are for the purpose of facilitating the understanding of the present invention, and are not for the purpose of limiting and interpreting the present invention. Moreover, the present invention can be variously modified without departing from the scope of the invention. Further, those skilled in the art can adopt an embodiment in which each of the elements described below is replaced with an equivalent one, and such embodiments are also included in the scope of the present invention.
(ネットワーク構成)
図1を参照して、本発明の所定の実施形態に係る学習システム1のネットワーク構成について説明する。学習システム1は、学習装置10、追加学習制御装置20、1又は複数のセンサ30及び記憶装置40を備える。学習装置10は、通信ネットワークNを介して、追加学習制御装置20、1又は複数のセンサ30及び記憶装置40に接続される。通信ネットワークNは、有線又は無線回線により構成された有線通信網及び無線通信網のいずれであってもよく、インターネットやLocal Area Network(LAN)であってよい。
(Network configuration)
A network configuration of a learning system 1 according to a predetermined embodiment of the present invention will be described with reference to FIG. The learning system 1 includes a
学習装置10は、記憶装置40に記憶された学習データに基づいて、学習モジュールの学習を行い、学習済モジュールを記憶装置40に記憶する。本実施形態に係る学習装置10は、学習モジュールを備えるが、学習モジュールは、学習装置10と別体の装置に備えられてもよい。
The
なお、学習モジュールとは、学習能力を備えた専用若しくは汎用のハードウェア若しくはソフトウェアの一単位、又は、当該ハードウェア若しくはソフトウェアの一単位の組合せを含む。当該学習を行う学習モジュールには、学習データによりすでに何らかの学習を行っているものもあれば、学習前のものも含む。ここで、学習能力とは、あるタスクの処理能力を、学習データから得られる経験に基づいて向上させることのできる能力をいう。 The learning module includes one unit of dedicated or general-purpose hardware or software having a learning ability, or a combination of one unit of the hardware or software. Some learning modules that perform the learning include those that have already performed some learning using learning data, and those that have not yet learned. Here, the learning ability refers to the ability to improve the processing ability of a certain task based on the experience obtained from the learning data.
追加学習制御装置20は、学習済モジュールを用いて、入力データの特徴に応じた出力データを出力する。本実施形態に係る追加学習制御装置20は、学習済モジュール又は当該学習済モジュールの複製物を学習装置10から取得して、学習モジュールとして設定する。追加学習制御装置20は、設定された学習モジュールを用いて出力した出力データに対する評価を行い、評価データを出力することができる。追加学習制御装置20は、設定された学習モジュールが達成すべき学習目標と評価データとを用いて、現在設定されている学習モジュールが学習目標を達成したか否か判定することができる。学習目標を達成していないと判定される場合、追加学習制御装置20は、例えば以前設定されていた学習モジュールを学習装置10から取得して、学習モジュールとして設定してもよい。なお、追加学習制御装置20は、後述する評価装置60の機能構成を備えており、評価装置60を実質的に含むものである。
The additional
なお、学習済モジュールの複製物とは、学習済モジュールの機能を再現することができる専用若しくは汎用のハードウェア若しくはソフトウェアの一単位、又は、当該ハードウェア若しくはソフトウェアの一単位の組合せを含む。 The copy of the learned module includes one unit of dedicated or general-purpose hardware or software capable of reproducing the function of the learned module, or a combination of one unit of the hardware or software.
学習済モジュールの複製物は、必ずしも学習能力を備えていなくてもよい。また、学習済モジュールの構成と、学習済モジュールの複製物の構成は、必ずしも一致していなくてもよい。また、学習済モジュールの複製物は、いわゆる蒸留によって得られる学習モジュールを含む。すなわち、学習済モジュールの複製物は、学習済モジュールの機能を保つように、学習済モジュールと構造が異なる他の学習モジュールを学習させることで得られる、学習済みの当該他の学習モジュールを含む。 The duplicate of the learned module may not necessarily have the learning ability. Also, the configuration of the learned module and the configuration of the duplicate of the learned module do not necessarily have to match. Also, a copy of the learned module includes a learning module obtained by so-called distillation. That is, the copy of the learned module includes the learned other learning module obtained by learning the learning module and another learning module having a different structure so as to maintain the function of the learned module.
ここで、当該他の学習モジュールは、学習済モジュールよりも構造が単純であってよく、よりデプロイに適したものであってよいし、当該他の学習モジュールの学習には、学習済モジュールの出力データを用いてよい。なお、学習済モジュールの複製物は、学習モジュールの学習過程において、オーバーフィッティングを防ぐ正則化の方法を変えたり、バックプロパゲーションの学習率を変えたり、重み係数の更新アルゴリズムを変えたりして得られる学習済モジュールを含む。 Here, the other learning module may be simpler in structure than the learned module and may be more suitable for deployment, and the output of the learned module may be used for learning of the other learning module. Data may be used. The copy of the learned module is obtained by changing the regularization method to prevent overfitting, changing the learning rate of back propagation, changing the algorithm of updating the weighting coefficient, or the like in the learning process of the learning module. Containing learned modules.
また、学習済モジュール又は当該学習済モジュールの複製物を取得するとは、学習済モジュールの機能を追加学習制御装置20において再現するために必要な情報を取得することをいう。例えば、学習モジュールがニューラルネットワークを含む場合、学習済モジュール又は当該学習済モジュールの複製物を取得するとは、少なくとも、ニューラルネットワークのレイヤ数、各レイヤに関するノード数、ノード間を繋ぐリンクの重みパラメータ、各ノードに関するバイアスパラメータ及び各ノードに関する活性化関数の関数形に関する情報を取得することをいう。
Further, acquiring a learned module or a duplicate of the learned module means acquiring information necessary for reproducing the function of the learned module in the additional
センサ30は、物理量を検出する物理量センサ、化学量を検出する化学量センサ、情報を検出する情報センサのいずれであってもよいが、これらに限られるものではなく、任意のセンサを含み得る。物理量センサは、例えば光を検出して画像データや動画データを出力するカメラや、人の心拍を検出して心拍データを出力する心拍センサ、人の血圧を検出して血圧データを出力する血圧センサ及び人の体温を検出して体温データを出力する体温センサ等のバイタルセンサを含み、その他任意の物理量を検出して電気的信号を出力するセンサを含む。化学量センサは、例えばガスセンサ、湿度センサ、イオンセンサを含み、その他任意の化学量を検出して電気信号を出力するセンサを含む。情報センサは、例えば統計データから特定のパターンを検出するセンサを含み、その他任意の情報を検出するセンサを含む。
The
記憶装置40は、センサ30によって出力されたセンシングデータを記憶する。また、記憶装置40は、学習装置10によって出力された学習済モジュールを記憶する。図1では、記憶装置40を単一の記憶部として示しているが、記憶装置40は、1又は複数のファイルサーバによって構成されてよい。
The
なお、図1において、学習装置10、追加学習制御装置20及び記憶装置40は、それぞれ別体として構成されているが、これらを一体として構成してもよい。すなわち、学習装置10、追加学習制御装置20及び記憶装置40の全てを一体として構成してもよく、学習装置10、追加学習制御装置20及び記憶装置40のうちの2つを選択的に一体として構成してもよい。このとき、一体として構成された、学習装置10、追加学習制御装置20及び記憶装置40の各要素間は、内部バスを介して接続される。
In addition, in FIG. 1, although the
(物理的構成:学習装置)
図2を参照して、本発明の所定の実施形態に係る学習装置10の物理的構成について説明する。学習装置10は、制御部10aと、記憶部10bと、通信部10cと、入力部10dと、表示部10eを有する。これら各構成は、バスを介して相互にデータ送受信可能に接続される。
(Physical configuration: learning device)
The physical configuration of the
制御部10aは、ハードウェアプロセッサに相当するCentral Processing Unit(CPU)、及びメモリに相当するRandom Access Memory(RAM)を含む。CPUが記憶部10bに記憶されているプログラムをRAMに展開し、RAMに展開された当該プログラムを解釈及び実行することにより、制御部10aは、後述する図4の各部として機能する。
The
なお、ハードウェアプロセッサの種類はCPUに限定されない。例えば、ハードウェアプロセッサとして、CPU、Graphics Processing Unit(GPU)、Field−programmable Gate Array(FPGA)、Digital Signal Processor(DSP)、Application Specific Integrated Circuit(ASIC)を単独で、又は、組合せて使用することができる。RAMは、データの書き換えが可能な記憶部であり、例えば半導体記憶素子で構成される。RAMは、CPUが実行するアプリケーション等のプログラムやデータを一時的に記憶する。 The type of hardware processor is not limited to the CPU. For example, using a CPU, a graphics processing unit (GPU), a field-programmable gate array (FPGA), a digital signal processor (DSP), an application specific integrated circuit (ASIC) alone or in combination as a hardware processor Can. The RAM is a storage unit in which data can be rewritten, and is formed of, for example, a semiconductor storage element. The RAM temporarily stores programs and data such as applications executed by the CPU.
記憶部10bは、例えばHard Disk Drive(HDD)やSolid State Drive(SDD)等の不揮発性の記憶媒体である。記憶部10bは、CPUが実行するプログラム及びデータを記憶する。
The
通信部10cは、学習装置10を通信ネットワークNに接続するハードウェアインタフェースである。
The
入力部10dは、ユーザからの入力を受け付けるものであり、例えば、キーボードやマウス、タッチパネルで構成される。 The input unit 10 d receives an input from the user, and is configured of, for example, a keyboard, a mouse, and a touch panel.
表示部10eは、CPUによる処理結果を視覚的に表示するものであり、例えば、Liquid Crystal Display(LCD)により構成される。
The
学習装置10は、例えば一般のパーソナルコンピュータのCPUによって本実施形態に係る学習プログラムを実行することで構成されてよい。学習プログラムは、RAMや記憶部10b等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10cにより接続される通信ネットワークNを介して提供されてもよい。これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。
The
(物理的構成:追加学習制御装置)
図3を参照して、本発明の所定の実施形態に係る追加学習制御装置20の物理的構成について説明する。追加学習制御装置20も、学習装置10と同様に、CPU及びRAMを含む制御部20a、データ等を記憶する記憶部20b、ネットワークNと接続するための通信部20c、ユーザからの入力を受け付ける入力部20d、表示部20e等を有する。これら各構成は、バスを介して相互にデータ送受信可能に接続される。CPUが記憶部20bに記憶されているプログラムをRAMに展開し、RAMに展開された当該プログラムを解釈及び実行することにより、制御部20aは、後述する図5の各部として機能する。
(Physical configuration: additional learning control device)
The physical configuration of the additional
追加学習制御装置20は、例えば一般のパーソナルコンピュータのCPUによって追加学習制御プログラムを実行することで構成されてよい。追加学習制御プログラムは、RAMや記憶部20b等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部20cにより接続される通信ネットワークNを介して提供されてもよい。
The additional
(機能構成:学習装置)
図4を参照して、本発明の所定の実施形態に係る学習装置10の機能構成について説明する。学習装置10は、学習指示受付部101、学習データ取得部102、学習制御部103、学習モジュール104、学習済モジュール出力部105及び学習済モジュール抽出部106を備える。
(Functional configuration: learning device)
The functional configuration of the
学習指示受付部101は、入力部10dを介したユーザからの学習指示、又は通信部10cを介した追加学習制御装置20からの学習指示を受け付けて、学習指示に含まれる情報を後述の学習データ取得部102に引き渡す。本実施形態では、学習指示には、学習データ取得条件、入力パラメータの指定等が含まれる。学習データ取得条件とは、学習モジュール104を学習させるための学習データとして使用できるデータのうちでも、ユーザからの学習指示を満たすために必要となる条件をいう。例えばセンサ30で取得されるデータのうち、取得日時を指定したものでもよい。入力パラメータとは、学習指示に含まれる情報のうち、学習済モジュールの制御の性能に影響を与える要因をいう。
The learning
学習データ取得部102は、学習データ取得条件を受信して、受信した学習データ取得条件に基づいて記憶装置40から学習データを取得する。
The learning
学習制御部103は、学習データ取得部102が取得した学習データを用いて、学習モジュール104を学習させる。学習制御部103は、学習指示受付部101で受け付けた学習指示に基づいて学習を完了させる。学習が完了したと判断する基準は、例えば所定個数の学習データによる学習をした場合でもよい。または学習済モジュールの制御の性能が後述の学習目標を満たした場合に、学習を完了してもよい。学習が完了すると、学習制御部103は、学習済モジュールを記憶装置40に記憶する。この際、本実施形態では、学習制御部103は、学習済モジュールを一意に識別可能な学習モジュール識別子及び学習データ取得条件と関連付けて学習済モジュールを記憶する。
The
ここで、記憶装置40に記憶される学習済モジュールは、その更新履歴がわかるようにバージョン管理されることが望ましい。バージョン管理は、学習モジュール識別子そのもので行ってもよいし、別途設けたバージョン情報で行ってもよい。
Here, it is desirable that the learned modules stored in the
学習モジュール104は、機械学習を実現するためのモジュールである。ここでは、学習モジュール104の一例としてニューラルネットワークを適用した実施例について説明する。しかしながら、ニューラルネットワークは学習モジュール104の一例にすぎず、学習装置10は、学習モジュール104として他の構成を適用してもよい。
The
学習済モジュール出力部105は、学習済モジュールと学習モジュール識別子とを例えば追加学習制御装置20のような外部に出力する。
The learned
学習済モジュール抽出部106は、学習モジュール抽出条件を受信して、受信した学習モジュール抽出条件に基づいて記憶装置40から学習済モジュールを取得する。本実施形態では、学習モジュール抽出条件には、現在設定されている学習モジュールの学習モジュール識別子、及び抽出ポイントが含まれる。抽出ポイントは、性能が劣化する前の日付や現在設定されている学習モジュールから遡るバージョンの指定等、抽出対象となる学習モジュールを指定可能な情報を含む。例えば、抽出ポイントは、「2017年12月31日以前」、「現在設定されている学習モジュールの1つ前のバージョン」とすることができる。
The learned
(機能構成:追加学習制御装置)
図5を参照して、本発明の所定の実施形態に係る追加学習制御装置20の機能構成について説明する。追加学習制御装置20は、学習済モジュール受付部201、学習モジュール202、学習目標受付部203、評価部204、判定部205、学習モジュール選択部206、要因推定部207、制御部208及びデータベース(DB)209を備える。
(Functional configuration: additional learning control device)
The functional configuration of the additional
学習済モジュール受付部201は、学習済モジュールと学習モジュール識別子とを受け付けて、受け付けた学習済モジュールを学習モジュール202として設定する。本実施形態では、学習済モジュール受付部201は、学習装置10の学習済モジュール出力部105から学習済モジュールと学習モジュール識別子とを受け付けて、受け付けた学習済モジュールを学習モジュール202として設定する。なお、学習済モジュール受付部201は、学習済モジュールを記憶装置40から受け付けて、学習モジュール202として設定してもよい。ここでは、学習モジュール202の一例としてニューラルネットワークを適用した実施例について説明する。しかしながら、ニューラルネットワークは学習モジュール202の一例にすぎず、追加学習制御装置20は、学習モジュール202として他の構成を適用してもよい。
The learned
学習目標受付部203は、入力部20dを介して、学習モジュール202が達成すべき学習目標を受け付けて、受け付けた学習目標をDB209に記憶する。本実施形態では、学習目標には、評価項目及び条件が含まれる。評価項目は、学習モジュール202を評価するための項目であり、例えば、学習モジュールが出力する出力データの精度を判断するために用いられる項目である。
The learning
条件は、評価項目に対する条件として、例えば、評価項目「制御部208が制御する装置に対する外部操作回数/日」に対して、「当該評価項目が基準値x以下」、「当該評価項目が直前に設定されていた学習モジュールより小さい」、評価項目「制御部208が制御する装置の消費電力量/月」に対して、「当該評価項目が基準値y以下」、「当該評価項目が直前に設定されていた学習モジュールより小さい」、評価項目「所定の時間内に学習モジュール202が算出した値が許容変化率を超える回数/月」に対して、「当該評価項目が基準値z以下」、「当該評価項目が直前に設定されていた学習モジュールより小さい」等とすることができる。
As the condition for the evaluation item, for example, “the evaluation item is less than or equal to the reference value x”, “the evaluation item is immediately before” with respect to the evaluation item “the number of external operations for the device controlled by the
評価部204は、記憶装置40に記憶されたセンシングデータを用いて学習モジュール202の評価を行って評価データを生成し、学習済モジュール受付部201が受け付けた学習モジュール識別子と関連付けて、生成した評価データをDB209に記憶する。本実施形態では、評価部204は、少なくとも学習目標に含まれる評価項目について評価を行い、評価データを生成することができる。評価部204は、学習モジュール202が設定されてから一定の期間の経過後に自動で評価を行うこともできるし、別途、ユーザからの評価指示を受け付けて評価を行ってもよい。例えば、評価部204は、学習目標を受け付けることに応答して、評価を行ってもよい。なお、評価部204は学習目標に含まれる評価項目の他に、予め設定された評価項目について評価を行ってもよい。
The
判定部205は、学習目標受付部203が受け付けた学習目標とDB209に記憶された評価データとを用いて、現在設定されている学習モジュールが、学習目標を達成したか否か判定する。学習目標を達成したと判定される場合、判定部205は、処理を終了する。
The
学習モジュール選択部206は、学習目標を達成していないと判定される場合に、学習装置10の学習済モジュール抽出部106に後述するとおり学習モジュール抽出条件を送信し、その応答として得られた学習済モジュールを学習モジュール202として設定する。学習モジュール選択部206が学習済モジュール抽出部106に学習モジュール抽出条件を送信することにより得られた学習済モジュールは、学習モジュール202として設定される前に、再度学習目標を達成するか評価されてもよい。
When it is determined that the learning goal is not achieved, the learning
また、学習モジュール選択部206は、後述の要因推定部207に、学習目標を達成することができなかった要因の推定を指示して、要因改善データを得てもよい。その後、要因推定部207から得られた要因改善データを用いて、学習モジュール選択部206は、学習装置10に再追加学習を指示してもよい。
The learning
要因推定部207は、現在設定されている学習モジュールが学習目標を達成していないと判定される場合に、学習目標を達成することができなかった要因を推定する。本実施形態では、要因推定部207は、学習モジュール選択部206からの指示に応答して、学習目標と記憶装置40のセンシングデータとを用いて、学習目標を達成することができなかった要因を推定する。学習目標を達成することができなかった要因を推定するために、記憶装置40のセンシングデータを統計処理する。
The
制御部208は、学習モジュール202が算出した値を用いて、制御を行う。本実施形態では学習モジュールを用いてシステムの制御を行う一例として制御を行う制御部を示すが、後述するように、本発明の実施形態は、学習モジュールを用いて処理を実行する様々なシステムに適用することができる。
The
DB209には、学習目標DB2091及び評価データDB2092が記憶される。本実施形態では、学習目標DB2091には、学習目標受付部203が受け付けた学習目標に含まれる、評価項目及び条件が記憶される。また、評価データDB2092には、評価部204が生成した評価データと評価対象である学習モジュールの学習モジュール識別子とが関連付けて記憶される。
A
(追加学習処理)
[第1実施形態]
図6のフローチャートに沿って、追加学習制御装置20によって実行される追加学習処理の第1実施形態について説明する。本発明の実施形態は、学習モジュールを用いて処理を実行する様々なシステムに適用することができ、その分野は特に限定されないが、以下の説明においては空調制御システムを例として記載する。
(Additional learning process)
First Embodiment
A first embodiment of the additional learning process performed by the additional
第1実施形態では、制御部208は例えば、空調制御部である。学習モジュール202はセンサ30によって出力された現在室温、外気温、湿度等の値や既知の日時、部屋の体積等を入力パラメータとし、室温設定値を算出する。追加学習制御装置20の制御部208は、学習モジュール202によって算出された室温設定値を用いて空調制御を行う。ここでは、制御部208が学習モジュール202を用いて実際に空調制御を行い、評価部204は、制御部208による制御結果について評価を行う実施例について説明する。しかしながら、代替として、追加学習制御装置20はシミュレーション部(図示せず)を備えてもよい。代替の実施例では、シミュレーション部が学習モジュール202を用いて空調制御を行い、評価部204は、シミュレーション部によるシミュレーション結果について評価を行うことができる。
In the first embodiment, the
また、ここでは、追加学習制御装置20が学習モジュール202及び制御部208を備えた実施例について説明するが、代替として、追加学習制御装置20とは別体の制御装置が学習モジュール及び制御部を備えてもよい。
Further, although an embodiment in which the additional
学習装置10の学習制御部103によって事前に行われた学習の結果、記憶装置40には、2010年1月1日から2012年12月31日までの期間の学習データを用いて学習したニューラルネットワーク0と、2010年1月1日から2014年12月31日までの期間の学習データを用いて学習したニューラルネットワーク1と、2010年1月1日から2016年12月31日までの期間の学習データを用いて学習したニューラルネットワーク2とが記憶されているものとする。ニューラルネットワーク0は、学習モジュール識別子0と関連付けて記憶装置40に記憶されている。ニューラルネットワーク1は、学習モジュール識別子1と関連付けて記憶装置40に記憶されている。ニューラルネットワーク2は、学習モジュール識別子2と関連付けて記憶装置40に記憶されている。
As a result of learning performed in advance by the
追加学習制御装置20は、2017年1月31日まで、ニューラルネットワーク1を学習モジュール202として設定しているものとする。記憶装置40には、センサ30によって出力されたセンシングデータが随時記憶されている。すなわち、記憶装置40には、ニューラルネットワーク1を用いて空調制御を行っていた期間中の、現在室温や外気温等の入力パラメータに関するセンシングデータ、及び室温設定値に対する外部操作回数や消費電力量等の評価項目に関するセンシングデータが記憶されている。また、評価部204によって以前行われた評価の結果、追加学習制御装置20の評価データDB2092には、ニューラルネットワーク0の評価データ0、及びニューラルネットワーク1の評価データ1が記憶されている。
It is assumed that the additional
S601において、追加学習制御装置20の学習済モジュール受付部201は、ニューラルネットワークと学習モジュール識別子とを受け付けて、受け付けたニューラルネットワークを学習モジュール202として設定する。本実施形態では、2017年2月1日に、学習済モジュール受付部201は、学習装置10の学習済モジュール出力部105から、ニューラルネットワーク2と学習モジュール識別子2と受け付けて、受け付けたニューラルネットワーク2を学習モジュール202として設定する。2017年2月1日以降、制御部208は、設定されたニューラルネットワーク2によって算出された室温設定値を用いて空調制御を行っている。その間、前述したように、記憶装置40には、ニューラルネットワーク2を用いて空調制御を行っている期間中の、センサ30によって出力されたセンシングデータが随時記憶されている。
In S601, the learned
S602において、追加学習制御装置20の学習目標受付部203は、入力部20dを介して、学習モジュール202が達成すべき学習目標を受け付けて、受け付けた学習目標をDB209の学習目標DB2091に記憶する。本実施形態では、2017年4月1日に、入力部20dを介して追加学習制御装置20の管理者から学習目標を受け付けて、学習目標受付部203は、受け付けた学習目標を学習目標DB2091に記憶する。学習目標には、評価項目「室温設定値に対する外部操作回数/日」と、条件「直前に設定されていた学習モジュールより少ない」とが含まれるものとする。
In S602, the learning
S603において、追加学習制御装置20の評価部204は、学習モジュール202の評価を行って評価データを生成し、学習済モジュール受付部201が受け付けた学習モジュール識別子と関連付けて、生成した評価データをDB209の評価データDB2092に記憶する。本実施形態では、S602で学習目標を受け付けることに応答して、評価部204は、ニューラルネットワーク2を用いて空調制御が行われた期間中に記憶装置40に記憶されたセンシングデータを用いて、ニューラルネットワーク2の評価を行う。
In step S603, the
ここで、評価部204は、S602で受け付けた学習目標に含まれる評価項目のみならず、予め設定された他の評価項目について評価を行ってもよい。このような構成とすることで、今後の学習目標において、異なる評価項目について、以前設定されていた学習モジュールとの比較条件が指定される場合に対応することができる。本実施形態では、評価部204は、学習目標に含まれる評価項目「室温設定値に対する外部操作回数/日」のみならず、予め設定された他の評価項目について評価を行って評価データ2を生成し、学習モジュール識別子2と関連付けて、評価データ2を評価データDB2092に記憶する。
Here, the
次に、S604において、追加学習制御装置20の判定部205は、S602で学習目標受付部203が受け付けた学習目標と評価データDB2092に記憶された評価データとを用いて、現在設定されている学習モジュールが、学習目標を達成したか否か判定する。学習目標を達成したと判定される場合(S604:Yes)、追加学習制御装置20は、処理を終了する。
Next, in step S604, the
本実施形態では、判定部205は、評価項目「室温設定値に対する外部操作回数/日」、及び、条件「直前に設定されていた学習モジュールより少ない」を含む学習目標と、評価データ1及び評価データ2とを用いて、ニューラルネットワーク2が、学習目標を達成したか否か判定する。その結果、学習目標を達成していないと判定され(S604:No)、処理はS605に進む。
In the present embodiment, the
S605において、追加学習制御装置20の学習モジュール選択部206は、学習装置10の学習済モジュール抽出部106に学習モジュール抽出条件を送信し、その応答として得られた学習モジュールを学習モジュール202として設定し、処理を終了する。本実施形態では、学習モジュール選択部206は、学習済モジュール抽出部106に学習モジュール抽出条件「現在設定されている学習モジュールの学習モジュール識別子:学習モジュール識別子2、抽出ポイント:現在設定されている学習モジュールの1つ前のバージョン」を送信し、応答として得たニューラルネットワーク1を学習モジュール202として設定する。
In S605, the learning
[第2実施形態]
第1実施形態では、学習目標を達成していないと判定されたニューラルネットワーク2について、更新前のバージョンであるニューラルネットワーク1に戻す例について説明した。第2実施形態では、学習目標を達成していないと判定された場合に、ニューラルネットワークをさらに追加学習させる例について説明する。
Second Embodiment
In the first embodiment, an example has been described in which the neural network 2 determined as not achieving the learning target is returned to the neural network 1 that is the version before update. In the second embodiment, an example will be described in which the neural network is additionally trained when it is determined that the learning target is not achieved.
図7は、追加学習制御装置20によって実行される追加学習処理の流れを示すフローチャートである。第2実施形態では第1実施形態と共通の事柄についての記述を省略し、異なる点についてのみ説明する。図7のS701からS705は、図6のS601からS605と同じ処理であるので、これらの処理の詳細な説明は省略する。
FIG. 7 is a flowchart showing the flow of the additional learning process performed by the additional
S706において、学習モジュール選択部206は、追加学習制御装置20の要因推定部207に、学習目標を達成することができなかった要因の推定を指示し、要因推定部207は、学習目標を達成することができなかった要因を推定する。本実施形態では、要因推定部207は、学習目標に含まれる評価項目「室温設定値に対する外部操作回数/日」について、記憶装置40のセンシングデータを用いて要因を推定する。例えば、要因推定部207は、ニューラルネットワーク2に用いた学習データの期間である2010年1月1から2016年12月31日までの期間のセンシングデータを用いて、要因を推定する。
In S706, the learning
本実施形態では、要因推定部207は、既知のアルゴリズムを使用して、例えば学習目標に含まれる評価項目「室温設定値に対する外部操作回数/日」が他の日の値から大きく外れて多かった日について、考えられるパターンを見出す。例えば、特定の期間「2016年7月1日から2016年7月31日まで」において「室温設定値に対する外部操作回数/日」が多いというパターンを見出したものとする。なお、パターンについては期間によるものだけでなく、入力パラメータに含まれる外気温、湿度等の値が所定の値と異なる値が続いたときに、「入力パラメータの値」が大きい又は少ないというパターンを見出してもよい。また、入力パラメータに含まれる部屋の体積が変わっていた場合に、「部屋の体積」が変化したというパターンを見出してもよい。
In the present embodiment, the
S707において、要因推定部207は、外れ値のパターンを見出したか否か判定する。外れ値のパターンを見出していない場合(S707:No)、追加学習制御装置20は処理を終了する。一方、外れ値のパターンを見出した場合(S707:Yes)、S708に進み、要因推定部207は、見出した外れ値のパターンを出力してもよい。本実施形態では、図8に示されるように、見出した外れ値のパターンを示すテキスト801「2016年7月1日から2016年7月31日において、室温設定値に対する外部操作回数/日が多い。」、パターンが性能劣化要因か否かを設定する性能劣化要因ラジオボタン802、詳細設定ボタン803、及び決定ボタン804を含む要因確定画面を出力する。詳細設定ボタンについては後述する。
In S 707, the
S709において、要因推定部207は、ユーザ入力を受信したか否か判定する。ユーザ入力を受信した場合、S710に進み、要因推定部207は、ユーザ入力に基づいて要因改善データを生成し、生成した要因改善データを学習モジュール選択部206に戻す。要因改善データには、S708において要因推定部207が出力した外れ値のパターンのうち、性能劣化要因ラジオボタン802で性能劣化要因として選択されること等により、学習データに含めることが望ましくないことが指示されたパターンが含まれる。
In step S709, the
本実施形態では、追加学習制御装置20の管理者は、2016年7月1日から2016年7月31日までの期間において室内工事が行われていたことを確認し、S708において出力された画面において、性能劣化要因ラジオボタン802で性能劣化要因として選択し、決定ボタン804を押下したものとする。その結果、要因推定部207は、受信したユーザ入力に基づいて要因改善データ「2016年7月1日から2016年7月31日までの期間を除く」を生成し、生成した要因改善データを学習モジュール選択部206に戻す。
In the present embodiment, the administrator of the additional
S711において、学習モジュール選択部206は、要因改善データに基づいて学習指示を生成し、生成した学習指示を学習装置10の学習指示受付部101に送信して、処理を終了する。本実施形態では、学習モジュール選択部206は、「学習データ取得条件:2010年1月1日から2016年12月31日まで、2016年7月1日から2016年7月31日までの期間を除く」を含む学習指示を学習指示受付部101に送信する。
In S711, the learning
なお、本実施形態では、S707で外れ値のパターンを見出したと判定される場合に、S710でユーザの入力に基づいて要因改善データを生成したが、S708からS710を省略してユーザの入力を受け付けることなく、要因推定部207が、見出した外れ値のパターンに基づいて要因改善データを生成してもよい。
In the present embodiment, when it is determined that the outlier pattern is found in S707, the factor improvement data is generated based on the user's input in S710, but S708 to S710 are omitted and the user's input is accepted. Instead, the
このようにすることで、学習装置10は、受信した学習指示に基づいて、ニューラルネットワークをさらに追加学習させることができる。本実施形態では、学習装置10は、2016年7月1日から2016年7月31日までの期間を除く学習データを用いて、ニューラルネットワーク1をさらに追加学習させることができる。
By doing this, the
[第3実施形態]
第2実施形態では、学習目標を達成していないと判定された場合に、学習データに含めることが望ましくないデータを除外して、ニューラルネットワークをさらに追加学習させる例について説明した。第3実施形態では、学習目標を達成していないと判定された場合に、ニューラルネットワークに対してさらに学習させるべきデータを追加して、ニューラルネットワークを追加学習させる例について説明する。
Third Embodiment
In the second embodiment, an example has been described in which, when it is determined that the learning target is not achieved, data that is not desirable to be included in the learning data is excluded and the neural network is additionally learned. In the third embodiment, an example will be described in which, when it is determined that the learning target is not achieved, data to be learned further is added to the neural network to additionally learn the neural network.
図7を参照して、第3実施形態について説明する。第3実施形態においても、第1実施形態及び第2実施形態と共通の事柄についての記述を省略し、異なる点についてのみ説明する。図7のS701からS705までは、第1実施形態と同じ処理であるので、これらの処理の詳細な説明は省略する。 A third embodiment will be described with reference to FIG. Also in the third embodiment, descriptions of matters in common with the first embodiment and the second embodiment will be omitted, and only differences will be described. Since S701 to S705 in FIG. 7 are the same processes as in the first embodiment, detailed description of these processes is omitted.
S706において、要因推定部207は、学習目標を達成することができなかった要因を推定する。本実施形態では、特定の時間帯「毎週土曜日の8時から9時」において「室温設定値に対する外部操作回数」が多いというパターンを見出したものとする。なお、パターンについては期間によるものだけでなく、入力パラメータに含まれる外気温、湿度等の値が所定の値と異なる値が続いたときに、「入力パラメータの値」が大きい又は少ないというパターンを見出してもよい。また、入力パラメータに含まれる部屋の体積が変わっていた場合に、「部屋の体積」が変化したというパターンを見出してもよい。
In S706, the
S707において、要因推定部207は、外れ値のパターンを見出したか否か判定する。本実施形態では、外れ値のパターンを見出したのでS708に進み、要因推定部207は、見出した外れ値のパターンを出力してもよい。本実施形態では、見出した外れ値のパターンを示すテキスト801「毎週土曜日の8時から9時において、室温設定値に対する外部操作が多い。」、性能劣化要因ラジオボタン802、詳細設定ボタン803、及び決定ボタン804を含む要因確定画面を出力する。
In S 707, the
本実施形態では、追加学習制御装置20の管理者は、毎週土曜日は平日よりも少ない数のユーザが部屋を利用することから、室温設定値を平日と比較して高く設定することが望ましいことを確認し、S709において出力された画面において、性能劣化要因ラジオボタン802で非性能劣化要因として選択し、詳細設定ボタン803を押下したものとする。例えば詳細設定ボタン803を押下することにより、詳細設定画面が表示され、管理者は、この詳細設定画面において入力パラメータの調整を行ってもよい。代替として、追加学習制御装置20が、入力パラメータの調整を行ってもよい。
In the present embodiment, the administrator of the additional
S709において、要因推定部207は、ユーザ入力を受信したか否か判定する。本実施形態では、管理者が、詳細設定画面において入力パラメータの調整をし、その後、決定ボタン804を押下したものとする。その結果、処理はS710に進み、要因推定部207は、ユーザ入力に基づいて要因改善データを生成し、生成した要因改善データを学習モジュール選択部206に戻す。本実施形態では、要因改善データには、詳細設定画面で指定された入力パラメータに関する設定が含まれる。
In step S709, the
S711において、学習モジュール選択部206は、要因改善データに基づいて学習指示を生成し、生成した学習指示を学習装置10の学習指示受付部101に送信して、処理を終了する。本実施形態では、学習モジュール選択部206は、詳細設定画面で指定された入力パラメータに関する設定を含む学習指示を学習指示受付部101に送信する。
In S711, the learning
なお、本実施形態では、S707で外れ値のパターンを見出したと判定される場合に、S710でユーザの入力に基づいて要因改善データを生成したが、S708からS710を省略してユーザの入力を受け付けることなく、要因推定部207が、見出した外れ値のパターンに基づいて要因改善データを生成してもよい。
In the present embodiment, when it is determined that the outlier pattern is found in S707, the factor improvement data is generated based on the user's input in S710, but S708 to S710 are omitted and the user's input is accepted. Instead, the
このようにすることで、学習装置10は、受信した学習指示に基づいて、ニューラルネットワークをさらに追加学習させることができる。本実施形態では、学習装置10は、追加学習制御装置20が見出したパターンが性能劣化要因ではなく、ニューラルネットワークにさらに学習させるべきパターンである場合に、追加の学習データを用いて、ニューラルネットワーク2をさらに追加学習させることができる。
By doing this, the
[別の実施形態]
上述したとおり、別の実施形態では、図9に示されるように、学習システム1は、学習済モジュール受付部201と、学習モジュール202と、制御部208とを備えた制御装置50を備えてもよい。学習システム1が制御装置50を備える本実施形態では、学習システム1は、学習目標受付部203、評価部204、判定部205、学習モジュール選択部206、要因推定部207及びDB209を備えた評価装置60を備える。前述したように、追加学習制御装置20は、評価装置60を含む。
Another Embodiment
As described above, in another embodiment, as illustrated in FIG. 9, the learning system 1 includes the
評価装置60は、図10に示されるように、CPU及びRAMを含む制御部60a、DB209のデータ等を記憶する記憶部60b、ネットワークNと接続するための通信部60c、ユーザからの入力を受け付ける入力部60d、表示部60e等を備えている。これら各構成は、バスを介して相互にデータ送受信可能に接続される。CPUが記憶部に記憶されているプログラムをRAMに展開し、RAMに展開された当該プログラムを解釈及び実行することにより、制御部60aは、図9の各部として機能する。
As shown in FIG. 10, the
評価装置60は、例えば一般のパーソナルコンピュータのCPUによって追加学習プログラムを実行することで構成されてよい。追加学習プログラムは、RAMや記憶部60b等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部により接続される通信ネットワークNを介して提供されてもよい。
The
本明細書において説明した各処理を実施するプログラムは、記録媒体に記憶させてもよい。この記録媒体を用いれば、コンピュータに上記プログラムをインストールすることにより、当該コンピュータを評価装置60又は追加学習制御装置20として機能させることができる。ここで、上記プログラムを記憶した記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は特に限定されないが、例えば、CD−ROM等の記録媒体であってもよい。
A program for performing each process described in the present specification may be stored in a recording medium. If this recording medium is used, the computer can be made to function as the
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。 Some or all of the above embodiments may be described as in the following appendices, but are not limited to the following.
(付記1)
少なくとも1つのメモリと、前記メモリと接続された少なくとも1つのハードウェアプロセッサとを備えた、第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価装置であって、
前記ハードウェアプロセッサが、
前記第2の学習モジュールが達成すべき学習目標を受け付け、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成し、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定し、
前記学習目標を達成しないと判定される場合、少なくとも前記学習目標に基づいて、前記第2の学習モジュールと異なる第3の学習モジュールを取得する、
評価装置。
(Supplementary Note 1)
An evaluation device for evaluating a second learning module additionally learning a first learning module, comprising: at least one memory and at least one hardware processor connected to the memory.
The hardware processor is
Accepting a learning goal to be achieved by the second learning module;
Evaluating the second learning module with respect to at least an evaluation item included in the learning target to generate evaluation data;
Using the learning goal and the evaluation data, determine whether the second learning module has achieved the learning goal,
When it is determined that the learning goal is not achieved, a third learning module different from the second learning module is acquired based on at least the learning goal.
Evaluation device.
(付記2)
第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価方法であって、
少なくとも1つ以上のハードウェアプロセッサによって、前記第2の学習モジュールが達成すべき学習目標を受け付け、
前記ハードウェアプロセッサによって、少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成し、
前記ハードウェアプロセッサによって、前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定し、
前記学習目標を達成しないと判定される場合、少なくとも前記学習目標に基づいて、前記第2の学習モジュールと異なる第3の学習モジュールを取得する、
評価方法。
(Supplementary Note 2)
An evaluation method for evaluating a second learning module obtained by additionally learning a first learning module, comprising:
The second learning module receives the learning goal to be achieved by the at least one hardware processor;
The hardware processor evaluates the second learning module for at least an evaluation item included in the learning target, and generates evaluation data.
The hardware processor uses the learning goal and the evaluation data to determine whether the second learning module has achieved the learning goal.
When it is determined that the learning goal is not achieved, a third learning module different from the second learning module is acquired based on at least the learning goal.
Evaluation method.
1…学習システム、10…学習装置、10a…制御部、10b…記憶部、10c…通信部、10d…入力部、10e…表示部、101…学習指示受付部、102…学習データ取得部、103…学習制御部、104…学習モジュール、105…学習済モジュール出力部、106…学習済モジュール抽出部、20…追加学習制御装置、20a…制御部、20b…記憶部、20c…通信部、20d…入力部、20e…表示部、201…学習済モジュール受付部、202…学習モジュール、203…学習目標受付部、204…評価部、205…判定部、206…学習モジュール選択部、207…要因推定部、208…制御部、209…DB、2091…学習目標DB、2092…評価データDB、30…センサ、40…記憶装置、50…制御装置、60…評価装置、60a…制御部、60b…記憶部、60c…通信部、60d…入力部、60e…表示部、801…テキスト、802…性能劣化要因ラジオボタン、803…詳細設定ボタン、804…決定ボタン
DESCRIPTION OF SYMBOLS 1 ... Learning system, 10 ... Learning apparatus, 10a ... Control part, 10b ... Storage part, 10c ... Communications part, 10d ... Input part, 10e ... Display part, 101 ... Learning instruction reception part, 102 ... Learning data acquisition part, 103 ... learning control unit, 104 ... learning module, 105 ... learned module output unit, 106 ... learned module extraction unit, 20 ... additional learning control device, 20a ... control unit, 20b ... storage unit, 20c ... communication unit, 20d ...
Claims (7)
前記第2の学習モジュールが達成すべき学習目標を受け付ける学習目標受付部と、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成する評価部と、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定する判定部と、
前記学習目標を達成しないと判定される場合、少なくとも前記学習目標に基づいて、前記第2の学習モジュールと異なる第3の学習モジュールを取得する学習モジュール選択部と
を備えた評価装置。 An evaluation apparatus for evaluating a second learning module that additionally learns a first learning module, comprising:
A learning target receiving unit that receives a learning target to be achieved by the second learning module;
An evaluation unit that evaluates the second learning module with respect to at least an evaluation item included in the learning target, and generates evaluation data;
A determination unit that determines whether the second learning module has achieved the learning target, using the learning target and the evaluation data;
A learning module selection unit that acquires a third learning module different from the second learning module based on at least the learning target when it is determined that the learning target is not achieved.
前記第2の学習モジュールが達成すべき学習目標を受け付ける工程と、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成する工程と、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定する工程と、
前記学習目標を達成しないと判定される場合、少なくとも前記学習目標に基づいて、前記第2の学習モジュールと異なる第3の学習モジュールを取得する工程と
を含む評価方法。 It is an evaluation method which evaluates the 2nd learning module which made the 1st learning module additionally learn, and a computer provided with a control part is
Receiving a learning goal to be achieved by the second learning module;
Evaluating the second learning module with respect to at least an evaluation item included in the learning target to generate evaluation data;
Determining whether the second learning module has achieved the learning goal using the learning goal and the evaluation data;
Obtaining a third learning module different from the second learning module based on at least the learning target, when it is determined that the learning target is not achieved.
前記第2の学習モジュールが達成すべき学習目標を受け付ける処理と、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成する処理と、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定する処理と、
前記学習目標を達成しないと判定される場合、前記第2の学習モジュールと異なる第3の学習モジュールを取得する処理と
を実行させるプログラム。 A program for causing a computer to evaluate a second learning module that additionally learns a first learning module,
A process of receiving a learning goal to be achieved by the second learning module;
A process of evaluating the second learning module for at least an evaluation item included in the learning target, and generating evaluation data;
A process of determining whether the second learning module has achieved the learning goal using the learning goal and the evaluation data;
A program for executing a process of acquiring a third learning module different from the second learning module when it is determined that the learning goal is not achieved.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017083501A JP6917004B2 (en) | 2017-04-20 | 2017-04-20 | Evaluation device, evaluation method and its program |
PCT/JP2018/015244 WO2018193934A1 (en) | 2017-04-20 | 2018-04-11 | Evaluation apparatus, evaluation method, and program therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017083501A JP6917004B2 (en) | 2017-04-20 | 2017-04-20 | Evaluation device, evaluation method and its program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018181184A true JP2018181184A (en) | 2018-11-15 |
JP6917004B2 JP6917004B2 (en) | 2021-08-11 |
Family
ID=62111150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017083501A Active JP6917004B2 (en) | 2017-04-20 | 2017-04-20 | Evaluation device, evaluation method and its program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6917004B2 (en) |
WO (1) | WO2018193934A1 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020091653A (en) * | 2018-12-05 | 2020-06-11 | オムロン株式会社 | Sensor system |
JP2020154785A (en) * | 2019-03-20 | 2020-09-24 | 富士通株式会社 | Prediction method, prediction program, and model learning method |
JP6984780B1 (en) * | 2021-06-30 | 2021-12-22 | 富士電機株式会社 | Information processing equipment, information processing system and information processing method |
KR102616968B1 (en) * | 2023-07-13 | 2023-12-27 | 주식회사 마키나락스 | Method for determining whether to additionally train anomaly detection model and determining adequacy of training data |
JP7423484B2 (en) | 2020-09-16 | 2024-01-29 | 株式会社東芝 | Learning devices, methods and programs |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112511368A (en) * | 2020-10-16 | 2021-03-16 | 深圳市科漫达智能管理科技有限公司 | Service heartbeat monitoring method and related device |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0922402A (en) * | 1995-05-01 | 1997-01-21 | Fuji Electric Co Ltd | Estimating method for daily maximum power demanded |
US6269351B1 (en) * | 1999-03-31 | 2001-07-31 | Dryken Technologies, Inc. | Method and system for training an artificial neural network |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962648A (en) | 1995-08-22 | 1997-03-07 | Mitsubishi Electric Corp | Pattern recognition device |
JP4552464B2 (en) | 2004-03-09 | 2010-09-29 | フジテック株式会社 | Elevator system and group management control device thereof |
US10460274B2 (en) * | 2013-11-18 | 2019-10-29 | Bidgely Inc. | Energy disaggregation techniques for whole-house energy consumption data |
US10443577B2 (en) * | 2015-07-17 | 2019-10-15 | General Electric Company | Systems and methods for improved wind power generation |
-
2017
- 2017-04-20 JP JP2017083501A patent/JP6917004B2/en active Active
-
2018
- 2018-04-11 WO PCT/JP2018/015244 patent/WO2018193934A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0922402A (en) * | 1995-05-01 | 1997-01-21 | Fuji Electric Co Ltd | Estimating method for daily maximum power demanded |
US6269351B1 (en) * | 1999-03-31 | 2001-07-31 | Dryken Technologies, Inc. | Method and system for training an artificial neural network |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020091653A (en) * | 2018-12-05 | 2020-06-11 | オムロン株式会社 | Sensor system |
JP7097006B2 (en) | 2018-12-05 | 2022-07-07 | オムロン株式会社 | Sensor system |
JP2020154785A (en) * | 2019-03-20 | 2020-09-24 | 富士通株式会社 | Prediction method, prediction program, and model learning method |
JP7279445B2 (en) | 2019-03-20 | 2023-05-23 | 富士通株式会社 | Prediction method, prediction program and information processing device |
JP7423484B2 (en) | 2020-09-16 | 2024-01-29 | 株式会社東芝 | Learning devices, methods and programs |
JP6984780B1 (en) * | 2021-06-30 | 2021-12-22 | 富士電機株式会社 | Information processing equipment, information processing system and information processing method |
JP2023006548A (en) * | 2021-06-30 | 2023-01-18 | 富士電機株式会社 | Information processing apparatus, information processing system, and information processing method |
KR102616968B1 (en) * | 2023-07-13 | 2023-12-27 | 주식회사 마키나락스 | Method for determining whether to additionally train anomaly detection model and determining adequacy of training data |
Also Published As
Publication number | Publication date |
---|---|
WO2018193934A1 (en) | 2018-10-25 |
JP6917004B2 (en) | 2021-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018181184A (en) | Evaluation device, evaluation method, and program therefor | |
US11170320B2 (en) | Updating machine learning models on edge servers | |
CN110276446B (en) | Method and device for training model and selecting recommendation information | |
US11062215B2 (en) | Using different data sources for a predictive model | |
US9600149B2 (en) | Display processing system, display processing method, and information storage medium | |
CN103699233B (en) | Character string input method and input unit | |
CN110674019A (en) | Method and device for predicting system fault and electronic equipment | |
JP6718500B2 (en) | Optimization of output efficiency in production system | |
US20200089653A1 (en) | Artificial intelligence device | |
US11847496B2 (en) | System and method for training and selecting equivalence class prediction modules for resource usage prediction | |
JP5264813B2 (en) | Evaluation apparatus, evaluation method, and evaluation program | |
JP6058571B2 (en) | Necessary personnel number calculation device, necessary personnel number calculation method and program | |
CN112131274B (en) | Method, device, equipment and readable storage medium for detecting abnormal points of time sequence | |
WO2021039797A1 (en) | Click rate prediction model construction device | |
US20160125290A1 (en) | Combined discrete and incremental optimization in generating actionable outputs | |
KR20230035750A (en) | Methodes, devices and systems for tailored interior design and providing quote information | |
JP2019036116A (en) | Decision device, decision method, and decision program | |
JP2017121017A (en) | Equipment control system and equipment control method | |
JP6558860B2 (en) | Estimation device, prediction device, method, and program | |
CN112217585A (en) | Signal path determination method and device, computer equipment and storage medium | |
US20230137400A1 (en) | Smart dialing recommendation method, non-transitory computer-readable medium, and mobile device | |
JP7470569B2 (en) | Estimation model construction device | |
KR102445230B1 (en) | A method for learning a task model and a language model, and a learning device for performing the same | |
US11693989B2 (en) | Computer-implemented methods and nodes implementing performance estimation of algorithms during evaluation of data sets using multiparty computation based random forest | |
JP6924878B1 (en) | Cloud service evaluation system, cloud service evaluation method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6917004 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |