JP2023165464A - Machine learning model update device, machine learning model update method, and machine learning model update program - Google Patents
Machine learning model update device, machine learning model update method, and machine learning model update program Download PDFInfo
- Publication number
- JP2023165464A JP2023165464A JP2022076480A JP2022076480A JP2023165464A JP 2023165464 A JP2023165464 A JP 2023165464A JP 2022076480 A JP2022076480 A JP 2022076480A JP 2022076480 A JP2022076480 A JP 2022076480A JP 2023165464 A JP2023165464 A JP 2023165464A
- Authority
- JP
- Japan
- Prior art keywords
- learning model
- update
- data
- learning
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims description 29
- 238000011156 evaluation Methods 0.000 claims abstract description 47
- 238000004364 calculation method Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000013450 outlier detection Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
Description
本発明は、機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムに関する。 The present invention relates to a machine learning model updating device, a machine learning model updating method, and a machine learning model updating program.
機械学習を用いた推論装置は、推論の結果を改善するために学習モデルの更新を行う。例えば、推論に用いられる運用データを利用して学習モデルを更新するか否かの判断を行うことがある。特許文献1の装置は、複数のサンプルの集合である運用データを平均と分散とによって評価する。特許文献1の装置は、平均と分散とによる評価値を用いて、学習モデルを更新するか否かの判定を行う。
An inference device using machine learning updates a learning model to improve inference results. For example, it may be determined whether or not to update a learning model using operational data used for inference. The device disclosed in
例えば、特許文献1は、機械学習モデルを更新する機能を持った装置を開示する。この装置は、指標値の算出と、指標値の算出と、学習モデル更新と、をこの順に実行する。
For example,
運用データは、必ずしも正規分布に従うとは限らない。運用データが正規分布に従う場合には、平均と分散とによって複数のサンプルの集合を適切に評価できる。したがって、学習モデルを更新するか否かの判断を適切に実行できる。しかし、運用データが正規分布に従わない場合には、平均と分散とによって複数のサンプルの集合を適切に評価できない。その結果、学習モデルを更新するか否かの判断を適切に実行できないことが生じる。 Operational data does not necessarily follow a normal distribution. When operational data follows a normal distribution, a set of multiple samples can be appropriately evaluated using the mean and variance. Therefore, it is possible to appropriately determine whether or not to update the learning model. However, if the operational data does not follow a normal distribution, a set of multiple samples cannot be appropriately evaluated based on the mean and variance. As a result, it may not be possible to appropriately determine whether or not to update the learning model.
本発明は、学習モデルを更新するか否かの判断を適切に実行できる機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムを提供する。 The present invention provides a machine learning model updating device, a machine learning model updating method, and a machine learning model updating program that can appropriately determine whether to update a learning model.
本発明の一形態である機械学習モデル更新装置は、運用データを受ける入力手段と、運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価する評価手段と、評価手段の結果を利用して第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得る算出手段と、更新判定指標値が更新条件を満たす場合に、第1の学習モデルを第2の学習モデルに更新する更新手段と、を備える。 A machine learning model updating device that is an embodiment of the present invention includes an input means for receiving operational data and elements constituting the operational data, which are included in a first learning data set used for learning a first learning model. an evaluation means for evaluating whether or not the first learning model is updated to the second learning model; and a calculation means for obtaining an update determination index value for determining whether to update the first learning model to the second learning model using the results of the evaluation means. and updating means for updating the first learning model to the second learning model when the update determination index value satisfies the update condition.
機械学習モデル更新装置は、運用データを構成する要素ごとに、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを、第1の学習モデルを第2の学習モデルに更新するか否かの条件として用いる。要素ごとに学習データの集合に内包されるか否を評価することによれば、運用データに含まれる要素の分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。つまり、機械学習モデル更新装置は、学習モデルを更新するか否かの判断を適切に実行できる。 The machine learning model update device updates the first learning model with the second learning model to determine whether each element constituting the operational data is included in the first learning data set used for learning the first learning model. This is used as a condition for whether or not to update to the learning model. By evaluating whether each element is included in the set of learning data, it is possible to determine which aspects need to be updated and which ones do not need to be updated, regardless of the distribution of elements included in the operational data. Able to appropriately judge aspects. In other words, the machine learning model updating device can appropriately determine whether to update the learning model.
上記の機械学習モデル更新装置の更新手段は、更新判定指標値を利用して第1の学習モデルを第2の学習モデルに更新するか否かを判定する更新判定手段と、運用データを利用して第1の学習データを第2の学習データに更新する学習データ更新手段と、第2の学習データを用いて第1の学習モデルを第2の学習モデルに更新する学習モデル更新手段と、を有してもよい。この構成によれば、第1の学習モデルを第2の学習モデルに好適に更新することができる。 The updating means of the machine learning model updating device described above includes an update judgment means that uses an update judgment index value to judge whether or not to update the first learning model to a second learning model, and an update judgment means that uses operational data. learning data updating means for updating the first learning data to the second learning data; and learning model updating means for updating the first learning model to the second learning model using the second learning data. May have. According to this configuration, the first learning model can be suitably updated to the second learning model.
上記の機械学習モデル更新装置の評価手段は、要素ごとに第1の学習データの集合に内包されるか否かを評価した結果、要素が第1の学習データの集合に内包されない場合には、第1の学習データの集合に内包されないことを示すフラグを要素に付してもよい。この構成によれば、フラグの有無に基づく更新の判断を行うことが可能になる。 The evaluation means of the machine learning model updating device described above evaluates whether or not each element is included in the first set of learning data, and if the element is not included in the first set of learning data, A flag indicating that the element is not included in the first learning data set may be attached to the element. According to this configuration, it is possible to determine whether to update based on the presence or absence of the flag.
上記の機械学習モデル更新装置の評価手段は、第1の学習データの集合から要素までの距離に基づいて内包されるか否かを評価してもよい。この構成によれば、フラグの有無に基づく更新の判断を行うことが可能になる。 The evaluation means of the machine learning model updating device described above may evaluate whether or not an element is included based on the distance from the first learning data set to the element. According to this configuration, it is possible to determine whether to update based on the presence or absence of the flag.
上記の機械学習モデル更新装置の算出手段は、運用データが含む要素の総数に対するフラグが付された要素の数の割合を、更新判定指標値として得てもよい。この構成によれば、更新の判断を容易に行うことが可能になる。 The calculation means of the machine learning model updating device described above may obtain the ratio of the number of flagged elements to the total number of elements included in the operational data as the update determination index value. According to this configuration, it becomes possible to easily determine whether to update.
上記の機械学習モデル更新装置における更新条件は、閾値であってもよい。更新判定手段は、更新判定指標値が閾値を超えた場合に、第1の学習モデルを第2の学習モデルに更新すると判定してもよい。この構成によれば、更新の判断をさらに容易に行うことが可能になる。 The update condition in the above machine learning model update device may be a threshold value. The update determination means may determine to update the first learning model to the second learning model when the update determination index value exceeds a threshold value. According to this configuration, it becomes possible to make an update determination more easily.
本発明の別の形態である機械学習モデル更新方法は、運用データを受けるステップと、運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、評価することの結果を利用して第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、更新判定指標値が更新条件を満たす場合に、第1の学習モデルを第2の学習モデルに更新するステップと、を含む。機械学習モデル更新方法は、機械学習モデル更新装置と同様に、運用データに含まれる要素の分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。 Another aspect of the present invention is a machine learning model updating method, in which the step of receiving operational data and the elements constituting the operational data are included in a first learning data set used for learning a first learning model. and a step of obtaining an update determination index value for determining whether to update the first learning model to the second learning model using the result of the evaluation. , updating the first learning model to the second learning model when the update determination index value satisfies the update condition. Similar to the machine learning model update device, the machine learning model update method appropriately distinguishes between aspects that need to be updated and aspects that do not need to be updated, regardless of the distribution of elements included in operational data. I can judge.
本発明のさらに別の形態である機械学習モデル更新プログラムは、運用データを受けるステップと、運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、評価することの結果を利用して第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、更新判定指標値が更新条件を満たす場合に、第1の学習モデルを第2の学習モデルに更新するステップと、をコンピュータに実行させる。機械学習モデル更新プログラムも、機械学習モデル更新装置と同様に、運用データに含まれる要素の分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。 A machine learning model update program according to yet another embodiment of the present invention includes a step of receiving operational data and elements constituting the operational data included in a first learning data set used for learning the first learning model. and a step of obtaining an update determination index value for determining whether to update the first learning model to the second learning model using the results of the evaluation. and updating the first learning model to the second learning model when the update determination index value satisfies the update condition. Similar to the machine learning model update device, the machine learning model update program also appropriately identifies aspects that need to be updated and aspects that do not need to be updated, without being influenced by the distribution of elements included in operational data. I can judge.
本発明の機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムは、学習モデルを更新するか否かの判断を適切に実行できる。 The machine learning model updating device, the machine learning model updating method, and the machine learning model updating program of the present invention can appropriately determine whether to update a learning model.
以下、添付図面を参照して、実施形態に係る機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムを詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。 Hereinafter, a machine learning model updating device, a machine learning model updating method, and a machine learning model updating program according to embodiments will be described in detail with reference to the accompanying drawings. In addition, in the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description will be omitted.
図1は、機械学習モデル更新装置1の利用例を示す機能ブロック図である。機械学習モデル更新装置1は、例えば、対象設備201の監視又は制御に用いられる。対象設備201には、複数のセンサ202、203、204が設けられている。例えば、センサ202は、温度を計測する。センサ203は、圧力を計測する。センサ204は、流量を計測する。センサ202、203、204は、計測した値を情報提供装置100に出力する。
FIG. 1 is a functional block diagram showing an example of how the machine learning
センサ202、203、204から情報提供装置100に渡される情報を、「運用データC」と称する。つまり、運用データCは、時間と関連付けられた少なくとも1種類の計測値を含む。図1の例示では、運用データCは、温度と時間とが関連づけられたデータと、圧力と時間とが関連づけられたデータと、流量と時間とが関連づけられたデータと、を含む。さらに、例えば、温度と時間とが関連づけられたデータとは、ある時間に計測された温度の値を複数含む。つまり、データは、複数の数値を含む。これらの温度、流量及び圧力を示すひとつひとつの数値を、「サンプル」(要素)と称する。
The information passed from the
情報提供装置100は、運用データCを用いて、対象設備201に関する値を推論し、推論した結果を出力する。例えば、対象設備201に関する値は、対象設備201の稼働状況を監視するための値であってもよい。この場合には、情報提供装置100は、推論結果Rをディスプレイといった外部装置206に出力する。また、情報提供装置100は、推論結果Rを通信回線を通じて上流側の装置に送信してもよい。
The
対象設備201に関する値は、対象設備201の監視に用いられるものに限定されない。対象設備201に関する値は、対象設備201の制御のための値であってもよい。この場合には、情報提供装置100は、推論結果Rをコントローラ205に出力する。コントローラ205は、推論結果Rを用いて制御信号Hを生成する。そして、コントローラ205は、制御信号Hを対象設備201に出力する。
The values related to the
情報提供装置100は、機械学習モデル更新装置1と、記憶装置2と、推論装置3と、を有する。これらの機能ブロックは、コンピュータ300(図2参照)にて機械学習モデル更新プログラムPGを実行することによって実現される。
The
機械学習モデル更新装置1は、いわゆる学習済みモデルを生成する。以下、学習済みモデルは、単に「学習モデルM」と称する。機械学習モデル更新装置1は、例えば、運用データCを利用して学習モデルMを生成する。機械学習モデル更新装置1が実行する学習モデルMの生成とは、最初の学習モデルMを生成する動作を含む。最初の学習モデルMを生成する動作は、例えば、学習フェーズと称する。さらに、機械学習モデル更新装置1が実行する学習モデルMの生成とは、既に生成された学習モデルMを更新することによって新たな学習モデルMを生成する動作も含む。学習モデルMを更新する動作は、例えば、更新フェーズと称する。機械学習モデル更新装置1は、生成した学習モデルMを記憶装置2に出力する。
The machine learning
記憶装置2は、学習モデルMを記憶する。なお、記憶装置2は、学習モデルMとは別の様々な情報を記憶してよい。
The
推論装置3は、学習モデルMと運用データCとを用いて、対象設備201に関する値を推論する。対象設備201に関する値を推論する動作は、推論フェーズと称する。推論装置3は、推論結果Rをコントローラ205や外部装置206に出力する。
The inference device 3 uses the learning model M and the operational data C to infer values regarding the
図2を参照して、機械学習モデル更新装置1のハードウェア構成について説明する。機械学習モデル更新装置1は、例えば、コンピュータ300によって機械学習モデル更新プログラムPGが実行されることによって実現される。機械学習モデル更新プログラムPGは、コンピュータ300に機械学習モデル更新方法を実行させるためのものである。
The hardware configuration of the machine learning
機械学習モデル更新装置1は、1又は複数のコンピュータ300を含む。コンピュータ300は、プロセッサであるCPU(Central Processing Unit)301と、主記憶部302と、補助記憶部303と、通信制御部304と、入力装置305と、出力装置306とを有する。機械学習モデル更新装置1は、これらのハードウェアと、プログラム等のソフトウェアとにより構成された1又は複数のコンピュータ300によって構成される。
Machine learning
機械学習モデル更新装置1が複数のコンピュータ300によって構成される場合には、これらのコンピュータ300はローカルで接続されてもよいし、インターネット又はイントラネットなどの通信ネットワークを介して接続されてもよい。この接続によって、論理的に1つの機械学習モデル更新装置1が構築される。
When the machine learning
CPU301は、オペレーティングシステムやアプリケーション・プログラムなどを実行する。主記憶部302は、ROM(Read Only Memory)およびRAM(Random Access Memory)により構成される。補助記憶部303は、ハードディスクおよびフラッシュメモリなどにより構成される記憶媒体である。補助記憶部303は、一般的に主記憶部302よりも大量のデータを記憶する。通信制御部304は、ネットワークカード又は無線通信モジュールにより構成される。入力装置305は、キーボード、マウス、タッチパネル、および、音声入力用マイクなどにより構成される。出力装置306は、ディスプレイおよびプリンタなどにより構成される。
The
補助記憶部303は、予め、機械学習モデル更新プログラムPGおよび処理に必要なデータを格納している。機械学習モデル更新プログラムPGは、機械学習モデル更新装置1の各機能要素をコンピュータ300に実行させる。例えば、機械学習モデル更新プログラムPGは、CPU301又は主記憶部302によって読み込まれ、CPU301、主記憶部302、補助記憶部303、通信制御部304、入力装置305、および出力装置306の少なくとも1つを動作させる。例えば、機械学習モデル更新プログラムPGは、主記憶部302および補助記憶部303におけるデータの読み出しおよび書き込みを行う。
The
機械学習モデル更新プログラムPGは、例えば、CD-ROM、DVD-ROM、半導体メモリなどの有形の記録媒体に記録された上で提供されてもよい。機械学習モデル更新プログラムPGは、データ信号として通信ネットワークを介して提供されてもよい。 The machine learning model update program PG may be provided after being recorded on a tangible recording medium such as, for example, a CD-ROM, a DVD-ROM, or a semiconductor memory. The machine learning model update program PG may be provided as a data signal via a communication network.
以下、機械学習モデル更新装置1について詳細に説明する。
The machine learning
図3に示すように、機械学習モデル更新装置1は、いくつかの機能構成要素を含む。これらの機能構成要素は、コンピュータ300によって機械学習モデル更新プログラムPGが実行されることによってそれぞれ実現される。
As shown in FIG. 3, the machine learning
機械学習モデル更新装置1は、入力手段11と、学習モデル生成手段12と、評価手段13と、算出手段14と、更新判定手段15と、学習データ更新手段16と、を含む。そして、学習モデル生成手段12、更新判定手段15及び学習データ更新手段16は、更新手段17を構成する。なお、機械学習モデル更新装置1は、これらの機能構成要素とは別に、学習モデルMの更新に要する付加的な動作のための機能構成要素を必要に応じて備えてもよい。
The machine learning
入力手段11は、情報提供装置100の外部から運用データCを受ける。入力手段11は、受けた運用データCを記憶装置2に渡す。記憶装置2は、運用データCを記憶する。入力手段11は、例えば、図2に示す通信制御部304又は入力装置305に対応してよい。入力手段11は、運用データCになんらのデータ処理を施すことなく、運用データCを記憶装置2に渡してもよい。また、入力手段11は、運用データCになんらかのデータ処理を施した後に、データ処理が施された運用データCを記憶装置2に渡してもよい。
The input means 11 receives operational data C from outside the
学習モデル生成手段12は、学習モデルMを生成する。学習モデル生成手段12は、記憶装置2から学習データDを受ける。学習モデル生成手段12は、学習データDを利用して学習を行う。そして、学習モデル生成手段12は、学習が終了した学習モデルMを記憶装置に渡す。学習モデル生成手段12は、新たな学習モデルMを生成することもできるし、既に記憶装置2に記憶されている学習モデルMを元にして新たな学習モデルMを生成することもできる。つまり、学習モデル生成手段12は、後述する学習データ更新手段16によって更新された学習データDを教師データとすることによって、更新された学習モデルMを得ることができる。従って、学習モデル生成手段12は、請求項に記載する学習モデル更新手段としても機能する。
The learning model generation means 12 generates a learning model M. The learning model generation means 12 receives learning data D from the
学習モデルMとしては、種々のモデルを採用することができる。例えば、学習モデルMとして、ニューラルネットワークモデルを採用してもよい。また、学習モデルMとして、決定木モデルを採用してもよい。本実施形態の機械学習モデル更新装置1では、学習データDに運用データCのサンプルが内包されるか否かを評価した結果を用いて学習モデルMの更新するか否かを判断している。このような判断において、決定木モデルは、相性がよい。
As the learning model M, various models can be adopted. For example, a neural network model may be adopted as the learning model M. Further, as the learning model M, a decision tree model may be adopted. In the machine learning
評価手段13は、運用データCを構成するサンプルにフラグ付けを行う。評価手段13は、記憶装置2から学習データDと運用データCとを受ける。このときに評価手段13が記憶装置2から受ける学習データDは、今現在利用されている学習モデルMの生成に利用されたものである。さらに、評価手段13が記憶装置2から受ける運用データCは、今現在行われている推論処理に利用されたものであってよい。つまり、評価手段13が受ける学習データDは、評価手段13が受ける運用データCよりも時間的に過去のものであってもよい。
The evaluation means 13 flags the samples forming the operational data C. The evaluation means 13 receives learning data D and operational data C from the
評価手段13は、運用データCを構成するサンプルCS(図4(b)参照)が、学習データDの集合(図4(a)参照)に内包されるか否かを評価する。具体的には、評価手段13は、運用データCを構成する一つのサンプルCSを選択し、選択されたサンプルCSが学習データDの集合に内包されるか否かを評価する。つまり、評価手段13は、サンプルCSをひとつづつについて学習データDの集合に内包されるか否かを評価する(図4(c)参照)。従って、原理的には、運用データCに含まれるサンプルCSの数は、複数である必要なく、サンプルCSの数は1つであってもよい。サンプルの集合について、その集合の特性をよく表す平均や分散などの評価値を得るためには、十分な数のサンプルが必要である。しかし、評価手段13は、サンプルCSをひとつづつ処理するので、サンプルCSの数は必ずしも複数である必要はない。 The evaluation means 13 evaluates whether the sample CS (see FIG. 4(b)) constituting the operational data C is included in the set of learning data D (see FIG. 4(a)). Specifically, the evaluation means 13 selects one sample CS constituting the operational data C, and evaluates whether the selected sample CS is included in the set of learning data D. That is, the evaluation means 13 evaluates each sample CS to see whether it is included in the set of learning data D (see FIG. 4(c)). Therefore, in principle, the number of sample CSs included in the operational data C does not need to be plural, and the number of sample CSs may be one. For a set of samples, a sufficient number of samples are required in order to obtain evaluation values such as the average and variance that well represent the characteristics of the set. However, since the evaluation means 13 processes the sample CS one by one, the number of sample CS does not necessarily have to be plural.
集合に内包されるか否かの評価には、種々の外れ値検知のアルゴリズムを用いてよい。外れ値検知のアルゴリズムとしては、例えば、局所外れ値因子法(Local Outlier Factor:LOF)、k近傍法(K Nearest Neighbor:kNN)が例示できる。これらの外れ値検知のアルゴリズムは、距離に基づいた検知手法である。なお、評価手段13が採用する外れ値検知は、必ずしも距離に基づいた検知手法である必要はない。例えば、評価手段13は、ニューラルネットワークを用いてサンプルCSが学習データDの集合に内包されるか否かを評価してもよい。 Various outlier detection algorithms may be used to evaluate whether a value is included in a set. Examples of algorithms for outlier detection include the local outlier factor method (LOF) and the k-nearest neighbor method (kNN). These outlier detection algorithms are distance-based detection techniques. Note that the outlier detection employed by the evaluation means 13 does not necessarily have to be a detection method based on distance. For example, the evaluation means 13 may evaluate whether the sample CS is included in the set of learning data D using a neural network.
評価手段13は、サンプルCSが学習データDの集合に内包されると評価した場合には、そのサンプルCSに学習データDの集合に内包されることを示す内包フラグを付す。例えば、学習データDの集合に内包されることを示す内包フラグとは、「0」という数値によって示してよい。 When the evaluation means 13 evaluates that the sample CS is included in the set of learning data D, it attaches an inclusion flag to the sample CS indicating that it is included in the set of learning data D. For example, the inclusion flag indicating inclusion in the set of learning data D may be indicated by a numerical value of "0".
評価手段13は、サンプルCSが学習データDの集合に内包されないと評価した場合には、そのサンプルCSに学習データDの集合に内包されないことを示す内包フラグを付す。例えば、学習データDの集合に内包されないことを示す内包フラグとは、「1」という数値によって示してよい。なお、評価手段13は、学習データDの集合に内包されないと評価したサンプルCSにのみ内包フラグを付してもよい。 When the evaluation means 13 evaluates that the sample CS is not included in the set of learning data D, it attaches an inclusion flag indicating that the sample CS is not included in the set of learning data D to the sample CS. For example, the inclusion flag indicating that it is not included in the set of learning data D may be indicated by a numerical value of "1". Note that the evaluation means 13 may attach an inclusion flag only to the sample CS that is evaluated as not being included in the set of learning data D.
評価手段13は、内包フラグが付されたサンプルを含むフラグ付き運用データCFを算出手段14に渡す。 The evaluation means 13 passes the flagged operational data CF including the samples to which the inclusion flag is attached to the calculation means 14 .
算出手段14は、評価手段13からフラグ付き運用データCFを受ける。算出手段14は、フラグ付き運用データCFを用いて更新判定指標値θ1を得る。更新判定指標値θ1は、例えば、内包フラグ(1:学習データDの集合に内包されない)が付されたサンプルの数であってもよい。また、更新判定指標値θ1は、例えば、フラグ付き運用データCFが含むサンプルの総数に対する内包フラグ(1:学習データDの集合に内包されない)が付されたサンプルの割合であってもよい。算出手段14は、更新判定指標値θ1を更新判定手段15に渡す。 The calculation means 14 receives the flagged operation data CF from the evaluation means 13. The calculation means 14 obtains the update determination index value θ1 using the flagged operation data CF. The update determination index value θ1 may be, for example, the number of samples to which an inclusion flag (1: not included in the set of learning data D) is attached. Further, the update determination index value θ1 may be, for example, the ratio of samples to which the inclusion flag (1: not included in the set of learning data D) is attached to the total number of samples included in the flagged operational data CF. The calculation means 14 passes the update determination index value θ1 to the update determination means 15.
更新判定手段15は、算出手段14から更新判定指標値θ1を受ける。更新判定手段15は、更新判定指標値θ1が更新条件を満たすか否を判定する。更新条件は、閾値であってもよい。例えば、更新判定手段15は、更新判定指標値θ1が総サンプル数に対する内包フラグ(1)が付されたサンプルの割合であるとき、その割合が予め定めた所定の数値よりも大きい場合(更新条件を満たす場合)に、学習モデルMを更新すると判定してよい。更新判定手段15は、更新条件を満たさない場合に、学習モデルMを更新しないと判定してよい。更新判定手段15は、判定結果θ2を学習データ更新手段16に渡す。
The update determination means 15 receives the update determination index value θ1 from the calculation means 14. The update determination means 15 determines whether the update determination index value θ1 satisfies an update condition. The update condition may be a threshold value. For example, when the update determination index value θ1 is the ratio of samples to which the inclusion flag (1) is attached to the total number of samples, and the ratio is larger than a predetermined value (update condition ), it may be determined that the learning model M is to be updated. The
学習データ更新手段16は、更新判定手段15から判定結果θ2を受ける。学習データ更新手段16は、更新判定指標値θ1が更新条件を満たす旨の判定結果θ2を受けたとき、学習データDを更新する。具体的には、学習データ更新手段16は、記憶装置2から学習データDと、運用データCと、を受ける。学習データ更新手段16は、運用データCを利用して学習データDを更新する。そして、学習データ更新手段16は、更新した学習データDを記憶装置2に渡す。
The learning data updating means 16 receives the determination result θ2 from the
学習データDを更新する手法には、特に制限はない。例えば、現在の学習データDに対して、内包フラグ(1:学習データDの集合に内包されない)が付されたサンプルCSのみを追加することによって、更新された学習データDを得てもよい。また、現在の学習データDに対して、内包フラグの内容を問わず、内包フラグが付された全てのサンプルを現在の学習データDに対して追加することによって、更新された学習データDを得てもよい(図4(d)参照)。 There are no particular restrictions on the method of updating the learning data D. For example, updated learning data D may be obtained by adding only the sample CS to which the inclusion flag (1: not included in the set of learning data D) is attached to the current learning data D. In addition, updated learning data D can be obtained by adding all samples with connotative flags to the current learning data D, regardless of the contents of the connotative flags. (See FIG. 4(d)).
次に、図5及び図6に示すフローチャートを参照しながら、機械学習モデル更新方法について説明する。 Next, a machine learning model updating method will be described with reference to the flowcharts shown in FIGS. 5 and 6.
まず、図5に示すように、第1の運用データCを受ける(ステップS1)。ステップS1は、入力手段11が実行する。次に、第1の運用データCを用いて第1の学習モデルMを得る(ステップS2)。ステップS2は、学習モデル生成手段12が実行する。このステップS1、S2は、いわゆる学習フェーズである。次に、第2の運用データCを受ける(ステップS3)。ステップS3は、入力手段11が実行する。そして、第2の運用データCと第1の学習モデルMとを用いて推論結果Rを得る(ステップS4)。ステップS4は、推論装置3が実行する。このステップS4は、いわゆる推論フェーズである。 First, as shown in FIG. 5, first operational data C is received (step S1). Step S1 is executed by the input means 11. Next, a first learning model M is obtained using the first operational data C (step S2). Step S2 is executed by the learning model generation means 12. These steps S1 and S2 are what is called a learning phase. Next, second operational data C is received (step S3). Step S3 is executed by the input means 11. Then, an inference result R is obtained using the second operational data C and the first learning model M (step S4). Step S4 is executed by the inference device 3. This step S4 is a so-called inference phase.
ここで、機械学習モデル更新方法(ステップS5)は、第2の運用データCを用いる。そこで、機械学習モデル更新方法は、推論フェーズが終了した後に行ってもよい。なお、機械学習モデル更新方法は、推論フェーズと並行して行ってもよい。機械学習モデル更新方法(ステップS5)の後に、第3の運用データCを受ける(ステップS6、ステップS7)。そして、第2の推論フェーズでは、機械学習モデル更新方法(ステップS5)の実行結果に応じて、更新された第2の学習モデルMを用いる処理(ステップS8)又は更新されない第1の学習モデルMを用いる処理(ステップS9)の何れかが実行される。 Here, the machine learning model updating method (step S5) uses the second operational data C. Therefore, the machine learning model updating method may be performed after the inference phase is completed. Note that the machine learning model updating method may be performed in parallel with the inference phase. After the machine learning model update method (step S5), third operational data C is received (steps S6 and S7). Then, in the second inference phase, depending on the execution result of the machine learning model updating method (step S5), a process using the updated second learning model M (step S8) or a process using the unupdated first learning model M Any one of the processes using (step S9) is executed.
以下、図6を参照しながら、機械学習モデル更新方法について詳細に説明する。いま、記憶装置2には、第1の学習データDと、第1の学習モデルMとが記憶されているとする。
The machine learning model updating method will be described in detail below with reference to FIG. It is now assumed that the
まず、第2の運用データCを受ける(ステップS51)。ステップS51は、入力手段11が実行する。次に、評価処理を実行する。評価処理は、評価手段13が実行する。具体的には、運用データCがM個のサンプルを含むとき、第m番目のサンプルCSについて第1の学習データDの集合に内包されるか否かを評価する(ステップS52)。内包される場合には(ステップS52:YES)、第mのサンプルに内包フラグ(0)を付す(ステップS53)。内包されない場合には(ステップS52:NO)、第mのサンプルに内包フラグ(1)を付す(ステップS54)。次に、全てのサンプルCSについて内包フラグを付したか否かを判定する(ステップS55)。全てのサンプルCSについて内包フラグを付していない場合には(ステップS55:NO)、再びステップS52を実行する。全てのサンプルCSについて内包フラグを付した場合には(ステップS55:YES)、次のステップS56を実行する。以上のステップS52~S55は、評価処理を構成する。 First, the second operational data C is received (step S51). Step S51 is executed by the input means 11. Next, evaluation processing is executed. The evaluation process is executed by the evaluation means 13. Specifically, when the operational data C includes M samples, it is evaluated whether the m-th sample CS is included in the first learning data set D (step S52). If included (step S52: YES), a inclusion flag (0) is attached to the m-th sample (step S53). If it is not included (step S52: NO), an inclusion flag (1) is attached to the m-th sample (step S54). Next, it is determined whether inclusion flags have been attached to all sample CS (step S55). If the inclusion flag is not attached to all the samples CS (step S55: NO), step S52 is executed again. If the inclusion flag is attached to all the samples CS (step S55: YES), the next step S56 is executed. The above steps S52 to S55 constitute evaluation processing.
更新判定指標値θ1を得る(ステップS56)。ステップS56は、算出手段14が実行する。次に、更新判定指標値θ1が更新条件を満たすか否かを判定する(ステップS57)。ステップS57は、更新判定手段15が実行する。 An update determination index value θ1 is obtained (step S56). Step S56 is executed by the calculation means 14. Next, it is determined whether the update determination index value θ1 satisfies the update conditions (step S57). Step S57 is executed by the update determination means 15.
更新判定指標値θ1が更新条件を満たさない場合には(ステップS57:NO)、学習データDを更新しない。この場合には、機械学習モデル更新の処理を終了する。その後、図5に示すステップS7及びステップS9が実行される。 If the update determination index value θ1 does not satisfy the update condition (step S57: NO), the learning data D is not updated. In this case, the machine learning model update process ends. After that, step S7 and step S9 shown in FIG. 5 are executed.
更新判定指標値θ1が更新条件を満たす場合には(ステップS57:YES)、第1の学習データDを更新することによって第2の学習データDを得る(ステップS58)。続いて、第2の学習データDを用いて第2の学習モデルMを得る(ステップS59)。ステップS59は、学習モデル生成手段12が実行する。その後、機械学習モデル更新の処理(ステップS5)を終了する。その後、図5に示すステップS6及びステップS8が実行される。 If the update determination index value θ1 satisfies the update condition (step S57: YES), the first learning data D is updated to obtain the second learning data D (step S58). Next, a second learning model M is obtained using the second learning data D (step S59). Step S59 is executed by the learning model generation means 12. Thereafter, the machine learning model update process (step S5) is ended. After that, step S6 and step S8 shown in FIG. 5 are executed.
機械学習モデル更新装置1は、運用データCを受ける入力手段11と、運用データCを構成するサンプルCSが、第1の学習モデルMの学習に用いた第1の学習データDの集合に内包されるか否かを評価する評価手段13と、評価手段13の結果を利用して第1の学習モデルMを更新するか否かの決定を行うための更新判定指標値θ1を得る算出手段14と、更新判定指標値θ1が更新条件を満たす場合に、第1の学習モデルMを第2の学習モデルMに更新する更新手段17と、を備える。
The machine learning
機械学習モデル更新装置1は、運用データCを構成するサンプルCSごとに、第1の学習モデルMの学習に用いた第1の学習データDの集合に内包されるか否かを、第1の学習モデルMを第2の学習モデルMに更新するか否かの条件として用いる。サンプルCSごとに学習データMの集合に内包されるか否を評価することによれば、運用データCに含まれるサンプルCSの分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。つまり、機械学習モデル更新装置1は、学習モデルMを更新するか否かの判断を適切に実行できる。
The machine learning
上記の機械学習モデル更新装置1の更新手段17は、更新判定指標値θ1を利用して第1の学習モデルMを更新するか否かを決定する更新判定手段15と、運用データCを利用して第1の学習データDを第2の学習データMに更新する学習データ更新手段16と、第2の学習データDを用いて第1の学習モデルMを第2の学習モデルMに更新する学習モデル生成手段12と、を有する。この構成によれば、第1の学習モデルMを第2の学習モデルMに好適に更新することができる。
The updating means 17 of the machine learning
上記の機械学習モデル更新装置1の評価手段13は、運用データCを構成するサンプルCSごとに第1の学習データMの集合に内包されるか否かを評価した結果、運用データCを構成するサンプルCSが第1の学習データDの集合に内包されない場合には、第1の学習データDの集合に内包されないことを示す内包フラグ(1)をサンプルCSに付す。この構成によれば、内包フラグの有無に基づく更新の判断を行うことが可能になる。
The evaluation means 13 of the machine learning
上記の機械学習モデル更新装置1の評価手段13は、第1の学習データDの集合からサンプルCSまでの距離に基づいて内包されるか否かを評価する。この構成によれば、内包フラグの有無に基づく更新の判断を行うことが可能になる。
The evaluation means 13 of the machine learning
上記の機械学習モデル更新装置1の算出手段14は、運用データCが含むサンプルCSの総数に対する内包フラグ(1)が付されたサンプルCSの数の割合を、更新判定指標値θ1として得る。この構成によれば、更新の判断を容易に行うことが可能になる。
The calculation means 14 of the machine learning
上記の機械学習モデル更新装置1において更新条件は、閾値である。更新判定手段15は、更新判定指標値θ1が閾値を超えた場合に、第1の学習モデルMを更新すると決定する。この構成によれば、更新の判断をさらに容易に行うことが可能になる。
In the machine learning
本発明の機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムは、上述した実施形態に限定されない。 The machine learning model update device, machine learning model update method, and machine learning model update program of the present invention are not limited to the embodiments described above.
算出手段14は、フラグ付き運用データCFに付された内包フラグの内容を利用して、更新判定指標値θ1を得た。具体的には、実施形態の算出手段14は、「内包する:0」又は「内包しない:1」の2値によって示される情報を用いて、更新判定指標値θ1を得た。評価手段13は、内包フラグを決定するための内部処理においていくつかの値を生成する。例えば、評価手段13は、「内包する:0」又は「内包しない:1」の判定結果を得るために、内部パラメータとして連続値で示されるスコアを用いる。評価手段13は、スコアが所定の数値より小さい場合には、「内包する:0」と判定する。評価手段13は、スコアが所定の数値より大きい場合には、「内包しない:1」と判定する。評価手段13は、「0」又は「1」で示される内包フラグに加えて、サンプルに対してスコアを付すことによりスコア付き運用データを出力してもよい。そして、算出手段14は、当該スコアを用いて更新判定指標値θ1を得てもよい。 The calculation means 14 uses the content of the inclusion flag attached to the flagged operational data CF to obtain the update determination index value θ1. Specifically, the calculation means 14 of the embodiment obtained the update determination index value θ1 using the information indicated by the binary value of “included: 0” or “not included: 1”. The evaluation means 13 generates several values in internal processing for determining the inclusion flag. For example, the evaluation means 13 uses a score expressed as a continuous value as an internal parameter in order to obtain a determination result of "includes: 0" or "does not include: 1". If the score is smaller than a predetermined numerical value, the evaluation means 13 determines that "includes: 0". If the score is larger than a predetermined numerical value, the evaluation means 13 determines that "not inclusive: 1". The evaluation means 13 may output scored operational data by assigning a score to the sample in addition to the inclusion flag indicated by "0" or "1". Then, the calculation means 14 may obtain the update determination index value θ1 using the score.
運用データCには特に制限はない。例えば、運用データCは、一日(24時間)に得られたデータであってもよい。運用データCは、一週間(24時間×7日)に得られたデータであってもよい。 There are no particular restrictions on the operational data C. For example, the operational data C may be data obtained in one day (24 hours). The operational data C may be data obtained in one week (24 hours x 7 days).
1 機械学習モデル更新装置
11 入力手段
12 学習モデル生成手段(学習モデル更新手段)
13 評価手段
14 算出手段
15 更新判定手段
16 学習データ更新手段
17 更新手段
C 運用データ
D 学習データ
M 学習モデル
R 推論結果
1 Machine learning
13 Evaluation means 14 Calculation means 15 Update determination means 16 Learning
Claims (8)
前記運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価する評価手段と、
前記評価手段の結果を利用して前記第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得る算出手段と、
前記更新判定指標値が更新条件を満たす場合に、前記第1の学習モデルを前記第2の学習モデルに更新する更新手段と、を備える機械学習モデル更新装置。 an input means for receiving operational data;
an evaluation means for evaluating whether the elements constituting the operational data are included in the first learning data set used for learning the first learning model;
calculation means for obtaining an update determination index value for determining whether to update the first learning model to a second learning model using the results of the evaluation means;
A machine learning model updating device comprising: updating means for updating the first learning model to the second learning model when the update determination index value satisfies an update condition.
前記更新判定指標値を利用して前記第1の学習モデルを前記第2の学習モデルに更新するか否かを判定する更新判定手段と、
前記運用データを利用して前記第1の学習データを第2の学習データに更新する学習データ更新手段と、
前記第2の学習データを用いて前記第1の学習モデルを前記第2の学習モデルに更新する学習モデル更新手段と、を有する、請求項1に記載の機械学習モデル更新装置。 The updating means includes:
update determination means for determining whether or not to update the first learning model to the second learning model using the update determination index value;
learning data updating means for updating the first learning data to second learning data using the operational data;
The machine learning model updating device according to claim 1, further comprising a learning model updating unit that updates the first learning model to the second learning model using the second learning data.
前記更新判定手段は、前記更新判定指標値が前記閾値を超えた場合に、前記第1の学習モデルを第2の学習モデルに更新すると判定する、請求項2に記載の機械学習モデル更新装置。 The update condition is a threshold,
The machine learning model updating device according to claim 2, wherein the update determination means determines to update the first learning model to the second learning model when the update determination index value exceeds the threshold value.
前記運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、
前記評価することの結果を利用して前記第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、
前記更新判定指標値が更新条件を満たす場合に、前記第1の学習モデルを前記第2の学習モデルに更新するステップと、を含む機械学習モデル更新方法。 a step of receiving operational data;
a step of evaluating whether or not elements constituting the operational data are included in a first learning data set used for learning the first learning model;
obtaining an update determination index value for determining whether to update the first learning model to a second learning model using the result of the evaluation;
A machine learning model updating method, comprising: updating the first learning model to the second learning model when the update determination index value satisfies an update condition.
前記運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、
前記評価することの結果を利用して前記第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、
前記更新判定指標値が更新条件を満たす場合に、前記第1の学習モデルを前記第2の学習モデルに更新するステップと、をコンピュータに実行させる、機械学習モデル更新プログラム。 a step of receiving operational data;
a step of evaluating whether or not elements constituting the operational data are included in a first learning data set used for learning the first learning model;
obtaining an update determination index value for determining whether to update the first learning model to a second learning model using the result of the evaluation;
A machine learning model update program that causes a computer to execute the step of updating the first learning model to the second learning model when the update determination index value satisfies an update condition.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022076480A JP2023165464A (en) | 2022-05-06 | 2022-05-06 | Machine learning model update device, machine learning model update method, and machine learning model update program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022076480A JP2023165464A (en) | 2022-05-06 | 2022-05-06 | Machine learning model update device, machine learning model update method, and machine learning model update program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023165464A true JP2023165464A (en) | 2023-11-16 |
Family
ID=88748865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022076480A Pending JP2023165464A (en) | 2022-05-06 | 2022-05-06 | Machine learning model update device, machine learning model update method, and machine learning model update program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023165464A (en) |
-
2022
- 2022-05-06 JP JP2022076480A patent/JP2023165464A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11275345B2 (en) | Machine learning Method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device | |
JP6148316B2 (en) | Machine learning method and machine learning device for learning failure conditions, and failure prediction device and failure prediction system provided with the machine learning device | |
US11720821B2 (en) | Automated and customized post-production release review of a model | |
JP5768834B2 (en) | Plant model management apparatus and method | |
WO2009090939A1 (en) | Apparatus and method for detecting network abnormality | |
JP7031743B2 (en) | Anomaly detection device | |
JP2019020885A (en) | Plant control support device, plant control support method, plant control support program, and recording medium | |
JP6663524B1 (en) | Learning data generation device and learning data generation method | |
KR102660544B1 (en) | Control apparatus, controller, control system, control method and control program | |
JP5320985B2 (en) | Prediction system, prediction method, and prediction program | |
JP2018205994A (en) | Time series data analysis device, time series data analysis method, and computer program | |
JP7283485B2 (en) | Estimation device, estimation method, and program | |
JP2020071845A (en) | Abnormality detection device, abnormality detection method, and abnormality detection program | |
JP7180692B2 (en) | Estimation device, estimation method, and program | |
JP7167992B2 (en) | label correction device | |
US20240095535A1 (en) | Executing a genetic algorithm on a low-power controller | |
JP7395987B2 (en) | Information processing systems, methods, and programs | |
JP7363910B2 (en) | Display method, display program and information processing device | |
JP2023165464A (en) | Machine learning model update device, machine learning model update method, and machine learning model update program | |
JP2007164346A (en) | Decision tree changing method, abnormality determination method, and program | |
JP7161379B2 (en) | inference device | |
US20230152759A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP2020112869A (en) | Abnormal operation detection device, abnormal operation detection method and program | |
WO2021152689A1 (en) | Event analysis support device, method, and storage medium | |
EP3762185A1 (en) | Method, apparatus, system and program for controlling a robot, and storage medium |