JP2021135812A

JP2021135812A - モデル更新装置、方法、及びプログラム

Info

Publication number: JP2021135812A
Application number: JP2020032223A
Authority: JP
Inventors: 泰明阿部; Yasuaki Abe; 勇樹上山; Yuki Kamiyama; 修治稲本; Shuji Inamoto; 喜輝伊藤; Yoshiki Ito
Original assignee: Omron Corp; Omron Tateisi Electronics Co
Current assignee: Omron Corp
Priority date: 2020-02-27
Filing date: 2020-02-27
Publication date: 2021-09-13
Anticipated expiration: 2040-02-27
Also published as: EP4113397A4; CN115087998A; US20230075229A1; JP7396117B2; EP4113397A1; WO2021171863A1

Abstract

【課題】モデルの推論精度を効果的に向上させるように、モデルを更新する。【解決手段】取得部１１が、説明変数に対する目的変数を出力するモデル３７に入力する説明変数を取得し、特定部１２が、説明変数空間を分割した各領域に、各領域に含まれる説明変数が取得部１１により取得された頻度を対応付けると共に、モデル３７の学習に利用された学習データに含まれる説明変数が属する領域であって、取得部１１により取得された説明変数の頻度が所定値以下の領域を特定し、更新部が、特定部１２により特定された領域に属する説明変数を含む学習データを忘却させるようにモデル３７を更新する。【選択図】図３

Description

本発明は、モデル更新装置、モデル更新方法、及びモデル更新プログラムに関する。

入力された説明変数に対する目的変数を推論して出力するように予め学習されたモデルに対して、追加学習や再学習を行うことにより、モデルの推論精度を維持又は向上させることが行われている。

例えば、機械設備の故障予知精度を向上させる技術が提案されている。この技術は、機械設備に設けられた複数のセンサのセンサデータを収集し、センサデータのうち、機械設備が正常状態にあった所定期間分、及び、任意の評価時における評価分を抽出する。また、この技術は、正常期間分を用いた機械学習の実行によって、機械設備における相関モデルを生成し、正常期間分を相関モデルへの入力によって得られる相関モデルの出力値より正常期間分のサンプルデータを導出する。そして、この技術は、評価分を相関モデル入力によって得られる相関モデル出力値により機械設備の正常状態からの乖離度を評価し、乖離度に基づいて機械設備の故障予兆を判定する。さらに、この技術は、抽出される誤検知に対応するセンサデータを含む追加学習分、及び、正常期間分のサンプルデータがともに反映されるよう機械学習の実行によって、相関モデルを更新する（特許文献１参照）。

特開２０１９−２８５６５号公報

しかしながら、モデルが想定している推論対象の全体的な状態に変化があった場合などには、新たな学習データを追加学習するだけでは、推論精度が向上しない場合がある。

本発明は、上記の点に鑑みてなされたものであり、モデルの推論精度を効果的に向上させるように、モデルを更新することを目的とする。

上記目的を達成するために、本発明に係るモデル更新装置は、説明変数に対する目的変数を出力するモデルに入力する説明変数を取得する取得部と、説明変数空間を分割した各領域に、各領域に含まれる説明変数が前記取得部により取得された頻度を対応付けると共に、前記モデルの学習に利用された学習データに含まれる説明変数が属する領域であって、前記取得部により取得された説明変数の頻度が所定値以下の領域を特定する特定部と、前記特定部により特定された領域に属する説明変数を含む学習データを忘却させるように前記モデルを更新する更新部と、を含んで構成されている。

また、前記更新部は、前記モデルにおいて、忘却させる学習データで学習された部分を除去することにより、前記モデルを更新することができる。

また、前記更新部は、忘却させる学習データを除いた学習データを利用して前記モデルを再学習することにより、前記モデルを更新することができる。

また、モデル更新装置は、前記モデルの推論精度を判定する判定部を含み、前記取得部は、前記説明変数を前記モデルへ入力した際の目的変数、及び前記説明変数に対する期待値を取得し、前記判定部は、前記取得部により取得された前記目的変数と前記期待値とに基づいて、前記推論精度が所定の精度を満たしているか否かを判定し、前記更新部は、前記判定部により前記推論精度が前記所定の精度を満たしていないと判定された場合に、前記取得部により取得された説明変数に対応する期待値を、前記説明変数に対する新たな目的変数とする学習データを利用して前記モデルを追加学習することにより、前記モデルを更新することができる。

また、前記更新部は、前記新たな目的変数に対応する説明変数であって、前記新たな目的変数以外の目的変数と対応付けられている説明変数を含む学習データを忘却させるように前記モデルを更新することができる。

また、モデル更新装置は、前記モデルから出力された目的変数から、制御対象を制御するための制御信号を生成して出力する制御部を含んで構成することができる。

また、本発明に係るモデル更新方法は、取得部が、説明変数に対する目的変数を出力するモデルに入力する説明変数を取得し、特定部が、説明変数空間を分割した各領域に、各領域に含まれる説明変数が前記取得部により取得された頻度を対応付けると共に、前記モデルの学習に利用された学習データに含まれる説明変数が属する領域であって、前記取得部により取得された説明変数の頻度が所定値以下の領域を特定し、更新部が、前記特定部により特定された領域に属する説明変数を含む学習データを忘却させるように前記モデルを更新する方法である。

また、本発明に係るモデル更新プログラムは、コンピュータを、説明変数に対する目的変数を出力するモデルに入力する説明変数を取得する取得部、説明変数空間を分割した各領域に、各領域に含まれる説明変数が前記取得部により取得された頻度を対応付けると共に、前記モデルの学習に利用された学習データに含まれる説明変数が属する領域であって、前記取得部により取得された説明変数の頻度が所定値以下の領域を特定する特定部、及び、前記特定部により特定された領域に属する説明変数を含む学習データを忘却させるように前記モデルを更新する更新部として機能させるためのプログラムである。

本発明に係るモデル更新装置、方法、及びプログラムによれば、モデルの推論精度を効果的に向上させるように、モデルを更新することができる。

本実施形態に係る予測制御システムの概略構成を示すブロック図である。本実施形態に係るＰＬＣのハードウェア構成を示すブロック図である。モデル生成装置及びＰＬＣの機能的構成を示すブロック図である。学習データ分布情報を概念的に示す図である。モデル更新の概要を説明するための図である。推論発生頻度情報を概念的に示す図である。推論精度の判定を説明するための図である。学習データ忘却時のモデル更新の様子を概念的に示す図である。追加学習時のモデル更新の様子を概念的に示す図である。学習データを追加した際の元の学習データの忘却を説明するための図である。本実施形態における制御処理の流れを示すフローチャートである。本実施形態におけるモデル更新処理の流れを示すフローチャートである。

以下、本発明の実施形態の一例を、図面を参照しつつ説明する。本実施形態では、本発明に係るモデル更新装置を搭載したＰＬＣ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＣｏｎｔｒｏｌｌｅｒ）を含む予測制御システムを例に説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法及び比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。

図１に示すように、本実施形態に係る予測制御システム１００は、モデル生成装置３０と、ＰＬＣ２０と、製造装置５０とを含む。ＰＬＣ２０は、モデル生成装置３０で生成されたモデルを用いて、制御対象である製造装置５０の動作を制御する。製造装置５０は、例えば、搬送装置、プレス機等である。各ＰＬＣ２０による制御対象の製造装置５０は、１つであってもよいし、複数であってもよい。ＰＬＣ２０及び製造装置５０の各組は、異なる複数の製造現場の各々に設置されてもよい。

図２は、本実施形態に係るＰＬＣ２０のハードウェア構成を示すブロック図である。図２に示すように、ＰＬＣ２０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）４１、メモリ４２、記憶装置４３、入出力Ｉ／Ｆ（Ｉｎｔｅｒｆａｃｅ）４４、記憶媒体読取装置４５、及び通信Ｉ／Ｆ４６を有する。各構成は、バス４７を介して相互に通信可能に接続されている。

記憶装置４３には、後述する制御処理を実行するための制御プログラム、モデル更新処理を実行するためのモデル更新プログラムを含む各種プログラムが格納されている。ＣＰＵ４１は、中央演算処理ユニットであり、各種プログラムを実行したり、各構成を制御したりする。すなわち、ＣＰＵ４１は、記憶装置４３からプログラムを読み出し、メモリ４２を作業領域としてプログラムを実行する。ＣＰＵ４１は、記憶装置４３に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。

メモリ４２は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）により構成され、作業領域として一時的にプログラム及びデータを記憶する。記憶装置４３は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、及びＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。

入出力Ｉ／Ｆ４４は、製造装置５０からのデータの入力、及び製造装置５０へのデータの出力を行うインタフェースである。また、例えば、キーボードやマウス等の、各種の入力を行うための入力装置、及び、例えば、ディスプレイやプリンタ等の、各種の情報を出力するための出力装置が接続されてもよい。出力装置として、タッチパネルディスプレイを採用することにより、入力装置として機能させてもよい。

記憶媒体読取装置４５は、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）−ＲＯＭ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）−ＲＯＭ、ブルーレイディスク、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリ等の各種記憶媒体に記憶されたデータの読み込みや、記憶媒体に対するデータの書き込み等を行う。

通信Ｉ／Ｆ４６は、モデル生成装置３０等の他の機器と通信するためのインタフェースであり、例えば、イーサネット（登録商標）、ＦＤＤＩ、Ｗｉ−Ｆｉ（登録商標）等の規格が用いられる。

モデル生成装置３０のハードウェア構成は、ＰＬＣ２０のハードウェア構成と同様であるため、説明を省略する。

図３に、モデル生成装置３０及びＰＬＣ２０の機能的構成を示す。

図３に示すように、モデル生成装置３０は、機能的には、収集部３１と、生成部３２と、分析部３３とを含む。

収集部３１は、製造装置５０において観測されるデータに基づく情報（以下、「観測情報」という）を収集し、収集データＤＢ３６に記憶する。観測情報は、例えば、製造装置５０内のモーターの回転数、製造装置５０に設けられた各種センサにより検出されたセンサ値、これらの値に基づいて判定処理等を行った処理結果等の時系列の情報である。

生成部３２は、説明変数に対する目的変数を出力するモデル３７であって、学習データを用いて、ＰＬＣ２０により製造装置５０を制御するために利用されるモデル３７のパラメータを予め学習することによりモデル３７を生成する。

本実施形態では、説明変数は、収集部３１により収集された観測情報に基づく情報であり、目的変数は、説明変数が示す観測情報が得られてから所定時間後の製造装置５０の状態を示す値である。すなわち、モデル３７は、観測情報に基づいて、製造装置５０の所定時間後の状態を推論するものである。

したがって、生成部３２は、収集データＤＢ３６に記憶された観測情報を取得し、観測情報に基づく説明変数を抽出する。また、生成部３２は、その観測情報が観測された場合における製造装置５０の所定時間後の正解の状態を示す目的変数を抽出する。生成部３２は、抽出した説明変数と目的変数とのペアを学習データとして、モデル３７のパラメータを学習することにより、モデル３７を生成する。生成部３２は、パラメータが学習されたモデル３７を、各ＰＬＣ２０に配布する。

分析部３３は、説明変数空間において、モデル３７の学習に利用した学習データに含まれる説明変数が属する領域の分布を示す学習データ分布情報３８を生成する。図４に、学習データ分布情報３８を概念的に示す。図４の例では、説明変数がｘ_１及びｘ_２の２つの場合を示している。分析部３３は、ｘ_１及びｘ_２の各々を各軸とする説明変数空間を、例えば図４に示すようなメッシュ状の領域に分割する。そして、モデル３７の学習に利用された学習データの各々について、その学習データに含まれる説明変数（図４中の白丸）が属する領域に、学習データが存在することを示す値を付与する。図４の例では、学習データが存在する領域を網掛けの領域で、学習データが存在しない領域を白の領域で表している。分析部３３は、生成した学習データ分布情報３８を、各ＰＬＣ２０に配布する。

次に、本実施形態に係るＰＬＣ２０の機能構成について説明する。

図３に示すように、ＰＬＣ２０は、機能構成として、収集部２１と、推論部２２と、制御部２３と、モデル更新部１０とを含む。なお、モデル更新部１０は、本発明のモデル更新装置の一例である。また、ＰＬＣ２０の所定の記憶領域には、モデル生成装置３０から配布されたモデル３７及び学習データ分布情報３８が記憶される。

収集部２１は、モデル生成装置３０の収集部３１と同様に、ＰＬＣ２０が制御する製造装置５０から観測情報を収集して、収集データＤＢ２６に記憶する。

推論部２２は、収集データＤＢ２６に記憶された観測情報を取得し、観測情報に基づく説明変数を抽出し、説明変数をモデル３７へ入力し、推論結果である目的変数を取得する。推論部２２は、取得した目的変数を制御部２３へ受け渡す。また、推論部２２は、モデル３７へ入力した説明変数、及びモデル３７の出力として取得した目的変数を、後述するモデル更新部１０の取得部１１へ受け渡す。

制御部２３は、推論部２２から受け渡された目的変数に基づいて、製造装置５０を制御するための制御信号を生成して出力する。例えば、制御部２３は、モデル３７で予測された製造装置５０の状態に応じて、ローラーの角度を調整したり、モーターの回転速度を変更したりするための制御信号を生成する。

モデル更新部１０は、機能的には、さらに、取得部１１と、特定部１２と、判定部１３と、更新部１４とを含む。

まず、モデル更新部１０の概略について説明する。図５の上段に、運用開始時のモデル３７、すなわち、モデル生成装置３０で生成された直後のモデル３７を概念的に示す。目的変数と説明変数とで表される空間における正例の学習データ（図５中の実線の〇印）と、負例の学習データ（図５中の実線の×印）とを切り分けるように、モデル３７の境界が設定される。

モデル３７を用いた製造装置５０の制御の運用が開始されると、例えば装置状態が経年的に劣化するなどして、観測される観測情報がゆるやかに変化する場合、すなわち、製造装置５０の状態が変化する場合がある。このような場合、図５中の下段に示すように、モデル３７の学習に利用された学習データの周辺で、実際の運用では発生し難いデータが存在する（図５中の点線の○印及び×印）。また、モデル３７の学習に利用された学習データでは存在しなかったデータが、実際の運用時に発生し易い場合もある（図５中の網掛の○印及び×印）。

一般的には、運用開始後に、モデルの推論精度に課題が生じた場合、モデルの学習に利用された当初の学習データセットを一度呼び出す。そして、当初の学習データセットに、追加学習用に新たに得られた学習データを追加した学習データセットを利用して学習することにより、モデルが更新される。すなわち、新たに製造装置５０から得られたデータを、ＰＬＣ２０に搭載済みのモデル３７に追加して更新する仕組みである。しかし、この場合、上述のように、経年劣化等により製造装置５０の状態が変化している場合などには、最新のデータで追加学習を行うだけでは、モデル３７において、元の学習データでモデリングされた振る舞いが残り続ける。そのため、推論精度の課題が残ってしまう場合がある。

そこで、モデル更新部１０は、周辺で推論が発生し難い学習データを忘却させるようにモデル３７を更新する。また、新たな推論が発生したデータについては、新たな学習データで追加学習を行ってモデル３７を更新する。これにより、図５の下段に示すように、モデル３７の境界が、点線で示す状態から実線で示す状態に更新される。したがって、製造装置５０の状態の変化に応じて、モデル３７の状態もシフトさせることができる。

以下、モデル更新部１０の各機能部について詳述する。

取得部１１は、モデル３７に入力する説明変数を推論部２２から取得する。取得部１１は、取得した説明変数を特定部１２へ受け渡す。

また、取得部１１は、推論部２２から受け渡された目的変数、すなわち、モデル３７に説明変数を入力した際に出力される目的変数を取得し、説明変数と対応付けて判定部１３へ受け渡す。さらに、取得部１１は、所定時間後に収集された観測情報から、説明変数に対する期待値、すなわち、その説明変数に対する正解となる目的変数を抽出し、説明変数と対応付けて判定部１３へ受け渡す。

特定部１２は、学習データ分布情報３８と同様に、説明変数空間を分割した各領域に、各領域に含まれる説明変数が取得部１１により取得された頻度を対応付けた推論発生頻度情報１６を生成する。説明変数が取得部１１により取得された頻度は、該当の領域に含まれる説明変数による推論が発生した頻度である。

図６に、推論発生頻度情報１６を概念的に示す。図６の例では、学習データ分布情報３８に重畳して、推論発生頻度情報１６を表している。図６において、太枠で示す領域は、学習データ分布情報３８により示される、モデル３７の学習に利用された学習データが存在する領域である。また、図６の例では、各領域に属する説明変数による推論が発生した頻度を、領域の濃度で表しており、濃度が濃いほど頻度が高いことを表している。

具体的には、特定部１２は、取得部１１から説明変数を受け渡される都度、推論発生頻度情報１６において、取得された説明変数が属する領域に保持されている頻度に１加算する。また、特定部１２は、推論発生頻度情報１６内の頻度の最大値が所定値となるように、各領域の頻度を正規化してもよい。

特定部１２は、モデル３７の学習に利用された学習データに含まれる説明変数が属する領域であって、推論が発生した頻度が所定値以下の領域を特定する。所定値は予め定めた値とすることができる。また、頻度順の下から所定番目の頻度を所定値としてもよい。この場合、頻度が他の領域よりも相対的に低い領域を特定することができる。特定部１２は、特定した領域の情報を更新部１４へ受け渡す。特定された領域に属する説明変数を含む学習データは、図５で説明した、周辺で推論が発生し難い学習データに相当し、忘却の対象となる学習データである。

判定部１３は、モデル３７の推論精度を判定する。具体的には、判定部１３は、取得部１１から受け渡された説明変数に対応する目的変数と期待値とを比較して、モデル３７の推論精度が所定の精度を満たしているか否かを判定する。例えば、図７に示すように、モデル３７が、所定時間Ｌ後の状態を推論する場合を考える。この場合、判定部１３は、時間ｔに取得された説明変数（ｘ_１（ｔ），ｘ_２（ｔ））に対するモデル３７からの出力である目的変数ｙ＾（図７中では、「ｙ」の上に「＾」）と、時間ｔ＋Ｌに取得された観測情報から抽出された期待値ｙ（ｔ＋Ｌ）とを取得する。そして、判定部１３は、ｙ＾とｙ（ｔ＋Ｌ）との誤差や、ｙ＾の所定の信頼区間にｙ（ｔ＋Ｌ）が含まれるか否かに基づいて推論精度を判定する。

例えば、判定部１３は、目的変数と期待値との誤差が所定値以下の場合には、推論精度が所定の精度を満たしていると判定する。一方、判定部１３は、目的変数と期待値との誤差が所定値を超えている場合には、製造装置５０の状態が当初のモデル３７の学習時から変化したことを示しており、推論精度が所定の精度を満たしていないと判定する。判定部１３は、判定結果を更新部１４へ受け渡す。

更新部１４は、特定部１２から、特定された領域の情報を受け渡されると、モデル３７の学習に利用された学習データのうち、特定された領域に属する説明変数を含む学習データを忘却させるようにモデル３７を更新する。

具体的には、更新部１４は、モデル３７において、忘却させる学習データで学習された部分を除去することにより、モデル３７を更新する。この処理には、当初のモデル３７の学習時の学習データセットを必要とせず、直接モデルに対するデータの追加及び削除を可能とするアルゴリズムを用いることができる。図８に、このアルゴリズムによる学習データ忘却時のモデル３７の更新の様子を概念的に示す。図８に示すように、モデル３７が、複数のノードを含む木構造で表される場合、モデル更新により、忘却させる学習データで学習された部分に相当するノードが除去される（図８中の破線の楕円部分）。この処理の場合、モデル３７において、除去されたノード以外のノード部分による推論結果は変化しない。

また、更新部１４は、当初の学習データセットのうち、忘却させる学習データを除去した学習データを利用して、モデル３７を再学習することにより、モデル３７を更新してもよい。この場合、モデル更新部１０は、当初の学習データセットをモデル生成装置３０から取得して保持しておけばよい。

また、更新部１４は、判定部１３により推論精度が所定の精度を満たしていないと判定された場合、モデル３７を追加学習することにより、モデル３７を更新する。具体的には、更新部１４は、取得部１１から受け渡された説明変数に対応する期待値を、その説明変数に対する正解の目的変数とする新たな学習データを作成する。そして、上述の、直接モデルに対するデータの追加及び削除を可能とするアルゴリズムを用いて追加学習を行う。図９に、このアルゴリズムによる追加学習時のモデル３７の更新の様子を概念的に示す。図９に示すように、モデル更新により、新たなノードが追加される（図９中の破線の楕円部分）。この処理の場合、モデル３７の既存部分による推論結果は変化しない。

なお、更新部１４は、当初の学習データセットから忘却させる学習データを除去すると共に、新たな学習データを追加した新たな学習データセットを利用して再学習することにより、モデル３７を更新してもよい。

また、更新部１４は、新たな目的変数に対応する説明変数であって、新たな目的変数以外の目的変数と対応付けられている説明変数を含む学習データを忘却させるようにモデル３７を更新する。例えば、図１０に示すように、当初の学習データとして説明変数ｘと目的変数ｙ_ｏｌｄとのペアが存在した場合において、新たな学習データとして説明変数ｘと目的変数ｙ_ｎｅｗとのペアが追加されたとする。この場合、更新部１４は、説明変数ｘと目的変数ｙ_ｏｌｄとのペアである学習データを忘却させるようにモデル３７を更新する。

次に、本実施形態に係る予測制御システム１００の作用について説明する。

まず、モデル生成装置３０において、モデル３７及び学習データ分布情報３８が生成され、ＰＬＣ２０に配布される。

ＰＬＣ２０では、モデル３７を用いた運用が開始される。具体的には、ＰＬＣ２０が、モデル３７の出力を用いて製造装置５０を制御する処理である制御処理を実行する。図１１は、ＰＬＣ２０のＣＰＵ４１により実行される制御処理の流れを示すフローチャートである。ＣＰＵ４１が記憶装置４３から制御プログラムを読み出して、メモリ４２に展開して実行することにより、ＣＰＵ４１がＰＬＣ２０の各機能構成として機能し、図１１に示す制御処理が繰り返し実行される。

ステップＳ１２で、制御部２３が、製造装置５０を制御するための制御信号を出力する。これにより、製造装置５０が、制御信号に基づいて制御されて動作する。製造装置５０の動作に伴い、製造装置５０において観測情報が観測され、ＰＬＣ２０に出力される。

次に、ステップＳ１４で、収集部２１が、製造装置５０から観測情報を取得し、収集データＤＢ２６に記憶する。

次に、ステップＳ１６で、推論部２２が、収集データＤＢ２６から観測情報を取得し、観測情報に対して必要な処理を行って、説明変数に加工し、説明変数をモデル３７に入力する。観測情報がそのままモデル３７に入力する説明変数となる場合には、推論部２２は、観測情報をそのまま説明変数としてモデル３７に入力する。

次に、ステップＳ１８で、制御部２３が、モデルから出力された目的変数に基づいて、製造装置５０を制御するための制御信号を生成する。そして、処理はステップＳ１２に戻る。

次に、モデル３７を更新するモデル更新処理について説明する。図１２は、ＰＬＣ２０のＣＰＵ４１により実行されるモデル更新処理の流れを示すフローチャートである。ＣＰＵ４１が記憶装置４３からモデル更新プログラムを読み出して、メモリ４２に展開して実行することにより、ＣＰＵ４１がＰＬＣ２０の各機能構成として機能し、図１２に示すモデル更新処理が実行される。モデル更新処理は、製造装置５０から観測情報が収集される都度実行される。

ステップＳ２２で、取得部１１が、モデル３７に入力する説明変数を推論部２２から取得する。取得部１１は、取得した説明変数を特定部１２へ受け渡す。

次に、ステップＳ２４で、特定部１２が、推論発生頻度情報１６において、取得部１１から受け渡された説明変数が属する領域に保持されている頻度に１加算する等して、推論発生頻度情報１６を更新する。

次に、ステップＳ２６で、特定部１２が、学習データ分布情報３８と推論発生頻度情報１６とを比較して、モデル３７の学習に利用された学習データに含まれる説明変数が属する領域であって、推論が発生した頻度が所定値以下の領域が存在するか否かを判定する。領域が存在する場合には、特定部１２がその領域の情報を更新部１４へ受け渡し、処理はステップＳ２８へ移行し、領域が存在しない場合には、処理はステップＳ３０へ移行する。

ステップＳ２８では、更新部１４が、モデル３７の学習に利用された学習データのうち、特定部１２により特定された領域に属する説明変数を含む学習データを忘却させるようにモデル３７を更新する。

次に、ステップＳ３０で、取得部１１が、推論部２２から受け渡された目的変数、すなわち、モデル３７に説明変数を入力した際に出力される目的変数を取得し、説明変数と対応付けて判定部１３へ受け渡す。

次に、ステップＳ３２で、取得部１１が、所定時間後に収集された観測情報から、説明変数に対する期待値、すなわち、その説明変数に対する正解となる目的変数を抽出し、説明変数と対応付けて判定部１３へ受け渡す。

次に、ステップＳ３４で、判定部１３が、取得部１１から受け渡された説明変数に対応する目的変数と期待値とを比較して、モデル３７の推論精度が所定の精度を満たしているか否かを判定する。所定の精度を満たしていない場合には、処理はステップＳ３６へ移行し、満たしている場合には、モデル更新処理は終了する。

ステップＳ３６では、更新部１４が、取得部１１から受け渡された説明変数に対応する期待値を、その説明変数に対する正解の目的変数とする新たな学習データを作成する。

次に、ステップＳ３８で、更新部１４が、作成した新たな学習データを利用して追加学習を行うことによりモデル３７を更新する。さらに、更新部１４が、新たな目的変数に対応する説明変数であって、新たな目的変数以外の目的変数と対応付けられている説明変数を含む学習データを忘却させるようにモデル３７を更新する。そして、モデル更新処理は終了する。

以上説明したように、本実施形態に係る予測制御システムによれば、ＰＬＣに含まれるモデル更新部が、説明変数に対する目的変数を出力するモデルに入力する説明変数を取得する。また、モデル更新部が、説明変数空間を分割した各領域に、各領域に含まれる説明変数を用いた推論が発生した頻度を対応付けた推論発生頻度情報を更新する。また、モデル更新部が、モデルの学習に利用された学習データに含まれる説明変数が属する領域を示す学習データ分布情報と推論発生頻度情報とを比較する。そして、モデル更新部が、モデルの学習に利用された学習データに含まれる説明変数が属する領域であって、推論の発生頻度が所定値以下の領域を特定する。さらに、モデル更新部が、特定された領域に属する説明変数を含む学習データを忘却させるようにモデルを更新する。

これにより、モデルにおいて、元の学習データでモデリングされた振る舞いが残り続けることを回避して、モデルの推論精度を効果的に向上させるように、モデルを更新することができる。その結果、ＰＬＣ側、すなわち、現場において、直近の製造装置５０の状態に応じてモデルを更新することができる。

また、さらに、モデルの推論精度を判定した上で、追加学習及び学習データの忘却による更新を行うことで、より推論精度を向上させることができる。

また、モデルの更新に、直接モデルに対するデータの追加及び削除を可能とするアルゴリズムを用いた場合には、ＰＬＣ側で当初の学習データセットを保持しておく必要がない。

なお、上記実施形態では、本発明のモデル更新装置をＰＬＣに搭載した例について説明したが、これに限定されない。モデルの出力を制御対象の制御に利用する場合に限らず、様々なモデルに対して、本発明を適用可能である。

また、上記実施形態では、推論発生頻度情報として、説明変数空間をメッシュ状に区切る場合について説明したが、これに限定されない。例えば、説明変数空間における各学習データの位置からの距離に基づいて、領域を区切ってもよい。

また、上記実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行したモデル更新処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等の製造後に回路構成を変更可能なＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）、及びＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、モデル更新処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

また、上記実施形態では、モデル更新プログラムが記憶装置に予め記憶（インストール）されている態様を説明したが、これに限定されない。プログラムは、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、ブルーレイディスク、ＵＳＢメモリ等の記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

１０モデル更新部
１１取得部
１２特定部
１３判定部
１４更新部
１６推論発生頻度情報
２０ＰＬＣ
２１収集部
２２推論部
２３制御部
２６収集データＤＢ
３０モデル生成装置
３１収集部
３２生成部
３３分析部
３６収集データＤＢ
３７モデル
３８学習データ分布情報
４１ＣＰＵ
４２メモリ
４３記憶装置
４４入出力Ｉ／Ｆ
４５記憶媒体読取装置
４６通信Ｉ／Ｆ
４７バス
５０製造装置
１００予測制御システム

Claims

説明変数に対する目的変数を出力するモデルに入力する説明変数を取得する取得部と、
説明変数空間を分割した各領域に、各領域に含まれる説明変数が前記取得部により取得された頻度を対応付けると共に、前記モデルの学習に利用された学習データに含まれる説明変数が属する領域であって、前記取得部により取得された説明変数の頻度が所定値以下の領域を特定する特定部と、
前記特定部により特定された領域に属する説明変数を含む学習データを忘却させるように前記モデルを更新する更新部と、
を含むモデル更新装置。
前記更新部は、前記モデルにおいて、忘却させる学習データで学習された部分を除去することにより、前記モデルを更新する請求項１に記載のモデル更新装置。
前記更新部は、忘却させる学習データを除いた学習データを利用して前記モデルを再学習することにより、前記モデルを更新する請求項１に記載のモデル更新装置。
前記モデルの推論精度を判定する判定部を含み、
前記取得部は、前記説明変数を前記モデルへ入力した際の目的変数、及び前記説明変数に対する期待値を取得し、
前記判定部は、前記取得部により取得された前記目的変数と前記期待値とに基づいて、前記推論精度が所定の精度を満たしているか否かを判定し、
前記更新部は、前記判定部により前記推論精度が前記所定の精度を満たしていないと判定された場合に、前記取得部により取得された説明変数に対応する期待値を、前記説明変数に対する新たな目的変数とする学習データを利用して前記モデルを追加学習することにより、前記モデルを更新する
請求項１〜請求項３のいずれか１項に記載のモデル更新装置。
前記更新部は、前記新たな目的変数に対応する説明変数であって、前記新たな目的変数以外の目的変数と対応付けられている説明変数を含む学習データを忘却させるように前記モデルを更新する請求項４に記載のモデル更新装置。
前記モデルから出力された目的変数から、制御対象を制御するための制御信号を生成して出力する制御部を含む請求項１〜請求項５のいずれか１項に記載のモデル更新装置。
取得部が、説明変数に対する目的変数を出力するモデルに入力する説明変数を取得し、
特定部が、説明変数空間を分割した各領域に、各領域に含まれる説明変数が前記取得部により取得された頻度を対応付けると共に、前記モデルの学習に利用された学習データに含まれる説明変数が属する領域であって、前記取得部により取得された説明変数の頻度が所定値以下の領域を特定し、
更新部が、前記特定部により特定された領域に属する説明変数を含む学習データを忘却させるように前記モデルを更新する
モデル更新方法。
コンピュータを、
説明変数に対する目的変数を出力するモデルに入力する説明変数を取得する取得部、
説明変数空間を分割した各領域に、各領域に含まれる説明変数が前記取得部により取得された頻度を対応付けると共に、前記モデルの学習に利用された学習データに含まれる説明変数が属する領域であって、前記取得部により取得された説明変数の頻度が所定値以下の領域を特定する特定部、及び、
前記特定部により特定された領域に属する説明変数を含む学習データを忘却させるように前記モデルを更新する更新部
として機能させるためのモデル更新プログラム。