JP2021157654A

JP2021157654A - 機械学習装置、学習モデルの生成方法及びプログラム

Info

Publication number: JP2021157654A
Application number: JP2020059007A
Authority: JP
Inventors: 貴好菊池; Takayoshi Kikuchi; 俊大内田; Shun Ouchida
Original assignee: KYB Corp
Current assignee: KYB Corp
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2021-10-07
Also published as: CN115315711A; WO2021193931A1; EP4131090A4; US20230126258A1; EP4131090A1

Abstract

【課題】データを選定して生成した新たな学習モデルへの更新等により、機械学習における精度を向上させるとともに、ランニングコストの低減を図る。【解決手段】データ収集部４１は機械学習を実行するためのデータを収集する。データ格納部４２は収集したデータを格納する。データ選定部４４は、データ格納部４２に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。そして、学習モデル生成部４５は選定されたデータに基づいて、機械学習により新規の学習モデルを生成し、更新部４６は、少なくとも、既存の学習モデルを学習モデル生成部４５において生成された新規の学習モデルに更新する。【選択図】図３

Description

本発明は、機械学習装置、学習モデルの生成方法及びプログラムに関する。

近年、ＣＰＵ（Central Processing Unit）及びＧＰＵ（Graphics Processing Unit）の高速化、メモリの大容量化、及び機械学習の技術が急速に進んできている。このため、数十万から百万といったオーダーの学習データを用いる機械学習が可能となり、精度の高い識別技術や分類技術が確立されつつある（非特許文献１参照）。

Yangqing Jia, Evan Shelhamer, Jeff Donahue, Sergey Karayev, Jonathan Long, Ross Girshick, Sergio Guadarrama, and Trevor Darrell. Caffe: Convolutional architecture for fast feature embedding. In Proceedings of the 22nd ACM international conference on Multimedia (pp. 675-678). ACM.

機械学習では、幅広い種類の対象体や対象体の状態等を汎用的に、検出あるいは認識するために、同じネットワークを使用し、対象体や対象体の状態等に応じて学習モデルを変更あるいは追加することにより、様々な対象体や対象体の状態等の認識を行っている。

ここで、学習モデルは、一般的に、偏りのない多くのデータから生成されることが好ましく、運用過程で新たなデータが収集されると当該データを用いて、学習モデルを更新するような処理も行われていた。

しかしながら、学習モデルの更新に偏りのあるデータを用いると、機械学習における精度が悪化するという問題があった。
また、新たに収集されたデータが膨大であると相当のランニングコストが発生するという問題もあった。

そこで、本発明は、上述の課題を解決するためになされたものであって、データを選定して生成した新たな学習モデルへの更新等により、機械学習における精度を向上させるとともに、ランニングコストの低減を図る機械学習装置、学習モデルの生成方法及びプログラムを提供することを目的とする。

形態１；本発明の１またはそれ以上の実施形態は、機械学習を実行するためのデータを収集するデータ収集部と、該収集したデータを格納するデータ格納部と、該データ格納部に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定するデータ選定部と、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する学習モデル生成部と、前記既存の学習モデルを前記学習モデル生成部において生成された前記新規の学習モデルに更新する更新部と、を備えた機械学習装置を提案している。

本装置では、データ選定部は、収集したデータを格納するデータ格納部に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。また、学習モデル生成部は、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。さらに、更新部は、既存の学習モデルを前記学習モデル生成部において生成された新規の学習モデルに更新する。
つまり、選定されたデータに基づいて、機械学習に用いられる既存の学習モデルを生成し、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。また、偏りのない厳選されたデータにより、機械学習により新規の学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。

形態２；本発明の１またはそれ以上の実施形態は、前記データ格納部に格納された所定のデータ収集期間内のデータ群についての分布を生成する分布生成部を備え、前記データ選定部は、前記分布生成部が生成する前記分布と、前記既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、前記データ格納部に格納されたデータ群を、前記学習モデルを更新するための前記データ群として選定する機械学習装置を提案している。

本装置では、分布生成部は、データ格納部に格納された所定のデータ収集期間内のデータ群についての分布を生成する。データ選定部は、分布生成部が生成する分布と、既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、データ格納部に格納されたデータ群を、学習モデルを更新するためのデータ群として選定する。
つまり、分布生成部が生成する分布が既存の分布に対して、設定された閾値以上に変化した場合には、対象体の状態に変化が起きたことが想定される。このような状況で、従前の学習モデルを用いて、機械学習を実行しても精度の低下を招いてしまうことが想定される。
そのため、分布生成部が生成する分布と、既存の学習モデルを生成した際のデータ群の分布と比較し、比較結果が類似しないと判定した場合には、データ格納部に格納されたデータ群を、学習モデルを更新するためのデータ群として選定して新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。

形態３；本発明の１またはそれ以上の実施形態は、前記データ選定部は、所定のデータ収集期間内に前記データ格納部に格納された格納データのうち、前記既存の学習モデルを生成した際のデータに対する外れ値を検出し、当該外れ値を含むデータを、前記学習モデルを更新するためのデータとして選定する更新装置を提案している。

本装置のデータ選定部は、所定のデータ収集期間内にデータ格納部に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定する。
つまり、データ選定部は、外れ値を検出するアルゴリズムを用いた機械学習を行い、所定のデータ収集期間内にデータ格納部に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定するため、結果的に、既存の学習モデルを生成した際のデータの分布に対して、所定以上外れたデータを新たな学習モデルを生成するためのデータとして選定することができる。
そのため、外れ値を検出するアルゴリズムを用いた機械学習を行ったデータ群を選定して新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。

形態４；本発明の１またはそれ以上の実施形態は、前記既存の学習モデルの精度と前記新規の学習モデルの精度とを比較する精度判定部を備え、前記更新部は、前記学習モデル生成部において生成された前記新規の学習モデルの精度が、前記既存の学習モデルの精度よりも低いときには、前記機械学習に用いられるアルゴリズムを変更する機械学習装置を提案している。

本装置では、精度判定部は、既存の学習モデルの精度と新規の学習モデルの精度とを比較する。更新部は、学習モデル生成部において生成された新規の学習モデルの精度が、既存の学習モデルの精度よりも低いときには、機械学習に用いられるアルゴリズムを変更する。
つまり、学習モデル生成部において生成された機械学習に用いられる新規の学習モデルを用いた機械学習の精度が、既存の機械学習に用いられる学習モデルを用いた機械学習の精度よりも低いときには、アルゴリズムが最適化されていないと判断し、更に、機械学習に用いられるアルゴリズムも変更する。
そのため、学習モデルを更新しても機械学習の精度が従前の精度よりも低い場合には、更に、アルゴリズムも変更することから、機械学習の精度を向上させることができる。また、ランニングコストに影響の大きい更新用の学習モデルの生成を厳選されたデータにより実行するため、学習モデルの更新に関わるランニングコストを低減することができる。

形態５；本発明の１またはそれ以上の実施形態は、機械学習を実行するためのデータを収集する第１の工程と、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第２の工程と、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第３の工程と、を備えたことを特徴とする学習モデルの生成方法を提案している。

本方法では、機械学習を実行するためのデータを収集し、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。そして、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。

形態６；本発明の１またはそれ以上の実施形態は、機械学習を実行するためのデータを収集する第１の工程と、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第２の工程と、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第３の工程と、前記既存の学習モデルを前記新規の学習モデルに更新する第４の工程と、をコンピュータに実行させるためのプログラムを提案している。

本プログラムでは、機械学習を実行するためのデータを収集し、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。そして、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成し、既存の学習モデルを新規の学習モデルに更新する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。

上記の故障予兆検出システムによれば、データを選定して生成した新たな学習モデルへの更新等により、機械学習における精度を向上させるとともに、ランニングコストの低減を図ることができる。

第１の実施形態に係る機械学習装置が用いられる故障予兆検出システムの構成を示す図である。第１の実施形態に係る故障予兆判定部の構成を示す図である。第１の実施形態に係る機械学習装置の構成を示す図である。第１の実施形態に係る機械学習装置の処理を示すフローチャート図である。第１の実施形態における分布を例示した図である。第２の実施形態に係る機械学習装置の構成を示す図である。第２の実施形態に係る機械学習装置内の外れ値検出部の構成を示す図である。第２の実施形態に係る機械学習装置の処理を示すフローチャート図である。第２の実施形態における外れ値を例示した図である。第３の実施形態に係る機械学習装置の構成を示す図である。第３の実施形態に係る機械学習装置の処理を示すフローチャート図である。

＜第１の実施形態＞
以下、図１から図５を用いて、本実施形態に係る機械学習装置４０について説明する。
なお、以下では、機械学習装置４０が用いられるシステムとして、故障予兆検出システム１を例示して説明する。

（故障予兆検出システムの構成）
図１を用いて、本実施形態に係る機械学習装置４０が用いられる故障予兆検出システム１の構成について説明する。なお、機械学習装置４０が用いられる故障予兆検出システム１は、機器内の作動油の油状態から機器の故障予兆情報を検出するシステムである。

図１に示すように、本実施形態に係る故障予兆検出システム１は、油状態センサ１０と、パラメータ算出部２０と、故障予兆判定部３０と、機械学習装置４０と、を含んで構成されている。

油状態センサ１０は、作動油の油状態を検出する油状態センサであり、センシング対象の機器１００の作動油内にセンシング部材が浸漬されるように装着され、例えば、作動油の比誘電率や導電率を含む情報を取得する。

パラメータ算出部２０は、油状態センサ１０のセンサ出力と相関関係情報とに基づいて、作動油の状態を示すパラメータの値を求める。

故障予兆判定部３０は、相関関係を有するパラメータの値から機器１００の故障予兆情報をリアルタイムに出力する。
ここで、故障予兆判定部３０は、相関関係を有するパラメータの値を入力し、機械学習を実行して機器１００の故障予兆情報を出力する。

機械学習装置４０は、故障予兆判定部３０において機械学習に用いられる学習モデルを更新する。具体的には、データとしてのパラメータ算出部２０において求められたパラメータの値のうち機械学習に用いられる学習モデルを更新するためのデータを選定する。そして、選定されたデータに基づいて、機械学習に用いられる学習モデルを生成し、既存の学習モデルを生成された学習モデルに更新する。

（故障予兆判定部３０の構成）
故障予兆判定部３０は、図２に示すように、故障予兆判定アルゴリズム３１と、学習モデル格納部３２と、制御部３３と、情報記憶部３４と、を含んで構成されている。

故障予兆判定アルゴリズム３１は、故障予兆判定部３０における機械学習を実行するためのアルゴリズムであり、パラメータ算出部２０において算出される作動油の油状態を示すパラメータのパラメータ値を入力とし、後述する学習モデルを用いた機械学習を実行し、例えば、故障時期、作動油の状態を示すパラメータの寄与度を含む故障予兆情報と、故障を未然に防止するための対応メッセージを出力する。

学習モデル格納部３２は、予め生成した学習モデルを格納する。ここで、学習モデルとは、入力データを元に、ルールやパターン（出力）を学習したデータである。

制御部３３は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等に格納された制御プログラムにしたがって、故障予兆判定部３０の動作を制御する。
また、制御部３３は、機械学習装置４０から更新する学習モデルを受け取ると、学習モデル格納部３２にアクセスして、既に格納されている学習モデルを更新する学習モデルに書き換える処理を行う。

情報記憶部３４は、パラメータ算出部２０から入力した情報と故障予兆判定アルゴリズム３１から出力される故障予兆情報とを紐付けたデータベースを記憶する。

（機械学習装置４０の構成）
機械学習装置４０は、図３に示すように、データ収集部４１と、データ格納部４２と、分布生成部４３と、データ選定部４４と、学習モデル生成部４５と、更新部４６と、を含んで構成されている。

データ収集部４１は、故障予兆判定部３０において機械学習を実行するためのデータを収集する。本実施形態においては、パラメータ算出部２０の算出結果（データ）を格納する故障予兆判定部３０内の情報記憶部３４に格納されている算出結果（データ）を故障予兆判定部３０内の制御部３３を介して取得する。
なお、他のシステムに機械学習装置４０が用いられる場合には、データ収集部４１が独自に、データを収集するようにしてもよい。

データ格納部４２は、データ収集部４１から入力した情報を、例えば、時系列順に格納する。また、データ格納部４２は、所定期間内に収集された情報を所定期間ごとに区切って格納するようにしてもよい。

分布生成部４３は、データ格納部４２に格納された所定のデータ収集期間内のデータ群についての分布を生成する。例えば、分布生成部４３は、パラメータ算出部２０の算出結果（データ）の分布を正規分布して生成してもよい。

データ選定部４４は、データ格納部４２に格納されたデータのうち機械学習に用いられる学習モデルを更新するためのデータを選定する。例えば、本実施形態においては、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化した場合に、変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定する。

学習モデル生成部４５は、データ選定部４４において選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する。

更新部４６は、既存の学習モデルを学習モデル生成部４５において生成された学習モデルに更新する。本実施形態においては、更新部４６は、故障予兆判定部３０内の制御部３３に既存の学習モデルを学習モデル生成部４５において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部３３に送信し、学習モデルの更新を実行させる。

（機械学習装置４０の処理）
図４および図５を用いて、本実施形態に係る機械学習装置４０の処理について説明する。

データ収集部４１は、故障予兆判定部３０において機械学習を実行するためのデータを収集する（ステップＳ１０１）。

分布生成部４３は、データ格納部４２に格納された所定のデータ収集期間内のデータ群についての分布を生成する（ステップＳ１０２）。このとき、分布生成部４３は、データ格納部４２に格納された直近の所定のデータ収集期間内のデータ群についての分布と、直近の所定のデータ収集期間の一つ前のデータ収集期間内のデータ群についての分布と、を生成し、データ選定部４４に出力する。なお、分布生成部４３が直近の所定のデータ収集期間よりも前の所定の収集期間のデータ群について生成した分布を、例えば、図示しない記憶部に格納しておくことにより、分布生成部４３の処理を低減してもよい。

データ選定部４４は、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化しているか否かを判定する（ステップＳ１０３）。データ選定部４４は、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化していないと判定した場合（ステップＳ１０３の「ＮＯ」）、処理をステップＳ１０１に戻す。

一方で、データ選定部４４は、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化していると判定した場合（ステップＳ１０３の「ＹＥＳ」）、例えば、図５に示すように、分布の中心が「Ａ」ずれており、「Ａ」が閾値以上である場合に、変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定し、当該データを学習モデル生成部４５に出力する。

学習モデル生成部４５は、データ選定部４４において選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する（ステップＳ１０４）。そして、更新部４６は、故障予兆判定部３０内の制御部３３に既存の学習モデルを学習モデル生成部４５において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部３３に送信し、学習モデルの更新を実行させる（ステップＳ１０５）。

（作用効果）
以上、説明したように、本実施形態における機械学習装置４０においては、データ選定部４４は、収集したデータを格納するデータ格納部４２に格納されたデータのうち、故障予兆判定部３０における機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。また、学習モデル生成部４５は、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。さらに、更新部４６は、既存の学習モデルを学習モデル生成部４５において生成された新規の学習モデルに更新する。
つまり、選定されたデータに基づいて、機械学習に用いられる既存の学習モデルを生成し、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。また、偏りのない厳選されたデータにより、機械学習により新規の学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。

本実施形態における機械学習装置４０において、分布生成部４３は、データ格納部４２に格納された所定のデータ収集期間内のデータ群についての分布を生成する。データ選定部４４は、分布生成部４３が生成する分布と、既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、データ格納部に格納されたデータ群を、学習モデルを更新するためのデータ群として選定する。
つまり、分布生成部４３が生成する分布と、既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しない場合には、対象体の状態に変化が起きたことが想定される。このような状況で、従前の学習モデルを用いて、機械学習を実行しても精度の低下を招いてしまうことが想定される。
そのため、分布生成部４３が生成する分布と、既存の学習モデルを生成した際のデータ群の分布と比較し、比較結果が類似しないと判定した場合には、データ格納部４２に格納されたデータ群を、学習モデルを更新するためのデータ群として選定して、新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。

＜第２の実施形態＞
以下、図６から図９を用いて、本実施形態に係る機械学習装置４０Ａについて説明する。

（機械学習装置４０Ａの構成）
図６を用いて、本実施形態に係る機械学習装置４０Ａの構成について説明する。

図６に示すように、本実施形態に係る機械学習装置４０Ａは、データ収集部４１と、データ格納部４２と、データ選定部４４Ａと、学習モデル生成部４５と、更新部４６と、外れ値検出部４７と、を含んで構成されている。
なお、第１の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。

データ選定部４４Ａは、データ格納部４２に格納されたデータのうち機械学習に用いられる学習モデルを更新するためのデータを選定する。例えば、本実施形態においては、直近の所定期間内にデータ格納部に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を機械学習に用いられる学習モデルを更新するためのデータとして選定する。なお、外れ値は、後述する外れ値検出部４７において検出される。

外れ値検出部４７は、データ格納部４２に格納されたデータを入力とし、専用アルゴリズムと学習モデルとを用いた機械学習を実行して、外れ値を検出する。検出した外れ値は、データ選定部４４Ａに出力される。

（外れ値検出部４７の構成）
図７に示すように、外れ値検出部４７は、外れ値検出アルゴリズム４７Ａと、学習モデル格納部４７Ｂと、を含んで構成されている。

外れ値検出アルゴリズム４７Ａは、複数のデータからなるデータ群に対して、後述する学習モデル格納部４７Ｂに格納された学習モデルを用いて、図９において、「×」印で示すような、所謂、外れ値を検出する機械学習を実行するためのアルゴリズムである。
なお、外れ値検出アルゴリズム４７Ａを用いた機械学習を実行すると、図９において「★」印のようなデータも検出するが、このようなデータについては、その目的等に応じて、適宜、除外等の処理をしてもよい。

学習モデル格納部４７Ｂは、外れ値検出アルゴリズム４７Ａにおける機械学習の実行において用いられる学習モデルを格納する。

（機械学習装置４０Ａの処理）
図８、図９を用いて、本実施形態に係る機械学習装置４０Ａの処理について説明する。

データ収集部４１は、故障予兆判定部３０において機械学習を実行するためのデータを収集する（ステップＳ２０１）。

外れ値検出部４７は、データ格納部４２に格納されたデータを入力と専用アルゴリズムと学習モデルとを用いた機械学習を実行して、外れ値を検出する。検出した外れ値は、データ選定部４４Ａに出力される（ステップＳ２０２）。具体的に、外れ値検出部４７は、外れ値検出アルゴリズム４７Ａを備えており、外れ値検出アルゴリズム４７Ａは、複数のデータからなるデータ群に対して、後述する学習モデル格納部４７Ｂに格納された学習モデルを用いて、図９において、「×」印で示すような、所謂、外れ値を検出する機械学習を実行して、検出した外れ値をデータ選定部４４Ａに出力する。

データ選定部４４Ａは、直近の所定期間内にデータ格納部に格納された格納データのうち、外れ値検出部４７において検出される既存の学習モデルを生成した際のデータに対する外れ値を機械学習に用いられる学習モデルを更新するためのデータとして選定する。

学習モデル生成部４５は、データ選定部４４Ａにおいて選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する（ステップＳ２０３）。そして、更新部４６は、故障予兆判定部３０内の制御部３３に既存の学習モデルを学習モデル生成部４５において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部３３に送信し、学習モデルの更新を実行させる（ステップＳ２０４）。

（作用効果）
以上、説明したように、本実施形態における機械学習装置４０Ａにおいては、データ選定部４４Ａは、所定のデータ収集期間内にデータ格納部４２に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定する。
つまり、データ選定部４４Ａは、外れ値を検出するアルゴリズムを用いた機械学習を行い、所定のデータ収集期間内にデータ格納部４２に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定するため、結果的に、既存の学習モデルを生成した際のデータの分布に対して、所定以上外れたデータを新たな学習モデルを生成するためのデータとして選定することができる。
そのため、外れ値を検出するアルゴリズムを用いた機械学習を行ったデータ群を選定して新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。
なお、本実施形態においては、外れ値を検出するアルゴリズムを用いた機械学習を行うことを例示したが、例えば、３σ法等のように、機械学習を用いない外れ値検出法を用いて処理を行ってもよい。

＜第３の実施形態＞
以下、図１０、図１１を用いて、本実施形態に係る機械学習装置４０Ｂについて説明する。

（機械学習装置４０Ｂの構成）
図１０を用いて、本実施形態に係る機械学習装置４０Ｂの構成について説明する。

図１０に示すように、本実施形態に係る機械学習装置４０Ｂは、データ収集部４１と、データ格納部４２と、分布生成部４３と、データ選定部４４と、学習モデル生成部４５と、更新部４６Ａと、アルゴリズム格納部４８と、精度判定部４９と、を含んで構成されている。
なお、第１の実施形態および第２の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。

更新部４６Ａは、既存の学習モデルを学習モデル生成部４５において生成された学習モデルに更新するとともに、後述する精度判定部４９において、学習モデル生成部４５において生成された機械学習に用いられる学習モデルを用いた機械学習の精度が、既存の機械学習に用いられる学習モデルを用いた機械学習の精度よりも低いと判定された場合に、更に、機械学習に用いられるアルゴリズムも変更する。

アルゴリズム格納部４８は、特徴の異なる複数の機械学習用アルゴリズムを格納する。更新部４６Ａは、アルゴリズム格納部４８に格納されたアルゴリズムの中から更新用のアルゴリズムを選択し、故障予兆判定部３０内の制御部３３に出力する。

精度判定部４９は、既存の学習モデルと学習モデル生成部４５において生成された機械学習に用いられる学習モデルを用いた機械学習の精度とを比較して、学習モデル生成部４５において生成された機械学習に用いられる学習モデルを用いた機械学習の精度を判定する。

（機械学習装置４０Ｂの処理）
図１１を用いて、本実施形態に係る機械学習装置４０Ｂの処理について説明する。

データ収集部４１は、故障予兆判定部３０において機械学習を実行するためのデータを収集する（ステップＳ３０１）。

分布生成部４３は、データ格納部４２に格納された所定のデータ収集期間内のデータ群についての分布を生成する（ステップＳ３０２）。このとき、分布生成部４３は、データ格納部４２に格納された直近の所定のデータ収集期間内のデータ群についての分布と、直近の所定のデータ収集期間の一つ前のデータ収集期間内のデータ群についての分布と、を生成し、データ選定部４４に出力する。

データ選定部４４は、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化しているか否かを判定する（ステップＳ３０３）。データ選定部４４は、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化していないと判定した場合（ステップＳ３０３の「ＮＯ」）、処理をステップＳ３０１に戻す。

一方で、データ選定部４４は、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化していると判定した場合（ステップＳ３０３の「ＹＥＳ」）変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定し、当該データを学習モデル生成部４５に出力する。

学習モデル生成部４５は、データ選定部４４において選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する（ステップＳ４０４）。更新部４６Ａは、故障予兆判定部３０内の制御部３３に既存の学習モデルを学習モデル生成部４５において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部３３に送信し、学習モデルの更新を実行させる（ステップＳ３０５）。

次いで、精度判定部４９は、既存の学習モデルと学習モデル生成部４５において生成された機械学習に用いられる学習モデルを用いた機械学習の精度とを比較して、学習モデル生成部４５において生成された機械学習に用いられる学習モデルを用いた機械学習の精度を判定する（ステップＳ３０６）。

精度判定部４９における判定の結果、学習モデル生成部４５において生成された機械学習に用いられる学習モデルを用いた機械学習の精度が既存の学習モデルを用いた機械学習の精度に対して、悪化していない場合（ステップＳ３０６の「ＮＯ」）には、処理をステップＳ３０１に戻す。

一方で、精度判定部４９における判定の結果、学習モデル生成部４５において生成された機械学習に用いられる学習モデルを用いた機械学習の精度が既存の学習モデルを用いた機械学習の精度に対して、悪化している場合（ステップＳ３０６の「ＹＥＳ」）には、更新部４６Ａは、故障予兆判定部３０内の制御部３３に既存の故障予兆判定アルゴリズムをアルゴリズム格納部４８に格納された別のアルゴリズムに更新させる命令メッセージと更新する別のアルゴリズムとを制御部３３に送信し、アルゴリズムの更新を実行させる（ステップＳ３０７）。

（作用効果）
以上、説明したように、本実施形態における機械学習装置４０Ｂにおいては、精度判定部４９は、既存の学習モデルの精度と新規の学習モデルの精度とを比較する。更新部４６Ａは、学習モデル生成部４５において生成された新規の学習モデルの精度が、既存の学習モデルの精度よりも低いときには、機械学習に用いられるアルゴリズムを変更する。
つまり、学習モデル生成部４５において生成された機械学習に用いられる新規の学習モデルを用いた機械学習の精度が、既存の機械学習に用いられる学習モデルを用いた機械学習の精度よりも低いときには、ハイパーパラメータを更新して評価した上、改善が見られない場合には、アルゴリズムも変更する。また、アルゴリズムとしては、例えば、ＳＶＭやＤＮＮを例示できるが、これらのアルゴリズム単体で評価を行う以外に、複数のアルゴリズムを混合して評価するアンサンブル学習により評価を行うようにしてもよい。
そのため、学習モデルを更新しても機械学習の精度が従前の精度よりも低い場合には、更に、アルゴリズムも変更することから、機械学習の精度を向上させることができる。また、ランニングコストに影響の大きい更新用の学習モデルの生成を厳選されたデータにより実行するため、学習モデルの更新に関わるランニングコストを低減することができる。また、ハイパーパラメータを更新して評価した上、改善が見られない場合には、アルゴリズムも変更するため、アルゴリズムが同一であってもハイパーパラメータのチューニング精度が向上することを期待できる場合もある。

なお、第１の実施形態において、閾値の設定は、任意に行えるようにしてもよい。また、閾値の設定は、データ選定部４４により選定されたデータの類似度に応じて、自動的に定めてもよい。

また、第３の実施形態では、データ選定部４４は、分布生成部４３が生成する分布が既存の分布に対して、設定された閾値以上に変化していると判定した場合、変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定することを例示したが、第２の実施形態で示したように、データ選定部４４Ａは、直近の所定期間内にデータ格納部に格納された格納データのうち、外れ値検出部４７において検出される既存の学習モデルを生成した際のデータに対する外れ値を機械学習に用いられる学習モデルを更新するためのデータとして選定するようにしてもよい。

なお、機械学習装置４０、４０Ａ、４０Ｂの処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを機械学習装置４０、４０Ａ、４０Ｂに読み込ませ、実行することによって本発明の機械学習装置４０、４０Ａ、４０Ｂを実現することができる。ここでいうコンピュータシステムとは、ＯＳや周辺装置等のハードウェアを含む。

「コンピュータシステム」は、ＷＷＷ（ＷｏｒｌｄＷｉｄｅＷｅｂ）システムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。

また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル（差分プログラム）であってもよい。

以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

１；故障予兆検出システム
１０；油状態センサ
２０；パラメータ算出部
３０；故障予兆判定部
３１；故障予兆判定アルゴリズム
３２；学習モデル格納部
３３；制御部
３４；情報記憶部
４０；機械学習装置
４０Ａ；機械学習装置
４０Ｂ；機械学習装置
４１；データ収集部
４２；データ格納部
４３；分布生成部
４４；データ選定部
４４Ａ；データ選定部
４５；学習モデル生成部
４６；更新部
４６Ａ；更新部
４７；外れ値検出部
４７Ａ；外れ値検出アルゴリズム
４７Ｂ；学習モデル格納部
４８；アルゴリズム格納部
４９；精度判定部
１００；機器

Claims

機械学習を実行するためのデータを収集するデータ収集部と、
該収集したデータを格納するデータ格納部と、
該データ格納部に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定するデータ選定部と、
該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する学習モデル生成部と、
前記既存の学習モデルを前記学習モデル生成部において生成された前記新規の学習モデルに更新する更新部と、
を備えたことを特徴とする機械学習装置。
前記データ格納部に格納された所定のデータ収集期間内のデータ群についての分布を生成する分布生成部を備え、
前記データ選定部は、前記分布生成部が生成する前記分布と、前記既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、前記データ格納部に格納されたデータ群を、前記学習モデルを更新するための前記データ群として選定することを特徴とする請求項１に記載の機械学習装置。
前記データ選定部は、所定のデータ収集期間内に前記データ格納部に格納された格納データのうち、前記既存の学習モデルを生成した際のデータに対する外れ値を検出し、当該外れ値を含むデータを、前記学習モデルを更新するためのデータとして選定することを特徴とする請求項１に記載の機械学習装置。
前記既存の学習モデルの精度と前記新規の学習モデルの精度とを比較する精度判定部を備え、
前記更新部は、前記学習モデル生成部において生成された前記新規の学習モデルの精度が、前記既存の学習モデルの精度よりも低いときには、前記機械学習に用いられるアルゴリズムを変更することを特徴とする請求項１から３のいずれか１項に記載の機械学習装置。
機械学習を実行するためのデータを収集する第１の工程と、
該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第２の工程と、
該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第３の工程と、
を備えたことを特徴とする学習モデルの生成方法。
機械学習を実行するためのデータを収集する第１の工程と、
該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第２の工程と、
該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第３の工程と、
前記既存の学習モデルを前記新規の学習モデルに更新する第４の工程と、
をコンピュータに実行させるためのプログラム。