JP2021157654A - 機械学習装置、学習モデルの生成方法及びプログラム - Google Patents

機械学習装置、学習モデルの生成方法及びプログラム Download PDF

Info

Publication number
JP2021157654A
JP2021157654A JP2020059007A JP2020059007A JP2021157654A JP 2021157654 A JP2021157654 A JP 2021157654A JP 2020059007 A JP2020059007 A JP 2020059007A JP 2020059007 A JP2020059007 A JP 2020059007A JP 2021157654 A JP2021157654 A JP 2021157654A
Authority
JP
Japan
Prior art keywords
data
learning model
machine learning
unit
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020059007A
Other languages
English (en)
Inventor
貴好 菊池
Takayoshi Kikuchi
貴好 菊池
俊 大内田
Shun Ouchida
俊 大内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KYB Corp
Original Assignee
KYB Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KYB Corp filed Critical KYB Corp
Priority to JP2020059007A priority Critical patent/JP2021157654A/ja
Priority to CN202180023864.3A priority patent/CN115315711A/zh
Priority to US17/914,024 priority patent/US20230126258A1/en
Priority to EP21775782.2A priority patent/EP4131090A4/en
Priority to PCT/JP2021/012928 priority patent/WO2021193931A1/ja
Publication of JP2021157654A publication Critical patent/JP2021157654A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】データを選定して生成した新たな学習モデルへの更新等により、機械学習における精度を向上させるとともに、ランニングコストの低減を図る。【解決手段】データ収集部41は機械学習を実行するためのデータを収集する。データ格納部42は収集したデータを格納する。データ選定部44は、データ格納部42に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。そして、学習モデル生成部45は選定されたデータに基づいて、機械学習により新規の学習モデルを生成し、更新部46は、少なくとも、既存の学習モデルを学習モデル生成部45において生成された新規の学習モデルに更新する。【選択図】図3

Description

本発明は、機械学習装置、学習モデルの生成方法及びプログラムに関する。
近年、CPU(Central Processing Unit)及びGPU(Graphics Processing Unit)の高速化、メモリの大容量化、及び機械学習の技術が急速に進んできている。このため、数十万から百万といったオーダーの学習データを用いる機械学習が可能となり、精度の高い識別技術や分類技術が確立されつつある(非特許文献1参照)。
Yangqing Jia, Evan Shelhamer, Jeff Donahue, Sergey Karayev, Jonathan Long, Ross Girshick, Sergio Guadarrama, and Trevor Darrell. Caffe: Convolutional architecture for fast feature embedding. In Proceedings of the 22nd ACM international conference on Multimedia (pp. 675-678). ACM.
機械学習では、幅広い種類の対象体や対象体の状態等を汎用的に、検出あるいは認識するために、同じネットワークを使用し、対象体や対象体の状態等に応じて学習モデルを変更あるいは追加することにより、様々な対象体や対象体の状態等の認識を行っている。
ここで、学習モデルは、一般的に、偏りのない多くのデータから生成されることが好ましく、運用過程で新たなデータが収集されると当該データを用いて、学習モデルを更新するような処理も行われていた。
しかしながら、学習モデルの更新に偏りのあるデータを用いると、機械学習における精度が悪化するという問題があった。
また、新たに収集されたデータが膨大であると相当のランニングコストが発生するという問題もあった。
そこで、本発明は、上述の課題を解決するためになされたものであって、データを選定して生成した新たな学習モデルへの更新等により、機械学習における精度を向上させるとともに、ランニングコストの低減を図る機械学習装置、学習モデルの生成方法及びプログラムを提供することを目的とする。
形態1;本発明の1またはそれ以上の実施形態は、機械学習を実行するためのデータを収集するデータ収集部と、該収集したデータを格納するデータ格納部と、該データ格納部に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定するデータ選定部と、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する学習モデル生成部と、前記既存の学習モデルを前記学習モデル生成部において生成された前記新規の学習モデルに更新する更新部と、を備えた機械学習装置を提案している。
本装置では、データ選定部は、収集したデータを格納するデータ格納部に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。また、学習モデル生成部は、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。さらに、更新部は、既存の学習モデルを前記学習モデル生成部において生成された新規の学習モデルに更新する。
つまり、選定されたデータに基づいて、機械学習に用いられる既存の学習モデルを生成し、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。また、偏りのない厳選されたデータにより、機械学習により新規の学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。
形態2;本発明の1またはそれ以上の実施形態は、前記データ格納部に格納された所定のデータ収集期間内のデータ群についての分布を生成する分布生成部を備え、前記データ選定部は、前記分布生成部が生成する前記分布と、前記既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、前記データ格納部に格納されたデータ群を、前記学習モデルを更新するための前記データ群として選定する機械学習装置を提案している。
本装置では、分布生成部は、データ格納部に格納された所定のデータ収集期間内のデータ群についての分布を生成する。データ選定部は、分布生成部が生成する分布と、既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、データ格納部に格納されたデータ群を、学習モデルを更新するためのデータ群として選定する。
つまり、分布生成部が生成する分布が既存の分布に対して、設定された閾値以上に変化した場合には、対象体の状態に変化が起きたことが想定される。このような状況で、従前の学習モデルを用いて、機械学習を実行しても精度の低下を招いてしまうことが想定される。
そのため、分布生成部が生成する分布と、既存の学習モデルを生成した際のデータ群の分布と比較し、比較結果が類似しないと判定した場合には、データ格納部に格納されたデータ群を、学習モデルを更新するためのデータ群として選定して新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。
形態3;本発明の1またはそれ以上の実施形態は、前記データ選定部は、所定のデータ収集期間内に前記データ格納部に格納された格納データのうち、前記既存の学習モデルを生成した際のデータに対する外れ値を検出し、当該外れ値を含むデータを、前記学習モデルを更新するためのデータとして選定する更新装置を提案している。
本装置のデータ選定部は、所定のデータ収集期間内にデータ格納部に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定する。
つまり、データ選定部は、外れ値を検出するアルゴリズムを用いた機械学習を行い、所定のデータ収集期間内にデータ格納部に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定するため、結果的に、既存の学習モデルを生成した際のデータの分布に対して、所定以上外れたデータを新たな学習モデルを生成するためのデータとして選定することができる。
そのため、外れ値を検出するアルゴリズムを用いた機械学習を行ったデータ群を選定して新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。
形態4;本発明の1またはそれ以上の実施形態は、前記既存の学習モデルの精度と前記新規の学習モデルの精度とを比較する精度判定部を備え、前記更新部は、前記学習モデル生成部において生成された前記新規の学習モデルの精度が、前記既存の学習モデルの精度よりも低いときには、前記機械学習に用いられるアルゴリズムを変更する機械学習装置を提案している。
本装置では、精度判定部は、既存の学習モデルの精度と新規の学習モデルの精度とを比較する。更新部は、学習モデル生成部において生成された新規の学習モデルの精度が、既存の学習モデルの精度よりも低いときには、機械学習に用いられるアルゴリズムを変更する。
つまり、学習モデル生成部において生成された機械学習に用いられる新規の学習モデルを用いた機械学習の精度が、既存の機械学習に用いられる学習モデルを用いた機械学習の精度よりも低いときには、アルゴリズムが最適化されていないと判断し、更に、機械学習に用いられるアルゴリズムも変更する。
そのため、学習モデルを更新しても機械学習の精度が従前の精度よりも低い場合には、更に、アルゴリズムも変更することから、機械学習の精度を向上させることができる。また、ランニングコストに影響の大きい更新用の学習モデルの生成を厳選されたデータにより実行するため、学習モデルの更新に関わるランニングコストを低減することができる。
形態5;本発明の1またはそれ以上の実施形態は、機械学習を実行するためのデータを収集する第1の工程と、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第2の工程と、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第3の工程と、を備えたことを特徴とする学習モデルの生成方法を提案している。
本方法では、機械学習を実行するためのデータを収集し、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。そして、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。
形態6;本発明の1またはそれ以上の実施形態は、機械学習を実行するためのデータを収集する第1の工程と、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第2の工程と、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第3の工程と、前記既存の学習モデルを前記新規の学習モデルに更新する第4の工程と、をコンピュータに実行させるためのプログラムを提案している。
本プログラムでは、機械学習を実行するためのデータを収集し、該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。そして、該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成し、既存の学習モデルを新規の学習モデルに更新する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。
上記の故障予兆検出システムによれば、データを選定して生成した新たな学習モデルへの更新等により、機械学習における精度を向上させるとともに、ランニングコストの低減を図ることができる。
第1の実施形態に係る機械学習装置が用いられる故障予兆検出システムの構成を示す図である。 第1の実施形態に係る故障予兆判定部の構成を示す図である。 第1の実施形態に係る機械学習装置の構成を示す図である。 第1の実施形態に係る機械学習装置の処理を示すフローチャート図である。 第1の実施形態における分布を例示した図である。 第2の実施形態に係る機械学習装置の構成を示す図である。 第2の実施形態に係る機械学習装置内の外れ値検出部の構成を示す図である。 第2の実施形態に係る機械学習装置の処理を示すフローチャート図である。 第2の実施形態における外れ値を例示した図である。 第3の実施形態に係る機械学習装置の構成を示す図である。 第3の実施形態に係る機械学習装置の処理を示すフローチャート図である。
<第1の実施形態>
以下、図1から図5を用いて、本実施形態に係る機械学習装置40について説明する。
なお、以下では、機械学習装置40が用いられるシステムとして、故障予兆検出システム1を例示して説明する。
(故障予兆検出システムの構成)
図1を用いて、本実施形態に係る機械学習装置40が用いられる故障予兆検出システム1の構成について説明する。なお、機械学習装置40が用いられる故障予兆検出システム1は、機器内の作動油の油状態から機器の故障予兆情報を検出するシステムである。
図1に示すように、本実施形態に係る故障予兆検出システム1は、油状態センサ10と、パラメータ算出部20と、故障予兆判定部30と、機械学習装置40と、を含んで構成されている。
油状態センサ10は、作動油の油状態を検出する油状態センサであり、センシング対象の機器100の作動油内にセンシング部材が浸漬されるように装着され、例えば、作動油の比誘電率や導電率を含む情報を取得する。
パラメータ算出部20は、油状態センサ10のセンサ出力と相関関係情報とに基づいて、作動油の状態を示すパラメータの値を求める。
故障予兆判定部30は、相関関係を有するパラメータの値から機器100の故障予兆情報をリアルタイムに出力する。
ここで、故障予兆判定部30は、相関関係を有するパラメータの値を入力し、機械学習を実行して機器100の故障予兆情報を出力する。
機械学習装置40は、故障予兆判定部30において機械学習に用いられる学習モデルを更新する。具体的には、データとしてのパラメータ算出部20において求められたパラメータの値のうち機械学習に用いられる学習モデルを更新するためのデータを選定する。そして、選定されたデータに基づいて、機械学習に用いられる学習モデルを生成し、既存の学習モデルを生成された学習モデルに更新する。
(故障予兆判定部30の構成)
故障予兆判定部30は、図2に示すように、故障予兆判定アルゴリズム31と、学習モデル格納部32と、制御部33と、情報記憶部34と、を含んで構成されている。
故障予兆判定アルゴリズム31は、故障予兆判定部30における機械学習を実行するためのアルゴリズムであり、パラメータ算出部20において算出される作動油の油状態を示すパラメータのパラメータ値を入力とし、後述する学習モデルを用いた機械学習を実行し、例えば、故障時期、作動油の状態を示すパラメータの寄与度を含む故障予兆情報と、故障を未然に防止するための対応メッセージを出力する。
学習モデル格納部32は、予め生成した学習モデルを格納する。ここで、学習モデルとは、入力データを元に、ルールやパターン(出力)を学習したデータである。
制御部33は、ROM(Read Only Memory)等に格納された制御プログラムにしたがって、故障予兆判定部30の動作を制御する。
また、制御部33は、機械学習装置40から更新する学習モデルを受け取ると、学習モデル格納部32にアクセスして、既に格納されている学習モデルを更新する学習モデルに書き換える処理を行う。
情報記憶部34は、パラメータ算出部20から入力した情報と故障予兆判定アルゴリズム31から出力される故障予兆情報とを紐付けたデータベースを記憶する。
(機械学習装置40の構成)
機械学習装置40は、図3に示すように、データ収集部41と、データ格納部42と、分布生成部43と、データ選定部44と、学習モデル生成部45と、更新部46と、を含んで構成されている。
データ収集部41は、故障予兆判定部30において機械学習を実行するためのデータを収集する。本実施形態においては、パラメータ算出部20の算出結果(データ)を格納する故障予兆判定部30内の情報記憶部34に格納されている算出結果(データ)を故障予兆判定部30内の制御部33を介して取得する。
なお、他のシステムに機械学習装置40が用いられる場合には、データ収集部41が独自に、データを収集するようにしてもよい。
データ格納部42は、データ収集部41から入力した情報を、例えば、時系列順に格納する。また、データ格納部42は、所定期間内に収集された情報を所定期間ごとに区切って格納するようにしてもよい。
分布生成部43は、データ格納部42に格納された所定のデータ収集期間内のデータ群についての分布を生成する。例えば、分布生成部43は、パラメータ算出部20の算出結果(データ)の分布を正規分布して生成してもよい。
データ選定部44は、データ格納部42に格納されたデータのうち機械学習に用いられる学習モデルを更新するためのデータを選定する。例えば、本実施形態においては、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化した場合に、変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定する。
学習モデル生成部45は、データ選定部44において選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する。
更新部46は、既存の学習モデルを学習モデル生成部45において生成された学習モデルに更新する。本実施形態においては、更新部46は、故障予兆判定部30内の制御部33に既存の学習モデルを学習モデル生成部45において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部33に送信し、学習モデルの更新を実行させる。
(機械学習装置40の処理)
図4および図5を用いて、本実施形態に係る機械学習装置40の処理について説明する。
データ収集部41は、故障予兆判定部30において機械学習を実行するためのデータを収集する(ステップS101)。
分布生成部43は、データ格納部42に格納された所定のデータ収集期間内のデータ群についての分布を生成する(ステップS102)。このとき、分布生成部43は、データ格納部42に格納された直近の所定のデータ収集期間内のデータ群についての分布と、直近の所定のデータ収集期間の一つ前のデータ収集期間内のデータ群についての分布と、を生成し、データ選定部44に出力する。なお、分布生成部43が直近の所定のデータ収集期間よりも前の所定の収集期間のデータ群について生成した分布を、例えば、図示しない記憶部に格納しておくことにより、分布生成部43の処理を低減してもよい。
データ選定部44は、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化しているか否かを判定する(ステップS103)。データ選定部44は、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化していないと判定した場合(ステップS103の「NO」)、処理をステップS101に戻す。
一方で、データ選定部44は、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化していると判定した場合(ステップS103の「YES」)、例えば、図5に示すように、分布の中心が「A」ずれており、「A」が閾値以上である場合に、変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定し、当該データを学習モデル生成部45に出力する。
学習モデル生成部45は、データ選定部44において選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する(ステップS104)。そして、更新部46は、故障予兆判定部30内の制御部33に既存の学習モデルを学習モデル生成部45において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部33に送信し、学習モデルの更新を実行させる(ステップS105)。
(作用効果)
以上、説明したように、本実施形態における機械学習装置40においては、データ選定部44は、収集したデータを格納するデータ格納部42に格納されたデータのうち、故障予兆判定部30における機械学習に用いられる既存の学習モデルを更新するためのデータを選定する。また、学習モデル生成部45は、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。さらに、更新部46は、既存の学習モデルを学習モデル生成部45において生成された新規の学習モデルに更新する。
つまり、選定されたデータに基づいて、機械学習に用いられる既存の学習モデルを生成し、選定されたデータに基づいて、機械学習により新規の学習モデルを生成する。
そのため、例えば、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、機械学習における精度を向上させることができる。また、偏りのない厳選されたデータにより、機械学習により新規の学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。
本実施形態における機械学習装置40において、分布生成部43は、データ格納部42に格納された所定のデータ収集期間内のデータ群についての分布を生成する。データ選定部44は、分布生成部43が生成する分布と、既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、データ格納部に格納されたデータ群を、学習モデルを更新するためのデータ群として選定する。
つまり、分布生成部43が生成する分布と、既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しない場合には、対象体の状態に変化が起きたことが想定される。このような状況で、従前の学習モデルを用いて、機械学習を実行しても精度の低下を招いてしまうことが想定される。
そのため、分布生成部43が生成する分布と、既存の学習モデルを生成した際のデータ群の分布と比較し、比較結果が類似しないと判定した場合には、データ格納部42に格納されたデータ群を、学習モデルを更新するためのデータ群として選定して、新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、偏りのない厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。
<第2の実施形態>
以下、図6から図9を用いて、本実施形態に係る機械学習装置40Aについて説明する。
(機械学習装置40Aの構成)
図6を用いて、本実施形態に係る機械学習装置40Aの構成について説明する。
図6に示すように、本実施形態に係る機械学習装置40Aは、データ収集部41と、データ格納部42と、データ選定部44Aと、学習モデル生成部45と、更新部46と、外れ値検出部47と、を含んで構成されている。
なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
データ選定部44Aは、データ格納部42に格納されたデータのうち機械学習に用いられる学習モデルを更新するためのデータを選定する。例えば、本実施形態においては、直近の所定期間内にデータ格納部に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を機械学習に用いられる学習モデルを更新するためのデータとして選定する。なお、外れ値は、後述する外れ値検出部47において検出される。
外れ値検出部47は、データ格納部42に格納されたデータを入力とし、専用アルゴリズムと学習モデルとを用いた機械学習を実行して、外れ値を検出する。検出した外れ値は、データ選定部44Aに出力される。
(外れ値検出部47の構成)
図7に示すように、外れ値検出部47は、外れ値検出アルゴリズム47Aと、学習モデル格納部47Bと、を含んで構成されている。
外れ値検出アルゴリズム47Aは、複数のデータからなるデータ群に対して、後述する学習モデル格納部47Bに格納された学習モデルを用いて、図9において、「×」印で示すような、所謂、外れ値を検出する機械学習を実行するためのアルゴリズムである。
なお、外れ値検出アルゴリズム47Aを用いた機械学習を実行すると、図9において「★」印のようなデータも検出するが、このようなデータについては、その目的等に応じて、適宜、除外等の処理をしてもよい。
学習モデル格納部47Bは、外れ値検出アルゴリズム47Aにおける機械学習の実行において用いられる学習モデルを格納する。
(機械学習装置40Aの処理)
図8、図9を用いて、本実施形態に係る機械学習装置40Aの処理について説明する。
データ収集部41は、故障予兆判定部30において機械学習を実行するためのデータを収集する(ステップS201)。
外れ値検出部47は、データ格納部42に格納されたデータを入力と専用アルゴリズムと学習モデルとを用いた機械学習を実行して、外れ値を検出する。検出した外れ値は、データ選定部44Aに出力される(ステップS202)。具体的に、外れ値検出部47は、外れ値検出アルゴリズム47Aを備えており、外れ値検出アルゴリズム47Aは、複数のデータからなるデータ群に対して、後述する学習モデル格納部47Bに格納された学習モデルを用いて、図9において、「×」印で示すような、所謂、外れ値を検出する機械学習を実行して、検出した外れ値をデータ選定部44Aに出力する。
データ選定部44Aは、直近の所定期間内にデータ格納部に格納された格納データのうち、外れ値検出部47において検出される既存の学習モデルを生成した際のデータに対する外れ値を機械学習に用いられる学習モデルを更新するためのデータとして選定する。
学習モデル生成部45は、データ選定部44Aにおいて選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する(ステップS203)。そして、更新部46は、故障予兆判定部30内の制御部33に既存の学習モデルを学習モデル生成部45において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部33に送信し、学習モデルの更新を実行させる(ステップS204)。
(作用効果)
以上、説明したように、本実施形態における機械学習装置40Aにおいては、データ選定部44Aは、所定のデータ収集期間内にデータ格納部42に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定する。
つまり、データ選定部44Aは、外れ値を検出するアルゴリズムを用いた機械学習を行い、所定のデータ収集期間内にデータ格納部42に格納された格納データのうち、既存の学習モデルを生成した際のデータに対する外れ値を検出し、その外れ値を含むデータを、学習モデルを更新するためのデータとして選定するため、結果的に、既存の学習モデルを生成した際のデータの分布に対して、所定以上外れたデータを新たな学習モデルを生成するためのデータとして選定することができる。
そのため、外れ値を検出するアルゴリズムを用いた機械学習を行ったデータ群を選定して新たな学習モデルを生成し、既存の学習モデルを生成した学習モデルに更新することにより機械学習の精度を向上させることができる。また、厳選されたデータにより、更新に用いる学習モデルを生成するため、学習モデルの更新に関わるランニングコストを低減することができる。
なお、本実施形態においては、外れ値を検出するアルゴリズムを用いた機械学習を行うことを例示したが、例えば、3σ法等のように、機械学習を用いない外れ値検出法を用いて処理を行ってもよい。
<第3の実施形態>
以下、図10、図11を用いて、本実施形態に係る機械学習装置40Bについて説明する。
(機械学習装置40Bの構成)
図10を用いて、本実施形態に係る機械学習装置40Bの構成について説明する。
図10に示すように、本実施形態に係る機械学習装置40Bは、データ収集部41と、データ格納部42と、分布生成部43と、データ選定部44と、学習モデル生成部45と、更新部46Aと、アルゴリズム格納部48と、精度判定部49と、を含んで構成されている。
なお、第1の実施形態および第2の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
更新部46Aは、既存の学習モデルを学習モデル生成部45において生成された学習モデルに更新するとともに、後述する精度判定部49において、学習モデル生成部45において生成された機械学習に用いられる学習モデルを用いた機械学習の精度が、既存の機械学習に用いられる学習モデルを用いた機械学習の精度よりも低いと判定された場合に、更に、機械学習に用いられるアルゴリズムも変更する。
アルゴリズム格納部48は、特徴の異なる複数の機械学習用アルゴリズムを格納する。更新部46Aは、アルゴリズム格納部48に格納されたアルゴリズムの中から更新用のアルゴリズムを選択し、故障予兆判定部30内の制御部33に出力する。
精度判定部49は、既存の学習モデルと学習モデル生成部45において生成された機械学習に用いられる学習モデルを用いた機械学習の精度とを比較して、学習モデル生成部45において生成された機械学習に用いられる学習モデルを用いた機械学習の精度を判定する。
(機械学習装置40Bの処理)
図11を用いて、本実施形態に係る機械学習装置40Bの処理について説明する。
データ収集部41は、故障予兆判定部30において機械学習を実行するためのデータを収集する(ステップS301)。
分布生成部43は、データ格納部42に格納された所定のデータ収集期間内のデータ群についての分布を生成する(ステップS302)。このとき、分布生成部43は、データ格納部42に格納された直近の所定のデータ収集期間内のデータ群についての分布と、直近の所定のデータ収集期間の一つ前のデータ収集期間内のデータ群についての分布と、を生成し、データ選定部44に出力する。
データ選定部44は、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化しているか否かを判定する(ステップS303)。データ選定部44は、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化していないと判定した場合(ステップS303の「NO」)、処理をステップS301に戻す。
一方で、データ選定部44は、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化していると判定した場合(ステップS303の「YES」)変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定し、当該データを学習モデル生成部45に出力する。
学習モデル生成部45は、データ選定部44において選定されたデータに基づいて、機械学習に用いられる学習モデルを生成する(ステップS404)。更新部46Aは、故障予兆判定部30内の制御部33に既存の学習モデルを学習モデル生成部45において生成された学習モデルに更新させる命令メッセージと更新する学習モデルとを制御部33に送信し、学習モデルの更新を実行させる(ステップS305)。
次いで、精度判定部49は、既存の学習モデルと学習モデル生成部45において生成された機械学習に用いられる学習モデルを用いた機械学習の精度とを比較して、学習モデル生成部45において生成された機械学習に用いられる学習モデルを用いた機械学習の精度を判定する(ステップS306)。
精度判定部49における判定の結果、学習モデル生成部45において生成された機械学習に用いられる学習モデルを用いた機械学習の精度が既存の学習モデルを用いた機械学習の精度に対して、悪化していない場合(ステップS306の「NO」)には、処理をステップS301に戻す。
一方で、精度判定部49における判定の結果、学習モデル生成部45において生成された機械学習に用いられる学習モデルを用いた機械学習の精度が既存の学習モデルを用いた機械学習の精度に対して、悪化している場合(ステップS306の「YES」)には、更新部46Aは、故障予兆判定部30内の制御部33に既存の故障予兆判定アルゴリズムをアルゴリズム格納部48に格納された別のアルゴリズムに更新させる命令メッセージと更新する別のアルゴリズムとを制御部33に送信し、アルゴリズムの更新を実行させる(ステップS307)。
(作用効果)
以上、説明したように、本実施形態における機械学習装置40Bにおいては、精度判定部49は、既存の学習モデルの精度と新規の学習モデルの精度とを比較する。更新部46Aは、学習モデル生成部45において生成された新規の学習モデルの精度が、既存の学習モデルの精度よりも低いときには、機械学習に用いられるアルゴリズムを変更する。
つまり、学習モデル生成部45において生成された機械学習に用いられる新規の学習モデルを用いた機械学習の精度が、既存の機械学習に用いられる学習モデルを用いた機械学習の精度よりも低いときには、ハイパーパラメータを更新して評価した上、改善が見られない場合には、アルゴリズムも変更する。また、アルゴリズムとしては、例えば、SVMやDNNを例示できるが、これらのアルゴリズム単体で評価を行う以外に、複数のアルゴリズムを混合して評価するアンサンブル学習により評価を行うようにしてもよい。
そのため、学習モデルを更新しても機械学習の精度が従前の精度よりも低い場合には、更に、アルゴリズムも変更することから、機械学習の精度を向上させることができる。また、ランニングコストに影響の大きい更新用の学習モデルの生成を厳選されたデータにより実行するため、学習モデルの更新に関わるランニングコストを低減することができる。また、ハイパーパラメータを更新して評価した上、改善が見られない場合には、アルゴリズムも変更するため、アルゴリズムが同一であってもハイパーパラメータのチューニング精度が向上することを期待できる場合もある。
なお、第1の実施形態において、閾値の設定は、任意に行えるようにしてもよい。また、閾値の設定は、データ選定部44により選定されたデータの類似度に応じて、自動的に定めてもよい。
また、第3の実施形態では、データ選定部44は、分布生成部43が生成する分布が既存の分布に対して、設定された閾値以上に変化していると判定した場合、変化後のデータ群を機械学習に用いられる学習モデルを更新するためのデータとして選定することを例示したが、第2の実施形態で示したように、データ選定部44Aは、直近の所定期間内にデータ格納部に格納された格納データのうち、外れ値検出部47において検出される既存の学習モデルを生成した際のデータに対する外れ値を機械学習に用いられる学習モデルを更新するためのデータとして選定するようにしてもよい。
なお、機械学習装置40、40A、40Bの処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを機械学習装置40、40A、40Bに読み込ませ、実行することによって本発明の機械学習装置40、40A、40Bを実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1;故障予兆検出システム
10;油状態センサ
20;パラメータ算出部
30;故障予兆判定部
31;故障予兆判定アルゴリズム
32;学習モデル格納部
33;制御部
34;情報記憶部
40;機械学習装置
40A;機械学習装置
40B;機械学習装置
41;データ収集部
42;データ格納部
43;分布生成部
44;データ選定部
44A;データ選定部
45;学習モデル生成部
46;更新部
46A;更新部
47;外れ値検出部
47A;外れ値検出アルゴリズム
47B;学習モデル格納部
48;アルゴリズム格納部
49;精度判定部
100;機器

Claims (6)

  1. 機械学習を実行するためのデータを収集するデータ収集部と、
    該収集したデータを格納するデータ格納部と、
    該データ格納部に格納されたデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定するデータ選定部と、
    該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する学習モデル生成部と、
    前記既存の学習モデルを前記学習モデル生成部において生成された前記新規の学習モデルに更新する更新部と、
    を備えたことを特徴とする機械学習装置。
  2. 前記データ格納部に格納された所定のデータ収集期間内のデータ群についての分布を生成する分布生成部を備え、
    前記データ選定部は、前記分布生成部が生成する前記分布と、前記既存の学習モデルを生成した際のデータ群の分布とを比較し、比較結果が類似しないと判定した場合に、前記データ格納部に格納されたデータ群を、前記学習モデルを更新するための前記データ群として選定することを特徴とする請求項1に記載の機械学習装置。
  3. 前記データ選定部は、所定のデータ収集期間内に前記データ格納部に格納された格納データのうち、前記既存の学習モデルを生成した際のデータに対する外れ値を検出し、当該外れ値を含むデータを、前記学習モデルを更新するためのデータとして選定することを特徴とする請求項1に記載の機械学習装置。
  4. 前記既存の学習モデルの精度と前記新規の学習モデルの精度とを比較する精度判定部を備え、
    前記更新部は、前記学習モデル生成部において生成された前記新規の学習モデルの精度が、前記既存の学習モデルの精度よりも低いときには、前記機械学習に用いられるアルゴリズムを変更することを特徴とする請求項1から3のいずれか1項に記載の機械学習装置。
  5. 機械学習を実行するためのデータを収集する第1の工程と、
    該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第2の工程と、
    該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第3の工程と、
    を備えたことを特徴とする学習モデルの生成方法。
  6. 機械学習を実行するためのデータを収集する第1の工程と、
    該収集したデータのうち機械学習に用いられる既存の学習モデルを更新するためのデータを選定する第2の工程と、
    該選定されたデータに基づいて、前記機械学習により新規の学習モデルを生成する第3の工程と、
    前記既存の学習モデルを前記新規の学習モデルに更新する第4の工程と、
    をコンピュータに実行させるためのプログラム。
JP2020059007A 2020-03-27 2020-03-27 機械学習装置、学習モデルの生成方法及びプログラム Pending JP2021157654A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2020059007A JP2021157654A (ja) 2020-03-27 2020-03-27 機械学習装置、学習モデルの生成方法及びプログラム
CN202180023864.3A CN115315711A (zh) 2020-03-27 2021-03-26 机器学习装置、学习模型的生成方法及程序
US17/914,024 US20230126258A1 (en) 2020-03-27 2021-03-26 Machine learning device, method for generating learning models, and program
EP21775782.2A EP4131090A4 (en) 2020-03-27 2021-03-26 AUTOMATIC LEARNING DEVICE, LEARNING MODEL GENERATION METHOD AND PROGRAM
PCT/JP2021/012928 WO2021193931A1 (ja) 2020-03-27 2021-03-26 機械学習装置、学習モデルの生成方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020059007A JP2021157654A (ja) 2020-03-27 2020-03-27 機械学習装置、学習モデルの生成方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2021157654A true JP2021157654A (ja) 2021-10-07

Family

ID=77892286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020059007A Pending JP2021157654A (ja) 2020-03-27 2020-03-27 機械学習装置、学習モデルの生成方法及びプログラム

Country Status (5)

Country Link
US (1) US20230126258A1 (ja)
EP (1) EP4131090A4 (ja)
JP (1) JP2021157654A (ja)
CN (1) CN115315711A (ja)
WO (1) WO2021193931A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11907032B2 (en) * 2021-06-21 2024-02-20 Microsoft Technology Licensing, Llc Generating fan control signal for computing device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214559A (zh) * 2018-08-17 2019-01-15 安吉汽车物流股份有限公司 物流业务的预测方法及装置、可读存储介质
WO2019176354A1 (ja) * 2018-03-13 2019-09-19 住友電気工業株式会社 学習用データ収集方法、学習用データ収集装置、異変検知システム及びコンピュータプログラム
US20190378044A1 (en) * 2013-12-23 2019-12-12 Groupon, Inc. Processing dynamic data within an adaptive oracle-trained learning system using curated training data for incremental re-training of a predictive model
JP2020024633A (ja) * 2018-08-08 2020-02-13 株式会社デンソー 訓練データ評価装置、訓練データ評価方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190378044A1 (en) * 2013-12-23 2019-12-12 Groupon, Inc. Processing dynamic data within an adaptive oracle-trained learning system using curated training data for incremental re-training of a predictive model
WO2019176354A1 (ja) * 2018-03-13 2019-09-19 住友電気工業株式会社 学習用データ収集方法、学習用データ収集装置、異変検知システム及びコンピュータプログラム
JP2020024633A (ja) * 2018-08-08 2020-02-13 株式会社デンソー 訓練データ評価装置、訓練データ評価方法、およびプログラム
CN109214559A (zh) * 2018-08-17 2019-01-15 安吉汽车物流股份有限公司 物流业务的预测方法及装置、可读存储介质

Also Published As

Publication number Publication date
CN115315711A (zh) 2022-11-08
WO2021193931A1 (ja) 2021-09-30
EP4131090A4 (en) 2024-04-10
US20230126258A1 (en) 2023-04-27
EP4131090A1 (en) 2023-02-08

Similar Documents

Publication Publication Date Title
Sahu et al. Predicting software bugs of newly and large datasets through a unified neuro-fuzzy approach: Reliability perspective
Linares-Vásquez et al. On using machine learning to automatically classify software applications into domain categories
US10133614B2 (en) Anomaly classification, analytics and resolution based on annotated event logs
White et al. Qos prediction for reliable service composition in iot
CN103513983A (zh) 用于预测性警报阈值确定工具的方法和系统
US20180174072A1 (en) Method and system for predicting future states of a datacenter
KR102330423B1 (ko) 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템
Yang et al. Incremental optimization mechanism for constructing a decision tree in data stream mining
JP7481902B2 (ja) 管理計算機、管理プログラム、及び管理方法
Ye et al. Hydrologic time series anomaly detection based on flink
WO2021193931A1 (ja) 機械学習装置、学習モデルの生成方法及びプログラム
CN116051118B (zh) 行为时序模型的分析方法及装置
JP2022531480A (ja) 訪問予測
Shetty et al. A Weighted Ensemble of VAR and LSTM for Multivariate Forecasting of Cloud Resource Usage
KR102480518B1 (ko) 신용평가 모델 업데이트 또는 교체 방법 및 장치
JP2020201870A (ja) ハイパーパラメータ管理装置、ハイパーパラメータ管理方法及びハイパーパラメータ管理プログラム製品
Mahgoub et al. Benchmarking concept drift detectors for online machine learning
JP2011008782A (ja) 特定のクエリに関する不確定かつ不整合オントロジの推論方式および装置
CN114124564A (zh) 一种仿冒网站检测方法、装置、电子设备及存储介质
US20220164659A1 (en) Deep Learning Error Minimizing System for Real-Time Generation of Big Data Analysis Models for Mobile App Users and Controlling Method for the Same
CN115349129A (zh) 生成具有不确定性区间的性能预测
Jaber et al. RETRACTED ARTICLE: AHI: a hybrid machine learning model for complex industrial information systems
US20190236410A1 (en) Bootstrapping recommendation systems from passive data
CN115622894B (zh) 基于历史数据概率分析的动态网络拓扑预测方法与系统
Zhang et al. Time-Variant Reliability-Based Optimization with Double-Loop Kriging Surrogates

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240604