JP2024003643A - ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム - Google Patents

ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム Download PDF

Info

Publication number
JP2024003643A
JP2024003643A JP2022102925A JP2022102925A JP2024003643A JP 2024003643 A JP2024003643 A JP 2024003643A JP 2022102925 A JP2022102925 A JP 2022102925A JP 2022102925 A JP2022102925 A JP 2022102925A JP 2024003643 A JP2024003643 A JP 2024003643A
Authority
JP
Japan
Prior art keywords
data
model
remaining life
learning
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022102925A
Other languages
English (en)
Inventor
昌尚 棗田
Masanao Natsumeda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2022102925A priority Critical patent/JP2024003643A/ja
Priority to US18/212,486 priority patent/US20230419109A1/en
Publication of JP2024003643A publication Critical patent/JP2024003643A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0283Predictive maintenance, e.g. involving the monitoring of a system and, based on the monitoring results, taking decisions on the maintenance schedule of the monitored system; Estimating remaining useful life [RUL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0895Weakly supervised learning, e.g. semi-supervised or self-supervised learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】機器の余寿命を推定するニューラルネットワークを適切に学習する。【解決手段】ニューラルネットワークの学習方法は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法である。ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、複数のメンテナンスサイクルデータを含む学習データから得られる第1のモデルの出力及び第2のモデルの出力を用いて、メンテナンスサイクルデータの終端を基準とする余寿命を予測するように第1のモデルの重みパラメータを更新する。【選択図】図3

Description

この開示は、ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システムの技術分野に関する。
各種機器のメンテナンスを行うために、機器の余寿命(即ち、故障発生までの期間)を推定する方法が知られている。例えば特許文献1では、機械学習モデルによって、工作機械の数値制御装置に設けられるNANDフラッシュメモリの余寿命を予測することが開示されている。特許文献2では、関数深層ネットワークにより監視対象システムの余寿命を予測することが開示されている。特許文献3では、2つの機械学習モデル(人工知能部)を切り替えて余寿命を予測することが開示されている。
特許第6386523号公報 特開2020-198081号公報 特開2021-056153号公報
この開示は、先行技術文献に開示された技術を改善することを目的とする。
この開示のニューラルネットワークの学習方法の一の態様は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する。
この開示のコンピュータプログラムの一の態様は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、ニューラルネットワークの学習方法をコンピュータに実行させる。
この開示の余寿命予測システムの一の態様は、保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測システムであって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、前記第1のモデルは、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように重みパラメータを更新することで学習されている。
第1実施形態に係る余寿命予測システムのハードウェア構成を示すブロック図である。 第1実施形態に係る余寿命予測システムの機能的構成を示すブロック図である。 第1実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。 第1実施形態に係る余寿命予測システムの予測動作の流れを示すフローチャートである。 各メンテナンスサイクルでの対象となる機器の健全度の時間変化を示す概念図である。 第1実施形態に係る余寿命予測システムが実行する学習方法を示す概念図である。 第1実施形態に係る余寿命予測システムが実行する学習方法の流れを示すフローチャートである。 第2実施形態に係る余寿命予測システムが実行する学習方法を示す概念図である。 第2実施形態に係る余寿命予測システムが実行する学習方法の流れを示すフローチャートである。 第3実施形態に係る余寿命予測システムによる損失関数の計算方法の流れを示すフローチャートである。 第4実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。 第5実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。 第6実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。
以下、図面を参照しながら、ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システムの実施形態について説明する。なお、以下では、余寿命予測システムにおいてニューラルネットワークの学習方法が実行される例を挙げて説明を進める。
<第1実施形態>
第1実施形態に係る余寿命予測システムについて、図1から図7を参照して説明する。
(ハードウェア構成)
まず、図1を参照しながら、第1実施形態に係る余寿命予測システムのハードウェア構成について説明する。図1は、第1実施形態に係る余寿命予測システムのハードウェア構成を示すブロック図である。
図1に示すように、第1実施形態に係る余寿命予測システム10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。余寿命予測システム10は更に、入力装置15と、出力装置16と、を備えていてもよい。上述したプロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16とは、データバス17を介して接続されている。
プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、余寿命予測システム10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、対象機器の余寿命を予測するための機能ブロック、及びニューラルネットワークを学習するための機能ブロックが実現される。即ち、プロセッサ11は、本実施形態に係る余寿命予測システム10における各制御を実行するコントローラとして機能してよい。
プロセッサ11は、例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)として構成されてよい。プロセッサ11は、これらのうち一つで構成されてもよいし、複数を並列で用いるように構成されてもよい。
RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。また、RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic Random Access Memory)や、SRAM(Static Random Access Memory)であってよい。また、RAM12に代えて、他の種類の揮発性メモリが用いられてもよい。
ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable Read Only Memory)や、EPROM(Erasable Read Only Memory)であってよい。また、ROM13に代えて、他の種類の不揮発性 メモリが用いられてもよい。
記憶装置14は、余寿命予測システム10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
入力装置15は、余寿命予測システム10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。入力装置15は、スマートフォンやタブレット等の携帯端末として構成されていてもよい。入力装置15は、例えばマイクを含む音声入力が可能な装置であってもよい。
出力装置16は、余寿命予測システム10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、余寿命予測システム10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。また、出力装置16は、余寿命予測システム10に関する情報を音声出力可能なスピーカ等であってもよい。出力装置16は、スマートフォンやタブレット等の携帯端末として構成されていてもよい。また、出力装置16は、画像以外の形式で情報を出力する装置であってもよい。例えば、出力装置16は、余寿命予測システム10に関する情報を音声で出力するスピーカであってもよい。
なお、図1では、複数の装置を含んで構成される余寿命予測システム10の例を挙げたが、これらの全部又は一部の機能を、1つの装置で実現してもよい。その場合、余寿命予測システムは、例えば上述したプロセッサ11、RAM12、ROM13のみを備えて構成され、その他の構成要素(即ち、記憶装置14、入力装置15、及び出力装置16)については、余寿命予測システム10に接続される外部の装置が備えるようにしてもよい。また、余寿命予測システムは、一部の演算機能を外部の装置(例えば、外部サーバやクラウド等)によって実現するものであってもよい。
(機能的構成)
次に、図2を参照しながら、第1実施形態に係る余寿命予測システム10の機能的構成について説明する。図2は、第1実施形態に係る余寿命予測システムの機能的構成を示すブロック図である。
図2に示すように、第1実施形態に係る余寿命予測システム10は、その機能を実現するための構成要素として、データ収集部110と、学習部120と、予測部130と、出力部140と、記憶部150と、を備えて構成されている。データ収集部110、学習部120、予測部130、及び出力部140の各々は、例えば上述したプロセッサ11(図1参照)によって実現される処理ブロックであってよい。また、記憶部150は、例えば上述した記憶装置14(図1参照)によって実現されてよい。
データ収集部110は、保全の対象である対象機器のメンテナンスサイクルデータを収集可能に構成されている。メンテナンスサイクルデータは、対象機器の保全直後から次回保全直前までの期間における時系列の稼働データである。なお、対象機器は、保全を行う機器であれば特に限定されないが、一例として、ハードディスク、NANDフラッシュメモリ、回転機器(例えば、ポンプやファン等)が挙げられる。ハードディスクの場合、メンテナンスサイクルデータには、Write Count、Average Write Response Time、Max Write Response Time、Write Transfer Rate、Read Count,Average Read Response Time、Max Read Time、Read Transfer Rate、Busy Ratio、Busy Time等が含まれていてよい。NANDフラッシュメモリの場合、メンテナンスサイクルデータには、書き換え回数、書き換え間隔、読み出し回数、使用環境における温度、エラー率、製造メーカに関する情報及び製造ロットに関する情報、並びに、NANDフラッシュメモリに対して誤り訂正符号化(ECC)処理を行うメモリコントローラのECC性能に関する情報、製造メーカに関する情報及び製造ロットに関する情報等が含まれていてよい。回転機器の場合、メンテナンスサイクルデータには、加速度センサ、超音波(AEセンサ)、電流、モータのトルク、歪ゲージ等の出力値等が含まれていてよい。
学習部120は、データ収集部110で収集されたメンテナンスサイクルデータを学習データとして用いることで、対象機器の余寿命(即ち、故障が発生するまでの期間)を予測するモデルを学習可能に構成されている。なお、本実施形態に係る余寿命予測システム10は、余寿命を予測するモデルとして、第1のモデル及び第2のモデルを含んでいるが、学習部120は、少なくとも第1のモデルを学習可能に構成されればよい。ただし、学習部120は、第1のモデル及び第2のモデルの両方を学習可能に構成されてもよい。第2のモデルの学習については、後述する他の実施形態で説明する。
予測部130は、学習部120で学習されたモデルを用いて、対象機器の余寿命を予測可能に構成されている。具体的には、予測部130は、データ収集部110で収集されたメンテナンスサイクルデータを、余寿命予測用のデータとして学習済みのモデルに入力することで、そのメンテナンスサイクルデータに対応する対象機器の余寿命を予測可能に構成されている。予測部130による予測動作については、後に詳しく説明する。
出力部140は、余寿命予測システム10における各種情報を出力可能に構成されている。例えば、出力部140は、予測部130で予測した対象機器の余寿命に関する情報を出力するように構成されてよい。この場合、出力される情報は、余寿命の値を示すものであってもよいし、余寿命に応じたアラーム(例えば、メンテナンスを促すための情報)等であってもよい。出力部140は、上述した出力装置16を介して、各種情報を出力可能に構成されてよい。例えば、出力部140は、モニタやスピーカ等を介して各種情報を出力するように構成されてよい。
記憶部150は、余寿命予測システム10で扱う各種情報を記憶可能に構成されている。記憶部150は、例えば学習部120で学習されたモデルを記憶可能に構成されてよい。また、記憶部150は、データ収集部110で収集されたメンテナンスサイクルデータを記憶可能に構成されてよい。
(学習動作)
次に、図3を参照しながら、第1実施形態に係る余寿命予測システム10による学習動作(即ち、余寿命を予測するモデルを学習する際の動作)について説明する。図3は、第1実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。
図3に示すように、第1実施形態に係る余寿命予測システム10の学習動作が開始されると、まずデータ収集部110がメンテナンスサイクルデータを取得する(ステップS101)。この際、データ収集部110は、対象機器から新たにメンテナンスサイクルデータを収集してもよいし、記憶部150から過去に収集したメンテナンスサイクルデータを取得してもよい。データ収集部110が取得したメンテナンスサイクルデータは、学習部120に出力される。
続いて、学習部120がメンテナンスサイクルデータを学習データとして用いることで、対象機器の余寿命を予測するモデルを学習する(ステップS102)。なお、学習部120によるモデルの学習動作については、後に詳しく説明する。学習が終了すると、学習部120は、学習済みのモデルを記憶部150に保存する(ステップS103)。
(予測動作)
次に、図4を参照しながら、第1実施形態に係る余寿命予測システム10による予測動作(即ち、学習済みのモデルを用いて余寿命を予測する際の動作)について説明する。図4は、第1実施形態に係る余寿命予測システムの予測動作の流れを示すフローチャートである。
図4に示すように、第1実施形態に係る余寿命予測システム10の予測動作が開始されると、まず予測部130が学習済みのモデルを記憶部150から読み込む(ステップS201)。なお、ここで読み込まれるモデルは、第1のモデルのみであってよい。
続いて、データ収集部110が、余寿命予測用のメンテナンスサイクルデータを取得する(ステップS202)。この際、データ収集部110は、対象機器から新たにメンテナンスサイクルデータを収集してもよいし、記憶部150から過去に収集したメンテナンスサイクルデータを取得してもよい。データ収集部110が取得したメンテナンスサイクルデータは、予測部130に出力される。
続いて、予測部130が、学習済みのモデルを用いて対象機器の余寿命を予測する(ステップS203)。そして、予測部130は、予測した余寿命が所定閾値を下回っているか否かを判定する(ステップS204)。なお、ここでの「所定閾値」は、対象機器のメンテナンスを行うべきか否かを判定するための閾値であり、予め任意の値が設定されていてよい。
予測した余寿命が所定閾値を下回っている場合(ステップS204:YES)、出力部140がユーザにアラームを出力する(ステップS205)。アラームには、例えばメンテナンス作業を促すような情報が含まれていてよい。一方、予測した余寿命が所定閾値を下回っていない場合(ステップS204:NO)、上述したステップS205の処理は省略されてよい。ただし、予測した余寿命に基づいて、次回のメンテナンス作業をいつ頃行えばよいかを示す情報を出力するようにしてもよい。
(学習データ及びモデル)
次に、図5及び図6を参照しながら、第1実施形態に係る余寿命予測システム10で用いられる学習データと、学習データを用いて学習されるモデルについて詳しく説明する。図5は、各メンテナンスサイクルでの対象となる機器の健全度の時間変化を示す概念図である。図6は、第1実施形態に係る余寿命予測システムが実行する学習方法を示す概念図である。
図5において、第1実施形態に係る余寿命予測システム10は、学習データとして複数のメンテナンスサイクルデータ(例えば、図中のデータA~Fを参照)を用いる。これら複数のメンテナンスサイクルデータは、それぞれ別々の機器から取得されるものであってもよいし、同一の機器から別タイミングで取得されるものであってもよい。メンテナンスサイクルデータは、メンテンナンスサイクル毎に、対象機器や、その周辺に敷設されたセンサから取得される値、或いはその統計値(メンテナンスサイクル全体ではない一定期間ごと)であり、典型的には多次元の時系列データであってよい。なお、図中の健全度は、仮想的な指標であり、実際には観測できない値であってよい。ここでの健全度は、劣化領域(即ち、健全度が低下している領域)において余寿命に一致する。
複数のメンテナンスサイクルデータは、メンテナンス直前である終端時刻の余寿命(即ち、図中の丸で囲んだ部分)にばらつきが存在する。このため、それぞれの終端時刻の余寿命をメンテンナンスが必要な時期に想到する値(例えば、0と仮定)を用いて学習を行うと、不適切な学習となってしまうおそれがある。しかるに本実施形態に係る余寿命予測システム10は、後述するように、メンテナンスサイクルデータにおける任意の時刻及び最終時刻の余寿命(任意の基準値を基準とする相対的な余寿命)を用いてモデルの学習を実行する。
図6に示すように、第1実施形態に係る余寿命予測システム10は、対象機器の余寿命を予測するモデルとして、第1のモデルと、第2のモデルとを備えている。第1のモデル及び第2のモデルの各々はニューラルネットワークを含んで構成されており、それぞれTSS2Vec(回帰型ニューラルネットワーク(RNN、LSTM、GRU等)、CNN、Transformerなど、系列データをベクトルに変換できるニューラルネットワーク)、非線形変換(Multilayer Perceptron等のベクトルを別のベクトルに変換するニューラルネットワーク)、及びVec2HI(Multilayer Perceptron等のベクトルをスカラー値に変換するニューラルネットワーク)を含んでいてよい。
第1のモデルは、メンテナンスサイクルデータから取り出した任意の時刻の部分時系列データ(即ち、メンテナンスサイクルデータに含まれる全期間のうち、任意の一部の期間を抜き出したデータ)を入力とする。なお、ここでの任意の時刻は特に限定されるものではないが、終端から大きく離れた時刻では劣化情報を含まない可能性があるため、メンテナンスサイクルの終端に比較的近い部分であることが好ましい。第1のモデルは、入力された任意の時刻の部分時系列データから、対象機器の任意の時刻の余寿命rij(“i”は、メンテナンスサイクルのインデックス、“j”は各メンテナンスサイクル内の時刻インデックス)を、任意の基準値を基準とする値として推定する。なお、余寿命を予測する際には、後述する別の基準値を算出し、算出した基準値を用いて予測する。このため、ここでの「基準値」は定義されていなくてもよい。
第2のモデルは、メンテナンスサイクルデータから取り出した終端時刻の部分時系列データ(即ち、メンテナンスサイクルデータに含まれる全期間のうち、終端時刻を含む一部の期間を抜き出したデータ)を入力とする。そして、第2のモデルは、入力された終端時刻の部分時系列データから、対象機器の最終時刻(即ち、メンテナンス直前の時刻)の余寿命eを、第1のモデルでも用いた基準値を基準とする値として推定する。
第1のモデルは、第1のモデルの出力である任意の時刻の余寿命rijと、第2のモデルの出力である最終時刻の余寿命eと、を用いて学習される。具体的には、第1のモデルは、任意の時刻の余寿命rij及び最終時刻の余寿命eを用いて、メンテナンスサイクルデータの終端を基準とする余寿命(即ち、メンテナンス直前の状態から故障が発生するまでの期間)を予測するように学習される。第1のモデルは、例えば、任意の時刻の余寿命rij及び最終時刻の余寿命eから計算される損失が小さくなるように、誤差逆伝搬法を用いて重みパラメータが変更されてよい。この場合の損失Lは、例えば下記式(1)のように計算されてよい。
Figure 2024003643000002

なお、dijは、メンテナンスサイクルデータにおける実際に観測された余寿命の差(即ち、任意の時刻の余寿命と、最終時刻の余寿命との差)を示す値である。観測された余寿命の差は、その期間中の使用回数または稼働時間であってもよい。
(学習方法の流れ)
次に、図7を参照しながら、第1実施形態に係る余寿命予測システム10が実行する学習方法(具体的には、図3で説明したステップS102の処理)の流れについて詳しく説明する。図7は、第1実施形態に係る余寿命予測システムが実行する学習方法の流れを示すフローチャートである。
図7に示すように、第1実施形態に係る余寿命予測システム10が実行する学習方法では、まず学習部130は、評価値(詳しくは後述)を初期化する(ステップS301)。また、学習部130は、第1のモデル及び第2のパラメータの重みパラメータを初期化する(ステップS302)。ここでは、第1のモデルと第2モデルとが同一となるように重みパラメータが初期化されてよい。
続いて、学習部130は、学習データに含まれるメンテナンスサイクルデータから任意の時刻の部分時系列データ、対応する相対余寿命の値(メンテナンスサイクルデータの終端の余寿命を0とした余寿命の値)、及びメンテナンスサイクルデータの終端時刻に対応する部分時系列データを指定組分取り出す(ステップS303)。即ち、メンテナンスサイクルデータから、学習に用いるデータを適宜抽出する。
続いて、学習部130は、学習データに基づく第1のモデル及び第2のモデルの出力を用いて、損失Lを計算する(ステップS304)。その後、学習部130は、損失Lを最小化するよう第1のモデルの重みパラメータを更新する(ステップS305)。そして、学習部130は、損失Lを用いて評価値を計算する(ステップS306)。なお、ここでの「評価値」は、第1のモデルの重みパラメータを最良値として保存するか決定するための指標であり、例えば損失Lを含む関数であってもよいし、損失Lそのものであってもよい。
続いて、学習部130は、評価値が改善していれば、第1のモデルの重みパラメータを記憶部150に上書き保存する(ステップS307)。なお、上述したステップS303からS307の処理は、予め設定されたイテレーション数だけ繰り返される。
学習が終了すると、学習部130は、記憶部150に保存した第1のモデルの重みパラメータを読み込み、基準余寿命を算出する。ここでの「基準余寿命」は、各メンテナンスサイクルの最終時刻の余寿命eの最小値、又は、サイクル別の複数のサンプルに基づく最終時刻の余寿命の推定値(例えば、e(ハット))の最小値である。最終時刻の余寿命の推定値は、例えば下記式(2)を用いて算出されてよい。
Figure 2024003643000003
別の形態としては、最終時刻の余寿命の推定値は、第2のモデルにrijの算出に用いた第1のモデルへの入力データを入力し、その出力をrijとして式(2)を計算した値としてもよい。
(技術的効果)
次に、第1実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
図1から図7で説明したように、第1実施形態に係る余寿命予測システム10では、任意の時刻の余寿命rij及び最終時刻の余寿命eを用いて、メンテナンスサイクルデータの終端を基準とする余寿命を予測するように学習される。このようにすれば、取得した各メンテナンスサイクルデータの終端にばらつきが生じている場合であっても、適切な学習を行うことができる。その結果、高い精度で対象機器の余寿命を予測することが可能となり、例えば適切なタイミングでメンテナンスを実施することが可能となる。
<第2実施形態>
第2実施形態に係る余寿命予測システム10について、図8及び図9を参照して説明する。なお、第2実施形態は、上述した第1実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1実施形態と同一であってよい。このため、以下では、すでに説明した第1実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
(第2のモデルの学習)
まず、図8を参照しながら、第2実施形態に係る余寿命予測システム10が実行する学習方法について詳しく説明する。図8は、第2実施形態に係る余寿命予測システムが実行する学習方法を示す概念図である。
図8に示すように、第2実施形態に係る余寿命予測システム10では、第1のモデルの重みパラメータ(即ち、学習によって更新された重みパラメータ)を用いて、第2のモデルの重みパラメータを更新する。即ち、第2実施形態に係る余寿命予測システム10では、第1のモデルに加えて、第2のモデルについても学習されることになる。なお、第2のモデルの重みパラメータを更新する際には、少なくとも一部を更新すればよい。即ち、第2のモデルに含まれるすべての重みパラメータが更新される必要はなく、一部の重みパラメータを更新するようにしてもよい。
(学習方法の流れ)
次に、図9を参照しながら、第2実施形態に係る余寿命予測システム10が実行する学習方法の流れについて説明する。図9は、第2実施形態に係る余寿命予測システムが実行する学習方法の流れを示すフローチャートである。なお、図9では、図7で示した処理と同様の処理に同一の符号を付している。
図9に示すように、第2実施形態に係る余寿命予測システム10による学習においては、概ね既に説明した第1実施形態と同様の流れで処理(図7参照)が実行される。ただし、第2実施形態に係る余寿命システム10では、第1のモデルの重みパラメータを更新する処理(ステップS305)の後に、更新後の第1のモデルの重みパラメータを用いて、第1のモデルの重みパラメータを更新する処理が実行される(ステップS311)。そして、ステップS311を含むS303からS307までの処理が、所定回数繰り返し実行されることになる。
第2のモデルの重みパラメータは、例えば第1のモデルの重みパラメータの指数平滑移動平均を用いて更新されてよい。例えば、第1のモデルの重みパラメータW1i、第2のモデルの重みパラメータW2iとすると、上述したステップS311では、W2i=(1-a)W1i+aW2iとなるよう第2のモデルの重みパラメータが更新されてよい。この場合、第2のモデルの過去の重みパラメータW2iが係数a(1より小さい値)だけ小さくなって考慮されることになり、この処理が繰り返されることで、指数平滑移動平均を用いた更新が実現される。
(技術的効果)
次に、第2実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
図8及び図9で説明したように、第2実施形態に係る余寿命予測システム10では、第1のモデルの重みパラメータを用いて、第2のモデルの重みパラメータが更新される。このようにすれば、第1のモデルに加えて第2のモデルも学習されることになるため、第1のモデルの重みパラメータのみを更新する場合と比較して、より適切な学習を実行することができる。また、第1のモデルの重みパラメータの指数平滑移動平均を用いれば、第1のモデルの重みパラメータを適切に考慮しつつ、第2のモデルの重みパラメータを更新することが可能である。
<第3実施形態>
第3実施形態に係る余寿命予測システム10について、図10を参照して説明する。なお、第3実施形態は、上述した第1及び第2実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
(損失の計算)
まず、図10を参照しながら、第3実施形態に係る余寿命予測システム10による損失の計算方法について説明する。図10は、第3実施形態に係る余寿命予測システムによる損失関数の計算方法の流れを示すフローチャートである。
第3実施形態に係る余寿命予測システム10では、入力データが類似しているものが類似した余寿命の値を持つものとして、余寿命を予測するモデルが学習される。具体的には、余寿命を予測するモデルを学習する際に用いる損失Lが、Feature matchingの正則化項を加えたものとして計算される。具体的には、損失Lは、下記式(3)によって算出されてよい。
Figure 2024003643000004

なお、上記式(3)における“L”は式(1)で説明した値であり、“λLf”がFeature matchingの正則化項である。λはハイパーパラメータであり、Lfは例えば下記式(4)を用いて算出できる。
Figure 2024003643000005
図10に示すように、上述したLfを計算する際には、まず学習データに含まれる複数のメンテナンスサイクルデータを2組に分割する(ステップS401)。即ち、複数のメンテナンスサイクルデータが、第1のデータ群に含まれるデータと、第2のデータ群に含まれるデータとに分割される。
続いて、各サイクルの終端から所定個数Nの部分時系列データを取り出す(ステップS402)。そして、取り出した部分時系列データと類似する部分時系列データを、他方の組から所定個数M取り出す(ステップS403)。なお、ここで取り出されたN個の部分時系列データと、M個の部分時系列データとは、互いにペア候補となる。
続いて、モデルを学習する際に、それぞれの組からランダムにペアとなる部分時系列データを所定個数K取り出す(ステップS404)。そして、取り出したK個の部分時系列データを、それぞれ特徴量ベクトルに変換する(ステップS405)。ここで変換された特徴量ベクトルが、上記式におけるf及びf’である。
最後に、変換した特徴量ベクトルf及びf’の期待値Eを用いてLfを算出する(ステップS406)。
Feature matchingの正則化項は、f及びf’のMaximum Mean Discrepancyがカーネルを用いて計算されたものであってもよい。このとき、例えば、カーネルにはRadial basis function カーネルを用いることができる。
(技術的効果)
次に、第3実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
図10で説明したように、第3実施形態に係る余寿命予測システム10では、損失Lを計算する際にFeature matchingの正則化項が考慮される。このようにすれば、モデルの学習をより適切に実行できるようになるため、より高い精度で対象機器の余寿命を予測することが可能となる。
<第4実施形態>
第4実施形態に係る余寿命予測システム10について、図11を参照して説明する。なお、第4実施形態は、上述した第1から第3実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第3実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
(事前学習による初期値の設定)
まず、図11を参照しながら、第4実施形態に係る余寿命予測システム10による学習動作(具体的には、事前学習を利用した学習動作)の流れについて説明する。図11は、第4実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。なお、図11では、図3で示した処理と同様の処理に同一の符号を付している。
図11に示すように、第4実施形態に係る余寿命予測システム10による学習動作では、まずデータ収集部110が、教師あり学習データを取得する(ステップS501)。なお、ここで取得される教師あり学習データは、対象機器が健全な状態から故障に至るまでの時系列の稼働データ(run-to-failure-data)である。学習用のラベルは例えば、故障までの使用回数や稼働時間として与えられる。
続いて、学習部130は、教師あり学習データを用いて第1のモデル及び第2のモデルの事前学習を実行する(ステップS502)。これは、第1のモデルの事前学習を実行し、第2のモデルを事前学習された第1のモデルの重みパラメータで初期化することで実現される。そして、事前学習された重みパラメータを各モデルの重みパラメータの初期値として設定する(ステップS503)。
その後は、既に説明した第1実施形態と同様の処理(図3参照)が実行される。即ち、メンテナンスサイクルデータ(即ち、教師なし学習データ)を用いてモデルの学習が実行される。ただし、第4実施形態では、上述したように、事前学習によって各モデルの重みパラメータの初期値が設定された状態で学習が開始されることになる。このため、図7のステップS302で説明したような、重みパラメータの初期化は実行されずともよい。
事前学習において、第1のモデルは、第1のモデルの出力である任意の時刻の余寿命rijと、与えられたラベルrij’と、を用いて学習される。具体的には、第1のモデルは、rijと、rij’が一致するように学習される。第1のモデルは、例えば、誤差逆伝搬法を用いて重みパラメータが変更されてよい。この場合の損失Lesは、例えば下記式(5)のように計算されてよい。
Figure 2024003643000006
(技術的効果)
次に、第4実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
図11で説明したように、第4実施形態に係る余寿命予測システム10では、教師あり学習データを用いた事前学習により、第1のモデル及び第2のモデルの重みパラメータの初期値が設定される。このようにすれば、各モデルの初期値が適切な値に設定されることになるため、その後の教師なし学習データを用いた学習を効率的に行うことができる。なお、本実施形態では、教師あり学習データの数が、教師なし学習データの数と比べて少ない状況(具体的には、教師あり学習データだけを用いて学習するにはデータ数が足りず、教師なし学習データも用いる必要があるような状況)を想定している。
<第5実施形態>
第5実施形態に係る余寿命予測システム10について、図12を参照して説明する。なお、第5実施形態は、上述した第1から第4実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第4実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。なお、本実施形態では、学習データには、教師ありデータと教師なしデータ(メンテナンスサイクルデータ)の2つが含むまれる。
(教師データを用いた学習)
まず、図12を参照しながら、第5実施形態に係る余寿命予測システム10による学習動作(教師データの有無に応じた学習動作)について説明する。図12は、第5実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。なお、図12で示す各処理は、図7のステップS303からS307に相当するものであり、図7を用いて説明したように所定回数繰り返される処理である。
図12に示すように、第5実施形態に係る余寿命予測システム10による学習動作では、まず学習部130が、教師あり学習データ(即ち、対象機器が健全な状態から故障に至るまでの時系列の稼働データ)を用いて学習を実施する。具体的には、まず学習部130は、教師あり学習データからデータをサンプリングする(ステップS601)。そして、学習部130は、教師あり学習データに基づく第1のモデルの出力を用いて、損失を計算する(ステップS602)。なお、教師あり学習データを用いる学習では、第4実施形態で説明したように、上述した数式(5)を用いて損失を計算すればよい。
続いて、学習部130は、損失を最小化するよう第1のモデルの重みパラメータを更新する(ステップS603)。そして、学習部130は、損失を用いて評価値を計算する(ステップS604)。その後、学習部130は、評価値が改善していれば、第1のモデルの重みパラメータを記憶部150に上書き保存する(ステップS605)。
上述したステップS601からS605の処理を所定回数繰り返し、教師あり学習データを用いた学習が終了すると(ステップS606:YES)、学習部130は、第2のモデルの重みパラメータを第1のモデルの重みパラメータで初期化し(ステップS607)、教師なし学習データ(即ち、メンテナンスデータ)を用いて学習を実行する。具体的には、学習部130は、教師なし学習データからデータをサンプリングする(ステップS608)。そして、学習部130は、教師なし学習データに基づく第1のモデル及び第2のモデルの出力を用いて、損失を計算する(ステップS609)。なお、教師なし学習データを用いる学習では、第1実施形態で説明したように、上述した数式(1)を用いて損失を計算すればよい。
続いて、学習部130は、損失を最小化するよう第1及び第2のモデルの重みパラメータを更新する(ステップS610)。そして、学習部130は、損失を用いて評価値を計算する(ステップS611)。その後、学習部130は、評価値が改善していれば、第1及び第2のモデルの重みパラメータを記憶部150に上書き保存する(ステップS612)。上述したステップS608からS612の処理を所定回数繰り返すと、教師なし学習データを用いた学習も終了すると判定される(ステップS613:YES)。
なお、ここでは教師あり学習データで学習した直後に、教師なし学習データで学習する例を挙げたが、これらの学習を同時に実施してもよい。即ち、教師あり学習データ及び教師なし学習データの両方を用いて同時に学習を行ってもよい。同時に学習を実施する場合は、データのサンプリングをそれぞれの学習データで実施した後、それぞれに対応する損失を計算し、計算した各損失の和を用いてパラメータを更新すればよい。それに続いて、評価値の算出、最良パラメータの保存の順に処理を実行すればよい。
(技術的効果)
次に、第5実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
図12で説明したように、第5実施形態に係る余寿命予測システム10では、第1および第2のモデルの重みパラメータが学習される際に、教師ありのデータと教師なしのデータ両方を用いて最終的な重みパラメータを決定する。このようにすれば、教師なしデータの情報を利用し、教師ありデータが少ない場合でも、故障発生時を基準とする余寿命を予測するモデルが学習される。その結果、より適切なメンテンナンス計画を立てることが出来る。
なお、上述した第4実施形態(図11参照)と、第5実施形態(図12参照)とは、組み合わせて実現されてよい。具体的には、まず第4実施形態で説明したように、事前学習によって初期値を設定した上で、第5実施形態で説明したように、教師あり学習データ及び教師なしデータによる学習が実行されてよい。このようにすれば、教師あり学習データを事前学習及びその後の学習の両方において活用し、より適切に学習を実行することが可能となる。
<第6実施形態>
第6実施形態に係る余寿命予測システム10について、図13を参照して説明する。なお、第6実施形態は、上述した第1から第5実施形態と一部の動作が異なるのみであり、その他の部分については第1から第5実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
(別モデルの学習)
まず、図13を参照しながら、第6実施形態に係る余寿命予測システム10による学習動作(具体的には、学習済みのモデルを用いた別モデルの学習動作)について説明する。図13は、第6実施形態に係る余寿命予測システムによる学習動作の流れを示すフローチャートである。
図13に示すように、第6実施形態に係る余寿命予測システム10では、予測部130が、上述した各実施形態で説明した方法を用いて学習されたモデルを用いて、各メンテナンスサイクルデータの終端の余寿命を予測する(ステップS701)。
続いて、予測部130は、予測した終端の余寿命に基づいて、各メンテナンスサイクルデータの各時刻の余寿命を修正する(ステップS702)。ここで修正された余寿命は、各メンテナンスサイクルデータの教師データとして扱われる。
続いて、学習部130は、余寿命が修正されたメンテナンスサイクルデータを教師あり学習データとして、新たな機械学習モデルを学習する(ステップS703)。ここでの学習では、モデルの予測値と教師データとが互いに近づくように重みパラメータが更新されてよい。なお、ここで学習される機械学習モデルは、ニューラルネットワークを含まないモデルであってもよい。
上記のように学習される機械学習モデルは、別システム(例えば、別の場所に設置される同様のシステム)において用いられるものであってよい。即ち、ステップS701で用いる学習済みのモデルと、ステップS703で学習される機械学習モデルは、それぞれ異なる余寿命予測システムで用いられるものであってよい。
(技術的効果)
次に、第6実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
図13で説明したように、第6実施形態に係る余寿命予測システム10では、上述した各実施形態の手法で学習した、各メンテナンスサイクルの終端の余寿命を予測する学習済みのモデルを用いて、各メンテナンスサイクルの終端の余寿命を補正したうえで、余寿命を予測する新たな機械学習モデルが学習される。このようにすれば、各メンテナンスサイクルの終端の余寿命の違いを補正するための学習と、メンテナンスサイクルデータ全体にわたって余寿命を予測するための学習を分けて構成することができる。その結果、予測のもととなる稼働データが余寿命を予測するための情報を持たない期間が余寿命の大きな場合にあったとしても、補正された余寿命に基づいて、学習に用いるデータを選択してモデルを学習し、評価することで、より広範囲の余寿命を予測するモデルを学習することができる。
上述した各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記録媒体はもちろん、そのプログラム自体も各実施形態に含まれる。
記録媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。更に、プログラム自体がサーバに記憶され、ユーザ端末にサーバからプログラムの一部または全てをダウンロード可能なようにしてもよい。
<付記>
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
付記1に記載のニューラルネットワークの学習方法は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、ニューラルネットワークの学習方法である。
(付記2)
付記2に記載のニューラルネットワークの学習方法は、更新された前記第1のモデルの重みパラメータを用いて、前記第2のモデルの重みパラメータの少なくとも一部を更新する、付記1に記載のニューラルネットワークの学習方法である。
(付記3)
付記3に記載のニューラルネットワークの学習方法は、更新された前記第1のモデルの重みパラメータの指数平滑移動平均を用いて、前記第2のモデルの重みパラメータの少なくとも一部を更新する、付記2に記載のニューラルネットワークの学習方法である。
(付記4)
付記4に記載のニューラルネットワークの学習方法は、前記学習データを第1データ群と第2データ群とに分割し、前記第1データ群に含まれる第1部分データと、前記第2データ群に含まれる前記第1部分データ類似する第2部分データと、を抽出し、前記第1部分データの特徴量ベクトルと、前記第2部分データの特徴量ベクトルと、が互いに類似するように前記第1のモデルの重みパラメータを更新する、付記1から3のいずれか一項に記載のニューラルネットワークの学習方法である。
(付記5)
付記5に記載のニューラルネットワークの学習方法は、前記学習データは、前記対象機器が健全な状態から故障に至るまでの時系列の稼働データである複数の教師あり学習データと、前記メンテナンスサイクルデータである複数の教師なし学習データと、を含み、前記教師あり学習データを用いて前記ニューラルネットワークを事前学習し、事前学習された前記ニューラルネットワークの重みパラメータを前記第1のモデル及び前記第2のモデルの初期値に設定した上で、前記教師なし学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、付記1から4のいずれか一項に記載のニューラルネットワークの学習方法である。
(付記6)
付記6に記載のニューラルネットワークの学習方法は、前記学習データは、前記対象機器が健全な状態から故障に至るまでの時系列の稼働データである複数の教師あり学習データと、前記メンテナンスサイクルデータである複数の教師なし学習データと、を含み、前記教師あり学習データを用いる場合には、前記第1のモデルが予測する予測値と、前記教師あり学習データが示す余寿命の実測値と、が互いに近づくように前記第1のモデルの重みパラメータを更新する、付記1から5のいずれか一項に記載のニューラルネットワークの学習方法である。
(付記7)
付記7に記載のニューラルネットワークの学習方法は、前記学習データは、前記対象機器が健全な状態から故障に至るまでの時系列の稼働データである複数の教師あり学習データと、前記メンテナンスサイクルデータである複数の教師なし学習データと、を含み、前記教師あり学習データを用いて前記ニューラルネットワークを事前学習し、事前学習された前記ニューラルネットワークの重みパラメータを前記第1のモデル及び前記第2のモデルの初期値に設定した上で、前記学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新し、前記教師あり学習データを用いる場合には、前記第1のモデルが予測する予測値と、前記教師あり学習データが示す余寿命の実測値と、が互いに近づくように前記第1のモデルの重みパラメータを更新する、付記1から6のいずれか一項に記載のニューラルネットワークの学習方法である。
(付記8)
付記8に記載のニューラルネットワークの学習方法は、前記重みパラメータが更新された前記第1のモデル又は前記第2のモデルで各メンテナンスサイクルデータの終端の余寿命を予測し、予測した前記各メンテナンスサイクルデータの終端の余寿命に基づいて、前記各メンテナンスサイクルデータの各時刻の余寿命を修正し、修正した余寿命を教師データとして含む学習データを用いて、前記対象機器の余寿命を予測する新たな機械学習モデルを学習する、請求項1から7のいずれか一項に記載のニューラルネットワークの学習方法である。
(付記9)
付記9に記載のコンピュータプログラムは、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、ニューラルネットワークの学習方法をコンピュータに実行させるコンピュータプログラムである。
(付記10)
付記10に記載の記録媒体は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、ニューラルネットワークの学習方法をコンピュータに実行させるコンピュータプログラムが記録された記録媒体である。
(付記11)
付記11に記載の余寿命予測システムは、保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測システムであって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、前記第1のモデルは、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように重みパラメータを更新することで学習されている、余寿命予測システムである。
(付記12)
付記12に記載の余寿命予測装置は、保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測システムであって、前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、前記第1のモデルは、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように重みパラメータを更新することで学習されている、余寿命予測装置である。
である。
この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴うニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システムもまたこの開示の技術思想に含まれる。
10 余寿命予測システム
11 プロセッサ
14 記憶装置14
110 データ収集部
120 学習部
130 予測部
140 出力部
150 記憶部
ij 任意の時刻の余寿命
最終時刻の余寿命

Claims (10)

  1. 保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、
    前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、
    複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、
    ニューラルネットワークの学習方法。
  2. 更新された前記第1のモデルの重みパラメータを用いて、前記第2のモデルの重みパラメータの少なくとも一部を更新する、
    請求項1に記載のニューラルネットワークの学習方法。
  3. 更新された前記第1のモデルの重みパラメータの指数平滑移動平均を用いて、前記第2のモデルの重みパラメータの少なくとも一部を更新する、
    請求項2に記載のニューラルネットワークの学習方法。
  4. 前記学習データを第1データ群と第2データ群とに分割し、
    前記第1データ群に含まれる第1部分データと、前記第2データ群に含まれる前記第1部分データ類似する第2部分データと、を抽出し、
    前記第1部分データの特徴量ベクトルと、前記第2部分データの特徴量ベクトルと、が互いに類似するように前記第1のモデルの重みパラメータを更新する、
    請求項1から3のいずれか一項に記載のニューラルネットワークの学習方法。
  5. 前記学習データは、前記対象機器が健全な状態から故障に至るまでの時系列の稼働データである複数の教師あり学習データと、前記メンテナンスサイクルデータである複数の教師なし学習データと、を含み、
    前記教師あり学習データを用いて前記ニューラルネットワークを事前学習し、
    事前学習された前記ニューラルネットワークの重みパラメータを前記第1のモデル及び前記第2のモデルの初期値に設定した上で、前記教師なし学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、
    請求項1から3のいずれか一項に記載のニューラルネットワークの学習方法。
  6. 前記学習データは、前記対象機器が健全な状態から故障に至るまでの時系列の稼働データである複数の教師あり学習データと、前記メンテナンスサイクルデータである複数の教師なし学習データと、を含み、
    前記教師あり学習データを用いる場合には、前記第1のモデルが予測する予測値と、前記教師あり学習データが示す余寿命の実測値と、が互いに近づくように前記第1のモデルの重みパラメータを更新する、
    請求項1から3のいずれか一項に記載のニューラルネットワークの学習方法。
  7. 前記学習データは、前記対象機器が健全な状態から故障に至るまでの時系列の稼働データである複数の教師あり学習データと、前記メンテナンスサイクルデータである複数の教師なし学習データと、を含み、
    前記教師あり学習データを用いて前記ニューラルネットワークを事前学習し、
    事前学習された前記ニューラルネットワークの重みパラメータを前記第1のモデル及び前記第2のモデルの初期値に設定した上で、前記学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新し、
    前記教師あり学習データを用いる場合には、前記第1のモデルが予測する予測値と、前記教師あり学習データが示す余寿命の実測値と、が互いに近づくように前記第1のモデルの重みパラメータを更新する、
    請求項1から3のいずれか一項に記載のニューラルネットワークの学習方法。
  8. 前記重みパラメータが更新された前記第1のモデル又は前記第2のモデルで各メンテナンスサイクルデータの終端の余寿命を予測し、
    予測した前記各メンテナンスサイクルデータの終端の余寿命に基づいて、前記各メンテナンスサイクルデータの各時刻の余寿命を修正し、
    修正した余寿命を教師データとして含む学習データを用いて、前記対象機器の余寿命を予測する新たな機械学習モデルを学習する、
    請求項1から3のいずれか一項に記載のニューラルネットワークの学習方法。
  9. 保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、
    前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、
    複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように前記第1のモデルの重みパラメータを更新する、
    ニューラルネットワークの学習方法をコンピュータに実行させるコンピュータプログラム。
  10. 保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測システムであって、
    前記ニューラルネットワークは、(i)前記対象機器の保全直後から次回保全直前までの期間における時系列の稼働データであるメンテナンスサイクルデータの任意の時刻の余寿命を、任意の基準値を基準とする値として予測する第1のモデルと、(ii)前記メンテナンスサイクルデータの最終時刻の余寿命を、前記基準値を基準とする値として予測する第2のモデルと、を含み、
    前記第1のモデルは、複数の前記メンテナンスサイクルデータを含む学習データから得られる前記第1のモデルの出力及び前記第2のモデルの出力を用いて、前記メンテナンスサイクルデータの終端を基準とする余寿命を予測するように重みパラメータを更新することで学習されている、
    余寿命予測システム。
JP2022102925A 2022-06-27 2022-06-27 ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム Pending JP2024003643A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022102925A JP2024003643A (ja) 2022-06-27 2022-06-27 ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム
US18/212,486 US20230419109A1 (en) 2022-06-27 2023-06-21 Method of learning neural network, recording medium, and remaining life prediction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022102925A JP2024003643A (ja) 2022-06-27 2022-06-27 ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム

Publications (1)

Publication Number Publication Date
JP2024003643A true JP2024003643A (ja) 2024-01-15

Family

ID=89323076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022102925A Pending JP2024003643A (ja) 2022-06-27 2022-06-27 ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム

Country Status (2)

Country Link
US (1) US20230419109A1 (ja)
JP (1) JP2024003643A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117592383B (zh) * 2024-01-19 2024-03-26 四川晟蔚智能科技有限公司 一种设备健康寿命预测方法、系统、设备及介质

Also Published As

Publication number Publication date
US20230419109A1 (en) 2023-12-28

Similar Documents

Publication Publication Date Title
CN110689109B (zh) 神经网络方法和装置
US11694109B2 (en) Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
US11650968B2 (en) Systems and methods for predictive early stopping in neural network training
JP5943358B2 (ja) 学習装置、処理装置、予測システム、学習方法、処理方法、およびプログラム
US12051232B2 (en) Anomaly detection apparatus, anomaly detection method, and program
CN109697977B (zh) 语音识别方法和设备
US20220092411A1 (en) Data prediction method based on generative adversarial network and apparatus implementing the same method
CN105095614A (zh) 更新预测模型的方法和装置
US20050273296A1 (en) Neural network model for electric submersible pump system
JP7152938B2 (ja) 機械学習モデル構築装置および機械学習モデル構築方法
US20180314978A1 (en) Learning apparatus and method for learning a model corresponding to a function changing in time series
KR20190045038A (ko) 음성 인식 방법 및 장치
CN112232495A (zh) 预测模型的训练方法、装置、介质和计算设备
JP2024003643A (ja) ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム
KR102045415B1 (ko) 자동으로 최적의 통계 모델을 결정하는 방법 및 그 장치
TWI677799B (zh) 模型構築系統及模型構築方法
JP2020027644A (ja) モータ励起信号検索方法及び電子機器
KR102157441B1 (ko) 관련성 전사를 이용한 신경망 학습 방법 및 서비스 장치
US12099915B2 (en) Method and apparatus for quantizing deep neural network
JP2019185207A (ja) モデル学習装置、モデル学習方法、プログラム
JP2024070487A (ja) ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム
US11177018B2 (en) Stable genes in comparative transcriptomics
US20240037388A1 (en) Method of learning neural network, feature selection apparatus, feature selection method, and recording medium
WO2024157398A1 (ja) 学習装置、学習方法、プログラム
US20240037389A1 (en) Method of learning neural network, feature selection apparatus, feature selection method, and recording medium