JP2022191680A - データ選択支援装置及びデータ選択支援方法 - Google Patents

データ選択支援装置及びデータ選択支援方法 Download PDF

Info

Publication number
JP2022191680A
JP2022191680A JP2021100050A JP2021100050A JP2022191680A JP 2022191680 A JP2022191680 A JP 2022191680A JP 2021100050 A JP2021100050 A JP 2021100050A JP 2021100050 A JP2021100050 A JP 2021100050A JP 2022191680 A JP2022191680 A JP 2022191680A
Authority
JP
Japan
Prior art keywords
data
learning
sensor
unit
data selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021100050A
Other languages
English (en)
Other versions
JP2022191680A5 (ja
Inventor
進 芹田
Susumu Serita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2021100050A priority Critical patent/JP2022191680A/ja
Priority to US17/838,983 priority patent/US20220405161A1/en
Publication of JP2022191680A publication Critical patent/JP2022191680A/ja
Publication of JP2022191680A5 publication Critical patent/JP2022191680A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能とする。【解決手段】データ選択支援装置100において、故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持する記憶部101と、時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類するデータ分類部111と、第一のデータ集合の値域に基づいて、第二のデータ集合の部分集合を選択する学習データ選択部118と、選択した部分集合に基づいて故障予知モデルの学習データとしての適切さを示す評価指標を計算する学習データ評価部120と、評価指標を最大化する第一のデータ集合の値域を探索するデータ選択条件探索部116を含む構成とする。【選択図】図2

Description

本発明は、データ選択支援装置及びデータ選択支援方法に関するものである。
生産現場で利用される製造設備や発電装置などは、故障して利用できない状態になると、業務の生産性低下などの大きな影響を及ぼす。そのため、装置の不具合を早期に発見し、故障を未然に防ぐことが求められる。装置の故障を予知する手法の一つとして異常検知技術がある。
異常検知技術では、装置に設置された各種のセンサから、装置の状態を表すセンサデータを収集する。そして、当該センセデータに基づいて、装置の正常状態を表す数理モデルを学習する。また、構築したモデルを、当該装置から取得されるセンサデータに適用し、その異常度を算出する。異常度が増加した場合、当該装置は故障に至るリスクが高いと判断し、警告等を出力する。
こうした異常検知に用いる数理モデルの構築は、大きく、次のステップからなる。1)データの収集、2)利用するセンサの選択、3)前処理、4)特徴量の抽出、5)モデルの学習、そして、6)モデルの検証である。
このうち「前処理」では、モデル学習に利用する学習データを選択するデータ選択(データフィルタリングとも呼ばれる)の処理が行われる。一般に、収集したセンサデータは、学習に不適切なデータを含む可能性があるためである。
例えば、装置の起動直後は、運転が安定しておらず、センサデータの変動も大きい。このようなセンサデータからモデル学習を行うと、故障予兆の見逃しや、誤検知につながりうる。そこで、「前処理」におけるデータ選択により、不適切なデータを除去することが必要になる。
例えば、学習データの選択等に関連する従来技術としては、機械学習時に用いる訓練データの取得に際して、不適切なデータが混入していないかの確認を容易にする学習用データ確認支援装置(特許文献1参照)などが提案されている。
この学習用データ確認支援装置は、機械学習を用いた、産業機械の異常検知を行うため、予め正常データのみからなる学習用データを取得する際に不適切なデータの混入の確認を容易にする学習用データ確認支援装置であって、産業機械にある一定の動作を行わせた際の制御に係る所定の状態量及び制御量の少なくとも一方を表す時系列データを含む測定データを取得するデータ取得部と、前記データ取得部で取得した複数の時系列データを時間軸の方向に位置合わせした状態で、それぞれ同種データを重ねあわせてグラフ表示する表示制御部と、を備えるものである。
特開2020-102001号公報
上述の従来技術においては、操作者がグラフを見て判断を行う必要がある。そのため、
不適切なデータか否かの判断が属人的になる恐れがある。また、大規模な測定データを確認する必要がある場合や、測定データの変化パタンが複雑な場合、人手では対応しきれず、対応自体が難しいこととなる。
そこで本発明の目的は、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能とする技術を提供することにある。
上記課題を解決する本発明のデータ選択支援装置は、故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持する記憶部と、前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類するデータ分類部と、前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する学習データ選択部と、前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する学習データ評価部と、前記評価指標を最大化する、前記第一のデータ集合の値域を探索するデータ選択条件探索部と、を備えることを特徴とする。
また、本発明のデータ選択支援方法は、情報処理装置が、故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持して、前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類する処理と、前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する処理と、前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する処理と、前記評価指標を最大化する、前記第一のデータ集合の値域を探索する処理と、を実行することを特徴とする。
本発明によれば、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能となる。
実施例1における予兆検知システムの全体構成例を示す図である。 実施例1におけるデータ選択支援装置の構成例を示す図である 実施例1におけるセンサデータの構成例を示す図である。 実施例1における故障履歴の構成例を示す図である。 実施例1の最適化設定値のセンサ分類例を示す図である。 実施例1の最適化設定値の固定された選択条件例を示す図である。 実施例1の最適化設定値の探索される選択条件例を示す図である。 実施例1の最適化設定値の探索パラメタ例を示す図である。 実施例1のデータ選択最適化部における処理の流れを示す図である。 実施例1のデータ選択条件探索部におけるフロー例を示す図である。 実施例1の学習データ選択部における処理概念を示す図である。 実施例1におけるモデル用センサのデータ分布例を示す図である。 実施例1におけるモデル用センサのデータ分布例を示す図である。 実施例2の最適化設定値における対象装置例を示す図である。 実施例2の最適化設定値におけるデータ期間例を示す図である。 実施例2の学習データ評価部におけるフロー例を示す図である。 実施例2における期間ラベリングの概念例を示す図である。 実施例2における異常度と閾値の概念例を示す図である。 実施例2における検証データに対する期間とラベリング期間の概念例を示す図である。
以下、図面を用いて本発明の実施例1及び実施例2についてそれぞれ説明する。実施例1と実施例2の違いは、最適なデータ選択条件を求める際に使うセンサデータの特性と学習データを評価する評価指標にある。
実施例1は、故障予知モデルの構築対象となる対象装置から取得したセンサデータを用いて、最適なデータ選択条件を出力する。また、対象装置が過去に故障を経験していない場合でも、計算可能な評価指標を用いる。
一方、実施例2では、故障予知モデルの構築対象となる対象装置以外の装置からも取得したセンサデータを用いて、最適なデータ選択条件を出力する。対象装置は過去に故障を経験している装置も含む。また、学習データの評価指標は、故障予知モデルの精度に基づく指標を用いる。
[実施例1]
<システム構成>
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態における予兆検知システム1000の全体構成例を示す図である。図1に示す予兆検知システム1000は、データ選択支援装置100を含んで、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能とする。
本実施形態における予兆検知システム1000は、図1で例示するように、装置群10、センサ群20、データ格納装置30、データ選択支援装置100、モデル構築装置200、及び故障予知装置300がネットワーク1により、データ通信可能に接続され構成されている。なお、データ選択支援装置100が、モデル構築装置200及び故障予知装置300の少なくともいずれかの機能を合わせて備えるとしてもよい。また、データ格納装置30が、データ選択支援装置100の記憶装置であってもよい。すなわち、予兆検知システム1000に含まれる各情報処理装置は、別々のサーバ等で実現されてもよし、一つのサーバ等で実現されてもよい。
装置群10は、故障予知対象となる複数の装置11から構成される。ひとつの装置11が複数の部分(パーツや部品)から構成される場合、各々の構成要素を装置11とみなしても良い。
また、センサ群20は、複数のセンサから構成される。各センサ21は、上述の装置11の加速度や温度など、物理的な量を測定する。一般に、一つの装置11には、複数のセンサ21が設置されている。
また、データ格納装置30は、センサデータ31と故障履歴32を格納している。このうちセンサデータ31は、対象となる装置11、センサ21が測定した値、測定時刻を記録したデータを格納するデータベースとなる。
また、センサデータ31は、過去の一定期間にわたるデータ(オフラインデータ)および、リアルタイムに取得されたデータ(オンラインデータ)の両方を含む。こうしたセンサデータ31の詳細は、図Aで説明する。
一方、故障履歴32は、故障が発生した装置11、故障日、症状など、故障に関する情報を格納するデータベースとなる。こうした故障履歴32の詳細は、図Bで説明する。
データ選択支援装置100は、少なくともデータ選択最適化部110を備える。データ選択最適化部110は、センサデータ31と故障履歴32を利用して、故障予兆モデルを構築するために使う学習データ選択条件を探索し、最適なデータ選択条件を生成する。
また、モデル構築装置200は、モデル構築部151を備える。モデル構築部151は、データ選択最適化部110が生成した最適学習データ選択条件を用いて、センサデータ31のデータ選択を行い、データ選択後のセンサデータを用いて、故障予知モデルを学習する。
具体的な処理の流れは、下記の通りである。まず、モデル構築部151は、故障予知モデルを構築したい対象装置(装置11)の過去のセンサデータ31を入力とする。ここで入力とするセンサデータ31の量は、利用できるデータに応じて変わりうる。例えば、過去三か月分のセンサデータ31を利用しても良い。
モデル構築部151は、データ選択最適化部110が生成した最適データ選択条件をもとに、学習データに用いるデータと用いないデータの選別を行う。モデル構築部151は、選択した学習データを用いて故障予知モデルの学習を行う。故障予知モデルの学習は、予め選択した学習アルゴリズムにより行われる。
この学習アルゴリズムは、与えられたセンサデータを用いて、正常モデルを構築する手法であればいずれの手法でも良い。例えば、MT(マハラノビスタグチ)法、One class SVMなどが利用できる。
モデル構築部151は、上述のモデル学習により、故障予知モデルを学習する。学習された故障予知モデルは、モデル適用部161が利用できるように、故障予知装置300に保存される。本発明の特徴は、モデル構築に用いるデータ選択条件を最適化することにあり、故障予知モデルの学習は機械学習など既存の手法を用いてよい。
故障予知装置300は、モデル適用部161を備える。モデル適用部161は、モデル構築部151が構築した故障予知モデルを、検知対象の装置11から取得したセンサデータ32にリアルタイムに適用し、異常度を算出する。また、モデル適用部161は、異常度が予め設定した閾値を超えた場合は、警告を出力するなどの処理を行う。
具体的な処理の流れは、下記の通りである。まず、モデル適用部161は、故障予知対象の装置11のセンサ21からセンサデータ31を取得する。
モデル適用部161は、センサデータ31に対し、データ選択最適化部110が生成した最適学習データ選択条件を適用する。ある時刻の検知対象オンラインセンサデータが最適データ選択の条件を満たす場合、モデル適用部161は、センサデータに対し、モデル構築部151が構築した故障予知モデルを適用する。なお、最適データ選択の条件を満たさない場合は、モデルを適用しない。
モデル適用部161は、検知対象オンラインセンサデータが学習データ選択条件を満たすかどうかに応じて、異常度を計算する。学習データ選択条件を満たす場合、モデル適用部161は、検知対象オンラインセンサデータにモデルを適用し異常度を算出する。
なお、異常度の算出方法は、利用する学習アルゴリズムごとに異なる。例えば、MT法を利用する場合、データ選択適用後の検知対象オフラインセンサデータで定義される正常データと検知対象オンラインセンサデータの間のマハラノビス距離が異常度として用いられる。一方、学習データ選択条件を満たさない場合は、モデルによる異常度算出は行わず、予め設定した規定の値(例えば0)を異常度として出力する。モデルの適用は、モデルの構築と同様、機械学習など既存の手法を用いることができる。
<ハードウェア構成>
また、本実施形態のデータ選択支援装置100のハードウェア構成は、図2に示す如くとなる。すなわちデータ選択支援装置100は、記憶部101、メモリ103、演算部104、および通信部105、を備える。
このうち記憶部101は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ103は、RAMなど揮発性記憶素子で構成される。
また、演算部104は、記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
また、通信部105は、ネットワーク1と接続して、データ格納装置30、モデル構築装置200、及び故障予知装置300などとの通信処理を担うネットワークインターフェイスカード等を想定する。
なお、データ選択支援装置100がスタンドアロンマシンである場合、ユーザからのキー入力や音声入力を受け付ける入力装置、処理データの表示を行うディスプレイ等の出力装置、を更に備えるとすれば好適である。
また、記憶部101内には、本実施形態のデータ選択支援装置100として必要な機能を実装する為のプログラム102に加えて、種々のデータ類が少なくとも記憶されている。なお、プログラム102を演算部104が実行することで、データ選択最適化部110、センサデータ分類部111、データ選択条件探索部116、学習データ選択部118、学習データ評価部120、などの機能部が実装される。勿論、電子回路など適宜なハードウェアによって当該機能部が実装されている形態であってもよい。
<データ構造例>
続いて、本実施形態のデータ選択支援装置100が用いる各種データについて説明する。図3に、本実施形態におけるセンサデータ31の一例を示す。
センサデータ31は、センサ21の設置対象となっている装置11を識別する装置ID、センサ値が測定された時刻、当該時刻に各センサ21で計測された値、を格納したものとなる。
図3の例では、「センサ1」から「センサN」の計N個のセンサ値が各時刻に測定された形態となっている。こうしたセンサ値は、加速度など装置の状態を定量化した数値データでもよいし、運転モードなど装置の状態を定性的に表現したカテゴリデータでもよい。
続いて、図4に、故障履歴32の構成例を示す。本実施形態における故障履歴32は、故障IDをキーに、装置ID、故障日、故障の症状、及び対策などの値を備える。
このうち故障IDは、故障事例を一意に特定する識別子である。また、装置IDは、故障が発生した装置を識別する識別子である。また、故障日は、故障が発生した日を示す。症状は、故障の症状や原因などを示す。対策は、部品交換など故障に対して行われた処置を表す。
こうした故障履歴32に含まれる情報は、装置11の管理企業等が運用するメンテナンスシステム等から取得するとしてもよい。或いは、保守業務の担当者等により管理されているメンテナンス台帳などのファイルから取得するとしてもよい。
続いて図5A~図5Dに、データ選択最適化部110が、最適なデータ選択条件を生成する際に利用する最適化設定値114の例を示す。最適化設定値114は、図5Aに示す「センサ分類」、図5Bに示す「固定された選択条件」、図5Cに示す「探索される選択条件、」図5Dに示す「探索パラメタ」などから構成される。
このうち図5Aに示すセンサ分類は、モデル学習用センサ、データ選択用センサなどの項目411、412を備える。モデル学習用センサ411は、利用可能なセンサ21のうち、故障予知モデルの学習に使うセンサの集合を指定したものとなる。
モデル構築部151は、ここで指定されたセンサ21から取得したセンサデータを学習データに用いて、予め指定された学習アルゴリズムにより故障予知モデルを学習する。
一方、データ選択用センサ412は、利用可能なセンサ21のうち、データ選択条件の生成に使うセンサの集合を指定したものとなる。モデル構築部151は、ここで指定されたセンサから構成されるデータ選択条件を用いて、学習データの選択を行う。モデル学習用センサ411とデータ選択用センサ412の各欄は、それぞれ最低一つ以上のセンサを設定値として備える。また、モデル学習用センサ411とデータ選択用センサ412の各欄は、重複するセンサを設定値として含んでも良い。
データ選択最適化部110は、2種類のデータ選択条件を組み合わせて、最終的なデータ選択条件を出力する。ひとつは、データ選択に使うセンサ21、およびセンサ21の値域が予め定義された「固定された選択条件」である。もう一つは、データ選択に使うセンサ21のみ定義され、センサ21の値域は探索を通して決定される「探索される選択条件」である。固定された選択条件および探索される選択条件で指定されたセンサは、すべてデータ選択用センサとして登録される。
図5Bは固定された選択条件の例を示す図である。固定された選択条件は、固定条件ID421、センサ422、センサ値条件423などの各値を格納する。このうち固定条件ID421は、固定された選択条件を一意に特定する識別子である。
また、センサ422は、固定された選択条件に使用されるセンサ21を示す。センサ値条件423は、選択されたセンタ21のセンサ値に対する条件式を表す。例えば、図5Bにおける「固定条件1」で示された条件は、「センサ3」の値が「10より大きく、かつ、20より小さい範囲」に制限されることを表す。ここで、変数xは「センサ3」の値を表す。センサ値条件423は、センサ値に対する値域を制限する表現であれば、どのような表現でも良い。
図5Cは「探索される選択条件」の例を示す図である。「探索される選択条件」は、探索条件ID431、センサ432、センサ値条件433、センサ値探索範囲434などの各値を格納する。
このうち探索条件ID431は、探索される選択条件を一意に特定する識別子である。
また、センサ432は、探索される選択条件に使われるセンサ21を表す。また、センサ値条件433は、選択されたセンサ21のセンサ値に対する条件式を表す。固定された選択条件のセンサ値条件と異なる点は、センサ値を表す変数xと探索されるべき変数zによる条件である点である。変数zは、データ選択最適化部110が最適なデータ選択条件を探索する過程で、様々な値が割り当てられる。
探索センサ値範囲434は、変数zの取りうる範囲を表す。データ選択最適化部110は、ここで定義された範囲で変数zに様々な値を割り当てる。図の例では、「探索条件1」は、「センサ5」のセンサ値が0 ≦z≦10の範囲で探索されることを表す。そして
、データ選択最適化部110が探索の結果、選択したセンサ値z(例えば5)に対して、センサ値条件x≧z(x≧5)が導出されることを表す。
図5Dは「探索パラメタ」の例を示す図である。「探索パラメタ」は、選択後に残る学習データ割合451、探索回数452などの各値を格納する。選択後に残る学習データ割合451は、データ選択最適化部110が生成する最適データ選択条件が満たすべきデータの数を規定する。
学習用センサデータに対し、データ選択を適用すると、学習用データのレコード数は、データ選択前に比べて減少する。学習用データが少なすぎると、信頼できる故障予知モデルは学習できない。そのため、データ選択最適化部110は、データ選択後の学習データが一定割合以上残るように、制限を加える。図の例では、すくなくとも0.2(20%)の
学習データがデータ選択後に残る制限を意味する。こうした制限を割合の形で指定する代わりに、データ選択後に残るべき学習データのレコード数(たとえば1000レコード)を指定してもよい。
また、探索回数452は、データ選択最適化部110が、探索される選択条件に従い、データ選択条件を探索する回数を表す。
<機能部:データ選択最適化部>
続いて図6に、データ選択最適化部110の処理の流れを示す。データ選択最適化部110は、センサデータ分類部111、データ選択条件探索部116、学習データ選択部118、学習データ評価部120などの機能部を備えて構成される。
このうちセンサデータ分類部111は、入力されたセンサデータ31を、モデル学習用センサデータとデータ選択用センサデータに分類する。この分類は、センサ分類の設定(図5A)を参照して行われる。
モデル学習用センサに属するセンサデータは、モデル学習用センサデータに、データ学習用センサに属するセンサデータは、データ選択用センサデータに分類される。センサデータ分類部111は、分類したモデル学習用センサデータとデータ選択用センサデータを内部のメモリに保存する。
データ選択条件探索部116は、最適なデータ選択条件を求めるため、複数のデータ選択条件を生成する。その中で、評価指標121を最大とするデータ選択条件を最適データ選択条件117として出力する。データ選択条件探索部116の具体的な処理は、図7のフローにて説明する。
学習データ選択部118は、データ選択条件探索部116が出力したデータ選択条件117を、データ選択用センサデータとデータモデル学習用センサデータに適用することで、モデル学習用センサデータに対してデータ選択を行う。具体的なデータ選択の処理の流れは、図8で説明する。学習データ選択部118は、データ選択を行った後のモデル学習用センサデータ119を学習データ評価部120へ送信する。
学習データ評価部120は、データ選択を行った後のモデル学習用センサデータ119を用いて、センサデータが学習データとして適当かどうかを評価する評価指標121を計算する。
評価指標121は、例えば下記のような指標を用いることができる。ひとつは、正規分布との類似度を測定する指標である。一般に、装置が正常動作している時は、センサデータが正規分布をなすという仮定に基づき、データ選択後のセンサデータが正規分布に近いほど、高い値を取る指標を評価指標として用いることができる。例えば、歪度や尖度といった指標を用いても良い。
あるいは、学習データに対する異常度の平均値を用いても良い。データ選択後のセンサデータを用いてモデルの学習を行う。得られたモデルを学習データに適用し、異常度を算出する。そして、学習データに対する異常度の平均値を算出する。通常、学習データに対する異常度は小さいほうが好ましいので、平均値の正負の符号を逆にした値を最終的な学習データの評価指標として利用する。学習データ評価部120は、計算した評価指標121をデータ選択条件探索部116へ送信する。
データ選択最適化部110は、データ選択条件の生成と評価のサイクルを複数回繰り返すことで、最適データ選択条件115を求める。
<フロー例>
以下、本実施形態におけるデータ選択支援方法の実際手順について図に基づき説明する。以下で説明するデータ選択支援方法に対応する各種動作は、データ選択支援装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
図7は、本実施形態におけるデータ選択支援方法のフロー例を示す図であり、特に、データ選択条件探索部116のフローを示す。なお、データ選択最適化部110は、例えば、適宜なユーザ端末や自身で備えるUI等を介してユーザからの指示を受け付けたタイミングなどで本フローを開始する。
(ステップS601)まず、データ選択条件探索部116は、「探索される選択条件」の探索対象センサ値の値を設定する。この場合、データ選択条件探索部116は、最適化設定値114(図5C)で指定された「探索される選択条件」の探索条件を読み込む。そして、探索条件ごとに、対象となるセンサの値zを探索センサ値範囲434の中から設定する。
例えば、探索条件が「探索条件1」、「探索条件2」から構成される場合は、「センサ5」の下限値に相当する値を5に(探索条件1)、「センサ5」の上限値に相当する値を17に(探索条件2)設定する。データ選択条件探索部116は、すべての探索条件に含まれる探索センサ値の値を設定する。
なお、このステップが初めて実行される場合は、各探索センサ値の値は、探索センサ値の範囲で任意に設定する。一方、このステップが二回目以降に実行される場合は、これま
で試行した探索センサ値の組み合わせと学習データ評価部120が算出する評価指標121に基づいて、次の設定値を決定する。次の設定値の選び方は、用いるパラメタ探索アルゴリズムに依存する。
ここで、パラメタ探索アルゴリズムは、ある拘束条件に従う変数の組の中から、予め定義された目的変数を最大化する変数の組を探索するアルゴリズムを指す。例えば、ベイズ最適化や、遺伝的アルゴリズムなどを利用してもよい。
(ステップS602)次に、データ選択条件探索部116は、上述のステップS601で設定した探索対象センサ値に基づいて、学習データ選択条件を生成する。この場合、データ選択条件探索部116は、センサ値条件の変数zを、S601で設定した探索対象センサ値で置き換える。これにより、指定したセンサ(図5Cの場合、「センサ5」)に関するセンサ値条件が得られる。この処理を、すべての探索条件に適用する。
(ステップS603)次に、データ選択条件探索部116は、上述のステップS602で得られた学習データ選択条件を、「固定された選択条件」(図5B)の集合とマージし、データ選択条件を生成する。
(ステップS604)次に、データ選択条件探索部116は、上述のステップS603で生成したデータ選択条件を学習データ評価部120へ出力する。なお、データ選択条件探索部116は、この出力後、学習データ評価部120から入力を受け付けるまで待機する。
(ステップS605)次に、データ選択条件探索部116は、学習データ評価部120から評価指標121を受信する。データ選択条件探索部116は、データ選択条件に用いた探索センサ値と算出された評価指標121の組を内部メモリに保存する。
(ステップS606)次に、データ選択条件探索部116は、探索センサ値の探索が終了したかを判定する。判定の仕方は用いるパラメタ探索アルゴリズムに依存する。たとえば、予め設定した探索回数に達したか、で判定しても良い。
探索が完了したと判定した場合(S606:YES)、データ選択条件探索部116は、処理をステップS607へ進める。探索が完了していない場合(S606:YES)、データ選択条件探索部116は、ステップS601へ戻り、処理を繰り返す。
(ステップS607)探索が完了した場合、データ選択条件探索部116は、最適データ選択条件115を出力する。最適データ選択条件115は、これまでに試行した探索センサ値のうち、評価指標121が最大となるものを選択する。なお、同一のデータ選択性能指標を持つ探索センサ値が存在する場合は、いずれか一つを出力する。
最適データ選択条件115を出力した後、データ選択条件探索部116は本フローを終了する。
<学習データ選択部の処理>
続いて、図8に学習データ選択部118が実際に学習データを選択する概念例を示す。図8の例では、「センサ3」のセンサデータに関して学習データ選択を行う状況を想定している。
例えば、学習データの選択条件が「x>10 AND x<20」と表現されている場合、学習データ選択部118は、センサデータ32の「センサ3」のセンサ値が、この条
件を満たす領域、すなわち、下限値「10」と上限値「20」の間、を抽出する(図8におけるグラフ(a))。
次に、学習データ選択部118は、上述のように抽出した値域に値を持つ期間を抽出する(図8におけるグラフ(b))。そして、学習データ選択部118は、モデル用センサの
センサデータから、上記で抽出した期間と同一の期間を抽出し、モデル学習に利用する(図8におけるグラフ(c))。
この一連の処理により、学習データ選択部118は、センサ値条件からモデル用センサの期間を得る。複数のセンサ値条件が存在する場合は、同様の処理を繰り返し、最終的な期間を得る。
図9A、図9Bは、学習データ選択部118が、モデル用センサデータにデータ選択を適用する前後での、モデル用センサデータの分布の変化を表す図である。一般に、図8で説明した一連の処理によりセンサデータに対してデータ選択を適用すると、データ選択前のデータの一部が除外され、データの分布が変化する。図9A、図9Bは、モデル用センサである、「センサ1」と「センサ2」のデータ分布を表す頻度グラフを、データ選択前とデータ選択後で比較した図である。
<実施例2>
続いて、以下図10から図13を用いて、実施例2置について説明する。図10は、図5A~5D等で説明した最適化設定値114に、新たに加わる設定値の例を示す図である。ここで加わる最適化設定値114は、対象装置、及びデータ期間に関するものとなる。
図10Aは、実施例2の最適化設定値114における対象装置の設定例を示す図である。対象装置の設定情報は、選択条件生成用装置1011の設定値などを格納する。選択条件生成用装置は、データ選択最適化部110が最適データ選択条件115を生成するのに利用する装置の集合である。
データ選択最適化部110は、ここで定義された装置集合から取得したセンサデータ31と故障履歴32を利用して、ひとつの最適データ選択条件115を出力する。図10Aの例では、「選択条件生成用装置」として設定されている、「装置1」、「装置2」、「装置3」の3つの装置から取得したデータを利用することになる。
なお、「選択条件生成用装置」としては、一つ以上の装置を定義していれば、何個定義する形態でも良い。また、「選択条件生成用装置」は、例えば、同一の製品種別からなる装置の集合で定義してもよい。
図10Bは、実施例2の最適化設定値114におけるデータ期間の設定例を示す図である。データ期間の設定情報は、学習開始日1021、学習終了日1022、評価開始日1023、評価終了日1024などの設定値を格納する。
このうち学習開始日1021の設定値は、「選択条件生成用装置」の欄で定義した装置ごとに、故障予知モデルの学習に利用するセンサデータの開始日(利用する当該センサデータのうち最も早い計測日)を表す。同様に、学習終了日は、故障予知モデルの学習に利用するセンサデータの終了日(利用する当該センサデータのうち最も遅い計測日)を表す。
データ選択最適化部110は、ここで定義された学習開始日1021と学習終了日1022の各値をもとに学習データを選択し、データ選択最適化を行う。また、評価開始日1
023の設定値は、「選択条件生成用装置」欄で定義した装置ごとに、故障予知モデルの評価に使うセンサデータの開始日(利用する当該センサデータのうち最も早い計測日)を表す。同様に、評価終了日は、故障予知モデルの評価に利用するセンサデータの終了日(利用する当該センサデータのうち最も遅い計測日)を表す。
<フロー:学習データ評価部>
図11は、実施例2における学習データ評価部120での処理例を示す図である。学習データ評価部120は、例えば、ユーザからの指示を適宜なユーザ端末やUIを介して受け付けたタイミングなどで本フローを開始する。
(ステップS1101)まず、学習データ評価部120は、最適化設定値114の選択条件生成用装置1011の設定値で指定された対象装置の情報を読み込む。そして、学習データ評価部120は、その対象装置のうち、ひとつの装置を選択する。はじめてこのステップが実行される場合は、任意の対象装置を選ぶ。二回目以降に実行される場合は、まだ選択されていない対象装置から選択する。
(ステップS1102)次に、学習データ評価部120は、センサデータ31にラベリングを行う。ラベリングとは、センサデータ31の各時刻を正常期間、グレー期間、異常期間、回復期間のいずれかに分類する処理である。期間ラベリングの詳細は図12で説明する。
(ステップS1103)次に、学習データ評価部120は、上述のラベリングで得た期間ラベリング済みセンサデータを参照し、故障予知モデルの学習に使う学習データを選定する。学習データは、期間ラベリングで分類された正常期間中のセンサデータが選定される。
例えば、正常期間の開始日から予め設定した学習ウィンドウ幅分(例えば3か月)の期間を学習データとして選定する。
さらに、学習データ評価部120は、選定した学習データに基づいて、S1101で選択した装置のセンサデータ31を学習データと検証データに分割する。検証データは、センサデータ31のうち、学習データに含まれない、(観測時期が)学習データ以後のデータを指す。学習データ評価部120は、分割した学習データと検証データを内部メモリに保存する。
(ステップS1104)次に、学習データ評価部120は、ステップS1101で選択した装置に対して、故障予知モデルを学習する。学習に用いるデータは、学習データ選択部118がデータ選択を行ったデータのうち、ステップS1101で選択した装置に関するデータであり、ステップS1103で分割して生成された学習データである。故障予知モデルの学習の処理は、モデル構築部151で行う処理と同様である。
(ステップS1105)次に、学習データ評価部120は、ステップS1104で生成した故障予知モデルを、ステップS1103で分割して生成された検証データに適用する。モデル適用の処理は、モデル適用部161の処理と同様である。しかし、オンラインデータの代わりに、検証データを入力とする。
学習データ評価部120は、検証データに故障予知モデルを適用し、異常度を算出する。算出した異常度は、内部メモリに保存しておく。
(ステップS1106)次に、学習データ評価部120は、「選択条件生成用装置」に含
まれるすべての装置に関して、上述の異常度の算出が完了したかを確認する。完了している場合(S1106:YES)、学習データ評価部120は、ステップS1107へ進む。一方、完了していない場合(S1106:YES)、学習データ評価部120は、ステップS1101へ戻り、処理を繰り返す。
(ステップS1107)すべての、対象装置に対する異常度算出が完了した後、学習データ評価部120は、装置ごとの異常度を統合し、評価指標121を算出する。評価指標121の算出方法の詳細は図13で説明する。学習データ評価部120は、算出した評価指標121をデータ選択条件探索部116へ出力し、処理を終了する。
<期間ラベリング>
図12は、学習データ評価部120が行うデータ選択最適化の処理の中で、期間ラベリング処理の様子を表した図である。
学習データ評価部120は、入力されたセンサデータ31にラベリングを行う。ラベリングとは、センサデータの各時刻を正常期間、グレー期間、異常期間、回復期間のいずれかに分類する処理である。
正常期間は、対象としている装置が正常に動作していたことが保障されている期間を指す。モデル構築部161は、正常期間のデータを利用して、正常モデルを学習する。異常期間は、対象とする装置が異常な振る舞いをしていたことが保証されている時期を指す。
グレー期間は、正常期間と異常期間の間に位置し、正常/異常の判断が困難な期間を指
す。突発的な故障を除けば、一般に、装置は、正常状態から異常状態へ連続的に移行する。そのため、正常と異常とはっきり判定できない期間をグレー期間とする。
回復期間は、故障が発生し、修理などを行い、装置が正常な状態に戻った期間を指す。装置の状態としては正常だが、修理等により、故障前の正常状態と異なる振る舞いをする可能性があるので、正常期間と区別して定義する。
図の例は、過去に故障した装置に対する期間ラベリングの例である。故障が発生していない装置には、異常期間が存在せず、正常期間あるいはグレー期間のみが存在する。
期間ラベリングは、各装置に対して、メンテナンス等を行った情報をもとに行っても良いし、ドメイン知識に基づくルールで決めても良い。ルールで決める場合、例えば、故障日から3か月前までを異常期間と定義し、異常期間より2か月前までをグレー期間とし、残りを正常期間とする、というルールにより、期間ラベリングを行っても良い。
<異常度>
図13A、図13Bは、学習データ評価部120が算出する評価指標121を説明する図である。学習データ評価部120は、ステップS1107において、「選択条件生成用装置」に関する検証データに対し、異常度を算出している。図13Aは、あるひとつの装置の検証データに対する異常度を表す。
学習データ評価部120は、予め設定した閾値に基づいて、異常度から検知期間を抽出する。検知期間は、異常度が閾値を超えている期間である。この閾値は、利用する検知アルゴリズム、学習データに基づいて設定する。例えば、MT法による検知では閾値4を用いても良い。
図13Bは、図13Aで示す異常度から、異常期間(斜線領域)を抽出した図を表す。
学習データ評価部120は、「選択条件生成用装置」ごとに、この検知期間と期間ラベリングで分類された期間の組を保持する。
ここで、期間ラベリングによる分類は、教師あり学習の識別問題における正解ラベルに、検知期間は予測ラベルに対応するが、性能指標を算出する方法は、通常の教師あり学習と下記の点において異なる。
まず、通常の識別学習では、正常/異常の2値の正解ラベルを持つ。それに対し、本発
明は、正常期、グレー期、異常期、回復期の4つのラベルを持つ。また、通常の識別問題際には、各時刻の点を独立なインスタンスとして扱い、PrecisionやRecallなどの性能を計算する。
それに対し本発明では、期間をベースとしたPrecisionやRecallを用いる。それにより、時系列的な要素を考慮してモデルの性能を評価する効果がある。まず、期間をベースとしたRecallの計算方法を説明する。
「選択条件生成用装置」に関する検証データの集合(簡単のため検証データ集合と呼ぶ)に含まれる異常期間を抽出する。そして、各異常期間に対し、検知期間と照合して、Recallスコアを計算する。
Recallスコアは、ひとつの異常期間をどれだけよく検知できたかを示す指標である。例えば、異常期間と検知期間がオーバーラップしている場合は1、そうでない場合は0といった指標を用いても良い。あるいは、異常期間に対する検知期間の占める割合を指標として用いても良い。あるいは、異常期間に含まれる検知期間のうち、その開始時刻が一番早い時刻を選び、異常期間に対する検知の早さを指標として用いても良い。
検証データ集合に含まれるすべての異常期間に対して、Recallスコアを計算し、それらの平均値をRecallとして算出する。
次に期間をベースとしたPrecisionの計算方法を説明する。まず、学習データ評価部120は、検証データ集合に含まれる検知期間を抽出する。そして、各検知期間に対し、期間ラベルと照合して、Precisionスコアを計算する。
Precisionスコアは、ひとつの検知期間がどれだけ精度良く実際の異常期間を検知できたかを示す指標である。例えば、検知期間が、少なくとも一つの異常期間とオーバーラップしていればスコア値1、そうでない場合はスコア値0とする指標を用いても良い。あるいは、検知期間に対する実際の異常期間の占める割合を指標に用いても良い。
検証データ集合に含まれるすべての異常期間に対して、Precisionスコアを計算し、それらの平均値をPrecisionとして算出する。ただし、ここで、グレー期あるいは、回復期に含まれる検知期間は平均値の算出対象から除外する。これにより、正常/異常の判断が難しい期間や、装置の動作が不安定な期間がPrecisionへ与え
る影響を除外する効果がある。
学習データ評価部120は、上記の方法で計算したPrecisionとRecallに基づいて、評価指標121を計算する。例えば、2つの値の調和平均であるF1値などを用いても良い。
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
こうした本実施形態によれば、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能となる。
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の学習データ選択支援装置において、前記学習データ選択部は、前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成するものであり、前記学習用センサデータを所定の評価アルゴリズムに適用して、当該モデル学習用センサデータが学習データとして適切であるかを示す評価指標を算定する学習データ評価部を更に備える、としてもよい。
これによれば、学習データの選択をより精度良く行うことが可能となる。ひいては、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる、より好適な学習データの選択を支援可能となる。
また、本実施形態のデータ選択支援装置において、前記学習データ選択部における、前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定するデータ選択最適化部を更に備える、としてもよい。
これによれば、第二のデータ集合に関する値域を効率的に特定可能となる。ひいては、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる、より好適な学習データの選択を支援可能となる。
また、本実施形態のデータ選択支援装置において、前記学習データ評価部は、予め定めた対象装置の集合に含まれる装置それぞれに関して、センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出するものである、としてもよい。
これによれば、複数の装置に関して好適な学習データの効率的な選択が可能となる。ひいては、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる、より好適な学習データの選択を支援可能となる。
また、本実施形態のデータ選択支援方法において、前記情報処理装置が、前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成し、前記学習用センサデータを所定の評価アルゴリズムに適用して、当該モデル学習用センサデータが学習データとして適切であるかを示す評価指標を算定する処理を更に実行する、としてもよい。
また、本実施形態のデータ選択支援方法において、前記情報処理装置が、前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定する処理を更に実行する、としてもよい。
また、本実施形態のデータ選択支援方法において、前記情報処理装置が、予め定めた対象装置の集合に含まれる装置それぞれに関して、センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出する、としてもよい。
1 ネットワーク
10 装置群
11 装置
20 センサ群
21 センサ
30 データ格納装置
31 センサデータ
32 故障履歴
100 データ選択支援装置
101 記憶部
102 プログラム
103 メモリ
104 演算部
105 通信部
110 データ選択最適化部
111 センサデータ分類部
112 モデル学習用センサデータ
113 データ選択用センサデータ
114 最適化設定値
115 最適データ選択条件
116 データ選択条件探索部
117 データ選択条件
118 学習データ選択部
119 選択後モデル学習用センサデータ
120 学習データ評価部
121 評価指標
200 モデル構築装置
151 モデル構築部
300 故障予知装置
161 モデル適用部

Claims (8)

  1. 故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持する記憶部と、
    前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類するデータ分類部と、
    前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する学習データ選択部と、
    前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する学習データ評価部と、
    前記評価指標を最大化する、前記第一のデータ集合の値域を探索するデータ選択条件探索部と、
    を備えることを特徴とするデータ選択支援装置。
  2. 前記学習データ選択部は、
    前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成するものであり、
    前記学習用センサデータを所定の評価アルゴリズムに適用して、当該学習用センサデータが学習データとして適切であるかを示す評価指標を算定する学習データ評価部を更に備える、
    ことを特徴とする請求項1に記載のデータ選択支援装置。
  3. 前記学習データ選択部における、前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定するデータ選択最適化部を更に備える、
    ことを特徴とする請求項2に記載のデータ選択支援装置。
  4. 前記学習データ評価部は、
    予め定めた対象装置の集合に含まれる装置それぞれに関して、
    センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、
    前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出するものである、
    ことを特徴とする請求項2に記載のデータ選択支援装置。
  5. 情報処理装置が、
    故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持して、
    前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類する処理と、
    前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する処理と、
    前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する処理と、
    前記評価指標を最大化する、前記第一のデータ集合の値域を探索する処理と、
    を実行することを特徴とするデータ選択支援方法。
  6. 前記情報処理装置が、
    前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成し、
    前記学習用センサデータを所定の評価アルゴリズムに適用して、当該学習用センサデータが学習データとして適切であるかを示す評価指標を算定する処理を更に実行する、
    ことを特徴とする請求項5に記載のデータ選択支援方法。
  7. 前記情報処理装置が、
    前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定する処理を更に実行する、
    ことを特徴とする請求項6に記載のデータ選択支援方法。
  8. 前記情報処理装置が、
    予め定めた対象装置の集合に含まれる装置それぞれに関して、
    センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、
    前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出する、
    ことを特徴とする請求項6に記載のデータ選択支援方法。
JP2021100050A 2021-06-16 2021-06-16 データ選択支援装置及びデータ選択支援方法 Pending JP2022191680A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021100050A JP2022191680A (ja) 2021-06-16 2021-06-16 データ選択支援装置及びデータ選択支援方法
US17/838,983 US20220405161A1 (en) 2021-06-16 2022-06-13 Data selection assist device and data selection assist method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021100050A JP2022191680A (ja) 2021-06-16 2021-06-16 データ選択支援装置及びデータ選択支援方法

Publications (2)

Publication Number Publication Date
JP2022191680A true JP2022191680A (ja) 2022-12-28
JP2022191680A5 JP2022191680A5 (ja) 2024-01-31

Family

ID=84490464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021100050A Pending JP2022191680A (ja) 2021-06-16 2021-06-16 データ選択支援装置及びデータ選択支援方法

Country Status (2)

Country Link
US (1) US20220405161A1 (ja)
JP (1) JP2022191680A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117594473B (zh) * 2024-01-19 2024-04-16 鲁欧智造(山东)高端装备科技有限公司 一种碳化硅功率器件的产品检测方法

Also Published As

Publication number Publication date
US20220405161A1 (en) 2022-12-22

Similar Documents

Publication Publication Date Title
Arena et al. A novel decision support system for managing predictive maintenance strategies based on machine learning approaches
CN111542846B (zh) 故障预测系统和故障预测方法
EP2905665B1 (en) Information processing apparatus, diagnosis method, and program
JP6708203B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2019185422A (ja) 故障予知方法、故障予知装置および故障予知プログラム
JP7493930B2 (ja) 情報処理方法、情報処理装置、生産システム、プログラム、記録媒体
CN112016689B (zh) 信息处理装置、预测判别系统以及预测判别方法
WO2022038804A1 (ja) 診断装置及びパラメータ調整方法
JP5868331B2 (ja) 圧縮機を診断するための方法およびシステム
KR102618023B1 (ko) 고장유형에 따른 패턴 분석을 통한 고장 예지 진단시스템 및 방법
CN117131110B (zh) 一种基于关联分析的容性设备介质损耗监测方法及系统
WO2019012653A1 (ja) 学習システム、分析システム、学習方法及び記憶媒体
Calabrese et al. An event based machine learning framework for predictive maintenance in industry 4.0
US20230123527A1 (en) Distributed client server system for generating predictive machine learning models
JP5824959B2 (ja) 異常診断装置
JP6922983B2 (ja) 分析システム、分析方法及びプログラム
CN111061581A (zh) 一种故障检测方法、装置及设备
JP2022191680A (ja) データ選択支援装置及びデータ選択支援方法
JP6915693B2 (ja) システム分析方法、システム分析装置、および、プログラム
KR20230066093A (ko) 이상 진단 모델의 구축 방법, 이상 진단 방법, 이상 진단 모델의 구축 장치 및 이상 진단 장치
US20230297095A1 (en) Monitoring device and method for detecting anomalies
JP7222939B2 (ja) 時系列パターンの説明情報生成装置
KR20220097252A (ko) 스마트 플랜트에 관한 머신러닝 기반 설비 관리 방법 및 시스템
JP2018014093A (ja) プロセスの状態診断方法及び状態診断装置
CN116235121A (zh) 识别用于执行生产过程的工业设施中的异常的装置和方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240123

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240123