JP2022191680A

JP2022191680A - データ選択支援装置及びデータ選択支援方法

Info

Publication number: JP2022191680A
Application number: JP2021100050A
Authority: JP
Inventors: 進芹田; Susumu Serita
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2021-06-16
Filing date: 2021-06-16
Publication date: 2022-12-28
Also published as: US20220405161A1

Abstract

【課題】大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能とする。【解決手段】データ選択支援装置１００において、故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持する記憶部１０１と、時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類するデータ分類部１１１と、第一のデータ集合の値域に基づいて、第二のデータ集合の部分集合を選択する学習データ選択部１１８と、選択した部分集合に基づいて故障予知モデルの学習データとしての適切さを示す評価指標を計算する学習データ評価部１２０と、評価指標を最大化する第一のデータ集合の値域を探索するデータ選択条件探索部１１６を含む構成とする。【選択図】図２

Description

本発明は、データ選択支援装置及びデータ選択支援方法に関するものである。

生産現場で利用される製造設備や発電装置などは、故障して利用できない状態になると、業務の生産性低下などの大きな影響を及ぼす。そのため、装置の不具合を早期に発見し、故障を未然に防ぐことが求められる。装置の故障を予知する手法の一つとして異常検知技術がある。

異常検知技術では、装置に設置された各種のセンサから、装置の状態を表すセンサデータを収集する。そして、当該センセデータに基づいて、装置の正常状態を表す数理モデルを学習する。また、構築したモデルを、当該装置から取得されるセンサデータに適用し、その異常度を算出する。異常度が増加した場合、当該装置は故障に至るリスクが高いと判断し、警告等を出力する。

こうした異常検知に用いる数理モデルの構築は、大きく、次のステップからなる。１）データの収集、２）利用するセンサの選択、３）前処理、４）特徴量の抽出、５）モデルの学習、そして、６）モデルの検証である。

このうち「前処理」では、モデル学習に利用する学習データを選択するデータ選択（データフィルタリングとも呼ばれる）の処理が行われる。一般に、収集したセンサデータは、学習に不適切なデータを含む可能性があるためである。

例えば、装置の起動直後は、運転が安定しておらず、センサデータの変動も大きい。このようなセンサデータからモデル学習を行うと、故障予兆の見逃しや、誤検知につながりうる。そこで、「前処理」におけるデータ選択により、不適切なデータを除去することが必要になる。

例えば、学習データの選択等に関連する従来技術としては、機械学習時に用いる訓練データの取得に際して、不適切なデータが混入していないかの確認を容易にする学習用データ確認支援装置（特許文献１参照）などが提案されている。

この学習用データ確認支援装置は、機械学習を用いた、産業機械の異常検知を行うため、予め正常データのみからなる学習用データを取得する際に不適切なデータの混入の確認を容易にする学習用データ確認支援装置であって、産業機械にある一定の動作を行わせた際の制御に係る所定の状態量及び制御量の少なくとも一方を表す時系列データを含む測定データを取得するデータ取得部と、前記データ取得部で取得した複数の時系列データを時間軸の方向に位置合わせした状態で、それぞれ同種データを重ねあわせてグラフ表示する表示制御部と、を備えるものである。

特開２０２０－１０２００１号公報

上述の従来技術においては、操作者がグラフを見て判断を行う必要がある。そのため、
不適切なデータか否かの判断が属人的になる恐れがある。また、大規模な測定データを確認する必要がある場合や、測定データの変化パタンが複雑な場合、人手では対応しきれず、対応自体が難しいこととなる。

そこで本発明の目的は、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能とする技術を提供することにある。

上記課題を解決する本発明のデータ選択支援装置は、故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持する記憶部と、前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類するデータ分類部と、前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する学習データ選択部と、前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する学習データ評価部と、前記評価指標を最大化する、前記第一のデータ集合の値域を探索するデータ選択条件探索部と、を備えることを特徴とする。

また、本発明のデータ選択支援方法は、情報処理装置が、故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持して、前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類する処理と、前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する処理と、前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する処理と、前記評価指標を最大化する、前記第一のデータ集合の値域を探索する処理と、を実行することを特徴とする。

本発明によれば、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能となる。

実施例１における予兆検知システムの全体構成例を示す図である。実施例１におけるデータ選択支援装置の構成例を示す図である実施例１におけるセンサデータの構成例を示す図である。実施例１における故障履歴の構成例を示す図である。実施例１の最適化設定値のセンサ分類例を示す図である。実施例１の最適化設定値の固定された選択条件例を示す図である。実施例１の最適化設定値の探索される選択条件例を示す図である。実施例１の最適化設定値の探索パラメタ例を示す図である。実施例１のデータ選択最適化部における処理の流れを示す図である。実施例１のデータ選択条件探索部におけるフロー例を示す図である。実施例１の学習データ選択部における処理概念を示す図である。実施例１におけるモデル用センサのデータ分布例を示す図である。実施例１におけるモデル用センサのデータ分布例を示す図である。実施例２の最適化設定値における対象装置例を示す図である。実施例２の最適化設定値におけるデータ期間例を示す図である。実施例２の学習データ評価部におけるフロー例を示す図である。実施例２における期間ラベリングの概念例を示す図である。実施例２における異常度と閾値の概念例を示す図である。実施例２における検証データに対する期間とラベリング期間の概念例を示す図である。

以下、図面を用いて本発明の実施例１及び実施例２についてそれぞれ説明する。実施例１と実施例２の違いは、最適なデータ選択条件を求める際に使うセンサデータの特性と学習データを評価する評価指標にある。

実施例１は、故障予知モデルの構築対象となる対象装置から取得したセンサデータを用いて、最適なデータ選択条件を出力する。また、対象装置が過去に故障を経験していない場合でも、計算可能な評価指標を用いる。

一方、実施例２では、故障予知モデルの構築対象となる対象装置以外の装置からも取得したセンサデータを用いて、最適なデータ選択条件を出力する。対象装置は過去に故障を経験している装置も含む。また、学習データの評価指標は、故障予知モデルの精度に基づく指標を用いる。

[実施例１]
＜システム構成＞

以下に本発明の実施形態について図面を用いて詳細に説明する。図１は、本実施形態における予兆検知システム１０００の全体構成例を示す図である。図１に示す予兆検知システム１０００は、データ選択支援装置１００を含んで、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能とする。

本実施形態における予兆検知システム１０００は、図１で例示するように、装置群１０、センサ群２０、データ格納装置３０、データ選択支援装置１００、モデル構築装置２００、及び故障予知装置３００がネットワーク１により、データ通信可能に接続され構成されている。なお、データ選択支援装置１００が、モデル構築装置２００及び故障予知装置３００の少なくともいずれかの機能を合わせて備えるとしてもよい。また、データ格納装置３０が、データ選択支援装置１００の記憶装置であってもよい。すなわち、予兆検知システム１０００に含まれる各情報処理装置は、別々のサーバ等で実現されてもよし、一つのサーバ等で実現されてもよい。

装置群１０は、故障予知対象となる複数の装置１１から構成される。ひとつの装置１１が複数の部分（パーツや部品）から構成される場合、各々の構成要素を装置１１とみなしても良い。

また、センサ群２０は、複数のセンサから構成される。各センサ２１は、上述の装置１１の加速度や温度など、物理的な量を測定する。一般に、一つの装置１１には、複数のセンサ２１が設置されている。

また、データ格納装置３０は、センサデータ３１と故障履歴３２を格納している。このうちセンサデータ３１は、対象となる装置１１、センサ２１が測定した値、測定時刻を記録したデータを格納するデータベースとなる。

また、センサデータ３１は、過去の一定期間にわたるデータ（オフラインデータ）および、リアルタイムに取得されたデータ（オンラインデータ）の両方を含む。こうしたセンサデータ３１の詳細は、図Ａで説明する。

一方、故障履歴３２は、故障が発生した装置１１、故障日、症状など、故障に関する情報を格納するデータベースとなる。こうした故障履歴３２の詳細は、図Ｂで説明する。

データ選択支援装置１００は、少なくともデータ選択最適化部１１０を備える。データ選択最適化部１１０は、センサデータ３１と故障履歴３２を利用して、故障予兆モデルを構築するために使う学習データ選択条件を探索し、最適なデータ選択条件を生成する。

また、モデル構築装置２００は、モデル構築部１５１を備える。モデル構築部１５１は、データ選択最適化部１１０が生成した最適学習データ選択条件を用いて、センサデータ３１のデータ選択を行い、データ選択後のセンサデータを用いて、故障予知モデルを学習する。

具体的な処理の流れは、下記の通りである。まず、モデル構築部１５１は、故障予知モデルを構築したい対象装置（装置１１）の過去のセンサデータ３１を入力とする。ここで入力とするセンサデータ３１の量は、利用できるデータに応じて変わりうる。例えば、過去三か月分のセンサデータ３１を利用しても良い。

モデル構築部１５１は、データ選択最適化部１１０が生成した最適データ選択条件をもとに、学習データに用いるデータと用いないデータの選別を行う。モデル構築部１５１は、選択した学習データを用いて故障予知モデルの学習を行う。故障予知モデルの学習は、予め選択した学習アルゴリズムにより行われる。

この学習アルゴリズムは、与えられたセンサデータを用いて、正常モデルを構築する手法であればいずれの手法でも良い。例えば、ＭＴ（マハラノビスタグチ）法、One class SVMなどが利用できる。

モデル構築部１５１は、上述のモデル学習により、故障予知モデルを学習する。学習された故障予知モデルは、モデル適用部１６１が利用できるように、故障予知装置３００に保存される。本発明の特徴は、モデル構築に用いるデータ選択条件を最適化することにあり、故障予知モデルの学習は機械学習など既存の手法を用いてよい。

故障予知装置３００は、モデル適用部１６１を備える。モデル適用部１６１は、モデル構築部１５１が構築した故障予知モデルを、検知対象の装置１１から取得したセンサデータ３２にリアルタイムに適用し、異常度を算出する。また、モデル適用部１６１は、異常度が予め設定した閾値を超えた場合は、警告を出力するなどの処理を行う。

具体的な処理の流れは、下記の通りである。まず、モデル適用部１６１は、故障予知対象の装置１１のセンサ２１からセンサデータ３１を取得する。

モデル適用部１６１は、センサデータ３１に対し、データ選択最適化部１１０が生成した最適学習データ選択条件を適用する。ある時刻の検知対象オンラインセンサデータが最適データ選択の条件を満たす場合、モデル適用部１６１は、センサデータに対し、モデル構築部１５１が構築した故障予知モデルを適用する。なお、最適データ選択の条件を満たさない場合は、モデルを適用しない。

モデル適用部１６１は、検知対象オンラインセンサデータが学習データ選択条件を満たすかどうかに応じて、異常度を計算する。学習データ選択条件を満たす場合、モデル適用部１６１は、検知対象オンラインセンサデータにモデルを適用し異常度を算出する。

なお、異常度の算出方法は、利用する学習アルゴリズムごとに異なる。例えば、ＭＴ法を利用する場合、データ選択適用後の検知対象オフラインセンサデータで定義される正常データと検知対象オンラインセンサデータの間のマハラノビス距離が異常度として用いられる。一方、学習データ選択条件を満たさない場合は、モデルによる異常度算出は行わず、予め設定した規定の値（例えば０）を異常度として出力する。モデルの適用は、モデルの構築と同様、機械学習など既存の手法を用いることができる。

＜ハードウェア構成＞
また、本実施形態のデータ選択支援装置１００のハードウェア構成は、図２に示す如くとなる。すなわちデータ選択支援装置１００は、記憶部１０１、メモリ１０３、演算部１０４、および通信部１０５、を備える。

このうち記憶部１０１は、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。

また、メモリ１０３は、ＲＡＭなど揮発性記憶素子で構成される。

また、演算部１０４は、記憶部１０１に保持されるプログラム１０２をメモリ１０３に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうＣＰＵである。

また、通信部１０５は、ネットワーク１と接続して、データ格納装置３０、モデル構築装置２００、及び故障予知装置３００などとの通信処理を担うネットワークインターフェイスカード等を想定する。

なお、データ選択支援装置１００がスタンドアロンマシンである場合、ユーザからのキー入力や音声入力を受け付ける入力装置、処理データの表示を行うディスプレイ等の出力装置、を更に備えるとすれば好適である。

また、記憶部１０１内には、本実施形態のデータ選択支援装置１００として必要な機能を実装する為のプログラム１０２に加えて、種々のデータ類が少なくとも記憶されている。なお、プログラム１０２を演算部１０４が実行することで、データ選択最適化部１１０、センサデータ分類部１１１、データ選択条件探索部１１６、学習データ選択部１１８、学習データ評価部１２０、などの機能部が実装される。勿論、電子回路など適宜なハードウェアによって当該機能部が実装されている形態であってもよい。

＜データ構造例＞
続いて、本実施形態のデータ選択支援装置１００が用いる各種データについて説明する。図３に、本実施形態におけるセンサデータ３１の一例を示す。

センサデータ３１は、センサ２１の設置対象となっている装置１１を識別する装置ＩＤ、センサ値が測定された時刻、当該時刻に各センサ２１で計測された値、を格納したものとなる。

図３の例では、「センサ１」から「センサＮ」の計Ｎ個のセンサ値が各時刻に測定された形態となっている。こうしたセンサ値は、加速度など装置の状態を定量化した数値データでもよいし、運転モードなど装置の状態を定性的に表現したカテゴリデータでもよい。

続いて、図４に、故障履歴３２の構成例を示す。本実施形態における故障履歴３２は、故障ＩＤをキーに、装置ＩＤ、故障日、故障の症状、及び対策などの値を備える。

このうち故障ＩＤは、故障事例を一意に特定する識別子である。また、装置ＩＤは、故障が発生した装置を識別する識別子である。また、故障日は、故障が発生した日を示す。症状は、故障の症状や原因などを示す。対策は、部品交換など故障に対して行われた処置を表す。

こうした故障履歴３２に含まれる情報は、装置１１の管理企業等が運用するメンテナンスシステム等から取得するとしてもよい。或いは、保守業務の担当者等により管理されているメンテナンス台帳などのファイルから取得するとしてもよい。

続いて図５Ａ～図５Ｄに、データ選択最適化部１１０が、最適なデータ選択条件を生成する際に利用する最適化設定値１１４の例を示す。最適化設定値１１４は、図５Ａに示す「センサ分類」、図５Ｂに示す「固定された選択条件」、図５Ｃに示す「探索される選択条件、」図５Ｄに示す「探索パラメタ」などから構成される。

このうち図５Ａに示すセンサ分類は、モデル学習用センサ、データ選択用センサなどの項目４１１、４１２を備える。モデル学習用センサ４１１は、利用可能なセンサ２１のうち、故障予知モデルの学習に使うセンサの集合を指定したものとなる。

モデル構築部１５１は、ここで指定されたセンサ２１から取得したセンサデータを学習データに用いて、予め指定された学習アルゴリズムにより故障予知モデルを学習する。

一方、データ選択用センサ４１２は、利用可能なセンサ２１のうち、データ選択条件の生成に使うセンサの集合を指定したものとなる。モデル構築部１５１は、ここで指定されたセンサから構成されるデータ選択条件を用いて、学習データの選択を行う。モデル学習用センサ４１１とデータ選択用センサ４１２の各欄は、それぞれ最低一つ以上のセンサを設定値として備える。また、モデル学習用センサ４１１とデータ選択用センサ４１２の各欄は、重複するセンサを設定値として含んでも良い。

データ選択最適化部１１０は、２種類のデータ選択条件を組み合わせて、最終的なデータ選択条件を出力する。ひとつは、データ選択に使うセンサ２１、およびセンサ２１の値域が予め定義された「固定された選択条件」である。もう一つは、データ選択に使うセンサ２１のみ定義され、センサ２１の値域は探索を通して決定される「探索される選択条件」である。固定された選択条件および探索される選択条件で指定されたセンサは、すべてデータ選択用センサとして登録される。

図５Ｂは固定された選択条件の例を示す図である。固定された選択条件は、固定条件ＩＤ４２１、センサ４２２、センサ値条件４２３などの各値を格納する。このうち固定条件ＩＤ４２１は、固定された選択条件を一意に特定する識別子である。

また、センサ４２２は、固定された選択条件に使用されるセンサ２１を示す。センサ値条件４２３は、選択されたセンタ２１のセンサ値に対する条件式を表す。例えば、図５Ｂにおける「固定条件１」で示された条件は、「センサ３」の値が「１０より大きく、かつ、２０より小さい範囲」に制限されることを表す。ここで、変数ｘは「センサ３」の値を表す。センサ値条件４２３は、センサ値に対する値域を制限する表現であれば、どのような表現でも良い。

図５Ｃは「探索される選択条件」の例を示す図である。「探索される選択条件」は、探索条件ＩＤ４３１、センサ４３２、センサ値条件４３３、センサ値探索範囲４３４などの各値を格納する。

このうち探索条件ＩＤ４３１は、探索される選択条件を一意に特定する識別子である。

また、センサ４３２は、探索される選択条件に使われるセンサ２１を表す。また、センサ値条件４３３は、選択されたセンサ２１のセンサ値に対する条件式を表す。固定された選択条件のセンサ値条件と異なる点は、センサ値を表す変数ｘと探索されるべき変数ｚによる条件である点である。変数ｚは、データ選択最適化部１１０が最適なデータ選択条件を探索する過程で、様々な値が割り当てられる。

探索センサ値範囲４３４は、変数ｚの取りうる範囲を表す。データ選択最適化部１１０は、ここで定義された範囲で変数ｚに様々な値を割り当てる。図の例では、「探索条件１」は、「センサ５」のセンサ値が０ ≦ｚ≦１０の範囲で探索されることを表す。そして
、データ選択最適化部１１０が探索の結果、選択したセンサ値ｚ（例えば５）に対して、センサ値条件ｘ≧ｚ（ｘ≧５）が導出されることを表す。

図５Ｄは「探索パラメタ」の例を示す図である。「探索パラメタ」は、選択後に残る学習データ割合４５１、探索回数４５２などの各値を格納する。選択後に残る学習データ割合４５１は、データ選択最適化部１１０が生成する最適データ選択条件が満たすべきデータの数を規定する。

学習用センサデータに対し、データ選択を適用すると、学習用データのレコード数は、データ選択前に比べて減少する。学習用データが少なすぎると、信頼できる故障予知モデルは学習できない。そのため、データ選択最適化部１１０は、データ選択後の学習データが一定割合以上残るように、制限を加える。図の例では、すくなくとも０．２(２０%)の
学習データがデータ選択後に残る制限を意味する。こうした制限を割合の形で指定する代わりに、データ選択後に残るべき学習データのレコード数（たとえば１０００レコード）を指定してもよい。

また、探索回数４５２は、データ選択最適化部１１０が、探索される選択条件に従い、データ選択条件を探索する回数を表す。

＜機能部：データ選択最適化部＞
続いて図６に、データ選択最適化部１１０の処理の流れを示す。データ選択最適化部１１０は、センサデータ分類部１１１、データ選択条件探索部１１６、学習データ選択部１１８、学習データ評価部１２０などの機能部を備えて構成される。

このうちセンサデータ分類部１１１は、入力されたセンサデータ３１を、モデル学習用センサデータとデータ選択用センサデータに分類する。この分類は、センサ分類の設定（図５Ａ）を参照して行われる。

モデル学習用センサに属するセンサデータは、モデル学習用センサデータに、データ学習用センサに属するセンサデータは、データ選択用センサデータに分類される。センサデータ分類部１１１は、分類したモデル学習用センサデータとデータ選択用センサデータを内部のメモリに保存する。

データ選択条件探索部１１６は、最適なデータ選択条件を求めるため、複数のデータ選択条件を生成する。その中で、評価指標１２１を最大とするデータ選択条件を最適データ選択条件１１７として出力する。データ選択条件探索部１１６の具体的な処理は、図７のフローにて説明する。

学習データ選択部１１８は、データ選択条件探索部１１６が出力したデータ選択条件１１７を、データ選択用センサデータとデータモデル学習用センサデータに適用することで、モデル学習用センサデータに対してデータ選択を行う。具体的なデータ選択の処理の流れは、図８で説明する。学習データ選択部１１８は、データ選択を行った後のモデル学習用センサデータ１１９を学習データ評価部１２０へ送信する。

学習データ評価部１２０は、データ選択を行った後のモデル学習用センサデータ１１９を用いて、センサデータが学習データとして適当かどうかを評価する評価指標１２１を計算する。

評価指標１２１は、例えば下記のような指標を用いることができる。ひとつは、正規分布との類似度を測定する指標である。一般に、装置が正常動作している時は、センサデータが正規分布をなすという仮定に基づき、データ選択後のセンサデータが正規分布に近いほど、高い値を取る指標を評価指標として用いることができる。例えば、歪度や尖度といった指標を用いても良い。

あるいは、学習データに対する異常度の平均値を用いても良い。データ選択後のセンサデータを用いてモデルの学習を行う。得られたモデルを学習データに適用し、異常度を算出する。そして、学習データに対する異常度の平均値を算出する。通常、学習データに対する異常度は小さいほうが好ましいので、平均値の正負の符号を逆にした値を最終的な学習データの評価指標として利用する。学習データ評価部１２０は、計算した評価指標１２１をデータ選択条件探索部１１６へ送信する。

データ選択最適化部１１０は、データ選択条件の生成と評価のサイクルを複数回繰り返すことで、最適データ選択条件１１５を求める。

＜フロー例＞
以下、本実施形態におけるデータ選択支援方法の実際手順について図に基づき説明する。以下で説明するデータ選択支援方法に対応する各種動作は、データ選択支援装置１００がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。

図７は、本実施形態におけるデータ選択支援方法のフロー例を示す図であり、特に、データ選択条件探索部１１６のフローを示す。なお、データ選択最適化部１１０は、例えば、適宜なユーザ端末や自身で備えるＵＩ等を介してユーザからの指示を受け付けたタイミングなどで本フローを開始する。

（ステップＳ６０１）まず、データ選択条件探索部１１６は、「探索される選択条件」の探索対象センサ値の値を設定する。この場合、データ選択条件探索部１１６は、最適化設定値１１４（図５Ｃ）で指定された「探索される選択条件」の探索条件を読み込む。そして、探索条件ごとに、対象となるセンサの値ｚを探索センサ値範囲４３４の中から設定する。

例えば、探索条件が「探索条件１」、「探索条件２」から構成される場合は、「センサ５」の下限値に相当する値を５に（探索条件１）、「センサ５」の上限値に相当する値を１７に（探索条件２）設定する。データ選択条件探索部１１６は、すべての探索条件に含まれる探索センサ値の値を設定する。

なお、このステップが初めて実行される場合は、各探索センサ値の値は、探索センサ値の範囲で任意に設定する。一方、このステップが二回目以降に実行される場合は、これま
で試行した探索センサ値の組み合わせと学習データ評価部１２０が算出する評価指標１２１に基づいて、次の設定値を決定する。次の設定値の選び方は、用いるパラメタ探索アルゴリズムに依存する。

ここで、パラメタ探索アルゴリズムは、ある拘束条件に従う変数の組の中から、予め定義された目的変数を最大化する変数の組を探索するアルゴリズムを指す。例えば、ベイズ最適化や、遺伝的アルゴリズムなどを利用してもよい。

（ステップＳ６０２）次に、データ選択条件探索部１１６は、上述のステップＳ６０１で設定した探索対象センサ値に基づいて、学習データ選択条件を生成する。この場合、データ選択条件探索部１１６は、センサ値条件の変数ｚを、Ｓ６０１で設定した探索対象センサ値で置き換える。これにより、指定したセンサ（図５Ｃの場合、「センサ５」）に関するセンサ値条件が得られる。この処理を、すべての探索条件に適用する。

（ステップＳ６０３）次に、データ選択条件探索部１１６は、上述のステップＳ６０２で得られた学習データ選択条件を、「固定された選択条件」（図５Ｂ）の集合とマージし、データ選択条件を生成する。

（ステップＳ６０４）次に、データ選択条件探索部１１６は、上述のステップＳ６０３で生成したデータ選択条件を学習データ評価部１２０へ出力する。なお、データ選択条件探索部１１６は、この出力後、学習データ評価部１２０から入力を受け付けるまで待機する。

（ステップＳ６０５）次に、データ選択条件探索部１１６は、学習データ評価部１２０から評価指標１２１を受信する。データ選択条件探索部１１６は、データ選択条件に用いた探索センサ値と算出された評価指標１２１の組を内部メモリに保存する。

（ステップＳ６０６）次に、データ選択条件探索部１１６は、探索センサ値の探索が終了したかを判定する。判定の仕方は用いるパラメタ探索アルゴリズムに依存する。たとえば、予め設定した探索回数に達したか、で判定しても良い。

探索が完了したと判定した場合（Ｓ６０６：ＹＥＳ）、データ選択条件探索部１１６は、処理をステップＳ６０７へ進める。探索が完了していない場合（Ｓ６０６：ＹＥＳ）、データ選択条件探索部１１６は、ステップＳ６０１へ戻り、処理を繰り返す。

（ステップＳ６０７）探索が完了した場合、データ選択条件探索部１１６は、最適データ選択条件１１５を出力する。最適データ選択条件１１５は、これまでに試行した探索センサ値のうち、評価指標１２１が最大となるものを選択する。なお、同一のデータ選択性能指標を持つ探索センサ値が存在する場合は、いずれか一つを出力する。

最適データ選択条件１１５を出力した後、データ選択条件探索部１１６は本フローを終了する。

＜学習データ選択部の処理＞
続いて、図８に学習データ選択部１１８が実際に学習データを選択する概念例を示す。図８の例では、「センサ３」のセンサデータに関して学習データ選択を行う状況を想定している。

例えば、学習データの選択条件が「ｘ＞１０ＡＮＤｘ＜２０」と表現されている場合、学習データ選択部１１８は、センサデータ３２の「センサ３」のセンサ値が、この条
件を満たす領域、すなわち、下限値「１０」と上限値「２０」の間、を抽出する（図８におけるグラフ（a））。

次に、学習データ選択部１１８は、上述のように抽出した値域に値を持つ期間を抽出する（図８におけるグラフ(b)）。そして、学習データ選択部１１８は、モデル用センサの
センサデータから、上記で抽出した期間と同一の期間を抽出し、モデル学習に利用する（図８におけるグラフ（c））。

この一連の処理により、学習データ選択部１１８は、センサ値条件からモデル用センサの期間を得る。複数のセンサ値条件が存在する場合は、同様の処理を繰り返し、最終的な期間を得る。

図９Ａ、図９Ｂは、学習データ選択部１１８が、モデル用センサデータにデータ選択を適用する前後での、モデル用センサデータの分布の変化を表す図である。一般に、図８で説明した一連の処理によりセンサデータに対してデータ選択を適用すると、データ選択前のデータの一部が除外され、データの分布が変化する。図９Ａ、図９Ｂは、モデル用センサである、「センサ１」と「センサ２」のデータ分布を表す頻度グラフを、データ選択前とデータ選択後で比較した図である。

＜実施例２＞
続いて、以下図１０から図１３を用いて、実施例２置について説明する。図１０は、図５Ａ～５Ｄ等で説明した最適化設定値１１４に、新たに加わる設定値の例を示す図である。ここで加わる最適化設定値１１４は、対象装置、及びデータ期間に関するものとなる。

図１０Ａは、実施例２の最適化設定値１１４における対象装置の設定例を示す図である。対象装置の設定情報は、選択条件生成用装置１０１１の設定値などを格納する。選択条件生成用装置は、データ選択最適化部１１０が最適データ選択条件１１５を生成するのに利用する装置の集合である。

データ選択最適化部１１０は、ここで定義された装置集合から取得したセンサデータ３１と故障履歴３２を利用して、ひとつの最適データ選択条件１１５を出力する。図１０Ａの例では、「選択条件生成用装置」として設定されている、「装置１」、「装置２」、「装置３」の３つの装置から取得したデータを利用することになる。

なお、「選択条件生成用装置」としては、一つ以上の装置を定義していれば、何個定義する形態でも良い。また、「選択条件生成用装置」は、例えば、同一の製品種別からなる装置の集合で定義してもよい。

図１０Ｂは、実施例２の最適化設定値１１４におけるデータ期間の設定例を示す図である。データ期間の設定情報は、学習開始日１０２１、学習終了日１０２２、評価開始日１０２３、評価終了日１０２４などの設定値を格納する。

このうち学習開始日１０２１の設定値は、「選択条件生成用装置」の欄で定義した装置ごとに、故障予知モデルの学習に利用するセンサデータの開始日（利用する当該センサデータのうち最も早い計測日）を表す。同様に、学習終了日は、故障予知モデルの学習に利用するセンサデータの終了日（利用する当該センサデータのうち最も遅い計測日）を表す。

データ選択最適化部１１０は、ここで定義された学習開始日１０２１と学習終了日１０２２の各値をもとに学習データを選択し、データ選択最適化を行う。また、評価開始日１
０２３の設定値は、「選択条件生成用装置」欄で定義した装置ごとに、故障予知モデルの評価に使うセンサデータの開始日（利用する当該センサデータのうち最も早い計測日）を表す。同様に、評価終了日は、故障予知モデルの評価に利用するセンサデータの終了日（利用する当該センサデータのうち最も遅い計測日）を表す。

＜フロー：学習データ評価部＞
図１１は、実施例２における学習データ評価部１２０での処理例を示す図である。学習データ評価部１２０は、例えば、ユーザからの指示を適宜なユーザ端末やＵＩを介して受け付けたタイミングなどで本フローを開始する。

（ステップＳ１１０１）まず、学習データ評価部１２０は、最適化設定値１１４の選択条件生成用装置１０１１の設定値で指定された対象装置の情報を読み込む。そして、学習データ評価部１２０は、その対象装置のうち、ひとつの装置を選択する。はじめてこのステップが実行される場合は、任意の対象装置を選ぶ。二回目以降に実行される場合は、まだ選択されていない対象装置から選択する。

（ステップＳ１１０２）次に、学習データ評価部１２０は、センサデータ３１にラベリングを行う。ラベリングとは、センサデータ３１の各時刻を正常期間、グレー期間、異常期間、回復期間のいずれかに分類する処理である。期間ラベリングの詳細は図１２で説明する。

（ステップＳ１１０３）次に、学習データ評価部１２０は、上述のラベリングで得た期間ラベリング済みセンサデータを参照し、故障予知モデルの学習に使う学習データを選定する。学習データは、期間ラベリングで分類された正常期間中のセンサデータが選定される。

例えば、正常期間の開始日から予め設定した学習ウィンドウ幅分（例えば３か月）の期間を学習データとして選定する。

さらに、学習データ評価部１２０は、選定した学習データに基づいて、Ｓ１１０１で選択した装置のセンサデータ３１を学習データと検証データに分割する。検証データは、センサデータ３１のうち、学習データに含まれない、（観測時期が）学習データ以後のデータを指す。学習データ評価部１２０は、分割した学習データと検証データを内部メモリに保存する。

（ステップＳ１１０４）次に、学習データ評価部１２０は、ステップＳ１１０１で選択した装置に対して、故障予知モデルを学習する。学習に用いるデータは、学習データ選択部１１８がデータ選択を行ったデータのうち、ステップＳ１１０１で選択した装置に関するデータであり、ステップＳ１１０３で分割して生成された学習データである。故障予知モデルの学習の処理は、モデル構築部１５１で行う処理と同様である。

（ステップＳ１１０５）次に、学習データ評価部１２０は、ステップＳ１１０４で生成した故障予知モデルを、ステップＳ１１０３で分割して生成された検証データに適用する。モデル適用の処理は、モデル適用部１６１の処理と同様である。しかし、オンラインデータの代わりに、検証データを入力とする。

学習データ評価部１２０は、検証データに故障予知モデルを適用し、異常度を算出する。算出した異常度は、内部メモリに保存しておく。

（ステップＳ１１０６）次に、学習データ評価部１２０は、「選択条件生成用装置」に含
まれるすべての装置に関して、上述の異常度の算出が完了したかを確認する。完了している場合（Ｓ１１０６：ＹＥＳ）、学習データ評価部１２０は、ステップＳ１１０７へ進む。一方、完了していない場合（Ｓ１１０６：ＹＥＳ）、学習データ評価部１２０は、ステップＳ１１０１へ戻り、処理を繰り返す。

（ステップＳ１１０７）すべての、対象装置に対する異常度算出が完了した後、学習データ評価部１２０は、装置ごとの異常度を統合し、評価指標１２１を算出する。評価指標１２１の算出方法の詳細は図１３で説明する。学習データ評価部１２０は、算出した評価指標１２１をデータ選択条件探索部１１６へ出力し、処理を終了する。

＜期間ラベリング＞
図１２は、学習データ評価部１２０が行うデータ選択最適化の処理の中で、期間ラベリング処理の様子を表した図である。

学習データ評価部１２０は、入力されたセンサデータ３１にラベリングを行う。ラベリングとは、センサデータの各時刻を正常期間、グレー期間、異常期間、回復期間のいずれかに分類する処理である。

正常期間は、対象としている装置が正常に動作していたことが保障されている期間を指す。モデル構築部１６１は、正常期間のデータを利用して、正常モデルを学習する。異常期間は、対象とする装置が異常な振る舞いをしていたことが保証されている時期を指す。

グレー期間は、正常期間と異常期間の間に位置し、正常/異常の判断が困難な期間を指
す。突発的な故障を除けば、一般に、装置は、正常状態から異常状態へ連続的に移行する。そのため、正常と異常とはっきり判定できない期間をグレー期間とする。

回復期間は、故障が発生し、修理などを行い、装置が正常な状態に戻った期間を指す。装置の状態としては正常だが、修理等により、故障前の正常状態と異なる振る舞いをする可能性があるので、正常期間と区別して定義する。

図の例は、過去に故障した装置に対する期間ラベリングの例である。故障が発生していない装置には、異常期間が存在せず、正常期間あるいはグレー期間のみが存在する。

期間ラベリングは、各装置に対して、メンテナンス等を行った情報をもとに行っても良いし、ドメイン知識に基づくルールで決めても良い。ルールで決める場合、例えば、故障日から３か月前までを異常期間と定義し、異常期間より２か月前までをグレー期間とし、残りを正常期間とする、というルールにより、期間ラベリングを行っても良い。

＜異常度＞
図１３Ａ、図１３Ｂは、学習データ評価部１２０が算出する評価指標１２１を説明する図である。学習データ評価部１２０は、ステップＳ１１０７において、「選択条件生成用装置」に関する検証データに対し、異常度を算出している。図１３Ａは、あるひとつの装置の検証データに対する異常度を表す。

学習データ評価部１２０は、予め設定した閾値に基づいて、異常度から検知期間を抽出する。検知期間は、異常度が閾値を超えている期間である。この閾値は、利用する検知アルゴリズム、学習データに基づいて設定する。例えば、ＭＴ法による検知では閾値４を用いても良い。

図１３Ｂは、図１３Ａで示す異常度から、異常期間（斜線領域）を抽出した図を表す。
学習データ評価部１２０は、「選択条件生成用装置」ごとに、この検知期間と期間ラベリングで分類された期間の組を保持する。

ここで、期間ラベリングによる分類は、教師あり学習の識別問題における正解ラベルに、検知期間は予測ラベルに対応するが、性能指標を算出する方法は、通常の教師あり学習と下記の点において異なる。

まず、通常の識別学習では、正常/異常の２値の正解ラベルを持つ。それに対し、本発
明は、正常期、グレー期、異常期、回復期の４つのラベルを持つ。また、通常の識別問題際には、各時刻の点を独立なインスタンスとして扱い、ＰｒｅｃｉｓｉｏｎやＲｅｃａｌｌなどの性能を計算する。

それに対し本発明では、期間をベースとしたＰｒｅｃｉｓｉｏｎやＲｅｃａｌｌを用いる。それにより、時系列的な要素を考慮してモデルの性能を評価する効果がある。まず、期間をベースとしたＲｅｃａｌｌの計算方法を説明する。

「選択条件生成用装置」に関する検証データの集合（簡単のため検証データ集合と呼ぶ）に含まれる異常期間を抽出する。そして、各異常期間に対し、検知期間と照合して、Ｒｅｃａｌｌスコアを計算する。

Ｒｅｃａｌｌスコアは、ひとつの異常期間をどれだけよく検知できたかを示す指標である。例えば、異常期間と検知期間がオーバーラップしている場合は１、そうでない場合は０といった指標を用いても良い。あるいは、異常期間に対する検知期間の占める割合を指標として用いても良い。あるいは、異常期間に含まれる検知期間のうち、その開始時刻が一番早い時刻を選び、異常期間に対する検知の早さを指標として用いても良い。

検証データ集合に含まれるすべての異常期間に対して、Ｒｅｃａｌｌスコアを計算し、それらの平均値をＲｅｃａｌｌとして算出する。

次に期間をベースとしたＰｒｅｃｉｓｉｏｎの計算方法を説明する。まず、学習データ評価部１２０は、検証データ集合に含まれる検知期間を抽出する。そして、各検知期間に対し、期間ラベルと照合して、Ｐｒｅｃｉｓｉｏｎスコアを計算する。

Ｐｒｅｃｉｓｉｏｎスコアは、ひとつの検知期間がどれだけ精度良く実際の異常期間を検知できたかを示す指標である。例えば、検知期間が、少なくとも一つの異常期間とオーバーラップしていればスコア値１、そうでない場合はスコア値０とする指標を用いても良い。あるいは、検知期間に対する実際の異常期間の占める割合を指標に用いても良い。

検証データ集合に含まれるすべての異常期間に対して、Ｐｒｅｃｉｓｉｏｎスコアを計算し、それらの平均値をＰｒｅｃｉｓｉｏｎとして算出する。ただし、ここで、グレー期あるいは、回復期に含まれる検知期間は平均値の算出対象から除外する。これにより、正常/異常の判断が難しい期間や、装置の動作が不安定な期間がＰｒｅｃｉｓｉｏｎへ与え
る影響を除外する効果がある。

学習データ評価部１２０は、上記の方法で計算したＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌに基づいて、評価指標１２１を計算する。例えば、２つの値の調和平均であるＦ１値などを用いても良い。

以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。

こうした本実施形態によれば、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる好適な学習データの選択を支援可能となる。

本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の学習データ選択支援装置において、前記学習データ選択部は、前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成するものであり、前記学習用センサデータを所定の評価アルゴリズムに適用して、当該モデル学習用センサデータが学習データとして適切であるかを示す評価指標を算定する学習データ評価部を更に備える、としてもよい。

これによれば、学習データの選択をより精度良く行うことが可能となる。ひいては、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる、より好適な学習データの選択を支援可能となる。

また、本実施形態のデータ選択支援装置において、前記学習データ選択部における、前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定するデータ選択最適化部を更に備える、としてもよい。

これによれば、第二のデータ集合に関する値域を効率的に特定可能となる。ひいては、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる、より好適な学習データの選択を支援可能となる。

また、本実施形態のデータ選択支援装置において、前記学習データ評価部は、予め定めた対象装置の集合に含まれる装置それぞれに関して、センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出するものである、としてもよい。

これによれば、複数の装置に関して好適な学習データの効率的な選択が可能となる。ひいては、大規模な測定データや複雑な変化パタンを持つ測定データに基づいて、装置の予兆検知を行う場合においても、予兆検知に用いる、より好適な学習データの選択を支援可能となる。

また、本実施形態のデータ選択支援方法において、前記情報処理装置が、前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成し、前記学習用センサデータを所定の評価アルゴリズムに適用して、当該モデル学習用センサデータが学習データとして適切であるかを示す評価指標を算定する処理を更に実行する、としてもよい。

また、本実施形態のデータ選択支援方法において、前記情報処理装置が、前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定する処理を更に実行する、としてもよい。

また、本実施形態のデータ選択支援方法において、前記情報処理装置が、予め定めた対象装置の集合に含まれる装置それぞれに関して、センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出する、としてもよい。

１ネットワーク
１０装置群
１１装置
２０センサ群
２１センサ
３０データ格納装置
３１センサデータ
３２故障履歴
１００データ選択支援装置
１０１記憶部
１０２プログラム
１０３メモリ
１０４演算部
１０５通信部
１１０データ選択最適化部
１１１センサデータ分類部
１１２モデル学習用センサデータ
１１３データ選択用センサデータ
１１４最適化設定値
１１５最適データ選択条件
１１６データ選択条件探索部
１１７データ選択条件
１１８学習データ選択部
１１９選択後モデル学習用センサデータ
１２０学習データ評価部
１２１評価指標
２００モデル構築装置
１５１モデル構築部
３００故障予知装置
１６１モデル適用部

Claims

故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持する記憶部と、
前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類するデータ分類部と、
前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する学習データ選択部と、
前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する学習データ評価部と、
前記評価指標を最大化する、前記第一のデータ集合の値域を探索するデータ選択条件探索部と、
を備えることを特徴とするデータ選択支援装置。
前記学習データ選択部は、
前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成するものであり、
前記学習用センサデータを所定の評価アルゴリズムに適用して、当該学習用センサデータが学習データとして適切であるかを示す評価指標を算定する学習データ評価部を更に備える、
ことを特徴とする請求項１に記載のデータ選択支援装置。
前記学習データ選択部における、前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定するデータ選択最適化部を更に備える、
ことを特徴とする請求項２に記載のデータ選択支援装置。
前記学習データ評価部は、
予め定めた対象装置の集合に含まれる装置それぞれに関して、
センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、
前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出するものである、
ことを特徴とする請求項２に記載のデータ選択支援装置。
情報処理装置が、
故障予知対象の装置に関してセンサから取得した、時系列センサデータを保持して、
前記センサの種類に応じて予め定めた条件に基づいて、前記時系列センサデータを第一及び第二の各データ集合に、互いの重複を許容して分類する処理と、
前記第一のデータ集合の値域に基づいて、前記第二のデータ集合の部分集合を選択する処理と、
前記選択した部分集合に基づいて、故障予知モデルの学習データとしての適切さを示す評価指標を計算する処理と、
前記評価指標を最大化する、前記第一のデータ集合の値域を探索する処理と、
を実行することを特徴とするデータ選択支援方法。
前記情報処理装置が、
前記第一のデータ集合に関して予め定めた前記値域に基づき、前記第二のデータ集合に関して想定した学習データの探索範囲で、所定単位の前記部分集合を選択し、前記第一のデータ集合と前記部分集合をマージしたものを学習用センサデータとして生成し、
前記学習用センサデータを所定の評価アルゴリズムに適用して、当該学習用センサデータが学習データとして適切であるかを示す評価指標を算定する処理を更に実行する、
ことを特徴とする請求項５に記載のデータ選択支援方法。
前記情報処理装置が、
前記所定単位の前記部分集合の選択及び前記学習用センサデータの生成の実行ごとに得られる前記評価指標に基づき、前記第二のデータ集合に関する値域として最適な条件を特定する処理を更に実行する、
ことを特徴とする請求項６に記載のデータ選択支援方法。
前記情報処理装置が、
予め定めた対象装置の集合に含まれる装置それぞれに関して、
センサから得た前記時系列センサデータのうち、少なくとも、当該装置が正常状態である正常期間に対応するものを、当該装置の状態に関して得ている所定情報に基づき分類する処理と、前記時系列センサデータを、前記正常期間に対応した学習データと、前記学習データよりも計測時期が前のものである検証データに分割する処理と、前記分割で生成した学習データに基づいて前記装置に関して故障予知モデルの学習を実行する処理と、前記故障予知モデルを、前記分割で生成した検証データに適用し、異常度を算出する処理を実行し、
前記集合に含まれる全ての装置に関して前記異常度の算出が完了した場合、各装置の異常度を統合して前記評価指標を算出する、
ことを特徴とする請求項６に記載のデータ選択支援方法。