WO2018180197A1

WO2018180197A1 - データ解析装置、データ解析方法およびデータ解析プログラム

Info

Publication number: WO2018180197A1
Application number: PCT/JP2018/008007
Authority: WO
Inventors: 京子加藤
Original assignee: 日本電気株式会社
Priority date: 2017-03-28
Filing date: 2018-03-02
Publication date: 2018-10-04
Also published as: JPWO2018180197A1; CN110476158A; US11593299B2; JP6828807B2; US20200019855A1

Abstract

データ解析装置１０は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析部１１と、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部１２と、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部１３と、周波数解析部１１が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部１２によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部１４とを備える。

Description

データ解析装置、データ解析方法およびデータ解析プログラム

　本発明は、データ解析装置、データ解析方法およびデータ解析プログラムに関する。

　センサ等が取得した振動データを基に、センサ等の観測対象の機器の異常を自動的に検出する技術に対して需要が存在する。なお、振動データは、例えば時間の経過に伴って変動しているデータを指す。

　一般的に、センサが取得するデータは、長大な時系列データであることが多い。長大な時系列データの中から有用な情報を取り出し異常検出等を行うためには、統計解析や機械学習等の分野における知識が求められる。また、データに対して様々な加工処理を繰り返し実行することも求められる。

　また、振動データを解析する場合、高速フーリエ変換(FFT:Fast Fourier Transform)等で振動データを周波数解析することが有効であることが知られている。

　例えば、機器の管理者が取得された振動データを見れば、機器の状態が正常であるか異常であるかを判別できる場合が多い。よって、管理者が状態を判別する作業を検出モデルを用いて自動化する機械学習が実行されれば、機器の異常状態が自動検知される可能性がある。

　しかし、機械学習では、多くの振動データへの「正常」のラベルか「異常」のラベルの付与が求められる。すなわち、機械学習が実行される場合、コストが大きいラベル付け作業の実行が求められるという問題がある。

　また、多くの振動データに対して周波数解析が行われることによって、検出モデルの精度の向上が見込まれる。しかし、単に周波数解析が実行されるだけでは、センサが取得するデータのような長大な時系列データの中から有用な情報を取り出し、有効な解析条件を発見することは依然として困難なままである。

　特許文献１には、動画像を構成する各フレームを所定のサイズの領域毎に走査して領域毎の重要度を算出する算出部と、領域を重要度に基づいてクラスタリングすることによって少なくとも１つの領域クラスタを生成するクラスタリング部とを備える画像処理装置が記載されている。

　また、特許文献２には、学習用画像上の少なくとも一つの領域に付与された教師ラベルと領域の画像との関係を学習してモデル化する学習手段を備えるデータ処理システムが記載されている。特許文献２に記載されているデータ処理システムは、学習用画像と異なる検出用画像を入力とし、所定の画像処理が施された検出用画像および画像処理が施されていない検出用画像の中からそれぞれモデルに基づいて対象物を含む領域を検出する検出手段を備える。

　また、特許文献３には、予め正常データと異常データを分離する閾値の存在領域を絞り込むことによって、最悪な場合でも閾値が存在し得る領域に閾値を設定でき、より高信頼に異常データと正常データをクラスタリングできるプロセス異常診断装置が記載されている。

　また、特許文献４には、１または複数の摺動部材を含む機械設備の異常の有無を診断する際の演算処理の負担を軽減し、診断作業の迅速化および信頼性の向上を実現できる評価方法が記載されている。特許文献４に記載されている評価方法は、機械設備から発生した音または振動から実測周波数スペクトルデータを生成する。

　特許文献２に記載されている技術が使用されると、コストが大きいラベル付け作業が効率的に実行される。また、特許文献１、特許文献３～特許文献４に記載されている技術が使用されると、センサが取得するデータのような長大な時系列データの中から有用な情報が取り出され、かつ有効な解析条件も発見される。

特開２０１６－２１９８７９号公報特開２０１６－０６２５２４号公報特許第４７６２０８８号公報特許第４００３０８６号公報

　しかし、特許文献２には、学習用画像へのラベル付与の手間を削減することは記載されているが、学習処理を工夫することによって生成されるモデルの精度を向上させることは記載されていない。同様に、特許文献１、特許文献３～特許文献４にも、学習処理を工夫することによって生成されるモデルの精度を向上させることは記載されていない。

［発明の目的］
　そこで、本発明は、上述した課題を解決する、学習処理で生成されるモデルの精度を向上させることができるデータ解析装置、データ解析方法およびデータ解析プログラムを提供することを目的とする。

　本発明によるデータ解析装置は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析部と、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部と、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部と、周波数解析部が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部とを備えることを特徴とする。

　本発明によるデータ解析方法は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析し、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングし、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出し、複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択することを特徴とする。

　本発明によるデータ解析プログラムは、コンピュータに、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析処理、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析処理、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出処理、および複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択処理を実行させることを特徴とする。

　本発明によれば、学習処理で生成されるモデルの精度を向上させることができる。

本発明によるデータ解析装置の第１の実施形態の構成例を示すブロック図である。第１の実施形態のデータ解析装置１０による解析処理の動作を示すフローチャートである。本発明による振動データ解析装置の第２の実施形態の構成例を示すブロック図である。学習用周波数解析部１２１による時間周波数解析処理の例を示す説明図である。距離算出部１２４による距離算出処理の例を示す説明図である。学習用行列変換部１２５による行列変換処理の例を示す説明図である。第２の実施形態の振動データ解析装置１００による学習処理の動作を示すフローチャートである。第２の実施形態の振動データ解析装置１００による判定処理の動作を示すフローチャートである。本発明による振動データ解析装置の第３の実施形態の構成例を示すブロック図である。第３の実施形態の振動データ解析装置１０１による学習処理の動作を示すフローチャートである。

実施形態１．
　以下、本発明の実施形態を、図面を参照して説明する。図１は、本発明によるデータ解析装置の第１の実施形態の構成例を示すブロック図である。本発明によるデータ解析装置１０は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析部１１（例えば、学習用周波数解析部１２１）と、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部１２（例えば、クラスタリング処理部１２２）と、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部１３（例えば、不正率算出部１２８）と、周波数解析部１１が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部１２によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部１４（例えば、最良条件選択部１２３）とを備える。

　以下、データ解析装置１０による解析処理を説明する。図２は、第１の実施形態のデータ解析装置１０による解析処理の動作を示すフローチャートである。

　最初に、周波数解析部１１は、指定された条件のうち未だ周波数解析が行われていない所定の条件を取り出す。すなわち、条件ループに入る（ステップS11 ）。

　周波数解析部１１は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する（ステップS12 ）。

　次いで、クラスタ分析部１２は、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングする（ステップS13 ）。

　次いで、算出部１３は、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する（ステップS14 ）。

　データ解析装置１０は、指定された条件の中で周波数解析が行われていない条件が存在する間、ステップS12 ～ステップS14 の処理を繰り返し実行する。ステップS12 ～ステップS14 の処理は条件ごとに、指定された条件の数だけ繰り返し実行される。

　指定された周波数解析の全ての条件で周波数解析が行われた時、データ解析装置１０は、条件ループを抜ける（ステップS15 ）。

　次いで、選択部１４は、算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部１２によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する（ステップS16 ）。選択した後、データ解析装置１０は、解析処理を終了する。

　そのような構成により、データ解析装置は、学習処理で生成されるモデルの精度を向上させることができる。

　また、データ解析装置１０は、選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する学習部（例えば、学習部１２７）を備えてもよい。

　そのような構成により、データ解析装置は、より精度が高いモデルを学習処理で生成できる。

　また、データ解析装置１０は、選択されたクラスタリングモデルに対応する条件を記憶する記憶部（例えば、条件記憶部１３０）を備えてもよい。

　そのような構成により、データ解析装置は、最適な周波数解析の条件を管理できる。

　また、データ解析装置１０は、判定用データが所定のクラスのデータであるか否かを判定する判定部（例えば、判定部１６３）を備え、周波数解析部１１は、判定用データを記憶部に記憶されている条件で周波数解析し、判定部は、周波数解析された判定用データが所定のクラスのデータであるか否かを学習部によって生成された所定のクラスのデータ判定用のモデルを用いて判定してもよい。

　そのような構成により、データ解析装置は、精度の高いモデルを用いて判定用データの種類を判定できる。

　また、学習部は、周波数解析された学習用データが行列変換されたデータを使用して学習処理を行ってもよい。

　そのような構成により、データ解析装置は、学習処理のアルゴリズムに適したデータを生成できる。

　また、学習処理は、ディープラーニングのアルゴリズムに従って行われてもよい。

実施形態２．
［構成の説明］
　次に、本発明の第２の実施形態を、図面を参照して説明する。図３は、本発明による振動データ解析装置の第２の実施形態の構成例を示すブロック図である。

　本実施形態の振動データ解析装置は、振動データセットを時間で周波数解析することによってスペクトログラムを取得する。次いで、振動データ解析装置は、取得されたスペクトログラムを用いて機械学習を行うことによって異常検出モデルを生成する。

　具体的には、本実施形態の振動データ解析装置は、時間以外にも解析対象範囲や周波数等の様々な条件を用いて、振動データセットに対して網羅的に周波数解析を行う。振動データ解析装置は、各条件で周波数解析を行った後、周波数解析されたデータセットを２つにクラスタリングする。

　次いで、振動データ解析装置は、クラスタリングの最良な結果に基づいて、スペクトログラムに「正常」のラベル、または「異常」のラベルを付与する。上記の方法を用いることによって、本実施形態の振動データ解析装置は、ラベル付け作業を効率的に行いつつ、高精度の異常検出モデルを生成できる。

　図３に示すように、振動データ解析装置１００は、学習用振動データ記憶部１１０と、振動データ学習部１２０と、条件記憶部１３０と、モデル記憶部１４０と、判定用振動データ記憶部１５０と、振動データ判定部１６０とを含む。

　振動データ解析装置１００は、振動データを解析する装置である。振動データ解析装置１００は、例えばパーソナルコンピュータ（ＰＣ）である。また、振動データ解析装置１００は、サーバやスマートフォン等でもよい。

　また、振動データ解析装置１００は、１つの端末で実現されてもよいし、複数の端末で実現されてもよい。例えば、振動データ学習部１２０と振動データ判定部１６０が同一端末に含まれていてもよいし、それぞれ別の端末に含まれていてもよい。

　学習用振動データ記憶部１１０は、機械学習に用いられる時系列データである振動データ群（時系列データセット）を記憶する機能を有する。例えば、学習用振動データ記憶部１１０は、対象データごとにCSV(Comma-Separated Values) ファイル形式で数値を含む時系列データを記憶する。なお、学習用振動データ記憶部１１０は、一般的な記憶装置である。

　図３に示すように、振動データ学習部１２０は、学習用周波数解析部１２１と、クラスタリング処理部１２２と、最良条件選択部１２３と、学習用行列変換部１２５と、ラベル付与部１２６と、学習部１２７とを有する。

　振動データ学習部１２０は、学習用振動データ記憶部１１０に保持されている学習用振動データを時間周波数解析する。次いで、振動データ学習部１２０は、時間周波数解析されたデータ（以下、時間周波数解析データという。）を用いて教師あり機械学習を行い、異常検出モデルを生成する。

　学習用周波数解析部１２１は、予め用意された条件群を基に時系列データセット（学習用振動データセット）を時間周波数解析することによって、時間周波数解析データを生成する機能を有する。

　周波数解析の条件は、例えば解析対象範囲、時間条件、および周波数条件の組合せである。解析対象範囲は、時間で解析対象の範囲が抽出されるための条件である。解析対象範囲は、学習用振動データにおける解析される時間範囲を指定する。

　例えば、解析対象範囲として「時間０～時間２」や「時間１０～時間３０」が指定される。なお、解析対象範囲は、予めユーザやシステムによって定義される。

　時間条件は、解析対象範囲で指定された範囲が解析される際の時間軸の条件である。例えば、時間条件は、４分割や８分割等の時間軸の区間分割数を示す。なお、時間条件は、予めユーザやシステムによって定義される。

　周波数条件は、解析対象範囲で指定された範囲が解析される際の周波数軸の条件である。例えば、周波数条件は、４帯域、８帯域、または１２帯域等の帯域数や帯域幅を示す。すなわち、周波数条件は、周波数軸の区間分割数を示す。なお、周波数条件は、予めユーザやシステムによって定義される。

　図４は、学習用周波数解析部１２１による時間周波数解析処理の例を示す説明図である。図４（ａ）は、処理対象の学習用振動データを示す。図４（ａ）に示す点線の矩形内が、解析対象範囲で指定された範囲である。

　学習用周波数解析部１２１は、例えば解析対象範囲で指定された範囲のデータに対して、時間条件が示す区間分割数で区切られた単位ごとに高速フーリエ変換を行う。次いで、学習用周波数解析部１２１は、高速フーリエ変換で出力された値を基にパワー積算値を算出し、パワーベクトルを生成する。

　図４（ｂ）は、学習用周波数解析部１２１が生成した時間周波数解析データが表示されたグラフを示す。横軸のP_ij は、区間i 、周波数帯f_jにおけるパワースペクトルを意味する。縦軸は、パワースペクトルの値（パワー）である。なお、時間周波数解析の他の条件は、図４（ｂ）の例に示す通りである。

　図４（ｃ）は、学習用周波数解析部１２１が生成したパワーベクトルを示す。T_iは、区間i における時間窓長を意味する。図４（ｃ）に示すように、パワーベクトルは、パワースペクトルで構成される。

　クラスタリング処理部１２２は、時間周波数解析データを基に、周波数解析の条件ごとに学習用振動データセットを正常データと異常データの２つにクラスタリングする機能を有する。

　クラスタリング処理部１２２が用いるクラスタリングの方式は、例えばk-means 法である。なお、クラスタリング処理部１２２は、k-means 法以外の方式でクラスタリングを行ってもよい。

　最良条件選択部１２３は、各クラスタの中心間の距離が最大になるクラスタリングモデルを最良モデルとして選択する機能を有する。最良条件選択部１２３は、選択されたクラスタリングモデルに対応する周波数解析の条件である最良条件を、条件記憶部１３０に保存する。

　最良条件選択部１２３は、距離算出部１２４を有する。距離算出部１２４は、各クラスタの中心間の距離を算出する機能を有する。距離算出部１２４は、距離として例えばユークリッド距離を算出する。なお、距離算出部１２４は、ユークリッド距離以外の距離を算出してもよい。

　図５は、距離算出部１２４による距離算出処理の例を示す説明図である。図５（ａ）は、処理対象の学習用振動データを示す。処理対象の学習用振動データは、D₁～D₂₀の２０個である。また、図５（ｂ）は、学習用周波数解析部１２１による時間周波数解析結果である。

　図５（ｃ）は、クラスタリング処理部１２２によるクラスタリングモデルの生成結果である。例えば、図５（ｃ）の「第１条件：クラスタリング結果」は、図５（ｂ）に示す第１条件における時間周波数解析結果をクラスタリング処理部１２２が白丸で表されるデータと黒丸で表されるデータにクラスタリングした結果である。

　クラスタリング処理部１２２によるクラスタリング結果を基に、距離算出部１２４は、各クラスタの中心間の距離を算出する。図５（ｃ）に示すように、第１条件よりも第２条件の方がクラスタ間の距離が大きい。すなわち、第２条件の方がより好ましい条件である。

　学習用行列変換部１２５は、時間周波数解析データを学習アルゴリズムに適した形式に行列変換する機能を有する。例えば、学習部１２７が学習アルゴリズムとして畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を使用する場合、学習用行列変換部１２５は、時間周波数解析データを画像に変換する。

　図６は、学習用行列変換部１２５による行列変換処理の例を示す説明図である。図６に示す例では、学習用行列変換部１２５は、パワーベクトルをグレースケールのスペクトログラム画像に変換している。なお、L_ijは、P_ijが行列変換された値（輝度値）である。

　なお、図６にはパワーベクトルがグレースケール画像に変換される例が示されているが、学習用行列変換部１２５は、パワーベクトルをカラー画像に変換してもよい。

　ラベル付与部１２６は、行列変換された後の時間周波数解析データに「正常」のラベル、または「異常」のラベルを付与する機能を有する。

　学習用振動データセットには、通常異常データの方が正常データよりも少なく含まれている場合が多い。よって、「正常」のラベル、または「異常」のラベルを付与する際、ラベル付与部１２６は、要素が少ない方のクラスタに属するデータに「異常」のラベルを、要素が多い方のクラスタに属するデータに「正常」のラベルを付与してもよい。

　なお、ラベル付け自体は、手動で行われてもよい。手動でラベルが付与される場合、例えばクラスタの中心に位置するデータ等の代表的なデータのみが目視で確認された上で、「正常」のラベル、または「異常」のラベルがデータに付与される。

　学習部１２７は、ラベルが付与された行列変換された後の時間周波数解析データを用いて教師あり機械学習を行う機能を有する。教師あり機械学習を行うことによって、学習部１２７は、異常検出モデルを生成する。

　学習部１２７が行う教師あり機械学習の学習アルゴリズムは、例えば畳み込みニューラルネットワーク(CNN) 等のディープラーニングのアルゴリズムである。しかし、学習アルゴリズムは、ディープラーニングのアルゴリズム以外のアルゴリズムでもよい。

　条件記憶部１３０は、振動データ学習部１２０の最良条件選択部１２３が選択した時間周波数解析の最良条件を保持する機能を有する。なお、条件記憶部１３０は、学習用振動データ記憶部１１０と同様に、一般的な記憶装置である。

　モデル記憶部１４０は、振動データ学習部１２０が生成した学習済みの異常検出モデルを保持する機能を有する。なお、モデル記憶部１４０は、学習用振動データ記憶部１１０と同様に、一般的な記憶装置である。

　判定用振動データ記憶部１５０は、判定対象の振動データ群を記憶する機能を有する。なお、判定用振動データ記憶部１５０は、学習用振動データ記憶部１１０と同様に、一般的な記憶装置である。

　図３に示すように、振動データ判定部１６０は、判定用周波数解析部１６１と、判定用行列変換部１６２と、判定部１６３とを有する。

　振動データ判定部１６０は、判定用振動データ記憶部１５０に保持されている判定用振動データに対して時間周波数解析と行列変換を行う。次いで、振動データ判定部１６０は、行列変換された後の時間周波数解析データを異常検出モデルに入力することによって、判定用振動データが正常なデータであるか異常なデータであるかを判定する。

　判定用周波数解析部１６１は、学習用周波数解析部１２１と同様の機能を有する。判定用周波数解析部１６１は、条件記憶部１３０に記憶されている条件を取得し、時間周波数解析の条件として用いる。

　判定用行列変換部１６２は、学習用行列変換部１２５と同様の機能を有する。

　判定部１６３は、モデル記憶部１４０から取得した異常検出モデルに行列変換された後の時間周波数解析データを入力することによって、判定対象の判定用振動データが正常なデータであるか異常なデータであるかを判定する機能を有する。

［動作の説明］
　以下、本実施形態の振動データ解析装置１００の動作を図７～図８を参照して説明する。振動データ解析装置１００の動作は、学習フェーズでの動作と判定フェーズでの動作の２つに分類される。

　学習フェーズでは、振動データ解析装置１００は、学習対象の振動データと正常データおよび異常データとの関係性を学習することによって、異常検出モデルを生成する。また、判定フェーズでは、振動データ解析装置１００は、異常検出モデルに判定対象の振動データを入力することによって、判定対象の振動データが正常なデータであるか異常なデータであるかを判定する。

　最初に、本実施形態の振動データ解析装置１００の学習フェーズでの動作を図７を参照して説明する。図７は、第２の実施形態の振動データ解析装置１００による学習処理の動作を示すフローチャートである。

　最初に、振動データ学習部１２０は、学習用振動データ記憶部１１０から、学習に用いられる学習用振動データセットを取得する。振動データ学習部１２０は、取得された学習用振動データセットを読み込む（ステップS101）。

　次いで、振動データ学習部１２０は、指定された周波数解析の条件の組合せのうち、未だ周波数解析が行われていない条件の組合せを取り出す。すなわち、条件ループに入る（ステップS102）。

　次いで、振動データ学習部１２０は、読み込まれた学習用振動データセットのうち、未だ周波数解析が行われていない学習用振動データを取り出す。すなわち、周波数解析ループに入る（ステップS103）。

　振動データ学習部１２０の学習用周波数解析部１２１は、対象の学習用振動データを取り出された条件で時間周波数解析することによって、パワーベクトル等の時間周波数解析データを生成する（ステップS104）。なお、取り出された条件は、上述した解析対象範囲、時間条件、周波数条件等の組合せである。

　学習用周波数解析部１２１は、読み込まれた学習用振動データセットの中で時間周波数解析されていない学習用振動データが存在する間、ステップS104の処理を繰り返し実行する。ステップS104の処理は学習用振動データごとに、ステップS101で取得された学習用振動データの数だけ繰り返し実行される。

　取得された学習用振動データが全て時間周波数解析された時、学習用周波数解析部１２１は、周波数解析ループを抜ける（ステップS105）。

　次いで、振動データ学習部１２０のクラスタリング処理部１２２は、条件ごとに時間周波数解析データセットを２つにクラスタリングする（ステップS106）。

　次いで、振動データ学習部１２０の最良条件選択部１２３の距離算出部１２４は、各クラスタの中心間の距離L を算出する（ステップS107）。

　次いで、最良条件選択部１２３は、ステップS107で算出された距離L が最大値(max(L))よりも大きい場合、最大値を距離L に更新する(max(L) = L)。また、最良条件選択部１２３は、最良条件（解析対象範囲、時間条件、周波数条件）を、距離L が算出されたクラスタリング結果の条件に更新する（ステップS108）。

　振動データ学習部１２０は、指定された周波数解析の条件の組合せの中で時間周波数解析が行われていない条件の組合せが存在する間、ステップS103～ステップS108の処理を繰り返し実行する。ステップS103～ステップS108の処理は条件の組合せごとに、指定された周波数解析の条件の組合せの数だけ繰り返し実行される。

　指定された周波数解析の条件の全ての組合せで時間周波数解析が行われた時、学習用周波数解析部１２１は、条件ループを抜ける（ステップS109）。

　次いで、最良条件選択部１２３は、距離の最大値max(L)と予め設定された閾値d とを比較し、max(L)がd よりも小さいか否かを確認する（ステップS110）。なお、閾値d は、予め設定されていなくてもよい。

　max(L)がd よりも小さい場合（ステップS110におけるTrue）、最良条件選択部１２３は、クラスタリング失敗とみなす（ステップS111）。振動データ解析装置１００は、学習処理を終了する。

　max(L)がd 以上である場合（ステップS110におけるFalse ）、最良条件選択部１２３は、最良条件（解析対象範囲、時間条件、周波数条件）を条件記憶部１３０に保存する（ステップS112）。

　次いで、振動データ学習部１２０は、保存された最良条件での時間周波数解析データセットのうち、未だラベル付けされていない時間周波数解析データを取り出す。すなわち、ラベル付けループに入る（ステップS113）。

　振動データ学習部１２０の学習用行列変換部１２５は、対象の最良条件での時間周波数解析データを学習アルゴリズムに適した形式に行列変換する（ステップS114）。

　次いで、振動データ学習部１２０のラベル付与部１２６は、最良条件に対応するクラスタリングモデル（クラスタリング結果）を用いて、行列変換されたデータを分類する。次いで、ラベル付与部１２６は、分類されたデータに「正常」のラベル、または「異常」のラベルを付与する（ステップS115）。

　振動データ学習部１２０は、時間周波数解析データセットの中でラベル付けされていない時間周波数解析データが存在する間、ステップS114～ステップS115の処理を繰り返し実行する。ステップS114～ステップS115の処理は時間周波数解析データごとに、ステップS101で取得された学習用振動データの数だけ繰り返し実行される。

　全ての時間周波数解析データに対してラベルが付与された時、振動データ学習部１２０は、ラベル付けループを抜ける（ステップS116）。

　次いで、学習部１２７は、ステップS115でラベルが付与された学習用振動データセット（行列変換された後の時間周波数解析データセット）を用いて、教師あり機械学習を行う（ステップS117）。教師あり機械学習を行うことによって、学習部１２７は、異常検出モデルを生成する。

　次いで、学習部１２７は、ステップS117で生成された異常検出モデルをモデル記憶部１４０に保存する（ステップS118）。保存した後、振動データ解析装置１００は、学習処理を終了する。

　なお、上記の例では、学習部１２７は、クラスタ間の距離が最大のクラスタリングモデルを自動的に最良モデルとして採用している。しかし、最良条件選択部１２３が距離が大きい順にクラスタリングモデル候補を学習用行列変換部１２５に入力し、学習部１２７が複数のモデルの中から最良なモデルを選択してもよい。

　次いで、本実施形態の振動データ解析装置１００の判定フェーズでの動作を図８を参照して説明する。図８は、第２の実施形態の振動データ解析装置１００による判定処理の動作を示すフローチャートである。

　最初に、振動データ判定部１６０は、モデル記憶部１４０から学習部１２７により生成された異常検出モデルを読み込む（ステップS121）。

　次いで、振動データ判定部１６０は、判定用振動データ記憶部１５０から、判定用振動データセットを取得する。振動データ判定部１６０は、取得された判定用振動データセットを読み込む（ステップS122）。

　次いで、振動データ判定部１６０は、条件記憶部１３０から最良条件選択部１２３により選択された最良条件を読み込む（ステップS123）。

　次いで、振動データ判定部１６０は、読み込まれた判定用振動データセットのうち、未だ判定されていない判定用振動データを取り出す。すなわち、判定ループに入る（ステップS124）。

　振動データ判定部１６０の判定用周波数解析部１６１は、対象の判定用振動データをステップS123で読み込まれた最良条件（解析対象範囲、時間条件、周波数条件）で時間周波数解析することによって、パワーベクトル等の時間周波数解析データを生成する（ステップS125）。なお、時間周波数解析処理は、学習フェーズのステップS104の処理と同様である。

　次いで、振動データ判定部１６０の判定用行列変換部１６２は、時間周波数解析データを行列変換する（ステップS126）。なお、行列変換処理は、学習フェーズのステップS114の処理と同様である。

　次いで、振動データ判定部１６０の判定部１６３は、ステップS121で読み込まれた異常検出モデルにステップS126で行列変換された時間周波数解析データを入力することによって、対象の判定用振動データが正常なデータであるか、異常なデータであるかを判定する（ステップS127）。

　振動データ判定部１６０は、判定用振動データセットの中で判定されていない判定用振動データが存在する間、ステップS125～ステップS127の処理を繰り返し実行する。ステップS125～ステップS127の処理は判定用振動データごとに、ステップS122で取得された判定用振動データの数だけ繰り返し実行される。

　全ての判定用振動データが判定された時、振動データ判定部１６０は、判定ループを抜ける（ステップS128）。判定ループを抜けた後、振動データ解析装置１００は、判定処理を終了する。以上の処理により、振動データ解析装置１００は、振動データが正常なデータであるか、異常なデータであるかを判定できる。

［効果の説明］
　本実施形態の振動データ学習部１２０の学習用周波数解析部１２１は、時系列データの集合である振動データセットを様々な条件（解析対象範囲、周波数、時間等）で周波数解析する。

　クラスタリング処理部１２２は、条件ごとに、周波数解析データを基に各学習用振動データを２つにクラスタリングする。次いで、最良条件選択部１２３は、最良なクラスタリングモデルを選択する。

　次いで、学習用行列変換部１２５は、学習アルゴリズムに合わせて周波数解析データを行列変換する。次いで、ラベル付与部１２６は、選択された最良なクラスタリングモデルを用いて、行列変換された周波数解析データに「正常」のラベル、または「異常」のラベルを付与する。

　次いで、学習部１２７は、ラベルが付与されたデータを用いて機械学習を行い、異常検出モデルを生成する。以上の構成により、本実施形態の振動データ学習部１２０は、ラベル付け作業を効率的に実行できる。すなわち、ラベル付けに掛かる工数が削減される。

　また、学習部１２７が正常なデータであるか異常なデータであるかの判断要素として、解析対象範囲、時間、および周波数等の組合せに従って抽出された特徴的な部分を学習するため、生成される異常検出モデルの精度が向上する。

　また、本実施形態の振動データ判定部１６０は、異常な振動データを検出できる。さらに、学習部１２７がディープラーニングが用いられる教師あり学習を行うことによって、判定部１６３は、クラスタリングだけが実行される場合よりも細かな特徴を掴んだ上で判定用振動データを判定できる。

実施形態３．
［構成の説明］
　次に、本発明の第３の実施形態を、図面を参照して説明する。図９は、本発明による振動データ解析装置の第３の実施形態の構成例を示すブロック図である。

　本実施形態の振動データ解析装置１０１の構成は、最良条件選択部１２３が距離算出部１２４の代わりに不正率算出部１２８を有する点以外、第２の実施形態の振動データ解析装置１００の構成と同様である。

　本実施形態の学習用振動データ記憶部１１０に保存されている学習用振動データセットの中には、予め「正常」のラベル、または「異常」のラベルが付与されている振動データが含まれている。振動データ学習部１２０は、ラベルが付与されている学習用振動データを抽出する。

　本実施形態の不正率算出部１２８は、同一ラベルが付与されたデータが同一クラスタにグルーピングされていない度合いを示す不正率を算出する。本実施形態の最良条件選択部１２３は、クラスタ間の距離が最大になる条件の組合せではなく、算出された不正率が最低になる条件の組合せを最良の条件として選択する。

　例えば、「正常」のラベルが付与された振動データがＭ個、「異常」のラベルが付与された振動データがＮ個それぞれ抽出された場合を考える。「正常」の振動データが全て同一クラスタに存在し、「異常」の振動データが全て「正常」の振動データが存在するクラスタとは別のクラスタに存在する場合、不正率算出部１２８は、不正率を「０」と算出する。

　また、「正常」の振動データがｍ個、「異常」の振動データがｎ個それぞれ想定されたクラスタとは異なるクラスタにグルーピングされた場合、不正率算出部１２８は、例えば不正率を「（ｍ／Ｍ）＋（ｎ／Ｎ）」と算出する。なお、不正率算出部１２８は、同一ラベルが付与されたデータが同一クラスタにグルーピングされていない度合いを示すのであれば不正率をどのような方法で算出してもよい。

　なお、本実施形態の最良条件選択部１２３は、算出された不正率が閾値d よりも大きい場合にクラスタリングが失敗したと判断してもよい。

［動作の説明］
　以下、本実施形態の振動データ解析装置１０１の学習フェーズでの動作を図１０を参照して説明する。図１０は、第３の実施形態の振動データ解析装置１０１による学習処理の動作を示すフローチャートである。

　なお、本実施形態の振動データ解析装置１０１の判定フェーズでの動作は、図８に示す判定処理の動作と同様である。

　最初に、振動データ学習部１２０は、学習用振動データ記憶部１１０から、学習に用いられるラベルが付与された学習用振動データセットを取得する。振動データ学習部１２０は、取得された学習用振動データセットを読み込む（ステップS201）。

　ステップS202～ステップS206の処理は、図７に示すステップS102～ステップS106の処理と同様である。

　次いで、振動データ学習部１２０の最良条件選択部１２３の不正率算出部１２８は、クラスタリング結果の不正率W を算出する（ステップS207）。

　次いで、最良条件選択部１２３は、ステップS207で算出された不正率W が最小値(min(W))よりも小さい場合、最小値を不正率W に更新する(min(W) = W)。また、最良条件選択部１２３は、最良条件（解析対象範囲、時間条件、周波数条件）を、不正率W が算出されたクラスタリング結果の条件に更新する（ステップS208）。

　ステップS209の処理は、図７に示すステップS109の処理と同様である。

　次いで、最良条件選択部１２３は、不正率の最小値min(W)と予め設定された閾値d とを比較し、min(W)がd よりも大きいか否かを確認する（ステップS210）。なお、閾値d は、予め設定されていなくてもよい。

　min(W)がd よりも大きい場合（ステップS210におけるTrue）、最良条件選択部１２３は、クラスタリング失敗とみなす（ステップS211）。振動データ解析装置１００は、学習処理を終了する。

　min(W)がd 以下である場合（ステップS210におけるFalse ）、最良条件選択部１２３は、最良条件（解析対象範囲、時間条件、周波数条件）を条件記憶部１３０に保存する（ステップS212）。

　ステップS213～ステップS218の処理は、図７に示すステップS113～ステップS118の処理と同様である。

［効果の説明］
　本実施形態の振動データ解析装置１０１は、クラスタリング処理部１２２が事前に正しいラベルが付与された振動データを用いてクラスタリングを行い、最良条件選択部１２３がクラスタリング結果を基に最良条件を選択するため、生成される異常検出モデルの精度を向上させることができる。

　各実施形態の振動データ解析装置は、工作機械の故障検知の分野等で好適に利用されることが期待される。

　なお、各実施形態のデータ解析装置１０、振動データ解析装置１００、および振動データ解析装置１０１は、例えば、非一時的な記憶媒体に格納されているプログラムに従って処理を実行するCPU(Central Processing Unit)によって実現されてもよい。すなわち、周波数解析部１１、クラスタ分析部１２、算出部１３、選択部１４、学習用周波数解析部１２１、クラスタリング処理部１２２、最良条件選択部１２３、学習用行列変換部１２５、ラベル付与部１２６、学習部１２７、判定用周波数解析部１６１、判定用行列変換部１６２、および判定部１６３は、例えば、プログラム制御に従って処理を実行するCPU によって実現されてもよい。

　また、学習用振動データ記憶部１１０、条件記憶部１３０、モデル記憶部１４０、および判定用振動データ記憶部１５０は、例えばRAM(Random Access Memory) で実現されてもよい。

　また、各実施形態のデータ解析装置１０、振動データ解析装置１００、および振動データ解析装置１０１における各部は、ハードウェア回路によって実現されてもよい。一例として、周波数解析部１１、クラスタ分析部１２、算出部１３、選択部１４、学習用振動データ記憶部１１０、学習用周波数解析部１２１、クラスタリング処理部１２２、最良条件選択部１２３、学習用行列変換部１２５、ラベル付与部１２６、学習部１２７、条件記憶部１３０、モデル記憶部１４０、判定用振動データ記憶部１５０、判定用周波数解析部１６１、判定用行列変換部１６２、および判定部１６３が、それぞれLSI(Large Scale Integration)で実現される。また、それらが１つのLSI で実現されていてもよい。

　以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１７年３月２８日に出願された日本特許出願２０１７－０６２１１９を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１０　データ解析装置
１００、１０１　振動データ解析装置
１１　周波数解析部
１２　クラスタ分析部
１３　算出部
１４　選択部
１１０　学習用振動データ記憶部
１２０　振動データ学習部
１２１　学習用周波数解析部
１２２　クラスタリング処理部
１２３　最良条件選択部
１２４　距離算出部
１２５　学習用行列変換部
１２６　ラベル付与部
１２７　学習部
１２８　不正率算出部
１３０　条件記憶部
１４０　モデル記憶部
１５０　判定用振動データ記憶部
１６０　振動データ判定部
１６１　判定用周波数解析部
１６２　判定用行列変換部
１６３　判定部

Claims

　データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを前記学習用データごとに所定の条件で周波数解析する周波数解析部と、
　周波数解析された学習用データを前記周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部と、
　各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部と、
　前記周波数解析部が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時の前記クラスタ分析部によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部とを備える
　ことを特徴とするデータ解析装置。
　選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する学習部を備える
　請求項１記載のデータ解析装置。
　選択されたクラスタリングモデルに対応する条件を記憶する記憶部を備える
　請求項２記載のデータ解析装置。
　判定用データが所定のクラスのデータであるか否かを判定する判定部を備え、
　周波数解析部は、判定用データを記憶部に記憶されている条件で周波数解析し、
　前記判定部は、周波数解析された判定用データが所定のクラスのデータであるか否かを学習部によって生成された所定のクラスのデータ判定用のモデルを用いて判定する
　請求項３記載のデータ解析装置。
　学習部は、周波数解析された学習用データが行列変換されたデータを使用して学習処理を行う
　請求項２から請求項４のうちのいずれか１項に記載のデータ解析装置。
　学習処理は、ディープラーニングのアルゴリズムに従って行われる
　請求項１から請求項５のうちのいずれか１項に記載のデータ解析装置。
　データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを前記学習用データごとに所定の条件で周波数解析し、
　周波数解析された学習用データを前記周波数解析された学習用データのクラスの数にクラスタリングし、
　各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出し、
　複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する
　ことを特徴とするデータ解析方法。
　選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する
　請求項７記載のデータ解析方法。
　コンピュータに、
　データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを前記学習用データごとに所定の条件で周波数解析する周波数解析処理、
　周波数解析された学習用データを前記周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析処理、
　各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出処理、および
　複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択処理
　を実行させるためのデータ解析プログラム。
　コンピュータに、
　選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する生成処理を実行させる
　請求項９記載のデータ解析プログラム。