JP7398641B2 - 評価装置、評価方法及びプログラム - Google Patents

評価装置、評価方法及びプログラム Download PDF

Info

Publication number
JP7398641B2
JP7398641B2 JP2020569452A JP2020569452A JP7398641B2 JP 7398641 B2 JP7398641 B2 JP 7398641B2 JP 2020569452 A JP2020569452 A JP 2020569452A JP 2020569452 A JP2020569452 A JP 2020569452A JP 7398641 B2 JP7398641 B2 JP 7398641B2
Authority
JP
Japan
Prior art keywords
group
data
unit
groups
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020569452A
Other languages
English (en)
Other versions
JPWO2020158266A1 (ja
Inventor
三資 農添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of JPWO2020158266A1 publication Critical patent/JPWO2020158266A1/ja
Application granted granted Critical
Publication of JP7398641B2 publication Critical patent/JP7398641B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、評価装置、評価方法及びプログラムに関し、特にマハラノビス距離を用いた評価装置、評価方法及びプログラムに関する。
マハラノビス距離を利用したパターン認識における異常原因診断方法が提案されている(例えば、特許文献1)。特許文献1に記載された発明では、マハラノビス距離を求めた後、i番目の要素について距離要素値と他の要素に対する相関係数との積の絶対値を計算し、その計算結果の中から、要素ごとの最大値を抽出する。
特開2005-267474号公報
しかしながら、特許文献1に開示されている技術では、マハラノビス距離の計算を行うためには、データ項目となる特徴量の数に応じた逆行列計算等が必要になるため、計算時間がかかるという問題がある。このため、マハラノビス距離を利用した異常原因診断を行う場合にも計算時間がかかることになる。
本開示は、上述の事情を鑑みてなされたもので、マハラノビス距離の計算量を削減し、計算時間を短縮することができる評価装置等を提供することを目的とする。
上記課題を解決するために、本開示の一形態に係る評価装置は、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価装置であって、プロセッサと、メモリと、を備え、前記プロセッサは、前記メモリを用いて、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較した結果を第1比較結果として出力する。
なお、これらの全般的または具体的な態様は、装置、方法、システム、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、装置、方法、システム、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本開示の評価装置等によれば、マハラノビス距離の計算量を削減し、計算時間を短縮することができる。
図1は、実施の形態における評価装置の一例を示すブロック図である。 図2は、図1に示す演算部の詳細機能構成の一例を示すブロック図である。 図3は、実施の形態における単位データ群と信号データ群との一例を示す図である。 図4は、図3に示す単位データ群を2つのグループにグルーピングした場合の例を示す図である。 図5は、実施の形態におけるグループ別単位空間を用いた単位データ群のマハラノビス距離の一例を示す図である。 図6は、実施の形態におけるグループ別単位空間を用いた信号データ群のマハラノビス距離の一例を示す図である。 図7Aは、実施の形態における評価装置の全体動作を示すフローチャートである。 図7Bは、図7Aに示すステップS11の詳細動作の一例を示すフローチャートである。 図8は、MT法の全体像を説明するための概念図である。 図9は、実施例1における波形データの一例を示す図である。 図10は、図9に示す波形データをグラフに表した図である。 図11Aは、図9に示す波形データに対するMT法のMD値と本手法のMD値とを示す図である。 図11Bは、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とを示す図である。 図12は、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とのヒストグラムを示す図である。 図13Aは、図11Aに示す信号データ群の各データ項目に対してMT法を用いて項目診断を行うための計算結果を示す図である。 図13Bは、図11Aに示す信号データ群のグループ別MD値に対してマルチMT法を用いて項目診断を行うための計算結果を示す図である。 図13Cは、図11Aに示す信号データ群の各データ項目に対して本手法を用いて項目診断を行うために用いた表を示す図である。 図14は、図9に示す信号データS1に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図15は、図9に示す信号データS2に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図16は、図9に示す信号データS3に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図17は、図9に示す信号データS4に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図18は、実施例2における相関係数表の一例を示す図である。 図19は、図18に示す相関係数を、2つのデータ項目の組み合わせでリスト化した表を示す図である。 図20は、図19に示す相関係数が降順にソートされたときの相関係数及びその2つのデータ項目の組み合わせと、3つのグループにグルーピングした手順とを示す図である。
(本開示の基礎となった知見)
マハラノビス距離に基づいて、正常または異常の判定を行うことができる方法としてMT法(マハラノビス・タグチ法)が知られている。MT法では、基準とみなすデータの群である単位空間として、正常で均質な状態のデータを用意し、その状態が持つパターンからのズレをマハラノビス距離として数値化する。そして、判定対象のデータのマハラノビス距離を計算し、単位空間からの離れ具合から、判定対象のデータが正常または異常であるかを判定する。
マハラノビス距離は、相関性も考慮した多次元の距離であり、マハラノビス距離の計算を行うためには、単位空間のデータの群のデータ項目となる特徴量の数に応じた逆行列計算等が必要になる。このため、マハラノビス距離の計算には計算時間がかかるという問題がある。なお、データ項目の数が多くなれば計算量がより増える。
そこで、本開示は、マハラノビス距離の計算量を削減し、計算時間を短縮することができる評価装置等を提供することを目的とする。
すなわち、本開示の一形態に係る評価装置は、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価装置であって、プロセッサと、メモリと、を備え、前記プロセッサは、前記メモリを用いて、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較した結果を第1比較結果として出力する。
この構成により、単位データ群の複数のデータ項目をグルーピングすることで、単位データ群を複数のグループに分割し、当該グループ毎に信号データ群のマハラノビス距離を算出し、算出したマハラノビス距離を線形和したもので、信号データ群を評価する。これにより、逆行列計算などマハラノビス距離を行うための計算量を削減できるので、計算時間を短縮することができる。
また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記単位データ群の前記複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を取得し、取得した複数の前記相関係数を降順にソートし、前記2以上のグループそれぞれに含まれるデータ項目の数の上限を決定し、降順に相関係数を示す2つのデータ項目を、決定した前記数の上限に従って、前記2以上のグループの1つに分類することで、前記2以上のグループにグルーピングするとしてもよい。
ここで、例えば、前記1つに分類する際、前記相関係数を示す2つのデータ項目のうち少なくとも一方が、先に分類されたグループに含まれるデータ項目と重複し、かつ、前記先に分類されたグループに含まれるデータ項目の数が、決定した前記数の上限より小さい場合に、前記相関係数を示す2つのデータ項目を前記先に分類されたグループに分類するとしてもよい。
また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記複数のデータ項目のうち選択した2つのデータ項目の間の関係を示す相関係数を取得し、取得した前記相関係数が閾値以上であるときに、選択した前記2つのデータ項目を、前記2以上のグループの1つに分類することを、前記複数のデータ項目のすべての組み合わせで行い、前記すべての組み合わせで行われた際、前記2以上のグループの1つに分類されなかった1以上のデータ項目を、前記すべての組み合わせで行われた際に分類されなかった、前記2以上のグループの1つに分類することで、前記単位データ群を前記2以上のグループにグルーピングするとしてもよい。
また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記2以上のグループにおけるグループの数を決定し、前記単位データ群における前記複数のデータ項目を、決定した前記数のグループそれぞれに振り分けることで、前記2以上のグループにグルーピングするとしてもよい。
また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記2以上のグループそれぞれに含まれるデータ項目の数を決定し、前記単位データ群における前記複数のデータ項目を、決定した前記数のデータ項目ごとにグルーピングすることで、前記2以上のグループにグルーピングするとしてもよい。
また、例えば、前記第1線形和と前記第2線形和とを算出する線形式の係数はそれぞれ、前記2以上のグループにおけるグループの数を分母とする単位分数であるとしてもよい。
また、例えば、前記プロセッサは、さらに、前記メモリを用いて、前記信号データ項目ごとに、算出した複数の前記第2マハラノビス距離同士を比較して、比較した結果を第2比較結果として出力し、前記第2比較結果に基づき、前記複数のデータ項目のうちどのデータ項目が異常になったかを解析する項目診断を行うとしてもよい。
また、本開示の一形態に係る評価方法は、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、コンピュータがマハラノビス距離を用いて前記信号データ群の評価を行うための評価方法であって、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する。
また、本開示の一形態に係るプログラムは、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価方法をコンピュータに実行させるためのプログラムであって、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する。
以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることもできる。
(実施の形態)
以下では、図面を参照しながら、実施の形態における評価装置等の説明を行う。
[評価装置1]
図1は、本実施の形態における評価装置1の一例を示すブロック図である。
評価装置1は、複数のデータ項目についての基準となるデータ群である単位データ群、及び複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて信号データ群の評価を行うためのものである。
評価装置1は、CPUなどのプロセッサ(マイクロプロセッサ)、メモリ等を備えるコンピュータで実現される。より具体的には、評価装置1は、例えば図1に示すように、演算部10と、メモリ11と、入力部12と、出力部13とを備える。なお、評価装置1が入力部12及び出力部13を備えることは必須ではない。
[入力部12]
入力部12は、複数のデータ項目についての基準となるデータ群である単位データ群、及び複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットが入力される。入力部12には、単位データ群及び信号データ群が別々に入力されてもよい。
[メモリ11]
メモリ11は、記憶媒体の一例であり、例えば、ハードディスクドライブまたはソリッドステートドライブ等の書き換え可能な不揮発性のメモリで構成される。本実施の形態では、メモリ11は、入力部12に入力されたデータセットを記憶する。
また、メモリ11は、後述する本実施におけるマハラノビス距離の算出方法のプログラム、マハラノビス距離の算出の際に用いる演算式、算出した相関係数、演算結果等が記憶されていてもよい。
[演算部10]
図2は、図1に示す演算部10の詳細機能構成の一例を示すブロック図である。
演算部10は、例えば、CPUなどのプロセッサ(マイクロプロセッサ)であり、メモリ11などを用いて、信号データ群の評価を行うために、マハラノビス距離を用いた計算を実行する。本実施の形態では、図2に示すように単位空間算出部101と、MD値算出部102と、線形和算出部103とを備える。
<単位空間算出部101>
図3は、実施の形態における単位データ群と信号データ群との一例を示す図である。図4は、図3に示す単位データ群を2つのグループにグルーピングした場合の例を示す図である。
単位空間算出部101は、単位データ群を、複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、2以上のグループにグルーピングされた単位データ群である2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出する。本実施の形態では、単位空間算出部101は、図2に示すように、相関係数算出部1011と、グルーピング部1012と、グループ別単位空間算出部1013とを備える。
≪相関係数算出部1011≫
相関係数算出部1011は、単位データ群の複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を算出する。これについて図3に示す例を用いて説明する。相関係数算出部1011は、図3に示すデータ項目1及び2、データ項目1及び3、データ項目1及び4、データ項目1及び5、データ項目2及び3、データ項目2及び4、データ項目2及び5、データ項目3及び4、データ項目3及び5、データ項目4及び5それぞれの単位データの相関係数を計算する。より詳細には、相関係数算出部1011は、データ項目1及び2におけるy11及びy12、y21及びy22、y31及びy32、y41及びy42、並びに、y51及びy52から相関係数を算出する。つまり、図3では、単位データ群は、単位データ1~単位データ5からなるため、2つのデータ項目の全ての組み合わせにおける単位データ1~単位データ5それぞれのデータから、相関係数が算出される。
ここで、図3に示す単位データ群を一般化した場合に相関係数を算出する方法について説明する。単位データ群のデータ項目の数をk、単位データ群のサンプル数をnとすると、各データ項目の単位データはyij(i=1,2,・・・,n、j=1,2,・・・,k)と表すことができる。また、各データ項目j(j=1,2,・・・,k)における単位データyij(i=1,2,・・・,n)の平均値をm、標準偏差をρとする。この場合、相関係数算出部1011は、まず、(式1)を用いて、各データ項目の単位データの基準化を行う。これにより、単位データ群のマハラノビス距離(以下、MD(Mahalanobis’ Distance)とも記載)の平均値が1となる。
ij=(yij-m)/ρ …(式1)
ここで、i=1,2,…,n、j=1,2,…k
相関係数算出部1011は、基準化を行った単位データ群を用いて、各々のデータ項目の間の相関、すなわちi列及びj列のデータの相関係数を、(式2)を用いて計算することができる。
Figure 0007398641000001
したがって、相関係数算出部1011は、(式2)を用いて、単位データ群の複数のデータ項目すべての相関係数を計算すると、(式3)のような相関行列Rを作成することができる。
Figure 0007398641000002
本実施の形態では、後述するMD値算出部102が、(式4)のような相関行列の逆行列R-1を計算するとして説明するが、相関係数算出部1011が逆行列R-1を計算してもよい。
Figure 0007398641000003
なお、本実施の形態では、相関係数算出部1011は、単位データ群から、複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を算出しなくてもよい。相関係数算出部1011は、グルーピングされたデータ項目のすべてにおけるデータ項目の間の相関係数を算出してもよい。これにより、単位データ群の複数のデータ項目のすべてにおける2つのデータ項目の間の相関係数を算出しなくてもよいので、計算量を削減することができる。また、逆行列を計算する際には、グルーピングされたデータ項目のすべてにおけるデータ項目の間の相関係数からなる相関行列からすればよいので、グルーピングしない場合と比較して計算量を削減することができる。
≪グルーピング部1012≫
グルーピング部1012は、単位データ群を、複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングする。これについて図3及び図4に示す例を用いて説明すると、グルーピング部1012は、5つのデータ項目を、2つのグループにグルーピングする。より詳細には、データ項目1~5を、データ項目1及び2からなるグループ1とデータ項目3~5からなるグループ2との2つのグループにグルーピングする。図4に示す例では、予め決定したグループ数が2である場合に、グループ数が2となるようにグルーピングされた例が示されている。
すなわち、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、そのグループの数が予め決定されていてもよい。このため、グルーピング部1012は、単位データ群における複数のデータ項目を、決定された数のグループそれぞれに振り分けることで、複数のデータ項目を2以上のグループにグルーピングしてもよい。
なお、グルーピングの方法は、予め決定したグループ数とする方法に限らず、予め決定したデータ項目の数でグルーピングする方法であってもよいし、単位データ群におけるデータ項目間の相関係数を利用する方法であってもよい。
すなわち、例えば、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、グルーピング部1012は、2以上のグループそれぞれに含まれるデータ項目の数を決定し、単位データ群における複数のデータ項目を、決定した数のデータ項目ごとにグルーピングすることで、2以上のグループにグルーピングしてもよい。
また、例えば、グルーピング部1012は、相関係数算出部1011が算出した単位データ群におけるデータ項目間の相関係数を取得して、利用してもよい。より詳細には、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、グルーピング部1012は、単位データ群の複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を取得する。グルーピング部1012は、取得した複数の相関係数を降順にソートし、2以上のグループそれぞれに含まれるデータ項目の数の上限を決定する。そして、グルーピング部1012は、降順に相関係数を示す2つのデータ項目を、決定した数の上限に従って、2以上のグループの1つに分類することで、2以上のグループにグルーピングすればよい。ここで、グルーピング部1012は、当該1つに分類する際、相関係数を示す2つのデータ項目のうちいずれかが、先に分類されたグループに含まれるデータ項目と重複し、かつ、先に分類されたグループに含まれるデータ項目の数が、決定した数の上限より小さい場合に、相関係数を示す2つのデータ項目を先に分類されたグループに分類すればよい。
また、例えば、グルーピング部1012は、選択した2つのデータ項目の間の相関係数を相関係数算出部1011に算出させ、閾値を利用してグルーピングしてもよい。より詳細には、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、グルーピング部1012は、複数のデータ項目のうち選択した2つのデータ項目の間の関係を示す相関係数を取得し、取得した相関係数が閾値以上であるときに、選択した2つのデータ項目を、2以上のグループの1つに分類する。そして、グルーピング部1012は、このような分類を、複数のデータ項目のすべての組み合わせで行ってもよい。なお、グルーピング部1012は、このような分類をすべての組み合わせで行った際、当該2以上のグループの1つに分類されなかった1以上のデータ項目を、すべての組み合わせで行われた際に分類されなかった、2以上のグループの1つに分類すればよい。これらのように、グルーピング部1012は、相関係数が高いデータ項目をグルーピングすることで、単位データ群を2以上のグループにグルーピングしてもよい。
≪グループ別単位空間算出部1013≫
グループ別単位空間算出部1013は、2以上のグループにグルーピングされた単位データ群である2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出する。これについて図4に示す例を用いて説明すると、グループ別単位空間算出部1013は、グルーピング部1012によりグルーピングされたグループ1、2に含まれる単位データを、グループ1、2におけるグループ別単位空間と決定する。より詳細には、グループ別単位空間算出部1013は、グループ1のデータ項目1及び2についてのy11及びy12、y21及びy22、y31及びy32、y41及びy42、並びに、y51及びy52をグループ1のグループ別単位空間と決定する。また、グループ別単位空間算出部1013は、グループ2のデータ項目3~5についてのy13~y15、y23~y25、y33~y35、y43~y45、並びに、y53~y55をグループ2のグループ別単位空間と決定する。つまり、グループ別単位空間算出部1013は、グループ1に属するすべての単位データで形成された単位空間と、グループ2に属するすべての単位データで形成された単位空間とを、グループ別単位空間に決定する。
なお、グループ別単位空間算出部1013は、決定したグループ別単位空間それぞれにおける各データ項目を基準化し、基準化したグループ別単位空間それぞれの相関係数を、相関係数算出部1011に算出させて取得してもよい。グループ別単位空間それぞれにおける各データ項目を基準化し相関係数を算出する方法は、上述した(式1)、(式2)を用いた方法と同様のため説明を省略する。
<MD値算出部102>
MD値算出部102は、算出したグループ別単位空間を用いて、対応するグループ別単位データ群の第1マハラノビス距離を算出する。また、MD値算出部102は、算出したグループ別単位空間それぞれを用いて、対応するデータ項目における信号データ群の第2マハラノビス距離を算出する。本実施の形態では、MD値算出部102は、図2に示すように、グループ別単位データ群MD算出部1021と、グループ別信号データ群MD算出部1022とを備える。
≪グループ別単位データ群MD算出部1021≫
図5は、実施の形態におけるグループ別単位空間を用いた単位データ群のマハラノビス距離の一例を示す図である。図5には、図4に示すグループ1、2から決定されたグループ別単位空間を用いて算出された、図3に示す単位データ群のマハラノビス距離の例が示されている。また、図5では、グループ1のグループ別単位空間を用いて算出されるマハラノビス距離がMD1と示されている。同様に、グループ2のグループ別単位空間を用いて算出されるマハラノビス距離がMD2と示されている。
グループ別単位データ群MD算出部1021は、単位空間算出部101が算出したグループ別単位空間を用いて、対応するグループ別単位データ群の第1マハラノビス距離を算出する。これについて図4及び図5に示す例を用いて説明する。グループ別単位データ群MD算出部1021は、図4に示すグループ1、2に属するすべての単位データで形成されるグループ別単位空間を用いて、当該グループ1、2に属する単位データそれぞれのマハラノビス距離を算出する。より詳細には、グループ別単位データ群MD算出部1021は、図4に示すグループ1に属するすべての単位データで形成されるグループ別単位空間を用いて、単位データ1~5それぞれのマハラノビス距離であるMDr11~MDr15を算出する。ここで、グループ1に属するすべての単位データは、y11、y12、y21、y22、y31、y32、y41、y42、y51及びy52である。同様に、グループ別単位データ群MD算出部1021は、図4に示すグループ2に属するすべての単位データで形成されるグループ別単位空間を用いて、単位データ1~5それぞれのマハラノビス距離であるMDr21~MDr25を算出する。ここで、グループ1に属するすべての単位データは、y13~y15、y23~y25、y33~y35、y43~y45、y53~y55である。
本実施の形態では、グループ別単位データ群MD算出部1021は、グループ別単位空間それぞれの相関係数からなる相関行列Rの逆行列R-1を算出する。なお、逆行列R-1を算出する方法は、上述した(式4)を用いた方法と同様のため説明を省略する。次に、グループ別単位データ群MD算出部1021は、グループ別単位データ群を構成する単位データyijを列ベクトルで表現したyを、グループ別単位データ群を構成する単位データyijの平均値m及び標準偏差ρを用いて、(式1)のように基準化した行列Yを算出する。そして、グループ別単位データ群MD算出部1021は、列ベクトルY(j=1,2,・・・,k)とその転置ベクトルY とを用いて、(式5)に示すように演算することでグループ別単位データ群の第1マハラノビス距離すなわちMDを算出する。ただし、列ベクトルY(j=1,2,・・・,k)は、Yij(i=1,2,・・・,n)を要素とする列ベクトルを表す。なお、(式5)において、kは、グループ別単位データ群のデータ項目の数である。このようにして、グループ別単位データ群MD算出部1021は、グループ別単位データ群における、そのグループ別単位空間の中心からの多次元の距離、第1マハラノビス距離を算出することができる。
MD=Y-1 /k・・・(式5)
≪グループ別信号データ群MD算出部1022≫
図6は、実施の形態におけるグループ別単位空間を用いた信号データ群のマハラノビス距離の一例を示す図である。図6には、図4に示すグループ1、2から決定されたグループ別単位空間を用いて算出された、図3に示す信号データ群のマハラノビス距離の例が示されている。なお、図5と同様の要素には同一の名称を付しており、詳細な説明は省略する。
グループ別信号データ群MD算出部1022は、単位空間算出部101が算出したグループ別単位空間それぞれを用いて、対応するデータ項目における信号データ群の第2マハラノビス距離を算出する。これについて図4及び図6に示す例を用いて説明する。グループ別信号データ群MD算出部1022は、図4に示すグループ1、2に属するすべての単位データで形成されるグループ別単位空間を用いて、当該グループ1、2に属するデータ項目についての信号データそれぞれのマハラノビス距離を算出する。
より詳細には、グループ別信号データ群MD算出部1022は、図4に示すグループ1に属するすべての単位データで形成されるグループ別単位空間を用いて、信号データ1、2それぞれのマハラノビス距離であるMDs11、MDs12を算出する。同様に、グループ別信号データ群MD算出部1022は、図4に示すグループ2に属するすべての単位データで形成されるグループ別単位空間を用いて、信号データ1、2それぞれのマハラノビス距離であるMDs21、MDs22を算出する。
本実施の形態では、グループ別信号データ群MD算出部1022は、グループ別単位データ群MD算出部1021が算出したグループ別単位空間それぞれに対応する逆行列R-1を用いて、信号データ群のマハラノビス距離を算出する。より詳細には、まず、グループ別信号データ群MD算出部1022は、信号データ群を構成するデータを列ベクトルで表現し、対応するグループ別単位空間で用いた平均値m及び標準偏差ρを用いて、基準化した行列を算出する。そして、グループ別信号データ群MD算出部1022は、算出した行列中の列ベクトルとその転置ベクトルと、グループ別単位空間それぞれに対応する逆行列R-1とを用いて、(式5)に示すように演算することで信号データ群の第2マハラノビス距離すなわちMDを算出する。このように、グループ別信号データ群MD算出部1022は、グループ別単位空間に対応する信号データ群における、当該グループ別単位空間の中心からの多次元の距離から、第2マハラノビス距離を算出することができる。
<線形和算出部103>
線形和算出部103は、グループ別単位データ群MD算出部1021が算出した複数の第1マハラノビス距離の第1線形和を算出する。また、線形和算出部103は、グループ別信号データ群MD算出部1022が算出した複数の第2マハラノビス距離の第2線形和を算出する。ここで、第1線形和と第2線形和とを算出する線形式の係数はそれぞれ、当該2以上のグループにおけるグループの数を分母とする単位分数である。
本実施の形態では、線形和算出部103は、グループ別単位データ群MD算出部1021が算出した単位データ群それぞれの複数の第1マハラノビス距離の第1線形和を算出する。これについて図5に示す例を用いて説明すると、線形和算出部103は、単位データ1の複数の第1マハラノビス距離であるMDr11とMDr21との線形和を算出する。より詳細には、線形和算出部103は、(式6)に示すように、線形式の項が2つであるので線形式の項それぞれの係数を1/2としてMDr11とMDr21との線形和を算出することで、単位データ1の第1線形和を算出する。
信号データ1の第1線形和=1/2MDr11+1/2MDr21…(式6)
同様に、線形和算出部103は、線形式の項それぞれの係数を1/2として、単位データ2の複数の第1マハラノビス距離であるMDr12とMDr22との線形和を算出し、単位データ3の複数の第1マハラノビス距離であるMDr13とMDr23との線形和を算出する。線形和算出部103は、線形式の項それぞれの係数を1/2として、単位データ4の複数の第1マハラノビス距離であるMDr14とMDr24との線形和を算出し、単位データ5の複数の第1マハラノビス距離であるMDr15とMDr25との線形和を算出する。
また、線形和算出部103は、グループ別信号データ群MD算出部1022が算出した信号データ群それぞれの複数の第2マハラノビス距離の第2線形和を算出する。これについて図6に示す例を用いて説明すると、線形和算出部103は、信号データ1の複数の第2マハラノビス距離であるMDs11とMDs21との線形和を算出する。より詳細には、線形和算出部103は、(式7)に示すように、線形式の項それぞれの係数を1/2としてMDs11とMDs21との線形和を算出することで、信号データ1の第2線形和を算出する。
信号データ1の第2線形和=1/2MDs11+1/2MDs21…(式7)
同様に、線形和算出部103は、線形式の項それぞれの係数を1/2として、信号データ2の複数の第2マハラノビス距離であるMDs12とMDs22との線形和を算出することで、信号データ2の第2線形和を算出する。
このように、線形和算出部103は、算出されたグルーピングされたグループ数を分母とする単位分数を係数として、グループ数分のマハラノビス距離の第2線形和を算出する。
なお、第1線形和及び第2線形和を算出する際の線形式の項におけるそれぞれの係数は、グループ数を分母とする単位分数など重み付けしないものである場合に限らず、相関係数の平均値などで重み付けしたものでもよい。
[出力部13]
出力部13は、線形和算出部103が算出した第1線形和と第2線形和とを比較して、比較した結果を第1比較結果として出力する。出力部13は、信号データ群ごとに、算出した複数の第2マハラノビス距離同士を比較して、比較した結果を第2比較結果として出力してもよい。例えば、第2比較結果により、ある信号データ群の第2線形和が、すべての単位データ群の第1線形和よりも値がかなり大きく、閾値以上であることが判定できれば、当該信号データ群が異常であると判定できる。
また、出力部13は、さらに、第2比較結果に基づき、複数のデータ項目のうちどのデータ項目が異常になったかを解析する項目診断を行い、その結果を出力してもよい。例えば、出力部13は、項目診断の結果、ある信号データ群のデータ項目が異常になったことを解析した場合、異常となったデータ項目を通知する警告情報を出力してもよい。
[評価装置1の動作]
上述のように構成された評価装置1の動作の一例について以下説明する。
図7Aは、本実施の形態における評価装置1の全体動作を示すフローチャートである。
評価装置1は、CPUとメモリとを用いて、以下のステップS11~ステップS17の処理を行う。より具体的には、まず、評価装置1は、単位データ群を、複数のデータ項目のうち少なくとも1以上のデータ項目を含む、2以上のグループにグルーピングする(S11)。次に、評価装置1は、グルーピングされた単位データ群である2以上のグループ別単位データ群それぞれにおける単位空間を、グループ別単位空間として算出する(S12)。次に、評価装置1は、算出したグループ別単位空間を用いて、対応するグループ別単位データ群の第1マハラノビス距離を算出する(S13)。次に、評価装置1は、算出したグループ別単位空間それぞれを用いて、対応するデータ項目における信号データ群の第2マハラノビス距離を算出する(S14)。次に、評価装置1は、ステップS13において算出した複数の第1マハラノビス距離の第1線形和を算出する(S15)。ここで、評価装置1は、ステップS13において算出した複数の第1マハラノビス距離を用いて、グループ別単位データ群それぞれにおける第1線形和を算出する。次に、評価装置1は、ステップS14において算出した複数の第2マハラノビス距離の第1線形和を算出する(S16)。ここで、評価装置1は、ステップS14において算出した複数の第2マハラノビス距離を用いて、グループ別単位空間に対応する信号データ群それぞれにおける第2線形和を算出する。最後に、評価装置1は、ステップS15において算出された第1線形和とステップS16において算出された第2線形和とを比較して、その比較結果を出力する(S17)。
以下、ステップS11の詳細動作の一例について図7Bを用いて説明する。
図7Bは、図7Aに示すステップS11の詳細動作の一例を示すフローチャートである。図7Bには、相関係数が高いデータ項目をグルーピングすることで、単位データ群を2以上のグループにグルーピングする場合の詳細動作が示されている。
すなわち、ステップS11において、まず、評価装置1は、単位データ群のデータ項目間における相関係数を取得する(S111)。評価装置1は、単位データ群のデータ項目間それぞれの2つの単位データから算出することで、単位データ群のデータ項目間における相関係数を取得する。続いて、評価装置1は、取得した相関係数を降順にソートし(S112)、最も高い値の相関係数を示す2つのデータ項目を1つのグループとして形成する(S113)。
続いて、評価装置1は、次に高い値を示す相関係数を示す2つのデータ項目を取得し(S114)、取得した2つのデータ項目の両方とも、形成中のグループを構成するデータ項目と重複するか否かを判定する(S115)。
ステップS115において重複しない場合(S115でno)、評価装置1は、取得した2つのデータ項目のいずれかが、形成中のグループを構成するデータ項目と重複するか否かを判定する(S116)。
ステップS116において重複しない場合(S116でno)、データ項目の両方とも完成したグループを構成するデータ項目と重複しないときには(S117でno)、評価装置1は、重複しないその2つのデータ項目を別のグループとして形成する(S118)。なお、ステップS115において、完成したグループを構成するデータ項目と重複するときには(S117でyes)、評価装置1は、何もせずステップS116に戻る。
一方、ステップS116において重複する場合(S116でyes)、評価装置1は、当該2つのデータ項目を重複するそのグループに加え(S119)、そのグループのデータ項目の数が上限になったかどうかを確認する(S120)。
ステップS120において、上限になったことを確認した場合(S120でyes)、評価装置1は、そのグループが完成したものとして取り扱い(S121)、他に形成中のグループがあるかどうかを確認する(S122)。
ステップS122において、形成中のグループが他にない場合(S122でno)、残りのすべてのデータ項目を1つのグループとして形成し(S123)、処理を終了する。
なお、ステップS115において、重複する場合(S115でyes)、ステップS117において、データ項目の少なくとも一方が完成したグループを構成するデータ項目と重複するときには(S117でyes)には、ステップS114に戻り処理を繰り返す。また、ステップS120において、上限になっていない場合(S120でno)、及び、ステップS122において、形成中のグループが他にある場合(S122でyes)には、ステップS114に戻り処理を繰り返す。
このようにして、評価装置1は、単位データ群の複数のデータ項目を2以上のグループにグルーピングすることで、単位データ群を2以上のグループにグルーピングする。
[効果等]
以上のようにして、評価装置1は、単位データ群の複数のデータ項目をグルーピングすることで、単位データ群を複数のグループに分割し、信号データ群のマハラノビス距離を当該グループ毎に算出し、算出したマハラノビス距離の線形和を算出する。そして、算出した線形和で信号データ群を評価する。これにより、評価装置1は、データ項目の数が多くても逆行列計算などマハラノビス距離を行うための計算量を削減できるので、計算時間を短縮することができる。例えば、グルーピングしない場合には、マハラノビス距離を計算するための一連の計算量は、項目数の3乗に比例した計算量となる。一方、本実施の形態のようにグルーピングする場合には、グルーピングしない場合の計算量からグルーピング数の2乗を除した計算量となり、計算量を削減できる。
なお、ここではグループ毎のデータ数に上限を設ける場合について説明したが、データ数に上限を設けない場合や、グループ数に上限を設ける場合なども、同様の効果を得られる。
ここで、MT法の手順と、MT法を用いてできることとを示す全体像について説明する。
図8は、MT法の全体像を説明するための概念図である。
まず、記憶装置等に、生産設備データなどの取得データが格納されているとする。なお、生産設備データとしては例えば一定間隔で離間した設備の位置毎の時系列な温度データなどの物理データでもよいし、設備ごとの生産物についての物理データでもよいし、物理データを特徴量化したスカラーのデータであってもよい。
MT法では、まず、取得データから、特徴量1~kを抽出し、例えば、テーブル型に特徴量1~kとそのデータとを配列する。特徴量としては、物理データの微分特性値、積分特性値、波形特徴値、最大値、最小値などが挙げられる。例えば、温度などの生産設備データから、波形データを抽出し、波形データをデータ項目についてテーブル型に配列する。
次に、テーブル型に配列したデータのうち、OKデータすなわち正常であるとみなす単位データ1~mを決定し、単位空間を生成する。このとき、生成した単位空間の相関行列と当該相関行列の逆行列などを計算しておく。
次に、取得データのうち、OKかNGかわからないデータすなわち正常であるかどうかわからない信号データm+1~nについて、単位空間を用いてマハラノビス距離(MD値)を計算する。そして、閾値を決定し、計算したMD値とその閾値とを用いて、信号データm+1~nが正常か否かを判定する。
なお、信号データm+1~nがNGデータすなわち正常でないと判定された場合、信号データm+1~nについて項目診断し、項目毎の要因の影響度を解析してもよい。
本実施の形態では、上述したが、図8に示す単位空間を、抽出した特徴量1~kすべてではなく、グルーピングした特徴量1~kごとすなわちグループ別の単位データごとに、グループ別単位空間として生成する。そして、信号データm+1~nのMD値及び項目診断を、グループ別単位空間を用いて、グルーピングした特徴量1~kごとの信号データm+1~nに対して行う。
(実施例1)
上記の実施の形態における評価装置1が行う評価方法の具体的態様の一例について、実施例1として説明する。
図9は、実施例1における波形データの一例を示す図である。図10は、図9に示す波形データをグラフに表した図である。図9に示す波形データは、メモリ11に格納されたデータセットから抽出され、単位空間を形成するために用いられる基準となるデータ群である単位データ群(U1~U26)と、評価対象となるデータ群である信号データ群(S1~S4)とで構成されている。図9に示す波形データは、WAVE1~WAVE12と示されるデータ項目ごとにテーブル型に配列されている。なお、図9でハッチングされている欄は、図10に示す単位データ群(U1~U26)から外れている信号データ群の値を示している。図10に示すように、信号データS1は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値の変化すなわち形状は似通っているが、全体的に値が小さい。信号データS2は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値及び値の変化は似通っているが、WAVE7の値だけ外れている。信号データS3は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値及び値の変化は似通っているが、WAVE1、2、3の値が外れている。信号データS4は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値及び値の変化は似通っているが、WAVE10及びWAVE11の値が右下がりとなっている。
[MD値の算出]
図11Aは、図9に示す波形データに対するMT法のMD値と本手法のMD値とを示す図である。本手法のMD値は、上記の実施の形態における評価装置1が行い、複数のデータ項目をグルーピングして、複数のグループに分割した単位データ群から形成したグループ別単位空間を用いて算出した、複数のマハラノビス距離の線形和である。本実施例では、複数のデータ項目(WAVE1~WAVE12)を4つずつ(WAVE1~WAVE4、WAVE5~WAVE8、WAVE9~WAVE12)、3グループに単位データ群を分割した。また、3グループに分割した単位データ群から形成したグループ別単位空間を用いて、単位データ(U1~U26)ごとのMD値を算出した。図11Aには、グループ別単位空間を用いて算出した、単位データ(U1~U26)ごとのMD値がグループ別MD値(MD1_1、MD1_2、MD1_3)として示されている。
なお、図11Aには、比較例として、図9に示す波形データに対するマルチMT法のMD値も示されている。マルチMT法のMD値は、複数のデータ項目をグルーピングして、それぞれのグループでマハラノビス距離を算出し、算出した複数のマハラノビス距離を入力として算出した1つのマハラノビス距離である。マルチMT法では、マハラノビス距離の算出を2階層以上行う必要があるので、グルーピングしないMT法のMD値、及び、グルーピングするが1階層のマハラノビス距離の算出を行う本手法のMD値よりも計算量が多くなる。つまり、本手法のMD値とマルチMT法とは、いずれもグルーピングという手法を用いるが、本手法のMD値に必要な計算量はマルチMT法に必要な計算量よりも少ない。
図11Bは、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とを示す図である。図12は、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とのヒストグラムを示す図である。図12の(a)には図11Aから抜粋したMT法のMD値のヒストグラムが示され、図12の(b)には図11Aから抜粋したマルチMT法のMD値のヒストグラムが示され、図12の(c)には図11Aから抜粋した本手法のMD値のヒストグラムが示されている。
図12からわかるように、信号データS1~S4について、本手法のMD値とMT法のMD値とが同じ傾向を示しているのがわかる。これにより、本手法のMD値をMT法のMD値の代わりに用いることで、MT法のMD値と比較して計算量を削減できるだけでなく、MT法のMD値を用いる場合と同じ判定ができるのがわかる。
なお、信号データS1~S4についてマルチMT法のMD値は、3グループに分割した単位データ群(グループ別単位データ群)のMD値に対して大きすぎる。このため、正常または異常であるかの判定で信号データS1をグレーゾーン扱いにできず、正しい判定が難しいというのがわかる。
[項目診断]
図13Aは、図11Aに示す信号データ群の各データ項目に対してMT法を用いて項目診断を行うための計算結果を示す図である。例えばMT法のMD値を用いて異常と判定された信号データS3でのWAVE1のデータ項目では、WAVE1のデータ項目の影響を、直交表を用いて計算した値が記入されている。他のデータ項目に記入されている値も同様である。なお、これらの値を記入するために、WAVE2~WAVE12の複数のデータ項目における相関行列を算出し、算出した相関行列の逆行列を用いている。また、図13Aには、データ項目に記入されている値と比較できるように、信号データそれぞれに対するMT法のMD値も示されている。
図13Bは、図11Aに示す信号データ群のグループ別MD値に対してマルチMT法を用いて項目診断を行うための計算結果を示す図である。例えばマルチMT法のMD値を用いて異常と判定された信号データS3でのMD1_1の項目では、上記と同様にして、直交表を用いて、MD1_1の影響を計算した値が記入されている。他の項目に記入されている値も同様である。また、図13Aには、項目に記入されている値と比較できるように、信号データそれぞれに対するマルチMT法のMD値も示されている。
図13Cは、図11Aに示す信号データ群の各データ項目に対して本手法を用いて項目診断を行うために用いた表を示す図である。図13Cには、図11Aに示すグループ別MD値(MD1_1、MD1_2、MD1_3)が抜粋された表が示されている。
図14は、図9に示す信号データS1に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図14の(a)には信号データS1に対するMT法による項目診断を行うためのグラフが示され、図14の(b)には信号データS1に対するマルチMT法による項目診断を行うためのグラフが示されている。また、図14の(c)には信号データS1に対する本手法による項目診断を行うためのグラフが示されている。同様に、図15は、図9に示す信号データS2に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図16は、図9に示す信号データS3に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図17は、図9に示す信号データS4に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図15~図17の(a)には信号データS2~S4に対するMT法による項目診断を行うためのグラフが示されている。同様に、図15~図17の(b)には信号データS2~S4に対するマルチMT法による項目診断を行うためのグラフが示され、図15~図17の(c)には信号データS2~S4に対する本MT法による項目診断を行うためのグラフが示されている。
図14~図17からわかるように、信号データS1~S4について本手法の項目診断を行うためのグラフとマルチMT法の項目診断を行うためのグラフとが同じ傾向を示しているのがわかる。つまり、これにより、本手法の項目診断とマルチMT法の項目診断とが同等の性能なのがわかるので、本手法の項目診断をマルチMT法の項目診断の代わりに用いることができる。これにより、信号データ群のグループ別MD値をそのまま用いることができるので、マルチMT法の項目診断で行う相関行列及び逆行列の算出が不要となり、計算量を削減できる。
例えば、信号データS2の項目診断については、図15の(a)から、MT法の項目診断を行うためのグラフでは、WAVE7のデータ項目のMD値が突出しており、WAVE7のデータ項目が、信号データS2が異常と判定された原因であることがわかる。図15の(c)から、本手法の項目診断を行うためのグラフでは、WAVE7を含む4つのデータ項目(WAVE1~WAVE12)からなるMD1_2のグループ別MD値が突出しており、MD1_2が、信号データS2が異常と判定された原因であることがわかる。そして、本手法の項目診断より異常と判定されたMD1_2を構成する4つのデータ項目(WAVE1~WAVE12)についてさらにMT法の項目診断を行うことで、WAVE7のデータ項目が、信号データS2が異常と判定された原因であることがわかる。他の信号データS3、S4の項目診断を行うためのグラフについても、説明は省略するが同様のことがわかる。
このように、本手法の項目診断を行い、異常と判定されたグループを構成するデータ項目についてさらにMT法の項目診断を行う。これにより、すべてのデータ項目について行うMT法の項目診断と比較して、計算量を削減できるだけでなく、すべてのデータ項目について行うMT法の項目診断と同じ解析ができるのがわかる。
以上のように、本手法によれば、上記の実施の形態における評価装置1が項目診断を行う場合でも、逆行列計算などマハラノビス距離を行うための計算量を削減できるので、計算時間を短縮することができる。
(実施例2)
実施例2では、単位データ群におけるデータ項目間の相関係数を利用して単位データ群を2以上のグループにグルーピングする方法の一例について説明する。
図18は、実施例2における相関係数表の一例を示す図である。図18には、図9に示す波形データのデータ項目間の相関係数が示されている。図18に示す相関係数は、実施の形態における評価装置1により算出される。
図19は、図18に示す相関係数を、2つのデータ項目の組み合わせでリスト化した表を示す図である。このリスト化は、実施の形態における評価装置1により行われてもよい。図19の表における組み合わせの数字は、図18の1行目のデータ項目の番号すなわちWave1~Wave12のいずれかと図18の1列目のデータ項目の番号すなわちWave1~Wave12のいずれかとの組み合わせを示している。例えば、組み合わせ1-2には、図18の1行目のWave1と図18の2列目のWave2との相関係数0.922252が示されている。図19に示す相関係数は、実施の形態における評価装置1により算出される。
図20は、図19に示す相関係数が降順にソートされたときの相関係数及びその2つのデータ項目の組み合わせと、3つのグループにグルーピングした手順とを示す図である。
本実施例では、図9に示す波形データの12個のデータ項目を4つずつ、3つのグループに分けることが予め決定されているとする。この場合、最も高い値の相関係数0.934755を示す組み合わせ2-3を1つの目のグループであるグループ1とする。次に高い値の相関係数0.929843を示す組み合わせ6-8は、グループ1に含まれる組み合わせの数字すなわちデータ項目と重複しないので、組み合わせ6-8を別のグループであるグループ2とする。
次に高い値の相関係数0.922252を示す組み合わせ1-2は、グループ1に含まれる組み合わせの数字の2と重複するので、組み合わせ1-2をグループ1に加える。同様に、次に高い値の相関係数0.916117を示す組み合わせ3-4は、グループ1に含まれる組み合わせの数字の3と重複するので、組み合わせ3-4をグループ1に加える。これにより、グループ1に含まれる組み合わせは1-2-3-4となり、データ項目の数が上限となったため、グループ1は完成したものとして取り扱う。
次に高い値の相関係数0.901614を示す組み合わせ2-4は、グループ1に含まれているので、なにもしない。なお、組み合わせ2-4をグループ1に加えてもグループ1に含まれるデータ項目は変化しないので、組み合わせ2-4をグループ1に加えるとしてもよい。次に、高い値の相関係数0.896364を示す組み合わせ1-3も、グループ1に含まれているので、なにもしない。
次に高い値の相関係数0.895188を示す組み合わせ6-7は、グループ2に含まれる組み合わせの数字の6と重複するので、組み合わせ6-7をグループ2に加える。一方、この次に、高い値の相関係数0.893529を示す組み合わせ4-5は、グループ1に含まれる組み合わせの数字の4と重複するが、グループ1のデータ数は上限となり完成しているので、なにもしない。
また、次に高い値の相関係数0.893529を示す組み合わせ5-6は、グループ2に含まれる組み合わせの数字の6と重複するので、組み合わせ5-6をグループ2に加える。これにより、グループ2に含まれる組み合わせは5-6-7-8となり、データ項目の数が上限となったため、グループ2は完成したものとして取り扱う。
そして、形成中のグループが他にないため、残りの組み合わせ9-10-11-12を1つのグループであるグループ3とする。
このようにして、評価装置1は、単位データ群におけるデータ項目間の相関係数を利用して単位データ群を2以上のグループにグルーピングすることができる。
なお、本実施例ではデータ項目数、グループ数をあらかじめ決めておいたが、データ数のみ決めたり、グループ数のみ決めたりする場合にも、それに応じたステップでグルーピングを行うことが可能である。
(他の実施態様の可能性)
以上、実施の形態において本開示の評価装置、評価方法及びプログラムについて説明したが、各処理が実施される主体や装置に関しては特に限定しない。ローカルに配置された特定の装置内に組み込まれたプロセッサなど(以下に説明)によって処理されてもよい。またローカルの装置と異なる場所に配置されているクラウドサーバなどによって処理されてもよい。
なお、本開示は、上記実施の形態に限定されるものではない。例えば、本明細書において記載した構成要素を任意に組み合わせて、また、構成要素のいくつかを除外して実現される別の実施の形態を本開示の実施の形態としてもよい。また、上記実施の形態に対して本開示の主旨、すなわち、請求の範囲に記載される文言が示す意味を逸脱しない範囲で当業者が思いつく各種変形を施して得られる変形例も本開示に含まれる。
また、本開示は、さらに、以下のような場合も含まれる。
(1)上記の装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)また、本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
(5)また、本開示は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータで読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標) Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本開示は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
本開示は、マハラノビス距離を用いた評価装置、評価方法及びプログラムに利用でき、特に生産設備などの異常を判定するために用いられる評価装置、評価方法及びプログラムに利用できる。
1 評価装置
10 演算部
11 メモリ
12 入力部
13 出力部
101 単位空間算出部
102 MD値算出部
103 線形和算出部
1011 相関係数算出部
1012 グルーピング部
1013 グループ別単位空間算出部
1021 グループ別単位データ群MD算出部
1022 信号データ群MD算出部

Claims (10)

  1. 複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価装置であって、
    プロセッサと、
    メモリと、を備え、
    前記プロセッサは、前記メモリを用いて、
    前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、
    前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、
    算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、
    算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、
    算出した複数の前記第1マハラノビス距離の第1線形和を算出し、
    算出した複数の前記第2マハラノビス距離の第2線形和を算出し、
    算出した前記第1線形和と前記第2線形和とを比較して、比較した結果を第1比較結果として出力する、
    評価装置。
  2. 前記単位データ群を前記2以上のグループにグルーピングする場合、
    前記単位データ群の前記複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を取得し、
    取得した複数の前記相関係数を降順にソートし、
    前記2以上のグループそれぞれに含まれるデータ項目の数の上限を決定し、
    降順に相関係数を示す2つのデータ項目を、決定した前記数の上限に従って、前記2以上のグループの1つに分類することで、前記2以上のグループにグルーピングする、
    請求項1に記載の評価装置。
  3. 前記1つに分類する際、前記相関係数を示す2つのデータ項目のうち少なくとも一方が、先に分類されたグループに含まれるデータ項目と重複し、かつ、前記先に分類されたグループに含まれるデータ項目の数が、決定した前記数の上限より小さい場合に、前記相関係数を示す2つのデータ項目を前記先に分類されたグループに分類する、
    請求項2に記載の評価装置。
  4. 前記単位データ群を前記2以上のグループにグルーピングする場合、
    前記複数のデータ項目のうち選択した2つのデータ項目の間の関係を示す相関係数を取得し、取得した前記相関係数が閾値以上であるときに、選択した前記2つのデータ項目を、前記2以上のグループの1つに分類することを、前記複数のデータ項目のすべての組み合わせで行い、
    前記すべての組み合わせで行われた際、前記2以上のグループの1つに分類されなかった1以上のデータ項目を、前記すべての組み合わせで行われた際に分類されなかった、前記2以上のグループの1つに分類することで、前記単位データ群を前記2以上のグループにグルーピングする、
    請求項1に記載の評価装置。
  5. 前記単位データ群を前記2以上のグループにグルーピングする場合、
    前記2以上のグループにおけるグループの数を決定し、
    前記単位データ群における前記複数のデータ項目を、決定した前記数のグループそれぞれに振り分けることで、前記2以上のグループにグルーピングする、
    請求項1に記載の評価装置。
  6. 前記単位データ群を前記2以上のグループにグルーピングする場合、
    前記2以上のグループそれぞれに含まれるデータ項目の数を決定し、
    前記単位データ群における前記複数のデータ項目を、決定した前記数のデータ項目ごとにグルーピングすることで、前記2以上のグループにグルーピングする、
    請求項1に記載の評価装置。
  7. 前記第1線形和と前記第2線形和とを算出する線形式の係数はそれぞれ、前記2以上のグループにおけるグループの数を分母とする単位分数である、
    請求項1~6のいずれか1項に記載の評価装置。
  8. 前記プロセッサは、さらに、前記メモリを用いて、
    前記信号データごとに、算出した複数の前記第2マハラノビス距離同士を比較して、比較した結果を第2比較結果として出力し、
    前記第2比較結果に基づき、前記複数のデータ項目のうちどのデータ項目が異常になったかを解析する項目診断を行う、
    請求項1~7のいずれか1項に記載の評価装置。
  9. 複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、コンピュータがマハラノビス距離を用いて前記信号データ群の評価を行うための評価方法であって、
    前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、
    前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、
    算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、
    算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、
    算出した複数の前記第1マハラノビス距離の第1線形和を算出し、
    算出した複数の前記第2マハラノビス距離の第2線形和を算出し、
    算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する、
    評価方法。
  10. 複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価方法をコンピュータに実行させるためのプログラムであって、
    前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、
    前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、
    算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、
    算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、
    算出した複数の前記第1マハラノビス距離の第1線形和を算出し、
    算出した複数の前記第2マハラノビス距離の第2線形和を算出し、
    算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する、
    プログラム。
JP2020569452A 2019-01-29 2019-12-25 評価装置、評価方法及びプログラム Active JP7398641B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019013089 2019-01-29
JP2019013089 2019-01-29
PCT/JP2019/050727 WO2020158266A1 (ja) 2019-01-29 2019-12-25 評価装置、評価方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2020158266A1 JPWO2020158266A1 (ja) 2021-12-02
JP7398641B2 true JP7398641B2 (ja) 2023-12-15

Family

ID=71839954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020569452A Active JP7398641B2 (ja) 2019-01-29 2019-12-25 評価装置、評価方法及びプログラム

Country Status (4)

Country Link
US (1) US20220083818A1 (ja)
JP (1) JP7398641B2 (ja)
CN (1) CN113348449A (ja)
WO (1) WO2020158266A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11846979B1 (en) * 2022-06-01 2023-12-19 Sas Institute, Inc. Anomaly detection and diagnostics based on multivariate analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181188A (ja) 2009-02-03 2010-08-19 Mitsubishi Heavy Ind Ltd プラント運転状態監視方法
JP2013041491A (ja) 2011-08-18 2013-02-28 Ihi Corp 異常診断装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3034203C (en) * 2016-08-26 2022-06-21 1Qb Information Technologies Inc. Method and system for performing real-time analytics on a plurality of data streams

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181188A (ja) 2009-02-03 2010-08-19 Mitsubishi Heavy Ind Ltd プラント運転状態監視方法
JP2013041491A (ja) 2011-08-18 2013-02-28 Ihi Corp 異常診断装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
藤 賢大,髪の特徴に基づく顔画像の印象類似検索,情報処理学会 研究報告 グラフィクスとCAD(CG),日本,情報処理学会,2013年11月21日,Vol.2013-CG-153 No.17,pp.1-6

Also Published As

Publication number Publication date
US20220083818A1 (en) 2022-03-17
CN113348449A (zh) 2021-09-03
JPWO2020158266A1 (ja) 2021-12-02
WO2020158266A1 (ja) 2020-08-06

Similar Documents

Publication Publication Date Title
Hossain et al. Use of electronic health data for disease prediction: A comprehensive literature review
JP4890806B2 (ja) 予測プログラムおよび予測装置
JP4394728B2 (ja) 影響要因特定装置
de Oliveira et al. A framework and benchmarking study for counterfactual generating methods on tabular data
JP2008546046A (ja) マハラノビスの距離の遺伝的アルゴリズムの方法及びシステム
JP7210958B2 (ja) 商品推薦装置及びプログラム
JP4318221B2 (ja) 医療情報分析装置、方法及びプログラム
JP7398641B2 (ja) 評価装置、評価方法及びプログラム
KR102174630B1 (ko) 질병 관련 유전자 순위정보 제공 방법
US20100094785A1 (en) Survival analysis system, survival analysis method, and survival analysis program
Salem et al. Early diagnosis of breast cancer by gene expression profiles
JP4723544B2 (ja) 基板分類方法および装置、基板分類方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
Sahu et al. DCNN-SVM: A new approach for lung cancer detection
Segura-Alabart et al. Nonunique UPGMA clusterings of microsatellite markers
US20200134430A1 (en) Analyzing apparatus, analysis method and analysis program
Balabhadrapathruni et al. A study on analysing the impact of feature selection on predictive machine learning algorithms
Brindise et al. Machine learning-based pre-discharge prediction of hospital readmission
JPWO2018088277A1 (ja) 予測モデル生成システム、方法およびプログラム
Ahmed et al. Genetic variations analysis for complex brain disease diagnosis using machine learning techniques: opportunities and hurdles
Naydenova et al. Smart diagnostic algorithms for automated detection of childhood pneumonia in resource-constrained settings
WO2018088276A1 (ja) 予測モデル生成システム、方法およびプログラム
Xu et al. Predictions from algorithmic modeling result in better decisions than from data modeling for soybean iron deficiency chlorosis
Joseph et al. Classification methodologies in healthcare
WO2018142665A1 (ja) 状態分析装置、状態分析方法、及び記憶媒体
JP2007122682A (ja) 故障品類似製品の抽出方法および抽出システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231120

R151 Written notification of patent or utility model registration

Ref document number: 7398641

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151