JP2020144626A - 異常検出システム、及び異常検出プログラム - Google Patents

異常検出システム、及び異常検出プログラム Download PDF

Info

Publication number
JP2020144626A
JP2020144626A JP2019041040A JP2019041040A JP2020144626A JP 2020144626 A JP2020144626 A JP 2020144626A JP 2019041040 A JP2019041040 A JP 2019041040A JP 2019041040 A JP2019041040 A JP 2019041040A JP 2020144626 A JP2020144626 A JP 2020144626A
Authority
JP
Japan
Prior art keywords
data
feature amount
learning model
feature
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019041040A
Other languages
English (en)
Other versions
JP7348588B2 (ja
Inventor
萌子 原
Moeko Hara
萌子 原
圭亨 中村
Yoshiaki Nakamura
圭亨 中村
賢 柏原
Ken Kashiwabara
賢 柏原
直己 高橋
Naoki Takahashi
直己 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyo Seikan Group Holdings Ltd
Original Assignee
Toyo Seikan Group Holdings Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyo Seikan Group Holdings Ltd filed Critical Toyo Seikan Group Holdings Ltd
Priority to JP2019041040A priority Critical patent/JP7348588B2/ja
Publication of JP2020144626A publication Critical patent/JP2020144626A/ja
Application granted granted Critical
Publication of JP7348588B2 publication Critical patent/JP7348588B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】異常検出システムにおいて、学習モデルを作成する入力データの質を向上させることにより、異常検出の精度を向上させることを可能とする。【解決手段】監視対象に関するデータを用いて特徴量を計算して得られた特徴量データに対して状態空間モデルへの写像手法を用いて特徴量データに対応する特徴空間を定義する基底を生成し、基底にもとづき特徴量データを写像して、特徴空間の新たな次元数を決定し、写像された特徴量データの次元数を削減して新たな次元数とし、変換後特徴量データを生成する写像部と、混合分布手法にもとづき変換後特徴量データを複数のクラスタに分類して、学習モデル候補を作成する学習モデル作成部と、学習モデル候補に対して、設定された閾値よりも混合比が低い値をとるクラスタ又は混合比が最も小さい値をとるクラスタを削除することにより、学習モデル候補を改変して学習モデルを作成するモデル改変部を備える。【選択図】図1

Description

本発明は、監視対象の異常を検出する異常検出技術に関し、特に異常検出の精度を向上させ得る異常検出システムに関する。
監視対象の異常を検出する異常検出技術においては、監視対象が異常である状態を的確に識別することが難しいという問題がある。
例えば、様々な監視対象に対して汎用的に用いることのできる異常検出システムの構築を考えた場合、監視対象のどのような状態が異常であるのかを定義することは容易ではない。
そこで、監視対象の異常状態をあらかじめ定義することなく、監視対象の正常な状態から得られる各種の測定データから抽出される特徴量をモデル化することで、正常な状態との比較から異常を検出する手法を用いることが考えられる。
この手法による異常検出は、何が異常であるかを定義しないため、想定外の異常状態にも対応することが可能となる。
一方、このような異常検出では、入力するデータの質が検出精度に与える影響は、非常に大きい。
すなわち、監視対象を測定して得られる入力データとしては、例えば画像や波形データなど様々なものがあるが、画像や波形データからは多くの特徴量を抽出することが可能である。また、検査対象が複雑になればなるほど、異常状態の判定に必要となる特徴量の選択が難しくなる。また、判定に用いる特徴量の数を単に多くするのみでは、反って判定結果の質を劣化させる特徴量が含まれてしまうという問題もある。さらに、入力データには、正常又は異常な状態を示すデータの双方において、ノイズが含まれる場合がある。
このため、このような異常検出システムにおいては、入力データの質を向上させることにより、高精度な異常検出を可能にすることが望ましい。
特開2016−206784号公報
このような異常検出システムにおいて、写像手法などを用いることにより、入力データの特徴量を加工して、特徴量のうち有用なものだけを使用して異常検出を行うことが考えられる。しかしながら、このような写像手法を用いる場合でも、入力データにノイズなどが残っていると、それにより検出精度が低下するが、写像手法では、入力データのノイズを適切に除去することは、困難であった。
そこで、本発明者らは鋭意研究し、入力データの特徴量に対して写像手法とクラスタリング手法を適用し、一定のクラスタを除去することによって、特徴量の外れ値を削除し、異常検出の精度を向上させることに成功して、本発明を完成させた。
ここで、写像手法とクラスタリング手法を用いる技術として、特許文献1に記載のデータ分析装置を挙げることができる。しかしながら、この装置では、本発明のような入力データの特徴量の外れ値を削除することはできなかった。
本発明は、上記事情に鑑みてなされたものであり、異常検出システムにおいて、学習モデルを作成する入力データの質を向上させることにより、異常検出の精度を向上させることが可能な異常検出システム、及び異常検出プログラムの提供を目的とする。
上記目的を達成するため、本発明の異常検出システムは、監視対象の異常を検出する異常検出システムであって、監視対象に関するデータを用いて特徴量を計算して得られた特徴量データに対して状態空間モデルへの写像手法を用いて前記特徴量データに対応する特徴空間を定義する基底を生成し、前記基底にもとづき前記特徴量データを写像して、前記特徴空間の新たな次元数を決定し、写像された前記特徴量データの次元数を削減して前記新たな次元数とし、変換後特徴量データを生成する写像部と、混合分布手法にもとづき前記変換後特徴量データを複数のクラスタに分類して、学習モデル候補を作成する学習モデル作成部と、前記学習モデル候補に対して、設定された閾値よりも混合比が低い値をとるクラスタ又は混合比が最も小さい値をとるクラスタを削除することにより、前記学習モデル候補を改変して学習モデルを作成するモデル改変部を備える構成としてある。
また、本発明の異常検出プログラムは、監視対象の異常を検出する異常検出プログラムであって、コンピュータを、監視対象に関するデータを用いて特徴量を計算して得られた特徴量データに対して状態空間モデルへの写像手法を用いて前記特徴量データに対応する特徴空間を定義する基底を生成し、前記基底にもとづき前記特徴量データを写像して、前記特徴空間の新たな次元数を決定し、写像された前記特徴量データの次元数を削減して前記新たな次元数とし、変換後特徴量データを生成する写像部、混合分布手法にもとづき前記変換後特徴量データを複数のクラスタに分類して、学習モデル候補を作成する学習モデル作成部、及び、前記学習モデル候補に対して、設定された閾値よりも混合比が低い値をとるクラスタ又は混合比が最も小さい値をとるクラスタを削除することにより、前記学習モデル候補を改変して学習モデルを作成するモデル改変部として機能させる構成としてある。
本発明によれば、異常検出システムにおいて、学習モデルを作成する入力データの質を向上させることにより、異常検出の精度を向上させることが可能な異常検出システム、及び異常検出プログラムの提供が可能となる。
本発明の第一実施形態の異常検出システム(異常検出装置)の構成を示すブロック図である。 本発明の第一実施形態、第二実施形態、及び第三実施形態で用いられる主成分分析による写像手法を示す説明図である。 本発明の第一実施形態、第二実施形態、及び第三実施形態で用いられる主成分分析にもとづいて、特徴量データを低次元空間に圧縮する流れを示す説明図である。 本発明の第一実施形態及び第三実施形態で用いられる混合ガウス分布モデルによるモデル改変処理についての説明図である。 本発明の第一実施形態の異常検出システムによる処理手順を示すフローチャートである。 本発明の第二実施形態の異常検出システムの構成を示すブロック図である。 本発明の第二実施形態の異常検出システムによる処理手順を示すフローチャートである。 本発明の第三実施形態の異常検出システムの構成を示すブロック図である。 本発明の第三実施形態の異常検出システムによる処理手順を示すフローチャートである。 実施例に示す試験で用いた画像データを示す図である。 実施例に示す試験で用いた画像データから抽出した特徴量の種類を示す図である。 実施例に示す試験における主成分分析の結果を表すグラフを示す図である。 実施例及び参考例によって得られた学習モデルの評価結果を示す図である。
以下、本発明の異常検出システム、及び異常検出プログラムの実施形態について詳細に説明する。ただし、本発明は、以下の実施形態及び後述する実施例の具体的な内容に限定されるものではない。
[第一実施形態]
まず、本発明の第一実施形態の異常検出システム、及び異常検出プログラムについて、図面を参照して説明する。
本実施形態の異常検出システムは、監視対象の異常を検出するものである。この監視対象には検査対象も含まれ、監視対象としては、例えば製品や装置、建物などにおける環境等を挙げることができる。
具体的には、本実施形態の異常検出システムに相当する異常検出装置1は、図1に示すように、測定データ入力部10、測定データ記憶部11、特徴量抽出部12、特徴量データ記憶部13、写像部14、写像データ記憶部15、学習モデル作成部16、学習モデル記憶部17、及びモデル改変部18を備えている。
本実施形態の異常検出装置1におけるこれらの各構成は、図1に示すように一個の情報処理装置に全て備えることができる。また、これらの各構成は、複数の情報処理装置からなる異常検出システムの各装置に分散して備えてもよい。これは、後述する各実施形態についても同様である。
測定データ入力部10は、監視対象について測定されたデータ(以下、測定データと称する場合がある)などを入力して、測定データ記憶部11に記憶させる。
測定データ記憶部11は、測定データ入力部10により入力された測定データを記憶する。
測定データとしては、製品などから取得される検査データと、装置などから取得されるプロセスデータを挙げることができる。
検査データとしては、画像、寸法(サイズ、円形度など)、色、欠陥(数、サイズなど)、排出数、透過度、重量、強度、及び表面粗さ等を挙げることができる。なお、検査データは、検査する項目だけ存在するため、これ以外にも多くのものが想定され得る。
プロセスデータとしては、音、温度、湿度、振動、変位、速度、加速度、回転角、角速度、角加速度、電圧、電流、光量、圧力等を挙げることができる。
測定指標として、このような検査データとプロセスデータを組合わせて用いることで、異常検知の性能の向上を図ることができる。
特徴量抽出部12は、測定データ記憶部11から測定データを読み込んで、この測定データにもとづき特徴量を計算し、特徴量データを生成して特徴量データ記憶部13に記憶させる。
このとき、測定データを2つの集合に分けて、特徴量抽出部12により、特徴量データとして、学習モデル候補を作成するために用いる学習用データセットと、学習モデル候補を改変して学習モデルを完成させるために用いる検証用データセットの2種類を生成させて、特徴量データ記憶部13に記憶させることが好ましい。
なお、測定データ入力部10、測定データ記憶部11、及び特徴量抽出部12は、本実施形態の異常検出システム及び異常検出プログラムの外部に構成することができ、本実施形態の異常検出システム及び異常検出プログラムから、これらの構成を省略してもよい。
特徴量データ記憶部13は、特徴量抽出部12により生成された特徴量データを記憶する。
特徴量データの構造は、例えば測定データ(例えば画像)ID、複数の特徴量ID等からなるものとすることができる。
特徴量としては、例えば測定データが画像である場合、監視対象の形状に関するものとして、大きさ,アスペクト比,円形度,周囲長,外接四角面積比,凸数等を挙げることができる。また、監視対象の輝度に関するものとして、色空間(R空間,G空間,B空間,GRAY空間),平均値,標準偏差,最大値,最小値,最大値−最小値,中央値,第1四分位数,第2四分位数,1σ確率,3σ確率,四分位範囲,平均値−中央値,ヒストグラム確率密度分布(歪度,尖度,コントラスト,2次モーメント,エントロピー),差分確率密度分布(コントラスト,2次モーメント,エントロピー)等を挙げることができる。
また、特徴量として、時系列データなどの波形データにおける測定値、波形データのある時間的幅の平均値、最大値、最小値、中央値、標準偏差、最大値-最小値、1σ確率、3σ確率、第1四分位数、第3四分位数、波形データのヒストグラムの最頻値、尖度、歪度、波形データの周波数特性におけるピーク位置、ピーク値、重心位置、田口法による変化量、存在量等を挙げることもできる。
写像部14は、特徴量データ記憶部13から特徴量データを読み込んで、この特徴量データに対して状態空間モデルへの写像手法を用いて、特徴量データに対応する特徴空間を定義する基底を生成し、この基底にもとづき特徴量データを写像する。このとき、特徴量データとしては、学習用データセットが好適に用いられる。
また、写像部14は、設定された閾値にもとづいて、特徴空間の新たな次元数(圧縮後の次元数)を決定する。
さらに、写像部14は、写像された特徴量データの次元数を削減して、新たな次元数とする次元削減処理を行う。
このとき、写像部14は、写像された特徴量データの主成分が持つ固有値を上位から足し合わせて、その合計値が閾値未満で、かつ最大の値になるように新たな次元数を決定し、次元削減処理を行うことができる。
そして、写像部14は、得られた変換後特徴量データを写像データとして、写像データ記憶部15に記憶させる。
写像データ記憶部15は、写像部14により生成された変換後特徴量データを写像データとして記憶する。
変換後特徴量データの構造は、例えば測定データ(例えば画像)ID、複数の特徴量ID等からなるものとすることができる。
具体的には、写像部14は、状態空間モデルへの写像手法として、主成分分析(PCA;Principal Component Analysis)、独立成分分析、カーネル主成分分析、LDA(Latent Dirichlet Allocation)、近傍探索手法の少なくともいずれかを用いることができ、主成分分析を好適に用いることができる。
主成分分析は、主部分空間(principal subspace)と呼ばれる低次元の線形空間の上へのデータ点の直交射影である。また、主成分分析は、もともとのデータ点と射影した点の間の2乗距離の平均値で定義される射影のコスト関数の期待値を最小化するような線形射影である。
主成分分析によれば、元のデータが持つ情報をできるだけ失わずに、低次元空間に情報を縮約することができる。すなわち、異常検出に必要のない無駄な特徴量を使うことなく、最低限の情報量だけで元のデータを表現することが可能である。
また、このとき、写像部14により、特徴量データを変換後特徴量データに変換する、以下の変換式が作成される。
例えば、図2に示すように、主成分分析により、第1主成分として80%、第2主成分として20%が得られた場合において、設定された閾値が80%である場合、写像部14によって、特徴空間の新たな次元数(圧縮後の次元数)として1次元が決定されて変換後特徴量データが生成され、特徴量データを1次元の変換後特徴量データに変換する変換式が作成される。
また、図3に示すように、特徴量データXに対応する特徴空間がM次元である場合には、写像処理によりM次元の特徴量データX’が生成され、次元削減処理によりM’次元(M>M’)の特徴量データX’が生成される。
さらに、写像部14は、特徴量データ記憶部13から検証用データセットの特徴量データを読み込んで、この特徴量データに対して状態空間モデルへの写像手法を用いて、先に生成した基底にもとづき特徴量データを写像する。
このとき、写像部14は、上記の変換式により、特徴量データを写像して、次元数を削減し、得られた変換後特徴量データを写像データとして、写像データ記憶部15に記憶させることができる。
学習モデル作成部16は、写像データ記憶部15から変換後特徴量データ(写像データ)を読み込んで、混合分布手法にもとづき変換後特徴量データを複数のクラスタ(塊)に分類し、学習モデル候補を作成して、これを学習モデル記憶部17に記憶させる。
学習モデル候補は、一又は二以上のクラスタからなり、クラスタの構造は、例えばクラスタID、各クラスの平均値、共分散行列、混合比等からなるものとすることができる。
本実施形態の異常検出システムでは、測定データを最終的に「正常」と「異常」の2種類に分類する。また、本実施形態の異常検出システムは、教師なし学習を採用しており、教師なし学習では「正常」データのみを使用して学習モデルを構築し、外れ値を「異常」と判定する。このため、異常を定義することなく、様々な種類の異常を検知することが可能となっている。
ところで、「正常」にも様々な種類が存在する可能性(多態性)があるところ、1つの均一な集団においては外れ値とならないデータが、1つの均一な集団を3つの集団とした場合には、データの分布を細かく表現することが可能になる結果、外れ値になることがある。
このため、本実施形態の異常検出システムでは、混合分布手法を用いて変換後特徴量データを複数のクラスタに分類することにより、異常検出の精度を向上させることが可能になっている。
混合分布手法としては、正規分布、t分布、ポアソン分布、ベルヌ−イ分布、ディリクレ分布の少なくともいずれかによる分布モデルを用いることができ、混合ガウス分布モデル(Gaussian Mixture Model, GMM)を好適に用いることができる。
混合ガウス分布モデルは、複数の正規分布を組み合わせた重み付け線形和で表されるモデルである。
ここで、教師データなしで、データ間の類似度あるいは非類似度を手掛かりに、いくつかのクラスタにグループ分けをすることをクラスタリングという。正規分布は単峰性の確率分布しか表現できないが、実際に観測される測定データを特徴空間に布置していくと、様々な種類の測定データが存在するため、複数のクラスタが構成されると考えられる。この場合、単峰性の確率分布を複数組み合わせた重み付け線形和で全体の確率分布をモデル化すると整合性の高いモデルが構築される。このような確率モデルを混合分布モデルといい、特に複数の正規分布を混ぜ合わせて構成された混合分布モデルを、混合ガウス分布モデルという。
混合ガウス分布モデルは、xを特徴量ベクトル、jを正規分布の番号、dを次元数としたとき、j番目の正規分布でのxの確率分布は、正規分布パラメータ(平均j、共分散行列j)により、以下の式で表される。
また、学習モデル作成部17は、混合分布手法にもとづき変換後特徴量データを複数のクラスタに分類するにあたり、正規分布の各パラメータを少しずつ調整することで、特徴が似ている測定データに分けた状態を近似して表現する。これは、EMアルゴリズムという手法によって実現される。EMアルゴリズムは、不完全データ、すなわち検出する測定データを学習しておらず、その発生確率が分からないような場合に用いられる。このような直接求められない値がある場合に、繰り返し演算を適用することによって値を推定する最尤推定の計算アルゴリズムの一つである。
モデル改変部18は、学習モデル記憶部17における学習モデル候補に対して、設定された閾値よりも混合比が低い値をとるクラスタ又は混合比が最も小さい値をとるクラスタを削除すること(以下、クラスタを削除することを「クラスタカット」と称する場合がある)により、学習モデル候補を改変して学習モデルを作成し、学習モデル記憶部17における学習モデル候補を学習モデルに更新する。
すなわち、本実施形態の異常検出システムによれば、例えば、図4に示すように、混合比が異常値(閾値未満)のクラスタが存在している場合、学習モデル候補におけるクラスタから、このような異常値のクラスタを削除することで、誤検出を抑制して、異常検出の精度を向上させることが可能になっている。
モデル改変部18により作成される学習モデルは、後述するように、クラスタの混合数ごとに複数であってもよい。その後、最適なクラスタの混合数にもとづいて、最も優れた学習モデルを決定し、学習モデルを完成させることができる。
また、本実施形態の異常検出システムにおいて、このようにして完成した学習モデルを記憶させるために、学習モデル記憶部17とは別個の記憶部を備えてもよい。
また、モデル改変部18により、検証用データセットの変換後特徴量データを用いて異常判定処理を行い、その結果にもとづいて、クラスタカットを行うことも好ましい。
すなわち、モデル改変部18は、学習モデル記憶部17の学習モデル候補における各クラスタについて検証用データセットの変換後特徴量データが外れ値として生起する確率(生起確率)を計算し、生起確率が設定した閾値よりも低い場合に正常と判定し、この変換後特徴量データに対応する検証用データが本来は異常である場合(誤判定の場合)、当該クラスタを学習モデル候補から削除することが好ましい。
なお、モデル改変部18によって、検証用データセットの特徴量データを入力して、写像部14により生成された基底を用いて特徴量データを写像し、写像された特徴量データの次元数を削減して新たな次元数とし、変換後特徴量データを生成し、学習モデル記憶部17の学習モデル候補における各クラスタについて変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも低い場合に正常と判定し、この変換後特徴量データに対応する検証用データが本来は異常である場合、当該クラスタを学習モデル候補から削除する構成とすることも可能である。
ここで、モデル改変部18による生起確率の計算手法は、同一の目的の処理を行い得る範囲において特に限定されないが、例えばマハラノビスタグチ(Maharanobis Taguchi, MT)法のマハラノビス距離を用いて好適に行うことができる。
具体的には、以下の式によりマハラノビス距離を算出することができる。
そして、得られたマハラノビス距離を以下の累積分布関数(CDF)に適用することで、生起確率を計算することができる。なお、後述する試験においては、閾値(threshold)を0.99(カイ二乗分布の片側有意水準1%)としている。
また、マハラノビスタグチ法にかえて、MTA(Maharanobis Taguchi Afjoint)法、RT(Recognition Taguchi)法、Taguchi法、及びTaguchi Schmidt法のいずれかを用いることもできる。
また、モデル改変部18は、特徴量データと各クラスタのマハラノビス距離の計算にあたり、各クラスタの重心を用いることができる。
また、「本来は異常である場合」は、変換後特徴量データに対応する検証用データが、検証用データセットにおける異常データであることを意味する。
さらに、学習モデル作成部17により、クラスタの混合数が相違する複数の学習モデル候補を作成させると共に、モデル改変部18により、複数の学習モデル候補のうちの真陽性の発生率が最も高いものを学習モデルに決定させることも好ましい。
すなわち、学習モデル作成部17は、設定された複数の混合数にもとづいて、変換後特徴量データ(写像データ)を混合数分のクラスタに分類して、混合数ごとに学習モデル候補を作成することが好ましい。
また、写像部14により、特徴量データ(検証用データセット)を入力して、写像部14により先に生成された基底を用いて特徴量データを写像し、写像された特徴量データの次元数を削減して新たな次元数とし、変換後特徴量データを生成することが好ましい。
そして、モデル改変部18により、混合数ごとに、学習モデル候補における各クラスタについて変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも高い場合に外れ値となることで異常と判定し、真陽性の発生率が最も高い学習モデル候補を学習モデルに決定することも好ましい。
なお、モデル改変部18によって、特徴量データ(検証用データセット)を入力して、写像部14により生成された基底を用いて特徴量データを写像し、写像された特徴量データの次元数を削減して新たな次元数とし、変換後特徴量データを生成し、混合数ごとに、学習モデル候補における各クラスタについて変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも高い場合に外れ値となることで異常と判定し、真陽性の発生率が最も高い学習モデル候補を学習モデルに決定する構成とすることも可能である。
真陽性の発生率は、例えば、検証用データセットにおいて事前に正常データと異常データを準備しておき、全ての異常データにおける異常データと判定されたものの割合として算出することができる。また、偽陽性の発生率は、全ての正常データにおける異常データと誤判定されたものの割合として算出することができる。
なお、本実施形態の異常検出システムは、学習モデルを作成するまでの構成を備えており、測定データの異常検出を行うものではないが、測定データの異常検出を行うことができる学習モデルを作成しているため、「異常検出システム」と称している。
次に、本実施形態の異常検出システムによる処理手順について、図5を参照して説明する。
まず、測定データ入力部10が、測定データを入力して、測定データ記憶部11に記憶させる(ステップ10)。
次いで、特徴量抽出部12が、測定データ記憶部11における測定データを読み込んで、特徴量を抽出し(ステップ11)、特徴量データを生成して、特徴量データ記憶部13に記憶させる。このとき、特徴量抽出部12は、特徴量データを学習用データセットと検証用データセットの2種類に分けて、特徴量データ記憶部13に記憶させることができる(ステップ12)。
次に、写像部14が、特徴量データ記憶部13における特徴量データを読み込んで、写像部による処理を実行する(ステップ13)。
このとき、写像部14は、学習用データセットの写像処理と次元削減を行う。
具体的には、写像部14は、主成分分析などにより、特徴量データに対応する特徴空間を定義する基底を生成して、この基底にもとづき特徴量データを写像する。また、設定された閾値にもとづき特徴空間の新たな次元数(圧縮後の次元数)を決定する。そして、写像された特徴量データの次元数を削減して新たな次元数とし、得られた変換後特徴量データを写像データとして、写像データ記憶部15に記憶させる。
次に、学習モデル作成部16が、学習モデル候補を作成して、学習モデル記憶部17に記憶させる(ステップ14)。
このとき、学習モデル作成部16は、写像データ記憶部15から変換後特徴量データ(写像データ)を読み込んで、混合ガウス分布モデルなどにより、変換後特徴量データを複数のクラスタに分類し、学習モデル候補を作成して、これを学習モデル記憶部17に記憶させる。
次に、モデル改変部18が、学習モデル候補に対してクラスタカットを行うことにより、学習モデルを作成し、最終的な学習モデルを決定する(ステップ15)。
このとき、モデル改変部18が、学習モデル候補に対して、設定された閾値よりも混合比が低い値をとるクラスタ又は混合比が最も小さい値をとるクラスタを削除することにより、学習モデル候補を改変して学習モデルを作成することが好ましい。
また、モデル改変部18が、学習モデル候補における各クラスタについて変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも低い場合に正常と判定し、特徴量データに対応する測定データが本来は異常である場合、当該クラスタを学習モデル候補から削除することにより、学習モデル候補を改変して学習モデルを作成することも好ましい。
さらに、モデル改変部18が、混合数ごとに、学習モデル候補における各クラスタについて変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも高い場合に外れ値となることで異常と判定し、真陽性の発生率が最も高い学習モデル候補を最終的な学習モデルとして決定することも好ましい。
このような本実施形態の異常検出システム及び異常検出プログラムによれば、学習モデル候補から混合比が一定以下の低い値をとるクラスタなどを削除して学習モデルを作成することができる。このため、実質的に入力データの質を向上させることができ、異常検出の精度を向上させることが可能である。
[第二実施形態]
次に、本発明の第二実施形態に係る異常検出システム、及び異常検出プログラムについて、図6及び図7を参照して説明する。
本実施形態は、第一実施形態により完成した学習モデルを用いて、測定データの異常判定を行う装置に関するものである。
本実施形態の異常検出システムに相当する異常検出装置1aは、図6に示すように、測定データ入力部10a、測定データ記憶部11a、特徴量抽出部12a、特徴量データ記憶部13a、写像部14a、写像データ記憶部15a、学習モデル記憶部17a、異常判定部19a、及び判定結果記憶部20aを備えている。
本実施形態の異常検出装置1aにおける測定データ入力部10a、測定データ記憶部11a、特徴量データ記憶部13a、写像データ記憶部15a、学習モデル記憶部17aは、第一実施形態における同一名称の構成と同様のものとすることができる。また、本実施形態の異常検出装置1aにおけるその他の構成についても、以下に説明する点を除いて、第一実施形態における同一名称の構成と同様のものとすることができる。
特徴量抽出部12aは、測定データ記憶部11aから測定データを読み込んで、この測定データにもとづき特徴量を計算し、特徴量データ(測定データセット)を生成して特徴量データ記憶部13aに記憶させる。
写像部14aは、特徴量データ記憶部13aから特徴量データを読み込んで、この特徴量データに対して状態空間モデルへの写像手法を用いて、設定された基底にもとづき特徴量データを写像し、写像された特徴量データの次元数を削減して新たな次元数として、変換後特徴量データを生成する。
このとき、写像部14aは、第一実施形態において作成された特徴量データを変換後特徴量データに変換する変換式を用いて、特徴量データを変換後特徴量データに変換し、変換後特徴量データを写像データとして、写像データ記憶部15aに記憶させることができる。なお、本実施形態の異常検出システム1aに変換式記憶部を設けて、上記の変換式を予め記憶させておくことができる。
異常判定部19aは、学習モデル記憶部17aの学習モデル候補における各クラスタについて、写像データ記憶部15aにおける変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも高い場合に外れ値となることで、対応する測定データを異常と判定して、この判定結果を判定結果記憶部20aに記憶させる。
異常判定部19aによる生起確率の計算は、第一実施形態のモデル改変部18と同一の手法で行うことができ、例えばマハラノビスタグチ(Maharanobis Taguchi, MT)法のマハラノビス距離を用いて好適に行うことができる。
次に、本実施形態の異常検出システムの処理手順について、図7を参照して説明する。
まず、測定データ入力部10aが、測定データを入力して、測定データ記憶部11aに記憶させる(ステップ30)。
次いで、特徴量抽出部12aが、測定データ記憶部11aにおける測定データを読み込んで、特徴量を抽出し(ステップ31)、特徴量データを(測定データセット)生成して、特徴量データ記憶部13aに記憶させる(ステップ32)。
次に、写像部14aが、特徴量データ記憶部13aにおける特徴量データを読み込んで、写像部による処理を実行する(ステップ33)。
このとき、写像部14aは、測定データセットの写像処理と次元削減を行う。
具体的には、写像部14aは、上記の変換式を用いて、特徴量データを変換後特徴量データに変換し、変換後特徴量データを写像データとして写像データ記憶部15aに記憶させる。
次に、異常判定部19aが、測定データの異常判定処理を行う(ステップ34)。
このとき、異常判定部19aは、学習モデル記憶部17aの学習モデルにおける各クラスタについて、写像データ記憶部15aにおける変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも高い場合に外れ値となることで、対応する測定データを異常と判定して、この判定結果を判定結果記憶部20aに記憶させる。
このような本実施形態の異常検出システム及び異常検出プログラムによれば、例えば第一実施形態の異常検出システムにより学習モデルと特徴量データを変換後特徴量データに変換する変換式とを作成し、これらを本実施形態の異常検出システムに記憶させることにより、本実施形態の異常検出システムによって測定データの異常判定を行うことが可能である。
[第三実施形態]
次に、本発明の第三実施形態に係る異常検出システム、及び異常検出プログラムについて、図8及び図9を参照して説明する。
本実施形態は、第一実施形態と第二実施形態を組み合わせて、第一実施形態の異常検出システムに異常判定を行うための構成を追加したものである。
本実施形態の異常検出システムに相当する異常検出装置1bは、図8に示すように、測定データ入力部10b、測定データ記憶部11b、特徴量抽出部12b、特徴量データ記憶部13b、写像部14b、写像データ記憶部15b、学習モデル作成部16b、学習モデル記憶部17b、モデル改変部18b、異常判定部19b、及び判定結果記憶部20bを備えている。
本実施形態の異常検出装置1bにおける測定データ入力部10b、測定データ記憶部11b、特徴量抽出部12b、特徴量データ記憶部13b、写像部14b、写像データ記憶部15b、学習モデル作成部16b、学習モデル記憶部17b、モデル改変部18bは、第一実施形態における同一名称の構成と同様のものとすることができる。また、本実施形態の異常検出装置1bにおける異常判定部19b、及び判定結果記憶部20bは、第二実施形態における同一名称の構成と同様のものとすることができる。
すなわち、学習モデルの作成段階において、特徴量抽出部12bは、測定データ記憶部11bから測定データを読み込んで、この測定データにもとづき特徴量を計算し、特徴量データを生成して特徴量データ記憶部13bに記憶させる。
このとき、測定データを2つの集合に分けて、特徴量抽出部12bにより、特徴量データとして、学習モデル候補を作成するために用いる学習用データセットと、学習モデル候補を改変して学習モデルを完成させるために用いる検証用データセットの2種類を生成させて、特徴量データ記憶部13bに記憶させる。
また、写像部14bは、特徴量データ記憶部13bから特徴量データ(学習用データセット)を読み込んで、この特徴量データに対して状態空間モデルへの写像手法を用いて、特徴量データに対応する特徴空間を定義する基底を生成し、この基底にもとづき特徴量データを写像する。また、写像部14bは、設定された閾値にもとづいて、特徴空間の新たな次元数(圧縮後の次元数)を決定する。さらに、写像部14bは、写像された特徴量データの次元数を削減して、新たな次元数とする次元削減処理を行う。そして、写像部14bは、得られた変換後特徴量データを写像データとして、写像データ記憶部15bに記憶させる。また、このとき、写像部14bにより、特徴量データを変換後特徴量データに変換する変換式が作成される。
また、学習モデルの完成後、異常検出段階において、特徴量抽出部12bは、測定データ記憶部11bから測定データを読み込んで、この測定データにもとづき特徴量を計算し、特徴量データ(測定データセット)を生成して特徴量データ記憶部13bに記憶させる。
写像部14bは、特徴量データ記憶部13bから特徴量データを読み込んで、この特徴量データに対して状態空間モデルへの写像手法を用いて、設定された基底にもとづき特徴量データを写像し、写像された特徴量データの次元数を削減して新たな次元数として、変換後特徴量データを生成する。
このとき、写像部14bは、上記の変換式を用いて、特徴量データを変換後特徴量データに変換し、変換後特徴量データを写像データとして、写像データ記憶部15bに記憶させることができる。
次に、本実施形態の異常検出システムによる処理手順について、図9を参照して説明する。
まず、測定データ入力部10bが、測定データを入力して、測定データ記憶部11bに記憶させる(ステップ50)。
次いで、特徴量抽出部12bが、測定データ記憶部11bにおける測定データを読み込んで、特徴量を抽出し(ステップ51)、特徴量データを生成して、特徴量データ記憶部13bに記憶させる。このとき、特徴量抽出部12bは、特徴量データを学習用データセットと検証用データセットの2種類に分けて、特徴量データ記憶部13bに記憶させる(ステップ52)。
次に、写像部14bが、特徴量データ記憶部13bにおける特徴量データを読み込んで、写像部による処理を実行する(ステップ53)。このとき、写像部14bは、学習用データセットの写像処理と次元削減を行う。
次いで、学習モデル作成部16bが、学習モデル候補を作成して、学習モデル記憶部17bに記憶させる(ステップ54)。
次に、モデル改変部18bが、学習モデル候補に対してクラスタカットを行うことにより、学習モデルを作成し、最終的な学習モデルを決定する(ステップ55)。
そして、異常検出段階において、測定データ入力部10bが、測定データを入力して、測定データ記憶部11bに記憶させる(ステップ56)。
次いで、特徴量抽出部12bが、測定データ記憶部11bにおける測定データを読み込んで、特徴量を抽出し(ステップ57)、特徴量データを(測定データセット)生成して、特徴量データ記憶部13bに記憶させる(ステップ58)。
次に、写像部14bが、特徴量データ記憶部13bにおける特徴量データを読み込んで、写像部による処理を実行する(ステップ59)。このとき、写像部14bは、測定データセットの写像処理と次元削減を行う。
最後に、異常判定部19bが、測定データの異常判定処理を行う(ステップ60)。
このとき、異常判定部19bは、学習モデル記憶部17bの学習モデルにおける各クラスタについて、写像データ記憶部15bにおける変換後特徴量データが生起する生起確率を計算し、生起確率が設定した閾値よりも高い場合に外れ値となることで、対応する測定データを異常と判定して、この判定結果を判定結果記憶部20bに記憶させる。
このような本実施形態の異常検出システム及び異常検出プログラムによれば、学習モデル候補から混合比が一定以下の低い値をとるクラスタなどを削除して学習モデルを作成することができる。また、この異常検出システムをそのまま異常検出に用いることができる。
これにより、本実施形態によれば、実質的に入力データの質を向上させ、異常検出の精度を向上させることが可能となっている。
上記実施形態の異常検出システムは、本発明の異常検出プログラムに制御されたコンピュータを用いて実現することができる。コンピュータのCPUは、異常検出プログラムにもとづいてコンピュータの各構成要素に指令を送り、異常検出システムの動作に必要となる所定の処理、例えば、測定データの入力処理、特徴量の抽出処理、データセットの作成処理、写像部による処理、学習モデルの生成処理、モデル改変処理、異常判定処理等を行わせる。このように、本発明の異常検出システムにおける各処理、動作は、プログラムとコンピュータとが協働した具体的手段により実現できるものである。
プログラムは予めROM、RAM等の記録媒体に格納され、コンピュータに実装された記録媒体から当該コンピュータにプログラムを読み込ませて実行されるが、例えば通信回線を介してコンピュータに読み込ませることもできる。
また、プログラムを格納する記録媒体は、例えば半導体メモリ、磁気ディスク、光ディスク、その他任意のコンピュータで読取り可能な任意の記録手段により構成できる。
以下、本発明の実施形態に係る異常検出システム及び異常検出プログラムを用いて学習モデルを作成し、その効果を評価した試験について、図10〜図13を用いて説明する。
実施例として、本発明の第一実施形態に係る異常検出システムを使用した。また、参考例として、本発明の第一実施形態に係る画像処理装置の一部を変更したものを使用した。具体的には、参考例ではモデル改変部18を省略して、クラスタカットを行わないように変更した。
本試験において、画像データを測定データとして用いるため、画像データを準備した。
具体的には、図10に示すように、形状と色の異なる9種類の画像を含む画像クラスを用意した。各画像クラスにおける画像のサイズは、50×50ピクセルであり、画像中央の20×20〜34×34ピクセル内に検出対象が描かれている。
画像クラス1〜3の検出対象の形状は円形であり、画像クラス4〜6の検出対象の形状は三角形であり、画像クラス7〜9の検出対象の形状は四角形である。
また、画像クラス1,4,7の検出対象の色は赤系であり、RGB空間においてRの値がG,Bより大きいことを示している。また、画像クラス2,5,8の検出対象の色は緑系であり、RGB空間においてGの値がR,Bより大きいことを示している。画像クラス3,6,9の検出対象の色は青系であり、RGB空間においてBの値がR,Gより大きいことを示している。なお、代表画像は、それぞれの画像クラスにおける代表的な画像の一例を示している。
また、画像クラス1,3〜9に含まれる画像は、全て正常のものであり、画像クラス2に含まれる画像は、全て異常のものであるとしている。
具体的には、学習用データセットを作成するための画像クラス1,3〜9に含まれる画像は各500枚であり、ステータスは全て正常としている。また、学習用データセットを作成するための画像クラス2に含まれる画像は各280枚であり、ステータスは全て異常としている。
さらに、検証用データセットを作成するための画像クラス1,3〜9に含まれる画像は各100枚であり、ステータスは全て正常としている。また、検証用データセットを作成するための画像クラス2に含まれる画像は各800枚であり、ステータスは全て異常としている。
上記において正常、異常の違いは、画像クラスに対してステータスを恣意的に決定している。
すなわち、学習用データセットにおいてステータスが異常の画像280枚は、全4280枚の画像中の7%程度であり、本実施形態の異常検出システムによって、これらが異常と判定される学習モデルが作成されることを想定している。
各画像の背景は、黒の濃淡によるグレー色(0〜25輝度(ランダム)に1ピクセルごとに決定)を設定し、ガウシアンフィルタを加えてぼやかすことにより描かれている。
また、全ての画像クラスの画像における検出対象に対し、ノイズがランダムに加えられている。具体的には、グレー色(0〜25輝度(ランダム))が1ピクセルごとに20%の確率で加えられている。このように、正常データと異常データの双方にノイズを加えることによって、学習モデルによる異常検出の難易度を向上させている。なお、これらのノイズは、特徴量抽出部12による特徴量の抽出処理、及び写像部14による主成分分析における次元削減処理によって、除去又は低減され得ると推定される。
特徴量抽出部12による特徴量の抽出において対象とする特徴量は、図11に示すように、形状に関する特徴量6種、輝度の特徴量を算出する色空間が4種、輝度の特徴量が20種であり、全部で86種類(=6+4×20)とした。
そして、写像部14により学習用データセットを用いて主成分分析を実施して、基底を生成した。また、生成した基底を用いて学習用データセットを写像し、写像した学習用データセットの主成分が持つ固有値を上位から足し合わせて、その合計値が95%未満で最大の値になるように、圧縮後の次元数を決定して、次元の削減を行った。
具体的には、図12に示す特徴量86種類に対応する86次元が、11次元に圧縮された。また、検証用データセットも同様に写像した後、同じ次元数に圧縮した。
次に、学習モデル作成部16により、圧縮された学習用データセット(変換後特徴量データ)を用いて、混合ガウス分布モデルによる学習モデル候補を生成した。このとき、クラスタの混合数を1〜20の20種類とした。
そして、実施例では、モデル改変部18により、圧縮された検証用データセット(変換後特徴量データ)を用いて、混合数ごとに、学習モデル候補による異常判定処理を行った。また、モデル改変部18により、混合数ごとに、混合比率が一番小さいクラスと、偽陰性(異常を正常と誤判定)が発生したクラスを削除することにより、クラスタカットを実施した。なお、クラスタカットは、閾値を片側有意水準0%として計算することにより行い、これによってそのクラスに存在したデータを全て外れ値とした。
一方、参考例では、このようなクラスタカットは、行わなかった。
以上によって得られた実施例と参考例のそれぞれの学習モデル候補について、混合数ごとに、真陽性率(異常を異常と判定した割合)と偽陽性率(正常を異常と誤判定した割合)を算出した。その結果を図13に示す。
異常検出システムにおいては、異常を異常と的確に判定することが重要であるところ、これらの図に示されるように、実施例では、ほとんどの混合数について、真陽性率が1.00であり、ほぼ全ての異常データを異常と判定できていることが分かる。これに対して、参考例は、全ての混合数について、真陽性率の点で実施例に大きく劣っている。
一方、実施例ではクラスタカットを行うことにより、偽陽性率が低下しており、真陽性率と偽陽性率はトレードオフの関係を示している。この傾向は混合数が低い場合に顕著に表れているが、混合数が9を超えるあたりから偽陽性率の低下が抑制されており,本試験では混合数18のときに最も良い性能が得られている。
したがって、本実施形態の異常検出システムにおけるモデル改変部18は、この場合、混合数18の学習モデル候補を最終的な学習モデルとして好適に決定することができる。
本発明は、以上の実施形態に限定されるものではなく、本発明の範囲内において、種々の変更実施が可能であることは言うまでもない。
例えば、異常検出システムにおける各構成を複数の情報処理装置に分散して持たせたり、特徴量として実施形態及び実施例に示したもの以外のものを含めて使用したりするなど適宜変更することが可能である。
本発明は、監視対象の装置などから取得されるプロセスデータや、製品などから取得される検査データ等を用いて監視対象の異常の有無の検査などを行う場合に好適に利用することが可能である。
1、1a、1b 異常検出装置
10、10a、10b 測定データ入力部
11、11a、11b 測定データ記憶部
12、12a、12b 特徴量抽出部
13、13a、13b 特徴量データ記憶部
14、14a、14b 写像部
15、15a、15b 写像データ記憶部
16、16b 学習モデル作成部
17、17a、17b 学習モデル記憶部
18、18b モデル改変部
19a、19b 異常判定部
20a、20b 判定結果記憶部

Claims (14)

  1. 監視対象の異常を検出する異常検出システムであって、
    監視対象に関するデータを用いて特徴量を計算して得られた特徴量データに対して状態空間モデルへの写像手法を用いて前記特徴量データに対応する特徴空間を定義する基底を生成し、前記基底にもとづき前記特徴量データを写像して、前記特徴空間の新たな次元数を決定し、写像された前記特徴量データの次元数を削減して前記新たな次元数とし、変換後特徴量データを生成する写像部と、
    混合分布手法にもとづき前記変換後特徴量データを複数のクラスタに分類して、学習モデル候補を作成する学習モデル作成部と、
    前記学習モデル候補に対して、設定された閾値よりも混合比が低い値をとるクラスタ又は混合比が最も小さい値をとるクラスタを削除することにより、前記学習モデル候補を改変して学習モデルを作成するモデル改変部と、を備える
    ことを特徴とする異常検出システム。
  2. 前記写像部が、
    監視対象に関する他のデータを用いて特徴量を計算して得られた他の特徴量データに対して状態空間モデルへの写像手法を用いて前記基底にもとづき前記他の特徴量データを写像し、写像された前記他の特徴量データの次元数を削減して前記新たな次元数として、他の変換後特徴量データを生成し、
    前記モデル改変部が、
    前記学習モデル候補における各クラスタについて前記他の変換後特徴量データが生起する生起確率を計算し、前記生起確率が設定した閾値よりも低い場合に正常と判定し、
    前記他の特徴量データに対応する前記他のデータが本来は異常である場合、当該クラスタを前記学習モデル候補から削除する
    ことを特徴とする請求項1記載の異常検出システム。
  3. 前記学習モデル作成部が、
    設定された複数の混合数にもとづいて、前記変換後特徴量データを前記混合数分のクラスタに分類して、前記混合数ごとに学習モデル候補を作成し、
    前記モデル改変部が、
    前記混合数ごとに、前記学習モデル候補における各クラスタについて前記他の変換後特徴量データが生起する生起確率を計算し、前記生起確率が設定した閾値よりも高い場合に異常と判定し、
    真陽性の発生率が最も高い前記学習モデル候補を前記学習モデルに決定する
    ことを特徴とする請求項2記載の異常検出システム。
  4. 前記写像部が、設定された閾値にもとづき前記特徴空間の新たな次元数を決定することを特徴とする請求項1〜3のいずれかに記載の異常検出システム。
  5. 前記写像部が、
    監視対象に関する新たなデータを用いて特徴量を計算して得られた新たな特徴量データに対して状態空間モデルへの写像手法を用いて前記基底にもとづき前記新たな特徴量データを写像し、写像された前記新たな特徴量データの次元数を削減して前記新たな次元数として、新たな変換後特徴量データを生成し、
    当該異常検出システムにおいて、
    前記学習モデルにおける各クラスタについて前記新たな変換後特徴量データが生起する生起確率を計算し、前記生起確率が設定した閾値よりも高い場合に異常と判定する異常判定部をさらに備えた
    ことを特徴とする請求項1〜4のいずれかに記載の異常検出システム。
  6. 前記監視対象に関するデータが、監視対象について測定されたデータであることを特徴とする請求項1〜5のいずれかに記載の異常検出システム。
  7. 前記状態空間モデルへの写像手法が、主成分分析、独立成分分析、カーネル主成分分析、LDA(Latent Dirichlet Allocation)、近傍探索手法の少なくともいずれかであることを特徴とする請求項1〜6のいずれかに記載の異常検出システム。
  8. 前記混合分布手法が、正規分布、t分布、ポアソン分布、ベルヌ−イ分布、ディリクレ分布の少なくともいずれかによる分布モデルであることを特徴とする請求項1〜7のいずれかに記載の異常検出システム。
  9. 前記監視対象について測定されたデータが、画像、寸法、色、欠陥、排出数、透過度、重量、強度、及び表面粗さの少なくともいずれかであることを特徴とする請求項6〜8のいずれかに記載の異常検出システム。
  10. 前記監視対象について測定されたデータが、音、温度、湿度、振動、変位、速度、加速度、回転角、角速度、角加速度、電圧、電流、光量、及び圧力の少なくともいずれかであることを特徴とする請求項6〜9のいずれかに記載の異常検出システム。
  11. 監視対象の異常を検出する異常検出プログラムであって、
    コンピュータを、
    監視対象に関するデータを用いて特徴量を計算して得られた特徴量データに対して状態空間モデルへの写像手法を用いて前記特徴量データに対応する特徴空間を定義する基底を生成し、前記基底にもとづき前記特徴量データを写像して、前記特徴空間の新たな次元数を決定し、写像された前記特徴量データの次元数を削減して前記新たな次元数とし、変換後特徴量データを生成する写像部、
    混合分布手法にもとづき前記変換後特徴量データを複数のクラスタに分類して、学習モデル候補を作成する学習モデル作成部、及び、
    前記学習モデル候補に対して、設定された閾値よりも混合比が低い値をとるクラスタ又は混合比が最も小さい値をとるクラスタを削除することにより、前記学習モデル候補を改変して学習モデルを作成するモデル改変部として機能させる
    ことを特徴とする異常検出プログラム。
  12. 前記写像部に、
    監視対象に関する他のデータを用いて特徴量を計算して得られた他の特徴量データに対して状態空間モデルへの写像手法を用いて前記基底にもとづき前記他の特徴量データを写像させ、写像された前記他の特徴量データの次元数を削減させて前記新たな次元数とさせ、他の変換後特徴量データを生成させ、
    前記モデル改変部に、
    前記学習モデル候補における各クラスタについて前記他の変換後特徴量データが生起する生起確率を計算させ、前記生起確率が設定した閾値よりも低い場合に正常と判定させ、
    前記他の特徴量データに対応する前記他のデータが本来は異常である場合、当該クラスタを前記学習モデル候補から削除させる
    ことを特徴とする請求項11記載の異常検出プログラム。
  13. 前記学習モデル作成部に、
    設定された複数の混合数にもとづいて、前記変換後特徴量データを前記混合数のクラスタに分類させて、前記混合数ごとに学習モデル候補を作成させ、
    前記モデル改変部に、
    前記混合数ごとに、前記学習モデル候補における各クラスタについて前記他の変換後特徴量データが生起する生起確率を計算させ、前記生起確率が設定した閾値よりも高い場合に異常と判定させ、
    真陽性の発生率が最も高い前記学習モデル候補を前記学習モデルに決定させる
    ことを特徴とする請求項12記載の異常検出プログラム。
  14. 前記写像部に、
    監視対象に関する新たなデータを用いて特徴量を計算して得られた新たな特徴量データに対して状態空間モデルへの写像手法を用いて前記基底にもとづき前記新たな特徴量データを写像させ、写像された前記新たな特徴量データの次元数を削減させて前記新たな次元数とさせ、新たな変換後特徴量データを生成させ、
    前記コンピュータを、
    前記学習モデルにおける各クラスタについて前記新たな変換後特徴量データが生起する生起確率を計算し、前記生起確率が設定した閾値よりも高い場合に異常と判定する異常判定部としてさらに機能させる
    ことを特徴とする請求項11〜13のいずれかに記載の異常検出プログラム。
JP2019041040A 2019-03-06 2019-03-06 異常検出システム、及び異常検出プログラム Active JP7348588B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019041040A JP7348588B2 (ja) 2019-03-06 2019-03-06 異常検出システム、及び異常検出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019041040A JP7348588B2 (ja) 2019-03-06 2019-03-06 異常検出システム、及び異常検出プログラム

Publications (2)

Publication Number Publication Date
JP2020144626A true JP2020144626A (ja) 2020-09-10
JP7348588B2 JP7348588B2 (ja) 2023-09-21

Family

ID=72353651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019041040A Active JP7348588B2 (ja) 2019-03-06 2019-03-06 異常検出システム、及び異常検出プログラム

Country Status (1)

Country Link
JP (1) JP7348588B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220066633A (ko) * 2020-11-16 2022-05-24 한국전자통신연구원 탐지대상 이미지에서의 이상 부분 탐지 방법 및 시스템, 이의 복원 모델 학습 방법
JP2022114704A (ja) * 2021-01-27 2022-08-08 三菱重工業株式会社 多変量データの異常診断支援方法及び異常診断支援装置
WO2022259966A1 (ja) * 2021-06-10 2022-12-15 国立大学法人東京大学 人工衛星監視装置、人工衛星監視方法及びプログラム
WO2024070390A1 (ja) * 2022-09-26 2024-04-04 株式会社Screenホールディングス 学習装置、情報処理装置、基板処理装置、基板処理システム、学習方法および処理条件決定方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257344A (ja) * 2009-04-27 2010-11-11 Nippon Telegr & Teleph Corp <Ntt> 視線位置推定方法、視線位置推定装置、プログラム、及び記録媒体
JP2011013818A (ja) * 2009-06-30 2011-01-20 Nippon Hoso Kyokai <Nhk> 顔特徴点抽出装置及び顔特徴点抽出プログラム
JP2016206784A (ja) * 2015-04-17 2016-12-08 株式会社Ihi データ分析装置及びデータ分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257344A (ja) * 2009-04-27 2010-11-11 Nippon Telegr & Teleph Corp <Ntt> 視線位置推定方法、視線位置推定装置、プログラム、及び記録媒体
JP2011013818A (ja) * 2009-06-30 2011-01-20 Nippon Hoso Kyokai <Nhk> 顔特徴点抽出装置及び顔特徴点抽出プログラム
JP2016206784A (ja) * 2015-04-17 2016-12-08 株式会社Ihi データ分析装置及びデータ分析方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220066633A (ko) * 2020-11-16 2022-05-24 한국전자통신연구원 탐지대상 이미지에서의 이상 부분 탐지 방법 및 시스템, 이의 복원 모델 학습 방법
KR102605692B1 (ko) * 2020-11-16 2023-11-27 한국전자통신연구원 탐지대상 이미지에서의 이상 부분 탐지 방법 및 시스템, 이의 복원 모델 학습 방법
JP2022114704A (ja) * 2021-01-27 2022-08-08 三菱重工業株式会社 多変量データの異常診断支援方法及び異常診断支援装置
JP7125518B2 (ja) 2021-01-27 2022-08-24 三菱重工業株式会社 多変量データの異常診断支援方法及び異常診断支援装置
WO2022259966A1 (ja) * 2021-06-10 2022-12-15 国立大学法人東京大学 人工衛星監視装置、人工衛星監視方法及びプログラム
WO2024070390A1 (ja) * 2022-09-26 2024-04-04 株式会社Screenホールディングス 学習装置、情報処理装置、基板処理装置、基板処理システム、学習方法および処理条件決定方法

Also Published As

Publication number Publication date
JP7348588B2 (ja) 2023-09-21

Similar Documents

Publication Publication Date Title
JP7348588B2 (ja) 異常検出システム、及び異常検出プログラム
CN111292303B (zh) 焊缝缺陷类别检测方法、装置、电子设备及存储介质
JP6941123B2 (ja) 適応型追加学習を用いた細胞のアノテーション法及びアノテーションシステム
US20210089895A1 (en) Device and method for generating a counterfactual data sample for a neural network
JP5414416B2 (ja) 情報処理装置及び方法
US20220269996A1 (en) Information processing apparatus, information processing method, and storage medium
CN114092387B (zh) 生成可用于检查半导体样本的训练数据
EP3220353B1 (en) Image processing apparatus, image processing method, and recording medium
US20140169639A1 (en) Image Detection Method and Device
US20220058431A1 (en) Semantic input sampling for explanation (sise) of convolutional neural networks
JP2013161295A (ja) ラベル付加装置、ラベル付加方法及びプログラム
JP2019158628A (ja) 検査装置、検査方法、及び検査プログラム
CN111739017A (zh) 一种在样本不平衡条件下显微图像的细胞识别方法及系统
CN114746859A (zh) 评价方法、评价程序以及信息处理装置
TWI601098B (zh) 影像分類裝置及影像分類方法
CN111814852A (zh) 图像检测方法、装置、电子设备和计算机可读存储介质
JP6643856B2 (ja) 分類方法、検査方法、検査装置、およびプログラム
JP2006085616A (ja) 画像処理アルゴリズム評価方法および装置、画像処理アルゴリズム生成方法および装置、プログラムならびにプログラム記録媒体
JP2006292615A (ja) 外観検査装置、外観検査方法、コンピュータを外観検査装置として機能させるためのプログラムおよび記録媒体
JP5298552B2 (ja) 判別装置、判別方法及びプログラム
JP2007018176A (ja) 学習装置、学習方法、学習プログラム、記録媒体、パターン認識装置およびパターン認識方法
JP6930195B2 (ja) モデル同定装置、予測装置、監視システム、モデル同定方法および予測方法
JP2021124886A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
WO2012092132A2 (en) Determining the uniqueness of a model for machine vision
CN114820003A (zh) 定价信息异常识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230822

R150 Certificate of patent or registration of utility model

Ref document number: 7348588

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150