WO2022244250A1

WO2022244250A1 - 情報生成装置、判定装置、情報生成方法、判定方法及び記憶媒体

Info

Publication number: WO2022244250A1
Application number: PCT/JP2021/019399
Authority: WO
Inventors: 康敬馬場崎; 君朴
Original assignee: 日本電気株式会社
Priority date: 2021-05-21
Filing date: 2021-05-21
Publication date: 2022-11-24
Also published as: JPWO2022244250A1

Abstract

情報生成装置１Ｘは、主に、特徴情報取得手段１４Ｘと、低分散次元選択手段１５Ｘと、基準情報生成手段１６Ｘとを備える。特徴情報取得手段１４Ｘは、正常状態を表すデータの特徴情報を取得する。低分散次元選択手段１５Ｘは、特徴情報を表す特徴空間において特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択する。基準情報生成手段１６Ｘは、低分散次元により特徴情報を表した低分散次元特徴情報に基づいて、低分散次元において正常状態を表す基準情報を生成する。

Description

情報生成装置、判定装置、情報生成方法、判定方法及び記憶媒体

　本開示は、情報生成装置、判定装置、情報生成方法、判定方法及び記憶媒体の技術分野に関する。

　画像解析により異常検知を行う技術が存在する。例えば、特許文献１には、部品の検査方法において、正常な状態を表す画像データを教師データとして用いてニューラルネットワークの学習を行い、学習したニューラルネットワークに検査用の画像を入力することで検査用の画像における異常の有無の判定を行う技術が開示されている。また、非特許文献１には、画像による異常判定において、正常データのみを用いて特定した特徴分布からのずれに基づき異常の有無を判定する技術が開示されている。また、非特許文献１には、主成分分析による特徴次元の削減を行う技術についても開示されている。

国際公開ＷＯ２０２０／０３１９８４

Paolo Napoletano, Flavio Piccoli and Raimondo Schettini, "Anomaly Detection in Nanofibrous Materials by CNN-Based Self-Similarity", MDPI, Sensors 2018, 18, 209.

　異常検知において、低処理コストとなるように特徴次元の削減を行った場合、異常検知精度も同時に低下してしまう虞がある。

　本開示の目的の一つは、上述した課題を鑑み、処理コストを低減しつつ高精度な異常検知を実現する、又は、実現するために必要な情報を生成する情報生成装置、判定装置、情報生成方法、判定方法及び記憶媒体を提供することである。

　情報生成装置の一の態様は、
　正常状態を表すデータの特徴情報を取得する特徴情報取得手段と、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択する低分散次元選択手段と、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する基準情報生成手段と、
を有する情報生成装置。

　情報生成方法の一の態様は、
　コンピュータが、
　正常状態を表すデータの特徴情報を取得し、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択し、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する、
情報生成方法である。

　記憶媒体の一の態様は、
　正常状態を表すデータの特徴情報を取得し、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択し、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する処理をコンピュータに実行させるプログラムを格納する記憶媒体である。

　処理コストを低減しつつ高精度な異常検知を実現する、又は、実現するために必要な情報を生成することが可能となる。

第１実施形態における異常検知システムの概略構成である。（Ａ）情報生成装置のハードウェア構成の一例を示す。（Ｂ）判定装置のハードウェア構成の一例を示す。情報生成処理に関する情報生成装置の機能ブロックの一例を示す。（Ａ）２次元特徴空間上において正常点の分布を抽象的に表した図である。（Ｂ）（Ａ）において、異常データ及びその距離を明示した図である。複数の次元数及び距離閾値の組に対する識別精度の遷移を表すグラフである。情報生成処理の処理手順を示すフローチャートの一例である。異常判定処理に関する判定装置の機能ブロックの一例である。異常判定処理の処理手順を示すフローチャートの一例である。第２実施形態に係る情報生成装置の概略構成を示す。第２実施形態において情報生成装置が実行する処理手順を示すフローチャートの一例である。

　以下、図面を参照しながら、情報生成装置、判定装置、情報生成方法、判定方法及び記憶媒体の実施形態について説明する。

　＜第１実施形態＞
　（１）全体構成
　図１は、第１実施形態における異常検知システム１００の概略構成である。異常検知システム１００は、カメラで撮影した物体の異常を検知するシステムであって、異常検知に必要な情報を生成する処理（「情報生成処理」とも呼ぶ。）と、異常の有無について判定する処理（「異常判定処理」とも呼ぶ。）とを実行する。異常検知システム１００は、主に、情報生成処理を行う情報生成装置１と、情報生成装置１及び判定装置３が参照する情報を記憶する記憶装置２と、異常判定処理を行う判定装置３とを有する。

　情報生成装置１は、記憶装置２の教師データ記憶部２１が記憶する教師データに基づいて、情報生成処理を実行し、情報生成処理により生成したデータを記憶装置２の生成データ記憶部２２に記憶する。

　記憶装置２は、情報生成処理及び異常判定処理に必要な情報を記憶する。記憶装置２は、情報生成装置１又は判定装置３に接続又は内蔵されたハードディスクなどの外部記憶装置であってもよく、フラッシュメモリなどの記憶媒体であってもよく、情報生成装置１及び判定装置３とデータ通信を行うサーバ装置などであってもよい。また、記憶装置２は、複数の記憶装置から構成され、上述した各記憶部を分散して保有してもよい。

　記憶装置２は、機能的には、教師データ記憶部２１と、生成データ記憶部２２と、判定対象データ記憶部２３とを有する。

　教師データ記憶部２１は、情報生成装置１による情報生成処理に用いられる画像データである教師データを記憶する。教師データ記憶部２１には、少なくとも、異常検知の対象となる物（単に「対象物」とも呼ぶ。）が正常状態であるときの対象物を撮影した正常教師データと、正常でない異常状態の対象物を撮影した異常教師データとが含まれている。好適には、正常教師データには、正常であることを示すラベル（正常ラベル）が付され、異常教師データには、異常であることを示すラベル（異常ラベル）が付されている。なお、異常教師データは、後述する検証用のデータであって、正常教師データよりも数が少ない。

　生成データ記憶部２２は、情報生成装置１が実行する情報生成処理により生成されたデータを記憶する。生成データ記憶部２２は、主に、「次元削減情報Ｉ１」と、「正常分布情報Ｉ２」と、「閾値情報Ｉ３」とを記憶する。ここで、次元削減情報Ｉ１は、教師データの特徴空間を、特徴空間より低い次元に変換するための情報（例えば変換行列）である。後述するように、「特徴空間より低い次元」は、特徴空間での正常教師データの分散が最も低くなる所定個数分の軸により構成される次元であり、以後では「低分散次元」とも呼ぶ。正常分布情報Ｉ２は、低分散次元での正常教師データの分布（辞書）を表す情報である。閾値情報Ｉ３は、低分散次元において異常か否かを判定するための閾値を表す。これらの各情報の生成方法の詳細については後述する。正常分布情報Ｉ２及び閾値情報Ｉ３は、低分散次元において対象物の正常状態を表す基準情報に相当する。

　判定対象データ記憶部２３は、異常判定処理において用いられる判定対象データを記憶する。判定対象データは、異常判定処理において異常があるか否か判定される対象となる対象物が撮影された画像データである。

　なお、記憶装置２は、上述した情報に加えて、情報生成処理及び異常判定処理に必要な種々の情報を記憶してもよい。例えば、記憶装置２は、教師データ又は判定対象データから特徴抽出を行う特徴抽出器のパラメータを記憶してもよい。この特徴抽出器は、深層学習（畳み込みニューラルネットワークを含む）、サポートベクターマシーンなどの任意の学習モデルを学習することで得られたものであってもよい。例えば、特徴抽出器が深層学習に基づくアーキテクチャを有する場合、記憶装置２には、特徴抽出器の層構造、各層のニューロン構造、各層におけるフィルタ数及びフィルタサイズ、並びに各フィルタの各要素の重みなどの種々の特徴抽出器のパラメータの情報が記憶される。

　判定装置３は、生成データ記憶部２２を参照し、判定対象データ記憶部２３から抽出した判定対象データに関する異常判定処理を実行する。なお、判定装置３は、判定対象データに基づく異常を検知した場合に、当該異常に関する情報の出力（音声出力、表示、ログの書き込み等）を行ってもよい。

　なお、図１に示される異常検知システム１００の構成は一例であり、種々の変更が行われてもよい。例えば、情報生成装置１と、記憶装置２と、判定装置３とのうち少なくとも２つが同一装置により実現されてもよい。他の例では、情報生成装置１と判定装置３とは、夫々、複数の装置により構成されてもよい。この場合、情報生成装置１を構成する複数の装置及び判定装置３を構成する複数の装置は、予め割り当てられた処理を実行するために必要な情報の授受を、有線又は無線での直接通信により又はネットワークを介した通信により装置間において行う。また、判定装置３は、記憶装置２に記憶された判定対象データを扱う代わりに、対象物を撮影するカメラが生成した画像を判定対象データとみなして取得し、当該判定対象データに対して異常判定処理を実行してもよい。

　（２）ハードウェア構成
　次に、情報生成装置１及び判定装置３の各ハードウェア構成について説明する。

　図２（Ａ）は、情報生成装置１のハードウェア構成の一例を示す。情報生成装置１は、ハードウェアとして、プロセッサ１１と、メモリ１２と、インターフェース１３とを含む。プロセッサ１１、メモリ１２、及びインターフェース１３は、データバス１９を介して接続されている。

　プロセッサ１１は、メモリ１２に記憶されているプログラムを実行することにより、情報生成装置１の全体の制御を行うコントローラ（演算装置）として機能する。プロセッサ１１は、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＴＰＵ（Ｔｅｎｓｏｒ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、量子プロセッサなどのプロセッサである。プロセッサ１１は、複数のプロセッサから構成されてもよい。プロセッサ１１は、コンピュータの一例である。

　メモリ１２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリなどの各種の揮発性メモリ及び不揮発性メモリにより構成される。また、メモリ１２には、情報生成装置１が実行する処理を実行するためのプログラムが記憶される。なお、メモリ１２が記憶する情報の一部は、情報生成装置１と通信可能な記憶装置２などの外部記憶装置により記憶されてもよく、情報生成装置１に対して着脱自在な記憶媒体により記憶されてもよい。また、メモリ１２は、記憶装置２が記憶する情報を代わりに記憶してもよい。

　インターフェース１３は、情報生成装置１と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。

　図２（Ｂ）は、判定装置３のハードウェア構成の一例を示す。判定装置３は、ハードウェアとして、プロセッサ３１と、メモリ３２と、インターフェース３３とを含む。プロセッサ３１、メモリ３２、及びインターフェース３３は、データバス３０を介して接続されている。

　プロセッサ３１は、メモリ３２に記憶されているプログラムを実行することにより、判定装置３の全体の制御を行うコントローラ（演算装置）として機能する。プロセッサ３１は、例えば、ＣＰＵ、ＧＰＵ、ＴＰＵ、量子プロセッサなどのプロセッサである。プロセッサ３１は、複数のプロセッサから構成されてもよい。プロセッサ３１は、コンピュータの一例である。

　メモリ３２は、ＲＡＭ、ＲＯＭ、フラッシュメモリなどの各種の揮発性メモリ及び不揮発性メモリにより構成される。また、メモリ３２には、判定装置３が実行する処理を実行するためのプログラムが記憶される。なお、メモリ３２が記憶する情報の一部は、判定装置３と通信可能な記憶装置２などの外部記憶装置により記憶されてもよく、判定装置３に対して着脱自在な記憶媒体により記憶されてもよい。また、メモリ３２は、記憶装置２が記憶する情報を代わりに記憶してもよい。

　インターフェース３３は、判定装置３と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。

　なお、情報生成装置１及び判定装置３のハードウェア構成は、図２（Ａ）及び図２（Ｂ）に示す構成に限定されない。例えば、情報生成装置１又は判定装置３の少なくとも一方は、ディスプレイなどの表示部、キーボードやマウスなどの入力部、スピーカなどの音出力部などをさらに備えてもよい。

　（３）情報生成処理
　次に、情報生成装置１が実行する情報生成処理について説明する。概略的には、情報生成装置１は、正常教師データの特徴情報に主成分分析を適用することで得られる軸を分散が低い方から順に選択することで低分散次元を決定し、次元削減情報Ｉ１、正常分布情報Ｉ２及び閾値情報Ｉ３を夫々生成する。これにより、情報生成装置１は、低処理コストかつ高識別性能により異常を識別可能な異常判定処理を実現するための情報を好適に生成する。

　（３－１）機能ブロック
　図３は、情報生成処理に関する情報生成装置１の機能ブロックの一例である。図３に示すように、情報生成装置１のプロセッサ１１は、機能的には、特徴抽出部１４と、低分散次元選択部１５と、基準情報生成部１６とを有する。なお、図３では、データの授受が行われるブロック同士を実線により結んでいるが、データの授受が行われるブロックの組合せは図３に限定されない。後述する他の機能ブロックの図においても同様である。

　特徴抽出部１４は、情報生成処理に使用する教師データを教師データ記憶部２１から抽出し、各教師データに対して特徴抽出処理を行う。この場合、特徴抽出部１４は、各教師データを、次元数「Ｎ」（Ｎは２以上の整数）の特徴空間における特徴情報（詳しくは特徴ベクトル）に変換する。この場合、特徴抽出部１４は、例えば、記憶装置２に記憶されたパラメータに基づき特徴抽出器を構成し、当該特徴抽出器に各教師データを順に入力することで、各教師データに対応する特徴ベクトルを取得する。そして、特徴抽出部１４は、各教師データに対応する特徴ベクトルを、低分散次元選択部１５に供給する。

　低分散次元選択部１５は、特徴抽出部１４から供給される、複数の正常教師データに対応する複数の特徴ベクトルに対して主成分分析を行うことでＮ個の軸（主成分軸）を決定し、決定したＮ個の軸を分散が低い方から並べた場合の上位「Ｎｓ」個（Ｎｓは、Ｎｓ＜Ｎを満たす１以上の整数）の軸を、低分散次元の軸として選択する。このように、低分散次元選択部１５は、主成分分析により得られた軸のうち最も分散が低いＮｓ個の軸に対応する次元を低分散次元として選択する。

　ここで、次元数（即ち、軸の選択数）Ｎｓは、後述するように、異常教師データを用いた検証に基づき決定されてもよく、記憶装置２等に予め記憶された適合値に決定されてもよい。低分散次元選択部１５は、低分散次元に関する情報（例えば、Ｎ次元の特徴空間をＮｓ次元の低分散次元に変換するための変換行列）を、次元削減情報Ｉ１として生成データ記憶部２２に記憶する。なお、上述の変換行列は、主成分分析の処理結果から特定可能な情報である。また、低分散次元選択部１５は、各教師データの特徴ベクトルを、低分散次元のベクトル（「低分散次元特徴ベクトル」とも呼ぶ。）に変換し、当該低分散次元特徴ベクトルを、基準情報生成部１６に供給する。

　基準情報生成部１６は、低分散次元選択部１５から供給される低分散次元特徴ベクトルから正常分布情報Ｉ２及び閾値情報Ｉ３の生成を行う。

　まず、基準情報生成部１６は、正常教師データの低分散次元特徴ベクトルの分布を表す正常分布情報Ｉ２を生成し、生成した正常分布情報Ｉ２を生成データ記憶部２２に記憶する。この場合、例えば、基準情報生成部１６は、正常分布情報Ｉ２として、正常教師データの低分散次元特徴ベクトルの重心（平均）ベクトル及び分散共分散行列等を算出してもよい。正常分布情報Ｉ２は、後述する距離の算出に用いられる。

　さらに、基準情報生成部１６は、閾値情報Ｉ３を決定する。この場合、例えば、基準情報生成部１６は、まず、正常教師データの分布（例えば正常教師データの重心ベクトル）と、各教師データの低分散次元特徴ベクトルとの距離（「距離Ｌ」とも呼ぶ。）を算出する。なお、距離Ｌは、分散共分散行列を用いたマハラノビス距離などの、異常検知において用いられる任意の距離であってもよい。そして、基準情報生成部１６は、正常教師データの低分散次元特徴ベクトルと異常教師データの低分散次元特徴ベクトルとを分離可能な距離Ｌに対する閾値（「距離閾値Ｌｔｈ」とも呼ぶ。）を設定する。この場合、基準情報生成部１６は、例えば、予め用意した複数の距離閾値Ｌｔｈの候補となる閾値を設定し、最も識別精度が高くなる閾値を、距離閾値Ｌｔｈとして設定する。なお、この例に限らず、基準情報生成部１６は、任意の数値解析手法（最適化手法）を用いて距離閾値Ｌｔｈの最適値を探索する計算を行ってもよい。そして、基準情報生成部１６は、距離閾値Ｌｔｈを表す閾値情報Ｉ３を、生成データ記憶部２２に記憶する。

　なお、基準情報生成部１６は、後述するように、距離閾値Ｌｔｈを、異常教師データを用いた検証により、次元数Ｎｓと同時に決定してもよい。言い換えると、低分散次元選択部１５及び基準情報生成部１６は、次元数Ｎｓと距離閾値Ｌｔｈとを個別に決定する代わりに、これらの最適値の探索を同時に行ってもよい。この具体例については、「（３－３）検証による次元数Ｎｓ及び距離閾値Ｌｔｈの決定」のセクションにて詳しく説明する。

　以上説明した図３に示されるプロセッサ１１の各構成要素（特徴抽出部１４、低分散次元選択部１５、基準情報生成部１６）は、例えば、プロセッサ１１がプログラムを実行することによって実現できる。また、必要なプログラムを任意の不揮発性記憶媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。なお、これらの各構成要素の少なくとも一部は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組合せ等により実現してもよい。また、これらの各構成要素の少なくとも一部は、例えばＦＰＧＡ（field-programmable gate array）又はマイクロコントローラ等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。また、各構成要素の少なくとも一部は、ＡＳＳＰ（Application Specific Standard Produce）やＡＳＩＣ（Application Specific Integrated Circuit）により構成されてもよい。このように、上述の各構成要素は、種々のハードウェアにより実現されてもよい。さらに、これらの各構成要素は，例えば，クラウドコンピューティング技術などを用いて、複数のコンピュータの協働によって実現されてもよい。以上のことは、後述する他の実施の形態においても同様である。

　（３－２）軸選択の具体例及び効果
　次に、本実施形態に基づく低分散次元の軸選択の具体例及びその効果について説明する。

　図４（Ａ）は、第１特徴軸及び第２特徴軸からなる２次元特徴空間上において、正常教師データの特徴ベクトル（「正常データ」とも呼ぶ。）の分布を抽象的に表した図である。図４（Ａ）において、楕円４０は、正常データのおよその分布範囲を示しており、重心４１は正常データの重心位置（重心ベクトルの位置）を示す。そして、図４（Ａ）では、主成分分析により得られる、分散が最大となる第１主成分軸である高分散軸ａと、高分散軸ａと垂直な第２主成分軸である低分散軸ｂとが破線により明示されている。

　図４（Ａ）の例では、低分散次元選択部１５は、低分散軸ｂが高分散軸ａよりも低分散であることから、低分散軸ｂを高分散軸ａよりも優先的に低分散次元の軸として選択する。ここでは、低分散次元選択部１５は、例えば、低分散軸ｂの１次元の低分散次元を決定する。

　図４（Ｂ）は、図４（Ａ）において、異常教師データの特徴ベクトル（「異常データ」とも呼ぶ。）４２及びその距離Ｌを明示した図である。ここで、異常データ４２に対応する異常教師データは、異常状態であることに起因して正常教師データとは特徴空間における分布が異なっており、異常データ４２は、正常点の分布を示す楕円４０の外側に存在する。

　この場合、図４（Ｂ）に示すように、低分散次元選択部１５は、距離Ｌとして、例えば、低分散軸ｂを基準として異常データ４２と重心４１との距離（矢印４３参照）を算出する。ここで、異常データ４２は、低分散軸ｂを基準とした場合には、正常点との分布と明確に異なる。従って、基準情報生成部１６は、距離閾値Ｌｔｈを楕円４０の短径又はそれよりわずかに大きい長さに設定することで、異常データ４２と楕円４０内の正常データとを好適に分離することが可能である。なお、距離Ｌの算出では、マハラノビス距離などのように、正常教師データの分散共分散行列（ここでは分散）を考慮してもよい。

　一方、仮に高分散軸ａを低分散次元の軸として選択して距離Ｌを算出する場合には、異常データ４２の距離Ｌは、矢印４４に相当する長さとなり、正常点の分布を示す楕円４０の長径よりも短くなる。よって、この場合には、いかに距離閾値Ｌｔｈを設定した場合であっても、楕円４０内の正常データと異常データ４２とを分離するような距離閾値Ｌｔｈを設定することはできない。

　以上説明した図４（Ａ）及び図４（Ｂ）の例に示されるように、分散が高い軸であるほど、変動が大きい特徴を表す軸となり、物体の認識に必要な特徴を表す軸として適しているが、異常検知においては有効な特徴を表す軸とはならない。一方、分散が低い軸であるほど、変動が小さい特徴を表す軸となり、物体に共通する特徴を表す軸として適した軸となる。従って、異常検知では、このような物体に共通する特徴を表す特徴次元であるほど、物体の異常状態と正常状態との差異が顕著に表れる特徴次元となる。

　以上を勘案し、第１実施形態に係る情報生成装置１は、低分散である軸ほど優先的に低分散次元の軸として選択する。これにより、情報生成装置１は、未知のデータの異常を判定する異常判定処理において、特徴次元削減による処理の高速化を実現しつつ、異常検知において高い精度を実現させる。
となる。

　（３－３）検証による次元数Ｎｓ及び距離閾値Ｌｔｈの決定
　次に、異常教師データを用いた検証による次元数Ｎｓ及び距離閾値Ｌｔｈの決定方法について説明する。ここでは、一例として、低分散次元選択部１５と基準情報生成部１６とが協働して次元数Ｎｓと距離閾値Ｌｔｈとを同時に決定する例について説明する。

　図５は、複数の次元数Ｎｓ及び距離閾値Ｌｔｈの組に対する識別精度の遷移を表すグラフである。ここで、グラフ「Ｇ１」は、距離閾値Ｌｔｈを「σ」に固定して次元数Ｎｓを変化させた場合の識別精度の遷移を示し、グラフ「Ｇ２」は、距離閾値Ｌｔｈを「２σ」に固定して次元数Ｎｓを変化させた場合の識別精度の遷移を示し、グラフ「Ｇ３」は、距離閾値Ｌｔｈを「３σ」に固定して次元数Ｎｓを変化させた場合の識別精度の遷移を示す。ここで、「σ」は、主成分分析により特定される主成分軸の分散（例えば最も分散が低い軸の分散又は全ての軸の分散の平均）を示す。また、識別精度は、対応する距離閾値Ｌｔｈ及び次元数Ｎｓを仮決めした場合の正常教師データ及び異常教師データに対する識別率を示す。

　図５に示すように、いずれの距離閾値Ｌｔｈを採用した場合であっても、次元数Ｎｓが所定数（図５では「Ｎｓ５」付近）になるまでは、次元数Ｎｓが大きくなるほど、識別精度が上昇する。一方、次元数Ｎｓが所定数以上となる場合、次元数Ｎｓが大きくなっても識別精度が殆ど上昇しなくなる（即ち頭打ちになる）。

　従って、低分散次元選択部１５及び基準情報生成部１６は、例えば、複数の距離閾値Ｌｔｈの候補の各々に対し、次元数Ｎｓを徐々に増やして識別精度を測定し、次元数Ｎｓを仮に増やした場合の識別精度の上昇の度合いが所定度合い以下となる次元数Ｎｓを選択する。例えば、図５の例では、低分散次元選択部１５及び基準情報生成部１６は、距離閾値Ｌｔｈがσ及び２σの場合には、「Ｎｓ４」を選択し、距離閾値Ｌｔｈが３σの場合には、「Ｎｓ５」を選択する。

　そして、低分散次元選択部１５及び基準情報生成部１６は、選択した次元数Ｎｓと、これに対応する距離閾値Ｌｔｈの候補との複数の組のうち、識別精度が最も高い組を、生成データ記憶部２２に記憶する距離閾値Ｌｔｈ及び次元数Ｎｓとして採用する。図５の例では、低分散次元選択部１５及び基準情報生成部１６は、距離閾値Ｌｔｈの各候補と、夫々識別精度の上昇率が頭打ちとなる次元数Ｎｓとの組（σ，Ｎｓ４）、（２σ，Ｎｓ４），（３σ，Ｎｓ５）のうち、（２σ，Ｎｓ４）の組が最も識別精度が高いことから、距離閾値Ｌｔｈを２σとし、次元数Ｎｓを「Ｎｓ４」とする。なお、上述したように、低分散次元の軸は、分散が低い順に選択されるため、次元数Ｎｓが定まれば低分散次元として選択される軸も一意に定まる。

　このように、低分散次元選択部１５及び基準情報生成部１６は、異常教師データを用いることで算出される識別精度を参照し、適切な距離閾値Ｌｔｈ及び次元数Ｎｓの組を決定することができる。なお、距離閾値Ｌｔｈ及び次元数Ｎｓの組の決定方法は図５を用いて説明した方法に限らず、多変数の最適値を探索する任意の最適化方法を用いてもよい。

　（３－４）処理フロー
　図６は、情報生成装置１が実行する情報生成処理の処理手順を示すフローチャートの一例である。

　まず、情報生成装置１は、複数の教師データを教師データ記憶部２１から取得する（ステップＳ１１）。この場合、例えば、情報生成装置１は、複数の正常教師データと、正常教師データより少数の検証用の異常教師データとを、教師データ記憶部２１から取得する。

　次に、情報生成装置１は、取得した各教師データに対して特徴抽出処理を行う（ステップＳ１２）。これにより、情報生成装置１は、次元数Ｎの特徴空間において表される特徴ベクトルを教師データごとに生成する。

　次に、情報生成装置１は、ステップＳ１２で取得した正常教師データの特徴ベクトルに対して主成分分析を実行する（ステップＳ１３）。そして、情報生成装置１は、主成分分析により得られた主成分軸を分散の大きさに従いソートする（ステップＳ１４）。

　そして、情報生成装置１は、低分散側から軸を選択する場合の次元数Ｎｓ及び正常か異常かを距離Ｌにより判定するための距離閾値Ｌｔｈを決定する（ステップＳ１５）。この場合、例えば、情報生成装置１は、正常教師データと異常教師データとを用いて識別精度の検証を行い、検証により得た識別精度に基づき、次元数Ｎｓ及び距離閾値Ｌｔｈを決定する。そして、情報生成装置１は、ステップＳ１５の実行結果に基づく次元削減情報Ｉ１、正常分布情報Ｉ２及び閾値情報Ｉ３を、生成データ記憶部２２に記憶する（ステップＳ１６）。この場合、情報生成装置１は、例えば、特徴空間から低分散次元に変換するための変換行列を表す次元削減情報Ｉ１と、正常教師データの低分散次元における分布（例えば重心ベクトル及び分散共分散行列等）を表す正常分布情報Ｉ２と、距離閾値Ｌｔｈを表す閾値情報Ｉ３とを、生成データ記憶部２２に記憶する。

　（４）異常判定処理
　次に、判定装置３が実行する異常判定処理について説明する。概略的には、判定装置３は、判定対象データの特徴ベクトルを次元削減情報Ｉ１に基づき低分散次元特徴ベクトルに変換し、当該低分散次元特徴ベクトル及び正常分布情報Ｉ２に基づく距離Ｌと閾値情報Ｉ３が示す距離閾値Ｌｔｈとに基づき異常であるか否かの判定を行う。これにより、判定装置３は、分散が低い順に軸が選択された低分散次元を用いて、判定対象データの異常判定を的確かつ低処理負荷により実行する。

　図７は、異常判定処理に関する判定装置３の機能ブロックの一例である。図７に示すように、情報生成装置１のプロセッサ１１は、機能的には、特徴抽出部３４と、低分散次元変換部３５と、比較部３６と、異常判定部３７とを有する。

　特徴抽出部３４は、判定対象データを判定対象データ記憶部２３から抽出し、抽出した判定対象データに対して特徴抽出処理を行う。この場合、特徴抽出部３４は、特徴抽出部１４と同一の特徴抽出器（特徴抽出アルゴリズム）を用い、判定対象データを、次元数Ｎの特徴空間における特徴情報（詳しくは特徴ベクトル）に変換する。

　低分散次元変換部３５は、生成データ記憶部２２から取得する次元削減情報Ｉ１に基づき、特徴抽出部３４が出力する判定対象データの特徴ベクトルを、低分散次元におけるベクトルである低分散次元特徴ベクトルに変換する。この場合、例えば、低分散次元変換部３５は、次元削減情報Ｉ１が示す特徴空間から低分散次元への変換行列を適用することで、判定対象データの特徴ベクトルを、低分散次元特徴ベクトルに変換する。

　比較部３６は、生成データ記憶部２２から取得する正常分布情報Ｉ２が示す正常教師データの低分散次元での分布と、低分散次元変換部３５が算出した判定対象データの低分散次元特徴ベクトルとの距離Ｌを算出する。この場合、距離Ｌは、基準情報生成部１６が算出する距離Ｌと同一指標の距離であって、マハラノビス距離などの、異常検知において用いられる任意の距離であってもよい。例えば、比較部３６は、正常分布情報Ｉ２が示す正常教師データの低分散次元での重心ベクトルと判定対象データの低分散次元特徴ベクトルとの距離を距離Ｌとして算出する。

　異常判定部３７は、生成データ記憶部２２から取得する閾値情報Ｉ３が示す距離閾値Ｌｔｈと、比較部３６が算出した距離Ｌとに基づき、判定対象データに関する異常の有無の判定を行う。この場合、例えば、異常判定部３７は、距離Ｌが距離閾値Ｌｔｈ以上である場合、判定対象データは異常状態の対象物を示していると判定し、距離Ｌが距離閾値Ｌｔｈ未満である場合、判定対象データは正常状態の対象物を示していると判定する。

　図８は、判定装置３が実行する異常判定処理の処理手順を示すフローチャートの一例である。

　まず、判定装置３の特徴抽出部３４は、判定対象データ記憶部２３から判定対象データを取得する（ステップＳ２１）。そして、判定装置３の特徴抽出部３４は、取得した判定対象データに対して特徴抽出処理を行う（ステップＳ２２）。これにより、特徴抽出部３４は、判定対象データに対する特徴ベクトルを算出する。そして、判定装置３の低分散次元変換部３５は、生成データ記憶部２２から取得する次元削減情報Ｉ１に基づき、ステップＳ２２で得られた特徴ベクトルの次元を削減する（ステップＳ２３）。この場合、低分散次元変換部３５は、特徴ベクトルを、低分散次元でのベクトルである低分散次元特徴ベクトルに変換する。

　そして、判定装置３の比較部３６は、生成データ記憶部２２から取得する正常分布情報Ｉ２に基づき、ステップＳ２３で得た判定対象データの低分散次元特徴ベクトルに対する距離Ｌを算出する（ステップＳ２４）。そして、異常判定部３７は、ステップＳ２４での算出結果である距離Ｌと、生成データ記憶部２２から取得する閾値情報Ｉ３が示す距離閾値Ｌｔｈとに基づき、判定対象データにより示される対象物の異常判定を行う（ステップＳ２５）。

　以上のように、判定装置３は、情報生成装置１が生成した各種情報を用いることで、次元削減による計算量削減を実現しつつ、異常判定に適した低分散次元において判定対象データに関する異常判定を的確に実行することができる。

　（５）変形例
　次に、上述した実施形態に適用可能な変形例について説明する。以下の変形例は、任意に組み合わせて実施されてもよい。

　（第１変形例）
　情報生成装置１は、異常教師データを用いることなく、正常教師データに基づいて情報生成処理を実行してもよい。

　この場合、教師データ記憶部２１には、正常教師データが記憶されている。そして、低分散次元選択部１５は、特徴抽出部１４が算出した正常教師データの特徴ベクトルに対して主成分分析を適用することで得た各主成分軸から、固定値である次元数Ｎｓだけ、分散が低い軸から優先して選択し、次元削減情報Ｉ１を生成する。この場合、固定値である次元数Ｎｓは、予め記憶装置２等に記憶されている。そして、基準情報生成部１６は、各正常教師データの特徴ベクトルを低分散次元特徴ベクトルに変換し、当該低分散次元特徴ベクトルに基づき正常分布情報Ｉ２を生成する。さらに、基準情報生成部１６は、低分散次元の軸として選択した主成分軸における正常教師データの分散等に基づき、距離閾値Ｌｔｈを表す閾値情報Ｉ３を生成する。例えば、基準情報生成部１６は、上述の分散の定数倍を、距離閾値Ｌｔｈとして定める。

　このように、本変形例においても、情報生成装置１は、正常教師データに基づき、異常判定処理に必要な各種情報（次元削減情報Ｉ１、正常分布情報Ｉ２、閾値情報Ｉ３）を好適に生成することができる。

　（第２変形例）
　情報生成装置１は、主成分分析により算出した主成分軸から低分散次元を構成する軸を選択した。これに代えて、情報生成装置１は、主成分分析を行うことなく、低分散次元を構成する軸を選択してもよい。

　例えば、情報生成装置１は、特徴抽出部１４が算出する正常教師データの特徴ベクトルに基づき、Ｎ次元の特徴空間を構成する各軸での当該特徴ベクトルの分散を算出し、当該分散が最も低いＮｄ個の軸を、低分散次元を構成する軸として選択してもよい。この場合においても、情報生成装置１は、正常状態において分散が低くなる軸を低分散次元を構成する軸として好適に選択し、高精度な異常判定処理を実行するための各種情報を好適に生成することができる。

　＜第２実施形態＞
　図９は、第２実施形態に係る情報生成装置１Ｘの概略構成を示す。情報生成装置１Ｘは、主に、特徴情報取得手段１４Ｘと、低分散次元選択手段１５Ｘと、基準情報生成手段１６Ｘとを備える。情報生成装置１Ｘは、複数の装置から構成されてもよい。情報生成装置１Ｘは、第１実施形態における情報生成装置１とすることができる。

　特徴情報取得手段１４Ｘは、正常状態を表すデータの特徴情報を取得する。この場合、「データ」は、画像データであってもよく、音データであってもよい。また、特徴情報取得手段１４Ｘは、データに対して特徴抽出処理を行うことで特徴情報を生成してもよく、他の装置又は処理ブロックがデータから算出した特徴情報、又は、記憶装置に予め記憶された特徴情報を取得してもよい。特徴情報取得手段１４Ｘは、例えば、第１実施形態（変形例を含む、以下同じ）における特徴抽出部１４とすることができる。

　低分散次元選択手段１５Ｘは、特徴情報を表す特徴空間において特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択する。「軸」は、特徴空間を構成する軸であってもよく、特徴空間に対して主成分分析等を適用することで得られる軸であってもよい。低分散次元選択手段１５Ｘは、例えば、第１実施形態における低分散次元選択部１５とすることができる。

　基準情報生成手段１６Ｘは、低分散次元により特徴情報を表した低分散次元特徴情報に基づいて、低分散次元において正常状態を表す基準情報を生成する。「低分散次元特徴情報」は、例えば、第１実施形態における低分散次元特徴ベクトルである。基準情報は、例えば、第１実施形態における正常分布情報Ｉ２及び閾値情報Ｉ３とすることができる。基準情報生成手段１６Ｘは、例えば、第１実施形態における基準情報生成部１６とすることができる。

　図１０は、第２実施形態において情報生成装置１Ｘが実行するフローチャートの一例である。まず、特徴情報取得手段１４Ｘは、正常状態を表すデータの特徴情報を取得する（ステップＳ３１）。そして、低分散次元選択手段１５Ｘは、特徴情報を表す特徴空間において特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択する（ステップＳ３２）。そして、基準情報生成手段１６Ｘは、低分散次元により特徴情報を表した低分散次元特徴情報に基づいて、低分散次元において正常状態を表す基準情報を生成する（ステップＳ３３）。

　第２実施形態によれば、情報生成装置１Ｘは、異常検知に好適な特徴空間での次元の選択を行い、かつ、正常状態を表す基準情報を好適に生成することができる。

　なお、上述した各実施形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータであるプロセッサ等に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記憶媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記憶媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記憶媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　その他、上記の各実施形態の一部又は全部は、以下の付記のようにも記載され得るが以下には限られない。

［付記１］
　正常状態を表すデータの特徴情報を取得する特徴情報取得手段と、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択する低分散次元選択手段と、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する基準情報生成手段と、
を有する情報生成装置。
［付記２］
　前記基準情報生成手段は、前記基準情報として、前記低分散次元特徴情報の分布を表す分布情報と、前記分布と判定対象データとの距離に基づき当該判定対象データが前記正常状態に対応するか否か判定するための閾値情報とを生成する、付記１に記載の情報生成装置。
［付記３］
　前記特徴情報取得手段は、異常状態を表すデータの特徴情報である異常特徴情報をさらに取得し、
　前記低分散次元選択手段は、前記異常特徴情報を用いた検証に基づき、前記低分散次元の次元数を決定する、付記１または２に記載の情報生成装置。
［付記４］
　前記基準情報生成手段は、前記次元数の候補と前記基準情報の候補の複数の組から前記検証に基づき選択された組に対応する前記基準情報の候補を、前記基準情報として決定する、付記３に記載の情報生成装置。
［付記５］
　前記低分散次元選択手段は、前記特徴情報に対して主成分分析を行うことで得られた軸を前記特徴情報の分散の大きさに従い並べた場合に前記分散が最も低い側から順に選択した所定個数分の軸に対応する次元を、前記低分散次元として選択する、付記１～４のいずれか一項に記載の情報生成装置。
［付記６］
　前記低分散次元選択手段は、前記特徴空間を前記低分散次元に変換するための変換情報を生成する、付記１～５のいずれか一項に記載の情報生成装置。
［付記７］
　判定対象データの特徴情報を取得する特徴情報取得手段と、
　前記特徴情報を、付記１～６のいずれか一項に記載の情報生成装置が選択した低分散次元により表した低分散次元特徴情報に変換する低分散次元変換手段と、
　当該低分散次元特徴情報と、前記情報生成装置が生成した基準情報とに基づき、前記判定対象データに関する異常の有無の判定を行う異常判定手段と、
を有する判定装置。
［付記８］
　コンピュータが、
　正常状態を表すデータの特徴情報を取得し、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択し、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する、
情報生成方法。
［付記９］
　正常状態を表すデータの特徴情報を取得し、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択し、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する処理をコンピュータに実行させるプログラムを格納する記憶媒体。
［付記１０］
　コンピュータが、
　判定対象データの特徴情報を取得し、
　前記特徴情報を、付記１～６のいずれか一項に記載の情報生成装置が選択した低分散次元により表した低分散次元特徴情報に変換し、
　当該低分散次元特徴情報と、前記情報生成装置が生成した基準情報とに基づき、前記判定対象データに関する異常の有無の判定を行う、判定方法。
［付記１１］
　判定対象データの特徴情報を取得し、
　前記特徴情報を、付記１～６のいずれか一項に記載の情報生成装置が選択した低分散次元により表した低分散次元特徴情報に変換し、
　当該低分散次元特徴情報と、前記情報生成装置が生成した基準情報とに基づき、前記判定対象データに関する異常の有無の判定を行う処理をコンピュータに実行させるプログラムを格納する記憶媒体。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。

　製品製造ラインでの欠陥製品の自動検知、営巣検知、その他任意の異常検知分野において好適に適用される。

　１、１Ｘ　情報生成装置
　２　記憶装置
　３　判定装置
　１１、３１　プロセッサ
　１２、３２　メモリ
　１３、３３　インターフェース
　２１　教師データ記憶部
　２２　生成データ記憶部
　２３　判定対象データ記憶部
　１００　異常検知システム

Claims

　正常状態を表すデータの特徴情報を取得する特徴情報取得手段と、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択する低分散次元選択手段と、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する基準情報生成手段と、
を有する情報生成装置。
　前記基準情報生成手段は、前記基準情報として、前記低分散次元特徴情報の分布を表す分布情報と、前記分布と判定対象データとの距離に基づき当該判定対象データが前記正常状態に対応するか否か判定するための閾値情報とを生成する、請求項１に記載の情報生成装置。
　前記特徴情報取得手段は、異常状態を表すデータの特徴情報である異常特徴情報をさらに取得し、
　前記低分散次元選択手段は、前記異常特徴情報を用いた検証に基づき、前記低分散次元の次元数を決定する、請求項１または２に記載の情報生成装置。
　前記基準情報生成手段は、前記次元数の候補と前記基準情報の候補の複数の組から前記検証に基づき選択された組に対応する前記基準情報の候補を、前記基準情報として決定する、請求項３に記載の情報生成装置。
　前記低分散次元選択手段は、前記特徴情報に対して主成分分析を行うことで得られた軸を前記特徴情報の分散の大きさに従い並べた場合に前記分散が最も低い側から順に選択した所定個数分の軸に対応する次元を、前記低分散次元として選択する、請求項１～４のいずれか一項に記載の情報生成装置。
　前記低分散次元選択手段は、前記特徴空間を前記低分散次元に変換するための変換情報を生成する、請求項１～５のいずれか一項に記載の情報生成装置。
　判定対象データの特徴情報を取得する特徴情報取得手段と、
　前記特徴情報を、請求項１～６のいずれか一項に記載の情報生成装置が選択した低分散次元により表した低分散次元特徴情報に変換する低分散次元変換手段と、
　当該低分散次元特徴情報と、前記情報生成装置が生成した基準情報とに基づき、前記判定対象データに関する異常の有無の判定を行う異常判定手段と、
を有する判定装置。
　コンピュータが、
　正常状態を表すデータの特徴情報を取得し、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択し、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する、
情報生成方法。
　正常状態を表すデータの特徴情報を取得し、
　前記特徴情報を表す特徴空間において前記特徴情報の分散が最も低い所定個数分の軸に対応する次元である低分散次元を選択し、
　前記低分散次元により前記特徴情報を表した低分散次元特徴情報に基づいて、前記低分散次元において前記正常状態を表す基準情報を生成する処理をコンピュータに実行させるプログラムを格納する記憶媒体。
　コンピュータが、
　判定対象データの特徴情報を取得し、
　前記特徴情報を、請求項１～６のいずれか一項に記載の情報生成装置が選択した低分散次元により表した低分散次元特徴情報に変換し、
　当該低分散次元特徴情報と、前記情報生成装置が生成した基準情報とに基づき、前記判定対象データに関する異常の有無の判定を行う、判定方法。
　判定対象データの特徴情報を取得し、
　前記特徴情報を、請求項１～６のいずれか一項に記載の情報生成装置が選択した低分散次元により表した低分散次元特徴情報に変換し、
　当該低分散次元特徴情報と、前記情報生成装置が生成した基準情報とに基づき、前記判定対象データに関する異常の有無の判定を行う処理をコンピュータに実行させるプログラムを格納する記憶媒体。