WO2023223510A1

WO2023223510A1 - 学習装置、学習方法及び学習プログラム

Info

Publication number: WO2023223510A1
Application number: PCT/JP2022/020860
Authority: WO
Inventors: 充敏熊谷
Original assignee: 日本電信電話株式会社
Priority date: 2022-05-19
Filing date: 2022-05-19
Publication date: 2023-11-23

Abstract

検知装置（１）は、検知対象とは異なる対象であって、検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得する学習データ入力部（１１）と、関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、関連データセットのラベルありデータで評価し、評価結果が上がるように、第１の異常検知器を学習するための異常検知学習モデルを学習する異常検知学習モデル学習部（１３）と、を有する。

Description

学習装置、学習方法及び学習プログラム

　本発明は、学習装置、学習方法及び学習プログラムに関する。

　異常検知は、データセットから正常パターンを学習し、与えられた未知のデータが異常か否かを識別する技術である。異常検知は、侵入検知、医療画像診断、産業システム監視など様々な実応用で利用されている。

　異常検知は、一般に、教師なし学習を用いて学習を行うことが多い。教師なし学習では、与えられたラベルなしデータセットから異常検知器を学習する。ここで、ラベルなしデータから正常パターンを学習するために、「ラベルなしデータのうち大多数は正常データである」、或いは、「ラベルなしデータの中の異常データは無視可能である」、といった仮定が設定される。

　しかしながら、実問題においては、上記の仮定が成り立たない場合も多い。例えば、侵入検知システムでは、一定期間各ユーザのデータを収集し、得られたデータの多くは正常データという仮定の基で、ユーザの正常パターンを学習することで異常を検知する方法がある。ここで、ユーザがマルウエアに感染していた場合、収集されたデータには多くの異常データが混入してしまい、上記の仮定が成り立たない。また、異常データが少量であっても、それに大きく影響を受け、異常検知器の学習性能が低下することもある。

　この問題は、正常または異常のラベルがついたサンプル（正常・異常サンプル）を学習に用いることで対処可能である。しかしながら、ラベル付けは一般に専門家の精査が必要であるため、全ての目標タスクに関して、ラベル付きデータを収集することは困難となる可能性が高い。上述の例の場合、新しいユーザが続々と現れる場合には、適用が特に困難になる。

　一方、関連するデータセットであれば、正常・異常サンプルが手に入るケースはある。上述の例の場合、新規ユーザのラベルありデータの収集は困難であっても、長期間稼働しているユーザであれば、稼働時間が長い分、正常・異常サンプルが一部得られている可能性はある。

　そこで、目標タスクにおける正常データセットに加え、正常・異常データからなる関連データセットを活用することで異常検知性能の向上を図る技術が提案されている。

　例えば、正常データセットを入力すると異常検知器を出力するニューラルネットを、関連データセットを用いて学習することで、未知の正常データセットから適切な異常検知器を学習可能とする技術がある（非特許文献１）。

　また、関連データセットを用いて、少量の正常・異常データセットから学習した異常検知器の期待異常検知性能を最大化するよう学習することで、未知の正常・異常データセットから適切な異常検知器を学習可能とする技術がある（非特許文献２）。

A.　Kumagai,　T.　Iwata,　and　Y.　Fujiwara,　"Transfer　Anomaly　Detection　by　Inferring　Latent　Domain　Representations",　In　NeurIPS,　2019. T.　Iwata,　and　A.　Kumagai,　"META-LEARNING　ONE-CLASS　CLASSIFIERS　WITH　EIGENVALUE　SOLVERS　FOR　SUPERVISED　ANOMALY　DETECTION",　arXiv　preprint　arXiv:2103.00684,　2021.

　非特許文献１，２に記載の技術では、目標データセットとして、ラベルありデータが必要である。したがって、目標データセットにラベルなしデータしか含まれない場合には適用することができない。

　本発明は、上記に鑑みてなされたものであって、ラベルなしデータから高性能の異常検知器を学習することができる学習装置、学習方法及び学習プログラムを提供することを目的とする。

　上述した課題を解決し、目的を達成するために、本発明に係る学習装置は、検知対象とは異なる対象であって、前記検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得する取得部と、前記関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、前記関連データセットのラベルありデータで評価し、評価結果が上がるように、前記第１の異常検知器を学習するための異常検知学習モデルを学習する学習部と、を有することを特徴とする。

　本発明によれば、ラベルなしデータから高性能の異常検知器を学習することができる。

図１は、実施の形態に係る検知装置の処理を説明する図である。図２は、実施の形態に係る検知装置の構成の一例を模式的に示す図である。図３は、学習処理の処理手順を示すフローチャートである。図４は、検知処理の処理手順を示すフローチャートである。図５は、学習部の処理を説明するための図である。図６は、プログラムが実行されることにより、検知装置が実現されるコンピュータの一例を示す図である。

　以下、図面を参照して、本発明の一実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。

［実施の形態］
　本実施の形態に係る検知装置は、ラベルなしデータと正常・異常データからなる関連データセットを活用することで、目標タスクのラベルなしデータから異常の影響を排除し、高精度な異常検知器を得る。

［検知装置の概要］
　図１は、実施の形態に係る検知装置の処理を説明する図である。図１に示すように、学習フェーズでは、目標データセット（ラベルなしデータ）に加えて、複数の関連データセット（正常・異常サンプルとラベルなしサンプル）の情報も活用することで、ラベルなしデータから高性能の異常検知器を学習する。

　まず、学習フェーズでは、関連データセットのデータのみを用いて、ラベルなしデータから学習した異常検知器（第１の異常検知器）の期待異常検知性能を直接最大化するようモデルを学習する。ここで、期待異常検知性能は、未学習のデータに対する検知性能の一つであり、ラベルありデータ（異常・正常データ）から計算できる。

　具体的には、学習フェーズでは、関連データセットt（t＝1，…，T）のうち、ラベルなしデータをランダムに抽出し（図１の（１））、異常検知学習モデルに入力し、異常検知器の学習を行う（図１の（２））。

　そして、学習フェーズでは、関連データセットtのラベルなしデータで学習した異常検知器の期待異常検知性能を計算する。学習フェーズでは、計算した期待異常検知性能を、関連データセットtのラベルありデータ（異常・正常データ）で評価し、評価値が上がるように異常検知学習モデルを学習する（図１の（３））。

　この際、学習フェーズでは、ラベルなしデータ中の異常データの影響を低減するような機構を組み合わせることで異常データの影響を受けずに異常検知器を学習可能となる。例えば、学習フェーズでは、ラベルなしデータの中で、他のサンプルとは性質が異なるサンプルの学習における影響度を小さくする外れ値検出の機構を組み合わせて、学習を行ってもよい。

　検知フェーズでは、学習した異常検知学習モデルに、目標タスクのラベルなしデータを入力することで目標タスクのデータに適した異常検知器を（第２の異常検知器）学習する。検知フェーズでは、学習によって得られた異常検知器を用いて、目標タスクの各テストデータの検知を実行する。

［検知装置］
　図２は、実施の形態に係る検知装置の構成の一例を模式的に示す図である。実施の形態に係る検知装置１は、例えば、ROM（Read　Only　Memory）、RAM（Random　Access　Memory）、CPU（Central　Processing　Unit）等を含むコンピュータ等に所定のプログラムが読み込まれて、CPUが所定のプログラムを実行することで実現される。また、検知装置１は、ネットワーク等を介して接続された他の装置との間で、各種情報を送受信する通信インタフェースを有する。検知装置１（学習装置）は、ワークステーションやパソコン等の汎用コンピュータで実現される。検知装置１は、図２に示すように、学習処理を行う学習部１０と、検知処理を行う検知部２０とを有する。

　学習部１０は、複数の関連データセット（正常・異常サンプルとラベルなしサンプル）を用いて、ラベルなしデータで学習した異常検知器の期待異常検知性能を直接最大化するよう異常検知学習モデル１４１を学習する。

　なお、関連データセットは、ラベルなしデータと少量の異常・正常データからなるデータセットである。関連データセットは、例えば、検知対象ではないが、長期間稼働しているユーザの異常・正常サンプルとラベルなしサンプルである。正常・異常サンプルは、正常または異常のラベルがついたサンプルである。

　検知部２０は、目標タスクのラベルなしデータが与えられた際に、異常検知学習モデル１４１を用いて、目標タスクに適した異常検知器を学習する。検知部２０は、得られた異常検知器を用いてテストデータの検知を行う。検知部２０は、学習部１０と同一のハードウェアに実装されてもよいし、異なるハードウェアに実装されてもよい。なお、目標タスクのラベルなしデータは、例えば、検知対象となる新規ユーザのラベルなしデータである。

［学習部］
　学習部１０は、学習データ入力部１１（取得部）、特徴抽出部１２、異常検知学習モデル学習部１３（学習部）、および格納部１４を有する。

　学習データ入力部１１は、キーボードやマウス等の入力デバイスを用いて実現され、操作者による入力操作に対応して、制御部に対して各種指示情報を入力する。学習データ入力部１１は、取得部として機能し、複数の関連データセット（正常・異常サンプルとラベルなしサンプル）を入力として受け取る。

　関連データセットは、NIC（Network　Interface　Card）等で実現される図示しない通信制御部を介して、外部のサーバ装置等から学習部１０に入力されてもよい。

　特徴抽出部１２は、入力を受け付けた関連データセットの各サンプルを特徴ベクトルに変換する。ここで、特徴ベクトルとは、必要なデータの特徴をn次元の数ベクトルで表記したものである。特徴ベクトルへの変換については、機械学習で一般的に用いられている手法を利用する。例えば、データがテキストの場合には、形態素解析によるもの、n-gramによるもの、区切り文字による手法等を適用可能である。

　異常検知学習モデル学習部１３は、特徴抽出後のサンプルデータを用いて、ラベルなしデータから、データに適した異常検知器（第１の異常検知器）を学習するための異常検知学習モデル１４１を学習する。異常検知学習モデル１４１は、ラベルなしデータが入力されると、この入力されたラベルなしデータに対応する異常検知器を出力するモデルである。

　異常検知学習モデル学習部１３は、関連データセットのラベルなしデータで学習した異常検知器（第１の異常検知器）の性能を、関連データセットのラベルありデータで評価し、評価結果が上がるように、異常検知学習モデルを学習する。

　ベースとなる異常検知器としては、オートエンコーダ、One-class　SVMなどの異常検知で用いられる手法を適用することができる。なお、異常検知学習モデル学習部１３は、ラベルなしデータの中で、他のサンプルとは性質が異なるサンプルの学習における影響度を小さくする外れ値検出の機構を組み合わせて、学習を行ってもよい。

　格納部１４は、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。格納部１４には、学習された異常検知学習モデル１４１が格納される。

［検知部］
　検知部２０は、データ入力部２１、特徴抽出部２２、学習・検知部２３、及び、検知結果出力部２４を有する。

　データ入力部２１は、キーボードやマウス等の入力デバイスを用いて実現され、操作者による入力操作に対応して、制御部に対して各種指示情報を入力したり、目標タスクのラベルなしデータとテストデータを受け付けたりする。データ入力部２１は、入力された目標タスクのラベルなしデータとテストデータを、特徴抽出部２２に出力する。

　なお、目標タスクのラベルなしデータとテストデータは、NIC等で実現される図示しない通信制御部を介して、外部のサーバ装置等から検知部２０に入力されてもよい。また、データ入力部２１は、学習データ入力部１１と同一のハードウェアでもよい。また、検知部２０は、１度、ラベルなしデータを受け取り、異常検知器を学習した後は、当該タスクのテストデータさえ異常検知器に入力すれば、検知を実行可能である。

　特徴抽出部２２は、学習部１０の特徴抽出部１２と同様に、学習・検知部２３における処理の準備として、取得された目標タスクのラベルなしデータとテストデータの各サンプルを特徴ベクトルに変換する。

　学習・検知部２３は、異常検知学習モデル１４１を用いて、ラベルなしデータから異常検知器（第２の異常検知器）を出力する。得られた異常検知器は保存され、学習・検知部２３は、以降、当該タスクのテストデータが入力された場合は、得られた異常検知器を用いて検知を行う。

　検知結果出力部２４は、液晶ディスプレイなどの表示装置、プリンター等の印刷装置、情報通信装置等によって実現され、検知処理の結果を操作者に対して出力する。例えば、検知結果出力部２４は、入力されたテストデータから検知された異常の有無を出力する。

［検知処理の処理手順］
　次に、図３および図４を参照して、検知装置１による検知処理の処理手順について説明する。検知装置１の検知処理は、学習部１０による学習処理と、検知部２０による検知処理とを含む。

［学習処理］
　図３は、学習処理の処理手順を示すフローチャートである。図３のフローチャートは、例えば、ユーザによる学習処理の開始を指示する操作入力があったタイミングで開始される。

　図３に示すように、学習データ入力部１１は、複数の関連データセット（正常・異常サンプルとラベルなしサンプル）を入力として受け取る（ステップＳ１）。特徴抽出部１２は、入力を受け付けた関連データセットの各サンプルを特徴ベクトルに変換する（ステップＳ２）。

　異常検知学習モデル学習部１３は、特徴抽出後のサンプルデータを用いて、ラベルなしデータから、データに適した異常検知器を学習するための異常検知学習モデル１４１を学習する（ステップＳ３）。異常検知学習モデル学習部１３は、特徴抽出後の関連データセットｔのうち、ラベルなしデータを異常検知学習モデルに入力し、異常検知器の学習を行う。そして、異常検知学習モデル学習部１３は、関連データセットｔのラベルなしデータで学習した異常検知器の性能を、関連データセットｔのラベルありデータ（異常・正常データ）で評価し、評価値が上がるように異常検知学習モデルを学習する。

　異常検知学習モデル学習部１３は、学習した異常検知学習モデル１４１を格納部１４に格納する。

［検知処理］
　図４は、検知処理の処理手順を示すフローチャートである。図４のフローチャートは、例えば、ユーザによる検知処理の開始を指示する操作入力があったタイミングで開始される。

　データ入力部２１が、処理対象の目標タスクのラベルなしデータとテストデータの入力を受け付け（ステップＳ１１）、特徴抽出部２２が、受け付けた目標タスクのラベルなしデータとテストデータの各サンプルを特徴ベクトルに変換する（ステップＳ１２）。

　学習・検知部２３は、異常検知学習モデル１４１を用いて、ラベルなしデータから異常検知器を学習し、学習した異常検知器を用いて、各テストサンプルの検知を実行する（ステップＳ１３）。検知部２０では、目標タスクのラベルなしデータから異常検知器を学習することで、以降は、このタスクのテストサンプルのみ入力すれば、それらの検知結果を出力可能となる。そして、検知結果出力部２４が、異常検知器による検知結果を出力する（ステップＳ１４）。

［実施の形態の効果］
　このように、実施の形態によれば、目標データセット（ラベルなしデータ）に加えて、複数の関連データセットの情報も活用することで、ラベルなしデータから高性能の異常検知器を学習する。

　具体的には、実施の形態に係る検知装置１は、検知対象とは異なる対象であって、検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得する。検知装置１は、関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、関連データセットのラベルありデータで評価し、評価結果が上がるように、第１の異常検知器を学習するための異常検知学習モデルを学習する。

　このように、検知装置１は、目標データセット（ラベルなしデータ）ではなく、複数の関連データセットを（正常・異常サンプルとラベルなしサンプル）用いて異常検知学習モデルを学習することにより、ラベルなしデータである目標データセットから高性能の異常検知器を学習することができる。

　検知装置１は、関連データセットのラベルなしデータで学習した異常検知器の期待異常検知性能を、関連データセットの正常・異常サンプルを基に、直接最大化するよう異常検知学習モデルを学習する。検知装置１は、目標タスクのラベルなしデータが与えられた際に、学習した異常検知学習モデルを用いて、目標タスクに対応する異常検知器を学習する。検知装置１は、これによって得られた異常検知器を用いてテストデータの検知を行う。

　したがって、検知装置１は、目標タスクがラベルなしデータのみからなる場合でも異常検知性能を向上させることができる。

　そして、検知装置１は、モデル学習過程において、関連データセットのラベルなしデータの中で、他のサンプルとは性質が異なるサンプルの学習における影響度を小さくして、異常検知器の学習を行う。このように、検知装置１は、ラベルなしデータ中の異常データの影響を低減するような機構を導入することで、異常データの悪影響を受けずに異常検知器を学習することが可能となる。

［適用例］
　本実施の形態の適用例について具体的に説明する。まず、S（式（１））を目標データセット（ラベルなしデータ）とする。ここで、x_nは、n番目のサンプルのD次元特徴ベクトルを表す。

　今、T個の関連データセットD（式（２））が学習フェーズに与えられたとする。

　ここで、x_t、x_t ^A、x_t ^Nは、t番目のタスクのラベルなしデータ、異常データ、正常データをそれぞれ表す。全てのデータセットにおいて、特徴ベクトルの次元Dは同じと仮定する。ここでの目的は、関連データセットには含まれない目標データセットSがテストフェーズに与えられたとき、そのデータセットに適した異常検知器を学習することである。

　まず、Sから異常検知器を学習するための異常検知器学習モデルを説明する（テストフェーズ）。その後、異常検知器学習モデルの学習方法を説明する（学習フェーズ）。

　検知フェーズでは、まず、目標データセットSのベクトル表現zを、式（３）で抽出する。

　fとgは、任意のニューラルネットワークである。fの「和」は、S内のサンプルの順番によらないため、式（３）は集合Sに対して一つのベクトルzを定める。なお、この形のニューラルネットワーク以外であっても、置換不変なニューラルネットワークであれば任意のもの（例えば、「最大値」やset　transformer）を用いてよい。

　得られたベクトルzを用いて異常検知器s（サンプルxに対するアノマリスコアを出力する関数）は、式（４）の再構成誤差で定義される。

　ここで、||　||₂は、l2ノルムを表す。[,]は二つのベクトルの結合を表す。H（式（５））は、ニューラルネットワークを表す。W（式（６））は、線形ウェイトパラメータを表す。

　通常、再構成誤差ベースの異常検知器は、正常データを用いて再構成誤差が小さくなるよう学習される。これにより、未知の正常データの再構成誤差は小さくなることが期待される一方で、異常データは学習していないため、再構成誤差が大きくなることが期待される。この機構により、再構成誤差ベースの異常検知器は広く利用される。

　しかしながら、目標データセットSには正常データだけでなく異常データも含まれる可能性がある。このため、目標データセットS内のすべてのサンプルの再構成誤差を小さくなるよう学習してしまうと、得られる異常検知器は、異常データの悪影響を受けて、低性能になる恐れがある。

　この問題に対処するため、実施の形態では式（７）に示す目的関数を最小化することを考える。

　ここで、||　||_Fは、フロベニウスノルムを表す。||　||₁は、l1ノルムを表す。λとμは、正の実数を表す。A（式（８））は、外れ値成分を表す行列である。a_nは、異常データである外れ値成分を取り除くためのベクトルである。式（７）に示すように、目的関数に、a_nを導入することで、外れ値成分の学習における影響度を小さくする。

　λ＝∞の場合、A＝0となり、式（７）の目的関数は通常の再構成誤差ベースの異常検知器の目的関数（式（４））と一致する。一般に、目標データセットS内の多数派が正常データである場合、異常データはそれらに比べ性質が異なるため、再構成が難しくなると予想される。外れ値成分を表す行列Aを導入しない場合（A＝0の場合）は、そのようなサンプルも無理やり再構成するよう学習される。

　一方、式（７）、式（８）に示すように、外れ値成分を表す行列Aを導入した場合、再構成が難しいサンプルx_mは、a_mが非ゼロのベクトルとして推定されることで、無理な再構成を回避して学習することができる。適切なa_nを推定し、目的関数（式（７））を最小化することで、目標データセットS内の異常データの悪影響を低減した形で異常検知器の学習ができると期待される。

　a_nのl1ノルム正則化は、推定された異常成分の大きさを制御するために導入する。なお、このl1正則化がない場合（λ＝0の場合）には、目的関数（式（７））の最適解は、自明かつ無意味なもの（A＝－X_S，W＝0）となってしまうことに注意されたい。

　また、目的関数（式（７））の推定対象は、外れ値成分を表す行列Aと線形ウェイトパラメータWである点にも注意が必要である。再構成誤差ベースの異常検知器の目的関数（式（４））においては、線形ウェイトパラメータWだけでなくhも学習対象であるが、Sから異常検知器を学習する際にはWのみを学習する。なお、hの学習については、後述する。これにより、目的関数（式（７））は凸関数となるため、大域的最適解が簡単な更新式により求めることが可能となる。具体的には、式（９）、式（１０）に示す更新式を交互に繰り返すことで求められる。

　式（９）、式（１０）に示す交互更新を十分多くの回数繰り返すことで、目的関数の大域的最適解が得られる。しかしながら、このような多数回の更新は、計算コストの増大やニューラルネットワークの計算グラフが増大することによる、学習困難性（勾配消失）の増大を招くという問題を引き起こす。

　これに対処するために、実施の形態では、外れ値成分を表す行列Aの初期値もニューラルネットワークを用いてモデル化する。

　具体的には、S内のサンプルx_nの初期値a_0nは、式（１１）の形で与えられる。

　vは、任意のニューラルネットワークである。vは、目標データセットSのベクトル表現zに依存させることで、目標データセットSに適した初期値が得られるようなモデルになっている。前項の更新をI回繰り返して得られるWをW_*とすると、目標データセットSから学習される異常検知器は、式（１２）となる。

　ここでは、関連データセットを用いたモデルの学習方法を述べる。ここでは、関連データセットから選択されたラベルなしデータを記号Sで表すこととする。提案するモデルの学習パラメータは、ニューラルネットf,g,h,vのパラメータと正則化パラメータλ、μである。目的関数は式（１３）である。

　ここで、s_xは、式（３）～式（１２）を使用することでSから学習された異常検知器（アノマリスコア関数）を表す。式（１３）において、データセットD_tからランダムにサンプルして得られる疑似少量学習データと疑似テストデータとを、それぞれS,Qで表している。Sは、ラベルなしデータ、Qは、ラベルありデータである。AUCは、異常サンプルのスコアを正常サンプルのものよりも高くしたときに高い値をとる。つまり、AUCを最大化することで高性能の異常検知器を学習できる。

　ここで、図５は、学習部１０の処理を説明するための図である。図５には、学習部１０の処理の疑似コードが例示されている。

　まず、学習部１０は、Dを関連データセットとし、ラベルなしデータ（疑似学習データ）S（サンプル数N_S）、ラベルありデータ（疑似テストデータ）Q（サンプル数N_Q）取得する（Algorithm　1）。

　学習部１０は、学習フェーズにおいて、ランダムにサンプルとなるタスクt、ラベルなしデータS、ラベルありデータQを選ぶ（Algorithm1の2－4行目）。

　学習部１０は、式（３）を用いて、ラベルなしデータSからベクトルzを計算する（Algorithm1の5行目）。

　学習部１０は、式（１１）を用いて、ラベルなしデータSから、外れ値成分を表す行列Aの初期値A₀を計算する（Aolorithm1の6行目）。

　学習部１０は、式（９）、式（１０）に示す更新式を交互に繰り返すことで、目的関数（式（７））の大域的最適解を求める（Aolorithm1の7～9行目）。

　学習部１０は、式（１３）を用いて、ラベルありデータQにおけるAUCを計算する（Aolorithm1の10行目）。

　学習部１０は、計算結果に基づき、AUCが最大化するように、モデルのパラメータを更新する（Aolorithm1の11行目）。

　本実施の形態に係る検知装置は、非特許文献１，２に記載のような従来の検知方法に対して特定の改善を提供するものであり、異常検知の性能評価に係る技術分野の向上を示すものである。

［実施の形態のシステム構成について］
　検知装置１の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、検知装置１の機能の分散及び統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散または統合して構成することができる。

　また、検知装置１においておこなわれる各処理は、全部または任意の一部が、CPU、GPU（Graphics　Processing　Unit）、及び、CPU、GPUにより解析実行されるプログラムにて実現されてもよい。また、検知装置１においておこなわれる各処理は、ワイヤードロジックによるハードウェアとして実現されてもよい。

　また、実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的に行うこともできる。もしくは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上述及び図示の処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて適宜変更することができる。

［プログラム］
　図６は、プログラムが実行されることにより、検知装置１が実現されるコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、CPU１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

　メモリ１０１０は、ROM１０１１及びRAM１０１２を含む。ROM１０１１は、例えば、BIOS（Basic　Input　Output　System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

　ハードディスクドライブ１０９０は、例えば、OS（Operating　System）１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、検知装置１の各処理を規定するプログラムは、コンピュータ１０００により実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、検知装置１における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、SSD（Solid　State　Drive）により代替されてもよい。

　また、上述した実施の形態の処理で用いられる設定データは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、CPU１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して実行する。

　なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してCPU１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local　Area　Network）、ＷＡＮ（Wide　Area　Network）等）を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してCPU１０２０によって読み出されてもよい。

　以上の実施形態に関し、更に以下の付記を開示する。

　（付記項１）
　メモリと、
　前記メモリに接続された少なくとも１つのプロセッサと、
　を含み、
　前記プロセッサは、
　検知対象とは異なる対象であって、前記検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得し、
　前記関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、前記関連データセットのラベルありデータで評価し、評価結果が上がるように、前記第１の異常検知器を学習するための異常検知学習モデルを学習する
　学習装置。

　（付記項２）
　付記項１に記載の学習装置であって、
　目標タスクである検知対象のラベルなしデータが与えられた際に、前記学習部によって学習された前記異常検知学習モデルを用いて、前記目標タスクに対応する第２の異常検知器を学習し、学習した第２の異常検知器を用いて前記検知対象のテストデータの異常検知を行う
　学習装置。

　（付記項３）
　付記項１に記載の学習装置であって、
　前記学習することは、
　前記関連データセットのラベルなしデータの中で、他のサンプルとは性質が異なるサンプルの学習における影響度を小さくして、前記第１の異常検知器の学習を行う
　学習装置。

　（付記項４）
　学習処理を実行するようにコンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
　前記学習処理は、
　検知対象とは異なる対象であって、前記検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得し、
　前記関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、前記関連データセットのラベルありデータで評価し、評価結果が上がるように、前記第１の異常検知器を学習するための異常検知学習モデルを学習する
　非一時的記憶媒体。

　以上、本発明者によってなされた発明を適用した実施の形態について説明したが、本実施の形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。すなわち、本実施の形態に基づいて当業者等によりなされる他の実施の形態、実施例及び運用技術等は全て本発明の範疇に含まれる。

　１　検知装置
　１０　学習部
　１１　学習データ入力部
　１２，２２　特徴抽出部
　１３　異常検知学習モデル学習部
　１４　格納部
　２０　検知部
　２１　データ入力部
　２３　学習・検知部
　２４　検知結果出力部
　１４１　異常検知学習モデル

Claims

　検知対象とは異なる対象であって、前記検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得する取得部と、
　前記関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、前記関連データセットのラベルありデータで評価し、評価結果が上がるように、前記第１の異常検知器を学習するための異常検知学習モデルを学習する学習部と、
　を有することを特徴とする学習装置。
　目標タスクである検知対象のラベルなしデータが与えられた際に、前記学習部によって学習された前記異常検知学習モデルを用いて、前記目標タスクに対応する第２の異常検知器を学習し、学習した第２の異常検知器を用いて前記検知対象のテストデータの異常検知を行う検知部
　をさらに有することを特徴とする請求項１に記載の学習装置。
　前記学習部は、前記関連データセットのラベルなしデータの中で、他のサンプルとは性質が異なるサンプルの学習における影響度を小さくして、前記第１の異常検知器の学習を行うことを特徴とする請求項１に記載の学習装置。
　学習装置が実行する学習方法であって、
　検知対象とは異なる対象であって、前記検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得する工程と、
　前記関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、前記関連データセットのラベルありデータで評価し、評価結果が上がるように、前記第１の異常検知器を学習するための異常検知学習モデルを学習する工程と、
　を含んだことを特徴とする学習方法。
　検知対象とは異なる対象であって、前記検知対象と関連する対象のラベルなしデータとラベルありデータとを、関連データセットとして取得するステップと、
　前記関連データセットのラベルなしデータで学習した第１の異常検知器の性能を、前記関連データセットのラベルありデータで評価し、評価結果が上がるように、前記第１の異常検知器を学習するための異常検知学習モデルを学習するステップと、
　をコンピュータに実行させるための学習プログラム。