WO2021176514A1

WO2021176514A1 - 学習処理プログラム、情報処理装置及び学習処理方法

Info

Publication number: WO2021176514A1
Application number: PCT/JP2020/008681
Authority: WO
Inventors: 小林健; 梅田裕平
Original assignee: 富士通株式会社
Priority date: 2020-03-02
Filing date: 2020-03-02
Publication date: 2021-09-10
Also published as: US20220405526A1; EP4116892A4; EP4116892A1; JP7368776B2; JPWO2021176514A1

Abstract

ラベルが付与されていない学習データセットを用いた学習により生成された判定モデルを用いて、学習データセットに含まれるデータのそれぞれについての学習データセットにおける特徴量の外れ度を算出し、外れ度に基づいて、学習データセットに含まれる１以上のデータまたは１以上のデータに関連する関連データを選択して出力し、１以上のデータに対するユーザによる判定結果の入力を受け付け、受け付けた判定結果に基づいて、学習データセットに含まれるデータのそれぞれの特徴量を調整する調整基準を決定し、判定モデルによる判定対象のデータの判定が行われる際に、判定対象のデータの特徴量は、調整基準に基づいて調整される。

Description

学習処理プログラム、情報処理装置及び学習処理方法

　本発明は、学習処理プログラム、情報処理装置及び学習処理方法に関する。

　近年、機械学習によって生成された判定モデルを用いた異常検知（以下、単に異常検知とも呼ぶ）が行われている。このような異常検知は、例えば、自動車のセンサデータに基づく悪路検出や、工場における製品の外観検査等の分野において用いられている。

　具体的に、上記のような判定モデルでは、例えば、異常判定の対象となるデータ（以下、判定対象データとも呼ぶ）のそれぞれの特徴量ベクトルを特徴空間に分布し、判定対象データのうち、正常状態のデータに対応する特徴量ベクトルからの距離の大きいデータを特定する。そして、異常検知では、特定した判定対象データのそれぞれを異常状態にあるデータとして検出してユーザに提示する（例えば、非特許文献１参照）。

https://en.wikipedia.org/wiki/Unsupervised_learning

　ここで、上記のような判定モデルの生成が行われる場合、ユーザは、手作業による学習データのラベル付けを行う場合がある。そのため、ラベル付けを行う必要がある学習データの数によっては、ラベル付けに伴うユーザによる作業工数が膨大になる場合がある。

　また、上記のような判定モデルは、例えば、特徴空間における特徴量ベクトルの距離を用いることによって各データの状態を判定する。そのため、上記のような判定モデルでは、ユーザが暗黙に所望する異常状態のデータ等を必ずしも検出することができない可能性がある。

　そこで、ユーザは、判定モデルの学習段階において、例えば、学習データにフィードバックを与える能動学習を行う。具体的に、ユーザは、例えば、異常状態にあるデータとして判定モデルから出力されたデータの一部について、異常状態にあるデータであるか否かのラベル付けを行い、さらに、ラベル付けされたデータを用いることによる教師あり学習を行う。

　これにより、ユーザは、例えば、ラベル付けの過程においてユーザが暗黙に所望していた異常状態の存在に気が付くことが可能になり、ユーザが暗黙に所望していた異常状態のデータについても検出可能な判定モデルを生成することが可能になる。また、ユーザは、ラベル付けに伴う作業工数を抑制することが可能になる。

　しかしながら、上記のような能動学習を行う場合、ユーザは、検知する必要があるデータの異常状態を予め網羅的に把握している必要がある。そのため、例えば、ユーザがデータの異常状態について十分に把握していない場合、上記のような能動学習を行うことができない。

　さらに、例えば、学習段階における作成者の設計等が適切でなかった等の理由によって判定モデルの再生成が必要となった場合、ラベル付けを含む作業を再度行う必要が生じ、ユーザによる作業工数がより膨大になる場合がある。

　そこで、一つの側面では、本発明は、判定モデルの改善を容易に行うことを可能とする学習処理プログラム、情報処理装置及び学習処理方法を提供することを目的とする。

　実施の形態の一態様では、ラベルが付与されていない学習データセットを用いた学習により生成された判定モデルを用いて、前記学習データセットに含まれるデータのそれぞれについての前記学習データセットにおける特徴量の外れ度を算出し、前記外れ度に基づいて、前記学習データセットに含まれる１以上のデータまたは前記１以上のデータに関連する関連データを選択して出力し、前記１以上のデータに対するユーザによる判定結果の入力を受け付け、受け付けた前記判定結果に基づいて、前記学習データセットに含まれるデータのそれぞれの特徴量を調整する調整基準を決定する、処理をコンピュータに実行させ、前記判定モデルによる判定対象のデータの判定が行われる際に、判定対象のデータの特徴量は、前記調整基準に基づいて調整される。

　一つの側面によれば、判定モデルの改善を容易に行うことを可能とする。

図１は、情報処理システム１０の構成について説明する図である。図２は、判定モデルの学習段階における処理の具体例について説明する図である。図３は、判定モデルによる異常検知の具体例について説明する図である。図４は、判定モデルによる異常検知の具体例について説明する図である。図５は、判定モデルの学習段階における処理の具体例について説明する図である。図６は、情報処理装置１のハードウエア構成を説明する図である。図７は、情報処理装置１の機能のブロック図である。図８は、第１の実施の形態における学習処理の概略を説明するフローチャート図である。図９は、第１の実施の形態における推論処理の概略を説明するフローチャート図である。図１０は、第１の実施の形態における学習処理の概略を説明する図である。図１１は、調整器による特徴量ベクトルの座標変換の具体例について説明する図である。図１２は、調整器による特徴量ベクトルの座標変換の具体例について説明する図である。図１３は、調整器による特徴量ベクトルの座標変換の具体例について説明する図である。図１４は、第１の実施の形態における学習処理の詳細を説明するフローチャート図である。図１５は、第１の実施の形態における学習処理の詳細を説明するフローチャート図である。図１６は、第１の実施の形態における学習処理の詳細を説明するフローチャート図である。図１７は、第１の実施の形態における推論処理の詳細を説明するフローチャート図である。図１８は、第１の実施の形態における学習処理の詳細を説明する図である。図１９は、第１の実施の形態における学習処理の詳細を説明する図である。図２０は、第１の実施の形態における学習処理の詳細を説明する図である。

　［情報処理システムの構成］
　初めに、情報処理システム１０の構成について説明を行う。図１は、情報処理システム１０の構成について説明する図である。

　情報処理システム１０は、図１に示すように、情報処理装置１と、ユーザが情報の入力等を行うユーザ端末２とを有する。ユーザ端末２は、例えば、ユーザが使用するＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）であり、情報処理装置１のインターネット網等のネットワークＮＷを介して接続している。

　具体的に、ユーザ端末２は、例えば、異常検知を行うための判定モデル（図示しない）を生成するために用いられる学習データ１３１の入力を受け付ける。そして、ユーザ端末２は、学習データ１３１の入力を受け付けた場合、その学習データ１３１を情報処理装置１に送信する。

　なお、学習データ１３１のそれぞれは、例えば、自動車に搭載されたカメラによって撮像された動画データに含まれる画像データのそれぞれであってよい。また、学習データ１３１のそれぞれは、例えば、自動車に搭載されたカメラによって撮像された動画データの変化を示す時系列データ（所定のウインドウサイズごとに切り出された動画データに対応する時系列データ）のそれぞれであってよい。

　情報処理装置１は、ユーザ端末２から送信された学習データ１３１を受け付けた場合、例えば、受け付けた学習データ１３１を情報格納領域１３０に記憶する。そして、情報処理装置１は、学習段階において、情報格納領域１３０に記憶した学習データ１３１の学習を行うことにより、データの異常検知を行うための判定モデルの生成を行う。

　その後、例えば、推論段階において、ユーザ端末２を介して判定対象データ（異常状態にあるか否かが未知であるデータ）が入力された場合、情報処理装置１は、その判定対象データを判定モデルに入力する。そして、情報処理装置１は、判定対象データの入力に伴って判定モデルから出力された値を、判定対象データが異常状態にあるデータであるか否かを示す情報として出力する。

　［判定モデルの学習段階における処理の具体例］
　次に、判定モデルの学習段階における処理の具体例について説明を行う。図２は、判定モデルの学習段階における処理の具体例について説明する図である。

　ユーザは、上記のような判定モデルの生成を行う場合、図２に示すように、学習データ１３１の収集を行った後（Ｓ１０１）、手作業による学習データ１３１のラベル付けを行う（Ｓ１０２）。そして、ユーザは、学習方法の選択を行った後（Ｓ１０３）、ラベル付けを行った学習データ１３１を用いることによって判定モデルの生成を行う（Ｓ１０４）。その後、ユーザは、例えば、判定精度等が基準を満たしていることの確認を行う（Ｓ１０５）。

　そのため、ラベル付けを行う必要がある学習データ１３１の数によっては、ラベル付けに伴うユーザによる作業工数が膨大になる場合がある。

　また、上記のような判定モデルは、推論段階において、例えば、特徴空間における特徴量ベクトルの距離を用いることによって各判定対象データの状態を判定する。そのため、上記のような判定モデルでは、ユーザが暗黙に所望する異常状態にある判定対象データを必ずしも検出することができない可能性がある。以下、判定モデルによる異常検知の具体例について説明を行う。

　［判定モデルによる異常検知の具体例］
　図３及び図４は、判定モデルによる異常検知の具体例について説明する図である。なお、以下、外部から受信した複数のメールからスパムメールの検知を行う判定モデルを用いる場合について説明を行う。

　図３に示す例は、学習段階において学習した学習データ１３１に対応する各特徴量ベクトル（ベクトル群ＶＧ１、ベクトル群ＶＧ２及びベクトル群ＶＧ３に含まれる各特徴量ベクトル）が特徴空間に分布されている状態を示している。

　具体的に、ベクトル群ＶＧ２に含まれる各特徴量ベクトルに対応するメールは、例えば、自然文からかけ離れた表現によって記述されたメールであり、ベクトル群ＶＧ３に含まれる各特徴量ベクトルに対応するメールは、例えば、自然文によって記述されたメールである。そのため、判定モデルは、この場合、図３に示すように、ベクトル群ＶＧ２に含まれる各特徴量ベクトルを、ベクトル群ＶＧ１に含まれる各特徴量ベクトル（正常メールに対応する各特徴量ベクトル）から遠い位置に分布し、ベクトル群ＶＧ３に含まれる各特徴量ベクトルを、正常メールに対応する各特徴量ベクトルから近い位置に分布する。

　しかしながら、上記のような学習が行われた場合、判定モデルは、図４に示すように、例えば、自然文に似せた表現によって記述されたスパムメールを、異常状態にあるメールとして検知することができない可能性がある。また、判定モデルは、この場合、例えば、自然文からかけ離れた表現によって記述された正常メールを、異常状態にあるメールとして検知する可能性がある。すなわち、上記のように学習が行われた判定モデルでは、ユーザが暗黙に所望する異常状態にある判定対象データを必ずしも検出することができない可能性がある。

　そこで、ユーザは、例えば、学習段階（判定モデルの検証段階）において、学習データ１３１にフィードバックを与える能動学習を行う。具体的に、ユーザは、例えば、判定モデルに対して入力された学習データ１３１のうち、異常状態にあると判定された学習データ１３１について、異常状態にあるデータであるか否かのラベル付けを人手によって行う。そして、ユーザは、ラベル付けされた学習データ１３１を用いることによる教師あり学習を行う。

　これにより、ユーザは、例えば、ラベル付けの過程においてユーザが暗黙に所望していた異常状態の存在に気が付くことが可能になり、ユーザが暗黙に所望していた異常状態のデータについても検出可能な判定モデルを生成することが可能になる。

　しかしながら、上記のような能動学習を行う場合、ユーザは、検知する必要があるデータの異常状態を予め網羅的に把握している必要がある。そのため、例えば、ユーザがデータの異常状態について十分に把握していない場合、上記のような能動学習を行うことができない。また、異常状態にあるデータが正常状態にあるデータであると判定モデルによって判定された場合、ユーザは、このようなデータの検知を行うことができない。

　さらに、学習段階における作成者の設計等が適切でなかった等の理由によって判定モデルの判定精度等が基準を満たしていない場合、ユーザは、図５に示すように、判定モデルの再生成を行う必要性からラベル付けを含む各作業を再度行う必要が生じ、ユーザによる作業工数がより膨大になる場合がある（Ｓ１０６のＮＯ、Ｓ１０２等）。

　そこで、本実施の形態における情報処理装置１は、学習段階において、ラベルが付与されていない複数の学習データ１３１（以下、学習データセットとも呼ぶ）を用いた学習により生成された判定モデルを用いて、学習データセットに含まれる学習データ１３１のそれぞれについての学習データセットにおける特徴量の外れ度を算出する。

　そして、情報処理装置１は、外れ度に基づいて、学習データセットに含まれる１以上の学習データ１３１または学習データセットに含まれる１以上の学習データ１３１のデータに関連する関連データを選択して出力する。その後、情報処理装置１は、出力した１以上の学習データ１３１に対するユーザによる判定結果の入力を受け付ける。続いて、情報処理装置１は、受け付けた判定結果に基づいて、学習データセットに含まれる学習データ１３１のそれぞれの特徴量を調整する調整基準を決定する。

　その後、情報処理装置１は、推論段階において、判定対象データの特徴量を調整基準によって調整してから判定対象データについての判定を行う。

　すなわち、情報処理装置１は、例えば、学習データセットに含まれる一部の学習データ１３１に対応する判定結果のみの入力をユーザから受け付け、受け付けた判定結果を用いることによって、学習データセットに含まれる全ての学習データ１３１の特徴量の調整を行う調整基準を決定する。具体的に、情報処理装置１は、例えば、判定結果に基づいて、特徴空間における各学習データ１３１の特徴量ベクトルの座標変換を行う行列を調整基準として決定する。

　これにより、情報処理装置１は、ラベル付けに伴うユーザの作業工数を抑制することが可能になり、また、ユーザが暗黙に所望していた異常状態のデータを検出可能な判定モデルを生成することが可能になる。

　［情報処理システムのハードウエア構成］
　次に、情報処理システム１０のハードウエア構成について説明する。図６は、情報処理装置１のハードウエア構成を説明する図である。

　情報処理装置１は、図６に示すように、プロセッサであるＣＰＵ１０１と、メモリ１０２と、外部インターフェース（Ｉ／Ｏユニット）１０３と、記憶媒体１０４とを有する。各部は、バス１０５を介して互いに接続される。

　記憶媒体１０４は、例えば、判定モデルの生成及び調整を行う処理（以下、単に学習処理とも呼ぶ）を行うためのプログラム１１０を記憶するプログラム格納領域（図示しない）を有する。また、記憶媒体１０４は、例えば、学習処理を行う際に用いられる情報を記憶する情報格納領域１３０を有する。なお、記憶媒体１０４は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）やＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）であってよい。

　ＣＰＵ１０１は、記憶媒体１０４からメモリ１０２にロードされたプログラム１１０を実行して学習処理を行う。

　外部インターフェース１０３は、例えば、ネットワークＮＷを介することによってユーザ端末２と通信を行う。

　［情報処理システムの機能］
　次に、情報処理システム１０の機能について説明を行う。図７は、情報処理装置１の機能のブロック図である。

　情報処理装置１は、図７に示すように、情報処理装置１のＣＰＵ１０１やメモリ１０２等のハードウエアとプログラム１１０とが有機的に協働することにより、データ受信部１１１と、データ管理部１１２と、モデル生成部１１３と、外れ度算出部１１４と、情報出力部１１５と、入力受付部１１６と、特徴量調整部１１７と、データ判定部１１８とを含む各種機能を実現する。

　また、情報処理装置１は、図７に示すように、学習データ１３１と、判定対象データ１３２とを情報格納領域１３０に記憶する。

　初めに、学習段階における機能について説明を行う。

　データ受信部１１１は、例えば、複数の学習データ１３１を含む学習データセットをユーザ端末２から受信する。具体的に、データ受信部１１１は、例えば、ラベルが付加されていない複数の学習データ１３１からなる学習データセットを受信する。そして、データ管理部１１２は、データ受信部１１１が受信した学習データセットを情報格納領域１３０に記憶する。

　モデル生成部１１３は、情報格納領域１３０に記憶された学習データセットに含まれる複数の学習データ１３１を用いることによって判定モデルを生成する。

　外れ度算出部１１４は、モデル生成部１１３が生成した判定モデルを用いることによって、情報格納領域１３０に記憶された学習データセットに含まれる学習データ１３１のそれぞれについての学習データセットにおける特徴量の外れ度を算出する。

　情報出力部１１５は、外れ度算出部１１４が算出した外れ度に基づいて、学習データセットに含まれる１以上の学習データ１３１を選択する。具体的に、情報出力部１１５は、例えば、外れ度算出部１１４が算出した外れ度が高い方から順に１以上の学習データ１３１の選択を行う。そして、情報出力部１１５は、例えば、選択した１以上の学習データ１３１をユーザ端末２に出力する。

　入力受付部１１６は、情報出力部１１５が出力した１以上のデータに対するユーザによる判定結果の入力を受け付ける。具体的に、入力受付部１１６は、例えば、ユーザ端末２を介してユーザが入力した判定結果を受け付ける。

　さらに具体的に、入力受付部１１６は、例えば、情報出力部１１５が出力した１以上のデータのそれぞれが、異常状態にあるデータであって優先度が高いデータ（以下、第１データとも呼ぶ）と、異常状態にあるデータであって優先度が低いデータ（以下、第２データとも呼ぶ）と、正常状態にあるデータ（以下、第３データとも呼ぶ）とのうちのいずれであるかを示す判定結果の入力を受け付ける。

　特徴量調整部１１７は、入力受付部１１６が受け付けた判定結果に基づいて、情報格納領域１３０に記憶された学習データセットに含まれる学習データ１３１のそれぞれの特徴量を調整する調整基準を決定する。具体的に、特徴量調整部１１７は、情報格納領域１３０に記憶された学習データに含まれる学習データ１３１のそれぞれに対応する特徴量ベクトルを特徴空間に分布した場合において、その特徴空間における各学習データ１３１の特徴量ベクトルの座標変換を行う行列を調整基準として決定する。

　さらに具体的に、特徴量調整部１１７は、例えば、入力受付部１１６が受け付けた判定結果が第１データであることを示す学習データ１３１のそれぞれに対応する外れ度が小さくなるように、学習データセットに含まれる学習データ１３１のそれぞれの特徴量を調整する調整基準を決定する。

　次に、推論段階における機能について説明を行う。

　データ受信部１１１は、例えば、判定モデルによる判定を行う判定対象データ１３２をユーザ端末２から受信する。そして、データ管理部１１２は、例えば、データ受信部１１１が受信した判定対象データ１３２を情報格納領域１３０に記憶する。

　データ判定部１１８は、モデル生成部１１３が生成した判定モデルに対して、データ受信部１１１が受信した判定対象データ１３２を入力する。この場合、判定モデルは、データ受信部１１１が受信した判定対象データ１３２から抽出した特徴量を、特徴量調整部１１７が決定した調整基準を用いることによって調整する。そして、判定モデルは、調整した特徴量を用いることによって、データ受信部１１１が受信した判定対象データ１３２についての判定を行う。具体的に、判定モデルは、例えば、データ受信部１１１が受信した判定対象データ１３２が異常状態にあるデータであるか否かについての判定を行う。

　情報出力部１１５は、例えば、データ判定部１１８によって行われた判定結果（例えば、判定対象データ１３２が異常状態にあるデータであるか否かについての判定結果）をユーザ端末２に出力する。

　［第１の実施の形態の概略］
　次に、第１の実施の形態の概略について説明する。図８は、第１の実施の形態における学習処理の概略を説明するフローチャート図である。また、図９は、第１の実施の形態における推論処理の概略を説明するフローチャート図である。さらに、図１０は、第１の実施の形態における学習処理の概略を説明する図である。

　初めに、第１の実施の形態における学習処理の概略について説明を行う。

　情報処理装置１は、図８に示すように、例えば、モデル学習タイミングになるまで待機する（Ｓ１のＮＯ）。モデル学習タイミングは、例えば、ユーザがユーザ端末２を介して判定モデルの学習を行う旨の情報を入力したタイミングであってよい。

　そして、モデル学習タイミングになった場合（Ｓ１のＹＥＳ）、情報処理装置１は、ラベルが付与されていない学習データセットを用いた学習により生成された判定モデルを用いて、学習データセットに含まれる学習データ１３１のそれぞれについての学習データセットにおける特徴量の外れ度を算出する（Ｓ２）。

　続いて、情報処理装置１は、Ｓ２の処理で算出した外れ度に基づいて、学習データセットに含まれる１以上のデータを選択して出力する（Ｓ３）。

　その後、情報処理装置１は、Ｓ３の処理で出力した１以上のデータに対するユーザによる判定結果の入力を受け付けるまで待機する（Ｓ４のＮＯ）。

　そして、Ｓ３の処理で出力した１以上のデータに対するユーザによる判定結果の入力を受け付けた場合（Ｓ４のＹＥＳ）、情報処理装置１は、受け付けた判定結果に基づいて、学習データセットに含まれる学習データ１３１のそれぞれの特徴量を調整する調整基準を決定する（Ｓ５）。

　次に、第１の実施の形態における推論処理の概略について説明を行う。

　情報処理装置１は、図９に示すように、例えば、ユーザがユーザ端末２を介して判定対象データ１３２を入力するまで待機する（Ｓ１１のＮＯ）。

　そして、判定対象データ１３２が入力された場合（Ｓ１１のＹＥＳ）、情報処理装置１は、判定モデルとＳ５の処理で決定した調整基準とを用いることによって、Ｓ１１の処理で入力された判定対象データ１３２についての判定を行う（Ｓ１２）。

　その後、情報処理装置１は、Ｓ１１の処理で入力された判定対象データ１３２についての判定結果を出力する（Ｓ１３）。

　すなわち、本実施の形態における情報処理装置１は、学習段階（判定モデルの検証段階）において、学習データセットに含まれる一部の学習データ１３１に対応する判定結果のみの入力をユーザから受け付け、受け付けた判定結果を用いることによって、学習データセットに含まれる全ての学習データ１３１の特徴量の調整を行う。具体的に、情報処理装置１は、図１０に示すように、特徴空間における各学習データ１３１の特徴量ベクトルの座標変換を行う調整器を、判定モデルを構成する機能の一つとして生成する（Ｓ１０８）。

　そして、情報処理装置１は、推論段階において、調整器を含む判定モデルを用いることによって、判定対象データ１３２が異常状態にあるデータであるか否かについての判定を行う。

　これにより、情報処理装置１は、ラベル付けに伴うユーザの作業工数を抑制しながら、ユーザが暗黙に所望していた異常状態のデータについても検出可能な判定モデルを生成することが可能になる。

　また、本実施の形態における情報処理装置１は、上記のように調整器の生成を行う場合、生成済の判定モデルの再生成を要しない。

　これにより、ユーザは、学習データ１３１のラベル付けに要する作業工数に加え、判定モデルの再生成に要する作業工数についても抑制することが可能になる。以下、調整器による特徴量ベクトルの座標変換の具体例について説明を行う。

　［調整器による特徴量ベクトルの座標変換の具体例］
　図１１から図１３は、調整器による特徴量ベクトルの座標変換の具体例について説明する図である。以下、学習段階において正常状態にある学習データ１３１と異常状態にある学習データ１３１との両方を学習するものとして説明を行う。

　図１１に示す例は、正常状態にある学習データ１３１に対応する各特徴量ベクトル（ベクトル群ＶＧ１１に含まれる各特徴量ベクトル）が特徴空間に分布されている状態を示している。また、図１１に示す例は、異常状態にある学習データ１３１に対応する各特徴量ベクトル（ベクトル群ＶＧ１２及びベクトル群ＶＧ１３のそれぞれに含まれる各特徴量ベクトル）が特徴空間に分布されている状態を示している。そして、図１１に示す例では、ベクトル群Ｖ１２に含まれる各特徴量ベクトルよりもベクトル群Ｖ１３に含まれる各特徴量ベクトルの方が、ベクトル群Ｖ１１に含まれる各特徴量ベクトルから近い位置に分布されている。

　ここで、例えば、Ｓ４の処理でユーザから入力を受け付けた判定結果が、ベクトル群ＶＧ１３に含まれる特徴量ベクトルに対応する判定対象データ１３２を、ベクトル群ＶＧ１２に含まれる特徴量ベクトルに対応する判定対象データ１３２よりも異常として検知したい旨を示している場合、情報処理装置１は、図１２に示すように、ベクトル群Ｖ１１に含まれる各特徴量ベクトルとベクトル群Ｖ１３に含まれる各特徴量ベクトルとの間の距離を、ベクトル群Ｖ１１に含まれる各特徴量ベクトルとベクトル群Ｖ１２に含まれる各特徴量ベクトルとの間の距離よりも遠くするための座標変換を行う調整器を生成する。

　これにより、ユーザは、調整器を用いることで、例えば、図１３に示すように、ベクトル群ＶＧ１２及びベクトル群ＶＧ１３に含まれる特徴量ベクトルのそれぞれに対してラベル付けを行うことなく、ベクトル群ＶＧ１２に含まれる特徴量ベクトルに対応する判定対象データ１３２よりも、ベクトル群ＶＧ１３に含まれる特徴量ベクトルに対応する判定対象データ１３２を異常として検知する判定モデルの生成を行うことが可能になる。

　［第１の実施の形態の詳細］
　次に、第１の実施の形態の詳細について説明する。図１４から図１６は、第１の実施の形態における学習処理の詳細を説明するフローチャート図である。また、図１７は、第１の実施の形態における推論処理の詳細を説明するフローチャート図である。さらに、図１８から図２０は、第１の実施の形態における学習処理の詳細を説明する図である。

　［学習データ記憶処理］
　初めに、第１の実施の形態における学習処理のうち、学習データ１３１の記憶を行う処理（以下、学習データ記憶処理とも呼ぶ）について説明を行う。図１４は、第１の実施の形態における学習データ記憶処理について説明するフローチャート図である。

　情報処理装置１のデータ受信部１１１は、例えば、学習データ１３１（学習データセットに含まれる学習データ１３１）をユーザ端末２から受信するまで待機する（Ｓ２１のＮＯ）。

　そして、例えば、複数の学習データ１３１を含む学習データセットを受信した場合（Ｓ２１のＹＥＳ）、情報処理装置１のデータ管理部１１２は、Ｓ２１の処理で受信した学習データ１３１を情報格納領域１３０に記憶する（Ｓ２２）。

　［モデル生成処理］
　次に、第１の実施の形態における学習処理のうち、判定モデルの生成を行う処理（以下、モデル生成処理とも呼ぶ）について説明を行う。図１５は、第１の実施の形態におけるモデル生成処理について説明するフローチャート図である。

　情報処理装置１のモデル生成部１１３は、図１５に示すように、モデル生成タイミングになるまで待機する（Ｓ３１のＮＯ）。モデル生成タイミングは、例えば、ユーザがユーザ端末２を介して判定モデルの生成を開始する旨の情報を入力したタイミングであってよい。

　そして、モデル生成タイミングになった場合（Ｓ３１のＹＥＳ）、モデル生成部１１３は、情報格納領域１３０に記憶された学習データ１３１の一部（以下、第１学習データ１３１ａと呼ぶ）のそれぞれに対応する特徴量を特定する（Ｓ３２）。第１学習データ１３１ａは、例えば、ユーザによって正常状態にあると判定された学習データ１３１であってよい。

　その後、モデル生成部１１３は、Ｓ３２の処理で特定した特徴量のそれぞれを用いることによって、判定モデルを生成する（Ｓ３３）。

　次に、情報処理装置１の外れ度算出部１１４は、Ｓ３３の処理で生成した判定モデルを用いて、情報格納領域１３０に記憶された学習データ１３１の一部（以下、第２学習データ１３１ｂと呼ぶ）のそれぞれに対応する特徴量の外れ度を算出する（Ｓ２４）。第２学習データ１３１ｂは、例えば、第１学習データ１３１ａと異なる学習データ１３１であって、ユーザによって異常状態にあると判定された学習データ１３１であってよい。また、第２学習データ１３１ｂは、例えば、第１学習データ１３１ａと異なる学習データ１３１であって、ユーザによって異常状態にあると判定された学習データ１３１と正常状態にあると判定された学習データ１３１との両方を含むものであってよい。

　具体的に、外れ度算出部１１４は、第２学習データ１３１ｂのそれぞれを入力することに応じて判定モデルから出力された値から、第２学習データ１３１ｂのそれぞれに対応する特徴量の外れ度を算出する。すなわち、外れ度算出部１１４は、第２学習データ１３１ｂごとに、特徴空間における他の第２学習データ１３１ｂに対する特徴量ベクトルの乖離状態を示す値を外れ度として算出する。以下、各学習データ１３１に対応する特徴量の外れ度の具体例について説明を行う。

　［各学習データに対応する特徴量の外れ度の具体例］
　図１８は、各学習データ１３１に対応する特徴量の外れ度の具体例を説明する図である。図１８に示すグラフでは、横軸が時刻に対応し、縦軸が各時刻に対応する学習データ１３１（各時刻に取得された学習データ１３１）の特徴量の外れ度に対応する。なお、図１８に示す例では、例えば、１分毎の時系列データが学習データ１３１のそれぞれに対応する。

　具体的に、図１８に示す例において、例えば、外れ度が０である学習データ１３１は、正常状態にあるデータであることを示している。これに対し、例えば、外れ度が０でない学習データ１３１は、異常状態にあるデータであることを示している。

　図１５に戻り、情報処理装置１の情報出力部１１５は、Ｓ３４の処理で算出した外れ度が高い順に、１以上の第２学習データ１３１ｂを選択して出力する（Ｓ３５）。具体的に、情報出力部１１５は、例えば、１以上の第２学習データ１３１ｂのそのものをユーザ端末２に出力する。また、情報出力部１１５は、例えば、１以上の第２学習データ１３１ｂの少なくとも一部の内容を示す関連データをユーザ端末２に出力する。以下、Ｓ３５の処理の具体例について説明を行う。

　［Ｓ３５の処理の具体例］
　図１９は、Ｓ３５の処理の具体例について説明する具体例である。

　図１９で示すグラフは、特徴量の外れ度が０でない学習データ１３１の集合として、データ集合ＤＧ１、ＤＧ２、及びＤＧ３が存在していることを示している。

　そして、情報出力部１１５は、例えば、データ集合ＤＧ１、ＤＧ２及びＤＧ３のうち、各時刻の外れ度の平均値が最も大きいデータ集合ＤＧ３を選択して出力する。

　図１６に戻り、情報処理装置１の入力受付部１１６は、情報出力部１１５が出力した１以上の第２学習データ１３１ｂに対するユーザによる判定結果の入力を受け付けるまで待機する（Ｓ４１のＮＯ）。

　具体的に、入力受付部１１６は、情報出力部１１５が出力した１以上の第２学習データ１３１ｂのそれぞれが、異常状態にあるデータであって優先度が高い第１データと、異常状態にあるデータであって優先度が低い第２データと、正常状態にある第３データとのうちのいずれに対応するデータであるかを示す判定結果の入力を受け付ける。

　なお、ユーザは、この場合、新たな異常に対応する第２学習データ１３１ｂの存在を検知した場合に、その第２学習データ１３１ｂを第１データとして判定するものであってよい。また、ユーザは、この場合、情報出力部１１５が出力した１以上の第２学習データ１３１ｂのそれぞれについて、異常度合い及び優先度を示すスコアの入力を行うものであってもよい。

　そして、１以上の第２学習データ１３１ｂに対するユーザによる判定結果の入力を受け付けた場合（Ｓ４１のＹＥＳ）、情報処理装置１の特徴量調整部１１７は、１以上の第２学習データ１３１ｂに対する判定結果が所定の条件を満たすか否かを判定する（Ｓ４２）。

　具体的に、特徴量調整部１１７は、例えば、１以上の第２学習データ１３１ｂのうち、第１データとして判定された第２学習データ１３１ｂの数または割合が閾値以上であるか否かについての判定を行う。

　その結果、１以上の第２学習データ１３１ｂに対する判定結果が所定の条件を満たさないと判定した場合（Ｓ４２のＮＯ）、特徴量調整部１１７は、Ｓ３１の処理で受け付けた判定結果を用いることによって、情報格納領域１３０に記憶された学習データ１３１（第１学習データ１３１ａ及び第２学習データ１３１ｂ）の特徴量を調整する調整基準を決定する（Ｓ４３）。

　具体的に、特徴量調整部１１７は、例えば、Ｓ３１の処理で受け付けた判定結果を用いることによって、情報格納領域１３０に記憶された学習データ１３１についての距離学習を行う。そして、特徴量調整部１１７は、情報格納領域１３０に記憶された学習データ１３１のそれぞれの特徴量が距離学習の学習結果に従うように調整基準の決定を行う。以下、Ｓ４３の処理の具体例について説明を行う。

　［Ｓ４３の処理の具体例］
　初めに、学習データ１３１についての距離学習の具体例について説明を行う。

　特徴量調整部１１７は、例えば、第１及び第２データのそれぞれと第３データとの距離が大きくなるように距離学習を行う。また、特徴量調整部１１７は、例えば、第１データと第３データとの距離が第２データと第３データとの距離よりも大きくなるように距離学習を行う。さらに、特徴量調整部１１７は、例えば、異なる第３データの間の距離が小さくなるように距離学習を行う。

　具体的に、特徴量調整部１１７は、例えば、以下の式（１）から式（４）に示す最適化問題を解くことによって距離学習を行う。

　上記の式（１）は、第１及び第２データのそれぞれと第３データとの距離を大きくすることを示す式であり、式（２）は、異なる第３データの間の距離を小さくすること（異なる第３データの間の距離を閾値以下にすること）を示す式であり、式（３）は、第１データと第３データとの距離を第２データと第３データとの距離よりも大きくすることを示す式であり、式（４）は、行列Ｍが半正定値行列であることを示す式である。

　なお、上記の式（１）から（４）において、Ｘ_ｉは、ｉ番目の学習データ１３１を示し、Ｘ_ｊは、ｊ番目の学習データ１３１を示し、Ｎは、学習データ１３１のうちの第３データの集合を示し、Ａ_＋は、学習データ１３１のうちの第１データの集合を示し、Ａ_－は、学習データ１３１のうちの第２データの集合を示し、Ｍは、調整基準に対応する行列Ｍを示している。

　続いて、特徴量調整部１１７は、式（１）から式（４）に示す最適化問題の最適解である行列Ｍを以下の式（５）のように分解する。

　その後、特徴量調整部１１７は、以下の式（６）に従うことによって、特徴空間における学習データ１３１のそれぞれに対応する特徴量ベクトルの座標変換を行う。

　具体的に、特徴量調整部１１７は、例えば、図２０に示すように、図１９で説明した学習データ１３１のそれぞれに対応する特徴量ベクトルの座標変換を行う。

　これにより、特徴量調整部１１７は、第２学習データ１３１ｂのそれぞれに対応する特徴量の外れ度を抑えることが可能になる。

　なお、図２０で示す例では、データ集合ＤＧ１、ＤＧ２及びＤＧ３のそれぞれに対応する特徴量の外れ度が抑えられた一方、データ集合ＤＧ４に対応する特徴量の外れ度が上がったことを示している。

　図１６に戻り、外れ度算出部１１４は、Ｓ３３の処理で生成した判定モデルとＳ４３の処理で決定した調整基準とを用いて、情報格納領域１３０に記憶された第２学習データ１３１ｂのそれぞれに対応する特徴量の外れ度を算出する（Ｓ４４）。

　そして、情報出力部１１５は、Ｓ４４の処理で算出した外れ度が高い順に、１以上の第２学習データ１３１ｂを選択して出力する（Ｓ４５）。その後、入力受付部１１６は、Ｓ４１以降の処理を行う。

　一方、１以上の第２学習データ１３１ｂに対する判定結果が所定の条件を満たすと判定した場合（Ｓ４２のＹＥＳ）、情報処理装置１は、学習処理を終了する。

　［推論処理］
　次に、第１の実施の形態における推論処理について説明を行う。図１７は、第１の実施の形態における推論処理について説明するフローチャート図である。

　データ受信部１１１は、図１７に示すように、例えば、ユーザがユーザ端末２を介して判定対象データ１３２を入力するまで待機する（Ｓ５１のＮＯ）。

　そして、判定対象データ１３２が入力された場合（Ｓ５１のＹＥＳ）、情報処理装置１のデータ判定部１１８は、Ｓ３３の処理で生成した判定モデルとＳ４３の処理で決定した調整基準とを用いることによって、Ｓ５１の処理で入力された判定対象データ１３２についての判定を行う（Ｓ５２）。

　具体的に、判定モデルは、Ｓ５１の処理で入力された判定対象データ１３２から抽出した特徴量を、Ｓ４３の処理で決定した調整基準を用いることによって調整する。すなわち、判定モデルは、この場合、特徴空間における判定対象データ１３２に対応する特徴量ベクトルについて、Ｓ４３の処理で決定した調整基準（行列）を用いることによる座標変換を行う。そして、判定モデルは、調整した特徴量を用いることにより、Ｓ５１の処理で入力された判定対象データ１３２が異常状態にあるデータであるか否かについての判定を行う。

　なお、Ｓ４３の処理が複数回行われることによって調整基準（行列）が複数生成されている場合、Ｓ５１の処理で入力された判定対象データ１３２から抽出した特徴量を、Ｓ４３の処理で決定した調整基準の全てを用いることによって調整する。

　図１７に戻り、情報出力部１１５は、Ｓ５１の処理で入力された判定対象データ１３２についての判定結果を出力する（Ｓ５３）。

　このように、本実施の形態における情報処理装置１は、学習段階において、ラベルが付与されていない複数の学習データ１３１（学習データセット）を用いた学習により生成された判定モデルを用いて、学習データセットに含まれる学習データ１３１のそれぞれについての学習データセットにおける特徴量の外れ度を算出する。

　その後、情報処理装置１は、推論段階において、判定対象データの特徴量を調整基準によって調整してから判定対象データ１３２についての判定を行う。

　すなわち、本実施の形態における情報処理装置１は、学習段階（判定モデルの検証段階）において、学習データセットに含まれる一部の学習データ１３１に対応する判定結果のみの入力をユーザから受け付け、受け付けた判定結果を用いることによって、学習データセットに含まれる全ての学習データ１３１の特徴量の調整を行う。具体的に、情報処理装置１は、特徴空間における各学習データ１３１の特徴量ベクトルの座標変換を行う調整基準（調整器）を、判定モデルを構成する機能の一つとして生成する。

　これにより、ユーザは、学習データ１３１のラベル付けに要する作業工数に加え、判定モデルの再生成に要する作業工数についても抑制することが可能になる。

１：情報処理装置　　　　　　　２：ユーザ端末
１３０：情報格納領域　　　　　１３１：学習データ
ＮＷ：ネットワーク

Claims

　ラベルが付与されていない学習データセットを用いた学習により生成された判定モデルを用いて、前記学習データセットに含まれるデータのそれぞれについての前記学習データセットにおける特徴量の外れ度を算出し、
　前記外れ度に基づいて、前記学習データセットに含まれる１以上のデータまたは前記１以上のデータに関連する関連データを選択して出力し、
　前記１以上のデータに対するユーザによる判定結果の入力を受け付け、
　受け付けた前記判定結果に基づいて、前記学習データセットに含まれるデータのそれぞれの特徴量を調整する調整基準を決定する、
　処理をコンピュータに実行させ、
　前記判定モデルによる判定対象のデータの判定が行われる際に、判定対象のデータの特徴量は、前記調整基準に基づいて調整される、
　ことを特徴とする学習処理プログラム。
　請求項１において、
　前記外れ度を算出する処理では、前記学習データセットに含まれるデータごとに、特徴空間における前記学習データセットに含まれる他のデータの特徴量ベクトルに対する各データの特徴量ベクトルの乖離状態を示す値を前記外れ度として算出する、
　ことを特徴とする学習処理プログラム。
　請求項１において、
　前記１以上のデータを出力する処理では、前記学習データセットに含まれるデータから、前記外れ度が高い順に１以上のデータを選択して出力する、
　ことを特徴とする学習処理プログラム。
　請求項１において、
　前記判定結果の入力を受け付ける処理では、前記１以上のデータのそれぞれが、異常状態にあるデータであって優先度が高い第１データと、異常状態にあるデータであって優先度が低い第２データと、正常状態にある第３データとを含む複数のデータのうちのいずれであるかを示す判定結果の入力を受け付ける、
　ことを特徴とする学習処理プログラム。
　請求項４において、
　前記調整基準を決定する処理では、前記１以上のデータのうちの前記第１データに対応する前記外れ度が小さくなるように、前記学習データセットに含まれるデータのそれぞれの特徴量を調整する調整基準を決定する、
　ことを特徴とする学習処理プログラム。
　請求項４において、
　前記調整基準を決定する処理では、
　前記判定結果を用いることによって、前記１以上のデータについての距離学習を行い、
　前記１以上のデータのそれぞれの特徴量が前記距離学習の学習結果に従うように、前記調整基準の決定を行う、
　ことを特徴とする学習処理プログラム。
　請求項６において、
　前記調整基準を決定する処理では、前記第１及び第２データのそれぞれと前記第３データとの距離が大きく、かつ、前記第１データと前記第３データとの距離が前記第２データと前記第３データとの距離よりも大きく、かつ、異なる前記第３データの間の距離が小さくなるように、前記１以上のデータについての前記距離学習を行う、
　ことを特徴とする学習処理プログラム。
　請求項６において、
　前記調整基準を決定する処理では、特徴空間における前記第１データ及び前記第２データのそれぞれに対応する特徴量ベクトルの座標変換に用いる行列を前記調整基準として決定する、
　ことを特徴とする学習処理プログラム。
　請求項４において、
　前記外れ度を算出する処理と、前記１以上のデータを出力する処理と、前記判定結果の入力を受け付ける処理と、前記調整基準を決定する処理とを、前記１以上のデータに含まれる前記第１データの数または割合が閾値以上になるまで行う、
　ことを特徴とする学習処理プログラム。
　請求項１において、さらに、
　前記判定対象のデータの入力を受け付け、
　前記調整基準を用いることによって前記判定対象のデータに対応する特徴量を調整し、
　調整した前記特徴量の前記判定モデルに対する入力に応じて前記判定モデルから出力された値に基づいて、前記判定対象のデータについての判定を行い、
　前記判定対象のデータについての判定結果を出力する、
　処理をコンピュータに実行させることを特徴とする学習処理プログラム。
　ラベルが付与されていない学習データセットを用いた学習により生成された判定モデルを用いて、前記学習データセットに含まれるデータのそれぞれについての前記学習データセットにおける特徴量の外れ度を算出する外れ度算出部と、
　前記外れ度に基づいて、前記学習データセットに含まれる１以上のデータまたは前記１以上のデータに関連する関連データを選択して出力する情報出力部と、
　前記１以上のデータに対するユーザによる判定結果の入力を受け付ける入力受付部と、
　受け付けた前記判定結果に基づいて、前記学習データセットに含まれるデータのそれぞれの特徴量を調整する調整基準を決定する特徴量調整部と、を有し、
　前記判定モデルによる判定対象のデータの判定が行われる際に、判定対象のデータの特徴量は、前記調整基準に基づいて調整される、
　ことを特徴とする情報処理装置。
　請求項１１において、
　前記入力受付部は、前記判定対象のデータの入力を受け付け、
　前記特徴量調整部は、前記調整基準を用いることによって前記判定対象のデータに対応する特徴量を調整し、さらに、
　調整した前記特徴量の前記判定モデルに対する入力に応じて前記判定モデルから出力された値に基づいて、前記判定対象のデータについての判定を行うデータ判定部を有し、
　前記情報出力部は、前記判定対象のデータについての判定結果を出力する、
　処理をコンピュータに実行させることを特徴とする情報処理装置。
　ラベルが付与されていない学習データセットを用いた学習により生成された判定モデルを用いて、前記学習データセットに含まれるデータのそれぞれについての前記学習データセットにおける特徴量の外れ度を算出し、
　前記外れ度に基づいて、前記学習データセットに含まれる１以上のデータまたは前記１以上のデータに関連する関連データを選択して出力し、
　前記１以上のデータに対するユーザによる判定結果の入力を受け付け、
　受け付けた前記判定結果に基づいて、前記学習データセットに含まれるデータのそれぞれの特徴量を調整する調整基準を決定する、
　処理をコンピュータに実行させ、
　前記判定モデルによる判定対象のデータの判定が行われる際に、判定対象のデータの特徴量は、前記調整基準に基づいて調整される、
　ことを特徴とする学習処理方法。
　請求項１３において、さらに、
　前記判定対象のデータの入力を受け付け、
　前記調整基準を用いることによって前記判定対象のデータに対応する特徴量を調整し、
　調整した前記特徴量の前記判定モデルに対する入力に応じて前記判定モデルから出力された値に基づいて、前記判定対象のデータについての判定を行い、
　前記判定対象のデータについての判定結果を出力する、
　処理をコンピュータに実行させることを特徴とする学習処理方法。