JP7272455B2

JP7272455B2 - 検出方法、検出プログラム及び情報処理装置

Info

Publication number: JP7272455B2
Application number: JP2021553208A
Authority: JP
Inventors: 佳寛大川
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-10-23
Filing date: 2019-10-23
Publication date: 2023-05-12
Anticipated expiration: 2039-10-23
Also published as: US20220230027A1; WO2021079436A1; JPWO2021079436A1

Description

本発明は、検出方法等に関する。

近年、企業等で利用されている情報システムに対して、データの判定機能、分類機能等を有する機械学習モデルの導入が進んでいる。以下、情報システムを「システム」と表記する。機械学習モデルは、システム開発時に学習させた教師データの通りに判定、分類を行うため、システム運用中に入力データの傾向が変化すると、機械学習モデルの精度が劣化する。

図２７は、入力データの傾向の変化による機械学習モデルの劣化を説明するための図である。ここで説明する機械学習モデルは、入力データを第１クラス、第２クラス、第３クラスのいずれかに分類するモデルであり、システム運用前に、教師データに基づき、予め学習されているものとする。教師データには、訓練データと、検証データとが含まれる。

図２７において、分布１Ａは、システム運用初期の入力データの分布を示す。分布１Ｂは、システム運用初期からＴ１時間経過した時点の入力データの分布を示す。分布１Ｃは、システム運用初期から更にＴ２時間経過した時点の入力データの分布を示す。時間経過に伴って、入力データの傾向（特徴量等）が変化するものとする。たとえば、入力データが画像であれば、同一の被写体を撮影した画像であっても、季節や時間帯に応じて、入力データの傾向が変化する。

決定境界３は、モデル適用領域３ａ～３ｃの境界を示すものである。たとえば、モデル適用領域３ａは、第１クラスに属する訓練データが分布する領域である。モデル適用領域３ｂは、第２クラスに属する訓練データが分布する領域である。モデル適用領域３ｃは、第３クラスに属する訓練データが分布する領域である。

星印は、第１クラスに属する入力データであり、機械学習モデルに入力した際に、モデル適用領域３ａに分類されることが正しい。三角印は、第２クラスに属する入力データであり、機械学習モデルに入力した際に、モデル適用領域３ｂに分類されることが正しい。丸印は、第３クラスに属する入力データであり、機械学習モデルに入力した際に、モデル適用領域３ａに分類されることが正しい。

分布１Ａでは、全ての入力データが正常なモデル適用領域に分布している。すなわち、星印の入力データがモデル適用領域３ａに位置し、三角印の入力データがモデル適用領域３ｂに位置し、丸印の入力データがモデル適用領域３ｃに位置している。

分布１Ｂでは、入力データの傾向が変化したため、全ての入力データが、正常なモデル適用領域に分布しているものの、星印の入力データの分布がモデル適用領域３ｂの方向に変化している。

分布１Ｃでは、入力データの傾向が更に変化し、星印の一部の入力データが、決定境界３を跨いで、モデル適用領域３ｂに移動しており、適切に分類されておらず、正解率が低下している（機械学習モデルの精度が劣化している）。

ここで、運用中の機械学習モデルの精度劣化を検出する技術として、Ｔ^２統計量（Hotelling's T-square）を用いる従来技術がある。この従来技術では、入力データおよび正常データ（訓練データ）のデータ群を主成分分析し、入力データのＴ^２統計量を算出する。Ｔ^２統計量は、標準化した各主成分の原点からデータまでの距離の二乗を合計したものである。従来技術は、入力データ群のＴ^２統計量の分布の変化を基にして、機械学習モデルの精度劣化を検知する。たとえば、入力データ群のＴ^２統計量は、異常値データの割合に対応する。

A.Shabbak and H. Midi,"An Improvement of the Hotelling Statistic in Monitoring Multivariate Quality Characteristics",Mathematical Problems in Engineering (2012) 1-15.

しかしながら、上述した従来技術では、画像データ等の高次元データに対して、Ｔ^２統計量を適用することが難しく、機械学習モデルの精度劣化を検知することができない。

たとえば、元々の情報量が非常に大きい高次元（数千～数万次元）データでは、主成分分析により次元を削減すると、ほとんどの情報が失われてしまう。そのため、分類や判定を行うための重要な情報（特徴量）まで落ちてしまい、異常データを上手く検知することができず、機械学習モデルの精度劣化を検知することができない。

１つの側面では、本発明は、機械学習モデルの精度劣化を検知することができる検出方法、検出プログラム及び情報処理装置を提供することを目的とする。

第１の案では、コンピュータは、次の処理を実行する。コンピュータは、複数のクラスに対応する複数の訓練データを基にして、データの特徴空間を複数の適用領域に分類する決定境界を学習した複数の検出モデルのうち、第１検出モデルにデータが入力された場合、入力されたデータが複数の適用領域のうちいずれの適用領域に位置するのかを示す第１出力結果を取得する。コンピュータは、複数の検出モデルのうち、第２検出モデルにデータが入力された場合、入力されたデータが複数の適用領域のうちいずれの適用領域に位置するのかを示す第２出力結果を取得する。コンピュータは、第１出力結果および第２出力結果に基づいて、データストリームされるデータの時間変化に基づく、学習済みモデルの出力結果の精度劣化の要因となるデータを検出する。

機械学習モデルの精度劣化を検知することができる。

図１は、参考技術を説明するための図である。図２は、監視対象の機械学習モデルの精度劣化を検知する仕組みを説明するための図である。図３は、参考技術によるモデル適用領域の一例を示す図（１）である。図４は、参考技術によるモデル適用領域の一例を示す図（２）である。図５は、本実施例に係る情報処理装置の処理を説明するための図（１）である。図６は、本実施例に係る情報処理装置の処理を説明するための図（２）である。図７は、本実施例に係る情報処理装置の効果を説明するための図である。図８は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図９は、訓練データセットのデータ構造の一例を示す図である。図１０は、機械学習モデルの一例を説明するための図である。図１１は、インスペクターテーブルのデータ構造の一例を示す図である。図１２は、訓練データテーブルのデータ構造の一例を示す図である。図１３は、運用データテーブルのデータ構造の一例を示す図である。図１４は、インスペクターＭ０の分類面の一例を示す図である。図１５は、インスペクターＭ０，Ｍ２の分類面を比較する図である。図１６は、各インスペクターの分類面を示す図である。図１７は、全てのインスペクターの分類面を重ねた分類面の一例を示す図である。図１８は、出力結果テーブルのデータ構造の一例を示す図である。図１９は、出力結果テーブルの出力結果のデータ構造の一例を示す図である。図２０は、検出部の処理を説明するための図（１）である。図２１は、時間経過に伴う運用データセットの変化を示す図である。図２２は、検出部の処理を説明するための図（２）である。図２３は、精度劣化情報のグラフの一例を示す図である。図２４は、本実施例に係る情報処理装置の処理手順を示すフローチャート（１）である。図２５は、本実施例に係る情報処理装置の処理手順を示すフローチャート（２）である。図２６は、本実施例に係る情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。図２７は、入力データの傾向の変化による機械学習モデルの劣化を説明するための図である。

以下に、本願の開示する検出方法、検出プログラム及び情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

本実施例の説明を行う前に、機械学習モデルの精度劣化を検知する参考技術について説明する。参考技術では、異なる条件でモデル適用領域を狭めた複数の監視器を用いて、機械学習モデルの精度劣化を検知する。以下の説明では、監視器を「インスペクター」と表記する。

図１は、参考技術を説明するための図である。機械学習モデル１０は、教師データを用いて機械学習した機械学習モデルである。参考技術では、機械学習モデル１０の精度劣化を検知する。たとえば、教師データには、訓練データと、検証データとが含まれる。訓練データは、機械学習モデル１０のパラメータを機械学習する場合に用いられるものであり、正解ラベルが対応付けられる。検証データは、機械学習モデル１０を検証する場合に用いられるデータである。

インスペクター１１Ａ，１１Ｂ，１１Ｃは、それぞれ異なる条件でモデル適用領域が狭められ、異なる決定境界を有する。インスペクター１１Ａ～１１Ｃは、それぞれ決定境界が異なるため、同一の入力データを入力しても、出力結果が異なる場合がある。参考技術では、インスペクター１１Ａ～１１Ｃの出力結果の違いを基にして、機械学習モデル１０の精度劣化を検知する。図１に示す例では、インスペクター１１Ａ～１１Ｃを示すが、他のインスペクターを用いて、精度劣化を検知してもよい。インスペクター１１Ａ～１１ＣのモデルにはＤＮＮ（Deep Neural Network）を利用する。

図２は、監視対象の機械学習モデルの精度劣化を検知する仕組みを説明するための図である。図２では、インスペクター１１Ａ，１１Ｂを用いて説明を行う。インスペクター１１Ａの決定境界を決定境界１２Ａとし、インスペクター１１Ｂの決定境界を決定境界１２Ｂとする。決定境界１２Ａと、決定境界１２Ｂとの位置はそれぞれ異なっており、モデル適用領域が異なる。

入力データがモデル適用領域４Ａに位置する場合には、入力データは、インスペクター１１Ａによって、第１クラスに分類される。入力データがモデル適用領域５Ａに位置する場合には、入力データは、インスペクター１１Ａによって、第２クラスに分類される。

入力データがモデル適用領域４Ｂに位置する場合には、入力データは、インスペクター１１Ｂによって、第１クラスに分類される。入力データがモデル適用領域５Ｂに位置する場合には、入力データは、インスペクター１１Ｂによって、第２クラスに分類される。

たとえば、運用初期の時間Ｔ１において、入力データＤ_Ｔ１をインスペクター１１Ａに入力すると、入力データＤ_Ｔ１はモデル適用領域４Ａに位置するため、「第１クラス」に分類される。入力データＤ_Ｔ１をインスペクター１１Ｂに入力すると、入力データＤ_Ｔ１はモデル適用領域４Ｂに位置するため、「第１クラス」に分類される。入力データＤ_Ｔ１を入力した場合の分類結果が、インスペクター１１Ａと、インスペクター１１Ｂとで同一であるため「劣化なし」と判定される。

運用初期から時間経過した時間Ｔ２において、入力データの傾向が変化して、入力データＤ_Ｔ２となる。入力データＤ_Ｔ２をインスペクター１１Ａに入力すると、入力データＤ_Ｔ２はモデル適用領域４Ａに位置するため、「第１クラス」に分類される。一方、入力データＤ_Ｔ２をインスペクター１１Ｂに入力すると、入力データＤ_Ｔ２はモデル適用領域４Ｂに位置するため、「第２クラス」に分類される。入力データＤ_Ｔ２を入力した場合の分類結果が、インスペクター１１Ａと、インスペクター１１Ｂとで異なるため「劣化あり」と判定される。

ここで、参考技術では、異なる条件でモデル適用領域を狭めたインスペクターを作成する場合、訓練データの数を削減する。たとえば、参考技術では、各インスペクターの訓練データをランダムに削減する。また、参考技術では、インスペクター毎に削減する訓練データの数を変更する。

図３は、参考技術によるモデル適用領域の一例を示す図（１）である。図３に示す例では、訓練データの分布２０Ａ，２０Ｂ，２０Ｃを示す。分布２０Ａは、インスペクター１１Ａを作成する場合に用いる訓練データの分布である。分布２０Ｂは、インスペクター１１Ｂを作成する場合に用いる訓練データの分布である。分布２０Ｃは、インスペクター１１Ｃを作成する場合に用いる訓練データの分布である。

星印は、正解ラベルが第１クラスの訓練データである。三角印は、正解ラベルが第２クラスの訓練データである。丸印は、正解ラベルが第３クラスの訓練データである。

各インスペクターを作成する場合に用いる訓練データの数は、数の多い順に、インスペクター１１Ａ、インスペクター１１Ｂ、インスペクター１１Ｃの順となる。

分布２０Ａにおいて、第１クラスのモデル適用領域は、モデル適用領域２１Ａとなる。第２クラスのモデル適用領域は、モデル適用領域２２Ａとなる。第３クラスのモデル適用領域は、モデル適用領域２３Ａとなる。

分布２０Ｂにおいて、第１クラスのモデル適用領域は、モデル適用領域２１Ｂとなる。第２クラスのモデル適用領域は、モデル適用領域２２Ｂとなる。第３クラスのモデル適用領域は、モデル適用領域２３Ｂとなる。

分布２０Ｃにおいて、第１クラスのモデル適用領域は、モデル適用領域２１Ｃとなる。第２クラスのモデル適用領域は、モデル適用領域２２Ｃとなる。第３クラスのモデル適用領域は、モデル適用領域２３Ｃとなる。

しかしながら、訓練データの数を削減しても、必ずしも、図３で説明したように、モデル適用領域が狭くならない場合がある。図４は、参考技術によるモデル適用領域の一例を示す図（２）である。図４に示す例では、訓練データの分布２４Ａ，２４Ｂ，２４Ｃを示す。分布２４Ａは、インスペクター１１Ａを作成する場合に用いる訓練データの分布である。分布２４Ｂは、インスペクター１１Ｂを作成する場合に用いる訓練データの分布である。分布２４Ｃは、インスペクター１１Ｃを作成する場合に用いる訓練データの分布である。星印、三角印、丸印の訓練データの説明は、図３で行った説明と同様である。

分布２４Ａにおいて、第１クラスのモデル適用領域は、モデル適用領域２５Ａとなる。第２クラスのモデル適用領域は、モデル適用領域２６Ａとなる。第３クラスのモデル適用領域は、モデル適用領域２７Ａとなる。

分布２４Ｂにおいて、第１クラスのモデル適用領域は、モデル適用領域２５Ｂとなる。第２クラスのモデル適用領域は、モデル適用領域２６Ｂとなる。第３クラスのモデル適用領域は、モデル適用領域２７Ｂとなる。

分布２４Ｃにおいて、第１クラスのモデル適用領域は、モデル適用領域２５Ｃとなる。第２クラスのモデル適用領域は、モデル適用領域２６Ｃとなる。第３クラスのモデル適用領域は、モデル適用領域２７Ｃとなる。

上記のように、図３で説明した例では、訓練データの数に応じて、各モデル適用領域が狭くなっているが、図４で説明した例では、訓練データの数によらず、各モデル適用領域が狭くなっていない。

参考技術では、どの訓練データを削除すれば、モデル適用領域がどの程度狭くなるのか未知であるため、モデル適用領域を、意図的に分類クラスを指定しながら任意の広さに調整することが困難である。そのため、訓練データを削除して作成したインスペクターのモデル適用領域が狭くならないケースがある。インスペクターのモデル適用領域が狭くならなかった場合、作り直しの工数がかかる。

すなわち、参考技術では、指定した分類クラスのモデル適用領域を狭めた複数のインスペクターを作成することができていない。

次に、本実施例に係る情報処理装置の処理について説明する。情報処理装置は、監視対象の機械学習モデルと同じ訓練データのデータセットから、スコアの低い訓練データを分類クラス毎に除外して学習させることで、モデル適用領域を狭める。以下の説明では、訓練データのデータセットを「訓練データセット」と表記する。訓練データセットには、複数の訓練データが含まれる。

図５は、本実施例に係る情報処理装置の処理を説明するための図（１）である。図５では、説明の便宜上、訓練データの正解ラベル（分類クラス）が、第１クラスまたは第２クラスである場合について説明する。丸印は、正解ラベルが第１クラスの訓練データである。三角印は、正解ラベルが第２クラスの訓練データである。

分布３０Ａは、インスペクター１１Ａを作成する訓練データセットの分布を示す。インスペクター１１Ａを作成する訓練データセットは、監視対象の機械学習モデルを学習する場合に用いる訓練データセットと同じであるものとする。第１クラスのモデル適用領域３１Ａと、第２クラスのモデル適用領域３２Ａとの決定境界を、決定境界３３Ａとする。

インスペクター１１Ａに、既存の学習モデル（ＤＮＮ）を用いた場合、各訓練データに対するスコアの値は、その学習モデルの決定境界に近いほど、小さな値となる。従って、複数の訓練データのうち、スコアの小さな訓練データを訓練データセットから除外することで、学習モデルの適用領域を狭めたインスペクターを生成することができる。

分布３０Ａにおいて、領域３４に含まれる各訓練データは、決定境界３３Ａから離れているため、スコアが高い。領域３５に含まれている各訓練データは、決定境界３３Ａから近いため、スコアが低い。情報処理装置は、分布３０Ａに含まれる訓練データセットから、領域３５に含まれる各訓練データを削除した、新たな訓練データセットを作成する。

情報処理装置は、新たな訓練データセットによって、学習モデルを学習することで、インスペクター１１Ｂを作成する。分布３０Ｂは、インスペクター１１Ｂを作成する訓練データセットの分布を示す。第１クラスのモデル適用領域３１Ｂと、第２クラスのモデル適用領域３２Ｂとの決定境界を、決定境界３３Ｂとする。新たな訓練データセットでは、決定境界３３Ａに近い領域３５の各訓練データが除外されているため、決定境界３３Ｂの位置が移動し、第１クラスのモデル適用領域３１Ｂが、第１クラスのモデル適用領域３１Ａよりも狭くなっている。

図６は、本実施例に係る情報処理装置の処理を説明するための図（２）である。本実施例に係る情報処理装置は、特定の分類クラスのモデル適用範囲を狭めたインスペクターを作成することが可能である。情報処理装置は、訓練データから分類クラスを指定して、スコアの低いデータを除外することで、特定のクラスのモデル適用領域を狭めることができる。

ここで、各訓練データには、分類クラスを示す正解ラベルが対応付けられている。情報処理装置が、第１クラスに対応するモデル適用領域を狭めたインスペクター１１Ｂを作成する処理について説明する。情報処理装置は、正解ラベル「第１クラス」に対応する訓練データのうち、スコアの低い訓練データを除外した第１訓練データセットを用いて、学習を行う。

分布３０Ａは、インスペクター１１Ａを作成する訓練データセットの分布を示す。インスペクター１１Ａを作成する訓練データセットは、監視対象の機械学習モデルを学習する場合に用いる訓練データセットと同じものとする。第１クラスのモデル適用領域３１Ａと、第２クラスのモデル適用領域３２Ａとの決定境界を、決定境界３３Ａとする。

情報処理装置は、分布３０Ａに含まれる訓練データセットにおいて、正解ラベル「第１クラス」に対応する訓練データのスコアを算出し、スコアが閾値未満となる訓練データを特定する。情報処理装置は、特定した訓練データを、分布３０Ａに含まれる訓練データセットから除外した新たな訓練データセット（第１訓練データセット）を作成する。

情報処理装置は、第１訓練データセットによって、学習モデルを学習することで、インスペクター１１Ｂを作成する。分布３０Ｂは、インスペクター１１Ｂを作成する訓練データの分布を示す。第１クラスのモデル適用領域３１Ｂと、第２クラスのモデル適用領域３２Ｂとの決定境界を、決定境界３３Ｂとする。第１訓練データセットでは、決定境界３３Ａに近い各訓練データが除外されているため、決定境界３３Ｂの位置が移動し、第１クラスのモデル適用領域３１Ｂが、第１クラスのモデル適用領域３１Ａよりも狭くなっている。

続いて、情報処理装置が、第２クラスに対応するモデル適用領域を狭めたインスペクター１１Ｃを作成する処理について説明する。情報処理装置は、正解ラベル「第２クラス」に対応する訓練データのうち、スコアの低い訓練データを除外した第２訓練データセットを用いて、学習を行う。

情報処理装置は、分布３０Ａに含まれる訓練データセットにおいて、正解ラベル「第２クラス」に対応する訓練データのスコアを算出し、スコアが閾値未満となる訓練データを特定する。情報処理装置は、特定した訓練データを、分布３０Ａに含まれる訓練データセットから除外した新たな訓練データセット（第２訓練データセット）を作成する。

情報処理装置は、第２訓練データセットによって、学習モデルを学習することで、インスペクター１１Ｃを作成する。分布３０Ｃは、インスペクター１１Ｃを作成する訓練データの分布を示す。第１クラスのモデル適用領域３１Ｃと、第２クラスのモデル適用領域３２Ｃとの決定境界を、決定境界３３Ｃとする。第２訓練データ群では、決定境界３３Ａに近い各訓練データが除外されているため、決定境界３３Ｃの位置が移動し、第２クラスのモデル適用領域３２Ｃが、第２クラスのモデル適用領域３２Ａよりも狭くなっている。

上記のように、本実施例に係る情報処理装置は、監視対象の機械学習モデルと同じ訓練データから、スコアの低い訓練データを分類クラス毎に除外して学習させることで、モデル適用領域を狭めることができる。

図７は、本実施例に係る情報処理装置の効果を説明するための図である。参考技術および本実施例に係る情報処理装置は、機械学習モデル１０の学習で使用した訓練データセットを用いて学習モデルを学習することで、インスペクター１１Ａを作成する。

参考技術では、機械学習モデル１０の学習で使用した訓練データセットから、訓練データをランダムに除外した新たな訓練データセットを作成する。参考技術では、作成した新たな訓練データセットを用いて学習モデルを学習することで、インスペクター１１Ｂを作成する。参考技術のインスペクター１１Ｂにおいて、第１クラスのモデル適用領域は、モデル適用領域２５Ｂとなる。第２クラスのモデル適用領域は、モデル適用領域２６Ｂとなる。第３クラスのモデル適用領域は、モデル適用領域２７Ｂとなる。

ここで、モデル適用領域２５Ａと、モデル適用領域２５Ｂとを比較すると、モデル適用領域２５Ｂが狭くなっていない。同様に、モデル適用領域２６Ａと、モデル適用領域２６Ｂとを比較すると、モデル適用領域２６Ｂが狭くなっていない。モデル適用領域２７Ａと、モデル適用領域２７Ｂとを比較すると、モデル適用領域２７Ｂが狭くなっていない。

一方、本実施例に係る情報処理装置は、機械学習モデル１０の学習で使用した訓練データセットから、スコアの低い訓練データを除外した新たな訓練データセットを作成する。情報処理装置は、作成した新たな訓練データセットを用いて学習モデルを学習することで、インスペクター１１Ｂを作成する。本実施例に係るインスペクター１１Ｂにおいて、第１クラスのモデル適用領域は、モデル適用領域３５Ｂとなる。第２クラスのモデル適用領域は、モデル適用領域３６Ｂとなる。第３クラスのモデル適用領域は、モデル適用領域３７Ｂとなる。

ここで、モデル適用領域２５Ａと、モデル適用領域３５Ｂとを比較すると、モデル適用領域３５Ｂが狭くなっている。

上記のように、本実施例に係る情報処理装置によれば、機械学習モデル１０の学習で使用した訓練データセットから、スコアの低い訓練データを除外した新たな訓練データセットを作成することで、インスペクターのモデル適用領域を必ず狭めることができる。これにより、モデル適用領域が狭まらなかった場合に必要なインスペクターの作り直しなどの工程を削減できる。

また、本実施例に係る情報処理装置によれば、特定の分類クラスのモデル適用範囲を狭めたインスペクターを作成することが可能となる。削減する訓練データのクラスを変えることで、必ず異なるモデル適用領域のインスペクターを作成できるため、モデル精度劣化の検知で求められる要件「異なるモデル適用領域の複数のインスペクター」をそれぞれ作成することができる。また、作成したインスペクターを用いることで、検知した精度劣化の原因を説明することが可能となる。

次に、本実施例に係る情報処理装置の構成の一例について説明する。図８は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図８に示すように、この情報処理装置１００は、通信部１１０と、入力部１２０と、表示部１３０と、記憶部１４０と、制御部１５０とを有する。

通信部１１０は、ネットワークを介して、外部装置（図示略）とデータ通信を実行する処理部である。通信部１１０は、通信装置の一例である。後述する制御部１５０は、通信部１１０を介して、外部装置とデータをやり取りする。

入力部１２０は、情報処理装置１００に対して各種の情報を入力するための入力装置である。入力部１２０は、キーボードやマウス、タッチパネル等に対応する。

表示部１３０は、制御部１５０から出力される情報を表示する表示装置である。表示部１３０は、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイ、タッチパネル等に対応する。

記憶部１４０は、教師データ１４１、機械学習モデルデータ１４２、インスペクターテーブル１４３、訓練データテーブル１４４、運用データテーブル１４５、出力結果テーブル１４６を有する。記憶部１４０は、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）などの半導体メモリ素子や、ＨＤＤ（Hard Disk Drive）などの記憶装置に対応する。

教師データ１４１は、訓練データセット１４１ａと、検証データ１４１ｂを有する。訓練データセット１４１ａは、訓練データに関する各種の情報を保持する。

図９は、訓練データセットのデータ構造の一例を示す図である。図９に示すように、この訓練データセットは、レコード番号と、訓練データと、正解ラベルとを対応付ける。レコード番号は、訓練データと、正解ラベルとの組を識別する番号である。訓練データは、メールスパムのデータ、電気需要予測、株価予測、ポーカーハンドのデータ、画像データ等に対応する。正解ラベルは、第１クラス、第２クラス、第３クラスの各分類クラスのうち、いずれかの分類クラスを一意に識別する情報である。

検証データ１４１ｂは、訓練データセット１４１ａによって学習された機械学習モデルを検証するためのデータである。検証データ１４１ｂは、正解ラベルが付与される。たとえば、検証データ１４１ｂを、機械学習モデルに入力した場合に、機械学習モデルから出力される出力結果が、検証データ１４１ｂに付与される正解ラベルに一致する場合、訓練データセット１４１ａによって、機械学習モデルが適切に学習されたことを意味する。

機械学習モデルデータ１４２は、機械学習モデルのデータである。図１０は、機械学習モデルの一例を説明するための図である。図１０に示すように、機械学習モデル５０は、ニューラルネットワークの構造を有し、入力層５０ａ、隠れ層５０ｂ、出力層５０ｃを持つ。入力層５０ａ、隠れ層５０ｂ、出力層５０ｃは、複数のノードがエッジで結ばれる構造となっている。隠れ層５０ｂ、出力層５０ｃは、活性化関数と呼ばれる関数とバイアス値とを持ち、エッジは、重みを持つ。以下の説明では、バイアス値、重みを「パラメータ」と表記する。

入力層５０ａに含まれる各ノードに、データ（データの特徴量）を入力すると、隠れ層２０ｂを通って、出力層２０ｃのノード５１ａ，５１ｂ，５１ｃから、各クラスの確率が出力される。たとえば、ノード５１ａから、第１クラスの確率が出力される。ノード５１ｂから、第２クラスの確率が出力される。ノード５１ｃから、第３クラスの確率が出力される。各クラスの確率は、出力層２０ｃの各ノードから出力される値を、ソフトマックス（Softmax）関数に入力することで、算出される。本実施例では、ソフトマックス関数に入力する前の値を「スコア」と表記する。

たとえば、正解ラベル「第１クラス」に対応する訓練データを、入力層５０ａに含まれる各ノードに入力した場合に、ノード５１ａから出力される値であって、ソフトマックス関数に入力する前の値を、入力した訓練データのスコアとする。正解ラベル「第２クラス」に対応する訓練データを、入力層５０ａに含まれる各ノードに入力した場合に、ノード５１ｂから出力される値であって、ソフトマックス関数に入力する前の値を、入力した訓練データのスコアとする。正解ラベル「第３クラス」に対応する訓練データを、入力層５０ａに含まれる各ノードに入力した場合に、ノード５１ｃから出力される値であって、ソフトマックス関数に入力する前の値を、入力した訓練データのスコアとする。

機械学習モデル５０は、教師データ１４１の訓練データセット１４１ａと、検証データ１４１ｂとを基にして、学習済みであるものとする。機械学習モデル５０の学習では、訓練データセット１４１ａの各訓練データを入力層５０ａに入力した場合、出力層２０ｃの各ノードの出力結果が、入力した訓練データの正解ラベルに近づくように、機械学習モデル５０のパラメータが学習（誤差逆伝播法による学習）される。

図８の説明に戻る。インスペクターテーブル１４３は、機械学習モデル５０の精度劣化を検知する複数のインスペクターのデータを保持するテーブルである。図１１は、インスペクターテーブルのデータ構造の一例を示す図である。図１１に示すように、このインスペクターテーブル１４３は、識別情報と、インスペクターとを対応付ける。識別情報は、インスペクターを識別する情報である。インスペクターは、モデル識別情報に対応するインスペクターのデータである。インスペクターのデータは、図１０で説明した機械学習モデル５０と同様にして、ニューラルネットワークの構造を有し、入力層、隠れ層、出力層を持つ。また、各インスペクターには、それぞれ異なるパラメータが設定される。

以下の説明では、識別情報「Ｍ０」のインスペクターを、「インスペクターＭ０」と表記する。識別情報「Ｍ１」のインスペクターを、「インスペクターＭ１」と表記する。識別情報「Ｍ２」のインスペクターを、「インスペクターＭ２」と表記する。識別情報「Ｍ３」のインスペクターを、「インスペクターＭ３」と表記する。

訓練データテーブル１４４は、各インスペクターを学習するための複数の訓練データセットを有する。図１２は、訓練データテーブルのデータ構造の一例を示す図である。図１２に示すように、訓練データテーブル１４４は、データ識別情報と、訓練データセットとを有する。データ識別情報は、訓練データセットを識別する情報である。訓練データセットは、各インスペクターを学習する場合に用いられる訓練データセットである。

データ識別情報「Ｄ１」の訓練データセットは、訓練データセット１４１ａから、スコアの低い、正解ラベル「第１クラス」の訓練データを除外した訓練データセットである。以下の説明では、データ識別情報「Ｄ１」の訓練データセットを、「訓練データセットＤ１」と表記する。

データ識別情報「Ｄ２」の訓練データセットは、訓練データセット１４１ａから、スコアの低い、正解ラベル「第２クラス」の訓練データを除外した訓練データセットである。以下の説明では、データ識別情報「Ｄ２」の訓練データセットを、「訓練データセットＤ２」と表記する。

データ識別情報「Ｄ３」の訓練データセットは、訓練データセット１４１ａから、スコアの低い、正解ラベル「第３クラス」の訓練データを除外した訓練データセットである。以下の説明では、データ識別情報「Ｄ３」の訓練データセットを、「訓練データセットＤ３」と表記する。

運用データテーブル１４５は、時間経過に伴って、追加される運用データセットを有する。図１３は、運用データテーブルのデータ構造の一例を示す図である。図１３に示すように、運用データテーブル１４５は、データ識別情報と、運用データセットとを有する。データ識別情報は、運用データセットを識別する情報である。運用データセットは、複数の運用データが含まれる。運用データは、メールスパムのデータ、電気需要予測、株価予測、ポーカーハンドのデータ、画像データ等に対応する。

データ識別情報「Ｃ０」の運用データセットは、運用開始時（ｔ＝０）において収集された運用データセットである。以下の説明では、データ識別情報「Ｃ０」の運用データセットを、「運用データセットＣ０」と表記する。

データ識別情報「Ｃ１」の運用データセットは、運用開始時からＴ１時間経過後に収集された運用データセットである。以下の説明では、データ識別情報「Ｃ１」の運用データセットを、「運用データセットＣ１」と表記する。

データ識別情報「Ｃ２」の運用データセットは、運用開始時からＴ２（Ｔ２＞Ｔ１）時間経過後に収集された運用データセットである。以下の説明では、データ識別情報「Ｃ２」の運用データセットを、「運用データセットＣ２」と表記する。

データ識別情報「Ｃ３」の運用データセットは、運用開始時からＴ３（Ｔ３＞Ｔ２）時間経過後に収集された運用データセットである。以下の説明では、データ識別情報「Ｃ３」の運用データセットを、「運用データセットＣ３」と表記する。

図示を省略するが、運用データセットＣ０～Ｃ３に含まれる各運用データには、運用データを一意に識別する「運用データ識別情報」が付与されるものとする。運用データセットＣ０～Ｃ３は、外部装置から情報処理装置１００にデータストリームされ、情報処理装置１００は、データストリームされた運用データセットＣ０～Ｃ３を、運用データテーブル１４５に登録する。

出力結果テーブル１４６は、各インスペクターＭ０～Ｍ３に、各運用データセットＣ０～Ｃ３を入力した際の、各インスペクターＭ０～Ｍ３の出力結果を登録するテーブルである。

図８の説明に戻る。制御部１５０は、第１学習部１５１、算出部１５２、作成部１５３、第２学習部１５４、取得部１５５、検出部１５６を有する。制御部１５０は、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）などによって実現できる。また、制御部１５０は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などのハードワイヤードロジックによっても実現できる。

第１学習部１５１は、訓練データセット１４１ａを取得し、訓練データセット１４１ａを基にして、学習モデルのパラメータを学習することで、インスペクターＭ０を作成する処理部である。訓練データセット１４１ａは、機械学習モデル５０を学習する場合に用いられた訓練データセットである。学習モデルは、機械学習モデル５０と同様にして、ニューラルネットワークの構造を有し、入力層、隠れ層、出力層を持つ。また、学習データには、パラメータ（パラメータの初期値）が設定される。

第１学習部１５１は、訓練データセット１４１ａの訓練データを、学習モデルの入力層に入力した場合、出力層の各ノードの出力結果が、入力した訓練データの正解ラベルに近づくように、学習モデルのパラメータを更新する（誤差逆伝播法による学習）。第１学習部１５１は、作成したインスペクターＭ０のデータを、インスペクターテーブル１４３に登録する。

図１４は、インスペクターＭ０の分類面の一例を示す図である。一例として、分類面を２軸で示す。分類面の横軸は、データの第１特徴量に対応する軸であり、縦軸は、第２特徴量に対応する軸である。なお、データは、３次元以上のデータであってもよい。インスペクターＭ０の決定境界は、決定境界６０となる。インスペクターＭ０の第１クラスに対するモデル適用領域は、モデル適用領域６０Ａとなる。モデル適用領域６０Ａには、第１クラスに対応する複数の訓練データ６１Ａが含まれる。

インスペクターＭ０の第２クラスに対するモデル適用領域は、モデル適用領域６０Ｂとなる。モデル適用領域６０Ｂには、第２クラスに対応する複数の訓練データ６１Ｂが含まれる。インスペクターＭ０の第３クラスに対するモデル適用領域は、モデル適用領域６０Ｃとなる。モデル適用領域６０Ｃには、第２クラスに対応する複数の訓練データ６１Ｃが含まれる。

インスペクターＭ０の決定境界６０、各モデル適用領域６０Ａ～６０Ｃは、機械学習モデルの決定境界、各モデル適用領域と同一となる。

算出部１５２は、訓練データセット１４１ａに含まれる各訓練データのスコアをそれぞれ算出する処理部である。算出部１５２は、インスペクターＭ０を実行し、実行したインスペクターＭ０に訓練データを入力することで、各訓練データのスコアを算出する。算出部１５２は、各訓練データのスコアを、作成部１５３に出力する。

算出部１５２は、正解ラベル「第１クラス」に対応する複数の訓練データのスコアを算出する。ここでは、訓練データセット１４１ａの訓練データのうち、正解ラベル「第１クラス」に対応する訓練データを、「第１訓練データ」と表記する。算出部１５２は、第１訓練データを、インスペクターＭ０の入力層に入力し、第１訓練データのスコアを算出する。算出部１５２は、複数の第１訓練データに対して、上記処理を繰り返し実行する。算出部１５２は、第１訓練データのレコード番号と、スコアとを対応付けた算出結果データ（以下、第１算出結果データ）を、作成部１５３に出力する。

算出部１５２は、正解ラベル「第２クラス」に対応する複数の訓練データのスコアを算出する。ここでは、訓練データセット１４１ａの訓練データのうち、正解ラベル「第２クラス」に対応する訓練データを、「第２訓練データ」と表記する。算出部１５２は、第２訓練データを、インスペクターＭ０の入力層に入力し、第２訓練データのスコアを算出する。算出部１５２は、複数の第２訓練データに対して、上記処理を繰り返し実行する。算出部１５２は、第２訓練データのレコード番号と、スコアとを対応付けた算出結果データ（以下、第２算出結果データ）を、作成部１５３に出力する。

算出部１５２は、正解ラベル「第３クラス」に対応する複数の訓練データのスコアを算出する。ここでは、訓練データセット１４１ａの訓練データのうち、正解ラベル「第３クラス」に対応する訓練データを、「第３訓練データ」と表記する。算出部１５２は、第３訓練データを、インスペクターＭ０の入力層に入力し、第３訓練データのスコアを算出する。算出部１５２は、複数の第３訓練データに対して、上記処理を繰り返し実行する。算出部１５２は、第３訓練データのレコード番号と、スコアとを対応付けた算出結果データ（以下、第３算出結果データ）を、作成部１５３に出力する。

作成部１５３は、各訓練データのスコアを基にして、複数の訓練データセットを作成する処理部である。作成部１５３は、各訓練データのスコアのデータとして、算出部１５２から、第１算出結果データ、第２算出結果データ、第３算出結果データを取得する。

作成部１５３は、第１算出結果データを取得すると、第１算出結果データに含まれる第１訓練データのうち、スコアが閾値未満となる第１訓練データを、除外対象の第１訓練データとして特定する。スコアが閾値未満となる第１訓練データは、決定境界６０付近の第１訓練データである。作成部１５３は、訓練データセット１４１ａから、除外対象の第１訓練データを除外した訓練データセット（訓練データセットＤ１）を作成する。作成部１５３は、訓練データセットＤ１を、訓練データテーブル１４４に登録する。

作成部１５３は、第２算出結果データを取得すると、第２算出結果データに含まれる第２訓練データのうち、スコアが閾値未満となる第２訓練データを、除外対象の第２訓練データとして特定する。スコアが閾値未満となる第２訓練データは、決定境界６０付近の第２訓練データである。作成部１５３は、訓練データセット１４１ａから、除外対象の第２訓練データを除外した訓練データセット（訓練データセットＤ２）を作成する。作成部１５３は、訓練データセットＤ２を、訓練データテーブル１４４に登録する。

作成部１５３は、第３算出結果データを取得すると、第３算出結果データに含まれる第３訓練データのうち、スコアが閾値未満となる第３訓練データを、除外対象の第３訓練データとして特定する。スコアが閾値未満となる第３訓練データは、決定境界付近の第３訓練データである。作成部１５３は、訓練データセット１４１ａから、除外対象の第３訓練データを除外した訓練データセット（訓練データセットＤ３）を作成する。作成部１５３は、訓練データセットＤ３を、訓練データテーブル１４４に登録する。

第２学習部１５４は、訓練データテーブル１４４の訓練データセットＤ１，Ｄ２，Ｄ３を用いて、複数のインスペクターＭ１，Ｍ２，Ｍ３を作成する処理部である。

第２学習部１５４は、訓練データセットＤ１を基にして、学習モデルのパラメータを学習することで、インスペクターＭ１を作成する。訓練データセットＤ１は、決定境界６０付近の第１訓練データが除外されたデータセットである。第２学習部１５４は、訓練データセットＤ１の訓練データを、学習モデルの入力層に入力した場合、出力層の各ノードの出力結果が、入力した訓練データの正解ラベルに近づくように、学習モデルのパラメータを更新する（誤差逆伝播法による学習）。これにより、第２学習部１５４は、インスペクターＭ１を作成する。第２学習部１５４は、インスペクターＭ１のデータを、インスペクターテーブル１４３に登録する。

第２学習部１５４は、訓練データセットＤ２を基にして、学習モデルのパラメータを学習することで、インスペクターＭ２を作成する。訓練データセットＤ２は、決定境界６０付近の第２訓練データが除外されたデータセットである。第２学習部１５４は、訓練データセットＤ２の訓練データを、学習モデルの入力層に入力した場合、出力層の各ノードの出力結果が、入力した訓練データの正解ラベルに近づくように、学習モデルのパラメータを更新する（誤差逆伝播法による学習）。これにより、第２学習部１５４は、インスペクターＭ２を作成する。第２学習部１５４は、インスペクターＭ２のデータを、インスペクターテーブル１４３に登録する。

図１５は、インスペクターＭ０，Ｍ２の分類面を比較する図である。インスペクターＭ０の分類面を分類面６０_Ｍ０とする。インスペクターＭ２の分類面を分類面６０_Ｍ２とする。インスペクターＭ０の分類面６０_Ｍ０に関する説明は、図１４の説明と同様である。

インスペクターＭ２の決定境界は、決定境界６４となる。インスペクターＭ２の第１クラスに対するモデル適用領域は、モデル適用領域６４Ａとなる。インスペクターＭ２の第２クラスに対するモデル適用領域は、モデル適用領域６４Ｂとなる。モデル適用領域６４Ｂには、第２クラスに対応し、かつ、スコアが閾値以上となる複数の訓練データ６５Ｂが含まれる。インスペクターＭ２の第３クラスに対するモデル適用領域は、モデル適用領域６４Ｃとなる。

インスペクターＭ０の分類面６０_Ｍ０と、インスペクターＭ２の分類面６０_Ｍ２とを比較すると、第２クラスのモデル適用領域に相当する、モデル適用領域６４Ｂが、モデル適用領域６０Ｂよりも狭くなっている。これは、インスペクターＭ２を学習する際に用いた訓練データセットから、決定境界６０付近の第２訓練データが除外されているためである。

第２学習部１５４は、訓練データセットＤ３を基にして、学習モデルのパラメータを学習することで、インスペクターＭ３を作成する。訓練データセットＤ３は、決定境界６０付近の第３訓練データが除外されたデータセットである。第２学習部１５４は、訓練データセットＤ３の訓練データを、学習モデルの入力層に入力した場合、出力層の各ノードの出力結果が、入力した訓練データの正解ラベルに近づくように、学習モデルのパラメータを更新する（誤差逆伝播法による学習）。これにより、第２学習部１５４は、インスペクターＭ３を作成する。第２学習部１５４は、インスペクターＭ３のデータを、インスペクターテーブル１４３に登録する。

図１６は、各インスペクターの分類面を示す図である。インスペクターＭ０の分類面を分類面６０_Ｍ０とする。インスペクターＭ１の分類面を分類面６０_Ｍ１とする。インスペクターＭ２の分類面を分類面６０_Ｍ２とする。インスペクターＭ３の分類面を分類面６０_Ｍ３とする。インスペクターＭ０の分類面６０_Ｍ０、および、インスペクターＭ２の分類面６０_Ｍ２に関する説明は、図１５の説明と同様である。

インスペクターＭ１の決定境界は、決定境界６２となる。インスペクターＭ１の第１クラスに対するモデル適用領域は、モデル適用領域６２Ａとなる。インスペクターＭ１の第２クラスに対するモデル適用領域は、モデル適用領域６２Ｂとなる。インスペクターＭ１の第３クラスに対するモデル適用領域は、モデル適用領域６２Ｃとなる。

インスペクターＭ３の決定境界は、決定境界６６となる。インスペクターＭ３の第１クラスに対するモデル適用領域は、モデル適用領域６６Ａとなる。インスペクターＭ３の第２クラスに対するモデル適用領域は、モデル適用領域６６Ｂとなる。インスペクターＭ３の第３クラスに対するモデル適用領域は、モデル適用領域６６Ｃとなる。

インスペクターＭ０の分類面６０_Ｍ０と、インスペクターＭ１の分類面６０_Ｍ１とを比較すると、第１クラスのモデル適用領域に相当する、モデル適用領域６２Ａが、モデル適用領域６０Ａよりも狭くなっている。これは、インスペクターＭ１を学習する際に用いた訓練データセットから、決定境界６０付近（スコアが閾値未満）の第１訓練データが除外されているためである。

インスペクターＭ０の分類面６０_Ｍ０と、インスペクターＭ２の分類面６０_Ｍ２とを比較すると、第２クラスのモデル適用領域に相当する、モデル適用領域６４Ｂが、モデル適用領域６０Ｂよりも狭くなっている。これは、インスペクターＭ２を学習する際に用いた訓練データセットから、決定境界６０付近（スコアが閾値未満）の第２訓練データが除外されているためである。

インスペクターＭ０の分類面６０_Ｍ０と、インスペクターＭ３の分類面６０_Ｍ３とを比較すると、第３クラスのモデル適用領域に相当する、モデル適用領域６６Ｃが、モデル適用領域６０Ｃよりも狭くなっている。これは、インスペクターＭ３を学習する際に用いた訓練データセットから、決定境界６０付近（スコアが閾値未満）の第３訓練データが除外されているためである。

図１７は、全てのインスペクターの分類面を重ねた分類面の一例を示す図である。図１７に示すように、決定境界６０，６２，６５，６６がそれぞれ異なっており、第１、２、３クラスのモデル適用領域もそれぞれ異なっている。

図８の説明に戻る。取得部１５５は、時間経過に伴って特徴量の変化する運用データを、複数のインスペクターにそれぞれ入力し、出力結果を取得する処理部である。

たとえば、取得部１５５は、インスペクターテーブル１４３から、インスペクターＭ０～Ｍ２のデータを取得し、インスペクターＭ０～Ｍ２を実行する。取得部１５５は、運用データテーブル１４５に格納された各運用データセットＣ０～Ｃ３を、インスペクターＭ０～Ｍ２に入力して、出力結果をそれぞれ取得し、出力結果テーブル１４６に登録する。

図１８は、出力結果テーブルのデータ構造の一例を示す図である。図１８に示すように、出力結果テーブル１４６では、インスペクターを識別する識別情報と、入力した運用データセットを識別するデータ識別情報と、出力結果とを対応付ける。たとえば、識別情報「Ｍ０」、データ識別情報「Ｃ０」に対応する出力結果は、インスペクターＭ０に、運用データセットＣ０の各運用データを入力した際の出力結果となる。

図１９は、出力結果テーブルの出力結果のデータ構造の一例を示す図である。図１９に示すでは、出力結果テーブル１４６に含まれる各出力結果のうち、いずれかの出力結果に対応する。出力結果には、運用データ識別情報と、分類クラスとが対応付けられる。運用データ識別情報は、運用データを一意に識別する情報である。分類クラスは、運用データが分類される分類クラスを一意に識別する情報である。たとえば、運用データ識別情報「ＯＰ１００１」の運用データを、該当するインスペクターに入力した場合の出力結果（分類クラス）が、第１クラスであることが示される。

図８の説明に戻る。検出部１５６は、出力結果テーブル１４６を基にして、データの時間変化に基づく、機械学習モデル５０の出力結果の要因となるデータを検出する処理部である。

図２０は、検出部の処理を説明するための図である。ここでは一例として、インスペクターＭ０，Ｍ１を用いて説明を行う。便宜的に、インスペクターＭ０の決定境界を決定境界７０Ａとし、インスペクターＭ１の決定境界を決定境界７０Ｂとする。決定境界７０Ａと、決定境界７０Ｂとの位置はそれぞれ異なっており、モデル適用領域が異なる。以下の説明では、運用データセットに含まれる一つの運用データを適宜、「インスタンス」と表記する。

インスタンスがモデル適用領域７１Ａに位置する場合には、インスタンスは、インスペクターＭ０によって、第１クラスに分類される。インスタンスがモデル適用領域７２Ａに位置する場合には、インスタンスは、インスペクターＭ０によって、第２クラスに分類される。

インスタンスがモデル適用領域７１Ｂに位置する場合には、インスタンスは、インスペクターＭ１によって、第１クラスに分類される。インスタンスがモデル適用領域７２Ｂに位置する場合には、インスタンスは、インスペクターＭ１によって、第２クラスに分類される。

たとえば、運用初期の時間Ｔ１において、インスタンスＩ１_Ｔ１をインスペクターＭ０に入力すると、インスタンスＩ１_Ｔ１はモデル適用領域７１Ａに位置するため、「第１クラス」に分類される。インスタンスＩ２_Ｔ１をインスペクターＭ０に入力すると、インスタンスＩ２_Ｔ１はモデル適用領域７１Ａに位置するため、「第１クラス」に分類される。インスタンスＩ３_Ｔ１をインスペクターＭ０に入力すると、インスタンスＩ３_Ｔ１はモデル適用領域７２Ａに位置するため、「第２クラス」に分類される。

運用初期の時間Ｔ１において、インスタンスＩ１_Ｔ１をインスペクターＭ１に入力すると、インスタンスＩ１_Ｔ１はモデル適用領域７１Ｂに位置するため、「第１クラス」に分類される。インスタンスＩ２_Ｔ１をインスペクターＭ１に入力すると、インスタンスＩ２_Ｔ１はモデル適用領域７１Ｂに位置するため、「第１クラス」に分類される。インスタンスＩ３_Ｔ１をインスペクターＭ１に入力すると、インスタンスＩ３_Ｔ１はモデル適用領域７２Ｂに位置するため、「第２クラス」に分類される。

運用初期の時間Ｔ１において、インスタンスＩ１_Ｔ１，Ｉ２_Ｔ１，Ｉ３_Ｔ１をインスペクターＭ０，Ｍ１に入力した際に分類される分類結果がそれぞれ同一であるため、検出部１５６は、機械学習モデル５０の精度劣化を検出しない。

ところで、運用初期から時間経過した時間Ｔ２において、インスタンスの傾向が変化して、インスタンスＩ１_Ｔ１，Ｉ２_Ｔ１，Ｉ３_Ｔ１は_、インスタンスＩ１_Ｔ２，Ｉ２_Ｔ２，Ｉ３_Ｔ２となる。インスタンスＩ１_Ｔ２をインスペクターＭ０に入力すると、インスタンスＩ１_Ｔ２はモデル適用領域７１Ａに位置するため、「第１クラス」に分類される。インスタンスＩ２_Ｔ２をインスペクターＭ０に入力すると、インスタンスＩ２_Ｔ１はモデル適用領域７１Ａに位置するため、「第１クラス」に分類される。インスタンスＩ３_Ｔ２をインスペクターＭ０に入力すると、インスタンスＩ３_Ｔ２はモデル適用領域７２Ａに位置するため、「第２クラス」に分類される。

運用初期から時間経過した時間Ｔ２において、インスタンスＩ１_Ｔ２をインスペクターＭ１に入力すると、インスタンスＩ１_Ｔ２はモデル適用領域７２Ｂに位置するため、「第２クラス」に分類される。インスタンスＩ２_Ｔ２をインスペクターＭ１に入力すると、インスタンスＩ２_Ｔ２はモデル適用領域７１Ｂに位置するため、「第１クラス」に分類される。インスタンスＩ３_Ｔ２をインスペクターＭ１に入力すると、インスタンスＩ３_Ｔ２はモデル適用領域７２Ｂに位置するため、「第２クラス」に分類される。

運用初期から時間経過した時間Ｔ２において、インスタンスＩ１_Ｔ１をインスペクターＭ０，Ｍ１に入力した際に分類される分類結果がそれぞれ異なるため、検出部１５６は、機械学習モデル５０の精度劣化を検出する。また、検出部１５６は、精度劣化の要因となったインスタンスＩ１_Ｔ２を検出することができる。

検出部１５６は、出力結果テーブル１４６を参照し、各運用データセットの各インスタンス（運用データ）について、各インスペクターに入力した際の分類クラスを特定し、上記処理を繰り返し実行する。

図２１は、時間経過に伴う運用データセットの変化を示す図である。図２１では、インスペクターＭ０に、各運用データセットを入力した際の分布を示す。図２１において、丸印の各運用データは、本来、第１クラスに属するデータとし、モデル適用領域６０Ａに分類されることが正しい。三角印の各運用データは、本来、第２クラスに属するデータとし、モデル適用領域６０Ｂに分類されることが正しい。四角印の各運用データは、本来、第３クラスに属するデータとし、モデル適用領域６０Ｃに分類されることが正しい。

運用初期の時間Ｔ１の運用データセットＣ０において、丸印の各運用データは、モデル適用領域６０Ａに含まれている。三角印の各運用データは、モデル適用領域６０Ｂに含まれている。四角印の各運用データは、モデル適用領域６０Ｃに含まれている。すなわち、各運用データが、適切に分類クラスに分類されており、精度劣化が検出されない。

運用初期からＴ２時間経過した運用データセットＣ１において、丸印の各運用データは、モデル適用領域６０Ａに含まれている。三角印の各運用データは、モデル適用領域６０Ｂに含まれている。四角印の各運用データは、モデル適用領域６０Ｃに含まれている。三角印の各運用データの中心が、モデル適用領域６０Ａ側に移動（ドリフト）しているものの、大半の運用データが、適切に分類クラスに分類されており、精度劣化が検出されない。

運用初期からＴ３時間経過した運用データセットＣ２において、丸印の各運用データは、モデル適用領域６０Ａに含まれている。三角印の各運用データは、モデル適用領域６０Ａ，６０Ｂに含まれている。四角印の各運用データは、モデル適用領域６０Ｃに含まれている。三角印の各運用データの約半数が、決定境界を跨いで、モデル適用領域６０Ａに移動（ドリフト）しており、精度劣化が検出される。

運用初期からＴ４時間経過した運用データセットＣ３において、丸印の各運用データは、モデル適用領域６０Ａに含まれている。三角印の各運用データは、モデル適用領域６０Ａに含まれている。四角印の各運用データは、モデル適用領域６０Ｃに含まれている。三角印の各運用データが、決定境界を跨いで、モデル適用領域６０Ａに移動（ドリフト）しており、精度劣化が検出される。

図示を省略するが、検出部１５６は、次の処理を実行することで、インスタンス毎に、精度劣化に起因しているインスタンスか否かと、インスタンスの特徴量がどの分類クラスの方向に移動しているのかを検出する。検出部１５６は、出力結果テーブル１４６を参照し、同一のインスタンスを各インスペクターＭ０～Ｍ３に入力した際の分類クラスを特定する。同一のインスタンスは、同一の運用データ識別情報が割り当てられた運用データである。

検出部１５６は、同一のインスタンスを各インスペクターＭ０～Ｍ３に入力した際の全ての分類クラス（出力結果）が同一である場合には、該当するインスタンスが、精度劣化に起因していないと判定する。一方、検出部１５６は、同一のインスタンスを各インスペクターＭ０～Ｍ３に入力した際の全ての分類クラスが同一でない場合には、該当するインスタンスを、精度劣化に起因するインスタンスとして検出する。

検出部１５６は、精度劣化に起因するインスタンスを、インスペクターＭ０に入力した際の出力結果と、インスペクターＭ１に入力した際の出力結果とが異なる場合、インスタンスの特徴量が「第１クラスの方向」に変化したことを検出する。

検出部１５６は、精度劣化に起因するインスタンスを、インスペクターＭ０に入力した際の出力結果と、インスペクターＭ２に入力した際の出力結果とが異なる場合、インスタンスの特徴量が「第２クラスの方向」に変化したことを検出する。

検出部１５６は、精度劣化に起因するインスタンスを、インスペクターＭ０に入力した際の出力結果と、インスペクターＭ３に入力した際の出力結果とが異なる場合、インスタンスの特徴量が「第３クラスの方向」に変化したことを検出する。

検出部１５６は、各インスタンスについて、上記処理を繰り返し実行することで、インスタンス毎に、精度劣化に起因しているインスタンスか否かと、インスタンスの特徴量がどの分類クラスの方向に移動しているのかを検出する。

ところで、検出部１５６は、出力結果テーブル１４６を基にして、各インスペクターの各モデル適用領域に含まれる運用データの時間変化に伴う分類クラスの変化のグラフを生成してもよい。たとえば、検出部１５６は、図２２に示すようなグラフＧ０～Ｇ３の情報を生成する。検出部１５６は、グラフＧ０～Ｇ３の情報を、表示部１３０に表示させてもよい。

図２２は、検出部の処理を説明するための図（２）である。図２２において、グラフＧ０は、インスペクターＭ０に各運用データセットを入力した際の、各クラス適用領域に位置する運用データの数の変化を示すグラフである。グラフＧ１は、インスペクターＭ１に各運用データセットを入力した際の、各クラス適用領域に位置する運用データの数の変化を示すグラフである。グラフＧ２は、インスペクターＭ２に各運用データセットを入力した際の、各クラス適用領域に位置する運用データの数の変化を示すグラフである。グラフＧ３は、インスペクターＭ３に各運用データセットを入力した際の、各クラス適用領域に位置する運用データの数の変化を示すグラフである。

グラフＧ０，Ｇ１，Ｇ２，Ｇ３の横軸は、運用データセットの時間経過を示す軸である。グラフＧ０，Ｇ１，Ｇ２，Ｇ３の縦軸は、各モデル領域データに含まれる運用データの数を示す軸である。各グラフＧ０，Ｇ１，Ｇ２，Ｇ３の線８１は、第１クラスのモデル適用領域に含まれる運用データの数の遷移を示す。各グラフＧ０，Ｇ１，Ｇ２，Ｇ３の線８２は、第２クラスのモデル適用領域に含まれる運用データの数の遷移を示す。各グラフＧ０，Ｇ１，Ｇ２，Ｇ３の線８３は、第３クラスのモデル適用領域に含まれる運用データの数の遷移を示す。

検出部１５６は、インスペクターＭ０に対応するグラフＧ０と、他のインスペクターＭ１，Ｍ２，Ｍ３に対応するグラフＧ１，Ｇ２，Ｇ３とを比較することで、機械学習モデル５０の精度劣化の予兆を検知することができる。また、検出部１５６は、精度劣化の原因を特定することができる。

図２２の時間ｔ＝１において、グラフＧ０の各モデル領域データに含まれる運用データの数と、グラフＧ１の各モデル領域データに含まれる運用データの数とが異なっているため、検出部１５６は、機械学習モデル５０の精度劣化（精度劣化の予兆）を検出する。

検出部１５６は、図２２の時刻ｔ＝２～３における、グラフＧ０～Ｇ３の各モデル領域データに含まれる運用データの数の変化を基にして、精度劣化の原因を検出する。検出部１５６は、グラフＧ０～Ｇ３の線８３が変化していないため、線８３に対応する第３クラスに分類される各運用データを、精度劣化の原因の対象から除外する。

検出部１５６は、時刻ｔ＝２～３において、グラフＧ０～Ｇ３の線８１が増加し、線８２の線が減少しており、第２クラスに分類されていた各運用データが、第１クラスのクラス適用領域に移動していることを検出する。

検出部１５６は、上記の検出結果を基にして、精度劣化情報のグラフを生成する。図２３は、精度劣化情報のグラフの一例を示す図である。図２３のグラフの横軸は、運用データセットの時間経過を示す軸である。グラフの縦軸は、精度を示す軸である。図２３に示す例では、時刻ｔ＝１以降において、精度が低下している。

検出部１５６は、運用データセットに含まれるインスタンスのうち、インスペクターＭ０の出力結果と、他のインスペクターＭ１～Ｍ３の出力結果との一致度合いを、精度として算出する。検出部１５６は、他の従来技術を用いて、精度を算出してもよい。検出部１５６は、情報劣化情報のグラフを、表示部１３０に表示させてもよい。

ところで、検出部１５６は、精度が閾値未満となった場合に、機械学習モデル５０の再学習の要求を、第１学習部１５１に出力してもよい。たとえば、検出部１５６は、運用データテーブル１４５に含まれる各運動データセットのうち、最新の運動データセットを選択する。検出部１５６は、選択した運用データセットの各運用データを、インスペクターＭ０に入力して、出力結果を特定し、特定した出力結果を、運動データの正解ラベルとして設定する。検出部１５６は、各運用データについて、上記処理を繰り返し実行することで、新たな訓練データセットを生成する。

検出部１５６は、新たな訓練データセットを、第１学習部１５１に出力する。第１学習部１５１は、新たな訓練データセットを用いて、機械学習モデル５０のパラメータを更新する再学習を実行する。第１学習部１５１は、新たな訓練データセットの訓練データを、機械学習モデル５０の入力層に入力した場合、出力層の各ノードの出力結果が、入力した訓練データの正解ラベルに近づくように、機械学習モデルのパラメータを更新する（誤差逆伝播法による学習）。

次に、本実施例に係る情報処理装置１００の処理手順の一例について説明する。図２４は、本実施例に係る情報処理装置の処理手順を示すフローチャート（１）である。図２４に示すように、情報処理装置１００の第１学習部１５１は、監視対象の機械学習モデルの学習に使用した訓練データセット１４１ａを取得する（ステップＳ１０１）。

第１学習部１５１は、訓練データセット１４１ａを用いて、インスペクターＭ０の学習を実行する（ステップＳ１０２）。情報処理装置１００は、ｉの値に、１を設定する（ステップＳ１０３）。

情報処理装置１００の算出部１５２は、インスペクターＭ０に第ｉクラスの訓練データを入力し、訓練データに関するスコアを算出する（ステップＳ１０４）。情報処理装置１００の作成部１５３は、スコアが閾値未満となる訓練データを、訓練データセット１４１ａから除外した訓練データセットＤｉを作成し、訓練データテーブル１４４に登録する（ステップＳ１０５）。

情報処理装置１００は、ｉの値がＮ（たとえば、Ｎ＝３）であるか否かを判定する（ステップＳ１０６）。情報処理装置は、ｉの値がＮである場合には（ステップＳ１０６，Ｙｅｓ）、ステップＳ１０８に移行する。一方、情報処理装置１００は、ｉの値がＮでない場合には（ステップＳ１０６，Ｎｏ）、ステップＳ１０７に移行する。情報処理装置１００は、ｉの値に１を加算した値によって、ｉの値を更新し（ステップＳ１０７）、ステップＳ１０４に移行する。

情報処理装置１００の第２学習部１５４は、複数の訓練データセットＤ１～Ｄ３を用いて、複数のインスペクターＭ１～Ｍ３の学習を実行する（ステップＳ１０８）。第２学習部１５４は、学習した複数のインスペクターＭ１～Ｍ３を、インスペクターテーブル１４３に登録する（ステップＳ１０９）。

図２５は、本実施例に係る情報処理装置の処理手順を示すフローチャート（２）である。情報処理装置１００の取得部１５５は、運用データテーブル１４５から、運用データセットを取得する（ステップＳ２０１）。取得部１５５は、運用データセットからインスタンスを１つ選択する（ステップＳ２０２）。

取得部１５５は、選択したインスタンスを各インスペクターＭ０～Ｍ３に入力し、出力結果を取得し、出力結果テーブル１４６に登録する（ステップＳ２０３）。情報処理装置１００の検出部１５６は、出力結果テーブル１４６を参照し、各出力結果が異なるか否かを判定する（ステップＳ２０４）。

検出部１５６は、各出力結果が異ならない場合には（ステップＳ２０５，Ｎｏ）、ステップＳ２０８に移行する。検出部１５６は、各出力結果が異なる場合には（ステップＳ２０５，Ｙｅｓ）、ステップＳ２０６に移行する。

検出部１５６は、精度劣化を検出する（ステップＳ２０６）。検出部１５６は、選択したインスタンスを、精度劣化の要因として検出する（ステップＳ２０７）。情報処理装置１００は、全てのインスタンスを選択したか否かを判定する（ステップＳ２０８）。

情報処理装置１００は、全てのインスタンスを選択した場合には（ステップＳ２０８，Ｙｅｓ）、処理を終了する。一方、情報処理装置１００は、全てのインスタンスを選択していない場合には（ステップＳ２０８，Ｎｏ）、ステップＳ２０９に移行する。取得部１５は、運用データセットから、未選択のインスタンスを１つ選択し（ステップＳ２０９）、ステップＳ２０３に移行する。

情報処理装置１００は、図２５で説明した処理を、運用データテーブル１４５に格納された各運用データセットについて実行する。

次に、本実施例に係る情報処理装置１００の効果について説明する。情報処理装置１００は、機械学習モデル５０の学習で使用した訓練データセット１４１ａから、スコアの低い訓練データを除外した新たな訓練データセットを作成し、新たな訓練データを用いて、インスペクターＭ１～Ｍ３を作成することで、インスペクターのモデル適用領域を必ず狭めることができる。これにより、モデル適用領域が狭まらなかった場合に必要なインスペクターの作り直しなどの工程を削減できる。

また、情報処理装置１００によれば、特定の分類クラスのモデル適用範囲を狭めたインスペクターＭ１～Ｍ３を作成することが可能となる。削減する訓練データのクラスを変えることで、必ず異なるモデル適用領域のインスペクターを作成できるため、モデル精度劣化の検知で求められる要件「異なるモデル適用領域の複数のインスペクター」をそれぞれ作成することができる。また、作成したインスペクターを用いることで、検知した精度劣化の原因を説明することが可能となる。

情報処理装置１００は、運用データセットの運用データ（インスタンス）を、インスペクターＭ０～Ｍ３に入力して、各インスペクターＭ０～Ｍ３の出力結果をそれぞれ取得し、各出力結果に基づいて、機械学習モデル５０の精度劣化を検出する。これによって、機械学習モデル５０の精度劣化を検出すると共に、精度劣化の要因となったインスタンスを検出することができる。本実施例では、インスペクターＭ１～Ｍ３を作成する場合について説明したが、他のインスペクターを更に作成して、精度劣化を検出してもよい。

情報処理装置１００は、機械学習モデル５０の精度劣化を検出した場合、運用データセットの運用データに対応する分類クラス（正解ラベル）を設定した新たな訓練データセットを作成し、作成した訓練データセットを用いて、機械学習モデル５０の再学習を実行する。これによって、時間経過に伴って、運用データセットの特徴量が変化した場合でも、かかる変化に応じた機械学習モデルを学習し、特徴量の変化に対応させることができる。

次に、本実施例に示した情報処理装置１００と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図２６は、本実施例に係る情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

図２６に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０１と、ユーザからのデータの入力を受け付ける入力装置２０２と、ディスプレイ２０３とを有する。また、コンピュータ２００は、記憶媒体からプログラム等を読み取る読み取り装置２０４と、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行うインタフェース装置２０５とを有する。コンピュータ２００は、各種情報を一時記憶するＲＡＭ２０６と、ハードディスク装置２０７とを有する。そして、各装置２０１～２０７は、バス２０８に接続される。

ハードディスク装置２０７は、第１学習プログラム２０７ａ、算出プログラム２０７ｂ、作成プログラム２０７ｃ、第２学習プログラム２０７ｄ、取得プログラム２０７ｅ、検出プログラム２０７ｆを有する。ＣＰＵ２０１は、第１学習プログラム２０７ａ、算出プログラム２０７ｂ、作成プログラム２０７ｃ、第２学習プログラム２０７ｄ、取得プログラム２０７ｅ、検出プログラム２０７ｆを読み出してＲＡＭ２０６に展開する。

第１学習プログラム２０７ａは、第１学習プロセス２０６ａとして機能する。算出プログラム２０７ｂは、算出プロセス２０６ｂとして機能する。作成プログラム２０７ｃは、作成プロセス２０６ｃとして機能する。第２学習プログラム２０７ｄは、第２学習プロセス２０６ｄとして機能する。取得プログラム２０７ｅは、取得プロセス２０６ｅとして機能する。検出プログラム２０７ｆは、検出プロセス２０６ｆとして機能する。

第１学習プロセス２０６ａの処理は、第１学習部１５１の処理に対応する。算出プロセス２０６ｂの処理は、算出部１５２の処理に対応する。作成プロセス２０６ｃの処理は、作成部１５３の処理に対応する。第２学習プロセス２０６ｄの処理は、第２学習部１５４の処理に対応する。取得プロセス２０６ｅの処理は、取得部１５５の処理に対応する。検出プロセス２０６ｆの処理は、検出部１５６の処理に対応する。

なお、各プログラム２０７ａ～２０７ｆついては、必ずしも最初からハードディスク装置５０７に記憶させておかなくてもよい。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ２００が各プログラム２０７ａ～２０７ｆを読み出して実行するようにしてもよい。

１００情報処理装置
１１０通信部
１２０入力部
１３０表示部
１４０記憶部
１４１教師データ
１４１ａ訓練データセット
１４１ｂ検証データ
１４２機械学習モデルデータ
１４３インスペクターテーブル
１４４訓練データテーブル
１４５運用データテーブル
１４６出力結果テーブル
１５０制御部
１５１第１学習部
１５２算出部
１５３作成部
１５４第２学習部
１５５取得部
１５６検出部

Claims

コンピュータが実行する特定方法であって、
複数のクラスに対応する複数の訓練データを基にして、データの特徴空間を複数の適用領域に分類する決定境界を学習した複数の検出モデルのうち、第１検出モデルにデータが入力された場合、入力されたデータが前記複数の適用領域のうちいずれの適用領域に位置するのかを示す第１出力結果を取得し、
前記複数の検出モデルのうち、第２検出モデルにデータが入力された場合、入力されたデータが前記複数の適用領域のうちいずれの適用領域に位置するのかを示す第２出力結果を取得し、
前記第１出力結果および前記第２出力結果に基づいて、データストリームされるデータの時間変化に基づく、学習済みモデルの出力結果の精度劣化の要因となるデータを検出する
処理を実行することを特徴とする検出方法。
前記複数の適用領域は、前記複数のクラスにそれぞれ対応付けられ、前記第１検出モデルにおける第１クラスに対応する適用領域の大きさと、前記第２検出モデルにおける第１クラスに対応する適用領域の大きさとが異なるように前記複数の検出モデルを学習する処理を更に実行することを特徴とする請求項１に記載の検出方法。
前記第１出力結果を取得する処理は、データセットに含まれるインスタンスが、第１検出モデルにデータが入力された場合の第１出力結果を取得し、前記第２出力結果を取得する処理は、データセットに含まれるインスタンスが、第２検出モデルにデータが入力された場合の第２出力結果を取得し、前記検出する処理は、学習済みモデルの出力結果の精度劣化の要因となるインスタンスを特定することを特徴とする請求項２に記載の検出方法。
前記検出する処理によって精度劣化の要因となるデータが検出された場合、対応するクラスを再設定した訓練データを用いて、前記学習済みモデルを再学習する処理を更に実行することを特徴とする請求項１、２または３に記載の検出方法。
コンピュータに、
複数のクラスに対応する複数の訓練データを基にして、データの特徴空間を複数の適用領域に分類する決定境界を学習した複数の検出モデルのうち、第１検出モデルにデータが入力された場合、入力されたデータが前記複数の適用領域のうちいずれの適用領域に位置するのかを示す第１出力結果を取得し、
前記複数の検出モデルのうち、第２検出モデルにデータが入力された場合、入力されたデータが前記複数の適用領域のうちいずれの適用領域に位置するのかを示す第２出力結果を取得し、
前記第１出力結果および前記第２出力結果に基づいて、データストリームされるデータの時間変化に基づく、学習済みモデルの出力結果の精度劣化の要因となるデータを検出する
処理を実行させることを特徴とする検出プログラム。
複数のクラスに対応する複数の訓練データを基にして、データの特徴空間を複数の適用領域に分類する決定境界を学習した複数の検出モデルのうち、第１検出モデルにデータが入力された場合、入力されたデータが前記複数の適用領域のうちいずれの適用領域に位置するのかを示す第１出力結果を取得し、前記複数の検出モデルのうち、第２検出モデルにデータが入力された場合、入力されたデータが前記複数の適用領域のうちいずれの適用領域に位置するのかを示す第２出力結果を取得する取得部と、
前記第１出力結果および前記第２出力結果に基づいて、データストリームされるデータの時間変化に基づく、学習済みモデルの出力結果の精度劣化の要因となるデータを検出する検出部と
を有することを特徴とする情報処理装置。