JP7268756B2

JP7268756B2 - 劣化抑制プログラム、劣化抑制方法および情報処理装置

Info

Publication number: JP7268756B2
Application number: JP2021553936A
Authority: JP
Inventors: 孝河東; 健人上村; 優安富; 友裕早瀬; 裕平梅田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-10-29
Filing date: 2019-10-29
Publication date: 2023-05-08
Anticipated expiration: 2039-10-29
Also published as: US20220245405A1; EP4053757A4; EP4053757A1; JPWO2021084623A1; WO2021084623A1

Description

本発明は、劣化抑制プログラム、劣化抑制方法および情報処理装置に関する。

従来から、データの判別や分類機能などを行う機械学習を用いた学習モデル（以下では、単に「モデル」と記載する場合がある）が利用されている。機械学習においては、時間経過に伴い、学習に使用したラベル付きデータセットに対して、適用するデータの分布（性質）が徐々に異なってくる「ドメインシフト」が発生することがある。この場合、学習モデルは、学習させた学習データの通りに判別や分類を行うので、運用中に入力データの傾向（データ分布）が変化すると、学習モデルの精度が劣化する。

近年では、精度劣化を抑制する技術として、アンサンブル学習が利用されている。具体的には、予測値と確信度とを出力可能なモデルを利用し、学習に使用可能なラベル付きデータセットを用いて複数の異なるモデルを学習する。そして、適用時は複数のモデルの出力の中で確信度が最も高いモデルの予測値を組み合わせて、全体の出力とする。

"Ensemble learning"、令和１年１０月４日検索、インターネット＜ＵＲＬ：https://en.wikipedia.org/wiki/Ensemble_learning＞

しかしながら、上記技術では、ドメインシフトが発生するデータに対してモデル全体の精度を維持することが難しい。

例えば、上記アンサンブル学習では、すべてのモデルの確信度が低くなった場合に出力を特定することができない。また、大きなドメインシフトが発生したときのように、すべてのモデルの確信度が一度低くなった後に再度高くなった場合、確信度自体の信頼性が低いので、モデルの推定精度の信頼性も低下する。このように、上記アンサンブル学習では、モデル全体の精度劣化を抑制することが難しい。

一つの側面では、モデル全体の精度劣化を抑制することができる劣化抑制プログラム、劣化抑制方法および情報処理装置を提供することを目的とする。

第１の案では、劣化抑制プログラムは、コンピュータに、第１学習データセットに含まれる、正解情報を示すラベルが付与された各学習データに基づいて、性質の異なる複数の学習モデルを生成する処理を実行させる。劣化抑制プログラムは、コンピュータに、前記複数の学習モデルのうちのいずれかの学習モデルの、推定対象である入力データに対する前記ラベルの推定の推定精度が所定の基準未満となった場合、前記推定精度が所定の基準以上の学習モデルによる推定結果を利用した複数の学習データを含む第２学習データセットを生成する処理を実行させる。劣化抑制プログラムは、コンピュータに、前記第２学習データセットを用いて前記推定精度が所定の基準未満となった学習モデルの再学習を実行する処理を実行させる。

一つの側面では、モデル全体の精度劣化を抑制することができる。

図１は、実施例１にかかる劣化抑制装置を説明する図である。図２は、アンサンブル学習の問題点を説明する図である。図３は、実施例１にかかる劣化抑制装置の機能構成を示す機能ブロック図である。図４は、初期ラベル付きデータＤＢに記憶される情報の例を示す図である。図５は、初期ラベル無しデータＤＢに記憶される情報の例を示す図である。図６は、推定対象データＤＢに記憶される情報の例を示す図である。図７は、推定結果ＤＢに記憶される情報の例を示す図である。図８は、モデル学習手法１を説明する図である。図９は、モデル学習手法２を説明する図である。図１０は、モデル学習手法３を説明する図である。図１１は、モデル学習手法４を説明する図である。図１２は、再学習を説明する図である。図１３は、実施例１にかかる一連の処理の流れを示すフローチャートである。図１４は、実施例１にかかる推定処理の流れを示すフローチャートである。図１５は、実施例１による効果を説明する図である。図１６は、クラスタ数と中心点との特定を説明する図である。図１７は、運用後のクラスタリングを説明する図である。図１８は、入力データへのラベル付けを説明する図である。図１９は、モデル精度の判定の詳細を説明する図である。図２０は、複数のモデルの劣化が検出された場合の回復例を説明する図である。図２１は、ハードウェア構成例を説明する図である。

以下に、本発明にかかる劣化抑制プログラム、劣化抑制方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

［劣化抑制装置の説明］
図１は、実施例１にかかる劣化抑制装置１０を説明する図である。図１に示すように、劣化抑制装置１０は、学習時には、ラベル付きデータセットを用いて複数の学習モデルを学習する。そして、劣化抑制装置１０は、適用時には、学習済みの複数の学習モデルを用いて、ドメインが時間と共に変化するラベル無しデータのラベル推定を実行する。この時、劣化抑制装置１０は、個々のモデルの精度劣化を検出することで、精度劣化したモデルを精度劣化していないモデルを用いて再学習することで推定精度を維持する。

ここで、一般的に利用されるアンサンブル学習の問題点について説明する。図２は、アンサンブル学習の問題点を説明する図である。図２に示すように、アンサンブル学習は、入力に対する出力として、予測値と確信度を出力可能なモデルを使用し、適用時は複数モデルの出力の中で確信度の高いものの予測値を組み合わせてモデル全体の出力とする。

例えば、適用初期は、確信度が高いモデルの予測結果を採用するが、時間経過により、すべてのモデルの確信度が低くなった場合には出力を特定できず、結果として、モデル全体の予測性能が劣化する。また、確信度が低くなった後に、再度高くなった場合、一度下がった確信度が上がる理由が不明確であり、確信度を信用することができず、得られる結果も不正確である可能性が高い。

このように、アンサンブル学習では、時間経過に伴い、学習に使用したラベル付きデータセットに対して、適用するデータの分布が徐々に異なってくる「ドメインシフト」に追従することができず、モデル全体の精度劣化を抑制することができない。

そこで、実施例１にかかる劣化抑制装置１０は、ドメイン変化に応じて異なる傾向を示す特徴生成器と精度劣化の検出器を用いることで、すべてのモデルの推定精度が劣化する状態の発生を軽減する。

具体的には、学習時では、劣化抑制装置１０は、学習データであるラベル付きデータを用いて、学習する特徴量が異なるものの同じ推定（分類）を行うようにモデル１、モデル２、モデル３を生成する。例えば、モデル１から３は、画像データを説明変数、動物名を目的変数（ラベル）とする学習データを用いて学習されるが、モデルごとにノイズを付与した画像データ等を用いることで、学習させる特徴量に変化を持たせる。

その後の適用時では、劣化抑制装置１０は、学習済みのモデル１、モデル２、モデル３に対して、推定対象である各ラベル無しデータを入力して、推定処理を随時実行する。ここで、劣化抑制装置１０は、時間経過により、モデル２の精度劣化を検出すると、モデル２の精度劣化が検出されたラベル無しデータに対する精度が劣化していないモデル１およびモデル３の推定結果を正解情報とする再学習データを生成する。そして、劣化抑制装置１０は、モデル２の再学習を実行する。

更なる時間経過により、劣化抑制装置１０は、モデル１の精度劣化を検出すると、モデル１の精度劣化が検出されたラベル無しデータに対する精度が劣化していないモデル２およびモデル３の推定結果を正解情報とする再学習データを生成する。そして、劣化抑制装置１０は、モデル１の再学習を実行する。

上述したように、劣化抑制装置１０は、ドメイン変化の種類に応じてそれぞれ異なる出力変化を起こす複数の学習手法を用いて複数のモデルを学習する。そして、劣化抑制装置１０は、各モデルの精度劣化を推定し、精度劣化が検出されたモデルを、精度劣化が検出されなかったモデルによりラベル付けされたデータを用いて、劣化したモデルと同一の学習手法で再学習する。この結果、劣化抑制装置１０は、モデル全体の精度劣化を抑制することができる。

［劣化抑制装置の機能構成］
図３は、実施例１にかかる劣化抑制装置１０の機能構成を示す機能ブロック図である。図３に示すように、劣化抑制装置１０は、通信部１１、記憶部１２、制御部２０を有する。

通信部１１は、他の装置の間の通信を制御する処理部であり、例えば通信インタフェースなどである。例えば、通信部１１は、管理者端末から各種指示を受信し、管理者端末に学習結果、推定結果、精度劣化状態などの各種情報を送信する。また、通信部１１は、学習データや推定対象のデータなどを受信することもできる。

記憶部１２は、各種データや制御部２０が実行するプログラムなどを記憶する記憶装置の一例であり、例えばメモリやハードディスクなどである。例えば、記憶部１２は、初期ラベル付きデータＤＢ１３、初期ラベル無しデータＤＢ１４、学習モデルＤＢ１５、推定対象データＤＢ１６、推定結果ＤＢ１７、再学習データＤＢ１８を記憶する。

初期ラベル付きデータＤＢ１３は、学習モデルの教師有学習に使用するラベル付きのデータを含むデータセットを記憶するデータベースである。図４は、初期ラベル付きデータＤＢ１３に記憶される情報の例を示す図である。図４に示すように、初期ラベル付きデータＤＢ１３は、「データＩＤ、説明変数、目的変数」を対応付けて記憶する。

ここで記憶される「データＩＤ」は、データを識別する識別子であり、「説明変数」は、学習時の説明変数となる画像データを示し、「目的変数」は、学習時の目的変数となる正解情報（ラベル）を示す。図４の例では、データＩＤ「０１」のラベル付きデータは、説明変数が「学習データ１」、目的変数が「Ａ」である例を示している。なお、画像分類を例にすると、ラベル付きデータの例としては、説明変数が「ネコが写っている画像データ」、目的変数が「ネコ」などである。

初期ラベル無しデータＤＢ１４は、学習モデルの教師無学習に使用するラベル無しのデータを含むデータセットを記憶するデータベースである。図５は、初期ラベル無しデータＤＢ１４に記憶される情報の例を示す図である。図５に示すように、初期ラベル無しデータＤＢ１４は、「データＩＤ、データ」を対応付けて記憶する。

ここで記憶される「データＩＤ」は、データを識別する識別子であり、「データ」は、学習時の画像データを示す。図５の例では、データＩＤ「Ａ１」のラベル無しデータが「学習データＡ」である例を示している。なお、画像分類を例にすると、ラベル無しデータの例としては、「犬が写っている画像データ」などである。

学習モデルＤＢ１５は、モデルの学習結果を記憶するデータベースである。具体的には、学習モデルＤＢ１５は、ニューラルネットワークやサポートベクターマシンなどを用いた各モデルの学習結果として、モデル１、モデル２、モデル３それぞれを構築することができる各種パラメータを記憶する。なお、学習モデルＤＢ１５は、学習済みの各種パラメータ（最適化されたパラメータ）が適用されたモデル１、モデル２、モデル３そのものを記憶することもできる。

推定対象データＤＢ１６は、学習済みのモデルに入力して推定を実行する対象のラベル無しデータを含むデータセットを記憶するデータベースである。図６は、推定対象データＤＢ１６に記憶される情報の例を示す図である。図６に示すように、推定対象データＤＢ１６は、「データＩＤ、データ」を対応付けて記憶する。ここで記憶される「データＩＤ」は、データを識別する識別子である。「データ」は、各モデルに入力される入力データであって、推定対象である画像データを示す。図６の例では、データＩＤ「Ｂ１」のラベル無しデータが「入力データＡ」である例を示している。なお、推定対象のデータは、データストリーム等で配信してもよい。

推定結果ＤＢ１７は、学習済みモデルによる推定結果を記憶するデータベースである。具体的には、推定結果ＤＢ１７は、推定対象データごとの推定結果を記憶する。図７は、推定結果ＤＢ１７に記憶される情報の例を示す図である。図７に示すように、推定結果ＤＢ１７は、「データＩＤ、データ、推定結果」を対応付けて記憶する。

ここで記憶される「データＩＤ」は、データを識別する識別子であり、「データ」は、推定対象である画像データを示し、推定結果が「ＢＢＢ」である例を示している。なお、推定結果ＤＢ１７は、各モデルの推定結果から最終的に決定されたモデル全体の推定結果を記憶することもでき、各モデルの推定結果を記憶することもでき、両方を記憶することもできる。なお、ここで記憶される情報は、後述するモデル実行部２２により生成されて格納される。

再学習データＤＢ１８は、精度が劣化したモデルの再学習に利用される再学習用のラベル付きデータを含むデータセットを記憶するデータベースである。具体的には、再学習データＤＢ１８は、再学習データを識別する「データＩＤ」、説明変数となる「画像データ」、目的変数となる「ラベル」を対応付けて記憶する。なお、ここで記憶される情報は、後述する再学習実行部２４により生成されて格納される。

制御部２０は、劣化抑制装置１０全体を司る処理部であり、例えばプロセッサなどである。この制御部２０は、学習実行部２１、モデル実行部２２、劣化検出部２３、再学習実行部２４を有する。なお、学習実行部２１、モデル実行部２２、劣化検出部２３、再学習実行部２４は、プロセッサが有する電子回路の一例やプロセッサが実行するプロセスの一例などである。

学習実行部２１は、複数のモデルを学習する処理部である。具体的には、学習実行部２１は、推定対象データ（入力データ）のドメインシフトに追従して、推定（判定）精度の劣化を検出するために、傾向の異なる複数のモデルを学習し、学習結果を学習モデルＤＢ１５に格納する。すなわち、学習実行部２１は、学習する特徴量を異ならせることで、性質の異なる複数のモデルであって、意図的に劣化タイミングをずらした複数のモデルを生成する。ここで、画像分類器に用いる各モデルの学習手法を具体的に説明する。

（学習手法１）
例えば、学習手法１は、ドメインシフトの一部が想定可能な場合に有効な手法であり、それぞれのモデルに対して、想定されるドメインシフトの異なる組合せを人工的に発生させてデータ拡張した学習データを用いて学習する。例えば、学習手法１では、推定対象データを撮影するカメラのセンサ劣化、カメラの位置ずれ、撮像時のノイズ増加を想定し、これらの状態を予め想定してモデルの学習を実行する。

図８は、モデル学習手法１を説明する図である。図８に示すように、学習実行部２１は、モデル１に対して、初期ラベル付きデータＤＢ１３に記憶される各ラベル付きデータ（学習データ）を用いた教師有学習を実行する。例えば、図４を例にして説明すると、学習実行部２１は、学習データ１（ＤＡ１）をモデル１に入力し、モデル１の出力結果とラベル「Ａ」とが一致するように、誤差逆伝搬法などを用いてモデル１のパラメータを最適化する。

一方、学習実行部２１は、モデル２とモデル３に対して、初期ラベル付きデータＤＢ１３に記憶される各ラベル付きデータに、ラベルはそのままで画像データにノイズなどを付与した学習データを用いた教師有学習を実行する。図４を例にして説明すると、学習実行部２１は、学習データ１にノイズを付与したノイズ付き学習データ１（ＤＡ２）をモデル２に入力し、モデル２の出力結果とラベル「Ａ」とが一致するように、誤差逆伝搬法などを用いてモデル２のパラメータを最適化する。また、学習実行部２１は、学習データ１を所定角度だけ回転させた回転後の学習データ１（ＤＡ３）をモデル３に入力し、モデル３の出力結果とラベル「Ａ」とが一致するように、誤差逆伝搬法などを用いてモデル３のパラメータを最適化する。

このように、学習実行部２１は、特徴量を少しずつ変更した学習データを用いることで、モデル適用領域（Applicability Domain）の大きさが少し異なる複数のモデルを生成することができる。

（学習手法２）
例えば、学習手法２は、類似する複数のタスクが想定できる場合に有効な手法であり、それぞれのモデルに対して、対象のメインタスクに対する学習と同時に別の補助タスクの異なる組合せを同時に学習する。

図９は、モデル学習手法２を説明する図である。図９に示すように、学習実行部２１は、モデル１に対して、初期ラベル付きデータＤＢ１３に記憶される各ラベル付きデータ（学習データ）を用いた教師有学習を実行するとともに、学習データとは異なるラベル付きの補助データ１を用いた教師有学習を実行する。

例えば、学習実行部２１は、人物の画像分類を想定する場合に、人物の画像データを用いるメインタスクを用いた教師有学習と、動物の画像データである補助データ１を用いる補助タスク１を用いた教師有学習を実行することで、人物の画像データの特徴量を学習するとともに、動物の画像データの特徴量を学習する。

上記例で説明すると、学習実行部２１は、モデル２に対して、人物の画像データを用いるメインタスクと、車両の画像データである補助データ２を用いる補助タスク２を同時に用いた教師有学習を実行することで、人物の画像データの特徴量を学習するとともに、車両の画像データの特徴量を学習する。

同様に、学習実行部２１は、モデル３に対して、人物の画像データを用いるメインタスクと、風景の画像データである補助データ３を用いる補助タスク３を同時に用いた教師有学習を実行することで、人物の画像データの特徴量を学習するとともに、風景の画像データの特徴量を学習する。

このように、学習実行部２１は、想定する特徴量の学習に加えて、ノイズとなりうる特徴量の学習を行うことで、モデル適用領域の決定境界が異なる複数のモデルを生成することができる。なお、各補助データは、予め記憶部１２に記憶される。

（学習手法３）
例えば、学習手法３は、ラベル無しデータが利用できる場合に有効な手法であり、各モデルに対して、教師有学習と教師無学習を実行する。具体的には、学習手法３は、それぞれのモデルの推定値が、ラベル付き学習データに対しては正しく出力され、ラベル無しデータに対してはそれぞれ異なるラベルを出力するように学習する。

図１０は、モデル学習手法３を説明する図である。例えば、学習実行部２１は、ラベル「Ａ」が付与されている学習データ１をモデル１、モデル２、モデル３それぞれに入力する。そして、学習実行部２１は、モデル１の出力結果とラベル「Ａ」とが一致するように、誤差逆伝搬法などを用いてモデル１のパラメータを最適化する。同様に、学習実行部２１は、モデル２の出力結果とラベル「Ａ」とが一致するようにモデル２のパラメータを最適化し、モデル３の出力結果とラベル「Ａ」とが一致するようにモデル３のパラメータを最適化する。

上記教師有学習と並行して、学習実行部２１は、初期ラベル無しデータＤＢ１４から取得したラベルが付与されていない学習データＡをモデル１、モデル２、モデル３それぞれに入力する。そして、学習実行部２１は、モデル１の出力結果が「Ａ」、モデル２の出力結果が「Ｂ」、モデル３の出力結果が「Ｃ」となるように、各モデルを学習する。

このように、学習実行部２１は、各モデルに対して、同じ特徴量を学習しつつ、異なる特徴量も併せて学習することで、モデル適用領域の大きさや数が異なる複数のモデルを生成することができる。

（学習手法４）
例えば、学習手法４は、初期ラベル付きデータＤＢ１３に記憶される学習データを用いた教師有学習により、モデルのタイプ、自由度、正則化の異なる複数のモデルを学習する。すなわち、適用するアルゴリズムが異なる複数のモデルを生成する。

図１１は、モデル学習手法４を説明する図である。図１１に示すように、学習実行部２１は、ニューラルネットワークを用いたモデル１、ランダムフォレストを用いたモデル２、サポートベクターマシン（ＳＶＭ）を用いたモデル３を用意し、それぞれに対してラベル「Ａ」が付与されている学習データ１を入力する。そして、学習実行部２１は、各モデルの出力がラベル「Ａ」と一致するように、各モデルを学習する。

学習実行部２１は、上記学習手法１から４のいずれか一つまたは組み合わせにより、複数のモデルを生成する。なお、選択の基準は、ユーザの指定に限らず、学習対象のカテゴリと学習手法とを対応付けておくことで、学習実行部２１が学習データを参照して自動で選択することもできる。

図３に戻り、モデル実行部２２は、学習実行部２１により生成された各モデルを用いて、画像分類などの分類や推定を実行する処理部である。例えば、モデル実行部２２は、学習モデルＤＢ１５から各種パラメータを読み出し、学習済みのモデル１、モデル２、モデル３を構築する。そして、モデル実行部２２は、推定対象データＤＢ１６に記憶される入力データＢをモデル１、モデル２、モデル３のそれぞれに入力し、各モデルの出力ラベル（出力結果）を取得する。

その後、モデル実行部２２は、各モデルの出力結果に基づき、モデル全体の推定結果を決定して、推定結果ＤＢ１７に格納する。なお、モデル全体の推定結果の決定手法には様々な手法を採用することができる。例えば、モデル実行部２２は、各モデルから確信度が取得できる場合は、確信度が最も高いモデルの出力結果を選択する。また、モデル実行部２２は、出力結果から多数決で選択することもできる。

劣化検出部２３は、各モデルの精度劣化を検出する処理部である。具体的には、劣化検出部２３は、各モデルの実行や出力結果等を監視し、いずれかのモデルで精度劣化を検出した場合、精度劣化したモデル、精度劣化が検出されたときの入力データ、精度劣化の回数など精度劣化に関する情報を再学習実行部２４に出力する。

なお、劣化検出方法は、一般的に利用されている様々な手法を採用することができる。例えば、劣化検出部２３は、確信度が閾値以下となったモデル、確信度が閾値以下となった回数が閾値以上となったモデル、モデル全体の推定結果に連続して所定回数以上選択されなかったモデルなどを精度劣化と検出することもできる。

再学習実行部２４は、精度が劣化したモデルの再学習を実行する処理部である。具体的には、再学習実行部２４は、精度劣化していないモデルの推定結果を正解情報とする再学習データを生成して、再学習データＤＢ１８に格納する。そして、再学習実行部２４は、生成した再学習データを用いて、精度劣化したモデルの再学習を実行する。

例えば、再学習実行部２４は、精度劣化が検出された直後から他のモデルが精度劣化するまでに収集できた一定数のデータを、再学習データに選択する。このとき、再学習実行部２４は、劣化に関わるデータが推定可能な場合は、劣化の原因と推定されたデータを重点的に選択する。例えば、再学習実行部２４は、精度劣化したモデルが精度劣化していないモデルと異なるラベルを出力するデータを選択する。

図１２は、再学習を説明する図である。図１２に示すように、再学習実行部２４は、モデル１、モデル２、モデル３のうちモデル１の精度劣化が検出された場合、モデル１の精度劣化が発生したときのモデル２とモデル３の一定数の推定結果を用いて、モデル１の再学習を実行する。例えば、再学習実行部２４は、入力データＺに対して、モデル１とは異なるラベルを出力したモデル３の推定結果（ＺＺＺ）を取得する。そして、再学習実行部２４は、入力データＺを説明変数、推定結果（ＺＺＺ）を目的変数とする再学習データを用いて、モデル１の再学習を実行する。

なお、再学習実行部２４は、モデル１の精度劣化中に、他のモデルで推定されたすべての推定結果を用いて再学習データを生成して、モデル１の再学習を実行することもできる。また、再学習実行部２４は、モデル１の精度劣化中に、他のモデルで推定されたすべての推定結果のうち、モデル１とは異なる推定結果（出力ラベル）のみを用いて再学習データを生成して、モデル１の再学習を実行することもできる。

また、再学習実行部２４は、同時に一定数以上のモデルの精度劣化を検出した場合、修復不能と判断して、推定（判定）を停止してユーザに通知することもできる。例えば、再学習実行部２４は、再学習に必要なデータ数を１０００個の推定結果を取得する前に、別のモデルの精度劣化を検出した場合に、修復不能と判断する。また、再学習実行部２４は、一定期間の間または同時に、半数以上のモデルが精度劣化を起こした場合に、修復不能と判断する。

［一連の流れ］
図１３は、実施例１にかかる一連の処理の流れを示すフローチャートである。図１３に示すように、学習実行部２１は、処理が開始されると、ユーザの指示や予め学習方法と対応付けておいた学習データの種別等により、学習手法１から４から、使用する学習方法を決定する（Ｓ１０１）。

続いて、学習実行部２１は、初期ラベル付きデータＤＢ１３に記憶される学習データを用いて、決定された学習方法により複数のモデルを学習する（Ｓ１０２）。このとき、学習方法によっては、ラベル無しデータ、ノイズ付きの学習データなどを用いた学習が実行される。

その後、モデル実行部２２が推定対象である新規データセットを取得し（Ｓ１０３）、劣化検出部２３が新規データセットに対する各モデルの精度劣化を検出する（Ｓ１０４）。なお、この新規データセットは、推定対象のデータから構成されるデータセットであってもよく、精度劣化の推定を行うために用意された検証用のデータで構成されるデータセットであってもよい。

そして、再学習実行部２４は、精度劣化が検出されていないモデルが一定数より多い場合（Ｓ１０５：Ｎｏ）、精度劣化が検出されたモデルが存在し、再学習に必要なデータセットが保存されているか否かを推定する（Ｓ１０６）。

ここで、再学習実行部２４は、再学習に必要なデータセットが保存されている場合（Ｓ１０６：Ｙｅｓ）、次に推定対象である新規データセットを管理者端末などから取得して保存する（Ｓ１０７）。その後、Ｓ１０３以降が実行される。

一方、再学習実行部２４は、再学習に必要なデータセットが保存されていない場合（Ｓ１０６：Ｎｏ）、精度劣化が検出されていないモデルを使って再学習用データにラベル付けを実行し（Ｓ１０８）、再学習用データを使って、精度劣化が検出されたモデルを再学習する（Ｓ１０９）。その後、Ｓ１０７以降が実行される。

また、Ｓ１０５において、再学習実行部２４は、精度劣化が検出されていないモデルが一定数以上である場合（Ｓ１０５：Ｙｅｓ）、精度劣化の回復ができなくなったことを管理者に通知したり、ディスプレイに表示したりする（Ｓ１１０）。

［推定処理の流れ］
図１４は、実施例１にかかる推定処理の流れを示すフローチャートである。図１４に示すように、モデル実行部２２は、処理が開始されると、推定対象データＤＢ１６から推定対象のデータを取得する（Ｓ２０１）。

続いて、モデル実行部２２は、推定対象のデータを各モデルに入力し、推定に使用する精度劣化が検出されていないモデルを決定し（Ｓ２０２）、推定に使用する複数のモデルを組み合わせて推定対象のデータにラベル付けを実行する（Ｓ２０３）。そして、モデル実行部２２は、推定されたラベルを推定結果として推定結果ＤＢ１７等に出力する（Ｓ２０４）。

［効果］
上述したように、劣化抑制装置１０は、精度劣化を起こしていないモデルでラベル無しデータにラベル付けを行い、このラベル付きデータを使って劣化したモデルを同じ学習手法で再学習することでドメインシフトに追従することができる。また、劣化抑制装置１０は、複数のモデルを異なる方法で学習し、ドメインシフトしたデータに対する各モデルの精度劣化を検出し、劣化が検出された場合に、劣化が検出されていないモデルを使ってラベル付けられた新しい学習データから学習に使用するデータを選択し精度劣化したモデルを再学習することができる。この結果、劣化抑制装置１０は、モデル全体の精度劣化を抑制することができる。

図１５は、実施例１による効果を説明する図である。図１５に示すように、アンサンブル学習などの一般技術では、各モデルの確信度が高いときは高精度の推定を実行できるが、時間経過によるドメインシフトによって、各モデルの確信度が低くなると、出力（予測）が特定できず、推定精度が低下する。

一方で、実施例１にかかる劣化抑制装置１０は、いずれかのモデルの精度が劣化すると、精度が劣化していないモデルの推定結果を正解情報とする再学習データにより、精度回復を実行するので、時間経過等に伴ってドメインシフトが生じるデータに対して、精度低下を軽減でき、全体として高精度を維持することができる。また、実施例１にかかる劣化抑制装置１０は、すべてのモデルの精度が劣化すると、推定を停止するので、回復不可能な精度低下時に間違った出力を抑制できる。

ところで、実施例１の劣化検出部２３は、様々な手法を用いてモデルの精度劣化を検出することができる。ここでは、その１つの手法として、各モデルについて、モデルの特徴量空間のクラスタリングにより、モデルの精度劣化を検出する手法を説明する。なお、特徴量空間とは、モデル適用領域を表現する空間や、入力データから得られる特徴量、ニューラルネットワークの最終層等から得られる特徴量を用いた空間の一例である。

まず、劣化検出部２３は、初期の学習段階（劣化前）の特徴量空間の各データの密度を、ガウス距離などを用いて計算する。続いて、劣化検出部２３は、クラスタの数と各クラスタの中で密度が一定以上の領域の中心点（代表点）を記録する。図１６は、クラスタ数と中心点との特定を説明する図である。図１６に示すように、劣化検出部２３は、横軸を特徴量、縦軸を密度とするグラフを生成する。そして、劣化検出部２３は、既知である各クラスタについて、属するデータ（学習データ）のうち、密度が最も高い位置（中心点）の座標を特定して記憶部１２に格納する。図１６の例では、クラスタＡとクラスタＢを含むクラスタ数として２、クラスタＡの中心点とクラスタＢの中心点を含む２つの中心点が記憶される。

なお、中心点の座標には、データの特徴を示す情報を採用することができ、例えば各モデルから取得できる特徴量や、上記密度情報を採用することができる。また、特徴量には、例えばニューラルネットワークの最終層から取得できる情報、入力データそのものから取得できる情報、入力データの平均画素値などを採用することができる。また、劣化前の特徴量空間に分類されたデータの情報は、学習時に取得しておき、記憶部１２等に保存しておくことで、上記処理に利用することができる。

次に、劣化検出部２３は、上記クラスタ数と中心点の数が一致する条件下で、入力データの密度に基づきクラスタとクラスタに属するデータとを抽出するクラスタリングを実行する。図１７は、運用後のクラスタリングを説明する図である。図１７に示すように、劣化検出部２３は、モデル実行部２２による推定結果（判定結果）に基づく入力データの特徴量や密度を用いて、横軸を特徴量、縦軸を密度とするグラフを生成する（Ｓ１）。続いて、劣化検出部２３は、密度に対する閾値を所定値ごとに下げていき、上記特定されたクラスタ数（ここでは２）と同じ数になる最小の閾値を探索する（Ｓ２）。

このとき、劣化検出部２３は、閾値以上である入力データの特徴量に対してパーシステントホモロジ変換（ＰＨ変換）を実行して、０次元の連結成分を参照し、予め定めた閾値以上の半径を有するバー（bar）の数が事前に特定したクラスタ数と一致するか否かにより、クラスタ数の計算および特定を実行する（Ｓ３）。ここで、劣化検出部２３は、閾値を超えるバーの数が事前のクラスタ数と一致しない場合は、閾値を所定値下げて処理を繰り返す（Ｓ４）。

このように、劣化検出部２３は、密度の閾値を下げて密度が閾値以上の入力データを抽出する処理と、抽出された入力データに対するＰＨ変換処理によりクラスタ数を計算する処理とを、事前のクラスタ数と一致するクラスタ数が検出されるまで繰り返す。そして、劣化検出部２３は、クラスタ数が一致すると、その時の閾値（密度）以上の密度を有する入力データから中心点Ｃ１とＣ２を特定する。その後、劣化検出部２３は、クラスタリングで得られる情報を記憶部１２に格納する。

その後、劣化検出部２３は、劣化前の中心点と運用後の中心点との位置関係から中心点の遷移を特定する。そして、劣化検出部２３は、中心点Ｃ１にクラスタＡ（ラベル＝クラスＡ）を対応付け、中心点Ｃ２にクラスタＢ（ラベル＝クラスＢ）を対応付ける。この結果、劣化検出部２３は、密度が閾値以上、かつ、中心点Ｃ１と同じクラスタに属する各入力データにラベルとしてクラスＡを設定する。同様に、劣化検出部２３は、密度が閾値以上、かつ、中心点Ｃ２と同じクラスタに属する各入力データにラベルとしてクラスＢを設定する。

次に、クラスタリング部２５により抽出されなかった閾値未満の入力データそれぞれにラベルを対応付ける。劣化検出部２３は、抽出されなかった各入力データについて、各クラスタの中心Ｃ１との距離およびＣ２との距離をそれぞれ計測し、２番目に近い距離が各クラスタの中心間の距離の最大値より大きい場合は、一番近いクラスタに属するデータと決定する。

つまり、劣化検出部２３は、上記手法によりクラスタが決定された領域Ｘ（クラスタＡ）と領域Ｙ（クラスタＢ）以外の領域のうち、領域Ｘよりも外側の領域Ｐの入力データについては、クラスタＡと決定し、領域Ｙよりも外側の領域Ｑの入力データについては、クラスタＢと決定する。

そして、劣化検出部２３は、２番目に近い距離が各クラスタの中心間の距離の最大値より小さい（複数のクラスタの中間にある）領域Ｚの入力データについては、近くにある複数のクラスタのデータが混在していると判定し、各入力データに関して各クラスタの確率を測定して付与する。具体的には、劣化検出部２３は、ｋ近傍法、一様確率法、分布比率保持法などを用いて、領域Ｚに属する各入力データについて、各クラスタに属する確率を算出し、確率的なラベル（クラスＡの確率、クラスＢの確率、クラスＣの確率）を生成して付与する。

上述した手法により推定して、各入力データに付与するラベルの情報が図１８である。図１８は、入力データへのラベル付けを説明する図である。推定されたラベルは、各クラスタに属する確率（クラスＡに属する確率，クラスＢに属する確率，クラスＣに属する確率）で付与される。図１８に示すように、領域Ｘと領域Ｐの各入力データには、推定ラベル［１，０，０］が付与され、領域Ｙと領域Ｑの各入力データには、推定ラベル［０，１，０］が付与され、領域Ｚの各入力データには、推定ラベル［ａ，ｂ，ｃ］が付与される。なお、ａ，ｂ，ｃは、ｋ近傍法などの手法により算出される確率である。そして、劣化検出部２３は、各入力データと推定ラベルとの対応付けを記憶部１２に格納する。

その後、劣化検出部２３は、各入力データについて、判定結果と推定結果とを取得し、これらの比較により劣化判定を実行する。例えば、劣化検出部２３は、各推定結果で示される各入力データ（各点）の確率ベクトルに対し、モデルによる判定結果のベクトル表示の成分積の和（内積）をその点のスコアとし、そのスコアの合計をデータ数で割った値と閾値との比較により、劣化判定を実行する。

図１９は、モデル精度の判定の詳細を説明する図である。図１９に示すように、各入力データに対して、学習モデルの判定結果と推定結果とを取得する。例えば、入力データ１は、モデル１によりクラスＡと判定されたことから判定結果は［１，０，０］であり、劣化検出部２３によりクラスタＡに属すると推定されたことから推定結果は［１，０，０］である。同様に、入力データ２は、モデル１によりクラスＢと判定されたことから判定結果は［０，１，０］であり、劣化検出部２３により領域Ｚに属すると推定されて算出された確率に基づき推定結果は［０．５，０．５，０］である。

そして、劣化検出部２３は、各入力データのモデル１の判定結果の行列と、各入力データの推定結果の行列とを生成し、要素積の和を算出し、要素積の和をデータ数で除算することで、推定の精度（スコア）を算出する。そして、劣化検出部２３は、推定の精度が閾値未満である場合に、モデル１の精度が劣化状態であると検出する。

上述したように、劣化検出部２３は、各モデルについて上記処理を実行することで、各モデルが劣化傾向にある状態を特定することができる。

さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［劣化検出］
例えば、劣化が検出されたモデルが回復する前に、他のモデルの劣化が発生する場合がある。この場合、再学習実行部２４は、他のモデルが精度劣化する直前のデータから遡った一定数のデータを、再学習データに選択することができる。

図２０は、複数のモデルの劣化が検出された場合の回復例を説明する図である。図２０に示すように、モデル１の劣化が検出されて、モデル１の回復処理が行われる前に、モデル２の劣化が検出されたとする。

この場合、再学習実行部２４は、モデル１の精度劣化前にドメインシフトが発生した後、モデル２の精度劣化が発生する前に再度ドメインシフトが発生していると推定する。そして、再学習実行部２４は、劣化前のモデル２の推定結果と、モデル３の推定結果とを用いた再学習データを生成して、モデル１の再学習を実行してモデル１の精度を回復させる。

その後、再学習実行部２４は、回復させたモデル１の推定結果と、モデル３の推定結果とを用いた再学習データを生成して、モデル２の再学習を実行してモデル２の精度を回復させる。

このように、再学習実行部２４は、複数モデルの精度劣化時も段階的に回復させることができる。また、再学習実行部２４は、劣化が発生していない状態の推定結果を用いて精度劣化状態のモデルを回復させることができ、間違った回復処理の発生を抑制することができる。ただし、再学習実行部２４は、各モデルを回復させるときに、精度劣化が発生していない推定結果が一定数以上取得できない場合は、回復不可能と判断して、管理者等に通知する。

［特徴量の利用］
上記実施例では、入力データの特徴量を用いる例を説明したが、これに限定されるものではなく、入力データの特徴を示す情報であればよく、機械学習などで利用される様々な特徴量を採用することもできる。また、特徴量空間は、入力データから得られる特徴量を座標とする空間の一例であり、実施例１で２次元の空間を例示したが、これに限定されるものではなく、機械学習や深層学習で利用される各種特徴量空間を用いることができる。例えば、モデル適用領域を表す特徴量空間を用いることができる。

［密度の計算］
実施例２では、ガウス密度を用いる例を説明したが、これに限定されるものではなく、eccentricityやＫＮＮ距離（K－Nearest Neighbor algorithm）など、公知の様々な手法を用いることができる。なお、ガウス密度などは、値が大きいほど密度が高いが、ＫＮＮ距離は、値（距離）が小さいほど密度が高くなるので、代表点の特定も密度が最も小さい点が選択される。

［数値等］
また、上記実施例で用いた数値、各閾値、特徴量空間、クラスタの数、ラベルの数等は、あくまで一例であり、任意に変更することができる。また、入力データや学習方法などもあくまで一例であり、任意に変更することができる。また、学習モデルには、ニューラルネットワークなど様々な手法を採用することができる。

［システム］
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、モデルを実行して推定を行う装置と、モデルを監視して劣化検出を行う装置とを別々の筐体で実現することもできる。

さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

［ハードウェア］
図２１は、ハードウェア構成例を説明する図である。図２１に示すように、劣化抑制装置１０は、通信装置１０ａ、ＨＤＤ（Hard Disk Drive）１０ｂ、メモリ１０ｃ、プロセッサ１０ｄを有する。また、図２１に示した各部は、バス等で相互に接続される。

通信装置１０ａは、ネットワークインタフェースカードなどであり、他の装置との通信を行う。ＨＤＤ１０ｂは、図３に示した機能を動作させるプログラムやＤＢを記憶する。

プロセッサ１０ｄは、図３に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１０ｂ等から読み出してメモリ１０ｃに展開することで、図３等で説明した各機能を実行するプロセスを動作させる。例えば、このプロセスは、劣化抑制装置１０が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１０ｄは、学習実行部２１、モデル実行部２２、劣化検出部２３、再学習実行部２４等と同様の機能を有するプログラムをＨＤＤ１０ｂ等から読み出す。そして、プロセッサ１０ｄは、学習実行部２１、モデル実行部２２、劣化検出部２３、再学習実行部２４等と同様の処理を実行するプロセスを実行する。

このように、劣化抑制装置１０は、プログラムを読み出して実行することで劣化抑制方法を実行する情報処理装置として動作する。また、劣化抑制装置１０は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、劣化抑制装置１０によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

１０劣化抑制装置
１１通信部
１２記憶部
１３初期ラベル付きデータＤＢ
１４初期ラベル無しデータＤＢ
１５学習モデルＤＢ
１６推定対象データＤＢ
１７推定結果ＤＢ
１８再学習データＤＢ
２０制御部
２１学習実行部
２２モデル実行部
２３劣化検出部
２４再学習実行部

Claims

コンピュータに、
第１学習データセットに含まれる、正解情報を示すラベルが付与された各学習データに基づいて、性質の異なる複数の学習モデルを生成し、
前記複数の学習モデルのうちのいずれかの学習モデルの、推定対象である入力データに対する前記ラベルの推定の推定精度が所定の基準未満となった場合、前記推定精度が所定の基準以上の学習モデルによる推定結果を利用した複数の学習データを含む第２学習データセットを生成し、
前記第２学習データセットを用いて前記推定精度が所定の基準未満となった学習モデルの再学習を実行する
処理を実行させることを特徴とする劣化抑制プログラム。
前記生成する処理は、前記入力データの特徴が時間経過により変化するドメインシフトが想定可能な場合に、想定可能な前記ドメインシフト後の入力データを用いて、前記性質の異なる複数の学習モデルを生成することを特徴とする請求項１に記載の劣化抑制プログラム。
前記生成する処理は、前記第１学習データセットに含まれる前記各学習データを用いた機械学習により第１の学習モデルを生成し、前記ラベルは変更せずに前記各学習データにノイズを付加したノイズ付き学習データを用いた機械学習により第２の学習モデルを機械学習により生成し、前記ラベルは変更せずに前記各学習データを回転させた回転後学習データを用いた機械学習により第３の学習モデルを生成することを特徴とする請求項２に記載の劣化抑制プログラム。
前記生成する処理は、推定対象である前記ラベルが付与された前記各学習データを含む前記第１学習データセットおよび前記推定対象と類似するラベルが付与された各学習データを含む類似学習データセットを用いた機械学習により前記複数の学習モデルを生成することを特徴とする請求項１に記載の劣化抑制プログラム。
前記生成する処理は、前記第１学習データセットを用いた、前記ラベルに基づく教師有学習により前記複数の学習モデルを生成するとともに、前記ラベルが付与されていない各学習データを含むラベル無しデータセットを用いて、前記複数の学習モデルの出力が異なるように、教師無学習により前記複数の学習モデルを生成することを特徴とする請求項１に記載の劣化抑制プログラム。
前記生成する処理は、前記各学習データに基づいて、学習のアルゴリズムが異なる前記複数の学習モデルを機械学習により生成することを特徴とする請求項１に記載の劣化抑制プログラム。
前記生成する処理は、前記推定精度が所定の基準未満の学習モデルに対して、前記推定精度が所定の基準未満となった時点で、前記推定精度が所定の基準以上である他の学習モデルの推定結果を正解情報とする前記第２学習データセットを生成することを特徴とする請求項１に記載の劣化抑制プログラム。
前記実行する処理は、前記推定精度が所定の基準以上の学習モデルによる前記推定結果の数が所定数以上取得できない場合、または、前記複数の学習モデル全ての推定精度が前記所定の基準未満となった場合、前記複数の学習モデル全体の精度回復が不可能と判定し、判定結果を出力することを特徴とする請求項１に記載の劣化抑制プログラム。
コンピュータが、
第１学習データセットに含まれる、正解情報を示すラベルが付与された各学習データに基づいて、性質の異なる複数の学習モデルを生成し、
前記複数の学習モデルのうちのいずれかの学習モデルの、推定対象である入力データに対する前記ラベルの推定の推定精度が所定の基準未満となった場合、前記推定精度が所定の基準以上の学習モデルによる推定結果を利用した複数の学習データを含む第２学習データセットを生成し、
前記第２学習データセットを用いて前記推定精度が所定の基準未満となった学習モデルの再学習を実行する
処理を実行することを特徴とする劣化抑制方法。
第１学習データセットに含まれる、正解情報を示すラベルが付与された各学習データに基づいて、性質の異なる複数の学習モデルを生成する生成部と、
前記複数の学習モデルのうちのいずれかの学習モデルの、推定対象である入力データに対する前記ラベルの推定の推定精度が所定の基準未満となった場合、前記推定精度が所定の基準以上の学習モデルによる推定結果を利用した複数の学習データを含む第２学習データセットを生成する生成部と、
前記第２学習データセットを用いて前記推定精度が所定の基準未満となった学習モデルの再学習を実行する実行部と
を有することを特徴とする情報処理装置。