JP7548047B2

JP7548047B2 - 判定処理プログラム、判定処理方法および情報処理装置

Info

Publication number: JP7548047B2
Application number: JP2021023333A
Authority: JP
Inventors: 孝河東; 健人上村; 優安富; 友裕早瀬
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2021-02-17
Filing date: 2021-02-17
Publication date: 2024-09-10
Anticipated expiration: 2041-02-17
Also published as: EP4047528A1; JP2022125637A; US20220261690A1

Description

本発明は、判定処理プログラム等に関する。

ラベル付きデータセットを入力とした機械学習を実行することで、機械学習モデルが生成され、学習済みの機械学習モデルにデータを適用して、データを複数のクラスに分類している。

ここで、時間経過等に伴い、適用するデータの分布が、機械学習を行った時点のデータの分布から、徐々に変化する場合がある。係るデータの分布の変化をドメインシフトと表記する。たとえば、従来技術では、ドメインシフトによって、機械学習モデルの精度が劣化するため、機械学習モデルの劣化を検出すると、機械学習モデルに対して再学習を実行する対応を行っている。

Ming-Yu Liu,Thomas Breuel,Jan Kautz "Unsupervised Image-to-Image Translation Networks" nVIDIA,NIPS 2017

しかしながら、上述した従来技術では、ドメインシフトに対応するための再学習にコストがかかるという問題がある。

１つの側面では、本発明は、ドメインシフトに対応するための再学習に要するコストを削減することができる判定処理プログラム、判定処理方法および情報処理装置を提供することを目的とする。

第１の案では、コンピュータに次の処理を実行させる。コンピュータは、分類モデルの劣化が発生した場合に、劣化が発生した後の第１入力データを分類モデルに入力することで分類モデルから出力される第１判定結果と、劣化が発生する前の第２入力データを、複数のデータ変換器に入力することで変換された複数の変換後データを分類モデルに入力することで分類モデルから出力される複数の第２判定結果との類似度を算出する。コンピュータは、類似度を基にして、複数のデータ変換器からデータ変換器を選択する。コンピュータは、選択したデータ変換器を用いて、分類モデルでのデータ入力における前処理を行う。

ドメインシフトに対応するための再学習に要するコストを削減することができる。

図１は、参考技術を説明するための図である。図２は、本実施例に係る情報処理装置の処理のポイント１を説明するための図である。図３は、本実施例に係る情報処理装置のポイント２を説明するための図である。図４は、本実施例に係る情報処理装置のポイント３を説明するための図（１）である。図５は、本実施例に係る情報処理装置のポイント３を説明するための図（２）である。図６は、本実施例に係る情報処理装置の処理を説明するための図（１）である。図７は、本実施例に係る情報処理装置の処理を説明するための図（２）である。図８は、本実施例に係る情報処理装置の処理を説明するための図（３）である。図９は、本実施例に係る情報処理装置の処理を説明するための図（４）である。図１０は、本実施例に係る情報処理装置の処理を説明するための図（５）である。図１１は、本実施例に係る情報処理装置の処理を説明するための図（６）である。図１２は、本実施例に係る情報処理装置の処理を説明するための図（７）である。図１３は、本実施例に係る情報処理装置の処理を説明するための図（８）である。図１４は、本実施例に係る情報処理装置の処理を説明するための図（９）である。図１５は、本実施例に係る情報処理装置の処理を説明するための図（１０）である。図１６は、本実施例に係る情報処理装置の処理を説明するための図（１１）である。図１７は、本実施例に係る情報処理装置の処理を説明するための図（１２）である。図１８は、本実施例に係る情報処理装置の効果を説明するための図である。図１９は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図２０は、学習データセットのデータ構造の一例を示す図である。図２１は、データセットテーブルのデータ構造の一例を示す図である。図２２は、スタイル変換器テーブルのデータ構造の一例を示す図である。図２３は、学習データセットテーブルのデータ構造の一例を示す図である。図２４は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。図２５は、選択部のその他の処理を説明するための図である。図２６は、本実施例に係る学習装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

以下に、本願の開示する判定処理プログラム、判定処理方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

本実施例の説明を行う前に、参考技術について説明する。図１は、参考技術を説明するための図である。参考技術を実行する装置を「参考装置」と表記する。参考装置は、ラベル付きのデータセットを用いて、分類モデルＣ１０を学習済みとする。分類モデルＣ１０は、入力されたデータを、いずれかの分類クラスに分類するモデルであり、ＮＮ（Neural Network）等の機械学習モデルによって実現される。

参考装置は、ドメインシフトによって、分類モデルＣ１０の劣化を検出すると、以下のステップＳ１～Ｓ５に示すような、モデル修復処理を行う。たとえば、時刻ｔ１において、劣化（ドメインシフト）が検出され、時刻ｔ１より前のデータを、劣化前データ（データセット）ｄ１とする。時刻ｔ１より後のデータを、劣化後データ（データセット）ｄ２とする。

ステップＳ１について説明する。参考装置は、劣化前データｄ１と、劣化後データｄ２とを基にして、スタイル変換器Ｔ１０を学習する。スタイル変換器Ｔ１０は、劣化前データｄ１を、劣化後データｄ２にスタイル変換するモデルである。スタイル変換器Ｔ１０は、ＮＮ等の機械学習モデルによって実現される。

ステップＳ２について説明する。参考装置は、劣化前データｄ１を、分類モデルＣ１０に入力することで、劣化前データｄ１の分類クラスを特定する。劣化前データｄ１の分類クラスを、推定ラベルＬ１とする。参考装置は、複数の劣化前データｄ１に対して、ステップＳ２を繰り返し実行する。

ステップＳ３について説明する。参考装置は、劣化前データｄ１を、スタイル変換器Ｔ１０に入力することで、劣化後データｄ３にスタイル変換する。参考装置は、複数の劣化前データｄ１に対して、ステップＳ３を繰り返し実行する。

ステップＳ４について説明する。参考装置は、ステップＳ２で特定した推定ラベルを「正解ラベル」、ステップＳ３でスタイル変換した劣化後データｄ３を「入力データ」とするデータ（データセット）を用いて、分類モデルＣ１０を再学習する。再学習した分類モデルＣ１０を、分類モデルＣ１１とする。

ステップＳ５について説明する。参考装置は、分類モデルＣ１１を用いて、劣化後データｄ２の推定ラベルＬ２を特定する。

ここで、図１に説明した参考技術では、分類モデルＣ１０（Ｃ１１）の劣化を検出するたびに、スタイル変換器Ｔ１０、分類モデルＣ１０の機械学習を再度実行するため、分類システムを再開するまでに時間を要してしまう。

次に、本実施例に係る情報処理装置の処理のポイント１～３について説明する。まず、「ポイント１」について説明する。本実施例に係る情報処理装置は、ドメインシフトによって、分類モデルの劣化を検出した場合に、劣化前から劣化後にデータを変換するスタイル変換器を学習し、保存しておく。情報処理装置は、保存された複数のスタイル変換器の中で、現在のドレインシフトと類似する変換を行うスタイル変換器が存在する場合には、かかるスタイル変換器を用いて、分類モデルの機械学習を実行する。スタイル変換器は「データ変換器」の一例である。

図２は、本実施例に係る情報処理装置の処理のポイント１を説明するための図である。たとえば、時刻ｔ２－１、ｔ２－２、ｔ２－３において、分類モデルの劣化を検出しているものとする。情報処理装置は、時刻ｔ２－１を基準とする劣化前、劣化後のデータを基にして、スタイル変換器Ｔ２１を機械学習する。情報処理装置は、時刻ｔ２－２を基準とする劣化前、劣化後のデータを基にして、スタイル変換器Ｔ２２を機械学習する。情報処理装置は、時刻ｔ２－３を基準とする劣化前、劣化後のデータを基にして、スタイル変換器Ｔ２３を機械学習する。

情報処理装置は、時刻ｔ２－４において、分類モデルの劣化を検出した場合に、次の処理を行う。時刻ｔ２－４より前のデータを、劣化前データｄ１－１とする。時刻ｔ２－４より後のデータを、劣化後データｄ１－２とする。情報処理装置は、劣化前データｄ１－１を、スタイル変換器Ｔ２２に入力することで、変換データｄｔ２にスタイル変換する。ここで、情報処理装置は、変換データｄｔ２と、劣化後データｄ１－２とが類似する場合に、劣化前データｄ１－１から劣化後データｄ１－２へのドメインシフトと類似するスタイル変換を実行するスタイル変換器が存在することを特定する。劣化後データは、「第１入力データ」の一例である。劣化前データは、「第２入力データ」の一例である。

情報処理装置は、劣化前データｄ１－１から劣化後データｄ１－２へのドメインシフトと類似するスタイル変換を実行するスタイル変換器が存在する場合、スタイル変換器Ｔ２２を再利用し、新たなスタイル変換器を生成する処理をスキップする。これによって、新たにスタイル変換器を生成するためのコストを削減することができる。

続いて、「ポイント２」について説明する。情報処理装置は、劣化後データを分類モデルに入力した際の出力結果と、劣化前データをスタイル変換器に入力した際の出力結果との差を、ドメインシフトの類似性として利用する。情報処理装置は、出力結果の差が小さいスタイル変換器を、再利用するスタイル変換器として特定する。

図３は、本実施例に係る情報処理装置のポイント２を説明するための図である。図３では、時刻ｔ２－４において、分類モデルＣ２０の劣化が検出され、時刻ｔ２－４より前のデータを、劣化前データｄ１－１とする。時刻ｔ２－４より後のデータを、劣化後データｄ１－２とする。スタイル変換器Ｔ２１～Ｔ２３に関する説明は、図２で行ったスタイル変換器Ｔ２１～Ｔ２３に関する説明と同様である。

情報処理装置は、劣化前データｄ１－１を、スタイル変換器Ｔ２１に入力することで、変換データｄｔ１にスタイル変換する。情報処理装置は、劣化前データｄ１－１を、スタイル変換器Ｔ２２に入力することで、変換データｄｔ２にスタイル変換する。情報処理装置は、劣化前データｄ１－１を、スタイル変換器Ｔ２３に入力することで、変換データｄｔ３にスタイル変換する。

情報処理装置は、劣化後データｄ１－２を、分類モデルＣ２０に入力することで、出力ラベルの分布ｄｉｓ０を特定する。情報処理装置は、変換データｄｔ１を、分類モデルＣ２０に入力することで、出力ラベルの分布ｄｉｓ１を特定する。情報処理装置は、変換データｄｔ２を、分類モデルＣ２０に入力することで、出力ラベルの分布ｄｉｓ２を特定する。情報処理装置は、変換データｄｔ３を、分類モデルＣ２０に入力することで、出力ラベルの分布ｄｉｓ３を特定する。

情報処理装置は、分布ｄｉｓ０と分布ｄｉｓ１との差、分布ｄｉｓ０と分布ｄｉｓ２との差、分布ｄｉｓ０と分布ｄｉｓ３との差をそれぞれ算出すると、分布ｄｉｓ０と分布ｄｉｓ２との差が最も小さい。分布ｄｉｓ２に対応する変換データは、変換データｄｔ２であり、劣化前データｄ１－１から、変換データｄｔ２にスタイル変換したスタイル変換器は、スタイル変換器Ｔ２２である。このため、情報処理装置は、スタイル変換器Ｔ２２を、再利用するスタイル変換器として特定する。

スタイル変換器Ｔ２２は、劣化前データｄ１－１から、劣化後データｄ１－２へのドメインシフトと類似するスタイル変換を実行可能なスタイル変換器となる。

続いて、「ポイント３」について説明する。情報処理装置は、直近の一定期間に複数回、類似のドメインシフトとして使用されたスタイル変換器が存在する場合、ポイント２で説明した処理で特定したスタイル変換器と、複数回使用されたスタイル変換器とを用いて、分類モデルの再学習を行う。

図４は、本実施例に係る情報処理装置のポイント３を説明するための図（１）である。図４では、時刻ｔ３において、分類モデルＣ２０の劣化が検出され、時刻ｔ３より前のデータを、劣化前データｄ３－１とする。時刻ｔ３より後のデータを、劣化後データｄ３－２とする。スタイル変換器Ｔ２４～Ｔ２６は、分類モデルＣ２０の劣化が検出されるたびに学習されたスタイル変換器とする。

情報処理装置が、ポイント２で説明した処理を実行して特定したスタイル変換器を、スタイル変換器Ｔ２４とする。また、直近の一定期間に、複数回、類似のドメインシフトとして使用されたスタイル変換器とスタイル変換器Ｔ２６とする。

情報処理装置は、劣化前データｄ３－１を、スタイル変換器Ｔ２４に入力することで、変換データｄｔ４にスタイル変換する。情報処理装置は、変換データｄｔ４を、スタイル変換器Ｔ２６に入力することで、変換データｄｔ６にスタイル変換する。

情報処理装置は、変換データｄｔ４，ｄｔ６を用いて、分類モデルＣ２０の再学習を実行する。たとえば、変換データｄｔ４，ｄｔ６に対応する正解ラベルは、劣化前データｄ３－１を、分類モデルＣ２０に入力した際の、推定ラベルとなる。

図５は、本実施例に係る情報処理装置のポイント３を説明するための図（２）である。図５では、時刻ｔ３において、分類モデルＣ２０の劣化が検出され、時刻ｔ３より前のデータを、劣化前データｄ３－１とする。時刻ｔ３より後のデータを、劣化後データｄ３－２とする。スタイル変換器Ｔ２４～Ｔ２６は、分類モデルＣ２０の劣化が検出されるたびに学習されたスタイル変換器とする。

情報処理装置が、ポイント２で説明した処理を実行して特定したスタイル変換器を、スタイル変換器Ｔ２４とする。また、直近の一定期間に、複数回（所定回数以上）、類似のドメインシフトとして使用されたスタイル変換器とスタイル変換器Ｔ２５，Ｔ２６とする。

情報処理装置は、劣化前データｄ３－１を、スタイル変換器Ｔ２４に入力することで、変換データｄｔ４にスタイル変換する。情報処理装置は、変換データｄｔ４を、スタイル変換器Ｔ２５に入力することで、変換データｄｔ５にスタイル変換する。情報処理装置は、変換データｄｔ５を、スタイル変換器Ｔ２６に入力することで、変換データｄｔ６にスタイル変換する。

情報処理装置は、変換データｄｔ４～ｄｔ６を用いて、分類モデルＣ２０の再学習を実行する。たとえば、変換データｄｔ４～ｄｔ６に対応する正解ラベルは、劣化前データｄ３－１を、分類モデルＣ２０に入力した際の、推定ラベルとなる。

本実施例に係る情報処理装置は、ポイント１～３に基づいて、スタイル変換器Ｔ１０の流用、分類モデルＣ１０の再学習を実行する。以下において、情報処理装置の処理の一例について説明する。図６～図１７は、本実施例に係る情報処理装置の処理を説明するための図である。

図６について説明する。情報処理装置は、時刻ｔ４－１において、正解ラベル付きの学習データセット１４１を用いて、分類モデルＣ２０の機械学習を実行する。学習データセット１４１には、入力データｘと、正解ラベルｙとの組が複数含まれている。

情報処理装置は、入力データｘを分類モデルＣ２０に入力することで、分類モデルＣ２０から出力される出力結果ｙ´と、正解ラベルｙとの誤差（classification loss）が、小さくなるように、分類モデルＣ２０のパラメータを学習する。たとえば、情報処理装置は、誤差逆伝播法を用いて、誤差が小さくなるように、分類モデルＣ２０のパラメータを学習する。

情報処理装置は、分類モデルＣ２０に、入力データｘを入力した場合の、出力結果ｙ´の平均確信度を算出し、平均確信度を用いて、分類モデルＣ２０の劣化を検出する。情報処理装置は、平均確信度が、閾値以下となった場合に、分類モデルＣ２０の劣化を検出する。たとえば、閾値を「０．６」とする。図６に示す例では、情報処理装置は、学習データセット１４１の入力データｘを分類モデルＣ２０に入力した場合の平均確信度を「０．９」とすると、平均確信度が閾値より大きいため、分類モデルＣ２０に劣化が発生していないと判定する。

図７の説明に移行する。情報処理装置は、時刻ｔ４－２において、データセット１４３ａに含まれる入力データｘを、分類モデルＣ２０に入力することで、出力結果ｙ´（分類結果）を取得する処理を繰り返すことで、データセット１４３ａを分類する。図７に示す例では、情報処理装置は、データセット１４３ａの入力データｘを分類モデルＣ２０に入力した場合の平均確信度を「０．９」とすると、平均確信度が閾値より大きいため、分類モデルＣ２０に劣化が発生していないと判定する。

図８の説明に移行する。情報処理装置は、時刻ｔ４－３において、データセット１４３ｂに含まれる入力データｘを、分類モデルＣ２０に入力することで、出力結果ｙ´（分類結果）を取得する処理を繰り返すことで、データセット１４３ｂを分類する。図８に示す例では、情報処理装置は、データセット１４３ｂの入力データｘを分類モデルＣ２０に入力した場合の平均確信度を「０．６」とすると、平均確信度が閾値以下であるため、分類モデルＣ２０に劣化が発生したと判定する。

図９の説明に移行する。情報処理装置は、図９で説明する処理を行うことで、データセット１４３ａの入力データｘ１を、データセット１４３ｂの入力データｘ２にスタイル変換するスタイル変換器Ｔ３１を機械学習する。スタイル変換器Ｔ３１は、エンコーダＥｎ１と、デコーダＤｅ１とを有する。情報処理装置は、スタイル変換器Ｔ３１に加えて、エンコーダＥｎ１´と、デコーダＤｅ１´と、識別器Ｄｉ１とを設定する。

エンコーダＥｎ１，Ｅｎ１´は、入力データを、特徴量空間の特徴量に変換する機械学習モデルである。デコーダＤｅ１，Ｄｅ１´は、特徴量空間の特徴量を、入力データに変換する機械学習モデルである。識別器Ｄｉ１は、入力データが、Ｒｅａｌであるか、Ｆａｋｅであるかを識別する機械学習モデルである。たとえば、識別器Ｄｉ１は、入力データが、データセット１４３ｂの入力データであると判定した場合に「Ｒｅａｌ」を出力し、データセット１４３ｂ以外の入力データであると判定した場合に「Ｆａｋｅ」を出力する。エンコーダＥｎ１，Ｅｎ１´、デコーダＤｅ１，Ｄｅ１´、識別器Ｄｉ１は、ＮＮ等の機械学習モデルである。

スタイル変換器Ｔ３１は、データセット１４３ａの入力データｘ１が入力され、ｘ２´を出力する。ｘ２´は、エンコーダＥｎ１´に入力されて特徴量に変換された後、デコーダＤｅ１´によって、ｘ２´´に変換される。

識別器Ｄｉ１は、スタイル変換器Ｔ３１から出力されたｘ２´、または、データセット１４３ｂの入力データｘ２の入力を受け付けた場合に、入力されたデータが、データセット１４３ｂの入力データであるか否かに応じて、ＲｅａｌまたはＦａｋｅを出力する。

情報処理装置は、図９の入力データ「ｘ１」と、出力データ「ｘ２´´」との誤差が小さくなり、かつ、出力データｘ２´が、識別器Ｄｉ１に入力された場合に、識別器Ｄｉ１によって、「Ｒｅａｌ」が出力されるように、エンコーダＥｎ１，Ｅｎ１´、デコーダＤｅ１，Ｄｅ１´、識別器Ｄｉ１のパラメータを機械学習する。情報処理装置が、係る機械学習を実行することで、データセット１４３ａの入力データｘ１を、データセット１４３ｂの入力データｘ２にスタイル変換するスタイル変換器Ｔ３１が機械学習される。たとえば、情報処理装置は、誤差逆伝播法を用いて、誤差が小さくなるように、各パラメータを機械学習する。

図１０の説明に移行する。情報処理装置は、図１０で説明する処理を行うことで、学習データセット１４５ａを生成する。情報処理装置は、データセット１４３ａの入力データｘ１を、スタイル変換器Ｔ３１に入力することで、入力データｘ１を、入力データｘ２´にスタイル変換する。情報処理装置は、入力データｘ１を、分類モデルＣ２０に入力した場合の分類結果を基にして、推定ラベル（正解ラベル）ｙ´を特定する。

情報処理装置は、入力データｘ２´と、正解ラベルｙ´との組を、学習データセット１４５ａに登録する。情報処理装置は、データセット１４３ａに含まれる各入力データｘについて、上記処理を繰り返し実行することで、学習データセット１４５ａを生成する。

図１１の説明に移行する。情報処理装置は、図１１で説明する処理を行うことで、分類モデルＣ２０の再学習を行う。情報処理装置は、正解ラベル付きの学習データセット１４５ａを用いて、分類モデルＣ２０の機械学習を再度、実行する。学習データセット１４５ａには、入力データｘと、正解ラベルｙとの組が複数含まれている。

情報処理装置は、入力データｘを分類モデルＣ２０に入力することで、分類モデルＣ２０９から出力される出力結果ｙ´と、正解ラベルｙとの誤差（classification loss）が、小さくなるように、分類モデルＣ２０のパラメータを再学習する。たとえば、情報処理装置は、誤差逆伝播法を用いて、誤差が小さくなるように、分類モデルＣ２０のパラメータを学習する。

情報処理装置は、分類モデルＣ２０に、入力データｘを入力した場合の、出力結果ｙ´の平均確信度を算出し、平均確信度を用いて、分類モデルＣ２０の劣化を検出する。情報処理装置は、平均確信度が、閾値以下となった場合に、分類モデルＣ２０の劣化を検出する。図１１に示す例では、情報処理装置は、学習データセット１４５ａの入力データｘを分類モデルＣ２０に入力した場合の平均確信度を「０．９」とすると、平均確信度が閾値より大きいため、分類モデルＣ２０に劣化が発生していないと判定する。

図１２の説明に移行する。情報処理装置は、時刻ｔ４－４において、データセット１４３ｃに含まれる入力データｘ３を、分類モデルＣ２０に入力することで、出力結果（分類結果）を取得する処理を繰り返すことで、データセット１４３ｃを分類する。たとえば、情報処理装置は、データセット１４３ｃの入力データｘ３を分類モデルＣ２０に入力した場合の平均確信度を「０．６」とすると、平均確信度が閾値以下であるため、分類モデルＣ２０に劣化が発生したと判定する。

情報処理装置は、データセット１４３ｃによって、再度、分類モデルＣ２０の劣化を検出すると、データセット１４３ｂからデータセット１４３ｃへの変化が、スタイル変換器Ｔ３１によるスタイル変化に類似した変化か否かを、次の処理により判定する。情報処理装置は、データセット１４３ｂの入力データｘ２を、スタイル変換器Ｔ３１に入力することで、変換データｘ２´にスタイル変換する。

情報処理装置は、変換データｘ２´を、分類モデルＣ２０に入力することで、出力ラベルｙ２´が出力される。出力ラベルｙ２´の分布を、分布ｄｉｓ１－１とする。情報処理装置は、データセット１４３ｃの入力データｘ３を、分類モデルＣ２０に入力することで、出力ラベルｙ３´が出力される。出力ラベルｙ３´の分布を、分布ｄｉｓ１－２とする。

情報処理装置は、分布ｄｉｓ１－１と、分布ｄｉｓ１－２との差が閾値以上であり、不一致であると判定する。すなわち、情報処理装置は、データセット１４３ｂからデータセット１４３ｃへの変化が、スタイル変換器Ｔ３１によるスタイル変化に類似した変化ではないと判定する。

図１３の説明に移行する。情報処理装置は、データセット１４３ｂの入力データを、データセット１４３ｃの入力データにスタイル変換するスタイル変換器Ｔ３２を機械学習する。スタイル変換器Ｔ３２を機械学習する処理は、図９で説明したスタイル学習Ｔ３１を機械学習する処理と同様である。スタイル変換器Ｔ３２は、エンコーダＥｎ２と、デコーダＤｅ２とを有する。

情報処理装置は、次の処理を実行することで、学習データセット１４５ｂを生成する。情報処理装置は、データセット１４３ｂの入力データｘ２を、スタイル変換器Ｔ３２に入力することで、入力データｘ２を、入力データｘ３´にスタイル変換する。情報処理装置は、入力データｘ２を、分類モデルＣ２０に入力した場合の分類結果を基にして、推定ラベル（正解ラベル）ｙ´を特定する。

情報処理装置は、入力データｘ３´と、正解ラベルｙ´との組を、学習データセット１４５ｂに登録する。情報処理装置は、データセット１４３ｂに含まれる各入力データｘについて、上記処理を繰り返し実行することで、学習データセット１４５ｂを生成する。

図１４の説明に移行する。情報処理装置は、図１４に示す処理を実行することで、学習データセット１４５ｃを生成する。情報処理装置は、スタイル変換器Ｔ３２から出力されるデータｘ３´を、入力データとして、スタイル変換器Ｔ３１に入力することで、出力データｘ３´´を得る。データｘ３´は、データセット１４３ｂの入力データｘ２を、スタイル変換器Ｔ３２に入力することで算出されるデータである。

情報処理装置は、入力データｘ２を、分類モデルＣ２０に入力した場合の分類結果を基にして、推定ラベル（正解ラベル）ｙ´を特定する。

情報処理装置は、入力データｘ３´´と、正解ラベルｙ´との組を、学習データセット１４５ｃに登録する。情報処理装置は、データセット１４３ｂに含まれる各入力データｘについて、上記処理を繰り返し実行することで、学習データセット１４５ｃを生成する。なお、学習データセット１４５ｂを生成する処理は、図１３で説明した。

図１５の説明に移行する。情報処理装置は、図１５で説明する処理を行うことで、分類モデルＣ２０の再学習を行う。情報処理装置は、正解ラベル付きの学習データセット１４５ｂ，１４５ｃを用いて、分類モデルＣ２０の機械学習を再度、実行する。学習データセット１４５ｂ，１４５ｃには、入力データｘと、正解ラベルｙとの組が複数含まれている。

情報処理装置は、分類モデルＣ２０に、入力データｘを入力した場合の、出力結果ｙ´の平均確信度を算出し、平均確信度を用いて、分類モデルＣ２０の劣化を検出する。情報処理装置は、平均確信度が、閾値以下となった場合に、分類モデルＣ２０の劣化を検出する。図１５に示す例では、情報処理装置は、学習データセット１４５ｂ，１４５ｃの入力データｘを分類モデルＣ２０に入力した場合の平均確信度を「０．９」とすると、平均確信度が閾値より大きいため、分類モデルＣ２０に劣化が発生していないと判定する。

図１６の説明に移行する。情報処理装置は、時刻ｔ４－５において、データセット１４３ｄに含まれる入力データｘ４を、分類モデルＣ２０に入力することで、出力結果（分類結果）を取得する処理を繰り返すことで、データセット１４３ｄを分類する。たとえば、情報処理装置は、データセット１４３ｄの入力データｘ４を分類モデルＣ２０に入力した場合の平均確信度を「０．６」とすると、平均確信度が閾値以下であるため、分類モデルＣ２０に劣化が発生したと判定する。

情報処理装置は、データセット１４３ｄによって、再度、分類モデルＣ２０の劣化を検出すると、データセット１４３ｃからデータセット１４３ｄへの変化が、スタイル変換器Ｔ３１またはスタイル変換器Ｔ３２によるスタイル変化に類似した変化か否かを、次の処理により判定する。情報処理装置は、データセット１４３ｃの入力データｘ２を、スタイル変換器Ｔ３１，Ｔ３２に入力することで、変換データｘ３´，ｘ３´´にスタイル変換する。

情報処理装置は、変換データｘ３´を、分類モデルＣ２０に入力することで、出力ラベルｙ３´が出力される。出力ラベルｙ３´の分布を、分布ｄｉｓ２－１とする。情報処理装置は、変換データｘ３´´を、分類モデルＣ２０に入力することで、出力ラベルｙ３´´が出力される。出力ラベルｙ３´´の分布を、分布ｄｉｓ２－２とする。情報処理装置は、データセット１４３ｄの入力データｘ４を、分類モデルＣ２０に入力することで、出力ラベルｙ４´が出力される。出力ラベルｙ４´の分布を、分布ｄｉｓ２－３とする。

情報処理装置は、分布ｄｉｓ２－３と、分布ｄｉｓ２－２との差が閾値以上であり、不一致であると判定する。すなわち、情報処理装置は、データセット１４３ｃからデータセット１４３ｄへの変化が、スタイル変換器Ｔ３２によるスタイル変化に類似した変化ではないと判定する。

一方、情報処理装置は、分布ｄｉｓ２－３と、分布ｄｉｓ２－１との差が閾値以上であり、一致すると判定する。すなわち、情報処理装置は、データセット１４３ｃからデータセット１４３ｄへの変化が、スタイル変換器Ｔ３１によるスタイル変化に類似した変化である判定する。この場合、情報処理装置は、新たなスタイル変換器を生成しないで、スタイル変換器Ｔ３１を再利用する。

図１７の説明に移行する。情報処理装置は、図１６で説明したように、データセット１４３ｃの入力データを、データセット１４３ｄの入力データにスタイル変換するスタイル変換器として、スタイル変換器Ｔ３１を流用する。

情報処理装置は、次の処理を実行することで、学習データセット１４５ｄを生成する。情報処理装置は、データセット１４３ｃの入力データｘ３を、スタイル変換器Ｔ３１に入力することで、入力データｘ３を、入力データｘ４´にスタイル変換する。情報処理装置は、入力データｘ３を、分類モデルＣ２０に入力した場合の分類結果を基にして、推定ラベル（正解ラベル）ｙ´を特定する。

情報処理装置は、入力データｘ４´と、正解ラベルｙ´との組を、学習データセット１４５ｄに登録する。情報処理装置は、データセット１４３ｃに含まれる各入力データｘについて、上記処理を繰り返し実行することで、学習データセット１４５ｄを生成する。図示を省略するが、情報処理装置は、学習データセット１４５ｄを用いて、分類モデルＣ２０を再学習する。

上記のように、本実施例に係る情報処理装置は、分類モデルの劣化を検出した場合に、すでに学習済みのスタイル変換器のうち、劣化検出前のデータから、劣化検出後のデータにスタイル変換可能なスタイル変換器が存在するか否かを判定する。情報処理装置は、劣化検出前のデータから、劣化検出後のデータにスタイル変換可能なスタイル変換器が存在する場合には、かかるスタイル変換器を流用して、学習データセットを生成し、分類モデルの再学習を実行する。これによって、分類モデルの劣化を検出するたびに、スタイル変換器を学習する処理を抑止できるので、ドメインシフトに対応するための再学習に要するコストを削減することができる。

図１８は、本実施例に係る情報処理装置の効果を説明するための図である。参考技術では、分類モデルの劣化を検出するたびに、スタイル変換器の学習、および、分類モデルの再学習を実行するが、情報処理装置では、スタイル変換器を流用する。これによって、劣化が検出された場合のスタイル変換器の学習回数が減るため、システムの再開までの時間を短縮することができる。

また、情報処理装置は、使用回数の多いスタイル変換器を更に用いて、入力データのスタイル変換を実行し、学習データセットに追加する。これにより、よく起こるドメインシフトに対して劣化を起こさない分類モデルが学習されるため、再学習した分類モデルの劣化が発生しにくくなる。

次に、本実施例に係る情報処理装置の構成の一例について説明する。図１９は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図１９に示すように、この情報処理装置は、通信部１１０と、入力部１２０と、出力部１３０と、記憶部１４０と、制御部１５０とを有する。

通信部１１０は、ＮＩＣ（Network Interface Card）等で実現され、ＬＡＮ（Local Area Network）やインターネットなどの電気通信回線を介した外部の装置と制御部１５０との通信を制御する。

入力部１２０は、キーボードやマウス等の入力デバイスを用いて実現され、利用者による入力操作に対応して、制御部１５０に対して処理開始などの各種指示情報を入力する。

出力部１３０は、液晶ディスプレイなどの表示装置、プリンター等の印刷装置等によって実現される。

記憶部１４０は、学習データセット１４１、分類モデルデータ１４２、データセットテーブル１４３、スタイル変換器テーブル１４４、学習データセットテーブル１４５を有する。記憶部１４０は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ（Flash Memory）などの半導体メモリ素子や、ＨＤＤ（Hard Disk Drive）などの記憶装置に対応する。

学習データセット１４１は、分類モデルＣ２０の機械学習に使用するラベル付きのデータセットである。図２０は、学習データセットのデータ構造の一例を示す図である。図２０に示すように、この学習データセット１４１は、入力データと、正解ラベルとを対応付ける。入力データは、画像データ、音声データ、テキストデータ等の各種の情報に対応する。本実施例では一例として、入力データを、画像データとして説明するが、これに限定されるものではない。正解ラベルは、入力データに対してあらかじめ設定されるラベルである。たとえば、正解ラベルとして、所定の分類クラスが設定される。

分類モデルデータ１４２は、分類モデルＣ２０のデータである。たとえば、分類モデルＣ２０は、ニューラルネットワークの構造を有し、入力層、隠れ層、出力層を持つ。入力層、隠れ層、出力層は、複数のノードがエッジで結ばれる構造となっている。隠れ層、出力層は、活性化関数と呼ばれる関数とバイアス値とを持ち、エッジには、重みが設定される。以下の説明では、バイアス値および重みを「パラメータ」と表記する。

データセットテーブル１４３は、複数のデータセットを保持するテーブルである。データセットテーブル１４３に含まれるデータセットは、異なる時刻（時期）に収集されたデータセットである。図２１は、データセットテーブルのデータ構造の一例を示す図である。図２１に示すように、データセットテーブル１４３は、データセット識別情報と、データセットとを対応付ける。

データセット識別情報は、データセットを識別する情報である。データセットには、複数の入力データが含まれる。

以下の説明では、データセット識別情報「Ｄａ１４３ａ」のデータセットを、データセット１４３ａと表記する。データセット識別情報「Ｄａ１４３ｂ」のデータセットを、データセット１４３ｂと表記する。データセット識別情報「Ｄａ１４３ｃ」のデータセットを、データセット１４３ｃと表記する。データセット識別情報「Ｄａ１４３ｄ」のデータセットを、データセット１４３ｄと表記する。たとえば、データセット１４３ａ～１４３ｄは、異なる時刻に生成されたデータセットであり、データセット１４３ａ，１４３ｂ，１４３ｃ，１４３ｄの順にデータセットテーブル１４３に登録されるものとする。

スタイル変換器テーブル１４４は、複数のスタイル変換器のデータを保持するテーブルである。図２２は、スタイル変換器テーブルのデータ構造の一例を示す図である。図２２に示すように、スタイル変換器テーブル１４４は、スタイル変換器識別情報と、スタイル変換器と、選択履歴とを対応付ける。

スタイル変換器識別情報は、スタイル変換器を識別する情報である。スタイル変換器は、スタイル変換器のデータであり、エンコーダと、デコーダとを有する。エンコーダは、入力データ（画像データ）を特徴空間の特徴量に変換（射影）するモデルである。デコーダは、特徴空間の特徴量を、画像データに変換するモデルである。

たとえば、エンコーダおよびデコーダは、ニューラルネットワークの構造を有し、入力層、隠れ層、出力層を持つ。入力層、隠れ層、出力層は、複数のノードがエッジで結ばれる構造となっている。隠れ層、出力層は、活性化関数と呼ばれる関数とバイアス値とを持ち、エッジには、重みが設定される。

以下の説明では、スタイル変換器識別情報「ＳＴ３１」のスタイル変換器を、スタイル変換器Ｔ３１と表記する。スタイル変換器識別情報「ＳＴ３２」のスタイル変換器を、スタイル変換器Ｔ３２と表記する。

選択履歴は、スタイル変換器が選択された日時のログである。選択履歴を用いることで、所定時間前から現在までにスタイル変換器が選択された回数を特定することができる。所定時間前から現在までにスタイル変換器が選択された回数を「直近の選択回数」と表記する。

学習データセットテーブル１４５は、複数の学習データセットを保持するテーブルである。図２３は、学習データセットテーブルのデータ構造の一例を示す図である。図２３に示すように、学習データセットテーブル１４５は、学習データセット識別情報と、学習データセットとを対応付ける。

学習データセット識別情報は、学習データセットを識別する情報である。学習データセットは、それぞれ、入力データと、正解ラベルとの組を複数有する。図１０等で説明したように、学習データセットテーブル１４５に含まれる各学習データセットの正解ラベルは、分類モデルＣ２０を用いて推定された推定ラベルに対応する。

図１９の説明に戻る。制御部１５０は、取得部１５１と、学習部１５２と、分類部１５３と、選択部１５４と、生成部１５５と、前処理部１５６とを有する。制御部１５０は、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）などによって実現できる。また、制御部１５０は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などのハードワイヤードロジックによっても実現できる。

取得部１５１は、外部装置等から各種のデータを取得する処理部である。取得部１５１は、外部装置等から、学習データセット１４１を受信した場合、受信した学習データセット１４１を、記憶部１４０に格納する。取得部１５１は、外部装置等から、データセットを取得する度に、取得したデータセットを、データセットテーブル１４３に登録する。たとえば、取得部１５１は、データセットを定期的に取得する。

学習部１５２は、学習データセット１４１を基にして、分類モデルの機械学習を実行する処理部である。図６等で説明したように、学習部１５２は、入力データｘを分類モデルＣ２０に入力することで、分類モデルＣ２０から出力される出力結果ｙ´と、正解ラベルｙとの誤差（classification loss）が、小さくなるように、分類モデルＣ２０のパラメータを学習（訓練）する。たとえば、学習部１５２は、誤差逆伝播法を用いて、誤差が小さくなるように、分類モデルＣ２０のパラメータを学習する。学習部１５２は、学習した分類モデルＣ２０のデータを、分類モデルデータ１４２として、記憶部１４０に登録する。

学習部１５２は、前処理部１５６から、再学習要求を受け付けた場合、学習データセットテーブル１４５に含まれる学習データセットを用いて、分類モデルＣ２０の再学習を実行する。学習部１５２は、再学習した分類モデルＣ２０のデータによって、分類モデルデータ１４２を更新する。

分類部１５３は、データセットテーブル１４３に登録されたデータセットを、分類モデルＣ２０を用いて分類する処理部である。図７等で説明したように、分類部１５３は、データセット（たとえば、データセット１４３ａ）に含まれる入力データｘを、分類モデルＣ２０に入力することで、出力結果ｙ´（分類結果）を取得する処理を繰り返すことで、データセットを分類する。分類部１５３は、データセットの分類結果を、出力部１３０に出力してもよい。

分類部１５３は、データセットの分類を行う場合に、出力結果ｙ´の平均確信度を算出する。分類部１５３は、平均確信度が、閾値Ｔｈ１以下である場合に、分類モデルＣ２０の劣化を検出する。たとえば、閾値Ｔｈ１を、０．６とする。分類部１５３は、分類モデルＣ２０の劣化を検出した場合には、劣化を検出した旨の情報を、選択部１５４に出力する。

選択部１５４は、分類部１５３から分類モデルＣ２０の劣化を検出した旨の情報を取得した場合に、スタイル変換器テーブル１４４に含まれる複数のスタイル変換器から、スタイル変換器を選択する処理部である。

選択部１５４の処理を、図１６を用いて説明する。スタイル変換器テーブル１４４には、スタイル変換器Ｔ３１と、スタイル変換器Ｔ３２が含まれているものとする。また、データセット１４３ｄを、分類モデルＣ２０に適用した場合に、劣化が検出されたものとする。

選択部１５４は、データセット１４３ｃからデータセット１４３ｄへの変化が、スタイル変換器Ｔ３１またはスタイル変換器Ｔ３２によるスタイル変化に類似した変化か否かを、次の処理により判定する。選択部１５４は、データセット１４３ｃの入力データｘ２を、スタイル変換器Ｔ３１，Ｔ３２に入力することで、変換データｘ３´，ｘ３´´にスタイル変換する。

選択部１５４は、変換データｘ３´を、分類モデルＣ２０に入力することで、出力ラベルｙ３´が出力される。出力ラベルｙ３´の分布を、分布ｄｉｓ２－１とする。選択部１５４は、変換データｘ３´´を、分類モデルＣ２０に入力することで、出力ラベルｙ３´´が出力される。出力ラベルｙ３´´の分布を、分布ｄｉｓ２－２とする。選択部１５４は、データセット１４３ｄの入力データｘ４を、分類モデルＣ２０に入力することで、出力ラベルｙ４´が出力される。出力ラベルｙ４´の分布を、分布ｄｉｓ２－３とする。

選択部１５４は、分布ｄｉｓ２－３と、分布ｄｉｓ２－１との類似度、分布ｄｉｓ２－３と、分布ｄｉｓ２－２との類似度を算出する。選択部１５４は、各分布の差が小さいほど、類似度の値を大きくする。選択部１５４は、分布ｄｉｓ２－３と、分布ｄｉｓ２－２との類似度が閾値Ｔｈ２未満であるため、分布ｄｉｓ２－２に対応するスタイル変換器Ｔ３２を、選択対象から除外する。

一方、選択部１５４は、分布ｄｉｓ２－３と、分布ｄｉｓ２－１との類似度が閾値Ｔｈ２以上であるため、分布ｄｉｓ２－１に対応するスタイル変換器Ｔ３１を選択する。選択部１５４は、選択したスタイル変換器Ｔ３１を、前処理部１５６に出力する。選択部１５４は、選択したスタイル変換器Ｔ３１に対応する選択履歴を、スタイル変換器テーブル１４４に登録する。選択部１５４は、図示しないタイマから、現在の日付の情報を取得し、選択履歴に設定する。

選択部１５４は、類似度が閾値以上となるスタイル変換器が、スタイル変換器テーブル１４４に存在しない場合には、スタイル変換器の作成要求を、生成部１５５に出力する。

ところで、選択部１５４は、スタイル変換器テーブル１４４の選択履歴を基にして、直近の選択回数が、所定回数以上となるスタイル変換器を追加で選択してもよい。選択部１５４は、追加で選択したスタイル変換器の情報を、前処理部１５６に出力する。

生成部１５５は、選択部１５４から、スタイル変換器の作成要求を取得した場合に、スタイル変換器を作成する処理部である。生成部１５５は、作成したスタイル変換器の情報を、スタイル変換器テーブル１４４に登録する。また、生成部１５５は、スタイル変換器の情報を、前処理部１５６に出力する。

生成部１５５の処理を、図９を用いて説明する。生成部１５５は、スタイル変換器Ｔ３１と、エンコーダＥｎ１´、デコーダＤｅ１´、識別器Ｄｉ１を設定する。たとえば、生成部１５５は、スタイル変換器Ｔ３１のエンコーダＥｎ１、デコーダＤｅ１、エンコーダＥｎ１´、デコーダＤｅ１´、識別器Ｄｉ１のパラメータをそれぞれ初期値に設定し、次の処理を実行する。

生成部１５５が、スタイル変換器Ｔ３１に、データセット１４３ａの入力データｘ１を入力することで、ｘ２´を出力させる。ｘ２´は、エンコーダＥｎ１´に入力されて特徴量に変換された後、デコーダＤｅ１´によって、ｘ２´´に変換される。

識別器Ｄｉ１は、スタイル変換器Ｔ３１から出力されたｘ２´、または、データセット１４３ｂの入力データｘ２の入力を受け付け、入力されたデータが、データセット１４３ｂの入力データであるか否かに応じて、ＲｅａｌまたはＦａｋｅを出力する。

生成部１５５は、図９の入力データ「ｘ１」と、出力データ「ｘ２´´」との誤差が小さくなり、かつ、出力データｘ２´が、識別器Ｄｉ１に入力された場合に、識別器Ｄｉ１によって、「Ｒｅａｌ」が出力されるように、エンコーダＥｎ１，Ｅｎ１´、デコーダＤｅ１，Ｄｅ１´、識別器Ｄｉ１のパラメータを機械学習する。生成部１５５が、係る機械学習を実行することで、データセット１４３ａの入力データｘ１を、データセット１４３ｂの入力データｘ２にスタイル変換するスタイル変換器Ｔ３１が機械学習（生成）する。たとえば、生成部１５５は、誤差逆伝播法を用いて、誤差が小さくなるように、各パラメータを機械学習する。

前処理部１５６は、選択部１５４によって選択されたスタイル変換器を用いて、劣化前データを、劣化後データにスタイル変換する処理部である。前処理部１５６は、劣化前データを、分類モデルＣ２０に入力して、劣化後データの正解ラベルを推定する。選択部１５４は、上記処理を繰り返すことで、学習データセットを生成し、学習データセットを、学習データセットテーブル１４５に登録する。

前処理部１５６は、生成部１５５から、新たなスタイル変換器の情報を取得した場合には、かかるスタイル変換器を用いて、学習データセットを生成する。たとえば、前処理部１５６は、劣化前データを、新たなスタイル変換器に入力して、劣化後データにスタイル変換する。前処理部１５６は、劣化前データを、分類モデルＣ２０に入力して、劣化後データの正解ラベルを推定する。

前処理部１５６の処理を、図１０を用いて説明する。一例として、選択部１５４によって、スタイル変換器Ｔ３１が選択されたものとする。前処理部１５６は、データセット１４３ａの入力データｘ１を、スタイル変換器Ｔ３１に入力することで、入力データｘ１を、入力データｘ２´にスタイル変換する。前処理部１５６は、入力データｘ１を、分類モデルＣ２０に入力した場合の分類結果を基にして、推定ラベル（正解ラベル）ｙ´を特定する。

前処理部１５６は、入力データｘ２´と、正解ラベルｙ´との組を、学習データセット１４５ａに登録する。前処理部１５６は、データセット１４３ａに含まれる各入力データｘについて、上記処理を繰り返し実行することで、学習データセット１４５ａを生成する。

ところで、前処理部１５６は、選択部１５４によって、追加でスタイル変換器が選択されている場合には、複数のスタイル変換器を用いて、複数の学習データセットを生成する。

前処理部１５６の処理を、図１４を用いて説明する。図１４では、選択部１５４によって、類似度に基づいて選択されたスタイル変換器を、スタイル変換器Ｔ３２とする。選択部１５４によって、直近の選択回数に基づいて追加で選択されたスタイル変換器を、スタイル変換器Ｔ３１とする。

まず、前処理部１５６は、データセット１４３ｂの入力データｘ２を、スタイル変換器Ｔ３２に入力することで、入力データｘ２を、入力データｘ３´にスタイル変換する。前処理部１５６は、入力データｘ２を、分類モデルＣ２０に入力した場合の分類結果を基にして、推定ラベル（正解ラベル）ｙ´を特定する。

前処理部１５６は、入力データｘ３´と、正解ラベルｙ´との組を、学習データセット１４５ｂに登録する。前処理部１５６は、データセット１４３ｂに含まれる各入力データｘについて、上記処理を繰り返し実行することで、学習データセット１４５ｂを生成する。

前処理部１５６は、スタイル変換器Ｔ３２から出力されるデータｘ３´を、入力データとして、スタイル変換器Ｔ３１に入力することで、出力データｘ３´´を得る。データｘ３´は、データセット１４３ｂの入力データｘ２を、スタイル変換器Ｔ３２に入力することで算出されるデータである。

前処理部１５６は、入力データｘ２を、分類モデルＣ２０に入力した場合の分類結果を基にして、推定ラベル（正解ラベル）ｙ´を特定する。

前処理部１５６は、入力データｘ３´´と、正解ラベルｙ´との組を、学習データセット１４５ｃに登録する。前処理部１５６は、データセット１４３ｂに含まれる各入力データｘについて、上記処理を繰り返し実行することで、学習データセット１４５ｃを生成する。

前処理部１５６は、上記の処理を実行することで、学習データセットを生成し、学習データセットテーブル１４５に登録する。また、前処理部１５６は、学習部１５２に対して、再学習要求を出力する。再学習要求には、再学習で使用する学習データセット識別情報が設定される。たとえば、前処理部１５６は、図１４の処理を実行して、学習データセット１４５ｂ，１４５ｃを生成した場合には、学習データセット１４５ｂ，１４５ｃを識別する学習データセット識別情報を、再学習要求に設定する。これによって、学習部１５２は、学習データセット１４５ｂ，１４５ｃを用いて、分類モデルＣ２０を再学習する。

次に、本実施例に係る情報処理装置１００の処理手順の一例について説明する。図２４は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。図２４に示すように、情報処理装置１００の学習部１５２は、学習データセット１４１を基にして、分類モデルの機械学習を実行する（ステップＳ１０１）。

情報処理装置１００の分類部１５３は、分類モデルにデータを入力し、平均確信度を算出する（ステップＳ１０２）。分類部１５３は劣化を検出しない場合には（ステップＳ１０３，Ｎｏ）、ステップＳ１１１に移行する。

一方、分類部１５３は、劣化を検出した場合には（ステップＳ１０３，Ｙｅｓ）、ステップＳ１０４に移行する。情報処理装置１００の選択部１５４は、ドメイン変化と同等のスタイル変換器が存在する場合には（ステップＳ１０４，Ｙｅｓ）、ステップＳ１０５に移行する。選択部１５４は、ドメイン変化と同等のスタイル変換器を選択する。情報処理装置１００の前処理部１５６は、選択されたスタイル変換器で、学習データセットを生成し（ステップＳ１０５）、ステップＳ１０８に移行する。

一方、選択部１５４は、ドメイン変化と同等のスタイル変換器が存在しない場合には（ステップＳ１０４，Ｎｏ）、ステップＳ１０６に移行する。情報処理装置１００の生成部１５５は、スタイル変換器を学習して、スタイル変換器テーブル１４４に保存する（ステップＳ１０６）。前処理部１５６は、生成されたスタイル変換器で、学習データセットを生成する（ステップＳ１０７）。

選択部１５４は、直近の選択回数が所定回数以上のスタイル変換器が存在しない場合には（ステップＳ１０８，Ｎｏ）、ステップＳ１１０に移行する。一方、選択部１５４は、直近の選択回数が所定回数以上のスタイル変換器が存在する場合には（ステップＳ１０８，Ｙｅｓ）、ステップＳ１０９に移行する。

前処理部１５６は、変換後のデータを、再度スタイル変換器で変換し、学習データを追加する（ステップＳ１０９）。学習部１５２は、生成された学習データセットを基にして、分類モデルを再学習する（ステップＳ１１０）。

情報処理装置１００は、次のデータが存在する場合には（ステップＳ１１１，Ｙｅｓ）、ステップＳ１０２に移行する。一方、情報処理装置１００は、次のデータが存在しない場合には（ステップＳ１１１，Ｎｏ）、処理を終了する。

次に、本実施例に係る情報処理装置１００の効果について説明する。情報処理装置１００は、分類モデルの劣化が発生した場合に、劣化前から劣化後へのドメイン変化を再現可能なスタイル変換器を、複数のスタイル変換器から選択し、選択したスタイル変換器を再利用して、劣化前のデータを、劣化後のデータに変換して、前処理を行う。これによって、分類モデルの劣化が発生する度に、スタイル変換器を生成することを抑止し、スタイル変換器の学習回数を削減することができる。学習回数を削減することで、分類モデルを用いるシステムを再開させるまでの時間を短縮することができる。また、ドメインシフトに対応するための再学習に要するコストを削減することができる。

情報処理装置１００は、劣化前のデータを分類モデルに入力することで、正解ラベルを特定し、劣化前のデータをスタイル変換器に入力することで、変換データを生成する。情報処理装置１００は、正解ラベルと変換データとを対応付けることで、学習データを生成する。かかる学習データを用いることで、分類モデルの再学習を実行することができる。

情報処理装置１００は、図４、図５で説明したように、複数のスタイル変換器を選択した場合には、複数のスタイル変換器を用いて、複数の変換データを生成し、分類モデルの学習データに用いる。これによって、学習データのバリエーションを増やして、分類モデルの機械学習を実行できるので、分類モデルの精度劣化を抑止できる。すなわち、再学習により、分類モデルを用いるシステムを停止しにくくすることができる。

情報処理装置１００は、分類モデルの劣化が発生した場合に、劣化前から劣化後へのドメイン変化を再現可能なスタイル変換器が存在しない場合には、新たなスタイル変換器を生成する。これによって、劣化前から劣化後へのドメイン変化を再現可能なスタイル変換器が存在しない場合でも、分類モデルの再学習に対応することができる。

情報処理装置１００は、学習データセットに登録された学習データセットを用いて、分類モデルの再学習を実行する。これによって、ドメインシフトが発生しても、かかるドメインシフトに対応可能な分類モデルを再学習して利用することができる。

ところで、本実施例に係る情報処理装置１００の選択部１５４は、図３で説明したポイント２を基にして、流用するスタイル変換器を選択していたが、これに限定されるものではない。たとえば、選択部１５４は、図２５に示す処理を行って、流用するスタイル変換器を選択してもよい。

図２５は、選択部のその他の処理を説明するための図である。図２５では、一例として、複数の分類モデルＣ２０－１，Ｃ２０－２，Ｃ２０－３，Ｃ２０－４が存在するものとする。すなわち、システムで、複数の分類モデルが利用されている。また、スタイル変換器Ｔ３１，Ｔ３２，Ｔ３３が存在するものとする。選択部１５４は、劣化後データｄ４によって、分類モデルＣ２０－３，Ｃ２０－４の劣化が検出されたものとする。

選択部１５４は、劣化後データｄ４を、スタイル変換器Ｔ３１に入力して、変換データｄ４－１にスタイル変換する。選択部１５４は、劣化後データｄ４を、スタイル変換器Ｔ３２に入力して、変換データｄ４－２にスタイル変換する。選択部１５４は、スタイル変換器Ｔ３３に入力して、変換データｄ４－３にスタイル変換する。

選択部１５４は、変換データｄ４－１を、分類モデルＣ２０－１～Ｃ２０－４に入力して、劣化が検出されるか否かを判定する。たとえば、変換データｄ４－１によって、分類モデルＣ２０－１，Ｃ２０－３によって、劣化が検出されたものとする。

選択部１５４は、変換データｄ４－２を、分類モデルＣ２０－１～Ｃ２０－４に入力して、劣化が検出されるか否かを判定する。たとえば、変換データｄ４－２によって、分類モデルＣ２０－３，Ｃ２０－４によって、劣化が検出されたものとする。

選択部１５４は、変換データｄ４－２を、分類モデルＣ２０－１～Ｃ２０－４に入力して、劣化が検出されるか否かを判定する。たとえば、変換データｄ４－３によって、分類モデルＣ２０－４によって、劣化が検出されたものとする。

ここで、劣化後データｄ４を分類モデルＣ２０－１～Ｃ２０－４に入力した際の劣化検出の結果と、変換データｄ４－３を分類モデルＣ２０－１～Ｃ２０－４に入力した際の劣化検出の結果とが一致する。このため、選択部１５４は、スタイル変換器Ｔ３２を、流用するスタイル変換器として選択する。これによって、流用可能なスタイル変換器を選択することができる。

次に、本実施例に示した情報処理装置１００と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図２６は、本実施例に係る情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

図２６に示すように、コンピュータ３００は、各種演算処理を実行するＣＰＵ２０１と、ユーザからのデータの入力を受け付ける入力装置２０２と、ディスプレイ２０３とを有する。また、コンピュータ２００は、記憶媒体からプログラム等を読み取る読み取り装置２０４と、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行うインタフェース装置２０５とを有する。コンピュータ２００は、各種情報を一時記憶するＲＡＭ２０６と、ハードディスク装置２０７とを有する。そして、各装置２０１～２０７は、バス２０８に接続される。

ハードディスク装置２０７は、取得プログラム２０７ａ、学習プログラム２０７ｂ、分類プログラム２０７ｃ、選択プログラム２０７ｄ、生成プログラム２０７ｅ、前処理プログラム２０７ｆを有する。ＣＰＵ３０１は、取得プログラム２０７ａ、学習プログラム２０７ｂ、分類プログラム２０７ｃ、選択プログラム２０７ｄ、生成プログラム２０７ｅ、前処理プログラム２０７ｆを読み出してＲＡＭ３０６に展開する。

取得プログラム２０７ａは、取得プロセス２０６ａとして機能する。学習プログラム２０７ｂは、学習プロセス２０６ｂとして機能する。分類プログラム２０７ｃは、分類プロセス２０６ｃとして機能する。選択プログラム２０７ｄは、選択プロセス２０６ｄとして機能する。生成プログラム２０７ｅは、生成プロセス２０６ｅとして機能する。前処理プログラム２０７ｆは、前処理プロセス２０６ｆとして機能する。

取得プロセス２０６ａの処理は、取得部１５１の処理に対応する。学習プロセス２０６ｂの処理は、学習部１５２の処理に対応する。分類プロセス２０６ｃの処理は、分類部１５３の処理に対応する。選択プロセス２０６ｄの処理は、選択部１５４の処理に対応する。生成プロセス２０６ｅの処理は、生成部１５５の処理に対応する。前処理プロセス２０６ｆの処理は、前処理部１５６の処理に対応する。

なお、各プログラム２０７ａ～２０７ｆについては、必ずしも最初からハードディスク装置２０７に記憶させておかなくてもよい。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ２００が各プログラム２０７ａ～２０７ｄを読み出して実行するようにしてもよい。

以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。

（付記１）コンピュータに、
分類モデルの劣化が発生した場合に、劣化が発生した後の第１入力データを分類モデルに入力することで前記分類モデルから出力される第１判定結果と、劣化が発生する前の第２入力データを、複数のデータ変換器に入力することで変換された複数の変換後データを前記分類モデルに入力することで前記分類モデルから出力される複数の第２判定結果との類似度を算出し、
前記類似度を基にして、前記複数のデータ変換器からデータ変換器を選択し、
選択したデータ変換器を用いて、前記分類モデルでのデータ入力における前処理を行う
処理を実行させることを特徴とする判定処理プログラム。

（付記２）前記前処理は、前記第２入力データを前記分類モデルに入力することで、前記第２入力データに対応する正解ラベルを特定し、前記正解ラベルと、前記変換後データとを対応付けた学習データを生成することを特徴とする付記１に記載の判定処理プログラム。

（付記３）前記選択する処理は、前記データ変換器を選択する度に、前記データ変換器の選択回数を計数し、計数した回数を基にして、前記複数のデータ変換器から、第１データ変換器を選択し、前記類似度を基にして、前記複数のデータ変換器から、第２データ変換器を選択し、前記前処理は、前記第２入力データを、前記第１データ変換器に入力することで変換される第１変換後データと、前記第１変換後データを、前記第２データ変換器に入力することで変換される第２変換後データと、前記正解ラベルとを基にして、学習データを生成することを特徴とする付記２に記載の判定処理プログラム。

（付記４）前記第１判定結果と類似する第２判定結果が存在しない場合に、前記第１入力データと、前記第２入力データとを基にして、新たなデータ変換器を生成する処理を更に実行することを特徴とする付記１に記載の判定処理プログラム。

（付記５）前記学習データを基にして、前記分類モデルに対する機械学習を実行する処理を更に実行することを特徴とする付記２または３に記載の判定処理プログラム。

（付記６）データを複数の分類モデルに入力した場合の劣化検出の結果と、前記データを前記複数のデータ変換器に入力して得られる複数の変換後データを、前記複数の分類モデルに入力した場合の劣化検出の結果とを基にして、前記複数のデータ変換器からデータ変換器を選択する処理を更に実行することを特徴とする付記１に記載の判定処理プログラム。

（付記７）コンピュータが実行する判定処理方法であって、
分類モデルの劣化が発生した場合に、劣化が発生した後の第１入力データを分類モデルに入力することで前記分類モデルから出力される第１判定結果と、劣化が発生する前の第２入力データを、複数のデータ変換器に入力することで変換された複数の変換後データを前記分類モデルに入力することで前記分類モデルから出力される複数の第２判定結果との類似度を算出し、
前記類似度を基にして、前記複数のデータ変換器からデータ変換器を選択し、
選択したデータ変換器を用いて、前記分類モデルでのデータ入力における前処理を行う
処理を実行することを特徴とする判定処理方法。

（付記８）前記前処理は、前記第２入力データを前記分類モデルに入力することで、前記第２入力データに対応する正解ラベルを特定し、前記正解ラベルと、前記変換後データとを対応付けた学習データを生成することを特徴とする付記７に記載の判定処理方法。

（付記９）前記選択する処理は、前記データ変換器を選択する度に、前記データ変換器の選択回数を計数し、計数した回数を基にして、前記複数のデータ変換器から、第１データ変換器を選択し、前記類似度を基にして、前記複数のデータ変換器から、第２データ変換器を選択し、前記前処理は、前記第２入力データを、前記第１データ変換器に入力することで変換される第１変換後データと、前記第１変換後データを、前記第２データ変換器に入力することで変換される第２変換後データと、前記正解ラベルとを基にして、学習データを生成することを特徴とする付記８に記載の判定処理方法。

（付記１０）前記第１判定結果と類似する第２判定結果が存在しない場合に、前記第１入力データと、前記第２入力データとを基にして、新たなデータ変換器を生成する処理を更に実行することを特徴とする付記７に記載の判定処理方法。

（付記１１）前記学習データを基にして、前記分類モデルに対する機械学習を実行する処理を更に実行することを特徴とする付記８または９に記載の判定処理方法。

（付記１２）データを複数の分類モデルに入力した場合の劣化検出の結果と、前記データを前記複数のデータ変換器に入力して得られる複数の変換後データを、前記複数の分類モデルに入力した場合の劣化検出の結果とを基にして、前記複数のデータ変換器からデータ変換器を選択する処理を更に実行することを特徴とする付記７に記載の判定処理方法。

（付記１３）分類モデルの劣化が発生した場合に、劣化が発生した後の第１入力データを分類モデルに入力することで前記分類モデルから出力される第１判定結果と、劣化が発生する前の第２入力データを、複数のデータ変換器に入力することで変換された複数の変換後データを前記分類モデルに入力することで前記分類モデルから出力される複数の第２判定結果との類似度を算出し、前記類似度を基にして、前記複数のデータ変換器からデータ変換器を選択する選択部と、
選択したデータ変換器を用いて、前記分類モデルでのデータ入力における前処理を行う前処理部と
を有することを特徴とする情報処理装置。

（付記１４）前記前処理部は、前記第２入力データを前記分類モデルに入力することで、前記第２入力データに対応する正解ラベルを特定し、前記正解ラベルと、前記変換後データとを対応付けた学習データを生成することを特徴とする付記１３に記載の情報処理装置。

（付記１５）前記選択部は、前記データ変換器を選択する度に、前記データ変換器の選択回数を計数し、計数した回数を基にして、前記複数のデータ変換器から、第１データ変換器を選択し、前記類似度を基にして、前記複数のデータ変換器から、第２データ変換器を選択し、前記前処理は、前記第２入力データを、前記第１データ変換器に入力することで変換される第１変換後データと、前記第１変換後データを、前記第２データ変換器に入力することで変換される第２変換後データと、前記正解ラベルとを基にして、学習データを生成することを特徴とする付記１４に記載の情報処理装置。

（付記１６）前記第１判定結果と類似する第２判定結果が存在しない場合に、前記第１入力データと、前記第２入力データとを基にして、新たなデータ変換器を生成する生成部を更に有することを特徴とする付記１３に記載の情報処理装置。

（付記１７）前記学習データを基にして、前記分類モデルに対する機械学習を実行する学習部を更に有することを特徴とする付記１４または１５に記載の情報処理装置。

（付記１８）前記選択部は、データを複数の分類モデルに入力した場合の劣化検出の結果と、前記データを前記複数のデータ変換器に入力して得られる複数の変換後データを、前記複数の分類モデルに入力した場合の劣化検出の結果とを基にして、前記複数のデータ変換器からデータ変換器を選択する処理を更に実行することを特徴とする付記１３に記載の情報処理装置。

１００情報処理装置
１１０通信部
１２０入力部
１３０出力部
１４０記憶部
１４１学習データセット
１４２分類モデルデータ
１４３データセットテーブル
１４４スタイル変換器テーブル
１４５学習データセットテーブル
１５０制御部
１５１取得部
１５２学習部
１５３分類部
１５４選択部
１５５生成部
１５６前処理部

Claims

コンピュータに、
分類モデルの劣化が発生した場合に、劣化が発生した後の第１入力データを分類モデルに入力することで前記分類モデルから出力される第１判定結果と、劣化が発生する前の第２入力データを、複数のデータ変換器に入力することで変換された複数の変換後データを前記分類モデルに入力することで前記分類モデルから出力される複数の第２判定結果との類似度を算出し、
前記類似度を基にして、前記複数のデータ変換器からデータ変換器を選択し、
選択したデータ変換器を用いて、前記分類モデルのデータ入力における前処理を行う
処理を実行させることを特徴とする判定処理プログラム。
前記前処理は、前記第２入力データを前記分類モデルに入力することで、前記第２入力データに対応する正解ラベルを特定し、前記正解ラベルと、前記変換後データとを対応付けた学習データを生成することを特徴とする請求項１に記載の判定処理プログラム。
前記選択する処理は、前記データ変換器を選択する度に、前記データ変換器の選択回数を計数し、計数した回数を基にして、前記複数のデータ変換器から、第１データ変換器を選択し、前記類似度を基にして、前記複数のデータ変換器から、第２データ変換器を選択し、前記前処理は、前記第２入力データを、前記第１データ変換器に入力することで変換される第１変換後データと、前記第１変換後データを、前記第２データ変換器に入力することで変換される第２変換後データと、前記正解ラベルとを基にして、学習データを生成することを特徴とする請求項２に記載の判定処理プログラム。
前記第１判定結果と類似する第２判定結果が存在しない場合に、前記第１入力データと、前記第２入力データとを基にして、新たなデータ変換器を生成する処理を更に実行することを特徴とする請求項１に記載の判定処理プログラム。
前記学習データを基にして、前記分類モデルに対する機械学習を実行する処理を更に実行することを特徴とする請求項２または３に記載の判定処理プログラム。
データを複数の分類モデルに入力した場合の劣化検出の結果と、前記データを前記複数のデータ変換器に入力して得られる複数の変換後データを、前記複数の分類モデルに入力した場合の劣化検出の結果とを基にして、前記複数のデータ変換器からデータ変換器を選択する処理を更に実行することを特徴とする請求項１に記載の判定処理プログラム。
コンピュータが実行する判定処理方法であって、
分類モデルの劣化が発生した場合に、劣化が発生した後の第１入力データを分類モデルに入力することで前記分類モデルから出力される第１判定結果と、劣化が発生する前の第２入力データを、複数のデータ変換器に入力することで変換された複数の変換後データを前記分類モデルに入力することで前記分類モデルから出力される複数の第２判定結果との類似度を算出し、
前記類似度を基にして、前記複数のデータ変換器からデータ変換器を選択し、
選択したデータ変換器を用いて、前記分類モデルのデータ入力における前処理を行う
処理を実行することを特徴とする判定処理方法。
分類モデルの劣化が発生した場合に、劣化が発生した後の第１入力データを分類モデルに入力することで前記分類モデルから出力される第１判定結果と、劣化が発生する前の第２入力データを、複数のデータ変換器に入力することで変換された複数の変換後データを前記分類モデルに入力することで前記分類モデルから出力される複数の第２判定結果との類似度を算出し、前記類似度を基にして、前記複数のデータ変換器からデータ変換器を選択する選択部と、
選択したデータ変換器を用いて、前記分類モデルでのデータ入力における前処理を行う前処理部と
を有することを特徴とする情報処理装置。