JP2022076203A

JP2022076203A - データ生成プログラム、データ生成方法および情報処理装置

Info

Publication number: JP2022076203A
Application number: JP2020186509A
Authority: JP
Inventors: 孝河東; Takashi Kato; 健人上村; Taketo Uemura; 優安富; Masaru Yasutomi; 友裕早瀬; Tomohiro Hayase
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-11-09
Filing date: 2020-11-09
Publication date: 2022-05-19
Also published as: US20220147764A1; EP3996001A1

Abstract

【課題】モデルの精度劣化の原因を特定することを課題とする。【解決手段】情報処理装置は、第１ドメインに対応する第１データセットと第２ドメインに対応する第２データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得する。情報処理装置は、第１ドメインに対応する第１データを識別モデルに入力して第１の識別の損失を取得するとともに、第２ドメインに対応する第２データを識別モデルに入力して第２の識別の損失を取得する。情報処理装置は、データ生成モデルを用いて、第２の識別の損失を第１の識別の損失に近づけたデータを生成し、生成されたデータを出力する。【選択図】図１

Description

本発明は、データ生成プログラム、データ生成方法および情報処理装置に関する。

深層学習などの機械学習により学習されたモデルは、訓練時と異なる性質のデータが入力されるドメインシフトなどにより判断の間違いが発生し、精度が劣化することがある。近年では、モデルが間違った出力したときに、なぜ間違ったかを分析することが行われている。例えば、モデルが間違えたデータを提示する技術や、発生したドメインシフトを可視化する技術が知られている。

特開２０１７－４５０９号公報

しかしながら、上記技術では、モデルの精度劣化の原因を特定することが難しい。例えば、間違ったデータの提示では、間違った原因を特定できず、ドメインシフトの提示では、精度劣化と関係がある原因まで特定することができない。

一つの側面では、モデルの精度劣化の原因を特定することができるデータ生成プログラム、データ生成方法および情報処理装置を提供することを目的とする。

第１の案では、データ生成プログラムは、コンピュータに、第１ドメインに対応する第１データセットと第２ドメインに対応する第２データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得する処理を実行させる。データ生成プログラムは、コンピュータに、前記第１ドメインに対応する第１データを前記識別モデルに入力して第１の前記識別の損失を取得するとともに、前記第２ドメインに対応する第２データを前記識別モデルに入力して第２の前記識別の損失を取得する処理を実行させる。データ生成プログラムは、コンピュータに、前記データ生成モデルを用いて、前記第２の識別の損失を前記第１の識別の損失に近づけたデータを生成し、生成された前記データを出力する処理を実行させる。

一実施形態によれば、モデルの精度劣化の原因を特定することができる。

図１は、実施例１にかかる情報処理装置を説明する図である。図２は、参考技術の問題点を説明する図である。図３は、参考技術の問題点を説明する図である。図４は、実施例１にかかる情報処理装置の機能構成を示す機能ブロック図である。図５は、生成モデルの訓練を説明する図である。図６は、可視化対象データの選択を説明する図である。図７は、特徴量と損失の抽出を説明する図である。図８は、特徴量と損失の補間を説明する図である。図９は、補間データの生成を説明する図である。図１０は、出力データを説明する図である。図１１は、出力データの提示例を説明する図である。図１２は、処理の流れを示すフローチャートである。図１３は、生成モデルとして用いるＧＡＮの訓練を説明する図である。図１４は、スタイル変換器の訓練を説明する図である。図１５は、スタイル変換器を用いた可視化対象データの生成を説明する図である。図１６は、ハードウェア構成例を説明する図である。

以下に、本願の開示するデータ生成プログラム、データ生成方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

［情報処理装置の説明］
図１は、実施例１にかかる情報処理装置１０を説明する図である。近年、機械学習により学習されたモデルに対して、判断根拠が知りたいという要望が存在する。モデルが間違える要因の一つには、訓練時と異なる性質のデータが入力されるドメインシフトが知られており、このドメインシフトによりモデルが劣化する。図１に示す情報処理装置１０は、上記要望に応えるために、モデルが間違えたデータに対してその原因を示唆する情報を出力することで、モデルの精度劣化の原因を特定するコンピュータ装置の一例である。

まず、モデルの精度劣化の手法として行われている参考技術の問題点について説明する。図２と図３は、参考技術の問題点を説明する図である。参考技術では、モデルが間違えたデータの提示を実行する。図２の（ａ）に示すように、参考技術では、ドメインシフト前の特徴量の分布における正誤判定の決定平面に対して、間違えたデータの特徴量を特定し、その特徴量に対応する入力データ（間違ったデータ）を提示する。また、図２の（ｂ）に示すように、参考技術では、ドメインシフト後の特徴量の分布における正誤判定の決定平面に対して、ドメインシフト後により新たに間違えたデータの特徴量を特定し、その特徴量に対応する入力データ（間違ったデータ）を提示する。

このように、間違ったデータだけを提示する参考技術では、間違った原因を特定することができないので、モデルの再学習などの対策を実行することができない。

また、図３に示すように、間違った原因がドメインシフトである場合に、発生したドメインシフトを可視化する参考技術も知られている。しかし、ドメインシフトの発生を提示するだけでは、入力データである画像の色の変化に原因があるのか、入力データである画像の傾きに原因があるのかを特定することができず、モデルの再学習などの対策を検討することが難しい。

そこで、実施例１にかかる情報処理装置１０は、ドメインシフト前後のデータを含むデータを、性能分析の対象である分類モデルの損失を条件として生成する生成モデルを用いて、ドメインシフト前後の対応付いた２つのデータを補間することで、分類モデルの性能を悪化させるまたは悪化させないデータの変化をユーザに示唆する。

例えば、図１に示すように、情報処理装置１０は、分類モデルによる分類精度が高いドメインシフト前の第１ドメインの第１データセットと、分類モデルによる分類精度が低いドメインシフト後の第２ドメインの第２データセットとを訓練データｘｓとして、訓練データｘｓの特徴量Ｚと訓練データｘｓに対する分類モデルの損失Ｌを条件として生成モデルを生成する。すなわち、第１データセットと第２データセットは、データの性質（分布）が異なるデータセットである。

その後、情報処理装置１０は、第１ドメインに属する第１データの特徴量および第１データに対する分類モデルの損失との組合せ１、第２ドメインに属する第２データの特徴量および第２データに対する分類モデルの損失との組合せ２を取得する。そして、情報処理装置１０は、組合せ１から組合せ２の間にある特徴量と損失との組み合わせを線形補間する。

そして、情報処理装置１０は、補間した各特徴量を生成モデルに入力して、各特徴量に対応する各データを生成する。その後、情報処理装置１０は、分類モデルによる分類が成功する第１データ、分類が失敗する第２データ、第１データから第２データへの遷移の途中に位置する生成データをユーザに出力する。この結果、情報処理装置１０は、分類モデルの精度劣化の原因を特定する情報をユーザに提示することができる。

［機能構成］
図４は、実施例１にかかる情報処理装置１０の機能構成を示す機能ブロック図である。図４に示すように、情報処理装置１０は、通信部１１、表示部１２、記憶部１３、制御部２０を有する。

通信部１１は、他の装置との間の通信を制御する処理部であり、例えば通信インタフェースなどにより実現される。例えば、通信部１１は、管理者端末から、訓練データ、適用先データ、各種指示などを受信する。また、通信部１１は、管理者端末に、分析結果などを送信する。

表示部１２は、各種情報を表示する処理部であり、例えばディスプレイやタッチパネルなどにより実現される。例えば、表示部１２は、分析結果などを表示する。

記憶部１３は、各種データや制御部２０が実行するプログラムなどを記憶する処理部であり、例えばメモリやハードディスクなどにより実現される。この記憶部１３は、第１データセット１４、第２データセット１５、分類モデル１６、生成モデル１７を記憶する。

第１データセット１４は、分類モデル１６の訓練（機械学習）に利用されたデータセットである。例えば、第１データセット１４に記憶される各データには、正解情報であるラベルが付与されている。また、第１データセット１４は、分類モデル１６による分類精度が高精度である第１ドメインに属する複数のデータを有する。すなわち、第１データセット１４内の各データは、ドメインシフト前のデータに該当する。

第２データセット１５は、訓練済みの分類モデル１６による分類対象のデータセットである。例えば、第２データセット１５は、分類モデル１６による分類精度が低精度である第２ドメインに属する複数のデータを有する。すなわち、第２データセット１５内の各データは、ドメインシフト後のデータに該当する。

分類モデル１６は、第１データセット１４を用いた訓練（機械学習）により生成される、ニューラルネットワーク（以下では、ＮＮと記載する場合がある）を用いたモデルの一例である。例えば、分類モデル１６は、画像データが入力された場合に、当該画像データに写っているか文字を分類する。なお、分類モデル１６は、訓練により生成されたモデルそのものであってもよく、訓練により生成されたＮＮのパラメータであってもよい。

生成モデル１７は、第１データセット１４と第２データセット１５とを用いた訓練により生成される、ＮＮを用いたモデルの一例である。例えば、生成モデル１７は、自己符号化器（オートエンコーダ）などであり、入力データから特徴量を抽出して再構成データを生成する。なお、生成モデル１７は、訓練により生成されたモデルそのものであってもよく、訓練により生成されたＮＮのパラメータであってもよい。

制御部２０は、情報処理装置１０全体を司る処理部であり、例えばプロセッサなどにより実現される。この制御部２０は、分類モデル訓練部２１、生成モデル訓練部２２、データ選択部２３、抽出部２４、補間部２５、生成部２６、表示制御部２７を有する。なお、分類モデル訓練部２１、生成モデル訓練部２２、データ選択部２３、抽出部２４、補間部２５、生成部２６、表示制御部２７は、プロセッサが有する電子回路やプロセッサが実行するプロセスなどにより実現される。

分類モデル訓練部２１は、第１データセット１４を用いた訓練により分類モデル１６を生成する処理部である。例えば、分類モデル訓練部２１は、第１データセット１４に含まれる各データを分類モデル１６に入力し、分類モデル１６の出力とラベルとが一致するように（誤差が最小化するように）、分類モデル１６の訓練を実行する。

生成モデル訓練部２２は、第１データセット１４と第２データセット１５とを用いた訓練により生成モデル１７を生成する処理部である。具体的には、生成モデル訓練部２２は、第１ドメインに対応する第１データセットと第２ドメインに対応する第２データセットとを用いた訓練によりされ、分類モデルによる分類の損失をパラメータに含む生成モデル１７を生成する。

例えば、生成モデル１７にオートエンコーダを用いた例で説明する。図５は、生成モデル１７の訓練を説明する図である。図５に示すように、生成モデル訓練部２２は、第１データセット１４または第２データセット１５から訓練データｘを取得し、分類モデル１６に入力して分類モデル１６の損失Ｌを取得する。この損失Ｌは、分類モデル１６が正しく分類できるほど小さな値となり、分類モデル１６が間違った分類を行うほど大きな値となる。

続いて、生成モデル訓練部２２は、訓練データｘを生成モデル１７のエンコーダに入力して、特徴量である潜在変数Ｚ１とＺ２とを取得する。そして、生成モデル訓練部２２は、訓練データｘの特徴量（潜在変数Ｚ１、Ｚ２）と分類モデル１６から取得した損失Ｌとを生成モデル１７のデコーダに入力し、再構成データｘ´を取得する。その後、生成モデル訓練部２２は、訓練データｘと再構成データｘ´とが一致するように（誤差が最小化するように）、生成モデル１７の訓練を実行する。

すなわち、生成モデル訓練部２２は、分析対象となる分類モデル１６の損失を条件としてデータ生成を行う生成モデル１７を生成する。つまり、生成モデル訓練部２２は、分類モデル１６の損失Ｌに依存しない残りの特徴、言い換えると分類モデル１６の性能に影響を与えない特徴を潜在変数Ｚ１とＺ２に誘導するように、生成モデル１７の訓練を実行する。

データ選択部２３は、可視化対象のデータを選択する処理部である。具体的には、データ選択部２３は、ドメイン１に属する第１データセット１４から任意のデータを選択し、ドメイン２に属する第２データセット１５から任意のデータを選択し、抽出部２４に出力する。

図６は、可視化対象データの選択を説明する図である。図６に示すように、データ選択部２３は、第１データセット１４内の各データのうち、分類モデル１６の損失が最小である第１データや分類モデル１６の損失が閾値以下である任意の第１データを選択する。同様に、データ選択部２３は、第２データセット１５内の各データのうち、分類モデル１６の損失が最大である第２データや分類モデル１６の損失が閾値以上である任意の第２データを選択する。

つまり、データ選択部２３は、可視化対象データとして、分類モデル１６による分類が成功した第１データと、分類モデル１６による分類が失敗した第２データとを選択する。

抽出部２４は、可視化対象データの特徴量や、可視化対象データに対する分類モデルの損失を抽出する処理部である。具体的には、抽出部２４は、可視化対象である第１データと第２データのそれぞれを分類モデル１６に入力して、それぞれの損失を抽出する。また、抽出部２４は、可視化対象である第１データと第２データのそれぞれを生成モデル１７のエンコーダに入力して、それぞれの特徴量を抽出する。そして、抽出部２４は、抽出した情報を補間部２５に出力する。

図７は、特徴量と損失の抽出を説明する図である。図７の例では、第１データは、文字「Ａ」の画像データであり、第２データは、第１データの文字よりも太く、異なる色の線で書かれた文字「Ａ」の画像データである。図７に示すように、抽出部２４は、第１データを分類モデル１６に入力して損失Ｌ（０．１）を抽出し、第１データを生成モデル１７のエンコーダに入力して特徴量（Ｚ１＝２．７、Ｚ２＝０．３）を抽出する。同様に、抽出部２４は、第２データを分類モデル１６に入力して損失Ｌ（０．９）を抽出し、第２データを生成モデル１７のエンコーダに入力して特徴量（Ｚ１＝１．１、Ｚ２＝３．１）を抽出する。

補間部２５は、第１データに対応する損失から第２データに対応する損失までの間の各損失を補間し、第１データの特徴量から第２データの特徴量までの間の各特徴量を補間する処理部である。そして、補間部２５は、補間した結果を生成部２６に出力する。

図８は、特徴量と損失の補間を説明する図である。図８に示すように、補間部２５は、第１データの特徴量（Ｚ１＝２．７、Ｚ２＝０．３）と第２データの特徴量（Ｚ１＝１．１、Ｚ２＝３．１）とを２点として、線形補間を実行する。この結果、補間部２５は、２点間の近似値として、特徴量（Ｚ１＝２．３、Ｚ２＝１．０）、特徴量（Ｚ１＝１．９、Ｚ２＝１．７）、特徴量（Ｚ１＝１．５、Ｚ２＝２．４）を算出する。

同様に、補間部２５は、第１データの損失Ｌ（０．１）と第２データの損失Ｌ（０．９）とを２点として、線形補間を実行する。この結果、補間部２５は、２点間の近似値として、損失Ｌ（０．３）、損失Ｌ（０．５）、損失Ｌ（０．７）を算出する。なお、線形補間の手法は、公知の様々な手法を採用することができる。ここでは、特徴量と損失とを同じ数だけ補間することもできる。なお、多次元の特徴量と１次元の損失とを１つの組と考え、これらの次元を有する空間上で補間することもできる。

生成部２６は、補間された特徴量等を用いて、補間データ（生成データ）を生成する処理部である。具体的には、生成部２６は、補間された各特徴量と各損失とを組み合わせた複数の組合せを生成し、各組合せと生成モデル１７とを用いて、第１データから第２データまでの間を補間する複数の補間データを生成する。

図９は、補間データの生成を説明する図である。図９に示すように、生成部２６は、補間された各特徴量および各損失と、第１データの特徴量および損失と、第２データの特徴量および損失とについて、各特徴量と各損失と組み合わせた各組合せを生成する。例えば、生成部２６は、第１データの特徴量（Ｚ１＝２．７、Ｚ２＝０．３）に対して、損失Ｌ（０．１）、損失Ｌ（０．３）、損失Ｌ（０．５）、損失Ｌ（０．７）、損失Ｌ（０．９）それぞれを組み合わせた５個の組合せを生成する。同様に、生成部２６は、補間された特徴量（Ｚ１＝２．３、Ｚ２＝１．０）に対して、損失Ｌ（０．１）、損失Ｌ（０．３）、損失Ｌ（０．５）、損失Ｌ（０．７）、損失Ｌ（０．９）それぞれを組み合わせた５個の組合せを生成する。

このようにして、生成部２６は、５個の特徴量と５個の損失とをそれぞれ組み合わせた２５個の組合せを生成する。そして、生成部２６は、２５個の組合せそれぞれについて、生成モデル１７のデコーダを用いて、補間データを生成する。例えば、生成部２６は、「特徴量（Ｚ１＝２．３、Ｚ２＝１．０），損失Ｌ（０．１）」に対して、それぞれを生成モデル１７のデコーダに入力して再構成データｘ´を取得し、再構成データｘ´を補間データとして採用する。つまり、生成部２６は、「特徴量（Ｚ１＝２．３、Ｚ２＝１．０），損失Ｌ（０．１）」が抽出できるデータを推定する。なお、第１データの「特徴量（Ｚ１＝２．７、Ｚ２＝０．３），損失Ｌ（０．１）」の組合せと第２データ「特徴量（Ｚ１＝１．１、Ｚ２＝３．１），損失Ｌ（０．９）」の組合せについては、実データが存在するので、生成対象から除外される。

表示制御部２７は、生成部２６により生成された各種データを表示部１２に表示出力する処理部である。具体的には、表示制御部２７は、第１データ、第２データ、補間データを出力する。このとき、表示制御部２７は、第１データと第２データとの間に各補間データを表示することで、分類の成功例から失敗例までを段階的に出力することもできる。

図１０は、出力データを説明する図である。図１０には、表示制御部２７が分類の成功例から失敗例までを段階的に表示するために生成する出力データの例を示している。図１０に示すように、出力データは、横軸を特徴量、縦軸を損失とするマトリックスであり、該当する箇所に第１データ、第２データ、補間データ（生成データ）が表示される。横軸の特徴量の変化は、分類モデル１６の性能以外のデータの特徴量（潜在変数）の変化であり、精度劣化に無関係なデータ変化を示している。縦軸の損失の変化は、損失等の分類モデル１６の性能を示す指標であり、精度変化の要因となったデータ変化である。

図１０の例では、左上に実データかつ分類が成功したる第１データが表示され、右下に実データかつ分類が失敗した第２データが表示され、これらの間に補間データが表示される。したがって、ユーザは、文字の色は分類モデル１６の性能に影響を与えず、文字の太さが分類モデル１６の性能に影響があることを認識できる。

ここで、人間が解釈できる形式の特徴量の場合は、具体的な形式で表示することもできる。図１１は、出力データの提示例を説明する図である。図１１に示すように、表示制御部２７は、図１０と同じ表形式であるものの、横軸を色合い、縦軸を分類モデル１６の性能と具体的に記載することで、ドメインシフトを可視化して、ユーザの認識を補助することができる。

［処理の流れ］
図１２は、処理の流れを示すフローチャートである。ここでは、各モデルの訓練を実行した後に補間を実行する例を説明するが、これに限定されるものではなく、別々のフローで実行することもできる。

図１２に示すように、分類モデル訓練部２１は、処理開始が指示されると（Ｓ１０１：Ｙｅｓ）、第１データセット１４を用いて分類モデル１６の訓練を実行する（Ｓ１０２）。続いて、生成モデル訓練部２２は、第１データセット１４および第２データセット１５と訓練済みの分類モデル１６とを用いて、生成モデル１７の訓練を実行する（Ｓ１０３）。

そして、データ選択部２３は、各データセットから２つの可視化対象データを選択し（Ｓ１０４）、抽出部２４は、各可視化対象データの特徴量と損失を抽出する（Ｓ１０５）。その後、補間部２５は、可視化対象データ間の特徴量と損失とを補間し（Ｓ１０６）、補間した情報を用いて補間データを生成する（Ｓ１０７）。そして、表示制御部２７は、生成結果を出力する（Ｓ１０８）。

［効果］
上述したように、情報処理装置１０は、対象の分類モデル１６がドメイン１のデータでは高精度だったが、ドメイン２のデータでは精度が低い場合に、原因を可視化し、分類モデル１６の精度劣化の原因を特定することができる。この結果、情報処理装置１０は、分類モデル１６の性能劣化の原因の分析と対策に有用な情報をユーザに提示することができる。

例えば、ユーザは、適用対象データの色合いが訓練データに比べて色合いが濃い場合は、分類モデル１６を適用し、適用対象データの文字の太さが訓練データに比べて太い場合は、分類モデル１６を適用しないと判断することもできる。また、ユーザは、訓練データよりも文字が太い適用対象データに分類モデル１６を適用する場合、文字が太い訓練データを用いて分類モデル１６の再訓練（再学習）した後に適用することもできる。

ところで、実施例１で説明した分類モデル１６や生成モデル１７などの機械学習モデルとして、様々なモデルを採用することができる。そこで、実施例２では、他の機械学習モデルの適用例について説明する。

［ＧＡＮ（Generative Adversarial Network）の適用］
図１３を用いて、生成モデル１７にＧＡＮを適用した例を説明する。図１３は、生成モデル１７として用いるＧＡＮの訓練を説明する図である。

図１３に示すようには、エンコーダは、入力データ（訓練データ）ｘから潜在変数（ｚ１´、ｚ２´）を生成する。生成器は、入力データｘの潜在変数（ｚ１、ｚ２）と分類モデル１６の損失Ｌとから入力データｘ´を生成する。識別器は、損失Ｌを条件として入力と潜在変数の組が実データか生成されたデータかを識別できるように、生成モデル訓練部２２により訓練される。例えば、識別器は、「入力データｘ、潜在変数（ｚ１´、ｚ２´）」が実データか否かを識別し、「入力データｘ´、潜在変数（ｚ１、ｚ２）」が実データか否かを識別できるように訓練される。

このように、損失を条件としデータに対応付いた潜在変数からデータを生成するように訓練するとともに、データから潜在変数への逆変換も訓練された機械学習モデルを生成モデル１７として用いることができるので、汎用性を向上できる。なお、生成モデル１７には、オートエンコーダ、ＶＡＥ（Variational AutoEncoder）、ＧＡＮ等を使用することができる。

［スタイル変換器の適用］
可視化対象データを生成するスタイル変換器を使用することもできる。図１４は、スタイル変換器の訓練を説明する図である。図１４では、サイクルＧＡＮを利用してドメイン２からドメイン１へのスタイル変換器を訓練する。図１４に示すように、スタイル変換器は、「エンコーダＡ、デコーダＡ」、「エンコーダＢ、デコーダＢ」、識別器を有する。

このような構成において、スタイル変換器は、ドメイン２の実データ、ドメイン１の疑似データ、ドメイン２の再構成データを順に生成し、ドメイン２の実データとドメイン２の再構成データとの誤差が小さくなるように、生成モデル訓練部２２により訓練される。

具体的には、スタイル変換器は、ドメイン２のデータセット２の入力データｘ２をエンコーダＡに入力し、デコーダＡを介して変換データｘ２´を生成する。続いて、スタイル変換器は、変換データｘ２´をエンコーダＢに入力し、デコーダＢを介して再構成データｘ２´´を生成する。そして、スタイル変換器は、入力データｘ２と再構成データｘ２´´との誤差が小さくなるように訓練される。また、識別器は、ドメイン１のデータセット１のデータｘ１と、変換データｘ２´とを入力として、変換データｘ２´がドメイン１の実データか否かを識別できるように訓練される（Ｒ／Ｆ：Real or Failure）。

このように訓練されたスタイル変換器は、可視化対象データの生成に利用することができる。図１５は、スタイル変換器を用いた可視化対象データの生成を説明する図である。図１５に示すように、データ選択部２３は、ドメイン２からデータｘ２を選択する（図１５の（１）参照）。続いて、データ選択部２３は、データｘ２をエンコーダＡに入力し、デコーダＡを介して変換データｘ２´を生成し、変換データｘ２´をドメイン１のデータとして選択する（図１５の（２）参照）。

このように、スタイル変換器を用いることで、分類モデル１６や生成モデル１７の訓練時とは異なる環境で訓練データが存在しない場合であっても、各ドメインの可視化対象データを生成することができる。したがって、分類モデル１６の適用環境に依存することなく、ドメインシフトの分析を実行することができる。

さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［データや数値等］
上記実施例で用いたデータ例、数値例、閾値、表示例、各モデルのＮＮ層の数、特徴空間の次元数等は、あくまで一例であり、任意に変更することができる。また、訓練データとして画像データを用いた画像分類以外にも、音声や時系列データの分析などにも用いることができる。

［分類モデル］
上記実施例では、情報処理装置１０が分類モデル１６を生成する例を説明したが、これに限定されるものではなく、情報処理装置１０の分類モデル訓練部２１が他の装置で生成された分類モデル１６を取得する構成を採用することもできる。

［システム］
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。なお、分類モデル１６は、識別モデルの一例であり、分類モデル訓練部２１は、第１取得部の一例であり、データ選択部２３と抽出部２４は、第２取得部の一例である。補間部２５と生成部２６は、生成部の一例であり、表示制御部２７は、出力部の一例である。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

［ハードウェア］
図１６は、ハードウェア構成例を説明する図である。図１６に示すように、情報処理装置１０は、通信装置１０ａ、ＨＤＤ（Hard Disk Drive）１０ｂ、メモリ１０ｃ、プロセッサ１０ｄを有する。また、図１６に示した各部は、バス等で相互に接続される。

通信装置１０ａは、ネットワークインタフェースカードなどであり、他の装置との通信を行う。ＨＤＤ１０ｂは、図４に示した機能を動作させるプログラムやＤＢを記憶する。

プロセッサ１０ｄは、図４に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１０ｂ等から読み出してメモリ１０ｃに展開することで、図４等で説明した各機能を実行するプロセスを動作させる。例えば、このプロセスは、情報処理装置１０が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１０ｄは、分類モデル訓練部２１、生成モデル訓練部２２、データ選択部２３、抽出部２４、補間部２５、生成部２６、表示制御部２７等と同様の機能を有するプログラムをＨＤＤ１０ｂ等から読み出す。そして、プロセッサ１０ｄは、分類モデル訓練部２１、生成モデル訓練部２２、データ選択部２３、抽出部２４、補間部２５、生成部２６、表示制御部２７等と同様の処理を実行するプロセスを実行する。

このように、情報処理装置１０は、プログラムを読み出して実行することで分析方法を実行する情報処理装置として動作する。また、情報処理装置１０は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、情報処理装置１０によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＭＯ（Magneto－Optical disk）、ＤＶＤ（Digital Versatile Disc）などのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することができる。

１０情報処理装置
１１通信部
１２表示部
１３記憶部
１４第１データセット
１５第２データセット
１６分類モデル
１７生成モデル
２０制御部
２１分類モデル訓練部
２２生成モデル訓練部
２３データ選択部
２４抽出部
２５補間部
２６生成部
２７表示制御部

Claims

コンピュータに、
第１ドメインに対応する第１データセットと第２ドメインに対応する第２データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得し、
前記第１ドメインに対応する第１データを前記識別モデルに入力して第１の前記識別の損失を取得するとともに、前記第２ドメインに対応する第２データを前記識別モデルに入力して第２の前記識別の損失を取得し、
前記データ生成モデルを用いて、前記第２の識別の損失を前記第１の識別の損失に近づけたデータを生成し、
生成された前記データを出力する、
処理を実行させることを特徴とするデータ生成プログラム。
前記第１の識別の損失から前記第２の識別の損失の間の各損失を線形補間により補間する処理を前記コンピュータに実行させ、
前記生成する処理は、補間された前記各損失に対応する各データを、前記データ生成モデルを用いて生成し、
前記出力する処理は、前記第１データと、補間された前記各損失に対応する前記各データと、前記第２データとを出力することを特徴とする請求項１に記載のデータ生成プログラム。
前記データ生成モデルは、入力データから特徴量を生成し、前記特徴量から前記入力データに対応する再構成データを生成する自己符号化器であり、
前記取得する処理は、前記第１データに対応する前記第１の識別の損失を取得するとともに、前記第１データを前記データ生成モデルに入力して第１特徴量を取得し、前記第２データに対応する前記第２の識別の損失を取得するとともに、前記第２データを前記データ生成モデルに入力して第２特徴量を取得し、
前記補間する処理は、前記第１の識別の損失と前記第１特徴量の組から、前記第２の識別の損失と前記第２特徴量の組の間に該当する損失と特徴量の各組を、線形補間により補間し、
前記生成する処理は、補間された前記各組の各特徴量を前記データ生成モデルに入力して、前記データ生成モデルにより生成される各再構成データを取得し、
前記出力する処理は、前記第１データから前記第２データの間を前記各再構成データで補間する段階的な表示形式で出力することを特徴とする請求項２に記載のデータ生成プログラム。
前記識別モデルの訓練に用いられた前記第１データセットに含まれる各データと前記データを前記識別モデルに入力したときの各識別の損失とを用いた訓練、および、訓練後の前記識別モデルによる識別対象である前記第２データセットに含まれる各データと前記データを前記識別モデルに入力したときの各識別の損失とを用いた訓練により、前記データ生成モデルを生成する、
処理を前記コンピュータに実行させることを特徴とする請求項１から３のいずれか一つに記載のデータ生成プログラム。
前記第１データセットに含まれる各データのうち、前記識別モデルによる前記識別の損失が閾値未満であるデータを前記第１データとして選択し、
前記第２データセットに含まれる各データのうち、前記識別モデルによる前記識別の損失が閾値以上であるデータを前記第２データとして選択する、
処理を前記コンピュータに実行させることを特徴とする請求項１から４のいずれか一つに記載のデータ生成プログラム。
前記第１データセットに含まれる各データと、前記第２データセットに含まれる各データとを用いた訓練により、前記第２データセットに含まれるデータを前記第１データセットに属するデータに変換するスタイル変換器を生成し、
前記第２データセットに含まれる各データから前記第２データを選択し、
前記第２データを前記スタイル変換器に入力して前記第１データを生成する、
処理を前記コンピュータに実行させることを特徴とする請求項１から４のいずれか一つに記載のデータ生成プログラム。
コンピュータが、
第１ドメインに対応する第１データセットと第２ドメインに対応する第２データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得し、
前記第１ドメインに対応する第１データを前記識別モデルに入力して第１の前記識別の損失を取得するとともに、前記第２ドメインに対応する第２データを前記識別モデルに入力して第２の前記識別の損失を取得し、
前記データ生成モデルを用いて、前記第２の識別の損失を前記第１の識別の損失に近づけたデータを生成し、
生成された前記データを出力する、
処理を実行することを特徴とするデータ生成方法。
第１ドメインに対応する第１データセットと第２ドメインに対応する第２データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得する第１取得部と、
前記第１ドメインに対応する第１データを前記識別モデルに入力して第１の前記識別の損失を取得するとともに、前記第２ドメインに対応する第２データを前記識別モデルに入力して第２の前記識別の損失を取得する第２取得部と、
前記データ生成モデルを用いて、前記第２の識別の損失を前記第１の識別の損失に近づけたデータを生成する生成部と、
生成された前記データを出力する出力部、
を有することを特徴とする情報処理装置。