JP2022102095A

JP2022102095A - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP2022102095A
Application number: JP2020216626A
Authority: JP
Inventors: ムハマドアクマル; Akmal Muhammad
Original assignee: Rakuten Group Inc
Current assignee: Rakuten Group Inc
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2022-07-07
Anticipated expiration: 2040-12-25
Also published as: EP4020338A1; JP7062747B1; TWI792560B; US20220207865A1; US12002488B2; CN114757358A; TW202226077A

Abstract

【課題】ターゲットドメインのサンプルがソースドメインのサンプルに十分対応しない場合であっても高精度な処理結果を得る情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】学習装置１は、ソースドメインに含まれる第１のクラスのサンプル及びび第２のクラスのサンプルと、ターゲットドメインに含まれる第１のクラスのサンプルとから、夫々特徴を抽出する特徴抽出部と、特徴抽出部が抽出した特徴の、特徴空間におけるターゲットドメインに含まれる第１のクラスのサンプルの分布に基づいて、ターゲットドメインの第２のクラスの疑似サンプルを生成する疑似サンプル生成部と、特徴空間において、ソースドメインに含まれる第１のクラスのサンプル及び第２のクラスのサンプルの分布を、ターゲットドメインに含まれる第１のクラスのサンプル及び第２のクラスの疑似サンプルの分布に近づくよう機械学習によりデータ変換するデータ変換部とを備える。
【選択図】図１

Description

本発明は、情報処理装置、情報処理方法およびプログラムに関し、特に、学習モデルを機械学習させるための技術に関する。

教師あり機械学習においては、教師サンプル（標本）と教師ラベルからなる教師データセットを用いて、教師サンプルとラベルとの関係を学習モデルに反映させるように、学習モデルを機械学習させる。このような機械学習により得られた学習済みモデルを、推論フェーズにおいてラベルの付されていない未知のサンプルに適用することで、例えば、画像認識、分類等の所望の処理結果が得られる。

ある教師データセットを用いて学習させた学習済みモデルを、当該教師データセットとはドメインが異なるデータセットを対象とするタスクにそのまま適用すると、推論の精度が低下してしまう。ここで、ドメインとは、データセットにおけるデータの種類、範囲、分布等をいう。
そこで、対象となるデータセットと同一のドメインであるターゲットドメインのサンプルを用いて、学習済みモデルをさらに機械学習させることで、学習済みモデルをターゲットドメインに適用可能とする技術があり、これは転移学習（ＴｒａｎｓｆｅｒＬｅａｒｎｉｎｇ）と称される。

この転移学習の１つに、ドメイン適応（ＤｏｍａｉｎＡｄａｐｔａｔｉｏｎ）がある。このドメイン適応では、教師データセットのドメインと対象となるデータセットのドメインとでサンプルの分布が異なることを前提とし、適用元である教師データセットのドメイン（ソースドメイン）の分布を、適用先である対象のデータセットのドメイン（ターゲットドメイン）の分布に近づけるように、学習モデルを学習させる。

特許文献１は、カメラで撮影された車両画像を分類するタスクにおけるドメイン適応化手法を開示する。
具体的には、特許文献１のラベリングシステムにおいては、同じカメラにより取得された画像を表すラベル化特徴ベクトルを対象ドメイン訓練セットとし、他の複数のカメラによりそれぞれ取得された複数のソースドメイン訓練セットとして用いて、ドメイン間のずれが学習されるよう、ブースト分類器を訓練する。これにより、早期に導入されたカメラや他の位置に設置されたカメラで収集された画像を利用して車両画像を分類している。

特開２０１６－５８０７９号公報

ところで、ドメイン適応においては、ソースドメインに含まれる教師サンプルにはラベルが付されているが、ターゲットドメインに含まれる対象データのサンプルにはラベルが付されているとは限らない。ターゲットドメインのサンプルにラベルが付されていない場合のドメイン適応は、教師なしドメイン適応とも呼ばれる。
いずれの場合であっても、ドメイン適応において、ターゲットドメインは、ソースドメインに属するサンプルに付されているすべてのラベルに対応するサンプルを含んでいることを想定している。

しかしながら、ターゲットドメインのサンプルとして、常にソースドメインのすべてのラベルに対応するサンプルが用意できるとは限らない。このように、ターゲットドメインが、ソースドメインに属するサンプルに付されている一部のラベルに対応するサンプルを欠くと、特許文献１の技術では、ソースドメインをターゲットドメインにドメイン適応させた際に、ソースドメインのサンプル分布をターゲットドメインのサンプル分布に十分に近づけることができない。
したがって、学習済みモデルに対するドメイン適応の精度が低下し、ひいては当該学習済みモデルを用いて推論する各種処理の精度もまた低下してしまうおそれがある。

本発明は上記課題を解決するためになされたものであり、その目的は、ターゲットドメインのサンプルがソースドメインのサンプルに十分対応しない場合であっても、高精度な処理結果を得ることが可能な情報処理装置、情報処理方法およびプログラムを提供することにある。

上記課題を解決するために、本発明に係る情報処理装置の一態様は、ソースドメインに含まれる第１のクラスのサンプルおよび第２のクラスのサンプルと、ターゲットドメインに含まれる前記第１のクラスのサンプルとから、それぞれ特徴を抽出する特徴抽出部と、前記特徴抽出部により抽出された前記特徴の特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布に基づいて、前記ターゲットドメインの前記第２のクラスの疑似サンプルを生成する疑似サンプル生成部と、前記特徴空間において、前記ソースドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスのサンプルの分布を、前記ターゲットドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスの前記疑似サンプルの分布に近づくよう機械学習によりデータ変換するデータ変換部と、を備える。

前記疑似サンプル生成部は、前記特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布の第１の信頼度を推定し、推定された前記第１の信頼度の勾配に基づいて、前記疑似サンプルを生成してよい。

前記疑似サンプル生成部は、推定された前記第１の信頼度が低い前記特徴空間の領域に、前記疑似サンプルを生成してよい。

前記疑似サンプル生成部は、前記特徴空間における前記ソースドメインに含まれる前記第２のクラスのサンプルの分布の第２の信頼度を推定し、推定された前記第２の信頼度の勾配に基づいて、前記疑似サンプルを生成してよい。

前記疑似サンプル生成部は、前記第１の信頼度と前記第２の信頼度とを結合し、結合された信頼度に基づいて、生成された前記疑似サンプルを、前記特徴空間において前記結合された信頼度がより高い領域に分布させるようリサンプリングしてよい。

前記疑似サンプル生成部は、前記特徴空間における前記ソースドメインに含まれる前記第１のクラスのサンプルの分布と前記第２のクラスのサンプルの分布との間の距離に基づいて、前記疑似サンプルを生成してよい。

サンプルを前記ソースドメインおよび前記ターゲットドメインのいずれかに分類するドメイン分類器をさらに備え、前記疑似サンプル生成部は、前記ドメイン分類器が前記ターゲットドメインに分類されたサンプルに対して、前記ソースドメインに分類されたサンプルより高い重みを付与するよう、前記ドメイン分類器を学習させてよい。

サンプルを前記第１のクラスおよび前記第２のクラスのいずれかに分類するクラス分類器をさらに備え、前記疑似サンプル生成部は、前記クラス分類器が前記第２のクラスに分類されたサンプルに対して、前記第１のクラスに分類されたサンプルより高い重みを付与するよう、前記クラス分類器を学習させてよい。

前記データ変換部は、前記ドメイン分類器および前記クラス分類器の少なくとも１つを、第１の損失関数を用いて算出される、前記特徴空間におけるクロスエントロピー損失がより小さくなるよう機械学習してよい。

前記データ変換部は、第２の損失関数を用いて算出される、前記特徴空間における前記ソースドメインと前記ターゲットドメインとの間のＷａｓｓｅｒｓｔｅｉｎ距離がより小さくなるよう機械学習してよい。

本発明に係る情報処理方法の一態様は、情報処理装置が実行する情報処理方法であって、ソースドメインに含まれる第１のクラスのサンプルおよび第２のクラスのサンプルと、ターゲットドメインに含まれる前記第１のクラスのサンプルとから、それぞれ特徴を抽出するステップと、抽出された前記特徴の特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布に基づいて、前記ターゲットドメインの前記第２のクラスの疑似サンプルを生成するステップと、前記特徴空間において、前記ソースドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスのサンプルの分布を、前記ターゲットドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスの前記疑似サンプルの分布に近づくよう機械学習によりデータ変換するステップと、を含む。

本発明に係る情報処理プログラムの一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、ソースドメインに含まれる第１のクラスのサンプルおよび第２のクラスのサンプルと、ターゲットドメインに含まれる前記第１のクラスのサンプルとから、それぞれ特徴を抽出する特徴抽出処理と、前記特徴抽出処理により抽出された前記特徴の特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布に基づいて、前記ターゲットドメインの前記第２のクラスの疑似サンプルを生成する疑似サンプル生成処理と、前記特徴空間において、前記ソースドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスのサンプルの分布を、前記ターゲットドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスの前記疑似サンプルの分布に近づくよう機械学習によりデータ変換するデータ変換処理とを含む処理を実行させるためのものである。

本発明によれば、ターゲットドメインのサンプルがソースドメインのサンプルに十分対応しない場合であっても、高精度な処理結果を得ることができる。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。

図１は、本発明の実施形態に係る学習装置の機能構成の一例を示すブロック図である。図２は、本実施形態に係るソースドメインとターゲットドメインのサンプル分布の非対称性（ドメインシフト）を説明する図である。図３は、本実施形態に係る学習装置が実行する疑似サンプル生成処理を経てドメイン適応されたソースドメインとターゲットドメインを説明する図である。図４は、本実施形態に係る学習装置を、機械学習に実装する場合の学習モデルのモジュール構成および概略処理手順の一例を示す概念図である。図５は、本実施形態に係る学習装置の疑似サンプル生成部が実行する疑似サンプル生成処理の詳細処理手順の一例を示すフローチャートである。図６は、特徴空間上で、ターゲットドメインおよびソースドメインのサンプルからターゲットドメインの疑似サンプルを生成する手順の一例を説明する模式図である。図７は、特徴空間上で、ターゲットドメインおよびソースドメインのサンプルからターゲットドメインの疑似サンプルを生成する手順の他の一例を説明する模式図である。図８は、本実施形態に係る学習装置のハードウエア構成の一例を示すブロック図である。

以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。

本実施形態に係る学習装置は、ソースドメインのサンプルおよびターゲットドメインのサンプルの特徴をそれぞれ抽出し、ソースドメインのサンプルに付与された複数のラベル（クラス）のうちターゲットドメインに十分に含まれていないラベル（クラス）のサンプルを、疑似サンプルとして、特徴空間におけるターゲットドメインの領域に生成し、生成された疑似サンプルでターゲットドメインのサンプルを補完する。
本実施形態に係る学習装置はまた、疑似サンプルが補完されたターゲットドメインに、ソースドメインがドメイン適応するよう機械学習する。

以下では、本実施形態が、例えば、画像を認識および分類する用途に適用される一例を説明するが、本実施形態はこれに限定されず、学習モデルが適用されるべきアプリケーションに応じて、あらゆる種類のデータやドメインに適用可能である。

＜学習装置の機能構成＞
図１は、本実施形態に係る学習装置１の機能構成の一例を示すブロック図である。
図１に示す学習装置１は、データ取得部１１、特徴抽出部１２、疑似サンプル生成部１３、データ変換部１４、および推論部１５を備える。
学習装置１は、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）等で構成されるクライアント装置（不図示）とネットワークを介して通信可能に接続してよい。この場合、学習出装置１はサーバに実装され、クライアント装置は、学習装置１が外部と情報の入出力を実行する際のユーザインタフェースを提供してよく、また、学習装置１の各コンポーネント１１～１５の一部または全部を備えてもよい。

データ取得部１１は、ソースデータセット２からソースドメインのサンプルを、ターゲットデータセット３からターゲットドメインのサンプルを、それぞれ取得して、取得されたソースドメインのサンプルおよびターゲットドメインのサンプルを特徴抽出部１２へ供給する。

ソースデータセット２は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の不揮発性記憶装置で構成され、ドメイン適応元のソースドメインに属するサンプル（標本）を格納する。ソースドメインに属するサンプルを、ソースサンプルという。ソースサンプルは、学習モデルを事前学習させるための教師データであり、各ソースサンプルは、分類上の正解を示すクラスがラベル付けされている。

ターゲットデータセット３は、ソースデータセット２と同様、ＨＤＤ、ＳＳＤ等の不揮発性記憶装置で構成され、ドメイン適応先のターゲットドメインに属するサンプルを格納する。ターゲットドメインに属するサンプルを、ターゲットサンプルという。ターゲットサンプルは、学習モデルを適用すべきタスクが処理対象とするデータと同一のドメインに属するサンプルであり、各ターゲットサンプルは、クラスがラベル付けされていてよいが、必ずしもクラスでラベル付けされていなくてもよい。
なお、ドメインとは、ある１つの確率分布から発生するデータの所属領域をいい、例えば、データの種類、範囲、分布等の属性によりドメインが構成される。

データ取得部１１は、ソースデータセット２およびターゲットデータセット３に予め格納されたソースサンプルおよびターゲットサンプルを読み出すことにより、ソースサンプルおよびターゲットサンプルを取得してもよく、あるいは、ソースサンプルおよびターゲットサンプルを記憶する同一のまたは異なる対向装置から通信Ｉ／Ｆを介して受信してもよい。

データ取得部１１はまた、学習装置１においてドメイン適応の機械学習処理を実行するために必要な各種パラメータの入力を受け付ける。データ取得部１１は、学習装置１と通信可能に接続されるクライアント装置のユーザインタフェースを介して、各種パラメータの入力を受け付けてよい。

特徴抽出部１２は、データ取得部１１から供給されるソースサンプルから、各ソースサンプルの特徴を抽出する。
特徴抽出部１２はまた、データ取得部１１から供給されるターゲットサンプルから、各ターゲットサンプルの特徴を抽出する。
特徴抽出部１２は、抽出されたソースサンプルの特徴およびターゲットサンプルの特徴を、疑似サンプル生成部１３へ供給する。

疑似サンプル生成部１３は、特徴抽出部１２から供給されるソースサンプルの特徴およびターゲットサンプルの特徴に基づいて、ターゲットドメインのターゲットサンプルにおいて、出現していない、または不足しているクラスのターゲットサンプルを、疑似サンプルとして生成する。

本実施形態では、疑似サンプル生成部１３は、特徴抽出部１２から供給されるソースサンプルの特徴およびターゲットサンプルの特徴を特徴空間上にマッピングし、特徴空間上のターゲットサンプルの分布の信頼度を推定し、推定された信頼度に基づいて疑似サンプルを生成することで、ターゲットドメインのターゲットサンプルを補完する。疑似サンプル生成部１３はさらに、特徴空間上のソースサンプルの分布の信頼度を推定し、推定された信頼度に基づいて疑似サンプルを生成してよい。
疑似サンプル生成部１３が実行する疑似サンプル生成処理の詳細は、図５を参照して後述する。

データ変換部１４は、特徴抽出部１２から供給されるソースドメインのソースサンプルの特徴の分布を、ターゲットドメインのターゲットサンプルの特徴の分布に一致させるようデータ変換を実行する。すなわち、データ変換部１４は、ソースサンプルの特徴およびターゲットサンプルの特徴を入力として、学習モデルに学習させるべき教師データを、ソースドメインのデータからターゲットドメインのデータに変換する、ドメイン適応を実行する。

本実施形態において、データ変換部１４は、疑似サンプル生成部１３により生成された疑似サンプルでターゲットドメインを補完し、疑似サンプルが補完されたターゲットドメインのターゲットサンプルの特徴を入力として、ソースドメインからターゲットドメインへのドメイン適応を実行する。
データ変換部１４は、変換された教師データ（学習データ）を用いて、学習モデルにおけるドメイン適応の関数のパラメータ値を機械学習する。

推論部１５は、データ変換部１４によりドメイン適応が適用された学習済みの学習モデルにより、入力データに対して各種処理結果を出力する。
このように機械学習された学習済みの学習モデルは、ターゲットドメインにおいて、疑似サンプルとして生成されたターゲットサンプルが未出現クラスのターゲットサンプルを補完しているため、各種推論処理における精度の低下が有効に防止される。

＜ドメイン適応と疑似サンプル生成＞
図２は、本実施形態に係るソースドメインとターゲットドメインのサンプル分布の非対称性（ドメインシフト）を説明する図である。
図２（ａ）は、ソースドメインに属するソースサンプルの特徴値Ｐ_ｓ（ｘ）の分布と、ターゲットドメインに属するターゲットサンプルの特徴値Ｐ_ｔ（ｘ）の分布とを示す。図２（ａ）に示されるように、ターゲットサンプルの特徴値の分布は、ソースサンプルの特徴値の分布と一致しておらず、ソースサンプルの特徴値の分布に対して、正方向に共変量（ｃｏｖａｒｉａｔｅ）シフトしている（Ｐ_ｓ（ｘ）≠Ｐ_ｔ（ｘ））。

図２（ｂ）は、ソースドメインに属するソースサンプルのクラス別の分布（Ｐ_ｓ（ｙ））と、ターゲットドメインに属するターゲットサンプルのクラス別の分布（Ｐ_ｔ（ｙ））とを示す。図２（ｂ）では、ソースドメインおよびターゲットドメインはいずれも２つのクラス（－１、＋１）を持つものとする。
図２（ｂ）に示されるように、ソースドメインにおいては、クラス（－１）にラベル付けされたソースサンプル数とクラス（＋１）にラベル付けされたソースサンプル数は、ほぼ同数である。一方、ターゲットドメインにおいては、クラス（－１）にラベル付けされたターゲットサンプル数は、クラス（－１）のソースサンプル数とほぼ同数なのに対して、クラス（＋１）にラベル付けされたターゲットサンプル数は、クラス（＋１）のソースサンプル数より著しく低く、ターゲットドメインはクラス分布においてもシフトを起こしている（Ｐ_ｓ（ｙ＝＋１）≠Ｐ_ｔ（ｙ＝＋１））。

非限定的一例として、ソースドメインがイラスト画像、ターゲットドメインが実写画像であり、入力画像を犬画像と猫画像とのいずれかのクラスに分類する学習モデルを得るため、学習モデルにドメイン適応を適用する場合を考える。
ソースドメインのソースサンプルは、犬を描いた犬のイラスト画像（Ｐ_ｓ（ｙ＝－１））と、猫を描いた猫のイラスト画像（Ｐ_ｓ（ｙ＝＋１））との双方を含み、各ソースサンプルは、犬のクラス（－１）と猫のクラス（＋１）とのいずれかがラベル付けされている。
一方、ターゲットドメインのターゲットサンプルは、図２（ｂ）に示すように、犬が撮像された犬の実写画像（Ｐ_ｔ（ｙ＝－１））がほぼ全てであり、猫が撮像された猫の実写画像（Ｐ_ｔ（ｙ＝＋１））は全く、あるいはごく僅かしか用意できなかったものとする。

実際に学習モデルを使用する推論フェーズ、すなわち入力画像をクラス分類するタスクのフェーズでは、犬の実写画像だけでなく猫の実写画像も入力されることが想定されるため、犬の実写画像と猫の実写画像とを高精度に区別することが要請される。
しかしながら、図２（ｂ）に示すように、ターゲットドメインに猫の実写画像（Ｐ_ｔ（ｙ＝＋１））が不足しているため、学習モデルにドメイン適応を適用しても、猫の実写画像を犬の実写画像と区別して分類する精度が低下してしまう。

本実施形態は、これに対して、学習モデルをドメイン適応させるに際して、ターゲットドメインにおいて不足している猫の実写画像（Ｐ_ｔ（ｙ＝＋１））を疑似サンプルとして生成し、生成された疑似サンプルでターゲットドメインを補完する。

図３は、本実施形態に係る学習装置１が実行する疑似サンプル生成処理を経てドメイン適応されたソースドメインとターゲットドメインを説明する図である。
図３（ａ）は、ドメイン適応後のソースドメインに属するソースサンプルの特徴値（Ｐ_ｓ（ｘ））の分布と、ターゲットドメインに属するターゲットサンプルの特徴値（Ｐ_ｔ（ｘ））の分布とを示す。図３（ａ）に示されるように、ターゲットサンプルの特徴値の分布は、ソースサンプルの特徴値の分布とほぼ一致している（Ｐ_ｓ（ｘ）≒Ｐ_ｔ（ｘ））。

図３（ｂ）は、ソースドメインに属するソースサンプルのクラス（＋１）の分布（Ｐ_ｓ（ｙ））と、ターゲットドメインに属するターゲットサンプル群のクラス（＋１）の分布（Ｐ_ｔ（ｙ））とを示す。
ドメイン適応に際して、クラス（＋１）について生成された疑似サンプルでターゲットドメインが補完されたため、図３（ｂ）に示すように、ソースドメインにおけるクラス（＋１）にラベル付けされたソースサンプル数と、ターゲットドメインにおけるクラス（＋１）にラベル付けされたターゲットサンプル数とは、ほぼ同数となっている（Ｐ_ｓ（ｙ＝＋１）≒Ｐ_ｔ（ｙ＝＋１））。
図３（ａ）および図３（ｂ）に示されるように、本実施形態によれば、ソースドメインとターゲットドメイン間で発生し得る、特徴値分布のシフトだけでなくクラス間のシフトも解消され得る。

＜機械学習用学習モデルのモジュール構成＞
図４は、本実施形態に係る学習装置１を機械学習モデルに実装する場合のモジュール構成および概略処理手順の一例を示す概念図である。
図４を参照して、学習装置１は、特徴抽出モジュール１２１、１２２、符号化モジュール１４１、疑似サンプル生成モジュール１３、分類器モジュール１４２、およびデータ変換モジュール１４３から構成されてよい。図４に示す各モジュールのうち、符号化モジュール１４１、疑似サンプル生成モジュール１３、分類器モジュール１４２、およびデータ変換モジュール１４３が、特徴抽出モジュール１２１、１２２の後段としてのドメイン適応モジュール１４を構成する。

図４では、入力画像を認識および分類する学習モデルを学習させる例を説明する。
なお、図４の各特徴抽出モジュール１２１、１２２は、学習装置１の特徴抽出部１２に、疑似サンプル生成モジュール１３は、学習装置１の疑似サンプル生成部１３に、符号化モジュール１４１、分類器モジュール１４２、およびデータ変換モジュール１４３を含むドメイン適用モジュール１４は、学習装置１のデータ変換部１４に、それぞれ対応する。

特徴抽出モジュール１２１は、ソースドメインのソース画像を入力とし、各ソース画像から特徴を抽出して、ソース画像の特徴を出力する。
特徴抽出モジュール１２２は、ターゲットドメインのターゲット画像を入力とし、各ターゲット画像から特徴を抽出して、ターゲット画像の特徴を出力する。
なお、学習モデルを学習させる際に、特徴抽出モジュール１２１、１２２を並行して実行してもよく、特徴抽出モジュール１２１、１２２のいずれかを先に他方を後に順に実行してもよい。

ソース画像およびターゲット画像の画像特徴を抽出する特徴抽出モジュール１２１、１２２は、例えば、畳み込みニューラルネットワーク（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ：ＣＮＮ）により構成されてよい。
特徴抽出モジュール１２１、１２２はさらに、ソース画像およびターゲット画像に対してデータ拡張（ｄａｔａａｕｇｍｅｎｔａｔｉｏｎ）のアルゴリズムを適用して、画像中の解析対象のオブジェクト（例えば、人間）を画像中央に適切なスケールで位置付けたり、背景を除去したりしてよい。
特徴抽出モジュール１２１、１２２はさらに、例えば、ＡｔｔｅｎｔｉｏｎＢｒａｎｃｈＮｅｔｗｏｒｋ（ＡＢＮ）等のアテンション機構を適用して、ソース画像およびターゲット画像から、画像中の注視領域のマップ（ａｔｔｅｎｔｉｏｎｍａｐ）を生成、最適化して、抽出された画像特徴を重み付けしてもよい。

ドメイン適応モジュール１４の符号化モジュール１４１は、特徴抽出モジュールが出力したソース画像の特徴およびターゲット画像の特徴を、共通の特徴空間に符号化（エンコーディング）する。
ここで、ソースドメインには、正（ｐｏｓｉｔｉｖｅ）クラスの特徴ベクタｚ_ｓ ^＋と、負（ｎｅｇａｔｉｖｅ）クラスの特徴ベクタｚ_ｓ ^－との双方が含まれているものとする（ｚ_ｓ ^＋，ｚ_ｓ ^－∈Ｒ^ｄ）。一方、ターゲットドメインには負クラスの特徴ベクタｚ_ｔ ^－のみが含まれているものとする（ｚ_ｔ ^－∈Ｒ^ｄ）。すなわち、正クラスは、ターゲットドメインにおいて未出現（未観測）のクラスである。符号化モジュール１４１に入力されるこれらの特徴ベクタは、ｄ次元の特徴ベクタであるとする。

符号化モジュール１４１は、ドメイン不変（ｄｏｍａｉｎｉｎｖａｒｉａｎｔ）である特徴空間のパラメータを学習し、例えば、学習可能なマッピング関数Ｇとしての全結合層（ＦｕｌｌｙＣｏｎｎｅｃｔｅｄＬａｙｅｒ）に実装されてよい。
符号化モジュール１４１は、符号化された特徴ベクタ＾ｚ_ｓ ^－、＾ｚ_ｓ ^＋、＾ｚ_ｔ ^－を出力する。これらの符号化特徴ベクタは、ｍ次元（ｍ＜ｄ）の特徴ベクタであるとする（＾ｚ∈Ｒ^ｍ）。

疑似サンプル生成モジュール１３は、共通の特徴空間にマッピングされた、符号化された特徴ベクタ＾ｚ_ｓ ^－、＾ｚ_ｓ ^＋、＾ｚ_ｔ ^－を入力として、ターゲットドメインにおいて未出現である正（ｐｏｓｉｔｉｖｅ）クラスの疑似サンプルを生成し、生成された正クラスの疑似サンプルを正クラスの特徴ベクタ＾ｚ_ｔ ^＋と見做して、ターゲットドメインのサンプルを補完する。
なお、図４では、疑似サンプル生成モジュール１３は、疑似サンプル生成処理を、符号化モジュール１４１による特徴ベクタの符号化の後に実行しているが、これに替えて、疑似サンプル生成処理を、符号化モジュール１４１による特徴ベクタの符号化の前に実行してもよい。
疑似サンプル生成モジュールによる疑似サンプル生成処理の詳細は、図５を参照して後述する。

Ｓ５で、ドメイン適応モジュールの分類器モジュール１４２（ｄｉｓｃｒｉｍｉｎａｔｏｒ）は、符号化された特徴ベクタ＾ｚを分類する（＾ｚ∈Ｒ^ｍ）。
分類器モジュール１４２は、入力される符号化特徴ベクタをソースドメインおよびターゲットドメインのいずれかのドメインに分類するドメイン分類器（Ｃ＿ｄ）と、入力される符号化特徴ベクタを正クラスおよび負クラスのいずれかのクラスに分類するクラス分類器（Ｃ＿ｃ）とを備えてよい。

分類器モジュール１４２は、例えば、学習可能なマッピング関数Ｃとしての全結合層（ＦｕｌｌｙＣｏｎｎｅｃｔｅｄＬａｙｅｒ）に実装されてよく、Ｒ^ｍをＲ^ｃにマッピングすることで分類を実行する。上記のドメイン分類器およびクラス分類器において、ｃ＝２である。
分類器モジュール１４２は、例えば、以下の式１で示される損失を最小化するための損失関数Ｌｃを用いて、ドメイン間やクラス間でのバイナリクロスエントロピー（ｂｉｎａｒｙｃｒｏｓｓｅｎｔｒｏｐｙ）損失がより小さくなるよう機械学習することで、分類性能を維持することができる。

（式１）

ここで、

は、ｉ番目のソースサンプルのバイナリラベルを示し、

は、指標関数である。なお、分類器モジュールは、上記式１で、バイナリクロスエントロピー損失に替えて、二乗誤差等、他の損失を算出してもよい。

ドメイン適応モジュール１４のデータ変換モジュール１４３は、ソースドメインとターゲットドメインとの間のデータの不一致（ｄｉｓｃｒｅｐａｎｃｙ）が最小化されるよう、符号化された特徴ベクタ表現＾ｚ（＾ｚ∈Ｒ^ｍ）を、実数ｚ（ｚ∈Ｒ）に変換する。すなわち、データ変換モジュール１４３は、ドメイン適応を評価するモジュール（ｄｏｍａｉｎｃｒｉｔｉｃ）である。
データ変換モジュール１４３は、例えば、学習可能な変換関数Ｆとしての全結合層に実装されてよい。

具体的には、データ変換モジュール１４３は、符号化されたソースドメインの特徴ベクタ＾ｚ_ｓ ^－、＾ｚ_ｓ ^＋と、符号化されたターゲットドメインの特徴ベクタ＾ｚ_ｔ ^－および疑似サンプルである正クラスの特徴ベクタ＾ｚ_ｔ ^＋とを入力として、ソースドメインの符号化特徴ベクタ＾ｚ_ｓ ^－、＾ｚ_ｓ ^＋とターゲットドメインの符号化特徴ベクタ＾ｚ_ｔ ^－、＾ｚ_ｔ ^＋との間の共通の特徴空間における距離を推定し、この距離が最小化するよう機械学習することで、ソースドメインの符号化特徴ベクタをターゲットドメインの符号化特徴ベクタにドメイン適応させる。
この距離は、例えば、距離空間上の確率分布間の距離としてのＷａｓｓｅｒｓｔｅｉｎ距離であってよいが、データ変換モジュール１４３は、他の距離を用いてもよい。
データ変換モジュール１４３は、例えば、以下の式２で示される損失を最小化するための損失関数Ｌｗを用いて、ソースドメインとターゲットドメインとの間でサンプル分布間の距離の損失がより小さくなるよう機械学習を実行することで、ドメイン適応を実行する。

（式２）

ここで、ｎ_ｓはソースドメインにおける正クラスおよび負クラスのサンプル数を示し、ｎ_ｔはターゲットドメインにおける正クラスおよび負クラスのサンプル数を示す。
本実施形態では、疑似サンプル生成モジュール１３により生成された疑似正サンプルの符号化特徴ベクタがターゲットドメインに追加されているため、データ変換モジュール１４３は、ターゲットドメインに追加された疑似正サンプルの符号化特徴ベクタを用いて、高精度にドメイン適応を実行することができる。

なお、学習モデルを機械学習させる際に、分類器モジュール１４２およびデータ変換モジュール１４３を並行して実行してもよく、分類器モジュール１４２およびデータ変換モジュール１４３のいずれかを先に他方を後に順に実行してもよい。分類器モジュール１４２による学習およびデータ変換モジュール１４３による学習は、敵対的学習として実行されてよい。

学習モデルを学習させるドメイン適応モジュール１４は、マッピング関数Ｇ、マッピング関数Ｃ、および変換関数Ｆの各パラメータが最適化されて、上記損失関数のトータルでの損失が最小化されるよう、機械学習を繰り返していく。これにより、ドメイン不変である共通の特徴空間のパラメータが学習されて、ソースドメインの特徴空間における正サンプル分布および負サンプル分布が、ターゲットドメインの特徴空間における正サンプル分布および負サンプル分布へ高精度にドメイン適応される。
なお、図４に示す学習モデルのモジュール構成は一例であり、本実施形態に係る学習装置１は、他の特徴抽出やドメイン適応の手法を用いてよい。

＜疑似サンプル生成処理の詳細処理手順＞
図５は、本実施形態に係る学習装置１の疑似サンプル生成部１３が実行する疑似サンプル生成処理の詳細処理手順の一例を示すフローチャートである。
なお、図５の各ステップは、学習装置１のＨＤＤ等の記憶装置に記憶されたプログラムをＣＰＵが読み出し、実行することで実現される。また、図５に示すフローチャートの少なくとも一部をハードウエアにより実現してもよい。ハードウエアにより実現する場合、例えば、所定のコンパイラを用いることで、各ステップを実現するためのプログラムからＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）上に自動的に専用回路を生成すればよい。また、ＦＰＧＡと同様にしてＧａｔｅＡｒｒａｙ回路を形成し、ハードウエアとして実現するようにしてもよい。また、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）により実現するようにしてもよい。

Ｓ５１で、学習装置１の疑似サンプル生成部１３は、サンプルをソースドメインおよびターゲットドメインのいずれかのドメインに分類するドメイン分類器を事前学習させる。ドメイン分類器は、ターゲットドメインに分類されるサンプルに対して、ソースドメインに分類されるサンプルより高い重みを付与するよう訓練される。
Ｓ５１では、疑似サンプル生成部１３はさらに、サンプルを正（ｐｏｓｉｔｉｖｅ）クラスおよび負（ｎｅｇａｔｉｖｅ）クラスのいずれかのクラスに分類するクラス分類器を、事前学習させてよい。クラス分類器は、正クラスに分類されるサンプルに対して、負クラスに分類されるサンプルより高い重みを付与するよう訓練される。

Ｓ５２で、学習装置１の疑似サンプル生成部１３は、特徴空間上のターゲットドメインの負クラスサンプルの分布から、ターゲットドメインの負クラスサンプルの信頼度を推定する。
具体的には、疑似サンプル生成部１３は、特徴空間上のターゲットドメインの負クラスサンプルの分布の平均ベクタ（ｍｅａｎｖｅｃｔｏｒ）および共分散行列（ｃｏｖａｒｉａｎｃｅｍａｔｒｉｘ）を推定し、ターゲットドメインの負クラスサンプルの分布に対する負クラスサンプル確率値（ｐｒｏｂａｂｉｌｉｔｙｖａｌｕｅ）を、ターゲットドメインの負クラスサンプルの信頼度（ｃｏｎｆｉｄｅｎｃｅｓｃｏｒｅ）として推定する。ここで、負クラスサンプルの分布は、ガウス（Ｇａｕｓｓｉａｎ）分布（正規分布）と見做すことができる。

S５３で、学習装置１の疑似サンプル生成部１３は、特徴空間上のターゲットドメインの領域に疑似正クラスサンプルを生成する。
S５２で推定された、特徴空間上のターゲットドメインの負クラスサンプルの信頼度スコアが、ｐ（D_ｔ ^－｜ｘ^＋）であるとすると、特徴空間上のターゲットドメインの疑似正クラスサンプルの信頼度は、以下の式３として推定できる。
ｐ（D_ｔ ^＋｜ｘ^＋）＝１－ｐ（D_ｔ ^－｜ｘ^＋）（式３）

具体的には、疑似サンプル生成部１３は、ターゲットドメインの負クラスサンプルの信頼度の特徴空間上の勾配に基づいて、ターゲットドメインの負クラスサンプルの信頼度が低い領域周囲に均一にターゲットドメインの疑似正クラスサンプルを生成する。

疑似サンプル生成部１３は、ソースドメインにおける正クラスサンプルおよび負クラスサンプルのクラス間距離の平均および標準偏差に基づき決定されるターゲットドメインの領域に、疑似正クラスサンプルを生成してよい。
すなわち、ソースドメインにおける正クラスサンプルおよび負クラスサンプルのクラス間距離は、ターゲットドメインにおける正クラスサンプルおよび負クラスサンプルのクラス間距離と等しいものと見做すことができる。このため、疑似サンプル生成部１３は、ターゲットドメインの負クラスサンプルが分布する領域から上記クラス間距離の分だけ離隔した領域に、ターゲットドメインの疑似正クラスサンプルを生成してよい。

疑似サンプル生成部１３はまた、ソースドメインの正クラスサンプルの数と同数の疑似正クラスサンプルを、ターゲットドメインの領域に生成してよい（N_ｔ ^＋＝N_ｓ ^＋）。ドメイン分類器（Ｃ＿ｄ）は、生成された疑似正クラスサンプルを、ターゲットドメインに分類する。

S５４で、学習装置１の疑似サンプル生成部１３は、特徴空間上のソースドメインの正クラスサンプルの分布の平均ベクタおよび共分散行列を推定し、ソースドメインの正クラスサンプルの分布に対する正クラスサンプル確率値を、ソースドメインの正クラスサンプルの信頼度として推定する。ここで、正クラスサンプルの分布も、ガウス分布（正規分布）と見做すことができる。疑似サンプル生成部１３は、Ｓ５３と同様、ソースドメインの正クラスサンプルの信頼度の特徴空間上の勾配に基づいて、ソースドメインの正クラスサンプルの信頼度が低い領域周囲に均一にターゲットドメインの疑似正クラスサンプルを生成してよい。
クラス（コンテンツ）分類器（Ｃ＿ｃ）は、ソースドメインの正クラスサンプルの信頼度ｐ（Ｄ_ｓ ^＋｜ｘ^＋）を用いて、疑似正クラスサンプルの信頼度を更新してよい。

S５５で、学習装置１の疑似サンプル生成部１３は、Ｓ５１で学習させたドメイン分類器およびクラス分類器を用いて、ターゲットドメインの負クラスサンプルの信頼度およびソースドメインの正クラスサンプルの信頼度を結合して、サンプルの重みを更新する。ターゲットドメインの負クラスサンプルの信頼度は、式３に示すように、ターゲットドメインの正クラスサンプルの信頼度に変換される。
ここで、正クラス（ｙ＝＋１）に分類されたサンプルは、より高い重みを持つ。また、以下の式４に示すように、ソースドメインの正サンプルの分布（Ｄ_ｓ ^＋）とターゲットドメインの正サンプルの分布（Ｄ_ｔ ^＋）とが条件付き独立であるものと推定される。
ｐ（Ｄ_ｓ ^＋，Ｄ_ｔ ^＋｜ｘ^＋）＝ｐ（Ｄ_ｓ ^＋｜ｘ^＋）ｐ（Ｄ_ｔ ^＋｜ｘ^＋）（式４）

Ｓ５６で、学習装置１の疑似サンプル生成部１３は、Ｓ５５でより高い重みが付与されたサンプルのパラメータ分布を算出し、特徴空間上でターゲットドメインの疑似正クラスサンプルをリサンプリングする。
具体的には、疑似サンプル生成部１３は、信頼度を重みとして、より高い信頼度を持つ疑似正クラスサンプルの領域におけるサンプル数を増大し（ｕｐ－ｓａｍｐｌｅ）、より低い信頼度を持つ疑似正クラスサンプルの領域におけるサンプル数を減少させる（ｄｏｗｎ－ｓａｍｐｌｅ）。

Ｓ５７で、学習装置１の疑似サンプル生成部１３は、所定の収束条件に到達するまで、Ｓ５１～Ｓ５６までの処理を繰り返す。
収束条件としては、例えば、Ｓ５４～Ｓ５５の処理をバイパスしてソースドメインの正クラスサンプルの情報を用いない場合には、図５に示す処理を所定回数繰り返したことで収束と見做してよい。
あるいは、ソースドメインの正クラスサンプルの情報を用いる場合には、繰り返しの回数で収束条件を設定してもよいが、例えば、距離の閾値を設定し、ソースドメインの正クラスサンプルと負クラスサンプルの分布の間の距離と、ターゲットドメインの正クラスサンプルと負クラスサンプルの分布の間の距離とが所定の閾値内に収束したことを収束条件として設定してもよい。また、サンプルの分布の間の距離に替えて、サンプルの信頼度の間の距離を用いてもよい。ここで、距離としては、例えば、Ｊｅｎｓｅｎ－Ｓｈａｎｎｏｎダイバージェンスを用いることができる。

図６は、特徴空間上で、ターゲットドメインおよびソースドメインのサンプルからターゲットドメインの疑似正クラスサンプルを生成する手順の一例を説明する模式図である。
図６（ａ）を参照して、特徴空間上、左側がソースドメインの領域、右側がターゲットドメインの領域を示す。垂直線６１は、ドメイン分類器により画定される特徴空間上のソースドメインとターゲットドメインとの境界を示す。
ソースドメインの領域は、（－）で示される負クラスサンプルの分布と、負クラスサンプルの分布の上方に、（＋）で示される正クラスサンプルの分布とを含む。一方、ターゲットドメインの領域は、（－）で示される負クラスサンプルの分布を含むが、正クラスサンプルの分布は出現していない。

図６（ｂ）を参照して、学習装置１の疑似サンプル生成部１３は、特徴空間上のターゲットドメインの領域に、疑似正クラスサンプルを生成する。境界６１の右側のターゲットドメインの領域において、（－）で示される負クラスサンプルの分布は、ターゲットドメインの負クラスサンプルの信頼度が高い領域であることを示す。
疑似サンプル生成部１３は、このターゲットドメインの（－）で示される負クラスサンプルの分布から離れるほど、ターゲットドメインの負クラスサンプルの信頼度が低い領域であり、したがって、ターゲットドメインの疑似正クラスサンプルの信頼度が高い領域であると判断し、ターゲットドメインの（－）で示される負クラスサンプルの分布の周囲に均一に疑似正クラスサンプルの領域６３～６７を複数生成する（図５のＳ５３）。

図６（ｃ）を参照して、学習装置１の疑似サンプル生成部１３は、特徴空間上のターゲットドメインの領域において、疑似正クラスサンプルをリサンプリングする。水平線６２は、クラス分類器により画定される正クラスと負クラスとの境界を示す。

疑似サンプル生成部１３は、図６（ｂ）でターゲットドメインに生成された複数の疑似正クラスサンプルの領域６３～６７のうち、ソースドメインの（＋）で示される正クラスサンプルの分布に対して距離がより近い領域６３を、疑似正クラスサンプルの信頼度が高い領域であると判断して、より高い重みを付与する。
一方、複数の疑似正クラスサンプルの領域６３～６７のうち、ソースドメインの（＋）で示される正クラスサンプルの分布に対して距離がより遠い領域６４～６７は、疑似正クラスサンプルの信頼度が低い領域であると判断して、より低い重みを付与する。また、水平線６２の下の疑似正クラスサンプルの領域６５～６７は、クラス分類器により負クラスの領域であると判断されるため、水平線６２の上の疑似正クラスサンプルの領域よりさらに低い重みが付与されてもよく、疑似正クラスサンプルが削除されてもよい。
疑似サンプル生成部１３は、最終的に、より高い信頼度が算出された疑似正クラスサンプルの領域６３に疑似正クラスサンプルを生成すればよい。

図７は、特徴空間上で、ターゲットドメインおよびソースドメインのサンプルからターゲットドメインの疑似正クラスサンプルを生成する手順の他の一例を説明する模式図である。
図７（ａ）を参照して、特徴空間上、左側がソースドメインの領域、右側がターゲットドメインの領域を示す。垂直線７１は、ドメイン分類器により画定される特徴空間上のソースドメインとターゲットドメインとの境界を示す。
ソースドメインの領域は、（－）で示される負クラスサンプルの分布と、負クラスサンプルの分布の上方に、（＋）で示される正クラスサンプルの分布とを含む。一方、ターゲットドメインの領域は、（－）で示される負クラスサンプルの分布を含むが、正クラスサンプルの分布は出現していない。ただし、図６（ａ）と異なり、ターゲットドメインの（－）で示される負クラスサンプルの分布は、境界７１を隔てて、ソースドメインの（－）で示される負クラスサンプルの分布より(＋)で示される正クラスサンプルの分布により隣接している。

図７（ｂ）を参照して、学習装置１の疑似サンプル生成部１３は、特徴空間上のターゲットドメインの領域に、疑似正クラスサンプルを生成する。境界７１の右側のターゲットドメインの領域において、（－）で示される負クラスサンプルの分布は、ターゲットドメインの負クラスサンプルの信頼度が高い領域であることを示す。
疑似サンプル生成部１３は、このターゲットドメインの（－）で示される負クラスサンプルの分布から離れるほど、ターゲットドメインの負クラスサンプルの信頼度が低い領域であり、したがって、ターゲットドメインの疑似正クラスサンプルの信頼度が高い領域であると判断し、ターゲットドメインの（－）で示される負クラスサンプルの分布の周囲に均一に疑似正クラスサンプルの領域７３～７７を複数生成する（図５のＳ５３）。

図７（ｃ）を参照して、学習装置１の疑似サンプル生成部１３は、特徴空間上のターゲットドメインの領域において、疑似正クラスサンプルをリサンプリングする。斜線７２は、クラス分類器により画定される正クラスと負クラスとの境界を示す。

疑似サンプル生成部１３は、図７（ｂ）でターゲットドメインに生成された複数の疑似正クラスサンプルの領域７３～７７のうち、ソースドメインの（＋）で示される正クラスサンプルの分布に対して距離がより近い領域７３を、疑似正クラスサンプルの信頼度が高い領域であると判断して、より高い重みを付与する。
一方、複数の疑似正クラスサンプルの領域７３～７７のうち、ソースドメインの（＋）で示される正クラスサンプルの分布に対して距離がより遠い領域７４～７７は、疑似正クラスサンプルの信頼度が低い領域であると判断して、より低い重みを付与する。また、斜線７２の下の疑似正クラスサンプルの領域７５～７７は、クラス分類器により負クラスの領域であると判断されるため、斜線７２の上の疑似正クラスサンプルの領域よりさらに低い重みが付与されてもよく、疑似正クラスサンプルが削除されてもよい。
疑似サンプル生成部１３は、最終的に、より高い信頼度が算出された疑似正クラスサンプルの領域７３に疑似正クラスサンプルを生成すればよい。

＜学習装置のハードウエア構成＞
図８は、本実施形態に係る学習装置１のハードウエア構成の非限定的一例を示す図である。
本実施形態に係る学習装置１は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図８を参照して、学習装置１は、単一のコンピュータに実装される例が示されているが、本実施形態に係る学習装置１は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。

図８に示すように、学習装置１は、ＣＰＵ８１と、ＲＯＭ８２と、ＲＡＭ８３と、ＨＤＤ８４と、入力部８５と、表示部８６と、通信Ｉ／Ｆ８７と、システムバス８８とを備えてよい。学習装置１はまた、外部メモリを備えてよい。
ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）８１は、学習装置１における動作を統括的に制御するものであり、データ伝送路であるシステムバス８８を介して、各構成部（８２～８７）を制御する。
学習装置１はまた、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を備えてよい。ＧＰＵは、ＣＰＵ８１より高い計算機能を有し、複数または多数のＧＰＵを並列して動作させることにより、特に、本実施形態のような機械学習を使用する画像処理等のアプリケーションに、より高い処理パフォーマンスを提供する。ＧＰＵは、通常、プロセッサと共有メモリを含む。それぞれのプロセッサが高速の共有メモリからデータを取得し、共通プログラムを実行することで、同種の計算処理を大量かつ高速に実行する。

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）８２は、ＣＰＵ８１が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）８４、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の不揮発性メモリや着脱可能な記憶媒体（不図示）等の外部メモリに記憶されていてもよい。
ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）８３は、揮発性メモリであり、ＣＰＵ８１の主メモリ、ワークエリア等として機能する。すなわち、ＣＰＵ８１は、処理の実行に際してＲＯＭ８２から必要なプログラム等をＲＡＭ８３にロードし、当該プログラム等を実行することで各種の機能動作を実現する。

ＨＤＤ８４は、例えば、ＣＰＵ８１がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、ＨＤＤ８４には、例えば、ＣＰＵ８１がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部８５は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部８６は、液晶ディスプレイ（ＬＣＤ）等のモニターにより構成される。表示部８６は、異常シーン検出処理で使用される各種パラメータや、他の装置との通信で使用される通信パラメータ等をパラメータ調整装置１へ指示入力するためのユーザインタフェースであるＧＵＩ（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ）を提供してよい。

通信Ｉ／Ｆ８７は、学習装置１と外部装置との通信を制御するインタフェースである。
通信Ｉ／Ｆ８７は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信Ｉ／Ｆ８７を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信Ｉ／Ｆ８７は、イーサネット（登録商標）等の通信規格に準拠する有線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＺｉｇＢｅｅ（登録商標）、ＵＷＢ（ＵｌｔｒａＷｉｄｅＢａｎｄ）等の無線ＰＡＮ（ＰｅｒｓｏｎａｌＡｒｅａＮｅｔｗｏｒｋ）を含む。また、Ｗｉ－Ｆｉ（ＷｉｒｅｌｅｓｓＦｉｄｅｌｉｔｙ）（登録商標）等の無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）や、ＷｉＭＡＸ（登録商標）等の無線ＭＡＮ（ＭｅｔｒｏｐｏｌｉｔａｎＡｒｅａＮｅｔｗｏｒｋ）を含む。さらに、ＬＴＥ／３Ｇ、４Ｇ、５Ｇ等の無線ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。

図１に示す学習装置１の各要素のうち少なくとも一部の機能は、ＣＰＵ８１がプログラムを実行することで実現することができる。ただし、図１に示す学習装置１の各要素のうち少なくとも一部の機能が専用のハードウエアとして動作するようにしてもよい。この場合、専用のハードウエアは、ＣＰＵ８１の制御に基づいて動作する。

以上説明したように、本実施形態によれば、学習装置は、ソースドメインのサンプルおよびターゲットドメインのサンプルの特徴をそれぞれ抽出し、ソースドメインのサンプルにラベル付けされた複数のクラスのうちターゲットドメインに十分に含まれていないクラスのサンプルを、疑似サンプルとして、特徴空間におけるターゲットドメインの領域に生成し、生成された疑似サンプルでターゲットドメインのサンプルを補完する。
本実施形態に係る学習装置はまた、疑似サンプルが補完されたターゲットドメインに、ソースドメインがドメイン適応するよう機械学習する。

したがって、ソースドメインのサンプルがターゲットドメインのサンプルと十分に対応しない場合であっても、高精度な処理結果を得ることができる。
例えば、映像中にごく僅かな頻度でしか出現しない異常シーン（ａｎｏｍａｌｙｓｃｅｎｅ）を検出するタスクにおいても、ターゲットドメインに、フィルタリングすべき異常シーンの疑似サンプルを生成し、生成された疑似サンプルでターゲットドメインを補完することで、ソースドメインおよびターゲットドメインのクラス間の非対称性が解消される。
これにより、ドメイン適応が高精度に実現され、機械学習モデルの可用性向上に資する。

なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。

１…学習装置、２…ソースデータセット、３…ターゲットデータセット、１１…データ取得部、１２…特徴抽出部、１３…疑似サンプル生成部、１４…データ変換部、１５…推論部、８１…ＣＰＵ、８２…ＲＯＭ、８３…ＲＡＭ、８４…ＨＤＤ、８５…入力部、８６…表示部、８７…通信Ｉ／Ｆ、８８…バス、１２１…ソース特徴抽出モジュール、１２２…ターゲット特徴抽出モジュール、１４１…エンコーダ（符号化モジュール）、１４２…分類器、１４３…データ変換モジュール

Claims

ソースドメインに含まれる第１のクラスのサンプルおよび第２のクラスのサンプルと、ターゲットドメインに含まれる前記第１のクラスのサンプルとから、それぞれ特徴を抽出する特徴抽出部と、
前記特徴抽出部により抽出された前記特徴の特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布に基づいて、前記ターゲットドメインの前記第２のクラスの疑似サンプルを生成する疑似サンプル生成部と、
前記特徴空間において、前記ソースドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスのサンプルの分布を、前記ターゲットドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスの前記疑似サンプルの分布に近づくよう機械学習によりデータ変換するデータ変換部と
を備えることを特徴とする情報処理装置。
前記疑似サンプル生成部は、前記特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布の第１の信頼度を推定し、推定された前記第１の信頼度の勾配に基づいて、前記疑似サンプルを生成する
ことを特徴とする請求項１に記載の情報処理装置。
前記疑似サンプル生成部は、推定された前記第１の信頼度が低い前記特徴空間の領域に、前記疑似サンプルを生成する
ことを特徴とする請求項２に記載の情報処理装置。
前記疑似サンプル生成部は、前記特徴空間における前記ソースドメインに含まれる前記第２のクラスのサンプルの分布の第２の信頼度を推定し、推定された前記第２の信頼度の勾配に基づいて、前記疑似サンプルを生成する
ことを特徴とする請求項１から３のいずれか１項に記載の情報処理装置。
前記疑似サンプル生成部は、前記第１の信頼度と前記第２の信頼度とを結合し、結合された信頼度に基づいて、生成された前記疑似サンプルを、前記特徴空間において前記結合された信頼度がより高い領域に分布させるようリサンプリングする
ことを特徴とする請求項４に記載の情報処理装置。
前記疑似サンプル生成部は、前記特徴空間における前記ソースドメインに含まれる前記第１のクラスのサンプルの分布と前記第２のクラスのサンプルの分布との間の距離に基づいて、前記疑似サンプルを生成する
ことを特徴とする請求項１から５のいずれか１項に記載の情報処理装置。
サンプルを前記ソースドメインおよび前記ターゲットドメインのいずれかに分類するドメイン分類器をさらに備え、
前記疑似サンプル生成部は、前記ドメイン分類器が前記ターゲットドメインに分類されたサンプルに対して、前記ソースドメインに分類されたサンプルより高い重みを付与するよう、前記ドメイン分類器を学習させる
ことを特徴とする請求項１から６のいずれか１項に記載の情報処理装置。
サンプルを前記第１のクラスおよび前記第２のクラスのいずれかに分類するクラス分類器をさらに備え、
前記疑似サンプル生成部は、前記クラス分類器が前記第２のクラスに分類されたサンプルに対して、前記第１のクラスに分類されたサンプルより高い重みを付与するよう、前記クラス分類器を学習させる
ことを特徴とする請求項１から７のいずれか１項に記載の情報処理装置。
前記データ変換部は、前記ドメイン分類器および前記クラス分類器の少なくとも１つを、第１の損失関数を用いて算出される、前記特徴空間におけるクロスエントロピー損失がより小さくなるよう機械学習する
ことを特徴とする請求項８に記載の情報処理装置。
前記データ変換部は、第２の損失関数を用いて算出される、前記特徴空間における前記ソースドメインと前記ターゲットドメインとの間のＷａｓｓｅｒｓｔｅｉｎ距離がより小さくなるよう機械学習する
ことを特徴とする請求項１から９のいずれか１項に記載の情報処理装置。
情報処理装置が実行する情報処理方法であって、
ソースドメインに含まれる第１のクラスのサンプルおよび第２のクラスのサンプルと、ターゲットドメインに含まれる前記第１のクラスのサンプルとから、それぞれ特徴を抽出するステップと、
抽出された前記特徴の特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布に基づいて、前記ターゲットドメインの前記第２のクラスの疑似サンプルを生成するステップと、
前記特徴空間において、前記ソースドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスのサンプルの分布を、前記ターゲットドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスの前記疑似サンプルの分布に近づくよう機械学習によりデータ変換するステップと
を含むことを特徴とする情報処理方法。
情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
ソースドメインに含まれる第１のクラスのサンプルおよび第２のクラスのサンプルと、ターゲットドメインに含まれる前記第１のクラスのサンプルとから、それぞれ特徴を抽出する特徴抽出処理と、
前記特徴抽出処理により抽出された前記特徴の特徴空間における前記ターゲットドメインに含まれる前記第１のクラスのサンプルの分布に基づいて、前記ターゲットドメインの前記第２のクラスの疑似サンプルを生成する疑似サンプル生成処理と、
前記特徴空間において、前記ソースドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスのサンプルの分布を、前記ターゲットドメインに含まれる前記第１のクラスのサンプルおよび前記第２のクラスの前記疑似サンプルの分布に近づくよう機械学習によりデータ変換するデータ変換処理と
を含む処理を実行させるためのものであることを特徴とする情報処理プログラム。