JP7166738B2

JP7166738B2 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JP7166738B2
Application number: JP2019188545A
Authority: JP
Inventors: 慧米川; コウ牛; 茂莉黒川
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2019-10-15
Filing date: 2019-10-15
Publication date: 2022-11-08
Anticipated expiration: 2039-10-15
Also published as: JP2021064174A

Description

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。

近年、ニューラルネットワークを始めとする機械学習の技術が急速に発展してきている。ニューラルネットワークのような教師あり機械学習では、学習に用いる学習データから入出力関係を学習することから、出力を得ようとするときに学習モデルに入力するデータは学習時と同種のデータである必要がある。すなわち、入力データがベクトルデータならば、次元数が同一であり、各次元の平均値や分散といった統計的性質等が学習時から大きく乖離しないことが必要である。しかしながら、学習データの入手が困難な場合、学習時とは異種なデータを入力として出力を得たいことがある。

学習データとは異種なデータを入力として学習モデルから出力を得ることを可能とするために、例えば非特許文献１には、あるベクトル空間（ソースドメイン）に存在するデータを別のベクトル空間（ターゲットドメイン）に変換する手法が提案されている。

具体的には、非特許文献１に開示されている技術では、行列の特異値分解を用いることにより、ソースドメインのベクトル空間からターゲットドメインのベクトル空間への線形変換を得て、これを用いてソースドメインのベクトルデータをターゲットドメインのベクトル空間に変換している。これにより、ソースドメインの学習データの入力の次元数や統計的性質を、事前にターゲットドメインの入力データに合わせておくことができるため、学習データとは異種なデータを入力として学習モデルから出力を得ることができる。

Liu Yang, Li-Ping Jing, and Jian Yu. 2015. Heterogeneous transductive transfer learning algorithm. Ruan Jian Xue Bao/Journal Softw. 26, 11 (2015), 2762-2780.

上記の技術を用いることにより、たしかに、異なるドメインのデータに学習モデルを適用することができる。しかしながら、非特許文献１において学習される線形変換は、同一のクラスに属するソースドメインのベクトルデータとターゲットドメインのベクトルデータを、ターゲットドメインのベクトル空間中の近傍領域に変換する保証はないため、モデル適用時に精度が低下する恐れがある。

本発明はこれらの点に鑑みてなされたものであり、異なるドメインのデータで構築した学習モデルを他のドメインのデータに適用する場合の学習モデルの精度を向上させるための技術を提供することを目的とする。

本発明の第１の態様は、情報処理装置である。この装置は、クラス識別用ベクトル空間のベクトルデータを入力とし、当該ベクトルデータが属するクラスを示すクラスラベルを出力するクラス識別関数を格納するクラス識別関数格納部と、第１ベクトルデータを前記クラス識別用ベクトル空間のベクトルデータである識別用ベクトルデータに変換する第１変換関数を格納する第１変換関数格納部と、前記第１ベクトルデータとは異なる次元数のベクトルデータであって、前記第１ベクトルデータに紐づけられている第２ベクトルデータを、前記識別用ベクトルデータに変換する第２変換関数を格納する第２変換関数格納部と、前記第１変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第１ベクトルデータのクラスラベルの推定値である第１推定値を取得する第１クラス識別部と、前記第２変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第２ベクトルデータのクラスラベルの推定値である第２推定値を取得する第２クラス識別部と、前記第１推定値と前記第２推定値を含む評価関数の評価値に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新する更新部と、を備える。

前記更新部は、前記評価関数の評価値に基づいて、前記クラス識別関数をさらに更新してもよい。

前記評価関数は、互いに紐づけられた前記第１ベクトルデータと前記第２ベクトルデータとのそれぞれから得られた前記第１推定値と前記第２推定値との差が小さい場合は、大きい場合よりも小さな評価値を出力するように構成されていてもよい。

前記更新部は、前記評価関数の評価値が小さくなるように前記クラス識別関数、前記第１変換関数、及び前記第２変換関数のうち少なくとも１つを更新してもよい。

前記更新部は、前記第１ベクトルデータを前記第１変換関数で変換して得られた識別用ベクトルデータと、前記第２ベクトルデータを前記第２変換関数で変換して得られた識別用ベクトルデータとを用いて算出される類似度指標に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新してもよい。

前記第２変換関数格納部は、前記更新部により更新された更新済み第２変換関数をさらに格納してもよく、前記情報処理装置は、更新済み第２変換関数とクラス識別関数との合成関数に前記第２ベクトルデータを入力することで識別処理を実行する識別部をさらに備えてもよい。

本発明の第２の態様は、情報処理方法である。この方法において、プロセッサが、クラス識別用ベクトル空間のベクトルデータを入力とし、当該ベクトルデータが属するクラスを示すクラスラベルを出力するクラス識別関数をクラス識別関数格納部から読み出して取得するステップと、第１ベクトルデータを前記クラス識別用ベクトル空間のベクトルデータである識別用ベクトルデータに変換する第１変換関数を第１変換関数格納部から読み出して取得するステップと、前記第１ベクトルデータとは異なる次元数のベクトルデータであって、前記第１ベクトルデータに紐づけられている第２ベクトルデータを、前記識別用ベクトルデータに変換する第２変換関数を第２変換関数格納部から読み出して取得するステップと、前記第１変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第１ベクトルデータのクラスラベルの推定値である第１推定値を取得するステップと、前記第２変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第２ベクトルデータのクラスラベルの推定値である第２推定値を取得するステップと、前記第１推定値と前記第２推定値を含む評価関数の評価値に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新するステップと、を実行する。

本発明の第３の態様は、プログラムである。このプログラムは、コンピュータに、クラス識別用ベクトル空間のベクトルデータを入力とし、当該ベクトルデータが属するクラスを示すクラスラベルを出力するクラス識別関数をクラス識別関数格納部から読み出して取得する機能と、第１ベクトルデータを前記クラス識別用ベクトル空間のベクトルデータである識別用ベクトルデータに変換する第１変換関数を第１変換関数格納部から読み出して取得する機能と、前記第１ベクトルデータとは異なる次元数のベクトルデータであって、前記第１ベクトルデータに紐づけられている第２ベクトルデータを、前記識別用ベクトルデータに変換する第２変換関数を第２変換関数格納部から読み出して取得するステップと、前記第１変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第１ベクトルデータのクラスラベルの推定値である第１推定値を取得する機能と、前記第２変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第２ベクトルデータのクラスラベルの推定値である第２推定値を取得する機能と、前記第１推定値と前記第２推定値を含む評価関数の評価値に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新する機能と、を実現させる。

このプログラムを提供するため、あるいはプログラムの一部をアップデートするために、このプログラムを記録したコンピュータ読み取り可能な記録媒体が提供されてもよく、また、このプログラムが通信回線で伝送されてもよい。

なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。

本発明によれば、異なるドメインのデータで構築した学習モデルを他のドメインのデータに適用する場合の学習モデルの精度を向上させることができる。

実施の形態の概要を説明するための図である。実施の形態に係る情報処理装置の機能構成を模式的に示す図である。未知のターゲットドメインのデータにクラス識別関数を適用する場合の様子を模式的に示す図である。実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。各関数の繰り返し更新処理を説明するためのフローチャートである。

＜実施の形態の概要＞
図１（ａ）－（ｂ）は、実施の形態の概要を説明するための図である。説明の便宜のため、以下本明細書において、ソースドメインのデータは胸部Ｘ線のデジタル画像に由来するデータであり、ターゲットドメインのデータは胸部Ｘ線のデジタル画像を医師が読影しその結果が記載されたカルテの文章であるものとする。また、ソースドメインに対応するベクトル空間を「第１ベクトル空間」、ターゲットドメインに対応するベクトル空間を「第２ベクトル空間」と記載する。

ソースドメインのデータである各デジタル画像は、それぞれ第１ベクトル空間中の１点に射影することができる。この射影の手法は任意であり種々の手法が存在するが、例えば、デジタル画像の各画素を並べたベクトルを考えたとき、ベクトルデータの各要素を座標値と見なすことにより、ベクトルデータは、ベクトルデータのサイズ（すなわち、デジタル画像の画素数）と同次元の多次元空間における１点に射影することができる。

例えば、デジタル画像の画素数が３であり、各画素の値がそれぞれａ、ｂ、及びｃであるとする。この場合、デジタル画像は、３次元空間中の１点（ａ，ｂ，ｃ）に射影することができる。この他、デジタル画像から１又は複数の特徴量を求めることにより、各特徴量を軸とする多次元空間中にデジタル画像を射影することができる。別の例としては、後述するように、デジタル画像に対して畳み込みニューラルネットワーク（Convolutional Neural Network, CNN）を適用することで、デジタル画像をベクトルデータに変換してもよい。

同様に、ターゲットドメインのデータである各文章も、それぞれ第２ベクトル空間中の１点に射影することができる。この射影の手法も任意であり種々の手法が存在するが、例えば、既知のＷｏｒｄ２ｖｅｃの手法を用いることにより、文章をベクトルデータに変換することができる。変換されたベクトルデータの各要素を座標値と見なすことにより、ベクトルデータは、ベクトルデータのサイズと同次元の多次元空間における１点に射影することができる。

ソースドメインのデジタル画像はそれぞれ、悪性の腫瘍が撮像されているか否かを示すクラスラベルが付与されている。具体的には、悪性の腫瘍が撮像されているデジタル画像は「腫瘍ありクラス」を示すクラスラベルとして「１」が付与され、悪性の腫瘍が撮像されていないデジタル画像は「腫瘍なしクラス」を示すクラスラベルとして「０」が付与されている。

上述したように、ターゲットドメインのデータである文章は、ソースドメインのデータであるデジタル画像を医師が読影して作成したカルテの文章である。したがって、ソースドメインのデータであるデジタル画像と、ターゲットドメインのデータである文章とは紐づけられている。しかしながら、ターゲットドメインのデータには腫瘍の有無を示すラベルは付与されていない。

実施の形態に係る情報処理装置は、例えばニューラルネットワーク等の既知の機械学習手法を用いることにより、ソースドメインのデジタル画像を入力とし、入力したデジタル画像に付与されているクラスラベルを出力する学習モデルを生成する。

具体的には、図１（ａ）に示すように、情報処理装置は、第１変換関数ｆを用いてデジタル画像をクラス識別用ベクトル空間に射影し、クラス識別用ベクトル空間のデータを入力したときに入力データのクラスラベルを出力するクラス識別関数ｈを生成する。

図１（ａ）において、白抜きの丸はクラス識別用ベクトル空間においてクラスラベルが１のデータを表し、黒丸はクラスラベルが０のデータを表している。クラス識別関数ｈは、図１（ａ）において破線上で０を出力し、破線より図中上側の領域で正の値、下側の領域で負の値を出力する関数である。すなわち、クラス識別関数ｈの出力値の正負がクラスラベルに対応する。なお、説明の便宜のため図１（ａ）においてクラスの境界の形（すなわち、クラス識別関数ｈの形）は直線で表しているが、複雑な曲線であってもよい。一般には、クラス識別用ベクトル空間は多次元空間であるため、クラスの境界は複雑な超曲面となり得る。

クラス識別関数ｈは、クラス識別用ベクトル空間で定義される関数である。したがって、ターゲットドメインのデータをクラス識別用ベクトル空間のデータに変換できれば、クラス識別関数ｈを形式的には適用することができる。例えば、ソースドメインのデータである文章をＷｏｒｄ２ｖｅｃでベクトルデータに変換し、変換したベクトルデータを第２変換関数ｇを用いてクラス識別用ベクトル空間のベクトルデータに変換できれば、クラス識別関数ｈを適用することができる。

しかしながら、クラス識別関数ｈは、デジタル画像に由来するクラス識別用ベクトル空間のデータを判別対象として学習されているため、クラス識別用ベクトル空間のデータであったとしても文章に由来するデータでは判別できない恐れがある。図１（ａ）に示す例では、白抜きの四角はクラス識別用ベクトル空間において真のクラスラベルが１の文章に由来するデータを表し、黒の四角は真のクラスラベルが０のデータを表している。図１（ａ）に示すように、クラス識別関数ｈの上側にも黒の四角が存在し、下側にも白抜きの四角が存在する。これは、Ｗｏｒｄ２ｖｅｃ及び第２変換関数ｇを用いて文章をクラス識別用ベクトル空間中のデータに変換しても、クラス識別関数ｈは正しいクラスラベルを出力できないことを示している。

そこで、実施の形態に係る情報処理装置は、後述する「合意原理（Consensus principle）」を用いることにより、各変換関数とクラス識別関数ｈとを最適化する。図１（ｂ）は、合意原理を用いた最適化後の第１変換関数ｆ’、第２変換関数ｇ’、及びクラス識別関数ｈ’を示す模式図である。図１（ｂ）に示すように、第１変換関数ｆ’は、画像データに由来するベクトルを第１変換関数ｆとは異なる点に射影する。同様に、第２変換関数ｇ’は、文章に由来するベクトルを第２変換関数ｇとは異なる点に射影する。また、クラス識別関数ｈ’は、第１変換関数ｆ’又は第２変換関数ｇ’によってクラス識別用ベクトル空間に射影されたデータに基づいて、クラスラベルを判別するように学習されている。

これにより、図１（ｂ）に示すように、クラス識別関数ｈ’は、画像データに由来するクラス識別用ベクトル空間中の点と文章に由来するクラス識別用ベクトル空間中の点との両方の点について、正しいクラスラベルを識別できるようになる。

ここで、クラスラベルが付与されたソースドメインのデータは学習時点で入手可能だが、クラスラベルが付与されたターゲットドメインのデータは学習時点では入手ｃだと仮定する。ソースドメインに由来するデータは得られるがターゲットドメインに由来するデータが得られないことは、図１（ａ）－（ｂ）において白抜きの丸及び黒丸の予測値はクラスラベルに基づいて修正可能だが、白抜きの四角及び黒の四角の予測値はクラスラベルに基づく修正が不能であることを意味する。この場合、実施の形態に係る情報処理装置は、定性的には、クラスラベルのあるソースドメインのデータを用いてクラス識別関数ｈ’の性能を上げつつ、かつ、クラスラベルのないターゲットドメインのデータも判別できるように、第１変換関数ｆ’、第２変換関数ｇ’及びクラス識別関数ｈ’を最適化することになる。

情報処理装置は、最適化後の第２変換関数ｇ’及びクラス識別関数ｈ’を記憶する。情報処理装置は、クラスラベルが付されていない文書についても、第２変換関数ｇ’で変換した後にクラス識別関数ｈ’を用いてクラスラベルを出力することにより、最適化前の各関数を用いる場合と比較して、クラスラベルの推定精度が向上していることが期待できる。

このように、実施の形態に係る情報処理装置によれば、異なるドメインのデータで構築した学習モデルを他のドメインのデータに適用する場合の学習モデルの精度を向上させることができる。

＜実施の形態に係る情報処理装置１の機能構成＞
図２は、実施の形態に係る情報処理装置１の機能構成を模式的に示す図である。情報処理装置１は、記憶部２と制御部３とを備える。図２において、矢印は主なデータの流れを示しており、図２に示していないデータの流れがあってもよい。図２において、各機能ブロックはハードウェア（装置）単位の構成ではなく、機能単位の構成を示している。そのため、図２に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。

記憶部２は、情報処理装置１を実現するコンピュータのＢＩＯＳ（Basic Input Output System）等を格納するＲＯＭ（Read Only Memory）や情報処理装置１の作業領域となるＲＡＭ（Random Access Memory）、ＯＳ（Operating System）やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される各変換関数やクラス識別関数等の種々の情報を格納するＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の大容量記憶装置である。

制御部３は、情報処理装置１のＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等のプロセッサであり、記憶部２に記憶されたプログラムを実行することによって第１クラス識別部３０、第２クラス識別部３１、更新部３２、及び識別部３３として機能する。

なお、図２は、情報処理装置１が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置１は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部３を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。

図２に示すように、記憶部２は、クラス識別関数格納部２０、第１変換関数格納部２１、及び第２変換関数格納部２２を含んでいる。クラス識別関数格納部２０は、クラス識別用ベクトル空間のベクトルデータを入力とし、そのベクトルデータが属するクラスを示すクラスラベルを出力するクラス識別関数ｈを格納している。

第１変換関数格納部２１は、第１ベクトルデータを、クラス識別用ベクトル空間のベクトルデータである識別用ベクトルデータに変換する第１変換関数ｆを格納している。第２変換関数格納部２２は、第１ベクトルデータとは異なる次元数のベクトルデータであって、第１ベクトルデータに紐づけられている第２ベクトルデータを、識別用ベクトルデータに変換する第２変換関数ｇを格納している。ここで、第１ベクトルデータは上述したソースドメインのデータに対応し、第２ベクトルデータは上述したターゲットドメインのデータに対応する。

第１変換関数ｆは、例えば、畳み込みニューラルネットワークで構成してよく、第２変換関数ｇは埋め込み層（embedding layer）を介した長期短期記憶（Long Short-Term Memory, LSTM）で構成してよく、一般には、多層パーセプトロンで構成してもよい。特に入出力次元が整合しているユニット数を有すれば３層の多層パーセプトロンで構成してもよいがこの限りではない。

ここで、第１変換関数ｆ及び第２変換関数ｇは、ともに入力されたベクトルデータを復元できるような性質を持つ関数であってもよい。具体的には、第１変換関数ｆは、第１ベクトルデータ群を入力として複数の識別用ベクトルデータを出力したとき、その識別用ベクトルデータを入力として、第１ベクトルデータ群の一部又は全部を近似する第３変換関数が存在するような関数である。同様に、第２変換関数ｇは、第２ベクトルデータ群を入力として複数の識別用ベクトルデータを出力したとき、その識別用ベクトルデータを入力として、第２ベクトルデータ群の一部又は全部を近似する第４換関数が存在するような関数である。

あるいは、第１ベクトルデータ及び第２ベクトルデータが、例えば音声データのように時間によって変化する時系列データである場合、第１変換関数ｆ及び第２変換関数ｇは、入力されたベクトルデータの将来を予測するような関数であってもよい。

第１変換関数ｆ及び第２変換関数ｇは、例えば既知の自己教師あり学習（self-supervised learning）又は教師なし学習（unsupervised learning）の手法を用いることで実現できる。これにより、情報処理装置１は、自己教師あり学習は改変された入力データから元の入力データを推定したり、入力データから将来又は過去の値を推定したりするよう学習タスクを実現できる。

例えば、画像データについては画像を複数（例えば、９つ）のブロックに分割して順番を入れ替えた入力から元の画像を推定するＪｉｇｓａｗ＋＋を用いてもよい。文章データについては、例えば、文章中の特定の単語を入力とし前後の単語を推定するＷｏｒｄ２ｖｅｃを用いてもよい。一般には、教師なし学習の行列因子分解を用いて入力データを近似する線形写像を得るＨｅＭａｐを用いてもよい。

記憶部２は、複数の第１ベクトルデータから構成される第１ベクトルデータ群と、複数の第２ベクトルデータから構成される第２ベクトルデータ群とも記憶している。第１クラス識別部３０は、第１変換関数ｆを第１変換関数格納部２１から読み出して取得する。また、第１クラス識別部３０は、第１ベクトルデータ群を記憶部２から読み出して取得する。

第１クラス識別部３０は、第１ベクトルデータ群を構成する第１ベクトルデータを第１変換関数ｆに入力することにより、識別用ベクトルデータに変換する。第１クラス識別部３０は、変換した識別用ベクトルデータをクラス識別関数ｈに入力することで、第１ベクトルデータのクラスラベルの推定値である第１推定値を取得する。

第２クラス識別部３１は、第２ベクトルデータ群を構成する第２ベクトルデータを第２変換関数ｇに入力することにより、識別用ベクトルデータに変換する。第２クラス識別部３１は、変換した識別用ベクトルデータをクラス識別関数ｈに入力することで、第２ベクトルデータのクラスラベルの推定値である第２推定値を取得する。

なお、識別用ベクトルデータの次元と、第１ベクトルデータの次元又は第２ベクトルデータの次元は必ずしも異なっていなくてもよい。例えば、識別用ベクトルデータの次元と、第１ベクトルデータの次元又は第２ベクトルデータの次元とが同一であること、すなわち第１変換関数ｆ又は第２変換関数ｇが恒等変換であってもよい。

更新部３２は、第１推定値と第２推定値を含む評価関数Ｅの評価値を用いて、合意原理に基づいて第１変換関数ｆと第２変換関数ｇとのうち少なくとも１つを更新する。具体的には、記憶部２は、各変換関数を更新する際に更新部３２が参照する評価関数Ｅを格納している。評価関数Ｅの一例は、以下の式（１）で示される。

ここで、ｘ_ｓは第１ベクトルデータ（ソースドメインのデータ）を表し、ｘ_ｔは第２ベクトルデータ（ターゲットドメインのデータ）を表す。

評価関数Ｅは、合意原理を実現するための式である。式（１）に示すように、評価関数Ｅは、互いに紐づけられた第１ベクトルデータと第２ベクトルデータとのそれぞれから得られた第１推定値と第２推定値との差が小さい場合は、大きい場合よりも小さな評価値を出力するように構成されている。更新部３２は、評価関数Ｅの評価値が小さくなるように第１変換関数ｆと第２変換関数ｇとのうち少なくとも１つを更新する。

合意原理は、識別モデルの２つの異なる出力を近づけることにより、識別モデルの誤り率が低減することを示した原理である。まず、更新部３２中の評価値算出部３２０は、第１変換関数ｆとクラス識別関数ｈとの合成関数である第１合成関数ｈ・ｆの出力である第１推定値を算出する。また、評価値算出部３２０は、第２変換関数ｇとクラス識別関数ｈとの合成関数である第２合成関数ｈ・ｇの出力である第２推定値を算出する。最後に、評価値算出部３２０は、第１推定値と第２推定値との誤差を算出する。第１推定値と第２推定値との誤差は、例えば第１推定値と第２推定値のユークリッド距離を用いればよい。

関数更新部３２１は、第１推定値と第２推定値との誤差が小さくなるように、第１変換関数ｆと第２変換関数ｇとのうち少なくとも１つを更新する。関数更新部３２１は、最適化手法としてミニバッチ確率的勾配法を用いてもよい。関数更新部３２１が確率的勾配法を実施する際には、関数パラメータのそれぞれについて目的関数の微分を計算して更新式を求めてもよいが、自動微分機能を備えた数値計算フレームワークを用いてもよい。最適化の更新処理の終了条件は、既定の回数に達することとしてもよく、また、学習データを構築用と検証用とに分けて構築用で更新処理をし、検証用で目的関数の値を算出し、検証用の目的関数の値が既定の回数だけ連続で改善（より小さくなること）しなかった場合としてもよく、さらに、これら両方のいずれかに該当することとしてもよい。関数パラメータの初期値には標準正規分布にしたがう乱数を用いてもよい。

式（１）に示す評価関数Ｅに、潜在空間の損失の項と忘却防止の正則化項とを加えてもよい。そのような評価関数Ｅの一例を以下の式（２）に示す。

式（２）において、第２項が潜在空間の損失の項であり、第３項が忘却防止の正則化項である。第２項は、異なるベクトルデータの特徴表現が互いに似通うようにする目的の項であり、第１ベクトルデータ由来の識別用ベクトルデータと、第２ベクトルデータ由来の識別用ベクトルデータとの類似度指標（例えば、ドメイン識別器を別途用意した敵対的損失や、識別用ベクトル空間の各次元の相関係数等）に基づく項である。第２項を用いることで、更新部３２は、第１ベクトルデータを第１変換関数ｆで変換して得られた第１識別用ベクトルデータと、第２ベクトルデータを第２変換関数ｇで変換して得られた第２識別用ベクトルデータとを用いて算出される類似度指標に基づいて、第１識別用ベクトルデータと第２識別用ベクトルデータとが類似するように、第１変換関数ｆと第２変換関数ｇとのうち少なくとも１つを更新することになる。

式（２）における第３項は、関数パラメータの忘却を防ぐ目的の項であり、第１変換関数ｆ及び第２変換関数ｇそれぞれの当初の値からの乖離をユークリッド距離で測った項である。第３項は、第１変換関数ｆと第２変換関数ｇとの更新を抑制する方向にはたらく。第３項を用いることで、更新部３２は、第１変換関数ｆと第２変換関数ｇとを変化させすぎることを抑制できる。

ここで、第１変換関数ｆと第２変換関数ｇとの少なくともいずれか一方を更新すると、識別用ベクトル空間において第１ベクトルデータ又は第２ベクトルデータが射影される点が変更される可能性がある。そこで、更新部３２は、評価関数Ｅの評価値に基づいて、クラス識別関数ｈを更新してもよい。具体的には、更新部３２は、評価関数Ｅの評価値が小さくなるように、クラス識別関数ｈを更新する。これにより、更新部３２は、更新後の第１変換関数ｆと第２変換関数ｇに最適化されたクラス識別関数ｈを生成することができる。

第２変換関数格納部２２は、更新部３２により更新された更新済み第２変換関数ｇをさらに格納する。同様に、クラス識別関数格納部２０は、更新部３２により更新された更新済みクラス識別関数ｈをさらに格納する。

図３は、未知のターゲットドメインのデータにクラス識別関数ｈを適用する場合の様子を模式的に示す図である。識別部３３は、更新済み第２変換関数ｇとクラス識別関数ｈとの合成関数に、クラスラベルの推定精度が付与されていない未知の第２ベクトルデータ群を入力することで、ターゲットドメインのデータの識別処理を実行する。

図３において、白抜きの三角形は、更新済み第２変換関数ｇ’を用いてクラス識別用ベクトル空間に射影された未知のターゲットドメインのデータ（すなわち、識別用ベクトルデータ）を示している。識別部３３は、これらの識別用ベクトルデータをクラス識別関数ｈ’に入力することにより、未知のターゲットドメインのデータが属するクラスを示すクラスラベルを推定することができる。なお、更新済み第２変換関数ｇ’を用いてクラス識別用ベクトル空間に射影された識別用ベクトルデータをクラス識別関数ｈに入力することが、更新済み第２変換関数ｇ’とクラス識別関数ｈ’との合成関数に第２ベクトルデータを入力することに相当する。

このように、情報処理装置１は、ソースドメインのデータで構築した学習モデルであるクラス識別関数ｈをターゲットドメインのデータに適用することができる。

＜情報処理装置１が実行する情報処理方法の処理フロー＞
図４は、実施の形態に係る情報処理装置１が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

第１クラス識別部３０は、第１ベクトルデータ群を記憶部２から読み出して取得する（Ｓ２）。第１クラス識別部３０は、第１変換関数ｆを第１変換関数格納部２１から読み出して取得する（Ｓ４）。第１クラス識別部３０は、第１変換関数ｆを用いて第１ベクトルデータ群を構成する各ベクトルデータを識別用ベクトルデータに変換する（Ｓ６）。第１クラス識別部３０は、変換した識別用ベクトルデータをクラス識別関数ｈに入力することにより、各識別用ベクトルデータが属するクラスを示すクラスラベルの推定値である第１推定値を取得する（Ｓ８）。

第２クラス識別部３１は、第２ベクトルデータ群を記憶部２から読み出して取得する（Ｓ１０）。第２クラス識別部３１は、第２変換関数ｇを第２変換関数格納部２２から読み出して取得する（Ｓ１２）。第２クラス識別部３１は、第２変換関数ｇを用いて第２ベクトルデータ群を構成する各ベクトルデータを識別用ベクトルデータに変換する（Ｓ１４）。第２クラス識別部３１は、変換した識別用ベクトルデータをクラス識別関数ｈに入力することにより、各識別用ベクトルデータが属するクラスを示すクラスラベルの推定値である第２推定値を取得する（Ｓ１６）。

更新部３２は、変換関数の更新時に参照するための評価関数Ｅを記憶部２から読み出して取得する（Ｓ１８）。更新部３２は、第１推定値と第２推定値を含む評価関数Ｅの評価値に基づいて、第１変換関数ｆと第２変換関数ｇとのうち少なくとも１つを更新する（Ｓ２０）。更新部３２が変換関数を更新すると、本フローチャートにおける処理は終了する。

［更新処理の繰り返し］
上記の処理は、クラス識別関数ｈを用いて第１変換関数ｆと第２変換関数ｇとの少なくとも一方を更新し、かつ、クラス識別関数ｈを更新する処理である。ここで、クラス識別関数ｈを更新した場合、更新後のクラス識別関数であるクラス識別関数ｈを用いて、再び第１変換関数ｆと第２変換関数ｇとの少なくとも一方を更新することもできる。以下では、クラス識別関数ｈ、第１変換関数ｆ、及び第２変換関数ｇを全て更新することを前提として説明する。

図５は、各関数の繰り返し更新処理を説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

更新部３２は、繰り返し処理に用いるループ変数ｉの値を１で初期化するとともに、更新処理の上限回数を定める更新上限回数Ｎ（Ｎは１以上の整数）を設定する（Ｓ３０）。以下、本フローチャートにおいて、ｉ回目の更新時に処理する第１変換関数ｆ、第２変換関数ｇ、及びクラス識別関数ｈを、それぞれ第１変換関数ｆ^ｉ、第２変換関数ｇ^ｉ、及びクラス識別関数ｈ^ｉと記載する。

第１クラス識別部３０及び第２クラス識別部３１は、それぞれ第１変換関数ｆ^ｉ及び第２変換関数ｇ^ｉを記憶部２から読み出して取得する（Ｓ３２）。また、第１クラス識別部３０及び第２クラス識別部３１は、それぞれクラス識別関数ｈ^ｉを記憶部２から読み出して取得する（Ｓ３４）。

関数更新部３２１は、評価値算出部３２０が出力した評価値に基づいて、第１変換関数ｆ^ｉ及び第２変換関数ｇ^ｉをそれぞれ第１変換関数ｆ^ｉ＋１及び第２変換関数ｇ^ｉ＋１に更新する（Ｓ３６）。関数更新部３２１は、更新後の第１変換関数ｆ^ｉ＋１及び第２変換関数ｇ^ｉ＋１に基づいてクラス識別関数ｈ^ｉをクラス識別関数ｈ^ｉ＋１に更新する（Ｓ３８）。

関数更新部３２１は、第１変換関数ｆ^ｉ＋１及び第２変換関数ｇ^ｉ＋１を記憶部２に保存する（Ｓ４０）。また、関数更新部３２１は、クラス識別関数ｈ^ｉ＋１を記憶部２に保存する（Ｓ４２）。

ループ変数ｉの値が更新上限回数Ｎ未満の場合（Ｓ４４のＹｅｓ）、更新部３２はループ変数ｉの値をｉ＋１に更新し（Ｓ４６）、ステップＳ３２の処理に戻って更新処理を継続する。ループ変数ｉの値が更新上限回数Ｎに到達すると（Ｓ４４のＮｏ）、本フローチャートにおける処理は終了する。

更新処理終了後、第１変換関数ｆ^１、第２変換関数ｇ^１、及びクラス識別関数ｈ^１はそれぞれＮ－１回更新されて第１変換関数ｆ^Ｎ、第２変換関数ｇ^Ｎ、及びクラス識別関数ｈ^Ｎとなる。これにより、情報処理装置１は、第１変換関数ｆ、第２変換関数ｇ、及びクラス識別関数ｈの精度をより向上させることができる。

＜実施の形態に係る情報処理装置１が奏する効果＞
以上説明したように、実施の形態に係る情報処理装置１によれば、異なるドメインのデータで構築した学習モデルを他のドメインのデータに適用する場合の学習モデルの精度を向上することができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果をあわせ持つ。

＜変形例＞
上記では、ソースドメインのデータがデジタル画像、ターゲットドメインのデータが文章である場合について主に説明したが、各データはこれに限られない。例えば、ソースドメインのデータが文章であり、ターゲットドメインのデータがデジタル画像であってもよい。また、ソースドメインのデータがユーザの購買履歴を示すデータであり、ターゲットドメインが、ユーザのウェブの一覧履歴を示すデータであってもよい。

１・・・情報処理装置
２・・・記憶部
２０・・・クラス識別関数格納部
２１・・・第１変換関数格納部
２２・・・第２変換関数格納部
３・・・制御部
３０・・・第１クラス識別部
３１・・・第２クラス識別部
３２・・・更新部
３２０・・・評価値算出部
３２１・・・関数更新部
３３・・・識別部

Claims

クラス識別用ベクトル空間のベクトルデータを入力とし、当該ベクトルデータが属するクラスを示すクラスラベルを出力するクラス識別関数を格納するクラス識別関数格納部と、
第１ベクトルデータを前記クラス識別用ベクトル空間のベクトルデータである識別用ベクトルデータに変換する第１変換関数を格納する第１変換関数格納部と、
前記第１ベクトルデータとは異なる次元数のベクトルデータであって、前記第１ベクトルデータに紐づけられている第２ベクトルデータを、前記識別用ベクトルデータに変換する第２変換関数を格納する第２変換関数格納部と、
前記第１変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第１ベクトルデータのクラスラベルの推定値である第１推定値を取得する第１クラス識別部と、
前記第２変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第２ベクトルデータのクラスラベルの推定値である第２推定値を取得する第２クラス識別部と、
前記第１推定値と前記第２推定値を含む評価関数の評価値に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新する更新部と、
を備える情報処理装置。
前記更新部は、前記評価関数の評価値に基づいて、前記クラス識別関数をさらに更新する、
請求項１に記載の情報処理装置。
前記評価関数は、互いに紐づけられた前記第１ベクトルデータと前記第２ベクトルデータとのそれぞれから得られた前記第１推定値と前記第２推定値との差が小さい場合は、大きい場合よりも小さな評価値を出力するように構成されている、
請求項１又は２に記載の情報処理装置。
前記更新部は、前記評価関数の評価値が小さくなるように前記クラス識別関数、前記第１変換関数、及び前記第２変換関数のうち少なくとも１つを更新する、
請求項３に記載の情報処理装置。
前記更新部は、前記第１ベクトルデータを前記第１変換関数で変換して得られた識別用ベクトルデータと、前記第２ベクトルデータを前記第２変換関数で変換して得られた識別用ベクトルデータとを用いて算出される類似度指標に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新する、
請求項３又は４に記載の情報処理装置。
前記第２変換関数格納部は、前記更新部により更新された更新済み第２変換関数をさらに格納し、
更新済み第２変換関数とクラス識別関数との合成関数に前記第２ベクトルデータを入力することで識別処理を実行する識別部をさらに備える、
請求項１から５のいずれか１項に記載の情報処理装置。
プロセッサが、
クラス識別用ベクトル空間のベクトルデータを入力とし、当該ベクトルデータが属するクラスを示すクラスラベルを出力するクラス識別関数をクラス識別関数格納部から読み出して取得するステップと、
第１ベクトルデータを前記クラス識別用ベクトル空間のベクトルデータである識別用ベクトルデータに変換する第１変換関数を第１変換関数格納部から読み出して取得するステップと、
前記第１ベクトルデータとは異なる次元数のベクトルデータであって、前記第１ベクトルデータに紐づけられている第２ベクトルデータを、前記識別用ベクトルデータに変換する第２変換関数を第２変換関数格納部から読み出して取得するステップと、
前記第１変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第１ベクトルデータのクラスラベルの推定値である第１推定値を取得するステップと、
前記第２変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第２ベクトルデータのクラスラベルの推定値である第２推定値を取得するステップと、
前記第１推定値と前記第２推定値を含む評価関数の評価値に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新するステップと、
を実行する情報処理方法。
コンピュータに、
クラス識別用ベクトル空間のベクトルデータを入力とし、当該ベクトルデータが属するクラスを示すクラスラベルを出力するクラス識別関数をクラス識別関数格納部から読み出して取得する機能と、
第１ベクトルデータを前記クラス識別用ベクトル空間のベクトルデータである識別用ベクトルデータに変換する第１変換関数を第１変換関数格納部から読み出して取得する機能と、
前記第１ベクトルデータとは異なる次元数のベクトルデータであって、前記第１ベクトルデータに紐づけられている第２ベクトルデータを、前記識別用ベクトルデータに変換する第２変換関数を第２変換関数格納部から読み出して取得するステップと、
前記第１変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第１ベクトルデータのクラスラベルの推定値である第１推定値を取得する機能と、
前記第２変換関数によって変換された前記識別用ベクトルデータを前記クラス識別関数に入力することで、前記第２ベクトルデータのクラスラベルの推定値である第２推定値を取得する機能と、
前記第１推定値と前記第２推定値を含む評価関数の評価値に基づいて、前記第１変換関数と前記第２変換関数とのうち少なくとも１つを更新する機能と、
を実現させるプログラム。