JP7147874B2

JP7147874B2 - 学習装置、学習方法および学習プログラム

Info

Publication number: JP7147874B2
Application number: JP2020565140A
Authority: JP
Inventors: 泰弘十河; 智哉坂井
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2019-01-11
Filing date: 2019-01-11
Publication date: 2022-10-05
Anticipated expiration: 2039-01-11
Also published as: US20220092475A1; JPWO2020144853A1; WO2020144853A1

Description

本発明は、既存のモデルを利用して新たなモデルを学習する学習装置、学習方法および学習プログラムに関する。

ビジネスシーンにおいて新たな価値を創造するために、創造的活動によって、日々新商品や新サービスが考案され、提供され続けている。効率的に利益を生み出すため、データに基づいた予測が行われることが多い。しかし、新商品や新サービスについての予測（新タスクと呼ぶこともある。）は提供開始からの期間が短く、大規模データを想定した予測分析技術の適用が困難である。

具体的には、少量のデータのみから統計的機械学習に基づいて予測および分類モデルを構築することは一般的に困難であり、頑健に予測方法や分類方法を模擬できるとは言い難い。そこで、少ないデータに基づく学習方法が各種提案されている。例えば、非特許文献１には、ワンショット学習（One-shot learning ）について記載されている。非特許文献１に記載されたワンショット学習では、入力間の類似度をランク付けする構造を用いたニューラルネットワークを学習する。

また、非特許文献２にも、ワンショット学習について記載されている。非特許文献２に記載されたワンショット学習では、小規模のラベル付きサポートセットとラベルのない例をラベルにマップし、新しいクラスタイプに適応するための微調整の必要性を除外したネットワークを学習する。

Koch, G., Zemel, R., & Salakhutdinov, R., "Siamese neural networks for one-shot image recognition", ICML Deep Learning Workshop, Vol. 2, 2015. Vinyals, O., Blundell, C., Lillicrap, T., & Wierstra, D., "Matching networks for one shot learning", Advances in Neural Information Processing Systems 29, pp. 3630-3638, 2016.

一方、非特許文献１や非特許文献２に記載されたワンショット学習（Few-shot learning と呼ぶこともある。）では、少量のデータのみを有する新タスクに対する予測モデルを高い精度で構築するために、既存の関連タスクのデータを統合したり参照したりする必要がある。

タスクの数によっては、そのデータの規模は膨大であり、分散管理されているような場合には、データを集約するための手間がかかってしまう。また、集約したとしても、その集約した膨大なデータを処理する必要があり、新タスクに対する予測モデルを短時間で構築するには非効率的である。

また、近年、プライバシー等の問題によりデータが提供されず、予測等に用いられるモデルのみが提供される形態も存在する。この場合、モデル構築に用いたデータ自体にアクセスすることはできない。そこで、短時間で予測モデルを構築するために、すでに学習済みの既存の予測モデルを利用することも考えられる。しかし、多種多様なモデルから、人手で必要になるモデルを選択し、適切に組み合わせて正確な予測モデルを構築することは困難である。そのため、既存の資産（すなわち、既存のモデル）を生かしつつ、少数のデータから、精度の高いモデルを学習できることが望まれている。

そこで、本発明では、既存のモデルを利用して少数のデータから精度の高いモデルを学習できる学習装置、学習方法および学習プログラムを提供することを目的とする。

本発明による学習装置は、対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される属性ベクトルからなる空間に対するそのラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する対象タスク属性推定部と、対象タスクの属性ベクトルに基づいて、上記変換方法により変換される予測対象サンプルの予測値を算出する予測値算出部とを備えたことを特徴とする。

本発明による学習方法は、コンピュータが、対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される属性ベクトルからなる空間に対するそのラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定し、コンピュータが、対象タスクの属性ベクトルに基づいて、上記変換方法により変換される予測対象サンプルの予測値を算出することを特徴とする。

本発明による学習プログラムは、コンピュータに、対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される属性ベクトルからなる空間に対するそのラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する対象タスク属性推定処理、および、対象タスクの属性ベクトルに基づいて、変換方法により変換される予測対象サンプルの予測値を算出する予測値算出処理を実行させることを特徴とする。

本発明によれば、既存のモデルを利用して少数のデータから精度の高いモデルを学習できる。

本発明による学習装置の第一の実施形態の構成例を示すブロック図である。第一の実施形態の学習装置の動作例を示すフローチャートである。第一の実施形態の学習装置の具体的な動作例を示すフローチャートである。本発明による学習装置の第二の実施形態の構成例を示すブロック図である。第二の実施形態の学習装置の動作例を示すフローチャートである。本発明による学習装置の第三の実施形態の構成例を示すブロック図である。第三の実施形態の学習装置の動作例を示すフローチャートである。本発明による学習装置の第四の実施形態の構成例を示すブロック図である。類似性を可視化する処理の例を示す説明図である。本発明による学習装置の概要を示すブロック図である。少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。

以下の説明では、新商品や新サービスなど、新たな予測対象を対象タスクと記す。以下の実施形態では、対象タスクのサンプルが少数（ａ “ｆｅｗ” ｓａｍｐｌｅｓ）である場合を想定する。ここで、少数とは、タスクの複雑性にも依存するが、例えば、十数～数百程度のサンプルを想定する。また、予測のために生成される成果物を予測器、予測モデル、または、単にモデルと記す。また、一以上の属性の集合を属性ベクトルと記し、予測器は、属性ベクトルに含まれる各属性を説明変数とする。すなわち、属性ベクトルは、各タスクの属性を意味するものである。

以下、学習済みのＴ個の予測器を、｛ｈ_ｔ（ｘ）｜ｔ＝１，…，Ｔ｝で表わす。また、対象タスクのサンプル（データ）をＤ_Ｔ＋１：＝｛（ｘ_ｎ，ｙ_ｎ）｜ｎ＝１，…，Ｎ_Ｔ＋１｝で表す。すなわち、対象タスクのサンプルが少数であるとの想定より、Ｎ_Ｔ＋１の値は小さいものとする。

また、すでに予測器が生成（学習）されたタスクを関連タスクと記す。本実施形態では、対象タスクに類似する関連タスクについて構成された予測器を用いて、その予測器の入出力関係から、対象タスクの予測器で用いられる属性ベクトルを生成する。ここで、類似の関連タスクとは、アルゴリズムの性質上、対象タスクと同様の説明変数（特徴量）によって構成できるタスク群を意味する。具体的に類似とは、特定のカテゴリに属する商品など、予め定義されたグループに属する対象を意味する。また、対象タスクまたは対象タスクに類似する範囲（すなわち、関連タスク）のサンプルのことを、対象タスクのドメインのサンプルと記す。

サンプルは、（正解）ラベルが付与されたサンプル（以下、ラベル付サンプルと記す。）と、（正解）ラベルが付与されていないサンプル（以下、ラベルなしサンプルと記す。）が存在する。以下の説明では、単にサンプルと記した場合、そのサンプルは、ラベル付サンプルとラベルなしサンプルのいずれか一方または両方を含むものとする。

以下、本発明の実施形態を図面を参照して説明する。

実施形態１．
図１は、本発明による学習装置の第一の実施形態の構成例を示すブロック図である。本実施形態の学習装置１００は、対象タスク属性推定部１１０と、予測値算出部１２０と、予測器記憶部１３０とを備えている。

予測器記憶部１３０は、学習済みの予測器を記憶する。予測器記憶部１３０は、例えば、磁気ディスク装置により実現される。

対象タスク属性推定部１１０は、対象タスクのドメインのサンプルに基づいて既存の（学習済みの）予測器の属性ベクトルを推定する。また、対象タスク属性推定部１１０は、既存の予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される属性ベクトルからなる空間に対する、そのラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する。

予測値算出部１２０は、推定された対象タスクの属性ベクトルに基づいて、上記変換方法により変換される予測対象サンプルの予測値を算出する。

以下、対象タスク属性推定部１１０および予測値算出部１２０の詳細な構成を説明する。

本実施形態の対象タスク属性推定部１１０は、サンプル生成部１１１と、属性ベクトル推定部１１２と、第一射影算出部１１３と、対象属性ベクトル算出部１１４とを含む。

サンプル生成部１１１は、対象タスクのドメインのサンプルをランダムに生成する。サンプルの生成方法は任意であり、各属性に任意の値をランダムに割り当ててサンプルを生成してもよい。

また、新たにサンプルを生成せず、予め準備された対象タスクのサンプルそのものがサンプルとして用いられてもよい。対象タスクのサンプルは、ラベル付サンプルであってもよく、ラベルなしサンプルであってもよい。この場合、対象タスク属性推定部１１０は、サンプル生成部１１１を含んでいなくてもよい。他にも、サンプル生成部１１１は、対象タスクのサンプルを凸結合したサンプルを生成してもよい。以下の説明では、生成されたサンプルの集合をＳで表わすこともある。

属性ベクトル推定部１１２は、対象タスクのドメインのサンプルを既存の複数の予測器ｈ_ｔ（ｘ）に適用して得られる出力（サンプル＋値）から、上記予測器でそれぞれ用いられる属性ベクトルｄからなる属性行列Ｄを推定する。

具体的には、属性ベクトル推定部１１２は、サンプルｘの射影αとの内積により算出される値と、そのサンプルｘを予測器ｈ_ｔ（ｘ）に適用して出力される値との差を最小化するように、属性ベクトルｄからなる属性行列Ｄを最適化する。ここで、射影αとは、属性ベクトルｄとの掛け合わせで各出力を再現可能な各サンプルｘ_ｉに対応する値である。ここで、推定される属性行列Ｄ＾（Ｄの上付きハット）は、以下に例示する式１で推定される。

式１において、Ｃは、各属性ベクトルｄが大きな値にならないための制約条件の集合であり、ｐは、属性ベクトルの要素の種類の最大数である。また、式１では、αに関するＬ１正則化を例示しているが、Ｌ１Ｌ２正則化など任意の正則化が含まれていてもよい。属性ベクトル推定部１１２は、上記に示す式１に対して、例えば、Ｋ－ＳＶＤ（k-singular value decomposition ）やＭＯＤ（Method of Optimal Directions）など、既存の辞書学習スキーマを用いて最適化を行ってもよい。なお、上記に示す式１が、辞書学習と同様の方法により最適化できることから、属性行列Ｄのことを辞書と記すこともある。

なお、ここで推定される属性ベクトルｄ_ｔは、いわゆるゼロショット学習の「属性」に対応するため、属性ベクトルｄ_ｔをゼロショット学習においても同様に扱うことが可能である。

第一射影算出部１１３は、推定された属性ベクトルｄ（より詳しくは、属性行列Ｄ）に適用して推定値（以下、第一の推定値と記す。）を得るための各ラベル付サンプル（ｘ_ｉ，ｙ_ｉ）（ｉ＝１，…，Ｎ_Ｔ＋１）の射影αを、予測器ｈにそのラベル付サンプル（ｘ_ｉ，ｙ_ｉ）を適用して得られる値と上記第一の推定値との差が最小になるように算出する。

具体的には、第一射影算出部１１３は、対象タスクのラベル付サンプル（ｘ_ｉ，ｙ_ｉ）について、それぞれ以下に例示する式２を算出することで、ｘ_ｉに対応する射影ベクトルα＾_ｉ（α_ｉの上付きハット）を算出してもよい。第一射影算出部１１３は、以下に例示する式２を、例えば、Ｌａｓｓｏの問題として解くことが可能である。

対象属性ベクトル算出部１１４は、算出された射影αに適用して推定値（以下、第二の推定値と記す。）を得るための対象タスクの属性ベクトルｄ_Ｔ＋１を、対象タスクのラベル付サンプルのラベルｙと上記第二の推定値との差が最小になるように算出する。

具体的には、対象属性ベクトル算出部１１４は、対象タスクのラベル付サンプル（ｘ_ｉ，ｙ_ｉ）のｙ_ｉと、算出された射影α_ｉを用いて、対象タスクの属性ベクトルｄ＾_Ｔ＋１（ｄ_Ｔ＋１の上付きハット）を以下に例示する式３を用いて算出してもよい。対象属性ベクトル算出部１１４は、以下に例示する式３を、上記式１を算出する方法と同様に方法を用いることで解を得ることが可能である。

本実施形態の予測値算出部１２０は、第二射影算出部１２１と、予測部１２２とを含む。

第二射影算出部１２１は、推定された属性ベクトルｄに適用して推定値（以下、第三の推定値と記す。）を得るための予測対象サンプルｘ_ｎｅｗの射影α＾_ｎｅｗを、予測器ｈにその予測対象サンプルｘ_ｎｅｗを適用して得られる値と、上記第三の推定値との差が最小になるように算出する。具体的には、第二射影算出部１２１は、対象タスクの予測対象サンプルｘ_ｎｅｗについて、上記式２を算出する方法と同様の方法で射影ベクトルα＾_ｎｅｗを求めればよい。

予測部１２２は、対象タスクの属性ベクトルｄ_Ｔ＋１に射影α_ｎｅｗを適用して（具体的には、内積を算出して）予測値ｙ_ｎを算出する。

対象タスク属性推定部１１０（より具体的には、サンプル生成部１１１と、属性ベクトル推定部１１２と、第一射影算出部１１３と、対象属性ベクトル算出部１１４）と、予測値算出部１２０（より具体的には、第二射影算出部１２１と、予測部１２２）とは、プログラム（学習プログラム）に従って動作するコンピュータのプロセッサ（例えば、ＣＰＵ（Central Processing Unit ）、ＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（field-programmable gate array ））によって実現される。

例えば、プログラムは、学習装置が備える記憶部（図示せず）に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、対象タスク属性推定部１１０（より具体的には、サンプル生成部１１１と、属性ベクトル推定部１１２と、第一射影算出部１１３と、対象属性ベクトル算出部１１４）および予測値算出部１２０（より具体的には、第二射影算出部１２１と、予測部１２２）として動作してもよい。また、学習装置の機能がＳａａＳ（Software as a Service ）形式で提供されてもよい。

対象タスク属性推定部１１０（より具体的には、サンプル生成部１１１と、属性ベクトル推定部１１２と、第一射影算出部１１３と、対象属性ベクトル算出部１１４）と、予測値算出部１２０（より具体的には、第二射影算出部１２１と、予測部１２２）とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。

また、学習装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

次に、本実施形態の学習装置の動作例を説明する。図２は、本実施形態の学習装置１００の動作例を示すフローチャートである。

対象タスク属性推定部１１０は、対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定する（ステップＳ１）。対象タスク属性推定部１１０は、推定された属性ベクトルからなる空間に対するラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する（ステップＳ２）。予測値算出部１２０は、対象タスクの属性ベクトルに基づいて、上記変換方法により変換される予測対象サンプルの予測値を算出する（ステップＳ３）。

図３は、本実施形態の学習装置１００の具体的な動作例を示すフローチャートである。

属性ベクトル推定部１１２は、対象タスクのドメインのサンプルを既存の複数の予測器に適用して得られる出力から、その予測器でそれぞれ用いられる属性ベクトルｄ（属性行列Ｄ）を推定する（ステップＳ２１）。第一射影算出部１１３は、推定された属性ベクトルｄに適用して第一の推定値を得るための各ラベル付サンプルの射影を、予測器ｈにラベル付サンプルを適用して得られる値と第一の推定値との差が最小になるように最適化する（ステップＳ２２）。対象属性ベクトル算出部１１４は、射影に適用して第二の推定値を得るための対象タスクの属性ベクトルを、ラベル付サンプルのラベルと第二の推定値との差が最小になるように最適化する（ステップＳ２３）。

第二射影算出部１２１は、推定された属性ベクトルに適用して第三の推定値を得るための予測対象サンプルｘ_ｎｅｗの射影α_ｎｅｗを、予測器に予測対象サンプルを適用して得られる値と第三の推定値との差が最小になるように最適化する（ステップＳ２４）。予測部１２２は、対象タスクの属性ベクトルｄ_Ｔ＋１に射影α_ｎｅｗを適用して予測値を算出する（ステップＳ２５）。

以上のように、本実施形態では、属性ベクトル推定部１１２が、既存の複数の予測器に適用して得られる出力から、各予測器で用いられる属性ベクトルｄを推定し、第一射影算出部１１３は、予測器に適用して得られる値と第一の推定値との差が最小になるように各ラベル付サンプルの射影を最適化する。そして、対象属性ベクトル算出部１１４が、ラベル付サンプルのラベルと第二の推定値との差が最小になるように対象タスクの属性ベクトルを最適化する。

さらに、第二射影算出部１２１が、予測器に予測対象サンプルを適用して得られる値と第三の推定値との差が最小になるように予測対象サンプルｘ_ｎｅｗの射影α_ｎｅｗを算出し、予測部１２２が、対象タスクの属性ベクトルｄ_Ｔ＋１に射影α_ｎｅｗを適用して予測値を算出する。

よって、既存のモデルを利用して少数のデータから精度の高いモデルを効率的に（短時間で）学習できる。具体的には、本実施形態では、新しい予測対象のサンプルが得られる毎に射影ベクトルを算出することで、より精度の高い予測を行うことが可能になる。

実施形態２．
次に、本発明による学習装置の第二の実施形態を説明する。図４は、本発明による学習装置の第二の実施形態の構成例を示すブロック図である。本実施形態の学習装置２００は、第一の実施形態の同様、対象タスク属性推定部１１０と、予測値算出部１２０と、予測器記憶部１３０とを備えている。ただし、第二の実施形態の対象タスク属性推定部１１０および予測値算出部１２０は、構成内容が第一の実施形態と異なる。

本実施形態の対象タスク属性推定部１１０は、サンプル生成部２１１と、変換推定部２１２と、属性ベクトル算出部２１３とを含む。

サンプル生成部２１１は、第一の実施形態のサンプル生成部１１１と同様、対象タスクのドメインのサンプルを生成する。

変換推定部２１２は、対象タスクのドメインのサンプルを既存の複数の予測器ｈ_ｔ（ｘ）に適用して得られる出力（サンプル＋値）から、上記予測器でそれぞれ用いられる属性ベクトルｄからなる属性行列Ｄ、および、上記出力をその属性ベクトルｄの空間に変換する変換行列Ｖを推定する。

具体的には、変換推定部２１２は、特徴写像関数φ（Ｒ^ｄ→Ｒ^ｂ）にサンプルｘを適用して得られるベクトルと変換行列Ｖと属性行列Ｄとの積により算出される値と、そのサンプルｘを予測器ｈ_ｔ（ｘ）に適用して出力される値との差を最小化するように、属性ベクトルｄからなる属性行列Ｄおよび変換行列Ｖを最適化する。ここで、特徴写像関数φは、属性間の変換を表わす、いわゆる予測等で行われる特徴量の変換（属性設計）に該当し、予め定義される任意の関数で表される。ここで、属性行列Ｄ＾（Ｄの上付きハット）および変換行列Ｖ＾（Ｖの上付きハット）は、以下に例示する式４で推定される。

式４において、Ｃは、式１と同様、各属性ベクトルｄが大きな値にならないための制約条件の集合であり、ｐは、属性ベクトルの要素の種類の最大数である。また、式１と同様に、式４においても、任意の正則化が含まれていてもよい。

属性ベクトル算出部２１３は、変換行列Ｖと写像関数φとの積に適用して推定値（以下、第四の推定値と記す。）を得るための対象タスクの属性ベクトルｄ_Ｔ＋１を、ラベル付サンプル（ｘ_ｉ，ｙ_ｉ）のラベルｙ_ｉと上記第四の推定値との差が最小になるように算出する。

具体的には、属性ベクトル算出部２１３は、対象タスクのラベル付サンプル（ｘ_ｉ，ｙ_ｉ）のｙ_ｉと、推定された変換行列Ｖを用いて、対象タスクの属性ベクトルｄ＾_Ｔ＋１（ｄ_Ｔ＋１の上付きハット）を以下に例示する式５を用いて算出してもよい。

本実施形態の予測値算出部１２０は、予測部２２２を含む。

予測部２２２は、対象タスクの属性ベクトルｄ_Ｔ＋１に変換行列Ｖおよび写像関数φに予測対象サンプルｘ_ｎｅｗを適用した結果を適用して予測値を算出する。予測部２２２は、例えば、以下の式６に例示する方法で、予測値を算出してもよい。

対象タスク属性推定部１１０（より具体的には、サンプル生成部２１１と、変換推定部２１２と、属性ベクトル算出部２１３）と、予測値算出部１２０（より具体的には、予測部２２２）とは、プログラム（学習プログラム）に従って動作するコンピュータのプロセッサによって実現される。

次に、本実施形態の学習装置の動作例を説明する。図５は、本実施形態の学習装置２００の動作例を示すフローチャートである。

変換推定部２１２は、対象ドメインのサンプルを既存の複数の予測器に適用して得られる出力から、その予測器でそれぞれ用いられる属性ベクトルｄ（属性行列Ｄ）およびその出力をその属性ベクトルｄの空間に変換する変換行列Ｖを推定する（ステップＳ３１）。属性ベクトル算出部２１３は、変換行列Ｖと写像関数φとの積に適用して第四の推定値を得るための対象タスクの属性ベクトルｄ_Ｔ＋１を、ラベル付サンプルのラベルｙと上記第四の推定値との差が最小になるように最適化する（ステップＳ３２）。予測部２２２は、対象タスクの属性ベクトルｄ_Ｔ＋１に、変換行列Ｖおよび写像関数φに予測対象サンプルｘ_ｎｅｗを適用した結果を適用して予測値を算出する（ステップＳ３３）。

以上のように、本実施形態では、変換推定部２１２が、既存の複数の予測器に適用して得られる出力から、各予測器で用いられる属性ベクトルｄおよび変換行列Ｖを推定し、属性ベクトル算出部２１３が、ラベル付サンプルのラベルｙと上記第四の推定値との差が最小になるように対象タスクの属性ベクトルｄ_Ｔ＋１を最適化する。そして、予測部２２２が、対象タスクの属性ベクトルｄ_Ｔ＋１に、変換行列Ｖおよび写像関数φに予測対象サンプルｘ_ｎｅｗを適用した結果を適用して予測値を算出する。

よって、第一の実施形態と同様、既存のモデルを利用して少数のデータから精度の高いモデルを効率的に（短時間で）学習できる。具体的には、本実施形態では、新しい予測対象のサンプルが得られるたびに、単純に変換行列Ｖを用いた演算をするだけで良いため、計算コストを低減させることが可能になる。特に、変換行列で適切に射影できるような新しいサンプルに対しては、予測精度が期待される。

実施形態３．
次に、本発明による学習装置の第三の実施形態を説明する。図６は、本発明による学習装置の第三の実施形態の構成例を示すブロック図である。本実施形態の学習装置３００は、第一の実施形態および第二の実施形態の同様、対象タスク属性推定部１１０と、予測値算出部１２０と、予測器記憶部１３０とを備えている。ただし、第三の実施形態の対象タスク属性推定部１１０および予測値算出部１２０は、構成内容が第一の実施形態および第二の実施形態と異なる。

本実施形態では、第一の実施形態および第二の実施形態と比較し、対象タスクのラベルなしデータが得られている状況を想定する。以下の説明では、対象タスクのラベル付データを以下に例示する式７で表し、対象タスクのラベルなしデータを、以下に例示する式８で表す。

本実施形態の対象タスク属性推定部１１０は、属性ベクトル最適化部３１１を含む。

属性ベクトル最適化部３１１は、対象タスクの属性ベクトルｄ_Ｔ＋１を算出するための二つの項（以下、第一の最適化項および第二の最適化項と記す。）を最小化するような辞書Ｄを学習する。第一の最適化項は、対象タスクのラベルなしデータに関する項であり、第二の最適化項は、対象タスクのラベル付データに関する項である。

具体的には、第一の最適化項は、対象タスクのラベルなしサンプルを既存の複数の予測器に適用して得られる値からなるベクトルｈ´_ｉと、その予測器でそれぞれ用いられる属性ベクトルｄ（より具体的には、属性行列Ｄ）にラベルなしサンプルｘの属性ベクトルｄ空間への射影α´を適用して得られる推定ベクトルとのノルムを算出する項である。第一の最適化項は、以下に例示する式９で表される。

第二の最適化項は、対象タスクのラベル付サンプルを既存の複数の予測器に適用して得られる値およびそのサンプルのラベルｙからなるベクトルｈバー_ｉ（ｈ_ｉの上付きバー）と、その予測器でそれぞれ用いられる属性ベクトルｄ（より具体的には、属性行列Ｄ）および対象タスクの属性ベクトルｄ_Ｔ＋１にサンプルｘの属性ベクトルｄおよび対象タスクの属性ベクトルｄ_Ｔ＋１空間への射影αを適用して得られる推定ベクトルとのノルムを算出する項である。第二の最適化項は、以下に例示する式１０で表される。

属性ベクトル最適化部３１１は、第一の最適化項と第二の最適化項との和が最小になるように最適化して属性ベクトルｄおよび対象タスクの属性ベクトルｄ_Ｔ＋１を算出する。属性ベクトル最適化部３１１は、例えば、以下に例示する式１１を最適化して、属性ベクトルｄおよび対象タスクの属性ベクトルｄ_Ｔ＋１を算出してもよい。

本実施形態の予測値算出部１２０は、予測器算出部３２１と、予測部３２２とを含む。

予測器算出部３２１は、対象タスクの予測器を学習する。具体的には、予測器算出部３２１は、以下に示す二つの項（以下、第一の学習項および第二の学習項）を最小化するように予測器を学習する。第一の学習項は、対象タスクのラベルなしサンプルに関する項であり、第二の学習項は、対象タスクのラベル付サンプルに関する項である。

具体的には、第一の学習項は、第二の実施形態で示す写像関数φにラベルなしサンプルを適用した結果に対して予測器を適用した値と、推定された属性ベクトルｄ_Ｔ＋１にそのラベルなしサンプルの射影α´を適用した値との差の大きさのラベルなしサンプルごとの総和である。

第二の学習項は、予め定めた比率γのもとで算出される、写像関数φにラベル付サンプルを適用した結果に対して予測器を適用した値とそのラベル付サンプルのラベルとの差の大きさと、写像関数φにラベル付サンプルを適用した結果に対して予測器を適用した値と対象タスクの属性ベクトルｄ_Ｔ＋１にそのラベル付サンプルの射影αを適用した値との差の大きさとの和のラベル付サンプルごとの総和である。

予測器算出部３２１は、第一の学習項と、第二の学習項との和を最小化するように予測器を学習する。予測器算出部３２１は、例えば、以下に例示する式１２を用いて予測器を学習してもよい。

予測部３２２は、写像関数φに予測対象サンプルｘ_ｎｅｗを適用した結果を予測器ｗに適用して予測値を算出する。予測部３２２は、例えば、以下に例示する式１３を用いて予測値を算出してもよい。

対象タスク属性推定部１１０（より具体的には、属性ベクトル最適化部３１１）と、予測値算出部１２０（より具体的には、予測器算出部３２１と、予測部３２２）とは、プログラム（学習プログラム）に従って動作するコンピュータのプロセッサによって実現される。

次に、本実施形態の学習装置の動作例を説明する。図７は、本実施形態の学習装置３００の動作例を示すフローチャートである。

属性ベクトル最適化部３１１は、ラベルなしサンプルを予測器に適用して得られる結果と、予測器の属性ベクトルにラベルなしサンプルの属性ベクトルの空間への射影を適用した結果とのノルム（第一の最適化項）と、ラベル付サンプルを予測器に適用して得られる結果及びそのラベル付サンプルのラベルを含むベクトルと、予測器の属性ベクトル及び対象タスクの予測ベクトルにラベル付サンプルの属性ベクトル及び対象タスクの属性ベクトルの空間への射影を適用して得られる結果とのノルム（第二の最適化項）の和が最小になるように、属性ベクトルおよび対象タスクの属性ベクトルｄ_Ｔ＋１を算出する（ステップＳ４１）。

予測器算出部３２１は、予め定めた比率γのもとで算出される、写像関数φにラベル付サンプルを適用した結果に対して予測器を適用した値とそのラベル付サンプルのラベルとの差の大きさと、写像関数φにラベル付サンプルを適用した結果に対して予測器を適用した値と対象タスクの属性ベクトルｄ_Ｔ＋１にそのラベル付サンプルの射影を適用した値との差の大きさとの和のラベル付サンプルごとの総和（第二の学習項）、および、写像関数φにラベルなしサンプルを適用した結果に対して予測器を適用した値と属性ベクトルｄ_Ｔ＋１にそのラベルなしサンプルの射影を適用した値との差の大きさのラベルなしサンプルごとの総和との和（第一の学習項）を最小化する予測器ｗを算出する（ステップＳ４２）。

予測部３２２は、写像関数φに予測対象サンプルｘ_ｎｅｗを適用した結果を予測器に適用して予測値を算出する（ステップＳ４３）。

以上のように、本実施形態では、属性ベクトル最適化部３１１は、第一の最適化項と第二の最適化項との和が最小になるように、属性ベクトルおよび対象タスクの属性ベクトルｄ_Ｔ＋１を算出し、予測器算出部３２１が、第二の学習項、および、第一の学習項との和を最小化する予測器を算出する。そして、予測部３２２が、写像関数φに予測対象サンプルｘ_ｎｅｗを適用した結果を予測器に適用して予測値を算出する。

よって、第一の実施形態および第二の実施形態と同様、既存のモデルを利用して少数のデータから精度の高いモデルを効率的に（短時間で）学習できる。具体的には、第一の実施形態および第二の実施形態では、任意のラベルなしサンプルを想定したが、本実施形態では、対象タスクのラベルなしサンプルが予め与えられる場合を想定する。これは、いわゆる半教師付き学習に相当し、ラベル付サンプルを直接使用できること、および、対象タスクのサンプルに関する分布の情報を使用できるため、第一の実施形態および第二の実施形態と比較し、精度を高くできる可能性がある。

実施形態４．
次に、本発明による学習装置の第四の実施形態を説明する。図８は、本発明による学習装置の第四の実施形態の構成例を示すブロック図である。本実施形態の学習装置４００は、対象タスク属性推定部１１０と、予測値算出部１２０と、予測器記憶部１３０と、モデル評価部１４０と、出力部１５０とを備えている。

本実施形態の対象タスク属性推定部１１０および予測値算出部１２０の内容は、第一の実施形態、第二の実施形態および第三の実施形態のいずれでも構わない。また、予測器記憶部１３０の内容は、上述する実施形態と同様である。

モデル評価部１４０は、学習済みの予測器の属性ベクトルと、推定された対象タスクを予測する予測器の属性ベクトルとの類似度を評価する。モデル評価部１４０が属性ベクトルの類似度を評価する方法は任意である。モデル評価部１４０は、例えば、以下の式１４に例示するコサイン類似度を算出して類似度を評価してもよい。

出力部１５０は、類似度に応じた態様で予測器の間の類似性を可視化する。図９は、類似性を可視化する処理の例を示す説明図である。出力部１５０は、図９に例示するように、二つの予測器の類似度を行列形式で表示し、各予測器の類似度を対応する位置に区別し得る態様で可視化してもよい。図９では、類似度の高いセルを濃い色で、類似度の低いセルを薄い色で可視化した例を示す。

このように、類似性の有する予測器（すなわち、タスク）の関係を可視化することで、例えば、キャンペーン等の意思決定を行う際に利用することが可能になる。

次に、本発明の概要を説明する。図１０は、本発明による学習装置の概要を示すブロック図である。本発明による学習装置８０（例えば、学習装置１００～４００）は、対象タスクのドメインのサンプルに基づいて既存の予測器（例えば、ｈ_ｔ）の属性ベクトル（例えば、属性ベクトルｄ、属性行列Ｄ）を推定し、予測器に対象タスクのラベル付サンプルを適用した結果（例えば、ｈ_ｔ（ｘ））に基づいて推定される属性ベクトルからなる空間に対するそのラベル付サンプルの変換方法（例えば、射影α）に基づいて、対象タスクの属性ベクトルを推定する対象タスク属性推定部８１（例えば、対象タスク属性推定部１１０）と、対象タスクの属性ベクトルに基づいて、上記変換方法により変換される予測対象サンプル（例えば、ｘ_ｎｅｗ）の予測値を算出する予測値算出部８２（例えば、予測値算出部１２０）とを備えている。

そのような構成により、既存のモデルを利用して少数のデータから精度の高いモデルを学習できる。

また、対象タスク属性推定部８１は、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、その予測器でそれぞれ用いられる属性ベクトルを推定する属性ベクトル推定部（例えば、属性ベクトル推定部１１２）と、推定された属性ベクトルに適用して第一の推定値を得るための各ラベル付サンプルの射影（例えばα）を、予測器にそのラベル付サンプルを適用して得られる値とその第一の推定値との差が最小になるように算出する第一射影算出部（例えば、第一射影算出部１１３）と、射影に適用して第二の推定値を得るための対象タスクの属性ベクトル（例えば、ｄ_Ｔ＋１）を、ラベル付サンプルのラベル（例えば、ｙ）と第二の推定値との差が最小になるように算出する対象属性ベクトル算出部（例えば、対象属性ベクトル算出部１１４）とを含んでいてもよい。

そして、予測値算出部８２は、推定された属性ベクトルに適用して第三の推定値を得るための予測対象サンプル（例えば、サンプルｘ_ｎｅｗ）の射影（例えば、射影α＾_ｎｅｗ）を、予測器にその予測対象サンプルを適用して得られる値と第三の推定値との差が最小になるように算出する第二射影算出部（例えば、第二射影算出部１２１）と、対象タスクの属性ベクトルに射影を適用して予測値を算出する予測部（例えば、予測部１２２）とを含んでいてもよい。

そのような構成により、新しい予測対象のサンプルが得られる毎に射影ベクトルを算出することで、より精度の高い予測を行うことが可能になる。

その他の構成として、対象タスク属性推定部８１は、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力（サンプル＋値）から、その予測器でそれぞれ用いられる属性ベクトルおよび上記出力をその属性ベクトルの空間に変換する変換行列（例えば、変換行列Ｖ）を推定する変換推定部（例えば、変換推定部２１２）と、変換行列と属性間の変換を表わす関数である写像関数（例えば、写像関数φ）との積に適用して推定値を得るための対象タスクの属性ベクトルを、ラベル付サンプルのラベルとその推定値との差が最小になるように算出する属性ベクトル算出部（例えば、属性ベクトル算出部２１３）とを含んでいてもよい。

そして、予測値算出部８２は、対象タスクの属性ベクトルに変換行列および写像関数に予測対象サンプルを適用した結果を適用して予測値を算出する予測部（例えば、予測部２２２）を含んでいてもよい。

そのような構成により、新しい予測対象のサンプルが得られるたびに、単純に変換行列Ｖを用いた演算をするだけで良いため、計算コストを低減させることが可能になる。特に、変換行列で適切に射影できるような新しいサンプルに対しては、予測精度が期待される。

さらに、その他の構成として、対象タスク属性推定部８１は、対象タスクのラベルなしサンプルを複数の予測器に適用して得られる値からなるベクトルと、その予測器でそれぞれ用いられる属性ベクトルにラベルなしサンプルのその属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第一の最適化項とし、対象タスクのラベル付サンプルを複数の予測器に適用して得られる値およびそのラベル付サンプルのラベルからなるベクトルと、その予測器でそれぞれ用いられる属性ベクトルおよび対象タスクの属性ベクトルにラベル付サンプルのその属性ベクトルおよび対象タスクの属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第二の最適化項としたときの、第一の最適化項と第二の最適化項との和が最小になるように属性ベクトルおよび対象タスクの属性ベクトルを算出する属性ベクトル最適化部（例えば、属性ベクトル最適化部３１１）を含んでいてもよい。

そして、予測値算出部８２は、予め定めた比率（例えば、比率γ）のもとで算出される、属性間の変換を表わす関数である写像関数（例えば、写像関数φ）にラベル付サンプルを適用した結果に対して予測器を適用した値とそのラベル付サンプルのラベルとの差の大きさと、写像関数にラベル付サンプルを適用した結果に対して予測器を適用した値と対象タスクの属性ベクトルにそのラベル付サンプルの射影を適用した値との差の大きさとの和のラベル付サンプルごとの総和、および、写像関数にラベルなしサンプルを適用した結果に対して予測器を適用した値と属性ベクトルにそのラベルなしサンプルの射影を適用した値との差の大きさのラベルなしサンプルごとの総和との和を最小化する予測器を算出する予測器算出部（例えば、予測器算出部３２１）と、写像関数に予測対象サンプルを適用した結果を予測器に適用して予測値を算出する予測部（例えば、予測部３２２）と含んでいてもよい。

そのような構成により、対象タスクのラベルなしサンプルが予め与えられる場合（いわゆる半教師付き学習の場合）には、ラベル付サンプルを直接使用できること、および、対象タスクのサンプルに関する分布の情報を使用できるため、より精度を高くできる可能性がある。

また、学習装置８０は、既存の予測器の属性ベクトルと、推定された対象タスクを予測する予測器の属性ベクトルとの類似度を評価するモデル評価部（例えば、モデル評価部１４０）と、類似度に応じた態様で予測器の間の類似性を可視化する出力部（例えば、出力部１５０）とを備えていてもよい。

図１１は、少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ１０００は、プロセッサ１００１、主記憶装置１００２、補助記憶装置１００３、インタフェース１００４を備える。

上述の学習装置は、コンピュータ１０００に実装される。そして、上述した各処理部の動作は、プログラム（学習プログラム）の形式で補助記憶装置１００３に記憶されている。プロセッサ１００１は、プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、当該プログラムに従って上記処理を実行する。

なお、少なくとも１つの実施形態において、補助記憶装置１００３は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disc Read-only memory ）、ＤＶＤ－ＲＯＭ（Read-only memory）、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００が当該プログラムを主記憶装置１００２に展開し、上記処理を実行してもよい。

また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置１００３に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル（差分プログラム）であってもよい。

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、前記予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される前記属性ベクトルからなる空間に対する当該ラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する対象タスク属性推定部と、前記対象タスクの属性ベクトルに基づいて、前記変換方法により変換される予測対象サンプルの予測値を算出する予測値算出部とを備えたことを特徴とする学習装置。

（付記２）対象タスク属性推定部は、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルを推定する属性ベクトル推定部と、前記推定された属性ベクトルに適用して第一の推定値を得るための各ラベル付サンプルの射影を、前記予測器に当該ラベル付サンプルを適用して得られる値と当該第一の推定値との差が最小になるように算出する第一射影算出部と、前記射影に適用して第二の推定値を得るための対象タスクの属性ベクトルを、前記ラベル付サンプルのラベルと当該第二の推定値との差が最小になるように算出する対象属性ベクトル算出部とを含み、前記予測値算出部は、前記推定された属性ベクトルに適用して第三の推定値を得るための予測対象サンプルの射影を、前記予測器に当該予測対象サンプルを適用して得られる値と当該第三の推定値との差が最小になるように算出する第二射影算出部と、前記対象タスクの属性ベクトルに前記射影を適用して予測値を算出する予測部とを含む付記１記載の学習装置。

（付記３）対象タスク属性推定部は、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルおよび前記出力を当該属性ベクトルの空間に変換する変換行列を推定する変換推定部と、前記変換行列と属性間の変換を表わす関数である写像関数との積に適用して推定値を得るための対象タスクの属性ベクトルを、ラベル付サンプルのラベルと当該推定値との差が最小になるように算出する属性ベクトル算出部とを含み、予測値算出部は、前記対象タスクの属性ベクトルに前記変換行列および前記写像関数に予測対象サンプルを適用した結果を適用して予測値を算出する予測部を含む付記１記載の学習装置。

（付記４）対象タスク属性推定部は、対象タスクのラベルなしサンプルを複数の予測器に適用して得られる値からなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルに前記ラベルなしサンプルの当該属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第一の最適化項とし、対象タスクのラベル付サンプルを前記複数の予測器に適用して得られる値および当該ラベル付サンプルのラベルからなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルおよび対象タスクの属性ベクトルに前記ラベル付サンプルの当該属性ベクトルおよび対象タスクの属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第二の最適化項としたときの、前記第一の最適化項と前記第二の最適化項との和が最小になるように属性ベクトルおよび対象タスクの属性ベクトルを算出する属性ベクトル最適化部を含み、前記予測値算出部は、予め定めた比率のもとで算出される、属性間の変換を表わす関数である写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と当該ラベル付サンプルのラベルとの差の大きさと、前記写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と前記対象タスクの属性ベクトルに当該ラベル付サンプルの射影を適用した値との差の大きさとの和のラベル付サンプルごとの総和、および、前記写像関数にラベルなしサンプルを適用した結果に対して予測器を適用した値と前記属性ベクトルに当該ラベルなしサンプルの射影を適用した値との差の大きさのラベルなしサンプルごとの総和との和を最小化する予測器を算出する予測器算出部と、前記写像関数に予測対象サンプルを適用した結果を前記予測器に適用して予測値を算出する予測部と含む付記１記載の学習装置。

（付記５）既存の予測器の属性ベクトルと、推定された対象タスクを予測する予測器の属性ベクトルとの類似度を評価するモデル評価部と、前記類似度に応じた態様で前記予測器の間の類似性を可視化する出力部とを備えた付記１から付記４のうちのいずれか１つに記載の学習装置。

（付記６）コンピュータが、対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、前記予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される前記属性ベクトルからなる空間に対する当該ラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定し、前記コンピュータが、前記対象タスクの属性ベクトルに基づいて、前記変換方法により変換される予測対象サンプルの予測値を算出することを特徴とする学習方法。

（付記７）コンピュータが、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルを推定し、前記コンピュータが、前記推定された属性ベクトルに適用して第一の推定値を得るための各ラベル付サンプルの射影を、前記予測器に当該ラベル付サンプルを適用して得られる値と当該第一の推定値との差が最小になるように算出し、前記コンピュータが、前記射影に適用して第二の推定値を得るための対象タスクの属性ベクトルを、前記ラベル付サンプルのラベルと当該第二の推定値との差が最小になるように算出し、前記コンピュータが、前記推定された属性ベクトルに適用して第三の推定値を得るための予測対象サンプルの射影を、前記予測器に当該予測対象サンプルを適用して得られる値と当該第三の推定値との差が最小になるように算出し、前記コンピュータが、前記対象タスクの属性ベクトルに前記射影を適用して予測値を算出する付記６記載の学習方法。

（付記８）コンピュータが、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルおよび前記出力を当該属性ベクトルの空間に変換する変換行列を推定し、前記コンピュータが、前記変換行列と属性間の変換を表わす関数である写像関数との積に適用して推定値を得るための対象タスクの属性ベクトルを、ラベル付サンプルのラベルと当該推定値との差が最小になるように算出し、前記コンピュータが、前記対象タスクの属性ベクトルに前記変換行列および前記写像関数に予測対象サンプルを適用した結果を適用して予測値を算出する付記６記載の学習方法。

（付記９）コンピュータが、対象タスクのラベルなしサンプルを複数の予測器に適用して得られる値からなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルに前記ラベルなしサンプルの当該属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第一の最適化項とし、前記コンピュータが、対象タスクのラベル付サンプルを前記複数の予測器に適用して得られる値および当該ラベル付サンプルのラベルからなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルおよび対象タスクの属性ベクトルに前記ラベル付サンプルの当該属性ベクトルおよび対象タスクの属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第二の最適化項としたときの、前記第一の最適化項と前記第二の最適化項との和が最小になるように属性ベクトルおよび対象タスクの属性ベクトルを算出し、前記コンピュータが、予め定めた比率のもとで算出される、属性間の変換を表わす関数である写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と当該ラベル付サンプルのラベルとの差の大きさと、前記写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と前記対象タスクの属性ベクトルに当該ラベル付サンプルの射影を適用した値との差の大きさとの和のラベル付サンプルごとの総和、および、前記写像関数にラベルなしサンプルを適用した結果に対して予測器を適用した値と前記属性ベクトルに当該ラベルなしサンプルの射影を適用した値との差の大きさのラベルなしサンプルごとの総和との和を最小化する予測器を算出し、前記コンピュータが、前記写像関数に予測対象サンプルを適用した結果を前記予測器に適用して予測値を算出する付記６記載の学習方法。

（付記１０）コンピュータに、対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、前記予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される前記属性ベクトルからなる空間に対する当該ラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する対象タスク属性推定処理、および、前記対象タスクの属性ベクトルに基づいて、前記変換方法により変換される予測対象サンプルの予測値を算出する予測値算出処理を実行させるための学習プログラム。

（付記１１）コンピュータに、対象タスク属性推定処理で、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルを推定する属性ベクトル推定処理、前記推定された属性ベクトルに適用して第一の推定値を得るための各ラベル付サンプルの射影を、前記予測器に当該ラベル付サンプルを適用して得られる値と当該第一の推定値との差が最小になるように算出する第一射影算出処理、および、前記射影に適用して第二の推定値を得るための対象タスクの属性ベクトルを、前記ラベル付サンプルのラベルと当該第二の推定値との差が最小になるように算出する対象属性ベクトル算出処理を実行させ、前記予測値算出処理で、前記推定された属性ベクトルに適用して第三の推定値を得るための予測対象サンプルの射影を、前記予測器に当該予測対象サンプルを適用して得られる値と当該第三の推定値との差が最小になるように算出する第二射影算出処理、および、前記対象タスクの属性ベクトルに前記射影を適用して予測値を算出する予測処理を実行させる付記１０記載の学習プログラム。

（付記１２）コンピュータに、対象タスク属性推定処理で、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルおよび前記出力を当該属性ベクトルの空間に変換する変換行列を推定する変換推定処理、および、前記変換行列と属性間の変換を表わす関数である写像関数との積に適用して推定値を得るための対象タスクの属性ベクトルを、ラベル付サンプルのラベルと当該推定値との差が最小になるように算出する属性ベクトル算出処理を実行させ、予測値算出処理で、前記対象タスクの属性ベクトルに前記変換行列および前記写像関数に予測対象サンプルを適用した結果を適用して予測値を算出する予測処理を実行させる付記１０記載の学習プログラム。

（付記１３）コンピュータに、対象タスク属性推定処理で、対象タスクのラベルなしサンプルを複数の予測器に適用して得られる値からなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルに前記ラベルなしサンプルの当該属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第一の最適化項とし、対象タスクのラベル付サンプルを前記複数の予測器に適用して得られる値および当該ラベル付サンプルのラベルからなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルおよび対象タスクの属性ベクトルに前記ラベル付サンプルの当該属性ベクトルおよび対象タスクの属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第二の最適化項としたときの、前記第一の最適化項と前記第二の最適化項との和が最小になるように属性ベクトルおよび対象タスクの属性ベクトルを算出する属性ベクトル最適化処理を実行させ、前記予測値算出処理で、予め定めた比率のもとで算出される、属性間の変換を表わす関数である写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と当該ラベル付サンプルのラベルとの差の大きさと、前記写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と前記対象タスクの属性ベクトルに当該ラベル付サンプルの射影を適用した値との差の大きさとの和のラベル付サンプルごとの総和、および、前記写像関数にラベルなしサンプルを適用した結果に対して予測器を適用した値と前記属性ベクトルに当該ラベルなしサンプルの射影を適用した値との差の大きさのラベルなしサンプルごとの総和との和を最小化する予測器を算出する予測器算出処理、および、前記写像関数に予測対象サンプルを適用した結果を前記予測器に適用して予測値を算出する予測処理を実行させる付記１０記載の学習プログラム。

１００，２００，３００，４００学習装置
１１０対象タスク属性推定部
１１１サンプル生成部
１１２属性ベクトル推定部
１１３第一射影算出部
１１４対象属性ベクトル算出部
１２０予測値算出部
１２１第二射影算出部
１２２予測部
１３０予測器記憶部
２１１サンプル生成部
２１２変換推定部
２１３属性ベクトル算出部
２２２予測部
３１１属性ベクトル最適化部
３２１予測器算出部
３２２予測部

Claims

対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、前記予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される前記属性ベクトルからなる空間に対する当該ラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する対象タスク属性推定部と、
前記対象タスクの属性ベクトルに基づいて、前記変換方法により変換される予測対象サンプルの予測値を算出する予測値算出部とを備えた
ことを特徴とする学習装置。
対象タスク属性推定部は、
対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルを推定する属性ベクトル推定部と、
前記推定された属性ベクトルに適用して第一の推定値を得るための各ラベル付サンプルの射影を、前記予測器に当該ラベル付サンプルを適用して得られる値と当該第一の推定値との差が最小になるように算出する第一射影算出部と、
前記射影に適用して第二の推定値を得るための対象タスクの属性ベクトルを、前記ラベル付サンプルのラベルと当該第二の推定値との差が最小になるように算出する対象属性ベクトル算出部とを含み、
前記予測値算出部は、
前記推定された属性ベクトルに適用して第三の推定値を得るための予測対象サンプルの射影を、前記予測器に当該予測対象サンプルを適用して得られる値と当該第三の推定値との差が最小になるように算出する第二射影算出部と、
前記対象タスクの属性ベクトルに前記射影を適用して予測値を算出する予測部とを含む
請求項１記載の学習装置。
対象タスク属性推定部は、
対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルおよび前記出力を当該属性ベクトルの空間に変換する変換行列を推定する変換推定部と、
前記変換行列と属性間の変換を表わす関数である写像関数との積に適用して推定値を得るための対象タスクの属性ベクトルを、ラベル付サンプルのラベルと当該推定値との差が最小になるように算出する属性ベクトル算出部とを含み、
予測値算出部は、
前記対象タスクの属性ベクトルに前記変換行列および前記写像関数に予測対象サンプルを適用した結果を適用して予測値を算出する予測部を含む
請求項１記載の学習装置。
対象タスク属性推定部は、
対象タスクのラベルなしサンプルを複数の予測器に適用して得られる値からなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルに前記ラベルなしサンプルの当該属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第一の最適化項とし、
対象タスクのラベル付サンプルを前記複数の予測器に適用して得られる値および当該ラベル付サンプルのラベルからなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルおよび対象タスクの属性ベクトルに前記ラベル付サンプルの当該属性ベクトルおよび対象タスクの属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第二の最適化項としたときの、
前記第一の最適化項と前記第二の最適化項との和が最小になるように属性ベクトルおよび対象タスクの属性ベクトルを算出する属性ベクトル最適化部を含み、
前記予測値算出部は、
予め定めた比率のもとで算出される、属性間の変換を表わす関数である写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と当該ラベル付サンプルのラベルとの差の大きさと、前記写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と前記対象タスクの属性ベクトルに当該ラベル付サンプルの射影を適用した値との差の大きさとの和のラベル付サンプルごとの総和、および、
前記写像関数にラベルなしサンプルを適用した結果に対して予測器を適用した値と前記属性ベクトルに当該ラベルなしサンプルの射影を適用した値との差の大きさのラベルなしサンプルごとの総和
との和を最小化する予測器を算出する予測器算出部と、
前記写像関数に予測対象サンプルを適用した結果を前記予測器に適用して予測値を算出する予測部と含む
請求項１記載の学習装置。
既存の予測器の属性ベクトルと、推定された対象タスクを予測する予測器の属性ベクトルとの類似度を評価するモデル評価部と、
前記類似度に応じた態様で前記予測器の間の類似性を可視化する出力部とを備えた
請求項１から請求項４のうちのいずれか１項に記載の学習装置。
コンピュータが、対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、前記予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される前記属性ベクトルからなる空間に対する当該ラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定し、
前記コンピュータが、前記対象タスクの属性ベクトルに基づいて、前記変換方法により変換される予測対象サンプルの予測値を算出する
ことを特徴とする学習方法。
コンピュータが、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルを推定し、
前記コンピュータが、前記推定された属性ベクトルに適用して第一の推定値を得るための各ラベル付サンプルの射影を、前記予測器に当該ラベル付サンプルを適用して得られる値と当該第一の推定値との差が最小になるように算出し、
前記コンピュータが、前記射影に適用して第二の推定値を得るための対象タスクの属性ベクトルを、前記ラベル付サンプルのラベルと当該第二の推定値との差が最小になるように算出し、
前記コンピュータが、前記推定された属性ベクトルに適用して第三の推定値を得るための予測対象サンプルの射影を、前記予測器に当該予測対象サンプルを適用して得られる値と当該第三の推定値との差が最小になるように算出し、
前記コンピュータが、前記対象タスクの属性ベクトルに前記射影を適用して予測値を算出する
請求項６記載の学習方法。
コンピュータが、対象タスクのドメインのサンプルを複数の予測器に適用して得られる出力から、当該予測器でそれぞれ用いられる属性ベクトルおよび前記出力を当該属性ベクトルの空間に変換する変換行列を推定し、
前記コンピュータが、前記変換行列と属性間の変換を表わす関数である写像関数との積に適用して推定値を得るための対象タスクの属性ベクトルを、ラベル付サンプルのラベルと当該推定値との差が最小になるように算出し、
前記コンピュータが、前記対象タスクの属性ベクトルに前記変換行列および前記写像関数に予測対象サンプルを適用した結果を適用して予測値を算出する
請求項６記載の学習方法。
コンピュータが、対象タスクのラベルなしサンプルを複数の予測器に適用して得られる値からなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルに前記ラベルなしサンプルの当該属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第一の最適化項とし、
前記コンピュータが、対象タスクのラベル付サンプルを前記複数の予測器に適用して得られる値および当該ラベル付サンプルのラベルからなるベクトルと、当該予測器でそれぞれ用いられる属性ベクトルおよび対象タスクの属性ベクトルに前記ラベル付サンプルの当該属性ベクトルおよび対象タスクの属性ベクトルの空間への射影を適用して得られるベクトルとのノルムを第二の最適化項としたときの、
前記第一の最適化項と前記第二の最適化項との和が最小になるように属性ベクトルおよび対象タスクの属性ベクトルを算出し、
前記コンピュータが、予め定めた比率のもとで算出される、属性間の変換を表わす関数である写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と当該ラベル付サンプルのラベルとの差の大きさと、前記写像関数に前記ラベル付サンプルを適用した結果に対して予測器を適用した値と前記対象タスクの属性ベクトルに当該ラベル付サンプルの射影を適用した値との差の大きさとの和のラベル付サンプルごとの総和、および、
前記写像関数にラベルなしサンプルを適用した結果に対して予測器を適用した値と前記属性ベクトルに当該ラベルなしサンプルの射影を適用した値との差の大きさのラベルなしサンプルごとの総和
との和を最小化する予測器を算出し、
前記コンピュータが、前記写像関数に予測対象サンプルを適用した結果を前記予測器に適用して予測値を算出する
請求項６記載の学習方法。
コンピュータに、
対象タスクのドメインのサンプルに基づいて既存の予測器の属性ベクトルを推定し、前記予測器に対象タスクのラベル付サンプルを適用した結果に基づいて推定される前記属性ベクトルからなる空間に対する当該ラベル付サンプルの変換方法に基づいて、対象タスクの属性ベクトルを推定する対象タスク属性推定処理、および、
前記対象タスクの属性ベクトルに基づいて、前記変換方法により変換される予測対象サンプルの予測値を算出する予測値算出処理
を実行させるための学習プログラム。