JP2021536087A

JP2021536087A - 経験損失推定システム、経験損失推定方法および経験損失推定プログラム

Info

Publication number: JP2021536087A
Application number: JP2021538513A
Authority: JP
Inventors: シルバダニエルゲオルグアンドラーデ; 穣岡嶋; 邦彦定政
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2018-09-28
Filing date: 2018-09-28
Publication date: 2021-12-23
Anticipated expiration: 2038-09-28
Also published as: US20210383265A1; JP7056804B2; WO2020065953A1

Abstract

密度推定部８１は、観測された共変数が与えられ、ランダム変数に対応する目的変数と、観測された共変数に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数の滑らかな関数の写像の結果である真値を示すランダム変数の条件付き確率密度を推定する。積分推定部８２は、入力されたランダム変数のシグモイド関数と、ランダム変数の条件付き確率密度の関数との積の一次元積分を推定する。

Description

本発明は、１以上の未知の共変数を取得した場合の分類器に期待される誤分類コストを推定する経験損失推定システム、経験損失推定方法、および経験損失推定プログラムに関する

多くの状況では、より多くの共変数を収集することで、分類精度を向上させることができる。しかし、共変数を取得するにはコストがかかる可能性がある。例えば、糖尿病の有無を診断する場合を想定する。年齢や性別などの情報（共変数）の収集には、ほとんどコストがかからないのに対し、血液検査には、明らかにコスト（医師の勤務時間コストなど）がかかる。一方、患者が糖尿病に苦しんでいるにもかかわらず、誤って糖尿病を持っていないと分類してしまうコストも存在する。

したがって、分類の最終的な目標は、取得した共変数のコストと予想される誤分類のコストの合計によって与えられる誤分類の総コストを削減することであると言える。

共変数を取得するためのコスト、および、誤分類のコストが与えられていると仮定する。誤分類の総コストを削減するためには、より多くの共変数を与えられた場合（すなわち、上記の例では患者に関するより多くの情報を与えられた場合）に予想される誤分類コストを見積もる必要がある。

形式的には、この予想されるコストは、以下のように表される。

ここで、Ｓは、既に観測された共変数の集合を示し、Ａは追加的に取得すると考えられる共変数を示す。また、正しいクラスがｙであるにもかかわらず、あるサンプル（すなわち、上記の例では患者）をクラスｙ’に分類してしまう場合のコストをｃ_ｙ，ｙ’と示す。なお、以下の説明では、本文中にギリシャ文字を用いる場合には、ギリシャ文字の英語表記を括弧（［］）で囲むことがある。また、大文字のギリシャ文字を表す場合には、［］内の単語の先頭を大文字で表し、小文字のギリシャ文字を表す場合には、［］内の単語の先頭を小文字で表す。さらに、以下の説明では、ギリシャ文字のデルタをｄと表記し、数学における結合を∪と示す。さらに、ｄ^＊（ｘ_Ａ∪Ｓ）は、共変数Ａ∪Ｓを用いたベイズ分類器を表し、以下のように定義される。

ここで、ｃ_ｙ，ｙ＊は、ｙとｙ^＊が等しくない場合に０であり、そうでない場合、ｃ_ｙ，ｙ＊＞０で、真のラベルｙを有するサンプルをラベルｙ^＊として誤分類してしまうコストを示す。

以下では、未知の共変数Ａを、潜在的なクエリ共変数、または、単にクエリ共変数と記す。これらは、問い合わせを所望される共変数（例えば、臨床実験を行う）であり、それらの結果ｘ_Ａを、分類器に含めることが可能なためである。

式１に示すように、期待される誤分類コストの計算には、すべての未知の共変数Ａに対する積分が必要である。多くの未知の共変数がある場合、すなわち｜Ａ｜＞１の場合、解析的な閉形解がないため、この積分の評価は、計算上困難である。

非特許文献１には、ベイズ的コスト考慮型の分類法が記載されている。非特許文献１に記載された方法は、常に｜Ａ｜を１に限定しているため、一次元積分のみ解く必要がある。

なお、非特許文献２には、ラベル付きデータを用いた勾配降下による学習方法が記載されている。

Shihao Ji, Lawrence Carin, "Cost-sensitive feature acquisition and classification", Pattern Recognition, Volume 40, Issue 5, May 2007, pp.1474-1485. Hastie, Trevor, Tibshirani, Robert, Friedman, Jerome, "The Elements of Statistical Learning", Springer-Verlag New York , 2009.

上述したように、非特許文献１に記載された方法では、クエリ共変数が２つ以上ある場合に予想される誤分類コストを推定できない。これは、誤分類の総コストがさらに減少する可能性があるにもかかわらず、クエリ共変数に対する処理を停止するという最適でない決定につながる可能性があるためである。

以下では、線形分離可能なデータであっても問題になる具体例を示す。ここで、Ｖを可能な全ての共変数の集合、Ｓをすでに観測された共変数の集合、Ａを追加で取得されると想定される共変数の集合とする。共変数を取得する際の総期待コストは、以下のように定義される。

ここでｆ_ｉは共変数ｉを取得するコストである。非特許文献１に記載された方法も、ｔ（Ａ）を最適化しようとするが、ｔ（Ａ）が最小であり、かつ｜Ａ｜≦１である集合Ａを選択する貪欲法が用いられる。そして、Ａ＝｛０｝が選択された場合、アルゴリズムは停止する。以下の例は、｜Ａ｜≦１のみを考慮する方法が失敗することを示す。

まず、以下の状況を想定する。

そして、ｘ_１とｘ_２の条件付き同時分布は、平均値が０の等方性ガウス分布ある。
ｐ（ｘ_１，ｘ_２｜ｘ_ｓ）＝Ｎ（ｘ_１，ｘ_２｜０，Ｉ）
単純化のために、誤分類コストがｃ_０，１＝ｃ_１，０＝ｃ＞０であり、ｃ_ｙ，ｙ＝０であると仮定する。さらに、単純化のため、共変数ｘ_１のクエリ共変数のコストがｘ_２と同じであると仮定し、これをｆ＞０と記載する。

クラス１とクラス０の間に、以下のような決定境界があると仮定する。

ここで、図７に示すように、一般性を損なうことなく、ｍ＞０、ｒ＞０とする。図７は、クラス間の決定境界の一例を示す説明図である。さらに、図７では、条件付き同時確率ｐ（ｘ_１，ｘ_２｜ｘ_Ｓ）の一定密度の等高線図が示されている。ここでは、Ａ＝｛０｝、Ａ＝｛ｘ_１｝、Ａ＝｛ｘ_２｝、および、Ａ＝｛ｘ_１，ｘ_２｝の４つの場合を考える。各Ａについて、期待される誤分類コストを計算し、α_Ａと表記する。

まず、Ａ＝｛ｘ_１，ｘ_２｝について、

であり、

次に、Ａ＝｛ｘ_１｝について、

以下を満たすｘ_１の値をｂと定義する。

以下の式

を満たすため、ｂ＝−ｒ／ｍになる。

同様に、期待ベイズリスク｛ｘ_２｝を計算することが可能である。

最後に、Ａ＝｛０｝とする。また、ランダム変数ｚ：＝ｘ_２−ｍｘ_１−ｒを定義する。ｘ_１とｘ_２は独立した標準正規分布であるため、ｚ〜Ｎ（−ｒ，ｍ^２＋１）である。

ｒ＞０と仮定しているため、上記式が得られる。そのため、ｄ^＊（ｘ_ｓ）＝０である。そして、結果として、以下の式が得られる。

一般性を失うことなく、α_｛ｘ１｝＜α_｛ｘ２｝であり、各共変数のコストがｆ＞０であると想定する。貪欲法で｜Ａ｜≦１の場合、
（Ｉ）ｔ（｛０｝）＜t（｛ｘ１｝）、または、
（ＩＩ）ｔ（｛０｝）＞ｔ（｛ｘ１，ｘ２｝）の場合、失敗する。これは、
（Ｉ）α_｛０｝＜α_｛ｘ１｝＋ｆ、または、
（ＩＩ）α_｛０｝＞２ｆを意味し、α_｛ｘ１｝＞α_｛０｝／２と等価だからである。

したがって、ｒ＝０の場合を除き、共変数コストｆ＞０が必ず存在するため、貪欲法は失敗する。具体的な数値例として、ｒ＝ｍ＝１、ｃ_０，１＝ｃ_１，０＝１００、ｆ＝１０と仮定する。各クエリセットに対する期待コストの合計を表１に示す。

そこで、本発明では、クエリ共変数が１以上の場合でも、低い計算コストで高精度に経験損失を推定できる経験損失推定システム、経験損失推定方法、および経験損失推定プログラムを提供することを目的とする。

本発明による経験損失推定システムは、ランダム変数に対応する目的変数と、観測された共変数に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数の滑らかな関数の写像の結果である真値を示すランダム変数の条件付き確率密度を推定する密度推定部と、入力されたランダム変数のシグモイド関数と、ランダム変数の条件付き確率密度の関数との積の一次元積分を推定する積分推定部とを備えたことを特徴とする。

本発明による経験損失推定方法は、ランダム変数に対応する目的変数と、観測された共変数に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数の滑らかな関数の写像の結果である真値を示すランダム変数の条件付き確率密度を推定し、入力されたランダム変数のシグモイド関数と、ランダム変数の条件付き確率密度の関数との積の一次元積分を推定することを特徴とする。

本発明による経験損失推定プログラムは、コンピュータに、ランダム変数に対応する目的変数と、観測された共変数に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数の滑らかな関数の写像の結果である真値を示すランダム変数の条件付き確率密度を推定する密度推定処理、および、入力されたランダム変数のシグモイド関数と、ランダム変数の条件付き確率密度の関数との積の一次元積分を推定する積分推定処理を実行させることを特徴とする。

本発明によれば、クエリ共変数が１以上の場合でも、低い計算コストで高精度に経験損失を推定できる。

本発明による経験損失推定システムの一実施形態の構成例を示すブロック図である。本発明による経験損失推定システムの一実施形態の構成例を示す説明図である。異なるシグモイド関数の近似例を示す説明図である。経験損失推定システムの動作例を示すフローチャートである。本発明による経験損失推定システムの概要を示すブロック図である。本発明の一実施形態に係るコンピュータの構成例を示す概略ブロック図である。クラス間の決定境界の例を示す説明図である。

以下、本発明の実施形態を図面を参照して説明する。

図１は、本発明による経験損失推定システムの一実施形態の構成例を示すブロック図である。また、図２は、本発明による経験損失推定システムの一実施形態の構成例を示す説明図である。

本実施形態では、条件付きクラス確率が、以下の一般化された加算モデルで表すことができると仮定する。

ここで、ｇは、例えばロジスティック関数などのシグモイド関数、τはバイアス、ｆ_Ａ：Ｒ^｜Ａ｜−＞Ｒ、および、ｆ_Ｓ：Ｒ^｜Ｓ｜−＞Ｒは、任意の滑らかな関数である。τおよびこれらの関数の学習方法は任意であり、例えば、一般的には、ラベル付きデータを用いて勾配降下法により学習される。非特許文献２に記載された方法が学習に用いられてもよい。ただし、本実施形態では、τおよびこれらの関数は、与えられるものとする。

例えば、線形決定境界を持つ分類器の場合、以下の式が得られる。

βは、ラベル付けされたデータから学習された分類器の重みベクトルである。ここで、β_Ａおよびβ_Ｓは、それぞれ、共変数ＡおよびＳに対応するβの部分ベクトルを表す。

期待される誤分類コストは、以下のように表わすことができる。

ここでは、密度ｈ（ｚ）：＝ｐ（ｚ｜ｘ_ｓ）であるランダム変数ｚ：＝ｆ_Ａ（ｘ_Ａ）を導入する。式３による結果として得られる積分は、ｚの一次元積分にしか過ぎない。しかし、ｈ（ｚ）を推定する必要がある。

本実施形態の経験損失推定システム１００は、密度推定部１０と、積分推定部２０と、記憶部３０とを備えている

密度推定部１０は、ｈ（ｚ）を推定する。具体的には、密度推定部１０は、観測された共変数Ｓが与えられ、ランダム変数ｚに対応する目的変数と、共変数Ｓに対応する独立変数とを有する回帰モデルを学習することにより、ｚの条件付き確率密度を推定する。ｚは、観測されていない共変数Ａの滑らかな関数の写像の結果である実数を表す。

以下では、線形回帰、または、非線形回帰を用いてｈ（ｚ）を推定する方法を説明する。ここでは、ラベル付けされていないデータの集合を｛ｘ^（ｉ）｝^ｎ _ｉ＝１と記す。なお、密度推定部１０は、クラスラベル付きデータを必要としない。非ラベル化データの集合から、密度推定部１０は、｛（ｚ^（ｉ），ｘ_Ｓ ^（ｉ））｝^ｎ _ｉ＝１（ただし、ｚ^（ｉ）＝ｆ_Ａ（ｘ_Ａ ^（ｉ）））形式の目的変数と独立変数の対の集合を形成してもよい。例えば、ｚとｘ_Ｓとの間に正規ノイズを伴う線形関係があると仮定すると、密度推定部１０は、以下の式を得られる。

あるパラメータベクトルに対して、

これは、データ｛（ｚ^（ｉ），ｘ_Ｓ ^（ｉ））｝^ｎ _ｉ＝１から推定される。以下、μ、Σ、および、σが用いられる。例えば、同時分布ｐ（ｘ）が多変数正規分布Ｎ（μ，Σ）であり、ｐ（ｙ｜ｘ_Ａ，ｘ_Ｂ）が重みベクトルｂのロジスティック回帰モデルにしたがう場合、最尤推定値は、以下にように示される。

すなわち、密度推定部１０は、正規分布によりｚの条件付き確率密度を推定してもよい。

ｚとｘ_ｓの間の線形関係が不合理な場合、ガウス過程のようなノンパラメトリック回帰モデルの方が、より適切である可能性がある。上述のように、ｘ^（ｉ）（ｘ^（ｉ）はＲ^ｐに属する。）を学習時に利用可能なｘのｉ番目のサンプルとし、ｘ^＊ _Ｓをテスト時の新しいサンプルの観測された共変数とする。このとき、行列Ｋ（Ｘ_Ｓ，Ｘ_Ｓ）は、以下のように定義される。

ここで、ｋは共分散関数であり、例えば、二乗指数共分散関数を使用すると、密度推定部１０は、以下の式を得られる。

ここで、ｌは長さスケールパラメータである。さらに、密度推定部１０は、列ベクトルｚ（ｚはＲ^ｎに属する）を以下のように定義する。

また、テスト時の新しいサンプルｘ^＊について、密度推定部１０は、同じように、以下のように定義する。

そして、密度推定部１０は、列ベクトルｋ（ｘ^＊ _Ｓ，Ｘ_Ｓ）（ｋ（ｘ^＊ _Ｓ，Ｘ_Ｓ）はＲ^ｎに属する。）を以下のように定義する。

そして、分散σ_０ ^２を有する追加的ガウスノイズを有するガウスプロセス仮定の下、密度推定部１０は、以下の式を得られる。

ここで、密度推定部１０は、以下の式で与えられる固定的な平均μ_０を想定する。

また、１_ｎ（１_ｎはＲ^ｎに属する。）は、すべて１のベクトルである。結果として、密度推定部１０は、以下の式を得られる。

積分推定部２０は、式３を推定する。特に、積分推定部２０は、入力ｚを有するシグモイド関数ｇとｚの条件付き確率密度関数との積の一次元積分を推定する。

積分推定部２０は、式３を推定するために、単純にｈ（ｚ）からのモンテカルロサンプルを用いてもよい。一方、処理速度を向上させるために、積分推定部２０は、以下に説明するように、シグモイド関数ｇの区分線形近似に基づく別の戦略を使用してもよい。

まず、積分推定部２０は、予想される誤分類コストを以下のように表現する。

なお、以下の関係に留意する。

さらに、積分推定部２０は、以下の式を得られる。

以上のように、ｄ^＊（ｘ_Ａ∪Ｓ）は、ｚ（ランダム変数）とζ（固定）にのみ依存する。そのため、積分推定部２０は、以下の式を得られる。

同様に、積分推定部２０は、以下の式を得られる。

したがって、残る課題は、以下の積分を評価することである。

一般的な戦略の一つが、シグモイド関数ｇを標準正規分布Φの累積分布関数で近似することである。しかし、ここでは、ａまたはｂが有界であるため、この近似はここでは機能しないことが分かる。代わりに、本実施形態では、積分推定部２０は、シグモイド関数がわずか数個の線形関数でよく近似できるという事実をここで使用する。ｈ（ｚ）が平均μ´と分散σ^２の正規分布であると仮定する。表記を容易にするために、以下の定数を導入する。

この場合、式４の積分は、以下のように表すことができる。

積分推定部２０は、シグモイド関数の以下の部分線形近似を定義する。

ξは、線形近似の数であり、例えば、４０に設定される。以下の近似との比較

は、図３に示される。図３は、異なるシグモイド関数の近似例を示す説明図である。図３において、線４１はシグモイド、線４２は線形近似、線４３は正規ＣＤＦ（累積分布関数）近似、線４４は離散近似を表している。非特許文献１によれば、線形関数近似および離散ビン近似では、ξ＝４０が設定されている。正規ＣＤＦ近似の場合、以下の式

が用いられる。

このことは、相対的に少数の線形近似については、積分推定部２０が、Φ−近似よりも正確な近似を達成できることを示している。より重要なことは、以下に示すように、これにより、Φ−近似を使用する場合にはできないような、式５の積分計算を扱いやすくできることである。

これにより、積分推定部２０は、以下の式を得られる。

これは、標準的な実装でよく近似することができる。残りの積分はまた、置換ｕ−μ：＝ｒを使用するΦで表すことができ、積分推定部２０は、以下の式を得られる。

このように、積分推定部２０は、シグモイド関数の区分線形近似を用いて一次元積分を推定してもよい。

記憶部３０は、各種データを記憶する。記憶部３０は、ラベル付けされていないデータ｛ｘ｝を記憶してもよい。記憶部３０は、例えば、磁気ディスクによって実現される。

密度推定部１０と、積分推定部２０とは、それぞれ、プログラム（経験損失推定プログラム）に従って動作するコンピュータのＣＰＵによって実行される。例えば、プログラムは、経験損失推定システム１００に含まれる記憶部３０に記憶され、ＣＰＵがプログラムを読み込んで、そのプログラムに従って密度推定部１０及び積分推定部２０として動作してもよい。

また、本実施形態の経験損失推定システムにおいて、密度推定部１０および積分推定部２０は、それぞれ専用のハードウェアによって実装されてもよい。また、本発明による経験損失推定システムが、有線または無線で接続された２つ以上の物理的に分離された装置で構成されてもよい。

以下、本実施形態の経験損失リスク推定システムの動作例を説明する。図４は、本実施形態の経験損失推定システムの動作例を示すフローチャートである。

密度推定部１０は、部分的に観測されたデータサンプルｘ_Ｓと、未知の共変数Ａのインデックスと、ラベル付けされていないデータ｛ｘ｝とを入力する（ステップＳ１０１）。密度推定部１０は、条件付き確率ｐ（ｘ_Ａ｜ｘ_Ｓ）を推定する（ステップＳ１０２）。密度推定部１０は、確率ｐ（ｘ^Ｔ _Ａβ_Ａ|ｘ_Ｓ）を正規分布ｈ（ｚ）で近似する（ステップＳ１０３）。

積分推定部２０は、ｚ＞ｚ^＊であればｄ^＊（ｘ_Ｓ∪Ａ）＝１、そうでなければｄ^＊（ｘ_Ｓ∪Ａ）＝０となるような閾値ｚ^＊を算出する（ステップＳ１０４）。積分推定部２０は、ｇの区分線形近似を行い、以下の積分をガウスＣＤＦで表現する（ステップＳ１０５）。

積分推定部２０は、Ｅ_ｘＡ［ＢａｙｅｓＲｉｓｋ（ｘ_Ｓ∪Ａ）｜ｘ_Ｓ］を評価する（ステップＳ１０６）。このようにして、共変数Ａが取得され、ベイズリスクが推定される。

以上のように、本実施形態では、密度推定部１０が、ｚに対応する目的変数と、観測された共変数Ｓに対応する独立変数とを有する回帰モデルを学習することにより、ｚの条件付き確率密度を推定し、積分推定部２０が、入力ｚを有するシグモイド関数ｇとｚの条件付き確率密度関数との積の一次元積分を推定する。

そのような構成により、クエリ共変数が１以上の場合でも、低い計算コストで高精度に経験損失を推定できる。

すなわち、本実施形態では、クラス確率がクエリ共変数の特徴マップの加法関数である分類器が考慮され、それらの特徴マップの和の値が実数である。この実数は、既に観測された共変数が与えられた条件分布を直接推定するランダム変数とみなされる。そして、積分推定部２０は、この条件付き分布に関して期待される誤分類コストを推定する。

この場合、本実施形態では、クエリ共変数の数が１以上の場合でも、予想される誤分類コストを推定するためには、一次元積分を解くだけでよい。したがって、高次元の積分とは対照的に、一次元積分は、数値的手法を用いて、低い計算コストで高い精度で解くことができる。

次に、本発明の概要を説明する。図５は、本発明による経験損失推定システムの概要を示すブロック図である。本発明による経験損失推定システム８０（例えば、経験損失推定システム１００）は、観測された共変数（例えば、Ｓ）が与えられ、ランダム変数（例えば、ｚ）に対応する目的変数と、観測された共変数（例えば、Ｓ）に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数（例えば、Ａ）の滑らかな関数の写像の結果である真値を示すランダム変数（例えば、ｚ）の条件付き確率密度を推定する密度推定部８１（例えば、密度推定部１０）と、入力されたランダム変数（例えば、ｚ）のシグモイド関数（例えば、ｇ）と、ランダム変数（例えば、ｚ）の条件付き確率密度の関数との積の一次元積分を推定する積分推定部８２（例えば、積分推定部２０）とを備えている。

また、密度推定部８１は、ランダム変数（例えば、ｚ）の条件付き確率密度を正規分布で推定し、積分推定部は、シグモイド関数の区分線形近似を用いて、一次元積分を推定してもよい。そのような構成により、処理速度の向上を図ることができる。

次に、本発明の例示的な実施形態によるコンピュータの構成例を説明する。図６は、本発明の一実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ１０００は、ＣＰＵ１００１、主記憶装置１００２、補助記憶装置１００３、インタフェース１００４および表示装置１００５を備える。

上述の経験損失推定システム１００は、コンピュータ１０００に実装される。そして、上述した各処理部の動作は、プログラム（分類プログラム）の形式で補助記憶装置１００３に記憶されている。ＣＰＵ１００１は、プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、当該プログラムに従って上記処理を実行する。

補助記憶装置１００３は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ−ＲＯＭ（Compact Disc Read-only memory ）、ＤＶＤ−ＲＯＭ（Read-only memory）、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００が当該プログラムを主記憶装置１００２に展開し、上記処理を実行してもよい。

また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、プログラムは、本実施形態における所定の処理を達成するために、補助記憶装置１００３に既に記憶されている別のプログラムと組み合わせた差分プログラムであってもよい。

さらに、本実施形態の処理の内容により、コンピュータ１０００の要素の一部を省略することが可能である。例えば、ユーザに情報を提示しない場合、表示装置１００５を省略することができる。図６には図示していないが、本実施形態の処理の内容によっては、コンピュータ１０００は、入力装置を含んでもよい。経験損失推定システム１００は、例えば、リンクが設定されている部分をクリックするなど、リンクへの移動指示を入力するための入力装置を含んでいてもよい。

また、各デバイスの構成要素の一部または全部は、汎用または専用の回路、プロセッサ等、またはそれらの組み合わせによって実装される。これらは、単一のチップで構成されていてもよいし、バスを介して接続された複数のチップで構成されていてもよい。また、各装置の構成要素の一部または全部が、上記の回路等とプログラムとの組み合わせによって実現されてもよい。

各装置の構成要素の一部または全部が複数の情報処理装置、回路等によって実現される場合、複数の情報処理装置、回路等が集中的に配置されていてもよいし、分散的に配置されていてもよい。例えば、情報処理装置、回路等は、クライアントシステムとサーバシステム、クラウドコンピューティングシステム等がそれぞれ通信ネットワークを介して接続された形態で実現されてもよい。

１０密度推定部
２０積分推定部
３０記憶部
１００経験損失推定システム

Claims

ランダム変数に対応する目的変数と、観測された共変数に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数の滑らかな関数の写像の結果である真値を示すランダム変数の条件付き確率密度を推定する密度推定部と、
入力されたランダム変数のシグモイド関数と、前記ランダム変数の条件付き確率密度の関数との積の一次元積分を推定する積分推定部とを備えた
ことを特徴とする経験損失推定システム。
密度推定部は、ランダム変数の条件付き確率密度を正規分布で推定し、
積分推定部は、シグモイド関数の区分線形近似を用いて、一次元積分を推定する
請求項１記載の経験損失推定システム。
ランダム変数に対応する目的変数と、観測された共変数に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数の滑らかな関数の写像の結果である真値を示すランダム変数の条件付き確率密度を推定し、
入力されたランダム変数のシグモイド関数と、前記ランダム変数の条件付き確率密度の関数との積の一次元積分を推定する
ことを特徴とする経験損失推定方法。
ランダム変数の条件付き確率密度を正規分布で推定し、
シグモイド関数の区分線形近似を用いて、一次元積分を推定する
請求項３記載の経験損失推定方法。
コンピュータに、
ランダム変数に対応する目的変数と、観測された共変数に対応する独立変数とを有する回帰モデルを学習することにより、観測されていない共変数の滑らかな関数の写像の結果である真値を示すランダム変数の条件付き確率密度を推定する密度推定処理、および、
入力されたランダム変数のシグモイド関数と、前記ランダム変数の条件付き確率密度の関数との積の一次元積分を推定する積分推定処理
を実行させるための経験損失推定プログラム。
コンピュータに、
密度推定処理で、ランダム変数の条件付き確率密度を正規分布で推定させ、
積分推定処理で、シグモイド関数の区分線形近似を用いて、一次元積分を推定させる
請求項５記載の経験損失推定プログラム。