JP7251642B2

JP7251642B2 - 学習装置、推定装置、学習方法、推定方法及びプログラム

Info

Publication number: JP7251642B2
Application number: JP2021546124A
Authority: JP
Inventors: 具治岩田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2019-09-18
Filing date: 2019-09-18
Publication date: 2023-04-04
Anticipated expiration: 2039-09-18
Also published as: US20220351052A1; JPWO2021053775A1; WO2021053775A1

Description

本発明は、学習装置、推定装置、学習方法、推定方法及びプログラムに関する。

或る情報と別の或る情報とが同時に出現するか否か等の共起関係を表す共起情報が知られている。共起情報は、例えば、推薦システムや文書クラスタリング、ソーシャルネットワーク解析等に用いられる。このような共起情報の具体例としては、例えば、商品Ａと商品Ｂとを同時に購入した人の人数を表す情報、或る文書中に単語Ａと単語Ｂとが出現する回数を表す情報、病歴として病気Ａと病気Ｂとに罹患したことがある人の人数を表す情報等が挙げられる。

ここで、例えば、購入履歴や病歴等の個人情報が含まれるデータはプライバシー保護の観点から共起情報が公開されない場合がある。一方で、プライバシーに関する情報が含まれないように集約された集約データ（例えば、商品毎の購入回数を表すデータ等）は公開されている場合がある。このため、集約データから共起回数を推定する手法が提案されている（例えば、非特許文献１参照）。

Aleksandra B. Slavkovic, Partial Information Releases for Condential Contingency Table Entries: Present and Future, Journal of Privacy and Condentiality (2009) 1, Number 2, pp. 253-264

しかしながら、従来から提案されている手法では、例えば、商品の説明等を表す補助的なデータを共起情報の推定に活用することができなかった。このため、共起情報の推定精度が必ずしも高くない場合があった。

本発明の実施の形態は、上記の点に鑑みてなされたもので、共起情報を高い精度で推定することを目的とする。

上記目的を達成するため、本発明の実施の形態における学習装置は、第１の対象毎の第２の対象に関する履歴を表す履歴データを所定の観点で集約した集約データと、前記第２の対象に関する補助的な情報を表す補助データと、前記履歴データに含まれる一部の部分履歴データとを入力として、２つの前記第２の対象間の共起関係を表す共起情報と前記集約データ、前記補助データ及び前記部分履歴データとの合致度を表す所定の目的関数の値と、前記目的関数のパラメータに関する微分値とを計算する計算手段と、前記計算手段により計算された前記目的関数の値と前記微分値とを用いて、前記目的関数の値を最大化又は最小化するように前記パラメータを更新する更新手段と、を有することを特徴とする。

共起情報を高い精度で推定することができる。

本発明の実施の形態における推定装置の機能構成の一例を示す図である。本発明の実施の形態における推定処理の一例を示すフローチャートである。評価結果の一例を示す図である。本発明の実施の形態における推定装置のハードウェア構成の一例を示す図である。

以下、本発明の実施の形態について説明する。本発明の実施の形態では、集約データと、補助データと、少数の履歴データとが与えられた場合に、共起情報を高い精度で推定することが可能な推定装置１０について説明する。また、当該共起情報を推定するためのパラメータを学習する学習装置２０についても説明する。

ここで、集約データとは、履歴データが或る観点（例えば、商品毎の購入回数、病気毎の罹患経験人数等）で集約されたデータのことである。集約データの具体例としては、商品毎の購入回数を表すデータ、病気毎の罹患経験人数を表すデータ等が挙げられる。

履歴データとは、或る第１の対象（例えば、ユーザ等）毎の或る第２の対象（例えば、商品、病気等）に関する履歴を表すデータである。履歴データの具体例としては、ユーザ毎の商品の購入履歴を表すデータ、ユーザ毎の病気の罹患履歴を表すデータ等が挙げられる。

補助データとは、第２の対象に関する補助的な情報（補助情報）を表すデータのことである。補助データの具体例としては、商品の特徴に関する情報（例えば、ジャンル、発売日、説明文等）を表すデータ、病気の特徴に関する情報（例えば、病名、説明文等）を表すデータ等が挙げられる。

以降で説明する実施の形態では、一例として、履歴データはユーザ毎の商品の購入履歴であるものとする。ただし、これは一例であって、本発明の実施の形態は、履歴データがユーザ毎の病気の罹患履歴である場合についても同様に適用可能である。また、履歴データが文書毎の単語の出現回数（出現履歴）を表す場合であっても同様に適用可能である。すなわち、本発明の実施の形態は、第１の対象毎の第２の対象に関する履歴を表す任意の履歴データについて同様に適用可能である。

＜理論的構成＞
まず、本発明の実施の形態の理論的構成について説明する。以降では、一例として、商品の総数（商品の種類数）をＩとして、各商品には１～Ｉまでのインデックスが付与されているものとする。また、ユーザの総数をＵとして、各ユーザには１～Ｕまでのインデックスが付与されているものとする。

このとき、集約データとしては、商品毎の購入回数

が与えられるものとする。ここで、ｙ_ｉは商品ｉを購入したユーザ数を表す。

補助データとしては、商品情報

が与えられるものとする。ここで、ｓ_ｉ∈Ｒ^Ｄは、商品ｉの特徴を表すＤ次元の実ベクトルである。商品の特徴としては、例えば、商品のジャンル、発売日、説明文等の任意の特徴を用いることができる。なお、Ｄは商品の特徴数であり、ｓ_ｉは商品ｉに関するＤ個の特徴をＤ次元の実ベクトルで表現したものである。

少数の履歴データとしては、少数のユーザの購入履歴

が与えられるものとする。ここで、Ｕ^＊はＵと比べて非常に少ない数（つまり、Ｕ^＊＜＜Ｕ）であるものとする。また、ｒ_ｕ∈｛０，１｝^ＩはＩ次元の二値ベクトルであり、そのｉ番目の要素ｒ_ｕｉは、ユーザｕが商品ｉを購入している場合はｒ_ｕｉ＝１、ユーザｕが商品ｉを購入していない場合はｒ_ｕｉ＝０であるものとする。

本発明の実施の形態では、全ての商品ペアｉ，ｊ∈｛１，・・・，Ｉ｝に関して、共起情報

を推定する。ここで、

は商品ｉと商品ｊの両方を購入しなかったユーザ数、

は商品ｉは購入しなかったが商品ｊは購入したユーザ数、

は商品ｉは購入したが商品ｊは購入しなかったユーザ数、ｚ_ｉｊは商品ｉと商品ｊの両方を購入したユーザ数を表す。なお、このｚ_ｉｊが商品ｉと商品ｊの共起回数を表す。

商品ｉと商品ｊの両方を購入したユーザ数ｚ_ｉｊ（つまり、共起回数ｚ_ｉｊ）が得られた場合、共起情報ｘ_ｉｊに含まれる他の要素（変数）は、ｙ_ｉ、ｙ_ｊ及びＵを用いて、以下の式（１）によりそれぞれ推定することができる。

このため、共起情報ｘ_ｉｊを得るためには共起回数ｚ_ｉｊのみを推定するだけでもよい。この場合、ｚ_ｉｊには以下の式（２）に示す制約条件が存在するため、この制約条件を満たすようにｚ_ｉｊを推定する。

ｍａｘ（０，ｙ_ｉ＋ｙ_ｊ－Ｕ）≦ｚ_ｉｊ≦ｍｉｎ（ｙ_ｉ，ｙ_ｊ）（２）
そこで、以降では、共起回数ｚ_ｉｊを推定する場合について説明する。本発明の実施の形態では、与えられた集約データｙ、補助データＳ及び少数の履歴データＲと合致するように共起回数ｚ_ｉｊを推定する。このときの合致の度合いを表す指標値としては、例えば、以下の式（３）に示す尤度Ｌを用いることができる。

ここで、

は共起回数集合、ｐ（ｘ_ｉｊ｜β_ｉｊ）はβ_ｉｊが与えられたときの共起回数の確率、β_ｉｊは補助データＳ等から計算されるパラメータであり、

と表される。また、Ψはβ_ｉｊを得るためのパラメータ（具体的には、例えば、後述するスカラーパラメータαとニューラルネットワークｆ_０（・），ｆ_０１（・），ｆ_１（・）のパラメータとをまとめたもの）、λはハイパーパラメータ、ｘ^＊ _ｉｊは少数の履歴データＲから計算された共起情報である。

上記の式（３）に示す尤度Ｌを目的関数として、上記の式（２）に示す制約条件の下で当該目的関数を最大化させるパラメータΨを最適化手法により推定することで、このΨにより計算されるパラメータβ_ｉｊを用いてｐ（ｘ_ｉｊ｜β_ｉｊ）により共起回数ｚ_ｉｊを推定することができる。

上記の確率ｐ（ｘ_ｉｊ｜β_ｉｊ）としては、例えば、以下の式（４）に示すディリクレ多項分布を用いることができる。

ここで、Γ（・）はガンマ関数を表す。

なお、上記の式（４）に示すディリクレ多項分布の代わりに、例えば、ポアソン分布や多項分布等が用いられてもよい。ここで、ｐ（ｘ^＊ _ｉｊ｜β_ｉｊ）については、上記の式（４）に含まれるｚ_ｉ´ｊ´をｚ^＊ _ｉ´ｊ´に読み替えればよい。ポアソン分布や多項分布等についても同様に読み替えればよい。ここで、ｚ^＊ _ｉ´ｊ´は少数の履歴データＲから計算された商品ｉ_´と商品ｊ_´の共起回数である。

上記のパラメータβ_ｉｊは、補助データＳに含まれる補助情報ｓ_ｉ及びｓ_ｊを入力とする関数で計算される。このような関数としては、例えば、ニューラルネットワークｆ_０（・），ｆ_０１（・），ｆ_１（・）を用いることができる。これらのニューラルネットワークｆ_０（・），ｆ_０１（・），ｆ_１（・）を用いて、パラメータβ_ｉｊは、以下の式（５）～（８）により計算することができる。

ここで、

は経験的な商品ｉの購入確率、α＞０はスカラーパラメータである。

なお、商品ｉと商品ｊとの間の共起関係は転置しても不変であるため、その性質を利用した以下の式（９）及び式（１０）に示すニューラルネットワークが用いられてもよい。

ｆ_０（ｓ_ｉ，ｓ_ｊ）＝ρ_０（φ_０（ｓ_ｉ）＋φ_０（ｓ_ｊ））（９）
ｆ_１（ｓ_ｉ，ｓ_ｊ）＝ρ_１（φ_１（ｓ_ｉ）＋φ_１（ｓ_ｊ））（１０）
ここで、ρ_０（・），φ_０（・），ρ_１（・），φ_１（・）はニューラルネットワークである。

なお、共起回数ｚ_ｉｊは上記の式（２）に示す制約条件を満たす必要があるが、ｚ_ｉｊを以下の式（１１）により置換することで、ｚ´_ｉｊは、上記の式（２）に示す制約条件を自然に満たすようにすることができる。

このため、共起回数ｚ_ｉｊを上記の式（１１）により置換することで、ｚ_ｉｊの代わりに、－∞＜ｚ´_ｉｊ＜∞を推定してもよい。

＜機能構成＞
以降では、本発明の実施の形態における推定装置１０の機能構成について、図１を参照しながら説明する。図１は、本発明の実施の形態における推定装置１０の機能構成の一例を示す図である。

図１に示すように、本発明の実施の形態における推定装置１０は、読込部１０１と、目的関数計算部１０２と、パラメータ更新部１０３と、終了条件判定部１０４と、共起情報推定部１０５と、記憶部１０６とを有する。

記憶部１０６は、各種データを記憶する。記憶部１０６に記憶されている各種データには、例えば、集約データ、補助データ、少数の履歴データ、目的関数のパラメータ（例えば、上記の式（３）に示す尤度ＬのパラメータΨ）等がある。

読込部１０１は、記憶部１０６に記憶されている集約データｙと補助データＳと少数の履歴データＲとを読み込む。なお、読込部１０１は、例えば、集約データｙと補助データＳと少数の履歴データＲとを所定のサーバ装置等から取得（ダウンロード）することで読み込んでもよい。

目的関数計算部１０２は、読込部１０１により読み込んだ集約データｙと補助データＳと少数の履歴データＲとを用いて、所定の目的関数（例えば、上記の式（３）に示す尤度Ｌ等）の値とそのパラメータに関する微分値とを計算する。このとき、制約条件（例えば、上記の式（２）に示す制約条件）が存在する場合には、目的関数計算部１０２は、この制約条件の下で目的関数値と微分値とを計算する。

パラメータ更新部１０３は、目的関数計算部１０２により計算された目的関数の値と微分値とを用いて、目的関数の値が高く（又は低く）なるようにパラメータを更新する。

終了条件判定部１０４は、所定の終了条件を満たすか否かを判定する。終了条件判定部１０４により終了条件を満たすと判定されるまで、目的関数計算部１０２による目的関数値及び微分値の計算とパラメータ更新部１０３によるパラメータの更新とが繰り返し実行される。これにより、共起情報を推定するためのパラメータが学習される。

なお、終了条件としては、例えば、繰り返し回数が所定の回数を超えたこと、繰り返しの前後で目的関数値の変化量が所定の第１の閾値以下となったこと、更新の前後でパラメータの変化量が所定の第２の閾値以下となったこと等が挙げられる。

共起情報推定部１０５は、学習済みのパラメータを用いて共起情報ｘ_ｉｊを推定する。例えば、上記の式（３）に示す尤度Ｌが目的関数として用いられた場合、共起情報推定部１０５は、上記の式（４）により共起回数ｚ_ｉｊを推定することができる。このとき、共起情報推定部１０５は、例えば、最も確率の高い共起回数ｚ_ｉｊを推定結果とすればよい。これにより、共起情報推定部１０５は、上記の式（１）により共起情報ｘ_ｉｊを推定することができる。なお、共起情報推定部１０５は必ずしも共起情報ｘ_ｉｊまでを推定する必要はなく、共起回数ｚ_ｉｊのみを推定してもよい。

ここで、読込部１０１と目的関数計算部１０２とパラメータ更新部１０３と終了条件判定部１０４と記憶部１０６とで学習装置２０が実現される。すなわち、共起情報を推定するためのパラメータを学習する各機能部（読込部１０１、目的関数計算部１０２、パラメータ更新部１０３及び終了条件判定部１０４）と記憶部１０６とで学習装置２０が実現される。

なお、図１に示す推定装置１０の機能構成は一例であって、他の機能構成であってもよい。例えば、推定装置１０と学習装置２０とが異なる装置で実現されており、通信ネットワーク等を介して互いに通信可能なように構成されていてもよい。

＜推定処理の流れ＞
以降では、共起情報を推定するためのパラメータの学習と学習済みのパラメータを用いた共起情報の推定とを行う推定処理の流れについて、図２を参照しながら説明する。図２は、本発明の実施の形態における推定処理の一例を示すフローチャートである。

まず、読込部１０１は、記憶部１０６に記憶されている集約データｙと補助データＳと少数の履歴データＲとを読み込む（ステップＳ１０１）。

次に、目的関数計算部１０２は、上記のステップＳ１０１で読み込んだ集約データｙと補助データＳと少数の履歴データＲとを用いて、所定の目的関数（例えば、上記の式（３）に示す尤度Ｌ等）の値とそのパラメータに関する微分値とを計算する（ステップＳ１０２）。このとき、制約条件（例えば、上記の式（２）に示す制約条件）が存在する場合には、目的関数計算部１０２は、この制約条件の下で目的関数値と微分値とを計算する。

次に、パラメータ更新部１０３は、上記のステップＳ１０２で計算された目的関数値及び微分値を用いて、当該目的関数値が高く（又は低く）なるようにパラメータを更新する（ステップＳ１０３）。

次に、終了条件判定部１０４は、所定の終了条件を満たすか否かを判定する（ステップＳ１０４）。終了条件を満たすと判定されなかった場合はステップＳ１０２に戻る。一方で、終了条件を満たすと判定された場合はステップＳ１０６に進む。

最後に、共起情報推定部１０５は、学習済みのパラメータ（すなわち、上記のステップＳ１０２～ステップＳ１０３の繰り返しによって更新されたパラメータ）を用いて共起情報ｘ_ｉｊを推定する（ステップＳ１０５）。上述したように、共起情報推定部１０５は、例えば、上記の式（４）により最も確率の高い共起回数ｚ_ｉｊを推定結果として推定すればよい。これにより、共起情報推定部１０５は、上記の式（１）により共起情報ｘ_ｉｊを推定することができる。

＜評価＞
以降では、本発明の実施の形態の評価について説明する。本発明の実施の形態を評価するため、ユーザ毎の商品の購入履歴を表す履歴データを用いた。また、評価指標としては、全てのユーザの購入履歴を用いて共起回数を実際に計算することで得られた真の共起回数の確率との誤差（ｅｒｒｏｒ）とした。このとき、各評価対象の評価結果を図３に示す。

各評価対象は以下の通りである。

ＩＮＤ：各商品の購入が独立であると仮定して従来技術により共起回数を推定した場合
ＭＬ：少数のユーザの購入履歴に関する尤度を最大化して従来技術により共起回数を推定した場合
Ｙ：商品毎の購入ユーザ数（つまり、集約データｙ）のみを用いて本発明の実施の形態により共起回数を推定した場合
Ｒ：少数のユーザの購入履歴（つまり、少数の履歴データＲ）のみを用いて本発明の実施の形態により共起回数を推定した場合
ＹＲ：商品毎の購入ユーザ数と少数のユーザの購入履歴とを用いて本発明の実施の形態により共起回数を推定した場合
ＹＳ：商品毎の購入ユーザ数と商品毎の補助情報（つまり、補助データＳ）とを用いて本発明の実施の形態により共起回数を推定した場合
ＲＳ：少数のユーザの購入履歴と商品毎の補助情報とを用いて本発明の実施の形態により共起回数を推定した場合
ＹＲＳ；商品毎の購入ユーザ数と少数のユーザの購入履歴と商品毎の補助情報とを用いて本発明の実施の形態により共起回数を推定した場合
図３に示すように、ＹＲＳが最も誤差が小さいことがわかる。すなわち、集約データと補助データと少数の履歴データとを用いることで、本発明の実施の形態では、共起回数を高い精度で推定できていることがわかる。

＜ハードウェア構成＞
最後に、本発明の実施の形態における推定装置１０のハードウェア構成について、図４を参照しながら説明する。図４は、本発明の実施の形態における推定装置１０のハードウェア構成の一例を示す図である。なお、学習装置２０についても、推定装置１０と同様のハードウェア構成により実現可能である。

図４に示すように、本発明の実施の形態における推定装置１０は、入力装置２０１と、表示装置２０２と、外部Ｉ／Ｆ２０３と、通信Ｉ／Ｆ２０４と、プロセッサ２０５と、メモリ装置２０６とを有する。これら各ハードウェアは、それぞれがバス２０７を介して通信可能に接続されている。

入力装置２０１は、例えばキーボードやマウス、タッチパネル等であり、ユーザが各種操作を入力するのに用いられる。表示装置２０２は、例えばディスプレイ等であり、推定装置１０の処理結果等を表示する。なお、推定装置１０は、入力装置２０１及び表示装置２０２の少なくとも一方を有していなくてもよい。

外部Ｉ／Ｆ２０３は、外部装置とのインタフェースである。外部装置には、記録媒体２０３ａ等がある。推定装置１０は、外部Ｉ／Ｆ２０３を介して、記録媒体２０３ａの読み取りや書き込み等を行うことができる。記録媒体２０３ａには、例えば、推定装置１０が有する各機能部（例えば、読込部１０１、目的関数計算部１０２、パラメータ更新部１０３、終了条件判定部１０４及び共起情報推定部１０５等）を実現する１以上のプログラム等が記録されていてもよい。

記録媒体２０３ａには、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disk）、ＳＤメモリカード（Secure Digital memory card）、ＵＳＢ（Universal Serial Bus）メモリカード等がある。

通信Ｉ／Ｆ２０４は、推定装置１０を通信ネットワークに接続するためのインタフェースである。推定装置１０が有する各機能部を実現する１以上のプログラムは、通信Ｉ／Ｆ２０４を介して、所定のサーバ装置等から取得（ダウンロード）されてもよい。

プロセッサ２０５は、例えばＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等であり、メモリ装置２０６等からプログラムやデータを読み出して処理を実行する演算装置である。推定装置１０が有する各機能部は、メモリ装置２０６等に格納されている１以上のプログラムがプロセッサ２０５に実行させる処理により実現される。

メモリ装置２０６は、例えばＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ等であり、プログラムやデータが格納される記憶装置である。推定装置１０が有する記憶部１０６は、メモリ装置２０６等により実現される。

本発明の実施の形態における推定装置１０は、図４に示すハードウェア構成を有することにより、上述した各種処理を実現することができる。なお、図４に示すハードウェア構成は一例であって、推定装置１０は、他のハードウェア構成を有していてもよい。例えば、推定装置１０は、複数のプロセッサ２０５を有していてもよいし、複数のメモリ装置２０６を有していてもよい。

本発明は、具体的に開示された上記の実施の形態に限定されるものではなく、請求の範囲の記載から逸脱することなく、種々の変形や変更等が可能である。

１０推定装置
２０学習装置
１０１読込部
１０２目的関数計算部
１０３パラメータ更新部
１０４終了条件判定部
１０５共起情報推定部
１０６記憶部

Claims

第１の対象毎の第２の対象に関する履歴を表す履歴データを所定の観点で集約した集約データと、前記第２の対象に関する補助的な情報を表す補助データと、前記履歴データに含まれる一部の部分履歴データとを入力として、２つの前記第２の対象間の共起関係を表す共起情報と前記集約データ、前記補助データ及び前記部分履歴データとの合致度を表す所定の目的関数の値と、前記目的関数のパラメータに関する微分値とを計算する計算手段と、
前記計算手段により計算された前記目的関数の値と前記微分値とを用いて、前記目的関数の値を最大化又は最小化するように前記パラメータを更新する更新手段と、
を有することを特徴とする学習装置。
所定の終了条件を満たすか否かを判定する判定手段を有し、
前記学習装置は、
前記判定手段により終了条件を満たすと判定されるまで、前記計算手段による前記目的関数の値及び前記微分値の計算と、前記更新手段による前記パラメータの更新とを繰り返す、ことを特徴とする請求項１に記載の学習装置。
前記履歴データは、ユーザ毎の商品の購入履歴を表すデータ、ユーザ毎の病気の罹患履歴を表すデータ、又は文書毎の単語の出現回数を表すデータのいずれかであり、
前記第２の対象に関する補助的な情報は、前記商品の特徴に関する情報、前記病気の特徴に関する情報、又は前記単語の特徴に関する情報のいずれかである、ことを特徴とする請求項１又は２に記載の学習装置。
前記目的関数は、前記補助データから計算される前記パラメータが与えられた場合における前記共起情報の第１の確率分布と前記部分履歴データから計算された共起情報の第２の確率分布とを用いた尤度で表される、ことである請求項１乃至３の何れか一項に記載の学習装置。
第１の対象毎の第２の対象に関する履歴を表す履歴データを所定の観点で集約した集約データと、前記第２の対象に関する補助的な情報を表す補助データと、前記履歴データに含まれる一部の部分履歴データとを入力として、２つの前記第２の対象間の共起関係を表す共起情報と前記集約データ、前記補助データ及び前記部分履歴データとの合致度を表す所定の目的関数の値と、前記目的関数のパラメータに関する微分値とを計算する計算手段と、
前記計算手段により計算された前記目的関数の値と前記微分値とを用いて、前記目的関数の値を最大化又は最小化するように前記パラメータを更新する更新手段と、
前記更新手段により更新された前記パラメータを用いて、前記共起情報を推定する推定手段と、
を有することを特徴とする推定装置。
第１の対象毎の第２の対象に関する履歴を表す履歴データを所定の観点で集約した集約データと、前記第２の対象に関する補助的な情報を表す補助データと、前記履歴データに含まれる一部の部分履歴データとを入力として、２つの前記第２の対象間の共起関係を表す共起情報と前記集約データ、前記補助データ及び前記部分履歴データとの合致度を表す所定の目的関数の値と、前記目的関数のパラメータに関する微分値とを計算する計算手順と、
前記計算手順で計算された前記目的関数の値と前記微分値とを用いて、前記目的関数の値を最大化又は最小化するように前記パラメータを更新する更新手順と、
をコンピュータが実行することを特徴とする学習方法。
第１の対象毎の第２の対象に関する履歴を表す履歴データを所定の観点で集約した集約データと、前記第２の対象に関する補助的な情報を表す補助データと、前記履歴データに含まれる一部の部分履歴データとを入力として、２つの前記第２の対象間の共起関係を表す共起情報と前記集約データ、前記補助データ及び前記部分履歴データとの合致度を表す所定の目的関数の値と、前記目的関数のパラメータに関する微分値とを計算する計算手順と、
前記計算手順で計算された前記目的関数の値と前記微分値とを用いて、前記目的関数の値を最大化又は最小化するように前記パラメータを更新する更新手順と、
前記更新手順で更新された前記パラメータを用いて、前記共起情報を推定する推定手順と、
をコンピュータが実行することを特徴とする推定方法。
コンピュータを、請求項１乃至４の何れか一項に記載の学習装置における各手段、又は、請求項５に記載の推定装置における各手段として機能させるためのプログラム。