JP6443858B2

JP6443858B2 - 算出装置、算出方法、学習装置、学習方法、及びプログラム

Info

Publication number: JP6443858B2
Application number: JP2014235353A
Authority: JP
Inventors: 力矢高橋
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2014-11-20
Filing date: 2014-11-20
Publication date: 2018-12-26
Anticipated expiration: 2034-11-20
Also published as: US10380502B2; JP2016099764A; US20160148120A1

Description

本発明は、算出装置、算出方法、学習装置、学習方法、及びプログラムに関する。

効用関数を利用して人の選択を予測する離散選択モデルが知られている（非特許文献１）。離散選択モデルは、複数の選択肢が完備性（選択肢Ａ及び選択肢Ｂの選好度合は、「ＡよりＢを好む」、「ＢよりＡを好む」、「Ａ及びＢを同程度に好む」のいずれかであること）及び推移性（ＡよりＢを好み、ＢよりＣを好むならば、ＡよりＣを好むこと）を備えることを前提とする。しかし、実際の人の選択には魅惑効果及び妥協効果等が観察され、推移性がないことがある（非特許文献２〜３）。非推移的な選択を予測可能な数理モデルも知られているが（非特許文献４〜５）、これらの従来の手法では、多数の消費者、多数の商品を含む大規模データに対して、モデルパラメータを安定的に推定することができなかった。

［非特許文献１］ J. von Neumann and O. Morgenstern. Theory of Games and Economic Behavior. Princeton University Press, Princeton, NJ, 1953.
［非特許文献２］ Joel Huber, John. W. Payne, and Christopher Puto. Adding asymmetrically dominated alternatives: Violations of regularity and the similarity hypothesis. Journal of Consumer Research, 9:90-98, 1982.
［非特許文献３］ Itamar Simonson. Choice based on reasons: The case of attraction and compromise effects. Journal of Consumer Research, 16:158-174, 1989.
［非特許文献４］ R. M. Roe, J. R. Busemeyer, and J. T. Townsend. Multialternative decision field theory: A dynamic connectionist model of decision making. Psychological Review, 108:370-392, 2001.
［非特許文献５］ C. Gonz´alez-Vallejo. Making trade-offs: A probabilistic and context-sensitive model of choice behavior. Psychological Review, 109:137-154, 2002.

非推移的な選考を示す人の実際の選択を学習し、非推移的な選択を予測することを課題とする。更に、大規模な学習データに対しても安定的に適用できる装置、方法、及び／又はプログラムを提供することを課題とする。

本発明の第１の態様においては、複数の選択肢セットのそれぞれに含まれる複数の選択肢のそれぞれに対応する特徴ベクトルを取得する特徴ベクトル取得部と、それぞれの選択肢に対応する特徴ベクトルに基づいて、複数の選択肢の組み合わせに依存しない選択肢自体の絶対評価を表す絶対評価ベクトルを算出する絶対評価算出部と、選択肢セットで複数の選択肢が提示された場合における、複数の選択肢のそれぞれ同士の間での相対的な評価の変換を表す相対化行列を算出する相対化行列算出部と、相対化行列に絶対評価ベクトルを乗じた結果に基づいて、複数の選択肢が提示された場合における各選択肢の相対評価を表す相対評価ベクトルを算出する相対評価算出部と、を備える算出装置、算出装置を用いる算出方法、及び、算出装置に用いるプログラムを提供する。

本発明の第２の態様においては、第１の態様に係る算出装置のパラメータを学習する学習装置であって、複数の選択肢のそれぞれの特徴ベクトルと、複数の選択肢の中から選択者によって選択された選択肢を示す選択情報とを含む学習データを選択肢の組ごとに取得する学習データ取得部と、特徴ベクトルから絶対評価ベクトルへと変換するための変換パラメータを調整して、相対評価ベクトルにおける選択情報により示された選択肢の相対評価をより高める学習処理部と、を備える学習装置、学習装置を用いる学習方法、及び、学習装置に用いるプログラムを提供する。

なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

本実施形態の学習装置１のブロック図を示す。人の選択における妥協効果の一例を示す。人の選択における魅惑効果の一例を示す。本実施形態の算出装置１００による処理フローを示す。本実施形態の学習装置２００による処理フローを示す。本実施形態の算出装置１００による別の処理フローを示す。複数の選択肢セットにおける目標選択肢の選択確率の例を示す。コンピュータ１９００のハードウェア構成の一例を示す。

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

図１は、本実施形態に係る算出装置１００及び学習装置２００のブロック図を備えるシステム１０を示す。システム１０は、算出装置１００により選択肢の他の選択肢に対する相対的な評価を算出し、学習装置２００により学習データを用いて算出装置１００の評価の算出に用いるパラメータを学習する。

算出装置１００は、複数の選択肢を含む選択肢セット（チョイスセット）の情報を受け取り、選択肢セット中の各選択肢の特徴から、各選択肢の当該選択肢セット中の相対的な評価（相対評価とする）を算出する。算出装置１００は、特徴ベクトル取得部１１０、絶対評価算出部１２０、類似度行列算出部１３０、相対化行列算出部１４０、相対評価算出部１５０、選択肢組入力部１７０、推定部１８０、及び、決定部１９０を有する。

特徴ベクトル取得部１１０は、複数の選択肢セットのそれぞれに含まれる複数の選択肢のそれぞれに対応し、各選択肢の特徴を表す特徴ベクトルを取得する。特徴ベクトル取得部１１０は、取得した選択肢セットごとの複数の選択肢の特徴ベクトルを並べた特徴行列を生成し、特徴行列を絶対評価算出部１２０、及び、類似度行列算出部１３０に供給する。

絶対評価算出部１２０は、それぞれの選択肢に対応する特徴ベクトルに基づいて、複数の選択肢の組み合わせに依存しない選択肢自体の絶対評価を表す絶対評価ベクトルを算出する。例えば、絶対評価算出部１２０は、各特徴量を重み付ける重みベクトルを、各選択肢に対する特徴ベクトルに乗じた結果に基づいて、絶対評価ベクトルを算出する。絶対評価ベクトルの算出方法の具体的態様については後述する。絶対評価算出部１２０は、算出した絶対評価ベクトルを相対評価算出部１５０に供給する。

類似度行列算出部１３０は、複数の選択肢同士の間の特徴ベクトルの類似度を表す類似度行列を算出する。例えば、類似度行列算出部１３０は、特徴行列に予め定められた定数行列及び当該特徴行列の転置を乗じた結果に基づいて、類似度行列を算出する。類似度行列算出部１３０は、算出した類似度行列を相対化行列算出部１４０に供給する。

相対化行列算出部１４０は、類似度行列に基づいて、選択肢セットで複数の選択肢が提示された場合における、複数の選択肢のそれぞれ同士の間での相対的な評価の変換を表す相対化行列を算出する。相対化行列算出部１４０が算出する相対化行列は、絶対評価ベクトルに乗じられることで、類似度がより高い２つの選択肢に対し、類似度がより低い２つの選択肢と比較して評価をより高めるように機能する。相対化行列算出部１４０による相対化行列の算出の具体的な方法は後述する。相対化行列算出部１４０は、算出した相対化行列を相対評価算出部１５０に供給する。

相対評価算出部１５０は、絶対評価ベクトル及び相対化行列に基づいて、選択肢の相対評価を算出する。例えば、相対評価算出部１５０は、相対化行列に絶対評価ベクトルを乗じた結果に基づいて、複数の選択肢が提示された場合における各選択肢の相対評価を表す相対評価ベクトルを算出する。相対評価算出部１５０は、算出した相対評価を推定部１８０又は学習装置２００に供給する。

選択肢組入力部１７０は、選択者に選択させたい予め定められた選択肢（「目標選択肢」とする）と、目標選択肢を含む異なる選択肢の組み合わせをそれぞれが有する複数の選択肢セットとをユーザ等から入力する。選択肢組入力部１７０は、入力した複数の選択肢セットを特徴ベクトル取得部１１０に供給し、絶対評価算出部１２０、類似度行列算出部１３０、相対化行列算出部１４０、及び相対評価算出部１５０に処理をさせることにより、入力した複数の選択肢セットの各選択肢の相対評価を算出させる。選択肢組入力部１７０は、更に入力した複数の選択肢セットを決定部１９０に供給する。

推定部１８０は、相対評価算出部１５０から得た相対評価ベクトルにおける各選択肢の相対評価に基づいて、各選択肢が選択肢セットの中で選択される選択確率を推定する。例えば、推定部１８０は、複数の選択肢セットにおける目標選択肢の選択確率を推定してよい。推定部１８０は、推定結果を決定部１９０に供給する。

決定部１９０は、目標選択肢の相対評価に基づいて、選択肢組入力部１７０から受け取った複数の選択肢セットから、選択者が目標選択肢を選択する可能性が高い選択肢セットを選択して、当該目標選択肢と共に提示する他の選択肢の組み合わせを決定する。例えば、決定部１９０は、目標選択肢の選択確率が高くなる選択肢セットを決定する。

このように算出装置１００は、選択肢セットに含まれる選択肢の特徴に基づいて、選択肢セットにおける各選択肢に対する選択者の選好度を相対評価として算出する。また、算出装置１００は、目標選択肢を選択者に選択させるために選択者に提示すべき選択肢セットを決定する。

学習装置２００は、複数の選択肢の特徴と選択者が選択肢を選択した結果との関係から、算出装置１００が相対評価の算出に用いるパラメータを学習する。学習装置２００は、学習データ取得部２１０と、学習処理部２２０とを備える。

学習データ取得部２１０は、学習データを取得する。例えば、学習データ取得部２１０は、複数の選択肢のそれぞれの特徴を表す特徴ベクトルと、複数の選択肢の中から選択者によって選択された選択肢を示す選択情報とを含む学習データを選択肢セットごとに取得する。

一例として、学習データ取得部２１０は、選択者に提示された複数の商品（選択肢）の組（選択肢セット）と実際に選択された商品との対応を含む購買履歴等をデータベース２０等から取得し、選択肢セットごとに各選択肢となる商品の性能及び価格等の特徴を数値化した値に基づいて特徴ベクトルを生成し、特徴ベクトルと選択情報との組を学習データとして取得する。学習データ取得部２１０は、取得した学習データを学習処理部２２０及び算出装置１００に提供する。

学習処理部２２０は、学習データに含まれる選択肢の相対評価を算出装置１００に算出させつつ、算出装置１００による相対評価の算出結果が学習データと整合するように、算出装置１００が相対評価の算出に用いるパラメータを調整しながら学習する。

このように、学習装置２００は、複数の選択肢セットに基づく特徴ベクトルと選択肢セットから実際に選択された選択肢とを含む学習データを用いて、算出装置１００が選択肢の相対評価をより正確に算出できるように算出装置１００を学習させる。

図２は、人の選択における妥協効果の一例を示す。図２のグラフは、選択肢となるＡ〜Ｄの商品の性能と価格（例えば、価格の安さの程度）の関係を示す。図中の点線は仮想的なパレート境界を示し、商品Ａ〜Ｄはパレート境界面上に位置し同程度の絶対評価を有するものとする。

ここで、商品Ａ、商品Ｂ、及び、商品Ｃの選択肢からなる選択肢セットを提示したとすると、選択者は選択肢セットの中で中間の性能と価格の商品Ｂを選択する傾向を示す。商品Ｂ、商品Ｃ、及び、商品Ｄの選択肢からなる選択肢セットを提示したとすると、選択者は選択肢セットの中で中間の性能と価格の商品Ｃを選択する傾向を示す。このように、選択者は、同程度の絶対評価を有する複数の選択肢の中から極端な選択をすることを避け、中庸な選択肢を選択する傾向を示す。別の観点からすると、選択者は、類似する選択肢が多く存在する選択肢を、類似する選択肢が少ない選択肢よりも高い頻度で選択する傾向があると言える。

図３は、人の選択における魅惑効果の一例を示す。図３のグラフの縦横軸及び点線は図２のグラフと同様である。パレート境界上にあり同程度の絶対評価を有する商品Ａ及び商品Ｄと、商品Ａに類似するが商品Ａよりも絶対評価が劣る商品Ａ−の３個の選択肢からなる選択肢セットを提示したとすると、選択者は商品Ａを選択する傾向を示す。このように、選択者は、類似するが明確に劣った選択肢が存在する選択肢（選択肢Ａ）を、類似する明確に劣った選択肢が存在しない選択肢（選択肢Ｄ）よりも選択する傾向がある。

このように、非推移性を示す選択モデルにおいては、選択肢の絶対評価と他の類似する選択肢（すなわち比較容易な選択肢）の状況とを考慮することで、選択者による選択肢の相対評価が得られると考えられる。例えば、選択者は、類似度に対応する事前分布と効用関数から得られる絶対評価とに基づいて、ベイズ事後確率に対応する相対評価を推定するベイジアンであると考えることができる。

すなわち、選択者は、選択肢間の類似度に基づく正規過程を事前分布として、選択肢の相対評価のベイズ縮小推定を行い、ベイズ事後期待値及びランダムノイズが最大となる選択肢を統計的に選択しているものと想定できる。選択者の選択に対する事前分布の影響は、選択者の直感に対応すると考えることができ、絶対評価の影響は選択者の合理的判断に対応すると考えることができる。

本実施形態の算出装置１００は、このような想定に基づいて、選択肢の絶対評価及び選択肢の相対化行列から、選択肢の選択肢セットにおける最終的な評価（相対評価量）を算出する。これにより、算出装置１００は、妥協効果及び魅惑効果を含む非推移的な人の選択をモデル化することができる。

本実施形態の説明では、主に消費者が商品を選択する場合について説明するが、システム１０の適用対象はこれに限られない。例えば、システム１０の算出装置１００及び学習装置２００は、個人、団体、ロボット及び／又は動物等の意思決定可能な選択主体が、商品、サービス、動作の対象及び／又は取得の対象等を選択対象とする選択肢セットから一又は複数の選択肢を選択する場合に適用することができる。

図４は、本実施形態の算出装置１００による処理フローを示す。本実施形態において、算出装置１００は、Ｓ１１０〜Ｓ１５０の処理を実行することにより、選択肢セットで各選択肢が選択される確率に対応する相対評価を算出する。

まず、Ｓ１１０において、特徴ベクトル取得部１１０は、各選択肢セットｉの選択肢の特徴を表す特徴ベクトルを取得する。例えば、特徴ベクトル取得部１１０は、学習装置２００等から、選択肢セットｉの選択肢ｊの特徴を表す特徴ベクトルＤ_φｊを取得する。

次に、特徴ベクトル取得部１１０は、ｉ番目（ｉは１又は２以上の整数）の選択肢セットｉに含まれるｍ［ｉ］個（ｍ［ｉ］は２以上の整数）の選択肢ｊの特徴ベクトルＤ_φｊから特徴行列φ_ｉを生成し、当該特徴行列を絶対評価算出部１２０、及び、類似度行列算出部１３０に供給する。例えば、特徴ベクトル取得部１１０は、選択肢セットｉに含まれるｍ［ｉ］個の選択肢の特徴ベクトルＤ_φｊを並べた特徴行列φ_ｉ＝（Ｄ_φ１，Ｄ_φ２，…，Ｄ_{φｍ［ｉ］}）を、絶対評価算出部１２０等に供給する。

次に、Ｓ１２０において、絶対評価算出部１２０は、それぞれの選択肢ｊに対応する特徴ベクトルＤ_φｊに基づいて、複数の選択肢の組み合わせに依存しない選択肢自体の絶対評価を表す絶対評価ベクトルＡ_ｉを算出する。例えば、絶対評価算出部１２０は、重みベクトルｗ_φ＝（ω_１，ω_２，…，ω_ｄφ）を、選択肢ｊに対する特徴ベクトルＤ_φｊ＝（α_ｊ１，α_ｊ２，…，α_ｊｄφ）に乗じた結果（内積）から選択肢ｊの絶対評価の尺度である絶対評価量ａ_ｉｊ＝ω_１×α_ｊ１＋ω_２×α_ｊ２＋，…，＋ω_ｄφ×α_ｊｄφを算出し、選択肢セットｉの全選択肢（ｊ∈ｍ［ｉ］）の絶対評価量を各要素として含む絶対評価ベクトルＡ_ｉ＝（ａ_ｉ１，ａ_ｉ２，…，ａ_{ｉｍ［ｉ］}）を算出する。なお、重みベクトルｗ_φは、特徴ベクトルＤ_φｊの各要素に対応し、特徴ベクトルＤ_φｊの各特徴量を重み付ける重み係数（ω_１，ω_２，…，ω_ｄφ）を各要素として有する。

絶対評価算出部１２０は、絶対評価量ａ_φｊに対して各要素にバイアスｂを加えた結果に基づいて、絶対評価ベクトルＡ_ｉ＝（ａ_ｉ１＋ｂ，ａ_ｉ２＋ｂ，…，ａ_ｉｊ＋ｂ）を算出してもよい。例えば、絶対評価算出部１２０は、全選択肢の特徴ベクトルＤ_φｊを含む特徴行列φ_ｉを用いてＡ_ｉ＝ｂ１_ｍ［ｉ］＋φ_ｉｗ_φにより絶対評価ベクトルＡ_ｉを算出してよい。なお、１_ｍ［ｉ］は全要素が１となるｍ［ｉ］次元のベクトルである。絶対評価算出部１２０は、算出した絶対評価ベクトルを相対評価算出部１５０に供給する。

次に、Ｓ１３０において、類似度行列算出部１３０は、複数の選択肢同士の間の特徴ベクトルの類似度を表す類似度行列を算出する。例えば、類似度行列算出部１３０は、ｍ［ｉ］×ｄ_φの特徴行列φ_ｉにｄ_φ×ｄ_φの定数行列Ω_φおよび当該特徴行列の転置φ_ｉ ^Ｔを乗じて、その算出結果φ_ｉΩ_φφ_ｉ ^Ｔを類似度行列Ｓ_ｉとしてよい。

類似度行列算出部１３０は、類似度行列Ｓ_ｉの計算において、同一の選択肢セットにおける複数の選択肢のそれぞれ同士について、第１選択肢ａの特徴ベクトルに定数行列Ω_φおよび第２選択肢ｂの特徴ベクトルＤ_φｂの転置Ｄ _φｂ ^Ｔを乗じた結果に基づいて、各要素ｓ_ａｂを算出する。類似度行列Ｓ_ｉの各要素ｓ_ａｂは、同一の選択肢セットにおいて選択肢ａ及び選択肢ｂの特徴ベクトルが類似する度合を示す内積であり、そのような内積が定義された特徴空間におけるユークリッド距離は、定数行列Ω_φの逆行列を分散共分散行列とするマハラノビス距離と一致する。

ここで、定数行列Ω_φは、選択肢セットｉの絶対評価ベクトルＡ_ｉから相対評価ベクトルｕ^＊ _ｉを生成するための相対化パラメータとして機能する。定数行列Ω_φは、初期値が予め定められ、学習装置２００による学習により更新されてよい。これに代えて、定数行列Ω_φは、各要素の値が固定された定数行列であってよい。例えば、定数行列Ω_φは、単位行列であってよい。類似度行列算出部１３０は、算出した類似度行列Ｓ_ｉを相対化行列算出部１４０に供給する。

次に、Ｓ１４０において、相対化行列算出部１４０は、複数の選択肢同士の間の類似度を表す類似度行列Ｓ_ｉに基づいて、選択肢セットｉでｍ［ｉ］個の選択肢が提示された場合における、ｍ［ｉ］個の選択肢のそれぞれ同士の間での相対的な絶対評価量ａ_φｊの変換を表す相対化行列Ｈ_ｉを算出する。例えば、相対化行列算出部１４０は、ｍ［ｉ］×ｍ［ｉ］の単位行列Ｉ_ｍ［ｉ］に類似度行列Ｓ_ｉを加えた行列の逆行列（Ｉ_ｍ［ｉ］＋Ｓ_ｉ）^−１を類似度行列Ｓ_ｉに乗じた結果に基づいて、相対化行列Ｈ_ｉ＝Ｓ_ｉ（Ｉ_ｍ［ｉ］＋Ｓ_ｉ）^−１を算出する。相対化行列算出部１４０は、算出した相対化行列Ｈ_ｉを相対評価算出部１５０に供給する。

次に、Ｓ１５０において、絶対評価ベクトル及び相対化行列に基づいて、選択肢セットにおける各選択肢の相対評価を算出する。例えば、相対評価算出部１５０は、選択肢セットｉにおけるｍ［ｉ］個の選択肢が提示された場合における各選択肢ｊの相対評価を表す相対評価量ｕ_ｉｊを各要素として含む相対評価ベクトルｕ^＊ _ｉ＝（ｕ_ｉ１，ｕ_ｉ２，…，ｕ_{ｉｍ［ｉ］}）を算出する。相対評価算出部１５０は、相対化行列Ｈ_ｉに絶対評価ベクトルＡ_ｉを乗じた結果に基づいて、相対評価ベクトルｕ^＊ _ｉを算出してよく、例えば、数式１により相対評価ベクトルｕ^＊ _ｉを算出してよい。

ここで、相対評価ベクトルｕ^＊ _ｉの各要素である相対評価量ｕ_ｉｊは、選択肢セットｉにおいて選択者が選択肢ｊを選択する確率を決定する。例えば、選択者が複数の選択肢から一の選択肢を選択する多項選択の場合、選択肢セットｉにおける各選択肢ｊの相対評価量ｕ_ｉｊの指数の比が、各選択肢の選択確率の比となる。すなわち、相対評価量ｕ_ｉｊは、多項ロジットモデルにおける対数尤度に対応する。

また、例えば、選択者が複数の選択肢から任意の数の選択肢を選択する因子的二項選択の場合、選択肢ｊの相対評価量ｕ_ｉｊをジグモイド関数に入力して得られた出力値が、選択肢ｊを選択する確率となる。相対評価算出部１５０は、算出した相対評価を推定部１８０又は学習装置２００に供給する。

このように、算出装置１００は、Ｓ１１０からＳ１５０の処理を実行することにより、各選択肢セットｉについて、各選択肢がその選択肢セットｉの中で選択される確率に対応する相対評価ベクトルｕ^＊ _ｉを算出する。特に、算出装置１００は、各選択肢の絶対評価及び各選択肢間の特徴の類似性を考慮し、各選択肢ｊの選択肢セットｉ中での相対的な評価を含む相対評価ベクトルｕ^＊ _ｉを算出することができる。これにより、算出装置１００は、選択の非推移性等を反映して各選択肢の評価を算出することができる。

なお、Ｓ１３０で類似度行列算出部１３０が類似度行列Ｓ_ｉを算出するために用いる特徴ベクトルＤ_φｂは、Ｓ１２０で絶対評価算出部１２０が絶対評価ベクトルＡ_ｉを算出するのに用いた特徴ベクトルＤ_φｂと同一であっても異なるものであってもよい。異なる場合、特徴ベクトル取得部１１０は、各選択肢について異なる種類の特徴ベクトルＤ_φｂを取得し、これらを絶対評価算出部１２０及び類似度行列算出部１３０に提供する。

図５は、本実施形態の学習装置２００による処理フローを示す。本実施形態において、学習装置２００は、Ｓ２１０〜Ｓ２３０の処理を実行することにより、算出装置１００が相対評価ベクトルの算出に用いるパラメータを学習する。

まず、Ｓ２１０において、学習データ取得部２１０は、複数組の複数の選択肢に対する学習データを取得する。例えば、学習データ取得部２１０は、外部のデータベース２０又は学習装置２００内部の記憶装置等から、選択肢セットｉごとに、ｍ［ｉ］個の選択肢のそれぞれの特徴を表す特徴ベクトルφ_ｉと、各選択肢セットｉでｍ［ｉ］個の選択肢の中から選択者によって選択された選択肢ｙ_ｉを示す選択情報とを含む学習データを取得する。

一例として、学習データ取得部２１０は、選択肢セットｉごとに、各選択肢ｊ（ｊ∈ｍ［ｉ］、ｍ［ｉ］はｉ番目の選択肢セットにおける選択肢数）の特徴を数値化した値（例えば、商品の大きさ、色、価格、性能、製造者、及び、種類等を示す数値）を取得し、これらの値を各要素として含む第１ベクトルｒ_ｉｊを生成する。また、学習データ取得部２１０は、選択肢セットｉにおける選択者の特徴（例えば、選択者の性別、年齢、年代、職業、国籍、住所、趣味、及び、過去の購買履歴等）を数値化した値を、各成分として含む第２ベクトルｑ_ｉを取得する。

次に、学習データ取得部２１０は、選択肢セットｉの各選択肢ｊについて、第２ベクトルｑ_ｉと第１ベクトルｒ_ｉｊとを連結した第３ベクトルｘ_ｉｊ＝（ｑ_ｉ ^Ｔ，ｒ_ｉｊ ^Ｔ）を生成する。第３ベクトルｘ_ｉｊに選択者の特徴に基づく第２ベクトルｑ_ｉを加えることにより、学習装置２００は、算出装置１００に、選択者の属性の影響を考慮して選択肢の相対評価を算出させることができる。これに代えて、学習データ取得部２１０は、第１ベクトルｒ_ｉｊのみを第３ベクトルｘ_ｉｊとしてもよい。

次に、学習データ取得部２１０は、第３ベクトルｘ_ｉｊを特徴ベクトル関数に入力して、ｄ_φ次元の特徴ベクトルＤ_φｊを出力してよい。例えば、学習データ取得部２１０は、中心座標の異なるｄ_φ個のＲａｄｉａｌＢａｓｉｓＦｕｎｃｔｉｏｎに第３ベクトルｘ_ｉｊを入力してｄ_φ個の特徴量α_ｊ１〜α_ｊｄφを算出し、これを各要素として含む特徴ベクトルＤ_φｊ＝（α_ｊ１，α_ｊ２，…，α_ｊｄφ）を取得する。これに代えて、学習データ取得部２１０は、ＲａｎｄｏｍＦｏｒｅｓｔにより特徴ベクトルＤ_φｊを出力してもよく、又は、第３ベクトルｘ_ｉｊ自体を特徴ベクトルＤ_φｊとしてもよい。

学習データ取得部２１０は、このように取得した各選択肢セットｉの全選択肢の特徴ベクトルＤ_φｊと選択された選択肢ｙ_ｉとの組を学習データとする。学習データ取得部２１０は、取得した学習データを学習処理部２２０及び算出装置１００に提供する。

次に、Ｓ２２０において、学習処理部２２０は、学習データに基づいて、算出装置１００が相対評価ベクトルｕ^＊ _ｉの算出に用いるパラメータを学習する。例えば、学習処理部２２０は、学習データの特徴ベクトルに基づいて、算出装置１００にＳ１１０〜Ｓ１５０の処理を実行させて相対評価ベクトルｕ^＊ _ｉを算出させ、相対評価ベクトルｕ^＊ _ｉが学習データの実際に選択された選択肢ｙ_ｉと整合するように、算出装置１００のパラメータを調整する。

学習処理部２２０は、パラメータとして、特徴ベクトルＤ_φｊから絶対評価ベクトルＡ_ｉへと変換するための変換パラメータ、及び／又は、類似度行列Ｓ_ｉを相対化行列Ｈ_ｉに変換する相対化行列Ω_φを定める相対化パラメータを調整してよい。例えば、学習処理部２２０は、変換パラメータとして、重みベクトルｗ_φおよび／またはバイアスｂの値を調整してよい。また、例えば、学習処理部２２０は、相対化パラメータとして、定数行列Ω_φを調整してよい。

ここで、学習処理部２２０は、選択情報により示された選択肢ｙ_ｉの相対評価ベクトルｕ^＊ _ｉにおける相対評価ｕ_ｉｙｉをより高めるように、算出装置１００のパラメータを学習する。また、学習処理部２２０は、選択肢セットｉの各々に対する相対評価ベクトルｕ^＊ _ｉにおける対応する選択情報により示された選択肢ｙ_ｉの相対評価ｕ_ｉｙｉに基づく値を複数の選択肢セットについて合計した合計値をより高めるように、算出装置１００のパラメータを学習してよい。

一例として、学習処理部２２０は、数式２に定義される選択肢ｙ_ｉの相対評価ｕ_ｉｙｉに基づく関数ｌ（ｕ^＊ _ｉ，ｙ_ｉ）を含む数式３を解くことにより、算出装置１００のパラメータを学習させてよい。具体的には、学習処理部２２０は、ガウス事前分布を設定して過剰適合を防ぎつつ、数式３の最適化問題を解くことによりＭＡＰ推定を実行する。学習処理部２２０は、算出装置１００にＳ１１０〜Ｓ１５０の処理を複数回実行させて変換パラメータについて凸最適化問題を解く。例えば、算出装置１００は、ニュートン・ラフソン法を実行して凸最適化問題の最適値を得ることができる。なお、数式３における｜｜・｜｜はＬ_２ノルムを示し、ｃは正則化ハイパーパラメータを示す。ｃ／２×｜｜ｗ_φ｜｜^２の項は、過剰適合を避けるための罰則項であり、当該罰則項を用いなくてもよい。

ここで、学習処理部２２０は、相対化パラメータを固定して変換パラメータのみを学習してよい。例えば、Ｓ２１０で学習データ取得部２１０がＲａｄｉａｌＢａｓｉｓＦｕｎｃｔｉｏｎを用いて特徴ベクトルＤ_φｊを取得する場合、学習処理部２２０は、相対化行列Ω_φを単位行列に固定して、変換パラメータのみを学習してよい。一方で、学習データ中の選択肢（商品等）の特徴が複雑な場合には、Ｓ２１０で学習データ取得部２１０がＲａｎｄｏｍＦｏｒｅｓｔを用いて特徴ベクトルＤ_φｊを取得し、学習処理部２２０は、相対化パラメータと変換パラメータの双方を学習してよい。

相対化パラメータと変換パラメータの双方を学習する場合、学習処理部２２０は、変換パラメータを固定した状態で相対化パラメータを学習し、相対化パラメータを固定した状態で変換パラメータを学習してよい。例えば、学習処理部２２０は、変換パラメータと相対化パラメータの一方を固定した状態で、他方を学習する操作を交互に繰り返すことにより、Ｓ２２０の学習を実行してよい。

次にＳ２３０において、学習装置２００は、学習結果を出力する。例えば、学習装置２００は、学習により得られた変換パラメータ及び相対化パラメータを算出装置１００に提供する。算出装置１００は、受け取ったパラメータを相対評価ベクトルｕ_ｉ ^＊の算出処理に用いるパラメータとして設定する。

このように、学習装置２００は、Ｓ２１０〜Ｓ２３０の処理を実行することにより、算出装置１００のパラメータを学習する。特に、学習装置２００は、非推移的な選択を含む学習データを算出装置１００に学習させることで、算出装置１００に非推移的な選択を予測する相対評価ベクトルｕ^＊ _ｉを算出させることができる。

なお、本実施形態の説明において、学習データ取得部２１０が学習データから特徴ベクトルを生成したが、これに代えて、算出装置１００の特徴ベクトル取得部１１０が特徴ベクトルを生成してもよい。この場合、学習データ取得部２１０は、学習データに含まれる各選択肢の特徴の情報（商品の性能等）を特徴ベクトル取得部１１０に提供し、この情報から特徴ベクトル取得部１１０は特徴ベクトルを生成してもよい。

図６は、本実施形態の算出装置１００による別の処理フローを示す。本実施形態において、算出装置１００は、Ｓ３１０〜Ｓ３３０の処理を実行することにより、所望の選択肢をより高い確率で選択者に選択させるための選択肢セットを決定する。なお、本図の処理を実行する前に、学習装置２００はＳ２１０〜Ｓ２３０に係る学習処理を実行する。

まず、Ｓ３１０において、選択肢組入力部１７０は、選択者に選択させたい予め定められた目標選択肢ｔと、目標選択肢ｔを含み、他の選択肢の組み合わせが異なる複数（Ｉ個）の選択肢セットをユーザから入力する。例えば、選択肢組入力部１７０は、各選択肢の特徴を数値化した値（例えば、商品の性能等）を選択肢セットｉ（ｉ∈Ｉ）ごとにユーザから入力する。

次に、選択肢組入力部１７０は、入力したＩ個の選択肢セットｉのｍ［ｉ］個の選択肢ｊの特徴ベクトルＤ_φｊを生成して特徴ベクトル取得部１１０及び決定部１９０に供給する。例えば、選択肢組入力部１７０は、Ｓ２１０と同様の方法でＩ個の選択肢セットについて選択肢ｊごとの特徴ベクトルＤ_φｊを生成して、特徴ベクトル取得部１１０及び決定部１９０に供給してよい。

次に、Ｓ３２０において、推定部１８０が、相対評価ベクトルｕ^＊ _ｉにおける各選択肢ｊの相対評価量ｕ_ｉｊに基づいて、各選択肢が選択肢セットの中で選択される選択確率を推定する。

例えば、まず、算出装置１００が特徴ベクトル取得部１１０に供給された選択肢セットｉ及び選択肢ｊごとの特徴ベクトルＤ_φｊに対してＳ１１０〜Ｓ１５０の処理を実行することで、各選択肢セットｉ（ｉ∈Ｉ）の相対評価ベクトルｕ^＊ _ｉを生成する。ここで、相対評価算出部１５０は、Ｓ１５０に対応する処理を実行する際に、Ｉ個の選択肢セットのそれぞれについて、目標選択肢ｔの相対評価量ｕ_ｉｔを含む相対評価ベクトルｕ^＊ _ｉを算出する。

次に、推定部１８０は、相対評価ベクトルｕ^＊ _ｉの各要素となる相対評価量ｕ_ｉｊの値に基づいて、選択肢セットｉにおける選択肢ｊの選択確率を算出する。例えば、選択肢セットｉの選択様式が多項選択である場合、推定部１８０は、選択肢セットｉにおける合計が１となるように各選択肢ｊの相対評価量ｕ_ｉｊの指数に基づく値（例えば、数２の関数におけるｌ（ｕ^＊ _ｉ，ｊ）の値の指数）を正規化し、正規化後の相対評価量ｕ_ｉｊの指数を選択肢ｊの選択確率ｐ_ｉｊとして推定する。また、例えば、選択肢セットｉの選択様式が因子的二項選択である場合、推定部１８０は、各選択肢ｊの相対評価量ｕ_ｉｊをジグモイド関数に入力した結果の値を選択肢ｊの選択確率ｐ_ｉｊとして推定する。推定部１８０は、推定結果を決定部１９０に供給する。

次に、Ｓ３３０において、決定部１９０は、目標選択肢ｔの相対評価量ｕ_ｉｔに基づいて、選択肢組入力部１７０から受け取った複数の選択肢セットから、選択者が目標選択肢ｔを選択する可能性が高い選択肢セットｉ'（ｉ'∈Ｉ）を選択して、当該目標選択肢ｔと共に提示する他の選択肢の組み合わせを決定する。例えば、決定部１９０は、推定部１８０の推定結果から、目標選択肢ｔの選択確率ｐ_ｉｔが最も高い選択肢セットｉ'、又は、選択確率ｐ_ｉｔが予め定められた基準よりも高くなる選択肢セットｉ'を、当該組み合わせとして決定する。

このように、算出装置１００は、Ｓ３１０〜Ｓ３３０の処理を実行することにより、相対評価ベクトルに基づいて複数の選択肢セットにおける各選択肢の選択確率を推定する。相対評価ベクトルは選択の非推移性を反映しているので、算出装置１００は、選択者による非推移性のある選択を予想することができる。これにより、算出装置１００は、目標選択肢を最も高い確率で選択させるために選択者に提示すべき選択肢セットを決定することができる。

図７は、複数の選択肢セットにおける目標選択肢の選択確率の例を示す。例えば、選択肢組入力部１７０は、Ｓ３１０において目標選択肢（選択肢Ｃ）をそれぞれ含む選択肢セット１（選択肢Ａ、選択肢Ｂ、及び選択肢Ｃ）、選択肢セット２（選択肢Ｂ、選択肢Ｃ、及び選択肢Ｄ）、及び、選択肢セット１（選択肢Ｃ、選択肢Ｄ、及び選択肢Ｅ）を入力する。

Ｓ３２０において、推定部１８０は、図示するように選択肢セット１〜３における各選択肢の選択確率を推定する。例えば、推定部１８０は、選択肢セット１において目標選択肢の選択確率Ｃを１８％と推定し、選択肢セット２において目標選択肢Ｃの選択確率を３８％と推定し、選択肢セット３において目標選択肢Ｃの選択確率を２４％と推定する。この結果、Ｓ３３０において、決定部１９０は、目標選択肢Ｃが最も高い選択確率を示す選択肢セット２を選択者に提示すべき選択肢セットとして決定してよい。

例えば、算出装置１００は、既に競合他社が存在する分野で新規商品を企画・開発する際に、新規参入することによりシェアを獲得できそうな商品とそうでない商品とを予測することを可能にする。コーヒー市場を一例とすると、高価格かつフルサービスの高級カフェチェーンと、低価格かつセルフサービスのカートリッジ型コーヒー商品と、中価格かつ低品質のコーヒー飲料製品とが存在する市場に、中価格中品質の店舗抽出型コンビニコーヒーを投入した場合にどの程度をシェアが得られるかを予測することができる。

図８は、算出装置１００及び学習装置２００として機能するコンピュータ１９００のハードウェア構成の一例を示す。本実施形態に係るコンピュータ１９００は、ホスト・コントローラ２０８２により相互に接続されるＣＰＵ２０００、ＲＡＭ２０２０、グラフィック・コントローラ２０７５、及び表示装置２０８０を有するＣＰＵ周辺部と、入出力コントローラ２０８４によりホスト・コントローラ２０８２に接続される通信インターフェイス２０３０、ハードディスクドライブ２０４０、及びＣＤ−ＲＯＭドライブ２０６０を有する入出力部と、入出力コントローラ２０８４に接続されるＲＯＭ２０１０、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０を有するレガシー入出力部を備える。

ホスト・コントローラ２０８２は、ＲＡＭ２０２０と、高い転送レートでＲＡＭ２０２０をアクセスするＣＰＵ２０００及びグラフィック・コントローラ２０７５とを接続する。ＣＰＵ２０００は、ＲＯＭ２０１０及びＲＡＭ２０２０に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ２０７５は、ＣＰＵ２０００等がＲＡＭ２０２０内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置２０８０上に表示させる。これに代えて、グラフィック・コントローラ２０７５は、ＣＰＵ２０００等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。

入出力コントローラ２０８４は、ホスト・コントローラ２０８２と、比較的高速な入出力装置である通信インターフェイス２０３０、ハードディスクドライブ２０４０、ＣＤ−ＲＯＭドライブ２０６０を接続する。通信インターフェイス２０３０は、有線又は無線によりネットワークを介して他の装置と通信する。また、通信インターフェイスは、通信を行うハードウェアとして機能する。ハードディスクドライブ２０４０は、コンピュータ１９００内のＣＰＵ２０００が使用するプログラム及びデータを格納する。ＣＤ−ＲＯＭドライブ２０６０は、ＣＤ−ＲＯＭ２０９５からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。

また、入出力コントローラ２０８４には、ＲＯＭ２０１０と、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０の比較的低速な入出力装置とが接続される。ＲＯＭ２０１０は、コンピュータ１９００が起動時に実行するブート・プログラム、及び／又は、コンピュータ１９００のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ２０５０は、フレキシブルディスク２０９０からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。入出力チップ２０７０は、フレキシブルディスク・ドライブ２０５０を入出力コントローラ２０８４へと接続するとともに、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ２０８４へと接続する。

ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供されるプログラムは、フレキシブルディスク２０９０、ＣＤ−ＲＯＭ２０９５、又はＩＣカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、ＲＡＭ２０２０を介してコンピュータ１９００内のハードディスクドライブ２０４０にインストールされ、ＣＰＵ２０００において実行される。

コンピュータ１９００にインストールされ、コンピュータ１９００を算出装置１００及び学習装置２００として機能させるプログラムは、特徴ベクトル取得モジュール、絶対評価算出モジュール、類似度行列算出モジュール、相対化行列算出モジュール、相対評価算出モジュール、選択肢入力モジュール、推定モジュール、決定モジュール、学習データ取得モジュール、及び、学習処理モジュールを備える。これらのプログラム又はモジュールは、ＣＰＵ２０００等に働きかけて、コンピュータ１９００を、算出装置１００の特徴ベクトル取得部１１０、絶対評価算出部１２０、類似度行列算出部１３０、相対化行列算出部１４０、相対評価算出部１５０、選択肢組入力部１７０、推定部１８０、及び、決定部１９０、並びに、学習装置２００の学習データ取得部２１０、及び、学習処理部２２０としてそれぞれ機能させてよい。

これらのプログラムに記述された情報処理は、コンピュータ１９００に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である算出装置１００の特徴ベクトル取得部１１０、絶対評価算出部１２０、類似度行列算出部１３０、相対化行列算出部１４０、相対評価算出部１５０、選択肢組入力部１７０、推定部１８０、及び、決定部１９０、並びに、学習装置２００の学習データ取得部２１０、及び、学習処理部２２０として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ１９００の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の算出装置１００及び学習装置２００が構築される。

一例として、コンピュータ１９００と外部の装置等との間で通信を行う場合には、ＣＰＵ２０００は、ＲＡＭ２０２０上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス２０３０に対して通信処理を指示する。通信インターフェイス２０３０は、ＣＰＵ２０００の制御を受けて、ＲＡＭ２０２０、ハードディスクドライブ２０４０、フレキシブルディスク２０９０、又はＣＤ−ＲＯＭ２０９５等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス２０３０は、ＤＭＡ（ダイレクト・メモリ・アクセス）方式により記憶装置との間で送受信データを転送してもよく、これに代えて、ＣＰＵ２０００が転送元の記憶装置又は通信インターフェイス２０３０からデータを読み出し、転送先の通信インターフェイス２０３０又は記憶装置へとデータを書き込むことにより送受信データを転送してもよい。

また、ＣＰＵ２０００は、ハードディスクドライブ２０４０、ＣＤ−ＲＯＭドライブ２０６０（ＣＤ−ＲＯＭ２０９５）、フレキシブルディスク・ドライブ２０５０（フレキシブルディスク２０９０）等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をＤＭＡ転送等によりＲＡＭ２０２０へと読み込ませ、ＲＡＭ２０２０上のデータに対して各種の処理を行う。そして、ＣＰＵ２０００は、処理を終えたデータを、ＤＭＡ転送等により外部記憶装置へと書き戻す。このような処理において、ＲＡＭ２０２０は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはＲＡＭ２０２０及び外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。例えば、算出装置１００及び／又は学習装置２００の記憶部は、算出装置１００の特徴ベクトル取得部１１０、絶対評価算出部１２０、類似度行列算出部１３０、相対化行列算出部１４０、相対評価算出部１５０、選択肢組入力部１７０、推定部１８０、及び、決定部１９０、並びに／又は、学習装置２００の学習データ取得部２１０、及び、学習処理部２２０から受け取った／へ提供するデータを適宜記憶してよい。例えば、記憶部は、特徴ベクトル取得部１１０が絶対評価算出部１２０に入力したデータを受け取って記憶してよい。また、記憶部は、相対評価算出部１５０が算出した相対評価ベクトル等を記憶してよい。

本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、ＣＰＵ２０００は、ＲＡＭ２０２０の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはＲＡＭ２０２０の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもＲＡＭ２０２０、メモリ、及び／又は記憶装置に含まれるものとする。

また、ＣＰＵ２０００は、ＲＡＭ２０２０から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、ＲＡＭ２０２０へと書き戻す。例えば、ＣＰＵ２０００は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすか否かを判断し、条件が成立した場合（又は不成立であった場合）に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。

また、ＣＰＵ２０００は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第１属性の属性値に対し第２属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、ＣＰＵ２０００は、記憶装置に格納されている複数のエントリの中から第１属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第２属性の属性値を読み出すことにより、所定の条件を満たす第１属性に対応付けられた第２属性の属性値を得ることができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

また、実施形態の説明において複数の要素が列挙された場合には、列挙された要素以外の要素を用いてもよい。例えば、「Ｘは、Ａ、Ｂ及びＣを用いてＹを実行する」と記載される場合、Ｘは、Ａ、Ｂ及びＣに加え、Ｄを用いてＹを実行してもよい。

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

１０システム、２０データベース、１００算出装置、１１０特徴ベクトル取得部、１２０絶対評価算出部、１３０類似度行列算出部、１４０相対化行列算出部、１５０相対評価算出部、１７０選択肢組入力部、１８０推定部、１９０決定部、２００学習装置、２１０学習データ取得部、２２０学習処理部

Claims

複数の選択肢のそれぞれに対応する特徴ベクトルを取得する特徴ベクトル取得部と、
それぞれの選択肢に対応する前記特徴ベクトルに基づいて、前記複数の選択肢の組み合わせに依存しない選択肢自体の絶対評価を表す絶対評価ベクトルを算出する絶対評価算出部と、
前記複数の選択肢が提示された場合における、前記複数の選択肢のそれぞれ同士の間での相対的な評価への変換を表す相対化行列を算出する相対化行列算出部と、
前記相対化行列に前記絶対評価ベクトルを乗じた結果に基づいて、前記複数の選択肢が提示された場合における各選択肢の相対評価を表す相対評価ベクトルを算出する相対評価算出部と、
を備える算出装置。
前記複数の選択肢同士の間の前記特徴ベクトルの類似度を表す類似度行列を算出する類似度行列算出部を更に備え、
前記相対化行列算出部は、前記類似度行列に基づいて前記相対化行列を算出する、
を備える請求項１に記載の算出装置。
前記相対化行列算出部は、類似度がより高い２つの選択肢に対し、類似度がより低い２つの選択肢と比較して評価をより高める前記相対化行列を算出する請求項２に記載の算出装置。
前記類似度行列算出部は、前記複数の選択肢のそれぞれ同士について、第１選択肢の前記特徴ベクトルに定数行列および第２選択肢の前記特徴ベクトルの転置を順次乗じた結果に基づいて、前記類似度行列を算出する請求項２または３に記載の算出装置。
前記相対化行列算出部は、単位行列に前記類似度行列を加えた行列の逆行列を前記類似度行列に乗じた結果に基づいて、前記相対化行列を算出する請求項２から４のいずれか一項に記載の算出装置。
前記絶対評価算出部は、各特徴量を重み付ける重みベクトルを各選択肢に対する前記特徴ベクトルに乗じた結果に基づいて前記絶対評価ベクトルを算出する請求項１から５のいずれか一項に記載の算出装置。
前記絶対評価算出部は、各特徴量を重み付ける前記重みベクトルを各選択肢に対する前記特徴ベクトルに乗じて各要素にバイアスを加えた結果に基づいて、前記絶対評価ベクトルを算出する請求項６に記載の算出装置。
前記相対評価ベクトルにおける各選択肢の相対評価に基づいて、各選択肢が選択される選択確率を推定する推定部を更に備える請求項１から７のいずれか一項に記載の算出装置。
前記相対評価算出部は、予め定められた選択肢を含み、他の選択肢の組み合わせが異なる複数の選択肢セットのそれぞれについて、前記予め定められた選択肢の相対評価を算出し、
前記予め定められた選択肢の相対評価に基づいて前記選択肢セットを選択して、当該予め定められた選択肢と共に提示する他の選択肢の組み合わせを決定する決定部
を更に備える請求項１から８のいずれか一項に記載の算出装置。
請求項１から９のいずれか一項に記載の算出装置のパラメータを学習する学習装置であって、
前記複数の選択肢のそれぞれの前記特徴ベクトルと、前記複数の選択肢の中から選択者によって選択された選択肢を示す選択情報とを含む学習データを取得する学習データ取得部と、
前記特徴ベクトルから前記絶対評価ベクトルへと変換するための変換パラメータを調整して、前記相対評価ベクトルにおける前記選択情報により示された選択肢の相対評価をより高める学習処理部と、
を備える学習装置。
前記学習データ取得部は、複数の選択肢セットの前記複数の選択肢に対する前記学習データを取得し、
前記学習処理部は、前記選択肢セットの各々に対する前記相対評価ベクトルにおける対応する前記選択情報により示された選択肢の相対評価に基づく値を複数の選択肢セットについて合計した合計値をより高めるように、前記特徴ベクトルから前記絶対評価ベクトルへと変換するための変換パラメータを調整する
請求項１０に記載の学習装置。
前記絶対評価ベクトルは、各特徴量を重み付ける重みベクトルを前記特徴ベクトルに乗じた結果に基づいて算出され、
前記学習処理部は、前記変換パラメータとして、前記重みベクトルを調整する
請求項１０または１１に記載の学習装置。
前記絶対評価ベクトルは、前記重みベクトルを各選択肢に対する特徴ベクトルに乗じて各要素にバイアスを加えた結果に基づいて算出され、
前記学習処理部は、前記変換パラメータとして、前記重みベクトルおよび前記バイアスを調整する
請求項１２に記載の学習装置。
前記学習処理部は、前記相対化行列を定める相対化パラメータを更に調整する請求項１２または１３に記載の学習装置。
前記相対化行列は、前記複数の選択肢同士の間の類似度を表す類似度行列に基づいて算出され、
前記類似度行列は、前記相対化パラメータとして、前記複数の選択肢のそれぞれ同士について、第１選択肢の前記特徴ベクトルに定数行列および第２選択肢の前記特徴ベクトルの転置を順次を乗じた結果に基づくものであり、
前記学習処理部は、前記定数行列を調整する
請求項１４に記載の学習装置。
前記学習処理部は、前記変換パラメータを固定した状態で前記相対化パラメータを学習し、前記相対化パラメータを固定した状態で前記変換パラメータを学習する請求項１４または１５に記載の学習装置。
コンピュータにより実行される選択肢の相対評価を算出する算出方法であって、
複数の選択肢セットのそれぞれに含まれる複数の選択肢のそれぞれに対応する特徴ベクトルを取得する特徴ベクトル取得段階と、
それぞれの選択肢に対応する前記特徴ベクトルに基づいて、前記複数の選択肢の組み合わせに依存しない選択肢自体の絶対評価を表す絶対評価ベクトルを算出する絶対評価算出段階と、
前記選択肢セットで前記複数の選択肢が提示された場合における、前記複数の選択肢のそれぞれ同士の間での相対的な評価の変換を表す相対化行列を算出する相対化行列算出段階と、
前記相対化行列に前記絶対評価ベクトルを乗じた結果に基づいて、前記複数の選択肢が提示された場合における各選択肢の相対評価を表す相対評価ベクトルを算出する相対評価算出段階と、
を備える算出方法。
コンピュータにより実行される、請求項１７に記載の算出方法に用いるパラメータを学習する学習方法であって、
前記複数の選択肢のそれぞれの前記特徴ベクトルと、前記複数の選択肢の中から選択者によって選択された選択肢を示す選択情報とを含む学習データを前記選択肢の組ごとに取得する学習データ取得段階と、
前記特徴ベクトルから前記絶対評価ベクトルへと変換するための変換パラメータを調整して、前記相対評価ベクトルにおける前記選択情報により示された選択肢の相対評価をより高める学習処理段階と、
を備える学習方法。
コンピュータを請求項１から９のいずれか１項に記載の算出装置として機能させるプログラム。
コンピュータを請求項１０から１６のいずれか１項に記載の学習装置として機能させるプログラム。