JP2015114987A

JP2015114987A - 処理装置、処理方法、およびプログラム

Info

Publication number: JP2015114987A
Application number: JP2013258420A
Authority: JP
Inventors: 大塚　誠; Makoto Otsuka; 誠大塚
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2013-12-13
Filing date: 2013-12-13
Publication date: 2015-06-22
Anticipated expiration: 2033-12-13
Also published as: US20150170029A1; US20150287061A1; JP5950284B2

Abstract

【課題】認知バイアスがかかった消費者の選択行動を、予測精度の高い学習可能なモデルで表現する。
【解決手段】入力層と中間層との間の各ノード間に設定された各第１ウェイト値と、中間層と出力層との間の各ノード間に設定された各第２ウェイト値とを記憶するパラメータ記憶部と、複数の入力ノードに対する複数の入力値を取得する取得部と、入力値が閾値以下である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値の影響を低減させた予測モデルを用いて、複数の入力値に対応する複数の出力ノードからの複数の出力値を算出する算出部と、を備える処理装置を提供する。
【選択図】図１１

Description

本発明は、処理装置、処理方法、およびプログラムに関する。

従来、消費者の消費行動を分析する方法、および消費者に商品を推薦するシステム等が知られている（例えば、非特許文献１〜３参照）。また、消費者が複数の商品から１つの商品を選択する場合、当該消費者の選択行動には種々の認知バイアスがかかることが知られている。
［非特許文献１］ Roe, Robert M.; Busemeyer, Jermone R.; Townsend, James T.; "Multialternative decision field theory: A dynamic connectionst model of decision making.", Psychological Review, Vol. 108(2), Apr 2001, 370-392.
［非特許文献２］ Hruschka, Harald.; "Analyzing market baskets by restricted Boltzmann machines.", OR Spectrum, Aug 2012, 1-20.
［非特許文献３］ Teppan, Erich Christian; Alexander Felfernig; "Minimization of product utility estimation errors in recommender result set evaluations, "Proceedings of the 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology-Volume 01. IEEE Computer Society, 2009.

このような、認知バイアスがかかった消費者の選択行動は、選択肢の商品リストに含まれるアイテムの種類に応じて商品の相対的な選択確率に影響を与えることになり、既存のモデルで表現することが困難であった。そして、認知バイアスをモデル化しても、複雑なモデルとなってしまう上に、学習アルゴリズムまで構築することは知られていなかった。

本発明の第１の態様においては、複数の入力ノードを含む入力層、複数の出力ノードを含む出力層、および複数の中間ノードを含む中間層を備える予測モデルを処理する処理装置であって、入力層と中間層との間の各ノード間に設定された各第１ウェイト値と、中間層と出力層との間の各ノード間に設定された各第２ウェイト値とを記憶するパラメータ記憶部と、複数の入力ノードに対する複数の入力値を取得する取得部と、入力値が閾値以下である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値の影響を低減させた予測モデルを用いて、複数の入力値に対応する複数の出力ノードからの複数の出力値を算出する算出部と、を備える処理装置、処理方法、およびプログラムを提供する。

なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

本実施形態に係る認知バイアスの第１例を示す。本実施形態に係る認知バイアスの第２例を示す。本実施形態に係る認知バイアスの第３例を示す。本実施形態に係る処理装置１００の構成例を示す。本実施形態に係る処理装置１００の動作フローを示す。本実施形態に係る学習データの一例を示す。本実施形態に係る選択モデルの一例を示す。本実施形態に係る確率算出部１６０が算出した各選択肢が選択される確率の一例を示す。本実施形態に係る処理装置１００の第１の変形例を示す。本実施形態に係る選択モデル１０の変形例を示す。本実施形態に係る処理装置１００の第２の変形例を示す。本実施形態に係る処理装置１００の第２の変形例が出力した各選択肢が選択される確率の一例を示す。本実施形態に係る処理装置１００として機能するコンピュータ１９００のハードウェア構成の一例を示す。

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

選択肢を提示された人および動物等の対象が、嗜好等に基づいて当該選択肢の中からいずれかを選択する行動において、当該選択行動の選択結果は、与えられた選択肢に応じて変化することが知られている。本実施形態において、このような選択行動の一例として、消費者が複数の商品から１つの商品を選択する場合を説明する。

消費者が複数の商品から１つの商品を選択する場合、当該消費者の選択行動には種々の認知バイアスが加わる。例えば、第１の商品と第２の商品を含む複数の商品を選択肢として消費者に提示した場合、当該消費者が第１の商品と第２の商品をそれぞれ選択する確率の比は、提示した選択肢に含まれる他の商品に応じて異なることがある。この場合、提示した選択肢に含まれる他の商品の存在が、消費者の選択行動に認知バイアスを加えたことになる。

図１は、本実施形態に係る認知バイアスの第１例を示す。図１は、本実施形態の認知バイアスであるシミラリティ効果（ＳｉｍｉｌａｒｉｔｙＥｆｆｅｃｔ）を説明する図である。図１において、商品Ａ、Ｂ、およびＳは、消費者に提示する選択肢である。図１のグラフは、商品の特徴の一例として、横軸に価格、縦軸に品質として商品Ａ、Ｂ、およびＳを示す。即ち、商品Ａは、商品Ｂに比較して、価格は高いが、品質が高い商品である。また、商品Ｓは、商品Ｂに比較して、価格が高く品質の高い商品Ａに類似した商品である。

ここでまず、市場（マーケット）に商品ＡおよびＢの選択肢がある場合、消費者が商品ＡおよびＢを選択するそれぞれの確率に応じて、商品ＡおよびＢのシェアが定まる。そして、当該市場に商品Ｓを加えると、商品Ｓは商品Ａと類似することから、商品Ａのシェアを減少させて、商品ＡおよびＢのシェアの比率に変化を与えることがある。即ち、この場合、商品ＡおよびＢの選択肢に対して、商品Ａに類似した商品Ｓの存在が、類似している商品同士でシェアを分け合うように、消費者の選択行動に認知バイアスを加える。このような認知バイアスの効果を、シミラリティ効果と呼ぶ。

図２は、本実施形態に係る認知バイアスの第２例を示す。図２は、本実施形態の認知バイアスであるコンプロマイズ効果（ＣｏｍｐｒｏｍｉｓｅＥｆｆｅｃｔ）を説明する図である。図２において、商品Ａ、Ｂ、およびＣは、消費者に提示する選択肢である。図２のグラフは、図１と同様に、商品の特徴の一例として、横軸に価格、縦軸に品質として商品Ａ、Ｂ、およびＣを示す。即ち、商品Ａは、商品Ｂに比較して、価格は高いが、品質が高い商品である。また、商品Ｃは、商品Ｂに比較して、価格が安く、品質も低い商品である。

ここでまず、市場に商品ＡおよびＢの選択肢がある場合、消費者が商品ＡおよびＢを選択するそれぞれの確率に応じて、商品ＡおよびＢのシェアが定まる。そして、当該市場に商品Ｃを加えると、商品Ａ、Ｂ、およびＣは、この順に価格と品質の程度が並ぶことになり、価格も品質も高い商品Ａのシェアを減少させて、商品ＡおよびＢのシェアの比率に変化を与えることがある。

例えば、商品ＡおよびＢの選択肢に対して、価格も品質も商品Ｂに劣る商品Ｃの存在が、商品の価格および品質のバランスの順位を形成させ、価格も品質も高い商品Ａとシェアを分け合い、結果として価格も品質も中間の商品Ｂのシェアが向上する。このような、商品Ｃによって消費者の選択行動に認知バイアスを加える効果を、コンプロマイズ効果と呼ぶ。

図３は、本実施形態に係る認知バイアスの第３例を示す。図３は、本実施形態の認知バイアスであるアトラクション効果（ＡｔｔｒａｃｔｉｏｎＥｆｆｅｃｔ）を説明する図である。図３において、商品Ａ、Ｂ、およびＤは、消費者に提示する選択肢である。図３のグラフは、図１と同様に、商品の特徴の一例として、横軸に価格、縦軸に品質として商品Ａ、Ｂ、およびＤを示す。即ち、商品Ａは、商品Ｂに比較して、価格は高いが、品質が高い商品である。また、商品Ｄは、商品Ｂに比較して、価格が少し高く、品質が少し低い商品である。

ここでまず、市場に商品ＡおよびＢの選択肢がある場合、消費者が商品ＡおよびＢを選択するそれぞれの確率に応じて、商品ＡおよびＢのシェアが定まる。そして、当該市場に商品Ｄを加えると、商品Ｂが相対的に商品Ｄより価格が安く品質も高いため、商品Ｂのシェアを増加させて、商品ＡおよびＢのシェアの比率に変化を与えることがある。

即ち、この場合、商品ＡおよびＢの選択肢に対して、価格も品質も商品Ｂに比べて少し劣る商品Ｃの存在が、商品Ｂの価格と品質に好ましい印象を与えるように、消費者の選択行動に認知バイアスを加える。このような認知バイアスの効果を、アトラクション効果と呼ぶ。

以上の３つの例のように、市場における消費者の選択行動には、種々の認知バイアスが加わり、その結果として、商品のシェア等が定まる。したがって、消費者の消費行動を分析する場合、および消費者に商品を推薦する場合等、当該認知バイアスを考慮したモデルを用いることが望ましいが、従来の学習モデルで表現することは困難であった。また、認知バイアスをモデル化しても、複雑なモデルとなってしまい、当該モデルを学習させることができなかった。

そこで、本実施形態の処理装置１００は、消費者等に与えられた選択肢を示す入力ベクトルから選択された選択項目を示す出力ベクトルへの写像を学習する問題として定式化することにより、認知バイアスが加わった消費者の選択行動を、学習可能なモデルで表現する。即ち、処理装置１００は、与えられた選択肢に対する対象の選択行動をモデル化した選択モデルを生成する。

図４は、本実施形態に係る処理装置１００の構成例を示す。処理装置１００は、取得部１１０と、記憶部１２０と、入力ベクトル生成部１３０と、出力ベクトル生成部１４０と、学習処理部１５０と、確率算出部１６０とを備える。

取得部１１０は、対象に与えられた選択肢を入力選択肢とし、入力選択肢の中から選択された選択肢を出力選択肢とする学習用の選択行動を少なくとも１つ含む学習データを取得する。取得部１１０は、例えば、複数の商品のうち、消費者に与えられる入力選択肢のデータと、当該消費者が選択した商品のデータとを、学習データとして取得する。取得部１１０は、ユーザの入力によって学習データを取得してよく、これに代えて、予め定められた形式で記憶されたデータを読み出して取得してもよい。

また、取得部１１０は、ネットワーク等に接続され、処理装置１００の本体とは異なる位置で学習データを取得し、当該ネットワークを介して本体部に取得した学習データを供給してもよい。例えば、取得部１１０は、サーバ等にアクセスして、当該サーバに記憶された学習データを取得する。また、取得部１１０は、商品またはサービス等をウェブサイトで販売するＥＣ（電子商取引）サイト等から、消費者に与えた商品の選択肢と、消費者が購入またはカート等に入れた経歴等の情報を学習データとして取得してよい。

また、取得部１１０は、別の装置によって実現され、処理装置１００の本体の前処理として学習データを取得してもよい。取得部１１０は、一例として、取得した学習データを記憶部１２０に供給する。

記憶部１２０は、取得部１１０に接続され、当該取得部１１０から受け取った学習データを記憶する。また、記憶部１２０は、処理装置１００が生成する選択モデルを記憶する。また、記憶部１２０は、当該選択モデルを生成する過程において処理するデータ等を記憶してよい。また、記憶部１２０は、処理装置１００内の各部の要求に応じて、記憶したデータを要求元に供給してよい。

入力ベクトル生成部１３０は、複数種類の選択肢のそれぞれが入力選択肢に含まれるか否かを示す入力ベクトルを生成する。入力ベクトル生成部１３０は、記憶部１２０に接続され、取得した学習データから入力ベクトルを生成する。入力ベクトル生成部１３０は、生成したベクトルを学習処理部１５０に供給する。

出力ベクトル生成部１４０は、複数種類の選択肢のそれぞれが学習用の出力選択肢に含まれたか否かを示す出力ベクトルを生成する。出力ベクトル生成部１４０は、記憶部１２０に接続され、取得した学習データから出力ベクトルを生成する。出力ベクトル生成部１４０は、生成した出力ベクトルを記憶部１２０を学習処理部１５０に供給する。

学習処理部１５０は、入力ベクトル生成部１３０および出力ベクトル生成部１４０に接続され、受け取った学習用の入力ベクトルおよび出力ベクトルを用いて、選択モデルを学習する。学習処理部１５０は、対象の認知バイアスに応じた選択行動を含む選択モデルを学習する。即ち、学習処理部１５０は、消費者に与えられた選択肢に応じて値が定まるバイアスパラメータを含むパラメータを用いて、選択モデルを学習する。学習処理部１５０は、記憶部１２０に接続され、学習した選択モデルおよび定まったパラメータ等を当該記憶部１２０に記憶する。

確率算出部１６０は、学習された選択モデルおよび定まったパラメータ等に基づき、入力選択肢に応じてそれぞれの選択肢が選択される確率を算出する。確率算出部１６０は、記憶部１２０に接続され、学習した選択モデルおよび定まったパラメータ等を当該記憶部１２０から読み出す。また、確率算出部１６０は、入力ベクトル生成部１３０に接続され、当該入力ベクトル生成部１３０が生成した入力ベクトルを受け取る。

確率算出部１６０は、入力ベクトルに応じた選択肢が選択される確率を算出する。この場合、取得部１１０は、確率を算出すべき選択肢の情報をユーザから取得し、入力ベクトル生成部１３０を介して当該情報を確率算出部１６０に供給してよい。ここで、処理装置１００が選択モデルの学習処理用に用いる学習装置の場合、予測に用いられる確率算出部１６０は設けられなくてもよい。

以上の本実施形態の処理装置１００は、バイアスパラメータを含むパラメータを用いて入力ベクトルから出力ベクトルへの写像を学習し、与えられた選択肢に対する消費者の選択行動をモデル化した選択モデルを生成する。処理装置１００の具体的な動作について、次に説明する。

図５は、本実施形態に係る処理装置１００の動作フローを示す。本実施形態の処理装置１００は、図５に示された動作フローを実行して、選択モデルを学習し、学習結果に応じた確率を算出する。

まず、取得部１１０は、学習データを取得する（Ｓ２００）。取得部１１０は、消費者に提示される可能性のあるＪ個の商品、提示した選択肢（即ち、Ｊ個の商品のうちから選別された複数の商品）、および消費者が選択肢の中から選択した商品等の情報を取得する。本実施形態において、取得部１１０は、５つの商品（Ａ，Ｂ，Ｃ，Ｄ，Ｓ）を、消費者に提示される可能性のある商品として取得した例を説明する。

図６は、本実施形態に係る学習データの一例を示す。図６の横軸は、消費者に提示される可能性のある商品を、縦軸は、消費者が商品を選択した確率を示す。図６は、消費者に４通りの選択肢を提示した場合の選択結果を示す。

例えば、図６において、斜線で示すＲ１に対応する棒グラフは、商品ＡおよびＢに存在し、商品Ａの棒グラフは、０．６を示し、商品Ｂの棒グラフは、０．４を示す。ここで、商品Ａは、商品Ｂに比較して、価格は高いが、品質が高い商品とする。

即ち、Ｒ１は、消費者に商品ＡおよびＢを提示する選択肢であり、消費者が商品Ａを選択した確率が６０％、商品Ｂを選択した確率が４０％の結果が得られたことを示す。そして、市場における商品ＡおよびＢのシェアは、消費者が選択した確率と略同一のパーセンテージになるとする。本実施形態において、このような選択肢Ｒ１と当該選択肢Ｒ１を提示した結果は、消費者に最初に商品を選択させる「初期状態」の学習データである。

図６において、波線で示すＲ２に対応する棒グラフは、商品Ａ、Ｂ、およびＳに存在し、商品Ａの棒グラフは０．３、商品Ｂの棒グラフは０．４、商品Ｓの棒グラフは０．３を示す。これより、Ｒ２は、消費者に商品Ａ、Ｂ、およびＳを提示する選択肢であり、消費者が商品Ａを選択した確率が３０％、商品Ｂを選択した確率が４０％、商品Ｓを選択した確率が３０％の結果が得られたことを示す。

ここで、選択肢Ｒ２の商品Ｓは、商品Ａと性能、価格、および品質等が類似の商品とする。そして、消費者に選択肢Ｒ１（商品ＡおよびＢ）を提示して、商品ＡおよびＢのシェアが定まった後、選択肢Ｒ２を提示した（商品Ｓを加える）場合、選択肢Ｒ１を提示した結果である商品Ａのシェア６０％が、類似している商品ＡおよびＳで当該シェアを分け合うように変化する（本例では、商品Ａが３０％、商品Ｓが３０％）ことになる。即ち、本実施形態において、選択肢Ｒ２と当該選択肢Ｒ２を提示した結果は、「シミラリティ効果」を示す学習データである。

図６において、無地で示すＲ３に対応する棒グラフは、商品Ａ、Ｂ、およびＣに存在し、商品Ａの棒グラフは０．３、商品Ｂの棒グラフは０．５、商品Ｃの棒グラフは０．２を示す。これより、Ｒ３は、消費者に商品Ａ、Ｂ、およびＣを提示する選択肢であり、消費者が商品Ａを選択した確率が３０％、商品Ｂを選択した確率が５０％、商品Ｃを選択した確率が２０％の結果が得られたことを示す。

ここで、選択肢Ｒ３の商品Ｃは、商品Ｂに比較して、価格が安く、品質も低い商品とする。そして、消費者に選択肢Ｒ１（商品ＡおよびＢ）を提示して、商品ＡおよびＢのシェアが定まった後、選択肢Ｒ３を提示した（商品Ｃを加える）場合、選択肢Ｒ１を提示した結果である商品Ａのシェア６０％を減少させ、結果として、価格も品質も中間の商品Ｂのシェアが向上する（本例では、商品Ａが３０％、商品Ｂが５０％）ことになる。即ち、本実施形態において、選択肢Ｒ３と当該選択肢Ｒ３を提示した結果は、「コンプロマイズ効果」を示す学習データである。

図６において、Ｒ４に対応する棒グラフは、商品Ａ、Ｂ、およびＤに存在し、商品Ａの棒グラフは０．４、商品Ｂの棒グラフは０．５、商品Ｃの棒グラフは０．１を示す。これより、Ｒ４は、消費者に商品Ａ、Ｂ、およびＤを提示する選択肢であり、消費者が商品Ａを選択した確率が４０％、商品Ｂを選択した確率が５０％、商品Ｃを選択した確率が１０％の結果が得られたことを示す。

ここで、選択肢Ｒ４の商品Ｄは、商品Ｂに比較して、価格が少し安く、品質も少し低い商品とする。そして、消費者に選択肢Ｒ１（商品ＡおよびＢ）を提示して、商品ＡおよびＢのシェアが定まった後、選択肢Ｒ４を提示した（商品Ｄを加える）場合、商品Ｂが相対的に商品Ｄより価格が安く品質も高いため、商品Ｂのシェアを増加させる（本例では、商品Ｂのシェアが４０％から５０％に増加する）ことになる。即ち、本実施形態において、選択肢Ｒ４と当該選択肢Ｒ４を提示した結果は、「アトラクション効果」を示す学習データである。

取得部１１０は、以上のような学習データを取得して、記憶部１２０に記憶する。これに代えて、または、これに加えて、取得部１１０は、取得した学習データを入力ベクトル生成部１３０および出力ベクトル生成部１４０に供給してもよい。

次に、入力ベクトル生成部１３０は、入力ベクトルを生成する（Ｓ２１０）。入力ベクトル生成部１３０は、例えば、複数の選択肢（商品）をｘ_Ｊとした要素を含み、当該複数の選択肢ｘ_Ｊのうち消費者に与えられた選択肢ｘ_ｉを非零の値（例えば１）に、消費者に与えられなかった選択肢を０にしたベクトルを入力ベクトルｘとする（Ｊはとりうる選択肢の総数であり、２以上の自然数である）。即ち、入力ベクトル生成部１３０は、次式に示す要素ｘ_ｉを有する入力ベクトルｘを生成する。
（数１）
ｘ_ｉ∈｛０，１｝，ｉ∈｛１，...，Ｊ｝

入力ベクトル生成部１３０は、一例として、図６の学習データに応じて、５つの商品（Ａ，Ｂ，Ｃ，Ｄ，Ｓ）に対応する入力ベクトルｘ＝（ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５）を生成する。ここで、ｘ_１は商品Ａに、ｘ_２は商品Ｂに、ｘ_３は商品Ｃに、ｘ_４は商品Ｄに、ｘ_５は商品Ｓに、それぞれ対応する。入力ベクトル生成部１３０は、初期状態の学習データの選択肢Ｒ１が商品ＡおよびＢを提示する選択肢なので、ｘ^Ｒ１＝（１，１，０，０，０）とする。入力ベクトル生成部１３０は、同様にして、各選択肢Ｒ１からＲ４に対応する入力ベクトルを次式のように生成する。なお、左辺の「ｘ」はベクトル表記を省略する。
（数２）
ｘ^Ｒ１＝（１，１，０，０，０）
ｘ^Ｒ２＝（１，１，０，０，１）
ｘ^Ｒ３＝（１，１，１，０，０）
ｘ^Ｒ４＝（１，１，０，１，０）

次に、出力ベクトル生成部１４０は、出力ベクトルを生成する（Ｓ２２０）。出力ベクトル生成部１４０は、例えば、複数の選択肢（商品）をｙ_Ｊとした要素を含み、当該複数の選択肢ｙ_Ｊのうち消費者が選択した選択肢ｙ_ｉを非零の値（例えば１）に、他の要素を０にしたベクトルを出力ベクトルｙとする。即ち、出力ベクトル生成部１４０は、次式に示す要素ｙ_ｉを有する出力ベクトルｙを生成する。
（数３）
ｙ_ｊ∈｛０，１｝，ｊ∈｛１，...，Ｊ｝

出力ベクトル生成部１４０は、一例として、図６の学習データに応じて、５つの商品（Ａ，Ｂ，Ｃ，Ｄ，Ｓ）に対応する出力ベクトルｙ＝（ｙ_１，ｙ_２，ｙ_３，ｙ_４，ｙ_５）を生成する。ここで、ｙ_１は商品Ａに、ｙ_２は商品Ｂに、ｙ_３は商品Ｃに、ｙ_４は商品Ｄに、ｙ_５は商品Ｓに、それぞれ対応する。出力ベクトル生成部１４０は、初期状態の学習データの選択肢Ｒ１に対して消費者が商品Ａを選択した場合に応じて、出力ベクトルをｙ^Ｒ１Ａ＝（１，０，０，０，０）とする。

同様に、出力ベクトル生成部１４０は、商品Ｂを選択した場合に応じて、出力ベクトルをｙ^Ｒ１Ｂ＝（０，１，０，０，０）とする。出力ベクトル生成部１４０は、各選択肢Ｒ１からＲ４に対応して、次式に示す出力ベクトルを生成する。
（数４）
ｙ^Ｒ１Ａ＝（１，０，０，０，０）
ｙ^Ｒ１Ｂ＝（０，１，０，０，０）
ｙ^Ｒ２Ａ＝（１，０，０，０，０）
ｙ^Ｒ２Ｂ＝（０，１，０，０，０）
ｙ^Ｒ２Ｓ＝（０，０，０，０，１）
ｙ^Ｒ３Ａ＝（１，０，０，０，０）
ｙ^Ｒ３Ｂ＝（０，１，０，０，０）
ｙ^Ｒ３Ｃ＝（０，０，１，０，０）
ｙ^Ｒ４Ａ＝（１，０，０，０，０）
ｙ^Ｒ４Ｂ＝（０，１，０，０，０）
ｙ^Ｒ４Ｄ＝（０，０，０，１，０）

次に、学習処理部１５０は、学習用の入力ベクトルおよび出力ベクトルを用いて、選択モデルの学習を実行する（Ｓ２３０）。本実施形態の学習データにおいて、例えば、初期状態の商品Ａと商品Ｂの選択確率の比（０．６／０．４）は、シミラリティ効果の結果によって、異なる比（０．３／０．４）となる。同様に、当該比は、コンプロマイズ効果の結果による当該比（０．３／０．５）、およびアトラクション効果の結果による当該比（０．４／０．５）のように、選択肢に応じてそれぞれ異なる比となる。

従来、このような消費者に提示する選択肢に応じて、当該選択肢に含まれる商品の選択確率の比が変化する選択行動は、モデル化することが困難であった。そこで、本実施形態の学習処理部１５０は、消費者の選択行動を、入力ベクトルから出力ベクトルへの写像を学習する問題として定式化して、入力選択肢に含まれる選択肢同士の選択確率の比が入力選択肢に含まれる他の選択肢の組合せに応じて異なりうる選択モデルを学習する。

図７は、本実施形態に係る選択モデル１０の一例を示す。選択モデル１０は、入力層１２と、出力層１４と、中間層１６とを有する。入力層１２は、複数種類の選択肢のそれぞれを入力ノードとする。即ち、入力ノードは、入力ベクトルの要素に対応し、各ノードの値が入力ベクトルの要素の値と略同一となる。例えば、入力層１２は、入力ベクトルｘ＝（ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５）に対応して、ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５を入力ノードとする。

出力層１４は、複数種類の選択肢のそれぞれを出力ノードとする。即ち、出力ノードは、出力ベクトルの要素に対応し、各ノードの値が出力ベクトルの要素の値と略同一となる。例えば、出力層１４は、出力ベクトルｙ＝（ｙ_１，ｙ_２，ｙ_３，ｙ_４，ｙ_５）に対応して、ｙ_１，ｙ_２，ｙ_３，ｙ_４，ｙ_５を出力ノードとする。

中間層１６は、複数の中間ノードを含む。ここで、中間ノードｈ_ｋの数Ｋは、１以上の自然数であり、入力ノードの数（出力ノードの数）Ｊと同一の数でもよい。また、中間ノードｈ_ｋの値は、一例として、非零の値（例えば１）または０とする。ここで、中間層１６は、選択モデルの入出力特性を表現すべく用いた隠れ層である。当該中間層１６が有する中間ノードｈ_ｋの値は、結果として１または０の値が一意に求まらなくてもよく、１または０の値となる確率の分布等が得られてもよい。中間ノードｈ_ｋの値は、次式で示される。
（数５）
ｈ_ｋ∈｛０，１｝，ｋ∈｛１，...，Ｋ｝

選択モデル１０が表現できる入出力特性は、中間ノードの数Ｋに応じて複雑さを増減できるので、より表現したい特性を増加させるには中間ノードの数Ｋを増加させることが好ましい。その一方で、選択モデル１０の学習に必要な計算量は、中間ノードの数Ｋの増加に応じて増加するので、学習をより高速に実行させるには中間ノードの数Ｋを減少させることが好ましい。これらを考慮し、処理装置１００の使用者等は、予め中間ノードの数Ｋを適度な値に設定してよい。本実施形態において、中間ノードｈ_ｋの数Ｋが、入力ノードの数Ｊ（＝５）と同一の値である例を説明する。

また、選択モデル１０は、各入力ノードｘ_ｉおよび各中間ノードｈ_ｋの間に各第１ウェイト値Ｗ_ｉｋが設定される。即ち、各入力ノードｘ_ｉおよび各中間ノードｈ_ｋは、それぞれ接続され、当該接続によるデータの流れに第１ウェイトＷ_ｉｋがそれぞれ付加される。また、選択モデル１０は、各中間ノードｈ_ｋおよび各出力ノードｙ_ｊの間に各第２ウェイト値Ｕ_ｊｋが設定される。即ち、各中間ノードｈ_ｋおよび各出力ノードｙ_ｊは、それぞれ接続され、当該接続によるデータの流れに第２ウェイトＵ_ｉｋがそれぞれ付加される。

第１ウェイト値Ｗ_ｉｋおよび第２ウェイト値Ｕ_ｊｋは、データの流れの方向によらず一定のウェイトを当該流れに付加する対称ウェイトである。ここで、各層内のノード同士は、接続されない。また、各入力ノードｘ_ｉおよび各出力ノードｙ_ｊは、それぞれ接続してもしなくてもよい。本実施形態においては、各入力ノードｘ_ｉおよび各出力ノードｙ_ｊを接続しない例を説明する。

また、選択モデル１０は、入力層１２、中間層１６、および出力層１４に含まれる各ノードに対して入力バイアス、中間バイアス、および出力バイアスが更に設定される。即ち、入力層１２の各入力ノードｘ_ｉには、入力バイアスｂ_ｉ ^ｘがそれぞれ設定される。同様に、出力層１４の各出力ノードｙ_ｊには出力バイアスｂ_ｊ ^ｙが、中間層１６の各中間ノードｈ_ｋには中間バイアスｂ_ｋ ^ｈが、それぞれ設定される。

学習処理部１５０は、各入力ノードｘ_ｉおよび各中間ノードｈ_ｋの間の各第１ウェイト値Ｗ_ｉｋと、各中間ノードｈ_ｋおよび各出力ノードｙ_ｊの間の各第２ウェイト値Ｕ_ｊｋとを学習する。また、学習処理部１５０は、入力層１２の各入力バイアスｂ_ｉ ^ｘ、中間層１６の各中間バイアスｂ_ｋ ^ｈ、および出力層１４の各出力バイアスｂ_ｊ ^ｙを更に学習する。即ち、学習処理部１５０は、第１ウェイト値Ｗ_ｉｋ、第２ウェイト値Ｕ_ｊｋ、入力バイアスｂ_ｉ ^ｘ、中間バイアスｂ_ｋ ^ｈ、および出力バイアスｂ_ｊ ^ｙをパラメータとして学習する。学習処理部１５０は、一例として、当該パラメータをベクトルθの要素とし、当該パラメータベクトルθ（Ｗ_ｉｋ，Ｕ_ｊｋ，ｂ_ｉ ^ｘ，ｂ_ｋ ^ｈ，ｂ_ｊ ^ｙ）を用いて学習する。

学習処理部１５０は、例えば、制約付ボルツマンマシン（ＲｅｓｔｒｉｃｔｅｄＢｏｌｚｍａｎｎＭａｃｈｉｎｅ）に基づく選択モデルを学習する。ボルツマンマシンは、確率的に動作する確率的素子によって構成され、入力を固定して動作させても確率に応じて様々な値を出力し、当該出力の観測系列（例えば時間系列）から各出力の出現確率（出現頻度）を得るシステムである。ここで、確率的素子のそれぞれが確率的平衡状態に落ち着いている場合、即ち、確率的素子のそれぞれの状態の出現確率が略一定となる場合、状態αの出現確率はボルツマン分布（ｅｘｐ｛−Ｅ（α）／Ｔ｝）に比例する。

即ち、ボルツマンマシンの出力そのものは時間的に変動するが、出現確率は入力から一意に定まり、時間的に略一定となる。なお、ボルツマンマシンは、初期値に応じて、出現確率が時間的に変動する過渡期を生じさせる場合があるが、当該初期値の影響が低減するまで十分に長い時間動作させることにより、出現確率は時間的に略一定の値に収束する。本実施形態においては、このようなボルツマンマシンのシステムに基づいて、選択モデルを学習する例を説明する。

学習処理部１５０は、入力ベクトルおよび出力ベクトルの要素を含む入出力サンプルベクトルｓ^ｌｍ＝（ｘ^ｌ，ｙ^ｍ）（または入出力サンプル列、入出力サンプル配列等）を生成する。ここで、学習処理部１５０は、消費者の選択結果である選択確率に応じた数の入出力サンプルベクトルを生成してよい。

例えば、学習処理部１５０は、初期状態の選択肢Ｒ１の提示に対して消費者が商品Ａを選択した結果が６０％であることに応じて、対応する入出力サンプルベクトルｓ^Ｒ１Ａを６つ生成する。この場合、学習処理部１５０は、選択肢Ｒ１の提示に対して商品Ｂを選択した結果が４０％であることに応じて、対応する入出力サンプルベクトルｓ^Ｒ１Ｂを４つ生成する。学習処理部１５０は、一例として、入出力サンプルベクトルｓ^ｌｍを次式のように生成する。なお、次式には、学習処理部１５０が各ベクトルを生成する数も示す。
（数６）
ｓ^Ｒ１Ａ＝（１，１，０，０，０，１，０，０，０，０）：６つ
ｓ^Ｒ１Ｂ＝（１，１，０，０，０，０，１，０，０，０）：４つ
ｓ^Ｒ２Ａ＝（１，１，０，０，１，１，０，０，０，０）：３つ
ｓ^Ｒ２Ｂ＝（１，１，０，０，１，０，１，０，０，０）：４つ
ｓ^Ｒ２Ｓ＝（１，１，０，０，１，０，０，０，０，１）：３つ
ｓ^Ｒ３Ａ＝（１，１，１，０，０，１，０，０，０，０）：３つ
ｓ^Ｒ３Ｂ＝（１，１，１，０，０，０，１，０，０，０）：５つ
ｓ^Ｒ３Ｃ＝（１，１，１，０，０，０，０，１，０，０）：２つ
ｓ^Ｒ４Ａ＝（１，１，０，１，０，１，０，０，０，０）：４つ
ｓ^Ｒ４Ｂ＝（１，１，０，１，０，０，１，０，０，０）：５つ
ｓ^Ｒ４Ｄ＝（１，１，０，１，０，０，０，０，１，０）：１つ

学習処理部１５０は、（数６）式で示した合計４０の入出力サンプルベクトルを学習用サンプルとして選択モデル１０を学習する。ここで、学習処理部１５０は、合計４０の入出力サンプルベクトルをランダムにシャッフルしたデータセットを学習用サンプルとして用いてよい。

そして、学習処理部１５０は、入出力サンプルベクトル毎に、ｐ（ｙ，ｘ）およびｐ（ｙ｜ｘ）の少なくともいずれか一方が高くなるように、パラメータベクトルθを更新する。ここで、ｐ（ｙ，ｘ）は、入力ベクトルがｘで、かつ、出力ベクトルがｙとなる同時確率を示す。また、ｐ（ｙ｜ｘ）は、入力ベクトルがｘとなった場合における、出力ベクトルがｙとなる条件付き確率を示す。なお、ｐ（ｙ，ｘ）およびｐ（ｙ｜ｘ）は、ｐ（ｙ｜ｘ）＝ｐ（ｙ，ｘ）／ｐ（ｘ）と関係づけられる。

学習処理部１５０は、例えば、学習用の選択行動を示す入出力サンプルベクトルのそれぞれについて、入力選択肢および出力選択肢の同時確率ｐ（ｙ，ｘ）を高めるように、パラメータを更新する。この場合、学習処理部１５０は、同時確率ｐ（ｙ，ｘ）を確率的に大きくする勾配方向にパラメータベクトルθの各要素を更新する。即ち、学習処理部１５０は、図７に示された選択モデル１０に基づく同時確率ｐ（ｙ，ｘ）のパラメータベクトルθに対する勾配を求め、当該同時確率ｐ（ｙ，ｘ）が大きくなる方向にパラメータベクトルθの要素をそれぞれ増減させて更新する。

また、学習処理部１５０は、例えば、学習用の選択行動のそれぞれについて、入力選択肢に応じて出力選択肢が選択される確率（即ち、条件付き確率ｐ（ｙ｜ｘ））を高めるように、パラメータを更新する。この場合、学習処理部１５０は、条件付き確率ｐ（ｙ｜ｘ）を確率的に大きくする勾配方向にパラメータを更新する。即ち、学習処理部１５０は、図７に示された選択モデル１０に基づく条件付き確率ｐ（ｙ｜ｘ）のパラメータベクトルθに対する勾配を求め、当該条件付き確率ｐ（ｙ｜ｘ）が大きくなる方向にパラメータベクトルθの要素をそれぞれ増減させて更新する。

ここで、図７に示された選択モデル１０に基づく同時確率ｐ（ｙ，ｘ）および条件付き確率ｐ（ｙ｜ｘ）は、次式で示すエネルギー関数Ｅ（ｘ，ｙ，ｈ；θ）および自由エネルギーＦ（ｘ，ｙ；θ）、Ｆ（ｘ；θ）、およびＦ（θ）を用いて示すことができる。ここで、パラメータθを有する x の確率分布を、ｐ（ｘ；θ）と表記した。

（数７）および（数８）式より、同時確率ｐ（ｙ，ｘ）および条件付き確率ｐ（ｙ｜ｘ）は、次式で示される。このように、選択モデル１０に基づき、ボルツマンマシンのエネルギー関数および自由エネルギーを用いて同時確率ｐ（ｙ，ｘ）および条件付き確率ｐ（ｙ｜ｘ）を算出する具体的な方法は既知である。

学習処理部１５０は、同時確率ｐ（ｙ，ｘ）のパラメータベクトルθに対する勾配を、（数７）から（数９）式より算出される次式から算出する。

ここで、（数１１）式におけるＣ（ｘ）は、入力ベクトルｘで１となる要素を、ｏｎｅ−ｈｏｔコーデイング（１つの要素を１とし、他の要素は全て０としたベクトルによって表現するコーディング方法）で表現したベクトルを含むセットである。（数１１）式において、ウェイトを工夫して式変形することで、次式を得る。即ち、アイテムセットに含まれていないアイテムに対しても期待値を取ってもよい。

学習処理部１５０は、パラメータベクトルθを、（数１１）または（数１２）式を用いて、予め定められた初期値から入出力サンプルベクトル毎に更新する。学習処理部１５０は、一例として、初期値を代入した（数１１）式の勾配の増加（プラス）方向に、予め定められた値（ΔＷ，ΔＵ，Δｂ^ｘ，Δｂ^ｈ，Δｂ^ｙ）だけ、初期値のパラメータベクトルθの各要素を増加させる。そして、学習処理部１５０は、例えば、同時確率ｐ（ｙ，ｘ）の増減が予め定められた範囲内に収束するまで当該更新を繰り返す。これに代えて、学習処理部１５０は、予め定められた回数の更新を繰り返してもよい。

また、学習処理部１５０は、複数の初期値からパラメータベクトルθの更新をそれぞれ繰り返してよい。この場合、学習処理部１５０は、一例として、パラメータベクトルθの要素のそれぞれが、予め定められた範囲内に収束するまで当該更新を繰り返す。これによって、学習処理部１５０は、より確度の高いパラメータベクトルθを定めることができる。

ここで、学習処理部１５０は、同時確率ｐ（ｙ，ｘ）の増減が収束しない場合、パラメータベクトルθの要素の一部または全部が収束しない場合等は、初期値を変更してもよい。このように、同時確率ｐ（ｙ，ｘ）を大きくするように、同時確率ｐ（ｙ，ｘ）の勾配を算出し、勾配方向にパラメータを更新する具体的な方法は、「Ｇｒａｄｉｅｎｔｆｏｒｇｅｎｅｒａｔｉｖｅｔｒａｉｎｉｎｇ」として既知である。

同様に、学習処理部１５０は、条件付き確率ｐ（ｙ｜ｘ）のパラメータベクトルθに対する勾配を、（数７）、（数８）、および（数１０）式より算出される次式から算出する。

（数１３）式においても、（数１１）式と同様に、ウェイトを工夫して式変形することで、次式を得る。

学習処理部１５０は、同時確率ｐ（ｙ，ｘ）の場合と同様に、（数１３）または（数１４）式を用いて予め定められた初期値から入出力サンプルベクトル毎に更新し、パラメータベクトルθを定める。このように、条件付き確率ｐ（ｙ｜ｘ）を大きくするように、条件付き確率ｐ（ｙ｜ｘ）の勾配を算出し、勾配方向にパラメータを更新する具体的な方法は、「Ｇｒａｄｉｅｎｔｆｏｒｄｉｓｃｒｉｍｉｎａｔｉｖｅｔｒａｉｎｉｎｇ」として既知である。

以上の本実施形態の学習処理部１５０は、同時確率ｐ（ｙ，ｘ）または条件付き確率ｐ（ｙ｜ｘ）の勾配を算出し、勾配方向にパラメータを更新することを説明した。これに代えて、学習処理部１５０は、ｐ（ｙ，ｘ）および条件付き確率ｐ（ｙ｜ｘ）の勾配をそれぞれ算出し、算出した２つの勾配に基づいてパラメータを更新してもよい。即ち、学習処理部１５０は、一例として、（数１１）式および（数１２）式から、ｐ（ｙ，ｘ）および条件付き確率ｐ（ｙ｜ｘ）の勾配をそれぞれ算出した後、当該２つの勾配を組み合わせた（ハイブリッド：ｈｙｂｒｉｄ）勾配を次式のように更に算出する。

学習処理部１５０は、同時確率ｐ（ｙ，ｘ）等の場合と同様に、パラメータベクトルθを、（数１３）式を用いて、予め定められた初期値から入出力サンプルベクトル毎に更新し、パラメータベクトルθを定める。このように、同時確率ｐ（ｙ，ｘ）および条件付き確率ｐ（ｙ｜ｘ）を大きくするように、同時確率ｐ（ｙ，ｘ）および条件付き確率ｐ（ｙ｜ｘ）の勾配の組み合わせを算出し、組み合わせの勾配方向にパラメータを更新する具体的な方法は、「Ｇｒａｄｉｅｎｔｆｏｒｈｙｂｒｉｄｔｒａｉｎｉｎｇ」として既知である。

以上のように、本実施形態の学習処理部１５０は、認知バイアスがかかった消費者の選択行動をモデル化した選択モデル１０を、制約付ボルツマンマシンに基づいて学習することができる。また、学習処理部１５０は、複雑で特殊なアルゴリズムを用いることなく、既知の学習アルゴリズムによって、選択モデル１０を学習することができる。学習処理部１５０は、学習した選択モデル１０のパラメータベクトルθを記憶部１２０に記憶する。

次に、確率算出部１６０は、入力選択肢に応じてそれぞれの選択肢が選択される確率を、各第１ウェイト値、各第２ウェイト値、各入力バイアス、各中間バイアス、および各出力バイアスを含むパラメータに基づき算出する（Ｓ２４０）。確率算出部１６０は、記憶部１２０から学習した選択モデル１０のパラメータベクトルθを読み出し、各選択肢が選択される確率を算出してよい。ここで、確率算出部１６０は、（数９）および（数１０）式を用いて各選択肢が選択される確率を算出してよい。

図８は、本実施形態に係る確率算出部１６０が算出した各選択肢が選択される確率の一例を示す。図８は、図６に示した学習データをターゲットとして、選択モデル１０を学習した結果の一例である。即ち、図８の横軸、縦軸、および各棒グラフがそれぞれ示す内容は、図６と略同一である。

図８と図６を比較することにより、本実施形態の処理装置１００は、ターゲットである学習データと略同一の傾向の確率を算出することができることがわかる。また、初期状態の商品Ａと商品Ｂの選択確率の比が、消費者に提示する選択肢に応じて変化することも再現できることがわかる。これより、処理装置１００は、選択モデル１０を用いてシミラリティ効果、コンプロマイズ効果、およびアトラクション効果等の認知バイアスが加わった消費者の消費行動を表現でき、また、当該選択モデル１０を既知の学習アルゴリズムで学習できることを確認できた。

以上の本実施形態の処理装置１００において、学習処理部１５０が制約付ボルツマンマシンに基づいて条件付き確率ｐ（ｙ｜ｘ）等を解析的に算出し、選択モデル１０を学習することを説明した。これに代えて、学習処理部１５０は、ギブスサンプリング等を用いて条件付き確率ｐ（ｙ｜ｘ）を推定し、選択モデル１０を学習してもよい。

この場合、学習処理部１５０は、Ｌ個の商品が提示されたことに応じて、入力層１２の入力ベクトルを固定したまま、出力層１４の出力ベクトルおよび中間層１６の中間ノードに対してギブスサンプリングを実行することで、それぞれの商品が消費者に選択される確率を推定することができる。この場合、学習処理部１５０は、一例として、推定する条件付き確率ｐ（ｙ｜ｘ）が最大となるようにパラメータベクトルθを勾配法等で決定し、選択モデル１０を学習することができる。

以上のように、本実施形態の処理装置１００は、選択モデル１０を学習して認知バイアスが加わった消費者の消費行動を表現することができる。これにより、例えば、取得部１１０が、ユーザに与えられた商品またはサービスの選択肢に対してユーザが選択した選択肢を学習用の選択行動として含む学習データを取得することで、学習処理部１５０が、商品またはサービスの選択肢に応じたユーザの選択行動をモデル化した選択モデル１０を学習することができる。この場合、対象はユーザであり、選択肢は当該ユーザに与えられる商品またはサービスの選択肢である。これによって、処理装置１００は、ユーザの購買行動を学習することができる。

図９は、本実施形態に係る処理装置１００の第１の変形例を示す。本変形例の処理装置１００において、図４に示された本実施形態に係る処理装置１００の動作と略同一のものには同一の符号を付け、説明を省略する。本変形例の処理装置１００の取得部１１０は、指定入力部１１２と、選択部１１４とを有する。また、本変形例の処理装置１００は、特定部１７０を更に備える。

指定入力部１１２は、複数種類の商品またはサービスのうち、販売を促進する商品またはサービスの指定を入力する。指定入力部１１２は、一例として、ユーザから売りたい商品またはサービス等の指定を受け取る。

選択部１１４は、複数種類の商品またはサービスに対応する複数種類の選択肢の中から、販売を促進する商品またはサービスを選択肢として含む複数の入力選択肢を選択する。例えば、ユーザが販売を促進する商品として、商品Ｂの指定を指定入力部１１２に入力した場合、選択部１１４は、商品Ｂを含む複数の選択肢（Ａ，Ｂ）、（Ａ，Ｂ，Ｃ）、・・・等を選択する。選択部１１４は、このように選択した複数の選択肢の情報を入力ベクトル生成部１３０に供給する。

入力ベクトル生成部１３０は、既に説明したように、受け取った複数の選択肢に応じた複数の入力ベクトルを生成して確率算出部１６０に供給する。確率算出部１６０は、既に説明したように、学習済の選択モデル１０のパラメータベクトルθを読み出し、各選択肢が選択される確率を算出する。

特定部１７０は、複数の入力選択肢のうち、販売を促進する商品またはサービスに応じた選択肢が選択される確率がより高くなる入力選択肢を特定する。特定部１７０は、一例として、図８の結果より、選択肢Ｒ４（商品Ａ，Ｂ，Ｄ）を、商品Ｂが選択される確率がより高くなる選択肢として特定する。このように、本変形例の処理装置１００は、販売を促進したい商品等に応じて、消費者に提示すべき選択肢を適切に特定することができる。

以上の本実施形態の処理装置１００において、取得部１１０は、ウェブサイト上で提示された選択肢の中からユーザが選択した選択肢を含む学習データを取得してもよい。即ち、本例において、対象はユーザであり、選択肢はウェブサイト上で当該ユーザに提示される。これによって、処理装置１００は、例えば、インターネットを介してショッピングをする消費者の選択行動をモデル化することができる。また、処理装置１００は、当該消費者の購買行動を学習することができ、また、販売促進する商品等を含めた適切な選択肢を当該消費者にウェブサイトを介して提示することができる。

また、本実施形態の処理装置１００は、消費者に提示する選択肢に応じて、当該選択肢に含まれるそれぞれの商品が選択される確率を算出することができる。そこで、処理装置１００は、食堂およびレストラン等の飲食店が消費者に提示するメニューに応じて、当該メニューに含まれるメニューアイテムが選択される確率を算出することもできる。これによって、処理装置１００は、飲食店等が提示するメニューに応じて準備すべきメニューアイテムの数および材料等を予測することもできる。

以上の本実施形態の処理装置１００において、学習処理部１５０は、１つの選択モデル１０を生成して学習することを説明した。これに代えて、学習処理部１５０は、複数の選択モデル１０を生成し、別個独立にそれぞれ学習してもよい。学習処理部１５０は、例えば、複数の消費者グループに対応付けて、複数の選択モデル１０を生成し、それぞれの消費者グループ毎に選択モデル１０を学習する。ここで、消費者グループは一人以上の消費者を含むグループである。これによって、消費者の選択行動を、消費者毎により細かく分析することができる。

以上の本実施形態の処理装置１００は、認知バイアスが加わった消費者の消費行動を表現できる選択モデル１０を学習できるが、学習済みの選択モデル１０を用いて商品の選択確率を算出すると、選択肢に含まれない商品に対しても選択確率が０ではない値を算出することがある。例えば、図８の確率算出部１６０が算出した各選択肢が選択される確率において、選択肢Ｒ２に対応する商品Ａ、Ｂ、およびＳには、それぞれ０ではない選択確率が算出される。しかしながら、確率算出部１６０は、選択肢Ｒ２に含まれない商品Ｄに対しても、０ではない選択確率を算出結果として出力する。

同様に、確率算出部１６０は、選択肢Ｒ３に対応する商品Ａ、Ｂ、およびＣに、それぞれ０ではない選択確率が算出すると共に、選択肢Ｒ３に含まれない商品Ｓに対しても、０ではない選択確率を算出結果として出力する。このように、消費者に提示しない商品に対して算出される選択確率は、全て誤差となってしまう。

そこで、本実施形態において、このような誤差を低減すべく、図７で説明した選択モデル１０を変形した例を説明する。図１０は、本実施形態に係る選択モデル１０の変形例を示す。本変形例の選択モデル１０において、図７に示された本実施形態に係る選択モデル１０の動作と略同一のものには同一の符号を付け、説明を省略する。

本変形例の選択モデル１０は、各入力ノードｘ_ｉおよび各中間ノードｈ_ｋの間に対称ウェイトの各第１ウェイト値Ｗ_ｉｋが設定される。そして、選択モデル１０は、各入力ノードｘ_ｊ、各中間ノードｈ_ｋ、および各出力ノードｙ_ｊの間に各第２ウェイト値Ｕ_ｊｊｋが設定される。即ち、第２ウェイト値Ｕ_ｊｊｋは、入力ノードｘ_ｊ、中間ノードｈ_ｋおよび各出力ノードｙ_ｊの各値に応じてウェイト値が定まる三方向ウェイトである。

ここで、第２ウェイト値Ｕ_ｊｊｋは、入力ノードｘ_ｊの値が１となる場合（消費者に提示された商品の場合）に、対応する出力ノードｙ_ｊのウェイト値を図７で説明した第２ウェイト値Ｕ_ｊｋとし、また、対応する出力ノードｙ_ｊ以外のノードのウェイト値を１未満の値にする。第２ウェイト値Ｕ_ｊｊｋは、一例として、対応する出力ノードｙ_ｊ以外のノードのウェイト値を０にする。この場合、第２ウェイト値Ｕ_ｊｊｋは、次式のように示される。

ここで、δ_ｉｊは、ｉとｊが等しい場合（ｉ＝ｊ）に１となり、ｉとｊが異なる場合（ｉ≠ｊ）に０となるクロネッカーのデルタとして既知の関数である。このように、本変形例の選択モデル１０は、消費者に提示されていない、選択肢としては存在しない商品の選択確率を低減させるように、第２ウェイト値にゲーティング機能を付加する。

そして、このような本変形例の選択モデル１０の各第１ウェイト値Ｗ_ｉｋおよび各第２ウェイト値Ｕ_ｊｊｋを学習すべく、図４で説明した処理装置１００を変形した例を説明する。図１１は、本実施形態に係る処理装置１００の第２の変形例を示す。本変形例の処理装置１００において、図４に示された本実施形態に係る処理装置１００の動作と略同一のものには同一の符号を付け、説明を省略する。

即ち、本変形例の処理装置１００は、図１０に示された複数の入力ノードを含む入力層１２、複数の出力ノードを含む出力層１４、および複数の中間ノードを含む中間層１６を備える選択モデル１０を処理する。本変形例の処理装置１００は、算出部２１０を備える。

取得部１１０は、複数の入力ノードｘ_ｉに対する複数の入力値を取得する。また、取得部１１０は、複数の入力値と複数の入力値に対応して複数の出力ノードに出力すべき複数の出力値とを含む学習データを取得してよい。

入力ベクトル生成部１３０は、複数種類の選択肢のそれぞれが入力選択肢に含まれるか否かを示す入力ベクトルｘを生成し、出力ベクトル生成部１４０は、複数種類の選択肢のそれぞれが学習用の出力選択肢に含まれるか否かを示す出力ベクトルｙを生成する。

算出部２１０は、入力ベクトル生成部１３０および出力ベクトル生成部１４０に接続され、入力ベクトルおよび出力ベクトルの情報を受け取る。算出部２１０は、入力値が０である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値の影響を低減させた選択モデル１０を用いて、複数の入力値に対応する複数の出力ノードからの複数の出力値を算出する。

算出部２１０は、複数の入力値に対応する複数の出力ノードからの複数の出力値の算出において、入力値が０の入力ノードに対応する出力ノードの出力値に１未満の係数を乗じて第２ウェイト値の影響を低減させてよい。算出部２１０は、一例として、複数の入力値に対応する複数の出力ノードからの複数の出力値の算出において、入力値が０の入力ノードに対応する出力ノードの出力値に係数０を乗じて０とする。

また、算出部２１０は、例えば、入力値が１である入力ノードｘ_ｊに対応する出力ノードｙ_ｊと、中間ノードｈ_ｋとの間に設定された第２ウェイト値Ｕ_ｊｊｋの大きさを変えずに、入力値が１である当該入力ノードｘ_ｊに対応しない出力ノードｙ_ｉ（ｉ≠ｊ）と、中間ノードｈ_ｋとの間に設定された第２ウェイト値Ｕ_ｉｊｋの大きさを低減させる。算出部２１０は、当該第２ウェイト値Ｕ_ｉｊｋの大きさを１未満の値にしてよい。

算出部２１０は、一例として、入力値が１である入力ノードｘ_ｊに対応しない出力ノードｙ_ｉと、中間ノードｈ_ｋとの間に設定された第２ウェイト値Ｕ_ｉｊｋの大きさを０にする。そして、算出部２１０は、低減後の第２ウェイト値に基づいて、複数の入力値に対応する複数の出力ノードからの複数の出力値を算出する。算出部２１０は、一例として、出力ノードｙ_ｊの出力値ｙ_ｊ ^ｏｕｔを次式のように算出する。

ここで、算出部２１０は、入力ベクトル、出力ベクトル、各第１ウェイト値、および各第２ウェイト値等の情報を、学習処理部１５０に供給する。また、算出部２１０は、記憶部１２０に接続されてよく、この場合、設定した各第１ウェイト値と各第２ウェイト値とを記憶部１２０に供給する。この場合、記憶部１２０は、入力層１２と中間層１６との間の各ノード間に設定された各第１ウェイト値と、中間層１６と出力層１４との間の各ノード間に設定された各第２ウェイト値とを記憶する。

学習処理部１５０は、算出部２１０に接続され、学習用の複数の入力値および複数の出力値に基づいて、本変形例の選択モデル１０を学習する。即ち、学習処理部１５０は、対象の認知バイアスに応じた選択行動を含む本変形例の選択モデル１０を学習する。学習処理部１５０は、一例として、（数２）、（数４）式で示される複数の入力ベクトルｘおよび複数の出力ベクトルｙに基づき、既に説明した学習方法により本変形例の選択モデル１０を学習する。

即ち、学習処理部１５０は、学習用の入力値が０である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値を０として本変形例の選択モデル１０を学習する。この場合、学習処理部１５０は、（数７）式のエネルギー関数に代えて、一例として、図１０の選択モデル１０を反映させた次式を用いてよい。

ここで、添え字ｙを次式のように定義することにより、（数１８）式は、（数２０）式のように表すことができる。

このような（数２０）式のエネルギー関数と、（数８）式の自由エネルギーＦ（ｘ，ｙ；θ）およびＦ（ｘ；θ）を用いることにより、条件付き確率ｐ（ｙ｜ｘ）は、（数１０）式のように算出することができる。そこで、学習処理部１５０は、（数２０）式のエネルギー関数に基づく条件付き確率ｐ（ｙ｜ｘ）において、パラメータベクトルθに対する勾配を（数１３）式から算出し、条件付き確率ｐ（ｙ｜ｘ）を確率的に大きくする勾配方向にパラメータを更新する。

以上のように、本変形例の学習処理部１５０は、図７の選択モデル１０の学習で説明したように、図１０の選択モデル１０を学習することができる。なお、図１０の選択モデル１０においては、ベクトルｈを与えてもベクトルｘおよびｙを同時に定めることができないので、同時確率ｐ（ｙ，ｘ）の「Ｇｒａｄｉｅｎｔｆｏｒｇｅｎｅｒａｔｉｖｅｔｒａｉｎｉｎｇ」を実行することはできない。

以上のように、本変形例の学習処理部１５０は、認知バイアスがかかった消費者の選択行動をモデル化した図１０の選択モデル１０を、制約付ボルツマンマシンに基づいて学習することができる。また、本変形例に係る確率算出部１６０は、学習した選択モデル１０に基づき、各選択肢が選択される確率を算出することができる。

図１２は、本変形例に係る確率算出部１６０が算出した各選択肢が選択される確率の一例を示す。図１２は、図８と同様、図６に示した学習データをターゲットとして、図１０の選択モデル１０を学習した結果の一例である。即ち、図１２の横軸、縦軸、および各棒グラフがそれぞれ示す内容は、図６および図８と略同一である。

図１２と図６を比較することにより、本変形例の処理装置１００は、ターゲットである学習データと略同一の傾向の確率を算出することができることがわかる。また、初期状態の商品Ａと商品Ｂの選択確率の比が、消費者に提示する選択肢に応じて変化することも再現できることがわかる。これにより、本変形例の学習処理部１５０は、入力選択肢に含まれる選択肢同士の選択確率の比が入力選択肢に含まれる他の選択肢の組合せに応じて異なりうる本変形例の選択モデル１０を学習することができることがわかる。

また、図１２と図８を比較することにより、本変形例の処理装置１００は、選択肢に含まれない商品に対して選択確率が略０を算出していることがわかる。例えば、図１２の各選択肢が選択される確率において、選択肢Ｒ２に対応する商品Ａ、Ｂ、およびＳには、それぞれ０ではない選択確率が算出されると共に、選択肢Ｒ２に含まれない商品Ｄに対しては、略０の選択確率を算出結果が得られている。

同様に、選択肢Ｒ３に対応する商品Ａ、Ｂ、およびＣに、それぞれ０ではない選択確率が算出すると共に、選択肢Ｒ３に含まれない商品Ｓに対しては、略０の選択確率が算出結果として得られている。このように、本変形例の処理装置１００は、消費者に提示しない商品に対して算出される選択確率を略０にして、選択確率の誤差を低減させることができる。

以上の本変形例の処理装置１００は、入力値が０である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値の影響を低減させた選択モデル１０を用いて、選択確率の誤差を低減させることを説明した。ここで、処理装置１００は、選択モデル１０の入力ノードｘ_ｉが０であることに代えて、入力ノードが予め定められた閾値以下の値であることに応じて、第２ウェイト値の影響を低減させるモデルを用いてもよい。この場合、処理装置１００は、複数の入力値に対応する複数の出力ノードからの複数の出力値を当該閾値以下に算出してよい。

また、以上の本実施形態の処理装置１００は、与えられた選択肢に対する対象の選択行動をモデル化した選択モデル１０を用いることを説明したが、これに限られず、確率分布を予測する予測モデルを用いてもよい。例えば、処理装置１００は、サイズＮの母集団Ａ（離散集合Ａ）から、任意のｍ個のサブセットＢを選択し、当該サブセットＢに定義される確率分布を予測する制約付きボルツマンマシンに基づく予測モデルに適用することができる。即ち、処理装置１００は、当該予測モデルを学習してサブセットＢに定義される確率分布を算出した場合、サブセットＢに含まれない母集団Ａの確率分布を略０にすることができるので、当該確率分布を効率よく学習して正確に算出することができる。

図１３は、本実施形態に係る処理装置１００として機能するコンピュータ１９００のハードウェア構成の一例を示す。本実施形態に係るコンピュータ１９００は、ホスト・コントローラ２０８２により相互に接続されるＣＰＵ２０００、ＲＡＭ２０２０、グラフィック・コントローラ２０７５、および表示装置２０８０を有するＣＰＵ周辺部と、入出力コントローラ２０８４によりホスト・コントローラ２０８２に接続される通信インターフェイス２０３０、ハードディスクドライブ２０４０、およびＤＶＤドライブ２０６０を有する入出力部と、入出力コントローラ２０８４に接続されるＲＯＭ２０１０、フレキシブルディスク・ドライブ２０５０、および入出力チップ２０７０を有するレガシー入出力部と、を備える。

ホスト・コントローラ２０８２は、ＲＡＭ２０２０と、高い転送レートでＲＡＭ２０２０をアクセスするＣＰＵ２０００およびグラフィック・コントローラ２０７５とを接続する。ＣＰＵ２０００は、ＲＯＭ２０１０およびＲＡＭ２０２０に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ２０７５は、ＣＰＵ２０００等がＲＡＭ２０２０内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置２０８０上に表示させる。これに代えて、グラフィック・コントローラ２０７５は、ＣＰＵ２０００等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。

入出力コントローラ２０８４は、ホスト・コントローラ２０８２と、比較的高速な入出力装置である通信インターフェイス２０３０、ハードディスクドライブ２０４０、ＤＶＤドライブ２０６０を接続する。通信インターフェイス２０３０は、ネットワークを介して他の装置と通信する。ハードディスクドライブ２０４０は、コンピュータ１９００内のＣＰＵ２０００が使用するプログラムおよびデータを格納する。ＤＶＤドライブ２０６０は、ＤＶＤ−ＲＯＭ２０９５からプログラムまたはデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。

また、入出力コントローラ２０８４には、ＲＯＭ２０１０と、フレキシブルディスク・ドライブ２０５０、および入出力チップ２０７０の比較的低速な入出力装置とが接続される。ＲＯＭ２０１０は、コンピュータ１９００が起動時に実行するブート・プログラム、および／または、コンピュータ１９００のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ２０５０は、フレキシブルディスク２０９０からプログラムまたはデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。入出力チップ２０７０は、フレキシブルディスク・ドライブ２０５０を入出力コントローラ２０８４へと接続すると共に、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ２０８４へと接続する。

ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供されるプログラムは、フレキシブルディスク２０９０、ＤＶＤ−ＲＯＭ２０９５、またはＩＣカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、ＲＡＭ２０２０を介してコンピュータ１９００内のハードディスクドライブ２０４０にインストールされ、ＣＰＵ２０００において実行される。

プログラムは、コンピュータ１９００にインストールされ、コンピュータ１９００を取得部１１０、記憶部１２０、入力ベクトル生成部１３０、出力ベクトル生成部１４０、学習処理部１５０、確率算出部１６０、特定部１７０、および算出部２１０等として機能させる。

プログラムに記述された情報処理は、コンピュータ１９００に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である取得部１１０、記憶部１２０、入力ベクトル生成部１３０、出力ベクトル生成部１４０、学習処理部１５０、確率算出部１６０、特定部１７０、および算出部２１０等として機能する。そして、この具体的手段によって、本実施形態におけるコンピュータ１９００の使用目的に応じた情報の演算または加工を実現することにより、使用目的に応じた特有の処理装置１００が構築される。

一例として、コンピュータ１９００と外部の装置等との間で通信を行う場合には、ＣＰＵ２０００は、ＲＡＭ２０２０上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス２０３０に対して通信処理を指示する。通信インターフェイス２０３０は、ＣＰＵ２０００の制御を受けて、ＲＡＭ２０２０、ハードディスクドライブ２０４０、フレキシブルディスク２０９０、またはＤＶＤ−ＲＯＭ２０９５等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス２０３０は、ＤＭＡ（ダイレクト・メモリ・アクセス）方式により記憶装置との間で送受信データを転送してもよく、これに代えて、ＣＰＵ２０００が転送元の記憶装置または通信インターフェイス２０３０からデータを読み出し、転送先の通信インターフェイス２０３０または記憶装置へとデータを書き込むことにより送受信データを転送してもよい。

また、ＣＰＵ２０００は、ハードディスクドライブ２０４０、ＤＶＤドライブ２０６０（ＤＶＤ−ＲＯＭ２０９５）、フレキシブルディスク・ドライブ２０５０（フレキシブルディスク２０９０）等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をＤＭＡ転送等によりＲＡＭ２０２０へと読み込ませ、ＲＡＭ２０２０上のデータに対して各種の処理を行う。そして、ＣＰＵ２０００は、処理を終えたデータを、ＤＭＡ転送等により外部記憶装置へと書き戻す。このような処理において、ＲＡＭ２０２０は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはＲＡＭ２０２０および外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、ＣＰＵ２０００は、ＲＡＭ２０２０の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはＲＡＭ２０２０の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもＲＡＭ２０２０、メモリ、および／または記憶装置に含まれるものとする。

また、ＣＰＵ２０００は、ＲＡＭ２０２０から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、ＲＡＭ２０２０へと書き戻す。例えば、ＣＰＵ２０００は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすかどうかを判断し、条件が成立した場合（または不成立であった場合）に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。

また、ＣＰＵ２０００は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第１属性の属性値に対し第２属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、ＣＰＵ２０００は、記憶装置に格納されている複数のエントリの中から第１属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第２属性の属性値を読み出すことにより、所定の条件を満たす第１属性に対応付けられた第２属性の属性値を得ることができる。

以上に示したプログラムまたはモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク２０９０、ＤＶＤ−ＲＯＭ２０９５の他に、ＤＶＤ、Ｂｌｕ−ｒａｙ（登録商標）、またはＣＤ等の光学記録媒体、ＭＯ等の光磁気記録媒体、テープ媒体、ＩＣカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークまたはインターネットに接続されたサーバシステムに設けたハードディスクまたはＲＡＭ等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ１９００に提供してもよい。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

１０選択モデル、１２入力層、１４出力層、１６中間層、１００処理装置、１１０取得部、１１２指定入力部、１１４選択部、１２０記憶部、１３０入力ベクトル生成部、１４０出力ベクトル生成部、１５０学習処理部、１６０確率算出部、１７０特定部、２１０算出部、１９００コンピュータ、２０００ＣＰＵ、２０１０ＲＯＭ、２０２０ＲＡＭ、２０３０通信インターフェイス、２０４０ハードディスクドライブ、２０５０フレキシブルディスク・ドライブ、２０６０ＤＶＤドライブ、２０７０入出力チップ、２０７５グラフィック・コントローラ、２０８０表示装置、２０８２ホスト・コントローラ、２０８４入出力コントローラ、２０９０フレキシブルディスク、２０９５ＤＶＤ−ＲＯＭ

Claims

複数の入力ノードを含む入力層、複数の出力ノードを含む出力層、および複数の中間ノードを含む中間層を備える予測モデルを処理する処理装置であって、
前記入力層と前記中間層との間の各ノード間に設定された各第１ウェイト値と、前記中間層と前記出力層との間の各ノード間に設定された各第２ウェイト値とを記憶するパラメータ記憶部と、
前記複数の入力ノードに対する複数の入力値を取得する取得部と、
入力値が閾値以下である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値の影響を低減させた前記予測モデルを用いて、複数の入力値に対応する前記複数の出力ノードからの複数の出力値を算出する算出部と、
を備える処理装置。
前記算出部は、入力値が閾値より大きい入力ノードに対応する出力ノードと、中間ノードとの間に設定された第２ウェイト値の大きさを変えずに、入力値が閾値より大きい前記入力ノードに対応しない出力ノードと、中間ノードとの間に設定された第２ウェイト値の大きさを低減させる請求項１に記載の処理装置。
前記算出部は、入力値が閾値より大きい前記入力ノードに対応しない出力ノードと、中間ノードとの間に設定された第２ウェイト値の大きさを０にする請求項２に記載の処理装置。
前記算出部は、複数の入力値に対応する前記複数の出力ノードからの複数の出力値の算出において、入力値が０の入力ノードに対応する出力ノードの出力値を０とする請求項３に記載の処理装置。
前記取得部は、前記複数の入力値と前記複数の入力値に対応して前記複数の出力ノードに出力すべき複数の出力値とを含む学習データを取得し、
当該処理装置は、学習用の前記複数の入力値および前記複数の出力値に基づいて、前記予測モデルを学習する学習処理部を備え、
前記学習処理部は、学習用の入力値が０である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値を０として前記予測モデルを学習する
請求項３または４に記載の処理装置。
前記予測モデルは、与えられた選択肢に対する対象の選択行動をモデル化した選択モデルであり、
複数種類の選択肢のそれぞれが入力選択肢に含まれるか否かを示す入力ベクトルを生成する入力ベクトル生成部と、
前記複数種類の選択肢のそれぞれが学習用の出力選択肢に含まれるか否かを示す出力ベクトルを生成する出力ベクトル生成部と、
を備える請求項５に記載の処理装置。
前記学習処理部は、対象の認知バイアスに応じた選択行動を含む前記予測モデルを学習する請求項６に記載の処理装置。
前記学習処理部は、入力選択肢に含まれる選択肢同士の選択確率の比が入力選択肢に含まれる他の選択肢の組合せに応じて異なりうる前記予測モデルを学習する請求項７に記載の処理装置。
前記予測モデルは、前記入力層、前記中間層、および前記出力層に含まれる各ノードに対して入力バイアス、中間バイアス、および出力バイアスが更に設定されるモデルであり、
前記学習処理部は、各第１ウェイト値と、各第２ウェイト値、各入力バイアス、各中間バイアス、および各出力バイアスを学習する請求項８に記載の処理装置。
入力選択肢に応じてそれぞれの選択肢が選択される確率を、各第１ウェイト値、各第２ウェイト値、各入力バイアス、各中間バイアス、および各出力バイアスを含むパラメータに基づき算出する確率算出部を更に備える請求項９に記載の処理装置。
前記学習処理部は、学習用の選択行動のそれぞれについて、入力選択肢に応じて出力選択肢が選択される確率を高めるように、前記パラメータを更新する請求項１０に記載の処理装置。
前記予測モデルは、与えられた選択肢に対する対象の選択行動をモデル化した選択モデルであって、前記対象はユーザであり、前記選択肢は前記ユーザに与えられる商品またはサービスの選択肢であり、
前記取得部は、前記ユーザに与えられた商品またはサービスの選択肢に対して前記ユーザが選択した選択肢を学習用の選択行動として含む前記学習データを取得し、
前記学習処理部は、商品またはサービスの選択肢に応じた前記ユーザの選択行動をモデル化した前記予測モデルを学習する
請求項５から１１のいずれか一項に記載の処理装置。
複数種類の商品またはサービスのうち、販売を促進する商品またはサービスの指定を入力する指定入力部と、
前記複数種類の商品またはサービスに対応する前記複数種類の選択肢の中から、販売を促進する商品またはサービスを選択肢として含む複数の入力選択肢を選択する選択部と、
前記複数の入力選択肢のうち、販売を促進する商品またはサービスに応じた選択肢が選択される確率がより高くなる入力選択肢を特定する特定部と、
を備える請求項１２に記載の処理装置。
前記予測モデルは、与えられた選択肢に対する対象の選択行動をモデル化した選択モデルであって、前記対象はユーザであり、前記選択肢はウェブサイト上で前記ユーザに提示される請求項５から１３のいずれか一項に記載の処理装置。
複数の入力ノードを含む入力層、複数の出力ノードを含む出力層、および複数の中間ノードを含む中間層を備える予測モデルを処理する処理方法であって、
前記入力層と前記中間層との間の各ノード間に設定された各第１ウェイト値と、前記中間層と前記出力層との間の各ノード間に設定された各第２ウェイト値とを記憶するパラメータ記憶段階と、
前記複数の入力ノードに対する複数の入力値を取得する取得段階と、
入力値が閾値以下である入力ノードに対応する出力ノードと中間ノードとの間に設定された第２ウェイト値の影響を低減させた前記予測モデルを用いて、複数の入力値に対応する前記複数の出力ノードからの複数の出力値を算出する算出段階と、
を備える処理方法。
コンピュータに、請求項１から１４のいずれか一項に記載の処理装置として機能させるプログラム。