JP2013164752A - 商品選択条件抽出装置、方法、及びプログラム - Google Patents

商品選択条件抽出装置、方法、及びプログラム Download PDF

Info

Publication number
JP2013164752A
JP2013164752A JP2012027810A JP2012027810A JP2013164752A JP 2013164752 A JP2013164752 A JP 2013164752A JP 2012027810 A JP2012027810 A JP 2012027810A JP 2012027810 A JP2012027810 A JP 2012027810A JP 2013164752 A JP2013164752 A JP 2013164752A
Authority
JP
Japan
Prior art keywords
product
word
selection condition
product selection
viewer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012027810A
Other languages
English (en)
Other versions
JP5642724B2 (ja
Inventor
Kenji Ezaki
健司 江崎
Masashi Uchiyama
匡 内山
Noriko Takaya
典子 高屋
Yusuke Ichikawa
裕介 市川
Shoichi Nagano
翔一 長野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012027810A priority Critical patent/JP5642724B2/ja
Publication of JP2013164752A publication Critical patent/JP2013164752A/ja
Application granted granted Critical
Publication of JP5642724B2 publication Critical patent/JP5642724B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】短期的な商品選択条件及び長期的な商品選択条件を考慮して精度よく商品選択条件を抽出することができるようにする。
【解決手段】短期的商品選択条件スコア算出部21によって、セッション毎に、閲覧者及び閲覧商品の組み合わせでの単語に関する短期的な商品選択条件スコアを算出する。商品選択条件スコア算出部23によって、閲覧者及び閲覧商品の組み合わせでの単語に関する長期的な商品選択条件スコアを算出し、短期的な商品選択条件スコア及び長期的な商品選択条件スコアに基づいて、閲覧者及び閲覧商品の組み合わせでの単語に関する商品選択条件スコアを算出する。商品選択条件スコアに基づいて、閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出する。
【選択図】図1

Description

本発明は、商品選択条件抽出装置、方法、及びプログラムに係り、特に、商品閲覧ログから、閲覧者の商品選択条件を抽出する商品選択条件抽出装置、方法、及びプログラムに関する。
近年、実店舗に加えてECサイトでも出店する企業が増えてきている。そのためECサイトの市場規模は増大し、ECサイトでの売り上げを向上することが重要である。ECサイトでの売り上げを向上するためには、顧客のニーズにあった商品を仕入れることが重要になるため、顧客のニーズを推定する事が必要である。
そのために顧客の多くや重要顧客が商品を選択した条件を顧客のニーズと推定し、条件にあった商品を仕入れることで売り上げの向上の実現が期待される。
また、暗黙的な選好による個人化のために、閲覧情報に基づくユーザプロファイルを作成することが知られている(非特許文献1)。
Marti A.Hearst、"情報検索のためのユーザインタフェース"、共立出版、P 239〜243、2011年
ここで、閲覧される商品が選択された条件を商品選択条件とする。
商品選択条件を抽出方法として、同一セッションにおける商品の記述の多くに出現する語を商品選択条件とする方法と、過去に閲覧された商品の記述の多くに出現する語を商品選択条件とする方法が考えられる。それぞれの方法を組み合わせることで、閲覧者が明確な目的をもって商品を閲覧している場合と、明確な目的はなく連続して閲覧した商品に共通性はないがそれぞれの商品は閲覧者の嗜好によって閲覧している場合との両方を考慮する事ができる。
しかしながら、セッションにおける商品の記述の多くに出現する語を商品選択条件とする方法では、閲覧したサイト中の多くの商品記述に出現する語であるサイト特有語や、過去に閲覧した商品の多くにのみ出現した語を、商品選択条件として抽出してしまう、という問題がある。過去に閲覧した商品の多くに出現しているが、最近閲覧した商品に出現しない語は、既に閲覧者にとって重要な条件ではなくなっていると考えられるからである。
本発明は上記事情に鑑みてなされたものであり、短期的な商品選択条件及び長期的な商品選択条件を考慮して精度よく商品選択条件を抽出することができる商品選択条件抽出装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の商品選択条件抽出装置は、サイトの閲覧者毎に各商品についての商品選択条件を抽出する商品選択条件抽出装置であって、入力された、セッション毎の、閲覧者、閲覧時刻、少なくとも1つの閲覧商品、及び各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、前記セッション毎に、前記閲覧者及び前記閲覧商品の組み合わせの各々における、前記閲覧商品の単語群の各単語ついて、前記セッションの類似する閲覧商品の各々の記述に含まれる単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する短期的な商品選択条件スコアを算出する短期的商品選択条件スコア算出手段と、前記入力された前記セッション毎のセッション情報に基づいて、前記閲覧者、前記閲覧商品、及び前記単語の組み合わせの各々について、前記閲覧者のセッションにおける前記単語の出現頻度が高く、かつ、前記単語を含む前記閲覧商品を最後に閲覧した前記閲覧者のセッションの閲覧時刻からの経過時間が短いほど、前記単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する長期的な商品選択条件スコアを算出すると共に、前記閲覧者、閲覧商品、及び単語の組み合わせに対する前記短期的な商品選択条件スコア及び前記長期的な商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせでの前記単語に関する商品選択条件スコアを算出する商品選択条件スコア算出手段と、前記閲覧者及び閲覧商品の組み合わせでの各単語に関する前記商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出する商品選択条件抽出手段と、を含んで構成されている。
また、本発明の商品選択条件抽出方法は、短期的商品選択条件スコア算出手段、商品選択条件スコア算出手段、及び商品選択条件抽出手段を含み、サイトの閲覧者毎に各商品についての商品選択条件を抽出する商品選択条件抽出装置における商品選択条件抽出方法であって、前記商品選択条件抽出装置は、短期的商品選択条件スコア算出手段によって、入力された、セッション毎の、閲覧者、閲覧時刻、少なくとも1つの閲覧商品、及び各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、前記セッション毎に、前記閲覧者及び前記閲覧商品の組み合わせの各々における、前記閲覧商品の単語群の各単語ついて、前記セッションの類似する閲覧商品の各々の記述に含まれる単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する短期的な商品選択条件スコアを算出するステップと、商品選択条件スコア算出手段によって、前記入力された前記セッション毎のセッション情報に基づいて、前記閲覧者、前記閲覧商品、及び前記単語の組み合わせの各々について、前記閲覧者のセッションにおける前記単語の出現頻度が高く、かつ、前記単語を含む前記閲覧商品を最後に閲覧した前記閲覧者のセッションの閲覧時刻からの経過時間が短いほど、前記単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する長期的な商品選択条件スコアを算出すると共に、前記閲覧者、閲覧商品、及び単語の組み合わせに対する前記短期的な商品選択条件スコア及び前記長期的な商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせでの前記単語に関する商品選択条件スコアを算出するステップと、商品選択条件抽出手段によって、前記閲覧者及び商品の組み合わせでの各単語に関する前記商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出するステップと、を含んで実行することを特徴とする。
また、本発明のプログラムは、サイトの閲覧者毎に各商品についての商品選択条件を抽出するためのプログラムであって、コンピュータを、入力された、セッション毎の、閲覧者、閲覧時刻、少なくとも1つの閲覧商品、及び各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、前記セッション毎に、前記閲覧者及び前記閲覧商品の組み合わせの各々における、前記閲覧商品の単語群の各単語ついて、前記セッションの類似する閲覧商品の各々の記述に含まれる単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する短期的な商品選択条件スコアを算出する短期的商品選択条件スコア算出手段、前記入力された前記セッション毎のセッション情報に基づいて、前記閲覧者、前記閲覧商品、及び前記単語の組み合わせの各々について、前記閲覧者のセッションにおける前記単語の出現頻度が高く、かつ、前記単語を含む前記閲覧商品を最後に閲覧した前記閲覧者のセッションの閲覧時刻からの経過時間が短いほど、前記単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する長期的な商品選択条件スコアを算出すると共に、前記閲覧者、閲覧商品、及び単語の組み合わせに対する前記短期的な商品選択条件スコア及び前記長期的な商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせでの前記単語に関する商品選択条件スコアを算出する商品選択条件スコア算出手段、及び前記閲覧者及び閲覧商品の組み合わせでの各単語に関する前記商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出する商品選択条件抽出手段として機能させるためのプログラムである。
本発明によれば、短期的商品選択条件スコア算出手段によって、入力された、セッション毎の、閲覧者、閲覧時刻、少なくとも1つの閲覧商品、及び各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、前記セッション毎に、前記閲覧者及び前記閲覧商品の組み合わせの各々における、前記閲覧商品の単語群の各単語ついて、前記セッションの類似する閲覧商品の各々の記述に含まれる単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する短期的な商品選択条件スコアを算出する。そして、商品選択条件スコア算出手段によって、前記入力された前記セッション毎のセッション情報に基づいて、前記閲覧者、前記閲覧商品、及び前記単語の組み合わせの各々について、前記閲覧者のセッションにおける前記単語の出現頻度が高く、かつ、前記単語を含む前記閲覧商品を最後に閲覧した前記閲覧者のセッションの閲覧時刻からの経過時間が短いほど、前記単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する長期的な商品選択条件スコアを算出すると共に、前記閲覧者、閲覧商品、及び単語の組み合わせに対する前記短期的な商品選択条件スコア及び前記長期的な商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせでの前記単語に関する商品選択条件スコアを算出する。
そして、商品選択条件抽出手段によって、前記閲覧者及び商品の組み合わせでの各単語に関する前記商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出する。
このように、短期的に閲覧した閲覧商品に共通する単語に高い短期的商品選択条件スコアを与え、短期的に閲覧した閲覧商品に共通する商品選択条件ではないが閲覧者の嗜好によって、長期的に閲覧した閲覧商品に共通する単語に高い長期的商品選択条件スコアを与えることによって、短期的な商品選択条件及び長期的な商品選択条件を考慮して精度よく商品選択条件を抽出することができる。
以上説明したように、本発明の商品選択条件抽出装置、方法、及びプログラムによれば、短期的に閲覧した閲覧商品に共通する単語に高い短期的商品選択条件スコアを与え、短期的に閲覧した閲覧商品に共通する商品選択条件ではないが閲覧者の嗜好によって、長期的に閲覧した閲覧商品に共通する単語に高い長期的商品選択条件スコアを与えることによって、短期的な商品選択条件及び長期的な商品選択条件を考慮して精度よく商品選択条件を抽出することができる、という効果が得られる。
本発明の実施の形態の商品選択条件抽出装置の機能的構成を示すブロック図である。 セッション群入力バッファの内容を示す図である。 単語群保存バッファの内容を示す図である。 短期的商品選択条件スコアを説明するための図である。 短期的商品選択条件群入力バッファの内容を示す図である。 頻度保存バッファの内容を示す図である。 長期的パラメータ群保存バッファ及び長期的商品選択条件群入力バッファの内容を示す図である。 長期的商品選択条件スコアを説明するための図である。 商品選択条件保存バッファの内容を示す図である。 本発明の実施の形態の商品選択条件抽出装置における商品選択条件抽出処理ルーチンの内容を示すフローチャートである。 本発明の実施の形態の商品選択条件抽出装置における短期的商品選択条件スコアを算出する処理の流れを示すフローチャートである。 本発明の実施の形態の商品選択条件抽出装置における長期的パラメータを算出する処理の流れを示すフローチャートである。 本発明の実施の形態の商品選択条件抽出装置における商品選択条件スコアを算出する処理の流れを示すフローチャートである。 従来技術を説明するための図である。 従来技術を説明するための図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の概要>
まず、図14に、従来手法での商品選択条件の抽出の課題を示す概要を示す。同一セッションにおける閲覧商品の記述の多くに出現する語を商品選択条件とする方法をTFで示す。この場合、「東京」といった閲覧したサイト中の多くの商品記述に出現する語であるサイト特有語や、他カテゴリに出現する「ファー」といった語に高いスコアを算出してしまう。
また、過去に閲覧した商品の多くに出現している語を商品選択条件とする場合、過去に閲覧した商品の多くに出現しているが最近閲覧した商品には出現しない語を商品選択条件として抽出してしまう。
また、図15に従来手法での商品選択条件の抽出の課題を示す概要を示す。
上記図15にあるA、B、C、D、Eの順に高いスコアを算出することが長期的商品選択条件の目的とする。
上記図15の画像は全てベージュを商品記述に含む商品で、横軸が時間軸とし、過去どの時点で閲覧したかを表している。
AとBは現在まで継続してベージュを含む商品を閲覧している。さらにBよりもAの方がベージュを含む商品を閲覧する間隔が短い。よってAの閲覧行動の方がより、ベージュに対する嗜好が強いと考える。
また、C、D、Eは過去にベージュを含む商品を閲覧していたが、最近はベージュを含む商品の閲覧頻度が少ない。Eでは最近は閲覧しておらず、CとDでは最近一回だけ閲覧している。
この場合、Eでは既にベージュに対する嗜好が失われていると考えられる。またDも過去にベージュを含む商品を多く閲覧していたにも関わらず最近一回見ただけでは嗜好が失われていないかどうか判断できない。このため、EよりもD、DよりもCの方が、ベージュに対する嗜好が強いといえる。
このように、過去に閲覧した商品の多くに出現している語を商品選択条件とした場合、A、D、C、E、Bの順に高いスコアを算出してしまう。
さらに、商品選択条件スコアを算出したい語を含む商品が出現してから、当該語を含む商品が出現するまでの経過時間によって減衰項を商品中での語の出現頻度にかけて総和を取る方法でも、A、B、D、C、Eの順に高いスコアを算出してしまう。これは過去にベージュを含む商品が多く出現していた場合、正しい算出ができないからである。
本発明では、商品選択条件について、短期的商品選択条件と長期的商品選択条件ごとにスコアを算出しそれらを結合して商品選択条件らしさを算出する。スコアが高いほど商品選択条件らしいとし、出力は、スコアの降順にランキングされた商品選択条件(単語)である。
短期的商品選択条件スコアの算出では、連続して閲覧した商品のうち、類似した商品ほど高い重みで、当該商品に出現した語の出現頻度の総和を取ることで、東京といった閲覧したサイト中の多くの商品記述に出現する語であるサイト特有語や、他カテゴリに出現するファーといった語に低いスコアを算出する。
また、長期的商品選択条件スコアの算出では、過去に閲覧した商品から、各語が出現する頻度と、語を含む商品が出現する間隔を推定し、嗜好が失われているかを考慮する。
これによって、上記図15に示した各閲覧行動にたいして、A、B、C、D、Eの順に高いスコアを算出することができる。
<システム構成>
本発明の実施の形態に係る商品選択条件抽出装置100は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する商品選択条件抽出処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、セッション群入力部10、商品選択条件抽出部20、及び商品選択条件出力部30を含んだ構成で表すことができる。
セッション群入力部10では、少なくとも1つのECサイトで得られたセッション毎のセッション情報の入力を受け付ける。ここで、セッションとは、同一の閲覧者が同一サイトにおいて連続して閲覧した閲覧ページのログを表す。セッション情報は、図2に示すように、予め規定されたセッションとしてのIDであるセッションIDと、どのユーザが閲覧したかというユーザIDと、セッションを閲覧した時刻である閲覧時刻(例えば、セッション中の中心時刻)と、セッション中で閲覧した閲覧商品のカテゴリと、閲覧商品の記述で出現した単語の集合である単語群及び単語の出現頻度とを含み、閲覧商品のカテゴリと単語群と各単語の出現頻度とを、閲覧商品のカテゴリ毎に有している。
商品選択条件抽出部20は、短期的商品選択条件スコア算出部21、長期的商品選択条件スコア算出部22、及び商品選択条件スコア算出部23を備えている。なお、長期的商品選択条件スコア算出部22及び商品選択条件スコア算出部23は、商品選択条件スコア算出手段の一例である。商品選択条件スコア算出部23は、商品選択条件抽出手段の一例である。
短期的商品選択条件スコア算出部21は、セッション群入力バッファ211と単語群保存バッファ212と短期的商品選択条件群入力バッファ213とを備えている。
セッション群入力バッファ211には、セッション群入力部10により入力された、上記図2に示すセッション毎のセッション情報が格納される。
短期的商品選択条件スコア算出部21は、以下に説明するように、セッション毎に、ユーザ、閲覧商品のカテゴリ、及び単語の組み合わせの各々に対して、短期的商品選択条件スコアを算出する。
まず、セッション群入力バッファ211からセッション情報を一つ取り出し、図3に示すように、取り出したセッション情報に含まれる単語群を単語群保存バッファ212に書き込む。単語群保存バッファ212に格納された単語毎に、以下の(1)式に従って、当該セッションのユーザu及び閲覧商品iにおける当該単語wの短期的商品選択条件スコアScoreshort(w,i,u)を算出する。
ここで、iは閲覧商品、wは単語、uはユーザ、Dismaxは最大カテゴリ距離を表す定数である。また、Discate(i,i-i’)は閲覧商品iとそれ以前に閲覧した閲覧商品i-i’のカテゴリ距離である。tf(w,i)は閲覧商品iの記述に含まれる単語wの出現頻度であり、INは、当該セッションにおいて閲覧商品i以前に出現した閲覧商品の集合である。当該Discate(i,j)は類似するカテゴリほど小さい値を持つものとする。
上記(1)式により、図4に示すように、セッションにおける閲覧商品毎に、類似カテゴリほど大きい重みを用いて、当該閲覧商品の記述中での単語の出現頻度を重み付けして、当該単語の短期的商品選択条件スコアを算出する。
なお、短期的商品選択条件スコアScoreshort(w,i,u)を算出するための式は、上記(1)式に限定されるものではなく、連続して閲覧された商品の記述に含まれる同一の単語の短期的商品選択条件スコアに高いスコアを算出するという性質を有する式であればよい。
ユーザID、閲覧商品のカテゴリ、及び単語の各組み合わせについて算出した短期的商品選択条件スコアを、図5に示すように、セッション毎に、短期的商品選択条件群入力バッファ213に格納する。
以上のように、短期的商品選択条件スコア算出部21は、入力された、セッション毎の、ユーザID、閲覧時刻、少なくとも1つの閲覧商品、各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、セッション毎に、ユーザID及び閲覧商品の組み合わせの各々における、閲覧商品の単語群の各単語ついて、閲覧商品と当該セッションにおける各閲覧商品との類似度、及び当該セッションにおける各閲覧商品の当該単語の出現頻度とに基づいて、ユーザID及び閲覧商品の組み合わせでの当該単語に関する短期的商品選択条件スコアを算出する。
長期的商品選択条件スコア算出部22は、セッション群入力バッファ221と頻度保存バッファ222と長期的パラメータ群保存バッファ223とを備えている。
セッション群入力バッファ221には、セッション群入力部10により入力された、上記図2に示すセッション毎のセッション情報が格納される。
長期的商品選択条件スコア算出部22は、以下に説明するように、セッション毎に、ユーザ及び単語の組み合わせの各々に対して、長期的パラメータを算出する。
セッション群入力バッファ221からセッション情報を一つ取り出し、取り出したセッション情報の単語群に含まれる各単語w1について、単語w1を含むセッションの閲覧開始時刻、最終閲覧時刻、及び閲覧頻度を算出する。閲覧開始時刻は、当該ユーザのセッションのうち、単語w1を含む閲覧商品を最初に閲覧したセッションの閲覧時刻である。また、最終閲覧時刻は、当該ユーザのセッションのうち、単語w1を含む閲覧商品を最後に閲覧したセッションの閲覧時刻である。閲覧頻度は、当該ユーザのセッションにおける、単語w1を含む閲覧商品の数である。図6に示すように、ユーザID毎に、各単語w1についての閲覧開始時刻、最終閲覧時刻、及び閲覧頻度が、頻度保存バッファ222に格納される。
また、頻度保存バッファ222の内容に基づいて、セッション毎に、各ユーザについて、各単語に対する長期的パラメータを、以下の(2)式を最大化するように最尤推定によって算出する。
ここで、λとμは推定するべき長期的パラメータである。また、Γは正規化項、xは当該単語を含む閲覧商品の閲覧頻度、Tは閲覧開始時刻から現在までの経過時刻、zは当該単語に対する嗜好が離脱しているかどうかを考慮する0又は1をとるパラメータである。yは離脱したと仮定する場合の離脱時刻である。なお、z、yには、仮定した値が与えられる。
セッション毎に、当該セッションのユーザについて算出された各単語に対する長期的パラメータλ、μが、図7に示すように、長期的パラメータ群保存バッファ223に格納される。
以上のように、長期的商品選択条件スコア算出部22は、入力されたセッション毎のセッション情報に基づいて、セッション毎に、当該セッションの各閲覧商品の単語群に含まれる各単語について、単語の出現頻度の分布を表わす分布パラメータ、及び単語に対する嗜好が離脱している離脱率の分布を表わす分布パラメータを、当該セッションのユーザ及び単語の組み合わせに対する長期的パラメータとして算出する。
商品選択条件スコア算出部23は、短期的商品選択条件群入力バッファ231と長期的商品選択条件群入力バッファ232と単語群保存バッファ233と商品選択条件保存バッファ234とを備えている。
短期的商品選択条件群入力バッファ231には、短期的商品選択条件群入力バッファ213に格納された同じ内容が格納される。長期的商品選択条件群入力バッファ232には、長期的パラメータ群保存バッファ223に格納された同じ内容が格納される。
商品選択条件スコア算出部23は、以下に説明するように、ユーザ及び閲覧商品の組み合わせの各々に対して、各単語の商品選択条件スコアを算出する。
まず、短期的商品選択条件群入力バッファ231から1つのセッションに対する情報を取り出し、当該セッションに含まれる単語群を単語群保存バッファ212に格納する。単語群保存バッファ212から1つの単語w1を取り出し、当該セッションのユーザと取り出した単語w1との組み合わせに対する長期的パラメータλ、μを長期的商品選択条件群入力バッファ232から取得する。短期的商品選択条件群入力バッファ231から得られる、当該セッションのユーザと閲覧商品のカテゴリと単語w1との組み合わせに対する短期的商品選択条件スコアと、取得した当該セッションのユーザと単語w1との組み合わせに対する長期的パラメータとに基づいて、以下の(3)式に従って、当該セッションのユーザuについて、閲覧商品のカテゴリiと単語w1との組み合わせについて商品選択条件スコアを算出する。
ただし、αは予め定められた重み係数であり、Scoreshortは、当該セッションのユーザと閲覧商品のカテゴリと単語w1との組み合わせに対する短期的商品選択条件スコアであり、Scorelongは、当該セッションのユーザと閲覧商品のカテゴリと単語w1との組み合わせに対する長期的商品選択条件スコアである。
ここで、ユーザu、閲覧商品のカテゴリi、及び単語wの組み合わせに対する長期的商品選択条件スコアは、以下の(4)式にしたがって算出される。
ここでλ(w,u)とμ(w,u)は、ユーザu及び単語wの組み合わせに対する長期的パラメータである。ΔT(w,i)は、ユーザuのセッションのうち、単語wを含んだ閲覧商品のカテゴリiを閲覧し、かつ、最後に出現したセッションの閲覧時刻から現在までの経過時間である。
上記(4)式により、図8に示すように、出現頻度の分布パラメータλ(w,u)が大きいほど、離脱率の分布パラメータμ(w,u)が小さいほど、高い長期的商品選択条件スコアが算出される。また、離脱率の分布パラメータμ(w,u)と、経過時間ΔT(i)との積が大きいほど、高い長期的商品選択条件スコアが算出される。
なお、長期的商品選択条件スコアを算出する式は、上記(4)式に限定されるものではなく、対象のユーザ及び閲覧商品の組み合わせについて、過去に当該ユーザが閲覧した閲覧商品の記述において出現頻度が高い単語であって、かつ、現在まで継続して当該ユーザが閲覧した当該閲覧商品の記述に出現している単語に関する長期的商品選択条件に高いスコアを算出するという性質を有する式であればよい。
セッション毎に、当該セッションのユーザについて算出された閲覧商品のカテゴリ及び単語の組み合わせの各々に対する商品選択条件スコアが、図9に示すように、商品選択条件保存バッファ234に格納される。
以上のように、商品選択条件スコア算出部23は、ユーザ、閲覧商品のカテゴリ、及び単語の組み合わせの各々について、算出した当該単語の出現頻度の分布パラメータ、当該単語の離脱率の分布パラメータ、及び当該単語を含む閲覧商品を当該ユーザが最後に閲覧してからの経過時間に基づいて、当該ユーザ及び当該閲覧商品のカテゴリの組み合わせでの当該単語に関する長期的商品選択条件スコアを算出すると共に、当該ユーザ、当該閲覧商品のカテゴリ、及び当該単語の組み合わせに対する短期的商品選択条件スコア及び長期的商品選択条件スコアに基づいて、当該ユーザ及び当該閲覧商品の組み合わせでの当該単語に関する商品選択条件スコアを算出する。
また、商品選択条件スコア算出部23は、セッション毎に、閲覧商品の各々について、商品選択条件保存バッファ234の単語群を、商品選択条件スコアが高い順に降順ソートし、スコアが高い上位N語を、当該セッションのユーザにおける当該閲覧商品に関する商品選択条件として商品選択条件出力部30により出力する。
<商品選択条件抽出装置の作用>
本実施の形態の商品選択条件抽出装置100に、セッション毎のセッション情報が入力されると、商品選択条件抽出装置100によって、セッション群入力バッファ211、221に格納される。そして、商品選択条件抽出装置100において、図10に示す、商品選択条件抽出処理ルーチンが実行される。
まず、ステップS011で、短期的商品選択条件スコア算出部21によって、短期的商品選択条件スコアを算出する。ステップS012では、長期的商品選択条件スコア算出部22によって、長期的パラメータを算出する。そして、ステップS013において、商品選択条件スコア算出部23によって、商品選択条件スコアを算出し、商品選択条件抽出処理ルーチンを終了する。
上記ステップS011は、図11に示す短期的商品選択条件スコア算出処理ルーチンによって実現される。
ステップS211において、セッション群入力バッファ211から、1つのセッション情報を取り出し、ステップS212において、上記ステップS211で取り出したセッション情報に含まれる単語群を単語群保存バッファ212に書き込む。
次のステップS213では、単語群保存バッファ212から単語を一つ取り出し、取り出した単語の短期的商品選択条件スコアを上記(1)式にしたがって算出する。そして、
算出した短期的商品選択条件スコアを短期的商品選択条件群入力バッファ213に書き込む。
そして、ステップS214において、単語群保存バッファ212が空になったか否かを判定し、単語群保存バッファ212が空でない場合には、上記ステップS213に戻り処理を継続する。一方、単語群保存バッファ212が空である場合には、ステップS215へ進む。
ステップS215では、セッション群入力バッファ211が空になったか否かを判定し、セッション群入力バッファ211が空でない場合には、上記ステップS211に戻り処理を継続する。一方、セッション群入力バッファ211が空である場合には、短期的商品選択条件スコア算出処理ルーチンを終了する。
上記ステップS012は、図12に示す長期的商品選択条件スコア算出処理ルーチンによって実現される。
ステップS311において、セッション群入力バッファ221から、1つのセッション情報を取り出し、ステップS312において、上記ステップS311で取り出したセッション情報に含まれる全ての単語w1の各々に対して、閲覧開始時刻、最終閲覧時刻、及び閲覧頻度を算出して、頻度保存バッファ222に書き込む。
そして、ステップS313において、頻度保存バッファ222の各単語について、上記(2)式に従って、長期的パラメータを最尤推定によって算出し、算出した長期的パラメータを長期的パラメータ群保存バッファ223に書き込む。
そして、ステップS314において、頻度保存バッファ222が空になったか否かを判定し、頻度保存バッファ222が空でない場合には、上記ステップS313に戻り処理を継続する。一方、頻度保存バッファ222が空である場合には、ステップS315へ進む。
ステップS315では、セッション群入力バッファ221が空になったか否かを判定し、セッション群入力バッファ221が空でない場合には、上記ステップS311に戻り処理を継続する。一方、セッション群入力バッファ221が空である場合には、長期的パラメータ算出処理ルーチンを終了する。
上記ステップS013は、図13に示す商品選択条件スコア算出処理ルーチンによって実現される。
ステップS411において、短期的商品選択条件群入力バッファ231から、1つのセッションに関する情報を取り出し、取り出したセッションに関する情報に含まれる単語群を単語群保存バッファ233に書き込む。
そして、ステップS412において、単語群保存バッファ233から、単語w1を1つ取り出し、上記ステップS411で取り出したセッションに関する情報に含まれるユーザ、及び取り出した単語w1に対応する長期的パラメータを、長期的商品選択条件群入力バッファ232から取得する。
次のステップS413では、上記ステップS413で取得した単語w1に対する長期的パラメータに基づいて、上記(4)式に従って、長期的商品選択条件スコアを算出し、算出した長期的商品選択条件スコアと、上記ステップS411で取り出したセッションに関する情報に含まれる単語w1に対する短期的商品選択条件スコアとに基づいて、上記(3)式に従って、商品選択条件スコアを算出する。算出した商品選択条件スコアを、商品選択条件保存バッファ234に書き込む。
そして、ステップS414において、単語群保存バッファ233が空であるか否かを判定する。単語群保存バッファ233が空でないならば、S412に戻り処理を継続する。一方、単語群保存バッファ233が空であるならば、ステップS415へ進む。
ステップS415では、商品選択条件保存バッファ234に格納されている単語群を、商品選択条件スコアが高い順に降順ソートし、スコアが高い上位N語を、当該ユーザ及び閲覧商品のカテゴリに対する商品選択条件として商品選択条件出力部30により出力する。
そして、ステップS416において、短期的商品選択条件群入力バッファ231が空であるか否かを判定し、短期的商品選択条件群入力バッファ231が空でないならば、上記ステップS411に戻り処理を継続する。一方、短期的商品選択条件群入力バッファ231が空であるならば、商品選択条件スコア算出処理ルーチンを終了する。
以上説明したように、本発明の実施の形態に係る商品選択条件抽出装置によれば、短期的に閲覧した閲覧商品に共通する単語に高い短期的商品選択条件スコアを与え、短期的に閲覧した閲覧商品に共通する商品選択条件ではないが閲覧者の嗜好によって、長期的に閲覧した閲覧商品に共通する単語に高い長期的商品選択条件スコアを与えることによって、短期的な商品選択条件及び長期的な商品選択条件を考慮して精度よく商品選択条件を抽出することができる。
また、連続して閲覧された商品に共通していない商品選択条件である場合でも、短期的商品選択条件スコアと長期的商品選択条件スコアとを算出する方法を用いることによって商品選択条件を抽出することが可能になる。また、長期的商品選択条件スコアについて、過去に閲覧した商品の多くに出現しているが最近閲覧した商品には出現しない語には低いスコアを、最近まで継続して閲覧した商品の多くに出現している語に高いスコアを与えることができる。これによって、短期的に閲覧した商品に共通する商品選択条件を抽出すると共に、短期的に閲覧した商品に共通する商品選択条件ではないが閲覧者の嗜好によって、長期的に閲覧した商品に共通する商品選択条件を抽出することができる。
本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述の商品選択条件抽出装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 セッション群入力部
20 商品選択条件抽出部
21 短期的商品選択条件スコア算出部
22 長期的商品選択条件スコア算出部
23 商品選択条件スコア算出部
30 商品選択条件出力部
100 商品選択条件抽出装置

Claims (3)

  1. サイトの閲覧者毎に各商品についての商品選択条件を抽出する商品選択条件抽出装置であって、
    入力された、セッション毎の、閲覧者、閲覧時刻、少なくとも1つの閲覧商品、及び各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、前記セッション毎に、前記閲覧者及び前記閲覧商品の組み合わせの各々における、前記閲覧商品の単語群の各単語ついて、前記セッションの類似する閲覧商品の各々の記述に含まれる単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する短期的な商品選択条件スコアを算出する短期的商品選択条件スコア算出手段と、
    前記入力された前記セッション毎のセッション情報に基づいて、前記閲覧者、前記閲覧商品、及び前記単語の組み合わせの各々について、前記閲覧者のセッションにおける前記単語の出現頻度が高く、かつ、前記単語を含む前記閲覧商品を最後に閲覧した前記閲覧者のセッションの閲覧時刻からの経過時間が短いほど、前記単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する長期的な商品選択条件スコアを算出すると共に、前記閲覧者、閲覧商品、及び単語の組み合わせに対する前記短期的な商品選択条件スコア及び前記長期的な商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせでの前記単語に関する商品選択条件スコアを算出する商品選択条件スコア算出手段と、
    前記閲覧者及び閲覧商品の組み合わせでの各単語に関する前記商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出する商品選択条件抽出手段と、
    を含む商品選択条件抽出装置。
  2. 短期的商品選択条件スコア算出手段、商品選択条件スコア算出手段、及び商品選択条件抽出手段を含み、サイトの閲覧者毎に各商品についての商品選択条件を抽出する商品選択条件抽出装置における商品選択条件抽出方法であって、
    前記商品選択条件抽出装置は、
    短期的商品選択条件スコア算出手段によって、入力された、セッション毎の、閲覧者、閲覧時刻、少なくとも1つの閲覧商品、及び各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、前記セッション毎に、前記閲覧者及び前記閲覧商品の組み合わせの各々における、前記閲覧商品の単語群の各単語ついて、前記セッションの類似する閲覧商品の各々の記述に含まれる単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する短期的な商品選択条件スコアを算出するステップと、
    商品選択条件スコア算出手段によって、前記入力された前記セッション毎のセッション情報に基づいて、前記閲覧者、前記閲覧商品、及び前記単語の組み合わせの各々について、前記閲覧者のセッションにおける前記単語の出現頻度が高く、かつ、前記単語を含む前記閲覧商品を最後に閲覧した前記閲覧者のセッションの閲覧時刻からの経過時間が短いほど、前記単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する長期的な商品選択条件スコアを算出すると共に、前記閲覧者、閲覧商品、及び単語の組み合わせに対する前記短期的な商品選択条件スコア及び前記長期的な商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせでの前記単語に関する商品選択条件スコアを算出するステップと、
    商品選択条件抽出手段によって、前記閲覧者及び商品の組み合わせでの各単語に関する前記商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出するステップと、
    を含んで実行することを特徴とする商品選択条件抽出方法。
  3. サイトの閲覧者毎に各商品についての商品選択条件を抽出するためのプログラムであって、
    コンピュータを、
    入力された、セッション毎の、閲覧者、閲覧時刻、少なくとも1つの閲覧商品、及び各閲覧商品の記述に含まれる単語群を含むセッション情報に基づいて、前記セッション毎に、前記閲覧者及び前記閲覧商品の組み合わせの各々における、前記閲覧商品の単語群の各単語ついて、前記セッションの類似する閲覧商品の各々の記述に含まれる単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する短期的な商品選択条件スコアを算出する短期的商品選択条件スコア算出手段、
    前記入力された前記セッション毎のセッション情報に基づいて、前記閲覧者、前記閲覧商品、及び前記単語の組み合わせの各々について、前記閲覧者のセッションにおける前記単語の出現頻度が高く、かつ、前記単語を含む前記閲覧商品を最後に閲覧した前記閲覧者のセッションの閲覧時刻からの経過時間が短いほど、前記単語に関するスコアが高くなるように、前記閲覧者及び前記閲覧商品の組み合わせでの前記単語に関する長期的な商品選択条件スコアを算出すると共に、前記閲覧者、閲覧商品、及び単語の組み合わせに対する前記短期的な商品選択条件スコア及び前記長期的な商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせでの前記単語に関する商品選択条件スコアを算出する商品選択条件スコア算出手段、及び
    前記閲覧者及び閲覧商品の組み合わせでの各単語に関する前記商品選択条件スコアに基づいて、前記閲覧者及び閲覧商品の組み合わせに対する商品選択条件としての単語を抽出する商品選択条件抽出手段
    として機能させるためのプログラム。
JP2012027810A 2012-02-10 2012-02-10 商品選択条件抽出装置、方法、及びプログラム Expired - Fee Related JP5642724B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012027810A JP5642724B2 (ja) 2012-02-10 2012-02-10 商品選択条件抽出装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012027810A JP5642724B2 (ja) 2012-02-10 2012-02-10 商品選択条件抽出装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013164752A true JP2013164752A (ja) 2013-08-22
JP5642724B2 JP5642724B2 (ja) 2014-12-17

Family

ID=49176059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012027810A Expired - Fee Related JP5642724B2 (ja) 2012-02-10 2012-02-10 商品選択条件抽出装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5642724B2 (ja)

Also Published As

Publication number Publication date
JP5642724B2 (ja) 2014-12-17

Similar Documents

Publication Publication Date Title
Ding et al. Learning user real-time intent for optimal dynamic web page transformation
CN107145536B (zh) 用户画像构建方法与装置及推荐方法与装置
KR101511050B1 (ko) 상품 정보를 제공하고 표시하는 방법, 장치, 시스템 및 컴퓨터 프로그램
US10402401B2 (en) Search based on diversity
US10671619B2 (en) Information processing system and information processing method
CN103744866A (zh) 一种搜索方法与装置
US20160063596A1 (en) Automatically generating reading recommendations based on linguistic difficulty
TWI433042B (zh) Multi - product recommendation method and system
JPWO2017158798A1 (ja) 情報処理装置、情報配信システム、情報処理方法、および情報処理プログラム
CN110428295A (zh) 商品推荐方法和系统
US20170206581A1 (en) Product vector for product recommendation
US20160034483A1 (en) Method and system for discovering related books based on book content
US20220382794A1 (en) System and method for programmatic generation of attribute descriptors
US20160350264A1 (en) Server and method for extracting content for commodity
JP2019164706A (ja) 情報処理装置、情報処理方法、およびプログラム
WO2019046329A1 (en) SEARCH METHOD AND APPARATUS
CN107093122B (zh) 对象分类方法及装置
CN117788109A (zh) 一种基于大语言模型生成商品标签的方法及电子设备
Pfeiffer et al. Classification of goal-directed search and exploratory search using mobile eye-tracking
KR20200140588A (ko) 이미지 기반 제품 매매 서비스 제공 시스템 및 방법
Nurmi et al. Promotionrank: Ranking and recommending grocery product promotions using personal shopping lists
CN112711706A (zh) 信息交互方法、装置、可读存储介质和电子设备
JP2016177690A (ja) サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム
Czerniawski Beauty beyond a size 16
JP2016009426A (ja) トレンド分析装置、及びトレンド分析方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141029

R150 Certificate of patent or registration of utility model

Ref document number: 5642724

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees