JP2013093015A - 情報推薦方法、装置及びプログラム - Google Patents

情報推薦方法、装置及びプログラム Download PDF

Info

Publication number
JP2013093015A
JP2013093015A JP2012196469A JP2012196469A JP2013093015A JP 2013093015 A JP2013093015 A JP 2013093015A JP 2012196469 A JP2012196469 A JP 2012196469A JP 2012196469 A JP2012196469 A JP 2012196469A JP 2013093015 A JP2013093015 A JP 2013093015A
Authority
JP
Japan
Prior art keywords
information
browsing
chunk
spot
stay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012196469A
Other languages
English (en)
Other versions
JP5732441B2 (ja
Inventor
Masanari Fujita
将成 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012196469A priority Critical patent/JP5732441B2/ja
Publication of JP2013093015A publication Critical patent/JP2013093015A/ja
Application granted granted Critical
Publication of JP5732441B2 publication Critical patent/JP5732441B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ユーザの閲覧履歴実績が少ない状況下でも、ユーザによる条件の手入力に頼ることなくより高精度な情報推薦を可能にする。
【解決手段】飲食店のWebサイトに対する詳細な閲覧履歴データをもとに、閲覧時刻の近さに応じた詳細閲覧のまとまりを閲覧チャンクとして抽出すると共に、GPS移動履歴データをもとに、ユーザが一定時間に一定の範囲内に留まっている場合にその滞在地情報の集合をユーザの行動範囲のまとまりを表す滞在チャンクとして抽出する。そして、これらのチャンクを参照飲食店集合からの標本と捉え、閲覧チャンクにおける無作為抽出との乖離確率pij、及び滞在チャンクにおける無作為抽出との乖離確率pikをそれぞれ計算し、これらの乖離確率を統合して飲食店のタグに対するユーザの嗜好スコアを計算し、この嗜好スコアを用いてユーザに対する飲食店の推薦リストを作成し配信する。
【選択図】図1

Description

この発明は、ユーザの嗜好や状況等に合わせた情報を推薦する情報推薦方法、装置及びプログラムに関する。
近年、ユーザの嗜好や状況等に応じた情報を推薦するサービスが種々提案されている。例えば、ユーザが設定した嗜好情報等の検索条件とユーザの現在位置の情報から周辺の飲食店の情報を選択し、ユーザに提示する飲食店ガイドサービスが提供されている。しかし、ユーザが適切な情報を取得するために、ユーザ自身が設定した嗜好情報等の検索条件を手入力することは、インターネット上の情報が大量で詳細になるにつれ、ユーザに過大な負担を強いるだけでなく、潜在的な嗜好を反映できない問題がある。
また、モバイルインターネットの普及によりスマートホン等の携帯端末を使用した情報検索が増加しているが、携帯端末は画面に一度に表示できる情報量が少なく、また検索条件の入力に手間がかかることから、ユーザの嗜好を考慮して適切な情報を推薦する技術のニーズはますます高まっている。
そこで、ユーザのインターネット閲覧履歴等を分析することで適切な情報推薦を行う技術が種々研究されている。しかし、従来の技術ではユーザ履歴が一位量以上蓄積されるまで推薦精度が向上しない、いわゆるCold-startという問題が発生する。この問題により、ユーザのサービス利用初期に適切な推薦が行えず満足度が上がらないことから、継続利用されないため履歴の蓄積が進まない。この結果、推薦精度の向上が長期化しサービス普及が進まない。
一方、閲覧履歴や検索履歴をもとにした情報推薦技術は一般にメモリベース法と呼ばれ、協調フィルタリングとコンテンツベースフィルタリングに大別される。この2つの方法のうち、アイテムにカテゴリ等を示すタグを付与することができる場合には、コンテンツベースフィルタリングがCold-start問題に強いといわれている。このため、履歴の蓄積状況等に応じてこの2つの技術を切り替えるか又は合成する方法が研究されている(例えば非特許文献1を参照)。
R. Burke, "Hybrid recommender systems: surveyand, experiments, user-modeling and user-adapted inter-actions," User Modeling and User-Adapted Interaction, Vol. 12, No. 4, pp.331-370, 2002.
ところが、非特許文献1に記載された飲食店推薦システムには以下のような改善すべき課題がある。すなわち、このシステムは、最初の段階では価格帯やグルメジャンル等の希望条件をユーザが手入力し、コンテンツベースフィルタリングを用いて候補となるレストランを選び出す。そして、協調フィルタリングによって候補の順位付けをするものとなっている。このため、一定の推薦精度を早い段階で実現できる。しかしながら、候補の絞り込みのための飲食店の希望条件をユーザ手入力に依存している。このため、候補が多い場合の推薦精度を向上させるには、順位付けのため履歴の蓄積が必要となる。すなわち、この方法は多くの候補が存在するわりに履歴の蓄積が少ない、飲食店等の情報を推薦する場合には十分な効果が期待できない。
この発明は上記事情に着目してなされたもので、その目的とするところは、ユーザの閲覧履歴実績が少ない状況下でも、ユーザによる条件の手入力に頼ることなくより高精度な情報推薦を可能にした情報推薦方法、装置及びプログラムを提供することにある。
上記目的を達成するためにこの発明の第1の観点は、コンピュータにより、地理的に散在する複数のスポットに対するユーザの興味を分析してその分析結果をもとに当該ユーザに対し推薦するスポットの情報を作成する情報推薦方法、装置及びプログラムにあって、
上記コンピュータが、上記複数のスポットに関する情報をそれぞれ掲示する閲覧サイトに対する上記ユーザの閲覧履歴を表す情報を取得して第1の記憶媒体に格納すると共に、上記ユーザの地理的な移動履歴を表す情報を取得して第2の記憶媒体に格納する。また、上記コンピュータが、上記第1の記憶媒体に記憶された閲覧履歴情報をもとに、当該閲覧履歴情報に含まれる複数のスポット閲覧情報を閲覧時間の近さを条件にクラスタ化して閲覧チャンクを生成すると共に、上記第2の記憶媒体に記憶された移動履歴情報、又はユーザが事前に入力した情報や無線基地局との接続情報をもとにユーザが訪問可能な参照エリアを決定して、予め記憶されたスポット情報の中から上記決定された参照エリアに含まれるスポット情報の集合を参照スポット集合として抽出する。そして、上記生成された閲覧チャンクに含まれるスポット閲覧情報の数aと、上記閲覧チャンクに含まれるスポット閲覧情報群のうち所定の概念を有するスポット閲覧情報の数nと、上記参照スポット集合に含まれるスポット情報の数Sと、上記参照スポット集合に含まれるスポット情報群のうち上記概念が付与されたスポット情報の数Nをもとに、上記閲覧チャンクに上記概念が出現するスポット閲覧情報の数が、上記n以上となる第1の確率及びn未満となる第2の確率をそれぞれ算出し、この算出された第1及び第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアzを算出し、上記閲覧チャンクごとに算出された特徴スコアzを用いて、上記概念に対する上記ユーザの興味の度合いを表す興味スコアを計算することを特徴とするものである。
また、この発明の第1の観点は以下のような態様を備えることを特徴とする。
第1の態様は、上記コンピュータが、上記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける機能をさらに備え、上記生成された滞在チャンクに含まれるスポット情報の数を上記aとすると共に、上記滞在チャンクに含まれるスポット情報群のうち所定の概念を有するスポット情報の数を上記nとして、上記特徴スコアzを算出するものである。
第2の態様は、上記コンピュータが、上記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける機能をさらに備え、上記閲覧チャンクに出現するスポット閲覧情報の数を上記Nとすると共に、上記閲覧チャンクの閲覧時刻から予め設定した一定時間内に存在する滞在チャンク群を共起チャンクとしてこの共起チャンク内の滞在チャンクに対し上記距離の近さを条件にして関連付けられたスポット群の数を上記aとし、上記一定時間内の滞在チャンクに関連付けられたスポット群の中で、上記閲覧チャンクに出現したスポットの数をnとして、上記特徴スコアzを算出するものである。
第3の態様は、上記コンピュータが、上記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける機能をさらに備え、上記参照スポット集合に含まれるスポット情報の数Sとし、閲覧チャンク内のスポット情報数をaとしたうえで、上記閲覧チャンクの閲覧時刻から予め設定した一定時間内に存在する滞在チャンク群に出現するスポット情報の数をNとし、上記閲覧チャンクに出現するスポット情報において、一定時間内に滞在開始時刻を持つ滞在チャンクに出現するスポット情報と共起するスポット情報群を共起チャンクとし、当該共起チャンク内のスポットの数をnとして上記特徴スコアzを算出するものである。
第4の態様は、上記コンピュータが、上記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける機能をさらに備え、上記参照スポット集合に含まれるスポット情報の数Sとし、閲覧チャンク内のスポット情報数をaとしたうえで、上記滞在チャンクの滞在開始時刻から予め設定した一定時間内を閲覧時刻とする閲覧チャンク群に出現するスポット情報の数をNとし、上記滞在チャンクに出現するスポット情報群において、一定時間内の閲覧チャンクに出現するスポット情報と共起するスポット情報群を共起チャンクとして、共起チャンク内のスポットの数をnとして上記特徴スコアzを算出するものである。
第5の態様は、上記閲覧チャンク、滞在チャンクまたは共起チャンクについて、ユーザの操作履歴、各チャンクの時刻及び状況、及び上記スポットと上記概念との関連度の少なくとも1つに応じて上記特徴スコアzを重み付けするものである。
第6の態様は、上記第1の確率及び上記第2の確率を超幾何分布、二項分布または正規分布により算出するものである。
第7の態様は、1つ以上の概念が出現するスポット情報について、当該スポット情報に出現する各概念の上記興味スコアを用いて、当該スポット情報に対するユーザの評価スコアを算出する機能をさらに備えたものである。
第8の態様は、上記スポット情報と各概念との関連度及び各概念の重要度の少なくとも1つに応じて上記興味スコアを重み付けするようにしたものである。
すなわちこの発明によれば、ユーザの閲覧履歴実績が少ない状況下でも、ユーザによる条件の手入力に頼ることなくより高精度な情報推薦を可能にした情報推薦方法、装置及びプログラムを提供することができる。
この発明の第1の実施形態に係る情報推薦装置を備えたシステムの全体構成を示す図。 図1に示した情報推薦装置における嗜好学習処理部の機能構成を示すブロック図。 図1に示した情報推薦装置における飲食店推薦処理部の機能構成を示すブロック図。 図1に示した情報推薦装置による全体の処理手順と処理内容を示すフローチャート。 図4に示した全体処理のうち嗜好学習処理の処理手順と処理内容を示すフローチャート。 図4に示した全体処理のうち飲食店推薦処理の処理手順と処理内容を示すフローチャート。 図5に示した嗜好学習処理において閲覧チャンク及び滞在チャンクを抽出する処理を説明するための図。 図5に示した嗜好学習処理において参照飲食店集合に対する閲覧チャンク及び滞在チャンクの乖離確率を算出する処理を説明するための図。 図5に示した嗜好学習処理において、共起チャンクを抽出する処理と、参照飲食店集合に対する共起チャンクの乖離確率を算出する処理を説明するための図。 図1に示した情報推薦装置による推薦精度の評価結果を示す図。
以下、図面を参照してこの発明に係わる実施形態を説明する。
(第1の実施形態)
[構成]
図1はこの発明の第1の実施形態に係るシステムの概略構成図であり、ユーザそれぞれ所持するユーザ端末UT1〜UTnを通信ネットワークNWを介して情報推薦装置としての機能を有する情報サーバSVに接続可能としたものである。
通信ネットワークNWは、インターネットと、このインターネットにアクセスするためのアクセス網とから構成される。アクセス網としては、携帯電話網やホットスポット(登録商標)、WiMAX(登録商標)、無線LAN等の移動通信網が用いられる。
ユーザ端末UT1〜UTnは、例えば携帯電話機やスマートホン、PDA(Personal Digital Assistant)、タブレット型端末、ノート型のパーソナル・コンピュータ等の携帯端末からなり、GPS(Global Positioning System)を利用して自端末の位置を計測する機能と、Webサイトにアクセスするためのブラウザ機能と、電子メールを送受信するメーラ機能を備えている。
情報サーバSVは例えばWebサーバからなり、図示しない通信インタフェースユニットと、制御ユニット1と、記憶ユニット2を備えている。
通信インタフェースユニットは、上記通信ネットワークNWを介してユーザ端末UT1〜UTnとの間で情報通信を行うもので、通信プロトコルとしては例えばTCP/IP(Transmission Control Protocol/Internet Protocol)が用いられる。
記憶ユニット2は、記憶媒体としてHDDやNAND型フラッシュメモリ等の随時書込み読出しが可能な不揮発性メモリを使用したもので、この実施形態を実施するために必要な記憶機能として、GPS移動履歴記憶部21と、詳細閲覧履歴記憶部22と、嗜好データベース23と、飲食店データベース24と、推薦リスト記憶部25を備えている。
GPS移動履歴記憶部21は、ユーザ端末UT1〜UTnから定期的に収集されるユーザのGPS移動履歴データを蓄積するために用いられる。このGPS移動履歴データは、ユーザの滞在地を表す測位データの集合からなり、各測位データは測位時刻と測位座標とからなる。
詳細閲覧履歴記憶部22は、ユーザ端末UT1〜UTnから送信された飲食店のURL(Uniform Resource Locator)に対する閲覧履歴を表すデータの集合を蓄積するために用いられる。各閲覧履歴データは、閲覧時刻と店IDとで表される。
嗜好データベース(Preference DB)23は、後述する嗜好学習処理部13により計算された嗜好データを記憶するために用いられる。各嗜好データは、タグと嗜好スコアにより構成される。
飲食店データベース24には、システムのサービスエリアに存在する飲食店を表す情報が予め記憶されている。この飲食店を表す情報は、「店ID」と、店の概要を表す「概要」と、メニューや価格帯等を表す「詳細」、店のWebサイトへのリンク情報である「URL」と、移動・経度により表される店の「住所座標」と、「タグ」により構成される。「タグ」は、飲食店のグルメジャンルや駐車場の有無等の属性情報を示す。
推薦リスト記憶部25は、後述する飲食店推薦処理部14により算出された飲食店の推薦リストを保存するために用いられる。推薦リスト(Recommend List)は、推薦候補となる飲食店データの集合を嗜好スコア順にソートしたもので、推薦順位、店ID、概要、詳細及びURLにより構成される。
制御ユニット1は、中央処理ユニット(Central Processing Unit:CPU)を備えたもので、この実施形態を実施するために必要な制御機能として、GPS移動履歴収集部11と、詳細閲覧履歴収集部12と、嗜好学習処理部13と、飲食店推薦処理部14を備えている。
GPS移動履歴収集部11は、定期的にユーザ端末UT1〜UTnから当該ユーザ端末UT1〜UTnにおいて計測されたGPS移動履歴データを通信ネットワークNWを介してそれぞれ収集し、収集したGPS移動履歴データをGPS移動履歴記憶部21に記憶させる機能を有する。
詳細閲覧履歴収集部12は、飲食店のURLに対するユーザ端末UT1〜UTnのアクセス履歴、つまり詳細閲覧履歴データを、当該ユーザ端末UT1〜UTnから通信ネットワークNWを介してそれぞれ収集する。そして、この収集した閲覧履歴データをGPS移動履歴記憶部21に記憶させる機能を有する。
嗜好学習処理部13は、上記GPS移動履歴記憶部21に蓄積されたユーザのGPS移動履歴データと、上記詳細閲覧履歴記憶部22に蓄積されている詳細閲覧履歴データと、上記飲食店データベース24に記憶された飲食店データに基づいて、各飲食店に対するユーザの嗜好スコアを算出し、この算出された嗜好スコアを嗜好データベース23に記憶させる機能を有するもので、具体的には以下のように構成される。図2はその機能構成を示すブロック図である。
すなわち嗜好学習処理部13は、参照飲食店集合作成部131と、詳細閲覧履歴分析部132と、GPS移動履歴分析部133と、飲食店共起分析部134と、嗜好スコア計算部135を備えている。
参照飲食店集合作成部131は、ユーザごとに、上記GPS移動履歴記憶部21に蓄積されたGPS移動履歴データをもとに当該ユーザの行動範囲を分析し、この行動範囲内に存在する飲食店を飲食店データベース24から抽出して参照飲食店集合を作成する機能を有する。
詳細閲覧履歴分析部132は、ユーザごとに、上記詳細閲覧履歴記憶部22に蓄積された詳細閲覧履歴データに出現する各店に関して、当該各店が保持するタグの合計数について、上記参照飲食店集合作成部131により作成された参照飲食店集合から無作為抽出した場合との乖離確率を算出する機能を有する。なお、後述するGPS移動履歴との統合を考慮した乖離確率の計算のために、上記詳細閲覧履歴から閲覧時刻の近さをもとに詳細閲覧のまとまりを抽出する。このまとまりを閲覧チャンクと呼ぶ。
GPS移動履歴分析部133は、上記ユーザごとに、上記GPS移動履歴記憶部21に蓄積されたGPS移動履歴データをもとに、ユーザが一定時間、一定の範囲内に留まるGPS移動履歴を抽出する。この抽出されたGPS移動履歴を滞在チャンクと呼称する。そして、この抽出した滞在チャンクにおける訪問可能性飲食店を、参照飲食店集合からの標本と考え、タグの滞在チャンクにおける無作為抽出との乖離確率を算出する機能を有する。
飲食店共起分析部134は、詳細閲覧後にユーザが実際に飲食店に訪問した可能性を分析に反映させるため、閲覧チャンクに出現した飲食店と、滞在チャンクで訪問可能性飲食店の共起について、これまでの各履歴への分析と同様に無作為抽出した場合との乖離確率を算出する機能を有する。
嗜好スコア計算部135は、上記詳細閲覧履歴分析部132、GPS移動履歴分析部133及び飲食店共起分析部134によりそれぞれ算出された乖離確率を統合し、これにより各タグに対するユーザの嗜好スコアを算出し、この算出された嗜好スコアを嗜好データベース23に格納する機能を有する。
飲食店推薦処理部14は、ユーザの要求に応じて推薦候補となる飲食店集合を作成し、この候補飲食店集合に含まれる各飲食店についてのスコアを計算して推薦リストを作成し、この推薦リストを要求元のユーザ端末UT1〜UTnへ返送する機能を有するもので、具体的には以下のように構成される。図3はその機能構成を示すブロック図である。
すなわち飲食店推薦処理部14は、候補飲食店集合作成部141と、飲食店スコア計算部142と、推薦リスト作成部143を備えている。
候補飲食店集合作成部141は、ユーザ端末UT1〜UTnから飲食店の推薦を要求するユーザリクエストが送られた場合に、当該ユーザリクエストに含まれる地域とタグにより表される店舗条件に該当する飲食店の集合を飲食店データベース24から検索し、これにより候補飲食店集合を作成する機能を有する。
飲食店スコア計算部142は、上記嗜好データベース23に記憶された、タグに対するユーザの嗜好スコアをもとに、上記候補飲食店集合に含まれる各飲食店のスコアを算出する機能を有する。この飲食店スコアは、上記ユーザの嗜好スコアとの合致度を表す情報となる。
推薦リスト作成部143は、上記算出された各飲食店のスコアをもとに飲食店情報をその降順にソートし、これにより上記ユーザの嗜好スコアとの合致度が高い順に飲食店情報を並べ替えた推薦リストを作成する。そして、この作成された推薦リストを、推薦リスト記憶部25に保存すると共に、通信ネットワークNWを介して要求元のユーザ端末UT1〜UTnへ返送する機能を有する。
なお、以上述べた制御ユニット1の各処理機能は、何れも図示しないプログラムメモリに格納されたアプリケーション・プログラムを上記CPUに実行させることにより実現される。
[動作]
次に、以上のように構成された情報推薦サーバSVによる情報推薦処理の動作を説明する。図4はその全体の処理手順と処理内容を示すフローチャートである。
(1)GPS移動履歴及び閲覧履歴の収集処理
情報推薦サーバSVの制御ユニット1は、ステップS1及びステップ3によりそれぞれGPS移動履歴の収集タイミングと詳細閲覧履歴の収集タイミングを監視している。この状態で、例えば一定の時間間隔に設定されたGPS移動履歴の収集タイミングになると、ステップS2によりGPS移動履歴収集部11を起動し、このGPS移動履歴収集部11の制御の下で、各ユーザ端末UT1〜UTnに対し順次GPS移動履歴の収集要求を送信する。
これに対し各ユーザ端末UT1〜UTnでは、前回の収集タイミングから今回の収集タイミングまでの期間に計測されたGPS測位データの集合が記憶されており、上記収集要求を受信すると各ユーザ端末UT1〜UTnは上記記憶されていたGPS測位データの集合を読み出して情報推薦サーバSVへ送信する。
情報推薦サーバSVの制御ユニット1は、GPS移動履歴収集部11の制御の下で、上記各ユーザ端末UT1〜UTnから送られたGPS測位データの集合を受信し、この受信されたGPS測位データの集合をGPS移動履歴データとしてGPS移動履歴記憶部21に格納する。
一方、詳細閲覧履歴の収集タイミングになると、ステップS4により詳細閲覧履歴収集部12を起動し、この詳細閲覧履歴収集部12の制御の下で、先に述べたGPS移動履歴を収集する場合と同様に、各ユーザ端末UT1〜UTnに対し順次詳細閲覧履歴の収集要求を送信する。
これに対し各ユーザ端末UT1〜UTnでは、前回の収集タイミングから今回の収集タイミングまでの期間にユーザが飲食店の詳細な情報を確認するために閲覧した当該飲食店のURLと閲覧時刻が記憶されている。そして、上記収集要求を受信すると、各ユーザ端末UT1〜UTnは上記記憶されていた飲食店のURLと閲覧時刻とからなる閲覧履歴データを読み出し、情報推薦サーバSVへ送信する。
情報推薦サーバSVの制御ユニット1は、詳細閲覧履歴収集部12の制御の下で、上記各ユーザ端末UT1〜UTnから送られた閲覧履歴データを受信し、この受信された閲覧履歴データを詳細閲覧履歴記憶部22に格納する。
(2)嗜好学習処理(Learning Process)
情報推薦サーバSVの制御ユニット1は、上記GPS移動履歴データ及び詳細閲覧履歴データの収集処理を定期的に実行しながら、ステップS5で嗜好学習タイミングになったか否かを監視している。この状態で予め定められた処理タイミングになると、ステップS6により嗜好学習処理部13を起動し、この嗜好学習処理部13の制御の下で以下のようにユーザの飲食店に対する嗜好を学習する。図5はその処理手順と処理内容を示すフローチャートである。
(2−1)参照飲食店集合の作成
情報推薦サーバSVの制御ユニット1は、先ずステップS61により参照飲食店集合作成部131を起動する。そして、この参照飲食店集合作成部131の制御の下、ステップS611により学習対象のユーザに関するGPS移動履歴データをGPS移動履歴記憶部21から読み出す。次にステップS612において、上記読み出されたGPS移動履歴データをもとにユーザの行動範囲を表す参照エリアを求め、この参照エリア内に存在する飲食店をステップS613により飲食店データベース24から読み出して、参照飲食店集合とする。なお、参照エリアの決定については、ユーザへの行動範囲や居住地、勤務地に対するアンケート、プロフィール情報等による手入力で収集した情報を元に決定することもできる。さらに、GPS移動履歴以外でも、位置情報が事前に把握されている無線基地局への接続履歴、前記無線基地局からの電波強度による位置測位情報等によって決定することもできる。
上記参照飲食店集合を作成する具体的な処理方法としては、以下の方法が考えられる。すなわち、先ずユーザのGPS移動履歴について全測位点の重心を計算し、この重心から各測位点の95%が含まれる距離を計算する。95%とする理由は、旅行等による移動による外れ値を考慮するためである。次に、この距離の定数倍を半径として上記計算された重心を中心とする円エリアを描き、この円エリアを参照エリアとしてこの参照エリア内に存在する飲食店を飲食店データベース24から読み出す。
(2−2)詳細閲覧履歴の分析
制御ユニット1は、次にステップS62により詳細閲覧履歴分析部132を起動する。そして、この詳細閲覧履歴分析部132の制御の下、先ずステップS621により詳細閲覧履歴記憶部22から学習対象ユーザの詳細閲覧履歴データを読出し、この詳細閲覧履歴から閲覧時刻の近さをもとに詳細閲覧のまとまりを抽出する。このまとまりを閲覧チャンクと呼ぶ。具体的には、あるユーザの詳細閲覧履歴が多数ある場合に、各履歴の前後一定時間(例えば30分)以内に別の履歴がある場合には、これらの履歴を同じ閲覧チャンクとしてまとめる。この処理を時系列的に順次行うことで、詳細閲覧履歴データから閲覧チャンク群を抽出する。図7(a)はその抽出結果の一例を示すもので、この例では閲覧チャンク1、閲覧チャンク2、閲覧チャンク3が抽出された場合を示している。
なお、一般にユーザ情報閲覧は、一定の時間帯に集中して行われる。このとき、一連の情報閲覧の中で各詳細閲覧店を選択する際には、他の詳細閲覧店との関係も存在すると考えられる。このため、閲覧チャンク化して分析を行うことは、推薦精度の向上させる上で有効である。
次にステップS622において、詳細閲覧履歴データに出現する各店に関して、当該各店が保持するタグの合計数について、上記参照飲食店集合作成部131により作成された参照飲食店集合から無作為抽出した場合との乖離確率を算出する。
例えば、上記抽出された各閲覧チャンクを参照飲食店集合からの標本と捉え、タグiの閲覧チャンクjにおける無作為抽出との乖離確率pijを、
Figure 2013093015
とする。
なお、rは参照飲食店集合内の飲食店数、di は参照飲食店集合内のタグiが付与された飲食店数である。また、vj は閲覧チャンクj内における出現飲食店数、nijは閲覧チャンクj内でタグiが付与されている飲食店数である。これらのr、di 、nijは飲食店データベース24から読み出して算出する。
(2−3)GPS移動履歴の分析
制御ユニット1は、次にステップS63においてGPS移動履歴分析部133を起動し、このGPS移動履歴分析部133の制御の下、以下のようにGPS移動履歴の分析処理を実行する。
すなわち、先ずステップS631により、ユーザごとに、上記GPS移動履歴記憶部21に蓄積されたGPS移動履歴データをもとに、ユーザが一定時間、一定の範囲内に留まるGPS移動履歴を抽出し、これを滞在チャンクとする。図7(b)はその抽出結果の一例を示すもので、この例では滞在チャンク1と滞在チャンク2が抽出された場合を示している。
この滞在チャンクの抽出には、GPS測位点にしばしば現れる外れ値や測位結果の変動を一定程度排除するためにDBSCAN法を用いる方法がある。他に、一定期間、一定範囲、一定数のGPS測位点が存在する場合を滞在チャンクとして取り出す方法もある。DBSCAN法は、分析対象店群について距離の閾値Epsと、近接対象店数の閾値MinPtsという2つのパラメータで決定される、接続関係(Directly Density Reachable)で連結される群を求める方法である。但し、ここでは接続関係の探索を時系列に限定し、連結が抽出できた場合には、始点と終了点との間の時間間隔を計算し、一定時間を超えた群を滞在チャンクとする。その際、初めの時刻を滞在開始時刻、終わりの時刻を滞在終了時刻とする。
続いてステップS632において、上記抽出された滞在チャンクに属するGPS測位点の重心を中心点とし、一定距離内に存在する飲食店を飲食店データベース24から抽出する。この抽出された飲食店を滞在チャンクにおける「訪問可能性飲食店」とする。なお、一定距離のパラメータは、使用するGPS機器の測位精度や履歴の特徴等により決定される。
次にステップS633において、上記抽出した滞在チャンクにおける訪問可能性飲食店を参照飲食店集合からの標本と考え、タグの滞在チャンクにおける無作為抽出との乖離確率pikを以下のように算出する。
すなわち、タグiの滞在チャンクをkとしたとき、この滞在チャンクkにおける無作為抽出との乖離確率pikを、
Figure 2013093015
とする。
なお、Sk は滞在チャンクkの訪問可能性飲食店数、nikは滞在チャンクkにおいてタグiが付与されている訪問可能性飲食店数である。
なお、各滞在チャンクについて訪問店は原則1店あると想定し、式(5)では、タグiが訪問可能性飲食店のどれか1つに付与されているものとして、無作為抽出した場合との乖離確率pikを計算する。
次にステップS634において、時刻による飲食行動可能性を計算する。すなわち、より高精度の店舗推薦を行うには、推薦対象の飲食店に訪問している可能性が高い滞在チャンクの影響を強くすることが適切である。各滞在チャンクは、滞在開始時刻と滞在終了時刻の情報を持つため、時刻を考慮した重要度を算出し分析に利用する。
第1の実施形態では、特に飲食店を推薦することを目的とすることから、時間帯別の食事行動率のデータを予め取得し記憶しておき、各滞在チャンクの滞在開始時刻から滞在終了時刻までの期間における食事行動率の平均値を、滞在チャンクkの重要度wk とする。なお、wk の算出には、例えば総務省統計局の社会生活時間調査の値を利用することができる。
図8は、以上のようにして計算された、閲覧チャンクjにおける無作為抽出との乖離確率と、滞在チャンクkにおける無作為抽出との乖離確率pikの概念を示す図である。
(2−4)飲食店共起分析
制御ユニット1は、次にステップS64において飲食店共起分析部134を起動し、この飲食店共起分析部134の制御の下、以下のように詳細訪問後の訪問分析を行う。すなわち、先ずステップS641において、上記詳細履歴分析部132により抽出された閲覧チャンクと、GPS移動履歴分析部133により抽出された滞在チャンクに基づいて、各閲覧チャンクに出現した飲食店が、その閲覧時刻から滞在開始時刻が一定時間以内(例えば24時間)の滞在チャンクにおいて訪問の可能性がある飲食店として出現した場合に、この飲食店を共起飲食店として抽出する。この共起飲食店は、ユーザがWebサイトを詳細に閲覧した飲食店の情報を契機として訪問とした可能性があると推測される。
但し、当該時間内に繁華街等で頻繁に滞留し、多数の飲食店に近接して、偶然共起した可能性を排除する必要がある。このため、各共起飲食店が一定期間内の滞在チャンクで訪問可能性飲食店となったことの珍しさを、無作為抽出からの乖離により以下のように算出する。
すなわち、ステップS642において、閲覧チャンクの閲覧時刻から一定時間内の滞在チャンクの訪問可能性飲食店の全てを、上記参照飲食店集合作成部131により作成された参照飲食店集合からの標本と捉える。そして、タグiの閲覧チャンクjにおける共起飲食店に対する無作為抽出との乖離確率picj を、
Figure 2013093015
として算出する。
なお、vijは閲覧チャンクjにおけるタグiが付与された詳細閲覧店数、oj は閲覧チャンクjの閲覧時刻から一定時間内の全滞在チャンクの訪問可能性飲食店の合計、cijは閲覧チャンクjにおけるタグiが付与された詳細閲覧店で、閲覧時刻から一定時間内の滞在チャンクの訪問可能性飲食店として共起した数である。
図9は、上記共起飲食店の抽出処理及び乖離確率の算出処理の概念を示したものである。
(2−5)嗜好スコアの計算
制御ユニット1は、最後にステップS65において嗜好スコア計算部135を起動し、この嗜好スコア計算部135の制御の下、各タグに対するユーザの嗜好スコアを以下のように計算する。
すなわち、先ずステップS651において、上記詳細閲覧履歴分析部132、GPS移動履歴分析部133及び飲食店共起分析部134によりそれぞれ計算された各乖離確率pij,pik,picj を、
Figure 2013093015
により統合し、各タグiに対するユーザの嗜好スコアzi を算出する。この嗜好スコアzi が大きいほど店舗に対するユーザの嗜好が強いと言える。
なお、φ1(p) は標準正規分布の累積密度関数の逆数である。また、Jは閲覧チャンクの総数、Kは滞在チャンクの総数、wk は滞在チャンクkの重要度である。なお、式(7)はStouffer’s Z-score methodに基づいており、各結合対象の重要度に対して、自然な形で重みを導入し確率を結合できる。すなわち、上記飲食店情報と各概念との関連度及び各概念の重要度の少なくとも1つに応じて上記嗜好スコアzを重み付けする。
(3)飲食店推薦処理(Recommend process)
情報推薦サーバSVの制御ユニット1は、上記GPS移動履歴データ及び詳細閲覧履歴データの収集処理を定期的に実行しながら、ステップS7でユーザからの情報推薦要求(ユーザリクエスト)の到来を監視している。この状態でユーザ端末UT1〜UTnから送信されたユーザリクエストを受信すると、ステップS8により飲食店推薦処理部14を起動し、この飲食店推薦処理部14の制御の下、以下のように飲食店の推薦処理を実行する。図6はその処理手順と処理内容を示すフローチャートである。
(3−1)候補飲食店集合の作成
先ずステップS81において、候補飲食店集合作成部141の制御の下、上記受信されたユーザリクエストに含まれる地域とタグにより表される店舗条件に基づいて、当該条件に該当する飲食店を飲食店データベース24から抽出し、これにより候補飲食店集合(Candidate restaurant set)を作成する。候補飲食店集合は、ユーザリクエストにより指定された条件、例えば地域条件として「X駅から1km以内」に基づいて、飲食店データベース24を検索して作成する。
(3−2)飲食店スコアの計算
次にステップS82において飲食店スコア計算部142を起動し、この飲食店スコア計算部142の制御の下、上記嗜好データベース23に記憶された、タグiに対するユーザの嗜好スコアzi をもとに、上記候補飲食店集合に含まれる各飲食店のスコアRestaurant Score(r)を、
Figure 2013093015
により算出する。
なお、rは候補飲食店集合の要素である飲食店の識別子、Tr は飲食店r2付与されたタグの集合であり、tr はTr に含まれるタグの数を示す。なお、本数式によるRestaurant Scoreによる飲食店のソートは、嗜好スコアzi と各飲食店が持つタグをそれぞれタグiに対する行列と見なした場合の、嗜好スコアzi のノルムを各計算時点で定数と考えたコサイン類似度による結果と同等である。
(3−3)推薦リストの作成と配信
次にステップS83において推薦リスト作成部143を起動し、この推薦リスト作成部143の制御の下で、上記飲食店スコア計算部142により算出された各飲食店のスコアzi をもとに、飲食店情報をスコアzi の降順にソートする(ステップS831)。すなわち、飲食店情報をユーザの嗜好スコアとの合致度が高い順に並べ替える。これによりユーザに適した飲食店の推薦リストが作成される。そして、この作成された推薦リストを、ステップS832により推薦リスト記憶部25に保存すると共に、ステップS833により通信ネットワークNWを介して推薦要求元のユーザ端末UT1〜UTnに向け返送する。
(4)実施形態による推薦方法の評価
この実施形態による推薦方法による推薦精度を、Random Sort、及びCosine Similarityによる推薦精度と比較した。
Random Sortは、候補飲食店集合に含まれる各店舗を無作為にソートする方法である。例えば、「現在地から1km以内」等を条件とした検索で、ユーザによる嗜好や条件入力、他の推薦方法がない場合は、この方法と同じである。このRandom Sortの評価には期待値を利用する。
Cosine Similarityは、メモリベースのコンテンツベースフィルタリングの従来方法として、詳細閲覧履歴に出現した各飲食店にタグが付与されていた場合に、タグ種別ごとに「1」を累計した結果をベクトルとして、評価対象の飲食店に付与されたタグによるベクトルとのコサイン類似度を飲食店スコアとする方法である。
精度評価の指標として、上記各方法による評価対象飲食店110件の推薦順に対して、情報検索分野で多く利用されている順位を考慮した適合指標であるDCG(Discounted Cumulative Gain)を算出した。DCGを採用した理由は、例えばこの発明技術の適用対象として想定される携帯端末(スマートホン等)向けのグルメレコメンドサービスにおいては、端末に一度に表示できる情報量が少ないため、嗜好との合致度順に提示できることが重要だからである。
DCGの算出に必要な入力値g(i) は、評価対象飲食店(110店)に対する被験者アンケート回答の選択肢に対し、「是非行きたい」=7、「行きたい」=6、「まあまあ行きたい」=5、「どちらでもない」=2、「行きたくない」=1のように割り当てた。このうち、「まあまあ行きたい」と、「どちらでもない」の間のDCG入力値g(i) の値の開きは、事前の被験者ヒヤリングにより、飲食店推薦の満足度には「行きたくない」飲食店の推薦を如何に減らすかが重要であることが判明したため、評価の低い飲食店が上位になる場合のDCGの減衰を大きくするためである。また、今回の評価のDCG算出範囲は、同様に被験者ヒヤリングにより得た推薦結果に対する平均的な確認範囲を反映して、上位32位とした。
以上のような条件の下で、本実施形態による推薦方法と、上記Random Sort及びCosine Similarityによる、被験者平均のDCG値と履歴収集期間との関係を求めると、図10に示す結果が得られた。この図10から明らかなように、詳細閲覧履歴とGPS移動履歴との統合分析により推薦精度が向上し、詳細閲覧履歴が少ない状況でも、より高い精度での推薦が可能であることが分かる。
なお、Cosine Similarityについて、各タグiの詳細閲覧履歴における出現しやすさの違いを考慮するために、タグ出現時に加算する値を重み付けし、1/log(Ei)とする方法と、1/Ei とする方法についても確認したが、推薦精度は向上しなかった。Ei は飲食店データベース24におけるタグiが付与された飲食店の総数である。
[第1の実施形態の効果]
以上詳述したように第1の実施形態では、飲食店のWebサイトに対する詳細な閲覧履歴データをもとに、閲覧時刻の近さに応じた詳細閲覧のまとまりを閲覧チャンクとして抽出すると共に、GPS移動履歴データをもとに、ユーザが一定時間に一定の範囲内に留まっている場合にその滞在地情報の集合をユーザの行動範囲のまとまりを表す滞在チャンクとして抽出する。そして、これらのチャンクを参照飲食店集合からの標本と捉え、閲覧チャンクにおける無作為抽出との乖離確率pij、及び滞在チャンクにおける無作為抽出との乖離確率pikをそれぞれ計算し、これらの乖離確率を統合して飲食店のタグに対するユーザの嗜好スコアを計算し、この嗜好スコアを用いてユーザに対する飲食店の推薦リストを作成し配信するようにしている。
すなわち、詳細閲覧履歴に含まれる飲食店と、GPS移動履歴から抽出される近接店とを、ユーザの行動範囲内の飲食店の集合からのユーザによる標本抽出であると見なし、各店に付与されたタグの出現数と、無作為抽出による出現数との乖離を計算して、出現数の乖離が大きいタグはユーザの嗜好と関連していると見なし、推薦に利用するようにしている。
したがって、ユーザによる詳細閲覧履歴とGPS移動履歴とを用いて高精度の情報推薦処理を行うことができる。このため、ユーザの閲覧履歴実績が少ない状況下でも、ユーザによる条件の手入力に頼ることなくより高精度な情報推薦を行うことが可能となる。しかも、上記推薦リストを得る過程において、詳細閲覧履歴及びGPS移動履歴を共通データ化し、共通の指標により分析し統合するようにしているので、詳細閲覧履歴とGPS移動履歴を適切に利用して高精度の推薦リストを作成することができる。
[第2の実施形態]
この発明の第2の実施形態は、飲食店の共起分析において、各閲覧チャンクに出現した飲食店が、その閲覧時刻から滞在開始時刻が一定時間以内の滞在チャンクにおいて訪問の可能性がある飲食店として出現した場合に、この飲食店を共起飲食店として抽出すると共に、各滞在チャンクにおいて訪問の可能性がある飲食店として出現した飲食店が、その滞在開始時刻から閲覧時刻が一定時間以内の閲覧チャンクにおいて出現した場合に、この飲食店を対象としている滞在チャンクにおける共起飲食店として抽出するようにしたものである。
なお、第2の実施形態においても、情報推薦装置の基本的な構成及び処理動作は第1の実施形態と同一なので、図1乃至図5を使用して説明を行う。
(2−4)′飲食店共起分析
制御ユニット1は、ステップS64において飲食店共起分析部134を起動し、この飲食店共起分析部134の制御の下、以下のように訪問分析を行う。すなわち、先ずステップS641において、上記詳細履歴分析部132により抽出された閲覧チャンクと、GPS移動履歴分析部133により抽出された滞在チャンクに基づいて、各閲覧チャンクに出現した飲食店が、その閲覧時刻から滞在開始時刻が一定時間以内(例えば一週間)の滞在チャンクにおいて訪問の可能性がある飲食店として出現した場合に、この飲食店を、対象としている閲覧チャンクにおける共起飲食店として抽出する。
またそれと共に、各滞在チャンクにおいて訪問の可能性があるとして出現した飲食店について、当該飲食店が上記滞在チャンクにおける滞在開始時刻から閲覧時刻が一定時間以内(例えば一週間)の閲覧チャンクにおいて出現した場合に、この飲食店を対象としている滞在チャンクにおける共起飲食店として抽出する。
そして、この共起飲食店を、ユーザがWebサイトを詳細に閲覧した飲食店の情報を契機として訪問した、もしくは訪問を契機としてWebサイトを詳細に閲覧した可能性がある飲食店と推測する。このような飲食店はユーザの嗜好に強く関係すると仮定することができる。
但し、ユーザが一定時間内に繁華街等に頻繁に滞留し、多数の飲食店に近接した場合にも、上記共起飲食店は抽出される。この種の飲食店は、偶然共起した可能性があるものであり、排除する必要がある。
そこで、各共起飲食店が一定期間内の滞在チャンクで訪問可能性飲食店となったことの珍しさを、無作為抽出からの乖離により以下のように算出する。
すなわち、ステップS642において、閲覧チャンクの閲覧時刻から一定時間内の滞在チャンクの訪問可能性飲食店の全てを、上記参照飲食店集合作成部131により作成された参照飲食店集合からの標本と捉える。そして、タグiの閲覧チャンクjにおける共起飲食店による無作為抽出との乖離確率pijco を、
Figure 2013093015
として算出する。
なお、bj は閲覧チャンクjに出現した詳細閲覧店数、rは参照飲食店集合の飲食店数、Sj は閲覧チャンクj の時刻から一定期間内の滞在チャンクを示す識別子の集合である。cijcoは閲覧チャンクj においてタグiが付与された詳細閲覧店であり、閲覧時刻から一定時間内の滞在チャンク(Sj に含まれる滞在チャンク)群の訪問可能性飲食店と共起した数である。
また、同様に滞在チャンクの訪問可能性飲食店について、滞在時刻から一定時間内の閲覧チャンクに出現した飲食店との共起に対して同様の処理を行う。すなわち、タグiの滞在チャンクkにおける共起飲食店による無作為抽出との乖離確率pikcoを、
Figure 2013093015
として算出する。
なお、sk は滞在チャンクk に出現した訪問可能性飲食店数、Bk は滞在チャンクk の時刻から一定期間内の閲覧チャンク群の識別子の集合である。また、cikcoは滞在チャンクk においてタグiが付与された訪問可能性飲食店であり、閲覧時刻から一定時間内の閲覧チャンク(Bk に含まれる閲覧チャンク)の詳細閲覧飲食店と共起した数である。
(2−5)′嗜好スコアの計算
制御ユニット1は、ステップS65において嗜好スコア計算部135を起動し、この嗜好スコア計算部135の制御の下、各タグに対するユーザの嗜好スコアを以下のように計算する。
すなわち、先ずステップS651において、上記詳細閲覧履歴分析部132、GPS移動履歴分析部133及び飲食店共起分析部134によりそれぞれ計算された各乖離確率について、履歴が収集前の初期状態をt=1とし、履歴チャンクの抽出順にtをインクリメントした識別子を与えることとする。このとき、時点tにおいて抽出された滞在チャンクと閲覧履歴チャンクの乖離確率をpit、pitcoとし、タグiに対する嗜好スコアを、
Figure 2013093015
とする。
この嗜好スコアZitが大きいほど、タグiに対するユーザの嗜好が強いと見なせる。なお、φ-1(p) は標準正規分布の累積密度関数の逆数、wt はチャンクtの重要度を示している。また、式(13)はStouffer’s Z-score methodに基づいており、各結合対象の重要度に対して自然な形で重みを導入し確率を結合できる。すなわち、上記飲食店情報と各概念との関連度及び各概念の重要度の少なくとも1つに応じて上記嗜好スコアzを重み付けする。
さらに、この処理は滞在チャンクもしくは閲覧チャンクの追加に伴い逐次更新可能とし、計算リソースを効率化している。具体的には、逐次処理において保持が必要なデータは、各タグのxit,yit、及び現時点から過去の一定時間までの閲覧履歴チャンクと滞在チャンクに出現した店舗ID群のみである。
[第2の実施形態の効果]
以上述べたように第2の実施形態によれば、「店舗情報閲覧後に訪問した近接店舗」、及び「店舗訪問後の店舗情報閲覧」を別にモデルとして分析したので、店舗情報閲覧の前後の近接する店舗への訪問のみをモデルとして分析するようにした第1の実施形態に比べ、さらに詳細な分析を行うことが可能となる。また第1の実施形態では、店舗情報閲覧前の近接する店舗への訪問を分析するために、チャンクの追加毎の逐次更新ができなかったが、分析結果のチャンク追加ごとの逐次更新を可能としたことにより、計算コストやメモリ等のコンピュータリソースを低減することができる。
(その他の実施形態)
なお、この発明は上記各実施形態に限定されるものではない。例えば、前記第1の実施形態では嗜好学習処理部13の飲食店共起分析部134において、飲食店の推薦リストを提供する前の段階では、ユーザが任意に飲食店のWebサイトを閲覧して取得した詳細閲覧情報をもとに、当該ユーザが実際にその飲食店へ訪問した可能性を分析に反映するようにした。しかし、それに限らず飲食店推薦処理部14により作成された推薦リストがユーザに配信され、ユーザがこの推薦リストをもとに飲食店のWebサイトに対しアクセスして取得した詳細閲覧情報を上記飲食店共起分析に反映するようにしてもよい。
また、前記実施形態では推薦対象となるスポットとして飲食店を例にとって説明したが、情報閲覧して実際に訪問するスポットであれば他のスポットでもよい。例えば、週末等の余暇に訪問するスポットが挙げられる。その一例としては、公園、遊園地、動物園、各種シッピング施設、ゲームセンタ、カラオケハウスが考えられる。これらのスポットについて、その評価、属性、設備等をタグとしてデータベースに蓄積し、ユーザによる情報閲覧履歴とGPS移動履歴を分析してユーザの嗜好を学習し、推薦リストを作成することで、ユーザの好みにあったスポットをユーザに提供することが可能となる。その他、宿泊施設や旅行情報の検索、観光地ガイドサービス、不動産情報検索、結構式場検索などへの応用が考えられる。
さらに、前記各乖離確率は、超幾何分布、二項分布または正規分布により算出するようにしてもよい。その他、推薦サーバSVの構成や、GPS移動履歴及び閲覧履歴の収集処理、嗜好学習処理、飲食店推薦処理の処理手順と処理内容等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。
要するにこの発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、各実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
SV…推薦サーバ、UT1〜UTn…ユーザ端末、NW…通信ネットワーク、1…制御ユニット、2…記憶ユニット、11…GPS移動履歴収集部、12…詳細閲覧履歴収集部、13…嗜好学習処理部、14…飲食店推薦処理部、21…GPS移動履歴記憶部、22…詳細閲覧履歴記憶部、23…嗜好データベース、24…飲食店データベース、25…推薦リスト記憶部、131…参照飲食店集合作成部、132…詳細閲覧履歴分析部、133…GPS移動履歴分析部、134…飲食店共起分析部、135…嗜好スコア計算部、141…候補飲食店集合作成部、142…飲食店スコア計算部、143…推薦リスト作成部。

Claims (11)

  1. コンピュータにより、地理的に散在する複数のスポットに対するユーザの興味を分析してその分析結果をもとに当該ユーザに対し推薦するスポットの情報を作成する情報推薦方法であって、
    前記コンピュータが、前記複数のスポットに関する情報をそれぞれ掲示する閲覧サイトに対する前記ユーザの閲覧履歴を表す情報を取得して第1の記憶媒体に格納する第1の過程と、
    前記コンピュータが、前記ユーザの地理的な移動履歴を表す情報を取得して第2の記憶媒体に格納する第2の過程と、
    前記コンピュータが、前記第1の記憶媒体に記憶された閲覧履歴情報をもとに、当該閲覧履歴情報に含まれる複数のスポット閲覧情報を閲覧時間の近さを条件にクラスタ化して閲覧チャンクを生成する第3の過程と、
    前記コンピュータが、前記第2の記憶媒体に記憶された移動履歴情報、またはユーザが事前に入力した情報や無線基地局との接続情報をもとにユーザが訪問可能な参照エリアを決定し、予め記憶されたスポット情報の中から、前記決定された参照エリアに含まれるスポット情報の集合を参照スポット集合として抽出する第4の過程と、
    前記コンピュータが、前記生成された閲覧チャンクに含まれるスポット閲覧情報の数aと、前記閲覧チャンクに含まれるスポット閲覧情報群のうち所定の概念を有するスポット閲覧情報の数nと、前記参照スポット集合に含まれるスポット情報の数Sと、前記参照スポット集合に含まれるスポット情報群のうち前記概念が付与されたスポット情報の数Nをもとに、前記閲覧チャンクに前記概念が出現するスポット閲覧情報の数が、前記n以上となる第1の確率及びn未満となる第2の確率をそれぞれ算出し、この算出された第1及び第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアzを算出する第5の過程と、
    前記コンピュータが、前記閲覧チャンクごとに算出された特徴スコアzを用いて、前記概念に対する前記ユーザの興味の度合いを表す興味スコアを計算する第6の過程と
    を具備することを特徴とする情報推薦方法。
  2. 前記コンピュータが、前記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける過程をさらに具備し、
    前記第5の過程は、前記生成された滞在チャンクに含まれるスポット情報の数を前記aとすると共に、前記滞在チャンクに含まれるスポット情報群のうち所定の概念を有するスポット情報の数を前記nとして、前記特徴スコアzを算出することを特徴とする請求項1記載の情報推薦方法。
  3. 前記コンピュータが、前記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける過程をさらに具備し、
    前記第5の過程は、前記閲覧チャンクに出現するスポット閲覧情報の数を前記Nとすると共に、前記閲覧チャンクの閲覧時刻から予め設定した一定時間内に存在する滞在チャンク群を共起チャンクとしてこの共起チャンク内の滞在チャンクに対し前記距離の近さを条件にして関連付けられたスポット群の数を前記aとし、前記一定時間内の滞在チャンクに関連付けられたスポット群の中で、前記閲覧チャンクに出現したスポットの数をnとして、前記特徴スコアzを算出することを特徴とする請求項1記載の情報推薦方法。
  4. 前記コンピュータが、前記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける過程を、さらに具備し、
    前記第5の過程は、前記参照スポット集合に含まれるスポット情報の数Sとし、閲覧チャンク内のスポット情報数をaとしたうえで、前記閲覧チャンクの閲覧時刻から予め設定した一定時間内に存在する滞在チャンク群に出現するスポット情報の数をNとし、前記閲覧チャンクに出現するスポット情報において、一定時間内に滞在開始時刻を持つ滞在チャンクに出現するスポット情報と共起するスポット情報群を共起チャンクとして、当該共起チャンク内のスポットの数をnとして前記特徴スコアzを算出することを特徴とする請求項1記載の情報推薦方法。
  5. 前記コンピュータが、前記第2の記憶媒体に記憶された移動履歴情報をもとに、当該移動履歴情報に含まれる複数の滞在情報を距離の近さを条件にクラスタ化して滞在チャンクを生成し、この滞在チャンクに対し距離の近さを条件にしてスポット群を関連付ける過程を、さらに具備し、
    前記第5の過程は、前記同様に参照スポット集合に含まれるスポット情報の数Sとし、閲覧チャンク内のスポット情報数をaとしたうえで、前記滞在チャンクの滞在開始時刻から予め設定した一定時間内を閲覧時刻とする閲覧チャンク群に出現するスポット情報の数をNとし、前記滞在チャンクに出現するスポット情報群において、一定時間内の閲覧チャンクに出現するスポット情報と共起するスポット情報群を共起チャンクとして、共起チャンク内のスポットの数をnとして、前記特徴スコアzを算出することを特徴とする請求項1記載の情報推薦方法。
  6. 前記第5の過程は、前記閲覧チャンク、滞在チャンクまたは共起チャンクについて、ユーザの操作履歴、各チャンクの時刻及び状況、及び前記スポットと前記概念との関連度の少なくとも1つに応じて前記特徴スコアzを重み付けすることを特徴とする請求項1乃至5のいずれかに記載の情報推薦方法。
  7. 前記第5の過程は、前記第1の確率及び前記第2の確率を超幾何分布、二項分布または正規分布により算出することを特徴とする請求項1に記載の情報推薦方法。
  8. 1つ以上の概念が出現するスポット情報について、当該スポット情報に出現する各概念の前記興味スコアを用いて、当該スポット情報に対するユーザの評価スコアを算出する第7の過程を、さらに具備することを特徴とする請求項1記載の情報推薦方法。
  9. 前記第7の過程は、前記スポット情報と各概念との関連度及び各概念の重要度の少なくとも1つに応じて前記興味スコアを重み付けすることを特徴とする請求項8記載の情報推薦方法。
  10. 地理的に散在する複数のスポットに対するユーザの興味を分析してその分析結果をもとに当該ユーザに対し推薦するスポットの情報を作成する情報推薦装置であって、
    前記複数のスポットに関する情報をそれぞれ掲示する閲覧サイトに対する前記ユーザの閲覧履歴を表す情報を取得して第1の記憶媒体に格納する手段と、
    前記ユーザの地理的な移動履歴を表す情報を取得して第2の記憶媒体に格納する手段と、
    前記第1の記憶媒体に記憶された閲覧履歴情報をもとに、当該閲覧履歴情報に含まれる複数のスポット閲覧情報を閲覧時間の近さを条件にクラスタ化して閲覧チャンクを生成する手段と、
    前記第2の記憶媒体に記憶された移動履歴情報をもとにユーザが訪問可能な参照エリアを決定し、予め記憶されたスポット情報の中から、前記決定された参照エリアに含まれるスポット情報の集合を参照スポット集合として抽出する手段と、
    前記生成された閲覧チャンクに含まれるスポット閲覧情報の数aと、前記閲覧チャンクに含まれるスポット閲覧情報群のうち所定の概念を有するスポット閲覧情報の数nと、前記参照スポット集合に含まれるスポット情報の数Sと、前記参照スポット集合に含まれるスポット情報群のうち前記概念が付与されたスポット情報の数Nをもとに、前記閲覧チャンクに前記概念が出現するスポット閲覧情報の数が、前記n以上となる第1の確率及びn未満となる第2の確率をそれぞれ算出し、この算出された第1及び第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアzを算出する手段と、
    前記閲覧チャンクごとに算出された特徴スコアzを用いて、前記概念に対する前記ユーザの興味の度合いを表す興味スコアを計算する手段と
    を具備することを特徴とする情報推薦装置。
  11. 請求項1乃至9のいずれかに記載の情報推薦方法が備える各過程の処理を、前記コンピュータに実行させるプログラム。
JP2012196469A 2011-10-06 2012-09-06 情報推薦方法、装置及びプログラム Expired - Fee Related JP5732441B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012196469A JP5732441B2 (ja) 2011-10-06 2012-09-06 情報推薦方法、装置及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011221993 2011-10-06
JP2011221993 2011-10-06
JP2012196469A JP5732441B2 (ja) 2011-10-06 2012-09-06 情報推薦方法、装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2013093015A true JP2013093015A (ja) 2013-05-16
JP5732441B2 JP5732441B2 (ja) 2015-06-10

Family

ID=48616064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012196469A Expired - Fee Related JP5732441B2 (ja) 2011-10-06 2012-09-06 情報推薦方法、装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5732441B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015095191A (ja) * 2013-11-13 2015-05-18 株式会社Agoop 情報処理システム、人口流量推定装置、プログラム、情報処理方法及び人口流量を推定する方法
JP2016053870A (ja) * 2014-09-04 2016-04-14 富士ゼロックス株式会社 情報提示プログラム及び情報処理装置
JP2017168154A (ja) * 2017-07-03 2017-09-21 ヤフー株式会社 情報集計装置、情報集計方法及び情報集計プログラム
KR20190118477A (ko) * 2018-04-10 2019-10-18 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 엔티티 추천 방법 및 장치
JP2020024496A (ja) * 2018-08-06 2020-02-13 凸版印刷株式会社 ユーザ分析装置及びプログラム
CN110866182A (zh) * 2019-10-17 2020-03-06 贝壳技术有限公司 房源推荐方法、装置、服务器及计算机可读存储介质
CN111209386A (zh) * 2020-01-07 2020-05-29 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
JP2020101930A (ja) * 2018-12-20 2020-07-02 ビリングシステム株式会社 支払・決済用アプリにおける検索・通知最適化システム、方法およびプログラム
JP2020102161A (ja) * 2018-12-25 2020-07-02 株式会社 ミックウェア 推定装置、レコメンドシステム、推定プログラムおよび推定方法
CN113674065A (zh) * 2021-08-30 2021-11-19 中国平安人寿保险股份有限公司 基于服务触点的业务推荐方法、装置、电子设备及介质
CN114549143A (zh) * 2022-03-18 2022-05-27 电子科技大学 线下停车记录与线上购买行为融合的个性化商品推荐方法
US11948472B2 (en) 2019-07-30 2024-04-02 Ntt Docomo, Inc. Popularity evaluation system and geographical feature generation model

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157273A (ja) * 2000-11-16 2002-05-31 Hitachi Ltd 確率を用いた特徴単語の選択方法
JP2008145233A (ja) * 2006-12-08 2008-06-26 Denso Corp ランドマーク提示装置、車載用ナビゲーション装置および車載用ナビゲーションシステム
JP2008158823A (ja) * 2006-12-25 2008-07-10 Dainippon Printing Co Ltd 情報提供システム
WO2009075043A1 (ja) * 2007-12-13 2009-06-18 Dai Nippon Printing Co., Ltd. 情報提供システム
JP2010146040A (ja) * 2008-12-16 2010-07-01 Hitachi Ltd 移動情報に基づいた操作者の趣味嗜好判断ナビゲーション装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157273A (ja) * 2000-11-16 2002-05-31 Hitachi Ltd 確率を用いた特徴単語の選択方法
JP2008145233A (ja) * 2006-12-08 2008-06-26 Denso Corp ランドマーク提示装置、車載用ナビゲーション装置および車載用ナビゲーションシステム
JP2008158823A (ja) * 2006-12-25 2008-07-10 Dainippon Printing Co Ltd 情報提供システム
WO2009075043A1 (ja) * 2007-12-13 2009-06-18 Dai Nippon Printing Co., Ltd. 情報提供システム
JP2010146040A (ja) * 2008-12-16 2010-07-01 Hitachi Ltd 移動情報に基づいた操作者の趣味嗜好判断ナビゲーション装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015072357A1 (ja) * 2013-11-13 2015-05-21 株式会社Agoop 情報処理システム、人口流量推定装置、プログラム、情報処理方法及び人口流量を推定する方法
JP2015095191A (ja) * 2013-11-13 2015-05-18 株式会社Agoop 情報処理システム、人口流量推定装置、プログラム、情報処理方法及び人口流量を推定する方法
JP2016053870A (ja) * 2014-09-04 2016-04-14 富士ゼロックス株式会社 情報提示プログラム及び情報処理装置
JP2017168154A (ja) * 2017-07-03 2017-09-21 ヤフー株式会社 情報集計装置、情報集計方法及び情報集計プログラム
KR102123153B1 (ko) * 2018-04-10 2020-06-15 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 엔티티 추천 방법 및 장치
KR20190118477A (ko) * 2018-04-10 2019-10-18 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 엔티티 추천 방법 및 장치
JP2019185716A (ja) * 2018-04-10 2019-10-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド エンティティ推薦方法及び装置
JP2020024496A (ja) * 2018-08-06 2020-02-13 凸版印刷株式会社 ユーザ分析装置及びプログラム
JP7107077B2 (ja) 2018-08-06 2022-07-27 凸版印刷株式会社 ユーザ分析装置及びプログラム
JP2020101930A (ja) * 2018-12-20 2020-07-02 ビリングシステム株式会社 支払・決済用アプリにおける検索・通知最適化システム、方法およびプログラム
JP2020102161A (ja) * 2018-12-25 2020-07-02 株式会社 ミックウェア 推定装置、レコメンドシステム、推定プログラムおよび推定方法
US11948472B2 (en) 2019-07-30 2024-04-02 Ntt Docomo, Inc. Popularity evaluation system and geographical feature generation model
CN110866182B (zh) * 2019-10-17 2020-07-10 贝壳找房(北京)科技有限公司 房源推荐方法、装置、服务器及计算机可读存储介质
CN110866182A (zh) * 2019-10-17 2020-03-06 贝壳技术有限公司 房源推荐方法、装置、服务器及计算机可读存储介质
CN111209386A (zh) * 2020-01-07 2020-05-29 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
CN111209386B (zh) * 2020-01-07 2022-04-12 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
CN113674065A (zh) * 2021-08-30 2021-11-19 中国平安人寿保险股份有限公司 基于服务触点的业务推荐方法、装置、电子设备及介质
CN113674065B (zh) * 2021-08-30 2023-09-22 中国平安人寿保险股份有限公司 基于服务触点的业务推荐方法、装置、电子设备及介质
CN114549143A (zh) * 2022-03-18 2022-05-27 电子科技大学 线下停车记录与线上购买行为融合的个性化商品推荐方法
CN114549143B (zh) * 2022-03-18 2022-07-29 电子科技大学 线下停车记录与线上购买行为融合的个性化商品推荐方法

Also Published As

Publication number Publication date
JP5732441B2 (ja) 2015-06-10

Similar Documents

Publication Publication Date Title
JP5732441B2 (ja) 情報推薦方法、装置及びプログラム
Yin et al. Joint modeling of user check-in behaviors for real-time point-of-interest recommendation
Bennett et al. Inferring and using location metadata to personalize web search
US11490220B2 (en) System and method for accurately and efficiently generating ambient point-of-interest recommendations
Zheng et al. Collaborative location and activity recommendations with gps history data
US8612134B2 (en) Mining correlation between locations using location history
US9495456B2 (en) Selecting, ranking, and/or presenting microsite content
WO2016206196A1 (zh) 用于获取用户属性信息的方法、装置及服务器
JP5410462B2 (ja) 行動及び属性推定装置及び方法及びプログラム
WO2010140504A1 (ja) 推薦情報提供システム、装置、方法及びプログラム
CN108596695B (zh) 实体推送方法及系统
Gunter et al. An exploratory analysis of geotagged photos from Instagram for residents of and visitors to Vienna
JP2010086150A (ja) 地域情報検索装置、地域情報検索装置の制御方法、地域情報検索システム、および地域情報検索システムの制御方法
KR102319438B1 (ko) 빅데이터 기반의 감성정보를 반영한 관광지 정보 제공 시스템 및 그 구동방법
US20130173568A1 (en) Method or system for identifying website link suggestions
US20190139165A1 (en) Contextual trip itinerary generator
Jiang et al. Towards intelligent geospatial data discovery: a machine learning framework for search ranking
US20170011063A1 (en) Systems and Methods to Facilitate Submission of User Images Descriptive of Locations
Menk et al. Recommendation systems for tourism based on social networks: A survey
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
JP2013222278A (ja) 施設評価装置、施設評価システム、施設評価方法およびプログラム
US20170236224A1 (en) Identifying Points of Interest
KR101523192B1 (ko) 소셜 검색 시스템 및 기법
KR101544462B1 (ko) 위치기반 정보 제공 시스템에서의 클라이언트 단말 정보를 이용한 개인화 된 poi정보 제공 방법 및 그 클라이언트 단말
KR101867421B1 (ko) 소셜 데이터를 이용한 서비스 제공업체 추천 방법 및 장치

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150413

R150 Certificate of patent or registration of utility model

Ref document number: 5732441

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees