JP2013196653A - 興味分析方法、装置及びプログラム - Google Patents

興味分析方法、装置及びプログラム Download PDF

Info

Publication number
JP2013196653A
JP2013196653A JP2012066377A JP2012066377A JP2013196653A JP 2013196653 A JP2013196653 A JP 2013196653A JP 2012066377 A JP2012066377 A JP 2012066377A JP 2012066377 A JP2012066377 A JP 2012066377A JP 2013196653 A JP2013196653 A JP 2013196653A
Authority
JP
Japan
Prior art keywords
model
concept
attribute
user
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012066377A
Other languages
English (en)
Other versions
JP5668007B2 (ja
Inventor
Koji Ito
浩二 伊藤
Masanari Fujita
将成 藤田
Tae Sato
妙 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012066377A priority Critical patent/JP5668007B2/ja
Publication of JP2013196653A publication Critical patent/JP2013196653A/ja
Application granted granted Critical
Publication of JP5668007B2 publication Critical patent/JP5668007B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ユーザが初めて情報推薦サービスを利用する場合であっても比較的良い推薦結果を得る。
【解決手段】情報利用者によるコンテンツの選択履歴を表す情報をもとに、当該既存の情報利用者の属性毎のモデルを作成し保存しておく。そして、新規の情報利用者の属性情報を取得し、この取得された属性情報をもとに当該新規の情報利用者の属性と合致する既存の情報利用者の属性のモデルを上記保存されているモデル群の中から選択し、この選択されたモデルをもとに上記新規の情報利用者の所定の概念に対する興味の度合いを表すモデルを作成し、この作成されたモデルに基づいて上記新規の情報利用者の興味を分析する。
【選択図】図24

Description

この発明は、コンテンツ閲覧履歴等からユーザの興味を分析する興味分析方法、装置及びプログラムに関する。
ユーザの行動や状況に合わせて適切なサービス・コンテンツをレコメンドする技術が望まれている。そこで、情報利用者毎に適する情報を選択し、あるいは情報利用者毎に適する順番に並び替えて情報を表示する、情報推薦サービスが提案されている。例えば、情報が広告である場合は、情報利用者毎に適する広告を選択し、あるいは情報利用者毎に適する順番に並び替えて広告を表示する広告推薦サービスであり、情報がニュースである場合は、情報利用者毎に適するニュースを選択し、あるいは情報利用者毎に適する順番に並び替えてニュースを表示するニュース推薦サービスであり、情報が飲食店情報である場合は、情報利用者毎に適する飲食店情報を選択し、あるいは情報利用者毎に適する順番に並び替えて飲食店情報を表示する飲食店情報推薦サービスである。
上記情報推薦サービスを実現するための方法として、各コンテンツに内容をサマライズする概念タグ(メタデータ)が付与されていることを前提としてユーザ履歴において出現する概念等の頻度からユーザの興味を推定する方法があり、この方法は内容ベースフィルタリング手法(Content Based Filtering:CBF)で、特にメモリベース手法として研究が進められている。
具体的に、内容ベースフィルタリング技術とは、例えば特定ブランド(ブランドを示す情報を概念タグとして保持)の商品を閲覧した場合に、同じブランドの商品(同じ概念タグを保持)を提示する。この場合の、メモリベース手法は、過去に閲覧した履歴から、特定ブランドを頻繁に閲覧していれば、特定ブランドの商品を提示することとなる。単純な方法では、閲覧履歴により多く出現した概念タグに関連する商品を提示することとなる。このような手法においてタクソノミ(オントロジ)を利用した方法としては、例えば、非特許文献1の「操作履歴を用いた多面的嗜好把握方法の提案」がある。
「操作履歴を用いた多面的嗜好把握方法の提案」,信学技報,vol. 110, no. 450, LOIS2010-76, pp. 67-72, 2011年3月
ところが、非特許文献1に記載された技術には以下のような解決すべき課題があった。すなわち、情報利用者が初めて情報推薦サービスを利用する場合、あるいは殆ど利用したことが無い場合には、ユーザ履歴が全くないか或いは非常に少ない。このため、モデルの作成に必要なユーザ履歴が不足して適切なモデルが作成できず、この結果適切な推薦が行われない。これは、Cold Start問題と呼ばれ、以下のような不具合を生じる。すなわち、情報推薦サービス利用開始時は、ユーザ履歴が少なく適切な推薦が行われないため、情報利用者の満足度が上がりにくい。そのため、情報推薦サービスが利用されず、ユーザ履歴が溜らない。その結果、ユーザ履歴が少ないため適切な推薦が行われないというように負の連鎖に陥り、その結果サービスの利用を停止する情報推薦サービス利用者が増え、情報推薦サービスが普及しない。
この発明は上記事情に着目してなされたもので、その目的とするところは、ユーザが初めて情報推薦サービスを利用する場合であっても、比較的良い推薦結果を得ることができる興味分析方法、装置及びプログラムを提供することにある。
上記目的を達成するためにこの発明の1つの観点は、コンピュータによって、概念出現の希少性を表す情報を利用して情報利用者の興味を推定し、その推定結果を用いて情報利用者毎に所定の概念に対する興味の度合いを表すモデルを作成し、この作成されたモデルを用いて上記情報利用者毎の興味を分析する方法にあって、上記情報利用者によるコンテンツの選択履歴を表す情報をもとに、当該既存の情報利用者の属性毎のモデルを作成して第1の記憶部に保存する。そして、新規の情報利用者の属性情報を取得し、この取得された属性情報をもとに当該新規の情報利用者の属性と合致する既存の情報利用者の属性のモデルを上記第1の記憶部から選択的に読み出し、この読み出されたモデルをもとに上記新規の情報利用者の所定の概念に対する興味の度合いを表すモデルを作成して、これを初期モデルとして第2の記憶部に保存する。そして、上記第2の記憶部に記憶されたモデルを初期モデルとして上記新規の情報利用者の興味分析を開始するようにしたものである。
したがって、ユーザが初めて情報推薦サービスを利用する場合であっても、比較的良い推薦結果を得ることができる。
また、この発明の1つの観点は以下のような態様を備えることを特徴とする。
第1の態様は、上記既存の情報利用者の属性毎のモデルを作成する際に、当該既存の情報利用者の属性が下位概念に対応する第1の階層とこの第1の階層より上位の概念に対応する第2の階層とを有する場合に、上記第1の階層に対応する下位概念のモデルを作成し、この第1の階層について作成された下位概念のモデルをもとに上記第2の階層に対応する上位概念のモデルを作成するようにしたものである。
このようにすると、属性が階層構造を持つ場合に、下位概念の属性のモデルを用いて上位概念の属性のモデルが作成されるので、少ない計算量で階層構造を持つ属性のモデルを作成することが可能となる。
第2の態様は、コンピュータの処理負荷が予め設定した値以下となる閾値又は時間帯を設定し、前記処理負荷が前記設定された閾値以下となったとき又は前記設定された時間帯になったときに上記属性毎のモデルを作成する処理を実行するようにしたものである。
このようにすると、既存の情報利用者の属性毎のモデルを作成する処理は、コンピュータの処理負荷が少ない深夜時間帯などを選んで実施されるので、コンピュータの処理負荷の増加を招かずに実施することができる。
すなわちこの発明によれば、ユーザが初めて情報推薦サービスを利用する場合であっても、比較的良い推薦結果を得ることができる興味分析方法、装置及びプログラムを提供することができる。
この発明の一実施形態に係る興味分析装置を用いたシステムの全体構成図。 図1に示したクライアント端末、コンテンツサーバ及び興味分析装置の機能構成を示すブロック図。 図2に示した興味分析装置の処理の概要を示す図。 図2に示したクライアント端末上でのコンテンツ閲覧操作の一例を示す図。 一覧閲覧コンテンツリストのデータ構成例を示す図。 詳細閲覧コンテンツのデータ構成例を示す図。 提示コンテンツリストのデータ構成例を示す図。 コンテンツデータベースの一例を示す図。 概念体系/ユーザ興味スコアデータベースの一例を示す図。 履歴情報受信部の処理フローを示す図。 特徴スコア算出部の処理フローを示す図。 分析パラメータリストのデータ構成例を示す図。 特徴スコア算出部の動作を説明するための模式図。 特徴スコア算出処理の詳細を示す図。 概念体系更新処理部の処理フローを示す図。 概念体系更新処理の詳細を示す図。 コンテンツ評価処理部の処理フローを示す図。 コンテンツスコアリストの一例を示す図。 コンテンツ評価処理の詳細を示す図。 コンテンツ要求データの一例を示す図。 図2に示した興味分析装置による属性モデル作成処理の第1の例を示す図。 図2に示した興味分析装置による属性モデル作成処理の第2の例を示す図。 図2に示した興味分析装置による初期モデル作成処理の例を示す図。 この発明の原理説明に用いる概略図。 属性ごとのモデル作成処理を説明するための図。 ユーザ興味スコアの更新式の第1の例を示す図。 ユーザ興味スコアの更新式の第2の例を示す図。 属性ごとのモデルを用いた初期モデル作成処理の概要を説明するための図。 属性ごとのモデルを用いた初期モデル作成処理に使用する計算式の一例を示す図。 モデル更新処理の輻輳について説明するための図。 ユーザのモデルを利用した属性ごとのモデル更新処理の説明に用いる図。 ユーザのモデルを利用した属性ごとのモデル更新処理に使用する計算式の一例を示す図。 ユーザモデルを用いた階層構造を持つ属性ごとのモデル作成処理の説明に用いる図。 ユーザモデルを用いた階層構造を持つ属性ごとのモデル作成処理に使用する計算式の一例を示す図。
[原理]
先ず、この発明の原理を図24〜図34を用いて説明する。
この発明は、概念出現の希少性を利用して情報利用者の興味を高精度に推定し、その推定結果を用いて情報利用者毎のモデルを作成し、この作成されたモデルを用いて情報を推薦する方法を前提とする。この前提とする方法では、情報利用者が選択候補情報一覧から情報を選択した履歴から情報利用者の興味を推定する場合に、情報利用者の選択候補となる情報一覧を定義し、そこからの情報選択における概念の出現数を分析することで、各概念の出現の希少性を考慮する。さらに、各概念が出現しない希少性も利用している。このため、情報利用者の興味を高精度に推定することが可能となる。以下、情報利用者に対して提示された選択候補情報一覧と、情報利用者が選択候補情報一覧から任意の情報を選択した履歴を情報選択履歴と呼ぶ。
この発明は、上記前提とする方法をさらに改良し、ユーザが初めて情報推薦サービスを利用する場合であっても、比較的良い推薦結果を得ることができるようにするものである。
図24はこの改良した発明の概要を説明するための図である。図24に示すように、この発明に係る興味分析装置は、新規ユーザFに対して信頼性の高い情報を推薦するために以下に示す処理を実行する。
(1) 既存ユーザ(例えば図24ではユーザA〜E)の履歴を用いて、属性毎、例えば図24に示した例では東京や千葉等の居住地毎、男性や女性等の性別毎のモデルを作成する。
(2) 新規ユーザFが開示を許諾する一部の属性情報をシステムに開示する。
(3) 新規ユーザFが開示した属性に合致したモデル、例えば図24の例では東京のモデルと女性のモデルを選定する。
(4) 選定されたモデルを用いて新規ユーザFの初期モデルを作成する。
(5) 上記作成された初期モデルを用いて新規ユーザFがサービスの利用を開始し、その後利用を継続する。これにより、新規ユーザFのモデルを東京かつ女性のステレオタイプを表す初期モデルから、新規ユーザF自身を表すモデルへと徐々に修正し、推薦精度を向上させる。
このような処理を実行することで、この発明に係る興味分析装置によれば次のような作用効果が奏せられる。すなわち、適切な初期モデルを用いることにより、利用開始時から比較的良好な推薦精度が実現されて高い満足度が実現され、これにより情報推薦サービスの利用が促進される。このため、情報選択履歴の蓄積が進み、ユーザ自身の興味に対する適合度が上昇し、推薦精度がより一層向上する。この結果、サービスの利用を停止する情報推薦サービス利用者が減り、情報推薦サービスが普及する。
次に、図24に示した一連の処理のうち、既存ユーザの履歴を用いて属性毎のモデルを作成する方法について図25を用いて説明する。
1回の学習において、複数のコンテンツを一覧として閲覧した履歴と、コンテンツの本体を閲覧した履歴とを用いてユーザのモデルを更新する。ここで、ユーザ毎のモデルを、概念毎に算出されるユーザ興味スコア(TotalZ)の集合とする。概念毎のユーザ興味スコア(TotalZ)を求めるとき、先ず複数のコンテンツを一覧として閲覧した第1のコンテンツリストと、この第1のコンテンツリストからコンテンツの本体を閲覧した第2のコンテンツリストとをクラスタ化する。このクラスタ化されたコンテンツリストを履歴クラスタと呼ぶ。
次に、この履歴クラスタ毎に、上記第1のコンテンツリストのコンテンツの総数を第1の総数、上記第1のコンテンツリストにおいて上記概念が出現するコンテンツの数を第1の出現数、上記第2のコンテンツリストのコンテンツの総数を第2の総数、上記第2のコンテンツリストにおいて上記概念が出現するコンテンツの数を第2の出現数とそれぞれ表したとき、これらの第1の総数、第1の出現数及び第2の総数の条件下で、上記第2のコンテンツリストに上記概念が出現するコンテンツの数が上記第2の出現数以上となる第1の確率と、上記第2の出現数以下となる第2の確率を算出する。
そして、上記第1及び第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコア(Z)を算出し、この履歴クラスタ毎に算出した特徴スコアを用いて上記概念に対する上記ユーザ興味スコアを計算し更新する。図26は上記特徴スコアを用いてユーザ興味スコアを算出する式を示したものである。ここで、重みWは、各履歴クラスタにおいて概念毎に設定される値である。
次に、図25に示すようにユーザのモデルの更新と同時に属性毎のモデルを更新する。例えば、男性のモデルを更新する場合は、属性が“男性”のユーザ(図25に示す例ではユーザA、ユーザB、ユーザE)の履歴クラスタが得られた際に、ユーザAのモデル、ユーザBのモデル、ユーザEのモデルを更新するのと同時に、男性のモデルも更新する。属性Cに合致するユーザAの履歴クラスタを用いた属性Cの各概念i に対する興味スコア(TotalZ)の更新式を図27に示す。
続いて、属性毎のモデルを用いた初期モデルを作成する。図28はその作成方法を説明するための図である。例えば、新規ユーザFが“東京”、“女性”という属性を情報推薦システムに対して提示した場合、情報推薦システムは新規ユーザFの属性に合致する東京のモデルと女性のモデルを図29に示す式を用いて結合し、新規ユーザFの初期モデルとして用いる。
しかし、図25に示すように履歴クラスタが得られるたびに属性毎のモデルを更新する方法を用いると、例えば男性のモデルや女性のモデルのようにユーザ数に対する割合が高い属性のモデルを更新する場合には、サービス利用者数の増加に従い当該モデルの更新頻度が増加する。そして、その結果システムの負荷が上昇し、更新処理の遅延や更新漏れ、システム停止を招くことがある(図30)。
この課題は以下のようにすることで解決される。図31は、図25に示した属性毎のモデルを更新する方法をさらに改良した提案を示すものである。属性毎のモデルの更新は、当該属性に合致する各ユーザの履歴クラスタを用いる代わりに、ユーザ毎の学習結果を用いて行う。但し、ユーザ毎に学習回数が異なるため、各ユーザの興味スコアを同じ割合で確率結合すると、学習回数の差異が考慮されない。従って、各ユーザの興味スコアでなく、共に保存されているX、Yを用いて求める。X、Yは各ユーザの学習の回数に依存する。このため、これらも考慮することにより、ユーザ毎の学習回数の差異を考慮することができる。
属性Cに関連する全てのユーザについての、Yi ,Xi が定まっているとき、属性Cに関するモデルの概念i に関するn番目の興味スコア(TotalZ Cin)と、YCin,XCinを更新する式を図32に示す。
さらに、属性毎のモデルを階層的に作成する例を図33に示す。例えば、関東のモデルが東京のモデルと千葉のモデルを子に持つ場合、図34に示すように子属性のモデルのX子属性i ,Y子属性i を用いて、親属性のモデルのX親属性i ,Y親属性i と、興味スコア(TotalZ親属性in)を求めることができる。
[実施形態]
以下、図面を参照してこの発明に係わる一実施形態を説明する。
(1)システム全体の構成
図1は、この発明の一実施形態に係る興味分析装置を用いたシステムの全体構成図である。このシステムは、クライアント端末200と、コンテンツサーバ300と、興味分析装置100を備える。クライアント端末200とコンテンツサーバ300との間、及びコンテンツサーバ300と興味分析装置100との間はそれぞれ通信ネットワークで接続される。ユーザは、クライアント端末200上での閲覧操作により、所望のコンテンツをコンテンツサーバ300から取得し、取得したコンテンツをクライアント端末200の画面に表示させ、閲覧する。
クライアント端末200は、ユーザ操作によるコンテンツ閲覧履歴を収集し、複数のコンテンツを一覧として閲覧した一覧閲覧コンテンツリスト(第1のコンテンツリスト)と、コンテンツの一覧からコンテンツの本体を閲覧した詳細閲覧コンテンツリスト(第2のコンテンツリスト)とをコンテンツサーバ300に送信する。コンテンツサーバ300は、この一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを、通信ネットワークを介して興味分析装置100に転送する。
興味分析装置100は、この一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストをもとに、コンテンツに出現する各概念に対する特徴スコア及びユーザ興味スコアを算出し、ユーザの興味を推定する。興味分析装置100は、このユーザ興味スコアに基づいて、コンテンツサーバ300から受け取った「提示コンテンツリスト」から、ユーザの興味に合わせてソートを行ったコンテンツのリスト(ソート済み提示コンテンツリスト)を生成し、コンテンツサーバ300に送信する。
また興味分析装置100は、定期的にユーザの興味モデルを用いて属性の興味モデルを作成し、初期利用ユーザから属性情報の提示を受けた場合には、属性にあわせて初期モデルを作成する機能も備える。
図2は、図1に示したクライアント端末200、コンテンツサーバ300及び興味分析装置100の機能構成を示すブロック図である。
(2)興味分析装置の構成
興味分析装置100は、履歴情報受信部110、特徴スコア算出部120、概念体系更新処理部130、概念体系/ユーザ興味スコアデータベース140、提示コンテンツリスト受信部150、コンテンツデータベース160、コンテンツ評価処理部170、及びソート済みコンテンツスコアリスト送信部180を備え、さらに属性興味スコア更新起動部190、属性興味スコア更新部195、属性興味スコアデータベース196、初期ユーザ興味スコア作成部197及びユーザ/属性情報データベース198を備えている。
図3は、興味分析装置100の処理の概要を示すものである。
履歴情報受信部110は、クライアント端末200からの一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストをコンテンツサーバ300を介して受信する。一覧閲覧コンテンツリストとは、例えばユーザがコンテンツのタイトルのみを一覧で閲覧したコンテンツのリストである。詳細閲覧コンテンツリストとは、ユーザがコンテンツ本体の内容(詳細)を閲覧したコンテンツのリストである。例えば、図3において、一覧閲覧コンテンツリストには、コンテンツ1〜8が含まれ、詳細閲覧コンテンツリストには、コンテンツ1,3,4が含まれる。また図3において、斜線パターンで示すコンテンツは、概念Bがコンテンツ1,6,7,8に出現することを示す。
特徴スコア算出部120は、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを利用して概念選択の統計モデルにより各概念の特徴スコア(後述するZ値)を算出する。
概念体系更新処理部130は、上記特徴スコアを用いて概念体系における概念間の関係情報(上位概念及び下位概念)に基づいて各概念に対するユーザ興味スコアを更新する。概念体系のグラフに含まれるノードは概念を表し、リンクは概念間の関係を表す。ユーザ興味スコアは、概念体系における各概念に対応するノードの値として保持する。概念体系において、上位に位置するノードほど抽象的な概念を表し、下位に位置するノードほど具体的な概念を表す。概念体系及び概念ID(ノード毎に付与される識別子)は、サービス運用者等が事前に設計し定義するものとする。
コンテンツ評価処理部170は、評価コンテンツに出現する各概念のユーザ興味スコアを利用して確率結合によってコンテンツに対するユーザの評価スコアを算出する。図3の例では、コンテンツ1に出現する概念E,F,Dのユーザ興味スコアを用いてコンテンツ1の評価スコアを求めている。興味分析装置100の詳しい動作説明は後述する。
属性興味スコア更新起動部190は、深夜時間帯などの負荷が少ない時間帯に定期的に属性興味スコアの更新処理を起動する。
属性興味スコアデータベース196は、後述する属性興味スコア更新部195により算出された属性のX,Y,TotalZを記憶するために用いられる。
ユーザ/属性情報データベース198は、ユーザ情報とその属性情報を記憶するために用いられる。
属性興味スコア更新部195は、ユーザ/属性情報データベース198に記憶された属性情報を用いて、属性毎に当該属性に合致するユーザ群を特定し、この特定したユーザのX,Yをもとに図32に示した式を用いて上記属性のX,Y,TotalZを求め、この求めた結果を属性興味スコアデータベースに保存する処理機能を有する。
また属性興味スコア更新部195は、ユーザ/属性情報データベース198に記憶された属性情報を用いて、属性の子属性群を特定し、この特定した属性のX,Yをもとに図34に示した式を用いて上記属性のX,Y,TotalZを求め、この求めた結果を属性興味スコアデータベース196に保存する処理機能も有する。なお、X,Y,TotalZについては後述する。
初期ユーザ興味スコア作成部197は、クライアント端末100からコンテンツサーバ300を経由して転送された新規ユーザの属性に合致する属性のモデルを、属性興味スコアデータベース196から読み出す。そして、この読み出された属性のモデルを図29に示す式を用いて確率結合し、その結果を初期利用ユーザの初期モデルとして概念体系/ユーザ興味スコアデータベース140に保存する機能を有する。
(3)クライアント端末の構成
図2において、クライアント端末200は、履歴収集部210、履歴情報送信部220、コンテンツ提示部230、コンテンツ要求送信部240及び属性提示部250を備える。
コンテンツ要求送信部240は、ユーザの指示(入力)によりコンテンツサーバ300に対してコンテンツの提示要求を行う。具体的には、図20に示すようなコンテンツ要求データをコンテンツサーバ300に送信する。例えば、コンテンツ要求データは、クライアント端末ID(もしくはユーザID)及び要求時刻を有する。なお、要求時刻は、コンテンツサーバ300において追加するようにしてもよい。クライアント端末ID(もしくはユーザID)は、端末(もしくはユーザ)毎に一意に付与される数字であって、後述する概念体系/ユーザ興味スコアデータベース140のユーザ興味スコアテーブルのユーザIDと一致するIDである。
図4は、クライアント端末200上でのユーザによるコンテンツ閲覧操作の一例を示したものである。
コンテンツ提示部230は、コンテンツサーバ300から受信したソート済み提示コンテンツリストをもとに、クライアント端末200の表示画面サイズが許容する範囲でソート順の上位から一覧として表示を行う。
図4に示した例では、10個のコンテンツ(コンテンツ1〜10)が一覧表示されている。ユーザのフリック、スクロールバーの操作等で一覧によりソート順下位のコンテンツが表示することができる。このように実際にクライアント端末200に表示されたコンテンツのリストを一覧閲覧コンテンツリストとする。つまり、ソート済み提示コンテンツリスト内のすべてのコンテンツがクライアント端末200で表示されるとは限らないため、一覧閲覧コンテンツリストに含まれるとは限らない。ユーザがこの一覧から各コンテンツのタイトルをクリック操作等で選択すると、選択されたタイトルのコンテンツ(図4のコンテンツ3,5,6)の本体(詳細)を閲覧することができる。この詳細を閲覧したコンテンツを、詳細閲覧コンテンツリストに含む。
履歴収集部210は、上述したように、ユーザの操作履歴を収集して一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを作成する。履歴情報送信部220は、履歴収集部210により作成された一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストをコンテンツサーバ300に送信する。
図5に、上記図4の場合の一覧閲覧コンテンツリストのデータ構成例を示す。一覧閲覧コンテンツリストは、クラスタID、コンテンツID及び閲覧時刻を有する。クラスタとは、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストに一意に付与される識別子(図5では“1”)である。別の時刻(時間帯)に表示した一覧閲覧コンテンツをユーザが閲覧した場合は、別のクラスタIDが付与される。なお、時刻以外の条件でクラスタIDを新たに付与する条件としては、一覧閲覧コンテンツリスト表示中に一定時間操作が無かった場合や、場所を移動した場合、気温や天候が変化した場合、同行者が変化した場合、閲覧するユーザ(ユーザID)を切り替えた場合、一覧閲覧コンテンツリストに対してコンテンツジャンル等を観点に絞り込み検索を掛けた場合、その他閲覧アプリケーションにおいて閲覧モードを切り替えた場合がある。コンテンツIDは、一覧閲覧コンテンツの各コンテンツに一意に付与された識別子であり、後述するコンテンツデータベース160が保持する値と一致するものとする。
図6は、上記図4の場合の詳細閲覧コンテンツリストのデータ構成例を示したものである。詳細閲覧コンテンツリストは、上記一覧閲覧コンテンツリストと同様に、クラスタID、コンテンツID及び閲覧時刻を有する。クラスタIDは、一覧閲覧コンテンツリストと同一の値とする(図6では“1”)。コンテンツID及び閲覧時刻は、詳細閲覧コンテンツリストでは、ユーザが一覧閲覧コンテンツから選択して詳細を閲覧したコンテンツ(図6ではコンテンツ3,5,6)の識別子及び当該コンテンツを閲覧した時刻となる。
属性提示部250は、この情報推薦サービスを初めて利用するユーザ、つまり新規ユーザ(初期利用ユーザ)が自己の属性情報を入力した場合に、この属性情報の入力を受け付けてコンテンツサーバ300へ送信する機能を有する。
(4)コンテンツサーバの構成
上記図2において、コンテンツサーバ300は、コンテンツ送信処理部310、ソート済み提示コンテンツリスト受信部320、提示コンテンツリスト送信部330、提示コンテンツリスト入力部340、履歴情報転送部350、コンテンツ要求転送部360及び属性転送部370を備える。
履歴情報転送部350は、クライアント端末200から受信した一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを、通信ネットワークを介して興味分析装置100に転送する。
提示コンテンツリスト入力部340には、サービス運用者により、ユーザの利用するクライアント端末200に提示するコンテンツを一覧にした提示コンテンツリストが入力される。提示コンテンツリスト送信部330は、上記入力された提示コンテンツリストを興味分析装置100へ通信ネットワークを介して送信する。
図7に、提示コンテンツリストのデータ構成例を示す。提示コンテンツリストは、コンテンツID、概念ID/関連度リスト、コンテンツ本体、及びコンテンツ登録時刻を有する。コンテンツIDは、各コンテンツに対してコンテンツサーバ300にて付与される一意のIDである。概念ID/関連度リストは、コンテンツに出現する概念の概念ID及び当該概念とコンテンツと関連性の程度を示す値のセットが格納される。概念ID/関連度リストは、コンテンツ毎に予め設定されており、具体例としては、コンテンツ1(スポーツ記事)には、{“野球”の概念ID=1,関連度=0.5}、{“サッカー”の概念ID=2,関連度=0.8}、{“ゴルフ”の概念ID=3、関連度=0.6}…のように、概念IDと関連度のセットが格納される。
なお、概念IDは、概念体系/ユーザ興味スコアデータベース140に格納される値と一致する。関連度は、例えば、0から1までの値とし、大きいほど関連性が強いものとする。関連度は、サービス運用者がコンテンツ登録時に設定する値、若しくは別システムにより算出される値を利用する。
ソート済み提示コンテンツリスト受信部320は、興味分析装置100から提示コンテンツリストの一部又は全部をソートしたソート済み提示コンテンツリストとクライアント端末ID(もしくはユーザID)を受信する。コンテンツ送信処理部310は、ソート済み提示コンテンツリストをクライアント端末ID(もしくはユーザID)に該当するクライアント端末200に送信する。
コンテンツ要求転送部360は、クライアント端末200のコンテンツ要求送信部240からのコンテンツ提示要求であるコンテンツ要求データ(図20)を興味分析装置100に転送する。
属性転送部370は、上記クライアント端末200から送信された新規ユーザの属性情報を受信し、この受信した新規ユーザの属性情報を興味分析装置100に転送する機能を有する。
(5)興味分析装置の動作
次に、興味分析装置100の各部の動作について説明する。
(5−1)コンテンツデータベース160
図8にコンテンツデータベース160のデータ構造の一例を示す。コンテンツデータベース160は、コンテンツテーブルと、ユーザ履歴テーブルとを有する。
コンテンツテーブルは、コンテンツID、概念ID/関連度リスト、コンテンツ本体、及びコンテンツ登録時刻を格納する。提示コンテンツリスト受信部150で受信した値が格納される。
ユーザ履歴テーブルは、コンテンツID、ユーザID(クライアント端末ID)、詳細閲覧総数、詳細閲覧時刻、一覧閲覧総数、一覧閲覧時刻、及び一覧非表示フラグを格納する。詳細閲覧時刻は、詳細閲覧総数が0の場合はnull、1以上であれば各閲覧の時系列による閲覧時刻のリストを格納する。一覧閲覧時刻は、一覧閲覧総数が0の場合はnull、1以上であれば各閲覧の時系列による閲覧時刻のリストを格納する。一覧非表示フラグは、まだユーザにクライアント端末の画面上で一覧としても表示/視認していない場合はfalse、一度でも閲覧した場合はtrueを格納する。ユーザ履歴テーブルおいては、ユーザID毎に全コンテンツIDの値を保持する。詳細閲覧総数及び一覧閲覧総数は、上記クラスタIDで示される一覧閲覧コンテンツリストが多数受信された場合には過去の履歴の累計を格納する。
例えば、このユーザ履歴テーブルのデータを利用することで、ユーザの閲覧回数に応じて、コンテンツについて、今後の評価(コンテンツ評価処理部170での処理時)で評価スコアを下げるようにする。評価スコアの低減方法としては、あるコンテンツに対する閲覧回数をkとしたとき、当該コンテンツの評価スコアをk+1で割る、或いは評価スコアに重み(例えば0.9)のk乗を乗算するなどがある。この処理により、同じコンテンツの反復提示を興味との一致度を加味して低減することができるためユーザの推薦に対する満足度を向上することができる。
(5−2)概念体系/ユーザ興味スコアデータベース140
図9に概念体系/ユーザ興味スコアデータベース140のデータ構造の一例を示す。概念体系/ユーザ興味スコア160は、ルート概念ノードIDと、概念体系テーブルと、ユーザ興味スコアテーブルとを有する。
ルート概念ノードIDとは、概念体系構造において最上位にある概念ノードIDであり、システム内に1つだけ存在する。
概念体系テーブルは、自概念ID、親概念IDリスト及び子概念IDリストを格納する。概念体系内の全ての自概念IDは、親概念ID及び子概念ID(ただし、自概念が最下位の場合には子概念IDはなし)と紐付けて保存されており、これにより概念構造が定義される。
ユーザ興味スコアテーブルは、概念ID、ユーザID(クライアント端末ID)、TotalZ(ユーザ興味スコア)、X、及びYの値を格納する。TotalZ、X及びYの定義及び算出方法は後述する。
(5−3)提示コンテンツリスト受信部150
提示コンテンツリスト受信部150は、コンテンツサーバ300から上記図7に示すような提示コンテンツリストを受信し、コンテンツデータベース160に保存する。
(5−4)履歴情報受信部110
図10は、履歴情報受信部110の処理手順と処理内容を示すフローチャートである。
(ステップS11:履歴データ受信)
履歴情報受信部110は、コンテンツサーバ300の履歴情報転送部350から通信ネットワークを介してクライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを受信し、特徴スコア算出部120へ出力する。
(5−5)特徴スコア算出部120
図11は、特徴スコア算出部120の処理手順と処理内容を示すフローチャートである。特徴スコア算出部120には、履歴情報受信部110からクライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストが入力される。
(ステップS12:出現概念抽出)
特徴スコア算出部120は、詳細閲覧コンテンツリスト内の各コンテンツに出現する概念IDをコンテンツデータベース160から抽出する。具体的には、図6の詳細閲覧コンテンツリストにおいて、各コンテンツIDに紐付けされている「概念ID」を図8のコンテンツデータベース160のコンテンツテーブルから検索する。
また特徴スコア算出部120は、クラスタデータ{クラスタID,一覧閲覧コンテンツリスト,詳細閲覧コンテンツリスト}と、コンテンツID/概念ID関連づけリスト{{コンテンツID,{関連づいている概念ID,…}},…}と、出現概念リスト{概念ID}とを生成する。ここで、「コンテンツID/概念ID関連付けリスト」とは、コンテンツIDをもとに検索された概念IDのリストである。「出現概念リスト」とは、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストに含まれる各コンテンツに出現する概念の概念IDを全て列挙したものである。
(ステップS13:出現概念抽出)
特徴スコア算出部120は、「出現概念リスト」の各概念IDについて、図9の概念体系/ユーザ興味スコアデータベース140から上位概念を抽出し、上位概念の概念IDを「出現概念リスト」及び「コンテンツID/概念ID関連づけリスト」に追加する。
具体的には、特徴スコア算出部120は、図9の概念体系テーブルを検索することにより、「出現概念リスト」の概念IDが「自概念ID」と一致するものを読み出し、その「親概念ID」を抽出する。例えば、上記抽出された「親概念ID」が図9の概念体系テーブルの「自概念ID」と一致するものを探し、その「親概念ID」も上位概念として抽出する。そして、特徴スコア算出部120は、上位概念の概念IDを抽出の元になった出現概念の概念IDを有するコンテンツIDに関連づける。
すなわち、上記抽出された「上位概念」を「元になった概念IDを持っていたコンテンツID」に対して上位概念が付与されていたと見なして、「出現概念リスト」「コンテンツID/概念ID関連づけリスト」に追加する。なお、概念体系階層におけるルート概念の抽出は除外する。
(ステップS14:分析パラメータ抽出)
特徴スコア算出部120は、「出現概念リスト」の各概念について出現数を算出し、特徴スコアの算出に必要な分析パラメータを抽出し、分析パラメータリストを生成する。
図12に、分析パラメータリストのデータ構成例を示す。分析パラメータリストは、クラスタID毎に、一覧閲覧コンテンツリストのコンテンツ総数S(第1の総数)、詳細閲覧コンテンツリストのコンテンツ総数a(第2の総数)、クラスタIDに紐づいた出現概念リスト内の概念ID毎に算出するNとnがある。N(第1の出現数)は、一覧閲覧コンテンツリストにおいて当該概念IDが付与されているコンテンツ数とする。n(第2の出現数)は詳細閲覧コンテンツリストにおける当該概念IDが付与されているコンテンツ数とする。なお、ステップS13にて追加した上位概念も含めて出現概念リスト内の概念IDすべてについて、Nとnを算出する。
図13(a)に分析パラメータ抽出処理の模式図を示す。例えば、50個(=S)のコンテンツが一覧表示されている中から、ユーザが10個(=a)のコンテンツの詳細を閲覧した場合を示す。ここで、一覧表示されている50個のコンテンツのうち「野球」という概念が含まれている記事が15個(=N)あり、ユーザが閲覧した10個のコンテンツのうち、「野球」という概念が含まれているコンテンツが5個(=n)あったことを示す。
(ステップS15:特徴スコア算出)
特徴スコア算出部120は、上記分析パラメータS,a,N,nを利用して概念ID毎に特徴スコアZを算出する。図14に特徴スコア算出処理の詳細を示す。図14において、iは概念の識別子、jは、クラスタIDを示す。H1(第1の確率)は、一覧閲覧コンテンツリストに含まれる一覧閲覧コンテンツの総数S、一覧閲覧コンテンツのうち概念iが出現するコンテンツ数Nのとき、詳細閲覧コンテンツをa個ランダム選択して閲覧した場合に、概念iが出現する詳細閲覧コンテンツの数がn以上となる累積確率である。H2(第2の確率)は、一覧閲覧コンテンツリストに含まれる一覧閲覧コンテンツの総数S、一覧閲覧コンテンツのうち概念iが出現するコンテンツ数Nのとき、詳細閲覧コンテンツをa個ランダム選択して閲覧した場合に、概念iが出現する詳細閲覧コンテンツの数がn以下となる累積確率である。なお、本実施形態では、累積確率H1及びH2は、超幾何分布により求めるが、この手法に限定するものではない。他の分布の例としては、二項分布、正規分布が存在する。
図13(b)に示すように、例えば、上記の分析パラメータS、N、a、nを用いて、ユーザが閲覧した10個のコンテンツのうち、「野球」という概念が含まれるコンテンツが5以上である確率が「0.12」であることを示す。ここで、「0.12」は、累積確率H1の値に相当する。
なお、H2の値を使う例として、上記の分析パラメータでnが0である場合を考える。この場合は、出現数が0以下の場合の確率を算出する。具体的には、図13(b)において横軸が0の項目の値となるため「0.02」となる。
そして、特徴スコア算出部120は、図14に示すように、上記算出した累積確率H1及びH2を用いて、標準正規分布の累積分布関数の逆関数により特徴スコアZを算出する。図13(c)に示すように、上記H1を累積確率とする標準正規分布の累積分布関数の逆関数により特徴スコアZを求める。なお、累積確率としてH2を利用する場合には、標準正規分布の累積分布関数の逆関数の返値の符号を負にして特徴スコアZを求める。この特徴スコアZを用いて、後述する概念体系更新処理部130は、「野球」という概念に対するユーザ興味スコアTotalZを求める。
特徴スコア算出部120は、更新対象概念リストを生成し、概念体系更新処理部130に出力する。「更新対象概念リスト」とは、概念ID、前記で算出した特徴スコアZ、及び重みwのセットである。なお、この更新対象概念リストに出現する概念IDが、次の概念体系更新処理で更新対象のノード(概念)となる。上位概念を追加した出現概念リスト内の概念IDすべてについて、特徴スコアZと重みwを算出する。重みwは、各クラスタIDにおいて概念毎に設定される値である。
なお、重みwは、初期値w=1とし、ユーザの特徴的な操作等が有った場合に、以下のように値を変化させることができる。例えば、クライアント端末200において、ユーザに提示されたコンテンツについて、ユーザは、お気に入りコンテンツとして登録や、他ユーザへのお勧め、又はコンテンツへの評価入力ができる。
クライアント端末200が、このような閲覧操作以外の操作履歴を興味分析装置100に送信できる場合には、以下の処理を行う。
すなわち、特徴スコア算出部120は、例えばコンテンツがお気に入りに登録されたとき、そのコンテンツが含む全ての概念IDについて重みwをw=1.5のように増加させる。その他にも、コンテンツ閲覧時刻、閲覧時の天気、気温、湿度、季節、曜日、休日、余暇かどうか、閲覧時のユーザ位置情報、スケジューラ、日記等から収集したイベント情報に応じて重みwの値を変えることもできる。
(5−6)概念体系更新処理部130
図15に、概念体系更新処理部130の処理フローを示す。概念体系更新処理部130には、特徴スコア算出部120から、クライアント端末ID(もしくはユーザID)及び更新対象概念リスト{クラスタID,{概念ID,特徴スコア=Z,重み=w},…}が入力される。
(ステップS16:概念ノード値更新)
概念体系更新処理部130は、「更新対象概念リスト」の各概念IDのノード値を更新する。図16に概念体系更新処理部130の処理の詳細を示す。概念体系更新処理部130は、コンテンツに出現した概念(出現概念)、及びこの出現概念の上位概念の概念IDについて、図16に示す各概念iに対するユーザ興味スコア更新式を用いて、ユーザ興味スコアTotalZin,及びXi(n−1),Yi(n−1)の値を求め、図9の概念体系/ユーザ興味スコアデータベース140の、クラスタIDに対応する図11のステップS12に入力されたユーザID(クライアント端末ID)のカラムに対応するユーザ興味スコアテーブルに格納されている各値を更新する。
ここで、Xi(n−1)は、各概念ID(ここでは識別子iで表現)に対する、過去の(前回までの)前記更新対象概念リストの重みwの二乗の合計である。Yi(n−1)は、同様に各概念ID(ここでは識別子iで表現)に対する、過去の前記更新対象概念リストの重みwと特徴スコアZの乗算の合計である。
この、X,Yはユーザ興味スコア(TotalZ)計算過程における中間結果を保持することとなり、省メモリ/ストレージを優先させる場合、最低限では各ノードの変数としてTotalZ,X,Yの3つの実数値を保持することで実現可能である。省メモリ/ストレージを優先させない場合は、算出した各概念、各クラスタの特徴スコアZをすべて保存することとなる。この場合は、X,Yの保存は不要となる。
図16において、nは、概念体系更新処理が何度目かを示す識別子である。ユーザ興味スコアTotalZを求める一連の処理は、クラスタID単位で行なわれ、この一連の処理が行なわれる単位を1度と数えるとき、nはこの一連の処理が何度目に行なわれたものであるかを示す識別子である。iは、概念IDの識別子である。Zinは、概念iの各更新処理に利用するZ値である。なお、上記Zijは一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリスト毎のZ値であり、Zij∈Zinの関係である。重みwinは、概念iの各更新処理に利用する重みである。上記重みwと同じであり、上記特徴スコア算出部120で設定したものと同様である。
例えば、winは、お気に入り登録、他ユーザとの共有等の閲覧以外の特殊な操作をユーザが行った場合、及びコンテンツ閲覧時間(閲覧開始から終了までの間隔)、コンテンツと概念の関連度合い、コンテンツ閲覧時刻、閲覧時の天気・気温・湿度・季節・曜日・休日・余暇かどうか、閲覧時のユーザ位置情報、スケジューラ・日記等から収集したイベント情報に応じて値を変化させる。その他サービス利用者、サービス運用者が特に指定した場合にも変化させる。
なお、一定期間過ぎた履歴の影響を低減させるため等のユーザ興味スコアの忘却は、最終更新時から現在の時刻までの時間間隔の閾値を超えた場合に、TotalZ,X,Yをそれぞれ減衰させることで実現する。
減衰の計算式の例を示す。例えば、kを減衰率(例えばk=0.8)と設定し、以下のように算出することができる。
TotalZ(減衰後)=k×TotalZ(現在)
X(減衰後)=k2×X(現在)
Y(減衰後)=k2×Y(現在)
(ステップS17:下位概念ノード値更新)
さらに、概念体系更新処理部130は、「更新対象概念リスト」の各概念ID(出現概念及び上位概念)の下位概念を抽出し、下位概念のノード値を更新する。下位概念の抽出では、「更新対象概念リスト」の各概念IDについて、図9に示す概念体系/興味度データベース140の概念体系テーブルを参照し、子概念IDリストから概念IDのリストを抽出し、さらに各子概念IDリストの概念IDについて概念体系テーブルを参照して子概念リストを抽出する処理を繰り返す。
下位概念の興味度の更新に利用する特徴スコアZは、例えば、隣接した親ノードのうち特徴スコアの絶対値が最も大きい値を利用、最も近い上位ノードの値を利用、親ノードの値を平均、または確率結合した値とする。なお、「更新対象概念リスト」のうち、上記ステップS16で更新済みの概念(コンテンツに出現した概念、及び上位概念)のユーザ興味スコアは更新しない。
(5−7)コンテンツ評価処理部170
図17はコンテンツ評価処理部170の処理手順と処理内容を示すフローチャートである。
コンテンツ評価処理部170には、コンテンツサーバ300のコンテンツ要求転送部360からの通知を入力として、コンテンツデータベース160のコンテンツテーブルから図7に示すような形式の提示コンテンツリストを読み出して以下のコンテンツ評価処理を行う。
すなわち、コンテンツ要求転送部360からはクライアント端末ID(もしくはユーザID)を含む、図20に示すようなコンテンツ要求データを受信する。また、上記提示コンテンツリストについては、サービス運用者もしくはサービス利用者(クライアント端末利用者)の事前設定により、過去何日以内に登録されたコンテンツのみを評価対象とするか(提示コンテンツリストに含めるか)を設定することができる。
(ステップS21:分析対象概念フィルタリング)
分析対象概念フィルタリングでは、サービス運用者又はサービス利用者が、事前設定や手動等で特に分析対象の概念IDを指定した場合は、概念体系/興味度データベース140を参照し、指定された分析対象の概念IDおよび下位の概念IDのみを評価対象とする。コンテンツ評価処理部170は、入力された提示コンテンツリストが保持する概念IDについて、事前にサービス運用者又はサービス利用者が設定した条件にしたがって分析対象外とし、「フィルタリング済みコンテンツリスト」を生成する。
例えば、ユーザが、野球に関するコンテンツのレコメンドを求めた場合には、図9に示す概念体系テーブルを参照し、野球に対応する概念IDの下位概念のみを分析対象とする。「フィルタリング済みコンテンツリスト」とは上記処理によって、各コンテンツIDに紐付けされている概念IDを事前にサービス運用者又はユーザが設定した条件にしたがって削除したコンテンツリストである。「フィルタリング済みコンテンツリスト」は、上記図7の提示コンテンツリストと同じデータ構成である。
(ステップS22:スコア評価)
コンテンツ評価処理部170は、「フィルタリング済みコンテンツリスト」に含まれるコンテンツの評価スコアを算出し、図18に示すようなコンテンツスコアリストを生成する。コンテンツスコアリストは、コンテンツID、評価スコア、コンテンツ本体及びコンテンツ登録時刻を有する。
図19に評価スコアの算出方法の一例を示す。例えば、図19に示すコンテンツ評価式により、コンテンツxに対する評価スコアEntityZxを概念iのユーザ興味スコアTotalZi 、コンテンツxと概念iとの関連度wi (もしくは、概念iの重要度)、及びコンテンツxに出現する概念IDの集合pを用いて算出することができる。なお、概念の識別子iは集合p内の概念IDに対応する。
図19の算出で利用するユーザ興味スコア(TotalZ)は、各コンテンツに関連した概念IDについて、概念体系/ユーザ興味スコアデータベース140のユーザ興味スコアテーブル(図9)から、クライアント端末ID(もしくは、ユーザID)をもとに読み出し利用する。図19において、概念K、概念B及び概念Dが出現するコンテンツ1を評価コンテンツとした場合、概念K、概念B及び概念DのTotalZ,wを利用して評価スコアEntityZx =0.18と算出できる。一方、概念Bのみが出現するコンテンツ2を評価コンテンツとした場合、概念BのTotalZ,wを利用して評価スコアEntityZx =−0.3と算出できる。評価スコアEntityZx の値が大きいコンテンツ1が優先して表示される。
その他にも、評価スコアEntityZx は、以下の変形例1〜3の方法により求めることができる。
変形例1としては、EntityZx =MAX(TotalZi *wi )により求める。MAX(TotalZi *wi )は、i∈pのTotalZi *wi の最大値を返す関数とする。
変形例2としては、EntityZx の値は、MAX(TotalZi *wi )の値が閾値を超えた場合には、MAX(TotalZi *wi )の返り値とする。MAX(TotalZi *wi )はi∈pのTotalZi *wi の最大値を返す関数とする。閾値を超えない場合は、図19のコンテンツ評価式の結果をEntityZx とする。MAX()は、はi∈pのTotalZi *wi で最大値を返す関数とする。閾値はサービス運用者が設定する値とする。
変形例3としては、TotalZi が正の値のi∈pについてのみ取り出し、図19のコンテンツ評価式で統合した値をEntityZx とする。
(ステップS23:コンテンツをスコア順にソート)
コンテンツ評価処理部170は、コンテンツスコアリストに含まれるコンテンツを評価スコアEntityZx の降順にソートし、ソート済みコンテンツスコアリストをソート済コンテンツスコアリスト送信部180に出力する。
(5−8)ソート済みコンテンツスコアリスト送信部180
ソート済みコンテンツスコアリスト送信部180は、コンテンツ評価処理部170から入力されるソート済みコンテンツスコアリストとクライアント端末ID(もしくはユーザID)を、通信ネットワークを介してコンテンツサーバ300に送信する。
(5−9)属性興味スコア更新部195
属性興味スコア更新部195は、ユーザの属性毎に当該属性のモデルを、当該属性に合致する他のユーザのモデルを用いて作成する。
図21は、興味分析装置100による、属性に関するモデルを作成する処理の概要を示すもので、属性Aのモデルを、当該属性Aに合致するユーザB、ユーザCのモデルを用いて作成する場合について例示したものである。属性興味スコア更新起動部190は、深夜時間帯などの興味分析装置100の処理負荷が少ない時間帯に定期的に処理を起動する。処理が起動されると属性興味スコア更新部195は、先ずユーザ/属性情報データベース198に保存されている属性情報を用いて、属性Aに合致するユーザ群、例えばユーザB及びユーザCを特定する。次に、この特定したユーザのX,Yをもとに、図32に示した式を用いて属性AのX,Y,TotalZを算出する。そして、この属性AのX,Y,TotalZの算出結果を属性興味スコアデータベース196に保存する。
図22は、興味分析装置100による、下位の属性のモデルを用いて上位の属性のモデルを作成する場合の処理の概要を示したもので、属性Aのモデルを、当該属性Aの子属性である属性B、属性Cのモデルを用いて作成する場合について例示している。属性興味スコア更新起動部190は、先に述べたように深夜時間帯などの装置の処理負荷が少ない時間帯に定期的に処理を起動する。処理が起動すると属性興味スコア更新部195は、ユーザ/属性情報データベース198に保存されている属性情報を用いて、属性Aの子属性群、例えば属性B及び属性Cを特定する。次に、この特定した属性のX,Yをもとに図34に示す式を用い、属性AのX,Y,TotalZを算出する。そして、この属性AのX,Y,TotalZの算出結果を属性興味スコアデータベース196に保存する。
図23は、興味分析装置100による、属性のモデルを用いた新規ユーザ(初期利用ユーザ)の初期モデルの作成に関する処理の概要を示したものである。
同図において、新規ユーザは自身のクライアント端末200において、自らの属性と各属性を確率結合する比率Wを入力する。そうすると、クライアント端末200の属性提示部250により、上記入力されたユーザ自身の属性と確率結合比率Wを表す情報が、コンテンツサーバ300の属性転送部370を経由して興味分析装置100に転送される。
興味分析装置100では、初期ユーザ興味スコア作成部197が上記転送された属性に合致する属性のモデルを属性興味スコアデータベース196から読み出す。そして、図29に示す式を用いて確率結合して初期利用ユーザに関する初期の興味スコアTotalZを計算し、この計算された初期の興味スコアTotalZを上記初期利用ユーザの初期モデルとして概念体系/ユーザ興味スコアデータベース140に記憶させる。
(6)実施形態の作用効果
以上詳述したように一実施形態によれば、以下のような作用効果が奏せられる。
(1) ユーザの選択候補となる一覧リストを定義し、そこからのコンテンツ選択における概念の出現数を分析することで、各概念の出現の希少性を考慮し、且つ一覧から選ばれない概念の履歴特徴を利用することができるため、ユーザの興味を高精度に推定することが可能となる。
(2) さらに、上記ステップS15、ステップS16に示したように、特徴スコアの算出やステユーザ興味スコアの算出に際し、閲覧時のユーザの状況や閲覧操作の特徴(お気に入り登録、長時間閲覧等)などを重み係数(重みw)を介して反映することができるため、ユーザ興味スコアをさらに精度良く求めることが可能となる。
(3) また、タクソノミ(オントロジ)等で定義された概念をメタタグとして付与したコンテンツ閲覧履歴分析において、概念出現の希少性を合理的に分析に反映することが難しかったため、従来はタクソノミ(オントロジ)構造の深さを一定する等によりコンテンツに付与する概念の抽象度を統一する等のオントロジ構造側の調整が必要があった。しかし、本実施形態では概念出現の希少性を考慮するオントロジ構造によるユーザ興味スコアの更新処理により上位概念が付与されたコンテンツと、下位概念が付与されたコンテンツの閲覧履歴を統合して分析可能となる。このため、分析に利用するタクソノミ(オントロジ)への制約低減し、タクソノミ(オントロジ)の維持・運用・管理コストを低減することが可能となる。
(4) さらに、ユーザ興味スコアを用いてコンテンツに対するユーザの評価スコアを算出することで、ユーザの興味に合ったコンテンツを推薦することが可能となる。
(5) また、既存ユーザのモデルを用いて属性に関するモデルを作成し、新規ユーザ(初期利用ユーザ)が提示した自身の属性に合致したモデルを当該新規ユーザの初期モデルとして用いている。このため、ユーザが初めて情報推薦サービスを利用する場合であっても、比較的良い推薦結果を得ることができる。しかも、上記属性に関するモデルを既存ユーザのモデルを用いて確率結合することにより作成しているので、少ない計算量で属性毎のモデルを作成することができる。
(6) さらに、確率結合処理は装置の処理負荷が少ない深夜時間帯などを選んで実施しているので、装置の処理負荷の増加を招かずに実施できる利点がある。
(7) さらに、属性が階層構造を持つ場合に、下位の属性のモデルを用いて上位の属性のモデルを作成することにより、少ない計算量で階層構造を持つ属性のモデルを作成することができる。
[他の実施形態]
なお、この発明は上記実施形態に限定されるものではなく、例えば興味分析装置の構成、属性毎のモデル作成処理及び初期モデルの作成処理の処理手順と処理内容、属性の種類等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
100…興味分析装置、200…クライアント端末、300…コンテンツサーバ、110…履歴情報受信部、120…特徴スコア算出部、130…概念体系更新処理部、140…概念体系/ユーザ興味スコアデータベース、150…提示コンテンツリスト受信部、160…コンテンツデータベース、170…コンテンツ評価処理部、180…ソート済みコンテンツスコアリスト送信部、190…属性興味スコア更新起動部、195…属性興味スコア更新部、196…属性興味スコアデータベース、197…初期ユーザ興味スコア作成部、198…ユーザ/属性情報データベース、210…履歴収集部、220…履歴情報送信部、230…コンテンツ提示部、240…コンテンツ要求送信部、250…属性提示部、310…コンテンツ送信処理部、320…ソート済み提示コンテンツリスト受信部、330…提示コンテンツリスト送信部、340…提示コンテンツリスト入力部、350…履歴情報転送部、360…コンテンツ要求転送部、370…属性転送部。

Claims (7)

  1. コンピュータによって、概念出現の希少性を表す情報を利用して情報利用者の興味を推定し、その推定結果を用いて情報利用者毎に所定の概念に対する興味の度合いを表すモデルを作成し、この作成されたモデルを用いて前記情報利用者毎の興味を分析する方法であって、
    前記情報利用者によるコンテンツの選択履歴を表す情報をもとに、当該既存の情報利用者の属性毎のモデルを作成して第1の記憶部に保存する第1の過程と、
    新規の情報利用者の属性情報を取得する第2の過程と、
    前記取得された属性情報をもとに当該新規の情報利用者の属性と合致する既存の情報利用者の属性のモデルを前記第1の記憶部から選択的に読み出し、この読み出されたモデルをもとに前記新規の情報利用者の所定の概念に対する興味の度合いを表すモデルを作成して、この作成されたモデルを前記新規の情報利用者の初期モデルとして第2の記憶部に保存する第3の過程と、
    前記第2の記憶部に記憶されたモデルを初期モデルとして前記新規の情報利用者の興味を分析する第4の過程と
    を具備することを特徴とする興味分析方法。
  2. 前記第1の過程は、前記既存の情報利用者の属性が下位概念に対応する第1の階層とこの第1の階層より上位の概念に対応する第2の階層とを有する場合に、前記第1の階層に対応する下位概念のモデルを作成し、この第1の階層について作成された下位概念のモデルをもとに前記第2の階層に対応する上位概念のモデルを作成することを特徴とする請求項1記載の興味分析方法。
  3. 前記第1の過程は、前記コンピュータの処理負荷が予め設定した値以下となる閾値又は時間帯を設定し、前記処理負荷が前記設定された閾値以下となったとき又は前記設定された当該時間帯になったときに前記属性毎のモデルを作成する処理を実行することを特徴とする請求項1又は2記載の興味分析方法。
  4. 概念出現の希少性を表す情報を利用して情報利用者の興味を推定し、その推定結果を用いて情報利用者毎に所定の概念に対する興味の度合いを表すモデルを作成し、この作成されたモデルを用いて前記情報利用者毎の興味を分析する興味分析装置であって、
    前記情報利用者によるコンテンツの選択履歴を表す情報をもとに、当該既存の情報利用者の属性毎のモデルを作成する手段と、
    前記作成された、既存の情報利用者の属性毎のモデルを保存する第1の記憶手段と、
    新規の情報利用者の属性情報を取得する手段と、
    前記取得された属性情報をもとに当該新規の情報利用者の属性と合致する既存の情報利用者の属性のモデルを前記第1の記憶手段から選択的に読み出し、この読み出されたモデルをもとに前記新規の情報利用者の所定の概念に対する興味の度合いを表すモデルを作成する手段と、
    前記作成された新規の情報利用者に関するモデルを、当該新規の情報利用者の初期モデルとして保存する第2の記憶手段と、
    前記第2の記憶手段に記憶された初期モデルに基づいて、前記新規の情報利用者の興味を分析する手段と
    を具備することを特徴とする興味分析装置。
  5. 前記属性毎のモデルを作成する手段は、前記既存の情報利用者の属性が下位概念に対応する第1の階層とこの第1の階層より上位の概念に対応する第2の階層とを有する場合に、前記第1の階層に対応する下位概念のモデルを作成し、この第1の階層について作成された下位概念のモデルをもとに前記第2の階層に対応する上位概念のモデルを作成することを特徴とする請求項4記載の興味分析装置。
  6. 前記興味分析装置の処理負荷が予め設定した値以下となる閾値又は時間帯を設定し、前記処理負荷が前記設定された閾値以下となったとき又は前記設定された当該時間帯になったときに、前記属性毎のモデルを作成する手段に前記属性毎のモデルを作成する処理を実行させる手段を、さらに具備することを特徴とする請求項4又は5記載の興味分析装置。
  7. 請求項1乃至3のいずれかに記載の興味分析方法が備える過程に対応する処理を、前記コンピュータに実行させるプログラム。
JP2012066377A 2012-03-22 2012-03-22 興味分析方法、装置及びプログラム Active JP5668007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012066377A JP5668007B2 (ja) 2012-03-22 2012-03-22 興味分析方法、装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012066377A JP5668007B2 (ja) 2012-03-22 2012-03-22 興味分析方法、装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2013196653A true JP2013196653A (ja) 2013-09-30
JP5668007B2 JP5668007B2 (ja) 2015-02-12

Family

ID=49395446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012066377A Active JP5668007B2 (ja) 2012-03-22 2012-03-22 興味分析方法、装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5668007B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046600A (zh) * 2015-07-09 2015-11-11 传成文化传媒(上海)有限公司 一种酒店用电视的个性化信息推荐方法及系统
CN105046601A (zh) * 2015-07-09 2015-11-11 传成文化传媒(上海)有限公司 用户数据处理方法和系统
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统
JP2016206805A (ja) * 2015-04-17 2016-12-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 識別サーバ、識別方法及び識別プログラム
JP2016206987A (ja) * 2015-04-23 2016-12-08 ヤフー株式会社 配信装置、配信方法、配信プログラム、端末装置、変更方法、及び変更プログラム
WO2021135172A1 (zh) * 2019-12-31 2021-07-08 深圳创维-Rgb电子有限公司 一种电视机播放控制方法、系统、控制终端及存储介质
CN113592589A (zh) * 2021-07-27 2021-11-02 上海致景信息科技有限公司 纺织原料推荐方法、装置及处理器

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086958A (ja) * 1994-06-20 1996-01-12 Nippon Telegr & Teleph Corp <Ntt> ユーザモデル生成装置及びユーザモデル生成方法
JPH10162027A (ja) * 1996-11-29 1998-06-19 Sony Corp 情報検索方法及びその装置
JP2002041559A (ja) * 2000-07-19 2002-02-08 Hitachi Ltd 主観的データ予測方法及び装置
JP2003216622A (ja) * 2002-01-24 2003-07-31 Ricoh Co Ltd 文書分類装置、文書分類方法、その方法によったプログラムおよびそのプログラムを記憶した記憶媒体
JP2005509967A (ja) * 2001-11-13 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 第3者のステレオタイプ選好に基づいて対象品目を推奨する方法及び装置
US20060136589A1 (en) * 1999-12-28 2006-06-22 Utopy, Inc. Automatic, personalized online information and product services
EP1906316A1 (en) * 2006-09-28 2008-04-02 Deutsche Telekom AG An interactive hybrid recommender system
US20080294628A1 (en) * 2007-05-24 2008-11-27 Deutsche Telekom Ag Ontology-content-based filtering method for personalized newspapers
US20090089023A1 (en) * 2007-09-27 2009-04-02 Fujitsu Limited Model creation support system, model creation support method, and model creation support program
US7836051B1 (en) * 2003-10-13 2010-11-16 Amazon Technologies, Inc. Predictive analysis of browse activity data of users of a database access system in which items are arranged in a hierarchy
JP2011123601A (ja) * 2009-12-09 2011-06-23 Nec Corp イベント一致判定装置、イベント一致判定方法、および、イベント一致判定プログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086958A (ja) * 1994-06-20 1996-01-12 Nippon Telegr & Teleph Corp <Ntt> ユーザモデル生成装置及びユーザモデル生成方法
JPH10162027A (ja) * 1996-11-29 1998-06-19 Sony Corp 情報検索方法及びその装置
US20060136589A1 (en) * 1999-12-28 2006-06-22 Utopy, Inc. Automatic, personalized online information and product services
JP2002041559A (ja) * 2000-07-19 2002-02-08 Hitachi Ltd 主観的データ予測方法及び装置
JP2005509967A (ja) * 2001-11-13 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 第3者のステレオタイプ選好に基づいて対象品目を推奨する方法及び装置
JP2003216622A (ja) * 2002-01-24 2003-07-31 Ricoh Co Ltd 文書分類装置、文書分類方法、その方法によったプログラムおよびそのプログラムを記憶した記憶媒体
US7836051B1 (en) * 2003-10-13 2010-11-16 Amazon Technologies, Inc. Predictive analysis of browse activity data of users of a database access system in which items are arranged in a hierarchy
EP1906316A1 (en) * 2006-09-28 2008-04-02 Deutsche Telekom AG An interactive hybrid recommender system
US20080294628A1 (en) * 2007-05-24 2008-11-27 Deutsche Telekom Ag Ontology-content-based filtering method for personalized newspapers
US20090089023A1 (en) * 2007-09-27 2009-04-02 Fujitsu Limited Model creation support system, model creation support method, and model creation support program
JP2011123601A (ja) * 2009-12-09 2011-06-23 Nec Corp イベント一致判定装置、イベント一致判定方法、および、イベント一致判定プログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200300299004; 村崎 康博: 'ユーザモデルエージェントによる番組選択システム' 電子情報通信学会技術研究報告 Vol.101 No.420, 20011109 *
CSNG200900289027; 中辻 真: 'ブログデータに基づくユーザの興味オントロジ自動生成とコミュニティ形成支援手法の提案' DEWS2006論文集 [online] , 20060630 *
JPN6014018977; 村崎 康博: 'ユーザモデルエージェントによる番組選択システム' 電子情報通信学会技術研究報告 Vol.101 No.420, 20011109 *
JPN6014018980; 中辻 真: 'ブログデータに基づくユーザの興味オントロジ自動生成とコミュニティ形成支援手法の提案' DEWS2006論文集 [online] , 20060630 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016206805A (ja) * 2015-04-17 2016-12-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 識別サーバ、識別方法及び識別プログラム
JP2016206987A (ja) * 2015-04-23 2016-12-08 ヤフー株式会社 配信装置、配信方法、配信プログラム、端末装置、変更方法、及び変更プログラム
CN105046600A (zh) * 2015-07-09 2015-11-11 传成文化传媒(上海)有限公司 一种酒店用电视的个性化信息推荐方法及系统
CN105046601A (zh) * 2015-07-09 2015-11-11 传成文化传媒(上海)有限公司 用户数据处理方法和系统
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统
WO2021135172A1 (zh) * 2019-12-31 2021-07-08 深圳创维-Rgb电子有限公司 一种电视机播放控制方法、系统、控制终端及存储介质
CN113592589A (zh) * 2021-07-27 2021-11-02 上海致景信息科技有限公司 纺织原料推荐方法、装置及处理器
CN113592589B (zh) * 2021-07-27 2024-03-29 上海致景信息科技有限公司 纺织原料推荐方法、装置及处理器

Also Published As

Publication number Publication date
JP5668007B2 (ja) 2015-02-12

Similar Documents

Publication Publication Date Title
JP5668007B2 (ja) 興味分析方法、装置及びプログラム
CN110909176B (zh) 数据推荐方法、装置、计算机设备以及存储介质
CN102073699B (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
TWI636416B (zh) 內容個人化之多相排序方法和系統
JP5668010B2 (ja) 情報推薦方法、装置及びプログラム
US8146120B2 (en) Multi-criteria rating and searching system
WO2015188699A1 (zh) 推荐项目的方法和装置
JP5752245B2 (ja) 情報検索方法、情報検索装置及び記憶媒体
CN105701216A (zh) 一种信息推送方法及装置
CN105976161A (zh) 一种基于时间轴上的智能推荐日历及基于用户的呈现方法
CN102667761A (zh) 可扩展的集群数据库
CN101401062A (zh) 确定相关来源、查询及合并多个内容来源的结果的方法和系统
CN108460082A (zh) 一种推荐方法及装置,电子设备
CN105654307A (zh) 基于用户反馈的商品推荐方法和系统
JP5723835B2 (ja) 興味分析方法、興味分析装置及びそのプログラム
JP5836210B2 (ja) 影響力推定方法、装置及びプログラム
JP5667959B2 (ja) 影響度分析方法、影響度分析装置及びそのプログラム
CN113850649A (zh) 一种基于多平台用户数据的定制化推荐方法及推荐系统
JP5504213B2 (ja) 興味分析方法及び興味分析装置
CN111400609B (zh) 用户推荐方法、装置、存储介质及服务器
Zhang et al. Improving augmented reality using recommender systems
CN111078998B (zh) 信息检索方法、装置、存储介质及服务器
CN115795156A (zh) 物料召回和神经网络训练方法、装置、设备及存储介质
JP5723830B2 (ja) 興味分析方法
JP5488031B2 (ja) 検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141215

R150 Certificate of patent or registration of utility model

Ref document number: 5668007

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150