JP2013257668A - 興味分析方法、興味分析装置及びそのプログラム - Google Patents
興味分析方法、興味分析装置及びそのプログラム Download PDFInfo
- Publication number
- JP2013257668A JP2013257668A JP2012132387A JP2012132387A JP2013257668A JP 2013257668 A JP2013257668 A JP 2013257668A JP 2012132387 A JP2012132387 A JP 2012132387A JP 2012132387 A JP2012132387 A JP 2012132387A JP 2013257668 A JP2013257668 A JP 2013257668A
- Authority
- JP
- Japan
- Prior art keywords
- content
- context
- list
- interest
- concept
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【解決手段】大域コンテキスト/コンテキストID設定部117は、コンテンツの閲覧に関するコンテキスト条件を収集する。分割コンテキスト抽出処理部116は、収集されたコンテキスト条件の組合せに基づいて、興味モデルを前記組合せ毎のテーブルに分割し、組合せに含まれるコンテキスト条件間の関連性に基づいて、前記組合せ毎のテーブルから更新対象テーブルを抽出し、更新対象テーブルに対して前記関連性をもとに重みを算出する。興味モデル更新処理部130は、コンテンツ閲覧履歴から算出される特徴スコアと前記重みとを用いて前記更新対象テーブルにおける前記概念に対する前記ユーザ興味スコアを更新する。
【選択図】図2
Description
上記第2の態様によれば、コンテキスト条件を履歴量と相関させることで、対応する履歴が少ないコンテキスト条件による興味モデルの分割を避けることが出来るため、最小限のコンピューターリソースでの情報推薦の高精度化が実現できる。
上記第3の態様によれば、コンテンツ要求時のユーザ状況に適合するユーザ興味モデルを用いてコンテンツの評価スコアを算出することで、ユーザの興味に合ったコンテンツを精度良く推薦することが可能となる。
図1は、本実施形態に係る興味分析装置を用いたシステム全体図である。このシステムは、クライアント端末200と、コンテンツサーバ300と、興味分析装置100を備える。クライアント端末200とコンテンツサーバ300との間、及びコンテンツサーバ300と興味分析装置100との間はそれぞれ通信ネットワークで接続される。ユーザは、クライアント端末200上での閲覧操作により、所望のコンテンツをコンテンツサーバ300から取得し、取得したコンテンツをクライアント端末200の画面に提示して閲覧する。
興味分析装置100は、履歴情報受信部110、学習対象の興味テーブル選択処理部113、コンテキスト履歴追記処理部115、分割コンテキスト抽出処理部116、大域コンテキスト/コンテキストID設定部117、コンテンツ要求受信部121、利用興味テーブル選択処理部124、興味モデル更新処理部130、コンテキスト/関連性定義データベース131、コンテキスト別履歴量データベース132、興味スコアデータベース140、提示コンテンツリスト受信部150、コンテンツデータベース160、コンテンツ評価処理部170、及びソート済みコンテンツスコアリスト送信部180を備える。
履歴情報受信部110は、クライアント端末200から一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストをコンテンツサーバ300を介して受信する。一覧閲覧コンテンツリストとは、例えば、ユーザがコンテンツのタイトルのみを一覧で閲覧したコンテンツのリストである。詳細閲覧コンテンツリストとは、ユーザがコンテンツ本体の内容(詳細)を閲覧したコンテンツのリストである。例えば、図3において、一覧閲覧コンテンツリストには、コンテンツ1〜8が含まれ、詳細閲覧コンテンツリストには、コンテンツ1,3,4が含まれる。また、図3において、斜線パターンで示すコンテンツは、概念Bがコンテンツ1,6,7,8に出現することを示す。
しかしながら、分析対象となり得る多数のコンテキストの切り口(時刻、場所、気温、曜日、季節等)が有る場合には、全ての組合せで興味モデルを分割することは計算量及び必要なコンピュータリソースが莫大となる。また、全ての組合せについて運用者が「重み」を設定することは非常に困難である。そこで、履歴データの集まり方から、最適なコンテキスト条件を自動抽出し、コンテキスト条件の組合せからなるコンテキストセットID毎に自動で学習時のコンテキスト適合度(重み)を決定する手法を後述する。
図2において、クライアント端末200は、履歴収集部210、履歴情報送信部220、コンテンツ提示部230、コンテンツ要求送信部240、及び端末情報収集部250を備える。
コンテンツ要求送信部240は、ユーザの指示(入力)によりコンテンツサーバ300に対して、コンテンツの提示要求を行う。具体的には図5のようなコンテンツ要求データをコンテンツサーバ300に送信する。例えば、コンテンツ要求データは、クライアント端末ID(もしくはユーザID)、要求時刻及び端末コンテキスト情報を有する。なお、要求時刻は、コンテンツサーバ300において追加するようにしてもよい。クライアント端末ID(もしくはユーザID)は、端末(もしくはユーザ)毎に一意に付与される数字等であって、後述する興味スコアデータベース140のユーザ興味テーブルのユーザIDと一致するIDである。
コンテンツ提示部230は、コンテンツサーバ300から受信したソート済み提示コンテンツリストをもとに、クライアント端末200の表示画面サイズが許容する範囲でソート順の上位から一覧として表示を行う。
上記図2において、コンテンツサーバ300は、コンテンツ送信処理部310、ソート済み提示コンテンツリスト受信部320、提示コンテンツリスト送信部330、提示コンテンツリスト入力部340、履歴情報転送部350、及びコンテンツ要求転送部360を備える。
提示コンテンツリスト入力部340には、サービス運用者により、ユーザの利用するクライアント端末200に提示するコンテンツを一覧にした提示コンテンツリストが入力される。提示コンテンツリスト送信部330は、上記入力された提示コンテンツリストを興味分析装置100へ通信ネットワークを介して送信する。
コンテンツ要求転送部360は、クライアント端末200のコンテンツ要求送信部240からのコンテンツ提示要求であるコンテンツ要求データ(図5)を興味分析装置100に転送する。
次に、興味分析装置100の各部の詳細について説明する。
[コンテンツデータベース160]
図10にコンテンツデータベース160のデータ構造の一例を示す。コンテンツデータベース160は、コンテンツテーブルを有する。
[興味スコアデータベース140]
図11に興味スコアデータベース140のデータ構造の一例を示す。興味スコアデータベース140は、ユーザ興味テーブルを有する。
図12に、コンテキスト別履歴量データベース132のデータ構造の一例を示す。コンテキスト別履歴量データベース132は、コンテキスト別ユーザ履歴量テーブルと、分析対象コンテキストセットテーブルとを有する。
図13に、分割コンテキスト/関連性定義データベース131のデータ構造の一例を示す。分割コンテキスト/関連性定義データベース131は、コンテキストIDテーブルと、コンテキスト関連性テーブルとを有する。
提示コンテンツリスト受信部150は、コンテンツサーバ300から上記図9のような提示コンテンツリストを受信し、上記図10に示すコンテンツデータベース160に保存する。
[履歴情報受信部110]
図14に、履歴情報受信部110の処理フローを示す。
履歴情報受信部110は、コンテンツサーバ300の履歴情報転送部350から通信ネットワークを介してクライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト、詳細閲覧コンテンツリスト、閲覧時刻情報、及び、各測定時刻情報と組とした端末コンテキスト情報(位置情報、加速度、地軸センサ、温度計など、その他端末保有のセンサの検出結果)、を受信する。そして、クラスタID(ユニークな値)を付与して、学習対象の興味テーブル選択処理113へ出力する(A−1)。
図15に、学習対象の興味テーブル選択処理部113の処理フローを示す。学習対象の興味テーブル選択処理部113は、履歴情報受信部110からクラスタID、クライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト、詳細閲覧コンテンツリスト、閲覧時刻情報、及び端末コンテキスト情報を受信する(A−1)。
先ず、この履歴受信時のユーザのコンテキスト(状況)を取得するために、学習対象の興味テーブル選択処理部113は、クラスタID、クライアント端末ID(もしくはユーザID)、閲覧時刻情報、及び端末コンテキスト情報を大域コンテキスト/コンテキストID設定部117へ出力し(A−2)、大域コンテキスト/コンテキストID設定部117からクライアント端末ID(もしくはユーザID)と、履歴収集時点のユーザ状況や大域コンテキストに適合するコンテキストID群とを受信する(A−3)。このとき、サーバの現時点への適合を利用する方法もある。
大域コンテキスト/コンテキストID設定部117は、学習対象の興味テーブル選択処理部113からの入力(A−2)又は利用興味テーブル選択処理部124からの入力(C−2)を処理起動トリガとする。
大域コンテキスト/コンテキストID設定部117は、クライアント端末ID(もしくはユーザID)、閲覧時刻情報(C−2の場合は時刻情報)、端末コンテキスト情報、及びクラスタID(C−2の場合は省略)を受信すると、大域コンテキストを収集する。例えば、端末コンテキスト情報がGPS履歴等の位置情報を含んでいる場合は、位置情報と時刻情報に対応する気温、湿度、天気等の情報をインターネットから収集する。または、世の中で話題になっているイベント情報をインターネット等から収集、もしくは運営者が適時設定した情報を収集する。端末コンテキスト情報がGPS履歴等の位置情報を含んでいる場合は、ユーザ位置の近隣のイベント情報をインターネット等から収集、もしくは運営者が適時設定した情報を収集する。あるいは、各ユーザのツイッターやブログ等の更新情報、季節/曜日/祝日などの情報、その他、事前設定などによる、ユーザの年齢、性別、職業等のユーザプロファイル情報を収集する。
大域コンテキスト/コンテキストID設定部117は、上記収集されたコンテキスト情報群をもとに、履歴収集時点(もしくはサーバ現時点)に適合するコンテキストID群をコンテキスト/関連性定義データベース131から読み出す。そして、A−2の場合は、クラスタID、及び上記履歴収集時点(もしくはサーバ現時点)に適合するコンテキストID群とを学習対象の興味テーブル選択処理部113へ出力する(A−3)。C−2の場合は、上記履歴収集時点(もしくはサーバ現時点)に適合するコンテキストID群を利用興味テーブル選択処理部124へ出力する。
図17に、ユーザ興味モデル更新部130の処理フローを示す。ユーザ興味モデル更新部130には、学習対象の興味テーブル選択処理部113からクライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト、詳細閲覧コンテンツリスト、学習対象ユーザ興味テーブルのコンテキストセットID、及び学習対象ユーザ興味テーブルのコンテキストセット毎のw値が入力される(A−4)。
ユーザ興味モデル更新部130は、クラスタIDの一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリスト内の各コンテンツに出現する概念IDをコンテンツデータベース160から抽出する。具体的には、図7、図8において、各コンテンツIDに紐付けされている「概念ID」を図10のコンテンツデータベース160のコンテンツテーブルから検索する。ユーザ興味モデル更新部130は、クラスタデータ{クラスタID,一覧閲覧コンテンツリスト,詳細閲覧コンテンツリスト}と、コンテンツID/概念ID関連づけリスト{{コンテンツID,{関連づいている概念ID,…}},…}と、出現概念リスト{概念ID}とを生成する。「コンテンツID/概念ID関連付けリスト」とは、コンテンツIDをもとに検索された概念IDのリストである。「出現概念リスト」とは、一覧閲覧コンテンツリスト、及び詳細閲覧コンテンツリストに含まれる各コンテンツに出現する概念の概念IDを全て列挙したものである。
ユーザ興味モデル更新部130は、「出現概念リスト」の各概念について出現数を算出し、特徴スコアの算出に必要な分析パラメータを抽出し、分析パラメータリストを生成する。
図18に、分析パラメータリストのデータ構成例を示す。分析パラメータリストは、クラスタID毎に、一覧閲覧コンテンツリストのコンテンツ総数S(第1の総数)、詳細閲覧コンテンツリストのコンテンツ総数a(第2の総数)、クラスタIDに紐づいた出現概念リスト内の概念ID毎に算出するNとnがある。N(第1の出現数)は、一覧閲覧コンテンツリストにおいて当該概念IDが付与されているコンテンツ数とする。n(第2の出現数)は詳細閲覧コンテンツリストにおける当該概念IDが付与されているコンテンツ数とする。なお、上記追加した上位概念も含めて出現概念リスト内の概念IDすべてについて、Nとnを算出する。
ユーザ興味モデル更新部130は、上記分析パラメータS,a,N,nを利用して概念ID毎に特徴スコアZを算出する。図20に特徴スコア算出処理の詳細を示す。図20において、iは概念の識別子、jは、クラスタIDを示す。H1(第1の確率)は、一覧閲覧コンテンツリストに含まれる一覧閲覧コンテンツの総数S、一覧閲覧コンテンツのうち概念iが出現するコンテンツ数Nのとき、詳細閲覧コンテンツをa個ランダム選択して閲覧した場合に、概念iが出現する詳細閲覧コンテンツの数がn以上となる累積確率である。H2(第2の確率)は、一覧閲覧コンテンツリストに含まれる一覧閲覧コンテンツの総数S、一覧閲覧コンテンツのうち概念iが出現するコンテンツ数Nのとき、詳細閲覧コンテンツをa個ランダム選択して閲覧した場合に、概念iが出現する詳細閲覧コンテンツの数がn以下となる累積確率である。なお、本実施形態では、累積確率H1及びH2は、超幾何分布により求めるが、この手法に限定するものではない。他の分布の例としては、二項分布、正規分布が存在する。
そして、ユーザ興味モデル更新部130は、図20に示すように、上記算出した累積確率H1及びH2を用いて、標準正規分布の累積分布関数の逆関数により特徴スコアZを算出する。図19(c)に示すように、上記H1を累積確率とする標準正規分布の累積分布関数の逆関数により特徴スコアZを求める。なお、累積確率としてH2を利用する場合には、標準正規分布の累積分布関数の逆関数の返値の符号を負にして特徴スコアZを求める。ユーザ興味モデル更新部130は、更新対象概念リスト{クラスタID,{概念ID,特徴スコア=Z,重み=w},…}を出力する。重みwは、更新対象興味テーブルID毎のw値である。
興味モデル更新処理部130は、「更新対象概念リスト」の各概念IDのユーザ興味スコア(TotalZ)を更新する。図21に興味モデル更新処理部130の処理の詳細を示す。興味モデル更新処理部130は、コンテンツに出現した概念(出現概念)について、図21に示す各概念iに対するユーザ興味スコア更新式を用いて、ユーザ興味スコアTotalZin,及びXi(n−1),Yi(n−1)の値を求める。そして、図11の興味スコアデータベース140のユーザ興味テーブルのコンテキストセットIDに対応するレコードについて、概念ID及びクライアント端末ID(ユーザID)に対応するカラムに格納されている各値(TotalZ,X,Y)を更新する。
図22にコンテキスト履歴追記処理部115の処理フローを示す。コンテキスト履歴追記処理部115には、学習対象の興味テーブル選択処理部113からクライアント端末ID(もしくはユーザID)、上記履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群、及びクラスタIDが入力される(B−1)。
コンテキスト履歴追記処理部115は、上記入力された情報をもとに、コンテキスト別履歴量データベース132のコンテキスト別ユーザ履歴量テーブルを更新する。具体的には、クライアント端末ID(もしくはユーザID)及びコンテキストIDに対応する適合クラスタIDリストのカラムに上記入力されたクラスタIDを追記する。
コンテキスト履歴追記処理部115は、クライアント端末ID(もしくはユーザID)、及び上記履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群を分割コンテキスト抽出処理部116へ出力する(B−2)。
図23に分割コンテキスト抽出処理部116の処理フローを示す。分割コンテキスト抽出処理部116には、コンテキスト履歴追記処理部115からクライアント端末ID(もしくはユーザID)、上記履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群が入力される(B−2)。
分割コンテキスト抽出処理部116は、各クライアント端末ID(もしくはユーザID)について、コンテキスト別履歴量データベース132のコンテキスト別ユーザ履歴量テーブルを参照し、更新対象となったコンテキストID毎に他のコンテキストと組み合わせた場合の履歴量が所定の閾値を超えているかを判定し、履歴量が閾値を超えている組合せを抽出する。ここで、図12のコンテキスト別ユーザ履歴量テーブルはコンテキストID毎の適合クラスタIDリストを保存しているため、コンテキストの組合せ毎の履歴量の算出には、この組み合わされたコンテキストIDに共通して関連づけられているクラスタIDの数を数えることで実現する。
分割コンテキスト抽出処理部116は、上記履歴量閾値判定処理により、新規のコンテキストセットIDと、そのコンテキストIDが入力されると、コンテキスト/関連性定義データベース131のコンテキスト関連性テーブルを参照し、新規コンテキストセット内のコンテキストIDと、関係を持つコンテキストIDをそれぞれ抽出し、抽出されたコンテキストIDを持つコンテキストセットIDを抽出する。なお、この関係を持つコンテキストIDの抽出処理では、コンテキスト/関連性定義データベース131のコンテキスト関連性テーブルをグラフとみなし、抽出対象のコンテキストIDを起点に、複数ホップを行う。ホップ回数は「2回や3回」、もしくは「関連コンテキストIDとの距離のホップ毎の積算値」を閾値として設定する。
分割コンテキスト抽出処理部116は、上記関連コンテキストセットID抽出処理により、新規のコンテキストセットIDと、そのコンテキストID、関連するコンテキストセットID群、及びそれぞれのコンテキストセットIDとの距離が入力されると、新規のコンテキストIDと関連するコンテキストID間で相互に関係性重みを、「関連コンテキストセットID抽出」で計算したセット間の距離から算出する。このとき、距離を重みとして、0〜1の値に正規化する。正規化の方法として、平均0、分散が運営者設定値の標準正規分布関数における確率値、累積確率値において距離をZ値とした場合の結果などの方法がある。その他、ロジスティック関数を利用する方法、十分大きい数値で除す方法がある。
分割コンテキスト抽出処理部116は、新規のコンテキストセットIDと、そのコンテキストID、と上記算出された関係性重みをもとに、コンテキスト別履歴量データベース132の分析対象コンテキストセットテーブルを更新する。
図25に、コンテキスト条件に基づく重み算出処理の具体例を示す。図25では、学習時のコンテキスト条件「6時〜8時」AND[場所x」の適合度(重み)算出イメージを示す。CASE1として、「2時〜4時」AND[場所x」のデータが発生した場合は、「6時〜8時」AND[場所x」のコンテキスト条件との距離は2であるため、重み関数w=f(2)の結果を重みとして追加された履歴クラスタにて学習処理を実行する。CASE2として、「10時〜12時」AND[場所4」のデータが発生した場合は、「6時〜8時」AND[場所x」のコンテキスト条件との距離は3であるため、重み関数w=f(3)の結果を重みとして追加された履歴クラスタにて学習処理を実行する。さらに、CASE3として、「6時〜8時」AND[場所y」のデータが発生した場合は、「6時〜8時」AND[場所x」のコンテキスト条件との距離は閾値を超えているため(この例では閾値は3)、学習処理は実行しない。
図26にコンテンツ評価処理部170の処理フローを示す。コンテンツ要求受信部121は、コンテンツ要求転送部360からクライアント端末ID(もしくはユーザID)を含む、図5に示すようなコンテンツ要求データを受信する。
コンテンツ要求受信部121は、コンテンツサーバ300のコンテンツ要求転送部360から通信ネットワークを介してクライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報(位置情報、加速度、地軸センサ、温度計など、その他端末保有のセンサの測定時刻及び測定結果)を受信する。そして、クライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報を利用興味テーブル選択処理部124へ出力する(C−1)。なお、これらの情報を履歴情報受信部110にさらに転送し、学習に利用する方法もある。また、このコンテンツ要求の履歴について、クライアント端末側で履歴収集し、コンテンツ要求送信部240から履歴情報収集部210に情報を通知し、興味分析装置100に送信する方法もある。
図27に、利用興味テーブル選択処理部124の処理フローを示す。利用興味テーブル選択処理部124は、コンテンツ要求受信部121からクライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報を受信する(C−1)。
利用興味テーブル選択処理部124は、クライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報を大域コンテキスト/コンテキストID設定部117へ出力し(C−2)、大域コンテキスト/コンテキストID設定部117からクライアント端末ID(もしくはユーザID)及び履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群を受信する(C−3)。
上記適合コンテキストIDの読み出し処理により、大域コンテキスト/コンテキストID設定部117から、クライアント端末ID(もしくはユーザID)、履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群が入力される。と、利用興味テーブル選択処理部124は、コンテキストIDがそろった時点で、コンテキスト別履歴量DB132の分析対象コンテキストセットテーブルからコンテキスト条件が適合するコンテキストセットIDを取得する。なお、複数のコンテキストセットIDが取得される場合は、コンテキストセットにおいて、もっともコンテキスト条件数が多いものを選択する。そして、利用興味テーブル選択処理部124は、クライアント端末ID(もしくはユーザID)、利用するユーザ興味テーブルに対応するコンテキストセットIDを出力する(C−4)。
図28にコンテンツ評価処理部170の処理フローを示す。コンテンツ評価処理部170には、コンテンツデータベース160のコンテンツテーブルから読み出した図7のような形式の提示コンテンツリストと、利用興味テーブル選択処理部124からクライアント端末ID(もしくはユーザID)、利用するユーザ興味テーブルのレコードを決定するためのコンテキストセットIDが入力される。
コンテンツ評価処理部170は、提示コンテンツリストから、利用するコンテキストセットIDが合致するユーザ興味テーブルのレコードを用いてコンテンツの評価を行う。そして、コンテンツ評価処理部170は、評価対象のコンテンツについて、評価スコアを算出し、図29に示すようなコンテンツスコアリストを生成する。コンテンツスコアリストは、コンテンツID、評価スコア、コンテンツ本体、及びコンテンツ登録時刻を有する。
変形例1としては、EntityZx=MAX(TotalZi*Wi)により求める。MAX(TotalZi*Wi)は、i∈pのTotalZi*Wiの最大値を返す関数とする。
(コンテンツをスコア順にソート)
コンテンツ評価処理部170は、コンテンツスコアリストに含まれるコンテンツを評価スコアEntityZxの降順にソートし、ソート済みコンテンツスコアリストをコンテンツスコアリスト送信部180に出力する。
ソート済みコンテンツスコアリスト送信部180は、コンテンツ評価処理部170から入力されるソート済みコンテンツスコアリストとクライアント端末ID(もしくはユーザID)を通信ネットワークを介してコンテンツサーバ300に送信する。
分析対象となり得る多数のコンテキストの切り口(時刻、場所、気温、曜日、季節等)が有る場合には、全ての組合せで計算することは計算量が莫大となる。また、全ての組合せについて運用者が「重み」を設定することは非常に困難である。本実施形態の手法によれば、コンテキスト条件自動判別機能により処理コストや運用コストが削減でき、多様なコンテキストを考慮した、適切なコンテキスト条件による分析により情報推薦を高精度化できる。
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
Claims (7)
- 複数の概念のそれぞれに対してユーザ興味スコアを有する興味モデルを用いて、前記概念を含むコンテンツの閲覧履歴からユーザの興味を分析する方法であって、
複数のコンテンツを一覧として閲覧した第1のコンテンツリストと、前記第1のコンテンツリストからコンテンツの本体を閲覧した第2のコンテンツリストとをクラスタ化するステップと、
前記クラスタ毎に、前記第1のコンテンツリストのコンテンツの総数を第1の総数と、前記第1のコンテンツリストにおいて前記概念が出現するコンテンツの数を第1の出現数と、前記第2のコンテンツリストのコンテンツの総数を第2の総数と、前記第2のコンテンツリストにおいて前記概念が出現するコンテンツの数を第2の出現数としたとき、前記第1の総数、前記第1の出現数、及び前記第2の総数の条件下で、前記第2のコンテンツリストに前記概念が出現するコンテンツの数が、前記第2の出現数以上となる第1の確率及び前記第2の出現数以下となる第2の確率を算出し、前記第1の確率及び前記第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアを算出する算出ステップと、
前記コンテンツの閲覧に関するコンテキスト条件を収集するステップと、
前記収集されたコンテキスト条件の組合せに基づいて、前記興味モデルを前記組合せ毎のテーブルに分割するステップと、
前記組合せに含まれるコンテキスト条件間の関連性に基づいて、前記組合せ毎のテーブルから更新対象テーブルを抽出するステップと、
前記更新対象テーブルに対して前記関連性をもとに重みを算出するステップと、
前記特徴スコアと前記重みとを用いて前記更新対象テーブルにおける前記概念に対する前記ユーザ興味スコアを更新するステップと
を有することを特徴とする興味分析方法。 - 前記コンテキスト条件に適合する閲覧履歴の量に基づいて、前記興味モデルを前記組合せ毎のテーブルに分割することを特徴とする請求項1に記載の興味分析方法。
- コンテンツ要求時のコンテキスト条件を収集し、当該コンテキスト条件に適合するテーブルを用いて、コンテンツに対する評価スコアを算出するステップをさらに有することを特徴とする請求項1又は2に記載の興味分析方法。
- 複数の概念のそれぞれに対してユーザ興味スコアを有する興味モデルを用いて、前記概念を含むコンテンツの閲覧履歴からユーザの興味を分析する装置であって、
複数のコンテンツを一覧として閲覧した第1のコンテンツリストと、前記第1のコンテンツリストからコンテンツの本体を閲覧した第2のコンテンツリストとをクラスタ化する手段と、
前記クラスタ毎に、前記第1のコンテンツリストのコンテンツの総数を第1の総数と、前記第1のコンテンツリストにおいて前記概念が出現するコンテンツの数を第1の出現数と、前記第2のコンテンツリストのコンテンツの総数を第2の総数と、前記第2のコンテンツリストにおいて前記概念が出現するコンテンツの数を第2の出現数としたとき、前記第1の総数、前記第1の出現数、及び前記第2の総数の条件下で、前記第2のコンテンツリストに前記概念が出現するコンテンツの数が、前記第2の出現数以上となる第1の確率及び前記第2の出現数以下となる第2の確率を算出し、前記第1の確率及び前記第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアを算出する算出手段と、
前記コンテンツの閲覧に関するコンテキスト条件を収集する手段と、
前記収集されたコンテキスト条件の組合せに基づいて、前記興味モデルを前記組合せ毎のテーブルに分割する手段と、
前記組合せに含まれるコンテキスト条件間の関連性に基づいて、前記組合せ毎のテーブルから更新対象テーブルを抽出する手段と、
前記更新対象テーブルに対して前記関連性をもとに重みを算出する手段と、
前記特徴スコアと前記重みとを用いて前記更新対象テーブルにおける前記概念に対する前記ユーザ興味スコアを更新する手段と
を有することを特徴とする興味分析装置。 - 前記コンテキスト条件に適合する閲覧履歴の量に基づいて、前記興味モデルを前記組合せ毎のテーブルに分割することを特徴とする請求項4に記載の興味分析装置。
- コンテンツ要求時のコンテキスト条件を収集し、当該コンテキスト条件に適合するテーブルを用いて、コンテンツに対する評価スコアを算出する手段をさらに有することを特徴とする請求項4又は5に記載の興味分析装置。
- 請求項4乃至6のいずれか1項に記載の興味分析装置を構成する各手段としてコンピュータを機能させる興味分析装置プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012132387A JP5723835B2 (ja) | 2012-06-11 | 2012-06-11 | 興味分析方法、興味分析装置及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012132387A JP5723835B2 (ja) | 2012-06-11 | 2012-06-11 | 興味分析方法、興味分析装置及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013257668A true JP2013257668A (ja) | 2013-12-26 |
JP5723835B2 JP5723835B2 (ja) | 2015-05-27 |
Family
ID=49954073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012132387A Expired - Fee Related JP5723835B2 (ja) | 2012-06-11 | 2012-06-11 | 興味分析方法、興味分析装置及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5723835B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017146683A (ja) * | 2016-02-16 | 2017-08-24 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP2017151867A (ja) * | 2016-02-26 | 2017-08-31 | ヤフー株式会社 | 更新装置、更新方法、及び更新プログラム |
CN107483613A (zh) * | 2017-08-31 | 2017-12-15 | 江西博瑞彤芸科技有限公司 | 一种信息推送方法 |
JP2020129409A (ja) * | 2016-02-16 | 2020-08-27 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP2021149553A (ja) * | 2020-03-19 | 2021-09-27 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
CN113592589A (zh) * | 2021-07-27 | 2021-11-02 | 上海致景信息科技有限公司 | 纺织原料推荐方法、装置及处理器 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010237916A (ja) * | 2009-03-31 | 2010-10-21 | Denso It Laboratory Inc | コンテンツ検索装置、方法及びプログラム |
JP2012053863A (ja) * | 2010-08-06 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | 情報推薦処理装置とそのプログラム |
-
2012
- 2012-06-11 JP JP2012132387A patent/JP5723835B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010237916A (ja) * | 2009-03-31 | 2010-10-21 | Denso It Laboratory Inc | コンテンツ検索装置、方法及びプログラム |
JP2012053863A (ja) * | 2010-08-06 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | 情報推薦処理装置とそのプログラム |
Non-Patent Citations (2)
Title |
---|
CSNG201200161012; 佐藤 妙: 'ユーザの興味と情報発信者からの影響度を融合した情報パーソナライズ方法の提案' 電子情報通信学会技術研究報告 Vol.111 No.470, 20120301, 73-78ページ, 社団法人電子情報通信学会 * |
JPN6014055063; 佐藤 妙: 'ユーザの興味と情報発信者からの影響度を融合した情報パーソナライズ方法の提案' 電子情報通信学会技術研究報告 Vol.111 No.470, 20120301, 73-78ページ, 社団法人電子情報通信学会 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017146683A (ja) * | 2016-02-16 | 2017-08-24 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP2020129409A (ja) * | 2016-02-16 | 2020-08-27 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP2017151867A (ja) * | 2016-02-26 | 2017-08-31 | ヤフー株式会社 | 更新装置、更新方法、及び更新プログラム |
CN107483613A (zh) * | 2017-08-31 | 2017-12-15 | 江西博瑞彤芸科技有限公司 | 一种信息推送方法 |
CN107483613B (zh) * | 2017-08-31 | 2020-07-14 | 江西博瑞彤芸科技有限公司 | 一种信息推送方法 |
JP2021149553A (ja) * | 2020-03-19 | 2021-09-27 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
JP7189905B2 (ja) | 2020-03-19 | 2022-12-14 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
CN113592589A (zh) * | 2021-07-27 | 2021-11-02 | 上海致景信息科技有限公司 | 纺织原料推荐方法、装置及处理器 |
CN113592589B (zh) * | 2021-07-27 | 2024-03-29 | 上海致景信息科技有限公司 | 纺织原料推荐方法、装置及处理器 |
Also Published As
Publication number | Publication date |
---|---|
JP5723835B2 (ja) | 2015-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3779841B1 (en) | Method, apparatus and system for sending information, and computer-readable storage medium | |
CN106156127B (zh) | 选择数据内容向终端推送的方法及装置 | |
JP5962926B2 (ja) | レコメンダシステム、レコメンド方法、及びプログラム | |
TWI636416B (zh) | 內容個人化之多相排序方法和系統 | |
JP5723835B2 (ja) | 興味分析方法、興味分析装置及びそのプログラム | |
CN103106285B (zh) | 一种基于信息安全专业社交网络平台的推荐算法 | |
WO2018040069A1 (zh) | 信息推荐系统及方法 | |
JP5615857B2 (ja) | 分析装置、分析方法及び分析プログラム | |
CN108846097B (zh) | 用户的兴趣标签表示方法、文章推荐方法、及装置、设备 | |
CN105976161A (zh) | 一种基于时间轴上的智能推荐日历及基于用户的呈现方法 | |
JP5668010B2 (ja) | 情報推薦方法、装置及びプログラム | |
JP5668007B2 (ja) | 興味分析方法、装置及びプログラム | |
US20130110803A1 (en) | Search driven user interface for navigating content and usage analytics | |
CN113850649A (zh) | 一种基于多平台用户数据的定制化推荐方法及推荐系统 | |
CN103235822A (zh) | 数据库的生成及查询方法 | |
JP5836210B2 (ja) | 影響力推定方法、装置及びプログラム | |
JP5667959B2 (ja) | 影響度分析方法、影響度分析装置及びそのプログラム | |
CN115827956A (zh) | 一种数据信息检索方法、装置、电子设备及存储介质 | |
JP5504213B2 (ja) | 興味分析方法及び興味分析装置 | |
CN113761084B (zh) | 一种poi搜索排序模型训练方法、排序装置与方法及介质 | |
CN106021423A (zh) | 基于群组划分的元搜索引擎个性化结果推荐方法 | |
CN105389714A (zh) | 一种从行为数据识别用户特性的方法 | |
CN105590234A (zh) | 一种向目标用户推荐商品的方法和系统 | |
CN110309406B (zh) | 点击率预估方法、装置、设备及存储介质 | |
CN113704617A (zh) | 物品推荐方法、系统、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150324 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5723835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |