JP2013257668A - Interest analysis method, interest analyzer and program of the same - Google Patents

Interest analysis method, interest analyzer and program of the same Download PDF

Info

Publication number
JP2013257668A
JP2013257668A JP2012132387A JP2012132387A JP2013257668A JP 2013257668 A JP2013257668 A JP 2013257668A JP 2012132387 A JP2012132387 A JP 2012132387A JP 2012132387 A JP2012132387 A JP 2012132387A JP 2013257668 A JP2013257668 A JP 2013257668A
Authority
JP
Japan
Prior art keywords
content
context
list
interest
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012132387A
Other languages
Japanese (ja)
Other versions
JP5723835B2 (en
Inventor
Masanari Fujita
将成 藤田
Tae Sato
妙 佐藤
Koji Ito
浩二 伊藤
Minoru Kobayashi
稔 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012132387A priority Critical patent/JP5723835B2/en
Publication of JP2013257668A publication Critical patent/JP2013257668A/en
Application granted granted Critical
Publication of JP5723835B2 publication Critical patent/JP5723835B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To enable information recommendation precision to be enhanced by automatically extracting an optimal context condition.SOLUTION: A global context/context ID setting part 117 collects context conditions related to content browsing. A divided context extracting and processing part 116 divides an interest model into tables for combination, on the basis of the combinations of the collected context conditions, and extracts a table to be updated from the tables for each combination, on the basis of a relationship between the context conditions included in the combinations, to calculate a weight for the table to be updated on the basis of the relationship. An interest model updating and processing part 130 updates a user interest score with respect to a concept of the table to be updated by using a feature score calculated from content browsing history and the weight.

Description

この発明は、ユーザのコンテンツ閲覧履歴と、閲覧対象コンテンツを代表する概念を示すメタ情報を利用してコンテキストを考慮してユーザの興味を分析する興味分析方法、興味分析装置及びそのプログラムに関する。   The present invention relates to an interest analysis method, an interest analysis apparatus, and a program for analyzing an interest of a user in consideration of a context by using meta information indicating a user's content browsing history and a concept representative of browsing target content.

ユーザの行動や状況に合わせて適切なサービス・コンテンツをリコメンドする技術が望まれている。このため、書籍通販サイトにて、サイト内での書籍情報閲覧履歴からユーザの興味を推定して書籍をリコメンドする等、履歴情報からユーザの趣味嗜好等を推定する技術が提案されている。このような方法において、各コンテンツに内容をサマライズするメタ情報が付与されていることを前提として、ユーザ履歴において出現する概念等の頻度からユーザの興味等を推定する方法は、内容ベースフィルタリング手法(Content Based Filtering: CBF)で、特にメモリベース手法として研究が進められている。   There is a demand for a technique for recommending appropriate services and contents in accordance with user actions and situations. For this reason, a technique for estimating a user's hobbies and the like from history information has been proposed, such as estimating a user's interest from a book information browsing history within the site and recommending a book. In such a method, assuming that meta information for summarizing contents is given to each content, a method for estimating the user's interest and the like from the frequency of concepts and the like appearing in the user history is a content-based filtering method ( Content Based Filtering (CBF) is being researched especially as a memory-based method.

具体的に、内容ベースフィルタリング技術とは、例えば特定ブランド(ブランドを示す情報を概念タグを保持)の商品を閲覧した場合に、同じブランドの商品(同じ概念タグを保持)を提示する。この場合の、メモリベース手法は、過去に閲覧した履歴から、特定ブランドを頻繁に閲覧していれば、特定ブランドの商品を提示することとなる。このような技術において、履歴を候補アイテムからの選択と見なして分析する手法が存在する。また、このような手法では、コンテキストの変化を学習時の重み、及び学習モデルの切り替えとして扱うことが可能である(例えば、非特許文献1又は2を参照。)。   Specifically, the content-based filtering technique presents products of the same brand (holding the same concept tag) when browsing products of a specific brand (information indicating the brand holds the concept tag). In this case, the memory-based method presents a product of a specific brand if the specific brand is frequently browsed from the history of browsing in the past. In such a technique, there is a method for analyzing a history as a selection from candidate items. Also, with such a method, it is possible to handle context changes as learning weights and learning model switching (see, for example, Non-Patent Document 1 or 2).

奥 健太,中島 伸介,宮崎 純,植村 俊亮,「Context-Aware SVMに基づく状況依存型情報推薦方式の提案」,日本データベース学会,DBSJ Letters Vol.5,No.1,pp.1-4,2006年6月Kenta Oku, Shinsuke Nakajima, Jun Miyazaki, Toshiaki Uemura, “Proposal of Context-Aware SVM-based Context-Aware Information Recommendation Method”, Database Society of Japan, DBSJ Letters Vol.5, No.1, pp.1-4, 2006 June Alexandros Karatzoglou,Xavier Amatriain,Linas Baltrunas,Nuria Oliver,Multiverse Recommendation: N-dimensional Tensor Factorization for Context-aware Collaborative Filtering,RecSys 2010: 79-86Alexandros Karatzoglou, Xavier Amatriain, Linas Baltrunas, Nuria Oliver, Multiverse Recommendation: N-dimensional Tensor Factorization for Context-aware Collaborative Filtering, RecSys 2010: 79-86

ところが、従来技術においては、コンテキストの定義について、人手で適切な分類を事前に決定する必要があった。このため、適切なコンテキストを設定することは稼働がかかり困難であった。また、コンテキストを設定した場合も、適切な設定でなければ、コンテキストに当てはまる履歴が十分に収集出来ず、適切な推薦結果を得られないという問題があった。   However, in the prior art, it was necessary to manually determine an appropriate classification in advance for the definition of the context. For this reason, it has been difficult to set an appropriate context. In addition, even when the context is set, there is a problem that if the setting is not appropriate, the history applicable to the context cannot be sufficiently collected and an appropriate recommendation result cannot be obtained.

この発明は上記事情に着目してなされたもので、その目的とするところは、最適なコンテキスト条件を自動的に抽出し、情報推薦精度の高度化を可能にする興味分析方法、興味分析装置及びそのプログラムを提供することにある。   The present invention has been made paying attention to the above circumstances, and the object of the present invention is to automatically extract an optimal context condition and to improve the accuracy of information recommendation, an interest analysis method, an interest analysis device, and To provide that program.

上記目的を達成するためにこの発明の第1の態様は、複数の概念のそれぞれに対してユーザ興味スコアを有する興味モデルを用いて、前記概念を含むコンテンツの閲覧履歴からユーザの興味を分析する方法、装置及びプログラムであって、複数のコンテンツを一覧として閲覧した第1のコンテンツリストと、前記第1のコンテンツリストからコンテンツの本体を閲覧した第2のコンテンツリストとをクラスタ化し、前記クラスタ毎に、前記第1のコンテンツリストのコンテンツの総数を第1の総数と、前記第1のコンテンツリストにおいて前記概念が出現するコンテンツの数を第1の出現数と、前記第2のコンテンツリストのコンテンツの総数を第2の総数と、前記第2のコンテンツリストにおいて前記概念が出現するコンテンツの数を第2の出現数としたとき、前記第1の総数、前記第1の出現数、及び前記第2の総数の条件下で、前記第2のコンテンツリストに前記概念が出現するコンテンツの数が、前記第2の出現数以上となる第1の確率及び前記第2の出現数以下となる第2の確率を算出し、前記第1の確率及び前記第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアを算出し、前記コンテンツの閲覧に関するコンテキスト条件を収集し、前記収集されたコンテキスト条件の組合せに基づいて、前記興味モデルを前記組合せ毎のテーブルに分割し、前記組合せに含まれるコンテキスト条件間の関連性に基づいて、前記組合せ毎のテーブルから更新対象テーブルを抽出し、前記更新対象テーブルに対して前記関連性をもとに重みを算出し、前記特徴スコアと前記重みとを用いて前記更新対象テーブルにおける前記概念に対する前記ユーザ興味スコアを更新するものである。   To achieve the above object, according to a first aspect of the present invention, an interest model having a user interest score for each of a plurality of concepts is used to analyze a user's interest from a browsing history of content including the concepts. A method, an apparatus, and a program, wherein a first content list browsing a plurality of contents as a list and a second content list browsing contents bodies from the first content list are clustered, and each cluster In addition, the total number of contents in the first content list is the first total number, the number of contents in which the concept appears in the first content list is the first appearance number, and the contents in the second content list The second total number and the second content list the number of contents in which the concept appears in the second content list. When the number of appearances is used, the number of contents in which the concept appears in the second content list under the conditions of the first total number, the first number of appearances, and the second total number is the second number. A first probability that is equal to or greater than the number of occurrences and a second probability that is equal to or less than the second number of occurrences, and a cumulative distribution function of a standard normal distribution based on the first and second probabilities The feature score is calculated by the inverse function of the above, the context conditions regarding the browsing of the content are collected, the interest model is divided into the table for each combination based on the combination of the collected context conditions, and included in the combination An update target table is extracted from the table for each combination based on the relationship between the context conditions to be calculated, a weight is calculated for the update target table based on the relationship, It is intended to update the user interest score for the concepts in the update target table using A and the said weight.

上記第1の態様によれば、履歴データの集まり方から、コンテキスト条件を自動抽出し、自動抽出したコンテキスト条件について、自動で学習時のコンテキスト適合度(重み)を決定することが可能となる。これにより、コンテキスト条件自動判別機能により処理コストや運用コストが削減でき、多様なコンテキストを考慮した、適切なコンテキスト条件による分析により情報推薦を高精度化できる。   According to the first aspect, it is possible to automatically extract context conditions from the way of collecting history data, and automatically determine the context suitability (weight) at the time of learning for the automatically extracted context conditions. Thereby, the processing cost and the operation cost can be reduced by the context condition automatic discrimination function, and the information recommendation can be made highly accurate by analysis based on an appropriate context condition in consideration of various contexts.

この発明の第2の態様は、前記第1の態様において、前記コンテキスト条件に適合する閲覧履歴の量に基づいて、前記興味モデルを前記組合せ毎のテーブルに分割するものである。
上記第2の態様によれば、コンテキスト条件を履歴量と相関させることで、対応する履歴が少ないコンテキスト条件による興味モデルの分割を避けることが出来るため、最小限のコンピューターリソースでの情報推薦の高精度化が実現できる。
According to a second aspect of the present invention, in the first aspect, the interest model is divided into a table for each combination based on the amount of browsing history that matches the context condition.
According to the second aspect, by correlating the context condition with the history amount, it is possible to avoid the division of the interest model based on the context condition having a small corresponding history. Accuracy can be realized.

この発明の第3の態様は、前記第1又は第2の態様において、コンテンツ要求時のコンテキスト条件を収集し、当該コンテキスト条件に適合するテーブルを用いて、コンテンツに対する評価スコアを算出するものである。
上記第3の態様によれば、コンテンツ要求時のユーザ状況に適合するユーザ興味モデルを用いてコンテンツの評価スコアを算出することで、ユーザの興味に合ったコンテンツを精度良く推薦することが可能となる。
According to a third aspect of the present invention, in the first or second aspect, context conditions at the time of content request are collected, and an evaluation score for the content is calculated using a table that matches the context conditions. .
According to the third aspect, by calculating a content evaluation score using a user interest model that matches a user situation at the time of content request, it is possible to recommend content that matches the user's interest with high accuracy. Become.

すなわちこの発明によれば、最適なコンテキスト条件を自動的に抽出し、情報推薦精度の高度化を可能にする興味分析方法、興味分析装置及びそのプログラムを提供することができる。   That is, according to the present invention, it is possible to provide an interest analysis method, an interest analysis device, and a program thereof that automatically extract optimum context conditions and enable information recommendation accuracy to be enhanced.

本実施形態に係る興味分析装置を用いたシステム全体図。The whole system figure using the interest analysis device concerning this embodiment. 図1の各装置の機能構成を示すブロック図。The block diagram which shows the function structure of each apparatus of FIG. 閲覧履歴を用いた興味分析処理の概要を示す図。The figure which shows the outline | summary of the interest analysis process using browsing history. コンテキスト条件を設定する場合の興味分析処理の概要を示す図。The figure which shows the outline | summary of the interest analysis process in the case of setting context conditions. コンテンツ要求データの一例を示す図。The figure which shows an example of content request data. クライアント端末上でのコンテンツ閲覧操作の一例を示す図。The figure which shows an example of content browsing operation on a client terminal. 一覧閲覧コンテンツリストのデータ構成例を示す図。The figure which shows the data structural example of a list browsing content list. 詳細閲覧コンテンツのデータ構成例を示す図。The figure which shows the data structural example of detailed browsing content. 提示コンテンツリストのデータ構成例を示す図。The figure which shows the data structural example of a presentation content list. コンテンツデータベースの一例を示す図。The figure which shows an example of a content database. ユーザ興味スコアデータベースの一例を示す図。The figure which shows an example of a user interest score database. コンテキスト別履歴量データベースの一例を示す図。The figure which shows an example of the historical amount database according to context. コンテキスト/関連性定義データベースの一例を示す図。The figure which shows an example of a context / relevance definition database. 履歴情報受信部の処理フローを示す図。The figure which shows the processing flow of a log | history information receiving part. 学習対象の興味テーブル選択処理部の処理フローを示す図。The figure which shows the processing flow of the interest table selection process part of learning object. 大域コンテキスト/コンテキスID設定部の処理フローを示す図。The figure which shows the processing flow of a global context / context ID setting part. 興味モデル更新処理部の処理フローを示す図。The figure which shows the processing flow of an interest model update process part. 分析パラメータリストのデータ構成例を示す図。The figure which shows the data structural example of an analysis parameter list. 特徴スコア算出部の動作を説明するための模式図。The schematic diagram for demonstrating operation | movement of a characteristic score calculation part. 特徴スコア算出処理の詳細を示す図。The figure which shows the detail of a characteristic score calculation process. 興味モデル更新処理の詳細を示す図。The figure which shows the detail of an interest model update process. コンテキスト履歴追記処理部の処理フローを示す図。The figure which shows the processing flow of a context log | history additional recording process part. 分割コンテキスト抽出の処理フローを示す図。The figure which shows the processing flow of division | segmentation context extraction. コンテキスト分割方法の処理概要を示す図。The figure which shows the process outline | summary of a context division | segmentation method. コンテキスト条件に基づく重み算出処理の具体例を示す図。The figure which shows the specific example of the weight calculation process based on a context condition. コンテンツ要求受信部の処理フローを示す図。The figure which shows the processing flow of a content request | requirement receiving part. 利用興味テーブル選択処理部の処理フローを示す図。The figure which shows the processing flow of a utilization interest table selection process part. コンテンツ評価処理部の処理フローを示す図。The figure which shows the processing flow of a content evaluation process part. コンテンツスコアリストの一例を示す図。The figure which shows an example of a content score list. コンテンツ評価処理の詳細を示す図。The figure which shows the detail of a content evaluation process.

以下、図面を参照してこの発明の実施の形態について詳細に説明する。
図1は、本実施形態に係る興味分析装置を用いたシステム全体図である。このシステムは、クライアント端末200と、コンテンツサーバ300と、興味分析装置100を備える。クライアント端末200とコンテンツサーバ300との間、及びコンテンツサーバ300と興味分析装置100との間はそれぞれ通信ネットワークで接続される。ユーザは、クライアント端末200上での閲覧操作により、所望のコンテンツをコンテンツサーバ300から取得し、取得したコンテンツをクライアント端末200の画面に提示して閲覧する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is an overall system diagram using the interest analysis apparatus according to the present embodiment. This system includes a client terminal 200, a content server 300, and an interest analysis device 100. The client terminal 200 and the content server 300, and the content server 300 and the interest analysis device 100 are connected to each other via a communication network. The user acquires desired content from the content server 300 through a browsing operation on the client terminal 200 and presents the acquired content on the screen of the client terminal 200 for browsing.

クライアント端末200は、ユーザ操作によるコンテンツ閲覧履歴を収集し、複数のコンテンツを一覧として閲覧した一覧閲覧コンテンツリスト(第1のコンテンツリスト)と、コンテンツの一覧からコンテンツの本体を閲覧した詳細閲覧コンテンツリスト(第2のコンテンツリスト)を閲覧時の端末コンテキスト情報と共にコンテンツサーバ300に送信する。なお、端末コンテキスト情報とは、例えば、位置情報、加速度、地軸センサ、温度計など、その他端末保有のセンサの測定時刻及び測定結果を含む。コンテンツサーバ300は、この端末コンテキスト情報と共に、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを、通信ネットワークを介して興味分析装置100に転送する。   The client terminal 200 collects a content browsing history by a user operation, browses a plurality of content as a list, a list browsing content list (first content list), and a detailed browsing content list that browses the content body from the content list The (second content list) is transmitted to the content server 300 together with the terminal context information at the time of browsing. Note that the terminal context information includes, for example, measurement time and measurement results of other terminal-owned sensors such as position information, acceleration, earth axis sensors, and thermometers. The content server 300 transfers the list browsing content list and the detailed browsing content list together with the terminal context information to the interest analysis device 100 via the communication network.

興味分析装置100は、複数の概念のそれぞれに対してユーザ興味スコアを有する興味モデルを用いて、概念をメタ情報として含むコンテンツの閲覧履歴からユーザの興味を分析する。具体的には、上記一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストとを利用して、コンテンツに出現する各概念に対する特徴スコア及びユーザ興味スコアを算出し、ユーザの興味を推定する。興味分析装置100は、このユーザ興味スコアに基づいて、コンテンツサーバ300から受け取った「提示コンテンツリスト」から、ユーザの興味に合わせてソートを行ったコンテンツのリスト(ソート済み提示コンテンツリスト)を生成し、コンテンツサーバ300に送信する。   The interest analysis apparatus 100 analyzes a user's interest from a browsing history of content including the concept as meta information, using an interest model having a user interest score for each of the plurality of concepts. Specifically, using the list browsing content list and the detailed browsing content list, a feature score and a user interest score for each concept appearing in the content are calculated, and the user's interest is estimated. Based on this user interest score, the interest analysis apparatus 100 generates a list of contents sorted according to the user's interest (sorted presented content list) from the “presentation content list” received from the content server 300. To the content server 300.

図2は、図1の各装置の機能構成を示すブロック図である。図2中の各部は、例えば、各装置のCPU(Central Processing Unit)とメモリ上で実行される制御プログラムにより実現することができる。
興味分析装置100は、履歴情報受信部110、学習対象の興味テーブル選択処理部113、コンテキスト履歴追記処理部115、分割コンテキスト抽出処理部116、大域コンテキスト/コンテキストID設定部117、コンテンツ要求受信部121、利用興味テーブル選択処理部124、興味モデル更新処理部130、コンテキスト/関連性定義データベース131、コンテキスト別履歴量データベース132、興味スコアデータベース140、提示コンテンツリスト受信部150、コンテンツデータベース160、コンテンツ評価処理部170、及びソート済みコンテンツスコアリスト送信部180を備える。
FIG. 2 is a block diagram showing a functional configuration of each device in FIG. Each unit in FIG. 2 can be realized by, for example, a CPU (Central Processing Unit) of each device and a control program executed on a memory.
The interest analysis device 100 includes a history information receiving unit 110, a learning target interest table selection processing unit 113, a context history additional processing unit 115, a divided context extraction processing unit 116, a global context / context ID setting unit 117, and a content request receiving unit 121. , Use interest table selection processing unit 124, interest model update processing unit 130, context / relevance definition database 131, context-specific history amount database 132, interest score database 140, presentation content list reception unit 150, content database 160, content evaluation processing Unit 170 and sorted content score list transmission unit 180.

図3に、興味分析装置100の閲覧履歴を用いた興味分析処理の概要を示す。
履歴情報受信部110は、クライアント端末200から一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストをコンテンツサーバ300を介して受信する。一覧閲覧コンテンツリストとは、例えば、ユーザがコンテンツのタイトルのみを一覧で閲覧したコンテンツのリストである。詳細閲覧コンテンツリストとは、ユーザがコンテンツ本体の内容(詳細)を閲覧したコンテンツのリストである。例えば、図3において、一覧閲覧コンテンツリストには、コンテンツ1〜8が含まれ、詳細閲覧コンテンツリストには、コンテンツ1,3,4が含まれる。また、図3において、斜線パターンで示すコンテンツは、概念Bがコンテンツ1,6,7,8に出現することを示す。
FIG. 3 shows an overview of the interest analysis process using the browsing history of the interest analysis device 100.
The history information receiving unit 110 receives the list browsing content list and the detailed browsing content list from the client terminal 200 via the content server 300. The list browsing content list is, for example, a list of content in which the user browses only the content titles in a list. The detailed browsing content list is a list of content that the user has viewed the content (details) of the content body. For example, in FIG. 3, the list browsing content list includes contents 1 to 8, and the detailed browsing content list includes contents 1, 3, and 4. In FIG. 3, the content indicated by the hatched pattern indicates that the concept B appears in the content 1, 6, 7, and 8.

興味モデル更新処理部130は、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを利用して、概念選択の統計モデルにより各概念の特徴スコア(後述するZ値)を算出する。さらに、後述するコンテキストセットID毎に分割される興味モデル(コンテキストセットID毎のユーザ興味テーブル)について、上記特徴スコアを用いてユーザ興味スコアを更新する。   The interest model update processing unit 130 uses the list browsing content list and the detailed browsing content list to calculate a feature score (Z value to be described later) of each concept using a statistical model of concept selection. Further, for the interest model (user interest table for each context set ID) divided for each context set ID, which will be described later, the user interest score is updated using the characteristic score.

コンテンツ評価処理部170は、評価コンテンツに出現する各概念のユーザ興味スコアを利用して確率結合によってコンテンツに対するユーザの評価スコアを算出する。図3の例では、コンテンツ1に出現する概念E,F,Dのユーザ興味スコアを用いて評価コンテンツ1の評価スコアを求めている。   The content evaluation processing unit 170 calculates the user's evaluation score for the content by probability combining using the user interest score of each concept appearing in the evaluation content. In the example of FIG. 3, the evaluation score of the evaluation content 1 is obtained using the user interest scores of the concepts E, F, and D that appear in the content 1.

図4は、コンテキスト条件を設定する場合の興味分析処理の概要を示す図である。興味モデル更新処理部130は、分析対象とすべきコンテキスト条件(コンテキストID)のセットを示すコンテキストセットIDと、そのコンテキストセットID向けの学習重みを自動抽出する。この例では、単純な例を示す。具体的には、コンテキストセットID(簡単化のためセットと呼称しても実際は時間帯のコンテキストIDのみを持つ)を1時間毎(24個)用意し、閲覧時刻をもとに重み付きで学習する。例えば、10:35に閲覧履歴が発生したとすると、この時刻に該当する興味テーブル(MODEL10)と、その時間的に近傍の興味テーブル(例えば、MODEL9,11)も同時に更新する。興味テーブルは、コンテキストセットIDが共通のレコードの集合を示す。   FIG. 4 is a diagram showing an overview of the interest analysis process when setting a context condition. The interest model update processing unit 130 automatically extracts a context set ID indicating a set of context conditions (context IDs) to be analyzed and a learning weight for the context set ID. This example shows a simple example. Specifically, context set IDs (24 sets) are prepared for each hour (same as a set for simplification but actually have only a time zone context ID), and weighted learning based on the browsing time To do. For example, if a browsing history occurs at 10:35, the interest table (MODEL 10) corresponding to this time and the interest tables nearby (for example, MODEL 9, 11) are updated simultaneously. The interest table indicates a set of records having a common context set ID.

コンテンツ評価処理部170は、コンテンツ要求時刻に適合する興味テーブルを用いてコンテンツを評価する。例えば、図4に示すように12:10にレコメンドする場合は、興味テーブル(MODEL12)を用いてコンテンツ評価を行う。
しかしながら、分析対象となり得る多数のコンテキストの切り口(時刻、場所、気温、曜日、季節等)が有る場合には、全ての組合せで興味モデルを分割することは計算量及び必要なコンピュータリソースが莫大となる。また、全ての組合せについて運用者が「重み」を設定することは非常に困難である。そこで、履歴データの集まり方から、最適なコンテキスト条件を自動抽出し、コンテキスト条件の組合せからなるコンテキストセットID毎に自動で学習時のコンテキスト適合度(重み)を決定する手法を後述する。
The content evaluation processing unit 170 evaluates content using an interest table that matches the content request time. For example, when recommending at 12:10 as shown in FIG. 4, content evaluation is performed using the interest table (MODEL 12).
However, if there are a lot of contextual cuts (time, place, temperature, day of the week, season, etc.) that can be analyzed, dividing the interest model by all combinations requires enormous amounts of computation and necessary computer resources. Become. Further, it is very difficult for the operator to set “weight” for all combinations. Therefore, a method for automatically extracting optimum context conditions from the way of collecting history data and automatically determining the context suitability (weight) at the time of learning for each context set ID consisting of a combination of context conditions will be described later.

(クライアント端末)
図2において、クライアント端末200は、履歴収集部210、履歴情報送信部220、コンテンツ提示部230、コンテンツ要求送信部240、及び端末情報収集部250を備える。
コンテンツ要求送信部240は、ユーザの指示(入力)によりコンテンツサーバ300に対して、コンテンツの提示要求を行う。具体的には図5のようなコンテンツ要求データをコンテンツサーバ300に送信する。例えば、コンテンツ要求データは、クライアント端末ID(もしくはユーザID)、要求時刻及び端末コンテキスト情報を有する。なお、要求時刻は、コンテンツサーバ300において追加するようにしてもよい。クライアント端末ID(もしくはユーザID)は、端末(もしくはユーザ)毎に一意に付与される数字等であって、後述する興味スコアデータベース140のユーザ興味テーブルのユーザIDと一致するIDである。
(Client terminal)
2, the client terminal 200 includes a history collection unit 210, a history information transmission unit 220, a content presentation unit 230, a content request transmission unit 240, and a terminal information collection unit 250.
The content request transmission unit 240 makes a content presentation request to the content server 300 in accordance with a user instruction (input). Specifically, content request data as shown in FIG. 5 is transmitted to the content server 300. For example, the content request data includes a client terminal ID (or user ID), a request time, and terminal context information. The request time may be added in the content server 300. The client terminal ID (or user ID) is a number uniquely assigned to each terminal (or user), and is an ID that matches a user ID in a user interest table of the interest score database 140 described later.

図6は、クライアント端末200上でのユーザによるコンテンツ閲覧操作の一例を示したものである。
コンテンツ提示部230は、コンテンツサーバ300から受信したソート済み提示コンテンツリストをもとに、クライアント端末200の表示画面サイズが許容する範囲でソート順の上位から一覧として表示を行う。
FIG. 6 shows an example of a content browsing operation by the user on the client terminal 200.
Based on the sorted presentation content list received from the content server 300, the content presentation unit 230 displays a list from the top of the sort order within the range allowed by the display screen size of the client terminal 200.

図6の例では、10個のコンテンツ(コンテンツ1〜10)が一覧表示されている。ユーザのフリック、スクロールバーの操作等で一覧によりソート順下位のコンテンツが表示することができる。このように実際にクライアント端末200に表示されたコンテンツのリストを一覧閲覧コンテンツリストとする。つまり、ソート済み提示コンテンツリスト内のすべてのコンテンツがクライアント端末200で表示されるとは限らないため、一覧閲覧コンテンツリストに含まれるとは限らない。ユーザがこの一覧から各コンテンツのタイトルをクリック操作等で選択すると、選択されたタイトルのコンテンツ(図6のコンテンツ3,5,6)の本体(詳細)を閲覧することができる。この詳細を閲覧したコンテンツを、詳細閲覧コンテンツリストに含む。   In the example of FIG. 6, ten contents (contents 1 to 10) are displayed in a list. The content in the lower order of the sort order can be displayed by the list by the user's flick, scroll bar operation or the like. The list of contents actually displayed on the client terminal 200 in this way is referred to as a list browsing content list. That is, not all the contents in the sorted presentation content list are displayed on the client terminal 200, and thus are not necessarily included in the list browsing content list. When the user selects a title of each content from this list by clicking or the like, the main body (details) of the content of the selected title (contents 3, 5, and 6 in FIG. 6) can be viewed. The content whose details are browsed is included in the detailed browsing content list.

履歴収集部210は、上述したように、ユーザの操作履歴を収集して一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを作成する。履歴情報送信部220は、履歴収集部210により作成された一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストをコンテンツサーバ300に送信する。   As described above, the history collection unit 210 collects user operation histories and creates a list browsing content list and a detailed browsing content list. The history information transmission unit 220 transmits the list browsing content list and the detailed browsing content list created by the history collection unit 210 to the content server 300.

図7に、上記図6の場合の一覧閲覧コンテンツリストのデータ構成例を示す。一覧閲覧コンテンツリストは、クラスタID、コンテンツID、及び閲覧時刻を有する。クラスタとは、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストに一意に付与される識別子(図7では“1”)である。別の時刻(時間帯)に表示した一覧閲覧コンテンツをユーザが閲覧した場合は、別のクラスタIDが付与される。なお、時刻以外の条件でクラスタIDを新たに付与する条件としては、一覧閲覧コンテンツリスト表示中に一定時間操作が無かった場合や、閲覧するユーザ(ユーザID)を切り替えた場合、一覧閲覧コンテンツリストに対して、コンテンツジャンル等を観点に絞り込み検索を掛けた場合、その他閲覧アプリケーションにおいて閲覧モードを切り替えた場合がある。コンテンツIDは、一覧閲覧コンテンツの各コンテンツに一意に付与された識別子であり、後述するコンテンツデータベース160が保持する値と一致するものとする。   FIG. 7 shows a data configuration example of the list browsing content list in the case of FIG. The list browsing content list has a cluster ID, a content ID, and a browsing time. The cluster is an identifier ("1" in FIG. 7) uniquely assigned to the list browsing content list and the detailed browsing content list. When the user browses the list browsing content displayed at another time (time zone), another cluster ID is given. The conditions for newly assigning the cluster ID under conditions other than the time include when there is no operation for a certain period of time while the list browsing content list is displayed, or when the browsing user (user ID) is switched, the list browsing content list On the other hand, when a narrow search is performed from the viewpoint of the content genre or the like, the browsing mode may be switched in other browsing applications. The content ID is an identifier uniquely assigned to each content of the list browsing content, and is assumed to match a value held in a content database 160 described later.

図8は、上記図6の場合の詳細閲覧コンテンツリストのデータ構成例を示したものである。詳細閲覧コンテンツリストは、上記一覧閲覧コンテンツリストと同様に、クラスタID、コンテンツID、及び閲覧時刻を有する。クラスタIDは、一覧閲覧コンテンツリストと同一の値とする(図8では“1”)。コンテンツID及び閲覧時刻は、詳細閲覧コンテンツリストでは、ユーザが一覧閲覧コンテンツから選択して詳細を閲覧したコンテンツ(図8ではコンテンツ3,5,6)の識別子及び当該コンテンツを閲覧した時刻となる。   FIG. 8 shows an example of the data structure of the detailed browsing content list in the case of FIG. The detailed browsing content list has a cluster ID, a content ID, and a browsing time, like the list browsing content list. The cluster ID is the same value as the list browsing content list (“1” in FIG. 8). In the detailed browsing content list, the content ID and browsing time are the identifier of the content (contents 3, 5, and 6 in FIG. 8) that the user has selected from the browsing content and browsed the content and the time when the content was browsed.

(コンテンツサーバ)
上記図2において、コンテンツサーバ300は、コンテンツ送信処理部310、ソート済み提示コンテンツリスト受信部320、提示コンテンツリスト送信部330、提示コンテンツリスト入力部340、履歴情報転送部350、及びコンテンツ要求転送部360を備える。
(Content server)
In FIG. 2, the content server 300 includes a content transmission processing unit 310, a sorted presentation content list reception unit 320, a presentation content list transmission unit 330, a presentation content list input unit 340, a history information transfer unit 350, and a content request transfer unit. 360 is provided.

履歴情報転送部350は、クライアント端末200から受信した一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを通信ネットワークを介して興味分析装置100に転送する。
提示コンテンツリスト入力部340には、サービス運用者により、ユーザの利用するクライアント端末200に提示するコンテンツを一覧にした提示コンテンツリストが入力される。提示コンテンツリスト送信部330は、上記入力された提示コンテンツリストを興味分析装置100へ通信ネットワークを介して送信する。
The history information transfer unit 350 transfers the list browsing content list and the detailed browsing content list received from the client terminal 200 to the interest analysis device 100 via the communication network.
The presentation content list input unit 340 receives a presentation content list that lists contents to be presented to the client terminal 200 used by the user by the service operator. The presented content list transmission unit 330 transmits the input presented content list to the interest analysis apparatus 100 via the communication network.

図9に、提示コンテンツリストのデータ構成例を示す。提示コンテンツリストは、コンテンツID、概念ID/関連度リスト、コンテンツ本体、及びコンテンツ登録時刻を有する。コンテンツIDは、各コンテンツに対してコンテンツサーバ300にて付与される一意のIDである。概念ID/関連度リストは、コンテンツに出現する概念の概念ID及び当該概念とコンテンツと関連性の程度を示す関連度Wのセットが格納される。概念ID/関連度リストは、コンテンツ毎に予め設定されており、具体例としては、コンテンツ1(スポーツ記事)には、{“野球”の概念ID=1,関連度=0.5}、{“サッカー”の概念ID=2,関連度=0.8}、{“ゴルフ”の概念ID=3、関連度=0.6}…のように設定される。   FIG. 9 shows a data configuration example of the presented content list. The presented content list has a content ID, a concept ID / relevance list, a content body, and a content registration time. The content ID is a unique ID assigned by the content server 300 to each content. The concept ID / relationship degree list stores a concept ID of a concept that appears in the content and a set of relevance W that indicates the degree of relevance between the concept and the content. The concept ID / relevance degree list is set in advance for each content. As a specific example, content 1 (sports article) includes {“baseball” concept ID = 1, relevance = 0.5}, { “Soccer” concept ID = 2, relevance = 0.8}, {“golf” concept ID = 3, relevance = 0.6}...

なお、概念IDは、興味スコアデータベース140に格納される値と一致する。関連度は、例えば、0から1までの値とし、大きいほど関連性が強いものとする。関連度は、サービス運用者がコンテンツ登録時に設定する値、若しくは別システムにより算出される値を利用する。   The concept ID matches the value stored in the interest score database 140. For example, the relevance is a value from 0 to 1, and the larger the relevance, the stronger the relevance. As the relevance, a value set by the service operator at the time of content registration or a value calculated by another system is used.

ソート済み提示コンテンツリスト受信部320は、興味分析装置100から提示コンテンツリストの一部又は全部をソートしたソート済み提示コンテンツリストとクライアント端末ID(もしくはユーザID)を受信する。コンテンツ送信処理部310は、ソート済み提示コンテンツリストをクライアント端末ID(もしくはユーザID)に該当するクライアント端末200に送信する。
コンテンツ要求転送部360は、クライアント端末200のコンテンツ要求送信部240からのコンテンツ提示要求であるコンテンツ要求データ(図5)を興味分析装置100に転送する。
The sorted presentation content list receiving unit 320 receives a sorted presentation content list and a client terminal ID (or user ID) obtained by sorting a part or all of the presentation content list from the interest analysis device 100. The content transmission processing unit 310 transmits the sorted presentation content list to the client terminal 200 corresponding to the client terminal ID (or user ID).
The content request transfer unit 360 transfers content request data (FIG. 5) that is a content presentation request from the content request transmission unit 240 of the client terminal 200 to the interest analysis device 100.

(興味分析装置)
次に、興味分析装置100の各部の詳細について説明する。
[コンテンツデータベース160]
図10にコンテンツデータベース160のデータ構造の一例を示す。コンテンツデータベース160は、コンテンツテーブルを有する。
(Interest analysis device)
Next, the detail of each part of the interest analysis apparatus 100 is demonstrated.
[Content database 160]
FIG. 10 shows an example of the data structure of the content database 160. The content database 160 has a content table.

コンテンツテーブルは、コンテンツID、概念ID/関連度リスト、コンテンツ本体、及びコンテンツ登録時刻を格納する。提示コンテンツリスト受信部150で受信した値が格納される。
[興味スコアデータベース140]
図11に興味スコアデータベース140のデータ構造の一例を示す。興味スコアデータベース140は、ユーザ興味テーブルを有する。
The content table stores a content ID, a concept ID / relevance list, a content body, and a content registration time. The value received by the presented content list receiving unit 150 is stored.
[Interest score database 140]
FIG. 11 shows an example of the data structure of the interest score database 140. The interest score database 140 has a user interest table.

ユーザ興味テーブルは、概念ID、コンテキストセットID、ユーザID(クライアント端末ID)、TotalZ(ユーザ興味スコア)、X、及びYの値を格納する。TotalZ、X、及びYの定義及び算出方法は後述する。つまり、ユーザ興味テーブルのコンテキストセットID毎のデータは、は、各ユーザ(端末)について、コンテキスト条件の組合せ(セット)毎に作成される。これは、このコンテキストの組合せの時にユーザが特徴的な行動を取ることを想定した分析を行うためである。   The user interest table stores values of concept ID, context set ID, user ID (client terminal ID), TotalZ (user interest score), X, and Y. The definition and calculation method of TotalZ, X, and Y will be described later. That is, the data for each context set ID in the user interest table is created for each combination (set) of context conditions for each user (terminal). This is to perform an analysis assuming that the user takes a characteristic action when the context is combined.

[コンテキスト別履歴量データベース132]
図12に、コンテキスト別履歴量データベース132のデータ構造の一例を示す。コンテキスト別履歴量データベース132は、コンテキスト別ユーザ履歴量テーブルと、分析対象コンテキストセットテーブルとを有する。
[History database 132 by context]
FIG. 12 shows an example of the data structure of the history amount database 132 by context. The context-specific history amount database 132 includes a context-specific user history amount table and an analysis target context set table.

コンテキスト別ユーザ履歴量テーブルは、クライアント端末ID(ユーザID)、コンテキストID、及び適合クラスタIDリストを含む。適合クラスタIDリストは、上記図7の一覧閲覧コンテンツリストのクラスタIDと同一の値であり、後述する履歴情報受信部110で付与される。適合クラスタIDリストは、このコンテキストID(コンテキスト条件)に適合する閲覧履歴のクラスタIDの群を示す。   The context-specific user history amount table includes a client terminal ID (user ID), a context ID, and a matching cluster ID list. The matching cluster ID list has the same value as the cluster ID of the list browsing content list in FIG. 7 and is given by the history information receiving unit 110 described later. The compatible cluster ID list indicates a group of browsing history cluster IDs that match the context ID (context condition).

分析対象コンテキストセットテーブルは、ユーザID(クライアント端末ID)、コンテキストセットID、適合コンテキストIDリスト、及び隣接コンテキストセットIDリストを含む。適合コンテキストIDリストは、このコンテキストセットが満たすべきコンテキスト条件のコンテキストIDの群を示す。隣接コンテキストセットIDリストは、このコンテキストセットの履歴により学習する場合に、同時に学習すべきコンテキストセットIDの群と、その時の重みwを示す。例えば、{コンテキストセットID1、0.1},{コンテキストセットID2、0.5},…とする。   The analysis target context set table includes a user ID (client terminal ID), a context set ID, a matching context ID list, and an adjacent context set ID list. The matching context ID list indicates a group of context IDs of the context conditions that should be satisfied by this context set. The adjacent context set ID list indicates a group of context set IDs to be learned simultaneously and the weight w at that time when learning is performed from the history of the context set. For example, {context set ID1, 0.1}, {context set ID2, 0.5},.

[分割コンテキスト/関連性定義データベース131]
図13に、分割コンテキスト/関連性定義データベース131のデータ構造の一例を示す。分割コンテキスト/関連性定義データベース131は、コンテキストIDテーブルと、コンテキスト関連性テーブルとを有する。
[Division context / relationship definition database 131]
FIG. 13 shows an example of the data structure of the division context / relevance definition database 131. The division context / relevance definition database 131 includes a context ID table and a context relevance table.

コンテキストIDテーブルは、コンテキストIDと、コンテキスト条件とを含む。コンテキスト条件は、例えば、24時間を8分割して、0時〜3時、3時〜6時等の条件、気温を10分割して、0度以下、0〜5度、...30度以上などの条件、月曜、火曜、...、日曜の曜日の条件、あるいは、春夏秋冬、晴れ、雨、曇りなどの季節や天気の条件を含む。   The context ID table includes a context ID and a context condition. The context condition is, for example, 24 hours divided into 8 and 0 to 3 o'clock, 3 o'clock to 6 o'clock, etc., and the air temperature is divided into 10 to 0 degrees or less, 0 to 5 degrees,. . . Conditions such as 30 degrees or more, Monday, Tuesday,. . . , Including conditions for Sundays, or seasonal and weather conditions such as spring, summer, autumn and winter, sunny, rainy, cloudy.

コンテキスト関連性テーブルは、コンテキストIDと、関連コンテキストIDと、関連コンテキストIDとの距離とを含む。コンテキストIDは、後述する大域コンテキスト/コンテキストID設定部117により一意に付与される数字等である。関連コンテキストIDは、このコンテキストIDと関連性を持つコンテキストIDの群である。関連コンテキストIDとの距離は、当該コンテキストIDと各関連コンテキストIDとの間の距離を示す数値が、コンテキストID、距離の値の組として、それぞれ格納され、数が大きいほど当該コンテキストIDとの関係性が少ないことを示す。   The context relevance table includes a context ID, a related context ID, and a distance between the related context IDs. The context ID is a number uniquely assigned by a global context / context ID setting unit 117 described later. The related context ID is a group of context IDs having a relationship with this context ID. As for the distance to the related context ID, a numerical value indicating the distance between the context ID and each related context ID is stored as a set of the context ID and the distance value, and the larger the number, the more the relationship with the context ID. It shows that there is little nature.

[提示コンテンツリスト受信部150]
提示コンテンツリスト受信部150は、コンテンツサーバ300から上記図9のような提示コンテンツリストを受信し、上記図10に示すコンテンツデータベース160に保存する。
[履歴情報受信部110]
図14に、履歴情報受信部110の処理フローを示す。
[Presentation content list receiving unit 150]
The presented content list receiving unit 150 receives the presented content list as shown in FIG. 9 from the content server 300 and stores it in the content database 160 shown in FIG.
[History information receiving unit 110]
FIG. 14 shows a processing flow of the history information receiving unit 110.

(履歴データ受信)
履歴情報受信部110は、コンテンツサーバ300の履歴情報転送部350から通信ネットワークを介してクライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト、詳細閲覧コンテンツリスト、閲覧時刻情報、及び、各測定時刻情報と組とした端末コンテキスト情報(位置情報、加速度、地軸センサ、温度計など、その他端末保有のセンサの検出結果)、を受信する。そして、クラスタID(ユニークな値)を付与して、学習対象の興味テーブル選択処理113へ出力する(A−1)。
(Receiving history data)
The history information receiving unit 110 receives a client terminal ID (or user ID), a list browsing content list, a detailed browsing content list, browsing time information, and each measurement time from the history information transfer unit 350 of the content server 300 via a communication network. The terminal context information (position information, acceleration, ground axis sensor, thermometer, etc., the detection result of other sensors owned by the terminal) that is paired with the information is received. Then, a cluster ID (unique value) is assigned and output to the learning target interest table selection process 113 (A-1).

[学習対象の興味テーブル選択処理部113]
図15に、学習対象の興味テーブル選択処理部113の処理フローを示す。学習対象の興味テーブル選択処理部113は、履歴情報受信部110からクラスタID、クライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト、詳細閲覧コンテンツリスト、閲覧時刻情報、及び端末コンテキスト情報を受信する(A−1)。
[Learning Object Interest Table Selection Processing Unit 113]
FIG. 15 shows a processing flow of the learning target interest table selection processing unit 113. The learning target interest table selection processing unit 113 receives the cluster ID, client terminal ID (or user ID), list browsing content list, detailed browsing content list, browsing time information, and terminal context information from the history information receiving unit 110. (A-1).

(学習対象のユーザ興味テーブル選択)
先ず、この履歴受信時のユーザのコンテキスト(状況)を取得するために、学習対象の興味テーブル選択処理部113は、クラスタID、クライアント端末ID(もしくはユーザID)、閲覧時刻情報、及び端末コンテキスト情報を大域コンテキスト/コンテキストID設定部117へ出力し(A−2)、大域コンテキスト/コンテキストID設定部117からクライアント端末ID(もしくはユーザID)と、履歴収集時点のユーザ状況や大域コンテキストに適合するコンテキストID群とを受信する(A−3)。このとき、サーバの現時点への適合を利用する方法もある。
(Select user interest table for learning)
First, in order to acquire the user's context (situation) at the time of history reception, the interest table selection processing unit 113 to be learned includes a cluster ID, a client terminal ID (or user ID), browsing time information, and terminal context information. To the global context / context ID setting unit 117 (A-2), the client terminal ID (or user ID) from the global context / context ID setting unit 117 and the context that matches the user situation and the global context at the time of history collection The ID group is received (A-3). At this time, there is a method of using the current adaptation of the server.

学習対象の興味テーブル選択処理部113は、コンテキストIDがそろった時点で、コンテキスト別履歴量データベース132の分析対象コンテキストセットテーブルからコンテキスト条件が合致するコンテキストセットIDのリストとw値を取得する。また、常に「その他」コンテキスト条件を分析対象とし、この重みは初期値w=1とする。なお、w値は、事前計算のデータベースから読み出す方法以外に、入力コンテキスト条件を起点として、分割コンテキスト抽出処理部116の「関係性重み算出」の処理にて算出する方法もある。   The learning target interest table selection processing unit 113 obtains a list of context set IDs and w values that match the context conditions from the analysis target context set table of the context-specific history amount database 132 when the context IDs are obtained. In addition, the “other” context condition is always an analysis target, and this weight is set to an initial value w = 1. In addition to the method of reading from the pre-calculated database, there is a method of calculating the w value by the “relationship weight calculation” process of the division context extraction processing unit 116 starting from the input context condition.

学習対象の興味テーブル選択処理部113は、クライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト、詳細閲覧コンテンツリスト、学習対象ユーザ興味テーブルのコンテキストセットID、及び学習対象ユーザ興味テーブルのコンテキストセットID毎のw値を出力する(A−4)。   The learning target interest table selection processing unit 113 includes a client terminal ID (or user ID), a list browsing content list, a detailed browsing content list, a context target ID of the learning target user interest table, and a context set ID of the learning target user interest table. Each w value is output (A-4).

[大域コンテキスト/コンテキストID設定部117]
大域コンテキスト/コンテキストID設定部117は、学習対象の興味テーブル選択処理部113からの入力(A−2)又は利用興味テーブル選択処理部124からの入力(C−2)を処理起動トリガとする。
[Global Context / Context ID Setting Unit 117]
The global context / context ID setting unit 117 uses the input (A-2) from the interest table selection processing unit 113 to be learned or the input (C-2) from the use interest table selection processing unit 124 as a process activation trigger.

(大域コンテキスト収集)
大域コンテキスト/コンテキストID設定部117は、クライアント端末ID(もしくはユーザID)、閲覧時刻情報(C−2の場合は時刻情報)、端末コンテキスト情報、及びクラスタID(C−2の場合は省略)を受信すると、大域コンテキストを収集する。例えば、端末コンテキスト情報がGPS履歴等の位置情報を含んでいる場合は、位置情報と時刻情報に対応する気温、湿度、天気等の情報をインターネットから収集する。または、世の中で話題になっているイベント情報をインターネット等から収集、もしくは運営者が適時設定した情報を収集する。端末コンテキスト情報がGPS履歴等の位置情報を含んでいる場合は、ユーザ位置の近隣のイベント情報をインターネット等から収集、もしくは運営者が適時設定した情報を収集する。あるいは、各ユーザのツイッターやブログ等の更新情報、季節/曜日/祝日などの情報、その他、事前設定などによる、ユーザの年齢、性別、職業等のユーザプロファイル情報を収集する。
(Global context collection)
The global context / context ID setting unit 117 receives the client terminal ID (or user ID), browsing time information (time information in the case of C-2), terminal context information, and cluster ID (omitted in the case of C-2). When received, collect global context. For example, when the terminal context information includes position information such as GPS history, information such as temperature, humidity, and weather corresponding to the position information and time information is collected from the Internet. Or, collect event information that has become a hot topic in the world from the Internet, or collect information that is set by the operator in a timely manner. When the terminal context information includes position information such as GPS history, event information in the vicinity of the user position is collected from the Internet or the information set by the operator in a timely manner. Alternatively, update information of each user's Twitter, blog, etc., information such as season / day of week / holiday, etc., and other user profile information such as the user's age, sex, occupation, etc. according to presetting, etc. are collected.

(DB読み出し)
大域コンテキスト/コンテキストID設定部117は、上記収集されたコンテキスト情報群をもとに、履歴収集時点(もしくはサーバ現時点)に適合するコンテキストID群をコンテキスト/関連性定義データベース131から読み出す。そして、A−2の場合は、クラスタID、及び上記履歴収集時点(もしくはサーバ現時点)に適合するコンテキストID群とを学習対象の興味テーブル選択処理部113へ出力する(A−3)。C−2の場合は、上記履歴収集時点(もしくはサーバ現時点)に適合するコンテキストID群を利用興味テーブル選択処理部124へ出力する。
(DB read)
Based on the collected context information group, the global context / context ID setting unit 117 reads a context ID group that matches the history collection time point (or server current time point) from the context / relevance definition database 131. In the case of A-2, the cluster ID and the context ID group suitable for the history collection time (or server current time) are output to the interest table selection processing unit 113 to be learned (A-3). In the case of C-2, a context ID group suitable for the history collection time (or server current time) is output to the utilization interest table selection processing unit 124.

[ユーザ興味モデル更新部130]
図17に、ユーザ興味モデル更新部130の処理フローを示す。ユーザ興味モデル更新部130には、学習対象の興味テーブル選択処理部113からクライアント端末ID(もしくはユーザID)、一覧閲覧コンテンツリスト、詳細閲覧コンテンツリスト、学習対象ユーザ興味テーブルのコンテキストセットID、及び学習対象ユーザ興味テーブルのコンテキストセット毎のw値が入力される(A−4)。
[User interest model update unit 130]
FIG. 17 shows a processing flow of the user interest model update unit 130. The user interest model update unit 130 receives the client terminal ID (or user ID), the list browsing content list, the detailed browsing content list, the context set ID of the learning target user interest table, and the learning from the learning target interest table selection processing unit 113. The w value for each context set in the target user interest table is input (A-4).

(出現概念抽出)
ユーザ興味モデル更新部130は、クラスタIDの一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリスト内の各コンテンツに出現する概念IDをコンテンツデータベース160から抽出する。具体的には、図7、図8において、各コンテンツIDに紐付けされている「概念ID」を図10のコンテンツデータベース160のコンテンツテーブルから検索する。ユーザ興味モデル更新部130は、クラスタデータ{クラスタID,一覧閲覧コンテンツリスト,詳細閲覧コンテンツリスト}と、コンテンツID/概念ID関連づけリスト{{コンテンツID,{関連づいている概念ID,…}},…}と、出現概念リスト{概念ID}とを生成する。「コンテンツID/概念ID関連付けリスト」とは、コンテンツIDをもとに検索された概念IDのリストである。「出現概念リスト」とは、一覧閲覧コンテンツリスト、及び詳細閲覧コンテンツリストに含まれる各コンテンツに出現する概念の概念IDを全て列挙したものである。
(Appearance concept extraction)
The user interest model updating unit 130 extracts a concept ID that appears in each content in the list browsing content list and the detailed browsing content list of the cluster ID from the content database 160. Specifically, in FIG. 7 and FIG. 8, “concept ID” linked to each content ID is searched from the content table of the content database 160 of FIG. 10. The user interest model update unit 130 includes cluster data {cluster ID, list browsing content list, detailed browsing content list} and content ID / concept ID association list {{content ID, {related concept ID, ...}}, ...} and the appearance concept list {concept ID} are generated. The “content ID / concept ID association list” is a list of concept IDs searched based on the content ID. The “appearance concept list” is a list of all concept IDs of concepts that appear in each content included in the list browsing content list and the detailed browsing content list.

(分析パラメータ抽出)
ユーザ興味モデル更新部130は、「出現概念リスト」の各概念について出現数を算出し、特徴スコアの算出に必要な分析パラメータを抽出し、分析パラメータリストを生成する。
図18に、分析パラメータリストのデータ構成例を示す。分析パラメータリストは、クラスタID毎に、一覧閲覧コンテンツリストのコンテンツ総数S(第1の総数)、詳細閲覧コンテンツリストのコンテンツ総数a(第2の総数)、クラスタIDに紐づいた出現概念リスト内の概念ID毎に算出するNとnがある。N(第1の出現数)は、一覧閲覧コンテンツリストにおいて当該概念IDが付与されているコンテンツ数とする。n(第2の出現数)は詳細閲覧コンテンツリストにおける当該概念IDが付与されているコンテンツ数とする。なお、上記追加した上位概念も含めて出現概念リスト内の概念IDすべてについて、Nとnを算出する。
(Analysis parameter extraction)
The user interest model update unit 130 calculates the number of appearances for each concept in the “appearance concept list”, extracts analysis parameters necessary for calculating the feature score, and generates an analysis parameter list.
FIG. 18 shows a data configuration example of the analysis parameter list. The analysis parameter list includes, for each cluster ID, the total content S (first total) of the list browsing content list, the total content a (second total) of the detailed browsing content list, and the appearance concept list associated with the cluster ID. N and n are calculated for each concept ID. N (first appearance number) is the number of contents to which the concept ID is assigned in the list browsing content list. n (second appearance number) is the number of contents to which the concept ID is assigned in the detailed browsing content list. It should be noted that N and n are calculated for all concept IDs in the appearance concept list including the added superordinate concept.

図19(a)に分析パラメータ抽出処理の模式図を示す。例えば、50個(=S)のコンテンツが一覧表示されている中から、ユーザが10個(=a)のコンテンツの詳細を閲覧した場合を示す。ここで、一覧表示されている50個のコンテンツのうち「野球」という概念が含まれている記事が15個(=N)あり、ユーザが閲覧した10個のコンテンツのうち、「野球」という概念が含まれているコンテンツが5個(=n)あったことを示す。   FIG. 19A shows a schematic diagram of the analysis parameter extraction process. For example, the case where the user browses the details of 10 (= a) contents from a list of 50 (= S) contents is shown. Here, 15 articles (= N) containing the concept of “baseball” among the 50 contents displayed in a list are displayed, and the concept of “baseball” is included in 10 contents viewed by the user. This indicates that there are five (= n) contents including “”.

(特徴スコア算出)
ユーザ興味モデル更新部130は、上記分析パラメータS,a,N,nを利用して概念ID毎に特徴スコアZを算出する。図20に特徴スコア算出処理の詳細を示す。図20において、iは概念の識別子、jは、クラスタIDを示す。H1(第1の確率)は、一覧閲覧コンテンツリストに含まれる一覧閲覧コンテンツの総数S、一覧閲覧コンテンツのうち概念iが出現するコンテンツ数Nのとき、詳細閲覧コンテンツをa個ランダム選択して閲覧した場合に、概念iが出現する詳細閲覧コンテンツの数がn以上となる累積確率である。H2(第2の確率)は、一覧閲覧コンテンツリストに含まれる一覧閲覧コンテンツの総数S、一覧閲覧コンテンツのうち概念iが出現するコンテンツ数Nのとき、詳細閲覧コンテンツをa個ランダム選択して閲覧した場合に、概念iが出現する詳細閲覧コンテンツの数がn以下となる累積確率である。なお、本実施形態では、累積確率H1及びH2は、超幾何分布により求めるが、この手法に限定するものではない。他の分布の例としては、二項分布、正規分布が存在する。
(Feature score calculation)
The user interest model update unit 130 calculates a feature score Z for each concept ID using the analysis parameters S, a, N, and n. FIG. 20 shows details of the feature score calculation process. In FIG. 20, i is a conceptual identifier, and j is a cluster ID. When H1 (first probability) is the total number S of the list browsing contents included in the list browsing content list and the number N of the contents of the list browsing content where the concept i appears, a detailed browsing content is randomly selected and viewed. In this case, the cumulative probability that the number of detailed browsing contents in which the concept i appears is n or more. When H2 (second probability) is the total number S of the list browsing contents included in the list browsing content list and the number of contents N in which the concept i appears in the list browsing contents, a detailed browsing content is randomly selected and viewed. In this case, the cumulative probability that the number of detailed browsing contents in which the concept i appears is n or less. In the present embodiment, the cumulative probabilities H1 and H2 are obtained by the hypergeometric distribution, but are not limited to this method. Examples of other distributions include a binomial distribution and a normal distribution.

図19(b)に示すように、例えば、上記の分析パラメータS、N、a、nを用いて、ユーザが閲覧した10個のコンテンツのうち、「野球」という概念が含まれるコンテンツが5以上である確率が、「0.12」であることを示す。ここで、「0.12」は、累積確率H1の値に相当する。   As shown in FIG. 19B, for example, there are 5 or more contents including the concept of “baseball” among the 10 contents viewed by the user using the analysis parameters S, N, a, and n described above. It is shown that the probability of being “0.12”. Here, “0.12” corresponds to the value of the cumulative probability H1.

なお、H2の値を使う例として、上記の分析パラメータでnが0である場合を考える。この場合は、出現数が0以下の場合の確率を算出する。具体的には、図19(b)において横軸が0の項目の値となるため「0.02」となる。
そして、ユーザ興味モデル更新部130は、図20に示すように、上記算出した累積確率H1及びH2を用いて、標準正規分布の累積分布関数の逆関数により特徴スコアZを算出する。図19(c)に示すように、上記H1を累積確率とする標準正規分布の累積分布関数の逆関数により特徴スコアZを求める。なお、累積確率としてH2を利用する場合には、標準正規分布の累積分布関数の逆関数の返値の符号を負にして特徴スコアZを求める。ユーザ興味モデル更新部130は、更新対象概念リスト{クラスタID,{概念ID,特徴スコア=Z,重み=w},…}を出力する。重みwは、更新対象興味テーブルID毎のw値である。
As an example of using the value of H2, consider the case where n is 0 in the above analysis parameters. In this case, the probability when the number of appearances is 0 or less is calculated. Specifically, in FIG. 19B, since the horizontal axis is the value of the item of 0, “0.02”.
Then, as shown in FIG. 20, the user interest model update unit 130 calculates the feature score Z by using the inverse function of the standard normal distribution cumulative distribution function using the calculated cumulative probabilities H1 and H2. As shown in FIG. 19C, the feature score Z is obtained by the inverse function of the cumulative distribution function of the standard normal distribution with H1 as the cumulative probability. When H2 is used as the cumulative probability, the feature score Z is obtained with the sign of the return value of the inverse function of the standard normal distribution cumulative distribution function being negative. The user interest model update unit 130 outputs an update target concept list {cluster ID, {concept ID, feature score = Z, weight = w},. The weight w is a w value for each update target interest table ID.

(DB更新)
興味モデル更新処理部130は、「更新対象概念リスト」の各概念IDのユーザ興味スコア(TotalZ)を更新する。図21に興味モデル更新処理部130の処理の詳細を示す。興味モデル更新処理部130は、コンテンツに出現した概念(出現概念)について、図21に示す各概念iに対するユーザ興味スコア更新式を用いて、ユーザ興味スコアTotalZin,及びXi(n−1),Yi(n−1)の値を求める。そして、図11の興味スコアデータベース140のユーザ興味テーブルのコンテキストセットIDに対応するレコードについて、概念ID及びクライアント端末ID(ユーザID)に対応するカラムに格納されている各値(TotalZ,X,Y)を更新する。
(DB update)
The interest model update processing unit 130 updates the user interest score (TotalZ) of each concept ID in the “update target concept list”. FIG. 21 shows details of processing of the interest model update processing unit 130. The interest model update processing unit 130 uses the user interest score update formula for each concept i shown in FIG. 21 for the concept (appearance concept) that appears in the content, and the user interest score TotalZ in and X i (n−1). , Y i (n−1) is obtained. And about each record (TotalZ, X, Y) stored in the column corresponding to the concept ID and the client terminal ID (user ID) for the record corresponding to the context set ID of the user interest table of the interest score database 140 of FIG. ).

ここで、Xi(n−1)は、各概念ID(ここでは識別子iで表現)に対する、過去の(前回までの)前記更新対象概念リストの重みwの二乗の合計である。Yi(n−1)は、同様に各概念ID(ここでは識別子iで表現)に対する、過去の前記更新対象概念リストの重みwと特徴スコアZの乗算の合計である。 Here, X i (n−1) is the sum of the squares of the weights w of the update target concept list in the past (up to the previous time) for each concept ID (represented by the identifier i here). Similarly, Y i (n−1) is the sum of multiplication of the weight w of the past update target concept list and the feature score Z for each concept ID (represented by identifier i here).

この、X,Yはユーザ興味スコア(TotalZ)計算過程における中間結果を保持することとなり、省メモリ/ストレージを優先させる場合、最低限としては各概念の変数としてTotalZ,X,Yの3つの実数値を保持することで実現可能である。省メモリ/ストレージを優先させない場合は、算出した各概念、各クラスタの特徴スコアZをすべて保存することとなる。この場合は、X,Yの保存は不要となる。   These X and Y hold intermediate results in the user interest score (TotalZ) calculation process. When giving priority to memory saving / storage, at least three variables of TotalZ, X, and Y are used as variables of each concept. This can be realized by holding a numerical value. When priority is not given to memory saving / storage, all the calculated concept scores and feature scores Z of the respective clusters are stored. In this case, storage of X and Y is not necessary.

図21において、nは、更新処理が何度目かを示す識別子である。ユーザ興味スコアTotalZを求める一連の処理は、クラスタID単位で行なわれ、この一連の処理が行なわれる単位を1度と数えるとき、nはこの一連の処理が何度目に行なわれたものであるかを示す識別子である。iは、概念IDの識別子である。Zinは、概念iの各更新処理に利用するZ値である。なお、上記Zijは一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリスト毎のZ値であり、Zij∈Zinの関係である。重みwinは、概念iの各更新処理に利用する重みであり、更新対象概念リストで設定される値である。 In FIG. 21, n is an identifier indicating how many times the update process is performed. A series of processes for obtaining the user interest score TotalZ is performed in units of cluster IDs. When the unit in which this series of processes is performed is counted once, n is the number of times this series of processes has been performed. Is an identifier. i is an identifier of a concept ID. Z in is a Z value used for each update process of concept i. Note that Z ij is a Z value for each of the list browsing content list and the detailed browsing content list, and has a relationship of Z ij εZ in . Weight w in is a weight to be used in each process of updating the concept i, is a value that is set in the updated concept list.

[コンテキスト履歴追記処理部115]
図22にコンテキスト履歴追記処理部115の処理フローを示す。コンテキスト履歴追記処理部115には、学習対象の興味テーブル選択処理部113からクライアント端末ID(もしくはユーザID)、上記履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群、及びクラスタIDが入力される(B−1)。
[Context history addition processing unit 115]
FIG. 22 shows a processing flow of the context history appending processing unit 115. The context history appending processing unit 115 has a client terminal ID (or user ID) from the interest table selection processing unit 113 to be learned, a context ID group suitable for the history collection time point (or the current time at the server), and a cluster ID. Input (B-1).

(DB更新)
コンテキスト履歴追記処理部115は、上記入力された情報をもとに、コンテキスト別履歴量データベース132のコンテキスト別ユーザ履歴量テーブルを更新する。具体的には、クライアント端末ID(もしくはユーザID)及びコンテキストIDに対応する適合クラスタIDリストのカラムに上記入力されたクラスタIDを追記する。
コンテキスト履歴追記処理部115は、クライアント端末ID(もしくはユーザID)、及び上記履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群を分割コンテキスト抽出処理部116へ出力する(B−2)。
(DB update)
The context history addition processing unit 115 updates the context-specific user history amount table of the context-specific history amount database 132 based on the input information. Specifically, the input cluster ID is added to the column of the matching cluster ID list corresponding to the client terminal ID (or user ID) and context ID.
The context history record processing unit 115 outputs the client terminal ID (or user ID) and the context ID group that matches the history collection time point (or the current time at the server) to the divided context extraction processing unit 116 (B-2). .

[分割コンテキスト抽出処理部116]
図23に分割コンテキスト抽出処理部116の処理フローを示す。分割コンテキスト抽出処理部116には、コンテキスト履歴追記処理部115からクライアント端末ID(もしくはユーザID)、上記履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群が入力される(B−2)。
[Division context extraction processing unit 116]
FIG. 23 shows a processing flow of the division context extraction processing unit 116. The divided context extraction processing unit 116 receives the client terminal ID (or user ID) from the context history addition processing unit 115 and a context ID group that matches the history collection time point (or the current time at the server) (B-2). ).

(コンテキスト条件組合せ毎の履歴量閾値判定)
分割コンテキスト抽出処理部116は、各クライアント端末ID(もしくはユーザID)について、コンテキスト別履歴量データベース132のコンテキスト別ユーザ履歴量テーブルを参照し、更新対象となったコンテキストID毎に他のコンテキストと組み合わせた場合の履歴量が所定の閾値を超えているかを判定し、履歴量が閾値を超えている組合せを抽出する。ここで、図12のコンテキスト別ユーザ履歴量テーブルはコンテキストID毎の適合クラスタIDリストを保存しているため、コンテキストの組合せ毎の履歴量の算出には、この組み合わされたコンテキストIDに共通して関連づけられているクラスタIDの数を数えることで実現する。
(History threshold judgment for each context condition combination)
For each client terminal ID (or user ID), the divided context extraction processing unit 116 refers to the context-specific user history amount table in the context-specific history amount database 132 and combines it with another context for each context ID to be updated. If the history amount exceeds a predetermined threshold, a combination in which the history amount exceeds the threshold is extracted. Here, since the user history amount table by context in FIG. 12 stores a matching cluster ID list for each context ID, the history amount for each context combination is calculated in common with the combined context ID. This is achieved by counting the number of associated cluster IDs.

例えば、「8時〜10時」、「駅近く」、AND「平日」のコンテキストの組合せの場合に、履歴量(閲覧回数など)が閾値である10回を超えるものを抽出する。抽出した組合せが、コンテキスト別ユーザ履歴量データベース132の分析対象コンテキストセットテーブルに無い場合は、新規コンテキストセットとして、コンテキストセットIDを割り振る。   For example, in the case of a combination of contexts “8:00 to 10:00”, “near station”, and AND “weekdays”, a history amount (such as the number of browsing times) exceeding 10 is extracted as a threshold. When the extracted combination is not in the analysis target context set table of the context-based user history amount database 132, a context set ID is allocated as a new context set.

図24にコンテキスト分割方法の処理概要を示す。ここでは、2次元のコンテキスト条件を設定するものとし、時間を2時間毎に12個用意し、位置情報IDを日本全地域をグリッドで分けたエリア通し番号として用意する。既存のコンテキスト条件が、「4時〜6時」AND「場所x」と、「18時〜20時」AND「場所y」と、「その他」(初期コンテキスト条件)との3つ存在する状態で、「6時〜8時」AND「場所x」のログ(履歴量、閲覧回数など)が追加発生したものとする。「6時〜8時」AND「場所x」のログが閾値である5以上になった時点で、「6時〜8時」AND「場所x」のコンテキスト条件を分割する。その結果、コンテキスト条件は、「4時〜6時」AND「場所x」と、「18時〜20時」AND「場所y」と、「6時〜8時」AND「場所x」と、「その他」(初期コンテキスト条件)との4つになる。なお、図24では説明を簡単にするため2次元ベクトルの例を示したが、実際は多次元ベクトル(時刻、場所、気温、天気、曜日、季節など)で処理を行う。   FIG. 24 shows a processing outline of the context dividing method. Here, it is assumed that a two-dimensional context condition is set, and 12 times are prepared every two hours, and the position information ID is prepared as an area serial number obtained by dividing all regions of Japan by a grid. There are three existing context conditions: “4 o'clock to 6 o'clock” AND “location x”, “18 o'clock to 20 o'clock” AND “location y”, and “other” (initial context condition). , “6 o'clock to 8 o'clock” AND “place x” logs (history amount, number of browsing times, etc.) are additionally generated. When the log of “6 o'clock to 8 o'clock” AND “location x” becomes 5 or more which is a threshold value, the context condition of “6 o'clock to 8 o'clock” AND “location x” is divided. As a result, the context conditions are “4 o'clock to 6 o'clock” AND “location x”, “18:00 to 20:00” AND “location y”, “6 o'clock to 8 o'clock” AND “location x”, “ There are four "others" (initial context conditions). In FIG. 24, an example of a two-dimensional vector is shown to simplify the explanation, but in actuality, processing is performed using a multidimensional vector (time, place, temperature, weather, day of the week, season, etc.).

(関連コンテキストセットID抽出)
分割コンテキスト抽出処理部116は、上記履歴量閾値判定処理により、新規のコンテキストセットIDと、そのコンテキストIDが入力されると、コンテキスト/関連性定義データベース131のコンテキスト関連性テーブルを参照し、新規コンテキストセット内のコンテキストIDと、関係を持つコンテキストIDをそれぞれ抽出し、抽出されたコンテキストIDを持つコンテキストセットIDを抽出する。なお、この関係を持つコンテキストIDの抽出処理では、コンテキスト/関連性定義データベース131のコンテキスト関連性テーブルをグラフとみなし、抽出対象のコンテキストIDを起点に、複数ホップを行う。ホップ回数は「2回や3回」、もしくは「関連コンテキストIDとの距離のホップ毎の積算値」を閾値として設定する。
(Related context set ID extraction)
When the new context set ID and the context ID are input by the history amount threshold determination process, the divided context extraction processing unit 116 refers to the context relevance table of the context / relevance definition database 131 and creates a new context. A context ID in the set and a context ID having a relationship are extracted, and a context set ID having the extracted context ID is extracted. In the context ID extraction process having this relationship, the context relevance table of the context / relevance definition database 131 is regarded as a graph, and multiple hops are performed starting from the extraction target context ID. As the number of hops, “2 or 3 times” or “integrated value for each hop of the distance to the related context ID” is set as a threshold.

抽出したコンテキストセットIDと新規コンテキストセットIDとの距離を、上記で算出した「関連コンテキストIDとの距離のホップ毎の積算値」の全コンテキストセットID内のコンテキストIDでの「合計」、「算術平均値」、「ベクトルと見なした場合のコサイン類似度や、ピアソン距離の逆数」によって算出する。   “Total” and “arithmetic” of the context IDs in all context set IDs of the “integrated value for each hop of the distance to the related context ID” calculated above for the distance between the extracted context set ID and the new context set ID It is calculated by “average value”, “cosine similarity when considered as a vector, and reciprocal of Pearson distance”.

(関係性重み算出)
分割コンテキスト抽出処理部116は、上記関連コンテキストセットID抽出処理により、新規のコンテキストセットIDと、そのコンテキストID、関連するコンテキストセットID群、及びそれぞれのコンテキストセットIDとの距離が入力されると、新規のコンテキストIDと関連するコンテキストID間で相互に関係性重みを、「関連コンテキストセットID抽出」で計算したセット間の距離から算出する。このとき、距離を重みとして、0〜1の値に正規化する。正規化の方法として、平均0、分散が運営者設定値の標準正規分布関数における確率値、累積確率値において距離をZ値とした場合の結果などの方法がある。その他、ロジスティック関数を利用する方法、十分大きい数値で除す方法がある。
(Relationship weight calculation)
When the divided context extraction processing unit 116 receives the new context set ID, the context ID, the related context set ID group, and the distance between each context set ID by the related context set ID extraction process, A mutual relationship weight between the new context ID and the related context ID is calculated from the distance between the sets calculated in “related context set ID extraction”. At this time, the distance is normalized to a value of 0 to 1, using the distance as a weight. As a normalization method, there are a method such as a mean 0, a probability value in a standard normal distribution function whose variance is an operator set value, and a result in a case where a distance is a Z value in a cumulative probability value. In addition, there are a method using a logistic function and a method of dividing by a sufficiently large number.

(DB更新)
分割コンテキスト抽出処理部116は、新規のコンテキストセットIDと、そのコンテキストID、と上記算出された関係性重みをもとに、コンテキスト別履歴量データベース132の分析対象コンテキストセットテーブルを更新する。
図25に、コンテキスト条件に基づく重み算出処理の具体例を示す。図25では、学習時のコンテキスト条件「6時〜8時」AND[場所x」の適合度(重み)算出イメージを示す。CASE1として、「2時〜4時」AND[場所x」のデータが発生した場合は、「6時〜8時」AND[場所x」のコンテキスト条件との距離は2であるため、重み関数w=f(2)の結果を重みとして追加された履歴クラスタにて学習処理を実行する。CASE2として、「10時〜12時」AND[場所4」のデータが発生した場合は、「6時〜8時」AND[場所x」のコンテキスト条件との距離は3であるため、重み関数w=f(3)の結果を重みとして追加された履歴クラスタにて学習処理を実行する。さらに、CASE3として、「6時〜8時」AND[場所y」のデータが発生した場合は、「6時〜8時」AND[場所x」のコンテキスト条件との距離は閾値を超えているため(この例では閾値は3)、学習処理は実行しない。
(DB update)
The divided context extraction processing unit 116 updates the analysis target context set table of the context-specific history amount database 132 based on the new context set ID, the context ID, and the calculated relationship weight.
FIG. 25 shows a specific example of the weight calculation process based on the context condition. FIG. 25 shows an image for calculating the fitness (weight) of the context condition “6 o'clock to 8 o'clock” AND [place x] during learning. When the data of “2 o'clock to 4 o'clock” AND [location x] is generated as CASE 1, the distance from the context condition of “6 o'clock to 8 o'clock” AND [location x] is 2, so the weight function w = The learning process is executed on the history cluster added with the result of f (2) as a weight. When the data of “10 o'clock to 12 o'clock” AND [location 4] is generated as CASE 2, the distance from the context condition of “6 o'clock to 8 o'clock” AND [location x] is 3, so the weight function w = The learning process is executed on the history cluster added with the result of f (3) as a weight. Furthermore, when data of “6 o'clock to 8 o'clock” AND [location y] is generated as CASE 3, the distance from the context condition of “6 o'clock to 8 o'clock” AND [location x] exceeds the threshold value. (In this example, the threshold is 3), and the learning process is not executed.

つまり、コンテキストを自動抽出することで、どのような状況(状況の組合せ)に着目して分析するかというコンテキスト定義の最適化及び定義作業の省力化でき、コンテキスト定義を履歴量と相関させることで対応する履歴が少ないコンテキスト分解を避けることが出来るため、最小限のコンピューターリソースでの情報推薦の高精度化が実現できる。   In other words, by automatically extracting the context, it is possible to optimize the context definition of what kind of situation (combination of situations) to analyze and to save labor of the definition work, and by correlating the context definition with the history amount Since it is possible to avoid context decomposition with few corresponding histories, it is possible to achieve high accuracy of information recommendation with minimum computer resources.

[コンテンツ要求受信部121]
図26にコンテンツ評価処理部170の処理フローを示す。コンテンツ要求受信部121は、コンテンツ要求転送部360からクライアント端末ID(もしくはユーザID)を含む、図5に示すようなコンテンツ要求データを受信する。
[Content Request Receiving Unit 121]
FIG. 26 shows a processing flow of the content evaluation processing unit 170. The content request receiving unit 121 receives content request data as shown in FIG. 5 including the client terminal ID (or user ID) from the content request transfer unit 360.

(コンテンツ要求履歴データ受信)
コンテンツ要求受信部121は、コンテンツサーバ300のコンテンツ要求転送部360から通信ネットワークを介してクライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報(位置情報、加速度、地軸センサ、温度計など、その他端末保有のセンサの測定時刻及び測定結果)を受信する。そして、クライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報を利用興味テーブル選択処理部124へ出力する(C−1)。なお、これらの情報を履歴情報受信部110にさらに転送し、学習に利用する方法もある。また、このコンテンツ要求の履歴について、クライアント端末側で履歴収集し、コンテンツ要求送信部240から履歴情報収集部210に情報を通知し、興味分析装置100に送信する方法もある。
(Receiving content request history data)
The content request receiving unit 121 receives a client terminal ID (or user ID), time information, and terminal context information (position information, acceleration, ground axis sensor, thermometer, etc.) from the content request transfer unit 360 of the content server 300 via a communication network. , And the measurement time and measurement results of other sensors owned by the terminal. Then, the client terminal ID (or user ID), time information, and terminal context information are output to the utilization interest table selection processing unit 124 (C-1). There is also a method in which these pieces of information are further transferred to the history information receiving unit 110 and used for learning. There is also a method of collecting the history of the content request on the client terminal side, notifying the history request collecting unit 210 of the information from the content request transmitting unit 240, and transmitting the information to the interest analysis apparatus 100.

[利用興味テーブル選択処理部124]
図27に、利用興味テーブル選択処理部124の処理フローを示す。利用興味テーブル選択処理部124は、コンテンツ要求受信部121からクライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報を受信する(C−1)。
[Use interest table selection processing unit 124]
FIG. 27 shows a processing flow of the utilization interest table selection processing unit 124. The usage interest table selection processing unit 124 receives the client terminal ID (or user ID), time information, and terminal context information from the content request receiving unit 121 (C-1).

(適合コンテキストIDの読み出し)
利用興味テーブル選択処理部124は、クライアント端末ID(もしくはユーザID)、時刻情報、及び端末コンテキスト情報を大域コンテキスト/コンテキストID設定部117へ出力し(C−2)、大域コンテキスト/コンテキストID設定部117からクライアント端末ID(もしくはユーザID)及び履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群を受信する(C−3)。
(Read conformance context ID)
The utilization interest table selection processing unit 124 outputs the client terminal ID (or user ID), time information, and terminal context information to the global context / context ID setting unit 117 (C-2), and the global context / context ID setting unit. From 117, a context ID group that matches the client terminal ID (or user ID) and the history collection time point (or the current time at the server) is received (C-3).

(利用するコンテキストセットID決定(ユーザ興味テーブル選択))
上記適合コンテキストIDの読み出し処理により、大域コンテキスト/コンテキストID設定部117から、クライアント端末ID(もしくはユーザID)、履歴収集時点(もしくはサーバでの現時点)に適合するコンテキストID群が入力される。と、利用興味テーブル選択処理部124は、コンテキストIDがそろった時点で、コンテキスト別履歴量DB132の分析対象コンテキストセットテーブルからコンテキスト条件が適合するコンテキストセットIDを取得する。なお、複数のコンテキストセットIDが取得される場合は、コンテキストセットにおいて、もっともコンテキスト条件数が多いものを選択する。そして、利用興味テーブル選択処理部124は、クライアント端末ID(もしくはユーザID)、利用するユーザ興味テーブルに対応するコンテキストセットIDを出力する(C−4)。
(Determine context set ID to be used (select user interest table))
Through the process of reading the matching context ID, a context ID group matching the client terminal ID (or user ID) and the history collection time (or the current time at the server) is input from the global context / context ID setting unit 117. Then, the utilization interest table selection processing unit 124 acquires a context set ID that satisfies the context condition from the analysis target context set table of the context-specific history amount DB 132 when the context IDs are collected. When a plurality of context set IDs are acquired, the context set having the largest number of context conditions is selected. Then, the use interest table selection processing unit 124 outputs the client terminal ID (or user ID) and the context set ID corresponding to the user interest table to be used (C-4).

[コンテンツ評価処理部170]
図28にコンテンツ評価処理部170の処理フローを示す。コンテンツ評価処理部170には、コンテンツデータベース160のコンテンツテーブルから読み出した図7のような形式の提示コンテンツリストと、利用興味テーブル選択処理部124からクライアント端末ID(もしくはユーザID)、利用するユーザ興味テーブルのレコードを決定するためのコンテキストセットIDが入力される。
[Content Evaluation Processing Unit 170]
FIG. 28 shows a processing flow of the content evaluation processing unit 170. The content evaluation processing unit 170 includes a presentation content list in a format as shown in FIG. 7 read from the content table of the content database 160, a client terminal ID (or user ID) from the usage interest table selection processing unit 124, and a user interest to be used. A context set ID for determining a record in the table is input.

(スコア評価)
コンテンツ評価処理部170は、提示コンテンツリストから、利用するコンテキストセットIDが合致するユーザ興味テーブルのレコードを用いてコンテンツの評価を行う。そして、コンテンツ評価処理部170は、評価対象のコンテンツについて、評価スコアを算出し、図29に示すようなコンテンツスコアリストを生成する。コンテンツスコアリストは、コンテンツID、評価スコア、コンテンツ本体、及びコンテンツ登録時刻を有する。
(Score evaluation)
The content evaluation processing unit 170 evaluates the content from the presented content list using a record of the user interest table that matches the context set ID to be used. Then, the content evaluation processing unit 170 calculates an evaluation score for the content to be evaluated, and generates a content score list as shown in FIG. The content score list has a content ID, an evaluation score, a content body, and a content registration time.

図30に評価スコアの算出方法の一例を示す。例えば、図30に示すコンテンツ評価式により、評価コンテンツxに対する評価スコアEntityZを概念iのユーザ興味スコアTotalZ、コンテンツxと概念iとの関連度W(もしくは、概念iの重要度)、及びコンテンツxに出現する概念IDの集合pを用いて算出することができる。なお、概念の識別子iは集合p内の概念IDに対応する。 FIG. 30 shows an example of an evaluation score calculation method. For example, the content evaluation formula shown in Figure 30, the user interest score TotalZ i concept i evaluation score EntityZ x for the evaluation content x, relevance W i a content x and concepts i (or importance of concepts i), And a set p of concept IDs appearing in the content x. The concept identifier i corresponds to the concept ID in the set p.

図30の算出で利用するユーザ興味スコア(TotalZ)は、各コンテンツに関連した概念IDについて、興味スコアデータベース140のユーザ興味テーブル(図11)から、クライアント端末ID(もしくは、ユーザID)をもとに読み出し利用する。図30において、概念K、概念B及び概念Dが出現するコンテンツ1を評価コンテンツとした場合、概念K、概念B及び概念DのTotalZ,関連度Wを利用して評価スコアEntityZ=0.18と算出できる。一方、概念Bのみが出現するコンテンツ2を評価コンテンツとした場合、概念BのTotalZ,Wを利用して評価スコアEntityZ=−0.3と算出できる。評価スコアEntityZの値が大きいコンテンツ1が優先して表示される。 The user interest score (TotalZ) used in the calculation of FIG. 30 is based on the client terminal ID (or user ID) from the user interest table (FIG. 11) of the interest score database 140 for the concept ID related to each content. Read out and use. In FIG. 30, when the content 1 in which the concept K, the concept B, and the concept D appear is an evaluation content, the evaluation score EntityZ x = 0.18 using the TotalZ and the relevance W of the concept K, the concept B, and the concept D. And can be calculated. On the other hand, when the content 2 in which only the concept B appears is set as the evaluation content, the evaluation score EntityZ x = −0.3 can be calculated using the TotalZ, W of the concept B. Content 1 with a large value of evaluation score EntityZ x is displayed preferentially.

その他にも、評価スコアEntityZは、以下の変形例1〜3の方法により求めることができる。
変形例1としては、EntityZ=MAX(TotalZ*W)により求める。MAX(TotalZ*W)は、i∈pのTotalZ*Wの最大値を返す関数とする。
In addition, the evaluation score EntityZ x can be obtained by the following methods 1 to 3.
As a first modification, it is obtained by EntityZ x = MAX (TotalZ i * W i ). MAX (TotalZ i * W i ) is a function that returns the maximum value of TotalZ i * W i for i∈p.

変形例2としては、EntityZの値は、MAX(TotalZ*W)の値が閾値を超えた場合には、MAX(TotalZ*W)の返り値とする。MAX(TotalZ*W)はi∈pのTotalZ*Wの最大値を返す関数とする。閾値を超えない場合は、図30のコンテンツ評価式の結果をEntityZとする。MAX()は、はi∈pのTotalZ*Wで最大値を返す関数とする。閾値はサービス運用者が設定する値とする。 The second modification, the value of EntityZ x When the value of the MAX (TotalZ i * W i) exceeds the threshold value, the return value of MAX (TotalZ i * W i) . MAX (TotalZ i * W i ) is a function that returns the maximum value of TotalZ i * W i for i∈p. When the threshold value is not exceeded, the result of the content evaluation formula in FIG. 30 is set to EntityZ x . MAX () is a function that returns the maximum value of TotalZ i * W i with i∈p. The threshold is a value set by the service operator.

変形例3としては、TotalZが正の値のi∈pについてのみ取り出し、図30のコンテンツ評価式で統合した値をEntityZとする。
(コンテンツをスコア順にソート)
コンテンツ評価処理部170は、コンテンツスコアリストに含まれるコンテンツを評価スコアEntityZの降順にソートし、ソート済みコンテンツスコアリストをコンテンツスコアリスト送信部180に出力する。
As a third modification example, only the value iεp where TotalZ i is a positive value is extracted, and the value integrated by the content evaluation formula of FIG. 30 is EntityZ x .
(Sort content in score order)
The content evaluation processing unit 170 sorts the content included in the content score list in descending order of the evaluation score EntityZ x and outputs the sorted content score list to the content score list transmission unit 180.

[ソート済みコンテンツスコアリスト送信部180]
ソート済みコンテンツスコアリスト送信部180は、コンテンツ評価処理部170から入力されるソート済みコンテンツスコアリストとクライアント端末ID(もしくはユーザID)を通信ネットワークを介してコンテンツサーバ300に送信する。
[Sorted content score list transmission unit 180]
The sorted content score list transmission unit 180 transmits the sorted content score list and client terminal ID (or user ID) input from the content evaluation processing unit 170 to the content server 300 via the communication network.

以上述べたように、上記実施形態によれば、ユーザの選択候補となる一覧リストを定義し、そこからのコンテンツ選択における概念の出現数を分析することで、各概念の出現の希少性を考慮し、且つ一覧から選ばれない概念の履歴特徴を利用することができるため、ユーザの興味を高精度に推定することが可能となる。   As described above, according to the above-described embodiment, the list of candidates for user selection is defined, and the number of appearances of concepts in content selection from there is analyzed, thereby taking into account the rarity of appearance of each concept. In addition, since it is possible to use history features of concepts that are not selected from the list, it is possible to estimate the user's interest with high accuracy.

また、履歴データの集まり方から、コンテキスト条件(その条件限定で傾向を分析するもの)を自動抽出し、自動抽出したコンテキスト条件について、自動で学習時のコンテキスト適合度(重み)を決定することが可能となる。
分析対象となり得る多数のコンテキストの切り口(時刻、場所、気温、曜日、季節等)が有る場合には、全ての組合せで計算することは計算量が莫大となる。また、全ての組合せについて運用者が「重み」を設定することは非常に困難である。本実施形態の手法によれば、コンテキスト条件自動判別機能により処理コストや運用コストが削減でき、多様なコンテキストを考慮した、適切なコンテキスト条件による分析により情報推薦を高精度化できる。
In addition, it is possible to automatically extract context conditions (those that analyze trends by limiting the conditions) from the way of gathering historical data, and automatically determine the context suitability (weight) at the time of learning for the automatically extracted context conditions. It becomes possible.
When there are many context cuts (time, place, temperature, day of the week, season, etc.) that can be analyzed, the calculation amount for all combinations becomes enormous. Further, it is very difficult for the operator to set “weight” for all combinations. According to the method of the present embodiment, processing cost and operation cost can be reduced by the automatic context condition discrimination function, and information recommendation can be made highly accurate by analysis based on appropriate context conditions in consideration of various contexts.

さらに、コンテンツ要求時のユーザ状況に適合するユーザ興味テーブルを用いてコンテンツの評価スコアを算出することで、ユーザの興味に合ったコンテンツを精度良く推薦することが可能となる。
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
Furthermore, by calculating a content evaluation score using a user interest table that matches a user situation at the time of content request, it is possible to recommend content that matches the user's interest with high accuracy.
Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Further, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.

100…興味分析装置、200…クライアント端末、300…コンテンツサーバ、110…履歴情報受信部、113…学習対象の興味テーブル選択処理部、115…コンテキスト履歴追記処理部、116…分割コンテキスト抽出処理部、117…大域コンテキスト/コンテキストID設定部、121…コンテンツ要求受信部、124…利用興味テーブル選択処理部、130…興味モデル更新処理部、131…コンテキスト/関連性定義データベース、132…コンテキスト別履歴量データベース、140…興味スコアデータベース、150…提示コンテンツリスト受信部、160…コンテンツデータベース、170…コンテンツ評価処理部、180…ソート済みコンテンツスコアリスト送信部、210…履歴情報送信部、220…履歴収集部、230…コンテンツ提示部、240…コンテンツ要求送信部、250…端末情報収集部、310…コンテンツ送信処理部、320…ソート済み提示コンテンツリスト受信部、330…提示コンテンツリスト送信部、340…提示コンテンツリスト入力部、350…履歴情報転送部、360…コンテンツ要求転送部。   DESCRIPTION OF SYMBOLS 100 ... Interest analysis apparatus, 200 ... Client terminal, 300 ... Content server, 110 ... History information receiving part, 113 ... Interest table selection process part of learning object, 115 ... Context history addition process part, 116 ... Divided context extraction process part, 117 ... Global context / context ID setting unit 121 ... Content request receiving unit 124 ... Use interest table selection processing unit 130 ... Interest model update processing unit 131 ... Context / relevance definition database 132 ... history amount database by context 140 ... Interest score database, 150 ... Presented content list receiving unit, 160 ... Content database, 170 ... Content evaluation processing unit, 180 ... Sorted content score list transmitting unit, 210 ... History information transmitting unit, 220 ... History collecting unit 230 ... Content presentation unit, 240 ... Content request transmission unit, 250 ... Terminal information collection unit, 310 ... Content transmission processing unit, 320 ... Sorted presentation content list reception unit, 330 ... Presentation content list transmission unit, 340 ... Presentation content list Input unit, 350... History information transfer unit, 360... Content request transfer unit.

Claims (7)

複数の概念のそれぞれに対してユーザ興味スコアを有する興味モデルを用いて、前記概念を含むコンテンツの閲覧履歴からユーザの興味を分析する方法であって、
複数のコンテンツを一覧として閲覧した第1のコンテンツリストと、前記第1のコンテンツリストからコンテンツの本体を閲覧した第2のコンテンツリストとをクラスタ化するステップと、
前記クラスタ毎に、前記第1のコンテンツリストのコンテンツの総数を第1の総数と、前記第1のコンテンツリストにおいて前記概念が出現するコンテンツの数を第1の出現数と、前記第2のコンテンツリストのコンテンツの総数を第2の総数と、前記第2のコンテンツリストにおいて前記概念が出現するコンテンツの数を第2の出現数としたとき、前記第1の総数、前記第1の出現数、及び前記第2の総数の条件下で、前記第2のコンテンツリストに前記概念が出現するコンテンツの数が、前記第2の出現数以上となる第1の確率及び前記第2の出現数以下となる第2の確率を算出し、前記第1の確率及び前記第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアを算出する算出ステップと、
前記コンテンツの閲覧に関するコンテキスト条件を収集するステップと、
前記収集されたコンテキスト条件の組合せに基づいて、前記興味モデルを前記組合せ毎のテーブルに分割するステップと、
前記組合せに含まれるコンテキスト条件間の関連性に基づいて、前記組合せ毎のテーブルから更新対象テーブルを抽出するステップと、
前記更新対象テーブルに対して前記関連性をもとに重みを算出するステップと、
前記特徴スコアと前記重みとを用いて前記更新対象テーブルにおける前記概念に対する前記ユーザ興味スコアを更新するステップと
を有することを特徴とする興味分析方法。
A method of analyzing a user's interest from a browsing history of content including the concept using an interest model having a user interest score for each of a plurality of concepts,
Clustering a first content list browsing a plurality of contents as a list and a second content list browsing a content body from the first content list;
For each cluster, the total number of contents in the first content list is the first total number, the number of contents in which the concept appears in the first content list is the first appearance number, and the second content When the total number of contents in the list is the second total number and the number of contents in which the concept appears in the second content list is the second appearance number, the first total number, the first appearance number, And under the condition of the second total number, a first probability that the number of contents in which the concept appears in the second content list is greater than or equal to the second occurrence number and less than or equal to the second occurrence number. Calculating a second probability, and calculating a feature score by an inverse function of a cumulative distribution function of a standard normal distribution based on the first probability and the second probability;
Collecting contextual conditions for viewing the content;
Dividing the model of interest into a table for each combination based on the collected context condition combinations;
Extracting an update target table from the table for each combination based on the relevance between context conditions included in the combination;
Calculating a weight for the update target table based on the relevance;
And updating the user interest score for the concept in the update target table using the feature score and the weight.
前記コンテキスト条件に適合する閲覧履歴の量に基づいて、前記興味モデルを前記組合せ毎のテーブルに分割することを特徴とする請求項1に記載の興味分析方法。   The interest analysis method according to claim 1, wherein the interest model is divided into a table for each combination based on an amount of browsing history that matches the context condition. コンテンツ要求時のコンテキスト条件を収集し、当該コンテキスト条件に適合するテーブルを用いて、コンテンツに対する評価スコアを算出するステップをさらに有することを特徴とする請求項1又は2に記載の興味分析方法。   The interest analysis method according to claim 1, further comprising a step of collecting context conditions at the time of requesting content and calculating an evaluation score for the content using a table that matches the context condition. 複数の概念のそれぞれに対してユーザ興味スコアを有する興味モデルを用いて、前記概念を含むコンテンツの閲覧履歴からユーザの興味を分析する装置であって、
複数のコンテンツを一覧として閲覧した第1のコンテンツリストと、前記第1のコンテンツリストからコンテンツの本体を閲覧した第2のコンテンツリストとをクラスタ化する手段と、
前記クラスタ毎に、前記第1のコンテンツリストのコンテンツの総数を第1の総数と、前記第1のコンテンツリストにおいて前記概念が出現するコンテンツの数を第1の出現数と、前記第2のコンテンツリストのコンテンツの総数を第2の総数と、前記第2のコンテンツリストにおいて前記概念が出現するコンテンツの数を第2の出現数としたとき、前記第1の総数、前記第1の出現数、及び前記第2の総数の条件下で、前記第2のコンテンツリストに前記概念が出現するコンテンツの数が、前記第2の出現数以上となる第1の確率及び前記第2の出現数以下となる第2の確率を算出し、前記第1の確率及び前記第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアを算出する算出手段と、
前記コンテンツの閲覧に関するコンテキスト条件を収集する手段と、
前記収集されたコンテキスト条件の組合せに基づいて、前記興味モデルを前記組合せ毎のテーブルに分割する手段と、
前記組合せに含まれるコンテキスト条件間の関連性に基づいて、前記組合せ毎のテーブルから更新対象テーブルを抽出する手段と、
前記更新対象テーブルに対して前記関連性をもとに重みを算出する手段と、
前記特徴スコアと前記重みとを用いて前記更新対象テーブルにおける前記概念に対する前記ユーザ興味スコアを更新する手段と
を有することを特徴とする興味分析装置。
Using an interest model having a user interest score for each of a plurality of concepts, an apparatus for analyzing user interest from a browsing history of content including the concept,
Means for clustering a first content list in which a plurality of contents are browsed as a list and a second content list in which content bodies are browsed from the first content list;
For each cluster, the total number of contents in the first content list is the first total number, the number of contents in which the concept appears in the first content list is the first appearance number, and the second content When the total number of contents in the list is the second total number and the number of contents in which the concept appears in the second content list is the second appearance number, the first total number, the first appearance number, And under the condition of the second total number, a first probability that the number of contents in which the concept appears in the second content list is greater than or equal to the second occurrence number and less than or equal to the second occurrence number. Calculating means for calculating a feature score by an inverse function of a cumulative distribution function of a standard normal distribution based on the first probability and the second probability;
Means for collecting contextual conditions relating to browsing of the content;
Means for dividing the model of interest into a table for each combination based on the combination of the collected context conditions;
Means for extracting an update target table from the table for each combination based on the relationship between the context conditions included in the combination;
Means for calculating a weight for the update target table based on the relevance;
An interest analysis apparatus comprising: means for updating the user interest score for the concept in the update target table using the feature score and the weight.
前記コンテキスト条件に適合する閲覧履歴の量に基づいて、前記興味モデルを前記組合せ毎のテーブルに分割することを特徴とする請求項4に記載の興味分析装置。   The interest analysis apparatus according to claim 4, wherein the interest model is divided into a table for each combination based on an amount of browsing history that matches the context condition. コンテンツ要求時のコンテキスト条件を収集し、当該コンテキスト条件に適合するテーブルを用いて、コンテンツに対する評価スコアを算出する手段をさらに有することを特徴とする請求項4又は5に記載の興味分析装置。   6. The interest analysis apparatus according to claim 4, further comprising means for collecting context conditions at the time of requesting content and calculating an evaluation score for the content using a table that matches the context condition. 請求項4乃至6のいずれか1項に記載の興味分析装置を構成する各手段としてコンピュータを機能させる興味分析装置プログラム。   An interest analysis device program that causes a computer to function as each means constituting the interest analysis device according to any one of claims 4 to 6.
JP2012132387A 2012-06-11 2012-06-11 Interest analysis method, interest analysis apparatus and program thereof Expired - Fee Related JP5723835B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012132387A JP5723835B2 (en) 2012-06-11 2012-06-11 Interest analysis method, interest analysis apparatus and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012132387A JP5723835B2 (en) 2012-06-11 2012-06-11 Interest analysis method, interest analysis apparatus and program thereof

Publications (2)

Publication Number Publication Date
JP2013257668A true JP2013257668A (en) 2013-12-26
JP5723835B2 JP5723835B2 (en) 2015-05-27

Family

ID=49954073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012132387A Expired - Fee Related JP5723835B2 (en) 2012-06-11 2012-06-11 Interest analysis method, interest analysis apparatus and program thereof

Country Status (1)

Country Link
JP (1) JP5723835B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146683A (en) * 2016-02-16 2017-08-24 ヤフー株式会社 Generation device, generation method, and generation program
JP2017151867A (en) * 2016-02-26 2017-08-31 ヤフー株式会社 Update device, update method, and update program
CN107483613A (en) * 2017-08-31 2017-12-15 江西博瑞彤芸科技有限公司 A kind of information-pushing method
JP2020129409A (en) * 2016-02-16 2020-08-27 ヤフー株式会社 Generator, generation method, and generation program
JP2021149553A (en) * 2020-03-19 2021-09-27 ヤフー株式会社 Information processing device, information processing method, and information processing program
CN113592589A (en) * 2021-07-27 2021-11-02 上海致景信息科技有限公司 Textile raw material recommendation method and device and processor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237916A (en) * 2009-03-31 2010-10-21 Denso It Laboratory Inc Content retrieval device, method, and program
JP2012053863A (en) * 2010-08-06 2012-03-15 Nippon Telegr & Teleph Corp <Ntt> Information recommendation processor and control program thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237916A (en) * 2009-03-31 2010-10-21 Denso It Laboratory Inc Content retrieval device, method, and program
JP2012053863A (en) * 2010-08-06 2012-03-15 Nippon Telegr & Teleph Corp <Ntt> Information recommendation processor and control program thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG201200161012; 佐藤 妙: 'ユーザの興味と情報発信者からの影響度を融合した情報パーソナライズ方法の提案' 電子情報通信学会技術研究報告 Vol.111 No.470, 20120301, 73-78ページ, 社団法人電子情報通信学会 *
JPN6014055063; 佐藤 妙: 'ユーザの興味と情報発信者からの影響度を融合した情報パーソナライズ方法の提案' 電子情報通信学会技術研究報告 Vol.111 No.470, 20120301, 73-78ページ, 社団法人電子情報通信学会 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146683A (en) * 2016-02-16 2017-08-24 ヤフー株式会社 Generation device, generation method, and generation program
JP2020129409A (en) * 2016-02-16 2020-08-27 ヤフー株式会社 Generator, generation method, and generation program
JP2017151867A (en) * 2016-02-26 2017-08-31 ヤフー株式会社 Update device, update method, and update program
CN107483613A (en) * 2017-08-31 2017-12-15 江西博瑞彤芸科技有限公司 A kind of information-pushing method
CN107483613B (en) * 2017-08-31 2020-07-14 江西博瑞彤芸科技有限公司 Information pushing method
JP2021149553A (en) * 2020-03-19 2021-09-27 ヤフー株式会社 Information processing device, information processing method, and information processing program
JP7189905B2 (en) 2020-03-19 2022-12-14 ヤフー株式会社 Information processing device, information processing method, and information processing program
CN113592589A (en) * 2021-07-27 2021-11-02 上海致景信息科技有限公司 Textile raw material recommendation method and device and processor
CN113592589B (en) * 2021-07-27 2024-03-29 上海致景信息科技有限公司 Textile raw material recommendation method, device and processor

Also Published As

Publication number Publication date
JP5723835B2 (en) 2015-05-27

Similar Documents

Publication Publication Date Title
EP3779841B1 (en) Method, apparatus and system for sending information, and computer-readable storage medium
CN106156127B (en) Method and device for selecting data content to push to terminal
JP5962926B2 (en) Recommender system, recommendation method, and program
TWI636416B (en) Method and system for multi-phase ranking for content personalization
JP5723835B2 (en) Interest analysis method, interest analysis apparatus and program thereof
WO2018040069A1 (en) Information recommendation system and method
JP5615857B2 (en) Analysis apparatus, analysis method, and analysis program
CN108846097B (en) User interest tag representation method, article recommendation device and equipment
CN105976161A (en) Time axis-based intelligent recommendation calendar and user-based presentation method
JP5668010B2 (en) Information recommendation method, apparatus and program
JP5668007B2 (en) Interest analysis method, apparatus and program
CN110175895B (en) Article recommendation method and device
CN105426514A (en) Personalized mobile APP recommendation method
US20130110803A1 (en) Search driven user interface for navigating content and usage analytics
CN103778206A (en) Method for providing network service resources
JP5836210B2 (en) Influence estimation method, apparatus and program
CN114581175A (en) Commodity pushing method and device, storage medium and electronic equipment
JP5667959B2 (en) Impact analysis method, impact analysis apparatus and program thereof
CN115827956A (en) Data information retrieval method and device, electronic equipment and storage medium
JP5504213B2 (en) Interest analysis method and interest analysis apparatus
CN113761084B (en) POI search ranking model training method, ranking device, method and medium
CN108874813B (en) Information processing method, device and storage medium
CN106021423A (en) Group division-based meta-search engine personalized result recommendation method
CN106919647B (en) Clustering-based network structure similarity recommendation method
CN105590234A (en) Method and system for recommending commodities to target users

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150330

R150 Certificate of patent or registration of utility model

Ref document number: 5723835

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees