JP5235227B2 - Log processing apparatus and operation method thereof - Google Patents

Log processing apparatus and operation method thereof Download PDF

Info

Publication number
JP5235227B2
JP5235227B2 JP2011145761A JP2011145761A JP5235227B2 JP 5235227 B2 JP5235227 B2 JP 5235227B2 JP 2011145761 A JP2011145761 A JP 2011145761A JP 2011145761 A JP2011145761 A JP 2011145761A JP 5235227 B2 JP5235227 B2 JP 5235227B2
Authority
JP
Japan
Prior art keywords
content
user
log
record
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011145761A
Other languages
Japanese (ja)
Other versions
JP2013012143A (en
Inventor
達郎 石田
彰 中山
英夫 鈴木
行信 谷口
明人 阿久津
仁志 瀬下
篤信 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011145761A priority Critical patent/JP5235227B2/en
Publication of JP2013012143A publication Critical patent/JP2013012143A/en
Application granted granted Critical
Publication of JP5235227B2 publication Critical patent/JP5235227B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ログ処理装置およびその動作方法に関するものである。   The present invention relates to a log processing apparatus and an operation method thereof.

協調フィルタリングは、広義には、多くのユーザの嗜好情報を蓄積し、ある利用者(ユーザ)と嗜好の類似した他のユーザの情報を用いて該当ユーザにコンテンツを推奨する技術である。   Collaborative filtering is a technology that, in a broad sense, accumulates preference information of many users and recommends content to relevant users using information on other users who have similar preferences to a certain user (user).

この技術は、利用者間間型とアイテム(コンテンツともいう)間型に分類にできる。利用者間型は、推奨を受けるユーザと嗜好パターンが似ているユーザ(類似ユーザという)をまず見つけ、その類似ユーザが好むアイテム群を推奨候補とする技術である。実装にはユーザ同士の類似度を、同じアイテムにつけた評価の相関係数(Pearson相関、順位相関などが用いられる)などによって表し、また、嗜好の予測には、類似度の高いユーザを抽出し、そのアイテムへの評価値を、そのユーザへの類似度で重みを付けし、それらの評価値の加重平均値を予測として用いる。それらの予測値の大きなものから、推奨アイテムとして推奨を行う。表示画面の広さに制約もあるため、小さな予測値を持つアイテムを削除したり、上位3〜10個程度のアイテムを表示するように構成を行う。   This technology can be classified into an inter-user type and an item (also called content) type. The inter-user type is a technique that first finds a user (referred to as a similar user) whose preference pattern is similar to the user receiving the recommendation, and sets an item group preferred by the similar user as a recommended candidate. For implementation, the degree of similarity between users is represented by the correlation coefficient (Pearson correlation, rank correlation, etc.) of the evaluation given to the same item, and users with high similarity are extracted for preference prediction. The evaluation value for the item is weighted with the similarity to the user, and the weighted average value of the evaluation values is used as a prediction. Recommendations are made as recommended items from those with large predicted values. Since there is a restriction on the size of the display screen, an item having a small predicted value is deleted, or the upper 3 to 10 items are displayed.

また、アイテム間型では、いろいろな利用者に同じような評価を受けているアイテムは似ているという考え、関心があるアイテムの類似アイテムに利用者は関心を持つという仮定を置き、ユーザの直近の利用履歴にあるアイテムに類似しているアイテムを推奨するものである。実装としては、アイテムの利用ユーザの共起性などでアイテム間の類似度を測り、ユーザの直近の利用履歴にあるアイテムの類似アイテムの推奨を行うことが行われている。   Also, in the item-to-item type, it is assumed that items that receive similar evaluations by various users are similar, and the assumption that users are interested in similar items of the items they are interested in is the closest to the user. Recommend items that are similar to items in your usage history. As an implementation, the similarity between items is measured based on the co-occurrence of the user of the item, and the similar item of the item in the latest usage history of the user is recommended.

この場合、1つのサービスに閉じた範囲での適用を想定し、ユーザの閲覧、クリック、予約、購入、視聴、評価など行動履歴をとった対象のアイテムの履歴情報や、アイテムのメタデータを入力とすることを前提としている。   In this case, assuming the application within a closed range for one service, enter the history information of the target item that took action history such as user browsing, click, reservation, purchase, viewing, evaluation, etc. and the item metadata It is assumed that.

これらの技術の詳細については、非特許文献1に解説されている。   Details of these techniques are described in Non-Patent Document 1.

上嶌敏弘, “推奨システムのアルゴリズム(2),” 人工知能学会誌 23巻1号, pp.89103, 2008年1月Toshihiro Kamijo, “Algorithm of Recommended System (2),” Journal of Japanese Society for Artificial Intelligence Vol.23, No.1, pp.89103, January 2008

利用者間型の推薦方法を用いる場合、あるアイテムへの評価値の加重平均値を利用するため、そのアイテムが新規にコンテンツとして登録された場合など、そのアイテムへの評価ログが少ない段階においては、そのアイテム以外のアイテムの評価値がそのアイテムに比較して、大きな値を持つと考えられるため、推薦として表示されないという課題あった。これは、サービス間でアイテム系IDのデータ量や登録・削除頻度、メタデータの質等が異なる場合、サービス横断での推薦が正しく機能しないことを意味する。   When using the user-to-user recommendation method, the weighted average value of evaluation values for a certain item is used, so when the item is newly registered as content, etc., at a stage where there are few evaluation logs for that item Since the evaluation value of an item other than that item is considered to have a larger value than that item, there is a problem that it is not displayed as a recommendation. This means that recommendation across services does not function correctly when the data amount of item IDs, the frequency of registration / deletion, the quality of metadata, etc. differ between services.

アイテム間型の推薦方法を用いる場合、アイテムの利用ユーザの共起性などでアイテム間の類似度を測るため、利用者間型の推薦方法を用いる場合と同様に、あるアイテムへの評価ログが少ない段階においては、他のアイテムへの類似度がそのアイテムに比較して、大きな値を持つと考えられるため、推薦として表示されないという課題があった。これは、サービス間でユーザ系IDのデータ量や新規登録・退会頻度、利用頻度等が異なる場合、サービス横断での推薦が正しく機能しないことを意味する。
これらの課題はコールドスタート問題として知られている。
When using the item-to-item type recommendation method, the similarity between items is measured by the co-occurrence of the user who uses the item. In a small number of stages, there is a problem that the degree of similarity to other items is not displayed as a recommendation because it is considered to have a larger value than that item. This means that the recommendation across services does not function correctly when the data amount of the user ID, the frequency of new registration / unsubscription, the usage frequency, etc. differ between services.
These issues are known as cold start problems.

また、別途、ID体系を統合して推薦を行う場合でも、ID体系やログデータの質にバラつきがあるため、1つのサービスに閉じた範囲での推薦と同等の精度の推薦を行うことは難しい。   In addition, even when the recommendation is performed by integrating the ID system, it is difficult to recommend with the same accuracy as the recommendation within the range closed to one service because the quality of the ID system and log data varies. .

さらに、実サービスを想定した場合、データベースやID数は有限であり、使い続けていくと過去に利用したIDを使いまわす必要性が生じる。特にIDを処理をせずに使いまわすと、過去のデータと現在のデータが混在し、推薦処理の出力の精度が低くなる。   Furthermore, assuming an actual service, the database and the number of IDs are limited, and it is necessary to reuse IDs used in the past as they continue to be used. In particular, if the ID is reused without processing, past data and current data are mixed, and the accuracy of the output of the recommendation processing is lowered.

本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、複数のサービスでのユーザIDおよびコンテンツIDの違いに起因する不都合を解消するためのログ処理装置およびその動作方法を提供することにある。   The present invention has been made in view of the above problems, and an object of the present invention is to provide a log processing apparatus and an operation thereof for eliminating inconvenience caused by a difference between a user ID and a content ID in a plurality of services. It is to provide a method.

上記の課題を解決するために、第1の本発明は、複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置であって、いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と、複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させるユーザID処理部と、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させるコンテンツID処理部と、前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを前記ログレコード記憶部に記憶させるログレコード生成部とを備えることを特徴とするログ処理装置をもって解決手段とする。 第2の本発明は、複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置の動作方法であって、前記ログ処理装置は、いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と 複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、備え、前記動作方法は、前記ログ処理装置のユーザID処理部が、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させ、前記ログ処理装置のコンテンツID処理部が、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させ、前記ログ処理装置のログレコード生成部が、前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを前記ログレコード記憶部に記憶させることを特徴とするログ処理装置の動作方法をもって解決手段とする。   In order to solve the above-described problem, the first aspect of the present invention is a log that processes a log accumulated to recommend content to a destination user when content can be transmitted in each of a plurality of services. A processing device, a service ID of the service indicating that any content of any service has been transmitted for any user, a content ID of the content at the service, and related to the content A log storage unit that stores logs including content-related information, a user ID of the user in the service, and user-related information related to the user, and a record generated for each log of the log storage unit are stored. Log record storage unit for storing a user record including a plurality of user IDs indicating the same user in a plurality of services Integrated user ID database, integrated content ID database storing content records including a plurality of content IDs indicating the same content in a plurality of services, and a plurality of logs having the same user related information and different service IDs A user ID processing unit that reads a user ID from each of the user ID and stores a user record including the user ID and the integrated user ID in the integrated user ID database, and a plurality of logs having the same content related information and different service IDs. A content ID processing unit that reads out content IDs from each of them, stores a content record including the content ID and the integrated content ID in the integrated content ID database, and a log for the log storage unit. The integrated user ID searched from the integrated user ID database for the record containing the user ID and read from the record, and the integrated content ID database searched for the record containing the content ID in the log and read from the record And a log record generation unit that stores a record including the integrated content ID and the service ID in the log in the log record storage unit. The second aspect of the present invention is an operation method of a log processing apparatus that performs processing of a log accumulated to recommend content to a destination user when content can be transmitted in each of a plurality of services, The log processing device relates to the service ID of the service indicating that any content of any service has been transmitted for any user, the content ID of the content in the service, and the content A log storage unit that stores logs including content-related information, a user ID of the user in the service, and user-related information related to the user, and a record generated for each log of the log storage unit are stored. Log records storage unit for storing multiple user IDs indicating the same user in multiple services. And an integrated content ID database in which content records including a plurality of content IDs indicating the same content in a plurality of services are stored, and the operation method includes a user ID of the log processing device The processing unit reads a user ID from each of a plurality of logs having the same user-related information and different service IDs, and stores a user record including the user ID and the integrated user ID in the integrated user ID database, and the log A content ID processing unit of the processing device reads the content ID from each of a plurality of logs having the same content-related information and different service IDs, and stores the content record including the content ID and the integrated content ID in the integrated content The log record generation unit of the log processing device searches for a record including the user ID in the log from the integrated user ID database for each log of the log storage unit and reads out the record from the record A record including the integrated user ID and a record including the content ID in the log from the integrated content ID database and reading the integrated content ID read from the record and the service ID in the log in the log record storage unit. A log processing apparatus operating method characterized by storing the information is used as a solving means.

本発明によれば、複数のサービスでのユーザIDおよびコンテンツIDの違いに起因する不都合を解消するための技術を提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, the technique for eliminating the inconvenience resulting from the difference in user ID and content ID in a some service can be provided.

本実施の形態に係るログ処理装置を使用したレコメンドサーバ1の構成を示す図である。It is a figure which shows the structure of the recommendation server 1 using the log processing apparatus which concerns on this Embodiment. ログ蓄積部101の内容の一例を示す図である。3 is a diagram illustrating an example of contents of a log storage unit 101. FIG. サービス数記憶部104の内容の一例を示す図である。5 is a diagram illustrating an example of contents of a service number storage unit 104. FIG. サービス数記憶部105の内容の一例を示す図である。5 is a diagram illustrating an example of contents of a service number storage unit 105. FIG. 統合ユーザIDデータベース108の内容の一例を示す図である。It is a figure which shows an example of the content of the integrated user ID database. 統合コンテンツIDデータベース109の内容の一例を示す図である。It is a figure which shows an example of the content of the integrated content ID database. ログレコード記憶部110の内容の一例を示す図である。3 is a diagram illustrating an example of contents of a log record storage unit 110. FIG. ログレコード削除部112の動作を示すフローチャートである。5 is a flowchart showing an operation of a log record deletion unit 112. ログ削除部114の動作を示すフローチャートである。5 is a flowchart showing an operation of a log deletion unit 114.

以下、本発明の実施の形態について図面を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本実施の形態に係るログ処理装置を使用したレコメンドサーバ1の構成を示す図である。   FIG. 1 is a diagram showing a configuration of a recommendation server 1 using the log processing apparatus according to the present embodiment.

レコメンドサーバ1は、複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨する装置である。   The recommendation server 1 is a device that recommends content to a destination user when content can be transmitted in each of a plurality of services.

レコメンドサーバ1は、(1)複数のサービスにおいてコンテンツが送信されことを示す履歴としてのログを蓄積したログ蓄積部101と、(2)コンテンツ推奨にあたり、ログ蓄積部101を用いて、事前処理を行う事前処理部102、103と、(3)事前処理で得られたデータが記憶されるサービス数記憶部104、105と、(4)ログ蓄積部101、サービス数記憶部104を利用して処理を行うユーザID処理部106と、(5)ログ蓄積部101、サービス数記憶部105を利用して処理を行うコンテンツID処理部107と、(6)ユーザID処理部106により生成されたレコードが記憶される統合ユーザIDデータベース108と、(7)ユーザID処理部107により生成されたレコードが記憶される統合コンテンツIDデータベース109と、(8)ログ蓄積部101、統合ユーザIDデータベース108、統合コンテンツIDデータベース109を用いて生成されたレコードが記憶されるログレコード記憶部110と、(9)そのレコードを生成するログレコード生成部111と、(10)ログレコード記憶部110からレコードを削除するログレコード削除部112と、(11)ログレコード記憶部110を用いてコンテンツの推奨を行うコンテンツ推奨部113と、(12)ログ蓄積部101からログを削除するログ削除部114とを備える。   The recommendation server 1 includes (1) a log accumulation unit 101 that accumulates logs as a history indicating that content is transmitted in a plurality of services, and (2) a preprocessing using the log accumulation unit 101 for content recommendation. Processing using the preprocessing units 102 and 103 to be performed, (3) service number storage units 104 and 105 in which data obtained by the preprocessing is stored, and (4) log storage unit 101 and service number storage unit 104 A user ID processing unit 106 that performs processing, (5) a content ID processing unit 107 that performs processing using the log storage unit 101 and the service number storage unit 105, and (6) a record generated by the user ID processing unit 106. Integrated user ID database 108 stored, and (7) integrated content storing records generated by the user ID processing unit 107 D database 109, (8) log storage unit 101, integrated user ID database 108, log record storage unit 110 in which records generated using integrated content ID database 109 are stored, and (9) generate the records A log record generation unit 111; (10) a log record deletion unit 112 that deletes a record from the log record storage unit 110; (11) a content recommendation unit 113 that recommends content using the log record storage unit 110; 12) a log deletion unit 114 that deletes a log from the log storage unit 101;

図2は、ログ蓄積部101の内容の一例を示す図である。
ログ蓄積部101は、複数のログを記憶している。各ログは、いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示すものである。送信先は、例えば、ユーザに使用される端末(パーソナルコンピュータや携帯端末など)である。
FIG. 2 is a diagram illustrating an example of the contents of the log storage unit 101.
The log storage unit 101 stores a plurality of logs. Each log indicates that any content of any service has been transmitted for any user. The transmission destination is, for example, a terminal (such as a personal computer or a portable terminal) used by the user.

各ログは、(1)該当のサービスを示す識別情報(以下、「サービスID」という)、(2)該サービスでの該コンテンツを示す識別情報(以下、サービスにより呼称を変えることはせず「コンテンツID」という)、(3)該コンテンツに関連する情報(以下、「コンテンツ関連情報」という)、(4)該サービスでの該ユーザを示す識別情報(以下、サービスにより呼称を変えることはせず「ユーザID」という)、(5)該ユーザに関連する情報(以下、ユーザ関連情報)を含む。   Each log includes (1) identification information indicating the corresponding service (hereinafter referred to as “service ID”), and (2) identification information indicating the content of the service (hereinafter referred to as “service ID”). (Content ID)), (3) information related to the content (hereinafter referred to as “content-related information”), (4) identification information indicating the user at the service (hereinafter referred to as service) (Referred to as “user ID”) and (5) information related to the user (hereinafter referred to as user-related information).

コンテンツ関連情報は、例えば、該当コンテンツの題名、あらすじなどである。ここでは、題名などの個々の要素を示すもの、ならびに、各要素の総称として、「コンテンツ関連情報」を用いる。なお、各コンテンツ関連情報は、全てのサービスのログに含まれるとは限らないが、便宜上、このような情報をコンテンツ関連情報という。   The content related information is, for example, a title of the corresponding content, a synopsis, and the like. Here, “content-related information” is used as a name indicating each element such as a title and a generic name of each element. Note that each content-related information is not necessarily included in all service logs, but for convenience, such information is referred to as content-related information.

ユーザ関連情報は、例えば、該当ユーザの氏名、電話番号などである。ここでは、氏名などの個々の要素を示すもの、ならびに、各要素の総称として、「ユーザ関連情報」を用いる。なお、各ユーザ関連情報は、全てのサービスのログに含まれるとは限らないが、便宜上、このような情報をユーザ関連情報という。   The user related information is, for example, the name, telephone number, etc. of the corresponding user. Here, “user-related information” is used as a name indicating each element such as a name and a generic name of each element. Note that each user-related information is not necessarily included in all service logs, but for convenience, such information is referred to as user-related information.

また、図示しないが、各ログは、(1)該コンテンツの送信にあたり、ユーザがクリックを行った時刻(クリック時刻)、(2)該コンテンツの送信にあたり、ユーザが予約を入れた時刻(予約時刻)、(3)該コンテンツの送信にあたり、ユーザが購入操作を行った時刻(購入時刻)、(4)該コンテンツをユーザが視聴した時刻(視聴時刻)、(5)該コンテンツをユーザが評価した時刻(評価時刻)の1以上を含むこととする。また、評価時刻を含むログは、評価にて付与された評点を含むことがある。   Further, although not shown, each log includes (1) a time when the user clicked (click time) when transmitting the content, and (2) a time when the user made a reservation when transmitting the content (reserved time). ), (3) the time when the user performed a purchase operation (purchase time), (4) the time when the user viewed the content (viewing time), and (5) the user evaluated the content One or more times (evaluation times) are included. Further, the log including the evaluation time may include a score given in the evaluation.

事前処理部102は、ログ蓄積部101において、ユーザ関連情報の種類ごとに、当該種類に属するユーザ関連情報を有するログ内のサービスIDの数(サービス数という)をカウントし、(1)当該ユーザ関連情報の種類を示す情報と、(2)サービス数と、を有するレコードを生成し、サービス数記憶部104に記憶させる。   For each type of user related information, the pre-processing unit 102 counts the number of service IDs (referred to as the number of services) in the log having the user related information belonging to the type, and (1) the user A record having information indicating the type of related information and (2) the number of services is generated and stored in the service number storage unit 104.

図3は、サービス数記憶部104の内容の一例を示す図である。
図3は、(1)ユーザ関連情報の種類を示す情報「氏名」と、(2)サービス数「3」とを含むレコード、(1)「電話番号」と(2)サービス数「3」とを含むレコードなどを例示する。
FIG. 3 is a diagram illustrating an example of the contents of the service number storage unit 104.
FIG. 3 shows (1) a record including information “name” indicating the type of user-related information, (2) a service number “3”, (1) “phone number” and (2) service number “3”. A record including

図1に戻り、事前処理部103は、ログ蓄積部101において、コンテンツ関連情報の種類ごとに、当該種類に属するコンテンツ関連情報を有するログ内のサービスIDの数(サービス数という)をカウントし、(1)当該コンテンツ関連情報の種類を示す情報と、(2)サービス数と、を有するレコードを生成し、サービス数記憶部105に記憶させる。   Returning to FIG. 1, the preprocessing unit 103 counts the number of service IDs (referred to as the number of services) in the log having content related information belonging to the type for each type of content related information in the log storage unit 101. A record having (1) information indicating the type of the content-related information and (2) the number of services is generated and stored in the service number storage unit 105.

図4は、サービス数記憶部105の内容の一例を示す図である。
図4は、(1)コンテンツ関連情報の種類を示す情報「題名」と、(2)サービス数「3」とを含むレコード、(1)「あらすじ」と(2)サービス数「3」とを含むレコードなどを例示する。
FIG. 4 is a diagram illustrating an example of the contents of the service number storage unit 105.
FIG. 4 shows (1) information “title” indicating the type of content-related information, and (2) a record including the number of services “3”, (1) “Synopsis” and (2) the number of services “3”. Examples include records.

図1に戻り、ユーザID処理部106は、ログ蓄積部101において、同一のユーザ関連情報を有する複数のログのそれぞれからユーザIDを読み出し、(1)当該各ユーザIDと、(2)該当のユーザを示す統合ユーザIDと、を含むレコードを生成し、統合ユーザIDデータベース108に記憶させる。   Returning to FIG. 1, the user ID processing unit 106 reads out the user ID from each of a plurality of logs having the same user-related information in the log storage unit 101, and (1) the user ID and (2) the corresponding user ID. A record including an integrated user ID indicating a user is generated and stored in the integrated user ID database 108.

このとき、ユーザID処理部106は、まず、サービス数記憶部104のサービス数が最も多いレコードからユーザ関連情報の種類を示す情報を読み出し、(1)当該種類に属する同一のユーザ関連情報を含み、かつ、(2)互いに異なるサービスIDを含む、複数のログを検索し、当該各ログからユーザIDを読み出し、(1)当該各ユーザIDと、(2)該当のユーザを示す統合ユーザIDと、を含むレコードを生成し、統合ユーザIDデータベース108に記憶させる。   At this time, the user ID processing unit 106 first reads information indicating the type of user-related information from the record having the largest number of services in the service number storage unit 104, and (1) includes the same user-related information belonging to the type. (2) Search a plurality of logs including different service IDs, read out the user ID from each log, (1) each user ID, and (2) an integrated user ID indicating the corresponding user, Are generated and stored in the integrated user ID database 108.

以下、ユーザID処理部106は、サービス数記憶部104で2番目以降のサービス数について、降順で、同様の動作を行う。   Thereafter, the user ID processing unit 106 performs the same operation in descending order for the second and subsequent service numbers in the service number storage unit 104.

図5は、統合ユーザIDデータベース108の内容の一例を示す図である。
図5は、(1)3個のユーザID「9648」、「U36128」、「User6198」と、(2)統合ユーザID「T00001」と、を含むレコードなどを例図する。
FIG. 5 is a diagram showing an example of the contents of the integrated user ID database 108.
FIG. 5 exemplifies a record including (1) three user IDs “9648”, “U36128”, “User6198”, and (2) an integrated user ID “T00001”.

図1に戻り、コンテンツID処理部107は、ログ蓄積部101において、同一のコンテンツ関連情報を有する複数のログのそれぞれからコンテンツIDを読み出し、(1)当該各コンテンツIDと、(2)該当のコンテンツを示す統合コンテンツIDと、を含むレコードを生成し、統合コンテンツIDデータベース109に記憶させる。   Returning to FIG. 1, the content ID processing unit 107 reads the content ID from each of a plurality of logs having the same content-related information in the log storage unit 101, and (1) the content ID and (2) the corresponding ID. A record including the integrated content ID indicating the content is generated and stored in the integrated content ID database 109.

このとき、コンテンツID処理部107は、まず、サービス数記憶部105のサービス数が最も多いレコードからコンテンツ関連情報の種類を示す情報を読み出し、(1)当該種類に属する同一のコンテンツ関連情報を含み、かつ、(2)互いに異なるサービスIDを含む、複数のログを検索し、当該各ログからコンテンツIDを読み出し、(1)当該各コンテンツIDと、(2)該当のコンテンツを示す統合コンテンツIDと、を含むレコードを生成し、統合コンテンツIDデータベース109に記憶させる。   At this time, the content ID processing unit 107 first reads information indicating the type of content related information from the record having the largest number of services in the service number storage unit 105, and (1) includes the same content related information belonging to the type. (2) Search a plurality of logs including different service IDs, read out the content ID from each log, (1) each content ID, and (2) an integrated content ID indicating the corresponding content, Are generated and stored in the integrated content ID database 109.

以下、コンテンツID処理部107は、サービス数記憶部105で2番目以降のサービス数について、降順で、同様の動作を行う。   Thereafter, the content ID processing unit 107 performs the same operation in descending order for the second and subsequent service numbers in the service number storage unit 105.

図6は、統合コンテンツIDデータベース109の内容の一例を示す図である。
図6は、(1)3個のコンテンツID「100056」、「C68913」、「Content8916」と、(2)統合コンテンツID「C00001」と、を含むレコードなどを例示する。
FIG. 6 is a diagram showing an example of the contents of the integrated content ID database 109.
FIG. 6 exemplifies a record including (1) three content IDs “100056”, “C68913”, “Content8916”, and (2) an integrated content ID “C00001”.

図1に戻り、ログレコード生成部111は、ログ蓄積部101のログ毎に、(1)当該ログにあるクリック時刻、予約時刻、購入時刻、視聴時刻、評価時刻の全てと、(2)現在時刻(以下、ログ生成時刻という)と、(3)統合ユーザIDデータベース108から当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザIDと、(4)統合コンテンツIDデータベース109から当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツIDと、(4)当該ログから読み出したサービスIDと、を含むレコードを生成し、ログレコード記憶部110に記憶させる。   Returning to FIG. 1, the log record generation unit 111 performs (1) all the click time, reservation time, purchase time, viewing time, and evaluation time in the log for each log in the log storage unit 101, and (2) the current Time (hereinafter referred to as log generation time), (3) an integrated user ID retrieved from the integrated user ID database 108 by searching for a record including the user ID in the log, and (4) an integrated content ID database 109, a record including the content ID in the log is retrieved and a record including the integrated content ID read from the record and (4) the service ID read from the log is generated, and the log record storage unit 110 generates the record. Remember.

なお、ログレコード生成部111は、評価時刻を含むレコードには、対応するログから読み出された評点を含ませる。一方、ログレコード生成部111は、評価時刻を含まないレコードには、評点「1」を含ませる。   Note that the log record generation unit 111 includes a score read from the corresponding log in the record including the evaluation time. On the other hand, the log record generation unit 111 includes a score “1” in a record that does not include an evaluation time.

図7は、ログレコード記憶部110の内容の一例を示す図である。
図7は、(1)クリック時刻「2011/06/23;23:12:23」、評価時刻「2011/06/29;23:45:33」と、(2)ログ生成時刻「2011/06/28;00:10:00」と、(3)統合ユーザID「T12541」と、(4)統合コンテンツID「C15244」と、(5)サービスID「SV1」と、(6)評点を含むレコードを例示する。
FIG. 7 is a diagram illustrating an example of the contents of the log record storage unit 110.
7 shows (1) click time “2011/06/23; 23: 12: 23”, evaluation time “2011/06/29; 23: 45: 33”, and (2) log generation time “2011/06 / 28; 00: 10: 00 ”, (3) integrated user ID“ T12541 ”, (4) integrated content ID“ C15244 ”, (5) service ID“ SV1 ”, and (6) a record including a score Is illustrated.

図8は、ログレコード削除部112の動作を示すフローチャートである。
ログレコード削除部112は、ログレコード記憶部110からレコードを削除等することで、後述のコンテンツの推奨が、あるサービスに偏って行われる等の不都合を防止するのである。
FIG. 8 is a flowchart showing the operation of the log record deletion unit 112.
The log record deletion unit 112 prevents inconvenience such as recommendation of content described later biased to a certain service by deleting records from the log record storage unit 110.

まず、ログレコード削除部112は、ログレコード記憶部110において、サービスIDごとの該サービスIDを含むレコードの集合におけるレコードの数の不均衡さを示すジニ係数GC1を求め、ジニ係数GC1が予め定めた閾値(以下、閾値GCT1という)より大きいか否かを判定する(S1)。   First, the log record deletion unit 112 obtains the Gini coefficient GC1 indicating the imbalance of the number of records in the set of records including the service ID for each service ID in the log record storage unit 110, and the Gini coefficient GC1 is determined in advance. It is determined whether it is greater than a threshold value (hereinafter referred to as threshold value GCT1) (S1).

ジニ係数GC1は、各対象(この場合、レコードの集合)における要素数(この場合、レコードの数)の不均衡さを示すものである。ジニ係数GC1は、0〜1の範囲に含まれる。ジニ係数GC1が1に近いほど不均衡の程度は大きく、ジニ係数GC1が0に近いほど不均衡の程度は小さい。不均衡がないとき、つまり、各レコードの数が互いに等しいとき、ジニ係数GC1は0になる。後述のジニ係数GC2なども同様である。   The Gini coefficient GC1 indicates an imbalance of the number of elements (in this case, the number of records) in each target (in this case, a set of records). The Gini coefficient GC1 is included in the range of 0-1. The closer the Gini coefficient GC1 is to 1, the greater the degree of imbalance, and the closer the Gini coefficient GC1 to 0, the smaller the degree of imbalance. When there is no imbalance, that is, when the number of records is equal to each other, the Gini coefficient GC1 becomes zero. The same applies to the Gini coefficient GC2, which will be described later.

ログレコード削除部112は、ジニ係数GC1を求めるにあたり、まず、式(1)により平均差MDFを計算する。

Figure 0005235227
In obtaining the Gini coefficient GC1, the log record deleting unit 112 first calculates the average difference MDF using Equation (1).
Figure 0005235227

ここで、nは、サービスの総数、xiは、サービスiのサービスIDを含むレコードの数、xjは、サービスjのサービスIDを含むレコードの数である。   Here, n is the total number of services, xi is the number of records including the service ID of service i, and xj is the number of records including the service ID of service j.

次に、ログレコード削除部112は、式(2)により平均値μを計算する。

Figure 0005235227
Next, the log record deletion unit 112 calculates the average value μ using Equation (2).
Figure 0005235227

ここで、nは、サービスの総数、x1、x2、…は、それぞれ、第1、第2、…、第nのサービスのサービスIDを含むレコードの数である。   Here, n is the total number of services, and x1, x2,... Are the numbers of records including the service IDs of the first, second,.

次に、ログレコード削除部112は、式(3)によりジニ係数GCを計算する。
GC1=MDF/(2×μ) (3)
ログレコード削除部112は、ジニ係数GC1が閾値GCT1より大きいなら(S1:YES)、予め定められた数(以下、閾値LT1という)より多い数のレコードを有するレコードの集合をログレコード記憶部110から検索し、各レコードの集合について、該集合から、該集合内のレコード数が閾値LT1に等しくなるようにレコードを削除する(S3)。
Next, the log record deletion unit 112 calculates the Gini coefficient GC using Expression (3).
GC1 = MDF / (2 × μ) (3)
If the Gini coefficient GC1 is larger than the threshold GCT1 (S1: YES), the log record deletion unit 112 sets a set of records having a larger number of records than a predetermined number (hereinafter referred to as threshold LT1) to the log record storage unit 110. The records are deleted from the set so that the number of records in the set is equal to the threshold LT1 (S3).

ログレコード削除部112は、ジニ係数GC1が閾値GCT1未満なら(S1:NO)、または、ステップS3の処理を終えたなら、ログレコード削除部112は、ログレコード記憶部110において、サービスIDごとに、該サービスIDを含むレコードの集合を分割する。ここで、ログレコード削除部112は、分割されたそれぞれが、同じ時間長(例えば、1時間)を有する時間帯に属する視聴時刻(他の時刻、例えばクリック時刻でもよい。)を含むものとする。   If the Gini coefficient GC1 is less than the threshold value GCT1 (S1: NO), or if the process of step S3 is completed, the log record deletion unit 112 performs log service storage unit 110 for each service ID. The set of records including the service ID is divided. Here, it is assumed that the log record deletion unit 112 includes viewing times (other times, for example, click times) belonging to a time zone having the same time length (for example, 1 hour).

次に、ログレコード削除部112は、サービスIDによらず、分割されたレコードの集合のすべてについて、かかるレコードの集合(以下、集合という)におけるレコードの数の不均衡さを示すジニ係数GC2を求め、ジニ係数GC2が予め定めた閾値(以下、閾値GCT2という)より大きいか否かを判定する(S5)。   Next, the log record deletion unit 112 sets the Gini coefficient GC2 indicating the imbalance of the number of records in the record set (hereinafter referred to as a set) for all of the divided record sets regardless of the service ID. Then, it is determined whether or not the Gini coefficient GC2 is larger than a predetermined threshold (hereinafter referred to as threshold GCT2) (S5).

ここでは、ログレコード削除部112は、まず、上記式(1)により平均差MDFを計算する。   Here, the log record deletion unit 112 first calculates the average difference MDF by the above equation (1).

ここで、nは、集合の総数、xiは、集合iのレコードの数、xjは、集合jのレコードの数である。   Here, n is the total number of sets, xi is the number of records in the set i, and xj is the number of records in the set j.

次に、ログレコード削除部112は、上記式(2)により平均値μを計算する。
ここで、nは、集合の総数、x1、x2、…は、それぞれ、第1、第2、…、第nの集合のレコードの数である。
Next, the log record deletion unit 112 calculates the average value μ using the above equation (2).
Here, n is the total number of sets, and x1, x2,... Are the numbers of records in the first, second,.

次に、ログレコード削除部112は、式(4)によりジニ係数GC2を計算する。
GC2=MDF/(2×μ) (4)
ログレコード削除部112は、ジニ係数GC2が閾値GCT2より大きいなら(S5:YES)、予め定められた数(以下、閾値LT2という)より多い数のレコードを有する集合をログレコード記憶部110から検索し、各集合について、該集合から、該集合内のレコード数が閾値LT2に等しくなるようにレコードを削除する(S7)。
Next, the log record deletion unit 112 calculates the Gini coefficient GC2 using Equation (4).
GC2 = MDF / (2 × μ) (4)
If the Gini coefficient GC2 is greater than the threshold value GCT2 (S5: YES), the log record deletion unit 112 searches the log record storage unit 110 for a set having a larger number of records than the predetermined number (hereinafter referred to as the threshold value LT2). For each set, records are deleted from the set so that the number of records in the set is equal to the threshold LT2 (S7).

ログレコード削除部112は、ジニ係数GC2が閾値GCT2未満なら(S5:NO)、または、ステップS7の処理を終えたなら、ログレコード記憶部110において、サービスIDごとに、該サービスIDを含むレコード内の評点の平均(平均評点)を求める。   When the Gini coefficient GC2 is less than the threshold value GCT2 (S5: NO) or when the process of step S7 is finished, the log record deletion unit 112 records the service ID for each service ID in the log record storage unit 110. Find the average of the scores (average score).

次に、ログレコード削除部112は、各平均評点の不均衡さを示すジニ係数GC3を求め、ジニ係数GC3が予め定めた閾値(以下、閾値GCT3という)より大きいか否かを判定する(S9)。   Next, the log record deletion unit 112 obtains the Gini coefficient GC3 indicating the imbalance of each average score, and determines whether the Gini coefficient GC3 is greater than a predetermined threshold (hereinafter referred to as threshold GCT3) (S9). ).

ここでは、ログレコード削除部112は、まず、上記式(1)により平均差MDFを計算する。
ここで、nは、平均評点の総数、xiは、平均評点i、xjは、平均評点jである。
Here, the log record deletion unit 112 first calculates the average difference MDF by the above equation (1).
Here, n is the total number of average scores, xi is the average score i, and xj is the average score j.

次に、ログレコード削除部112は、上記式(2)により平均値μを計算する。
ここで、nは、平均評点の総数、x1、x2、…は、それぞれ、第1、第2、…、第nの平均評点である。
Next, the log record deletion unit 112 calculates the average value μ using the above equation (2).
Here, n is the total number of average scores, and x1, x2,... Are the first, second,.

次に、ログレコード削除部112は、式(5)によりジニ係数GC3を計算する。
GC3=MDF/(2×μ) (5)
ログレコード削除部112は、ジニ係数GC3が閾値GCT3より大きいなら(S9:YES)、ログレコード記憶部110において、予め定められた点(以下、閾値LT3という)より大きい平均評点に対応するサービスIDを含むレコードを検索し、該レコード内の評点に対し、ステップS9で計算した平均差MDFと予め定められた係数との積を加え(S11)、処理を終える。
Next, the log record deletion unit 112 calculates the Gini coefficient GC3 using Expression (5).
GC3 = MDF / (2 × μ) (5)
If the Gini coefficient GC3 is greater than the threshold GCT3 (S9: YES), the log record deletion unit 112 determines the service ID corresponding to the average score that is greater than a predetermined point (hereinafter referred to as the threshold LT3) in the log record storage unit 110. A record including the above is retrieved, and the product of the average difference MDF calculated in step S9 and a predetermined coefficient is added to the score in the record (S11), and the process ends.

ログレコード削除部112は、ジニ係数GC3が閾値GCT未満なら(S9:NO)、処理を終える。   If the Gini coefficient GC3 is less than the threshold value GCT (S9: NO), the log record deletion unit 112 ends the process.

図1に戻り、コンテンツ推奨部113は、ログレコード記憶部110を用いて、ユーザに好まれると思われるコンテンツのコンテンツIDを予め定められた最大数以下の範囲で求め、該コンテンツIDを含む情報を該ユーザに使用される端末などに送信する。   Returning to FIG. 1, the content recommendation unit 113 uses the log record storage unit 110 to obtain a content ID of content that the user would like to use within a predetermined maximum number or less, and includes the content ID. Is transmitted to a terminal used by the user.

なお、コンテンツ推奨部113は、かかる動作を適宜実行し、その際、ユーザに好まれると思われるコンテンツを求めるのに、例えば、非特許文献1を使用することができる。例えば、コンテンツ間、ユーザ間、サービス間での関連性が求められ、このような関連性を基に、コンテンツが決定される。   In addition, the content recommendation part 113 can use this operation | movement suitably, and can use the nonpatent literature 1, for example for calculating | requiring the content considered that a user likes at that time. For example, relationships between contents, users, and services are required, and contents are determined based on such relationships.

図9は、ログ削除部114の動作を示すフローチャートである。
ログ削除部114は、ログ蓄積部101から、使用されなくなったユーザIDやコンテンツIDを含むログを検出し、削除する(S21)。
FIG. 9 is a flowchart showing the operation of the log deletion unit 114.
The log deletion unit 114 detects and deletes a log including a user ID and content ID that are no longer used from the log storage unit 101 (S21).

次に、ログ削除部114は、統合ユーザIDデータベース108から、ステップS21で削除したユーザIDを含むレコードを検出し、削除する(S23)。   Next, the log deletion unit 114 detects and deletes the record including the user ID deleted in step S21 from the integrated user ID database 108 (S23).

次に、ログ削除部114は、統合コンテンツIDデータベース109から、ステップS21で削除したコンテンツIDを含むレコードを検出し、削除する(S25)。   Next, the log deletion unit 114 detects and deletes the record including the content ID deleted in step S21 from the integrated content ID database 109 (S25).

次に、ログ削除部114は、ログレコード記憶部110から、ステップS21で削除したレコード内の統合ユーザIDまたはステップS23で削除したレコード内の統合コンテンツIDを含むレコードを検出し、削除し(S27)、処理を終える。   Next, the log deletion unit 114 detects and deletes the record including the integrated user ID in the record deleted in step S21 or the integrated content ID in the record deleted in step S23 from the log record storage unit 110 (S27). ) Finish the process.

したがって、本実施の形態によれば、レコメンドサーバ1において、サービスID、該サービスでのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部101と、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを統合ユーザIDデータベース108に記憶させるユーザID処理部106と、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを統合コンテンツIDデータベース109に記憶させるコンテンツID処理部107と、ログ蓄積部101のログ毎に、統合ユーザIDデータベース108から当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、統合コンテンツIDデータベース109から当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードをログレコード記憶部110に記憶させるログレコード生成部111とを備えるログ処理装置を構成することで、複数のサービスでのユーザIDおよびコンテンツIDの違いに起因する不都合を解消する技術を提供することができる。   Therefore, according to the present embodiment, in the recommendation server 1, the service ID, the content ID in the service, the content related information related to the content, the user ID in the service, the user related information related to the user, A user ID is read from each of a plurality of logs having the same user related information and different service IDs, and a user record including the user ID and the integrated user ID is integrated user The content ID is read from the user ID processing unit 106 stored in the ID database 108 and each of a plurality of logs having the same content related information and different service IDs, and the content record including the content ID and the integrated content ID is integrated. For each log of the content ID processing unit 107 and the log storage unit 101 to be stored in the content ID database 109, the integrated user ID database 108 is searched for a record including the user ID in the log and is read from the record. A log record for searching the record including the content ID in the log from the integrated content ID database 109 and storing the record including the integrated content ID read from the record and the service ID in the log in the log record storage unit 110 By configuring the log processing device including the generation unit 111, it is possible to provide a technique that eliminates inconvenience due to the difference between the user ID and the content ID in a plurality of services.

例えば、あるユーザAが利用していたサービスαおよびβのログから、それまでサービスαを利用していて初めてサービスβを利用したユーザBに対して、サービスβのコンテンツを推薦することができる。   For example, from the logs of services α and β used by a certain user A, the content of the service β can be recommended to the user B who has used the service β for the first time using the service α.

なお、本実施の形態に係るログ処理装置としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。   The computer program for causing the computer to function as the log processing apparatus according to the present embodiment can be recorded on a computer-readable recording medium such as a semiconductor memory, a magnetic disk, an optical disk, a magneto-optical disk, or a magnetic tape. It can be widely distributed by being transmitted via a communication network such as the Internet.

1…レコメンドサーバ
101…ログ蓄積部
102、103…事前処理部
104、105…サービス数記憶部
106…ユーザID処理部
107…コンテンツID処理部
108…統合ユーザIDデータベース
109…統合コンテンツIDデータベース
110…ログレコード記憶部
111…ログレコード生成部
112…ログレコード削除部
113…コンテンツ推奨部
114…ログ削除部
DESCRIPTION OF SYMBOLS 1 ... Recommendation server 101 ... Log storage part 102, 103 ... Pre-processing part 104, 105 ... Service number storage part 106 ... User ID processing part 107 ... Content ID processing part 108 ... Integrated user ID database 109 ... Integrated content ID database 110 ... Log record storage unit 111 ... Log record generation unit 112 ... Log record deletion unit 113 ... Content recommendation unit 114 ... Log deletion unit

Claims (3)

複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置であって、
いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、
前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と、
複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、
複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、
同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させるユーザID処理部と、
同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させるコンテンツID処理部と、
前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを生成し、前記ログレコード記憶部に記憶させるログレコード生成部と
を備えることを特徴とするログ処理装置。
A log processing device for processing a log accumulated to recommend content to a destination user when content can be transmitted in each of a plurality of services,
The service ID of the service indicating that any content of any service has been transmitted for any user, the content ID of the content at the service, content-related information related to the content, the service A log storage unit for storing a log including the user ID of the user and user-related information related to the user;
A log record storage unit for storing a record generated for each log of the log storage unit;
An integrated user ID database in which user records including a plurality of user IDs indicating the same user in a plurality of services are stored;
An integrated content ID database in which content records including a plurality of content IDs indicating the same content in a plurality of services are stored;
A user ID processing unit that reads a user ID from each of a plurality of logs having the same user-related information and different service IDs, and stores a user record including the user ID and the integrated user ID in the integrated user ID database;
A content ID processing unit that reads a content ID from each of a plurality of logs having the same content-related information and different service IDs, and stores a content record including the content ID and the integrated content ID in the integrated content ID database;
For each log in the log storage unit, a record including a user ID in the log is searched from the integrated user ID database, and an integrated user ID read from the record, and a content ID in the log from the integrated content ID database A log record generating unit that searches for a record to be included and generates a record including an integrated content ID read from the record and a service ID in the log, and stores the record in the log record storage unit Processing equipment.
複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置の動作方法であって、
前記ログ処理装置は、
いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、
前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と 複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、
複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、
を備え、
前記動作方法は、
前記ログ処理装置のユーザID処理部が、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させ、
前記ログ処理装置のコンテンツID処理部が、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させ、
前記ログ処理装置のログレコード生成部が、前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを生成し、前記ログレコード記憶部に記憶させる
ことを特徴とするログ処理装置の動作方法。
An operation method of a log processing apparatus for processing logs accumulated in order to recommend content to a destination user when content can be transmitted in each of a plurality of services,
The log processing device includes:
The service ID of the service indicating that any content of any service has been transmitted for any user, the content ID of the content at the service, content-related information related to the content, the service A log storage unit for storing a log including the user ID of the user and user-related information related to the user;
A log record storage unit for storing a record generated for each log of the log storage unit, and an integrated user ID database in which user records including a plurality of user IDs indicating the same user in a plurality of services are stored;
An integrated content ID database in which content records including a plurality of content IDs indicating the same content in a plurality of services are stored;
With
The operation method is as follows:
The user ID processing unit of the log processing device reads a user ID from each of a plurality of logs having the same user related information and different service IDs, and a user record including the user ID and the integrated user ID is stored in the integrated user ID. Memorize it in the database,
The content ID processing unit of the log processing device reads the content ID from each of a plurality of logs having the same content-related information and different service IDs, and the content record including the content ID and the integrated content ID is the integrated content ID. Memorize it in the database,
The log record generation unit of the log processing device searches for a record including the user ID in the log from the integrated user ID database for each log of the log storage unit, and reads the integrated user ID read from the record, the integrated Searching the record including the content ID in the log from the content ID database, generating a record including the integrated content ID read from the record and the service ID in the log, and storing the record in the log record storage unit. An operating method of a log processing apparatus.
請求項1記載のログ処理装置としてコンピュータを機能させるためのコンピュータプログラム。   A computer program for causing a computer to function as the log processing apparatus according to claim 1.
JP2011145761A 2011-06-30 2011-06-30 Log processing apparatus and operation method thereof Active JP5235227B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011145761A JP5235227B2 (en) 2011-06-30 2011-06-30 Log processing apparatus and operation method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011145761A JP5235227B2 (en) 2011-06-30 2011-06-30 Log processing apparatus and operation method thereof

Publications (2)

Publication Number Publication Date
JP2013012143A JP2013012143A (en) 2013-01-17
JP5235227B2 true JP5235227B2 (en) 2013-07-10

Family

ID=47685953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011145761A Active JP5235227B2 (en) 2011-06-30 2011-06-30 Log processing apparatus and operation method thereof

Country Status (1)

Country Link
JP (1) JP5235227B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7001508B2 (en) * 2018-03-16 2022-01-19 ヤフー株式会社 Information processing equipment, information processing methods, and programs.

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229052A (en) * 2001-03-14 2001-08-24 Yoko Ogawa Log processor, log processing method and log processing program
JP2004341584A (en) * 2003-05-13 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> System, method, program, and recording medium for introducing information
JP2007208936A (en) * 2006-02-06 2007-08-16 Toshiba Corp Video distribution system and video distribution service receiving terminal management method
JP4487291B2 (en) * 2006-02-13 2010-06-23 鳴利 田渕 Monitoring result recording system, common log generation device, and program
JP4465633B2 (en) * 2007-12-07 2010-05-19 ソニー株式会社 Information processing apparatus and method, and program
JP4645676B2 (en) * 2008-04-28 2011-03-09 ソニー株式会社 Information processing apparatus, related item providing method, and program
US20110060738A1 (en) * 2009-09-08 2011-03-10 Apple Inc. Media item clustering based on similarity data

Also Published As

Publication number Publication date
JP2013012143A (en) 2013-01-17

Similar Documents

Publication Publication Date Title
US11244326B2 (en) Analytical precursor mining for personalized recommendation
US7685200B2 (en) Ranking and suggesting candidate objects
JP4678546B2 (en) RECOMMENDATION DEVICE AND METHOD, PROGRAM, AND RECORDING MEDIUM
CN109522480B (en) Information recommendation method and device, electronic equipment and storage medium
KR20100086676A (en) Method and apparatus of predicting preference rating for contents, and method and apparatus for selecting sample contents
WO2013095902A2 (en) A hierarchical behavioral profile
KR101206160B1 (en) Method for recommending content based on user preference and profile of content
KR101593991B1 (en) Method and apparatus for recommending content
CN111310046B (en) Object recommendation method and device
KR20090017268A (en) Method for updating interest keyword of user and system for executing the method
JP6079270B2 (en) Information provision device
KR20200049193A (en) Method for providing contents and service device supporting the same
KR20140006516A (en) System and method for providing location based contents service
CN112328889A (en) Method and device for determining recommended search terms, readable medium and electronic equipment
CN108319628B (en) User interest determination method and device
JP5048852B2 (en) Search device, search method, search program, and computer-readable recording medium storing the program
US9020863B2 (en) Information processing device, information processing method, and program
KR101334096B1 (en) Item based recommendation engiine recommending highly associated item
CN112836126A (en) Recommendation method and device based on knowledge graph, electronic equipment and storage medium
JP5235227B2 (en) Log processing apparatus and operation method thereof
JP7278100B2 (en) Post evaluation system and method
Shafiq et al. Community aware personalized web search
US9542497B2 (en) Information processing apparatus, information processing method, and information processing program
JP5216895B2 (en) Log processing apparatus and operation method thereof
JP5938002B2 (en) Content recommendation device and operation method thereof

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130325

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5235227

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350