JP2013012143A - ログ処理装置およびその動作方法 - Google Patents

ログ処理装置およびその動作方法 Download PDF

Info

Publication number
JP2013012143A
JP2013012143A JP2011145761A JP2011145761A JP2013012143A JP 2013012143 A JP2013012143 A JP 2013012143A JP 2011145761 A JP2011145761 A JP 2011145761A JP 2011145761 A JP2011145761 A JP 2011145761A JP 2013012143 A JP2013012143 A JP 2013012143A
Authority
JP
Japan
Prior art keywords
content
user
log
record
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011145761A
Other languages
English (en)
Other versions
JP5235227B2 (ja
Inventor
Tatsuro Ishida
達郎 石田
Akira Nakayama
彰 中山
Hideo Suzuki
英夫 鈴木
Yukinobu Taniguchi
行信 谷口
Akihito Akutsu
明人 阿久津
Hitoshi Seshimo
仁志 瀬下
Atsunobu Kimura
篤信 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011145761A priority Critical patent/JP5235227B2/ja
Publication of JP2013012143A publication Critical patent/JP2013012143A/ja
Application granted granted Critical
Publication of JP5235227B2 publication Critical patent/JP5235227B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】複数のサービスでのユーザIDおよびコンテンツIDの違いに起因する不都合を解消するためのログ処理装置およびその動作方法を提供する。
【解決手段】ログ蓄積部101のログ毎に、(1)当該ログにあるクリック時刻、予約時刻、購入時刻、視聴時刻、評価時刻の全てと、(2)現在時刻(以下、ログ生成時刻という)と、(3)統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザIDと、(4)統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツIDと、(4)当該ログから読み出したサービスIDと、を含むレコードを生成する。
【選択図】図2

Description

本発明は、ログ処理装置およびその動作方法に関するものである。
協調フィルタリングは、広義には、多くのユーザの嗜好情報を蓄積し、ある利用者(ユーザ)と嗜好の類似した他のユーザの情報を用いて該当ユーザにコンテンツを推奨する技術である。
この技術は、利用者間間型とアイテム(コンテンツともいう)間型に分類にできる。利用者間型は、推奨を受けるユーザと嗜好パターンが似ているユーザ(類似ユーザという)をまず見つけ、その類似ユーザが好むアイテム群を推奨候補とする技術である。実装にはユーザ同士の類似度を、同じアイテムにつけた評価の相関係数(Pearson相関、順位相関などが用いられる)などによって表し、また、嗜好の予測には、類似度の高いユーザを抽出し、そのアイテムへの評価値を、そのユーザへの類似度で重みを付けし、それらの評価値の加重平均値を予測として用いる。それらの予測値の大きなものから、推奨アイテムとして推奨を行う。表示画面の広さに制約もあるため、小さな予測値を持つアイテムを削除したり、上位3〜10個程度のアイテムを表示するように構成を行う。
また、アイテム間型では、いろいろな利用者に同じような評価を受けているアイテムは似ているという考え、関心があるアイテムの類似アイテムに利用者は関心を持つという仮定を置き、ユーザの直近の利用履歴にあるアイテムに類似しているアイテムを推奨するものである。実装としては、アイテムの利用ユーザの共起性などでアイテム間の類似度を測り、ユーザの直近の利用履歴にあるアイテムの類似アイテムの推奨を行うことが行われている。
この場合、1つのサービスに閉じた範囲での適用を想定し、ユーザの閲覧、クリック、予約、購入、視聴、評価など行動履歴をとった対象のアイテムの履歴情報や、アイテムのメタデータを入力とすることを前提としている。
これらの技術の詳細については、非特許文献1に解説されている。
上嶌敏弘, "推奨システムのアルゴリズム(2)," 人工知能学会誌 23巻1号, pp.89103, 2008年1月
利用者間型の推薦方法を用いる場合、あるアイテムへの評価値の加重平均値を利用するため、そのアイテムが新規にコンテンツとして登録された場合など、そのアイテムへの評価ログが少ない段階においては、そのアイテム以外のアイテムの評価値がそのアイテムに比較して、大きな値を持つと考えられるため、推薦として表示されないという課題あった。これは、サービス間でアイテム系IDのデータ量や登録・削除頻度、メタデータの質等が異なる場合、サービス横断での推薦が正しく機能しないことを意味する。
アイテム間型の推薦方法を用いる場合、アイテムの利用ユーザの共起性などでアイテム間の類似度を測るため、利用者間型の推薦方法を用いる場合と同様に、あるアイテムへの評価ログが少ない段階においては、他のアイテムへの類似度がそのアイテムに比較して、大きな値を持つと考えられるため、推薦として表示されないという課題があった。これは、サービス間でユーザ系IDのデータ量や新規登録・退会頻度、利用頻度等が異なる場合、サービス横断での推薦が正しく機能しないことを意味する。
これらの課題はコールドスタート問題として知られている。
また、別途、ID体系を統合して推薦を行う場合でも、ID体系やログデータの質にバラつきがあるため、1つのサービスに閉じた範囲での推薦と同等の精度の推薦を行うことは難しい。
さらに、実サービスを想定した場合、データベースやID数は有限であり、使い続けていくと過去に利用したIDを使いまわす必要性が生じる。特にIDを処理をせずに使いまわすと、過去のデータと現在のデータが混在し、推薦処理の出力の精度が低くなる。
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、複数のサービスでのユーザIDおよびコンテンツIDの違いに起因する不都合を解消するためのログ処理装置およびその動作方法を提供することにある。
上記の課題を解決するために、第1の本発明は、複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置であって、いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と、複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させるユーザID処理部と、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させるコンテンツID処理部と、前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを前記ログレコード記憶部に記憶させるログレコード生成部とを備えることを特徴とするログ処理装置をもって解決手段とする。 第2の本発明は、複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置の動作方法であって、前記ログ処理装置は、いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と 複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、備え、前記動作方法は、前記ログ処理装置のユーザID処理部が、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させ、前記ログ処理装置のコンテンツID処理部が、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させ、前記ログ処理装置のログレコード生成部が、前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを前記ログレコード記憶部に記憶させることを特徴とするログ処理装置の動作方法をもって解決手段とする。
本発明によれば、複数のサービスでのユーザIDおよびコンテンツIDの違いに起因する不都合を解消するための技術を提供することができる。
本実施の形態に係るログ処理装置を使用したレコメンドサーバ1の構成を示す図である。 ログ蓄積部101の内容の一例を示す図である。 サービス数記憶部104の内容の一例を示す図である。 サービス数記憶部105の内容の一例を示す図である。 統合ユーザIDデータベース108の内容の一例を示す図である。 統合コンテンツIDデータベース109の内容の一例を示す図である。 ログレコード記憶部110の内容の一例を示す図である。 ログレコード削除部112の動作を示すフローチャートである。 ログ削除部114の動作を示すフローチャートである。
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本実施の形態に係るログ処理装置を使用したレコメンドサーバ1の構成を示す図である。
レコメンドサーバ1は、複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨する装置である。
レコメンドサーバ1は、(1)複数のサービスにおいてコンテンツが送信されことを示す履歴としてのログを蓄積したログ蓄積部101と、(2)コンテンツ推奨にあたり、ログ蓄積部101を用いて、事前処理を行う事前処理部102、103と、(3)事前処理で得られたデータが記憶されるサービス数記憶部104、105と、(4)ログ蓄積部101、サービス数記憶部104を利用して処理を行うユーザID処理部106と、(5)ログ蓄積部101、サービス数記憶部105を利用して処理を行うコンテンツID処理部107と、(6)ユーザID処理部106により生成されたレコードが記憶される統合ユーザIDデータベース108と、(7)ユーザID処理部107により生成されたレコードが記憶される統合コンテンツIDデータベース109と、(8)ログ蓄積部101、統合ユーザIDデータベース108、統合コンテンツIDデータベース109を用いて生成されたレコードが記憶されるログレコード記憶部110と、(9)そのレコードを生成するログレコード生成部111と、(10)ログレコード記憶部110からレコードを削除するログレコード削除部112と、(11)ログレコード記憶部110を用いてコンテンツの推奨を行うコンテンツ推奨部113と、(12)ログ蓄積部101からログを削除するログ削除部114とを備える。
図2は、ログ蓄積部101の内容の一例を示す図である。
ログ蓄積部101は、複数のログを記憶している。各ログは、いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示すものである。送信先は、例えば、ユーザに使用される端末(パーソナルコンピュータや携帯端末など)である。
各ログは、(1)該当のサービスを示す識別情報(以下、「サービスID」という)、(2)該サービスでの該コンテンツを示す識別情報(以下、サービスにより呼称を変えることはせず「コンテンツID」という)、(3)該コンテンツに関連する情報(以下、「コンテンツ関連情報」という)、(4)該サービスでの該ユーザを示す識別情報(以下、サービスにより呼称を変えることはせず「ユーザID」という)、(5)該ユーザに関連する情報(以下、ユーザ関連情報)を含む。
コンテンツ関連情報は、例えば、該当コンテンツの題名、あらすじなどである。ここでは、題名などの個々の要素を示すもの、ならびに、各要素の総称として、「コンテンツ関連情報」を用いる。なお、各コンテンツ関連情報は、全てのサービスのログに含まれるとは限らないが、便宜上、このような情報をコンテンツ関連情報という。
ユーザ関連情報は、例えば、該当ユーザの氏名、電話番号などである。ここでは、氏名などの個々の要素を示すもの、ならびに、各要素の総称として、「ユーザ関連情報」を用いる。なお、各ユーザ関連情報は、全てのサービスのログに含まれるとは限らないが、便宜上、このような情報をユーザ関連情報という。
また、図示しないが、各ログは、(1)該コンテンツの送信にあたり、ユーザがクリックを行った時刻(クリック時刻)、(2)該コンテンツの送信にあたり、ユーザが予約を入れた時刻(予約時刻)、(3)該コンテンツの送信にあたり、ユーザが購入操作を行った時刻(購入時刻)、(4)該コンテンツをユーザが視聴した時刻(視聴時刻)、(5)該コンテンツをユーザが評価した時刻(評価時刻)の1以上を含むこととする。また、評価時刻を含むログは、評価にて付与された評点を含むことがある。
事前処理部102は、ログ蓄積部101において、ユーザ関連情報の種類ごとに、当該種類に属するユーザ関連情報を有するログ内のサービスIDの数(サービス数という)をカウントし、(1)当該ユーザ関連情報の種類を示す情報と、(2)サービス数と、を有するレコードを生成し、サービス数記憶部104に記憶させる。
図3は、サービス数記憶部104の内容の一例を示す図である。
図3は、(1)ユーザ関連情報の種類を示す情報「氏名」と、(2)サービス数「3」とを含むレコード、(1)「電話番号」と(2)サービス数「3」とを含むレコードなどを例示する。
図1に戻り、事前処理部103は、ログ蓄積部101において、コンテンツ関連情報の種類ごとに、当該種類に属するコンテンツ関連情報を有するログ内のサービスIDの数(サービス数という)をカウントし、(1)当該コンテンツ関連情報の種類を示す情報と、(2)サービス数と、を有するレコードを生成し、サービス数記憶部105に記憶させる。
図4は、サービス数記憶部105の内容の一例を示す図である。
図4は、(1)コンテンツ関連情報の種類を示す情報「題名」と、(2)サービス数「3」とを含むレコード、(1)「あらすじ」と(2)サービス数「3」とを含むレコードなどを例示する。
図1に戻り、ユーザID処理部106は、ログ蓄積部101において、同一のユーザ関連情報を有する複数のログのそれぞれからユーザIDを読み出し、(1)当該各ユーザIDと、(2)該当のユーザを示す統合ユーザIDと、を含むレコードを生成し、統合ユーザIDデータベース108に記憶させる。
このとき、ユーザID処理部106は、まず、サービス数記憶部104のサービス数が最も多いレコードからユーザ関連情報の種類を示す情報を読み出し、(1)当該種類に属する同一のユーザ関連情報を含み、かつ、(2)互いに異なるサービスIDを含む、複数のログを検索し、当該各ログからユーザIDを読み出し、(1)当該各ユーザIDと、(2)該当のユーザを示す統合ユーザIDと、を含むレコードを生成し、統合ユーザIDデータベース108に記憶させる。
以下、ユーザID処理部106は、サービス数記憶部104で2番目以降のサービス数について、降順で、同様の動作を行う。
図5は、統合ユーザIDデータベース108の内容の一例を示す図である。
図5は、(1)3個のユーザID「9648」、「U36128」、「User6198」と、(2)統合ユーザID「T00001」と、を含むレコードなどを例図する。
図1に戻り、コンテンツID処理部107は、ログ蓄積部101において、同一のコンテンツ関連情報を有する複数のログのそれぞれからコンテンツIDを読み出し、(1)当該各コンテンツIDと、(2)該当のコンテンツを示す統合コンテンツIDと、を含むレコードを生成し、統合コンテンツIDデータベース109に記憶させる。
このとき、コンテンツID処理部107は、まず、サービス数記憶部105のサービス数が最も多いレコードからコンテンツ関連情報の種類を示す情報を読み出し、(1)当該種類に属する同一のコンテンツ関連情報を含み、かつ、(2)互いに異なるサービスIDを含む、複数のログを検索し、当該各ログからコンテンツIDを読み出し、(1)当該各コンテンツIDと、(2)該当のコンテンツを示す統合コンテンツIDと、を含むレコードを生成し、統合コンテンツIDデータベース109に記憶させる。
以下、コンテンツID処理部107は、サービス数記憶部105で2番目以降のサービス数について、降順で、同様の動作を行う。
図6は、統合コンテンツIDデータベース109の内容の一例を示す図である。
図6は、(1)3個のコンテンツID「100056」、「C68913」、「Content8916」と、(2)統合コンテンツID「C00001」と、を含むレコードなどを例示する。
図1に戻り、ログレコード生成部111は、ログ蓄積部101のログ毎に、(1)当該ログにあるクリック時刻、予約時刻、購入時刻、視聴時刻、評価時刻の全てと、(2)現在時刻(以下、ログ生成時刻という)と、(3)統合ユーザIDデータベース108から当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザIDと、(4)統合コンテンツIDデータベース109から当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツIDと、(4)当該ログから読み出したサービスIDと、を含むレコードを生成し、ログレコード記憶部110に記憶させる。
なお、ログレコード生成部111は、評価時刻を含むレコードには、対応するログから読み出された評点を含ませる。一方、ログレコード生成部111は、評価時刻を含まないレコードには、評点「1」を含ませる。
図7は、ログレコード記憶部110の内容の一例を示す図である。
図7は、(1)クリック時刻「2011/06/23;23:12:23」、評価時刻「2011/06/29;23:45:33」と、(2)ログ生成時刻「2011/06/28;00:10:00」と、(3)統合ユーザID「T12541」と、(4)統合コンテンツID「C15244」と、(5)サービスID「SV1」と、(6)評点を含むレコードを例示する。
図8は、ログレコード削除部112の動作を示すフローチャートである。
ログレコード削除部112は、ログレコード記憶部110からレコードを削除等することで、後述のコンテンツの推奨が、あるサービスに偏って行われる等の不都合を防止するのである。
まず、ログレコード削除部112は、ログレコード記憶部110において、サービスIDごとの該サービスIDを含むレコードの集合におけるレコードの数の不均衡さを示すジニ係数GC1を求め、ジニ係数GC1が予め定めた閾値(以下、閾値GCT1という)より大きいか否かを判定する(S1)。
ジニ係数GC1は、各対象(この場合、レコードの集合)における要素数(この場合、レコードの数)の不均衡さを示すものである。ジニ係数GC1は、0〜1の範囲に含まれる。ジニ係数GC1が1に近いほど不均衡の程度は大きく、ジニ係数GC1が0に近いほど不均衡の程度は小さい。不均衡がないとき、つまり、各レコードの数が互いに等しいとき、ジニ係数GC1は0になる。後述のジニ係数GC2なども同様である。
ログレコード削除部112は、ジニ係数GC1を求めるにあたり、まず、式(1)により平均差MDFを計算する。
Figure 2013012143
ここで、nは、サービスの総数、xiは、サービスiのサービスIDを含むレコードの数、xjは、サービスjのサービスIDを含むレコードの数である。
次に、ログレコード削除部112は、式(2)により平均値μを計算する。
Figure 2013012143
ここで、nは、サービスの総数、x1、x2、…は、それぞれ、第1、第2、…、第nのサービスのサービスIDを含むレコードの数である。
次に、ログレコード削除部112は、式(3)によりジニ係数GCを計算する。
GC1=MDF/(2×μ) (3)
ログレコード削除部112は、ジニ係数GC1が閾値GCT1より大きいなら(S1:YES)、予め定められた数(以下、閾値LT1という)より多い数のレコードを有するレコードの集合をログレコード記憶部110から検索し、各レコードの集合について、該集合から、該集合内のレコード数が閾値LT1に等しくなるようにレコードを削除する(S3)。
ログレコード削除部112は、ジニ係数GC1が閾値GCT1未満なら(S1:NO)、または、ステップS3の処理を終えたなら、ログレコード削除部112は、ログレコード記憶部110において、サービスIDごとに、該サービスIDを含むレコードの集合を分割する。ここで、ログレコード削除部112は、分割されたそれぞれが、同じ時間長(例えば、1時間)を有する時間帯に属する視聴時刻(他の時刻、例えばクリック時刻でもよい。)を含むものとする。
次に、ログレコード削除部112は、サービスIDによらず、分割されたレコードの集合のすべてについて、かかるレコードの集合(以下、集合という)におけるレコードの数の不均衡さを示すジニ係数GC2を求め、ジニ係数GC2が予め定めた閾値(以下、閾値GCT2という)より大きいか否かを判定する(S5)。
ここでは、ログレコード削除部112は、まず、上記式(1)により平均差MDFを計算する。
ここで、nは、集合の総数、xiは、集合iのレコードの数、xjは、集合jのレコードの数である。
次に、ログレコード削除部112は、上記式(2)により平均値μを計算する。
ここで、nは、集合の総数、x1、x2、…は、それぞれ、第1、第2、…、第nの集合のレコードの数である。
次に、ログレコード削除部112は、式(4)によりジニ係数GC2を計算する。
GC2=MDF/(2×μ) (4)
ログレコード削除部112は、ジニ係数GC2が閾値GCT2より大きいなら(S5:YES)、予め定められた数(以下、閾値LT2という)より多い数のレコードを有する集合をログレコード記憶部110から検索し、各集合について、該集合から、該集合内のレコード数が閾値LT2に等しくなるようにレコードを削除する(S7)。
ログレコード削除部112は、ジニ係数GC2が閾値GCT2未満なら(S5:NO)、または、ステップS7の処理を終えたなら、ログレコード記憶部110において、サービスIDごとに、該サービスIDを含むレコード内の評点の平均(平均評点)を求める。
次に、ログレコード削除部112は、各平均評点の不均衡さを示すジニ係数GC3を求め、ジニ係数GC3が予め定めた閾値(以下、閾値GCT3という)より大きいか否かを判定する(S9)。
ここでは、ログレコード削除部112は、まず、上記式(1)により平均差MDFを計算する。
ここで、nは、平均評点の総数、xiは、平均評点i、xjは、平均評点jである。
次に、ログレコード削除部112は、上記式(2)により平均値μを計算する。
ここで、nは、平均評点の総数、x1、x2、…は、それぞれ、第1、第2、…、第nの平均評点である。
次に、ログレコード削除部112は、式(5)によりジニ係数GC3を計算する。
GC3=MDF/(2×μ) (5)
ログレコード削除部112は、ジニ係数GC3が閾値GCT3より大きいなら(S9:YES)、ログレコード記憶部110において、予め定められた点(以下、閾値LT3という)より大きい平均評点に対応するサービスIDを含むレコードを検索し、該レコード内の評点に対し、ステップS9で計算した平均差MDFと予め定められた係数との積を加え(S11)、処理を終える。
ログレコード削除部112は、ジニ係数GC3が閾値GCT未満なら(S9:NO)、処理を終える。
図1に戻り、コンテンツ推奨部113は、ログレコード記憶部110を用いて、ユーザに好まれると思われるコンテンツのコンテンツIDを予め定められた最大数以下の範囲で求め、該コンテンツIDを含む情報を該ユーザに使用される端末などに送信する。
なお、コンテンツ推奨部113は、かかる動作を適宜実行し、その際、ユーザに好まれると思われるコンテンツを求めるのに、例えば、非特許文献1を使用することができる。例えば、コンテンツ間、ユーザ間、サービス間での関連性が求められ、このような関連性を基に、コンテンツが決定される。
図9は、ログ削除部114の動作を示すフローチャートである。
ログ削除部114は、ログ蓄積部101から、使用されなくなったユーザIDやコンテンツIDを含むログを検出し、削除する(S21)。
次に、ログ削除部114は、統合ユーザIDデータベース108から、ステップS21で削除したユーザIDを含むレコードを検出し、削除する(S23)。
次に、ログ削除部114は、統合コンテンツIDデータベース109から、ステップS21で削除したコンテンツIDを含むレコードを検出し、削除する(S25)。
次に、ログ削除部114は、ログレコード記憶部110から、ステップS21で削除したレコード内の統合ユーザIDまたはステップS23で削除したレコード内の統合コンテンツIDを含むレコードを検出し、削除し(S27)、処理を終える。
したがって、本実施の形態によれば、レコメンドサーバ1において、サービスID、該サービスでのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部101と、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを統合ユーザIDデータベース108に記憶させるユーザID処理部106と、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを統合コンテンツIDデータベース109に記憶させるコンテンツID処理部107と、ログ蓄積部101のログ毎に、統合ユーザIDデータベース108から当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、統合コンテンツIDデータベース109から当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードをログレコード記憶部110に記憶させるログレコード生成部111とを備えるログ処理装置を構成することで、複数のサービスでのユーザIDおよびコンテンツIDの違いに起因する不都合を解消する技術を提供することができる。
例えば、あるユーザAが利用していたサービスαおよびβのログから、それまでサービスαを利用していて初めてサービスβを利用したユーザBに対して、サービスβのコンテンツを推薦することができる。
なお、本実施の形態に係るログ処理装置としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1…レコメンドサーバ
101…ログ蓄積部
102、103…事前処理部
104、105…サービス数記憶部
106…ユーザID処理部
107…コンテンツID処理部
108…統合ユーザIDデータベース
109…統合コンテンツIDデータベース
110…ログレコード記憶部
111…ログレコード生成部
112…ログレコード削除部
113…コンテンツ推奨部
114…ログ削除部

Claims (3)

  1. 複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置であって、
    いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、
    前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と、
    複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、
    複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、
    同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させるユーザID処理部と、
    同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させるコンテンツID処理部と、
    前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを生成し、前記ログレコード記憶部に記憶させるログレコード生成部と
    を備えることを特徴とするログ処理装置。
  2. 複数のサービスのそれぞれにおいてコンテンツが送信可能な場合における送信先のユーザに対しコンテンツを推奨するために蓄積されたログの処理を行うログ処理装置の動作方法であって、
    前記ログ処理装置は、
    いずれかのサービスのいずれかのコンテンツがいずれかのユーザのために送信されたことを示す該サービスのサービスID、該サービスでの該コンテンツのコンテンツID、該コンテンツに関連するコンテンツ関連情報、該サービスでの該ユーザのユーザID、該ユーザに関連するユーザ関連情報、を含むログが蓄積されるログ蓄積部と、
    前記ログ蓄積部のログ毎に生成されるレコードを記憶するためのログレコード記憶部と 複数のサービスでの同一のユーザを示す複数のユーザIDを含むユーザレコードが記憶される統合ユーザIDデータベースと、
    複数のサービスでの同一のコンテンツを示す複数のコンテンツIDを含むコンテンツレコードが記憶される統合コンテンツIDデータベースと、
    を備え、
    前記動作方法は、
    前記ログ処理装置のユーザID処理部が、同一のユーザ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからユーザIDを読み出し、該ユーザIDならびに統合ユーザIDを含むユーザレコードを前記統合ユーザIDデータベースに記憶させ、
    前記ログ処理装置のコンテンツID処理部が、同一のコンテンツ関連情報および互いに異なるサービスIDを有する複数のログのそれぞれからコンテンツIDを読み出し、該コンテンツIDならびに統合コンテンツIDを含むコンテンツレコードを前記統合コンテンツIDデータベースに記憶させ、
    前記ログ処理装置のログレコード生成部が、前記ログ蓄積部のログ毎に、前記統合ユーザIDデータベースから当該ログ内のユーザIDを含むレコードを検索して当該レコードから読み出した統合ユーザID、前記統合コンテンツIDデータベースから当該ログ内のコンテンツIDを含むレコードを検索して当該レコードから読み出した統合コンテンツID、当該ログ内のサービスID、を含むレコードを生成し、前記ログレコード記憶部に記憶させる
    ことを特徴とするログ処理装置の動作方法。
  3. 請求項1記載のログ処理装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2011145761A 2011-06-30 2011-06-30 ログ処理装置およびその動作方法 Active JP5235227B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011145761A JP5235227B2 (ja) 2011-06-30 2011-06-30 ログ処理装置およびその動作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011145761A JP5235227B2 (ja) 2011-06-30 2011-06-30 ログ処理装置およびその動作方法

Publications (2)

Publication Number Publication Date
JP2013012143A true JP2013012143A (ja) 2013-01-17
JP5235227B2 JP5235227B2 (ja) 2013-07-10

Family

ID=47685953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011145761A Active JP5235227B2 (ja) 2011-06-30 2011-06-30 ログ処理装置およびその動作方法

Country Status (1)

Country Link
JP (1) JP5235227B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019160178A (ja) * 2018-03-16 2019-09-19 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム。

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229052A (ja) * 2001-03-14 2001-08-24 Yoko Ogawa ログ処理装置、ログ処理方法、及びログ処理プログラム
JP2004341584A (ja) * 2003-05-13 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> 情報紹介システム、情報紹介方法、プログラムおよび記録媒体
JP2007208936A (ja) * 2006-02-06 2007-08-16 Toshiba Corp 映像配信システムおよび映像配信サービスの受信端末管理方法
JP2007213521A (ja) * 2006-02-13 2007-08-23 Meiri Tabuchi 監視結果記録システム、共通ログ生成装置、及びプログラム
JP2009141746A (ja) * 2007-12-07 2009-06-25 Sony Corp 情報処理装置および方法、並びにプログラム
JP2009266096A (ja) * 2008-04-28 2009-11-12 Sony Corp 情報処理装置、および関連アイテムの提供方法
JP2011081780A (ja) * 2009-09-08 2011-04-21 Apple Inc 類似性データに基づくメディアアイテムのクラスタリング

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229052A (ja) * 2001-03-14 2001-08-24 Yoko Ogawa ログ処理装置、ログ処理方法、及びログ処理プログラム
JP2004341584A (ja) * 2003-05-13 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> 情報紹介システム、情報紹介方法、プログラムおよび記録媒体
JP2007208936A (ja) * 2006-02-06 2007-08-16 Toshiba Corp 映像配信システムおよび映像配信サービスの受信端末管理方法
JP2007213521A (ja) * 2006-02-13 2007-08-23 Meiri Tabuchi 監視結果記録システム、共通ログ生成装置、及びプログラム
JP2009141746A (ja) * 2007-12-07 2009-06-25 Sony Corp 情報処理装置および方法、並びにプログラム
JP2009266096A (ja) * 2008-04-28 2009-11-12 Sony Corp 情報処理装置、および関連アイテムの提供方法
JP2011081780A (ja) * 2009-09-08 2011-04-21 Apple Inc 類似性データに基づくメディアアイテムのクラスタリング

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019160178A (ja) * 2018-03-16 2019-09-19 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム。
JP7001508B2 (ja) 2018-03-16 2022-01-19 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム。

Also Published As

Publication number Publication date
JP5235227B2 (ja) 2013-07-10

Similar Documents

Publication Publication Date Title
US7685200B2 (en) Ranking and suggesting candidate objects
KR101792587B1 (ko) 컨텐츠에 대한 선호도 예측 방법 및 장치와, 샘플 컨텐츠 선정 방법 및 장치
US9727880B2 (en) Predicting user responses
US20140317117A1 (en) Method, device and computer storage media for user preferences information collection
KR101206160B1 (ko) 사용자 선호도와 컨텐츠 내용을 고려한 컨텐츠 추천 방법
JP2009193465A (ja) 情報処理装置、情報提供システム、情報処理方法、およびプログラム
KR20090017268A (ko) 사용자의 관심 키워드를 업데이트 하는 방법과 그 방법을수행하기 위한 시스템
CN108319628B (zh) 一种用户兴趣确定方法及装置
KR20200049193A (ko) 콘텐츠 추천 방법 및 이를 지원하는 서비스 장치
CN111428120B (zh) 一种信息确定方法、装置、电子设备及存储介质
JP6079270B2 (ja) 情報提供装置
CN113191896A (zh) 一种招标信息的推荐方法、装置及计算机设备
KR20140006516A (ko) 위치 기반 콘텐츠 추천 서비스 제공 시스템 및 방법
CN112328889A (zh) 推荐搜索词确定方法、装置、可读介质及电子设备
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
US20140229488A1 (en) Apparatus, Method, and Computer Program Product For Ranking Data Objects
KR101334096B1 (ko) 높은 연관성을 가지는 아이템을 추천하는 아이템 기반의 추천 엔진
KR101976816B1 (ko) SaaS 어플리케이션 연동 서비스의 제공장치 및 그 제공방법
US20160379283A1 (en) Analysis of social data to match suppliers to users
CN112836126A (zh) 基于知识图谱的推荐方法、装置、电子设备及存储介质
JP5235227B2 (ja) ログ処理装置およびその動作方法
US9542497B2 (en) Information processing apparatus, information processing method, and information processing program
JP5216895B2 (ja) ログ処理装置およびその動作方法
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법
JP5938002B2 (ja) コンテンツ推薦装置およびその動作方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130325

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5235227

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350