JP5451545B2 - ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム - Google Patents

ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム Download PDF

Info

Publication number
JP5451545B2
JP5451545B2 JP2010153500A JP2010153500A JP5451545B2 JP 5451545 B2 JP5451545 B2 JP 5451545B2 JP 2010153500 A JP2010153500 A JP 2010153500A JP 2010153500 A JP2010153500 A JP 2010153500A JP 5451545 B2 JP5451545 B2 JP 5451545B2
Authority
JP
Japan
Prior art keywords
log
noise removal
removal condition
noise
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010153500A
Other languages
English (en)
Other versions
JP2012014660A (ja
Inventor
亮介 野地
裕一 中澤
可奈子 三木
良規 草地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2010153500A priority Critical patent/JP5451545B2/ja
Publication of JP2012014660A publication Critical patent/JP2012014660A/ja
Application granted granted Critical
Publication of JP5451545B2 publication Critical patent/JP5451545B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、セットトップボックス(STB)から収集される視聴ログ等の行動ログからノイズを除去するための技術に関するものである。
現在、個人の行動ログが様々な場面で取得されている。行動ログとしては、TVやVODの視聴ログ、実店舗での購買履歴ログ、オンラインショッピングでの購買履歴ログ、携帯電話やPCでのWebの閲覧・検索履歴ログ、オフィス・交通機関での入退室・乗降車ログなどがある。このような行動ログは、種々のサービスやマーケティングに活用されている。例えば、行動ログ(購買履歴ログ)を利用したサービスとして、ECサイトで本を購入するときなどに、「あなたにおすすめの本」や、「この本を買った人にはこれがおすすめ」のようなレコメンドを表示するサービスがある。また、マーケティングに関しては、行動ログからマーケティング用データ(売り上げ、視聴率、マーケティングセグメント毎の行動特性など)を抽出し、当該データをサービス・商品の提供側に対して提供するマーケティングシステムがある。
行動ログを収集する仕組みはログの種類により異なるが、例えば、IPTVやCATVにおいては、STBに対する操作情報等を視聴ログとしてネットワーク上のログ収集格納装置に送信し、ログ収集格納装置が視聴ログを収集する仕組みがある。
特開2009−118189号公報
レコメンドシステムやマーケティングシステムなどの行動ログを利用するシステムにおいては、入力する行動ログにノイズが含まれる場合には、ユーザの嗜好を正しく反映した適切なレコメンドやマーケティングデータの出力を行うことができないという問題がある。この問題をSTBからの視聴ログ収集を例に挙げて説明する。
STBとテレビ受像機とからなる映像受信装置において、視聴者は、STBを操作するとともに、テレビ受像機そのものを操作する場合がある。例えば、就寝のためにテレビの視聴を終了するときに、STBの電源をOFFにするのでなく、テレビ受像機の電源をOFFにする場合がある。この場合、テレビ放送の受信機能を有するSTBは、番組を受信し続けることになり、この時点でSTBにより生成される視聴ログは、番組を受信し続けていることを示す視聴ログとなる。
そのため、上記のようなSTBから得られたログから視聴者の行動を分析しようとした際に、STBから得られた視聴ログをそのまま利用してしまうと、実際には視聴していない番組が好きなことになってしまうなど、精度の高い分析をすることができない。
そこで、STBのログから複数の指標を用いてノイズを除き、視聴者の嗜好を表すであろうログを抜き出す必要がある。例えば、継続視聴時間がある閾値以上であるログを、「つけっぱなし」のログとして除外する。また、例えば、視聴割合(ある番組放送時間に対する視聴時間の割合)の閾値により、「興味を持って見た」と推定できるログと、そうでないと推定できるログとに分別することができる。
上記のようなノイズ除去に用いるパラメータの閾値は、一般に、視聴者にアンケートをとってその結果を分析して決めたり、あるいは、システム運営者側で感覚的に決めたりする。
しかし、それでは、新たなノイズ除去用のパラメータ(継続未視聴時間等)を加える際に、閾値の決定に時間がかかることや(例えば、アンケート収集の稼動がかかる)、閾値を決定する人に依存して値にバラツキが出ることが問題となる。
ノイズ除去に用いるパラメータとしては、上記に挙げた視聴割合等以外に、番組が有料であったかどうか、ニッチなジャンルであったかどうか、予約して見たかどうか、予約番組直後の放送であったかどうか、そのチャンネルに固定する直前のザッピング度合い(どれだけチャンネルを遷移した後に決めたか)等ログから算出できる値で、様々なパラメータが考えられる。
また、TVで途中まで見た番組を携帯で持ち出して見るようなことになれば、どの端末で見たかも分割の重要なパラメータとなり、取得可能なログの種類が増えることによって嗜好を表すログとそうでないログを分割するためのパラメータは増え続けることになり。その度に閾値を決定する必要が出てくる。
また、閾値は、ユーザの属性によっても変化する。例えば、子供と大人では平均的に興味を持って番組を視聴する時間が異なったり、映画好きの人とドキュメンタリー好きでは平均的な視聴割合が異なる可能性がある。更に、季節や曜日による変化や、時代とともにライフスタイルが変化することにより、同じ個人でも適正な閾値に変化が生じてくることもある。
上記のように、適正に個々人の嗜好を反映するようにノイズを除去したログを抽出するためには、多くのパラメータの中から利用できそうなものを適切に選択し、最適閾値を検証することを何度も繰り返し実施しなければならない。しかしながら、現在は、個人の経験、アンケート等での閾値決定を必要とするため、時間が足りず、一律の閾値をずっと利用し続けることになってしまう。それでは、ログを入力して視聴者に番組をおすすめするレコメンドシステムでは個々人へのきめ細かいレコメンドを実施できず、視聴率や視聴者行動特性を算出するマーケティングデータシステムも正しく視聴者行動を捉えられなくなる。
本発明は、上記の点に鑑みてなされたものであり、収集された行動ログから、個々人の嗜好を反映するようにノイズを除去した適切なログを抽出するために使用するノイズ除去条件を自動的に決定する技術を提供することを目的とする。
上記の課題を解決するために、本発明は、ユーザの行動ログからノイズを除去するために用いるノイズ除去条件を決定するノイズ除去条件決定装置であって、ログ格納手段に格納された行動ログから、ノイズ除去条件候補を用いてノイズを除去し、ノイズ除去済ログを抽出するノイズ除去済ログ抽出手段と、前記ノイズ除去済ログ抽出手段により抽出された前記ノイズ除去済ログから、ある基準点より前の行動ログからなる学習用ログと、ノイズ除去条件を決定する対象となる対象ユーザの前記基準点以降の行動ログからなる正解ログとを抽出する評価用ログ抽出手段と、前記評価用ログ抽出手段により抽出された前記学習用ログを用いて、前記対象ユーザの行動予測を行い、行動予測結果を行動予測結果格納手段に格納する行動予測手段と、前記行動予測手段により得られた行動予測結果と、前記正解ログとを比較し、両者の一致度合いに基づいて、所定の基準で行動予測結果の評価を行う比較評価手段と、ノイズ除去条件候補を変更しながら、前記ノイズ除去済ログ抽出手段、前記評価用ログ抽出手段、及び前記比較評価手段による処理を繰り返す制御を行い、繰り返しの結果得られる複数の評価結果のうち最も良い評価結果に対応するノイズ除去条件候補を、前記対象ユーザのノイズ除去条件として決定する最適ノイズ除去条件決定手段とを備えたことを特徴とするノイズ除去条件決定装置として構成される。
また、本発明は、ノイズ除去条件決定装置が実行する処理に対応するノイズ除去条件決定方法として構成してもよい。また、本発明は、コンピュータを、ノイズ除去条件決定装置の各手段として機能させるためのプログラムとして構成することもできる。
本発明によれば、行動ログからノイズを除去した適切なログを抽出するために使用するノイズ除去条件を自動的に決定することが可能となる。
本発明の実施の形態に係るシステムの全体構成図である。 ノイズ除去条件決定装置10の機能構成図である。 ノイズ除去条件決定装置10の動作を説明するためのフローチャートである。 ノイズ除去済ログ抽出を説明するための図である。 行動予測結果の評価を説明するための例を示す図である。 合致した番組集合と、正解ログの番組集合と、行動予測結果の番組集合との関係を示す図である。 ノイズ除去済ログ抽出装置200の機能構成を示す図である。
以下、図面を参照して本発明の実施の形態を説明する。
(システム構成)
図1に本発明の実施の形態に係るシステムの全体構成図を示す。図1に示すように、本実施の形態に係るシステムは、本発明に係るノイズ除去条件決定装置10、ログ収集格納装置20、及び映像受信装置30が、通信ネットワーク40を介して接続されて構成されている。
本実施の形態に係る映像受信装置30は、放送される番組を受信して表示するとともに、視聴ログを通信ネットワーク40を介してログ収集格納装置20に送信する機能を備えた装置である。本実施の形態では、映像受信装置30として、STBとTV受像機とからなる装置を想定しているが、映像受信装置30は、これに限られるものではなく、例えば、インターネット経由で放送される番組を受信可能なPCでもよい。なお、図1には、映像受信装置30が1つだけ示されているが、実際には多数の映像受信装置が通信ネットワーク40に接続されている。
通信ネットワーク40は、視聴ログを伝送するネットワークである。この通信ネットワーク40は、放送される番組自体も伝送するネットワークであってもよいし、放送される番組以外のデータ通信を行うためのネットワークであってもよい。前者は、IPTVやCATV等の場合に相当し、後者は、番組を電波で受信し、視聴ログを通信ネットワーク40(インターネット等)を介して送信する場合等に相当する。
ログ収集格納装置20は、映像受信装置30から、視聴ログを受信し、記憶手段に格納する装置である。ノイズ除去条件決定装置10は、ログ収集格納装置20により収集された視聴ログを用いて、ユーザ毎に最適なノイズ除去条件を決定する装置である。
図2に、ノイズ除去条件決定装置10の機能構成図を示す。図2に示すように、ノイズ除去条件決定装置10は、ログ取得部101、ログ格納部102、ノイズ除去条件候補提供部103、ノイズ除去済ログ抽出部104、ノイズ除去済ログ格納部105、評価用ログ抽出部106、正解ログ格納部107、学習用ログ格納部108、履歴ログ格納部109、行動予測部110、行動予測結果格納部111、比較評価部112、評価結果格納部113、最適ノイズ除去条件決定部114、ノイズ除去条件格納部115を備える。また、行動予測部110は、協調フィルタ生成部121、協調フィルタ格納部122、予測行動抽出部123を備える。なお、協調フィルタとは、協調フィルタリングによって生成されたフィルタのことである。
上記各機能部の処理内容については、後述するノイズ除去条件決定装置10の動作説明の中で順次説明される。
なお、本実施の形態では、行動予測部110として、レコメンドサービスで使用されるレコメンドエンジンを用い、レコメンド手法として協調フィルタリングを使用するため、行動予測部110は、協調フィルタ生成部121、及び協調フィルタ格納部122を備えるが、行動予測部110を実現するために採用する手法はこれに限られず、他の手法を用いてもよい。
また、本実施の形態では、ノイズ除去条件決定装置10とは別にログ収集格納装置20を備え、ノイズ除去条件決定装置10はログ収集格納装置20からログを取得することとしているが、ノイズ除去条件決定装置10自体がログ収集格納機能を備えてもよい。
ノイズ除去条件決定装置10は、CPU、メモリ、ハードディスク、通信インターフェース等を備えた一般的なコンピュータに、各機能部の処理を記述したプログラムを実行させることにより実現可能である。当該プログラムは、可搬メモリ等の記録媒体に記録して配布することが可能である。また、当該プログラムをネットワーク上のサーバからダウンロードしてインストールすることも可能である。
また、ノイズ除去条件決定装置10は、1つのコンピュータで実現してもよいし、複数のコンピュータをネットワークを介して接続することにより実現してもよい。
(ノイズ除去条件決定装置10の動作)
次に、図3に示すフローチャートに示す手順に沿って、ノイズ除去条件決定装置10の動作を説明する。説明において、図4〜図6を適宜参照する。
<ステップ1:ログ取得処理>
ログ取得部101が、ログ収集格納装置20から視聴ログを取得し、ログ格納部102に格納する。ログ格納部102に格納される視聴ログ(=ログ収集格納装置20において格納される視聴ログ)は、例えば、(ログ取得時刻、ユーザID、視聴チャンネル、番組ID、視聴開始時刻、視聴終了時刻、番組開始時刻、番組終了時刻、視聴割合、継続視聴時間)からなる情報である。
これらの情報は、映像受信装置30が生成し、定期的、もしくは所定の契機(視聴終了時等)にて映像受信装置30からログ収集格納装置20に送信される。もしくは、映像受信装置20は、ユーザ操作に基づき直接に取得できる情報(ユーザID、視聴チャンネル、チャンネルを合わせた時刻、他のチャンネルに変更した時刻等)のみをログ収集格納装置20に送信し、ログ収集格納装置20において、番組提供事業者が提供する番組表等を参照して、映像受信装置30から受信したログに対して解釈・計算を行って、上記の形式のログを格納することとしてもよい。
上記のログにおいて、ユーザIDは、映像受信装置30に予め割り当てられたIDもしくは予め入力されたIDである。また、視聴者がIDを入力してから視聴を行うサービス等においては、ユーザIDを、当該映像受信装置30で視聴を行う視聴者が、視聴時に入力するIDとしてもよい。以下、"ユーザ"は、ユーザIDで一意に識別される主体を意味する。
視聴開始時刻、及び視聴終了時刻は、映像受信装置30においてユーザがチャンネルを番組に合わせたり変更したりする操作に対応する情報である。番組開始時刻、及び番組終了時刻は、番組表から得られる情報である。視聴割合は、該当の番組の放送時間に含まれる視聴時間の割合である。継続視聴時間は、ユーザ操作がないまま継続して視聴された時間(あるコンテンツ(番組、CM、番組中のコーナー等)を視聴開始した時刻−それ以前に最後に操作を行った時刻)である。
以降の処理は、ユーザ毎に行われ、各ユーザに関して最適なノイズ除去条件が決定されるが、以下の説明においては、1のユーザに関する処理について説明する。
<ステップ2:ノイズ除去済ログ抽出処理>
ノイズ除去条件候補提供部103は、最適ノイズ除去条件を決定する対象となるユーザを除く各ユーザの最適ノイズ除去条件をノイズ除去条件格納部115から取得し、それらをノイズ除去済ログ抽出部104に与える。なお、ノイズ除去条件格納部115は、ユーザ毎にノイズ除去条件を格納しており、既に最適ノイズ除去条件として決定しているノイズ除去条件に関しては、最適であることを示すフラグが立てられている。フラグが立てられていないノイズ除去条件は、ノイズ除去条件候補であり、最適ノイズ除去条件を決定するための候補として用いられる。また、最適ノイズ除去条件が決定していないユーザに関して、複数種類のノイズ除去条件候補が格納されている。
ノイズ除去条件候補提供部103は、最適ノイズ除去条件を決定する対象となるユーザに関しては、ノイズ除去条件格納部115から1つのノイズ除去条件候補を取得して、ノイズ除去済ログ抽出部104に与える。なお、最適ノイズ除去条件を決定する対象となるユーザを除くユーザの中で、最適ノイズ除去条件が未定のユーザがある場合、当該ユーザに関しては、予め定めた1つのノイズ除去条件候補をノイズ除去済ログ抽出部104に与える。最適ノイズ除去条件を決定する対象のユーザに関して、ノイズ除去条件候補は、ステップ2からの処理を繰り返す度に変更されるが、その他のユーザのノイズ除去条件は固定である。
続いて、ノイズ除去済ログ抽出部104が、ノイズ除去条件候補提供部103から与えられたユーザ毎のノイズ除去条件(ノイズ除去条件候補含む)をユーザ毎のフィルタリングの条件として用いて、ログ格納部102から各ユーザのノイズ除去済ログを抽出し、抽出したノイズ除去済ログをノイズ除去済ログ格納部105に格納する。
例えば、ユーザAに着目し、元のログが図4(a)に示すものであるとする。ここで、ユーザAに対するノイズ除去条件(又はノイズ除去条件候補)として、視聴割合が70%以上であるという条件を用いた場合、ノイズ除去済ログは図4(b)に示すとおりのログになる。
なお、ステップ2におけるログ抽出処理では、上記ノイズ除去条件を用いたノイズ除去と合わせて、一定時間内にある回数以上チャンネルが変更されているログをザッピングデータとみなして削除する処理を行ってもよい。
<ステップ3:評価用ログ抽出処理>
次に、評価用ログ抽出部106が、評価のために使用するログとして、ノイズ除去済ログ格納部105から学習用ログ、正解ログ、履歴ログを取得し、それぞれ学習用ログ格納部108、正解ログ格納部107、履歴ログ格納部109に格納する。
学習用ログは、ノイズ除去済ログ格納部105に格納されたノイズ除去済ログのうち、予め定めた基準点(基準時刻)よりも前のログである。履歴ログは、ノイズ除去済ログのうち、最適ノイズ除去条件を決定する対象となるユーザに関しての上記基準点よりも前のログである。正解ログは、ノイズ除去済ログのうち、最適ノイズ除去条件を決定する対象となるユーザに関しての上記基準点以降のログである。なお、学習用ログには、履歴ログが含まれているので、ここで履歴ログを抽出することは必ずしも必要でなく、評価において必要に応じて学習用ログから履歴ログに相当するログを抽出して使用してもよい。
例えば、ノイズ除去済ログに、1月1日から3月31日までのログが含まれる場合において、基準点を3月1日とすると、学習用ログとして、ノイズ除去済ログから、1月1日から2月末日までのログを抽出し、履歴ログとして、対象ユーザに関する1月1日から2月末日までのログを抽出し、正解ログとして、対象ユーザに関する3月1日から3月31日までのログを抽出する。
<ステップ4:行動予測処理>
次に、行動予測部110が、基準点より前のデータである学習用ログ及び履歴ログを用いて、行動予測を行う。本実施の形態では、ログを用いたレコメンド手法としてよく用いられている協調フィルタリングによる行動予測を行う。
ここではまず、協調フィルタ生成部121が、学習用ログ格納部108に格納されている学習用ログに基づき、協調フィルタリングによって協調フィルタを生成し、協調フィルタ格納部122に格納する。
そして、予測行動抽出部123が、履歴ログ格納部109に格納されている履歴ログを協調フィルタに適用することにより、予測された行動内容を抽出し、それを行動予測結果格納部111に格納する。ここでは、予測された行動内容としての番組IDと、ユーザID(最適ノイズ除去条件決定対象のユーザのユーザID)とを含む情報が行動予測結果格納部111に格納される。
<ステップ5:比較評価処理>
続いて、比較評価部112が、行動予測結果と、正解ログ格納部107に格納されている正解ログとを比較し、合致するアイテム(本実施形態では、番組(つまり、番組ID)である)の個数を算出する。
そして、比較評価部112は、合致した番組数と行動予測結果の番組数との比を適合率として算出し、合致した番組数と正解ログに含まれる番組数との比を再現率として算出する。
例えば、正解ログにおける番組と、行動予測結果における番組が図5に示すとおりであったとする。この場合、合致した番組数が4であり、行動予測結果の番組数が6であるから、適合率は4/6≒66.6%である。また、正解ログの番組数が8であるから、再現率は4/8=50%である。なお、再現率は網羅性を表す指標であり、この値が高い場合は、視聴者が視聴したいものを網羅的にレコメンドしていることになる。また、適合率は正確性を表す指標であり、この値が高い場合、レコメンド結果(行動予測結果)に外れが少ないことを示す。図6に、合致した番組集合と、正解ログの番組集合と、行動予測結果の番組集合との関係を示す。
更に比較評価部112は、下記の式により再現率と適合率の調和平均であるF値を求め、それを、ユーザIDとともに評価結果格納部113に格納する。また、評価結果格納部113には、最適ノイズ除去条件決定部114等により、上記F値に対応するノイズ除去条件が格納される。
F値=2/(1/再現率+1/適合率)
図5に示す例では、F値=2/(8/4+6/4)=2/3.5≒57.1%となる。この値が高い場合、行動予測(レコメンド)が総合的に高精度(網羅的で外れが少ない)であることを示す。すなわち、本実施の形態では、最も良い評価結果は、最も高いF値に相当する。通常、再現率と適合率は、一方が高くなると他方が低くなる傾向がある。
なお、上記の評価方法は一例に過ぎない。行動予測の正確さを計測できる評価方法であれば、上記の方法以外の方法を用いてもよい。
<ステップ6、ステップ7、ステップ8:終了判定処理、継続処理、最適ノイズ除去条件決定処理>
続いて、最適ノイズ除去条件決定部114が、現在の対象ユーザに関する最適ノイズ条件決定のための繰り返し処理を終了するか否かを判定する(ステップ6)。この判定においては、例えば、異なるノイズ除去条件候補に基づくF値が予め定めた数だけ得られたこと(すなわち、繰り返し処理が予め定めた回数に達したこと)を終了条件することができる。また、予め定めたF値以上のF値が得られたことを終了条件としてもよい。また、ノイズ除去条件候補が、少しずつ値をずらすことができるもの("視聴割合がX%以上"等)である場合、その値を例えば1%ずつ増加又は減少させながらF値を求める処理を繰り返す中で、最大のF値が得られたと判定することを終了条件としてもよい。更に、所定回数が終了した時点で、最大のF値に対応するノイズ除去条件を中心にして、上記のように少しずつ値をずらしながら処理を繰り返し、更に大きなF値が得られるノイズ除去条件を決定してもよい。
ステップ6で終了でないと判定した場合にステップ7に進み、最適ノイズ除去条件決定部114は、異なるノイズ除去条件候補を用いてステップ2からの処理を行うよう各機能部に対する制御を行う。この場合、異なるノイズ除去条件候補を用いてステップ2からの処理が行われる。
ステップ6で終了であると判定した場合にはステップ8に進む。ステップ8において、最適ノイズ除去条件決定部114は、評価結果格納部113に格納された複数のF値のうちの最大のF値を求めるために使用したノイズ除去条件候補を、最適ノイズ除去条件として、該当のユーザIDとともにノイズ除去条件格納部115に格納する。すなわち、当該ユーザに関してノイズ除去条件格納部115に格納されたノイズ除去条件候補のうち、最適であると決定されたノイズ除去条件候補に対して最適ノイズ除去条件であることを示すフラグが立てられる。最適ノイズ除去条件を決定した後、当該ユーザについての最適ノイズ除去条件以外のノイズ除去条件候補をノイズ除去条件格納部115から削除することとしてもよい。
なお、ノイズ除去条件は、視聴割合等の単独のパラメータに関する条件に限らず、視聴割合と継続視聴時間などの複数のパラメータを組み合わせた条件であってもよい。その場合、多次元的にノイズ除去条件を決定するために、サポートベクターマシン等を利用してもよい。
また、ノイズ除去条件は、上記に挙げた例に限られず、例えば、番組が有料かどうか、ニッチ名のジャンルであったかどうか、視聴予約をして視聴したものかどうか等をノイズ除去条件とすることもできる。
(適用例)
上記のようにして得られた各ユーザの最適ノイズ除去条件は、例えば、ログを用いてレコメンドを行うレコメンド装置に提供され、当該レコメンド装置において、ログからユーザ毎のノイズ除去を行うことにより、ユーザ毎に適切にノイズが除去されたノイズ除去済ログを取得することができ、当該ノイズ除去済ログを用いることにより、精度の高いレコメンドを行うことができる。また、上記のようにして得られた各ユーザの最適ノイズ除去条件を、ログを用いてマーケティングデータを算出するマーケティングデータ算出装置に提供してもよく、これにより、マーケティングデータ算出装置は精度の高いマーケティングデータを得ることができる。
また、図7に示すように、ノイズ除去条件決定装置10と同じ機能を有するノイズ除去条件決定部201と、ノイズ除去条件決定部201において決定した各ユーザの最適ノイズ除去条件を用いてノイズ除去済ログを抽出するノイズ除去済ログ抽出部202と、ノイズ除去済ログ格納部203とを備えることによりノイズ除去済ログ抽出装置200を実現することもできる。なお、ノイズ除去済ログ抽出装置200は、本実施の形態に係るノイズ除去条件決定機能を有するので、これをノイズ除去条件決定装置と称してもよい。
図7に示す例では、ノイズ除去済ログ抽出装置200から、ノイズ除去済ログが、マーケティングデータ算出装置300、及びレコメンド装置400に提供される。もちろん、ノイズ除去済ログを、その他の装置に提供してもよい。
(実施の形態の効果)
本実施の形態で説明した技術により、ノイズ除去条件を、アンケート調査等の手間をかけることなく自動的に決定することが可能となるので、ノイズ除去条件決定の時間を短縮できる。そのため、よりきめ細かいノイズ除去条件を求めることが可能となる。更に、本実施の形態の技術によれば、個人の感覚やアンケート調査等の主観評価によらず、客観的な評価を用いてノイズ除去条件を決定するので、個人の嗜好を的確に反映した精度の高いノイズ除去条件を決定することが可能となる。
また、ログの中に、つけっぱなしのログや、余り興味を持って見なかったログ等が含まれている場合でも、本実施の形態の技術で決定したノイズ除去条件により、これらのログをノイズとして適切に除去することができる。例えばレコメンドシステムにおいて、このようにノイズが除去されたログを用いることにより、個々の視聴者にとって本当に見たい番組、もしくは有益である番組をレコメンドすることができる。
また、マーケティングデータシステムにおいて、上記のようにノイズが除去されたログを使用することにより、精度よく時間・番組・チャンネル別視聴率を算出したり、行動特性による特定の視聴者セグメントを抽出したりすることができる。マーケティングデータをもとにIPTV・CATVを提供する企業やコンテンツプロバイダがどのようなコンテンツを配信・調達するかというコンテンツ配信戦略を練ったり、特定のユーザセグメントにダイレクトマーケティングを行うことができるようになる。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。例えば、上記の実施の形態では、行動ログとして視聴ログを例に挙げて説明したが、本発明は、視聴ログに限らず、行動ログからノイズを除去するためのノイズ除去条件決定に適用できる。
10 ノイズ除去条件決定装置
20 ログ収集格納装置
30 映像受信装置
40 通信ネットワーク
101 ログ取得部
102 ログ格納部
103 ノイズ除去条件候補提供部
104 ノイズ除去済ログ抽出部
105 ノイズ除去済ログ格納部
106 評価用ログ抽出部
107 正解ログ格納部
108 学習用ログ格納部
109 履歴ログ格納部
110 行動予測部
111 行動予測結果格納部
112 比較評価部
113 評価結果格納部
114 最適ノイズ除去条件決定部
115 ノイズ除去条件格納部
121 協調フィルタ生成部
122 協調フィルタ格納部
123 予測行動抽出部
200 ノイズ除去済ログ抽出装置
201 ノイズ除去条件決定部
202 ノイズ除去済ログ抽出部
203 ノイズ除去済ログ格納部
300 マーケティングデータ算出装置
400 レコメンド装置

Claims (6)

  1. ユーザの行動ログからノイズを除去するために用いるノイズ除去条件を決定するノイズ除去条件決定装置であって、
    ログ格納手段に格納された行動ログから、ノイズ除去条件候補を用いてノイズを除去し、ノイズ除去済ログを抽出するノイズ除去済ログ抽出手段と、
    前記ノイズ除去済ログ抽出手段により抽出された前記ノイズ除去済ログから、ある基準点より前の行動ログからなる学習用ログと、ノイズ除去条件を決定する対象となる対象ユーザの前記基準点以降の行動ログからなる正解ログとを抽出する評価用ログ抽出手段と、
    前記評価用ログ抽出手段により抽出された前記学習用ログを用いて、前記対象ユーザの行動予測を行い、行動予測結果を行動予測結果格納手段に格納する行動予測手段と、
    前記行動予測手段により得られた行動予測結果と、前記正解ログとを比較し、両者の一致度合いに基づいて、所定の基準で行動予測結果の評価を行う比較評価手段と、
    ノイズ除去条件候補を変更しながら、前記ノイズ除去済ログ抽出手段、前記評価用ログ抽出手段、及び前記比較評価手段による処理を繰り返す制御を行い、繰り返しの結果得られる複数の評価結果のうち最も良い評価結果に対応するノイズ除去条件候補を、前記対象ユーザのノイズ除去条件として決定する最適ノイズ除去条件決定手段と
    を備えたことを特徴とするノイズ除去条件決定装置。
  2. 前記行動予測手段は、前記学習用ログから協調フィルタリングによってフィルタを生成し、当該フィルタを用いて前記対象ユーザの行動予測を行うことを特徴とする請求項1に記載のノイズ除去条件決定装置。
  3. 前記比較評価手段は、前記行動予測結果と前記正解ログとの間で一致した一致アイテム数と、前記行動予測結果のアイテム数との比である適合率を算出し、前記一致アイテム数と前記正解ログのアイテム数との比である再現率を算出し、算出した適合率と再現率とを用いて評価結果を算出することを特徴とする請求項1又は2に記載のノイズ除去条件決定装置。
  4. 前記行動ログは、放送番組を受信する映像受信装置から送信され、通信ネットワークを介して収集された視聴ログであることを特徴とする請求項1ないし3のうちいずれか1項に記載のノイズ除去条件決定装置。
  5. ユーザの行動ログからノイズを除去するために用いるノイズ除去条件を決定するノイズ除去条件決定装置が実行するノイズ除去条件決定方法であって、
    ログ格納手段に格納された行動ログから、ノイズ除去条件候補を用いてノイズを除去し、ノイズ除去済ログを抽出するノイズ除去済ログ抽出ステップと、
    前記ノイズ除去済ログ抽出ステップにより抽出された前記ノイズ除去済ログから、ある基準点より前の行動ログからなる学習用ログと、ノイズ除去条件を決定する対象となる対象ユーザの前記基準点以降の行動ログからなる正解ログとを抽出する評価用ログ抽出ステップと、
    前記評価用ログ抽出ステップにより抽出された前記学習用ログを用いて、前記対象ユーザの行動予測を行い、行動予測結果を行動予測結果格納手段に格納する行動予測ステップと、
    前記行動予測ステップにより得られた行動予測結果と、前記正解ログとを比較し、両者の一致度合いに基づいて、所定の基準で行動予測結果の評価を行う比較評価ステップと、
    ノイズ除去条件候補を変更しながら、前記ノイズ除去済ログ抽出ステップ、前記評価用ログ抽出ステップ、及び前記比較評価ステップによる処理を繰り返す制御を行い、繰り返しの結果得られる複数の評価結果のうち最も良い評価結果に対応するノイズ除去条件候補を、前記対象ユーザのノイズ除去条件として決定する最適ノイズ除去条件決定ステップと
    を備えたことを特徴とするノイズ除去条件決定方法。
  6. コンピュータを、請求項1ないし4のうちいずれか1項に記載のノイズ除去条件決定装置における各手段として機能させるためのプログラム。
JP2010153500A 2010-07-05 2010-07-05 ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム Active JP5451545B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010153500A JP5451545B2 (ja) 2010-07-05 2010-07-05 ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010153500A JP5451545B2 (ja) 2010-07-05 2010-07-05 ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2012014660A JP2012014660A (ja) 2012-01-19
JP5451545B2 true JP5451545B2 (ja) 2014-03-26

Family

ID=45600966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010153500A Active JP5451545B2 (ja) 2010-07-05 2010-07-05 ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5451545B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10257213B2 (en) 2014-03-19 2019-04-09 Nippon Telegraph And Telephone Corporation Extraction criterion determination method, communication monitoring system, extraction criterion determination apparatus and extraction criterion determination program
JP6596454B2 (ja) * 2017-02-08 2019-10-23 東芝映像ソリューション株式会社 システム、方法及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099373A (ja) * 1998-09-18 2000-04-07 Toshiba Corp 履歴情報管理システム
JP3805949B2 (ja) * 1999-10-26 2006-08-09 日本電信電話株式会社 情報フィルタリング装置および方法と情報フィルタリングプログラムを記録した記録媒体
JP4326174B2 (ja) * 2001-10-04 2009-09-02 ソニー株式会社 情報処理システム、情報処理装置および方法、記録媒体、並びにプログラム
JP2006085558A (ja) * 2004-09-17 2006-03-30 Toyota Motor Corp 商品属性マップ表示装置と表示方法とそのためのプログラム
US20060224579A1 (en) * 2005-03-31 2006-10-05 Microsoft Corporation Data mining techniques for improving search engine relevance
JP2010128761A (ja) * 2008-11-27 2010-06-10 Fuji Xerox Co Ltd 情報処理装置及びプログラム

Also Published As

Publication number Publication date
JP2012014660A (ja) 2012-01-19

Similar Documents

Publication Publication Date Title
JP6935523B2 (ja) メディアアセットに関するコンテクスト上関係する情報を表示するための方法およびシステム
US10997229B2 (en) Content recommendation system
US11477532B2 (en) Personalized content recommendations based on consumption periodicity
US8151194B1 (en) Visual presentation of video usage statistics
US9256652B2 (en) Systems and methods for combining media recommendations from multiple recommendation engines
US20120317123A1 (en) Systems and methods for providing media recommendations
RU2641663C1 (ru) Способ рекомендации телевизионной программы и сервер
US20140052696A1 (en) Systems and methods for visual categorization of multimedia data
CN107710261B (zh) 用于估计用户注意的系统和方法
WO2013184875A2 (en) Systems and methods for compiling media information based on privacy and reliability metrics
US20160050457A1 (en) Method and system for tv channel content management and monetization based on content fingerprinting using a portable computing and communications device
CN105407385A (zh) 一种视频推荐方法及系统
CN102710988A (zh) 一种基于机顶盒的电视节目推荐方法及机顶盒设备
JP5451545B2 (ja) ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム
JP6069246B2 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP5600501B2 (ja) レコメンド装置、レコメンド方法、及びプログラム
EP3214821A1 (en) Determining advertisement locations based on customer interaction
JP6069245B2 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131226

R150 Certificate of patent or registration of utility model

Ref document number: 5451545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250