JP4950753B2 - コメント収集解析装置およびそのプログラム - Google Patents

コメント収集解析装置およびそのプログラム Download PDF

Info

Publication number
JP4950753B2
JP4950753B2 JP2007125143A JP2007125143A JP4950753B2 JP 4950753 B2 JP4950753 B2 JP 4950753B2 JP 2007125143 A JP2007125143 A JP 2007125143A JP 2007125143 A JP2007125143 A JP 2007125143A JP 4950753 B2 JP4950753 B2 JP 4950753B2
Authority
JP
Japan
Prior art keywords
preference
comment
program
viewer
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007125143A
Other languages
English (en)
Other versions
JP2008283412A (ja
Inventor
香子 有安
保明 金次
宏 妹尾
欣司 松村
誠 沼田
里枝 澤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2007125143A priority Critical patent/JP4950753B2/ja
Publication of JP2008283412A publication Critical patent/JP2008283412A/ja
Application granted granted Critical
Publication of JP4950753B2 publication Critical patent/JP4950753B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、放送番組に対する視聴者からのコメントを収集、解析するコメント収集解析装置およびそのプログラムに関する。
近年のサーバ型放送の研究によって、放送局が番組ごとに、番組のタイトル、ジャンル、放送日、シーン別のキーワード等の補助情報(メタデータ)を付与し、視聴者側の端末(視聴者端末)において、メタデータを用いて、放送番組を検索、再生するシステムが実現されようとしている。しかし、この放送番組に対するメタデータの付与は、番組提供者(放送事業者等)が行う必要があるため、膨大な量の放送番組に対してメタデータを付与するには、非常に手間がかかるという問題がある。
一方で、番組の視聴履歴、ネット検索履歴等に基づいて、視聴者の嗜好を推定し、番組全体に関する評価を間接的に行う技術が開発されている(例えば、特許文献1参照)。
また、放送番組を視聴しながら、番組に対する感想、意見等を掲示板、チャット等に書き込み、視聴者同士でコミュニケーションを図る「実況チャット」と呼ばれる技術が一般化してきている(例えば、非特許文献1参照)。
特開2006−186664号公報 宮森、中村、田中、「番組実況チャットに基づく視聴者視点を利用した放送番組のビュー生成」、日本データベース学会Letters Vol.4, No.1, pp.93-96, 平成18年7月12日
前記した特許文献1に記載の技術は、視聴者個人の好みを推定することや、番組全体に関する評価を間接的に取得することは可能である。しかし、この技術は、個別の番組に対する感想等を収集することができないため、個別の番組に対して、その番組を特徴付けるメタデータを抽出して付与することが困難であるという問題がある。
一方、前記した非特許文献1に記載した技術は、番組に対する感想等を取得することができる。しかし、この技術は、視聴者に対して積極的に感想等を入力してもらう仕組みがなく、多くの視聴者から感想等を収集することができないため、膨大な量の放送番組に対してメタデータを抽出して付与することが困難であるという問題がある。
本発明は、以上のような課題を解決するためになされたものであり、前記「実況チャット」等で収集したデータを解析し、嗜好に応じて視聴者をグループ分けし、視聴者に対して嗜好に応じた情報をフィードバックすることで、視聴者の積極的なコメント入力を推進することが可能なコメント収集解析装置およびそのプログラムを提供することを目的とする。
本発明は、前記目的を達成するために創案されたものであり、まず、請求項1に記載のコメント収集解析装置は、放送または通信回線を介して配信される番組に対して、視聴者が視聴者端末で入力したコメントデータを収集し、解析することで、前記視聴者を嗜好ごとに分類するコメント収集解析装置であって、コメント受信手段と、嗜好対象表現記憶手段と、嗜好表現記憶手段と、コメント整形手段と、嗜好分類手段と、フィードバック手段と、メタデータ受信手段と、を備える構成とした。
かかる構成において、コメント収集解析装置は、コメント受信手段によって、通信回線を介して、時間軸に沿って番組に関するコメントデータを受信する。
また、コメント収集解析装置は、嗜好対象表現記憶手段に、同一の嗜好の対象となる対象物を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための対象識別語とを予め対応付けて記憶しておく。このように、同一の対象を固有の対象識別語に対応付けておけば、嗜好の対象となる対象物を特定する表現が視聴者によって異なっていても対応することができる。
また、コメント収集解析装置は、嗜好表現記憶手段に、同一の嗜好の内容を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための嗜好識別語とを予め対応付けて記憶しておく。例えば、肯定的な感情であっても、「好き」、「かっこいい」等、視聴者によって異なっている。そこで、この嗜好表現記憶手段には、同一の嗜好表現を固有の嗜好識別語に対応付けておく。
そして、コメント収集解析装置は、コメント整形手段によって、コメント受信手段で受信したコメントデータを、嗜好対象表現記憶手段に記憶されている対象識別語と、嗜好表現記憶手段に記憶されている嗜好識別語とに基づいて置換することで、コメントデータを整形する。このように、コメントデータを対象識別語および嗜好識別語で置換することで、同一の嗜好の対象は、同じ対象識別語で表され、同一の嗜好の内容は、同じ嗜好識別語で表されることになる。
そして、コメント収集解析装置は、嗜好分類手段によって、コメント整形手段で整形されたコメントデータの類似の度合いを示す類似度を算出し、嗜好ごとに視聴者を分類する。この嗜好分類手段では、コメントデータが正規化されているため、各コメントデータの類似度を求めることができる。例えば、嗜好分類手段は、各コメントデータの類似度を、シンプソン係数等を用いて求め、その類似度ごとに視聴者を分類する。
そして、コメント収集解析装置は、フィードバック手段によって、嗜好分類手段で分類された視聴者ごとの対象物に対する嗜好を示す嗜好情報を視聴者端末に送信する。このように、嗜好情報を視聴者端末に送信することで、視聴者端末において、番組の取捨選択等の制御に利用することが可能になる。
また、コメント収集解析装置は、メタデータ受信手段によって、番組の実際の放送時間(タイムスタンプ)に対応付けられた場面の内容を示す内容データをメタデータとして受信する。この内容データは、番組の場面が文字列で表されたデータであれば何でもよいが、例えば、字幕データを利用することができる。
そして、コメント収集解析装置は、主語補完手段によって、内容データを形態素解析および構文解析することで、主語を抽出し、コメントデータに付されたタイムスタンプに基づいて、その抽出した主語をコメントデータにおける対象識別語として補完する。より具体的には、タイムスタンプが近い主語をコメントデータにおける対象識別語とする。これによって、コメントデータで嗜好の対象となる対象物が省略されている場合でも、コメントデータ内に主語(対象識別語)を補完することができる。
また、請求項に記載のコメント収集解析装置は、請求項1に記載のコメント収集解析装置において、嗜好表現記憶手段に記憶されている前記嗜好識別語に、同一の嗜好の内容を示す複数の異なる表現の文字列として、複数の記号を組み合わせることで感情を表現する記号列を対応付けた構成とした。
かかる構成において、コメント収集解析装置は、複数の記号を組み合わせることで感情を表現する記号列、例えば、視聴者が、コメントデータ内に顔文字で感情を表現した場合であっても、その感情を同一の嗜好を意味する文字列に置換することができる。
また、請求項に記載のコメント収集解析装置は、請求項1または請求項2に記載のコメント収集解析装置において、フィードバック手段が、番組情報取得手段と、番組情報解析手段と、嗜好情報生成手段と、嗜好情報送信手段とを備える構成とした。
かかる構成において、コメント収集解析装置は、番組情報取得手段によって、配信予定の番組の内容を示す番組情報を取得する。この番組情報は、時間と番組内容とを対応付けた情報であって、例えば、電子番組表(EPG:Electric Program Guide)である。
そして、コメント収集解析装置は、番組情報解析手段によって、番組情報から対象識別語を抽出する。そして、コメント収集解析装置は、嗜好情報生成手段によって、番組情報解析手段で抽出された対象識別語と、当該対象識別語に対して嗜好分類手段で分類された嗜好と、番組を特定する番組特定情報(番組名、放送時間等)とを対応付けて嗜好情報を生成する。
そして、コメント収集解析装置は、嗜好情報送信手段によって、嗜好情報を視聴者端末に送信する。これによって、視聴者端末では、どの番組に視聴者の嗜好の対象となる人物等が登場するのかを認識することができる。
さらに、請求項に記載のコメント収集解析プログラムは、放送または通信回線を介して配信される番組に対して、視聴者が視聴者端末で入力したコメントデータを収集し、解析することで、前記視聴者を嗜好ごとに分類するために、コンピュータを、コメント受信手段、コメント整形手段、嗜好分類手段、フィードバック手段、メタデータ受信手段、として機能させる構成とした。
かかる構成において、コメント収集解析プログラムは、コメント受信手段によって、通信回線を介して、時間軸に沿って番組に関するコメントデータを受信する。
また、コメント収集解析プログラムは、コメント整形手段によって、嗜好対象表現記憶手段と、嗜好表現記憶手段とを参照して、コメントデータを対象識別語と嗜好識別語とに基づいて置換することでコメントデータを整形する。なお、嗜好対象表現記憶手段には、同一の嗜好の対象となる対象物を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための対象識別語とを予め対応付けて記憶しておく。また、嗜好表現記憶手段には、同一の嗜好を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための嗜好識別語とを予め対応付けて記憶しておく。
そして、コメント収集解析プログラムは、嗜好分類手段によって、コメント整形手段で整形されたコメントデータの類似の度合いを示す類似度を算出し、嗜好ごとに視聴者を分類する。そして、コメント収集解析プログラムは、フィードバック手段によって、嗜好分類手段で分類された視聴者ごとの対象物に対する嗜好を示す嗜好情報を視聴者端末に送信する。
また、コメント収集解析プログラムは、メタデータ受信手段によって、番組の実際の放送時間に対応した場面の内容を示す内容データをメタデータとして受信する。そして、コメント収集解析プログラムは、コメント整形手段によって、内容データを形態素解析および構文解析することで、主語を抽出し、コメントデータに付されたタイムスタンプに基づいて、主語を当該コメントデータにおける対象識別語とする。
本発明は、以下に示す優れた効果を奏するものである。
請求項1または請求項に記載の発明によれば、コメント収集解析装置は、コメントに基づいて、視聴者を嗜好ごとに分類し、その解析結果である嗜好情報を視聴者端末にフィードバックするため、視聴者端末側で、嗜好情報を利用することができる。これによって、コメント収集解析装置は、視聴者が積極的にコメントを入力ための仕組みを提供することができる。
請求項1または請求項4に記載の発明によれば、コメント収集解析装置は、コメントデータに、嗜好の対象となる主語が記述されていない場合であっても、主語を補完することができるため、正しく視聴者を対象物に対する嗜好ごとに分類することができる。
請求項に記載の発明によれば、コメント収集解析装置は、顔文字のような複数の記号を組み合わせることで感情を表現する記号列を、嗜好を示す表現として解析することができる。これによって、視聴者は、形式にとらわれずに、コメントを入力することができる。
請求項に記載の発明によれば、コメント収集解析装置は、番組情報を解析し、視聴者ごとに番組に対する嗜好情報を視聴者端末に送信することができる。これによって、視聴者端末では、当該嗜好情報に基づいて、番組の提示手法を制御することが可能になる。
以下、本発明の実施の形態について図面を参照して説明する。
[コメント収集システムの構成]
まず、図1を参照して、本発明の実施形態に係るコメント収集システムの構成について説明する。図1は、本発明の実施形態に係るコメント収集システムの構成を示すブロック図である。ここでは、コメント収集システムSは、放送番組(以下、番組コンテンツという)を配信する放送局側に、コメント収集解析装置1と、放送番組配信装置2と、番組配信サーバ3とを備え、インターネットサービスプロバイダ(ISP)側に、Webサーバ4と、データ蓄積装置5とを備え、ネットワーク(通信回線)Nを介して、番組コンテンツを視聴する視聴者側の視聴者端末6から、番組コンテンツに対する意見、感想等のコメント(コメントデータ)を収集し、解析するシステムである。
コメント収集解析装置1は、視聴者からのコメントを、コメントデータとしてネットワークNを介して収集し、解析することで、視聴者を嗜好ごとに分類するとともに、視聴者の好みを示す嗜好情報を、視聴者側の視聴者端末6に送信するものである。このコメント収集解析装置1の詳細な構成については、後記することとする。
なお、ここでは、コメント収集解析装置1は、Webサーバ4を介して、視聴者からのコメントデータを収集することとする。
放送番組配信装置2は、放送波を介して、番組コンテンツを視聴者側の視聴者端末6に配信するものである。この放送番組配信装置2は、番組コンテンツを、地上デジタル放送で放送するものであってもよいし、BS(Broadcast Satellite)放送、CS(Communication Satellite)放送等の衛星放送で放送するものであってもよい。なお、放送される番組コンテンツには、番組のタイトル、ジャンル、放送日、シーン別のキーワード等のメタデータが付与されているものとする。また、このメタデータには、番組の場面内容を示すテキストデータである内容データ(例えば、字幕データ)が時刻情報(タイムスタンプ)とともに含まれている場合もある。
番組配信サーバ3は、放送番組配信装置2が放送する番組コンテンツを蓄積しておくものである。さらに、番組配信サーバ3は、ネットワークNを介して、番組コンテンツを配信する機能を有している。なお、ここでは、番組配信サーバ3は、Webサーバ4を経由して番組コンテンツを配信することとする。
これによって、視聴者は、視聴者端末6で、放送番組配信装置2が放送波によってリアルタイムで配信する番組コンテンツを視聴することもできるし、すでに放送された番組コンテンツであっても、番組配信サーバ3から、ネットワークNを介して番組コンテンツを取得して視聴することができる。
Webサーバ4は、視聴者側の視聴者端末6から、視聴者が入力したコメントデータを収集するものである。なお、Webサーバ4は、視聴者が番組配信サーバ3に蓄積されている番組コンテンツを視聴する際は、番組配信サーバ3からその番組コンテンツを取得し、ネットワークNを介して、番組コンテンツを配信する。
また、ここでは、Webサーバ4は、予め契約によって定められた視聴者のログイン情報(視聴者固有の識別子〔視聴者ID〕、パスワード等)に基づいて、視聴者端末6からのコメント入力の可否や、番組配信要求の可否を判定することとする。
このWebサーバ4は、収集したコメントデータを、視聴者IDと、コメントの対象となった番組コンテンツを特定する番組特定情報とともにデータ蓄積装置5に出力する。なお、番組特定情報は、コメントの対象となった番組コンテンツを特定する情報であれば、その種類を問わないが、例えば、番組名、視聴時刻、チャンネル等である。
データ蓄積装置5は、Webサーバ4から送信されるコメントデータと、番組特定情報とを、視聴者IDに対応付けて蓄積するものである。
また、データ蓄積装置5は、番組の場面内容を示す内容データ(字幕データ等)が存在する場合、予めその内容データも、番組配信サーバ3から取得し、タイムスタンプに対応付けて蓄積しておくものとする。
このように、データ蓄積装置5は、番組ごとに、視聴者ID、コメントデータおよび番組特定情報、さらには、必要に応じて内容データが対応付けられて蓄積される(図では一部省略)。
視聴者端末6は、放送局が配信する番組コンテンツを受信して提示するとともに、視聴者から当該番組コンテンツに対するコメントデータの入力を受け付けて、放送局側に送信するものである。ここでは、視聴者端末6は、一般的なWebブラウザによって、Webサーバ4から、番組コンテンツを取得し再生することで、視聴者に番組コンテンツを提示する。
さらに、視聴者端末6は、Webブラウザによって、Webサーバ4が指示するレイアウトに基づいてコメント入力画面を画面上に表示し、キーボード等の入力装置(図示せず)を介して、視聴者からコメントデータの入力を受け付ける。例えば、視聴者端末6は、図2に示すような視聴者端末表示画面100において、番組コンテンツ表示領域101に番組コンテンツを表示し、コメント入力領域102に図示を省略したキーボード等の入力装置を介してコメントを入力する。
また、視聴者端末6は、コメントデータが入力される際に、番組名、視聴時刻、チャンネル等の番組特定情報を設定するものとする。この番組特定情報は、番組コンテンツに付加されているメタデータ等から取得することとしてもよいし、視聴者が入力装置を介して入力する形態であっても構わない。
なお、視聴者端末6は、Webサーバ4から、番組コンテンツを取得する以外に、一般的なテレビチューナを備え、放送波を介して配信される番組コンテンツを取得し、提示することとしもよい。
さらに、視聴者端末6は、コメント収集解析装置1から配信される視聴者ごとの嗜好情報(フィードバックデータ)に基づいて、視聴者の好みに沿った番組提示を行う機能を有している。この番組提示機能については後記する。
また、ここでは、Webサーバ4とデータ蓄積装置5とをISP側に備える構成としているが、放送局内に備える構成としてもよい。
以下、コメント収集解析装置について具体的に説明する。
[コメント収集解析装置の構成]
まず、図3を参照して、コメント収集解析装置の構成について説明する。図3は、本発明の実施形態に係るコメント収集解析装置の構成を示すブロック図である。図3に示すように、コメント収集解析装置1は、コメント解析手段10と、フィードバック手段20とを備えている。まず、コメント解析手段10について詳細に説明する。
コメント解析手段10は、ネットワークNを介して、番組コンテンツに対する視聴者からのコメントをコメントデータとして収集し、解析するものである。ここでは、コメント解析手段10は、複数の視聴者から収集したコメントデータを解析することで、視聴者を嗜好ごとに分類することとする。なお、コメント解析手段10は、受信手段11と、置換文字記憶手段12と、コメント整形手段13と、整形コメント記憶手段14と、嗜好分類手段15と、分類情報記憶手段16と、を備えている。
受信手段(コメント受信手段、メタデータ受信手段)11は、ネットワークNを介して、視聴者が入力したコメントデータと、そのコメントデータを入力した際に視聴している番組コンテンツを特定する番組特定情報を受信するものである。ここでは、受信手段11は、番組特定情報で特定される番組コンテンツに対して、データ蓄積装置5から視聴者IDごとにコメントデータを受信する。この受信手段11で受信したコメントデータは、視聴者IDとともに、コメント整形手段13に出力される。
また、受信手段11は、番組コンテンツのタイムスタンプに対応付けられた場面の内容を示す内容データ(例えば、字幕データ)をメタデータとして受信するものでもある。
置換文字記憶手段(嗜好対象表現記憶手段、嗜好表現記憶手段)12は、コメントデータを部分的に置換することで、コメントデータを正規化するための文字列を記憶しておくものであって、ハードディスク等の一般的な記憶装置である。ここでは、置換文字記憶手段12には、名前置換データと、記号置換データと、嗜好表現置換データとを記憶しておく。
名前置換データは、同一の嗜好の対象となる対象物を示す複数の異なる表現の文字列を、共通の文字列である識別語(対象識別語)に置換するためのデータである。ここでは、表現が異なる複数の文字列を、同一の文字列(対象識別語)に対応付けておく。例えば、番組コンテンツがドラマの場合、通常、俳優の名前とその俳優が演じる役名とは異なっているが、同一の人物を指し示すことになる。そこで、名前置換データは、予め俳優の「氏」、「名」、「氏名」、あるいは、それらに類似する文字列を、役名に対応付けておく。
記号置換データは、複数の記号を組み合わせることで感情を表現する記号列(例えば、顔文字)を、その感情を示す識別語に置換するためのデータである。ここでは、同一の感情を示す複数の記号の組み合わせを、予め定めた分類に区分するための嗜好識別語に対応付けておく。例えば、笑い顔を表現する「(^o^)」、「(´∀`)/」等を肯定的表現として、予め「肯定」という嗜好識別語に対応付けておく。また、例えば、怒り顔を表現する「(`д´#)」、「(`・ω・´)」等を否定的表現として、予め「否定」という嗜好識別語に対応付けておく。
嗜好表現置換データは、同一の嗜好を示す複数の異なる表現の文字列を、共通の文字列である識別語(嗜好識別語)に置換するためデータである。ここでは、複数の嗜好の表現を、予め定めた分類に区分するための嗜好識別語に対応付けておく。例えば、「好き」、「かわいい」等の感情を示す文字列を肯定的表現として、予め「肯定」という嗜好識別語に対応付けておく。また、例えば、「怖い」、「嫌い」等の感情を示す文字列を否定的表現として、予め「否定」という嗜好識別語に対応付けておく。
このように、置換文字記憶手段12には、視聴者ごとに異なる表現を正規化するための置換用の文字列を記憶しておく。
コメント整形手段13は、受信手段11で受信したコメントデータにおいて、視聴者間で異なる表現を用いた文字列を、正規化するものである。この正規化されたコメントデータは、視聴者IDに対応付けられて整形コメント記憶手段14に記憶される。ここでは、コメント整形手段13は、名前置換手段13aと、記号置換手段13bと、単語列解析手段13cと、嗜好表現置換手段13dと、主語補完手段13eとを備えている。
名前置換手段13aは、置換文字記憶手段12に記憶されている名前置換データに基づいて、コメントデータにおいて、同一の対象に対して、視聴者ごとに異なる名前の文字列を、同一人物を示す文字列に置換するものである。この名前置換手段13aは、例えば、コメントデータ内に、置換文字記憶手段12に記憶されている名前置換データと同一の俳優名が含まれている場合、当該俳優名を役名に置換する。なお、この置換された文字列は、当該コメントデータ内において、主語を意味することになる。
記号置換手段13bは、置換文字記憶手段12に記憶されている記号置換データに基づいて、コメントデータにおいて、同一の感情を示す複数の記号の組み合わせを、予め定めた分類に区分するための識別語に置換するものである。この記号置換手段13bは、例えば、コメントデータ内に、「(^o^)」の記号の組み合わせが含まれている場合、「肯定」という識別語に置換する。
なお、コメント整形手段13は、名前置換手段13a、記号置換手段13bにおいて、文字列が置換されたものについては、その文字列ごとに置換されたことを示す属性を付加しておく。
単語列解析手段13cは、コメントデータである単語列を形態素ごとに解析するものである。ここでは、単語列解析手段13cは、必要に応じて名前置換手段13aおよび記号置換手段13bで文字列置換されたコメントデータを解析する。
この単語列解析手段13cは、コメントデータを形態素解析することで、形態素ごとに品詞を対応付け、構文解析を行うことで、各単語間の引用関係を求める。この解析結果によって、コメントデータが品詞ごとに区分され、コメントデータにおいて主語となる単語が含まれているか否かを判定することが可能になる。このコメントデータおよび解析結果は、嗜好表現置換手段13dに出力される。
なお、単語列解析手段13cは、コメントデータ内に名前置換手段13aおよび記号置換手段13bで置換された文字列が含まれていることを属性により判別した場合、当該置換された文字列はすでに解析内容が判明しているものであるため、解析を行わないこととする。
嗜好表現置換手段13dは、置換文字記憶手段12に記憶されている嗜好表現置換データに基づいて、単語列解析手段13cで解析されたコメントデータの中で、嗜好表現となる文字列を、予め定めた分類に区分するための嗜好識別語に置換するものである。この嗜好表現置換手段13dは、例えば、ある品詞に対応付けられた文字列が「怖い」である場合、当該文字列をその文字列に対応する嗜好識別語「否定」に置換する。
このように、嗜好表現置換手段13dは、コメントデータを品詞に対応する文字列ごとに、嗜好表現となる文字列と比較して嗜好識別語に置換することで、単語間に跨って嗜好表現となる文字列が存在した場合であっても、誤って識別語に置換することがない。
主語補完手段13eは、コメントデータに主語が含まれていな場合に、主語を補完するものである。ここでは、主語補完手段13eは、単語列解析手段13cで解析した解析結果で、主語が含まれていない場合、受信手段11を介して、データ蓄積装置5から、字幕データを取得し、当該字幕データにおける話者を主語としてコメントデータに補完する。この場合、主語補完手段13eは、字幕データを形態素解析および構文解析し、当該字幕データに含まれるそれぞれの単語と、コメントデータとの構文解析における一致度を比較することによって、主語を一意に決定し、当該主語でコメントデータを補完することとする。なお、この字幕データの形態素解析および構文解析は、単語列解析手段13cで行うこととしてもよい。
このように、コメント整形手段13は、視聴者が入力したコメントデータに対して主語や感情表現を置換することで、コメントデータを嗜好分類手段15で分類可能な形式に正規化することができる。
整形コメント記憶手段14は、コメント整形手段13で整形されたコメントデータを、視聴者IDに対応付けて記憶するものであって、ハードディスク等の一般的な記憶装置である。
嗜好分類手段15は、コメント整形手段13で整形され、整形コメント記憶手段14に記憶されたコメントデータに基づいて、視聴者を、ある対象物に対する嗜好の類似するグループに分類するものである。なお、コメント整形手段13で整形されたコメントデータは、嗜好を表す表現が正規化されているため、視聴者間のコメントデータの類似度を求めることで、視聴者を嗜好に基づいてグループ分けすることができる。ここでは、嗜好分類手段15は、類似度算出手段15aと、分類手段15bと、例外除去手段15cと、を備えている。
類似度算出手段15aは、視聴者ごとのコメントデータの類似度を算出するものである。ここでは、この類似度算出手段15aは、視聴者間のコメントデータの類似度をマトリックス形式(類似度マトリックス)に配列化して、分類手段15bに出力する。
なお、類似度の算出は、一般的な手法を用いることができるが、ここでは、一例としてシンプソン(Simpson)係数により類似度を算出する手法について説明する。
シンプソン係数を用いた視聴者Uと視聴者Uとの類似度Sim(U,U)は、以下の(1)式で表される。
Figure 0004950753
ここで、Wは、視聴者Uのコメントデータの集合{Wi1,Wi2,…}を示し、Wは、視聴者Uのコメントデータの集合{Wj1,Wj2,…}を示している。また、|W|は、集合Wに含まれるコメントデータが、視聴者U以外の他の視聴者のコメントデータの集合の構成要素と一致する数を示し、|W|は、集合Wに含まれる構成要素が、視聴者U以外の他の視聴者のコメントデータの集合の構成要素と一致する数を示している。また、|W∩W|は、集合Wと集合Wとで、構成要素が一致する数を示している。
このように、類似度算出手段15aは、視聴者間のコメントデータの類似度を一定の基準により数値化する。
ここで、図4を参照(適宜図3参照)して、類似度算出手段15aが、コメントデータから、視聴者間の類似度を類似度マトリックスとして生成する手法について具体的に説明する。図4は、類似度マトリックスの生成手法を説明するための説明図である。
この図4において、(a)は、各視聴者(U,U,U,U)のコメントデータを示している。なお、ここでは、説明を簡略化するため、「主語(対象識別語)」と「嗜好識別語」のみを示している。例えば、視聴者Uのコメントデータは、W11,W12,W13であることを示している。この(a)に示すように、コメントデータは、コメント整形手段13によって、「主語(対象識別語)」、「嗜好識別語」を含んで正規化されている。
そして、類似度算出手段15aは、(b)に示すように、視聴者間の類似度を算出する。ここでは、前記(1)式で示したシンプソン係数によって類似度を算出した例を示している。例えば、視聴者Uと視聴者Uの類似度は、視聴者Uのコメントデータの集合W{W11,W12,W13}と、視聴者Uのコメントデータの集合W{W21,W22,W23}とにおいて、|W1∩W2|は、(「○○太郎」「肯定」)のみが一致するため“1”となり、|W|は、視聴者Uのコメントデータの集合Wの構成要素が、W22、W42およびW43と一致するため“3”、|W|は、視聴者Uのコメントデータの集合Wの構成要素が、W11、W12、W13、W41、W42およびW43と一致するため“6”となり、類似度Sim(U,U)は、“1/3”となる。
このように、類似度算出手段15aは、視聴者間で類似度を算出することで、類似度マトリックスMXを生成する。
図3に戻って、コメント収集解析装置1の構成について説明を続ける。
分類手段15bは、類似度算出手段15aで算出された視聴者ごとのコメントデータの類似度に基づいて、視聴者を嗜好の類似するグループに分類するものである。この分類手段15bは、例えば、最初に類似度が低い、すなわち、相関の低い視聴者をクラス分けし、他の視聴者を、各クラスの視聴者との間で類似度が高いクラスに分類することで、クラス分けを行う。
ここで、図5を参照(適宜図3参照)して、分類手段15bが、類似度に基づいて視聴者を嗜好ごとに分類する手法について具体的に説明する。図5は、視聴者を嗜好ごとに分類する手法を説明するための説明図である。この図5において、類似度マトリックスMXは、図4で説明した類似度マトリックMXを示している。
ここで、分類手段15bは、(a)に示すように、まだ分類されていないコメントデータを入力した視聴者のリスト(非分類視聴者リスト)を生成する。
そして、分類手段15bは、類似度が最低値を有している視聴者をクラス分けする。類似度マトリックスMXにおいて、視聴者Uと、視聴者Uとが、類似度“0”の最低値を示しているため、ここでは、(b)に示すように、視聴者UをクラスC1、視聴者UをクラスC2に分類する。そして、分類手段15bは、非分類視聴者リストからUとUとを削除する。
次に、分類手段15bは、クラスC1の視聴者Uとの間で類似度が最高値を示す視聴者Uを、クラスC1に分類する。一方、クラスC2の視聴者Uとの間で類似度が最高値を示す視聴者は存在しないため、クラスC2への分類は行わない。そして、分類手段15bは、非分類視聴者リストからUを削除する。
また、分類手段15bは、クラスC1の視聴者Uとの間で類似度が最高値を示す視聴者Uを、クラスC1に分類する。一方、クラスC2の視聴者Uとの間で類似度が最高値を示す視聴者は存在しないため、クラスC2への分類は行わない。そして、分類手段15bは、非分類視聴者リストからUを削除する。
これによって、非分類視聴者リストは空集合となり、クラスC1に{U,U,U}、クラスC2に{U}と分類されることになる。
図3に戻って、コメント収集解析装置1の構成について説明を続ける。
例外除去手段15cは、分類手段15bで分類された各クラスにおいて、例外となるコメントを入力した視聴者を、分類の対象外として除去するものである。この例外となるコメントとは、コメントデータの内容が、他の視聴者のコメントデータと大きく異なる場合に、クラス分けに意味を持たないコメントのことをいう。このような視聴者を、分類から除去することで、グループを特異なグループに細分化してしまうことを防止することができる。
ここで、図6を参照(適宜図3参照)して、例外除去手段15cが、例外となる視聴者を分類の対象外とする手法について具体的に説明する。図6は、例外除去の手法を説明するための説明図である。なお、ここでは、説明の都合上、視聴者間の類似度は、図4で説明したものとは異なる値を用い、各視聴者をノードとして表現した際のノード間の線上に類似度を示している。
ここで、例外除去手段15cは、コメントデータの類似度の和が最も大きい視聴者から、順次検索し、最後の視聴者と、他の視聴者とのコメントデータの類似度の和を計算することで、最後の視聴者と他の視聴者との類似度を求める。
例えば、図6(a)においては、コメントデータの類似度の和が最も大きい視聴者から探索すると、視聴者U、U、Uの順で探索されることになる。そして、最終的に残った視聴者Uの類似度の和(ここでは、0+0+0.1=0.1)を、視聴者U、U、Uと視聴者Uとの類似度とする。
次に、例外除去手段15cは、最終的に残った視聴者(ここでは、U)と、その直前に検索された視聴者(ここでは、U)とを連結して1つのクラスとみなす。すなわち、例外除去手段15cは、視聴者Uと視聴者Uとの類似度と、視聴者Uと視聴者Uとの類似度とを加算することで、視聴者UおよびUのグループ(図中U34)と、視聴者Uとの類似度とし、視聴者Uと視聴者Uとの類似度と、視聴者Uと視聴者Uとの類似度とを加算することで、視聴者UおよびUのグループ(図中U34)と、視聴者Uとの類似度とし、図6(b)に示すような3つの視聴者のグループ間の類似関係を形成する。
そして、例外除去手段15cは、さらに、図6(a)で行った処理と同様に、類似度の和が最も大きい視聴者から、順次検索し、最後の視聴者と、他の視聴者とのコメントデータの類似度の和を計算することで、最後の視聴者(ここでは、視聴者UおよびU、図中U34)を、他の視聴者とクラス分けたときの類似度を求める。
そして、例外除去手段15cは、他の視聴者が、1人になるまで前記した処理を行うことで、各視聴者をグループ分けしたときのグループ間の類似度を求める。
図6の(a)では、視聴者U、U、Uと、視聴者Uとをクラス分けした際のクラス間の類似度が、“0.1”となっている。また、(b)では、視聴者U、Uと、視聴者U、Uとをクラス分けした際のクラス間の類似度が、“1.0”となっている。また、(c)では、視聴者Uと、視聴者U、U、Uとをクラス分けした際のクラス間の類似度が、“1.4”となっている。そこで、例外除去手段15cは、視聴者Uを、分類の対象外として除去する。
図3に戻って、コメント収集解析装置1の構成について説明を続ける。
分類情報記憶手段16は、嗜好分類手段15で分類された嗜好の類似する視聴者を、その嗜好の種別ごとに記憶するものであって、ハードディスク等の一般的な記憶装置である。この分類情報記憶手段16には、嗜好の種別として、例えば、番組コンテンツに登場する人物に対する好みを、視聴者の識別子(視聴者ID)に対応付けて記憶する。
次に、フィードバック手段20について詳細に説明する。
フィードバック手段20は、コメント解析手段10で解析された嗜好ごとに分類された分類情報に基づいて、視聴者端末6に、配信される番組コンテンツに対する視聴者ごとの嗜好の情報をフィードバックするものである。ここでは、フィードバック手段20は、番組情報取得手段21と、番組情報解析手段22と、嗜好情報生成手段23と、嗜好情報送信手段24とを備えている。
番組情報取得手段21は、外部から、配信予定の番組コンテンツの内容を示す情報(番組情報)を取得するものである。この番組情報は、配信予定の番組コンテンツの開始時刻、登場人物等を示す情報であって、例えば、EPG等の電子化された番組案内情報や、番組コンテンツの内容を時間に対応付けたメタデータ、字幕データ等である。なお、番組情報は、放送局内の番組配信サーバ3から取得することとしてもよいし、放送事業者がメタデータの生成を委託した外部業者が保有するメタデータ生成装置(図示せず)等から取得することとしてもよい。この番組情報取得手段21で取得した番組情報は、番組情報解析手段22に出力される。
番組情報解析手段22は、番組情報取得手段21で取得した番組情報を解析し、番組コンテンツごとに、登場人物等の嗜好の対象を抽出するものである。この番組情報解析手段22は、例えば、番組情報が番組内容をテキストデータで記述したものであれば、当該テキストデータを形態素解析、構文解析することで主語を抽出する。
嗜好情報生成手段23は、コメント解析手段10で解析され分類情報記憶手段16に記憶されている嗜好の種別ごとに分類された視聴者の好み(嗜好)と、番組情報解析手段22で解析された番組コンテンツの嗜好の対象に基づいて、視聴者の対象に対する嗜好を示す嗜好情報を生成するものである。なお、分類情報記憶手段16には嗜好の類似する視聴者がグループ化されているため、嗜好情報生成手段23は、このグループごとに嗜好情報を生成する。
例えば、嗜好情報生成手段23は、番組特定情報(例えば、番組名)、嗜好の対象(例えば、登場人物)が番組内に現れる開始時間、終了時間、その嗜好の内容(例えば、「肯定」、「否定」)を、同一のグループ内で視聴者IDに対応付けて視聴者ごとの嗜好情報として生成する。
嗜好情報送信手段24は、嗜好情報生成手段23で生成された嗜好情報を、視聴者ごとに予め契約等によって登録されている視聴者端末6に送信するものである。ここでは、嗜好情報送信手段24は、嗜好情報を、ネットワークNを介して視聴者端末6に送信することとする。なお、嗜好情報送信手段24は、嗜好情報を、視聴者固有の個別情報(EMM:Entitlement Management Message)として、放送波を介して配信する形態であっても構わない。
このようにコメント収集解析装置1を構成することで、コメント収集解析装置1は、視聴者端末6から、番組コンテンツに対するコメントデータを収集し、解析することができる。また、コメント収集解析装置1は、コメントデータの解析結果に基づいて、番組コンテンツに対する視聴者の嗜好情報を視聴者端末6に送信することができる。この嗜好情報によって、視聴者端末6では、視聴者の好みに応じて、番組コンテンツを選択したり、番組内の表示方法を変更したり等の制御を行うことができる。
また、ここでは、コメント収集解析装置1のフィードバック手段20において、番組情報解析手段22および嗜好情報生成手段23を備え、コメント収集解析装置1が、番組情報を解析し、当該番組コンテンツに対応した視聴者ごとの嗜好情報を視聴者端末6に送信することとしたが、フィードバック手段20が、分類情報記憶手段16に記憶されている嗜好情報、例えば、ある登場人物に対する「肯定」、「否定」の情報のみを嗜好情報として送信することとしてもよい。この場合、番組情報の解析は、各視聴者端末6で行うことになる。
以上、コメント収集解析装置1の構成について説明したが、コメント収集解析装置1は、一般的なコンピュータを前記した各手段として機能させるコメント収集解析プログラムによって動作させることができる。このコメント収集解析プログラムは、通信回線を介して配布することも可能であるし、CD−ROM等の記録媒体に書き込んで配布することも可能である。
[コメント収集解析装置の動作]
次に、図7を参照(構成については、適宜図3参照)して、コメント収集解析装置1の動作について説明する。図7は、本発明の実施形態に係るコメント収集解析装置の動作を示すフローチャートである。
まず、コメント収集解析装置1は、受信手段11によって、ネットワークNを介して、コメントデータと、そのコメントデータを入力した際の番組コンテンツを特定する番組特定情報を受信する(ステップS1)。なお、ここでは、コメント収集解析装置1は、ISP側に配置されたWebサーバ4によってデータ蓄積装置5に蓄積されたコメントデータおよび番組特定情報を、受信手段11により取得する。
そして、コメント収集解析装置1は、コメント整形手段13の名前置換手段13aによって、置換文字記憶手段12に記憶されている名前置換データに基づいて、コメントデータ内の文字列を置換する(ステップS2)。これによって、同一の対象に対して、視聴者ごとに異なる名前の文字列が、同一人物を示す文字列に置換されることになる。
さらに、コメント収集解析装置1は、記号置換手段13bによって、置換文字記憶手段12に記憶されている記号置換データに基づいて、コメントデータ内の記号の組み合わせを、感情を示す嗜好識別語に置換する(ステップS3)。これによって、同一の感情を示す複数の記号の組み合わせが、予め定めた分類に区分するための嗜好識別語に置換されることになる。
そして、コメント収集解析装置1は、単語列解析手段13cによって、名前置換手段13aおよび記号置換手段13bで文字列置換されたコメントデータを形態素ごとに解析する(ステップS4)。その後、コメント収集解析装置1は、嗜好表現置換手段13dによって、置換文字記憶手段12に記憶されている嗜好表現置換データに基づいて、単語列解析手段13cで解析されたコメントデータの中で、嗜好表現となる文字列を嗜好識別語に置換する(ステップS5)。
そして、コメント収集解析装置1は、主語補完手段13eによって、ステップS5による解析結果において、コメントデータに主語が含まれていない場合に、データ蓄積装置5から、字幕データを取得し、当該字幕データにおける話者を主語としてコメントデータに補完する(ステップS6)。
なお、コメント収集解析装置1は、コメントデータ内に、字幕データの形態素で読みが類似する単語が含まれている場合は、その単語を字幕データの単語に置換することとしてもよい。また、この置換において、操作者に対して、置換を実施するか否かを表示装置(図示せず)に表示して、操作者の判断に基づいて、置換を実施することとしてもよい。
そして、コメント収集解析装置1は、ステップS2〜S6によって整形されたコメントデータを整形コメント記憶手段14に記憶する(ステップS7)。
ここまでの動作によって、視聴者ごとに異なる表現で記述されたコメントデータが一定の基準に正規化されたことになる。
そして、コメント収集解析装置1は、嗜好分類手段15の類似度算出手段15aによって、整形コメント記憶手段14に記憶されている視聴者ごとのコメントデータの類似度を算出する(ステップS8)。そして、コメント収集解析装置1は、分類手段15bによって、類似度算出手段15aで算出された視聴者ごとのコメントデータの類似度に基づいて、視聴者を嗜好の類似するクラスに分類する(ステップS9)。
さらに、コメント収集解析装置1は、例外除去手段15cによって、分類手段15bで分類された各クラスにおいて、例外となるコメントを入力した視聴者を、分類の対象外として除去する(ステップS10)。そして、コメント収集解析装置1は、ステップS8〜S10で嗜好の類似する視聴者ごとに分類された分類情報を分類情報記憶手段16に記憶する(ステップS11)。
ここまでの動作によって、嗜好の類似する視聴者がグループ化されたことになる。
そして、コメント収集解析装置1は、番組情報取得手段21によって、配信予定の番組コンテンツの内容を示す情報(番組情報)を取得し(ステップS12)、番組情報解析手段22によって、その番組情報を解析し、コメントデータの時間軸と字幕データとに基づいて、登場人物等の嗜好の対象を抽出する(ステップS13)。
さらに、コメント収集解析装置1は、嗜好情報生成手段23によって、分類情報記憶手段16に記憶されている嗜好の種別ごとに分類された視聴者の好みと、ステップS13で解析された番組コンテンツの嗜好の対象に基づいて、視聴者の嗜好を示す嗜好情報を生成する(ステップS14)。そして、コメント収集解析装置1は、嗜好情報送信手段24によって、視聴者ごとに予め契約等によって登録されている視聴者端末6に嗜好情報を送信する(ステップS15)。
以上の動作によって、コメント収集解析装置1は、視聴者端末6で入力されたコメントデータを収集・解析し、嗜好ごとに視聴者をグループ分けし、嗜好の類似した視聴者に対して、嗜好情報をフィードバックすることができる。これによって、視聴者端末6で嗜好情報に基づいて、視聴者に対して、映像の提示を制御することが可能になる。
また、このように、コメント収集解析装置1は、視聴者にコメントデータに対して嗜好情報をフィードバックすることで、視聴者の積極的なコメント入力を推進することができる。
[コメント収集解析装置の動作の具体例]
次に、図8および図9を参照(適宜図1、図3参照)して、コメント収集解析装置1の動作の具体例について説明する。図8は、本発明の実施形態に係るコメント収集解析装置がコメントデータを収集・解析する動作を模式的に示した図である。図9は、本発明の実施形態に係るコメント収集解析装置が嗜好情報をフィードバックする動作を模式的に示した図である。
(コメントデータ収集・解析動作)
まず、コメントデータの収集・解析動作の具体例について説明する。図8に示すように、複数の視聴者U〜Uは、番組コンテンツを視聴中に、視聴者端末6を介して番組コンテンツに対するコメントを入力する。ここでは、視聴者U1が「○○太郎嫌い」、視聴者U2が「○○太郎カッコイイ」、視聴者U3が「○○太郎見たくない」とそれぞれ入力したとする。このコメントデータは、ネットワークNを経由して、Webサーバ4を介してデータ蓄積装置5に蓄積される。このとき、データ蓄積装置5には、視聴者を特定する識別子ID〜IDに対応付けてコメントデータが管理される。また、それぞれのコメントデータは、コメントの対象となった番組コンテンツを特定する対象番組情報が対応付けられる。
そして、コメント収集解析装置1は、コメント整形手段13によって、データ蓄積装置5に蓄積されたコメントデータを取得し、コメントデータを整形(正規化)し、嗜好分類手段15によって、整形されたコメントデータを分類(クラスタリング)する。これによって、「○○太郎嫌い」のクラスαに識別子ID、IDを持つ視聴者が分類され、「○○太郎好き」のクラスβに識別子IDを持つ視聴者が分類される。
(嗜好情報フィードバック動作)
次に、嗜好情報のフィードバック動作の具体例について説明する。図9に示すように、コメント収集解析装置1は、番組情報取得手段21によって、出演者名等が含まれている番組情報を取得し、番組情報解析手段22によって、番組情報を解析する。そして、コメント収集解析装置1は、出演者が出演する番組コンテンツの情報(番組名、開始時間、終了時間等)を、嗜好でクラスタリングされた視聴者ごとに、その嗜好情報をフィードバックする。すなわち、「○○太郎嫌い」のクラスαに分類された識別子IDおよびIDの視聴者に対して、コメント収集解析装置1は、「○○太郎」が出演する番組コンテンツ、出演する時間帯(開始時間、終了時間)、好み(ここでは、「否定」)等の嗜好情報を視聴者端末6に送信する。
これによって、嗜好情報を受信した視聴者端末6は、例えば、「○○太郎」を嫌いな視聴者Uに対しては、表示画面を小さく表示し、「○○太郎」を好きな視聴者Uに対しては、番組コンテンツの録画予約を促す画面を提示する。また、例えば、「○○太郎」を嫌いな視聴者Uに対しては、「○○太郎」が番組コンテンツに登場する前に警告を提示する。
このように、視聴者端末6では、コメント収集解析装置1からフィードバックされる嗜好情報に基づいて、視聴者の嗜好にあった表示形式で番組コンテンツを提示することができる。
本発明の実施形態に係るコメント収集システムの構成を示すブロック図である。 視聴者端末の表示画面例を示す図である。 本発明の実施形態に係るコメント収集解析装置の構成を示すブロック図である。 類似度マトリックスの生成手法を説明するための説明図である。 視聴者を嗜好ごとに分類する手法を説明するための説明図である。 例外除去の手法を説明するための説明図である。 本発明の実施形態に係るコメント収集解析装置の動作を示すフローチャートである。 本発明の実施形態に係るコメント収集解析装置がコメントデータを収集・解析する動作を模式的に示した図である。 本発明の実施形態に係るコメント収集解析装置が嗜好情報をフィードバックする動作を模式的に示した図である。
符号の説明
S コメント収集システム
1 コメント収集解析装置
2 放送番組配信装置
3 番組配信サーバ
4 Webサーバ
5 データ蓄積装置
6 視聴者端末
10 コメント解析手段
11 受信手段(コメント受信手段、メタデータ受信手段)
12 置換文字記憶手段(嗜好対象表現記憶手段、嗜好表現記憶手段)
13 コメント整形手段
14 整形コメント記憶手段
15 嗜好分類手段
16 分類記憶手段
20 フィードバック手段
21 番組情報取得手段
22 番組情報解析手段
23 嗜好情報生成手段
24 嗜好情報送信手段

Claims (4)

  1. 放送または通信回線を介して配信される番組に対して、視聴者が視聴者端末で入力したコメントデータを収集し、解析することで、前記視聴者を嗜好ごとに分類するコメント収集解析装置であって、
    前記通信回線を介して、前記番組に関する前記コメントデータを受信するコメント受信手段と、
    同一の嗜好の対象となる対象物を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための対象識別語とを予め対応付けて記憶した嗜好対象表現記憶手段と、
    同一の嗜好の内容を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための嗜好識別語とを予め対応付けて記憶した嗜好表現記憶手段と、
    前記コメント受信手段で受信したコメントデータを、前記嗜好対象表現記憶手段に記憶されている対象識別語と、前記嗜好表現記憶手段に記憶されている嗜好識別語とに基づいて置換することで、前記コメントデータを整形するコメント整形手段と、
    このコメント整形手段で整形されたコメントデータの類似の度合いを示す類似度を算出し、前記嗜好ごとに前記視聴者を分類する嗜好分類手段と、
    この嗜好分類手段で分類された視聴者ごとの前記対象物に対する嗜好を示す嗜好情報を前記視聴者端末に送信するフィードバック手段と、
    前記番組の実際の放送時間に対応した場面の内容を示す内容データをメタデータとして受信するメタデータ受信手段と、を備え
    前記コメント整形手段が、前記内容データを形態素解析および構文解析することで、主語を抽出し、前記コメントデータに付されたタイムスタンプに基づいて、前記主語を当該コメントデータにおける対象識別語とする主語補完手段を備えることを特徴とするコメント収集解析装置。
  2. 前記嗜好表現記憶手段に記憶されている前記嗜好識別語に、同一の嗜好の内容を示す複数の異なる表現の文字列として、複数の記号を組み合わせることで感情を表現する記号列を対応付けたことを特徴とする請求項1に記載のコメント収集解析装置。
  3. 前記フィードバック手段は、
    配信予定の番組の内容を示す番組情報を取得する番組情報取得手段と、
    この番組情報取得手段で取得した番組情報から前記対象識別語を抽出する番組情報解析手段と、
    この番組情報解析手段で抽出された対象識別語と、当該対象識別語に対して前記嗜好分類手段で分類された嗜好と、前記番組を特定する番組特定情報とを対応付けて前記嗜好情報を生成する嗜好情報生成手段と、
    この嗜好情報生成手段で生成された嗜好情報を前記視聴者端末に送信する嗜好情報送信手段と、
    を備えることを特徴とする請求項1または請求項2に記載のコメント収集解析装置。
  4. 放送または通信回線を介して配信される番組に対して、視聴者が視聴者端末で入力したコメントデータを収集し、解析することで、前記視聴者を嗜好ごとに分類するために、コメント収集解析装置のコンピュータを、
    前記通信回線を介して、前記番組に関する前記コメントデータを受信するコメント受信手段、
    同一の嗜好の対象となる対象物を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための対象識別語とを予め対応付けて記憶した嗜好対象表現記憶手段と、同一の嗜好の内容を示す複数の異なる表現の文字列と、当該文字列を共通の文字列に置換するための嗜好識別語とを予め対応付けて記憶した嗜好表現記憶手段とを参照して、前記コメント受信手段で受信したコメントデータを前記対象識別語と前記嗜好識別語とに基づいて置換することで、前記コメントデータを整形するコメント整形手段、
    このコメント整形手段で整形されたコメントデータの類似の度合いを示す類似度を算出し、前記嗜好ごとに前記視聴者を分類する嗜好分類手段、
    この嗜好分類手段で分類された視聴者ごとの前記対象物に対する嗜好を示す嗜好情報を前記視聴者端末に送信するフィードバック手段、
    前記番組の実際の放送時間に対応した場面の内容を示す内容データをメタデータとして受信するメタデータ受信手段として機能させ
    前記コメント整形手段が、前記内容データを形態素解析および構文解析することで、主語を抽出し、前記コメントデータに付されたタイムスタンプに基づいて、前記主語を当該コメントデータにおける対象識別語とすることを特徴とするコメント収集解析プログラム。
JP2007125143A 2007-05-10 2007-05-10 コメント収集解析装置およびそのプログラム Expired - Fee Related JP4950753B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007125143A JP4950753B2 (ja) 2007-05-10 2007-05-10 コメント収集解析装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007125143A JP4950753B2 (ja) 2007-05-10 2007-05-10 コメント収集解析装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2008283412A JP2008283412A (ja) 2008-11-20
JP4950753B2 true JP4950753B2 (ja) 2012-06-13

Family

ID=40143868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007125143A Expired - Fee Related JP4950753B2 (ja) 2007-05-10 2007-05-10 コメント収集解析装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP4950753B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010117031A1 (ja) * 2009-04-10 2010-10-14 日本電気株式会社 類型化装置、類型化方法及び類型化プログラム
JP5442401B2 (ja) * 2009-11-13 2014-03-12 株式会社インテック 行動情報抽出システム及び抽出方法
JP5277184B2 (ja) * 2010-01-25 2013-08-28 日本放送協会 選択肢生成提示装置及び選択肢生成提示プログラム
JP5896900B2 (ja) 2010-11-30 2016-03-30 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America コンテンツ管理装置、コンテンツ管理方法、コンテンツ管理プログラム及び集積回路
WO2013014824A1 (ja) * 2011-07-22 2013-01-31 パナソニック株式会社 メッセージ出力装置およびメッセージ出力方法
JP5637954B2 (ja) * 2011-07-28 2014-12-10 日本放送協会 推薦番組提示装置およびそのプログラム
JP2013033375A (ja) 2011-08-02 2013-02-14 Sony Corp 情報処理装置、情報処理方法、および、プログラム
JP2013088832A (ja) 2011-10-13 2013-05-13 Sony Corp 情報処理装置、情報処理方法、および、プログラム
CN108701313B (zh) 2015-12-11 2022-06-03 万事达卡国际股份有限公司 使用数据语料库生成推荐的系统和方法
CN115348479A (zh) * 2022-07-22 2022-11-15 北京奇艺世纪科技有限公司 一种视频播放问题的识别方法、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249346A (ja) * 1995-03-10 1996-09-27 Toshiba Corp 文書検索装置及び文書生成方法
JP2002230024A (ja) * 2001-02-05 2002-08-16 Ntt Comware Corp 検索方法、文書情報の特性情報を生成する方法、ユーザの嗜好情報を生成する方法、検索装置、文書特性情報生成装置、ユーザ嗜好情報生成装置、記録媒体およびプログラム
JP2003250142A (ja) * 2002-02-22 2003-09-05 Ricoh Co Ltd 映像配信サーバ
JP2004199547A (ja) * 2002-12-20 2004-07-15 Ikuo Sugawara 相互行為分析システム、及び相互行為分析プログラム
JP3873926B2 (ja) * 2003-05-16 2007-01-31 日本電気株式会社 字幕挿入方法、字幕挿入システム、および字幕挿入プログラム
JP2007036830A (ja) * 2005-07-28 2007-02-08 Makani Networks Co Ltd 動画管理システム、動画管理方法、クライアント、およびプログラム

Also Published As

Publication number Publication date
JP2008283412A (ja) 2008-11-20

Similar Documents

Publication Publication Date Title
JP4950753B2 (ja) コメント収集解析装置およびそのプログラム
US11197036B2 (en) Multimedia stream analysis and retrieval
KR102091414B1 (ko) 방송되는 미디어 관련 전자 메시징 향상
US7533399B2 (en) Programming guide content collection and recommendation system for viewing on a portable device
KR20210054491A (ko) 검색, 추천, 및 발견을 촉진하기 위해 머신-학습 추출물들 및 시맨틱 그래프들을 이용하여 구조화된 데이터를 생성하는 방법들 및 시스템들
CN105981067B (zh) 针对视频的各个部分提供评论和统计信息的装置及其方法
US20070203945A1 (en) Method for integrated media preview, analysis, purchase, and display
JP5277184B2 (ja) 選択肢生成提示装置及び選択肢生成提示プログラム
US20140052696A1 (en) Systems and methods for visual categorization of multimedia data
US8478759B2 (en) Information presentation apparatus and mobile terminal
KR101550886B1 (ko) 동영상 콘텐츠에 대한 부가 정보 생성 장치 및 방법
JP6429382B2 (ja) コンテンツ推薦装置、及びプログラム
BR112016006860B1 (pt) Aparelho e método para criar um único fluxo de dados de informações combinadas para renderização em um dispositivo de computação do cliente
US20130007057A1 (en) Automatic image discovery and recommendation for displayed television content
US20220253601A1 (en) Language-based content recommendations using closed captions
US20030195891A1 (en) Describing media content in terms of degrees
US8352985B2 (en) Method of storing and displaying broadcast contents and apparatus therefor
KR101286427B1 (ko) 방송 콘텐츠 추천 장치 및 방법
CN112040318A (zh) 个性化节目单推荐方法、装置、存储介质和电子设备
JP2014130536A (ja) 情報管理装置、サーバ及び制御方法
JP4755122B2 (ja) 画像辞書生成方法及び装置及びプログラム
KR101220080B1 (ko) 실시간 인기 키워드에 대한 대표 문구 제공 방법 및 시스템
Ariyasu et al. Message analysis algorithms and their application to social tv
KR20100111907A (ko) 시청자 참여정보를 반영한 광고 제공장치 및 방법
Almeida et al. A video engine supported by social buzz to automatically create TV summaries

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120309

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees