JP2015041239A - メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法 - Google Patents

メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法 Download PDF

Info

Publication number
JP2015041239A
JP2015041239A JP2013171785A JP2013171785A JP2015041239A JP 2015041239 A JP2015041239 A JP 2015041239A JP 2013171785 A JP2013171785 A JP 2013171785A JP 2013171785 A JP2013171785 A JP 2013171785A JP 2015041239 A JP2015041239 A JP 2015041239A
Authority
JP
Japan
Prior art keywords
comment
server
media content
evaluation index
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013171785A
Other languages
English (en)
Other versions
JP6130270B2 (ja
Inventor
池田 和史
Kazufumi Ikeda
和史 池田
服部 元
Hajime Hattori
元 服部
滝嶋 康弘
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013171785A priority Critical patent/JP6130270B2/ja
Publication of JP2015041239A publication Critical patent/JP2015041239A/ja
Application granted granted Critical
Publication of JP6130270B2 publication Critical patent/JP6130270B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】メディアコンテンツの種々の配信指標に応じて、それに関するコメント集合のソート条件を制御して、ユーザに明示するコメントリスト公開サーバ等を提供する。【解決手段】メディアコンテンツにおける配信指標要素毎に、コメントの内容から抽出可能な各評価指標要素に対する重み係数を割り当てて記憶する重み係数記憶手段と、当該メディアコンテンツにおける配信指標要素を抽出する配信指標抽出手段と、メディアコンテンツに関するコメント集合を、コメントサーバから検索するコメント集合検索手段と、コメント集合の各コメントについて、その内容から各評価指標要素の値を抽出する評価指標値抽出手段と、コメント集合の各コメントについて、評価指標要素の値に重み係数を乗算する評価指標値更新手段と、更新された評価指標要素の値に基づいて複数のコメントをソートするコメントソート手段とを有する。【選択図】図2

Description

本発明は、メディアコンテンツと、そのメディアコンテンツに関して投稿されたコメント集合とを、ユーザに明示する技術に関する。
近年、インターネットを介して、様々なメディアコンテンツが公開されている。メディアコンテンツとは、例えばニュース記事や、Webページ、音楽コンテンツ、電子書籍、テレビ放送コンテンツのようなものであって、不特定多数の第三者からアクセス可能なコンテンツをいう。
一方で、インターネットを介して、SNS(Social Networking Service)や、ブログ(Web log)、ミニブログ(mini Web log)(例えばtwitter(登録商標))のようなサイトサーバへ、不特定多数のユーザから大量のコメントが投稿されている。このようなコメントは、共通の話題に対して議論されている場合も多い。例えば、前述したようなメディアコンテンツを共通の話題として、多数のコメントが投稿されることも多い。
従来、サイトに公開されたニュース記事について、そのニュース記事のタイトルやURL(Uniform Resource Locator)を検索キーとしてコメントを収集し、それらコメント集合をユーザに明示する技術がある(例えば非特許文献1参照)。
また、複数の文書の中から、類似する文書が多いほどそれら文書の話題度を高く設定し、その話題度が高い文書を優先的に提示する技術もある(例えば特許文献1参照)。この技術によれば、日々変化する膨大な情報の話題性を把握することができ、文書間の類似性と、話題の時間的な盛り上がりという2つの観点に基づいて提示することができる。受け身の立場で最新の話題情報を取得したいユーザにとって、効率的に情報を取得することができる。
特開2006−120069号公報
「Yahoo! ニュース」、[online]、[平成25年8月12日検索]、インターネット<URL:headlines.yahoo.co.jp>
非特許文献1に記載の技術によれば、コメント集合は、基本的に時系列順に表示されるだけである。ユーザは、有益なコメントを発見するために、多数のコメントを閲覧し確認する必要がある。特にスマートフォンや携帯電話機、タブレットなどの端末は、ディスプレイサイズが限定されることから、有益なコメントを発見しにくい。ここで、引用数が多いコメントほど、有益性が高いと考えることもできる。しかしながら、引用数は、そのコメントの発言者の認知度によって影響を受けることが多く、コメントの内容自体が有益とは限らない。
また、特許文献1に記載の技術によれば、文書間の類似度によって文書の有益性を測っている。しかしながら、単一の指標だけでコメントの有益性を判断した場合、あるメディアコンテンツではユーザにとって最適であっても、他のメディアコンテンツでも最適であるとは限らない。これに対し、本願の発明者らは、メディアコンテンツのジャンルや、配信元、配信日時によっては、コメント集合をユーザにとって最適に表示する指標も異なるであろうと考えた。
そこで、本発明は、メディアコンテンツの種々の配信指標に応じて、そのメディアコンテンツに関するコメント集合のソート条件を制御して、ユーザに明示するコメントリスト公開サーバ、プログラム及び方法を提供することを目的とする。
本発明によれば、メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なコメントリスト公開サーバであって、
メディアコンテンツにおける配信指標要素毎に、コメントの内容から抽出可能な各評価指標要素に対する重み係数を割り当てて記憶する重み係数記憶手段と、
メディアサーバから取得した当該メディアコンテンツにおける配信指標要素を抽出する配信指標抽出手段と、
メディアコンテンツに関するコメント集合を、コメントサーバから検索するコメント集合検索手段と、
コメントサーバから取得したコメント集合の各コメントについて、その内容から各評価指標要素の値を抽出する評価指標値抽出手段と、
メディアコンテンツに対するコメント集合の各コメントについて、評価指標要素の値に重み係数を乗算する評価指標値更新手段と、
メディアコンテンツに対するコメント集合について、更新された評価指標要素の値に基づいて複数のコメントをソートするコメントソート手段と
を有することを特徴とする。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
配信指標要素は、当該メディアコンテンツにおけるジャンル情報、配信元情報、配信日時、又は、これら要素の複数の組み合わせである
ことも好ましい。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
評価指標要素は、当該コメントにおける盛り上がり要素を含み、
盛り上がり要素の値は、当該コメントに含まれる複数の形態素の中で、同一の形態素が連続した最大数であることも好ましい。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
肯定/否定/顔文字それぞれの感情表現用語を予め登録した感情表現用語登録手段を更に有し、
評価指標要素は、当該コメントにおける感情表現要素を含み、
感情表現要素の値は、当該コメントに含まれる各感情表現用語の出現数である
ことも好ましい。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
評価指標要素は、当該コメントにおける文体要素を含み、
文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であることも好ましい。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
評価指標要素は、当該コメントにおける注目度要素を含み、
注目度要素の値は、当該コメントの引用数である
ことも好ましい。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
メディアコンテンツにおけるコメント集合の中から、TF−IDF(Term Frequency - Inverse Document Frequency)を用いて、当該メディアコンテンツを特徴付ける1つ以上の特徴単語を抽出し、
評価指標要素は、当該コメントにおける多数派度要素を含み、
多数派度要素の値は、当該コメントに含まれる特徴単語の出現数である
ことも好ましい。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
重み係数記憶手段について、配信指標要素毎における各評価指標要素に対する重み係数は、ユーザによって明示的に設定されることも好ましい。
本発明のコメントリスト公開サーバにおける他の実施形態によれば、
メディアコンテンツは、ニュース記事コンテンツ又は放送コンテンツであり、
コメントは、SNS(Social Networking Service)サーバ、ブログ(Web-log)サーバ、掲示板サーバ又はレビューサイトサーバから発信されたものであることも好ましい。
本発明によれば、メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なサーバに搭載されたコンピュータを機能させるプログラムであって、
メディアコンテンツにおける配信指標要素毎に、コメントの内容から抽出可能な各評価指標要素に対する重み係数を割り当てて記憶する重み係数記憶手段と、
メディアサーバから取得した当該メディアコンテンツにおける配信指標要素を抽出する配信指標抽出手段と、
メディアコンテンツに関するコメント集合を、コメントサーバから検索するコメント集合検索手段と、
コメントサーバから取得したコメント集合の各コメントについて、その内容から各評価指標要素の値を抽出する評価指標値抽出手段と、
メディアコンテンツに対するコメント集合の各コメントについて、評価指標要素の値に重み係数を乗算する評価指標値更新手段と、
メディアコンテンツに対するコメント集合について、更新された評価指標要素の値に基づいて複数のコメントをソートするコメントソート手段と
してコンピュータを機能させることを特徴とする。
本発明によれば、メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なコメントリスト公開サーバを用いたコメント公開方法であって、
メディアコンテンツにおける配信指標要素毎に、コメントの内容から抽出可能な各評価指標要素に対する重み係数を割り当てて記憶する重み係数記憶部を有し、
メディアサーバから取得した当該メディアコンテンツにおける配信指標要素を抽出する第1のステップと、
メディアコンテンツに関するコメント集合を、コメントサーバから検索する第2のステップと、
コメントサーバから取得したコメント集合の各コメントについて、その内容から各評価指標要素の値を抽出する第3のステップと、
メディアコンテンツに対するコメント集合の各コメントについて、評価指標要素の値に重み係数を乗算する第4のステップと、
メディアコンテンツに対するコメント集合について、更新された評価指標要素の値に基づいて複数のコメントをソートする第5のステップと
を有することを特徴とする。
本発明のコメントリスト公開サーバ、プログラム及び方法によれば、メディアコンテンツの種々の配信指標に応じて、そのメディアコンテンツに関するコメント集合のソート条件を制御して、ユーザに明示することができる。
本発明におけるシステム構成図である。 本発明におけるコメントリスト公開サーバの機能構成図である。 ユーザによって閲覧される端末の画面表示図である。 盛り上がり要素に高く重み付けされたコメント集合のソートを表す画面表示図である。 否定・感情表現要素に高く重み付けされたコメント集合のソートを表す画面表示図である。 多数派度要素に高く重み付けされたコメント集合のソートを表す画面表示図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明におけるシステム構成図である。
図1によれば、メディアコンテンツを配信するメディアサーバ2と、複数の投稿者間でテキストのコメントを発信し合うコメントサーバ3とが、インターネットに接続されている。メディアサーバ2が配信するメディアコンテンツは、例えばニュース記事、Webページ、音楽コンテンツ、電子書籍、テレビ放送コンテンツのようなものであって、不特定多数のユーザからアクセス可能なものである。コメントサーバ3は、SNSサーバ、ブログサーバ、掲示板サーバ又はレビューサイトサーバであってもよい。コメントサーバ3が公開するコメントは、例えばtwitter(登録商標)サイトで公開されるツィートのようなものである。
尚、以下では、メディアサーバ2とコメントサーバ3とが別々にインターネットに設置されているものとして説明する(図1参照)が、これら機能が一体となったサイトサーバであってもよい。このようなサイトサーバの場合、メディアコンテンツ毎に、多数のコメントが対応付けて公開されている。例えばYouTube(登録商標)のようなサイトサーバがある。
図1によれば、「コメントリスト公開サーバ1」が、インターネットに更に接続されている。コメントリスト公開サーバ1は、メディアサーバ2からメディアコンテンツを取得すると共に、コメントサーバ3からコメント集合を検索して取得することができる。コメントリスト公開サーバ1は、メディアコンテンツの種々の配信指標に応じて、そのメディアコンテンツに関するコメント集合のソート条件を制御して、ユーザに明示する。尚、前述したメディアサーバ及びコメントサーバの機能を統合したサイトサーバに、本発明のコメントリスト公開サーバの機能が組み込まれたものであってもよい。
端末4は、例えばスマートフォンや、携帯電話機、タブレット端末、パーソナルコンピュータ、テレビ等であって、ユーザによって閲覧可能なものである。端末4は、コメントリスト公開サーバ1へアクセスすることによって、メディアコンテンツと共に、そのメディアコンテンツに関するコメントリストとの両方を閲覧することができる。
図2は、本発明におけるコメントリスト公開サーバの機能構成図である。
図2によれば、コメントリスト公開サーバ1は、インターネットに接続する通信インタフェースと共に、重み係数記憶部10と、配信指標抽出部11と、コメント集合検索部12と、評価指標値抽出部13と、評価指標値更新部14と、コメントソート部15と、コメントリスト公開部16と、感情表現要素登録部17とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、コメント公開方法としても理解できる。
[重み係数記憶部10]
重み係数記憶部10は、メディアコンテンツにおける「配信指標要素」毎に、コメントの内容から抽出可能な各「評価指標要素」に対する「重み係数」を割り当てて記憶する。即ち、本発明のコメントリスト公開サーバ1は、メディアコンテンツの種別(配信指標要素)に応じて、コメント集合を異なる観点(評価指標要素に対する重み係数)からソートして、ユーザに明示するものである。
「配信指標要素」としては、例えば、当該メディアコンテンツにおける<ジャンル情報A><配信元情報B><配信日時C>(これら要素の複数の組み合わせ)がある。
「評価指標要素」としては、例えば、当該コメントから抽出可能な、<盛り上がり要素α><感情表現要素β><文体要素γ><注目度要素δ><多数度派要素ε>がある。
重み係数における具体的な例は、図3〜図6と共に後述する。
[配信指標抽出部11]
配信指標抽出部11は、メディアサーバ2から取得した当該メディアコンテンツにおける「配信指標要素」を抽出する。例えばRSS(Really Simple Syndication/Rich Site
Summary)を用いて、最新のメディアコンテンツのURLを収集することができる。そして、配信指標抽出部11は、収集されたメディアコンテンツから、タイトルや記事本文だけでなく、「配信指標要素」(ジャンル情報A、配信元情報B、配信日時C)を抽出する。抽出された配信指標要素は、コメント集合検索部12へ出力される。
[コメント集合検索部12]
コメント集合検索部12は、メディアコンテンツに関するコメント集合を、コメントサーバ3から検索する。例えばメディアコンテンツのURLやタイトル、又はハッシュタグを検索キーとして、コメントサーバ3によって公開される検索用API(Application Programing Interface)を用いて検索する。例えばメディアコンテンツがニュース記事である場合、そのニュース記事に関するコメント集合を収集することができる。検索されたコメント集合は、評価指標値算出部13へ出力される。
また、他の実施形態として、メディアコンテンツに含まれるテキストから形態素解析によって単語を抽出するものであってもよい。「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。そして、形態素解析によって抽出された単語から、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を抽出する。TF−IDFとは、各単語に重みを付けて、クエリから文章をベクトル空間で表し、文章とクエリの類似度でランク付けをする技術である。ランク付けられた値が高いほど、重要キーワードと認識される。そして、この特徴的な単語を検索キーとして、コメントサーバ3から検索することができる。
[評価指標値抽出部13]
評価指標値抽出部13は、コメントサーバ3から取得したコメント集合の各コメントについて、その内容から各「評価指標要素」(盛り上がり要素、感情表現要素、文体要素、注目度要素、多数度派要素)の値を抽出する。評価指標値抽出部13は、コメント集合検索部12と同様に、形態素解析及びTF−IDFの処理を実行することによって、コメントに含まれている各評価指標要素を抽出する。抽出された各評価指標要素の値は、評価指標値更新部14へ出力される。
[評価指標値更新部14]
評価指標値更新部14は、メディアコンテンツに対するコメント集合の各コメントについて、評価指標要素の値に重み係数を乗算する。更新された評価指標値は、コメントソート部15へ出力される。
重み係数の乗算に関する具体的な例は、図3〜図6と共に後述する。
[コメントソート部15]
コメントソート部15は、メディアコンテンツに対するコメント集合について、更新された評価指標要素の値に基づいて複数のコメントをソートする。具体的には、更新された複数の評価指標要素の値の和を、ソート優先度Pとして算出する。そして、ソート優先度Pが高いコメントから順にソートされる。ソートされたコメント集合は、コメントリスト公開部16へ出力される。
[コメントリスト公開部16]
コメントリスト公開部16は、メディアコンテンツと共に、ソートされたコメント集合も、サイトページとしてユーザの端末4へ送信する。例えばメディアコンテンツがニュース記事である場合、端末4のユーザは、そのニュース記事と共に、当該ニュース記事に応じてソートされた他の投稿者のコメント集合を閲覧することができる。
図3は、ユーザによって閲覧される端末の画面表示図である。
図3によれば、ケータイのニュース記事(ジャンル情報)として、b新聞社(配信元情報)から、2013年8月5日15:30(配信日時)に配信されたメディアコンテンツが表示されている。
「a社が、スマートフォンからスマートフォンを充電するケーブルを発売しました。
このケーブルのプラグには、芸人のMMMさんがプリントされています。
お値段は、税込み3,150円です。」
このメディアコンテンツに関して、不特定多数のユーザから投稿されたコメントも表示されている。
以下では、評価指標要素毎に、具体的な重み付けの方法を説明する。
<盛り上がり要素>
盛り上がり要素は、コメントに含まれる「盛り上がり表現」である。この表現は、例えば文字の連続性に注目する。例えば、同一の文字が3文字以上出現する場合、コメントの中でその部分が強調されていると考えられる。即ち、盛り上がり要素の値は、当該コメントに含まれる複数の形態素の中で、同一の形態素が連続した最大数であってもよい。例えば、盛り上がり度eは、例えば以下のように表すことができる。
「いやあああああああああああああああああああ」(19文字):e=19
「うおおおおおおおおおおお」(11文字) :e=11
「おいおいwwwwwwwwww」 :e=14
(「おい」2回+「w」10回=14回)
ここで、評価指標要素の値に基づくソート優先度Pは、以下のように表される。
P=(αA+αB+αC)×e
e:盛り上がり度
αA:ジャンル情報に対する盛り上がり表現要素の重み係数
αB:配信元情報に対する盛り上がり表現要素の重み係数
αC:配信日時に対する盛り上がり表現要素の重み係数
図4は、盛り上がり要素に高く重み付けされたコメント集合のソートを表す画面表示図である。図4によれば、同一の形態素が連続した数が多いコメントほど、優先的に上位に表示されている。
具体的な例として、例えばジャンル情報が「スポーツ」である場合、盛り上がったコメントを優先的に表示するため、「スポーツ」の盛り上がり表現の重みαAを高く設定する。一方で、ジャンル情報が「政治・経済」の場合、盛り上がりコメントを優先的に表示する必要性は低く、「政治・経済」の盛り上がり表現の重みαAを低く設定する。
また、例えば配信元情報が「芸能」会社である場合、「芸能」の盛り上がり表現の重みαBを高く設定し、盛り上がったコメントを優先的に表示することが好ましい。
逆に、例えば配信日時が「朝」である場合、「朝」の盛り上がり表現の重みαCを低く設定し、盛り上がったコメントを優先的に表示しないようにすることが好ましい。
<感情表現要素>
感情表現要素は、コメントに含まれる「感情的な表現」である。この表現は、例えば肯定文字/否定文字/顔文字に注目する。即ち、感情表現要素の値は、当該コメントに含まれる各「感情表現用語」の出現数である。
そのために、コメントリスト公開サーバ1は、肯定文字/否定文字/顔文字それぞれの感情表現用語を予め登録した「感情表現用語登録部17」を更に有する。感情表現用語登録部17の辞書を用いて、コメントに感情表現が含まれるか否かを判別する。
感情表現用語登録部 <- 肯定 sp=「嬉しい」「おめでとう」
否定 sn=「怖い」「いや」
顔文字sf=「(^_^)」「(;゜Д゜)」「(;´Д`)」
コメント
「嬉しいニュースだね。優勝おめでとう(^_^)」 -> 肯定2個+顔文字1個
「え!・・・怖い((((;゜Д゜)))))))」 -> 否定1個+顔文字1個
「いや、これは・・・(;´Д`)」 -> 否定1個+顔文字1個
ここで、評価指標要素の値に基づくソート優先度Pは、以下のように表される。
P=(βAp+βBp+βCp)×sp+(βAn+βBn+βCn)×sn
+(βAf+βBf+βCf)×sf
sp:肯定度
sn:否定度
sf:顔文字度
βAp:ジャンル情報に対する肯定・感情表現要素の重み係数
βAn:ジャンル情報に対する否定・感情表現要素の重み係数
βAf:ジャンル情報に対する顔文字・感情表現要素の重み係数
βBp:配信元情報に対する肯定・感情表現要素の重み係数
βBn:配信元情報に対する否定・感情表現要素の重み係数
βBf:配信元情報に対する顔文字・感情表現要素の重み係数
βCp:配信日時に対する肯定・感情表現要素の重み係数
βCn:配信日時に対する否定・感情表現要素の重み係数
βCf:配信日時に対する顔文字・感情表現要素の重み係数
図5は、否定・感情表現要素に高く重み付けされたコメント集合のソートを表す画面表示図である。図5によれば、否定文字及び顔文字が多く含まれるコメントほど、優先的に上位に表示されている。
具体的な例として、例えばジャンル情報が「スポーツ」である場合、肯定的な感情表現を含むコメントを優先的に表示するために、「スポーツ」の肯定・感情表現要素の重みβApを高く設定する。一方で、ジャンル情報が「政治・経済」の場合、否定的な感情表現を含むコメントを優先的に表示するために、「政治・経済」の否定・感情表現要素の重みβAnを高く設定する。
また、例えば配信元情報が「芸能」会社である場合、「芸能」の否定的な感情表現を含むコメントを優先的に表示するために、「芸能」の否定・感情表現要素の重みβBnを高く設定する。
更に、例えば配信日時が「休日」である場合、「休日」の顔文字・感情表現要素の重みβCfを高く設定し、顔文字の多い穏やかなコメントを優先的に表示させることも好ましい。
<文体要素>
文体要素は、コメントに含まれる「文体表現」である。この表現は、形態素解析によって解析された文末語の「形容詞」「形容動詞」「動詞」の活用形に注目することができる。その活用形としては、例えば「命令形」「仮定形」「未然形」などがある。即ち、文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数である。
「うわ、やめろよ」 -> 命令形
「もうちょっと安かったらなぁ」 -> 仮定形
「これは買わない」 -> 未然形
評価指標要素の値に基づくソート優先度Pは、以下のように表される。
P=(γA+γB+γC)×(w1+w2+・・・+wn)
γA:ジャンル情報に対する文体要素の重み係数
γB:配信元情報に対する文体要素の重み係数
γC:配信日時に対する文体要素の重み係数
w1:命令形の有無(0/1)
w2:仮定形の有無(0/1)
・・・
wn:〜形の有無(0/1)
具体的な例として、例えばジャンル情報が「ニュース」である場合、仮定的な文体を含むコメントを優先的に表示するために、文体要素の重みγAを高く設定する。
<注目度要素>
注目度要素は、当該コメントの引用数である。例えばtwitterサーバである場合、リツィート数やフォロワー数を、注目度fとする。
評価指標要素の値に基づくソート優先度Pは、以下のように表される。
P=(δA+δB+δC)×f
δA:ジャンル情報に対する注目度要素の重み係数
δB:配信元情報に対する注目度要素の重み係数
δC:配信日時に対する注目度要素の重み係数
具体的な例として、例えばジャンル情報が「ニュース」である場合、引用数の多いコメントを優先的に表示するために、注目度要素の重みδAを高く設定する。
<多数派度要素>
多数派度要素の値は、コメントに含まれる「特徴単語の出現数」である。特徴単語は、当該メディアコンテンツに関するコメント集合の中から、TF−IDFを用いて抽出される。そして、特徴単語を含むコメントは、多数派と判定する。
特徴単語を含むコメント数 -> 多数派度m
評価指標要素の値に基づくソート優先度Pは、以下のように表される。
P=(εA+εB+εC)×m
εA:ジャンル情報に対する多数派度要素の重み係数
εB:配信元情報に対する多数派度要素の重み係数
εC:配信日時に対する多数派度要素の重み係数
図6は、多数派度要素に高く重み付けされたコメント集合のソートを表す画面表示図である。図6によれば、多数派のコメントほど、優先的に上位に表示されている
具体的な例として、例えばジャンル情報が「ニュース」である場合、少数派のコメントを優先的に表示するために、多数派度要素の重みεAを低く設定する。TFは、当該ニュースに関するコメント中の各単語の出現頻度とし、DFは、全てのニュースに関するコメント中の各単語の出現頻度とする。
前述した<盛り上がり要素><感情表現要素><文体要素><注目度要素><多数度派要素>を全て考慮すると、以下のようにソート優先度を算出することができる。
P=(αA+αB+αC)×e
+(βAp+βBp+βCp)×sp+(βAn+βBn+βCn)×sn
+(βAf+βBf+βCf)×sf
+(γA+γB+γC)×(w1+w2+・・・+wn)
+(δA+δB+δC)×f
+(εA+εB+εC)×m
他の実施形態として、配信指標要素毎における各評価指標要素に対する重み係数は、予め固定的に設定されたものであってもよいし、ユーザによって明示的に設定されるものであってもよい。図3〜図6によれば、ユーザによって閲覧されるブラウザの上段に、「評価指標要素」(盛り上がり要素、感情表現要素、文体要素、注目度要素、多数度派要素)のボタンも備えられている。ユーザは、現在表示されているコメント集合を、所望する評価指標に応じてソートすることができる。具体的には、ユーザが評価指標要素のボタンをクリックすることによって、重み係数記憶部10におけるその評価指標要素に基づく重み係数が高くなるように設定される。
また、これら重み係数は、ユーザ毎に自動的に設定されるものであってもよい。例えば、ニューラルネットワークや、SVM(Support Vector Machine)、ナイーブベイズ、C4.5のような識別器を用いて、各指標(e、s、w、f、m)を素性とすることも好ましい。ユーザによって閲覧(又は評価)されたコメントを「正例」とし、閲覧されなかったコメントを「負例」として、識別器に学習させることによって重み係数を決定することもできる。また、ルールベースを用いて、閲覧したコメント中に各指標が含まれていれば、重みを自動的に変更するものであってもよい。
以上、詳細に説明したように、本発明のコメントリスト公開サーバ、プログラム及び方法によれば、メディアコンテンツの種々の配信指標に応じて、そのメディアコンテンツに関するコメント集合のソート条件を制御して、ユーザに明示することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 コメントリスト公開サーバ
10 重み係数記憶部
11 配信指標抽出部
12 コメント集合検索部
13 評価指標値抽出部
14 評価指標値更新部
15 コメントソート部
16 コメントリスト公開部
17 感情表現要素登録部
2 メディアサーバ
3 コメントサーバ
4 端末

Claims (11)

  1. メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なコメントリスト公開サーバであって、
    前記メディアコンテンツにおける配信指標要素毎に、前記コメントの内容から抽出可能な各評価指標要素に対する重み係数を割り当てて記憶する重み係数記憶手段と、
    前記メディアサーバから取得した当該メディアコンテンツにおける配信指標要素を抽出する配信指標抽出手段と、
    前記メディアコンテンツに関するコメント集合を、前記コメントサーバから検索するコメント集合検索手段と、
    前記コメントサーバから取得した前記コメント集合の各コメントについて、その内容から各評価指標要素の値を抽出する評価指標値抽出手段と、
    前記メディアコンテンツに対する前記コメント集合の各コメントについて、前記評価指標要素の値に前記重み係数を乗算する評価指標値更新手段と、
    前記メディアコンテンツに対する前記コメント集合について、更新された前記評価指標要素の値に基づいて複数のコメントをソートするコメントソート手段と
    を有することを特徴とするコメントリスト公開サーバ。
  2. 前記配信指標要素は、当該メディアコンテンツにおけるジャンル情報、配信元情報、配信日時、又は、これら要素の複数の組み合わせである
    ことを特徴とする請求項1に記載のコメントリスト公開サーバ。
  3. 前記評価指標要素は、当該コメントにおける盛り上がり要素を含み、
    前記盛り上がり要素の値は、当該コメントに含まれる複数の形態素の中で、同一の形態素が連続した最大数である
    ことを特徴とする請求項1又は2に記載のコメントリスト公開サーバ
  4. 肯定/否定/顔文字それぞれの感情表現用語を予め登録した感情表現用語登録手段を更に有し、
    前記評価指標要素は、当該コメントにおける感情表現要素を含み、
    前記感情表現要素の値は、当該コメントに含まれる各感情表現用語の出現数である
    ことを特徴とする請求項1から3のいずれか1項に記載のコメントリスト公開サーバ
  5. 前記評価指標要素は、当該コメントにおける文体要素を含み、
    前記文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数である
    ことを特徴とする請求項1から4のいずれか1項に記載のコメントリスト公開サーバ
  6. 前記評価指標要素は、当該コメントにおける注目度要素を含み、
    前記注目度要素の値は、当該コメントの引用数である
    ことを特徴とする請求項1から5のいずれか1項に記載のコメントリスト公開サーバ
  7. 前記メディアコンテンツにおける前記コメント集合の中から、TF−IDF(Term Frequency - Inverse Document Frequency)を用いて、当該メディアコンテンツを特徴付ける1つ以上の特徴単語を抽出し、
    前記評価指標要素は、当該コメントにおける多数派度要素を含み、
    前記多数派度要素の値は、当該コメントに含まれる前記特徴単語の出現数である
    ことを特徴とする請求項1から6のいずれか1項に記載のコメントリスト公開サーバ。
  8. 前記重み係数記憶手段について、前記配信指標要素毎における各評価指標要素に対する重み係数は、ユーザによって明示的に設定される
    ことを特徴とする請求項1から7のいずれか1項に記載のコメントリスト公開サーバ。
  9. 前記メディアコンテンツは、ニュース記事コンテンツ又は放送コンテンツであり、
    前記コメントは、SNS(Social Networking Service)サーバ、ブログ(Web-log)サーバ、掲示板サーバ又はレビューサイトサーバから発信されたものである
    ことを特徴とする請求項1から8のいずれか1項に記載のコメントリスト公開サーバ。
  10. メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なサーバに搭載されたコンピュータを機能させるプログラムであって、
    前記メディアコンテンツにおける配信指標要素毎に、前記コメントの内容から抽出可能な各評価指標要素に対する重み係数を割り当てて記憶する重み係数記憶手段と、
    前記メディアサーバから取得した当該メディアコンテンツにおける配信指標要素を抽出する配信指標抽出手段と、
    前記メディアコンテンツに関するコメント集合を、前記コメントサーバから検索するコメント集合検索手段と、
    前記コメントサーバから取得した前記コメント集合の各コメントについて、その内容から各評価指標要素の値を抽出する評価指標値抽出手段と、
    前記メディアコンテンツに対する前記コメント集合の各コメントについて、前記評価指標要素の値に前記重み係数を乗算する評価指標値更新手段と、
    前記メディアコンテンツに対する前記コメント集合について、更新された前記評価指標要素の値に基づいて複数のコメントをソートするコメントソート手段と
    してコンピュータを機能させることを特徴とするプログラム。
  11. メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なコメントリスト公開サーバを用いたコメント公開方法であって、
    前記メディアコンテンツにおける配信指標要素毎に、前記コメントの内容から抽出可能な各評価指標要素に対する重み係数を割り当てて記憶する重み係数記憶部を有し、
    前記メディアサーバから取得した当該メディアコンテンツにおける配信指標要素を抽出する第1のステップと、
    前記メディアコンテンツに関するコメント集合を、前記コメントサーバから検索する第2のステップと、
    前記コメントサーバから取得した前記コメント集合の各コメントについて、その内容から各評価指標要素の値を抽出する第3のステップと、
    前記メディアコンテンツに対する前記コメント集合の各コメントについて、前記評価指標要素の値に前記重み係数を乗算する第4のステップと、
    前記メディアコンテンツに対する前記コメント集合について、更新された前記評価指標要素の値に基づいて複数のコメントをソートする第5のステップと
    を有することを特徴とするコメント公開方法。
JP2013171785A 2013-08-21 2013-08-21 メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法 Expired - Fee Related JP6130270B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013171785A JP6130270B2 (ja) 2013-08-21 2013-08-21 メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013171785A JP6130270B2 (ja) 2013-08-21 2013-08-21 メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2015041239A true JP2015041239A (ja) 2015-03-02
JP6130270B2 JP6130270B2 (ja) 2017-05-17

Family

ID=52695365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013171785A Expired - Fee Related JP6130270B2 (ja) 2013-08-21 2013-08-21 メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6130270B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016294A (ja) * 2015-06-30 2017-01-19 キヤノンマーケティングジャパン株式会社 情報処理装置、その制御方法、及びプログラム
CN107872714A (zh) * 2017-10-27 2018-04-03 咪咕视讯科技有限公司 一种弹幕的处理方法、终端设备以及计算机可读存储介质
WO2019180546A1 (ja) * 2018-03-23 2019-09-26 株式会社半導体エネルギー研究所 文書検索システム、文書検索方法、プログラム、及び非一時的コンピュータ可読記憶媒体
CN111177533A (zh) * 2019-12-05 2020-05-19 哈勃智远(北京)科技有限公司 一种融媒体影响力分析报表生成方法及设备
CN111444701A (zh) * 2019-01-16 2020-07-24 阿里巴巴集团控股有限公司 问讯提示方法及装置
JP2022069177A (ja) * 2020-10-23 2022-05-11 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報出力方法および情報出力プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107385A (ja) * 2004-10-08 2006-04-20 Nippon Telegr & Teleph Corp <Ntt> 投稿記事抽出方法及び装置及びプログラム
JP2009508267A (ja) * 2005-09-13 2009-02-26 グーグル インコーポレイテッド ブログ文書のランク付け
JP2013073474A (ja) * 2011-09-28 2013-04-22 Ntt Docomo Inc 情報処理装置及び情報処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107385A (ja) * 2004-10-08 2006-04-20 Nippon Telegr & Teleph Corp <Ntt> 投稿記事抽出方法及び装置及びプログラム
JP2009508267A (ja) * 2005-09-13 2009-02-26 グーグル インコーポレイテッド ブログ文書のランク付け
JP2013073474A (ja) * 2011-09-28 2013-04-22 Ntt Docomo Inc 情報処理装置及び情報処理方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016294A (ja) * 2015-06-30 2017-01-19 キヤノンマーケティングジャパン株式会社 情報処理装置、その制御方法、及びプログラム
CN107872714A (zh) * 2017-10-27 2018-04-03 咪咕视讯科技有限公司 一种弹幕的处理方法、终端设备以及计算机可读存储介质
CN107872714B (zh) * 2017-10-27 2020-09-18 咪咕视讯科技有限公司 一种弹幕的处理方法、终端设备以及计算机可读存储介质
WO2019180546A1 (ja) * 2018-03-23 2019-09-26 株式会社半導体エネルギー研究所 文書検索システム、文書検索方法、プログラム、及び非一時的コンピュータ可読記憶媒体
JP2021007024A (ja) * 2018-03-23 2021-01-21 株式会社半導体エネルギー研究所 文書検索方法、文書検索システム、プログラム
JPWO2019180546A1 (ja) * 2018-03-23 2021-03-11 株式会社半導体エネルギー研究所 文書検索システム、文書検索方法、プログラム、及び非一時的コンピュータ可読記憶媒体
JP2021072102A (ja) * 2018-03-23 2021-05-06 株式会社半導体エネルギー研究所 文書検索方法、文書検索装置
JP7321143B2 (ja) 2018-03-23 2023-08-04 株式会社半導体エネルギー研究所 文書検索システム
US11789953B2 (en) 2018-03-23 2023-10-17 Semiconductor Energy Laboratory Co., Ltd. Document search system, document search method, program, and non-transitory computer readable storage medium
CN111444701A (zh) * 2019-01-16 2020-07-24 阿里巴巴集团控股有限公司 问讯提示方法及装置
CN111177533A (zh) * 2019-12-05 2020-05-19 哈勃智远(北京)科技有限公司 一种融媒体影响力分析报表生成方法及设备
JP2022069177A (ja) * 2020-10-23 2022-05-11 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報出力方法および情報出力プログラム

Also Published As

Publication number Publication date
JP6130270B2 (ja) 2017-05-17

Similar Documents

Publication Publication Date Title
Bernstein et al. Eddi: interactive topic-based browsing of social status streams
US9613149B2 (en) Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
JP6130270B2 (ja) メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法
Liu et al. Mining the interests of Chinese microbloggers via keyword extraction
CN107784092A (zh) 一种推荐热词的方法、服务器及计算机可读介质
Zangerle et al. Using tag recommendations to homogenize folksonomies in microblogging environments
WO2009082100A2 (en) Method and system for searching information of collective emotion based on comments about contents on internet
Wu et al. News filtering and summarization on the web
Gulla et al. Implicit user profiling in news recommender systems
Hienert et al. Extraction of historical events from wikipedia
JP5725619B2 (ja) 多数のコメント文章に基づいて位置情報にキーワードをタグ付けする装置、プログラム及び方法
Chang et al. Improving recency ranking using twitter data
JP2014085862A (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
CN102662977B (zh) 自学习的发帖审计系统的实现方法
KR20160002199A (ko) 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템
Hu et al. Embracing information explosion without choking: Clustering and labeling in microblogging
Moens et al. Mining User Generated Content and Its Applications.
JP6152333B2 (ja) メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法
KR102540944B1 (ko) 메타데이터를 활용한 인공지능 기반 문서관리 및 통합 검색 지원 디지털 콘텐츠 시스템
Thakkar Twitter sentiment analysis using hybrid naive Bayes
Dokoohaki et al. Mining divergent opinion trust networks through latent dirichlet allocation
Deshpande et al. A survey on: classification of Twitter data using sentiment analysis
Niu et al. Microblog user interest mining based on improved textrank model
Taniskidou et al. Comparative Analysis of Content-based Personalized Microblog Recommendations [Experiments and Analysis]
Chan et al. Social media harvesting

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170413

R150 Certificate of patent or registration of utility model

Ref document number: 6130270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees