JP6152333B2 - メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法 - Google Patents

メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法 Download PDF

Info

Publication number
JP6152333B2
JP6152333B2 JP2013235367A JP2013235367A JP6152333B2 JP 6152333 B2 JP6152333 B2 JP 6152333B2 JP 2013235367 A JP2013235367 A JP 2013235367A JP 2013235367 A JP2013235367 A JP 2013235367A JP 6152333 B2 JP6152333 B2 JP 6152333B2
Authority
JP
Japan
Prior art keywords
comment
subjective
server
media content
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013235367A
Other languages
English (en)
Other versions
JP2015095181A (ja
Inventor
池田 和史
和史 池田
服部 元
元 服部
滝嶋 康弘
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013235367A priority Critical patent/JP6152333B2/ja
Publication of JP2015095181A publication Critical patent/JP2015095181A/ja
Application granted granted Critical
Publication of JP6152333B2 publication Critical patent/JP6152333B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、メディアコンテンツとその簡単な説明文とを、サイトページとしてユーザに紹介する技術に関する。
近年、インターネットを介して、様々なメディアコンテンツが公開されている。メディアコンテンツとは、例えばニュース記事や、Webページ、音楽コンテンツ、電子書籍、テレビ放送コンテンツのようなものであって、不特定多数の第三者からアクセス可能なコンテンツをいう。
一方で、インターネットを介して、SNS(Social Networking Service)や、ブログ(Web log)、ミニブログ(mini Web log)(例えばtwitter(登録商標))のようなサイトサーバへ、不特定多数のユーザから大量のコメントが投稿されている。このようなコメントは、共通の話題に対して議論されている場合も多い。例えば、前述したようなメディアコンテンツを共通の話題として、多数のコメントが投稿されることも多い。
従来、Webサイトに公開されたニュース記事について、そのニュース記事に紐付くコメントを要約説明文としてユーザに明示する技術がある(例えば特許文献1参照)。この技術によれば、その要約説明文は、ニュース記事自体に記述され、かつ、SNSの多数のコメントの中でも言及された言葉である。このような言葉は、ニュース記事の要約説明文として相応しいものといえる。
また、ニュース記事と、そのニュース記事を引用して記述されたブログ記事とを効率的に関連付ける技術もある(例えば特許文献2参照)。この技術によれば、ブログ記事の内容から、当該ニュース記事に対する評判情報を抽出する。特に、ブログ記事の内容から肯定/否定表現を検出することによって、当該ニュース記事に対するユーザの主観を認識することができる。
特開2012−113688号公報 特許第5129082号
ユーザは、当該ニュース記事に対する有益なコメントを発見するために、多数のコメントを閲覧し確認する必要がある。しかしながら、特にスマートフォンや携帯電話機、タブレット等の携帯端末の場合、画面サイズの制約から、ユーザが多数のニュース記事を閲覧することが難しい。そのために、ニュース記事のタイトルやカテゴリ、新着情報など限定的な情報しか表示できない。
特許文献1に記載の技術によれば、ニュース記事からは、一般的事実に基づいて記述された客観的要素の語は抽出できるものの、SNSのコメントに記述された主観的要素の語を抽出することはできない。また、特許文献2に記載の技術によれば、当該ニュース記事に対するユーザ主観の肯定/否定しか得られず、その原因となったコメントに基づく主観的要素の語を認識することはできない。
これに対し、発明者らは、当該ニュース記事に対して主観的要素の語を含むコメントのみを多数抽出することによって、それらのコメント集合から共感的要素の語を抽出することができるのではないか?と考えた。その共感的要素の語は、当該ニュース記事に対する要約語として認識することができる。
そこで、本発明は、ユーザがメディアコンテンツを検索する際に、当該メディアコンテンツに関する多数のユーザの主観的なコメント集合から、多数のユーザによって共感された要約語を決定する装置、サーバ、プログラム及び方法を提供することを目的とする。
本発明によれば、メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であって、当該メディアコンテンツに対する要約語を決定する装置であって、
コメントサーバから、当該メディアコンテンツに関するコメント集合を検索するコメント集合検索手段と、
コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する主観指標値抽出手段と、
主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する主観コメント抽出手段と、
複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する要約語決定手段と
を有し、
主観指標要素は、当該コメントにおける文体要素を含み、
文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であることを特徴とする。
本発明の装置における他の実施形態によれば、
要約語決定手段は、TF−IDF(Term Frequency - Inverse Document Frequency)を用いて1つ以上の特徴語を決定することも好ましい。
本発明の装置における他の実施形態によれば、
顔文字を予め登録した顔文字要素登録手段を更に有し、
主観指標要素は、当該コメントにおける顔文字要素を含み、
顔文字要素の値は、当該コメントに含まれる各顔文字の出現数であることも好ましい。
本発明の装置における他の実施形態によれば、
主観指標要素は、当該コメントにおける盛り上がり要素を含み、
盛り上がり要素の値は、当該コメントに含まれる複数の形態素の中で、同一の形態素が連続した最大数であることも好ましい。
本発明の装置における他の実施形態によれば、
当該メディアコンテンツにおけるジャンル情報、配信元情報、配信日時、又は、これら要素の複数の組み合わせを配信指標要素として、
メディアサーバから取得した当該メディアコンテンツにおける配信指標要素を抽出する配信指標抽出手段と、
メディアコンテンツにおける配信指標要素毎に、コメントの内容から抽出可能な各主観指標要素に対する重み係数を割り当てて記憶する重み係数記憶手段と、
メディアコンテンツに対するコメント集合の各コメントについて、主観指標要素の値に重み係数を乗算する主観指標値更新手段と
を更に有することも好ましい。
本発明の装置における他の実施形態によれば、
重み係数記憶手段について、配信指標要素毎における各主観指標要素に対する重み係数は、ユーザによって明示的に設定されることも好ましい。
本発明の装置における他の実施形態によれば、
コメントサーバは、SNS(Social Networking Service)サーバ、ブログ(Web-log)サーバ、掲示板サーバ又はレビューサイトサーバであることも好ましい。
本発明によれば、メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であって、当該メディアコンテンツに対する要約語を決定するサーバであって、
コメントサーバから、当該メディアコンテンツに関するコメント集合を検索するコメント集合検索手段と、
コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する主観指標値抽出手段と、
主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する主観コメント抽出手段と、
複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する要約語決定手段と、
当該メディアコンテンツに要約語を対応付けてユーザに明示する要約語公開手段と
を有し、
主観指標要素は、当該コメントにおける文体要素を含み、
文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であることを特徴とする。
本発明によれば、メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なサーバに搭載されたコンピュータを、当該メディアコンテンツに対する要約語を決定するように機能させるプログラムであって、
コメントサーバから、当該メディアコンテンツに関するコメント集合を検索するコメント集合検索手段と、
コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する主観指標値抽出手段と、
主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する主観コメント抽出手段と、
複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する要約語決定手段と
してコンピュータを機能させ
主観指標要素は、当該コメントにおける文体要素を含み、
文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であることを特徴とする。
本発明によれば、メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なサーバを用いて、当該メディアコンテンツに対する要約語を決定する方法であって、
コメントサーバから、当該メディアコンテンツに関するコメント集合を検索する第1のステップと、
コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する第2のステップと、
主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する第3のステップと、
複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する第4のステップと
を有し、
主観指標要素は、当該コメントにおける文体要素を含み、
文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であることを特徴とする。
本発明の装置、サーバ、プログラム及び方法によれば、ユーザがメディアコンテンツを検索する際に、当該メディアコンテンツに関する多数のユーザの主観的なコメント集合から、多数のユーザによって共感された要約語を決定することができる。
本発明におけるシステム構成図である。 本発明における要約語公開サーバの機能構成図である。 要約公開サーバのコメント集合検索部によって収集されたコメント集合を表す説明図である。 要約公開サーバの主観コメント抽出部によって選択されたコメント集合を表す説明図である。 要約公開サーバの要約語決定部によって選択された要約語を表す説明図である。 ユーザによって閲覧される端末の画面表示図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明におけるシステム構成図である。
図1によれば、メディアコンテンツを配信するメディアサーバ2と、複数の投稿者間でテキストのコメントを発信し合うコメントサーバ3とが、インターネットに接続されている。メディアサーバ2が配信するメディアコンテンツは、例えばニュース記事、Webページ、音楽コンテンツ、電子書籍、テレビ放送コンテンツのようなものであって、不特定多数のユーザからアクセス可能なものである。コメントサーバ3は、SNSサーバ、ブログサーバ、掲示板サーバ又はレビューサイトサーバであってもよい。コメントサーバ3が公開するコメントは、例えばtwitter(登録商標)サイトで公開されるツィートのようなものである。
尚、以下では、メディアサーバ2とコメントサーバ3とが別々にインターネットに設置されているものとして説明する(図1参照)が、これら機能が一体となったサイトサーバであってもよい。このようなサイトサーバの場合、メディアコンテンツ毎に、多数のコメントが対応付けて公開されている。例えばYouTube(登録商標)のようなサイトサーバがある。
図1によれば、本発明の対象物となる「要約語公開サーバ1」が、インターネットに更に接続されている。要約語公開サーバ1は、メディアサーバ2からメディアコンテンツを取得すると共に、コメントサーバ3からコメント集合を検索して取得することができる。要約語公開サーバ1は、メディアコンテンツに関するコメント集合から1つ以上の要約語を決定し、メディアコンテンツと共にその要約語をユーザに明示する。尚、前述したメディアサーバ及びコメントサーバの機能を統合したサイトサーバに、本発明の要約語公開サーバの機能が組み込まれたものであってもよい。
端末4は、例えばスマートフォンや、携帯電話機、タブレット端末、パーソナルコンピュータ、テレビ等であって、ユーザによって閲覧可能なものである。端末4は、要約語公開サーバ1へアクセスすることによって、メディアコンテンツとその要約語とを対応付けて紹介したページを閲覧することができる。
図2は、本発明における要約語公開サーバの機能構成図である。
図2によれば、要約語公開サーバ1は、インターネットに接続する通信インタフェースと共に、コメント集合検索部11と、主観指標値抽出部12と、顔文字要素登録部13と、主観コメント抽出部14と、要約語決定部15と、要約語公開部16とを有する。また、オプション的に、配信指標抽出部17と、重み係数記憶部18と、主観指標値更新部19とを更に有するものであってもよい。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、要約語公開方法としても理解できる。
[コメント集合検索部11]
コメント集合検索部11は、メディアコンテンツに関するコメント集合を、コメントサーバ3から検索する。例えばメディアコンテンツのURLやタイトル、又はハッシュタグを検索キーとして、コメントサーバ3によって公開される検索用API(Application Programing Interface)を用いて検索する。メディアコンテンツがニュース記事である場合、そのニュース記事に関するコメント集合を収集することができる。検索されたコメント集合は、主観指標値抽出部12へ出力される。尚、また、他の実施形態として、メディアコンテンツに含まれるテキストから、形態素解析及びTF−IDFの処理を実行することによって、検索キーを抽出するものであってもよい。
図3は、要約公開サーバのコメント集合検索部11によって収集されたコメント集合を表す説明図である。具体的に、ニュース記事「a社から携帯端末Xが発売」に関するコメント集合が収集されている。
[主観指標値抽出部12]
主観指標値抽出部12は、コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する。「主観指標要素」とは、例えば<顔文字要素><文体要素><盛り上がり要素>である。抽出された各主観指標要素の値は、主観コメント抽出部14(又はオプション的な主観指標値更新部19)へ出力される。
主観指標値抽出部12は、形態素解析によって、コメントに含まれている各主観指標要素を抽出する。「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。
<顔文字要素>顔文字要素は、コメントに含まれる「感情的な表現」であって、その値は、当該コメントに含まれる各「顔文字」の出現数である。尚、主観指標値抽出部12は、顔文字要素登録部13を参照して顔文字を特定する。
<文体要素>文体要素は、当該コメントに含まれる文末の形態素としての命令形、仮定形、未然形のような「文体表現」であって、その値は、各「文体表現」の出現数である。
<盛り上がり要素>盛り上がり要素は、当該コメントに含まれる複数の形態素の中で、同一の形態素が連続した最大数である。
[顔文字要素登録部13]
顔文字要素登録部13は、顔文字を予め登録したものであって、主観指標値抽出部12から参照されるものである。
[主観コメント抽出部14]
主観コメント抽出部14は、主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する。主観指標要素の値が高いほど、そのコメントの主観性が高いことを意味する。ここで、主観指標要素の値とは、複数の主観指標要素から算出された「主観度P」であってもよい。その算出方法については、重み係数と共に後述する。
図4は、要約公開サーバの主観コメント抽出部によって選択されたコメント集合を表す説明図である。具体的に、主観指標要素(顔文字要素、文体要素、盛り上がり要素)を含む多数のコメントが抽出されている。
[要約語決定部15]
要約語決定部15は、複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する。要約語決定部15は、各主観コメントに対して形態素解析及びTF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)を用いて1つ以上の特徴語を決定する。TF−IDFとは、各単語に重みを付けて、クエリから文章をベクトル空間で表し、文章とクエリの類似度でランク付けをする技術である。ランク付けられた値が高いほど、重要キーワードと認識される。
TFを、当該ニュース記事に関する主観コメント中の各単語の出現頻度とし、DFを、全てのニュース記事に関するコメント中の各単語の出現頻度とする。DFを、当該ニュースの主観コメントを含まないその他のコメント中の各単語の出現頻度とするものであってもよい。尚、TF−IDFの代わりに、AIC(Akaike's Information Criterion、赤池情報量規準)やχ二乗値を用いることもできる。TF−IDF値が最も高い1つの単語を要約語として選択してもよいし、閾値以上となる複数の単語を要約語として選択してもよい。
そして、この特徴的な要約語は、要約語公開部16へ出力される。この要約語は、当該ニュース記事に関して主観表現を含む主観コメント中に有意に頻出する単語を意味する。
図5は、要約公開サーバの要約語決定部によって選択された要約語を表す説明図である。具体的に、「誰得」「欲しい」の単語が比較的多く出現していることが認識できる。この中で、TF−IDFによって「誰得」が特徴語として決定される。結果的に、ニュース記事「a社から携帯端末Xが発売」に関して要約語「誰得」が対応付けられる。
[要約語公開部16]
要約語公開部16は、当該メディアコンテンツに要約語を対応付けたページを、ユーザに明示する。例えばメディアコンテンツがニュース記事である場合、端末4のユーザは、そのニュース記事と共に、当該ニュース記事に応じた要約語を閲覧することができる。
図6は、ユーザによって閲覧される端末の画面表示図である。具体的に、ニュース記事「a社から携帯端末Xが発売」に対して要約語「誰得」が対応付けて、ユーザに明示されている。そのユーザは、当該ニュース記事に対して、多数のユーザが要約語「誰得」について共感していることを認識することができる。
要約語公開サーバ1は、オプション的に、配信指標抽出部17と、重み係数記憶部18と、主観指標値更新部19とを更に有するものであってもよい。
[配信指標抽出部17]
配信指標抽出部17は、メディアサーバ2から取得した当該メディアコンテンツにおける「配信指標要素」を抽出する。例えばRSS(Really Simple Syndication/Rich Site Summary)を用いて、最新のメディアコンテンツのURLを収集することができる。そして、配信指標抽出部17は、収集されたメディアコンテンツのタイトルや記事本文から、「配信指標要素」としては、例えば当該メディアコンテンツにおける<ジャンル情報A><配信元情報B><配信日時C>(これら要素の複数の組み合わせ)を抽出する。抽出された配信指標要素は、主観指標値更新部19へ出力される。
[重み係数記憶部18]
重み係数記憶部18は、メディアコンテンツにおける「配信指標要素」毎に、コメントの内容から抽出可能な各「主観指標要素」に対する「重み係数」を割り当てて記憶する。即ち、本発明の要約語公開サーバ1は、メディアコンテンツの種別(配信指標要素)に応じて、コメント集合から異なる観点(主観指標要素に対する重み係数)に基づく主観コメントを選択することができる。
[主観指標値更新部19]
主観指標値更新部19は、メディアコンテンツに対するコメント集合の各コメントについて、主観指標要素の値に重み係数を乗算する。更新された主観指標値は、要約語決定部15へ出力される。以下では、主観指標要素毎に、具体的な重み係数の乗算について説明する。
ケータイのニュース記事(ジャンル情報)が、b新聞社(配信元情報)から、2013年8月5日15:30(配信日時)に配信されたメディアコンテンツ「a社から携帯端末Xが発売」のWebページであるとする。
<顔文字要素>
顔文字要素登録部 <- 「(;゜∠゜)」「(σ´囗`。)」「(;´∀`)」・・・
コメント
「えっ(;゜∠゜)誰得?」
「欲しいかも(σ´囗`。)」
「(;´∀`)・・・うわぁ、誰得・・・」
主観度Pは、以下のように表される。
P=(αA+αB+αC)×s
s:顔文字の出現頻度
αA:ジャンル情報に対する顔文字の重み係数
αB:配信元情報に対する顔文字の重み係数
αC:配信日時に対する顔文字の重み係数
具体的な例として、例えばジャンル情報が「スポーツ」である場合、感情表現のコメントから優先的に抽出するため、「スポーツ」の顔文字の重みαAを高く設定する。一方で、ジャンル情報が「政治・経済」の場合、冷静なコメントから優先的に抽出するために、「政治・経済」の顔文字の重みαAを低く設定する。
また、例えば配信元情報が「週刊誌」会社である場合、感情表現のコメントから優先的に抽出するため、「週刊誌」の顔文字の重みαBを高く設定する。
逆に、例えば配信日時が「休日」である場合、穏やかなコメントから優先的に抽出するために、「休日」の顔文字の重みαCを低く設定する。
<文体要素>
文体要素は、文体表現として、形態素解析によって解析された文末語の「形容詞」「形容動詞」「動詞」の活用形に注目する。その活用形としては、例えば「命令形」「仮定形」「未然形」などがある。即ち、文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数である。
「うわぁ、誰得な仕様はやめろよ」 -> 命令形
「欲しいけど、もうちょっと安かったらなぁ」 -> 仮定形
「こんな誰得携帯は買わない。」 -> 未然形
主観度Pは、以下のように表される。
P=(βA1+βB1+βC1)×w1+(βA2+βB2+βC2)×w2+
(βA3+βB3+βC3)×w3+・・・・+
(βAn+βBn+βCn)×wn
βA1:ジャンル情報に対する命令形の重み係数
βA2:ジャンル情報に対する仮定形の重み係数
βA3:ジャンル情報に対する未然形の重み係数
βB1:配信元情報に対する命令形の重み係数
βB2:配信元情報に対する仮定形の重み係数
βB3:配信元情報に対する未然形の重み係数
βC1:配信日時に対する命令形の重み係数
βC2:配信日時に対する仮定形の重み係数
βC3:配信日時に対する未然形の重み係数
・・・
w1:命令形の有無(0/1)
w2:仮定形の有無(0/1)
・・・
具体的な例として、例えばジャンル情報が「ニュース」である場合、仮定的な文体を含むコメントを優先的に抽出するために、文体要素の重みβA2を高く設定する。
<盛り上がり要素>
盛り上がり要素は、盛り上がり表現として、例えば文字の連続性に注目する。例えば、同一の文字が3文字以上出現する場合、コメントの中でその部分が強調されていると考えられる。即ち、盛り上がり要素の値は、当該コメントに含まれる複数の形態素の中で、同一の形態素が連続した最大数であってもよい。例えば、盛り上がり要素の出現頻度eは、例えば以下のように表すことができる。
「この機能、誰得wwwwwwww」(8文字):e=8
「うおおおおお!欲しいいい!」(5文字) :e=5
「おいおいおい誰得だよ」(「おい」3回) :e=6
主観度Pは、以下のように表される。
P=(γA+γB+γC)×e
e:盛り上がり要素の出現頻度
γA:ジャンル情報に対する盛り上がり表現要素の重み係数
γB:配信元情報に対する盛り上がり表現要素の重み係数
γC:配信日時に対する盛り上がり表現要素の重み係数
具体的な例として、例えばジャンル情報が「スポーツ」である場合、興奮したコメントから優先的に抽出するため、「スポーツ」の盛り上がり表現の重みγAを高く設定する。一方で、ジャンル情報が「政治・経済」の場合、冷静なコメントを優先的に抽出する必要性は低く、「政治・経済」の盛り上がり表現の重みγAを低く設定する。
また、例えば配信元情報が「週刊誌」会社である場合、盛り上がったコメントから優先的に抽出するべく、「週刊誌」の盛り上がり表現の重みαγBを高く設定する。
逆に、例えば配信日時が「休日」である場合、穏やかなコメントから優先的に抽出するため、「休日」の盛り上がり表現の重みγCを低く設定する。
前述した<顔文字要素><文体要素><盛り上がり要素>を全て考慮すると、以下のように主観度Pを算出することができる。
P=(αA+αB+αC)×s+
(βA1+βB1+βC1)×w1+(βA2+βB2+βC2)×w2+
(βA3+βB3+βC3)×w3+・・・・+
(βAn+βBn+βCn)×wn+
(γA+γB+γC)×e
他の実施形態として、配信指標要素毎における各主観指標要素に対する重み係数は、予め固定的に設定されたものであってもよいし、ユーザによって明示的に設定されるものであってもよい。図3〜図6によれば、ユーザによって閲覧されるブラウザの上段に、「主観指標要素」(盛り上がり要素、顔文字要素、文体要素)のボタンも備えられている。ユーザが主観指標要素のボタンをクリックすることによって、重み係数記憶部18におけるその主観指標要素に基づく重み係数が高くなるように設定されるものであってもよい。
また、これら重み係数は、ユーザ毎に自動的に設定されるものであってもよい。例えば、ニューラルネットワークや、SVM(Support Vector Machine)、ナイーブベイズ、C4.5のような識別器を用いて、各指標(e、s、w)を素性とすることも好ましい。ユーザによって閲覧(又は評価)されたコメントを「正例」とし、閲覧されなかったコメントを「負例」として、識別器に学習させることによって重み係数を決定することもできる。また、ルールベースを用いて、閲覧したコメント中に各指標が含まれていれば、重みを自動的に変更するものであってもよい。
以上、詳細に説明したように、本発明の装置、サーバ、プログラム及び方法によれば、ユーザがメディアコンテンツを検索する際に、当該メディアコンテンツに関する多数のユーザの主観的なコメント集合から、多数のユーザによって共感された要約語を決定することができる。ユーザとしては、メディアコンテンツの一覧表示画面の中で、当該メディアコンテンツに関する主観コメントの中で共感された要約語を一見して認識することできる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 要約語公開サーバ
11 コメント集合検索部
12 主観指標値抽出部
13 顔文字要素登録部
14 主観コメント抽出部
15 要約語決定部
16 要約語公開部
17 配信指標抽出部
18 重み係数記憶部
19 主観指標値更新部
2 メディアサーバ
3 コメントサーバ
4 端末

Claims (10)

  1. メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であって、当該メディアコンテンツに対する要約語を決定する装置であって、
    前記コメントサーバから、当該メディアコンテンツに関するコメント集合を検索するコメント集合検索手段と、
    前記コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する主観指標値抽出手段と、
    前記主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する主観コメント抽出手段と、
    複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する要約語決定手段と
    を有し、
    前記主観指標要素は、当該コメントにおける文体要素を含み、
    前記文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であることを特徴とする装置。
  2. 前記要約語決定手段は、TF−IDF(Term Frequency - Inverse Document Frequency)を用いて1つ以上の特徴語を決定することを特徴とする請求項1に記載の装置。
  3. 顔文字を予め登録した顔文字要素登録手段を更に有し、
    前記主観指標要素は、当該コメントにおける顔文字要素を含み、
    前記顔文字要素の値は、当該コメントに含まれる各顔文字の出現数である
    ことを特徴とする請求項1又は2に記載の装置。
  4. 前記主観指標要素は、当該コメントにおける盛り上がり要素を含み、
    前記盛り上がり要素の値は、当該コメントに含まれる複数の形態素の中で、同一の形態素が連続した最大数である
    ことを特徴とする請求項1からのいずれか1項に記載の装置。
  5. 当該メディアコンテンツにおけるジャンル情報、配信元情報、配信日時、又は、これら要素の複数の組み合わせを配信指標要素として、
    前記メディアサーバから取得した当該メディアコンテンツにおける前記配信指標要素を抽出する配信指標抽出手段と、
    前記メディアコンテンツにおける配信指標要素毎に、前記コメントの内容から抽出可能な各主観指標要素に対する重み係数を割り当てて記憶する重み係数記憶手段と、
    前記メディアコンテンツに対する前記コメント集合の各コメントについて、前記主観指標要素の値に前記重み係数を乗算する主観指標値更新手段と
    を更に有することを特徴とする請求項からのいずれか1項に記載の装置。
  6. 前記重み係数記憶手段について、前記配信指標要素毎における各主観指標要素に対する重み係数は、ユーザによって明示的に設定される
    ことを特徴とする請求項に記載の装置。
  7. 前記コメントサーバは、SNS(Social Networking Service)サーバ、ブログ(Web-log)サーバ、掲示板サーバ又はレビューサイトサーバである
    ことを特徴とする請求項1からのいずれか1項に記載の装置。
  8. メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であって、当該メディアコンテンツに対する要約語を決定するサーバであって、
    前記コメントサーバから、当該メディアコンテンツに関するコメント集合を検索するコメント集合検索手段と、
    前記コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する主観指標値抽出手段と、
    前記主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する主観コメント抽出手段と、
    複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する要約語決定手段と、
    当該メディアコンテンツに前記要約語を対応付けてユーザに明示する要約語公開手段と
    を有し、
    前記主観指標要素は、当該コメントにおける文体要素を含み、
    前記文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であるすることを特徴とするサーバ。
  9. メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なサーバに搭載されたコンピュータを、当該メディアコンテンツに対する要約語を決定するように機能させるプログラムであって、
    前記コメントサーバから、当該メディアコンテンツに関するコメント集合を検索するコメント集合検索手段と、
    前記コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する主観指標値抽出手段と、
    前記主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する主観コメント抽出手段と、
    複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する要約語決定手段と
    してコンピュータを機能させ
    前記主観指標要素は、当該コメントにおける文体要素を含み、
    前記文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であることを特徴とするプログラム。
  10. メディアコンテンツを配信するメディアサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なサーバを用いて、当該メディアコンテンツに対する要約語を決定する方法であって、
    前記コメントサーバから、当該メディアコンテンツに関するコメント集合を検索する第1のステップと、
    前記コメント集合の各コメントについて、その内容から主観指標要素の値を抽出する第2のステップと、
    前記主観指標要素の値が所定閾値以上となるコメントのみを、主観コメントとして抽出する第3のステップと、
    複数の主観コメントの中から、当該メディアコンテンツを特徴付ける1つ以上の特徴語を、要約語として決定する第4のステップと
    有し、
    前記主観指標要素は、当該コメントにおける文体要素を含み、
    前記文体要素の値は、当該コメントに含まれる文末の形態素における各文体の出現数であるすることを特徴とする方法。
JP2013235367A 2013-11-13 2013-11-13 メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法 Expired - Fee Related JP6152333B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013235367A JP6152333B2 (ja) 2013-11-13 2013-11-13 メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013235367A JP6152333B2 (ja) 2013-11-13 2013-11-13 メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2015095181A JP2015095181A (ja) 2015-05-18
JP6152333B2 true JP6152333B2 (ja) 2017-06-21

Family

ID=53197520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013235367A Expired - Fee Related JP6152333B2 (ja) 2013-11-13 2013-11-13 メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6152333B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6999514B2 (ja) * 2018-07-04 2022-02-10 株式会社エクサ アイデア支援システム
CN111625740A (zh) * 2019-02-28 2020-09-04 阿里巴巴集团控股有限公司 图像显示方法、图像显示装置和电子设备
JP6941659B2 (ja) * 2019-11-15 2021-09-29 株式会社 ディー・エヌ・エー ライブ動画配信サービスを提供するためのシステム、方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4342575B2 (ja) * 2007-06-25 2009-10-14 株式会社東芝 キーワード提示のための装置、方法、及びプログラム
JP2012155695A (ja) * 2011-01-07 2012-08-16 Kddi Corp 動画コンテンツにおける注目シーンにキーワードタグを付与するプログラム、端末、サーバ及び方法
JP2012227760A (ja) * 2011-04-20 2012-11-15 Funai Electric Co Ltd 録画装置、再生装置およびサーバー装置

Also Published As

Publication number Publication date
JP2015095181A (ja) 2015-05-18

Similar Documents

Publication Publication Date Title
US8990097B2 (en) Discovering and ranking trending links about topics
US10817613B2 (en) Access and management of entity-augmented content
KR101997541B1 (ko) 온라인 소셜 네트워크에서 외부 컨텐츠의 순위화
US10540666B2 (en) Method and system for updating an intent space and estimating intent based on an intent space
US11042590B2 (en) Methods, systems and techniques for personalized search query suggestions
JP6224731B2 (ja) 個人的ユーザ経験を改善するためにソーシャル・メディアを豊富にする方法および装置
US9720904B2 (en) Generating training data for disambiguation
US20160328401A1 (en) Method and apparatus for recommending hashtags
US20110302152A1 (en) Presenting supplemental content in context
Zangerle et al. Using tag recommendations to homogenize folksonomies in microblogging environments
US20120330932A1 (en) Presenting supplemental content in context
US11899728B2 (en) Methods, systems and techniques for ranking personalized and generic search query suggestions
US11232522B2 (en) Methods, systems and techniques for blending online content from multiple disparate content sources including a personal content source or a semi-personal content source
WO2014164746A1 (en) Customizable, real time intelligence channel
JP6130270B2 (ja) メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法
US11836169B2 (en) Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
JP5725619B2 (ja) 多数のコメント文章に基づいて位置情報にキーワードをタグ付けする装置、プログラム及び方法
US20160148325A1 (en) Method and apparatus for providing a response to an input post on a social page of a brand
US8782078B2 (en) Systematic process for creating large numbers of relevant, contextual marginal comments based on existing discussions of quotations and links
KR101606758B1 (ko) 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템
JP6152333B2 (ja) メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法
JP2015064623A (ja) ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法
US9576077B2 (en) Generating and displaying media content search results on a computing device
CN110147488A (zh) 页面内容的处理方法、处理装置、计算设备及存储介质
US20150169526A1 (en) Heuristically determining key ebook terms for presentation of additional information related thereto

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170529

R150 Certificate of patent or registration of utility model

Ref document number: 6152333

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees