JP2012070036A - 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法 - Google Patents

同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法 Download PDF

Info

Publication number
JP2012070036A
JP2012070036A JP2010210587A JP2010210587A JP2012070036A JP 2012070036 A JP2012070036 A JP 2012070036A JP 2010210587 A JP2010210587 A JP 2010210587A JP 2010210587 A JP2010210587 A JP 2010210587A JP 2012070036 A JP2012070036 A JP 2012070036A
Authority
JP
Japan
Prior art keywords
viewpoint
attribute
similarity
vector
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010210587A
Other languages
English (en)
Other versions
JP5466119B2 (ja
Inventor
Kazufumi Ikeda
和史 池田
Hajime Hattori
元 服部
Kazunori Matsumoto
一則 松本
Toshihiro Ono
智弘 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2010210587A priority Critical patent/JP5466119B2/ja
Priority to US13/222,613 priority patent/US8930976B2/en
Publication of JP2012070036A publication Critical patent/JP2012070036A/ja
Application granted granted Critical
Publication of JP5466119B2 publication Critical patent/JP5466119B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4126The peripheral being portable, e.g. PDAs or mobile phones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】同一の共有コンテンツに興味を持つ他の視聴者の属性の観点を推定すると共に、その観点に基づいて視聴者属性を推定するプログラム等を提供する。
【解決手段】ツリー状の観点及び属性単語を含む観点リストを記憶した観点リスト記憶手段と、各属性単語に関連する多数の学習文章情報を記憶した学習文章情報記憶手段とを有する。また、共有コンテンツから複数のキーワードを抽出する。次に、共有コンテンツについて、キーワードを要素とし且つその出現頻度を値とする第1のベクトルを導出し、キーワード毎に、当該キーワードと一致する属性単語における学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトルを導出する。両ベクトルの類似度を算出し、類似度を対応付けた類似度付き観点リストを生成し、観点リストのレイヤ毎に、類似度の分散が最も大きい観点及び属性単語を導出する。
【選択図】図3

Description

本発明は、ユーザによって所持される端末が、不特定多数の第三者に対して配信される共有コンテンツと、不特定多数の第三者によって投稿されるコメント文章とを受信し且つ表示する技術に関する。
近年、インターネットを介して、不特定多数の第三者に対して、様々な「共有コンテンツ」が配信されている。共有コンテンツは、例えば、テレビ放送コンテンツや、Webページ、音楽、映像、電子書籍のような各種のメディアコンテンツであって、不特定多数の第三者からアクセス可能かコンテンツをいう。
代表的な共有コンテンツとしては、放送コンテンツがある。放送コンテンツには、放送番組としての映像音声情報だけでなく、視聴者のために様々な情報が含められている。特に、その映像音声情報に同期して表示される字幕文字情報は、視聴されている放送番組に対する視聴者の理解を補完するために有効である。通常、字幕文字情報は、その放送番組の内容を要約した短い文章となる。そのために、その字幕文字情報に含まれる単語は、その映像音声情報を適切に表すものが選択される。即ち、字幕文字情報の中に出現するキーワードの出現頻度によって、その放送コンテンツの内容を適切に把握することもできる。
一方で、インターネットを介して、ブログ(Web log)やミニブログ(mini Web log)(例えばtwitter(登録商標))のようなサイトに対して、不特定多数の第三者からのコメント文章が、活発に発信されている。このようなコメント文章の特徴は、1つの共通の話題に対して議論されている。このような共通の話題、即ち、不特定多数の第三者に対して配信される共有コンテンツとして、テレビの放送コンテンツがある。
ユーザは、例えば、放送コンテンツを視聴しながら、その放送内容について不特定多数のユーザ間で、ミニブログ等を介して議論することができる。特に、近年、テレビ放送を視聴しながら(例えばプロ野球を見ながら)、ミニブログを介して、それに対するコメント(例えば試合に対する応援や批判のメッセージ)を発信するという視聴スタイルが普及しつつある。これは、1つの共有コンテンツを、多数のユーザと共有して視聴しているという感覚が得られる。
このようなサービスに関連する従来技術として、テレビの放送コンテンツにおける字幕文字情報から特徴的なキーワードを自動的に抽出し、当該キーワードを含む文章が記述されたページをWebサイトから検索し、そのページをユーザに提示するという技術がある(例えば特許文献1参照)。
また、ブログサイトに記述されたコメント文章に基づいて、著者の属性を推定する技術もある(例えば非特許文献1参照)。この技術によれば、任意の観点について、汎用的にその属性を推定することができる。
特開2010−087658号公報 特開2008−048297号公報
大倉務、清水伸幸、中川裕志、「スケーラブルで汎用的なブログ著者属性推定手法(web情報抽出)」、情報処理学会研究報告、自然言語処理研究会報告、2007(94)、1-5、2007-09-25、[online]、[平成22年9月2日検索]、インターネット<URL:http://ci.nii.ac.jp/naid/110006402891>
特許文献1に記載された技術によれば、放送コンテンツに関連するWebページを検索することはできる。しかしながら、同一の放送コンテンツを視聴している第三者のコメント文章のみを検索することはできない。また、第三者のコメント文章を検索できたとしても、既存のミニブログ等によれば、そのコメント文章を投稿したユーザの属性までを知ることはできない。
特許文献2に記載された技術によれば、コメント文章からそのユーザがどのような属性(例えば年齢、性別、職業、趣味等)を持つかを推定することができる。しかしながら、放送コンテンツに沿った観点で、視聴者の属性を認識することまではできない。特に、年齢世代に関連しない内容の放送コンテンツについて、年齢の観点から分析したとしても、何ら役立つ情報は得られない。
そこで、本発明は、同一の共有コンテンツに興味を持つ他の視聴者の属性の観点を推定すると共に、その観点に基づいて視聴者属性を推定することができるプログラム、装置及び方法を提供することを特徴とする。
本発明は、不特定多数の第三者に対して配信される共有コンテンツについて、それを視聴している不特定多数の第三者の属性を検出するための観点を推定するようにコンピュータを機能させる最適観点推定プログラムであって、
予め規定された観点と、該観点からツリー状に構成された属性単語とからなる観点リストを記憶した観点リスト記憶手段と、
観点リストの属性単語毎に、当該属性単語に関連する多数の学習文章情報を記憶した学習文章情報記憶手段と、
共有コンテンツに含まれる複数のキーワードを抽出するキーワード抽出手段と、
共有コンテンツについて、キーワードを要素とし且つその出現頻度を値とする第1のベクトルwj=(wj1,wj2,wj3,・・・wjn)を導出する第1のベクトル導出手段と、
キーワード毎に、当該キーワードと一致する属性単語における学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトル(第1のベクトルの要素列と同一)wg=(wg1,wg2,wg3,・・・wgn)を導出する第2のベクトル導出手段と、
第1のベクトルと、キーワード毎の第2のベクトルとの類似度を算出する類似度算出手段と、
観点及び属性単語毎に類似度を対応付けた類似度付き観点リストを生成する類似度付き観点リスト生成手段と、
観点リストのレイヤ毎に、類似度の分散が最も大きい観点及び属性単語を導出する最適観点導出手段と
してコンピュータを機能させることを特徴とする。
本発明の最適観点推定プログラムにおける他の実施形態によれば、
類似度算出手段は、類似度を以下の式によって算出し、
cosθ=(wj・wg)/(|wj|・|wg|)
最適観点導出手段は、以下のレイヤ毎の分散を比較する
cosθ・L1, cosθ・L2, ・・・, cosθ・Lm (m:レイヤLの観点数)
ようにコンピュータを機能させることも好ましい。
本発明の最適観点推定プログラムにおける他の実施形態によれば、キーワード抽出手段は、共有コンテンツに含まれる文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を、キーワードとして抽出することも好ましい。
本発明の最適観点推定プログラムにおける他の実施形態によれば、
共有コンテンツは、テレビ放送コンテンツであって、映像音声情報と字幕文字情報とからなり、
キーワード抽出手段は、字幕文字情報からキーワードを抽出する
ようにコンピュータを機能させることも好ましい。
本発明によれば、コンピュータを搭載した装置について、請求項1から4のいずれか1項に記載の最適観点推定プログラムと共に、共有コンテンツについて不特定多数の第三者によって投稿された多数のコメント文章に基づいて、最適観点導出手段によって導出される観点を更に最適化するようにコンピュータを機能させる観点最適化プログラムであって、
コメント文章には、投稿者識別子が対応付けられており、
所定時間間隔毎に、共有コンテンツに関連するコメント文章を収集する関連コメント収集手段と、
収集されたコメント文章を、投稿者識別子毎に区分する投稿者別コメント収集手段と、
投稿者識別子毎に、コメント文章から属性単語を抽出する属性単語抽出手段と、
観点リストにおける属性単語毎に、同一の属性単語を有する投稿者識別子の数を導出する投稿者数導出手段と、
所定時間間隔毎に、属性単語における投稿者識別子の数を蓄積する投稿者数蓄積手段と
してコンピュータを機能させ、
最適観点導出手段は、類似度の分散が大きい属性単語であって、且つ、過去の複数の所定時間間隔における投稿者識別子の数の変化が大きい属性単語を、最適観点として導出するようにコンピュータを機能させることを特徴とする。
本発明によれば、コンピュータを搭載した装置について、請求項1から4のいずれか1項に記載の最適観点推定プログラムと共に、共有コンテンツについて不特定多数の第三者によって投稿された多数のコメント文章に基づいて、視聴者の属性を推定するようにコンピュータを機能させる視聴者属性推定プログラムであって、
コメント文章には、投稿者識別子が対応付けられており、
共有コンテンツに関連する、所定範囲のコメント文章を収集する関連コメント収集手段と、
収集されたコメント文章を、投稿者識別子毎に区分する投稿者別コメント収集手段と、
投稿者識別子毎に、コメント文章から属性単語を抽出する属性単語抽出手段と、
最適と推定された観点から下位レイヤにおける属性単語毎に、同一の属性単語を有する投稿者識別子の数を導出する視聴者属性数導出手段と、
属性単語毎のコメント文章の割合を、共有コンテンツに関する視聴者層として導出する視聴者属性割合導出手段と
を有することを特徴とする。
本発明の視聴者属性推定プログラムにおける他の実施形態によれば、視聴者属性数導出手段について、最適と推定された観点から1つだけ下位レイヤにおける属性単語について、コメント文章の数を導出するようにコンピュータを機能させることも好ましい。
本発明の視聴者属性推定プログラムにおける他の実施形態によれば、投稿者別コメント収集手段は、更に、ミニブログから、同一の投稿者識別子に基づいて過去の多数のコメント文章を辿って収集するようにコンピュータを機能させることも好ましい。
本発明の視聴者属性推定プログラムにおける他の実施形態によれば、
コメント文章は、ミニブログ(mini Web log)サイトに投稿されたものであり、
関連コメント収集手段及び投稿者別コメント収集手段は、ミニブログサイトから共有コンテンツに関連するコメント文章を受信する
ようにコンピュータを機能させることも好ましい。
本発明の視聴者属性推定プログラムにおける他の実施形態によれば、
学習文章情報記憶手段について、
学習文章情報は、ミニブログに記載されたコメント文章情報であり、
投稿者識別子に対応付けられたプロファイル情報を含むコメント文章情報を収集し、該プロファイル情報から属性単語を抽出し、該属性単語に対応付けてコメント文章情報を学習文章情報として記憶することも好ましい。
本発明によれば、不特定多数の第三者に対して配信される共有コンテンツについて、それを視聴している不特定多数の第三者の属性を検出するための観点を推定する最適観点推定装置であって、
予め規定された観点と、該観点からツリー状に構成された属性単語とからなる観点リストを記憶した観点リスト記憶手段と、
観点リストの属性単語毎に、当該属性単語に関連する多数の学習文章情報を記憶した学習文章情報記憶手段と、
共有コンテンツに含まれる複数のキーワードを抽出するキーワード抽出手段と、
共有コンテンツについて、キーワードを要素とし且つその出現頻度を値とする第1のベクトルwj=(wj1,wj2,wj3,・・・wjn)を導出する第1のベクトル導出手段と、
キーワード毎に、当該キーワードと一致する属性単語における学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトル(第1のベクトルの要素列と同一)wg=(wg1,wg2,wg3,・・・wgn)を導出する第2のベクトル導出手段と、
第1のベクトルと、キーワード毎の第2のベクトルとの類似度を算出する類似度算出手段と、
観点及び属性単語毎に類似度を対応付けた類似度付き観点リストを生成する類似度付き観点リスト生成手段と、
観点リストのレイヤ毎に、類似度の分散が最も大きい観点及び属性単語を導出する最適観点導出手段と
を有することを特徴とする。
本発明によれば、不特定多数の第三者に対して配信される共有コンテンツについて、それを視聴している不特定多数の第三者の属性を検出するための観点を推定する最適観点推定方法であって、
予め規定された観点と、該観点からツリー状に構成された属性単語とからなる観点リストを記憶した観点リスト記憶部と、
観点リストの属性単語毎に、当該属性単語に関連する多数の学習文章情報を記憶した学習文章情報記憶部と
を有し、
共有コンテンツに含まれる複数のキーワードを抽出する第1のステップと、
共有コンテンツについて、キーワードを要素とし且つその出現頻度を値とする第1のベクトルwj=(wj1,wj2,wj3,・・・wjn)を導出する第2のステップと、
キーワード毎に、当該キーワードと一致する属性単語における学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトル(第1のベクトルの要素列と同一)wg=(wg1,wg2,wg3,・・・wgn)を導出する第3のステップと、
第1のベクトルと、キーワード毎の第2のベクトルとの類似度を算出する第4のステップと、
観点及び属性単語毎に類似度を対応付けた類似度付き観点リストを生成する第5のステップと、
観点リストのレイヤ毎に、類似度の分散が最も大きい観点及び属性単語を導出する第6のステップと
を有することを特徴とする。
本発明のプログラム、装置及び方法によれば、同一の共有コンテンツに興味を持つ他の視聴者の属性の観点を推定すると共に、その観点に基づいて視聴者属性を推定することができる。
本発明におけるシステム構成図である。 本発明におけるシーケンス図である。 本発明におけるユーザ所持の端末の表示画面である。 本発明における視聴者属性推定サーバの学習文章情報記憶部及び観点リストの説明図である。 本発明における視聴者属性推定サーバの最適観点推定機能の構成図である。 本発明における視聴者属性推定サーバの視聴者属性推定機能の構成図である。 本発明における視聴者属性推定サーバの観点最適化機能の構成図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明におけるシステム構成図である。
図1によれば、宅内に設置されたセットトップボックス3は、一方で、アクセスネットワークを介して、インターネットに接続されている。セットトップボックス3は、放送局2から配信される放送コンテンツ(共有コンテンツ)を受信することができる。この共有コンテンツは、不特定多数の第三者に向けて配信されるものであって、エアを介してアンテナによって受信されるものであってもよいし、インターネットやケーブルテレビを介して受信されるものであってもよい。
尚、以下では、共有コンテンツは、不特定多数の第三者へ配信される共有コンテンツであるとして説明するが、勿論、Webサイトから配信される様々なメディアコンテンツであってもよい。例えば、放送コンテンツは、デジタル放送番組であって、地上波デジタル放送、ワンセグ放送、BS(Broadcast Satellite)放送等によって配信される。これら放送コンテンツは、基本的に、映像音声情報と共に字幕文字情報も含む。
セットトップボックス3は、他方で、宅内のLAN(ホームネットワーク)を介して、テレビ4及び携帯端末5に接続されている。携帯端末5は、例えばタブレット型パーソナルコンピュータ、スマートフォン等であってもよく、一般に無線LANを介して、セットトップボックス3と通信する。携帯端末5は、セットトップボックス3を介してインターネットに接続し、様々な外部サーバと通信することができる。また、テレビ4は、セットトップボックス3から放送コンテンツを受信し且つ再生する。ユーザは、テレビ4に再生される放送コンテンツを視聴すると共に、携帯端末5を操作して様々な情報を取得することができる。
図1によれば、インターネットには、ミニブログ(mini Web log)サーバ6が接続されている。ミニブログサーバ6は、例えばtwitter(登録商標)サーバであってもよく、不特定多数の第三者からコメント文章が投稿される。
ユーザは、携帯端末5を操作することによって、ミニブログサーバ6にアクセスし、不特定多数の第三者から投稿されたコメント文章を閲覧することができる。ユーザは、例えば、テレビ4の放送コンテンツを視聴しながら、それに関連して第三者から発信されたコメントを、携帯端末5を用いて閲覧することができる。
本発明によれば、インターネットには、更に、視聴者属性推定サーバ1が接続されている。視聴者属性推定サーバ1は、放送局2から放送コンテンツを受信すると共に、その放送コンテンツに関連するコメント文章をミニブログサーバ6から収集する。また、視聴者属性推定サーバ1は、放送コンテンツ及びコメント文章を分析するための「最適観点推定機能」及び「視聴者属性推定機能」を有する。
「最適観点推定機能」は、共有コンテンツに対して、その共有コンテンツに興味を持つ他の視聴者の属性を抽出するための最適観点を推定する。具体的には、共有コンテンツに含まれるキーワードと、予め記憶された学習文章情報との類似度に基づいて、その共有コンテンツに対して、どのような観点で、ユーザのコメント文章を分類するのが最適かを推定する。
「視聴者属性推定機能」は、ミニブログサーバ6から共有コンテンツに関連する他の視聴者のコメント文章を収集し、最適観点に基づく視聴者の属性を推定する。具体的には、最適観点推定機能によって推定された最適観点について、その共有コンテンツを視聴している視聴者層の構成割合を算出する。ユーザが所持する端末からの要求に応じて、その視聴者層の構成割合は送信される。
図2は、本発明におけるシーケンス図である。
図3は、本発明におけるユーザ所持の端末の表示画面である。
(S201)放送局2は、不特定多数の第三者へ向けて放送コンテンツを配信する。セットトップボックス3は、エア又はネットワークを介して受信した放送コンテンツを、ホームネットワーク内のテレビ4へ転送する。
(S202)テレビ4は、受信したその放送コンテンツを再生表示する。これによって、ユーザは、その放送コンテンツを視聴することができる。図3のS202を参照すると、阪神−巨人戦のプロ野球の試合が放映されている。
(S203)視聴者属性推定サーバ1は、受信した放送コンテンツについて、最適観点を推定する。
(S204)同じ放送コンテンツを視聴している他のユーザが、汎用端末7を用いて、ミニブログサーバ6へ、その放送コンテンツに関連するコメント文章を投稿している。ミニブログサーバ6は、受信したコメント文章を蓄積し、不特定多数の第三者へ公開する。
(S205)視聴者属性推定サーバ1は、ミニブログサーバ6から、その放送コンテンツに関連するコメント文章を、所定の範囲で収集する。
(S206)携帯端末5も、ユーザ操作に応じて、視聴者属性推定サーバ1から、その放送コンテンツに関連するコメント文章を受信する。受信したコメント文章は、携帯端末5のディスプレイに逐次表示される。図3のS206を参照すると、テレビ4に放映されているプロ野球の試合に対する、第三者のコメント文章が表示されている。
(S207)視聴者属性推定サーバ1は、収集したコメント文章について、最適観点に基づく視聴者属性を推定する。
(S208)携帯端末5は、ユーザ操作に応じて、視聴者属性推定サーバ1へ、視聴者属性の取得要求を送信する。
(S209)視聴者属性推定サーバ1は、その放送コンテンツに対する視聴者属性情報を、携帯端末5へ送信する。
(S210)携帯端末5は、受信した視聴者属性情報をディスプレイに表示する。図3のS209を参照すると、放映されているプロ野球を視聴している視聴者属性が表示されている。ここでは、視聴者属性として、趣味のスポーツが「野球」である人が多く、且つ、「阪神ファン」である人が多いことが理解できる。
図4は、本発明における視聴者属性推定サーバの学習文章情報記憶部及び観点リストの説明図である。
図4によれば、視聴者属性推定サーバ1は、インターネットに接続する通信インタフェース部101と、観点リスト記憶部102と、学習文章情報記憶部103とを有する。
観点リスト記憶部102は、予め規定された観点と、その観点からツリー状に構成された属性単語とからなる観点リストを記憶する。図4によれば、第1のレイヤとして観点「職業」「性別」「趣味」・・・が構成され、第2のレイヤとして観点「職業」−属性単語「主婦」「会社員」、観点「性別」−属性単語「男」「女」、観点「趣味」−属性「スポーツ」「本」・・・が構成されている。
学習文章情報記憶部103は、観点リストの属性単語毎に、当該属性単語に関連する多数の学習文章情報を記憶する。
図5は、本発明における視聴者属性推定サーバの最適観点推定機能の構成図である。
図5によれば、視聴者属性推定サーバ1の最適観点推定機能は、文章情報分離部110と、キーワード抽出部111と、第1のベクトル導出部112と、第2のベクトル導出部113と、類似度算出部114と、類似度付き観点リスト生成部115と、最適観点導出部116とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
文章情報分離部110は、共有コンテンツから文章のみを分離する。特に、共有コンテンツの種別によって、分離される文章情報も異なる。
[共有コンテンツ] [文章情報]
テレビ放送 番組表、及び、字幕文字
Webページ タグ、及び、本文
音楽 タグ、及び、歌詞
電子書籍 タグ、及び、文章
分離された文章情報は、キーワード抽出部111へ出力される。
尚、共有コンテンツが放送コンテンツである場合、文章情報は、例えばiEPG(internet Electronic Program Guide)のテキストであってもよい。また、番組ストリームについて、PSI/SI(Program Specific Information / Service Information)情報のEvent Information Tableに含まれるテキストであってもよい。
キーワード抽出部111は、文章情報から形態素解析によって複数のキーワードを抽出する。ここで、「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。
また、抽出されたキーワードについて、更に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって、共有コンテンツにおける文章中の特徴的な重要単語を抽出することも好ましい(例えば特許文献2参照)。TF−IDFとは、各単語に重みを付けて、クエリから文書をベクトル空間で表し、文書とクエリの類似度でランク付けをする技術である。ランク付けられた値が高いほど、重要キーワードと認識される。
第1のベクトル導出部112は、共有コンテンツについて、キーワードを要素とし且つその出現頻度を値とする第1のベクトルwj=(wj1,wj2,wj3,・・・wjn)を導出する。例えば以下のように割り当てられている。
第1のベクトル[野球、サッカー、巨人、阪神、テニス、・・・](単語)
第1のベクトル [ 15, 2, 8, 11, 0,・・・・・](出現頻度)
第2のベクトル導出部113は、キーワード毎に、当該キーワードと一致する属性単語における学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトル(第1のベクトルの要素列と同一)wg=(wg1,wg2,wg3,・・・wgn)を導出する。例えば以下のように割り当てられている。
キーワード「野球」
第2のベクトル[野球、サッカー、巨人、阪神、テニス、・・・](単語)
第2のベクトル [1215, 10, 320, 280, 4,・・・・・](出現頻度)
類似度算出部114は、第1のベクトルと、キーワード毎の第2のベクトルとの類似度を算出する。
「cos類似度」とは、第1のベクトルxと第2のベクトルyとのなす角θの余弦cosθをいう。これは、ベクトルの向きの近さを類似性の指標としたものである。ベクトルの向きが一致している場合に最大値の1となり、直交する場合に0となり、逆向きの場合に最小値の−1となる。
類似度: cosθ=(wj・wg)/(|wj|・|wg|)
wj・wg=ベクトルwj・wgの内積
=(wj1×wg1+wj2×wg2+・・・+wjn×wgn
|wj|=ベクトルwjの長さ(ノルム)
[原点からベクトルwjの終点までのユークリッド距離]
=sqrt(wj・wj)
|wg|=ベクトルwgの長さ(ノルム)
[原点からベクトルwgの終点までのユークリッド距離]
=sqrt(wg・wg)
類似度付き観点リスト生成部115は、属性単語毎に類似度を対応付けた類似度付き観点リストを生成する。図5によれば、例えばプロ野球「阪神−巨人戦」の字幕文字から抽出されたキーワードについて、類似度付き観点リストが表されている。
最適観点導出部116は、観点リストのレイヤL毎に、類似度の分散を比較し、当該分散が最も大きい観点及び属性単語を導出する。最適観点導出部116は、以下のようにレイヤ毎に、分散を比較する。
cosθ・L1,cosθ・L2,・・・,cosθ・Lm (m:レイヤLの観点数)
観点リストの同じレイヤ内で、類似度の差が大きい観点を見つける。例えば「野球」の類似度は、同じレイヤ(スポーツ種別)の他のカテゴリである「サッカー」や「テニス」の類似度と比較して、高い。また、「野球」の下位レイヤでは、「阪神」「巨人」の類似度は、「中日」の類似度と比較して、高い。このとき、上位レイヤの中で分散が大きい「野球」が、最適観点として出力される。
図6は、本発明における視聴者属性推定サーバの視聴者属性推定機能の構成図である。
図6によれば、視聴者属性推定サーバ1の視聴者属性機能には、関連コメント収集部120と、投稿者別コメント収集部121と、属性単語抽出部122と、視聴者属性数導出部123と、視聴者属性割合導出部124と、視聴者層表示制御部125とを有する。これら機能構成部も、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
コメント文章には、投稿者識別子が対応付けられている。例えばtwitterの場合、コメントに発信者ID(識別子)が付与されている。
関連コメント収集部120は、例えばミニブログサーバから、共有コンテンツに関連する、所定範囲のコメント文章を収集する。所定範囲とは、コメント文章が投稿された時間範囲であってもよいし、コメント文章の数であってもよい。収集されたコメント文章は、投稿者別コメント収集部121へ出力される。
投稿者別コメント収集部121は、収集されたコメント文章を、投稿者識別子毎に区分する。ここで、投稿者別コメント収集部121は、更に、例えばミニブログサーバから、同一の投稿者識別子に基づいて過去の多数のコメント文章を辿って収集することも好ましい。これによって、投稿者毎に、できる限り正確な属性を推定することができる。収集された投稿者識別子毎のコメント文章は、属性単語抽出部122へ出力される。
属性単語抽出部122は、投稿者識別子毎に、コメント文章から属性単語を抽出する。属性単語は、観点リストに基づくものであって、その投稿者の属性を表す。属性単語抽出部122は、前述した非特許文献1に記載された技術によって実現される。非特許文献1に記載された技術によれば、学習文章情報を教師データとして利用しながらも、任意の属性を導出することができる。
視聴者属性数導出部123は、最適と推定された観点から下位レイヤにおける属性単語毎に、同一の属性単語を有する投稿者識別子の数を導出する。ここで、最適と推定された観点から1つだけ下位レイヤにおける属性単語について、コメント文章の数を導出することも好ましい。例えば最適観点「野球」の場合、1つ下位のレイヤの「巨人」「阪神」について、投稿者識別子の数を導出する。
視聴者属性割合導出部124は、属性単語毎のコメント文章の割合を、共有コンテンツに関する視聴者層として導出する。例えば、図3のS210に表したように、属性単語毎の割合を導出する。その属性割合は、視聴者層表示制御部125へ出力される。
視聴者層表示制御部125は、ユーザ操作に基づく端末からの取得要求に応じて、視聴者属性情報を取得応答として返信する。これによって、ユーザ操作に基づく端末には、図3のS210のような視聴者属性情報が表示される。
尚、学習文章情報記憶部103は、学習文章情報として、ミニブログに記載されたコメント文章情報を記憶することも好ましい。例えばtwitterの場合、投稿者識別子には、プロファイル情報が対応付けられている。プロファイル情報には、一般に、「性別」「年代」「出身地」「在住地」等のキーワードが記載されている。プロファイル情報は、閲覧者にそのコメント文章の投稿者における概略的な属性を知ってもらうためのものである。
そこで、学習文章情報記憶部103は、コメント文章情報を収集し、そのコメント文章情報の投稿者のプロファイル情報から属性単語を抽出する。そして、その属性単語に対応付けてそのコメント文章情報を学習文章情報として記憶する。これによって、学習文章情報として、時代に応じたコメント文章を用いることができると共に、特別な学習文章情報を別途用意する必要もない。
図7は、本発明における視聴者属性推定サーバの観点最適化機能の構成図である。
図7によれば、視聴者属性推定サーバ1は、最適観点推定機能と連携して、観点最適化機能を有する。観点最適化機能は、共有コンテンツについて不特定多数の第三者によって投稿された多数のコメント文章に基づいて、最適観点導出部116によって導出される観点を更に最適化するように機能する。
図7によれば、観点最適化機能には、関連コメント収集部130と、投稿者別コメント収集部131と、属性単語抽出部132と、投稿者数導出部133と、投稿者数蓄積部134とを有する。これら機能構成部も、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
コメント文章には、投稿者識別子が対応付けられている。前述したtwitterの場合、発信者IDが対応付けられている。
関連コメント収集部130は、例えばミニブログサーバから、所定時間間隔毎に、共有コンテンツに関連するコメント文章を収集する(所定時間間隔で収集する以外、前述した投稿者別コメント収集部121と同様の機能である)。ここで、所定時間間隔とは、任意の単位時間であって、例えば5分間であってもよい。この所定時間間隔の単位で、属性単語に属する投稿者の数の変化を検出する。収集されたコメント文章は、投稿者別コメント収集部131へ出力される。
投稿者別コメント収集部131は、収集されたコメント文章を、投稿者識別子毎に区分する(前述した投稿者別コメント収集部121と同様の機能である)。区分されたコメント文章は、属性単語抽出部132へ出力される。
属性単語抽出部132は、投稿者識別子毎に、コメント文章から属性単語を抽出する(前述した属性単語抽出部132と同様の機能であって、非特許文献1に記載の技術を用いることもできる)。抽出された属性単語は、投稿者数導出部133へ出力される。
投稿者数導出部133は、観点リストにおける属性単語毎に、同一の属性単語を有する投稿者識別子の数を導出する。属性単語毎の投稿者識別子の数は、投稿者数蓄積部134へ出力される。
投稿者数蓄積部134は、所定時間間隔毎に、属性単語における投稿者識別子の数を蓄積する。そして、投稿者数蓄積部134は、最適観点導出部116から参照される。
最適観点導出部116は、類似度の分散が大きい観点及び属性単語であって、且つ、過去の複数の所定時間間隔における投稿者識別子の数の変化が大きい属性単語を、最適観点として導出する。
具体的には、共有コンテンツが、「阪神−巨人戦のプロ野球の試合」であるとする。この場合、最適観点導出部116によれば、観点として「野球」が導出され、その属性単語として「巨人」、「阪神」、「中日」で構成されるとする。このとき、例えば、「阪神のバッターがホームランを打った」時間帯では、「阪神」ファンの属性を有する投稿者からのコメント文章が多い。一方で、「阪神のバッターが空振り三振した」時間対では、「巨人」ファンの属性を有する投稿者からのコメント文章が多い。このように、時間帯によって、投稿者数が変化するような観点及び属性単語は、その共有コンテンツの観点としては最適であることを意味する。
一方で、観点として「年齢」が導出され、その属性単語として「10代」、「20代」、「30代」で構成されるとしても、時間帯によって投稿者からのコメント文章の量にばらつきがあることは少ない。このように、時間帯によって、投稿者数が変化しない観点及び属性単語は、その共有コンテンツの観点としてはそれほど最適であるとはいえない。
以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、同一の共有コンテンツに興味を持つ他の視聴者の属性の観点を推定すると共に、その観点に基づいて視聴者属性を推定することができる。
共有コンテンツを視聴しているユーザは、端末を用いて視聴者層を認識することができ、不特定多数の第三者からのコメント文章の閲覧を、客観的に認識することができる。また、評判解析技術と組み合わせることによって、視聴者層毎の意見を集約し、更なるサービスを提供することが想定される。例えば「主婦」層の意見と「サラリーマン」層の意見との相違を明らかにすることもできる。更に、テレビ放送については、視聴者層のアンケートを実施する必要もなく、コメント文章から視聴者層を推定することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 視聴者属性推定サーバ
101 通信インタフェース部
102 観点リスト記憶部
103 学習文章情報記憶部
110 文章情報分離部
111 キーワード抽出部
112 第1のベクトル導出部
113 第2のベクトル導出部
114 類似度算出部
115 類似度付き観点リスト生成部
116 最適観点導出部
120 関連コメント収集部
121 投稿者別コメント収集部
122 属性単語抽出部
123 視聴者属性数導出部
124 視聴者属性割合導出部
125 視聴者層表示制御部
130 関連コメント収集部
131 投稿者別コメント収集部
132 属性単語抽出部
133 投稿者数導出部
134 投稿者数蓄積部
2 放送局
3 セットトップボックス
4 テレビ
5 携帯端末
6 ミニブログサーバ
7 汎用端末

Claims (12)

  1. 不特定多数の第三者に対して配信される共有コンテンツについて、それを視聴している不特定多数の第三者の属性を検出するための観点を推定するようにコンピュータを機能させる最適観点推定プログラムであって、
    予め規定された観点と、該観点からツリー状に構成された属性単語とからなる観点リストを記憶した観点リスト記憶手段と、
    前記観点リストの前記属性単語毎に、当該属性単語に関連する多数の学習文章情報を記憶した学習文章情報記憶手段と、
    前記共有コンテンツに含まれる複数のキーワードを抽出するキーワード抽出手段と、
    前記共有コンテンツについて、前記キーワードを要素とし且つその出現頻度を値とする第1のベクトルwj=(wj1,wj2,wj3,・・・wjn)を導出する第1のベクトル導出手段と、
    前記キーワード毎に、当該キーワードと一致する前記属性単語における前記学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトル(第1のベクトルの要素列と同一)wg=(wg1,wg2,wg3,・・・wgn)を導出する第2のベクトル導出手段と、
    第1のベクトルと、前記キーワード毎の第2のベクトルとの類似度を算出する類似度算出手段と、
    前記観点及び前記属性単語毎に前記類似度を対応付けた類似度付き観点リストを生成する類似度付き観点リスト生成手段と、
    前記観点リストのレイヤ毎に、前記類似度の分散が最も大きい観点及び属性単語を導出する最適観点導出手段と
    してコンピュータを機能させることを特徴とする最適観点推定プログラム。
  2. 前記類似度算出手段は、前記類似度を以下の式によって算出し、
    cosθ=(wj・wg)/(|wj|・|wg|)
    前記最適観点導出手段は、以下のレイヤ毎の分散を比較する
    cosθ・L1, cosθ・L2, ・・・, cosθ・Lm (m:レイヤLの観点数)
    ようにコンピュータを機能させることを特徴とする請求項1に記載の最適観点推定プログラム。
  3. 前記キーワード抽出手段は、前記共有コンテンツに含まれる文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を、前記キーワードとして抽出するようにコンピュータを機能させることを特徴とする請求項1又は2に記載の最適観点推定プログラム。
  4. 前記共有コンテンツは、テレビ放送コンテンツであって、映像音声情報と字幕文字情報とからなり、
    前記キーワード抽出手段は、前記字幕文字情報から前記キーワードを抽出する
    ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載の最適観点推定プログラム。
  5. コンピュータを搭載した装置について、請求項1から4のいずれか1項に記載の前記最適観点推定プログラムと共に、前記共有コンテンツについて不特定多数の第三者によって投稿された多数のコメント文章に基づいて、前記最適観点導出手段によって導出される観点を更に最適化するようにコンピュータを機能させる観点最適化プログラムであって、
    前記コメント文章には、投稿者識別子が対応付けられており、
    所定時間間隔毎に、前記共有コンテンツに関連する前記コメント文章を収集する関連コメント収集手段と、
    収集された前記コメント文章を、前記投稿者識別子毎に区分する投稿者別コメント収集手段と、
    前記投稿者識別子毎に、前記コメント文章から属性単語を抽出する属性単語抽出手段と、
    前記観点リストにおける前記属性単語毎に、同一の属性単語を有する投稿者識別子の数を導出する投稿者数導出手段と、
    前記所定時間間隔毎に、前記属性単語における前記投稿者識別子の数を蓄積する投稿者数蓄積手段と
    してコンピュータを機能させ、
    前記最適観点導出手段は、前記類似度の分散が大きい属性単語であって、且つ、過去の複数の所定時間間隔における前記投稿者識別子の数の変化が大きい属性単語を、最適観点として導出するようにコンピュータを機能させることを特徴とする観点最適化プログラム。
  6. コンピュータを搭載した装置について、請求項1から5のいずれか1項に記載の前記最適観点推定プログラムと共に、前記共有コンテンツについて不特定多数の第三者によって投稿された多数のコメント文章に基づいて、視聴者の属性を推定するようにコンピュータを機能させる視聴者属性推定プログラムであって、
    前記コメント文章には、投稿者識別子が対応付けられており、
    前記共有コンテンツに関連する、所定範囲の前記コメント文章を収集する関連コメント収集手段と、
    収集された前記コメント文章を、前記投稿者識別子毎に区分する投稿者別コメント収集手段と、
    前記投稿者識別子毎に、前記コメント文章から属性単語を抽出する属性単語抽出手段と、
    最適と推定された前記観点から下位レイヤにおける前記属性単語毎に、同一の属性単語を有する前記投稿者識別子の数を導出する視聴者属性数導出手段と、
    前記属性単語毎の前記コメント文章の割合を、前記共有コンテンツに関する視聴者層として導出する視聴者属性割合導出手段と
    してコンピュータを機能させることを特徴とする視聴者属性推定プログラム。
  7. 前記視聴者属性数導出手段について、最適と推定された前記観点から1つだけ下位レイヤにおける属性単語について、前記コメント文章の数を導出するようにコンピュータを機能させることを特徴とする請求項6に記載の視聴者属性推定プログラム。
  8. 前記コメント文章は、ミニブログ(mini Web log)サイトに投稿されたものであり、
    前記関連コメント収集手段及び前記投稿者別コメント収集手段は、前記ミニブログサイトから前記共有コンテンツに関連するコメント文章を受信する
    ようにコンピュータを機能させることを特徴とする請求項6又は7に記載の視聴者属性推定プログラム。
  9. 前記投稿者別コメント収集手段は、更に、前記ミニブログから、同一の投稿者識別子に基づいて過去の多数のコメント文章を辿って収集するようにコンピュータを機能させることを特徴とする請求項8に記載の視聴者属性推定プログラム。
  10. 前記学習文章情報記憶手段について、
    前記学習文章情報は、前記ミニブログに記載されたコメント文章情報であり、
    前記投稿者識別子に対応付けられたプロファイル情報を含むコメント文章情報を収集し、該プロファイル情報から前記属性単語を抽出し、該属性単語に対応付けて前記コメント文章情報を学習文章情報として記憶する
    ことを特徴とする請求項9に記載の視聴者属性推定プログラム。
  11. 不特定多数の第三者に対して配信される共有コンテンツについて、それを視聴している不特定多数の第三者の属性を検出するための観点を推定する最適観点推定装置であって、
    予め規定された観点と、該観点からツリー状に構成された属性単語とからなる観点リストを記憶した観点リスト記憶手段と、
    前記観点リストの前記属性単語毎に、当該属性単語に関連する多数の学習文章情報を記憶した学習文章情報記憶手段と、
    前記共有コンテンツに含まれる複数のキーワードを抽出するキーワード抽出手段と、
    前記共有コンテンツについて、前記キーワードを要素とし且つその出現頻度を値とする第1のベクトルwj=(wj1,wj2,wj3,・・・wjn)を導出する第1のベクトル導出手段と、
    前記キーワード毎に、当該キーワードと一致する前記属性単語における前記学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトル(第1のベクトルの要素列と同一)wg=(wg1,wg2,wg3,・・・wgn)を導出する第2のベクトル導出手段と、
    第1のベクトルと、前記キーワード毎の第2のベクトルとの類似度を算出する類似度算出手段と、
    前記観点及び前記属性単語毎に前記類似度を対応付けた類似度付き観点リストを生成する類似度付き観点リスト生成手段と、
    前記観点リストのレイヤ毎に、前記類似度の分散が最も大きい観点及び属性単語を導出する最適観点導出手段と
    を有することを特徴とする最適観点推定装置。
  12. 不特定多数の第三者に対して配信される共有コンテンツについて、それを視聴している不特定多数の第三者の属性を検出するための観点を推定する最適観点推定方法であって、
    予め規定された観点と、該観点からツリー状に構成された属性単語とからなる観点リストを記憶した観点リスト記憶部と、
    前記観点リストの前記属性単語毎に、当該属性単語に関連する多数の学習文章情報を記憶した学習文章情報記憶部と
    を有し、
    前記共有コンテンツに含まれる複数のキーワードを抽出する第1のステップと、
    前記共有コンテンツについて、前記キーワードを要素とし且つその出現頻度を値とする第1のベクトルwj=(wj1,wj2,wj3,・・・wjn)を導出する第2のステップと、
    前記キーワード毎に、当該キーワードと一致する前記属性単語における前記学習文章情報について、当該学習文章情報に含まれる単語を要素とし且つその出現頻度を値とする第2のベクトル(第1のベクトルの要素列と同一)wg=(wg1,wg2,wg3,・・・wgn)を導出する第3のステップと、
    第1のベクトルと、前記キーワード毎の第2のベクトルとの類似度を算出する第4のステップと、
    前記観点及び前記属性単語毎に前記類似度を対応付けた類似度付き観点リストを生成する第5のステップと、
    前記観点リストのレイヤ毎に、前記類似度の分散が最も大きい観点及び属性単語を導出する第6のステップと
    を有することを特徴とする最適観点推定方法。
JP2010210587A 2010-09-21 2010-09-21 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法 Active JP5466119B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010210587A JP5466119B2 (ja) 2010-09-21 2010-09-21 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法
US13/222,613 US8930976B2 (en) 2010-09-21 2011-08-31 Context-based automatic selection of factor for use in estimating characteristics of viewers viewing same content

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010210587A JP5466119B2 (ja) 2010-09-21 2010-09-21 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP2012070036A true JP2012070036A (ja) 2012-04-05
JP5466119B2 JP5466119B2 (ja) 2014-04-09

Family

ID=45818928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010210587A Active JP5466119B2 (ja) 2010-09-21 2010-09-21 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法

Country Status (2)

Country Link
US (1) US8930976B2 (ja)
JP (1) JP5466119B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013246757A (ja) * 2012-05-29 2013-12-09 Kddi Corp グループ内のメンバオブジェクト全体における各クラス種別の比率を推定するクラス種別推定装置、プログラム及び方法
JP2015166916A (ja) * 2014-03-03 2015-09-24 富士通株式会社 群形成方法、データ収集方法、及びデータ収集装置
CN106326329A (zh) * 2015-07-01 2017-01-11 富士通株式会社 群形成方法和群形成设备
CN106708966A (zh) * 2016-11-29 2017-05-24 中国计量大学 基于相似度计算的垃圾评论检测方法
US11144723B2 (en) 2018-06-29 2021-10-12 Fujitsu Limited Method, device, and program for text classification

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8818978B2 (en) * 2008-08-15 2014-08-26 Ebay Inc. Sharing item images using a similarity score
JP5756052B2 (ja) * 2012-04-10 2015-07-29 日本電信電話株式会社 ユーザ属性推定装置及び方法及びプログラム
EP2915335A1 (en) * 2012-11-02 2015-09-09 Koninklijke Philips N.V. Communicating media related messages
JP6042789B2 (ja) * 2013-11-15 2016-12-14 日本電信電話株式会社 プロフィール語抽出装置、プロフィール語抽出方法およびプロフィール語抽出プログラム
US11375288B1 (en) * 2014-04-03 2022-06-28 Twitter, Inc. Method and apparatus for capturing and broadcasting media
EP3007082A1 (en) * 2014-10-07 2016-04-13 Thomson Licensing Method for computing a similarity measure for video segments
WO2016081749A1 (en) * 2014-11-19 2016-05-26 Google Inc. Methods, systems, and media for presenting related media content items
US9678822B2 (en) * 2015-01-02 2017-06-13 Tata Consultancy Services Limited Real-time categorization of log events
CN106446264B (zh) * 2016-10-18 2019-08-27 哈尔滨工业大学深圳研究生院 文本表示方法及系统
JP6794921B2 (ja) * 2017-05-01 2020-12-02 トヨタ自動車株式会社 興味判定装置、興味判定方法、及びプログラム
US11070861B2 (en) 2017-06-02 2021-07-20 Disney Enterprises, Inc. Techniques for generating promotional plans to increase viewership
CN108334533B (zh) * 2017-10-20 2021-12-24 腾讯科技(深圳)有限公司 关键词提取方法和装置、存储介质及电子装置
CN111031397B (zh) * 2019-12-05 2022-09-30 北京奇艺世纪科技有限公司 收集剪辑片段评论的方法、装置、设备及存储介质
CN113761179A (zh) * 2020-06-03 2021-12-07 富泰华工业(深圳)有限公司 评论管控方法、服务器及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010135925A (ja) * 2008-12-02 2010-06-17 Nippon Hoso Kyokai <Nhk> コメント可視化装置およびコメント可視化プログラム
JP2010206447A (ja) * 2009-03-03 2010-09-16 Panasonic Corp 視聴端末装置、サーバ装置および参加型番組共有システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008048297A (ja) 2006-08-21 2008-02-28 Sony Corp コンテンツ提供方法、コンテンツ提供方法のプログラム、コンテンツ提供方法のプログラムを記録した記録媒体及びコンテンツ提供装置
US20080215589A1 (en) * 2006-11-10 2008-09-04 Getingate, Inc. System, Method, and Computer-Readable Medium for Collection and Distribution of User-Supplied Comments Associated with Network and Local Content
JP2009213067A (ja) * 2008-03-06 2009-09-17 Toshiba Corp 番組推薦装置および番組推薦方法
JP5202217B2 (ja) 2008-09-30 2013-06-05 Kddi株式会社 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム
US20100191689A1 (en) * 2009-01-27 2010-07-29 Google Inc. Video content analysis for automatic demographics recognition of users and videos

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010135925A (ja) * 2008-12-02 2010-06-17 Nippon Hoso Kyokai <Nhk> コメント可視化装置およびコメント可視化プログラム
JP2010206447A (ja) * 2009-03-03 2010-09-16 Panasonic Corp 視聴端末装置、サーバ装置および参加型番組共有システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013246757A (ja) * 2012-05-29 2013-12-09 Kddi Corp グループ内のメンバオブジェクト全体における各クラス種別の比率を推定するクラス種別推定装置、プログラム及び方法
JP2015166916A (ja) * 2014-03-03 2015-09-24 富士通株式会社 群形成方法、データ収集方法、及びデータ収集装置
CN106326329A (zh) * 2015-07-01 2017-01-11 富士通株式会社 群形成方法和群形成设备
CN106326329B (zh) * 2015-07-01 2019-11-05 富士通株式会社 群形成方法和群形成设备
CN106708966A (zh) * 2016-11-29 2017-05-24 中国计量大学 基于相似度计算的垃圾评论检测方法
CN106708966B (zh) * 2016-11-29 2023-04-25 中国计量大学 基于相似度计算的垃圾评论检测方法
US11144723B2 (en) 2018-06-29 2021-10-12 Fujitsu Limited Method, device, and program for text classification

Also Published As

Publication number Publication date
JP5466119B2 (ja) 2014-04-09
US20120072937A1 (en) 2012-03-22
US8930976B2 (en) 2015-01-06

Similar Documents

Publication Publication Date Title
JP5466119B2 (ja) 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法
US11301505B2 (en) Topic and time based media affinity estimation
CN106921891B (zh) 一种视频特征信息的展示方法和装置
US9008489B2 (en) Keyword-tagging of scenes of interest within video content
CN109327714B (zh) 一种用于补充实况广播的方法及系统
US9471936B2 (en) Web identity to social media identity correlation
KR101644789B1 (ko) 방송 프로그램 연관 정보 제공 장치 및 방법
JP2012155695A (ja) 動画コンテンツにおける注目シーンにキーワードタグを付与するプログラム、端末、サーバ及び方法
US8478759B2 (en) Information presentation apparatus and mobile terminal
CN107087225B (zh) 将隐藏式字幕流用于设备元数据
WO2018197639A1 (en) Multimedia stream analysis and retrieval
JPWO2006019101A1 (ja) コンテンツ関連情報取得装置、コンテンツ関連情報取得方法、およびコンテンツ関連情報取得プログラム
KR101550886B1 (ko) 동영상 콘텐츠에 대한 부가 정보 생성 장치 및 방법
JP2013011967A (ja) 公開コンテンツのキーワードに基づく関連情報を配信する関連情報配信プログラム、サーバ及び方法
JP5335500B2 (ja) コンテンツ検索装置及びコンピュータプログラム
WO2017149447A1 (en) A system and method for providing real time media recommendations based on audio-visual analytics
JP6101554B2 (ja) 番組判定装置およびプログラム
JP5600498B2 (ja) 情報選択装置、サーバ装置、情報選択方法、及びプログラム
JP6381107B2 (ja) リンク情報生成装置およびリンク情報生成プログラム
JP6440459B2 (ja) 検索装置、検索方法及び検索プログラム
JP5637954B2 (ja) 推薦番組提示装置およびそのプログラム
JP5757886B2 (ja) テレビ放送録画予約方法、装置およびシステム
KR20100111907A (ko) 시청자 참여정보를 반영한 광고 제공장치 및 방법
Rajiur Rahman et al. Visual Summarization of Lecture Video Segments for Enhanced Navigation
JP2016045517A (ja) コンテンツ提示装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140123

R150 Certificate of patent or registration of utility model

Ref document number: 5466119

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150