JP5202217B2 - 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム - Google Patents

放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム Download PDF

Info

Publication number
JP5202217B2
JP5202217B2 JP2008252218A JP2008252218A JP5202217B2 JP 5202217 B2 JP5202217 B2 JP 5202217B2 JP 2008252218 A JP2008252218 A JP 2008252218A JP 2008252218 A JP2008252218 A JP 2008252218A JP 5202217 B2 JP5202217 B2 JP 5202217B2
Authority
JP
Japan
Prior art keywords
keyword
broadcast content
news
broadcast
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008252218A
Other languages
English (en)
Other versions
JP2010087658A (ja
Inventor
知彦 高橋
一則 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2008252218A priority Critical patent/JP5202217B2/ja
Publication of JP2010087658A publication Critical patent/JP2010087658A/ja
Application granted granted Critical
Publication of JP5202217B2 publication Critical patent/JP5202217B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、放送コンテンツを受信し且つ再生表示する放送受信装置及びプログラムに関する。
近年、デジタル放送の普及に伴って、放送コンテンツには、放送番組としての映像音声情報だけでなく、視聴者のために様々な情報が含められている。特に、その映像音声情報に同期して表示される字幕文字情報は、視聴されている放送番組に対する視聴者の理解を補完するために有効である。通常、字幕文字情報は、その放送番組の内容を要約した短い文章となる。そのために、その字幕文字情報に含まれる単語は、その映像音声情報を適切に表すものが選択される。
字幕文字情報の中に出現する単語の出現頻度によって、その放送コンテンツの内容を適切に把握することもできる。この場合、最初に、字幕文字情報から形態素解析技術を用いて単語を抽出し、次に、その単語の出現頻度(例えばTF−IDF(Term Frequency(単語出現頻度) - Inverse Document Frequency(逆文書出現頻度)))に応じて重要キーワードを抽出する(例えば特許文献1参照)。抽出された重要キーワードが、視聴者に表示されることによって、映像音声情報の内容の理解が補完される。
ここで、「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。英語は、文章を、原則として単語ごとに区切って書くために、形態素毎に分割することは容易であるが、日本語では単語ごとに区切らず続けて書くために、形態素毎の分割が難しい。そのために、辞書用いて、複数の区切り方を試すこととなる。また、TF−IDFとは、各単語に重みを付けて、クエリから文書をベクトル空間で表し、文書とクエリの類似度でランク付けをする技術である。ランク付けられた値が高いほど、重要キーワードと認識される。
特開2008−048297号公報
しかしながら、前述した従来技術によれば、放送コンテンツの字幕文字情報における単語の出現頻度のみに基づいて重要キーワードを抽出するために、単語の時事性(ニュース性)については、全く考慮されていない。放送コンテンツの中で代表的なテレビ番組では、バラエティやドラマなど、新しい略語、造語又は流行語などのキーワードが用いられることがある。特に、時事性のあるキーワードほど、視聴者にとっては、耳慣れない場合も多くなる。以前にはほとんど使われていない単語が、近年様々なところで使われるようになった場合、その単語は、時事性が高く、視聴者が特に興味を持って知ろうとすると想定される。従来技術によれば、このような時事性の高い単語を、放送コンテンツの字幕文字情報から抽出することはできない。
また、放送コンテンツの字幕文字情報における単語の出現頻度のみに基づいて重要キーワードを抽出する場合、その番組の視聴中にリアルタイムに重要キーワードを表示することは極めて難しい。番組の前半では、全ての単語の出現回数が0であるからである。そのために、不必要な単語も抽出することとなる。
更に、視聴者としては、興味を持って知ろうとする時事性の高いキーワードについては、そのキーワードの意味及び関連情報を即時に知りたいと考えることもある。
更に、膨大な字幕文字情報の中から抽出した多数の単語を、ユーザに対して提示しても、ユーザは煩わしさを感じるだけであり、結局、利便性が低下してしまう。そうすると、ユーザに提示すべきキーワードは、その時事性及び信頼性の両観点から厳選されることが望ましい。
そこで、本発明は、放送コンテンツの字幕文字情報の中から、時事性・信頼性の高いキーワードを表示することによって、その映像音声情報に対する視聴者の理解を補完させることができる放送受信装置及びプログラムを提供することを目的とする。
本発明によれば、映像音声情報及び字幕文字情報を含む放送コンテンツを受信する放送受信手段と、該映像音声情報を視聴者に対して再生表示する映像音声再生手段と、字幕文字情報を視聴者に対して表示する字幕文字表示手段とを有する放送受信装置において、
放送コンテンツを、ニュース放送コンテンツ又は視聴放送コンテンツに分離するメディア分離手段と、
ニュース放送コンテンツに含まれる字幕文字情報から、出現頻度が高い複数のキーワードを、時事キーワードとして抽出する時事キーワード抽出手段と、
時事キーワードを蓄積する時事キーワード蓄積手段と、
ニュース放送コンテンツ毎に、当該ニュース放送コンテンツにおける出現頻度上位n件の時事キーワードが、他のニュース放送コンテンツにおける出現頻度上位m件の時事キーワードに入っている場合に正に重み付け、それら値の総和を信頼性パラメータとして付与し、当該信頼性パラメータが所定以下低いニュース放送コンテンツを除外するべく、時事キーワード抽出手段へ通知するニュースソース信頼性判別手段と、
聴放送コンテンツに含まれる字幕文字情報から、複数の視聴単語を抽出する視聴単語抽出手段と、
視聴単語抽出手段によって抽出された複数の視聴単語が、時事キーワード蓄積手段に含まれる時事キーワードと一致するか否かを判別し、一致した視聴単語を重要キーワードとして出力する重要キーワード判別手段と
を有することを特徴とする。
本発明の放送受信装置における他の実施形態によれば、
重要キーワード判別手段において、単語iの重要度P(i)が、以下の式によって算出される
IDF(i):過去に保存された重要キーワード候補を用いた単語iのIDF
(IDF:Inverse Document Frequency)、
elapse:当該単語の過去出現日と今日との差分日、
period:抽出対象とする過去出現日と今日との差分日、
elapse:当該単語の過去出現日から経過日数に応じた重み付け、
freq(i):その日のニュース放送コンテンツにおける単語iの出現回数、
P(i)=IDF(i)×Σperiod elapse=0(Nelapse×freq(i))
ことも好ましい。
本発明の放送受信装置における他の実施形態によれば、
字幕文字表示手段は、重要キーワードを表示し、
映像音声再生手段における映像音声情報の再生に同期して、字幕文字表示手段における重要キーワードの表示が実行される
ことも好ましい。
本発明の放送受信装置における他の実施形態によれば、
WANインタフェース部を介して、広域通信ネットワークに接続する検索サーバへ重要キーワードをキーとして送信し、当該重要キーワードに基づく検索結果情報を取得するキーワード検索手段を更に有し、
字幕文字表示手段は、検索結果情報を更に表示する
ことも好ましい。
本発明の放送受信装置における他の実施形態によれば、
受信した放送コンテンツを蓄積するコンテンツ蓄積手段を更に有し、
コンテンツ蓄積手段は、重要キーワード検索手段から出力された重要キーワードをキーとして、蓄積された放送コンテンツの字幕文字情報を検索し、該当する放送コンテンツを映像音声再生手段へ出力することも好ましい。
本発明の放送受信装置における他の実施形態によれば、
映像音声再生手段及び字幕文字表示手段は、LANインタフェース部を介して、LANに接続する情報家電機器に対して、映像音声を再生し且つ重要キーワードを表示するように情報を送信することも好ましい。
本発明の放送受信装置における他の実施形態によれば、
放送受信装置は、視聴放送コンテンツを有線又は無線を介して受信するセットトップボックス、又は、チューナ内蔵型のレコーダ若しくはテレビであることも好ましい。
本発明によれば、放送受信装置に搭載されたコンピュータを機能させるプログラムであって、映像音声情報及び字幕文字情報を含む放送コンテンツを受信する放送受信手段と、該映像音声情報を視聴者に対して再生表示する映像音声再生手段と、字幕文字情報を視聴者に対して表示する字幕文字表示手段としてコンピュータを機能させるプログラムにおいて、
放送コンテンツを、ニュース放送コンテンツ又は視聴放送コンテンツに分離するメディア分離手段と、
ニュース放送コンテンツに含まれる字幕文字情報から、出現頻度が高い複数のキーワードを、時事キーワードとして抽出する時事キーワード抽出手段と、
時事キーワードを蓄積する時事キーワード蓄積手段と、
ニュース放送コンテンツ毎に、当該ニュース放送コンテンツにおける出現頻度上位n件の時事キーワードが、他のニュース放送コンテンツにおける出現頻度上位m件の時事キーワードに入っている場合に正に重み付け、それら値の総和を信頼性パラメータとして付与し、当該信頼性パラメータが所定以下低いニュース放送コンテンツを除外するべく、時事キーワード抽出手段へ通知するニュースソース信頼性判別手段と、
聴放送コンテンツに含まれる字幕文字情報から、複数の視聴単語を抽出する視聴単語抽出手段と、
視聴単語抽出手段によって抽出された複数の視聴単語が、時事キーワード蓄積手段に含まれる時事キーワードと一致するか否かを判別し、一致した視聴単語を重要キーワードとして出力する重要キーワード判別手段と
してコンピュータを機能させることを特徴とする。
本発明の放送受信装置及びプログラムによれば、放送コンテンツの字幕文字情報の中から、時事性・信頼性の高いキーワードを表示することによって、その映像音声情報に対する視聴者の理解を補完させることができる。
以下では、図面を用いて、本発明を実施するための最良の形態について詳細に説明する。
図1は、本発明におけるシステム構成図である。
放送受信装置1は、放送局2から放送コンテンツを受信するセットトップボックス又は情報家電機器(チューナ内蔵型のレコーダ若しくはテレビ)である。放送コンテンツは、アンテナによって受信されるものであってもよいし、WAN(広域通信ネットワーク、例えばインターネットやケーブルテレビ)を介して受信されるものであってもよい。また、放送受信装置1は、WANを介して、少なくとも外部の検索サーバ4にアクセスすることができる。尚、放送受信装置1がLAN(ホームネットワーク)に接続される情報家電機器である場合、そのLANを介してルータを経由してWANに接続するものであってもよい。
「放送コンテンツ」は、デジタル放送番組であって、例えば、地上波デジタル放送、ワンセグ放送、BS(Broadcast Satellite)放送等である。これらデジタル放送番組は、基本的に、映像音声情報と共に字幕文字情報も含む。
図2は、本発明における放送受信装置の機能構成図である。
図2によれば、放送受信装置1は、放送コンテンツ受信部101と、WANインタフェース部102と、LANインタフェース部103とを有する。放送コンテンツ受信部101は、放送コンテンツを受信する。放送コンテンツには、映像音声情報と字幕文字情報とが多重化して含まれる。WANインタフェース部102は、広域通信ネットワークに接続する。また、放送受信装置1が、セットトップボックスである場合、他の情報家電機器にホームネットワークを介して接続するために、LANインタフェース部103を更に有する。
また、図2によれば、放送受信装置1は、メディア分離部104と、視聴単語抽出部105と、時事キーワード抽出部106と、時事キーワード蓄積部107と、重要キーワード判別部108と、重要キーワード検索部109と、映像音声再生部110と、字幕文字表示部111と、ニュースソース信頼性判別部112と、コンテンツ蓄積部113とを有する。これら機能構成部は、放送受信装置1に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
メディア分離部104は、放送コンテンツ受信部101から放送コンテンツを受信し、その放送コンテンツについて映像音声情報と字幕文字情報とに多重分離する。本発明によれば、放送コンテンツを、「視聴放送コンテンツ」と「ニュース放送コンテンツ」とに区分している。視聴放送コンテンツは、現時点で利用者が視聴している番組を意味し、ニュース放送コンテンツは、情報の信頼性があり且つ時事性のあるニュース番組を意味する。尚、視聴放送コンテンツは、その内容に限定されず、ドラマ、映画、ドキュメンタリ、クイズ番組等、任意の番組に適用できる。
ニュース放送コンテンツは、利用者が視聴放送コンテンツを視聴していないときに、受信されるものであってもよい。また、放送コンテンツ受信部101が、複数の放送コンテンツを同時受信可能(デュアルチューナ搭載装置)である場合、利用者が視聴放送コンテンツを視聴している際であっても、バックグラウンドでニュース放送コンテンツを受信することができる。
放送コンテンツがニュース放送コンテンツか否かを判断するために、例えばiEPG(internet Electronic Program Guide)が用いられる。iEPGは、インターネットを用いたテレビ番組録画予約方式である。これによって、現に放送されている放送番組のスケジュールを把握することができ、ニュース放送コンテンツを選択することができる。例えば、ニュース放送コンテンツとしては、iEPGファイルに含まれるGenreに「News」が指定されている放送コンテンツ、又は、Titleにニュースが含まれている放送コンテンツが選択される。更に、ジャンルとしてはニュース番組に分類されても、時事キーワード抽出に適さない番組を取り除くため、後述のニュースソース信頼性判別部112が定期的に実行され、信頼性の高いニュースソースが選択される。
iEPGから得られる情報は、例えば以下のようなものである。
Figure 0005202217
また、番組ストリームに含まれるPSI/SI(Program Specific Information / Service Information)情報を用いることもできる。PSI/SI情報のEvent Information Tableに含まれる番組の名称、ジャンル等によって、ニュース放送コンテンツであるか否かを判断することもできる。
そして、メディア分離部104は、映像音声情報を、映像音声再生部110へ出力し、視聴者によって現に視聴されている視聴放送コンテンツの字幕文字情報を、視聴単語抽出部105へ出力し、ニュース放送コンテンツの字幕文字情報を、時事キーワード抽出部106へ出力する。
時事キーワード抽出部106は、ニュース放送コンテンツの字幕文字情報から、複数の時事キーワードを抽出する。時事キーワードを、ニュース放送コンテンツから抽出することによって、情報の信頼性があり且つ時事性のあるキーワードを得ることができる。時事キーワード抽出部106は、既存の「形態素解析」技術用いて単語毎に区分し、更に名詞・未知語のみを抽出する。
このようにして抽出された時事キーワードは、その出現頻度及び放送日が、時事キーワード蓄積部107へ出力される。しかしながら、例えばPSI/SI情報がニュース番組であっても、そのニュース放送コンテンツが必ずしも時事キーワードの抽出対象として相応しいと言えない場合がある。例えば、バラエティ色の強い単発の特集ニュース番組のような場合、その司会者の名前が、最も登場頻度が高い単語になって時事キーワードとして抽出されることがある。また、例えばドキュメンタリのような特集番組では、1つのトピックを掘り下げることが重視され、時事キーワードとしての重要性が正しく取得できないことがある。
このようなニュース放送コンテンツに基づいて時事キーワードを抽出し且つ蓄積した場合、重要キーワードの判別における精度が低下する。そこで、時事キーワードの抽出段階について、偏った時事キーワードが抽出されることを防ぐため、ニュースソース信頼性判別部112によって、時事キーワードの抽出には適さないニュース放送コンテンツを判別する。
ニュースソース信頼性判別部112は、例えば終日時点で、定期的に時事キーワードの抽出の対象とするニュースソースの信頼性を判別する。信頼性判別処理手順は、以下の通りである。
例えば、今日1日で、以下のニュース番組が、PSI/SI情報のEvent Information
Tableに含まれる番組の名称から、ニュース番組と判別され、時事キーワードが抽出されたとする。
Figure 0005202217
ここで、「面白お買い物ニュース」は、ニュース番組というよりは、バラエティ色の強い番組である。また、「ニュース特番、30年前のXXブームを特集する」は、特定のトピックを掘り下げた特集番組である。更に、その他は、時事性の高いニューストピックを紹介する一般的なニュース番組とする。
ニュースソース信頼性判別部112は、「普遍性・時事性のあるニュースのトピックは、その他のチャンネルでも放送されている可能性が高く、また、同一チャンネルのニュースでも、その日繰り返し報道(続報)される可能性が高い」というニューストピックの傾向に基づいて、そのニュース番組の信頼性パラメータを算出する。信頼性パラメータは、各ニュース番組から抽出された、出現頻度上位の単語の比較によって得られる。今、「モーニングニュース」の出現頻度上位n件の単語それぞれに対して、「Aチャンネル朝のニュース」の出現頻度上位m件に入っているか否かを判別する。この判別が真ならば(上位m件に入っていれば)、信頼性パラメータは正に重み付けられ、偽ならば(上位m件に入っていなければ)、負に重み付けられる。この処理を、モーニングニュース以後のニュース番組l件に対して実行し、信頼性パラメータの総和を算出する。
ここで、「面白お買い物ニュース」や、「ニュース特番『30年前の××ブームを特集する』」のような番組では、他と異なったキーワードが出現回数上位として判別される。そのため、その信頼性パラメータは、低く算出される。ニュースソース信頼性判別部112では、信頼性パラメータが低いと判別された番組を、時事キーワードの抽出対象から外すことで、時事キーワードの信頼性を高める。
前述の信頼性パラメータは、各番組プログラム単位で共通の値が用いられる。そのため、例えば毎週1回放送、毎日放送といった定期的に繰り返される番組プログラムについては、過去の番組の傾向から、その番組を時事キーワード抽出対象とするかを判別することができる。
時事キーワード蓄積部107は、時事キーワード抽出部106から出力された時事キーワードを蓄積すると共に、出現頻度及び放送日(最新出現日)も蓄積する。そして、時事キーワード蓄積部107は、その出現頻度及び最新出現日に応じた重要度の順に、当該キーワードを蓄積する。
視聴単語抽出部105は、視聴放送コンテンツに含まれる字幕文字情報から、複数の単語を抽出する。視聴単語抽出部105は、既存の「形態素解析」技術用いて単語毎に区分し、更に名詞・未知語のみを抽出する。抽出された視聴単語は、重要キーワード判別部108へ出力される。
重要キーワード判別部108は、視聴単語抽出部105から出力された複数の視聴単語が、時事キーワード蓄積部107に含まれる時事キーワードと一致するか否かを判別する。一致する単語は、重要キーワードとして、字幕文字表示部111へ出力される。
重要キーワード検索部109は、WANインタフェース部102を介して、広域通信ネットワークに接続する検索サーバ4へ重要キーワードをキーとして送信し、当該重要キーワードに基づく検索結果情報を取得する。重要キーワード検索部109は、利用者がその重要キーワードにおける検索結果情報を得たいときに、利用者の操作に応じて実行される。
映像音声再生部110は、メディア分離部104から出力された映像音声情報を、復号し且つ再生する。放送受信装置1が、映像情報を表示するディスプレイと、音声情報を再生するスピーカとを有する場合、映像音声再生部110は、このディスプレイ及びスピーカへ映像再生情報を出力する。また、映像音声再生部110は、LANインタフェース部103を介して、LANに接続する情報家電機器に対して、映像音声を再生するように情報を送信する。
字幕文字表示部111は、重要キーワード判別部108から出力された重要キーワードと、重要キーワード検索部109から出力された検索結果情報とを表示する。字幕文字表示部111は、映像音声再生部110における映像音声情報の再生に同期して、重要キーワード及び検索結果情報を表示する。また、字幕文字表示部111は、映像音声再生部110と同様に、LANインタフェース部103を介して、LANに接続する情報家電機器に対して、重要キーワード及び検索結果情報を表示するように情報を送信する。
コンテンツ蓄積部113は、受信した放送コンテンツを蓄積する。ここで、コンテンツ蓄積部113は、重要キーワード検索部109から出力された重要キーワードをキーとして、蓄積された放送コンテンツの字幕文字情報を検索し、該当する放送コンテンツを映像音声再生手段へ出力する。
図3は、ニュース放送コンテンツに対する時事キーワードの抽出及び蓄積を表す説明図である。
以下の字幕文字情報のニュース放送コンテンツが放送されたとする。
「日本ではいわゆるワーキングプアが大きな問題となっているほか、さらに格差が広がり続ければ子どもの教育環境にも差が生まれ、世代を越えて影響が出かねない。」
図3(a)によれば、最初に、ニュース放送コンテンツの字幕文字情報を、形態素解析によって区分する。次に、区分された単語毎に、最初に、助詞・接続詞の単語を取り除くと共に、名詞・未知語の単語を抽出する。重要キーワードの候補は、通常、全て名詞であると言える。また、形態素解析によって品詞を決定することができなかった、いわゆる「未知語」は、新しい用語である可能性が高いために、やはり重要キーワードの候補となる。
更に、抽出された名詞・未知語について、時事キーワード蓄積部107に蓄積された単語群とのIDFを導出し、一般用語を取り除く。そして、ニュース放送コンテンツの中でその単語が繰り返された回数に基づいてTFを導出する。TFが上位の単語は、時事キーワードとして決定する。
図3(b)は、時事キーワード蓄積部107に蓄積された、時事キーワードと出現回数と放送日時とを表す。また、重要キーワード判別部108は、単語iの重要度P(i)について、最近一定期間内に発生した当該時事キーワードの出現頻度を正に重み付け、それ以外の過去の期間に発生した当該時事キーワードの出現頻度を負に重み付ける。また、出現回数と最新放送日時とに基づく単語iの重要度P(i)を、例えば以下の式によって算出する。
IDF(i):過去に保存された重要キーワード候補を用いた単語iのIDF
(IDF:Inverse Document Frequency)、
elapse:当該単語の過去出現日と今日との差分日、
period:抽出対象とする過去出現日と今日との差分日、
elapse:当該単語の過去出現日から経過日数に応じた重み付け、
freq(i):その日のニュース放送コンテンツにおける単語iの出現回数、
P(i)=IDF(i)×Σperiod elapse=0(Nelapse×freq(i))
図3(c)は、重要度P(i)に基づくキーワードの順位付けを表す。例えば重要度Pが60以上のキーワードは、時事キーワードであると想定できる。放送受信装置1が、日々更新されるニュース放送コンテンツを受信する毎に、時事キーワード蓄積部107に蓄積された時事キーワードは更新される。
時事キーワードを時事キーワード蓄積部107に蓄積するときは、例えば利用者が視聴放送コンテンツを視聴していない時間に自動的に実行されることが好ましい。また、放送コンテンツ受信部101が、複数の放送コンテンツを同時受信可能(デュアルチューナ搭載装置)である場合、利用者が視聴放送コンテンツを視聴している際に、バックグラウンドで時事キーワードが蓄積されるものであってもよい。更に、既に録画済みのニュース放送コンテンツに対して、時事キーワードが抽出されるものであってもよい。
図4は、視聴放送コンテンツに対する重要キーワードの抽出を表す説明図である。
以下の字幕文字情報の視聴放送コンテンツ(ドラマの台詞)が放送されたとする。
「同じ年だね。タメ口で行きましょう。こちら田中さん。格差社会とワーキングプアについて、フィールドワークで収集した豊富なデータで論じるので有名です。」
図4(a)は、図3(a)のニュース放送コンテンツと同様に、最初に、視聴放送コンテンツの字幕文字情報が、形態素解析によって区分された単語を表す。
次に、図4(b)は、図4(a)の複数の視聴単語から、助詞・接続詞の単語が取り除かれると共に、抽出された名詞・未知語の単語を表す。
そして、図4(c)によれば、抽出された名詞・未知語について、時事キーワード蓄積部107に蓄積された時事キーワードと一致した名詞・未知語のみを表す。ここでは、図3(b)の時事キーワードと一致する「格差」「ワーキングプア」のみが、重要キーワードとして抽出される。
尚、図4(d)は、抽出された名詞・未知語について、従来技術によって導出した単語を表す。従来技術によれば、「年」「口」のように、名詞の中でも一般用語を予め蓄積した辞書登録部を有する。その辞書登録部と一致する単語は、一般用語として取り除く。図4(d)によれば、本発明の図4(c)と比較して、多くの単語が抽出されていると共に、最近どの語が話題になっているかといった時事性(ニュース性)のある重要キーワードのみを抽出できていない。
図5は、視聴中における重要キーワードの表示を表す画面表示図である。
図5(a)は、視聴者が字幕文字情報を表示させている場合である。字幕文字の中で、重要キーワードと判別された単語はマークアップされる。
図5(b)は、視聴者が重要キーワードの一覧を表示させている場合である。番組視聴中に表示される重要キーワードリストは、視聴放送コンテンツの字幕文字情報に応じてリアルタイムに変化していく。
図5(a)及び図5(b)によって表示された重要キーワードは、視聴者の操作によって選択可能となっている。視聴者の操作によってその重要キーワードが選択された場合、放送受信装置は、自動的にWANを介して検索サーバにアクセスする。そして、その重要キーワードをキーとする検索結果情報が得られる。
図6は、重要キーワードの検索結果情報が表示された画面表示図である。
図6によれば、図5で視聴者によって選択された重要キーワード「ワーキングプア」における検索結果情報が、表示されている。ここでは、「ワーキングプア」の解説情報が表示されている。これによって、利用者は、視聴中に、その番組の内容の理解を補完する情報を得ることができる。
更に、重要キーワードから、放送受信装置内に蓄積されたニュース番組をユーザに提示することもできる。例えば、利用者が、「ワーキングプア」という単語に関するニュース番組を見たい場合、重要キーワード検索部は、放送受信装置が備えるHDD等の蓄積媒体に保存されたニュース放送コンテンツのEPG情報・メタデータ・字幕文字情報等に対して、「ワーキングプア」という単語で検索を実行し、該当する単語と関連性の深いニュース番組を選択し、ユーザに提示する。これにより、ユーザは、HDDに蓄えられた膨大な番組データの中から、「ちょっと調べたいな」という用語に関連するニュース番組を、瞬時に選択し、見ることができる。
以上、詳細に説明したように、本発明の放送受信装置及びプログラムによれば、放送コンテンツの字幕文字情報の中から、時事性(ニュース性)の高いキーワードを表示することによって、その映像音声情報に対する視聴者の理解を補完させることができる。
特に、視聴放送コンテンツの字幕文字情報の単語と比較するキーワードを、ニュース放送コンテンツの字幕文字情報から得ることによって、また、そのニュース放送コンテンツの信頼性を他のニューストピックと比較することによって、以下の効果が得られる。
(1)信頼性の高い情報が得られる。
(2)定期的に更新され、時事性の高い情報が得られる。
(3)専用サーバを備える必要がなく、テレビ放送の配信のフレームワークの中で取得することができ、低コストにシステムを構築することができる。
前述した本発明の種々の実施形態において、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
本発明におけるシステム構成図である。 本発明における放送受信装置の機能構成図である。 ニュース放送コンテンツに対する時事キーワードの抽出及び蓄積を表す説明図である。 視聴放送コンテンツに対する重要キーワードの抽出を表す説明図である。 視聴中における重要キーワードの表示を表す画面表示図である。 重要キーワードの検索結果情報が表示された画面表示図である。
符号の説明
1 放送受信装置
101 放送コンテンツ受信部
102 WANインタフェース部
103 LANインタフェース部
104 メディア分離部
105 視聴単語抽出部
106 時事キーワード抽出部
107 時事キーワード蓄積部
108 重要キーワード判別部
109 重要キーワード検索部
110 映像音声再生部
111 字幕文字表示部
112 ニュースソース信頼性判別部
113 コンテンツ蓄積部
2 放送局
3 情報家電機器
4 検索サーバ
5 LAN
6 WAN、広域通信ネットワーク

Claims (8)

  1. 映像音声情報及び字幕文字情報を含む放送コンテンツを受信する放送受信手段と、該映像音声情報を視聴者に対して再生表示する映像音声再生手段と、前記字幕文字情報を前記視聴者に対して表示する字幕文字表示手段とを有する放送受信装置において、
    前記放送コンテンツを、ニュース放送コンテンツ又は視聴放送コンテンツに分離するメディア分離手段と、
    前記ニュース放送コンテンツに含まれる字幕文字情報から、出現頻度が高い複数のキーワードを、時事キーワードとして抽出する時事キーワード抽出手段と、
    前記時事キーワードを蓄積する時事キーワード蓄積手段と、
    前記ニュース放送コンテンツ毎に、当該ニュース放送コンテンツにおける出現頻度上位n件の時事キーワードが、他のニュース放送コンテンツにおける出現頻度上位m件の時事キーワードに入っている場合に正に重み付け、それら値の総和を信頼性パラメータとして付与し、当該信頼性パラメータが所定以下低いニュース放送コンテンツを除外するべく、前記時事キーワード抽出手段へ通知するニュースソース信頼性判別手段と、
    前記視聴放送コンテンツに含まれる字幕文字情報から、複数の視聴単語を抽出する視聴単語抽出手段と、
    前記視聴単語抽出手段によって抽出された複数の視聴単語が、前記時事キーワード蓄積手段に含まれる時事キーワードと一致するか否かを判別し、一致した視聴単語を重要キーワードとして出力する重要キーワード判別手段と
    を有することを特徴とする放送受信装置。
  2. 前記重要キーワード判別手段において、単語iの重要度P(i)が、以下の式によって算出される
    IDF(i):過去に保存された重要キーワード候補を用いた単語iのIDF
    (IDF:Inverse Document Frequency)、
    elapse:当該単語の過去出現日と今日との差分日、
    period:抽出対象とする過去出現日と今日との差分日、
    elapse:当該単語の過去出現日から経過日数に応じた重み付け、
    freq(i):その日のニュース放送コンテンツにおける単語iの出現回数、
    P(i)=IDF(i)×Σperiod elapse=0(Nelapse×freq(i))
    ことを特徴とする請求項に記載の放送受信装置。
  3. 前記字幕文字表示手段は、前記重要キーワードを表示し、
    前記映像音声再生手段における前記映像音声情報の再生に同期して、前記字幕文字表示手段における前記重要キーワードの表示が実行される
    ことを特徴とする請求項1又は2に記載の放送受信装置。
  4. WANインタフェース部を介して、広域通信ネットワークに接続する検索サーバへ前記重要キーワードをキーとして送信し、当該重要キーワードに基づく検索結果情報を取得するキーワード検索手段を更に有し、
    前記字幕文字表示手段は、前記検索結果情報を更に表示する
    ことを特徴とする請求項1からのいずれか1項に記載の放送受信装置。
  5. 受信した放送コンテンツを蓄積するコンテンツ蓄積手段を更に有し、
    前記コンテンツ蓄積手段は、前記重要キーワード検索手段から出力された前記重要キーワードをキーとして、蓄積された放送コンテンツの字幕文字情報を検索し、該当する放送コンテンツを映像音声再生手段へ出力することを特徴とする請求項1からのいずれか1項に記載の放送受信装置。
  6. 前記映像音声再生手段及び前記字幕文字表示手段は、LANインタフェース部を介して、LANに接続する情報家電機器に対して、前記映像音声を再生し且つ前記重要キーワードを表示するように情報を送信することを特徴とする請求項1からのいずれか1項に記載の放送受信装置。
  7. 前記放送受信装置は、前記視聴放送コンテンツを有線又は無線を介して受信するセットトップボックス、又は、チューナ内蔵型のレコーダ若しくはテレビであることを特徴とする請求項1からのいずれか1項に記載の放送受信装置。
  8. 放送受信装置に搭載されたコンピュータを機能させるプログラムであって、映像音声情報及び字幕文字情報を含む放送コンテンツを受信する放送受信手段と、該映像音声情報を視聴者に対して再生表示する映像音声再生手段と、前記字幕文字情報を前記視聴者に対して表示する字幕文字表示手段としてコンピュータを機能させるプログラムにおいて、
    前記放送コンテンツを、ニュース放送コンテンツ又は視聴放送コンテンツに分離するメディア分離手段と、
    前記ニュース放送コンテンツに含まれる字幕文字情報から、出現頻度が高い複数のキーワードを、時事キーワードとして抽出する時事キーワード抽出手段と、
    前記時事キーワードを蓄積する時事キーワード蓄積手段と、
    前記ニュース放送コンテンツ毎に、当該ニュース放送コンテンツにおける出現頻度上位n件の時事キーワードが、他のニュース放送コンテンツにおける出現頻度上位m件の時事キーワードに入っている場合に正に重み付け、それら値の総和を信頼性パラメータとして付与し、当該信頼性パラメータが所定以下低いニュース放送コンテンツを除外するべく、前記時事キーワード抽出手段へ通知するニュースソース信頼性判別手段と、
    前記視聴放送コンテンツに含まれる字幕文字情報から、複数の視聴単語を抽出する視聴単語抽出手段と、
    前記視聴単語抽出手段によって抽出された複数の視聴単語が、前記時事キーワード蓄積手段に含まれる時事キーワードと一致するか否かを判別し、一致した視聴単語を重要キーワードとして出力する重要キーワード判別手段と
    してコンピュータを機能させることを特徴とする放送受信装置用のプログラム。
JP2008252218A 2008-09-30 2008-09-30 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム Expired - Fee Related JP5202217B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008252218A JP5202217B2 (ja) 2008-09-30 2008-09-30 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008252218A JP5202217B2 (ja) 2008-09-30 2008-09-30 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010087658A JP2010087658A (ja) 2010-04-15
JP5202217B2 true JP5202217B2 (ja) 2013-06-05

Family

ID=42251200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008252218A Expired - Fee Related JP5202217B2 (ja) 2008-09-30 2008-09-30 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5202217B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8715559B2 (en) 2005-09-15 2014-05-06 Sumitomo Electric Fine Polymer, Inc. Non-porous sinter molded article of tetrafluoroethylene resin, expanded tetrafluoroethylene resin molded article, producing methods therefor, composite member, filter, impact deformation absorber and sealing material

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5466119B2 (ja) 2010-09-21 2014-04-09 Kddi株式会社 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法
JP2014048946A (ja) * 2012-08-31 2014-03-17 Toshiba Corp 電子機器及びその制御方法
JP6433045B2 (ja) * 2014-05-08 2018-12-05 日本放送協会 キーワード抽出装置およびプログラム
JP6348778B2 (ja) * 2014-06-13 2018-06-27 日本放送協会 情報出力装置及び情報出力プログラム
JP6157444B2 (ja) * 2014-12-08 2017-07-05 関西テレビ放送株式会社 字幕送出装置及びその制御プログラム、並びに字幕配信システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4650927B2 (ja) * 2004-08-13 2011-03-16 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2006129122A (ja) * 2004-10-29 2006-05-18 Sharp Corp 放送受信装置、放送受信方法、放送受信プログラム及びプログラム記録媒体
JP2007148976A (ja) * 2005-11-30 2007-06-14 Toshiba Corp 関連情報検索装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8715559B2 (en) 2005-09-15 2014-05-06 Sumitomo Electric Fine Polymer, Inc. Non-porous sinter molded article of tetrafluoroethylene resin, expanded tetrafluoroethylene resin molded article, producing methods therefor, composite member, filter, impact deformation absorber and sealing material

Also Published As

Publication number Publication date
JP2010087658A (ja) 2010-04-15

Similar Documents

Publication Publication Date Title
US9942599B2 (en) Methods and apparatus to synchronize second screen content with audio/video programming using closed captioning data
CN108370447B (zh) 内容处理装置及其内容处理方法、服务器
US10567834B2 (en) Using an audio stream to identify metadata associated with a currently playing television program
EP2417767B1 (en) Apparatus and method for providing information related to broadcasting programs
JP6335145B2 (ja) メディアメタデータを相関させる方法および装置
KR100889986B1 (ko) 양방향 방송 단말기를 위한 추천 키워드 제공 시스템 및방법
JP5202217B2 (ja) 放送コンテンツから時事性のあるキーワードを抽出する放送受信装置及びプログラム
KR20130083829A (ko) 디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천
KR20070096396A (ko) Epg정보 제공 방법 및 시스템
KR100988255B1 (ko) 정보 처리 장치 및 방법, 및 프로그램이 기록된 컴퓨터로 판독가능한 매체
JP2012249059A (ja) 画像処理装置及び録画装置
JP2008227909A (ja) 映像検索装置
JP2009033234A (ja) 番組情報処理装置及び番組情報処理方法
KR20100075719A (ko) 방송 수신장치 및 그 키워드 검색 방법
JP5209129B1 (ja) 情報処理装置、放送受信装置及び情報処理方法
JP2009077166A (ja) 情報処理装置および情報表示方法
JP5213572B2 (ja) 手話映像生成システム、サーバ、端末装置、情報処理方法、及びプログラム
JP3569441B2 (ja) 類似番組検索装置、類似番組検索方法および類似番組検索プログラムを記録した媒体
US10796089B2 (en) Enhanced timed text in video streaming
JP5156508B2 (ja) デジタル放送受信装置
JP5703321B2 (ja) 情報処理装置及び情報処理方法
JP2007174246A (ja) 映像情報処理方法、映像情報処理プログラム及び映像情報処理装置
JP5575195B2 (ja) 情報処理装置および情報表示方法
KR20080096341A (ko) 대화형 디엠비 방송 제공시스템 및 이의 제공방법
Laverty et al. Extraction of Teletext Subtitles from Broadcast Television for Archival and Analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120918

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130212

R150 Certificate of patent or registration of utility model

Ref document number: 5202217

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees