JP5238339B2 - デジタル放送用の受信装置及びプログラム - Google Patents

デジタル放送用の受信装置及びプログラム Download PDF

Info

Publication number
JP5238339B2
JP5238339B2 JP2008114216A JP2008114216A JP5238339B2 JP 5238339 B2 JP5238339 B2 JP 5238339B2 JP 2008114216 A JP2008114216 A JP 2008114216A JP 2008114216 A JP2008114216 A JP 2008114216A JP 5238339 B2 JP5238339 B2 JP 5238339B2
Authority
JP
Japan
Prior art keywords
broadcast
data
topics
topic
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008114216A
Other languages
English (en)
Other versions
JP2009265909A (ja
Inventor
里枝 澤井
宏 妹尾
善明 鹿喰
欣司 松村
香子 有安
一博 大槻
誠 沼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2008114216A priority Critical patent/JP5238339B2/ja
Publication of JP2009265909A publication Critical patent/JP2009265909A/ja
Application granted granted Critical
Publication of JP5238339B2 publication Critical patent/JP5238339B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、デジタル放送における字幕又はデータ放送を解析する技術に関し、特にデジタル放送用の受信装置及びプログラムに関する。
従来のダイジェストシステムにおける受信装置は、或る特定の期間に放送されたコンテンツの中からダイジェストを作成してきた。例えば、単一の野球番組を対象とし、ホームランや得点などゲームの中で重要なシーンを抽出してダイジェストを作成する受信装置が知られている(例えば、非特許文献1参照)。
また、1日のニュースや1週間のニュースなど、特定の期間に放送された複数のニュース番組を対象とし、必要なトピックのみを抽出してダイジェストを作成する受信装置も知られている(例えば、特許文献1,非特許文献2参照)。
これらの受信装置は、特定の期間或いは番組を対象とし、対象コンテンツの一部分のみ選択的に提示することにより、なるべく情報を簡略化・省略化するためのものである。
一方、従来のトピック分類法では、トピック間の類似度を算出する場合、下記のようにトピック全体の比較を行うものが知られている(例えば、非特許文献3参照)。
特開2007−305054号 橋本隆子、白田由香里、真野博子、飯沢篤志、"TV受信端末におけるダイジェスト視聴受信装置"、情報処理学会誌、Vol.41,No.SIG3(TOD6),2000年、pp.71−84 鎌原淳三、香取啓志、下条真司、宮原秀夫、西尾章治郎、"自動再構成を行うマルチメディアニュース推薦受信装置"、情報処理学会誌、Vol.40,No.SIG3(TOD1),1999年、pp.124−133 角谷和俊、松本好市、高橋美乃梨、上原邦昭、"マルチチャンネル型ニュース配信受信装置のための時系列クラスタリング"、情報処理学会論文誌、Vol.43,No.SIG5(TOD14),2002年、pp.87−97
ニュース番組である事象の続報が伝えられるときに、その事象の初期の情報が過去に何度か報じられている場合、過去の情報が省略されてしまうことがよくある。例えば、「○○県の小学生が誘拐された事件について、〜〜」などである。前述した受信装置では、対象コンテンツの一部分のみ選択的に提示することにより、なるべく情報を簡略化・省略化することができるが、その一方で該対象コンテンツの詳細な情報を得ることができない。
また、前述したトピック分類法はトピック全体を分類するものであるが、一般にトピックの文章長が固定であり、中継やインタビューなどの特殊なコーナーがなければ、同じ事象を伝えるトピックは全体を比較してもほぼ類似しているものである。しかし、テレビ番組では、番組によってトピックの放送時間は全く異なり、インタビューや解説、別の事件と比較した特集などの様々なコーナーが用意されている。そのため、同じ事象に関するトピックであっても、全体を比較すると内容の異なるトピックが多いことから改善の余地がある。
本発明の目的は、デジタル放送を受信して蓄積したデータから事象の経過のあらましを提示する、デジタル放送用の受信装置及びプログラムを提供することにある。
ニュース番組では、新しい情報が入り次第、古い情報と差し替えられて常に最新の情報が報道されており、個々の事象に関して、時下の経過とともに発端から結果まで一連の情報が伝えられる。本発明は、ニュース番組のトピックを個々の事象に分類し、特に重要なトピックや内容に変化のあったトピックを抽出することで、事象の一連の流れが分かるような「あらましダイジェスト」を作成するための受信装置を提供する。
即ち、本発明による受信装置は、特定のトピックを編成するためにデジタル放送のデータを受信する受信装置であって、映像及び音声に字幕を付随させて放送されるデジタル放送のデータを受信して蓄積する手段と、蓄積したデジタル放送のデータから字幕情報を抽出する字幕情報抽出手段と、予め定めたtf−idf技法を用いて、蓄積したデジタル放送のデータに対する特定のトピックについての字幕情報を、コンテンツベクトルとして表す値に変換する字幕情報解析手段と、予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数のトピックをある事象に関連するトピックにグルーピングする分類手段と、前記グルーピングした特定の事象のトピックを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成する編成手段とを備えることを特徴とする。
また、本発明による受信装置において、予め定めた新規度計算を行って、事象毎のトピックにグルーピングした関連トピックの中から、内容が更新されたトピックを検出する新規度計算手段を更に備え、前記編成手段は、前記グルーピングした特定の事象のトピックのうち、内容が更新されたトピックを抽出し、放送時刻の順に編成することを特徴とする。
また、本発明による受信装置において、予め定めた緊急度計算に基づいて、事象毎のトピックにグルーピングした関連トピックの中から、緊急度の高いトピックを抽出する緊急度計算手段を更に備え、前記編成手段は、更に、緊急度の高いトピックを放送時刻の順に編成することを特徴とする。
また、本発明による受信装置において、データ放送コンテンツのテキストを編成するためにデータ放送を受信する受信装置であって、データ放送にデータ放送コンテンツのテキストを付随させて放送されるデータ放送のデータを受信して蓄積する手段と、蓄積したデータ放送のデータからデータ放送コンテンツのテキストを抽出するテキスト抽出手段と、予め定めたtf−idf技法を用いて、蓄積したデータ放送のデータに対する特定のテキストを、コンテンツベクトルとして表す値に変換するテキスト解析手段と、予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数のテキストをある事象に関連するテキストにグルーピングする分類手段と、前記グルーピングした特定の事象のテキストを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成する編成手段とを備えることを特徴とする。
更に、本発明は、特定のトピックを編成するためにデジタル放送のデータを受信する受信装置として構成するコンピュータに、映像及び音声に字幕を付随させて放送されるデジタル放送のデータを受信して蓄積するステップと、蓄積したデジタル放送のデータから字幕情報を抽出するステップと、予め定めたtf−idf技法を用いて、蓄積したデジタル放送のデータに対する特定のトピックについての字幕情報を、コンテンツベクトルとして表す値に変換するステップと、予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数種のトピックをある事象に関連するトピックにグルーピングするステップと、前記グルーピングした特定の事象のトピックを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成するステップとを実行させるためのプログラムとしても特徴づけられる。
更に、本発明は、データ放送コンテンツのテキストを編成するためにデータ放送を受信する受信装置として構成するコンピュータに、データ放送にデータ放送コンテンツのテキストを付随させて放送されるデータ放送のデータを受信して蓄積するステップと、蓄積したデータ放送のデータからデータ放送コンテンツのテキストを抽出するステップと、予め定めたtf−idf技法を用いて、蓄積したデータ放送のデータに対する特定のテキストを、コンテンツベクトルとして表す値に変換するステップと、予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数のテキストをある事象に関連するテキストにグルーピングするステップと、前記グルーピングした特定の事象のテキストを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成するステップとを実行させるためのプログラムとしても特徴づけられる。
本受信装置によれば、初期の情報を見逃してしまった視聴者や、これまでの経緯をおさらいしたい視聴者に対して、過去のニュース番組からその事象に関する情報を抽出し、事象の経過のあらましを提示することができるようになる。また、あらましとして抽出するトピックは、ただ単に関連トピックを羅列するだけではなく、事象に大きな展開のあったことを伝えるトピックや特に重要なトピックのみとするため、不必要に情報抽出して、視聴者の便宜を損なうこともない。
更に、特定の事象を対象として、幾つかのコンテンツだけでは伝えられない詳細な情報を提示することで視聴者は特定のニュースの情報を深く掘り下げた解説として利用することができるようになる。
また、Webページのニュースコンテンツでは、ニュース本文とともに過去の関連トピックへのリンクが併記される場合があるが、テレビの番組ではそのような機能を設けるには工夫が必要になる。本受信装置であれば、番組の視聴中でも番組の視聴中でも経緯の分からないニュースが出てきた場合にも、あらましの作成を要求することで過去の詳細を視聴できるようになる。
本受信装置では、事象毎にトピックを分類して放送番組を考慮した技法でトピック間類似度を計算するため、事象に対するトピックのグルーピングの精度を上げることができる。また、事象毎のトピックの分類により、比較するトピック長が短くなるため、トピック間類似度の計算コストを軽減することができる。
以下、本発明による一実施例の受信装置について説明する。
図1に、本実施例の受信装置のブロック図を示す。本実施例の受信装置は、アンテナ2と、制御部1と、記憶手段3と、トピック/映像音声蓄積手段4とを備える。制御部1は、放送信号受信手段11と、字幕情報抽出手段12と、字幕情報解析手段13と、グルーピング(分類手段)14と、新規度計算手段15と、緊急度計算手段16と、トピック抽出手段17と、トピック編成手段18とを有する。記憶手段3は、少なくとも字幕情報蓄積手段31と、映像音声蓄積手段32とを有する。
放送信号受信手段11は、アンテナ2を介して任意のニュース番組の映像・音声と、これに付随する字幕を受信して、字幕情報抽出手段12に送出する。
字幕情報抽出手段12は、受信したニュース番組の映像及び音声に付随する字幕をそれぞれ抽出し、それぞれを識別子などで関連付けて字幕情報蓄積手段31及び映像音声蓄積手段32に蓄積する。
字幕情報解析手段13は、後述するtf−idf技法を用いて、全ニュース番組に対する特定のニューストピックについての字幕情報を、コンテンツベクトルとして表す値に変換する。
グルーピング手段14は、予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数種ある事象を事象毎のトピックにグルーピングし、各グループを識別可能な識別番号を付して分類する。
新規度計算手段15は、予め定めた新規度計算を行って、事象毎のトピックにグルーピングした関連トピックの中から、内容が更新されたトピック(更新トピック)を検出する。
緊急度計算手段16は、各グループに属するトピックの放送時間又は放送頻度などの放送状況に基づいて定義された重要度の時間的推移から、重要度が高まるトピックを抽出する。
トピック抽出手段17は、グルーピングしたグループ番号に基づいて、或いは新規度及び/又は緊急度の値に基づいて、所望のトピックを抽出する。
トピック編成手段18は、トピック抽出手段17によって抽出したトピックを放送時刻の順に編成し、トピック/映像音声提示手段4に送出する。
トピック/映像音声提示手段4は、抽出して再編成したトピック情報、及び/又は抽出して再編成したトピックに対応する映像音声情報を、字幕情報蓄積手段31及び/又は映像音声蓄積手段32から取り出し、必要に応じて例えば図示しない表示装置又はスピーカ等を用いて再生し、或いは又、抽出して再編成したトピック情報を、所定の記憶手段に蓄積する。この抽出して再編成したトピック情報は、あらましダイジェストとして利用することができる。
以下、図2を参照して、より詳細に本実施例の動作を説明する。
ステップS1で、放送信号受信手段11により、アンテナ2を介して任意のニュース番組の映像・音声と、これに付随する字幕を受信して、字幕情報抽出手段12に送出する。続いて、字幕情報抽出手段12により、受信したニュース番組の映像及び音声に付随する字幕をそれぞれ抽出し、それぞれを識別子などで関連付けて字幕情報蓄積手段31及び映像音声蓄積手段32に蓄積する。
ステップS2で、字幕情報解析手段13により、以下に定義されるtf−idf技法を用いて、全ニュース番組に対する特定のニューストピックについての字幕情報を、コンテンツベクトルとして表す値に変換する。
ここで、tf−idf技法について説明する。
tf−idf技法は、tf(Term Frequency)値とidf(Inverse Document Frequency)値を次のように定義している。
tfij=ニューストピックd中の語kの出現頻度
idf=log(1/全ニューストピック中、語kを含むニューストピックの割合)+1
次に、或るニューストピックdでの語kの重みwijを次式のように定義する。
ij=tfij×idf
また、語の総数をnとし、ニューストピックdのコンテンツベクトルDを次式のように定義する。
=<wi1,・・・,win
ステップS3で、グルーピング手段14により、予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数種ある事象を事象毎のトピックにグルーピングし、各グループを識別可能な識別番号を付して分類する。
ここで、コンテンツベクトルを用いたグルーピングについて説明する。
或る事象(例えば、特定のニュース番組)に関して、内容が更新される前後のトピック(例えば、特定のニュース番組がその都度取り扱う字幕情報又はテキスト)例を図3に示す。図3の例は、12時のニューストピックdが試合前、19時のニューストピックdが試合後の様子を報じているトピックの字幕テキストである。d,dともに、冒頭dia,dja文で「センバツ高校野球の決勝」について話すことを伝えているが、テキストの後半dib,djb文は、それぞれその時点で最新のニュースを伝えているため内容が異なる。
このように、ニューストピックは、最初にどういった事象(例えば、センバツ高校野球の決勝のニュース番組)について伝えるかが定められ、次に具体的な最新情報(例えば、試合前の球場の様子や、試合結果、又は試合後の様子など)について伝えられるのが一般的である。そのため、同じ事象に関するニューストピックは、出だしが同じような文章で始まり、時間の経過によってニュース内容が更新されるとそれ以降の文章が大きく異なる。これを利用して、本受信装置では、冒頭dia,dja文のコンテンツベクトルを作成し、作成したコンテンツベクトルを部分ベクトルとして機能させ、複数種ある事象を事象毎のトピックにグルーピングする。
グルーピングに際し、トピックdの冒頭dia,dja文だけを用いて作成したコンテンツベクトルを次式のように定義する。mは、冒頭dia,dja文に出現するキーワードの総数である。
ia=<wi1,・・・,wim
或るトピックd,dの冒頭dia,dja文の類似度を次式のように定義する。
ij =D ・D /(|D |・|D |)
トピックd, dの放送時刻をt 、或る時間間隔をT、類似度の閾値をθとする。或るトピックdについて、t−T<t<tを満たす任意のトピックdに対して、Sij >θであるdをdの関連トピックとみなし、関連トピックの集合をその事象のグループとする。
グルーピングの例を図4に示す。図4(a)に示すように、データdの時間的推移をi,jを用いて表したとき、図4(b)に示すように、第1グループ(group1)は、知事選挙に関するグループ、第2グループ(group2)は、或る事件に関するグループとして分類される。これらは、関連トピックを線で結んでいき、線で繋がったトピック集合(例えば、第1グループではFD,FD,FD’,FD,FD’,FD’’,FD,FDであり、第2グループではSD,SD’,SD,SD,SD)をグループとしたものである。或る事象に関して新たな報道がなされると、新しい関連トピックがさらに右方向へと繋がっていき、時間の経過と共に逐次的にグループは大きくなっていくことになる。
ステップS4により、新規度計算手段15は、予め定めた新規度計算を行って、事象毎のトピックにグルーピングした関連トピックの中から、内容が更新されたトピック(更新トピック)を検出する。
ここで、新規度の計算について説明する。
図3の例のように、更新トピックは、既報の関連トピックと比べ、冒頭は同じような内容であるため類似度は高くなるが、後半は内容が異なるため類似度が低い。新規度の計算においても、ニュース番組のこのような特性を利用する。
まず、トピックの前半及び後半を含む全文の類似度を次式のように定義する。
ij’=D ・D/(|D|・|D|)
或るトピックdについて、t−T<t<tを満たすdの関連トピックdに対して、トピックdの新規度vi,noveltyを次式に従って定義する。
i,novelty=min(Sij /Sij
図4の第2グループ(group2)の例では、事件の詳細が明らかになったニュースや犯人逮捕のニュースなど、何か新たな展開を伝えるトピックで新規度が高くなる。
ステップS5で、緊急度計算手段16により、各グループに属するトピックの放送時間又は放送頻度などの放送状況に基づいて定義された重要度の時間的推移から、重要度が高まるトピックを抽出する。突然重要性が高まったニュースを緊急度の高いニュースと称し、事象に何らかの大きな動きがあったと場合を云う。ここで、重要度は、各グループに属するトピックの放送時間、又は放送頻度、又はその双方に基づいて定義付けることができる。
尚、トピックの重要度は、例えば、“ニュースダイジェスト作成受信装置における重要度算出技法の評価”、情報処理学会研究報告(データベース受信装置研究会2008−DBS−144・グループウェアとネットワークサービス研究会2008−GN−66・放送コンピューティング研究第2グループ008−DBS−144・グループウェアとネットワークサービス研究会2008−GN−66・放送コンピューティング研究第2グループ008−BCCgr−19合同研究会発表会),Vol.2008,No.7,2008年,pp.155−162に知られている方法で計算することもできる。
図5は、e〜eの各事象のグループに属したトピックの重要度の時間的推移の例である。eは、長期にわたって重要度が変化しないため、常に重要度が高い状態であるが、緊急度は特別高くないことを表している。eは、地震報道のように新しい事象に関するニュースが突然発生したものであり、発生したときの緊急度は極めて高いことを表す。eは、裁判の一審・二審のように一旦動きの収まった事象に新しい動きがあったことを表しており、再度重要度が高まっているということは、緊急度が高いことを表している。
このように、緊急度計算手段16は、予め定めた緊急度計算に基づいて、当該新規度計算によって検出した新規度の高いトピックのうち、緊急度の高いトピックを抽出する。重要度が急に高まったトピックほど緊急度は高いものとし、例えば次式のように定義することができる。
Figure 0005238339
上記の式は、最小二乗法を用いて重要度の推移を近似し、傾きをトピックdの緊急度vi,emergencyとして定義した例である。尚、dは、t−T<t<tを満たすものとし、その条件を満たすトピック数をnとする。
ステップS6で、トピック抽出手段17により、グルーピングしたグループ番号に基づいて、或いは新規度及び/又は緊急度の値に基づいて、所望のトピックを抽出する。トピックの抽出は、φをある閾値、x,yを予め定めた任意の整数としたとき、ベクトル値の大きさが次式を満たすトピックdを抽出する。
max(x・vi,novelty, y・vi,emergency)>φ
或いは、トピック抽出手段17は、次式を満たすトピックdを抽出して、放送時刻の順に再生してもよい。
x・vi,novelty + y・vi,emergency)>φ
ステップS7で、トピック編成手段18により、トピック抽出手段17によって抽出したトピックを放送時刻の順に編成し、トピック/映像音声提示手段4に送出する。例えば、トピック編成手段18は、この抽出して再編成したトピック情報を、あらましダイジェストとして作成することができる。
ステップS8で、トピック/映像音声提示手段4は、抽出して再編成したトピック情報、及び/又は抽出して再編成したトピックに対応する映像音声情報を、字幕情報蓄積手段31及び/又は映像音声蓄積手段32から取り出し、必要に応じて例えば図示しない表示装置又はスピーカ等を用いて再生し、或いは又、抽出して再編成したトピック情報を、所定の記憶手段に蓄積する。この抽出して再編成したトピック情報は、あらましダイジェストとして提示することができる。
このように、本実施例の受信装置によれば、或る事象に関して過去の経緯を伝える上で、代表的なトピックを抽出し、編成して提示する。特に、ニュース番組の特性を考慮したグルーピング技法をとることで、計算コストが極めて低くなる。また、グルーピング技法で作成するベクトルは、新規度の計算に流用でき、緊急度の計算に必要となる重要度をダイジェスト受信装置などで流用することもできる。従って、受信装置全体の算出プロセスを軽減することができる。
データ放送を受信且つ蓄積して、字幕の代わりにデータ放送コンテンツのテキストを解析し、事象のあらましをデータ放送コンテンツによって提示することも可能である。例えば、当該受信装置をデータ放送コンテンツのテキストを編成するためにデータ放送を受信する受信装置として構成する。即ち、上述した実施例と同様に、該受信装置は、データ放送にデータ放送コンテンツのテキストを付随させて放送されるデータ放送のデータを受信して蓄積する手段と、蓄積したデータ放送のデータからデータ放送コンテンツのテキストを抽出するテキスト抽出手段と、予め定めたtf−idf技法を用いて、蓄積したデータ放送のデータに対する特定のテキストを、コンテンツベクトルとして表す値に変換するテキスト解析手段と、予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数種ある事象を事象毎のテキストにグルーピングする分類手段と、グルーピングした特定の事象のテキストを抽出し、放送時刻の順に編成する編成手段とを備えるように構成する。
前述した実施例では、説明の便宜のために、各手段を個別の手段として説明したが、適宜組み合わせて、又は1つの制御手段で構成することができることは明らかである。また、例えば当該受信装置を複数の装置又はコンピュータで実現することができる。更に、受信装置として構成する1つ以上のコンピュータは、前述した各処理を実現させるために、中央演算処理装置(CPU)の制御によって実現でき、少なくとも1つ以上のメモリを備えることができる。更に、受信装置としてコンピュータを機能させるために、メモリの所定の領域にCPUで実行させるためのプログラムを格納することができる。また、前述した各処理を実現させるために必要とされるデータを、メモリに一時的、又は恒久的に格納することもできる。このようなメモリは、適宜コンピュータ内部のROM、RAM又はハードディスクなどで構成させることができ、或いは又、外部記憶装置(例えば、外付けハードディスク)を用いて構成させることもできる。従って、本発明は、前述した実施例に限定されるものではなく、その主旨を逸脱しない範囲において種々変更可能である。
本受信装置によれば、ニュース番組などの或る事象に対して過去の経緯を伝える際に、代表的なトピックを効率的に抽出し、提示することができ、特にダイジェスト受信装置などに有用である。
本発明による一実施例の受信装置のブロック図である。 本発明による一実施例の受信装置の動作を示すフローチャートである。 本発明による一実施例の受信装置が扱う、或る事象に関して内容が更新される前後のトピック例を示す図である。 本発明による一実施例の受信装置におけるグルーピングの例を示す図である。 本発明による一実施例の受信装置が扱う、各事象のグループに属したトピックの重要度の時間的推移の例である。
符号の説明
1 制御部
2 アンテナ
3 記憶手段
4 トピック/映像音声蓄積手段
11 放送信号受信手段
12 字幕情報抽出手段
13 字幕情報解析手段
14 グルーピング(分類手段)
15 新規度計算手段
16 緊急度計算手段
17 トピック抽出手段
18 トピック編成手段
31 字幕情報蓄積手段
32 映像音声蓄積手段

Claims (6)

  1. 特定のトピックを編成するためにデジタル放送のデータを受信する受信装置であって、
    映像及び音声に字幕を付随させて放送されるデジタル放送のデータを受信して蓄積する手段と、
    蓄積したデジタル放送のデータから字幕情報を抽出する字幕情報抽出手段と、
    予め定めたtf−idf技法を用いて、蓄積したデジタル放送のデータに対する特定のトピックについての字幕情報を、コンテンツベクトルとして表す値に変換する字幕情報解析手段と、
    予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数のトピックをある事象に関連するトピックにグルーピングする分類手段と、
    前記グルーピングした特定の事象のトピックを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成する編成手段とを備えることを特徴とする、受信装置。
  2. 予め定めた新規度計算を行って、事象毎のトピックにグルーピングした関連トピックの中から、内容が更新されたトピックを検出する新規度計算手段を更に備え、
    前記編成手段は、前記グルーピングした特定の事象のトピックのうち、内容が更新されたトピックを抽出し、放送時刻の順に編成することを特徴とする、請求項1に記載の受信装置。
  3. 予め定めた緊急度計算に基づいて、事象毎のトピックにグルーピングした関連トピックの中から、緊急度の高いトピックを抽出する緊急度計算手段を更に備え、
    前記編成手段は、更に、緊急度の高いトピックを放送時刻の順に編成することを特徴とする、請求項1又は2に記載の受信装置。
  4. データ放送コンテンツのテキストを編成するためにデータ放送を受信する受信装置であって、
    データ放送にデータ放送コンテンツのテキストを付随させて放送されるデータ放送のデータを受信して蓄積する手段と、
    蓄積したデータ放送のデータからデータ放送コンテンツのテキストを抽出するテキスト抽出手段と、
    予め定めたtf−idf技法を用いて、蓄積したデータ放送のデータに対する特定のテキストを、コンテンツベクトルとして表す値に変換するテキスト解析手段と、
    予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数のテキストをある事象に関連するテキストにグルーピングする分類手段と、
    前記グルーピングした特定の事象のテキストを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成する編成手段とを備えることを特徴とする、受信装置。
  5. 特定のトピックを編成するためにデジタル放送のデータを受信する受信装置として構成するコンピュータに、
    映像及び音声に字幕を付随させて放送されるデジタル放送のデータを受信して蓄積するステップと、
    蓄積したデジタル放送のデータから字幕情報を抽出するステップと、
    予め定めたtf−idf技法を用いて、蓄積したデジタル放送のデータに対する特定のトピックについての字幕情報を、コンテンツベクトルとして表す値に変換するステップと、
    予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数のトピックをある事象に関連するトピックにグルーピングするステップと、
    前記グルーピングした特定の事象のトピックを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成するステップとを実行させるためのプログラム。
  6. データ放送コンテンツのテキストを編成するためにデータ放送を受信する受信装置として構成するコンピュータに、
    データ放送にデータ放送コンテンツのテキストを付随させて放送されるデータ放送のデータを受信して蓄積するステップと、
    蓄積したデータ放送のデータからデータ放送コンテンツのテキストを抽出するステップと、
    予め定めたtf−idf技法を用いて、蓄積したデータ放送のデータに対する特定のテキストを、コンテンツベクトルとして表す値に変換するステップと、
    予め定めた類似度計算により算出したコンテンツベクトルの類似度に基づいて、複数のテキストをある事象に関連するテキストにグルーピングするステップと、
    前記グルーピングした特定の事象のテキストを抽出し、放送時刻の順に編成し、該事象の経過のあらましを作成するステップとを実行させるためのプログラム。
JP2008114216A 2008-04-24 2008-04-24 デジタル放送用の受信装置及びプログラム Expired - Fee Related JP5238339B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008114216A JP5238339B2 (ja) 2008-04-24 2008-04-24 デジタル放送用の受信装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008114216A JP5238339B2 (ja) 2008-04-24 2008-04-24 デジタル放送用の受信装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2009265909A JP2009265909A (ja) 2009-11-12
JP5238339B2 true JP5238339B2 (ja) 2013-07-17

Family

ID=41391696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008114216A Expired - Fee Related JP5238339B2 (ja) 2008-04-24 2008-04-24 デジタル放送用の受信装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5238339B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354186A (zh) * 2015-11-05 2016-02-24 同济大学 一种新闻事件抽取方法及系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016035607A (ja) * 2012-12-27 2016-03-17 パナソニック株式会社 ダイジェストを生成するための装置、方法、及びプログラム
JP6815184B2 (ja) * 2016-12-13 2021-01-20 株式会社東芝 情報処理装置、情報処理方法、および情報処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331529A (ja) * 2000-03-17 2001-11-30 Fujitsu Ltd ニュース情報提示装置および提示方法
JP2003167907A (ja) * 2001-12-03 2003-06-13 Dainippon Printing Co Ltd 情報提供方法およびシステム
JP4710000B2 (ja) * 2005-02-16 2011-06-29 独立行政法人情報通信研究機構 番組提示システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354186A (zh) * 2015-11-05 2016-02-24 同济大学 一种新闻事件抽取方法及系统

Also Published As

Publication number Publication date
JP2009265909A (ja) 2009-11-12

Similar Documents

Publication Publication Date Title
US11412300B2 (en) System and methods for analyzing content engagement in conjunction with social media
US10075742B2 (en) System for social media tag extraction
US9967514B2 (en) Recording system
US20110191801A1 (en) System and methods for switching between two or more media streams
EP2901631B1 (en) Enriching broadcast media related electronic messaging
US20220020058A1 (en) Synchronizing advertisements
US9602886B2 (en) Methods and systems for displaying contextually relevant information from a plurality of users in real-time regarding a media asset
US20030105794A1 (en) Systems for sensing similarity in monitored broadcast content streams and methods of operating the same
US20230129029A1 (en) Systems and methods for audio adaptation of content items to endpoint media devices
US11665404B2 (en) Systems and methods for aggregating related media content based on tagged content
JP5238339B2 (ja) デジタル放送用の受信装置及びプログラム
US20220295132A1 (en) Systems and Methods for Creating Custom Media Channels
CN112601105A (zh) 一种应用于直播评论的信息提取方法及装置
US20170325003A1 (en) A video signal caption system and method for advertising
JP4881061B2 (ja) コンテンツ受信装置およびコンテンツ受信プログラム
US20190318515A1 (en) Information Processing Apparatus, Information Processing Method, And Program
US20090064253A1 (en) Method and apparatus for recording broadcast data and providing contents
CN112015736A (zh) 基于Spark Mllib实现的多功能推荐方法及装置
CN102067156A (zh) 显示日志信息的装置和方法
CN114390306A (zh) 一种直播互动摘要生成方法和装置
TW201931868A (zh) 數位新聞影片篩選及通報方法
CN116112732A (zh) 一种人工智能交互方法及系统
Basso et al. A novel architecture for content and delivery validation for IPTV systems
JP2000287142A (ja) 放送受信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5238339

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees