JP2004328478A - 要約生成装置及びそのプログラム - Google Patents

要約生成装置及びそのプログラム Download PDF

Info

Publication number
JP2004328478A
JP2004328478A JP2003121991A JP2003121991A JP2004328478A JP 2004328478 A JP2004328478 A JP 2004328478A JP 2003121991 A JP2003121991 A JP 2003121991A JP 2003121991 A JP2003121991 A JP 2003121991A JP 2004328478 A JP2004328478 A JP 2004328478A
Authority
JP
Japan
Prior art keywords
video
text
sentence
directly related
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003121991A
Other languages
English (en)
Other versions
JP4359069B2 (ja
Inventor
Ichiro Yamada
一郎 山田
Masaki Sano
雅規 佐野
Masahiro Shibata
正啓 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2003121991A priority Critical patent/JP4359069B2/ja
Publication of JP2004328478A publication Critical patent/JP2004328478A/ja
Application granted granted Critical
Publication of JP4359069B2 publication Critical patent/JP4359069B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】本発明は、重要度の高いイベントを高精度に抽出して要約を生成することができる要約生成装置及びそのプログラムを提供することを目的とする。
【解決手段】音声を含む映像と音声のテキストそれぞれを蓄積し、蓄積されたテキストの各文が直接関連文か、非直接関連文かを予め登録された学習データに基づいて判定し、直接関連文グループか非直接関連文グループかを判定してセグメントを付加し、直接関連文グループを構成するテキストの各文から予め登録されているイベントキーワードと一致するイベントを抽出して直接関連文グループのインデックスとして蓄積し、予め登録されているイベントの重要度に応じてインデックスの蓄積から重要度の高いイベントをインデックスとする直接関連文グループを抽出し、抽出した直接関連文グループに対応する映像を映像の蓄積から抽出し要約映像として表示する。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、要約生成装置及びそのプログラムに関し、特に、デジタル放送の番組の要約を作成する要約生成装置及びそのプログラムに関する。
【0002】
【従来の技術】
従来から映像コンテンツの検索を目的としたサッカー映像における特定映像イベント抽出システムが提案されている(例えば、非特許文献1参照。)。このシステムは、放送されるサッカー番組の映像を解析して特徴点を抽出し、この抽出した特徴点を用いてカメラの状態推定を行うことでカメラの状態空間を作成し、抽出する画像を限定した上で特定映像イベントの抽出を行う。
【0003】
【非特許文献1】
丸尾二郎,岩井儀雄,谷内田正彦,越後富夫,飯作俊一「サッカー映像からの特定映像イベントの抽出」電子情報通信学会PRMU研究会 PRMU 99−41,pp.31−38(1999)
【0004】
【発明が解決しようとする課題】
従来の特定映像イベント抽出システムでは、映像におけるゴールポストやコーナー等の映像上の特徴点を抽出し、その特徴点に基づいてイベントを抽出しているため、映像からゴールポストやコーナー等の特徴点を抽出できない場合がある。また、ゴールポストやコーナー等の特徴点が必ずしもコーナーキックというイベントに結びつかないため、高精度にイベントを抽出することが難しいという問題があった。
【0005】
本発明は、上記の点に鑑みなされたもので、重要度の高いイベントを高精度に抽出して要約を生成することができる要約生成装置及びそのプログラムを提供することを目的とする。
【0006】
【課題を解決するための手段】
請求項1,5に記載の発明は、音声を含む映像と前記音声のテキストそれぞれを蓄積し、蓄積されたテキストの各文が前記映像の内容と直接的に関連する直接関連文であるか、もしくは、映像内容と直接的に関連しない非直接関連文であるかを予め登録された学習データに基づいて判定し、蓄積されたテキストの各文が直接関連文グループを構成するか、非直接関連文グループを構成するかを判定してセグメントを付加し、直接関連文グループを構成するテキストの各文から予め登録されているイベントキーワードと一致するイベントを抽出して前記直接関連文グループのインデックスとして蓄積し、予め登録されているイベントの重要度に応じて前記インデックスの蓄積から重要度の高いイベントをインデックスとする直接関連文グループを抽出し、抽出した直接関連文グループに対応する映像を前記映像の蓄積から抽出し要約映像として表示することにより、
重要度の高いイベントを高精度に抽出して要約を生成することができる。
【0007】
請求項2,6に記載の発明は、デジタル放送のトランスポートストリームを受信し、前記トランスポートストリームから音声を含む映像を再生して前記映像及びテキスト蓄積手段に蓄積し、トランスポートストリームから字幕テキストストリームを抽出して字幕テキストを再生し前記映像及びテキスト蓄積手段に蓄積することにより、
デジタル放送により放送される番組の要約を生成することができる。
【0008】
【発明の実施の形態】
まず、本発明の原理について説明する。
【0009】
映像中で発生しているイベントを高精度に抽出するために、デジタル放送で送られてくるトランスポートストリーム(TS)に多重された字幕テキストを利用する。また、字幕テキストデータから高精度なイベント抽出を行うために、字幕テキストデータの各文が、映像内容を説明する実況文であるか、もしくは、映像内容以外を話題とする解説文であるかを判定する。
【0010】
この判定のために、予め別の字幕テキストデータが実況分であるか解説文であるか正解を手作業により与えた学習データを作成し、文の特徴点を既存技術であるサポートベクターマシン(C.Cortes and V.vapnik“Support Vector Networks”,Machine Learning,Wol.20,pp.273−297)により学習する。
【0011】
そして、映像内容を説明すると判定された実況文の固まりを対象としてセグメント化し、実況文のセグメントからイベントの抽出し、重要性の大きなイベントを持つセグメントに対応する映像をイベント映像として抽出する。
【0012】
以下、図面を参照して本発明の実施例について説明する。
【0013】
図1は、本発明の要約生成装置のハードウェア構成を示す一実施例のブロック図を示す。要約生成装置は、専用の装置構成とすることもできるが、例えば、汎用のパーソナルコンピュータ、ワークステーション等を適用することができる。
【0014】
図1において、要約生成装置は、入力装置11と、出力装置12と、ドライブ装置13と、補助記憶装置14と、メモリ装置15と、演算処理装置16と、データベース17と、デジタルチューナ18から構成されており、これらはシステムバス19で相互に接続されている。
【0015】
入力装置11は、使用者が操作するキーボード及びマウス、音声入力用のマイクロホンを有しており、各種信号を入力する。出力装置12は、質問応答装置のプログラムを操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイを有し、実行プログラムに基づいて表示される。ここで、本発明において、要約生成装置にインストールされる実行プログラムは、例えば、CD−ROM等の記録媒体19等により提供される。プログラムを記録した記録媒体19はドライブ装置13に装着され、記憶媒体19に格納された実行プログラムが、記録媒体19からドライブ装置13を介して補助記憶装置14にインストールされる。
【0016】
演算処理装置16は、メモリ装置15により読み出され格納されている実行プログラムに基づいて、各種演算や後述する各処理を含む要約生成装置全体の処理を制御する。また、プログラムの実行中に必要な各種情報は、データベース17から取得することができ、また格納することもできる。デジタルチューナ18は、例えばBSデジタル放送や地上波デジタル放送を受信する。
【0017】
図2は、本発明の要約生成装置の一実施例の機能構成図を示す。同図中、デジタルチューナ18では例えばBSデジタル放送のトランスポートストリーム(TS:Transport Stream)を受信し、受信したトランスポートストリームから再生した音声を含む映像を映像蓄積部20に蓄積する。これと共に、受信したトランスポートストリームを字幕テキストデータ抽出部22に供給する。
【0018】
ここで、図3及び図4を参照して、トランスポートストリームの構成とデータ構造について説明する。図3は、トランスポートストリームの構成の例を示す概念図である。図4は、トランスポートストリームのデータ構造を示す図である。
【0019】
図3に示すように、デジタル放送で放送されるトランスポートストリームは、映像ストリーム、音声ストリーム、データストリーム、字幕テキストストリーム、文字スーバストリーム等の個別のストリーム(エレメンタリストリーム(ES))が多重化されて構成されている。ここでは、映像ストリーム(ES1)と、音声ストリーム1(ES2)及び音声ストリーム2(ES3)と、データストリーム1(ES4)、データストリーム2(ES5)及びデータストリーム3(ES6)と、字幕テキストストリーム(ES7)と、文字スーバストリーム(ES8)とで、1つのトランスポートストリームを構成した例を示している。
【0020】
なお、映像、音声、字幕及び文字スーバの各ストリームは、PES(Packetized Elementary Stream)と呼ばれるデータ形式となっている。また、データ放送として放送されるデータ放送用データであるデータストリームは、セクション(Section)と呼ばれるデータ形式となっている。このPES及びセクションの形式は、MPEG2のシステム規格であるISO/IEC13818−1で規定されている。
【0021】
このトランスポートストリームは、図4に示すように、PES及びセクションの各データが、184バイト単位に分割され、その分割されたデータ(分割データdd)に4バイトのTSヘッダtshが付加されたTSパケット構造となっている。このTSヘッダtshは、TSパケットの開始を示す同期バイトsyn、TSパケットを識別するパケット識別子pid等を含んでいる。なお、分割される前のPESやセクションは、同じパケット識別子pidの値が付与されている。
【0022】
図2に示すデジタルチューナ18は、TSヘッダtshの同期バイトsynを検出することで、TSパケット単位(188バイト)で、トランスポートストリームを受信する。
【0023】
字幕テキストデータ抽出部22は、デジタルチューナ18から供給されるTSパケットから、字幕テキストストリームのみを分離抽出して字幕テキストを再生し、この字幕テキストを字幕テキスト蓄積部24に蓄積する。図5に字幕テキスト蓄積部24に蓄積された字幕テキストの一実施例を示す。各行の先頭はタイムコード(フレーム番号)、次の0または1の数字は話者を表し、0がアナウンサー、1が解説者を表す。その後が字幕テキスト文である。
【0024】
字幕テキスト解析部26は、字幕テキスト蓄積部24に蓄積されている各文に対して、映像内容を説明する実況文であるか、もしくは、映像内容以外を話題とする解説文であるかを判定する。これは、字幕テキストに「シュート」というイベントキーワードが存在しても、映像中に「シュート」イベントが発生したのか、それとも、映像とは無関係に「シュート」について説明しているのか判断ができないからである。
【0025】
図6は、字幕テキスト解析部26が実行する字幕テキスト解析処理のフローチャートを示す。同図中、ステップS10で、字幕テキストデータ蓄積部24に蓄積された字幕テキストデータを対象に、未処理の文の有無を判定する。未処理の文がない場合は処理を終了する。
【0026】
未処理の文がある場合は、ステップS12で1つの文を対象として特徴点を抽出する。特徴点は、例えば以下の項目とする。
【0027】
1.最終形態素の動詞(または名詞)の表記
2.最終形態素の格
3.最終形態素に係る人名の表記
4.最終形態素に係る人名の格
5.最終形態素に係る人名以外の表記
6.最終形態素に係る人名以外の格
7.最終形態素に係る動詞句の表記
8.接続詞の有無(有り:1、無し:0)
9.助詞丁寧の有無(有り:1、無し:0)
10.間投助詞の有無(有り:1、無し:0)
11.助詞完了の有無(有り:1、無し:0)
12.助詞過去の有無(有り:1、無し:0)
13.接続助詞の有無(有り:1、無し:0)
14.終助詞の有無(有り:1、無し:0)
15.助詞断定の有無(有り:1、無し:0)
16.助詞打消の有無(有り:1、無し:0)
17.解説者やアナウンサーの名前の出現の有無(有り:1、無し:0)
18.発話者の有無(有り:1、無し:0)
例えば、以下の2文から抽出される特徴データを以下に示す。この例では抽出された特徴は、セパレータ”|”により分割され、上記特徴点1〜18の順に並んでいる。
[特徴点抽出例1]
「さあまた岡野がまたスピードを生かす、抜ける、抜けた、チャンス、シュート。」
(シュート||||チャンス|||1|0|0|0|0|0|0|0|0|0|0)
[特徴点抽出例2]
「今野とも奪い合いましたが、最後のシュートは浮いてしまいました。」
(浮く||||シュート|は|奪い合う|0|1|0|0|1|1|0|0|0|0|0)
次に、ステップS14で、抽出された特徴をもととして、その文が映像内容を説明する実況文であるか、もしくは、映像内容以外を話題とする解説文であるかを判定する。判定には、一般的な学習機であるサポートベクターマシンを利用する。サポートベクターマシンは既存の技術で有り、学習データ格納部28に格納されている予め学習された特徴データを基に、入力された特徴が2つのクラスタ(実況文/解説文)のどちらに属するかを判定する。
【0028】
本手法でも、予め、サッカー放送におけるアナウンス書き起こし原稿に対して、実況文であるか解説文であるかを手作業により与え、学習データを作成している。この判定結果では、先の例で示した「さあまた岡野がまたスピードを生かす、抜ける、抜けた、チャンス、シュート。」という文は「実況文」に判定され、「今野とも奪い合いましたが、最後のシュートは浮いてしまいました。」は「解説文」に判定される。この判定結果を付加した字幕テキストがセグメント付加部30の入力として与えられる。図7に判定結果を付加した字幕テキストの一実施例を示す。
【0029】
ところで、サッカー番組は切れ目がないため、内容の変化点を見つけることが難しい。これを解決するために、本発明ではセグメント付加部30を設けている。
【0030】
図2に示すセグメント付加部30は、タイムコード順にならべられた字幕テキストデータに対して、内容の変化点により分割するセグメントを付加し、実況文集合、解説文集合を作る。
【0031】
図8は、セグメント付加部30が実行するセグメント付加処理のフローチャートを示す。同図中、ステップS20で、判定結果(実況文/解説文)を付加した字幕テキストをタイムコード順に入力する。この処理ではその時点の状態を変数statusに記憶する。このstatusの初期設定を行うために、ステップS22においてタイムコード順で最初の字幕テキストに付加された判定結果をそのままstatusに設定する。
【0032】
次に、ステップS24で処理済みの字幕テキストより新しいタイムコードを持つ字幕テキストが存在するか否かを判別し、存在しない場合は処理を終了する。存在する場合にはステップS36に進み、処理対象を1つ進める。つまり、処理済みの字幕テキストの次に新しいタイムコードを持つ字幕テキストを処理対象とする。そして、ステップS26でstatusが実況文か否かを判別する。
【0033】
statusが実況文の場合には、ステップS28で処理対象の字幕テキストは解説文か否かを判別し、ここで解説文の場合にはステップS30で処理対象の1つ前の字幕テキストは解説文か否かを判別し、ここで解説文の場合にはステップS32に進み、処理対象の2つ前の字幕テキストと1つ前の字幕テキストとの間にセグメントを設ける。そして、このセグメントの前を実況文グループと判断し、セグメントの後を解説文グループと判断する。更に、ステップS34で解説文をstatusに設定してステップS22に進む。なお、ステップS28で処理対象の字幕テキストが実況文の場合、または、ステップS30で処理対象の1つ前の字幕テキストが実況文の場合は、そのままステップS22に進む。
【0034】
一方、ステップS26でstatusが解説文の場合には、ステップS36で処理対象の字幕テキストは実況文か否かを判別し、ここで実況文の場合にはステップS38で処理対象の1つ前の字幕テキストは実況文か否かを判別し、ここで実況文の場合にはステップS40に進み、処理対象の2つ前の字幕テキストと1つ前の字幕テキストとの間にセグメントを設ける。そして、このセグメントの前を解説文グループと判断し、セグメントの後を実況文グループと判断する。更に、ステップS42で実況文をstatusに設定してステップS22に進む。なお、ステップS36で処理対象の字幕テキストが解説文の場合、または、ステップS38で処理対象の1つ前の字幕テキストが解説文の場合は、そのままステップS22に進む。
【0035】
このようにして、図7に示すように、実況文または解説文が2つ以上連続してstatusと異なるときにするときにセグメントが設けられ、実況文グループと解説文グループが形成される。
【0036】
図2に示すイベント抽出部32では、実況文グループの字幕テキストから、予め登録されているイベントキーワードを抽出する。ここで、イベントキーワード格納部34にはイベントキーワードとして、例えば、以下に示す単語が予め格納されている。
「ファール、フリーキック、スローイン、シュート、ゴール、コーナーキック、ゴールキック、イエローカード、クロス、ハンド、チャンス、オーバーラップ、オフサイド、タックル、ミス、ドリブル、ワンツー、プレッシャー、トラップ、退場、キープ、ボレー、ダイレクトボレー、ヘディング、PK、スルーパス、パス、ロングスロー、スルー、カウンター、オーバーヘッド、オーバーヘッドキック、カバー、キックオフ、いいプレー、ループシュート、ショートコーナー、キャッチ」
上記のイベントキーワードのいずれかが実況文グループの字幕テキストに存在する場合は、イベント抽出部32は、その実況文グループに対応するイベントと判断し、そのイベントをインデックスとして開始タイムコード及び終了タイムコードと共にインデックス蓄積部36に蓄積する。開始タイムコードは当該実況文グループの最初の字幕テキストのタイムコードであり、終了タイムコードは当該実況文グループの最後のタイムコード(次の解説文グループの最初の字幕テキストのタイムコードを1だけ減じた値)である。図9に、サッカー1試合分のイベント抽出結果を示す。ここで、先頭は開始タイムコード、2番目は終了タイムコードと、3番目の「パス」、「フリーキック」等がインデックス(つまりイベント)である。
【0037】
図2に示す要約生成部38は、予め登録されているイベント重要度を基に、インデックス蓄積部36を参照して最も重要なイベントのインデックスを抽出し、抽出したインデックスの対応する映像情報を映像蓄積部20から取り出して要約として出力装置12のディスプレイに表示する。
【0038】
図10は、要約生成部38が実行する要約生成処理のフローチャートを示す。同図中、ステップS50で要約映像及びトータル時間をリセットする。また、インデックス蓄積部36に蓄積されている全てインデックス情報を抽出対象とする。
【0039】
次に、ステップS52で、トータル時間が指定時間を超えたか否かを判断する。ここで、指定時間とは、予めユーザにより入力された時間であり、デフォルト値は例えば3分である。トータル時間が指定時間を超えていない場合は、ステップS54で、イベント重要度格納部40に予め登録されているイベント重要度を利用して、重要度が最も大きいイベントのインデックスをインデックス蓄積部36内の抽出対象から抽出する。イベント重要度は、ユーザによって自由に操作でき、例えば以下に示すものを利用する。
【0040】
イベント重要度1.ゴール
イベント重要度2.PK
イベント重要度3.シュート
イベント重要度4.退場
イベント重要度5.イエローカード
イベント重要度6.フリーキック
イベント重要度7.コーナーキック
ステップS56ではステップS54においてインデックス蓄積部36から抽出されたインデックスが複数ある場合、該当する複数のインデックスのうち開始タイムコードと終了タイムコードの差が最も小さいインデックスを抽出し、その開始タイムコードと終了タイムコードの差をトータル時間に加算し、そのインデックスを処理対象から外したのちステップS52に進む。
【0041】
これによって、トータル時間が指定時間を超えると、ステップS52からステップS58に進む。ステップS58では抽出した1または複数のインデックスそれぞれに対応する映像情報を映像蓄積部20からインデックスを抽出した順に取り出し要約として表示する。なお、インデックスと映像情報との対応は開始タイムコード及び終了タイムコードでとっている。
【0042】
以上から明らかなように、本実施例によれば、映像の意味的なグループ化を自動で行い、イベントを正確に抽出することにより、番組を放送中にリアルタイムで要約を作成することができ、番組を途中から見始めた視聴者用に、それまでの試合のダイジェストを受信機側で作成することができ、デジタル放送のサービスとして利用できる。
【0043】
なお、上記実施例では、サッカー番組の映像から重要なイベントを抽出して要約を作成することを例に説明しているが、サッカー番組に限定されるものではない。例えば、図11に示すような自然紀行番組での番組ナレーションの字幕テキストについて、映像に映っている事項を説明する映像記述文と補足的な説明を行う補足説明文を判定し、映像記述文のグループからイベントキーワードを抽出し、予め登録されているイベント重要度を基に要約を生成するものであっても良い。図11では、先頭に判定結果(映像記述文/補足説明文)、次に字幕テキスト文、最後にタイムコード(時刻とフレーム数)を示している。なお、この場合には、学習データ及びイベントキーワード及びイベント重要度それぞれを自然紀行番組用のものに設定する必要がある。
【0044】
なお、映像蓄積部20,字幕テキスト蓄積部24が請求項記載の映像及びテキスト蓄積手段に対応し、実況文または映像記述文が直接関連文に対応し、解説文または補足説明文が非直接関連文に対応し、字幕テキスト解析部26が直接関連文判定手段に対応し、セグメント付加部30がセグメント付加手段に対応し、イベント抽出部32,インデックス蓄積部36がインデックス蓄積手段に対応し、要約生成部38が要約抽出手段に対応し、デジタルチューナ18が受信手段に対応し、字幕テキストデータ抽出部22が字幕テキスト抽出手段に対応する。
【0045】
【発明の効果】
上述の如く、請求項1,5に記載の発明によれば、重要度の高いイベントを高精度に抽出して要約を生成することができる。
【0046】
請求項2,6に記載の発明によれば、デジタル放送により放送される番組の要約を生成することができる。
【図面の簡単な説明】
【図1】本発明の要約生成装置のハードウェア構成を示す一実施例のブロック図である。
【図2】本発明の要約生成装置の一実施例の機能構成図である。
【図3】トランスポートストリームの構成の例を示す概念図である。
【図4】トランスポートストリームのデータ構造を示す図である。
【図5】字幕テキストの一実施例を示す図である。
【図6】字幕テキスト解析処理のフローチャートである。
【図7】判定結果を付加した字幕テキストの一実施例を示す図である。
【図8】セグメント付加処理のフローチャートである。
【図9】サッカー1試合分のイベント抽出結果を示す図である。
【図10】要約生成処理のフローチャートである。
【図11】判定結果を付加した字幕テキストの他の実施例を示す図である。
【符号の説明】
11 入力装置
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 メモリ装置
16 演算処理装置
17 データベース
18 デジタルチューナ
19 記録媒体
19 システムバス
20 映像蓄積部
22 字幕テキストデータ抽出部
24 字幕テキスト蓄積部
26 字幕テキスト解析部
28 学習データ格納部
30 セグメント付加部
32 イベント抽出部
34 イベントキーワード格納部
36 インデックス蓄積部
38 要約生成部
40 イベント重要度格納部

Claims (6)

  1. 音声を含む映像と前記音声のテキストそれぞれを蓄積する映像及びテキスト蓄積手段と、
    蓄積されたテキストの各文が前記映像の内容と直接的に関連する直接関連文であるか、もしくは、映像内容と直接的に関連しない非直接関連文であるかを予め登録された学習データに基づいて判定する直接関連文判定手段と、
    前記蓄積されたテキストの各文が直接関連文グループを構成するか、非直接関連文グループを構成するかを判定してセグメントを付加するセグメント付加手段と、
    前記直接関連文グループを構成するテキストの各文から予め登録されているイベントキーワードと一致するイベントを抽出して前記直接関連文グループのインデックスとして蓄積するインデックス蓄積手段と、
    予め登録されているイベントの重要度に応じて前記インデックスの蓄積から重要度の高いイベントをインデックスとする直接関連文グループを抽出し、抽出した直接関連文グループに対応する映像を前記映像の蓄積から抽出し要約映像として表示する要約抽出手段を
    有することを特徴とする要約生成装置。
  2. 請求項1記載の要約生成装置において、
    デジタル放送のトランスポートストリームを受信し、前記トランスポートストリームから音声を含む映像を再生して前記映像及びテキスト蓄積手段に蓄積する受信手段と、
    前記トランスポートストリームから字幕テキストストリームを抽出して字幕テキストを再生し前記映像及びテキスト蓄積手段に蓄積する字幕テキスト抽出手段を
    有することを特徴とする要約生成装置。
  3. 請求項1記載の要約生成装置において、
    前記直接関連文は実況文であり、前記非直接関連文は解説文であることを特徴とする要約生成装置。
  4. 請求項1記載の要約生成装置において、
    前記直接関連文は映像記述文であり、前記非直接関連文は補足説明文であることを特徴とする要約生成装置。
  5. コンピュータを、
    音声を含む映像と前記音声のテキストそれぞれを蓄積する映像及びテキスト蓄積手段、
    蓄積されたテキストの各文が前記映像の内容と直接的に関連する直接関連文であるか、もしくは、映像内容と直接的に関連しない非直接関連文であるかを予め登録された学習データに基づいて判定する直接関連文判定手段、
    前記蓄積されたテキストの各文が直接関連文グループを構成するか、非直接関連文グループを構成するかを判定してセグメントを付加するセグメント付加手段、
    前記直接関連文グループを構成するテキストの各文から予め登録されているイベントキーワードと一致するイベントを抽出して前記直接関連文グループのインデックスとして蓄積するインデックス蓄積手段、
    予め登録されているイベントの重要度に応じて前記インデックスの蓄積から重要度の高いイベントをインデックスとする直接関連文グループを抽出し、抽出した直接関連文グループに対応する映像を前記映像の蓄積から抽出し要約映像として表示する要約抽出手段、
    として機能させるための要約生成プログラム。
  6. 請求項5記載の要約生成プログラムにおいて、
    コンピュータを、
    デジタル放送のトランスポートストリームを受信し、前記トランスポートストリームから音声を含む映像を再生して前記映像及びテキスト蓄積手段に蓄積する受信手段、
    前記トランスポートストリームから字幕テキストストリームを抽出して字幕テキストを再生し前記映像及びテキスト蓄積手段に蓄積する字幕テキスト抽出手段、
    として機能させるための要約生成プログラム。
JP2003121991A 2003-04-25 2003-04-25 要約生成装置及びそのプログラム Expired - Fee Related JP4359069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003121991A JP4359069B2 (ja) 2003-04-25 2003-04-25 要約生成装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003121991A JP4359069B2 (ja) 2003-04-25 2003-04-25 要約生成装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2004328478A true JP2004328478A (ja) 2004-11-18
JP4359069B2 JP4359069B2 (ja) 2009-11-04

Family

ID=33500377

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003121991A Expired - Fee Related JP4359069B2 (ja) 2003-04-25 2003-04-25 要約生成装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP4359069B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007073347A1 (en) * 2005-12-19 2007-06-28 Agency For Science, Technology And Research Annotation of video footage and personalised video generation
JP2007189343A (ja) * 2006-01-11 2007-07-26 Toshiba Corp 映像要約装置、映像要約方法および映像要約プログラム
JP2009141797A (ja) * 2007-12-07 2009-06-25 Fujitsu Ltd データ生成装置、データ生成プログラムおよび情報処理装置
JP2009533993A (ja) * 2006-04-20 2009-09-17 エヌエックスピー ビー ヴィ データ要約システム及びデータストリーム要約方法
KR101265960B1 (ko) 2007-08-21 2013-05-22 삼성전자주식회사 하이라이트 추출 장치 및 그 방법
WO2016076540A1 (en) * 2014-11-14 2016-05-19 Samsung Electronics Co., Ltd. Electronic apparatus of generating summary content and method thereof
CN113033163A (zh) * 2021-03-24 2021-06-25 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007073347A1 (en) * 2005-12-19 2007-06-28 Agency For Science, Technology And Research Annotation of video footage and personalised video generation
JP2007189343A (ja) * 2006-01-11 2007-07-26 Toshiba Corp 映像要約装置、映像要約方法および映像要約プログラム
JP2009533993A (ja) * 2006-04-20 2009-09-17 エヌエックスピー ビー ヴィ データ要約システム及びデータストリーム要約方法
US8798169B2 (en) 2006-04-20 2014-08-05 Nxp B.V. Data summarization system and method for summarizing a data stream
KR101265960B1 (ko) 2007-08-21 2013-05-22 삼성전자주식회사 하이라이트 추출 장치 및 그 방법
JP2009141797A (ja) * 2007-12-07 2009-06-25 Fujitsu Ltd データ生成装置、データ生成プログラムおよび情報処理装置
WO2016076540A1 (en) * 2014-11-14 2016-05-19 Samsung Electronics Co., Ltd. Electronic apparatus of generating summary content and method thereof
US9654845B2 (en) 2014-11-14 2017-05-16 Samsung Electronics Co., Ltd. Electronic apparatus of generating summary content and method thereof
CN113033163A (zh) * 2021-03-24 2021-06-25 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备

Also Published As

Publication number Publication date
JP4359069B2 (ja) 2009-11-04

Similar Documents

Publication Publication Date Title
JP5022025B2 (ja) コンテンツのデータ・ストリームとメタデータを同期するための方法および装置。
JP4920395B2 (ja) 動画要約自動作成装置、方法、及びコンピュータ・プログラム
US20100005485A1 (en) Annotation of video footage and personalised video generation
US20020093591A1 (en) Creating audio-centric, imagecentric, and integrated audio visual summaries
CN101189657A (zh) 一种用于对多媒体信号执行自动配音的方法和设备
CN111986656B (zh) 教学视频自动字幕处理方法与系统
US20070168864A1 (en) Video summarization apparatus and method
US20070130611A1 (en) Triggerless interactive television
KR20080114786A (ko) 다수의 이미지들 요약의 자동 생성 방법 및 장치
KR20040039432A (ko) 다중 언어 필사 시스템
Lambourne et al. Speech-based real-time subtitling services
JP4332700B2 (ja) マルチメディアの手掛かりを利用したテレビ番組をセグメント化及びインデクス化する方法及び装置
CN112733654B (zh) 一种视频拆条的方法和装置
JP2006287319A (ja) 番組ダイジェスト作成装置および番組ダイジェスト作成プログラム
Ando et al. Construction of a large-scale Japanese ASR corpus on TV recordings
JP4359069B2 (ja) 要約生成装置及びそのプログラム
CN107688792B (zh) 一种视频翻译方法及其系统
CN113365109A (zh) 一种生成视频字幕的方法、装置、电子设备和存储介质
JP4323937B2 (ja) 映像コメント生成装置及びそのプログラム
JP4538618B2 (ja) 字幕番組制作システムにおける表示単位字幕文の自動生成方法
CN116017088A (zh) 视频字幕处理方法、装置、电子设备和存储介质
JP2009130411A (ja) 字幕監視装置及び字幕監視プログラム
KR100404322B1 (ko) 멀티모달 특징 기반의 뉴스 비디오 요약 방법
Li et al. Bridging the semantic gap in sports
Series Artificial intelligence systems for programme production and exchange

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090807

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130814

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140814

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees