JP2005165941A - 映像コメント生成装置及びそのプログラム - Google Patents

映像コメント生成装置及びそのプログラム Download PDF

Info

Publication number
JP2005165941A
JP2005165941A JP2003407355A JP2003407355A JP2005165941A JP 2005165941 A JP2005165941 A JP 2005165941A JP 2003407355 A JP2003407355 A JP 2003407355A JP 2003407355 A JP2003407355 A JP 2003407355A JP 2005165941 A JP2005165941 A JP 2005165941A
Authority
JP
Japan
Prior art keywords
sentence
video
comment
directly related
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003407355A
Other languages
English (en)
Other versions
JP4323937B2 (ja
Inventor
Ichiro Yamada
一郎 山田
Masahiro Shibata
正啓 柴田
Masaki Sano
雅規 佐野
Narichika Hamaguchi
斉周 浜口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2003407355A priority Critical patent/JP4323937B2/ja
Publication of JP2005165941A publication Critical patent/JP2005165941A/ja
Application granted granted Critical
Publication of JP4323937B2 publication Critical patent/JP4323937B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 抽出したイベントの内容に応じたコメントを生成することができる映像コメント生成装置及びそのプログラムを提供することを目的とする。
【解決手段】 音声を含む映像と前記音声のテキストそれぞれを供給され、供給されたテキストの各文が前記映像の内容と直接的に関連する直接関連文であるか、もしくは、映像内容と直接的に関連しない非直接関連文であるかを判定する判定手段36と、非直接関連文グループを構成するテキストの各文から映像を適切に説明する文を抽出しコメントを生成する文利用コメント生成手段52を有する
【選択図】 図2

Description

本発明は、映像コメント生成装置及びそのプログラムに関し、特に、デジタル放送の番組の映像を説明するコメントを自動生成する映像コメント生成装置及びそのプログラムに関する。
従来、エレクトリック・アーツ・スクェア社製のゲームソフト「FIFAサッカー・ワールドチャンピオンシップ」等で利用されている映像コメント自動出力技術では、予めコメント候補を多数用意しておき、ゲーム状況に応じてランダム性を加味してコメント候補の選択を行い、選択したコメントを出力している。
また、映像コンテンツの検索を目的としたサッカー映像における特定イベント抽出システムが提案されている(例えば、非特許文献1参照。)。このシステムは、放送されるサッカー番組の映像を解析して特徴点を抽出し、この抽出した特徴点を用いてカメラの状態推定を行うことでカメラの状態空間を作成し、抽出する画像を限定した上で特定イベントの抽出を行っている。
丸尾二郎,岩井儀雄,谷内田正彦,越後富夫,飯作俊一「サッカー映像からの特定イベントの抽出」電子情報通信学会PRMU研究会 PRMU 99−41,pp.31−38(1999)
予め用意したコメント候補を利用する手法では、そのコメント数に限界があり、何度も同じコメントが繰り返されるという問題がある。
従来の特定イベント抽出システムでは、映像におけるゴールポストやコーナー等の映像上の特徴点を抽出し、その特徴点に基づいてイベントを抽出しているため、映像からゴールポストやコーナー等の特徴点を抽出できない場合がある。また、ゴールポストやコーナー等の特徴点が必ずしもコーナーキックというイベントに結びつかないため、高精度にイベント映像を抽出することが難しい。また、抽出したイベント映像についてのコメントを出力することは考えられていなかった。
本発明は、上記の点に鑑みなされたもので、抽出したイベントの内容に応じたコメントを生成することができる映像コメント生成装置及びそのプログラムを提供することを目的とする。
請求項1,6に記載の発明は、音声を含む映像と前記音声のテキストそれぞれを供給され、供給されたテキストの各文が前記映像の内容と直接的に関連する直接関連文であるか、もしくは、映像内容と直接的に関連しない非直接関連文であるかを判定し、非直接関連文グループを構成するテキストの各文から映像を適切に説明する文を抽出しコメントを生成することにより、
抽出したイベントの内容に応じたコメントを生成することができる。
請求項2,7に記載の発明は、文利用コメント生成手段で映像を適切に説明する文が抽出されなかったとき予め用意されているテンプレートからコメントを生成することにより、
非直接関連文グループを構成するテキストからコメントを抽出できなかった場合にも、抽出したイベントの内容に応じたコメントを生成することができる。
請求項3に記載の発明は、直接関連文グループを構成するテキストの各文からイベントキーワードと一致するイベント名とイベントの動作主を抽出し直接関連文グループのインデックスとして蓄積し、非直接関連文グループの各文における、前記非直接関連文グループの直前の直接関連文グループから抽出されたインデックスの存在状況に基づいて、映像を適切に説明する文を抽出することにより、請求項1の発明を実現できる。
請求項4に記載の発明は、ユーザ情報と前記非直接関連文グループの直前の直接関連文グループから抽出されたインデックスに基づいて、テンプレートを選択しコメントを生成することにより、請求項2の発明を実現できる。
請求項1,6に記載の発明によれば、抽出したイベントの内容に応じたコメントを生成することができる。
請求項2,7に記載の発明によれば、非直接関連文グループを構成するテキストからコメントを抽出できなかった場合にも、抽出したイベントの内容に応じたコメントを生成することができる。
請求項3に記載の発明によれば、請求項1の発明を実現できる。
請求項4に記載の発明によれば、請求項2の発明を実現できる。
以下、図面を参照して本発明の実施形態について説明する。
図1は、本発明の映像コメント生成装置を適用した要約・解説作成システムのハードウェア構成を示す一実施形態のブロック図を示す。映像コメント生成装置は、専用の装置構成とすることもできるが、例えば、汎用のパーソナルコンピュータ、ワークステーション等を適用することができる。
図1において、要約・解説作成システムは、入力装置11と、出力装置12と、ドライブ装置13と、補助記憶装置14と、メモリ装置15と、演算処理装置16と、データベース17と、デジタルテレビジョンチューナ18から構成されており、これらはシステムバス19で相互に接続されている。
入力装置11は、使用者が操作するキーボード及びマウス、音声入力用のマイクロホンを有しており、各種信号を入力する。出力装置12は、各種プログラムを操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイを有し、実行プログラムに基づいて表示される。ここで、本発明において、映像コメント生成装置にインストールされる実行プログラムは、例えば、CD−ROM等の記録媒体20等により提供される。プログラムを記録した記録媒体20はドライブ装置13に装着され、記憶媒体19に格納された実行プログラムが、記録媒体20からドライブ装置13を介して補助記憶装置14にインストールされる。
演算処理装置16は、メモリ装置15により読み出され格納されている実行プログラムに基づいて、各種演算や後述する各処理を含むシステム全体の処理を制御する。また、プログラムの実行中に必要な各種情報は、データベース17から取得することができ、また格納することもできる。デジタルテレビジョンチューナ18は、例えばBSデジタル放送や地上波デジタル放送を受信する。
図2は、本発明の映像コメント生成装置を適用した要約・解説作成システムの一実施形態の機能構成図を示す。同図中、要約・解説作成システムは、要約生成ブロック22と、映像コメント生成ブロック24と、番組作成ブロック26とから大略構成されている。
要約生成ブロック22では、デジタルテレビジョンチューナ18で例えばBSデジタル放送のトランスポートストリーム(TS:Transport Stream)を受信し、受信したトランスポートストリームから再生した音声を含む映像を映像蓄積部30に蓄積する。これと共に、受信したトランスポートストリームを字幕テキストデータ抽出部32に供給する。
ここで、図3及び図4を参照して、トランスポートストリームの構成とデータ構造について説明する。図3は、トランスポートストリームの構成の例を示す概念図である。図4は、トランスポートストリームのデータ構造を示す図である。
図3に示すように、デジタル放送で放送されるトランスポートストリームは、映像ストリーム、音声ストリーム、データストリーム、字幕テキストストリーム、文字スーバストリーム等の個別のストリーム(エレメンタリストリーム(ES))が多重化されて構成されている。ここでは、映像ストリーム(ES1)と、音声ストリーム1(ES2)及び音声ストリーム2(ES3)と、データストリーム1(ES4)、データストリーム2(ES5)及びデータストリーム3(ES6)と、字幕テキストストリーム(ES7)と、文字スーバストリーム(ES8)とで、1つのトランスポートストリームを構成した例を示している。
なお、映像、音声、字幕及び文字スーバの各ストリームは、PES(Packetized Elementary Stream)と呼ばれるデータ形式となっている。また、データ放送として放送されるデータ放送用データであるデータストリームは、セクション(Section)と呼ばれるデータ形式となっている。このPES及びセクションの形式は、MPEG2のシステム規格であるISO/IEC13818−1で規定されている。
このトランスポートストリームは、図4に示すように、PES及びセクションの各データが、184バイト単位に分割され、その分割されたデータ(分割データdd)に4バイトのTSヘッダtshが付加されたTSパケット構造となっている。このTSヘッダtshは、TSパケットの開始を示す同期バイトsyn、TSパケットを識別するパケット識別子pid等を含んでいる。なお、分割される前のPESやセクションは、同じパケット識別子pidの値が付与されている。
図2に示すデジタルテレビジョンチューナ18は、TSヘッダtshの同期バイトsynを検出することで、TSパケット単位(188バイト)で、トランスポートストリームを受信する。
字幕テキストデータ抽出部32は、デジタルテレビジョンチューナ18から供給されるTSパケットから、字幕テキストストリームのみを分離抽出して字幕テキストを再生し、この字幕テキストを字幕テキスト蓄積部34に蓄積する。図5に字幕テキスト蓄積部34に蓄積された字幕テキストの一実施形態を示す。各行の先頭はタイムコード(時刻及びフレーム番号)、次の0または1の数字は話者を表し、0がアナウンサー、1が解説者を表す。その後が字幕テキスト文である。
字幕テキスト解析部36は、字幕テキスト蓄積部34に蓄積されている各文に対して、映像内容を説明する実況文であるか、もしくは、映像内容以外を話題とする解説文であるかを判定する。これは、字幕テキストに「シュート」というイベントキーワードが存在しても、映像中に「シュート」イベントが発生したのか、それとも、映像とは無関係に「シュート」について説明しているのか判断ができないからである。
図6は、字幕テキスト解析部36が実行する字幕テキスト解析処理のフローチャートを示す。同図中、ステップS10で、字幕テキストデータ蓄積部34に蓄積された字幕テキストデータを対象に、未処理の文の有無を判定する。未処理の文がない場合は処理を終了する。
未処理の文がある場合は、ステップS12で1つの文を対象として特徴点を抽出する。特徴点は、例えば以下の項目とする。
1.最終形態素の動詞(または名詞)の表記
2.最終形態素の格
3.最終形態素に係る人名の表記
4.最終形態素に係る人名の格
5.最終形態素に係る人名以外の表記
6.最終形態素に係る人名以外の格
7.最終形態素に係る動詞句の表記
8.接続詞の有無(有り:1、無し:0)
9.助詞丁寧の有無(有り:1、無し:0)
10.間投助詞の有無(有り:1、無し:0)
11.助詞完了の有無(有り:1、無し:0)
12.助詞過去の有無(有り:1、無し:0)
13.接続助詞の有無(有り:1、無し:0)
14.終助詞の有無(有り:1、無し:0)
15.助詞断定の有無(有り:1、無し:0)
16.助詞打消の有無(有り:1、無し:0)
17.解説者やアナウンサーの名前の出現の有無(有り:1、無し:0)
18.発話者の有無(有り:1、無し:0)
例えば、以下の2文から抽出される特徴データを以下に示す。この例では抽出された特徴は、セパレータ”|”により分割され、上記特徴点1〜18の順に並んでいる。
[特徴点抽出例1]
「さあまた岡野がまたスピードを生かす、抜ける、抜けた、チャンス、シュート。」
(シュート||||チャンス|||1|0|0|0|0|0|0|0|0|0|0)
[特徴点抽出例2]
「今野とも奪い合いましたが、最後のシュートは浮いてしまいました。」
(浮く||||シュート|は|奪い合う|0|1|0|0|1|1|0|0|0|0|0)
次に、ステップS14で、抽出された特徴をもととして、その文が映像内容を説明する実況文であるか、もしくは、映像内容以外を話題とする解説文であるかを判定する。判定には、一般的な学習機であるサポートベクターマシンを利用する。サポートベクターマシンは既存の技術で有り、学習データ格納部38に格納されている予め学習された特徴データを基に、入力された特徴が2つのクラスタ(実況文/解説文)のどちらに属するかを判定する。
本手法でも、予め、サッカー放送におけるアナウンス書き起こし原稿に対して、実況文であるか解説文であるかを手作業により与え、学習データを作成している。この判定結果では、先の例で示した「さあまた岡野がまたスピードを生かす、抜ける、抜けた、チャンス、シュート。」という文は「実況文」に判定され、「今野とも奪い合いましたが、最後のシュートは浮いてしまいました。」は「解説文」に判定される。この判定結果を付加した字幕テキストがセグメント付加部40の入力として与えられる。図7に判定結果を付加した字幕テキストの一実施形態を示す。
ところで、サッカー番組は切れ目がないため、内容の変化点を見つけることが難しい。これを解決するために、本発明ではセグメント付加部40を設けている。
図2に示すセグメント付加部40は、タイムコード順にならべられた字幕テキストデータに対して、内容の変化点により分割するセグメントを付加し、実況文集合、解説文集合を作る。
図8は、セグメント付加部40が実行するセグメント付加処理のフローチャートを示す。同図中、ステップS20で、判定結果(実況文/解説文)を付加した字幕テキストをタイムコード順に入力する。この処理ではその時点の状態を変数statusに記憶する。このstatusの初期設定を行うために、ステップS22においてタイムコード順で最初の字幕テキストに付加された判定結果をそのままstatusに設定する。
次に、ステップS24で処理済みの字幕テキストより新しいタイムコードを持つ字幕テキストが存在するか否かを判別し、存在しない場合は処理を終了する。存在する場合にはステップS36に進み、処理対象を1つ進める。つまり、処理済みの字幕テキストの次に新しいタイムコードを持つ字幕テキストを処理対象とする。そして、ステップS26でstatusが実況文か否かを判別する。
statusが実況文の場合には、ステップS28で処理対象の字幕テキストは解説文か否かを判別し、ここで解説文の場合にはステップS30で処理対象の1つ前の字幕テキストは解説文か否かを判別し、ここで解説文の場合にはステップS32に進み、処理対象の2つ前の字幕テキストと1つ前の字幕テキストとの間にセグメントを設ける。そして、このセグメントの前を実況文グループと判断し、セグメントの後を解説文グループと判断する。更に、ステップS34で解説文をstatusに設定してステップS22に進む。なお、ステップS28で処理対象の字幕テキストが実況文の場合、または、ステップS30で処理対象の1つ前の字幕テキストが実況文の場合は、そのままステップS22に進む。
一方、ステップS26でstatusが解説文の場合には、ステップS36で処理対象の字幕テキストは実況文か否かを判別し、ここで実況文の場合にはステップS38で処理対象の1つ前の字幕テキストは実況文か否かを判別し、ここで実況文の場合にはステップS40に進み、処理対象の2つ前の字幕テキストと1つ前の字幕テキストとの間にセグメントを設ける。そして、このセグメントの前を解説文グループと判断し、セグメントの後を実況文グループと判断する。更に、ステップS42で実況文をstatusに設定してステップS22に進む。なお、ステップS36で処理対象の字幕テキストが解説文の場合、または、ステップS38で処理対象の1つ前の字幕テキストが解説文の場合は、そのままステップS22に進む。
このようにして、図7に示すように、実況文または解説文が2つ以上連続してstatusと異なるときにするときにセグメントが設けられ、実況文グループと解説文グループが形成される。
図2に示すイベント抽出部42では、実況文グループの字幕テキストから、予め登録されているイベントキーワードを抽出する。ここで、イベントキーワード格納部44にはイベントキーワードとして、例えば、以下に示すイベント名と、イベントの動作主となる選手名の単語が予め格納されている。
「ファール、フリーキック、スローイン、シュート、ゴール、コーナーキック、ゴールキック、イエローカード、クロス、ハンド、チャンス、オーバーラップ、オフサイド、タックル、ミス、ドリブル、ワンツー、プレッシャー、トラップ、退場、キープ、ボレー、ダイレクトボレー、ヘディング、PK、スルーパス、パス、ロングスロー、スルー、カウンター、オーバーヘッド、オーバーヘッドキック、カバー、キックオフ、いいプレー、ループシュート、ショートコーナー、キャッチ、……、中田、中田浩二、中村、中村俊輔、ビスマルク、相馬、柳沢、平瀬、川口、小笠原、……」
上記のイベントキーワードのいずれかが実況文グループの字幕テキストに存在する場合は、イベント抽出部42は、その実況文グループに対応するイベントと判断し、そのイベント名とイベントの動作主をインデックスとして開始タイムコード及び終了タイムコードと共にインデックス蓄積部46に蓄積する。開始タイムコードは当該実況文グループの最初の字幕テキストのタイムコードであり、終了タイムコードは当該実況文グループの最後のタイムコード(次の解説文グループの最初の字幕テキストのタイムコードを1だけ減じた値)である。図9に、サッカー1試合分のイベント名(動作主を除く)の抽出結果を示す。ここで、先頭は開始タイムコード、2番目は終了タイムコードと、3番目の「パス」、「フリーキック」等がインデックス(つまりイベント名)である。
図2に示す要約生成部48は、イベント重要度格納部50に予め登録されているイベント重要度を基に、インデックス蓄積部46を参照して最も重要なイベントのインデックスを抽出し、抽出したインデックスの対応する映像情報を映像蓄積部30から取り出して要約として番組作成ブロック26に供給する。
図10は、要約生成部48が実行する要約生成処理のフローチャートを示す。同図中、ステップS50で要約映像及びトータル時間をリセットする。また、インデックス蓄積部46に蓄積されている全てインデックス情報を抽出対象とする。
次に、ステップS52で、トータル時間が指定時間を超えたか否かを判断する。ここで、指定時間とは、予めユーザにより入力された時間であり、デフォルト値は例えば3分である。トータル時間が指定時間を超えていない場合は、ステップS54で、イベント重要度格納部50に予め登録されているイベント重要度を利用して、重要度が最も大きいイベントのインデックスをインデックス蓄積部46内の抽出対象から抽出する。イベント重要度は、ユーザによって自由に操作でき、例えば以下に示すものを利用する。
イベント重要度1.ゴール
イベント重要度2.PK
イベント重要度3.シュート
イベント重要度4.退場
イベント重要度5.イエローカード
イベント重要度6.フリーキック
イベント重要度7.コーナーキック
ステップS56ではステップS54においてインデックス蓄積部46から抽出されたインデックスが複数ある場合、該当する複数のインデックスのうち開始タイムコードと終了タイムコードの差が最も小さいインデックスを抽出し、その開始タイムコードと終了タイムコードの差をトータル時間に加算し、そのインデックスを処理対象から外したのちステップS52に進む。
これによって、トータル時間が指定時間を超えると、ステップS52からステップS58に進む。ステップS58では抽出した1または複数のインデックスそれぞれに対応する映像情報(要約の実況シーンの映像)を、映像蓄積部30からインデックスを抽出した順に取り出して番組作成ブロック26に渡す。なお、インデックスと映像情報(要約の実況シーンの映像)との対応は開始タイムコード及び終了タイムコードでとっている。
図2に示す映像コメント生成ブロック24は、字幕データ利用コメント生成部52と、テンプレート利用コメント生成部54から構成されている。映像コメント生成ブロック24には、番組作成ブロック26から生成するコメント数が指定される。
字幕データ利用コメント生成部52は、インデックス蓄積部46から読出したインデックス(イベント名とイベントの動作主)を解析して映像を説明するのに適切なコメントを抽出して番組作成ブロック26に供給する。
テンプレート利用コメント生成部54は、番組作成ブロック26から供給されるユーザ情報とインデックス蓄積部46から読出したインデックス(イベント名とイベントの動作主)に基づいて、予め用意されているテンプレートからコメントを生成して番組作成ブロック26に供給する。
ここで、図11に、要約生成ブロック22で解析された字幕テキストの他の実施形態を示す。各行の先頭(左端)から開始タイムコード(時刻及びフレーム番号)、終了タイムコードを表わし、映像とのリンクを取るために使われる。次に、字幕テキスト、字幕テキストが実況文と解説文のいずれであるかの判定結果、各実況シーンで発生したイベント名とイベントの動作主を表わす。なお、横線は、実況文グループと解説文グループとのセグメントを表わしている。
映像コメント生成ブロック24では、セグメントで分割された各実況シーンに対してコメントを付加する。実況シーンとは、字幕テキストにおいて実況文グループと判定された部分であり、図11では矢印で範囲指定した部分が実況シーンに相当する。
図12は、映像コメント生成ブロック24が実行する映像コメント生成処理のフローチャートを示す。同図中、まず、ステップS61において字幕データ利用コメント生成部52は、ステップS58でインデックスを抽出した全ての実況シーンに対して処理を行ったか判別し、処理を行った場合はこの処理を終了する。全ての実況シーンを処理していない場合は、ステップS62に進んで、処理されていない実況シーンの中で、もっとも開始時間の早い実況シーンを選択して処理対象つまり対象シーンとする。
次に、ステップS63で、処理シーンに映像説明として相応しいコメントがあるか否かを判定する。このコメント判定処理のフローチャートを図13に示す。ここでは、入力として、対象シーンとインデックス集合が与えられる。まず、ステップS71で対象シーンの次に出現する解説文グループを抽出する。これらの解説文グループが、映像を説明するコメントの候補となる。映像の説明として相応しいかを判断するためのウエイトを各文に持たせ、初期値を0に設定する。
ステップS72で、抽出された文の全てについて処理が行われたか判別する。処理されていない場合はステップS73に進み、処理対象を次の文とする。ここでは、処理されていない文の中で、もっとも開始時間の早い文を処理対象つまり対象文として選択する。
次に、ステップS74で、対象文が実況文か否かを判別する。解説文グループにも、実況文がごくまれに含まれる場合があるため、ステップS74ではその実況文を除いている。実況文である場合には、再びステップS72に戻る。対象が解説文である場合にはステップS75に進む。
ステップS75では、対象文に、ステップS62で選択された処理対象の実況シーンに含まれるイベント名が存在するか判別する。存在する場合は、ステップS76で対象文のウエイトにw1(例えばw1=0.4)を加える。
次に、ステップS77で、対象文にステップS62で選択された対象シーンに含まれるイベントの動作主が存在するか判別する。存在する場合は、ステップS78で対象文のウエイトにw2(例えばw2=0.3)を加える。
次に、ステップS79で、対象文にチーム名が存在するか判別する。存在する場合は、ステップS80で対象文のウエイトにw3(例えばw3=0.2)を加える。
次に、ステップS81で、対象文にステップS62で選択された対象シーンの字幕テキストに出現した選手名(イベントの動作主以外)が存在するか判別する。存在する場合は、ステップS82で対象文のウエイトにw4(例えばw4=0.1)を加える。
更に、ステップS83で、字幕出現時間によるペナルティをあたえる。解説文グループの開始点の時間をTl、対象文の開始点をTnとしたとき、対象文が持つウエイトは、例えば下記の式によりペナルティを与える。
ウエイト=ウエイト/{(Tn−Tl)/90+1} …(1)
ここで、ウエイトは、イベント名、イベントの動作主名、チーム名、選手名(イベントの動作主以外)の順に、4:3:2:1の比率となる。なお、ウエイトw1〜w4は比率であるため、総和が1になる必要はない。また、(1)式によるペナルティは、イベント発生直後の解説文をコメント候補として重視するために、イベント発生から長い時間を経過して発話された解説文のウエイトを低くするためのものであり、90フレーム(=3sec)の経過でウエイトを1/2に低下させている。
ステップS72で全ての文が処理されたと判別された場合、ステップS84に進み、ここで、ステップS71で抽出された解説文グループ中で一定の閾値を超えるウエイトを持つ解説文の有無を判別する。全ての文が一定の閾値以下である場合は、ステップS85で映像説明として相応しいコメントがない(NO)と判別する。閾値を超える文が存在する場合は、ステップS86で映像説明として相応しいコメントが存在する(YES)と判別する。
図12に戻って説明するに、ステップS63で映像説明として相応しいコメントが存在すると判別された場合にはステップS64で字幕利用処理を行ってステップS61に進む。この際に、閾値を超えた文とそのウエイトがステップS64に渡される。一方、映像説明として相応しいコメントがないと判別された場合にはステップS65でテンプレート利用処理を行ってステップS61に進む。
例えば、図11のイベント名「シュート」の実況シーンに対する解説文「う一ん、いい形を作りましたアントラーズ」が閾値を超えた最優先のコメント候補としてステップS64に渡され、また、イベント名「ファール」「イエローカード」の実況シーンに対する解説文「この時間帯にイエローカードもらうのはちょっと辛いですね」が閾値を超えた最優先のコメント候補としてステップS64に渡される。
ステップS64の字幕データ利用処理では、ステップS63から渡された文をそのウエイトが降順になるように並べて映像を説明するコメント候補とする。そして、コメント候補から番組作成ブロック26から指定されたコメント数だけ、ウエイトが大きい順に解説文を取り出して番組作成ブロック26に渡す。例えば、指定コメント数が1の場合は、ウエイト最大の解説文がコメントとして選ばれ番組作成ブロック26に渡される。
ステップS65のテンプレート利用処理は、テンプレート利用コメント生成部54で実行される。この処理では、番組作成ブロック26から入力されたユーザの情報、つまり、ユーザのサポートチーム等の情報と、インデックスに含まれるイベントの種類や動作主の所属チーム等の情報により、利用するテンプレートを選択し、テンプレートの中からランダムに1つのコメントを選択して番組作成ブロック26に渡す。
このテンプレート利用処理のフローチャートを図14に示す。同図中、ステップS91でインデックスに含まれるイベント名に「攻撃」があるか否かを判別する。イベント名に「攻撃」がある場合にはステップS92でインデックスに含まれるイベントの動作主はユーザのサポートチームであるか否かを判別する。イベントの動作主がユーザのサポートチームであればステップS93でイベント名に「ゴール」があるか否かを判別する。
イベント名に「ゴール」がある場合にはステップS94でテンプレート1からランダムに1つのコメントを選択して番組作成ブロック26に渡す。イベント名に「ゴール」がない場合にはステップS95でテンプレート2からランダムに1つのコメントを選択して番組作成ブロック26に渡す。
ここで、図15にテンプレートの一例を示す。例えばテンプレート1には、「ゴール、すばらしいシュートでした。」、「すばらしい得点シーンでした」、「やりました。ゴールです。」という3つのコメントがあり、この中から1つのコメントがランダムに選択される。
ステップS92でイベントの動作主がユーザのサポートチームでない場合には、ステップS96でイベント名に「ゴール」があるか否かを判別する。イベント名に「ゴール」がある場合にはステップS97でテンプレート3からランダムに1つのコメント(例えば「敵に点が入りましたが、まだ時間はあります。」等)を選択して番組作成ブロック26に渡す。イベント名に「ゴール」がない場合にはステップS98でテンプレート4からランダムに1つのコメント(例えば「良い守りでした。」等)を選択して番組作成ブロック26に渡す。
ステップS91でイベント名に「攻撃」がない場合には、ステップS100でイベント名に「ファール」があるか否かを判別する。イベント名に「ファール」がある場合にはステップS101でインデックスに含まれるイベントの動作主はユーザのサポートチームであるか否かを判別する。イベントの動作主がユーザのサポートチームであればステップS102でテンプレート5からランダムに1つのコメント(例えば「きわどい反則でした。」等)を選択して番組作成ブロック26に渡す。イベントの動作主がユーザのサポートチームでない場合にはステップS103でテンプレート6からランダムに1つのコメント(例えば「ひどいプレーですね。」等)を選択して番組作成ブロック26に渡す。
ステップS100でイベント名に「ファール」がない場合にはステップS104でインデックスに含まれるイベントの動作主はユーザのサポートチームであるか否かを判別する。イベントの動作主がユーザのサポートチームであればステップS105でテンプレート7からランダムに1つのコメント(例えば「ナイスプレーです。」等)を選択して番組作成ブロック26に渡す。イベントの動作主がユーザのサポートチームでない場合にはステップS106でテンプレート8からランダムに1つのコメント(例えば「敵のプレーでした。」等)を選択して番組作成ブロック26に渡す。
番組作成ブロック26は、要約生成ブロック22から供給される映像情報(要約の実況映像)と、映像コメント生成ブロック24から供給されるコメント(テキスト)を素材データとして保持する。また、番組作成ブロック26には、CG(Computer Graphics)モデルやCGキャスタの素材データ、例えばTVML(TV Program Making Language)によって記述されている番組台本テンプレートの素材データ、音楽の素材データ等が予め保持されている。
番組作成ブロック26は、特願2001−351512に記載した番組作成用プロファイル生成装置及び番組自動作成装置(視聴端末)に相当する機能を有しており、保持している複数の素材データを組み合わせることにより番組コンテンツを生成する。
この番組コンテンツによって、インデックスの実況シーンの映像を要約として出力装置12のディスプレイに表示する。これに続いて、その実況シーンに対するコメントをディスプレイに表示されたCGキャスタが合成音声で出力して解説する。上記の実況シーンの表示とCGキャスタによる解説は、要約生成ブロック22でインデックスを抽出した順に行われる。
このように、映像の意味的なグループ化を自動で行い、イベントを正確に抽出することにより、番組を放送中にリアルタイムで要約を作成することができ、番組を途中から見始めた視聴者用に、それまでの試合の要約を受信機側で作成することができ、デジタル放送のサービスとして利用できる。
なお、上記実施形態では、サッカー番組の映像から重要なイベントを抽出して要約を作成することを例に説明しているが、サッカー番組に限定されるものではない。例えば、図16に示すような自然紀行番組での番組ナレーションの字幕テキストについて、映像に映っている事項を説明する映像記述文と補足的な説明を行う補足説明文を判定し、映像記述文のグループからイベントキーワードを抽出し、予め登録されているイベント重要度を基に要約の映像を生成し、この要約に続く補足説明文からコメントを生成するものであっても良い。
図16では、先頭に判定結果(映像記述文/補足説明文)、次に字幕テキスト文、最後にタイムコード(時刻とフレーム数)を示している。なお、この場合には、学習データ及びイベントキーワード及びイベント重要度それぞれを自然紀行番組用のものに設定する必要がある。
なお、実況文または映像記述文が請求項記載の直接関連文に対応し、解説文または補足説明文が非直接関連文に対応し、字幕テキスト解析部36が判定手段に対応し、字幕データ利用コメント生成部52が文利用コメント生成手段に対応し、テンプレート利用コメント生成部54がテンプレート利用コメント生成手段に対応し、インデックス蓄積部46がインデックス蓄積手段に対応する。
本発明の要約生成装置のハードウェア構成を示す一実施形態のブロック図である。 本発明の映像コメント生成装置を適用した要約・解説作成システムの一実施形態の機能構成図である。 トランスポートストリームの構成の例を示す概念図である。 トランスポートストリームのデータ構造を示す図である。 字幕テキストの一実施形態を示す図である。 字幕テキスト解析処理のフローチャートである。 判定結果を付加した字幕テキストの一実施形態を示す図である。 セグメント付加処理のフローチャートである。 サッカー1試合分のイベント抽出結果を示す図である。 要約生成処理のフローチャートである。 解析された字幕テキストの他の実施形態を示す図である。 映像コメント生成処理のフローチャートである。 コメント判定処理のフローチャートである。 テンプレート利用処理のフローチャートである。 テンプレートの一例を示す図である。 判定結果を付加した字幕テキストの他の実施形態を示す図である。
符号の説明
11 入力装置
13 出力装置
14 補助記憶装置
15 メモリ装置
16 演算処理装置
17 データベース
18 デジタルテレビジョンチューナ
19 システムバス
13 ドライブ装置
20 記録媒体
22 要約生成ブロック
24 映像コメント生成ブロック
26 番組作成ブロック
30 映像蓄積部
32 字幕テキストデータ抽出部
34 字幕テキスト蓄積部
36 字幕テキスト解析部
38 学習データ格納部
40 セグメント付加部
42 イベント抽出部
44 イベントキーワード格納部
46 インデックス蓄積部
48 要約生成部
50 イベント重要度格納部
52 字幕データ利用コメント生成部
54 テンプレート利用コメント生成部

Claims (7)

  1. 音声を含む映像と前記音声のテキストそれぞれを供給され、供給されたテキストの各文が前記映像の内容と直接的に関連する直接関連文であるか、もしくは、映像内容と直接的に関連しない非直接関連文であるかを判定する判定手段と、
    非直接関連文グループを構成するテキストの各文から映像を適切に説明する文を抽出しコメントを生成する文利用コメント生成手段を
    有することを特徴とする映像コメント生成装置。
  2. 請求項1記載の映像コメント生成装置において、
    前記文利用コメント生成手段で映像を適切に説明する文が抽出されなかったとき予め用意されているテンプレートからコメントを生成するテンプレート利用コメント生成手段を
    有することを特徴とする映像コメント生成装置。
  3. 請求項1または2記載の映像コメント生成装置において、
    直接関連文グループを構成するテキストの各文からイベントキーワードと一致するイベント名とイベントの動作主を抽出し直接関連文グループのインデックスとして蓄積するインデックス蓄積手段を有し、
    前記文利用コメント生成手段は、前記非直接関連文グループの各文における、前記非直接関連文グループの直前の直接関連文グループから抽出されたインデックスの存在状況に基づいて、映像を適切に説明する文を抽出することを特徴とする映像コメント生成装置。
  4. 請求項3記載の映像コメント生成装置において、
    前記テンプレート利用コメント生成手段は、ユーザ情報と前記非直接関連文グループの直前の直接関連文グループから抽出されたインデックスに基づいて、テンプレートを選択しコメントを生成することを特徴とする映像コメント生成装置。
  5. 請求項1乃至4のいずれか記載の映像コメント生成装置において、
    前記直接関連文は映像記述文であり、前記非直接関連文は補足説明文であることを特徴とする映像コメント生成装置。
  6. コンピュータを、
    音声を含む映像と前記音声のテキストそれぞれを供給され、供給されたテキストの各文が前記映像の内容と直接的に関連する直接関連文であるか、もしくは、映像内容と直接的に関連しない非直接関連文であるかを判定する判定手段、
    非直接関連文グループを構成するテキストの各文から映像を適切に説明する文を抽出しコメントを生成する文利用コメント生成手段、
    として機能させるための映像コメント生成プログラム。
  7. 請求項6記載の映像コメント生成プログラムにおいて、
    コンピュータを、
    前記文利用コメント生成手段で映像を適切に説明する文が抽出されなかったとき予め用意されているテンプレートからコメントを生成するテンプレート利用コメント生成手段、
    として機能させるための映像コメント生成プログラム。
JP2003407355A 2003-12-05 2003-12-05 映像コメント生成装置及びそのプログラム Expired - Fee Related JP4323937B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003407355A JP4323937B2 (ja) 2003-12-05 2003-12-05 映像コメント生成装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003407355A JP4323937B2 (ja) 2003-12-05 2003-12-05 映像コメント生成装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2005165941A true JP2005165941A (ja) 2005-06-23
JP4323937B2 JP4323937B2 (ja) 2009-09-02

Family

ID=34729426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003407355A Expired - Fee Related JP4323937B2 (ja) 2003-12-05 2003-12-05 映像コメント生成装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP4323937B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009118168A (ja) * 2007-11-06 2009-05-28 Hitachi Ltd 番組録画再生装置、および、番組録画再生方法
JP2012039280A (ja) * 2010-08-05 2012-02-23 Nippon Hoso Kyokai <Nhk> 解説放送文作成支援装置及びプログラム
CN110326301A (zh) * 2017-03-21 2019-10-11 多玩国株式会社 反应选择装置、反应选择方法、以及反应选择程序
WO2023090040A1 (ja) * 2021-11-18 2023-05-25 ソニーグループ株式会社 コメント生成装置、コメント生成方法及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009118168A (ja) * 2007-11-06 2009-05-28 Hitachi Ltd 番組録画再生装置、および、番組録画再生方法
JP2012039280A (ja) * 2010-08-05 2012-02-23 Nippon Hoso Kyokai <Nhk> 解説放送文作成支援装置及びプログラム
CN110326301A (zh) * 2017-03-21 2019-10-11 多玩国株式会社 反应选择装置、反应选择方法、以及反应选择程序
US11064258B2 (en) 2017-03-21 2021-07-13 Dwango Co., Ltd. Reaction selection device, reaction selection method, and reaction selection program
WO2023090040A1 (ja) * 2021-11-18 2023-05-25 ソニーグループ株式会社 コメント生成装置、コメント生成方法及びプログラム

Also Published As

Publication number Publication date
JP4323937B2 (ja) 2009-09-02

Similar Documents

Publication Publication Date Title
JP4250301B2 (ja) 映像シーケンスを編集する方法及びシステム
JP4920395B2 (ja) 動画要約自動作成装置、方法、及びコンピュータ・プログラム
JP5010292B2 (ja) 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
JP6824399B2 (ja) 音声ガイド生成装置、音声ガイド生成方法及び放送システム
US7519618B2 (en) Metadata generating apparatus
JP4449216B2 (ja) 映像情報の編集方法及び編集装置
US20100005485A1 (en) Annotation of video footage and personalised video generation
US8307403B2 (en) Triggerless interactive television
US20070168864A1 (en) Video summarization apparatus and method
Babaguchi et al. Intermodal collaboration: A strategy for semantic content analysis for broadcasted sports video
JP2006287319A (ja) 番組ダイジェスト作成装置および番組ダイジェスト作成プログラム
CN110691271A (zh) 一种新闻视频生成方法、系统、装置和存储介质
Hua et al. Baseball scene classification using multimedia features
CN112995756A (zh) 短视频的生成方法及装置、短视频生成系统
JP4323937B2 (ja) 映像コメント生成装置及びそのプログラム
JP4359069B2 (ja) 要約生成装置及びそのプログラム
JP2006115052A (ja) コンテンツ検索装置とその入力装置、コンテンツ検索システム、コンテンツ検索方法、プログラム及び記録媒体
CN107688792B (zh) 一种视频翻译方法及其系统
JP6811811B1 (ja) メタデータ生成システム、映像コンテンツ管理システム及びプログラム
JPWO2004012100A1 (ja) コンテンツ要約装置及びコンテンツ要約プログラム
JP2008022292A (ja) 出演者情報検索システム、出演者情報取得装置、出演者情報検索装置、および、その方法ならびにプログラム
JP4538618B2 (ja) 字幕番組制作システムにおける表示単位字幕文の自動生成方法
JP2007519321A (ja) 視聴覚データストリームのマルチメディア要約を作成する方法及び回路
Li et al. Bridging the semantic gap in sports
CN112233647A (zh) 信息处理设备和方法以及计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090605

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140612

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees