JP4695582B2 - 映像抽出装置及び映像抽出プログラム - Google Patents

映像抽出装置及び映像抽出プログラム Download PDF

Info

Publication number
JP4695582B2
JP4695582B2 JP2006327532A JP2006327532A JP4695582B2 JP 4695582 B2 JP4695582 B2 JP 4695582B2 JP 2006327532 A JP2006327532 A JP 2006327532A JP 2006327532 A JP2006327532 A JP 2006327532A JP 4695582 B2 JP4695582 B2 JP 4695582B2
Authority
JP
Japan
Prior art keywords
video
telop
similarity
sentence
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006327532A
Other languages
English (en)
Other versions
JP2008141621A (ja
Inventor
吉彦 河合
伸行 八木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2006327532A priority Critical patent/JP4695582B2/ja
Publication of JP2008141621A publication Critical patent/JP2008141621A/ja
Application granted granted Critical
Publication of JP4695582B2 publication Critical patent/JP4695582B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、映像に付加された音声や字幕等に基づいて、映像から一部分を抽出する映像抽出装置及び映像抽出プログラムに関する。
大量に蓄積された映像からユーザが所望の映像を選択する方法として、録画時に付与した放送時間や番組タイトルなどの情報に基づいて選択する方法がある。ここで選択された映像が本当に所望のものかを確認するためには、早送りや巻き戻しなどの操作によって映像の内容を確認する必要がある。
更に、ユーザがタイトルなどの情報を覚えていない場合には、映像をひとつずつ確認するしかない。そして、従来、ユーザに対して複数の映像を表示画面上において一覧提示する方法として、画面内に各番組映像の代表フレームを並べて表示するものがある。また、代表フレームの代わりに、番組の冒頭部分の数分間の映像を再生して表示する方法もある。これらの方法は、冒頭部分のフレームや、冒頭から所定の時間間隔の映像のように、予め設定された単純な物理量に基づいて選択された番組映像の一部分のみを表示するものである。更に、番組映像の一部ではなく、内容全体を効率的に提示する方法として、映像の動き情報に基づいて一部のシーンを早送りしながら映像全体を再生するものがある(非特許文献1参照)。
「プラットフォームビジネスアリーナ 情報大航海」カタログ、p.6、2006年10月3日〜7日、CEATEC JAPAN 2006で配布
しかしながら、代表フレームや冒頭の映像を提示するものでは、提示される画像や映像は、映像の内容を考慮して抽出されたものではないため、当該映像の内容を示す画像や映像にはならないことも多い。そのため、ユーザが、提示された画像や映像から番組の内容を勘案して映像を選択することができなかった。
また、一部を早送りして映像全体を再生する方法では、各番組について、表示される映像の長さが長くなるため、所望の番組を確認するまでに時間がかかってしまう。また、早送りするシーンの選択は、映像の動きベクトルの大きさという物理量に基づくため、番組の意味や内容は考慮されないという問題がある。更に、番組の選択のための提示において映像全体を再生してしまっては、改めて番組映像を視聴する意味が薄れてしまう。また、同時に複数の番組を並べて提示する装置においては、1番組当たりの情報量が多くなるため、計算負荷が大きいという問題もある。
本発明は、前記従来技術の問題を解決するために成されたもので、映像の内容に基づいて、当該映像の一部分の画像もしくは映像を抽出した映像を生成することができる映像抽出装置及び映像抽出プログラムを提供することを目的とする。
前記課題を解決するため、請求項1に記載の映像抽出装置は、映像を入力し、当該映像に付加された音声データ及び字幕の情報の少なくともひとつに基づいて、当該映像の一部分を抽出する映像抽出装置であって、映像付加単位データ生成手段と、他映像類似度算出手段と、部分映像抽出手段と、テロップ単位データ生成手段と、テロップ類似度算出手段とを備え、前記部分映像抽出手段が、前記他映像類似度算出手段によって算出された他映像類似度と、前記テロップ類似度算出手段によって算出されたテロップ類似度とに基づいて前記映像付加単位データを選定する構成とした。
かかる構成によれば、映像抽出装置は、映像付加単位データ生成手段によって、映像に付加された音声データ及び字幕の情報の少なくともひとつをテキストデータとし、このテキストデータを所定の単位に分割して、この単位ごとに映像における区間に対応させた映像付加単位データを生成する。
また、映像抽出装置は、他映像類似度算出手段によって、映像付加単位データについて所定の特徴量を解析する。そして、映像抽出装置は、他映像類似度算出手段によって、この解析結果と、複数の他の映像に対して生成された当該他の映像の内容の要約を示すテキストデータである他映像要約テキストデータについて解析された所定の特徴量の解析結果とに基づいて、他映像要約テキストデータと特徴量が類似する度合いを示す他映像類似度を算出する。更に、映像抽出装置は、部分映像抽出手段によって、他映像類似度に基づいて映像付加単位データを選定して、この映像付加単位データに対応する映像の区間を検出し、この区間の映像を抽出する。
これによって、映像抽出装置は、他映像要約テキストデータとの所定の特徴量の類似度に基づいて映像付加単位データを選定し、この映像付加単位データに対応する区間の映像を抽出した映像を生成することができる。
これによって、映像抽出装置は、他映像要約テキストデータとの所定の特徴量の類似度、及び、対応する映像区間内に表示されたテロップとスポット映像内のテロップとの所定の特徴量の類似度に基づいて、映像付加単位データを選定し、この映像付加単位データに対応する区間の映像を抽出した映像を生成することができる。
更に、請求項に記載の映像抽出プログラムは、映像を入力し、当該映像に付加された音声データ及び字幕の情報の少なくともひとつに基づいて、当該映像の一部分を抽出するためにコンピュータを、映像付加単位データ生成手段、他映像類似度算出手段、部分映像抽出手段、テロップ単位データ生成手段、テロップ類似度算出手段として機能させることとした。
かかる構成によれば、映像抽出プログラムは、映像付加単位データ生成手段によって、映像に付加された音声データ及び字幕の情報の少なくともひとつをテキストデータとし、このテキストデータを所定の単位に分割して、この単位ごとに映像における区間に対応させた映像付加単位データを生成する。また、映像抽出プログラムは、他映像類似度算出手段によって、映像付加単位データについて所定の特徴量を解析して、この解析結果と、複数の他の映像に対して生成された当該他の映像の内容の要約を示すテキストデータである他映像要約テキストデータについて解析された所定の特徴量の解析結果とに基づいて、他映像要約テキストデータと特徴量が類似する度合いを示す他映像類似度を算出する。更に、映像抽出プログラムは、部分映像抽出手段によって、他映像類似度に基づいて映像付加単位データを選定して、この映像付加単位データに対応する映像の区間を検出し、この区間の映像を抽出する。
これによって、映像抽出プログラムは、他映像要約テキストデータとの所定の特徴量の類似度に基づいて映像付加単位データを選定し、この映像付加単位データに対応する区間の映像を抽出した映像を生成することができる。
本発明に係る映像抽出装置及び映像抽出プログラムでは、以下のような優れた効果を奏する。
請求項1及び請求項2に記載の発明によれば、複数の他の映像の要約を示すテキストデータの所定の特徴量が類似する箇所を音声や字幕のテキストデータから抽出し、この箇所に対応する区間の映像を抽出した映像を生成することができる。ここで、映像の要約文では、具体的な数値を示したり、シーンの内容を強調したりするために、特徴的な用語や言い回しが用いられることが多い。そのため、映像内の音声や字幕において要約文に類似する用語や言い回しが使用される箇所に、この映像の要約に相当するシーンが含まれることが想定される。これによって、入力された映像から、音声や字幕のテキストデータにおいて、複数の他の映像の要約を示すテキストデータと比較して所定の特徴量が類似する部分を抽出して、当該映像の要約に相当する映像を生成することができる。
更に、入力された映像の要約のテキストデータがなくても、当該映像の要約映像を自動で生成することができるとともに、もとの映像の一部のみを抽出して要約映像を生成するため、ユーザに対して短時間で要約を提示することができる要約映像を自動で生成できる。また、複数の映像についての要約映像を提示する場合にも情報量が少なくなり、計算負荷を減らすことができる。
そして、映像内の音声又は字幕の情報に加えて、テロップの情報も利用して、当該映像の要約に相当する映像を生成することができる。そのため、人手によって生成された要約映像(スポット映像)に近い要約映像を自動で生成することができる。
以下、本発明の実施の形態について図面を参照して説明する。
[映像抽出装置の構成]
まず、図1を参照して、本発明における映像抽出装置1の構成について説明する。図1は、本発明における映像抽出装置の構成を示したブロック図である。
映像抽出装置1は、番組紹介文に基づいて、当該映像に付加された字幕(CC;クローズドキャプション)のテキストデータ(以下、CCテキストデータと言う)、当該映像の音声データを音声変換したテキストデータ(以下、音声テキストデータと言う)もしくは映像内のテロップ(文字スーパ)のテキストデータ(以下、テロップテキストデータと言う)のうち、当該番組紹介文に類似する部分のテキストデータに対応する区間の映像を番組紹介映像として抽出して、番組紹介映像を生成するものである。ここで、映像抽出装置1は、字幕情報抽出手段10と、音声認識手段11と、テロップ抽出手段12と、電子番組表取得手段13と、番組紹介映像生成手段14とを備える。
字幕情報抽出手段(映像付加単位データ生成手段)10は、外部から入力された映像に付加されたCCのテキストデータを抽出するものである。ここで抽出されたCCテキストデータは、番組紹介映像生成手段14の紹介文類似度算出部14aに出力される。このCCテキストデータは、複数のCC文(映像付加単位データ)に分割され、各CC文には、タイムコードの情報が対応付けられている。そして、この各CC文は、タイムコードによって示される時刻を始点とする映像の音声のテキストデータである。なお、この字幕情報抽出手段10は、入力された映像にCCテキストデータが付加されていないと判断した場合には、入力された映像の音声を音声認識手段11に出力する。
音声認識手段(映像付加単位データ生成手段)11は、字幕情報抽出手段10から入力された音声を認識処理し、CCテキストデータの代替情報となる音声テキストデータを生成するものである。ここで生成された音声テキストデータは、番組紹介映像生成手段14の紹介文類似度算出部14aに出力される。ここでは、音声認識手段11は、音声認識した音声テキストデータを複数の文字列[以下、音声認識文(映像付加単位データ)と言う]に分割して、各音声認識文には当該音声が再生される開始時刻及び終了時刻の情報を対応付けることとした。なお、音声テキストデータは、1文ごとに分割されることとしてもよいし、1文が所定の字数を超えた場合には更に途中の文節で分割されることとしてもよい。
テロップ認識手段12は、映像中に表示されるテロップの認識を行うものである。このテロップ認識手段12は、映像中にテロップが表示されたときに、表示された文字映像に対してOCR(Optical Character Reader)処理を行い、処理結果の各文字列(以下、テロップ認識文と言う)に、このテロップが表示された時刻の情報を対応付ける。ここで生成された処理結果であるテロップテキストデータは、番組紹介映像生成手段14の紹介文類似度算出部14aに出力される。
電子番組表取得手段13は、録画時にユーザによって入力された映像の番組タイトル、放送時刻、放送チャンネルなどの情報から、電子番組表の情報を取得するものである。ここで、電子番組表取得手段13は、電子番組表から該当する番組の番組紹介文の情報[以下、EPGテキストデータ(要約テキストデータ)と言う]を取得する。ここで取得されたEPGテキストデータは、番組紹介映像生成手段14の紹介文類似度算出部14aに出力される。
ここでは、電子番組表取得手段13は、ユーザから映像の番組タイトル、放送時刻、放送チャンネルなどの情報が入力されなかった場合には、テロップ認識手段12で認識された情報(例えば、番組タイトル)に基づいて、電子番組表を取得することとした。電子番組表取得手段13は、入力ストリームから電子番組表を取得することとしてもよいし、そこから取得できない場合には、インターネット等を介して取得することとしてもよい。そして、電子番組表取得手段13は、EPGテキストデータが取得できなかった場合には、番組紹介映像生成手段14の紹介文類似度算出部14aにEPGテキストデータを取得できなかった旨を通知する信号を出力する。
番組紹介映像生成手段14は、番組紹介文の情報と、字幕情報抽出手段10、音声認識手段11及びテロップ認識手段12から入力されたCCテキストデータ、音声テキストデータ及びテロップテキストデータとに基づいて、外部から入力された映像の一部を抽出して番組紹介映像を生成するものである。番組紹介映像生成手段14は、紹介文類似度算出部14a、他番組紹介文類似度算出部14b及び番組紹介映像抽出部14cを備える。
紹介文類似度算出部(類似度算出手段)14aは、字幕情報抽出手段10、音声認識手段11及びテロップ認識手段12から入力されたCCテキストデータ、音声テキストデータ及びテロップテキストデータにおいて、電子番組表取得手段13で取得されたEPGテキストデータに含まれる単語(形態素)の出現する頻度に基づいて、EPGテキストデータと、各CC文、音声認識文及びテロップ認識文とが類似する度合いを示す類似度を算出するものである。ここで算出された類似度は、番組紹介映像抽出部14cに出力される。なお、紹介文類似度算出部14aは、電子番組表取得手段13からEPGテキストデータを取得できなかった旨を通知する信号を入力した場合には、CCテキストデータ、音声テキストデータ及びテロップテキストデータを他番組紹介文類似度算出部14bに出力する。
以下、紹介文類似度算出部14aが類似度を算出する方法の例について説明する。ここでは、紹介文類似度算出部14aは、字幕情報抽出手段10からCCテキストデータが入力された場合には、テロップ認識手段12から入力されたテロップテキストデータから、当該CCテキストデータの各CC文に対応する映像の区間内に表示されたテロップ認識文を探索して、CC文とテロップ認識文との組を生成する。なお、紹介文類似度算出部14aは、各CC文の区間の終了時間を、例えば、話速に基づいて、CC文の字数から当該区間の時間を算出して、対応付けられたタイムコードによって示される当該区間の開始時間に加算することで求めることが可能である。このとき、紹介文類似度算出部14aは、CCテキストデータから1つの文が所定の字数を超え、所定の字数以内に分割されたCC文を選択し、このCC文のタイムコードと、当該CC文の字数と、次のCC文のタイムコードとに基づいて、この2つのタイムコードによって示される時刻の間にこの字数分の音声が出力されることとして話速を算出することができる。
また、ここでは、紹介文類似度算出部14aに字幕情報抽出手段10からCCテキストデータが入力されない場合には音声認識手段11から音声テキストデータが入力され、紹介文類似度算出部14aは、テロップ認識手段12から入力されたテロップテキストデータから、当該音声テキストデータの各音声認識文に対応する映像の区間内に表示されたテロップ認識文を探索して、音声認識文とテロップ認識文との組を生成する。
そして、紹介文類似度算出部14aは、CC文とテロップ認識文との組もしくは音声認識文とテロップ認識文との組について、EPGテキストデータを構成する各文(以下、EPG文と言う)に含まれるそれぞれの単語の出現頻度に基づいて類似度を算出する。ここでは、紹介文類似度算出部14aは、TFIDF[TF;Term Frequency(語彙頻度)、IDF;Inverse Document Frequency(文書頻度の逆数)]値を要素とした特徴ベクトルの余弦を用いて類似度を算出することとした。以下、紹介文類似度算出部14aが、CC文とテロップ認識文との組について類似度を算出する場合について説明するが、紹介文類似度算出部14aは、音声認識文とテロップ認識文との組について類似度を算出する場合には、CC文を音声認識文と置き換えて同様に算出することができる。
ここで、特徴ベクトルのi番目の要素は、ある単語wのTFIDF値となる。ここで、ある文S1の特徴ベクトルをv、ある文S2の特徴ベクトルをvとしたとき、文S1と文S2の類似度δ(v,v)は以下の式(1)のように算出することができる。
Figure 0004695582
ここで、vjiは、特徴ベクトルvのi番目の要素を表す。また、ある単語wのTFIDF値tfidf(w)は、以下の式(2)によって算出することができる。
Figure 0004695582
ここで、tf(w)は文に含まれる単語wの総数、df(w)は単語wが含まれるCC文の総数、NはCC文の総数を表す。そして、あるCC文と、その映像の区間内に表示されたテロップのテロップ認識文とについて、あるEPG文との類似度Simは、以下の式(3)によって算出することができる。
Figure 0004695582
ここで、vcc、vsp及びvepgは、それぞれCC文、テロップ認識文及びEPG文から作成した特徴ベクトルを表す。以上のようにして、紹介文類似度算出部14aは、EPG文と、CC文及びテロップ認識文の組との類似度を算出することができる。
なお、紹介文類似度算出部14aによる類似度の算出方法はこの方法に限定されず、例えば、特徴ベクトルの要素を頻度(TF)として類似度を算出することとしてもよいし、特徴ベクトルの距離を用いて類似度を算出することとしてもよい。更に、紹介文類似度算出部14aは、各単語について予め重みを設定しておき、それぞれ重みを付けて類似度を算出することとしてもよい。このように重みを設定すると、紹介文類似度算出部14aは、例えば、助詞や助動詞や句読点のようにその映像の内容とは関連性が低いことが想定される単語の重みを小さくし、予め重要性が高いと判断された単語の重みを大きく設定することで、単語の重要性を考慮して類似度を算出することができる。
他番組紹介文類似度算出部(他映像類似度算出手段)14bは、外部から入力された複数の他の映像の番組紹介文である他番組紹介文(他映像要約テキストデータ)の特徴量に基づいて、字幕情報抽出手段10及び音声認識手段11から入力された各CC文及び音声認識文と、他番組紹介文との特徴量が類似する度合いを示す類似度(他映像類似度)を算出するものである。更に、他番組紹介文類似度算出部(テロップ類似度算出手段)14bは、外部から入力された複数の他の映像のスポット映像(番組紹介映像)の特徴量に基づいて、テロップ認識手段12から入力された各テロップ文及び当該テロップ文に対応する区間の映像のテロップと、スポット映像内のテロップとの特徴量が類似する度合いを示す類似度(テロップ類似度)を算出するものでもある。更に、ここでは、他番組紹介文類似度算出部14bは、他番組紹介文と類似する度合いを示す類似度と、スポット映像内のテロップとの特徴量が類似する度合いを示す類似度とを統合した類似度を算出することとした。ここで算出された類似度は、番組紹介映像抽出部14cに出力される。
ここで、電子番組表等の番組紹介文は、通常、番組の魅力的なシーンについての内容を紹介するように記述されている。そして、その番組紹介文においては、具体的な数値を示したり、魅力的なシーンであることを強調したりするために、特徴的な用語や言い回しが用いられる。そこで、番組内において他番組紹介文に類似する用語や言い回しが使用される箇所には魅力的なシーンが含まれていると仮定して、このようなシーンを選択することとした。そのため、他番組紹介文類似度算出部14bは、他番組紹介文に用いられる特徴的な表現を示す特徴量を解析し、この結果に基づいて、CC文もしくは音声認識文と他番組紹介文との特徴量が類似するかを示す類似度を算出し、番組紹介映像抽出部14cが、この類似度に基づいて、他番組紹介文に類似するCC文もしくは音声認識文に対応する箇所の映像を番組紹介映像として抽出することとした。
更に、他番組紹介文類似度算出部14bは、過去の番組のスポット映像でテロップが使用されていたシーンにおいて、どのようなテロップが表示されていたかを学習して、類似度の算出に利用することとした。そして、他番組紹介文類似度算出部14bは、CC文もしくは音声認識文に基づいて算出された類似度と、テロップ文に基づいて算出された類似度との重み付き和を用いて、最終的な類似度を算出することとした。
このように、他番組紹介文類似度算出部14bは、外部から入力された映像についてのEPGテキストデータが電子番組表取得手段13によって取得することができなかった場合でも、過去の映像についての複数の番組紹介文の特徴量に基づいて類似度を算出することができる。これによって、EPGテキストデータがなかったり、番組タイトルや放送日が取得できなかったりして、映像のEPGテキストデータが取得できなくても、後記する番組紹介映像抽出部14cによって、当該映像を紹介するための番組紹介映像を生成することができる。
以下、他番組紹介文類似度算出部14bが類似度を算出する方法の例について説明する。ここでは、他番組紹介文類似度算出部14bは、AdaBoost([Freund 1996] Y. Freund and R. E. Schapire, "A decision-theoretic generalization of on-line learning and application to boosting", Journal of Computer and System Science, Vol.55, No.1, pp.119-139, 1996)による機械学習を予め行い、所定の特徴量を解析する複数の弱識別器(図示せず)を構成することとした。
ここで、他番組紹介文類似度算出部14bは、紹介文類似度算出部14aからCCテキストデータとテロップテキストデータとが入力された場合には、テロップテキストデータから、CCテキストデータの各CC文に対応する映像の区間内に表示されたテロップ認識文を探索して、CC文とテロップ認識文(テロップ単位データ)との組を生成する。また、他番組紹介文類似度算出部14bは、紹介文類似度算出部14aから音声テキストデータとテロップテキストデータが入力された場合には、テロップテキストデータから、音声テキストデータの各音声認識文に対応する映像の区間内に表示されたテロップ認識文を探索して、音声認識文とテロップ認識文(テロップ単位データ)との組を生成する。なお、特許請求の範囲に記載のテロップ単位データ生成手段は、テロップ認識手段12と、他番組紹介文類似度算出部14bとに相当する。
まず、他番組紹介文類似度算出部14bがCC文もしくは音声認識文に基づいて類似度を算出する方法について説明する。ここでは、他番組紹介文類似度算出部14bは、複数の過去の番組の番組紹介文の各文を正例、CCの各文を負例としてAdaBoostによって学習し、弱識別器を生成することとした。入力された複数の過去の番組の番組紹介文及びCCの各文に対して、形態素数(文長)が所定の閾値以上か閾値未満か、所定の品詞が含まれるか否か、所定の索引語が含まれるか否か、及び、所定の固有表現が含まれるか否かの4つの特徴量を解析して、その特徴量に基づいて番組紹介文かCCかを識別する弱識別器を構成するとことした。ここで、索引語は、形態素と品詞の組とする。また、固有表現は、IREX(Information Retrieval and Extraction Exercise)で定義された組織名、人名、地名、固有物名、日付表現、時間表現、金額表現及び割合表現の8種類とした。
以下、AdaBoostの学習アルゴリズムについて説明する。ここで、他番組紹介文類似度算出部14bに、学習データとして(x、y)、…、(x、y)、…、(x、y)が入力されたとする。ここで、x(i=1〜n)は、過去の番組の番組紹介文及びCCの各文であり、xが正例のときはy=1、負例のときはy=0である。そうすると、他番組紹介文類似度算出部14bは、弱識別器の候補ht,1、ht,2、…、ht,mを生成する。ここでは、弱識別器の候補ht,j(j=1〜m)は、以下の式(4)のように表される。なお、fはj番目の特徴量、θは閾値を表す。更に、sは不等号の向きを制御する値で{1,−1}である。ここで、他番組紹介文類似度算出部14bは、重みw1,i←1/nに初期化して、t=1とする。
Figure 0004695582
そして、他番組紹介文類似度算出部14bは、以下の式(5)に示すようにwt,iを正規化する。そして、他番組紹介文類似度算出部14bは、各弱識別器の候補ht,1、ht,2、…、ht,mのエラー率εt,j(j=1〜m)を以下の式(6)によって算出して、エラー率εt,j(j=1〜m)の最小値となる弱識別器を選択する。ここで、エラー率εt,j(j=1〜m)の最小値をε、このときの弱識別器をhとする。これによって、最もエラーの少ない弱識別器hが選ばれる。更に、他番組紹介文類似度算出部14bは、以下の式(7)に従って重みwt+1,iを算出して、選択された弱識別器において誤ったデータに対して大きな重みを与える。
Figure 0004695582
Figure 0004695582
Figure 0004695582
そして、他番組紹介文類似度算出部14bは、この処理をt=1〜Tまで繰り返す。これによって、他番組紹介文類似度算出部14bは、T個の弱識別器h(t=1〜T)を選択し、それぞれの弱識別器hの信頼度αの値を算出することができる。そして、T個の弱識別器h(t=1〜T)から構成される識別器h(x)は、以下の式(8)によって示される。
Figure 0004695582
ここでは、他番組紹介文類似度算出部14bは、紹介文類似度算出部14aから入力されたCC文もしくは音声認識文を入力し、前記の学習によって生成された弱識別器を用いてそれぞれの弱識別器hの信頼度αを算出し、信頼度αの和をCC文もしくは音声認識文に基づく類似度(他映像類似度)とした。
続いて、他番組紹介文類似度算出部14bがテロップ文に基づいて類似度を算出する方法について説明する。他番組紹介文類似度算出部14bは、テロップによる類似度の算出についても、AdaBoostによって学習して弱識別器を生成することとした。学習データには、複数の過去の番組のスポット映像で使用された映像区間とその際に表示されたテロップを正例、スポット映像に使用されなかった映像区間とその際に表示されたテロップを負例として使用する。
ここでは、他番組紹介文類似度算出部14bは、過去の番組の各映像区間に対して、テロップが表示されているか否か、テロップで表示された文字列がタイトルもしくはサブタイトルに含まれるか否か、文字列の大きさが閾値以上か閾値未満か、文字数が閾値以上か閾値未満か、及び、文字の表示座標が閾値以上か閾値未満かの5つの特徴量を解析して、前記の式(4)〜(8)に基づいて、スポット映像に用いられた映像区間を識別する弱識別器を構成する。
ここでは、他番組紹介文類似度算出部14bは、紹介文類似度算出部14aから入力されたテロップ文を入力し、前記の学習によって生成された弱識別器を用いてそれぞれの弱識別器hの信頼度αを算出し、信頼度αの和をテロップ文に基づく類似度(テロップ類似度)とした。
そして、他番組紹介文類似度算出部14bは、CC文もしくは音声認識文に基づく類似度をF、テロップに基づく類似度をFとすると、これらを組み合わせた類似度Fは、以下の式(9)のようになる、
Figure 0004695582
ここで、a、bは重みであり、それぞれの識別器の識別能力によって決定することとした。具体的には、重みaは、番組紹介文を識別する識別器をhepgとしたとき、以下の式(10)によって算出できる。
Figure 0004695582
ここで、xは学習データを表し、xが正例ならy=1、負例ならy=0とする。式(10)では、誤って識別された学習データの数によって重みaを決定している。重みbも、スポット映像を識別する識別器について同様にして算出することができる。なお、重みa、bは所定値とすることとしてもよい。
なお、他番組紹介文類似度算出部14bは、このAdaBoostによる学習での弱識別器に限定されず、例えば、サポートベクタマシーン(SVM;V. N. Vapnik, "The nature of statistical learning theory", Springer-Verlag, 1995)による機械学習を予め行い、所定の特徴量を解析する複数の超平面を構成することとしてもよい。
番組紹介映像抽出部(部分映像抽出手段)14cは、紹介文類似度算出部14aもしくは他番組紹介文類似度算出部14bによって算出された類似度に基づいて、外部から入力された映像からその一部を抽出して番組紹介映像を生成するものである。ここで生成された番組紹介映像は外部に出力される。
ここで、番組紹介映像抽出部14cは、電子番組表取得手段13によってEPGテキストデータが抽出された場合には、各EPG文について、紹介文類似度算出部14aで算出された類似度が最大のCC文とテロップ認識文との組もしくは音声認識文とテロップ認識文との組を選択し、それらに対応する映像区間を外部から入力された映像から抽出して、番組紹介映像を生成する。また、番組紹介映像抽出部14cは、電子番組表取得手段13によってEPGテキストデータが抽出されない場合には、CC文とテロップ認識文との組もしくは音声認識文とテロップ認識文との組のうち、他番組紹介文類似度算出部14bで算出された類似度の大きいものから順にn個選択し、それらに対応する映像区間を外部から入力された映像から抽出して、番組紹介映像を生成する。選択数nは、生成される番組紹介映像の長さが予め決めた長さに達するまでとしてもよいし、予め定めた固定値としてもよい。なお、番組紹介映像抽出部14cは、選択された映像区間の各々から更に一部分の区間の映像、もしくは、静止画像を抽出して、番組抽出映像を生成することとしてもよい。
以上によって、映像抽出装置1は、映像の内容を示すCCテキストデータもしくは音声テキストデータに基づいて番組紹介映像を生成することができる。なお、映像抽出装置1は、コンピュータにおいて各手段を各機能プログラムとして実現することも可能であり、各機能プログラムを結合して、映像抽出プログラムとして動作させることも可能である。
[映像抽出装置の動作]
次に、図2から図4を参照して、映像抽出装置1の動作について説明する。まず、図2を参照(適宜図1参照)して、映像抽出装置1の動作について説明する。図2は、本発明の映像抽出装置が番組紹介映像を生成する動作を示したフローチャートである。
映像抽出装置1は、字幕情報抽出手段10、テロップ認識手段12及び番組紹介映像生成手段14によって、外部から映像を入力するとともに、電子番組表取得手段13によって映像の番組タイトル、放送時刻、放送チャンネルなどの情報を入力する(ステップS10)。続いて、映像抽出装置1は、字幕情報抽出手段10によって、ステップS10において入力された映像にCCテキストデータが付加されているかを判断する(ステップS11)。そして、付加されている場合には(ステップ11でYes)、映像抽出装置1は、字幕情報抽出手段10によってCCテキストデータを抽出するとともに、テロップ認識手段12によってテロップテキストデータを抽出する(ステップS12)。
一方、付加されていない場合には(ステップ11でNo)、映像抽出装置1は、音声認識手段11によって音声認識して音声テキストデータを生成するとともに、テロップ認識手段12によってテロップテキストデータを抽出する(ステップS13)。
続いて、映像抽出装置1は、電子番組表取得手段13によって、ステップS10において入力された映像の番組タイトル、放送時刻、放送チャンネルなどの情報に基づいて、EPGテキストデータを取得できるか否かを判断する(ステップS14)。そして、取得できる場合(ステップS14でYes)には、映像抽出装置1は、電子番組表取得手段13によって、EPGテキストデータを取得する(ステップS15)。そして、映像抽出装置1は、紹介文類似度算出部14a及び番組紹介映像抽出部14cによって、後記するEPG番組紹介映像生成動作によって番組紹介映像を生成する(ステップS16)。
一方、取得できない場合(ステップS14でNo)には、映像抽出装置1は、他番組紹介文類似度算出部14b及び番組紹介映像抽出部14cによって、後記する番組紹介映像生成動作によって番組紹介映像を生成する(ステップS17)。
そして、映像抽出装置1は、番組紹介映像抽出部14cによって、ステップS16もしくはステップS17において生成された番組紹介映像を外部に出力し(ステップS18)、動作を終了する。
(EPG番組紹介映像生成動作)
続いて、図3を参照(適宜図1及び図2参照)して、紹介文類似度算出部14a及び番組紹介映像抽出部14cによって番組紹介文を生成する動作(EPG番組紹介映像生成動作)について説明する。図3は、EPG番組紹介映像生成動作を示したフローチャートである。
映像抽出装置1は、紹介文類似度算出部14aによって、ステップS15(図2参照)において取得されたすべてのEPG文について番組紹介映像の抽出が終了したかを判断する(ステップS30)。そして、終了した場合には(ステップ30でYes)、そのまま動作を終了する。一方、終了していない場合には(ステップ30でNo)、映像抽出装置1は、紹介文類似度算出部14aによって、ステップS15において取得されたEPGテキストデータからひとつのEPG文を選択する(ステップS31)。
そして、映像抽出装置1は、紹介文類似度算出部14aによって、すべてのCC文もしくは音声認識文について、ステップS31において選択されたEPG文についての類似度の算出が終了したかを判断する(ステップS32)。そして、終了していない場合には(ステップ32でNo)、映像抽出装置1は、紹介文類似度算出部14aによって、ステップS12又はステップS13(図2参照)において抽出されたCCテキストデータ又は音声テキストデータからひとつのCC文又は音声認識文を選択する(ステップS34)。続いて、映像抽出装置1は、紹介文類似度算出部14aによって、選択されたCC文又は音声認識文の映像区間内に対応する、ステップS12又はステップS13において抽出されたテロップ文を選択する(ステップS35)。
そして、映像抽出装置1は、ステップS34及びステップS35において選択されたCC文又は音声認識文とテロップ文とについて、ステップS31において選択されたEPG文に対する類似度を算出し(ステップS36)、ステップS32に戻って、すべてのCC文もしくは音声認識文について、選択されたEPG文についての類似度の算出が終了したかを判断する動作以降の動作を行う。
一方、ステップS32において終了したと判断された場合には(ステップ32でYes)、映像抽出装置1は、番組紹介映像抽出部14cによって、ステップS36において算出された類似度のうち最大の類似度のCC文とテロップ認識文との組もしくは音声認識文とテロップ認識文との組を選択し、それらに対応する映像区間を、ステップS10(図2参照)において入力された映像から抽出して、番組紹介映像に追加し(ステップS33)、ステップS30に戻って、すべてのEPG文について番組紹介映像の抽出が終了したかを判断する動作以降の動作を行う。
(番組紹介映像生成動作)
続いて、図4を参照(適宜図1及び図2参照)して、他番組紹介文類似度算出部14b及び番組紹介映像抽出部14cによって番組紹介文を生成する動作(番組紹介映像生成動作)について説明する。図4は、番組紹介映像生成動作を示したフローチャートである。なお、ここでは、他番組紹介文類似度算出部14bのAdaBoostの学習による識別器がすでに生成されていることとする。
映像抽出装置1は、他番組紹介文類似度算出部14bによって、すべてのCC文もしくは音声認識文について、類似度の算出が終了したかを判断する(ステップS50)。そして、終了していない場合には(ステップ50でNo)、映像抽出装置1は、他番組紹介文類似度算出部14bによって、ステップS12又はステップS13(図2参照)において抽出されたCCテキストデータ又は音声テキストデータからひとつのCC文又は音声認識文を選択する(ステップS51)。続いて、映像抽出装置1は、他番組紹介文類似度算出部14bによって、選択されたCC文又は音声認識文の映像区間内に対応する、ステップS12又はステップS13において抽出されたテロップ文を選択する(ステップS52)。
そして、映像抽出装置1は、ステップS51及びステップS52において選択されたCC文又は音声認識文とテロップ文とについて、過去の番組の番組紹介文及びスポット映像に対する類似度を算出し(ステップS53)、ステップS50に戻って、すべてのCC文もしくは音声認識文について類似度の算出が終了したかを判断する動作以降の動作を行う。
一方、ステップS50において終了したと判断された場合には(ステップ50でYes)、映像抽出装置1は、番組紹介映像抽出部14cによって、ステップS53において算出された類似度をソートし(ステップ54)、類似度の大きいものから順にn個のCC文とテロップ認識文との組もしくは音声認識文とテロップ認識文との組を選択して、それらに対応する映像区間を、ステップS10において入力された映像から抽出して、番組紹介映像を生成し(ステップS55)、そのまま動作を終了する。
[映像抽出装置の利用例]
ここで、図5を参照して、映像抽出装置1の利用例について説明する。図5は、本発明の映像抽出装置を備える映像検索装置の構成を示したブロック図である。
映像検索装置2は、ユーザから入力された検索条件の情報に基づいて、検索条件に適合する映像の番組紹介映像を検索結果として提示する表示画面の映像を生成するものである。この映像検索装置2には、検索結果を表示するための表示装置Dが外部に接続されている。ここでは、映像検索装置2は、映像抽出装置1と、映像検索手段3と、映像蓄積手段4と、紹介映像蓄積手段5と、映像表示手段6とを備える。
映像抽出装置1は、映像検索手段3から入力された映像と、番組タイトル、放送時刻、放送チャンネルなどの情報に基づいて、この映像の番組紹介映像を生成するものである。ここで生成された番組紹介映像は、紹介映像蓄積手段5に出力される。なお、この映像抽出装置1は、図1に示した映像抽出装置1と同一のものである。
映像検索手段3は、ユーザから入力される検索条件の情報に基づいて、映像蓄積手段4から、検索条件に適合する映像を読み出すものである。ここで読み出された映像と、当該映像の情報とは、映像抽出装置1に出力される。
ここで、図6を参照(適宜図5参照)して、検索条件の情報を入力する表示画面の例について説明する。図6は、検索条件の情報を入力する表示画面の例を模式的に示した模式図である。図6(a)に示すように、表示画面W1は、放送日の開始日を入力する領域F1と、終了日を入力する領域F2と、録画日の開始日を入力する領域F3と、終了日を入力する領域F4と、チャンネルを入力する領域F5と、番組名を入力する領域F6と、番組の出演者を入力する領域F7と、検索のキーワードを入力する領域F8とを有する。そして、ユーザが図示しないキーボード等によって、これらの領域F1〜F8に放送日の期間、録画日の期間、チャンネル、番組名、出演者やキーワードを入力することで、これらの情報が映像検索手段3に検索条件の情報として入力される。
更に、図6(b)に示すように、表示画面W2にジャンルの情報が提示され、ユーザが図示しないマウスやリモコン等によって、カーソルC1を動かしてジャンルを指定することで、これらの情報が映像検索手段3に検索条件の情報として入力されることとしてもよい。
そして、映像検索手段3は、入力された検索条件の情報に基づいて、映像蓄積手段4から検索条件に適合する映像を読み出す。なお、各映像の放送日、チャンネル、番組名、出演者、ジャンル等の情報は、予め映像蓄積手段4において映像に対応付けられて蓄積されていることとしてもよいし、映像検索手段3が、電子番組表やクローズドキャプション等から取得することとしてもよい。
映像蓄積手段4は、複数の番組映像を蓄積するもので、ハードディスク等の一般的な記憶手段である。紹介映像蓄積手段5は、映像抽出装置1によって生成された複数の番組紹介映像を蓄積するもので、ハードディスク等の一般的な記憶手段である。
映像表示手段6は、映像検索手段3によって検索された映像の番組紹介映像を、検索結果として提示する表示画面の映像を生成するものである。ここで、映像表示手段6は、紹介映像蓄積手段5に蓄積された番組紹介映像を読み出し、これらの番組紹介映像を提示する表示画面の映像を生成する。ここで生成された映像は、表示装置Dに出力される。
ここで、図7を参照(適宜図5参照)して、映像表示手段6によって生成される検索結果を提示する表示画面の例について説明する。図7は、検索結果を提示する表示画面の例を模式的に示した模式図である。図7(a)に示すように、表示画面W3は、番組ごとに番組紹介映像を一覧で提示する画面であり、複数の映像の小画面I、I、…を有する。ひとつの小画面Iがひとつの番組に対応しており、映像表示手段6は、この小画面Iの枠内に、映像抽出装置1によって生成された番組紹介映像を再生して表示する。そして、ここでは、映像表示手段6は、小画面Iの番組紹介映像の再生が終わると、再び先頭に戻り繰り返し再生することとした。更に、ここでは、映像表示手段6は、表示画面W3内のすべての小画面Iの番組紹介映像を同時に再生して提示することとした。なお、小画面Iに提示する内容は、静止画像としてもよい。
そして、ユーザが、図示しないリモコンやマウス等のインタフェース機器によってカーソルC2を移動させて、一覧の中から視聴したい番組の小画面Iを選択して再生ボタンB1を押下すると、選択された映像を再生する指令が、図示しない映像再生手段に入力される。そうすると、この映像再生手段は、選択された映像を映像蓄積手段4から読み出して再生し、表示装置Dに出力する。ここで、映像表示手段6は、紹介映像蓄積手段5に蓄積されているすべての番組をひとつの表示画面に提示することが難しい場合には、複数の画面に分けて表示することとした。図7(a)では、表示画面W3の下部の「前の一覧へ」及び「次の一覧へ」のボタンB2、B3をユーザが押下すると、映像表示手段6は、一覧画面を遷移させる。
また、表示画面W3の小画面I、I、…の各々に複数の番組からなる番組集合の番組紹介映像を提示することとしてもよい。このとき、ひとつの小画面Iがひとつの番組集合に対応しており、映像表示手段6は、この小画面Iの枠内に、番組集合に含まれる番組の番組紹介映像を順次再生して表示する。番組集合は、数話で完結するドラマ番組の集合としたり、あるタレントが出演している番組の集合としたりしてもよい。この番組集合は、ユーザが手動で設定することとしてもよいし、電子番組表などから取得できる番組タイトル、出演者、放送日時、チャンネルなどの情報をもとに、映像表示手段6が生成することとしてもよい。
更に、図7(b)に示すように、表示画面W4は、番組紹介映像を時間軸方向に展開して提示する画面である。表示画面W4において、横一列の小画面I1〜Im、I11〜I1mのそれぞれがひとつの番組紹介映像に対応しており、右に行くほど番組の再生時間が進んだ映像区間の映像が提示される。そして、列内の小画面I1、I2、…に提示する内容は、番組紹介映像におけるショット切替点や、所定の時間間隔を基準に分割した部分映像としてもよいし、静止画像としてもよい。
以上のように、映像抽出装置1によってCCや、映像の音声の認識結果に基づいて生成された番組紹介映像を並べて提示することで、一覧提示された複数の映像からユーザがひとつの映像を選択する場合に、映像の内容を反映した番組紹介映像を提示することができる。また、映像抽出装置1によれば、例えば、一時間程度の番組映像に対して数十秒程度の紹介映像を生成することができ、一覧画面で同時に再生しても、ユーザは番組選択に必要な情報を短時間で得ることができる。
なお、映像検索装置2では、ユーザによって入力された検索条件によって検索された映像の映像紹介映像を提示することとしたが、本発明の映像抽出装置1が、例えば、映像蓄積手段4に蓄積されたすべての映像の番組紹介映像を生成して、映像表示手段6がすべての映像の番組紹介映像を表示装置Dに表示させることとしてもよい。
本発明における映像抽出装置の構成を示したブロック図である。 本発明の映像抽出装置が番組紹介映像を生成する動作を示したフローチャートである。 本発明の映像抽出装置の紹介文類似度算出部14a及び番組紹介映像抽出部14cによって番組紹介文を生成する動作(EPG番組紹介映像生成動作)を示したフローチャートである。 本発明の映像抽出装置の他番組紹介文類似度算出部14b及び番組紹介映像抽出部14cによって番組紹介文を生成する動作(番組紹介映像生成動作)を示したフローチャートである。 本発明の映像抽出装置を備える映像検索装置の構成を示したブロック図である。 本発明の映像抽出装置を備える映像検索装置の検索条件の情報を入力する表示画面の例を模式的に示した模式図である。 本発明の映像抽出装置を備える映像検索装置の検索結果を提示する表示画面の例を模式的に示した模式図である。
符号の説明
1 映像抽出装置
10 字幕情報抽出手段(映像付加単位データ生成手段)
11 音声認識手段(映像付加単位データ生成手段)
12 テロップ認識手段
13 電子番組表取得手段
14 番組紹介映像生成手段
14a 紹介文類似度算出部(類似度算出手段)
14b 他番組紹介文類似度算出部(他映像類似度算出手段、テロップ類似度算出手段)
14c 番組紹介映像抽出部(部分映像抽出手段)

Claims (2)

  1. 映像を入力し、当該映像に付加された音声データ及び字幕の情報の少なくともひとつに基づいて、当該映像の一部分を抽出する映像抽出装置であって、
    前記映像に付加された音声データ及び字幕の情報の少なくともひとつをテキストデータとし、このテキストデータを所定の単位に分割して、この単位ごとに前記映像における区間に対応させた映像付加単位データを生成する映像付加単位データ生成手段と、
    この映像付加単位データ生成手段によって生成された映像付加単位データについて所定の特徴量を解析して、この解析結果と、複数の他の映像に対して生成された当該他の映像の内容の要約を示すテキストデータである他映像要約テキストデータについて解析された前記所定の特徴量の解析結果とに基づいて、前記他映像要約テキストデータと特徴量が類似する度合いを示す他映像類似度を算出する他映像類似度算出手段と、
    この他映像類似度算出手段によって算出された他映像類似度に基づいて前記映像付加単位データを選定して、当該映像付加単位データに対応する前記映像の区間を検出し、この区間の映像を抽出する部分映像抽出手段と、
    映像内のテロップを抽出してテキストデータとし、前記映像付加単位データの前記区間に対応付けたテロップ単位データを生成するテロップ単位データ生成手段と、
    このテロップ単位データ生成手段によって生成されたテロップ単位データ及び当該テロップ単位データに対応付けられた前記区間の映像について所定の特徴量を解析して、この解析結果と、複数の他の映像に対して生成された当該他の映像の内容の要約を示す映像であるスポット映像について解析された前記所定の特徴量の解析結果とに基づいて、前記スポット映像と特徴量が類似する度合いを示すテロップ類似度を算出するテロップ類似度算出手段と、を備え、
    前記部分映像抽出手段が、前記他映像類似度算出手段によって算出された他映像類似度と、前記テロップ類似度算出手段によって算出されたテロップ類似度とに基づいて前記映像付加単位データを選定することを特徴とする映像抽出装置。
  2. 映像を入力し、当該映像に付加された音声データ及び字幕の情報の少なくともひとつに基づいて、当該映像の一部分を抽出するためにコンピュータを、
    前記映像に付加された音声データ及び字幕の情報の少なくともひとつをテキストデータとし、このテキストデータを所定の単位に分割して、この単位ごとに前記映像における区間に対応させた映像付加単位データを生成する映像付加単位データ生成手段、
    この映像付加単位データ生成手段によって生成された映像付加単位データについて所定の特徴量を解析して、この解析結果と、複数の他の映像に対して生成された当該他の映像の内容の要約を示すテキストデータである他映像要約テキストデータについて解析された前記所定の特徴量の解析結果とに基づいて、前記他映像要約テキストデータと特徴量が類似する度合いを示す他映像類似度を算出する他映像類似度算出手段、
    この他映像類似度算出手段によって算出された他映像類似度に基づいて前記映像付加単位データを選定して、当該映像付加単位データに対応する前記映像の区間を検出し、この区間の映像を抽出する部分映像抽出手段、
    映像内のテロップを抽出してテキストデータとし、前記映像付加単位データの前記区間に対応付けたテロップ単位データを生成するテロップ単位データ生成手段、
    このテロップ単位データ生成手段によって生成されたテロップ単位データ及び当該テロップ単位データに対応付けられた前記区間の映像について所定の特徴量を解析して、この解析結果と、複数の他の映像に対して生成された当該他の映像の内容の要約を示す映像であるスポット映像について解析された前記所定の特徴量の解析結果とに基づいて、前記スポット映像と特徴量が類似する度合いを示すテロップ類似度を算出するテロップ類似度算出手段、として機能させ、
    前記部分映像抽出手段が、前記他映像類似度算出手段によって算出された他映像類似度と、前記テロップ類似度算出手段によって算出されたテロップ類似度とに基づいて前記映像付加単位データを選定することを特徴とする映像抽出プログラム。
JP2006327532A 2006-12-04 2006-12-04 映像抽出装置及び映像抽出プログラム Active JP4695582B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006327532A JP4695582B2 (ja) 2006-12-04 2006-12-04 映像抽出装置及び映像抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006327532A JP4695582B2 (ja) 2006-12-04 2006-12-04 映像抽出装置及び映像抽出プログラム

Publications (2)

Publication Number Publication Date
JP2008141621A JP2008141621A (ja) 2008-06-19
JP4695582B2 true JP4695582B2 (ja) 2011-06-08

Family

ID=39602602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006327532A Active JP4695582B2 (ja) 2006-12-04 2006-12-04 映像抽出装置及び映像抽出プログラム

Country Status (1)

Country Link
JP (1) JP4695582B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298270A (zh) * 2019-06-14 2019-10-01 天津大学 一种基于跨模态重要性感知的多视频摘要方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5367499B2 (ja) * 2009-08-17 2013-12-11 日本放送協会 シーン検索装置及びプログラム
CN112966596A (zh) * 2021-03-04 2021-06-15 北京秒针人工智能科技有限公司 视频光学字符识别系统方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115607A (ja) * 2003-10-07 2005-04-28 Matsushita Electric Ind Co Ltd 映像検索装置
JP2005234786A (ja) * 2004-02-18 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> 映像キーワード抽出方法及び装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115607A (ja) * 2003-10-07 2005-04-28 Matsushita Electric Ind Co Ltd 映像検索装置
JP2005234786A (ja) * 2004-02-18 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> 映像キーワード抽出方法及び装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298270A (zh) * 2019-06-14 2019-10-01 天津大学 一种基于跨模态重要性感知的多视频摘要方法

Also Published As

Publication number Publication date
JP2008141621A (ja) 2008-06-19

Similar Documents

Publication Publication Date Title
KR102018295B1 (ko) 구간 영상 검색 및 제공 장치, 방법 및 컴퓨터-판독가능 매체
KR100828166B1 (ko) 동영상의 음성 인식과 자막 인식을 통한 메타데이터 추출방법, 메타데이터를 이용한 동영상 탐색 방법 및 이를기록한 기록매체
JP5691289B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
US8750681B2 (en) Electronic apparatus, content recommendation method, and program therefor
CN101202864B (zh) 动画再现装置
US9280709B2 (en) Information processing device, information processing method and program
KR102085908B1 (ko) 컨텐츠 제공 서버, 컨텐츠 제공 단말 및 컨텐츠 제공 방법
US7769761B2 (en) Information processing apparatus, method, and program product
US20180068690A1 (en) Data processing apparatus, data processing method
CN101422041A (zh) 基于因特网搜索的电视
US10978077B1 (en) Knowledge point mark generation system and method thereof
JP2007519987A (ja) 内部及び外部オーディオビジュアルデータの統合解析システム及び方法
JP5637930B2 (ja) 興味区間検出装置、視聴者興味情報提示装置、および興味区間検出プログラム
KR20000054561A (ko) 비디오 인덱싱 방식을 이용한 네트워크 기반의 비디오검색 시스템 및 그 운영방법
JP5218766B2 (ja) 権利情報抽出装置、権利情報抽出方法及びプログラム
JP4192703B2 (ja) コンテンツ処理装置、コンテンツ処理方法及びプログラム
KR20060089922A (ko) 음성 인식을 이용한 데이터 추출 장치 및 방법
EP2336900A2 (en) Search device and search method
JP4695582B2 (ja) 映像抽出装置及び映像抽出プログラム
JP2004289530A (ja) 記録再生装置
JP5231130B2 (ja) キーフレーズ抽出装置、シーン分割装置およびプログラム
JP5152857B2 (ja) 電子機器、表示制御方法、およびプログラム
JP2002014973A (ja) 映像検索装置、方法、映像検索プログラムを記録した記録媒体
JP2006106451A (ja) テレビ放送受信機における音声入力方法
JP4456573B2 (ja) 映像抽出装置及び映像抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4695582

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250