JP2005234786A - 映像キーワード抽出方法及び装置及びプログラム - Google Patents
映像キーワード抽出方法及び装置及びプログラム Download PDFInfo
- Publication number
- JP2005234786A JP2005234786A JP2004041588A JP2004041588A JP2005234786A JP 2005234786 A JP2005234786 A JP 2005234786A JP 2004041588 A JP2004041588 A JP 2004041588A JP 2004041588 A JP2004041588 A JP 2004041588A JP 2005234786 A JP2005234786 A JP 2005234786A
- Authority
- JP
- Japan
- Prior art keywords
- telop
- scenario
- video
- keyword
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Processing Or Creating Images (AREA)
Abstract
【解決手段】 本発明は、指定された映像識別情報に基づいて、シナリオテキストとテロップ原稿を読み込み、テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出し、テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する。
【選択図】 図1
Description
藤本他、「テロップ文字認識を用いた商品紹介映像の区間分割」(画像の認識・理解シンポジウム(MIRU2002))
(1)シナリオから映像制作者の意図に沿った重要なキーワードを抽出することが可能;
(2)予めキーワード辞書を用意することなく、映像キーワードの抽出が可能;
(3)テロップ認識の結果に誤りがある場合でも重要なキーワードを抽出可能;
な映像キーワード抽出方法及び装置及びプログラムを提供することを目的とする。
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込み過程(ステップ1)と、
映像識別情報に基づいて、シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込み過程(ステップ2)と、
テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出過程(ステップ3)と、
テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理過程(ステップ4)と、
少なくとも、映像識別情報とキーワードを出力する出力過程(ステップ5)と、を行う。
対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
重要文を形態素解析して、キーワードを抽出する。
対応表からトピック毎のテロップの分布を算出し、
算出されたテロップ分布に基づいて対応表を修正する過程を更に行う。
シナリオテキストが蓄積されたシナリオデータベース14と、
テロップ原稿が蓄積されたテロップ原稿データベース13と、
処理対象の映像識別情報を指定する指定手段15と、
指定手段15により指定された映像識別情報に基づいて、シナリオデータベースから該シナリオテキストを読み込むシナリオ読み込み手段17と、
指定手段15により指定された映像識別情報に基づいて、テロップ原稿データベースからテロップ原稿を読み込むテロップ原稿読み込み手段16と、
テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出し、テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理手段18と、
少なくとも、映像識別情報とキーワードを出力する出力手段19と、を有する。
対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
重要文を形態素解析して、キーワードを抽出する手段と、を含む。
対応表からトピック毎のテロップの分布を算出する手段と、
算出されたテロップ分布に基づいて対応表を修正する手段と、を更に有する。
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込みステップと、
映像識別情報に基づいて、シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込みステップと、
テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出ステップと、
テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理ステップと、
少なくとも、映像識別情報とキーワードを出力する出力ステップと、をコンピュータに実行させる。
対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる。
対応表からトピック毎のテロップの分布を算出するステップと、
算出されたテロップ分布に基づいて対応表を修正するステップと、を更に、コンピュータに実行させる。
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み過程と、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析過程と、
シナリオテキストから抽出されたシナリオ名詞句とテロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定過程と、
少なくとも映像識別情報とキーワードを出力する出力過程と、を行う。
シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める過程を含む。
入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
シナリオテキストが蓄積されたシナリオテキストデータベース
指定された映像識別情報に基づいて、テロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み手段と、
指定された映像識別情報に基づいて、シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析手段と、
シナリオテキストから抽出されたシナリオ名詞句とテロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定手段と、
少なくとも映像識別情報とキーワードを出力する出力手段と、を有する。
前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める手段を含む。
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込みステップと、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析ステップと、
シナリオテキストから抽出されたシナリオ名詞句とテロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定ステップと、
少なくとも映像識別情報とキーワードを出力する出力ステップと、をコンピュータに実行させる。
シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求めるステップをコンピュータに実行させる。
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み過程と、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析過程と、
シナリオテキストから抽出された名詞句とテロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定過程と、
少なくとも映像識別情報とキーワードを出力する出力過程と、を行う。
対応表とテロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
重要文を形態素解析して、キーワードを抽出する。
対応表における要素の数からトピック毎のテロップの分布を算出し、
算出されたテロップ分布に基づいて対応表を修正する過程を更に行う。
入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
シナリオテキストが蓄積されたシナリオテキストデータベースと、
指定された映像識別情報に基づいて、テロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み手段と、
指定された映像識別情報に基づいて、シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析手段と、
シナリオテキストから抽出された名詞句とテロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定手段と、
少なくとも映像識別情報とキーワードを出力する出力手段と、を有する。
対応表とテロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
重要文を形態素解析して、キーワードを抽出する手段を含む。
対応表における要素の数からトピック毎のテロップの分布を算出する手段と、
算出されたテロップ分布に基づいて対応表を修正する手段と、を更に有する。
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込みステップと、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析ステップと、
シナリオテキストから抽出された名詞句とテロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定ステップと、
少なくとも映像識別情報とキーワードを出力する出力ステップと、をコンピュータに実行させる。
対応表とテロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる。
対応表における要素の数からトピック毎のテロップの分布を算出するステップと、
算出されたテロップ分布に基づいて対応表を修正するステップと、を更にコンピュータに実行させる。
w(y)=by 2log10(my/ny)
として算出する。
Y:テロップIDyの最大値;
ay(i):テロップTyから抽出されたi番目の名詞句;
n:テロップTyから抽出された名詞句の数;
適合判定処理部18は、初めに、ステップ401からステップ407の処理により、あるx,yについてシナリオJxとテロップ名詞列Tyとの文字列比較を行い、対応表C(x,y)に一致した単語数の割合を書き込む。ステップ408からステップ411までは、表内を総当り的に走査していくステップである。
図20は、本発明の第2の実施の形態における映像キーワード抽出装置の構成を示す。
D[i,j0-1]=D[i-1,j0]+ins(ki)
D[i0-1,j]=D[i0-1.k-1]+del(gj)
D[i,j]=min{D[i-1,j-1]+sub(ki,gj),D[i-1,j]+del(ki),D[i,j-1]+ins(gj)}
(i0≦i≦I, j0≦j≦J)
コストとして考えられるものとしては、例えば、任意のi,jについて、sub(ki,gj)=0(gjの認識候補中にkiが存在する場合。以降便宜上ki=gj表す)、sub(ki,gj)=1(gjの認識候補中にkiが存在しない場合。以降便宜上ki≠gjと表す)、del(gj)=1, ins(ki)=1などがある。また、sub(ki,gj)={テロップ認識において算出された文字の類似度(0から1の範囲)}とする方法も考えられる。
dist(K,G)=min{D[I,j]} …(式A)
である。
D[i,j]:編集距離マトリックス;
ki:あるシナリオ名詞句のi番目の文字;
gj:あるテロップ認識結果文字列のj番目の文字(複数候補が存在);
N:ki=gjとなった回数。ただし、ki=gjは複数候補を持つ文字gjの候補中に文字kiが含まれていることを示す(以下、同様);
Q:類似度;
I:シナリオ名詞句Kの文字列数(iの最大値);
J:テロップ認識結果Gの文字列長(jの最大値);
を示す。
図27は、本発明の第3の実施の形態における映像キーワード抽出装置の構成図である。
また、重要文自体へのポインタを書き込む。
12 シナリオテキスト入力部
13 テロップ原稿データベース、テロップ原稿記憶部
14 シナリオテキストデータベース、シナリオテキスト記憶部
15 指定手段、制御部
16 テロップ原稿読み込み手段、テロップ情報抽出部
17 シナリオ読み込み手段、シナリオ読み込み部
18 適合判定処理手段、適合判定処理部
19 出力手段、出力部
93 テロップ認識結果記憶部
96 テロップ認識結果読み込み部
97 シナリオテキスト解析部
98 類似適合判定処理部
99 出力部
161 テロップワード記憶テーブル
171 シナリオテキスト記憶テーブル
137 シナリオテキスト解析部
138 類似適合判定処理部
139 出力部
952 映像番号
961 テロップ認識結果記憶テーブル
971 シナリオ名詞句記憶テーブル
2101 ID
2102 テロップ表示開始時刻
2103 テロップ表示時間長
2104 テロップ
2105 文字数
2106 文字の大きさ
2201 ID
2202 テロップ名詞列
2203 テロップ重要度
2301 ID
2302 トピックID
2303 シナリオ
2701 テロップID
2702 トピック3のキーワード
2901 名詞句IDx’
2902 シナリオIDx’
2903 トピックIDt
2904 文中でキーワードが出現する文字位置
2905 シナリオ名詞句Kx
3001 ID
3002 テロップ表示開始時刻
3003 テロップ表示終了時刻
3004 文字数
3005 文字の大きさ
3006 テロップ重要度
3007 テロップ認識結果文字列
3201 ID
3202 トピックID
3204 出現文字位置
3205 シナリオ名詞句列
3301 テロップID
3302 トピックID
3303 キーワード列
3304 重要度
3305 関連テロップID
Claims (24)
- 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込み過程と、
前記映像識別情報に基づいて、前記シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込み過程と、
前記テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出過程と、
前記テロップから抽出された前記名詞句と前記シナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理過程と、
少なくとも、前記映像識別情報と前記キーワードを出力する出力過程と、を行うことを特徴とする映像キーワード抽出方法。 - 前記適合判定処理過程において、
前記対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
前記重要文を形態素解析して、キーワードを抽出する請求項1記載の映像キーワード抽出方法。 - 前記適合判定処理過程において、
前記対応表からトピック毎のテロップの分布を算出し、
算出されたテロップ分布に基づいて前記対応表を修正する過程を更に行う請求項1記載の映像キーワード抽出方法。 - 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
シナリオテキストが蓄積されたシナリオデータベースと、
テロップ原稿が蓄積されたテロップ原稿データベースと、
処理対象の映像識別情報を指定する指定手段と、
前記指定手段により指定された映像識別情報に基づいて、前記シナリオデータベースから該シナリオテキストを読み込むシナリオ読み込み手段と、
前記指定手段により指定された前記映像識別情報に基づいて、前記テロップ原稿データベースからテロップ原稿を読み込むテロップ原稿読み込み手段と、
前記テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出手段と、
前記テロップから抽出された前記名詞句と前記シナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理手段と、
少なくとも、前記映像識別情報と前記キーワードを出力する出力手段と、
を有することを特徴とする映像キーワード抽出装置。 - 前記適合判定処理手段は、
前記対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
前記重要文を形態素解析して、キーワードを抽出する手段と、を含む請求項4記載の映像キーワード抽出装置。 - 前記適合判定処理手段は、
前記対応表からトピック毎のテロップの分布を算出する手段と、
算出されたテロップ分布に基づいて前記対応表を修正する手段と、を更に有する請求項4記載の映像キーワード抽出装置。 - コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込みステップと、
前記映像識別情報に基づいて、前記シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込みステップと、
前記テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出ステップと、
前記テロップから抽出された前記名詞句と前記シナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理ステップと、
少なくとも、前記映像識別情報と前記キーワードを出力する出力ステップと、をコンピュータに実行させることを特徴とする映像キーワード抽出プログラム。 - 前記適合判定処理ステップにおいて、
前記対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
前記重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる請求項7記載の映像キーワード抽出プログラム。 - 前記適合判定処理ステップにおいて、
前記対応表からトピック毎のテロップの分布を算出するステップと、
算出されたテロップ分布に基づいて前記対応表を修正するステップと、を更に、コンピュータに実行させる請求項7記載の映像キーワード抽出プログラム。 - 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み過程と、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析過程と、
前記シナリオテキストから抽出された前記シナリオ名詞句と前記テロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定過程と、
少なくとも前記映像識別情報と前記キーワードを出力する出力過程と、を行うことを特徴とする映像キーワード抽出方法。 - 前記類似適合判定過程において、
前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める過程を含む請求項10記載の映像キーワード抽出方法。 - 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
シナリオテキストが蓄積されたシナリオテキストデータベース
指定された映像識別情報に基づいて、前記テロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み手段と、
指定された映像識別情報に基づいて、前記シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析手段と、
前記シナリオテキストから抽出された前記シナリオ名詞句と前記テロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定手段と、
少なくとも前記映像識別情報と前記キーワードを出力する出力手段と、を有することを特徴とする映像キーワード抽出装置。 - 前記類似適合判定手段は、
前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める過程を含む請求項12記載の映像キーワード抽出装置。 - コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込みステップと、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析ステップと、
前記シナリオテキストから抽出された前記シナリオ名詞句と前記テロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定ステップと、
少なくとも前記映像識別情報と前記キーワードを出力する出力ステップと、をコンピュータに実行させることを特徴とする映像キーワード抽出プログラム。 - 前記類似適合判定ステップにおいて、
前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求めるステップを、コンピュータに実行させる請求項14記載の映像キーワード抽出プログラム。 - 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み過程と、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析過程と、
前記シナリオテキストから抽出された前記名詞句と前記テロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定過程と、
少なくとも前記映像識別情報と前記キーワードを出力する出力過程と、を行うことを特徴とする映像キーワード抽出方法。 - 前記適合判定処理過程において、
前記対応表と前記テロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
前記重要文を形態素解析して、キーワードを抽出する請求項16記載の映像キーワード抽出方法。 - 前記適合判定処理過程において、
前記対応表における要素の数からトピック毎のテロップの分布を算出する過程と、
算出されたテロップ分布に基づいて前記対応表を修正する過程を更に行う請求項16記載の映像キーワード抽出方法。 - 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
シナリオテキストが蓄積されたシナリオテキストデータベースと、
指定された映像識別情報に基づいて、前記テロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み手段と、
指定された映像識別情報に基づいて、前記シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析手段と、
前記シナリオテキストから抽出された前記名詞句と前記テロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定手段と、
少なくとも前記映像識別情報と前記キーワードを出力する出力手段と、を有することを特徴とする映像キーワード抽出装置。 - 前記適合判定処理手段は、
前記対応表と前記テロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
前記重要文を形態素解析して、キーワードを抽出する手段を含む請求項19記載の映像キーワード抽出装置。 - 前記適合判定処理手段は、
前記対応表における要素の数からトピック毎のテロップの分布を算出する手段と、
算出されたテロップ分布に基づいて前記対応表を修正する手段と、を更に有する請求項19記載の映像キーワード抽出装置。 - コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込みステップと、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析ステップと、
前記シナリオテキストから抽出された前記名詞句と前記テロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定ステップと、
少なくとも前記映像識別情報と前記キーワードを出力する出力ステップと、をコンピュータに実行させることを特徴とする映像キーワード抽出プログラム。 - 前記適合判定処理ステップは、
前記対応表と前記テロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
前記重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる請求項22記載の映像キーワード抽出プログラム。 - 前記適合判定処理ステップは、
前記対応表における要素の数からトピック毎のテロップの分布を算出するステップと、
算出されたテロップ分布に基づいて前記対応表を修正するステップと、を更にコンピュータに実行させる請求項22記載の映像キーワード抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004041588A JP4239850B2 (ja) | 2004-02-18 | 2004-02-18 | 映像キーワード抽出方法及び装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004041588A JP4239850B2 (ja) | 2004-02-18 | 2004-02-18 | 映像キーワード抽出方法及び装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005234786A true JP2005234786A (ja) | 2005-09-02 |
JP4239850B2 JP4239850B2 (ja) | 2009-03-18 |
Family
ID=35017697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004041588A Expired - Fee Related JP4239850B2 (ja) | 2004-02-18 | 2004-02-18 | 映像キーワード抽出方法及び装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4239850B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148904A (ja) * | 2005-11-29 | 2007-06-14 | Toshiba Corp | 情報提示方法、情報提示装置及び情報提示プログラム |
JP2008141621A (ja) * | 2006-12-04 | 2008-06-19 | Nippon Hoso Kyokai <Nhk> | 映像抽出装置及び映像抽出プログラム |
JP2008148077A (ja) * | 2006-12-12 | 2008-06-26 | Hitachi Ltd | 動画再生装置 |
JP2008176748A (ja) * | 2007-01-22 | 2008-07-31 | Fujitsu Ltd | 情報付与プログラム、情報付与装置、および情報付与方法 |
JP2012185567A (ja) * | 2011-03-03 | 2012-09-27 | Fujitsu Ltd | 表示制御装置、表示制御方法、および表示制御プログラム |
CN111899202A (zh) * | 2020-05-19 | 2020-11-06 | 武汉东智科技股份有限公司 | 一种视频图像中叠加时间字符的增强方法 |
CN113032679A (zh) * | 2021-04-19 | 2021-06-25 | 北京新三优秀科技有限公司 | 一种短视频处理方法、电子设备和计算机可读存储介质 |
KR20210104526A (ko) * | 2020-02-17 | 2021-08-25 | 주식회사 엘지유플러스 | Vod 컨텐츠의 키워드를 출력하는 방법 및 장치 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012065124A (ja) | 2010-09-15 | 2012-03-29 | Fuji Xerox Co Ltd | 画像処理装置、識別装置及びプログラム |
-
2004
- 2004-02-18 JP JP2004041588A patent/JP4239850B2/ja not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148904A (ja) * | 2005-11-29 | 2007-06-14 | Toshiba Corp | 情報提示方法、情報提示装置及び情報提示プログラム |
JP2008141621A (ja) * | 2006-12-04 | 2008-06-19 | Nippon Hoso Kyokai <Nhk> | 映像抽出装置及び映像抽出プログラム |
JP4695582B2 (ja) * | 2006-12-04 | 2011-06-08 | 日本放送協会 | 映像抽出装置及び映像抽出プログラム |
JP2008148077A (ja) * | 2006-12-12 | 2008-06-26 | Hitachi Ltd | 動画再生装置 |
JP2008176748A (ja) * | 2007-01-22 | 2008-07-31 | Fujitsu Ltd | 情報付与プログラム、情報付与装置、および情報付与方法 |
JP2012185567A (ja) * | 2011-03-03 | 2012-09-27 | Fujitsu Ltd | 表示制御装置、表示制御方法、および表示制御プログラム |
KR20210104526A (ko) * | 2020-02-17 | 2021-08-25 | 주식회사 엘지유플러스 | Vod 컨텐츠의 키워드를 출력하는 방법 및 장치 |
KR102570285B1 (ko) * | 2020-02-17 | 2023-08-24 | 주식회사 엘지유플러스 | Vod 컨텐츠의 키워드를 출력하는 방법 및 장치 |
CN111899202A (zh) * | 2020-05-19 | 2020-11-06 | 武汉东智科技股份有限公司 | 一种视频图像中叠加时间字符的增强方法 |
CN111899202B (zh) * | 2020-05-19 | 2024-03-15 | 武汉东智科技股份有限公司 | 一种视频图像中叠加时间字符的增强方法 |
CN113032679A (zh) * | 2021-04-19 | 2021-06-25 | 北京新三优秀科技有限公司 | 一种短视频处理方法、电子设备和计算机可读存储介质 |
CN113032679B (zh) * | 2021-04-19 | 2023-12-29 | 北京新三优秀科技有限公司 | 一种短视频处理方法、电子设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4239850B2 (ja) | 2009-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0440197B1 (en) | Method and apparatus for inputting text | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
US8266169B2 (en) | Complex queries for corpus indexing and search | |
CN102483743B (zh) | 对书写体系和语言的检测 | |
JP2019125343A (ja) | 曖昧なエンティティワードに基づくテキスト処理方法及び装置 | |
WO2010119615A1 (ja) | 学習データ生成装置、及び固有表現抽出システム | |
US20100161314A1 (en) | Region-Matching Transducers for Text-Characterization | |
JP2004348591A (ja) | 文書検索方法及び装置 | |
CN111276149B (zh) | 语音识别方法、装置、设备及可读存储介质 | |
US11501546B2 (en) | Media management system for video data processing and adaptation data generation | |
JP2007122403A (ja) | 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム | |
JP4239850B2 (ja) | 映像キーワード抽出方法及び装置及びプログラム | |
CN112784009A (zh) | 一种主题词挖掘方法、装置、电子设备及存储介质 | |
JP3444831B2 (ja) | 編集処理装置、及び編集処理プログラムが記憶された記憶媒体 | |
JP5594134B2 (ja) | 文字列検索装置,文字列検索方法および文字列検索プログラム | |
JP4175093B2 (ja) | トピック境界決定方法及び装置及びトピック境界決定プログラム | |
JP3975825B2 (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
JP4985096B2 (ja) | 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム | |
JP4047895B2 (ja) | 文書校正装置およびプログラム記憶媒体 | |
CN117669513B (zh) | 一种基于人工智能的数据管理系统及方法 | |
CN114222193B (zh) | 一种视频字幕时间对齐模型训练方法及系统 | |
JP4047894B2 (ja) | 文書校正装置およびプログラム記憶媒体 | |
JP2007172315A (ja) | 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム | |
CN117789705A (zh) | 数据处理方法、装置、设备及存储介质 | |
JP2004158038A (ja) | 言語処理システム及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050531 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080812 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081215 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |