JP2005234786A - 映像キーワード抽出方法及び装置及びプログラム - Google Patents

映像キーワード抽出方法及び装置及びプログラム Download PDF

Info

Publication number
JP2005234786A
JP2005234786A JP2004041588A JP2004041588A JP2005234786A JP 2005234786 A JP2005234786 A JP 2005234786A JP 2004041588 A JP2004041588 A JP 2004041588A JP 2004041588 A JP2004041588 A JP 2004041588A JP 2005234786 A JP2005234786 A JP 2005234786A
Authority
JP
Japan
Prior art keywords
telop
scenario
video
keyword
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004041588A
Other languages
English (en)
Other versions
JP4239850B2 (ja
Inventor
Yosuke Torii
陽介 鳥井
Yukinobu Taniguchi
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004041588A priority Critical patent/JP4239850B2/ja
Publication of JP2005234786A publication Critical patent/JP2005234786A/ja
Application granted granted Critical
Publication of JP4239850B2 publication Critical patent/JP4239850B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】 シナリオから映像制作者の意図に沿った重要なキーワードの抽出、予めキーワード辞書を用意することなく、また、テロップ認識の結果に誤りがある場合でも重要なキーワードの抽出を可能にする。
【解決手段】 本発明は、指定された映像識別情報に基づいて、シナリオテキストとテロップ原稿を読み込み、テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出し、テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する。
【選択図】 図1

Description

本発明は、映像キーワード抽出方法及び装置及びプログラムに係り、特に、膨大に存在する映像データから所望の映像を検索する際に必要な、トピック区間のキーワードを抽出し、メタデータとして付与するための映像キーワード抽出方法及び装置及びプログラムに関する。
大量にある映像データの中から所望の映像または映像の一部(シーン)を検索するためには、映像データに予めキーワードを人手で付与しておく必要がある。このキーワードの付与の作業は手間がかかる上、人によって付与されるキーワードにばらつきがあるため、目的の映像を検索できない場合がある。このような問題を解決するために、映像制作の過程で作られるシナリオテキストからキーワードを自動的に抽出するアプローチがある。
また、効率的に映像データを扱うためのメディアハンドリング技術として、映像の認識結果と事前に用意されているシナリオ文書とをマッチングし、映像の意味的内容に基づく検索などに利用する技術について従来から検討されている。
例えば、キーワード抽出技術の例として、商品名をキーワードとし、辞書に登録しておき、テロップ認識結果と辞書とを照合することで、登録されている商品名がテロップ表示された時刻をトピック区切りとして出力し、また、音声の音響パワーが無音区間を検出した区間の終点時刻をトピック区切りの始点候補として検出する方法がある。なお、商品映像の商品名は文字サイズが大きく、雑音となる背景画像が少ないため、文字認識が比較的容易な画像であり、テロップ認識結果の候補中に商品辞書に登録された正解文字列が存在しているものと仮定している(例えば、非特許文献1参照)。
藤本他、「テロップ文字認識を用いた商品紹介映像の区間分割」(画像の認識・理解シンポジウム(MIRU2002))
しかしながら、従来のキーワード抽出技術では、その文章中での単語の出現頻度、共起確率などの統計量を基準にキーワードが選ばれているが、例えば、ニュースシナリオの1トピックに相当するセリフ部分のように比較的短いテキストを対象とした場合、語数が少なくなるため統計量が信頼できず、重要な語が抽出できないという問題がある。
また、商品名をキーワードとし、辞書に登録しておき、テロップ認識結果と辞書とを照合する技術では、商品名辞書を予め用意する必要があるという問題がある。商品紹介映像であれば商品名は限定されるので辞書作成は現実的手間で可能であるが、ニュース番組のようなジャンルの映像には適用が難しい。また、テロップ認識結果の中に必ず辞書中の正解候補が存在することを仮定していたが、実際には全く認識できない誤認識文字が含まれ、キーワードを認識できないこともある。
本発明は、上記の点に鑑みなされたもので、
(1)シナリオから映像制作者の意図に沿った重要なキーワードを抽出することが可能;
(2)予めキーワード辞書を用意することなく、映像キーワードの抽出が可能;
(3)テロップ認識の結果に誤りがある場合でも重要なキーワードを抽出可能;
な映像キーワード抽出方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明は、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込み過程(ステップ1)と、
映像識別情報に基づいて、シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込み過程(ステップ2)と、
テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出過程(ステップ3)と、
テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理過程(ステップ4)と、
少なくとも、映像識別情報とキーワードを出力する出力過程(ステップ5)と、を行う。
また、本発明の適合判定処理過程において、
対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
重要文を形態素解析して、キーワードを抽出する。
また、本発明の適合判定処理過程において、
対応表からトピック毎のテロップの分布を算出し、
算出されたテロップ分布に基づいて対応表を修正する過程を更に行う。
図2は、本発明の原理構成図である。
本発明は、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
シナリオテキストが蓄積されたシナリオデータベース14と、
テロップ原稿が蓄積されたテロップ原稿データベース13と、
処理対象の映像識別情報を指定する指定手段15と、
指定手段15により指定された映像識別情報に基づいて、シナリオデータベースから該シナリオテキストを読み込むシナリオ読み込み手段17と、
指定手段15により指定された映像識別情報に基づいて、テロップ原稿データベースからテロップ原稿を読み込むテロップ原稿読み込み手段16と、
テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出し、テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理手段18と、
少なくとも、映像識別情報とキーワードを出力する出力手段19と、を有する。
また、本発明の適合判定処理手段18は、
対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
重要文を形態素解析して、キーワードを抽出する手段と、を含む。
また、本発明の適合判定処理手段18は、
対応表からトピック毎のテロップの分布を算出する手段と、
算出されたテロップ分布に基づいて対応表を修正する手段と、を更に有する。
本発明は、コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込みステップと、
映像識別情報に基づいて、シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込みステップと、
テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出ステップと、
テロップから抽出された名詞句とシナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理ステップと、
少なくとも、映像識別情報とキーワードを出力する出力ステップと、をコンピュータに実行させる。
また、本発明の適合判定処理ステップにおいて、
対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる。
また、本発明の適合判定処理ステップにおいて、
対応表からトピック毎のテロップの分布を算出するステップと、
算出されたテロップ分布に基づいて対応表を修正するステップと、を更に、コンピュータに実行させる。
本発明は、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み過程と、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析過程と、
シナリオテキストから抽出されたシナリオ名詞句とテロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定過程と、
少なくとも映像識別情報とキーワードを出力する出力過程と、を行う。
また、本発明の類似適合判定過程において、
シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める過程を含む。
本発明は、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
シナリオテキストが蓄積されたシナリオテキストデータベース
指定された映像識別情報に基づいて、テロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み手段と、
指定された映像識別情報に基づいて、シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析手段と、
シナリオテキストから抽出されたシナリオ名詞句とテロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定手段と、
少なくとも映像識別情報とキーワードを出力する出力手段と、を有する。
また、本発明の類似適合判定手段は、
前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める手段を含む。
本発明は、コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込みステップと、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析ステップと、
シナリオテキストから抽出されたシナリオ名詞句とテロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定ステップと、
少なくとも映像識別情報とキーワードを出力する出力ステップと、をコンピュータに実行させる。
また、本発明の類似適合判定ステップは、
シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求めるステップをコンピュータに実行させる。
本発明は、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み過程と、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析過程と、
シナリオテキストから抽出された名詞句とテロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定過程と、
少なくとも映像識別情報とキーワードを出力する出力過程と、を行う。
また、本発明は、適合判定処理過程において、
対応表とテロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
重要文を形態素解析して、キーワードを抽出する。
また、本発明は、適合判定処理過程において、
対応表における要素の数からトピック毎のテロップの分布を算出し、
算出されたテロップ分布に基づいて対応表を修正する過程を更に行う。
本発明は、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
シナリオテキストが蓄積されたシナリオテキストデータベースと、
指定された映像識別情報に基づいて、テロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み手段と、
指定された映像識別情報に基づいて、シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析手段と、
シナリオテキストから抽出された名詞句とテロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定手段と、
少なくとも映像識別情報とキーワードを出力する出力手段と、を有する。
また、本発明の適合判定処理手段は、
対応表とテロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
重要文を形態素解析して、キーワードを抽出する手段を含む。
また、本発明の適合判定処理手段は、
対応表における要素の数からトピック毎のテロップの分布を算出する手段と、
算出されたテロップ分布に基づいて対応表を修正する手段と、を更に有する。
本発明は、コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込みステップと、
指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析ステップと、
シナリオテキストから抽出された名詞句とテロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定ステップと、
少なくとも映像識別情報とキーワードを出力する出力ステップと、をコンピュータに実行させる。
また、本発明の適合判定処理ステップは、
対応表とテロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる。
また、本発明の適合判定処理ステップは、
対応表における要素の数からトピック毎のテロップの分布を算出するステップと、
算出されたテロップ分布に基づいて対応表を修正するステップと、を更にコンピュータに実行させる。
本発明によれば、シナリオの部分から抽出されたキーワードの内、テロップにも含まれる語は、より視聴者にアピールすべき重要なキーワードであるという判断ができる。セリフとテロップに共通したキーワードを抽出し、また、シナリオからのキーワード抽出の結果文字列と比較し、共通する語の重要度を算出することにより、映像中に現れる語の中でより適切なキーワードを決定することができる。
また、本発明は、テロップの文字数に対する表示時間、文字の大きさなどからテロップ固有の重要度を算出し、それをシナリオテキストと各トピック毎に対応付けることにより、映像固有の情報をテキストに反映し、映像で強調されている内容をキーワードとして抽出することができる。
また、本発明は、映像作成時に用意されているシナリオテキスト、あるいはテロップ原稿を用い、名詞句の自動抽出を行い、その名詞句の重要度を映像から得ることにより、キーワード辞書作成の手間を減らすことができる。
また、本発明は、複数の認識文字候補を持つテロップ認識結果文字列とシナリオから抽出されたキーワードとの間の編集距離を計算し、その編集距離に基づいた文字列の類似度を算出し、類似度が閾値以下の場合に、テロップにキーワードが含まれると見做すことにより、誤りを含んだテロップ認識結果とキーワードとの文字列照合を行い、キーワードを抽出することができ、キーワードの抽出漏れが削減される。
以下、図面と共に本発明の実施の形態を説明する。
図3は、本発明の第1の実施の形態における映像キーワード抽出装置の構成図である。
同図に示す映像キーワード抽出装置は、テロップ原稿入力部11、シナリオテキスト入力部12、テロップ原稿記憶部13、シナリオテキスト記憶部14、制御部15、テロップ情報抽出部16、シナリオ読み込み部17、適合判定処理部18、及び出力部19から構成される。
テロップ原稿入力部11は、テロップ原稿記憶部13へテロップ原稿を入力するものであり、例えば、人手によりキーボート等を用いて入力する。
シナリオテキスト入力部12は、シナリオテキスト記憶部14へシナリオテキスト(音声セリフ部分)を入力するものであり、例えば、人手によりキーボード等を用いて入力する。
テロップ原稿記憶部13は、テロップ原稿入力部11からテロップ原稿が入力され、これを蓄積する。テロップ原稿記憶部13は、図4に示すようなテロップ原稿記憶テーブルが大量に記憶されている。各テーブルには映像に対応する番号が振られており、例えば、映像を指定すると自動的にその映像に対応したテロップ原稿が取り出せるようなデータベースである。
図4のテロップ原稿記憶テーブルにおいて、テロップ原稿に必要な情報項目は、各テロップのIDy(2101)、テロップ表示開始時刻(2102)、テロップが表示されている時間長m(2103)、テロップ文(2104)、テロップ表示される文字数n(2105)、テロップの文字の大きさb(2106)などである。テロップのIDyは映像においてテロップが出現する順に昇順であり、連続した整数値が付けられているものとする。テロップ表示時間長(2103)については、代わりにテロップ表示終了時刻が記録されていてもよい。文字数n(2105)は、テロップ内容(2104)から算出できるため、必ずしも必要な項目ではない。
シナリオテキスト記憶部14は、シナリオテキスト入力部12から入力されたシナリオテキストが蓄積される。シナリオテキスト記憶部14には、テロップ原稿記憶部13同様、例えば、映像に対応するデータベースの形で、図5に示すようなシナリオテキストが、例えば、映像番号と対応付けられて大量に蓄積されている。
シナリオテキストに必要な項目はトピックの情報である。テキストのフォーマットは機械的に読み書きできる形式であればどのようなものでもよい。図5の例では、下向き三角のマークがトピックの切れ目を表している。
制御部15は、処理対象となる映像を番号で指定するための入力を行う装置であり、例えば、人がキーボードなどで映像番号を入力する。あるいは、総当り的に機械が番号を指定する。入力された番号は、テロップ情報抽出部16及びシナリオ読み出し部17を経由してそれぞれテロップ原稿記憶部13とシナリオテキスト記憶部14に渡され、該当する映像に対応した図4に示すテロップ原稿記憶テーブルのデータがそれぞれの装置へ入力される。
テロップ情報抽出部16は、制御部15で選ばれたテロップ原稿記憶テーブルをテロップ原稿記憶部13から読み出して入力する。入力テロップ原稿に処理を行い、図6のように、テロップIDy、テロップに含まれる名詞列T,テロップ重要度w(y)を算出して内部のテロップワード記憶テーブル161に格納する。図6のようなテロップワード記憶テーブル161のデータを適合判定処理部18に出力する。
名詞列T={a,a,…a}は、テロップの文を形態素解析を用いて分解し、連続した名詞や不明語などを一つの名詞aとして取り出したものである。助詞「の」で連接されている前後が名詞のものを名詞句として取り出すことも可能である。
また、テロップ重要度w(y)は、例えば、図4のテロップ表示時間mと文字列n、文字の大きさbの項目から算出する。
これは、文字数に比して長く画面に表示されたテロップはその映像の内容を良く表すテロップと判断でき、また、大きな文字で表示されたテロップは制作者が強調したいテロップと考えられるため、これらの値を用いてテロップ重要度を算出している。
シナリオ読み出し部17では、制御部15で選ばれたシナリオテキストをシナリオテキスト記憶部14から読み込む。読み込まれたシナリオテキストを一定の規則で区切り、それぞれの区切りにシナリオのIDであるxを付与することにする。シナリオIDxは登場順に連続した自然数とする。シナリオテキストにあるトピックセグメンテーションの切れ目の情報も同時に格納する。ここで、各トピックに便宜上IDを付与する。始めのトピックのIDを“1”とし、切れ目記号(下向き三角)が現われる度にIDを1増加させることにする。格納したデータの例を図7に示す。同図に示す例では、シナリオテキストを1文ずつ区切り、シナリオテキスト記憶テーブル171に格納している。
適合判定処理部18は、図6のテロップワード記憶テーブル161と図7のシナリオテキスト記憶テーブル171からデータを読み込み、映像に存在するトピック毎のキーワードとその重要度、またトピックを代表する文を1つ以上出力部19に出力する。出力の例を図8に示す。
出力部19は、映像番号と出力されたキーワード及び文をデータベース等に出力する。なお、出力時のフォーマットは機械的に読み書きできるものであればよい。
以下に、上記の構成における動作を説明する。
図9は、本発明の第1の実施の形態における動作の概要を示すフローチャートである。
なお、以下では、テロップ原稿入力部11からすでにテロップ原稿が入力され、テロップ原稿記憶部13に蓄積され、また、シナリオテキスト入力部12からシナリオテキストが入力され、シナリオテキスト記憶部14に蓄積されているものとする。
ステップ21) 制御部15において、処理対象の映像が人手により指定入力される、または、機械的に決定され、映像に付与された番号(以下、映像番号と記す)をテロップ情報抽出部16及びシナリオ読み込み部17に渡される。
ステップ22) シナリオ読み出し部17は、シナリオテキスト記憶部14からシナリオテキストを読み込み、一定の規則で区切り、それぞれの区切りにシナリオのIDを付与する。シナリオテキストにあるトピック区切りの切れ目の情報同時にシナリオテキスト記憶テーブル171に格納する。また、各トピックに便宜上IDを付与する。初めのトピックIDを“1”とし、シナリオテキスト中に切れ目記号として図5に示すような下向き三角が表れる度にIDを1つ増加させるものとする。データは、図7に示すようにシナリオテキスト記憶テーブル171に格納される。
ステップ23) テロップ情報抽出部16は、映像番号を制御部15から入力されると、当該映像番号に対応したテロップ原稿をテロップ原稿記憶部13から読み出し、当該テロップ原稿に対する処理を行い、図6に示すように、テロップIDy、テロップに含まれる1つあるいは複数の名詞句(列)T、テロップ重要度w(y)を算出して、テロップワード記憶テーブル161に格納する。名詞句列T={a,a,…a}はテロップの文を、形態素解析を用いて分解し、連続した名詞や不要語などを一つの名詞句aとして取り出す。例として助詞「の」で連接されているもので、かつ、その前後が名詞句であるものも一つの名詞句として取り出すことも可能である。
テロップ重要度w(y)は、例えば、図4のテロップ表示時間mと文字数n、文字の大きさbの項目から算出する。ここでは、例として、
w(y)=b log10(m/n
として算出する。
ステップ24) 適合判定処理部18は、図6のテロップワード記憶テーブル161と図7のシナリオテキスト記憶テーブル171のデータを読み込み、映像に存在するトピック毎のキーワードとその重要度、またトピックを代表する文を1つ以上出力する。図8の(A)に出力例を示す。
ステップ25) 出力部19において、映像番号と出力されたキーワード及び文をデータベース等に格納する。なお、データベースへの格納時のフォーマットは機械的に読み書きできるものであればよい。または、ディスプレイ等の表示装置によりユーザに抽出されたキーワードを表示してもよい。
次に、上記のステップ24の適合判定部18における適合判定処理について詳細に説明する。
図10は、本発明の第1の実施の形態における適合判定処理のフローチャートである。
ステップ31) 適合判定部18は、シナリオ記憶テーブル171とテロップワード記憶テーブル161から読み込んだデータのマッチングを、シナリオ文JとテロップワードTを用いて行う。そのマッチングの結果を対応表C(x,y)としてメモリ等に記録し、出力する。C(x,y)に記録する数値としては、シナリオ文Jに含まれるテロップワードTの数の割合である。詳細は、図11において後述する。
ステップ32) 適合判定部18は、ステップ31で作成された対応表からテロップ分布を算出し、対応表C(x,y)を修正する。まず、ステップ31で作成された対応表C(x,y)をメモリ等から読み込む。この対応表から各トピックIDtのテロップ分布S(y)を算出し、テロップが属するトピックを決定する。その後、各々のテロップは一つのトピックに属すると仮定し、テロップが誤って他のトピックに対応付いている対応表の値を削除し、対応表及びテロップ分布を修正する。詳細は、図14において後述する。
ステップ33) ステップ32で出力された対応表C(x,y)とテロップワード記憶テーブル161のデータを入力し、シナリオ文の重要度を算出する。テロップ重要度を反映した対応表w(y)C(x,y)を作成し、それを用いてシナリオ文の重要度を算出する。詳細は図17において後述する。
ステップ34) テロップ重要度を利用してキーワードを選び出し、図8に示すフォーマットで出力する。ステップ33で抽出されたシナリオ文からのキーワードもこの出力に付け加えることが可能である。詳細は、図19において後述する。
次に、上記のステップ31の対応表作成処理について説明する。
図11は、本発明の第1の実施の形態における対応表作成処理のフローチャートである。以下の説明における各変数は以下の通りである。
X:シナリオ文IDxの最大値;
Y:テロップIDyの最大値;
(i):テロップTから抽出されたi番目の名詞句;
n:テロップTから抽出された名詞句の数;
適合判定処理部18は、初めに、ステップ401からステップ407の処理により、あるx,yについてシナリオJとテロップ名詞列Tとの文字列比較を行い、対応表C(x,y)に一致した単語数の割合を書き込む。ステップ408からステップ411までは、表内を総当り的に走査していくステップである。
ステップ401) シナリオのIDxとテロップIDyを初期化する。テロップ数と同じ列数とシナリオ区切り数と同じ行数を持つ表(テロップワード−シナリオ対応表C(x,y).例えば、図12))を作成する。また、対応表C(x,y)内の値を全て0にセットする。
ステップ402からステップ406では、シナリオJの部分列と、テロップTの各名詞との文字列比較を行う。出力は、一致した名詞の数をテロップT中の全名詞数で割った値を記憶した対応表C(x,y)である(対応表の例は、図12)。また、出力として一致したテロップ名詞の文字位置を同時に出力する例も考えられる(例えば、図13の文字位置も保存する処理とした場合)。
ステップ402) テロップ内の名詞列aの文字位置iを1に、また一致回数カウンタbを0に初期化する。
ステップ403) 文字列比較を行い、Jの中にaが含まれているかどうかを判定する。含まれている場合には、ステップ404に移行し、含まれていない場合にはステップ405に移行する。
ステップ404) bをインクリメントする。
ステップ405) テロップT内の全ての名詞について文字列比較を行ったか判定する。つまり、文字位置iがテロップT内の名詞の総数nと一致した時、文字列比較ループを抜けステップ407に移行する。一致しない場合には、ステップ406に移行する。
ステップ406) iをインクリメントし、ステップ403に移行する。
ステップ407) 算出された一致個数bとnとの比を対応表C(x,y)に記録する。表中に記録する数値は、ステップ404で一致した文字位置情報を格納しておけば、その一致文字位置情報も同時に書き込むことができる(例えば、図13)。図13(A)の対応表C(x,y)においてテロップ「24」とシナリオ「3−29」との対応する名詞の割合は1/2で、合致した名詞はテロップ24の2番目の名詞であることがこの表によりわかるようになっている。次に、ステップ408に移行する。
ステップ408) 全てのテロップIDyについて処理が終わっているかどうかを判定する。終わっていない場合は、ステップ409に移行し、終わっている場合は、ステップ410に移行する。
ステップ409) yをインクリメントし、ステップ402へ移行する。
ステップ410) 全てのシナリオIDxについて処理を行ったかどうかを判定する。全てのキーワードについて処理が終わっていない場合は、ステップ411に移行する。処理が終わっている場合には、完成した対応表C(x,y)をメモリ等に出力する。
ステップ411) yを1に初期化し、xをインクリメントしてステップ402に移行する。
次に、ステップ32のテロップ分布算出処理について説明する。
以下では、ステップ31で作成された対応表C(x,y)をメモリ等から読み込んで入力するものとする。
図14は、本発明の第1の実施の形態におけるテロップ分布算出・対応表修正処理のフローチャートである。
以下で用いられるδは、0以上の整数値であり、対応誤り消去の際に区切り境界付近で消去しない対応のオフセットであり、テロップの区切り検出誤差の見込み量である。
ステップ51) トピックIDtを初期化する。
ステップ52) あるトピックIDtに対するテロップの分布S(y)を算出し、ステップ53に移行する。
(y)の算出式は以下のようになる。
Figure 2005234786
但し、xはトピックtに属するシナリオIDである。
ステップ53) トピックIDが1かどうかを判定する。1の場合は、処理に必要な2つ目の分布算出のため、ステップ58に移行し、1以外の場合はステップ54に移行する。
ステップ54) 2分布間の区切りを算出する。2つのテロップ分布St−1,Sの区切りを算出し、算出されたテロップ分布S(y)を用いてテロップ分布の誤対応を修正する。当該ステップでは、2つのテロップ分布S(y),St−1(y)間の分離度を計算し、最大の分離度を与えるテロップIDを2分布の区切りとなるテロップIDとして算出する。分離度の算出法については、後述する。
この区切りとなるテロップIDをtに対してy(t)としてメモリ等に記憶する。この処理により、トピックt−1に属するテロップは、分布St−1(y)の内y<y(t−1)となり、また、トピックtに属するテロップは分布S(y)の内y≧y(t−1)となる。この区切りにより分布内に存在する誤対応を削除することができる。誤対応の削除の処理がステップ55、56である。
ステップ55) トピックt−1における分布St−1(y)の、別のトピック(>t−1)に対応付いているテロップの対応を削除する。つまり、トピックt−1に属するシナリオIDx、y≧y(t−1)+δの範囲において対応表C(x,y)の各要素、及びy≧y(t−1)の範囲にあるテロップ分布St−1(y)の数値を0にする。
ステップ56) ステップ55同様に、トピックtにおける分布の、別のトピック(<t)に対応付いている対応を削除する。つまり、トピックt’(t’≧t)に属したシナリオIDx、y<y(t)−δの範囲について対応表C(x,y)内の格要素と、及びテロップ分布St+1(y)のy<y(t)−δの範囲にある数値を0にする。δ(≧0)は、テロップ区切り検出の誤差により正しい対応付けが削除されるのを防ぐため、ステップ55,56にて削除しない区切り付近の要素数である。このようにしてテロップ分布及び対応表を修正する。対応表のt’(t’≧t)の範囲の要素について削除できるのは、テロップが1つのトピックに属しており、かつ、トピックの順番がシナリオテキストの順番と同じであるときのみ行うことができる。
ステップ57) 次の処理対象トピックが存在するかどうかチェックし、存在するときはステップ58に移行する。存在しないときは、トピック分布S(y)と修正された対応表C(x,y)を出力して終了する。
図15に算出された分布と対応表を示す。「トピック3」と記している行がステップ52にて算出された「トピック3」のテロップ分布を示している。この分布と「トピック4」の分布を入力し、2分布間の区切り検出を用いて、テロップ列のトピック区切りを算出する。
ここでは、トピック区切りとしてy(3)=28と算出されており、これで「トピック3」に対応するテロップがIDy=23〜27(23〜というのは、t=2,3間の区切りにより算出)、「トピック4」に対応するテロップがIDy=28〜と決定される。
それで、「トピック3」の文章にy≧28のテロップが対応しているときはその対応を削除する。対応表C(x,y)でy≧28に存在する「トピック3」の文章との対応を示す数値を全て0にセットする(表中の斜線で示す)。また、「トピック4」以上のトピックにおいてテロップy<28の対応表の値が0でないときには、0にセットする。各テロップが一つのトピックに属することを仮定すると、テロップと対応するトピックを特定し、対応するトピック以外の対応付けを消去したことによりテロップ内の名詞のシナリオとの誤対応が消去される。出力は、誤対応を消去した対応表C(x,y)と分布S(y)である。
次に、上記のステップ54における分離度算出及び区切り検出処理を詳細に説明する。
図16は、本発明の第1の実施の形態における分離度算出及び区切り検出処理のフローチャートである。
以下のステップ601〜608は、分布St+1(y)の終点Yt+1を決定する処理であり、ステップ609〜613が分離度算出及び区切り検出の処理である。
ステップ601) 変数の初期化ステップであり、分離度D=0,分布インデックスy=y(t−1)、区切り候補y’=y(t−1)+δ+1(但し、y(0)=0),Yt+1=0,カウンタz=0とする。
ステップ602) 分布St+1(y)が0かどうか判定し、0でないときはステップ603に移行し、0の場合は、ステップ604に移行する。
ステップ603) yの値を記憶し(Yt+1=y)、カウンタzをリセットして(z=0)ステップ606へ移行する。
ステップ604) Yt+1が初期状態かどうかを判定し、初期状態でないときは、ステップ605に移行する。
ステップ605) 分布が空の個数を数えるカウンタzをインクリメントして、ステップ606に移行する。
ステップ606) 次のテロップが存在するか判断する(y=Y)。また、からの個数zが一定値Z以上になっていないかを判定する。「真」の場合は、ステップ607に移行し、「偽」の場合は、ステップ608に移行する。なお、テロップの分布は、該当するトピック範囲内に集まっているものであり、一定以上離れた場所の分布は誤りである可能性があるため、定数Z以上は先を探さないこととしている。
ステップ607) 処理の終了後に、Yt+1が初期値であるとき(Yt+1=0)、つまり、分布St+1(y)が空であるかどうかを判定し、空の場合は、ステップ617に移行する。空でない場合には、区切り検出処理(ステップ609)に移行する。
ステップ608) yをインクリメントしてステップ602に移行する。
ステップ609) 分離度D(y’)を次式により算出し、ステップ610に移行する。
Figure 2005234786
この式は、テロップy’の前で2つのトピックに分けたときに、それぞれのトピックに属する各テロップ分布の比をとったものである。1に近いとき2トピックの数の割合がつりあいに近いので分離が良いとする。
ステップ610) 分離度(D(y’))が1を超えるかどうかを判定する。超えた場合は、前後で区切りがあるのでステップ613に移行する。超えない場合はステップ611に移行する。
ステップ611) 終了判定を行う。区切りy’がYt+1の場合は区切りが検出されずに終了することになり、ステップ614に移行する。終了でない場合には、ステップ612に移行する。
ステップ612) y’をインクリメントしてステップ609に移行する。
ステップ613) ステップ610において、分離度が1を超えた場合に、1に近い分離度D(y’−1)と1/D(y’)を比較して、どちらが区切りかを判定する。大きな値を持つ方のy’の値を区切りとして出力して終了する。
ステップ614) これまで算出されたD(y’)のうち、最も1に近いものを区切りとして出力して終了する。
ステップ615) ステップ613において、D(y’−1)が区切りと判定された場合には、y’−1を出力して処理を終了する。
ステップ616) ステップ613において、D(y’)が区切りとして判定された場合には、区切りy’を出力して処理を終了する。
ステップ617) ステップ607において空の場合には、前に算出された区切りY(t−1)を出力して処理を終了する。
上記の手順によると、分布に空白が続いた後、区切りが存在するときには、yが大である方へ区切りがくることになる(分布の左端に区切りがくる)。これは、ニュース等のコンテンツにおいては、トピック初めのテロップは見出しのテロップとなっており、対応するシナリオが存在することが多いので、特に問題となることはない。シナリオと対応付いていないテロップのトピックは特に決定する必要はないと考えられる。
次に、上記のステップ33の重要文抽出処理について説明する。
図17は、本発明の第1の実施の形態における重要文抽出処理のフローチャートである。
ステップ71) 処理対象トピックtを初期化する(t=1)。
ステップ72) 対象トピック内のシナリオxについて、次式によりシナリオ重要度Vt(x)を算出する。
Figure 2005234786
ステップ73) ステップ72で算出した重要度V(x)内の最大値を与えるxの値を重要文IDx(t)としてメモリ等に記憶する。この例では、最大値を与えるxを1つしか算出していないが、複数の重要文を選んでもよい(一定数、一定重要度以上など)。
ステップ74) ステップ73で選ばれた重要文を形態素解析して、その中に含まれる固有名詞などを抽出する。これを重要文キーワードU(t)としてメモリ等に記憶する。このキーワードは、テロップには含まれていない場合、新たにキーワードとして追加することが可能である。このキーワードの重要度はそのキーワードを抽出した文の重要度をその文に含まれる相異なるキーワードの数で割ったものとする。重要文から取り出すキーワードは0個以上の名詞であり、また、固有名詞だけでなく、普通の名詞句を取り出してもよい。
ステップ75) 次のトピックt+1があるかを判定し、存在する場合は処理対象トピックを1増やして、ステップ72に戻る。最後のトピックまで処理が終了したときは、重要文IDx(t)、重要度V(x(t))、重要文キーワードU(t)を出力して処理を終了する。
出力例を図18に示す。同図(A)の表で右端の値が各シナリオIDの重要度であり、「トピック3」ではシナリオID30の文の重要度が最大であるので、同図(B)の文章が出力される。「トピック3」の映像内容は、「加藤清正が行った治水事業」についての説明が主であるため、この抽出された文はまとめの文といえる。重要文キーワードは、『加藤清正』という固有名詞である。
次に、上記のステップ34におけるキーワード決定処理について説明する。
図19は、本発明の第1の実施の形態におけるキーワード決定処理のフローチャートである。
同図に示す処理は、出力部19の出力テーブルOに出力する情報を記憶し出力するものである。
出力テーブルの例として、図8(A)の表と、図13(B)の表がある。項目は、テロップIDy、対応するトピックID,抽出されたキーワード、キーワードの重要度がある。重要文に出てきているテロップの場合は、同時に出てきている他のテロップIDを記憶する関連テロップID,また重要文から抽出されたキーワードと重要文そのものへのポインタを格納する。このフローチャートはこの出力テーブルを作成する処理を説明している。なお、出力テーブルは出力部19上のメモリ等の記憶手段上に作成されるものとする。
以下の処理の前提として、ステップ33の処理結果として(x(t)、V(x(t),U(t))の組が与えられるものとする。
ステップ801) 変数を初期化する。t=1、y=1、x=(トピックtに属しているシナリオのIDxの集合)とする。
ステップ802) テロップyの総重要度W(y)を算出する。算出方法は、次式による。
Figure 2005234786
ステップ803) テロップ総重要度が0かどうか判定する。0の場合はテロップの名詞句がシナリオに1度も登場していないため、重要でないと判断できるため、キーワードとしては格納しない。ステップ804に移行する。0でない時には、ステップ808に移行する。
ステップ804) 次のテロップが存在するか判定し、存在すれば、ステップ805へ移行し、存在しない場合には出力テーブルOを出力して終了する。
ステップ805) 次テロップが同トピックtに属するかを判定し、同トピックでない場合、ステップ806へ移行する。同トピックの場合はそのままステップ807に移行する。
ステップ806) ステップ805で同トピックでない場合には、トピックtをインクリメントしてステップ807に移行する。
ステップ807) 処理対象テロップIDをインクリメントしてステップ802に戻る。
ステップ808) ステップ803において、0でない時には、キーワードとして出力テーブルOに書込みステップ809に移行する。
ステップ809) 重要文中にこのテロップ名詞句が含まれているかどうかを判定し、含まれている場合は、ステップ810に移行する。含まれていない場合にはステップ804に移行する。
ステップ810) 出力テーブルOに、C(x(t),y’)≠0であるy’全てを関連テロップIDとして、また、ステップ803で出力された重要文のキーワードを関連ワードとして、また、重要文へのポインタをそれぞれ追加し、ステップ804に移行する。
上記の処理結果は、例えば、図8(A)の表、図13(B)の表のように、映像番号に対して1つのテーブルをメモリ等の上に用意し、重要度が0でないテロップについて記録する。項目は、テロップID,トピックID,テロップ名詞列、テロップ総重要度W(y)があり、また、重要文中に存在するテロップワードの行に対して関連ワードという項目を追加し、入力されている重要文キーワードU(t)をそこに記憶する。さらに、重要文へのポインタを追加する。このテーブルを映像番号と関連付けてデータベース(補助記憶装置)(図示せず)に格納する。
また、他の出力例は、図8(A)の表に示す。テロップID,y=23,24,25,26,27の名詞がキーワードとして出力される(図8(B))。図13(A)の表のように一致したテロップ名詞の文字位置情報も記憶されている場合は、シナリオ文と一致したテロップ名詞のみをキーワードとして出力することも可能である(図13、『トピック3のキーワード』(B))。
[第2の実施の形態]
図20は、本発明の第2の実施の形態における映像キーワード抽出装置の構成を示す。
同図において、図3と同一構成部分には同一符号を付与する。
図20に示す映像キーワード抽出装置は、テロップ認識結果入力部91、シナリオテキスト入力部12、シナリオテキスト記憶部14、制御部15、テロップ認識結果記憶部93、テロップ認識結果読み込み部96、シナリオテキスト解析部97、類似適合判定処理部98、出力部99から構成される。
テロップ認識結果入力部91は、テロップ認識結果記憶部93へテロップ認識結果を入力するものである。入力の方法は、例えば、映像を入力し、その映像に表示されたテロップ文字列を画像処理により認識し、テロップ文字コード列を記録することにより行う。
テロップ文字の認識処理は、例えば、「桑野他、“エッジ密集度によるテロップ文字フレーム検出誤り抑制法”(電子情報通信学会情報・システムソサエティ大会、D-12-12,1997年 9月)」や、「森他、“背景・文字の形状特徴と動的修正識別関数を用いた映像中テロップ文字認識”(電子情報通信学会論文誌、Vol. J83-D2, No.7, pp.1658-1666. 2000年7月)等の技術を組み合わせて利用することで実現可能である。
一般的なテロップ文字認識手法では、必ずしも正確な文字コードが得られる訳ではないので、1つのテロップ文字について複数の認識結果を候補として出力することで、認識誤りに対してロバストな処理が実現できる。認識結果を、例えば、図21に示すようなテロップン認識結果記憶テーブル961に格納する。図21の例では、認識候補として、10位までを各列毎に記憶している。一連のテロップ文字列(3007)毎に、識別番号ID:y(3001)、テロップ表示開始時刻(3002)、テロップ表示時間長(3003)、テロップ文字数(3004)、テロップ文字の大きさ(3005)を記録する。
テロップ認識結果記憶部93は、テロップ認識結果入力部11からテロップ認識結果が入力され、蓄積されるデータベースであり、図21(A)に示すようなテロップ認識結果記憶テーブルが大量に記憶されている。各テーブルには映像に対応する番号が振られており、例えば、映像を指定すると自動的にその映像に対応したテロップ認識結果がとりだせるようなデータベースである。
このテロップ認識結果記憶のために必要な情報項目は、各テロップのIDy(3001)、テロップ表示開始時刻(3002)、テロップが表示されている時間長m(3003)、テロップが表示される文字数n(3004)、テロップの文字の大きさb(3005)、テロップ認識結果文字列L(3007)などである。テロップのIDyは、映像においてテロップが出現する順に昇順であり、連続した整数値で付けられているものとする。テロップ表示時間長m(3003)については、代わりにテロップ表示終了時刻が記録されているものでもよい。文字数n(3004)は、テロップ認識結果文字列L(3007)から算出できるため、必ずしも必要な項目ではない。テロップ認識結果文字列Lは、各行がテロップの各1文字に相当し、各列が認識候補を表している。この例では、テロップ認識の結果として、10個の文字の候補が算出されるため10列の認識文字候補が例には存在している。
テロップ認識結果読み込み部96では、制御部15で選ばれたテロップ認識結果記憶テーブルのデータをテロップ認識結果記憶部93から読み込む。また、テロップ重要度を算出する。その結果を図21の(B)に示す。この算出方法は、図3のテロップ情報抽出部16の処理と同様の算出法を用いるものとする。
シナリオテキスト解析部97は、制御部15で選ばれたシナリオテキストをシナリオテキスト記憶部14から入力する。入力されたシナリオテキストを一定の規則で区切り、それぞれの区切りにシナリオのIDを付与する。シナリオテキストにあるトピックの切れ目の情報もID付けして同時に格納する。
また、シナリオの各文に対して形態素解析を行い、名詞句を抽出する。各名詞句に対してIDx’を付与して、シナリオ名詞句記憶テーブル971に格納する。当該シナリオ名詞句記憶テーブル971の例を図22に示す。同図の例では、シナリオテキストを1文ずつに区切り、名詞句を抽出している。項目は、名詞句IDx’(2901)、シナリオIDx’(2902)、トピックIDt(2903)、文中でその名詞句が出現する文字位置(2904)、シナリオ名詞句K(2905)である。
なお、形態素の方法としては、例えば、「形態素解析システム『茶筌』、情報処理Vol.41 No.11,pp.1208-1214,Nov.2000」がある。
また、形態素解析後に、名詞句を抽出する例を以下に示す。
・連続した名詞を一つの名詞句として取り出す(但し、サ変名詞の後に動詞『する』が来る場合のサ変名詞は除く)。
・上記に加え、助詞「の」で結ばれる2つの名詞(句)があれば、まとめて取り出す(例:『土木』(名詞)+『の』(助詞)+『神様』(名詞)→『土木の神様』)。
・助詞「の」が2つ以上存在する名詞句では、「の」で結ばれる名詞の組み合わせを全て取り出す。
・類似文字列比較をする場合は、上記のように抽出された名詞句のうち、一定文字列数以下の名詞(句)を消去する。これは類似文字列比較の信頼性を向上させるためである(また、トピックを特定するのにふさわしくない名詞(句)が抽出されることを防ぐ)。
類似適合判定処理部98では、図21のテロップ認識結果記憶テーブル961と、図22のシナリオ名詞句記憶テーブル971を読み込み、映像のキーワードを出力する。出力例を図23に示す。
出力部99では、映像番号と出力されたキーワード及び文をデータベース等に格納する。なお、格納時のフォーマットは機械的に読み書きできるものであればよい。
次に、上記の構成における動作を説明する。
図24は、本発明の第2の実施の形態における動作の概要を示すフローチャートである。
ステップ101) 制御部15により、処理対象の映像を人が指定する、あるいは、機械的に決定することにより、テロップ認識結果読み込み部96及びシナリオテキスト解析部97に、映像に付与されている映像番号を渡す。
ステップ102) テロップ認識結果読み込み部96は、ステップ101において制御部15で選ばれた映像番号に対応するデータをテロップ認識意結果記憶部93から読み込み、テロップ重要度を算出し、テロップ認識結果記憶テーブル961に格納する。なお、テロップ重要度の算出方法は、図3のテロップ情報抽出部16の処理と同様である。
ステップ103) シナリオテキスト解析部97は、ステップ101において制御部15で選ばれた映像番号に対応するデータをシナリオテキスト記憶部14から読み込み、シナリオテキストを一定の規則で区切り、それぞれの区切りにシナリオのIDを付与する。シナリオテキストにあるトピックの切れ目の情報もID付けして、同時にシナリオ名詞句記憶テーブル971に格納する。また、シナリオの各文に対して、形態素解析を行い、名詞句を抽出する。各名詞句に対してIDx’を付けてシナリオ名詞句記憶テーブル971に格納する。格納したデータの例を図22に示す。この例では、シナリオテキストを1文ずつに区切り、名詞句を抽出している。項目は、名詞句IDx’(2901)、シナリオIDx(2902)、トピックIDt(2903),文中で、名詞句が出現する文字位置(2904)、シナリオ名詞句Kx’(2905)である。
ステップ104) 類似適合判定処理部98において、シナリオ名詞句記憶テーブル971と、テロップ認識結果記憶テーブル961からシナリオ名詞句Kx’と、テロップ認識文字列Lを読み込み、x’yの全ての組み合わせについて順次照合し、テロップ認識文字列Lの中にシナリオ名詞句Kx’が部分文字列として含まれているか調べ、含まれている場合は、そのシナリオ名詞句Kx’と、テロップLとのIDの組(x’,y)と、シナリオ名詞句Kx’とテロップLの出現回数A(x’)、B(y)を出力する。出力は、抽出されたキーワードと当該キーワードに対応するIDの組(x’,y)などである。このステップについては、図25で後述する。
ステップ105) 出力部99において、映像番号と出力されたキーワード及び文をデータベース等に格納する。格納時のフォーマットは、機械的に読み書きできるものであればよい。または、ディスプレイ等の表示装置によりユーザに抽出されたキーワードを表示してもよい。
次に、上記のステップ104の類似適合判定処理について説明する。
図25は、本発明の第2の実施の形態における類似適合判定処理のフローチャートである。
ステップ111) 類似適合判定処理部98は、シナリオ名詞句のIDx’とテロップIDyを初期化する。また、全てのテロップの中でシナリオ名詞句Kx’が出現した回数A(x’)が出現した回数A(x’)と、全てのシナリオ名詞句の中でテロップLが出現した回数B(y)を0に初期化する。
ステップ112)、シナリオ名詞句Kx’と、テロップ認識結果文字列Lの部分列と類似文字列比較を行い、類似度を算出し、類似度が一定値以上であるとき一致と見做す。この類似度算出については、後述する。
ステップ113) 一致した場合としなかった場合の場合分けを行う。不一致が確認された場合には、ステップ115に移行し、一致が確認された場合にはステップ114に移行する。
ステップ114) ステップ113で一致したシナリオ名詞句IDx’と、テロップIDyの対(x’,y)を出力する。また、一致したそれぞれのIDに対応する出現回数A(x’)、B(y)をインクリメントした後、ステップ115に移行する。
ステップ115) 全てのテロップについて処理が終わっているかどうかを判定する。終わっていない場合は、ステップ116に移行し、終わっている場合には、ステップ117に移行する。
ステップ116) yをインクリメントし、ステップ112に戻る。
ステップ117) 全てのシナリオ名詞句について処理を行ったかを判定する。全てのキーワードについて処理が終わっていない場合は、ステップ118に移行し、終わっている場合には、ステップ119に移行する。
ステップ118) yを1に初期化し、x’を1つ増やしてステップ112に戻る。
ステップ119) 上記の処理の結果を用いて、キーワードとなる語や重要なテロップなどを決定し、出力する。例えば、ある閾値よりA(x’)が大きい時は、シナリオ名詞句Kx’を重要語として出力する。また、ある閾値よりB(y)が大きいとき、そのテロップLを重要なテロップとして出力したり、Kx’とその重要度A(x’)あるいは、図21に記載されている重要度3006を組にして出力することも可能である。
出現回数A(x’)の大きなシナリオ名詞句Kx’はテロップとして表示された回数が多いキーワードであり、A(x’)は、キーワードの重要度の目安として利用可能である。音声と映像の両者に含まれる言葉は、視聴者に印象付けたいと映像制作者が意図したものと考えることができる。本発明では、音声としてのセリフ部分の重要語(シナリオ名詞句)と、映像表示としてテロップ文字列との相関を調べることでキーワードを抽出している。
また、B(y)の大きなテロップLは、シナリオ名詞句を多く含むということで、Lは纏めてきなテロップであると考えられ、例えば、そのテロップの表示時間前後に重要な(トピックにおいてキーとなる)映像や音声が流れていると判断することもできる。
次に、ステップ112の類似文字列判定処理について説明する。
図26は、本発明の第2の実施の形態における類似文字列判定処理のフローチャートである。同図に示す処理は、大きく分けて3つの部分に分かれる。ステップ1202、1213〜1216が名詞句文字kの内、テロップ認識結果文字gの中に存在する文字を探す先頭一致文字検出フェーズであり、ステップ1203〜1210がDPマッチングにより一致した先頭文字から名詞句と認識結果文字列との編集距離を算出していく編集距離マトリックス作成フェーズ、ステップ1211,1212が算出された類似度の最大値を格納していく類似度最大化フェーズである。
先頭一致文字列検出フェーズでは、テロップ文字列の中でシナリオ名詞句の文字を含む文字位置の探索を行う。その後一致した文字位置以降の部分文字列について編集距離を算出する編集距離マトリクス作成フェーズへ移行する。
編集距離マトリックス作成フェーズについては、公知の技術であるDPマッチングを用いた類似文字列照合処理を行う。例えば、「内山他、“近似文字列照合による前文検索のための接尾辞配列の高速走査法”(情報処理学会論文誌:データベース(2002年度)、Vol.43, No.SIG9(TOD15), pp>1-14))を参考にした方法を用いることができる。
以下にその概略を説明する。
文字列K=k,k,…,kとG=g,g,…,gのそれぞれ文字位置i〜I,j〜Jの部分文字列の編集距離をdist(K,G)とする。ここで編集距離とはKをGに一致させる操作として、置換・削除、挿入を許したとき、それらのコストの総和のことである。ここで、kとgの置換コストをsub(k,g)、gの削除コストをdel(g),kの挿入コストをins(k)とする。k1…iとg1…jとの距離をD[i,j]は、次のような漸化式で計算できる。
D[i0-1,j0-1]=0,
D[i,j0-1]=D[i-1,j0]+ins(ki)
D[i0-1,j]=D[i0-1.k-1]+del(gj)
D[i,j]=min{D[i-1,j-1]+sub(ki,gj),D[i-1,j]+del(ki),D[i,j-1]+ins(gj)}
(i0≦i≦I, j0≦j≦J)
コストとして考えられるものとしては、例えば、任意のi,jについて、sub(k,g)=0(gの認識候補中にkが存在する場合。以降便宜上k=g表す)、sub(k,g)=1(gの認識候補中にkが存在しない場合。以降便宜上k≠gと表す)、del(g)=1, ins(k)=1などがある。また、sub(k,g)={テロップ認識において算出された文字の類似度(0から1の範囲)}とする方法も考えられる。
また、テロップ認識結果の文字コード列が複数候補算出される場合は、文字の一致をその文字位置jにおける認識候補の一致文字の和集合とみなし、sub(k,g)を算出する。
このとき、
dist(K,G)=min{D[I,j]} …(式A)
である。
ここで、類似度をこの編集距離と名詞句の文字列長I、及びD[i,j]=D[i−1,j−1]+sub(k,g)を選んだ回数(上記の例ではk=gの回数)Nを用いて例えば、N/(I+dist(K,G))とする。i,jを変化させながら類似度を計算し、類似度が予め設定した値よりも大きい場合、シナリオ名詞句は、テロップGに含まれていると判断する。
また、シナリオ名詞句Kとテロップ認識結果文字列の文字位置j〜jと(但し、jは式Aにてmin{D[I,j]}を与えるjの最大値)とが、ほぼ一致したと考えられるので、例えば、テロップ文字位置j〜jの部分文字列をシナリオ名詞句Kで置換することでテロップ認識結果を修正できる。
類似度最大化フェーズは類似度を算出し、類似度の最大となる位置とその類似度の値を保存する。
図26のフローチャートにおいて、
D[i,j]:編集距離マトリックス;
:あるシナリオ名詞句のi番目の文字;
:あるテロップ認識結果文字列のj番目の文字(複数候補が存在);
N:k=gとなった回数。ただし、k=gは複数候補を持つ文字gの候補中に文字kが含まれていることを示す(以下、同様);
Q:類似度;
I:シナリオ名詞句Kの文字列数(iの最大値);
J:テロップ認識結果Gの文字列長(jの最大値);
を示す。
ステップ1201) 変数の初期化ステップである。名詞句文字位置i、認識文字文字位置jをそれぞれ初期値の“1”に、一致文字数N、類似度Qをそれぞれ0に初期化する。また、テロップ認識結果文字列の一致先頭文字位置j、一致終端文字位置jを0に初期化する。
ステップ1202) 名詞句文字kを認識文字gの各候補文字と比較して一致するものがあるか調べる。存在する場合は、編集距離を算出することにし、ステップ1203へ移行する。存在しない場合は、ステップ1213に移行する。
ステップ1203) 編集距離マトリクスDの算出前にDの初期化を行う。事前の編集距離として、i−1行目とj−1列目を埋めておく。また、先頭の一致位置をi,jとしてそれぞれメモリ等に記憶しておく。
ステップ1204) 現認識文字位置jが認識文字長を超えていない場合、ステップ1202と同様のkとgの文字を各候補について比較し、一致文字があるかどうか判定する。一致文字があった場合とない場合で編集距離マトリクスの置換コストがない場合とある場合にはステップ1205に移行し、そうでない場合には、ステップ1206に移行する。
ステップ1205) D[i,j]=min{D[i−1,j−1]+sub,D[i,j−1]+ins,D[i−1,j]+del}を計算し、ステップ1207に移行する。
ステップ1206) 一致回数Nをインクリメントし、上記のステップ1205のsubを含む項でそのsubを足さないでD[i,j]を算出し、ステップ1207に移行する。但し、この例では、sub=1,ins=1,del=1としている。
ステップ1207) 認識文字位置jが初期位置から名詞句文字列長より定数cだけ大きくなっているかどうか判定する、認識文字位置による終了判定を行う。認識結果に冗長な誤認識文字が(1つの文字を2つの文字と誤認識することにより)存在することがあるため、比較すべき文字列の長さをcだけ伸ばすことにしている。当該ステップで認識文字について比較が終了したと判定された場合はステップ1209へ、終了していない場合は、ステップ1208へ移行する。
ステップ1208) 認識文字位置をインクリメントしてステップ1204に戻る。
ステップ1209) 名詞句文字位置iが最後の文字についてまで編集距離マトリックスを作成した場合には、ステップ1211に移行し、最後の文字まで比較が終わっていない場合には、ステップ1210に移行する。
ステップ1210) 名詞句文字位置iをインクリメントし、また、認識結果文字位置jをjに戻してステップ1204に戻る。
ステップ1211) Q=N/(min{D[I,j]}+I)により、類似度Qを算出する。名詞句文字位置i=Iにおける編集距離マトリクスの最小値min{D[I,j]}が求める編集距離となり、それと名詞句文字列長Iを足したもので一致文字数を割った値を類似度として採用する。それが、現在メモリ等に記憶されている類似度とどちらが大きいかを判定する。Q<N/(min{D[I,j]}+I)である場合には、ステップ1212に移行し、そうでない場合には、ステップ1202に戻る。
ステップ1212) ステップ1211で求められた類似度をQに、現先頭文字位置jをjに、評価値Qの算出の際に得られるmin{D[I,j]}を与えるjをjにそれぞれ記憶し、先頭文字位置検出フェーズのステップ1202に戻る。
ステップ1213) 認識文字の次の文字があるかjにより判定した後、次の認識文字がある場合、ステップ1214に移行する。
ステップ1214) 文字位置jをインクリメントしてステップ1202に戻る。
ステップ1215) 名詞句文字の次の文字があるかiにより判定し、次の文字がある場合、ステップ1216へ移行する。最後まで調べていた場合はステップ1217へ移行する。
ステップ1216) 名詞句文字kの文字位置iをインクリメントしてステップ1202に戻り、次の文字について認識結果文字を初めから調べていくために、j=1とする。
ステップ1217) 文字位置j,jと類似度Qを出力する。ここで、文字位置j〜jはシナリオ名詞句文字列{k}が対応するテロップ認識結果文字列{g}中の文字位置であり、その文字列同士の類似度がQである。
以上のようにして、認識文字列と名詞句文字列の類似度を算出する。
[第3の実施の形態]
図27は、本発明の第3の実施の形態における映像キーワード抽出装置の構成図である。
本実施の形態は、前述の第1の実施の形態の処理対象の一つがテロップ原稿からテロップ認識結果文字列になった例を示しており、主な処理については、第1の実施の形態と大差ない。本実施の形態では、テロップを形態素解析する代わりに、シナリオテキストを形態素解析する。テロップ認識結果には、誤認識文字が含まれており、形態素解析を行うことが困難であるのがその理由である。類似文字比較の部分は、第2の実施の形態と同様である。以下には変化のある部分だけを記載する。
図27では、図3及び、図20と同一部分については同一符号を付す。
シナリオテキスト解析部137では、制御部15で選ばれた番号に対応するシナリオテキストをシナリオテキスト記憶部14から読み出し、入力されたシナリオテキストを一定の規則で区切り、それぞれの区切りにシナリオIDを付与する。シナリオテキストにあるトピックの切れ目の情報もID付けして同時に格納する。
また、シナリオの各文に対して形態素解析を行い、名詞句を抽出する。各シナリオIDそれぞれに複数のシナリオ名詞句列Kを算出し、シナリオ名詞句記憶テーブル1371に格納する。図28にシナリオ名詞句記憶テーブル1371の例を示す。この例では、シナリオテキストを1文ずつに区切り、名詞句を抽出している。項目は、シナリオIDx(3202)、トピックIDt(3203)、文中でキーワードが現れる文字位置(3204)、シナリオ名詞句列K(3205)である。
類似適合判定処理部138では、図21(B)のテロップ認識結果記憶テーブルと、図28のシナリオ名詞句記憶テーブルのデータを入力し、映像のキーワードを出力する。出力例を図29に示す。テロップIDy(3301)、関連テロップID(3305)はテロップ認識結果記憶テーブル図21(B)から、トピックID(3302),キーワード列(3303)、関連ワードは、シナリオ名詞句記憶テーブル(図28)から、それぞれ選ばれ取得される。また、キーワード重要度(3304)はテロップ認識結果記憶テーブル(図21)のテロップ重要度と後述のテロップ−シナリオ名詞句対応表とを用いて算出される。
出力部139では、映像番号と出力された図29のような出力テーブルのデータをデータベース等に格納する。格納時のフォーマットは機械的に読み書きできるものであればよい。
次に、上記の構成における動作を説明する。
図30は、本発明の第3の実施の形態における動作の概要を示すフローチャートである。
同図では、図24の動作と異なる部分(ステップ142,144,145)のみ説明する。
ステップ142) シナリオテキストを読み込み、一定の規則で区切り、それぞれの区切りにシナリオのIDを付与する。シナリオテキストにあるトピックの切れ目の情報もIDを付与して同時にシナリオ名詞句記憶テーブル1371に格納する。また、シナリオの各文に対して形態素解析を行い、名詞句を抽出する。各シナリオIDそれぞれに複数のシナリオ名詞句列Kを算出し、シナリオ名詞句記憶テーブル1371に格納する。このようなデータが格納されたシナリオ名詞句記憶テーブル1371の例を図28に示す。この例では、シナリオテキストを1文ずつに区切り、名詞句を抽出している。項目は、シナリオIDx(3202),トピックIDt(3203)、文中でキーワードが現れる文字位置(3204)、シナリオ名詞句列K(3205)である。
ステップ144) 図21(B)のテロップ認識結果記憶テーブルと図28のシナリオ名詞句記憶テーブルを入力し、図29に示すようなデータを出力する。シナリオ名詞句列とテロップ認識結果の類似文字列比較を行い、各テロップに含まれるシナリオ名詞句列の対応表を算出し、その対応からトピック区切りを算出し、テロップをトピック単位に区切って分布を修正し、各名詞句の重要度を算出することによってキーワードを選択する。
ステップ145) 映像番号と出力された図29のような出力テーブルをデータベース等に格納する。格納時のフォーマットは機械的に読み書きできるものであればよい。
次に、上記のステップ144を詳細に説明する。
図31は、本発明の第3の実施の形態における適合判定処理のフローチャートである。
同図のフローチャートは、図10の処理を基本とし、テロップ原稿の代わりにテロップ認識結果を用いて、それに対応できるよう変更を加えた例である。以下では、図10と異なる処理についてのみ説明する。
ステップ151) 入力されたシナリオ名詞句記憶テーブル1371と、テロップ認識結果記憶テーブル961のデータのマッチングを、シナリオ名詞句列Kとテロップ認識文字列Lを用いて行う。そのマッチング結果を対応表C(x,y)としてメモリ等に記録する。C(x,y)に記録する数値としては、テロップ認識文字列Lに含まれるシナリオ名詞句列Kの名詞句の文字位置である。詳細は後述する。
ステップ152) テロップ分布を算出し、対応表C(x,y)を修正する。
具体的には、図14のフローチャートのステップ52の式を変更しただけである。詳細については後述する。
ステップ153) ステップ32で出力された対応表C(x,y)とテロップ認識結果テーブルのデータを入力し、シナリオ文の重要度w(y)を算出する。テロップ重要度を反映した対応表w(y)C(x,y)を作成し、それを用いてシナリオ文の重要度を算出する。
具体的には、図17のフローチャートのステップ72の式とステップ74を変更しただけのフローである。詳細は後述する。
ステップ154)テロップ重要度を利用してキーワードを選び出し、例えば、図8、図13に示すような形で出力する。ステップ153で抽出されたシナリオ文からのキーワードもこの出力に付け加えることが可能である。詳細は後述する。
次に、上記のステップ151における処理について説明する。
図32は、本発明の第3の実施の形態における対応表作成処理のフローチャートである。同図に示す処理は、第1の実施の形態における図11のステップ403,404,407を変更したものであり、以下では、変更点(ステップ1603,1604,1607)のみを説明する。
本実施の形態では、シナリオから名詞句列を取り出しているので、文字列比較ループがシナリオ名詞句列―テロップ認識結果文字列比較ループとなる。文字位置iがシナリオ名詞句K内に存在する名詞句の文字位置となる。また、文字列比較法が類似文字列比較になる。
以下に、各ステップにおける変更点を述べる。
ステップ1603) 前述のステップ403では、一致文字列を探していたのに対し、本実施の形態では、シナリオ文字列a(i)∈kとLの類似文字列比較に変更される。
この処理手順は、図26の類似文字列比較により算出された類似度を閾値処理することにより、一致かどうかを判定するものである。
ステップ1604) 前述のステップ404では一致個数を数えていたのを、一致した単語の文字位置を配列(I)に追加する処理へ変更する。
ステップ1607) 対応表に書き込む値を、文字位置iの配列に変更する。
この変更された手順により作成される対応表は図33のようになる。
次に、前述のステップ152における対応表を修正する処理を説明する。
図34は、本発明の第3の実施の形態におけるテロップ分布算出・対応表修正処理のフローチャートであり、第1の実施の形態における図14のステップ52に代わる処理である。変更部分(ステップ172)のみを説明する。
ステップ172) 図14のステップ52からの変更は、対応表の値C(x,y)における要素(対応する名詞句)の個数|C(x,y)|を代わりに用いてテロップ分布S(y)を算出する。この変更に伴って算出されるテロップ分布と対応表の修正例を図35に示す。
次に、前述のステップ153の重要文抽出処理について説明する。
図36は、本発明の第3の実施の形態における重要文抽出処理のフローチャートである。
同図に示す処理は、前述の第1の実施の形態の図17のフローチャートの内、ステップ72、ステップ74を変更したものなので、その部分(ステップ182,184)のみを説明する。本実施の形態におけるテロップ重要度表w(y)|C(x,y)|とシナリオ、テロップ重要度を図37に示す。
ステップ182) シナリオ文の重要度を算出する際の変更としてC(x,y)を使用する代わりに、対応表の要素の個数である|C(x,y)|を利用する。
ステップ184) シナリオ名詞句記憶テーブルからシナリオIDがx(t)のものを読出し、そのシナリオ名詞句列Kx中の名詞の中の数値表現や固有名詞などの内、任意のyについて対応表C(x(t),y)に文字位置が存在しない名詞句を一定個数選択し、重要文キーワードU(t)として記憶し、出力する。
次に、前述のステップ154のキーワード決定処理について説明する。
図38は、本発明の第3の実施の形態におけるキーワード決定処理のフローチャートである。
同図に示す処理は、第1の実施の形態における図19のフローチャートの内、ステップ802,808,810を変更したものなので、その部分(ステップ1902,1908,1910)のみを説明する。
ステップ1902) 対応表の変更に伴う計算式の変更であり、
Figure 2005234786
となる点において異なる。
ステップ1908) テロップ総重要度W(x)が0でないテロップと類似したシナリオ名詞句を出力部99の出力テーブルにキーワードとして書き込む。
ステップ1910) 重要文として抽出された文中に出現するテロップy’をC(x(t),y’)が空でないy’として算出し、そのy’を関連テロップとして書き込む。また、y’に重要文キーワードU(t)を関連キーワードとして書き込む。
また、重要文自体へのポインタを書き込む。
この一連の処理により書き込まれる出力部99の出力テーブルの例を図29に示す。
また、上記の第1〜第3の実施の形態における各フローチャートに示す動作をプログラムとして構築し、映像キーワード抽出装置として利用されるコンピュータにインストールし、CPU等の制御手段により実行する、または、ネットワークを介して流通させることも可能である。
また、構築されたプログラムを映像キーワード抽出装置として利用されるコンピュータに接続されるハードディスクや、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、実施する際にコンピュータにインストールすることも可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
本発明は、膨大な数の映像データから所望の映像を検索するシステムに適用可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の第1の実施の形態における映像キーワード抽出装置の構成図である。 本発明の第1の実施の形態におけるテロップ原稿記憶部のテロップ原稿記憶テーブルの例である。 本発明の第1の実施の形態におけるシナリオテキスト記憶部に蓄積されるシナリオテキストの例である。 本発明の第1の実施の形態におけるテロップワード記憶テーブルの例である。 本発明の第1の実施の形態におけるシナリオテキスト記憶テーブルの例である。 本発明の第1の実施の形態における適合判定処理部の出力例である。 本発明の第1の実施の形態における動作の概要を示すフローチャートである。 本発明の第1の実施の形態における適合判定処理のフローチャートである。 本発明の第1の実施の形態における対応表作成処理のフローチャートである。 本発明の第1の実施の形態におけるテロップワード−シナリオ対応表の例(祖の1)である。 本発明の第1の実施の形態におけるテロップワード−シナリオ対応表の例(対応した単語の文字位置も同時に記憶する例)である。 本発明の第1の実施の形態におけるテロップ分布算出・対応表修正処理のフローチャートである。 本発明の第1の実施の形態におけるテロップワード−シナリオ対応表の例(その2)である。 本発明の第1の実施の形態における分離度算出・区切り検出処理のフローチャートである。 本発明の第1の実施の形態における重要文抽出処理のフローチャートである。 本発明の第1の実施の形態における対応表の「トピック3」についての重要度w(y)C(x,y)算出とキーワードである。 本発明の第1の実施の形態におけるキーワード決定処理のフローチャートである。 本発明の第2の実施の形態における映像キーワード抽出装置の構成図である。 本発明の第2の実施の形態におけるテロップ認識結果記憶テーブルの例である。 本発明の第2の実施の形態におけるシナリオ名詞句記憶テーブルの例(その1)である。 本発明の第2の実施の形態における類似適合判定処理部の出力例である。 本発明の第2の実施の形態における動作の概要を示すフローチャートである。 本発明の第2の実施の形態における類似適合判定処理のフローチャートである。 本発明の第2の実施の形態における類似文字列判定処理のフローチャートである。 本発明の第3の実施の形態における映像キーワード抽出装置の構成図である。 本発明の第3の実施の形態におけるシナリオ名詞句記憶テーブルの例である。 本発明の第3の実施の形態における処理結果記憶例である。 本発明の第3の実施の形態における動作の概要を示すフローチャートである。 本発明の第3の実施の形態における適合判定処理のフローチャートである。 本発明の第3の実施の形態における対応表作成処理のフローチャートである。 本発明の第3の実施の形態におけるテロップ−シナリオ名詞句対応表の例である。 本発明の第3の実施の形態におけるテロップ分布算出・対応表修正処理のフローチャートである。 本発明の第3の実施の形態におけるテロップ−シナリオ名詞句対応表から算出された分布と対応表の修正例である。 本発明の第3の実施の形態における重要文抽出処理のフローチャートである。 本発明の第3の実施の形態におけるテロップ重要度表w(y)|C(x,y)|とシナリオ、テロップ重要度の例である。 本発明の第3の実施の形態におけるキーワード決定処理のフローチャートである。
符号の説明
11 テロップ原稿入力部
12 シナリオテキスト入力部
13 テロップ原稿データベース、テロップ原稿記憶部
14 シナリオテキストデータベース、シナリオテキスト記憶部
15 指定手段、制御部
16 テロップ原稿読み込み手段、テロップ情報抽出部
17 シナリオ読み込み手段、シナリオ読み込み部
18 適合判定処理手段、適合判定処理部
19 出力手段、出力部
93 テロップ認識結果記憶部
96 テロップ認識結果読み込み部
97 シナリオテキスト解析部
98 類似適合判定処理部
99 出力部
161 テロップワード記憶テーブル
171 シナリオテキスト記憶テーブル
137 シナリオテキスト解析部
138 類似適合判定処理部
139 出力部
952 映像番号
961 テロップ認識結果記憶テーブル
971 シナリオ名詞句記憶テーブル
2101 ID
2102 テロップ表示開始時刻
2103 テロップ表示時間長
2104 テロップ
2105 文字数
2106 文字の大きさ
2201 ID
2202 テロップ名詞列
2203 テロップ重要度
2301 ID
2302 トピックID
2303 シナリオ
2701 テロップID
2702 トピック3のキーワード
2901 名詞句IDx’
2902 シナリオIDx’
2903 トピックIDt
2904 文中でキーワードが出現する文字位置
2905 シナリオ名詞句K
3001 ID
3002 テロップ表示開始時刻
3003 テロップ表示終了時刻
3004 文字数
3005 文字の大きさ
3006 テロップ重要度
3007 テロップ認識結果文字列
3201 ID
3202 トピックID
3204 出現文字位置
3205 シナリオ名詞句列
3301 テロップID
3302 トピックID
3303 キーワード列
3304 重要度
3305 関連テロップID

Claims (24)

  1. 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
    指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込み過程と、
    前記映像識別情報に基づいて、前記シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込み過程と、
    前記テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出過程と、
    前記テロップから抽出された前記名詞句と前記シナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理過程と、
    少なくとも、前記映像識別情報と前記キーワードを出力する出力過程と、を行うことを特徴とする映像キーワード抽出方法。
  2. 前記適合判定処理過程において、
    前記対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
    前記重要文を形態素解析して、キーワードを抽出する請求項1記載の映像キーワード抽出方法。
  3. 前記適合判定処理過程において、
    前記対応表からトピック毎のテロップの分布を算出し、
    算出されたテロップ分布に基づいて前記対応表を修正する過程を更に行う請求項1記載の映像キーワード抽出方法。
  4. 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
    シナリオテキストが蓄積されたシナリオデータベースと、
    テロップ原稿が蓄積されたテロップ原稿データベースと、
    処理対象の映像識別情報を指定する指定手段と、
    前記指定手段により指定された映像識別情報に基づいて、前記シナリオデータベースから該シナリオテキストを読み込むシナリオ読み込み手段と、
    前記指定手段により指定された前記映像識別情報に基づいて、前記テロップ原稿データベースからテロップ原稿を読み込むテロップ原稿読み込み手段と、
    前記テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出手段と、
    前記テロップから抽出された前記名詞句と前記シナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理手段と、
    少なくとも、前記映像識別情報と前記キーワードを出力する出力手段と、
    を有することを特徴とする映像キーワード抽出装置。
  5. 前記適合判定処理手段は、
    前記対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
    前記重要文を形態素解析して、キーワードを抽出する手段と、を含む請求項4記載の映像キーワード抽出装置。
  6. 前記適合判定処理手段は、
    前記対応表からトピック毎のテロップの分布を算出する手段と、
    算出されたテロップ分布に基づいて前記対応表を修正する手段と、を更に有する請求項4記載の映像キーワード抽出装置。
  7. コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
    指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込むシナリオ読み込みステップと、
    前記映像識別情報に基づいて、前記シナリオテキストに対応する映像のテロップ原稿が蓄積されたデータベースからテロップ原稿を読み込むテロップ原稿読み込みステップと、
    前記テロップ原稿を解析してテロップ重要度を算出し、該テロップ重要度に基づいて該テロップ原稿から名詞句を抽出するテロップ情報抽出ステップと、
    前記テロップから抽出された前記名詞句と前記シナリオテキストのシナリオとを文字列比較し、一致している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する適合判定処理ステップと、
    少なくとも、前記映像識別情報と前記キーワードを出力する出力ステップと、をコンピュータに実行させることを特徴とする映像キーワード抽出プログラム。
  8. 前記適合判定処理ステップにおいて、
    前記対応表から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
    前記重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる請求項7記載の映像キーワード抽出プログラム。
  9. 前記適合判定処理ステップにおいて、
    前記対応表からトピック毎のテロップの分布を算出するステップと、
    算出されたテロップ分布に基づいて前記対応表を修正するステップと、を更に、コンピュータに実行させる請求項7記載の映像キーワード抽出プログラム。
  10. 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
    指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み過程と、
    指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析過程と、
    前記シナリオテキストから抽出された前記シナリオ名詞句と前記テロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定過程と、
    少なくとも前記映像識別情報と前記キーワードを出力する出力過程と、を行うことを特徴とする映像キーワード抽出方法。
  11. 前記類似適合判定過程において、
    前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める過程を含む請求項10記載の映像キーワード抽出方法。
  12. 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
    入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
    シナリオテキストが蓄積されたシナリオテキストデータベース
    指定された映像識別情報に基づいて、前記テロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込み手段と、
    指定された映像識別情報に基づいて、前記シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析手段と、
    前記シナリオテキストから抽出された前記シナリオ名詞句と前記テロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定手段と、
    少なくとも前記映像識別情報と前記キーワードを出力する出力手段と、を有することを特徴とする映像キーワード抽出装置。
  13. 前記類似適合判定手段は、
    前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求める過程を含む請求項12記載の映像キーワード抽出装置。
  14. コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
    指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込むテロップ認識結果読み込みステップと、
    指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析してシナリオ名詞句を抽出するシナリオ解析ステップと、
    前記シナリオテキストから抽出された前記シナリオ名詞句と前記テロップ認識結果とを類似文字列比較し、類似しているキーワードを抽出する類似適合判定ステップと、
    少なくとも前記映像識別情報と前記キーワードを出力する出力ステップと、をコンピュータに実行させることを特徴とする映像キーワード抽出プログラム。
  15. 前記類似適合判定ステップにおいて、
    前記シナリオ名詞句と前記テロップ認識結果中に存在する先頭一致文字を検索し、一致した先頭文字から該シナリオ名詞句と該テロップ認識結果との編集距離を算出し、該編集距離に基づいて所定の値以上の類似度を求めるステップを、コンピュータに実行させる請求項14記載の映像キーワード抽出プログラム。
  16. 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出方法において、
    指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み過程と、
    指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析過程と、
    前記シナリオテキストから抽出された前記名詞句と前記テロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定過程と、
    少なくとも前記映像識別情報と前記キーワードを出力する出力過程と、を行うことを特徴とする映像キーワード抽出方法。
  17. 前記適合判定処理過程において、
    前記対応表と前記テロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出し、
    前記重要文を形態素解析して、キーワードを抽出する請求項16記載の映像キーワード抽出方法。
  18. 前記適合判定処理過程において、
    前記対応表における要素の数からトピック毎のテロップの分布を算出する過程と、
    算出されたテロップ分布に基づいて前記対応表を修正する過程を更に行う請求項16記載の映像キーワード抽出方法。
  19. 大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出するための映像キーワード抽出装置であって、
    入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースと、
    シナリオテキストが蓄積されたシナリオテキストデータベースと、
    指定された映像識別情報に基づいて、前記テロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込み手段と、
    指定された映像識別情報に基づいて、前記シナリオテキストデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析手段と、
    前記シナリオテキストから抽出された前記名詞句と前記テロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定手段と、
    少なくとも前記映像識別情報と前記キーワードを出力する出力手段と、を有することを特徴とする映像キーワード抽出装置。
  20. 前記適合判定処理手段は、
    前記対応表と前記テロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出する手段と、
    前記重要文を形態素解析して、キーワードを抽出する手段を含む請求項19記載の映像キーワード抽出装置。
  21. 前記適合判定処理手段は、
    前記対応表における要素の数からトピック毎のテロップの分布を算出する手段と、
    算出されたテロップ分布に基づいて前記対応表を修正する手段と、を更に有する請求項19記載の映像キーワード抽出装置。
  22. コンピュータに、大量の映像データから所望の映像を検索する際に必要なトピック区間のキーワードを抽出させるための映像キーワード抽出プログラムであって、
    指定された映像識別情報に基づいて、入力映像中に表示されたテロップ文字列が認識された結果が蓄積されたテロップ認識結果データベースからテロップ認識結果を読み込み、テロップ重要度を算出するテロップ認識結果読み込みステップと、
    指定された映像識別情報に基づいて、シナリオテキストが蓄積されたデータベースから該シナリオテキストを読み込み、該シナリオテキストを解析して名詞句を抽出するシナリオ解析ステップと、
    前記シナリオテキストから抽出された前記名詞句と前記テロップ認識結果とを類似文字列比較し、類似している名詞句を抽出して対応表を作成し、該対応表に基づいてトピック区切りを抽出し、キーワードを抽出する類似適合判定ステップと、
    少なくとも前記映像識別情報と前記キーワードを出力する出力ステップと、をコンピュータに実行させることを特徴とする映像キーワード抽出プログラム。
  23. 前記適合判定処理ステップは、
    前記対応表と前記テロップ重要度から各シナリオ文毎の重要度を算出し、該重要度の高いシナリオ文を重要文として抽出するステップと、
    前記重要文を形態素解析して、キーワードを抽出するステップと、をコンピュータに実行させる請求項22記載の映像キーワード抽出プログラム。
  24. 前記適合判定処理ステップは、
    前記対応表における要素の数からトピック毎のテロップの分布を算出するステップと、
    算出されたテロップ分布に基づいて前記対応表を修正するステップと、を更にコンピュータに実行させる請求項22記載の映像キーワード抽出プログラム。
JP2004041588A 2004-02-18 2004-02-18 映像キーワード抽出方法及び装置及びプログラム Expired - Fee Related JP4239850B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004041588A JP4239850B2 (ja) 2004-02-18 2004-02-18 映像キーワード抽出方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004041588A JP4239850B2 (ja) 2004-02-18 2004-02-18 映像キーワード抽出方法及び装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2005234786A true JP2005234786A (ja) 2005-09-02
JP4239850B2 JP4239850B2 (ja) 2009-03-18

Family

ID=35017697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004041588A Expired - Fee Related JP4239850B2 (ja) 2004-02-18 2004-02-18 映像キーワード抽出方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4239850B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148904A (ja) * 2005-11-29 2007-06-14 Toshiba Corp 情報提示方法、情報提示装置及び情報提示プログラム
JP2008141621A (ja) * 2006-12-04 2008-06-19 Nippon Hoso Kyokai <Nhk> 映像抽出装置及び映像抽出プログラム
JP2008148077A (ja) * 2006-12-12 2008-06-26 Hitachi Ltd 動画再生装置
JP2008176748A (ja) * 2007-01-22 2008-07-31 Fujitsu Ltd 情報付与プログラム、情報付与装置、および情報付与方法
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム
CN111899202A (zh) * 2020-05-19 2020-11-06 武汉东智科技股份有限公司 一种视频图像中叠加时间字符的增强方法
CN113032679A (zh) * 2021-04-19 2021-06-25 北京新三优秀科技有限公司 一种短视频处理方法、电子设备和计算机可读存储介质
KR20210104526A (ko) * 2020-02-17 2021-08-25 주식회사 엘지유플러스 Vod 컨텐츠의 키워드를 출력하는 방법 및 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012065124A (ja) 2010-09-15 2012-03-29 Fuji Xerox Co Ltd 画像処理装置、識別装置及びプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148904A (ja) * 2005-11-29 2007-06-14 Toshiba Corp 情報提示方法、情報提示装置及び情報提示プログラム
JP2008141621A (ja) * 2006-12-04 2008-06-19 Nippon Hoso Kyokai <Nhk> 映像抽出装置及び映像抽出プログラム
JP4695582B2 (ja) * 2006-12-04 2011-06-08 日本放送協会 映像抽出装置及び映像抽出プログラム
JP2008148077A (ja) * 2006-12-12 2008-06-26 Hitachi Ltd 動画再生装置
JP2008176748A (ja) * 2007-01-22 2008-07-31 Fujitsu Ltd 情報付与プログラム、情報付与装置、および情報付与方法
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム
KR20210104526A (ko) * 2020-02-17 2021-08-25 주식회사 엘지유플러스 Vod 컨텐츠의 키워드를 출력하는 방법 및 장치
KR102570285B1 (ko) * 2020-02-17 2023-08-24 주식회사 엘지유플러스 Vod 컨텐츠의 키워드를 출력하는 방법 및 장치
CN111899202A (zh) * 2020-05-19 2020-11-06 武汉东智科技股份有限公司 一种视频图像中叠加时间字符的增强方法
CN111899202B (zh) * 2020-05-19 2024-03-15 武汉东智科技股份有限公司 一种视频图像中叠加时间字符的增强方法
CN113032679A (zh) * 2021-04-19 2021-06-25 北京新三优秀科技有限公司 一种短视频处理方法、电子设备和计算机可读存储介质
CN113032679B (zh) * 2021-04-19 2023-12-29 北京新三优秀科技有限公司 一种短视频处理方法、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
JP4239850B2 (ja) 2009-03-18

Similar Documents

Publication Publication Date Title
EP0440197B1 (en) Method and apparatus for inputting text
JP5257071B2 (ja) 類似度計算装置及び情報検索装置
US8266169B2 (en) Complex queries for corpus indexing and search
CN102483743B (zh) 对书写体系和语言的检测
JP2019125343A (ja) 曖昧なエンティティワードに基づくテキスト処理方法及び装置
WO2010119615A1 (ja) 学習データ生成装置、及び固有表現抽出システム
US20100161314A1 (en) Region-Matching Transducers for Text-Characterization
JP2004348591A (ja) 文書検索方法及び装置
CN111276149B (zh) 语音识别方法、装置、设备及可读存储介质
US11501546B2 (en) Media management system for video data processing and adaptation data generation
JP2007122403A (ja) 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
JP4239850B2 (ja) 映像キーワード抽出方法及び装置及びプログラム
CN112784009A (zh) 一种主题词挖掘方法、装置、电子设备及存储介质
JP3444831B2 (ja) 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP5594134B2 (ja) 文字列検索装置,文字列検索方法および文字列検索プログラム
JP4175093B2 (ja) トピック境界決定方法及び装置及びトピック境界決定プログラム
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP4985096B2 (ja) 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム
JP4047895B2 (ja) 文書校正装置およびプログラム記憶媒体
CN117669513B (zh) 一种基于人工智能的数据管理系统及方法
CN114222193B (zh) 一种视频字幕时间对齐模型训练方法及系统
JP4047894B2 (ja) 文書校正装置およびプログラム記憶媒体
JP2007172315A (ja) 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム
CN117789705A (zh) 数据处理方法、装置、设备及存储介质
JP2004158038A (ja) 言語処理システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080812

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees