JP3504439B2 - 映像検索方法 - Google Patents

映像検索方法

Info

Publication number
JP3504439B2
JP3504439B2 JP19627096A JP19627096A JP3504439B2 JP 3504439 B2 JP3504439 B2 JP 3504439B2 JP 19627096 A JP19627096 A JP 19627096A JP 19627096 A JP19627096 A JP 19627096A JP 3504439 B2 JP3504439 B2 JP 3504439B2
Authority
JP
Japan
Prior art keywords
video
vocabulary
context
telop
morphological analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19627096A
Other languages
English (en)
Other versions
JPH1040260A (ja
Inventor
伸治 安部
正治 倉掛
和己 小高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP19627096A priority Critical patent/JP3504439B2/ja
Publication of JPH1040260A publication Critical patent/JPH1040260A/ja
Application granted granted Critical
Publication of JP3504439B2 publication Critical patent/JP3504439B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、映像中の文字情報
をインデクスとして利用し、検索要求として入力された
利用者側の文脈に対応する映像の区間を提示する映像検
索方法に関する。 【0002】 【従来の技術】映像情報を対象とする情報検索手法、あ
るいは検索を目的とした映像情報構造化手法に関して近
年多くの手法が提案されている。その中でも、検索要求
として映像に関する意味内容的な記述を入力することに
よって、映像検索の実現を目指す技術(参考文献1,
2)が提案されている。 【0003】参考文献1,2は、映像に付加されたテク
スト情報(参考文献1はシナリオ情報を利用、参考文献
2は字幕情報を利用)を使って映像を構造化し、任意の
映像区間を意味的な記述によって検索する手法である。 【0004】参考文献: [1]竹下 敦、“対話のインタラクション構造を用い
た話題の認識”、情報処理学会研究技術報告87−1
0,pp.75−82(1992)。 【0005】[2]柳沼良知、坂内正夫、DPマッチン
グを用いたドラマ映像・音声・シナリオ文書の対応付け
手法の一提案、信学論、Vol. J79-D-II, No.5, pp.747-
755(1996) 。 【0006】 【発明が解決しようとする課題】参考文献1,2は字幕
方法やシナリオなどのように内容的に映像と同期したテ
クスト情報が得られる場合を前提としており、テクスト
情報の対話的な話題構造の解析によって、テクストと同
期した映像を構造化する手法である。しかしながら、一
般の放送映像などを対象とする場合、字幕放送やシナリ
オ情報などのような、映像内容と意味的に同期した内容
を持つテクスト情報を入手することは一般に困難である
場合が多い。 【0007】本発明の目的は、字幕放送やシナリオの存
在を前提としない手法によって、検索要求として入力さ
れた利用者の文脈に対応する映像の区間を提示する映像
検索方法を提供することにある。 【0008】 【課題を解決するための手段】本発明の映像検索方法
は、映像中のフレーム画像シーケンスからカットチェン
ジ点を検出するカットチェンジ検出段階と、映像中から
テロップを切り出してテクスト情報として認識するテロ
ップ情報認識段階と、認識されたテクスト情報を形態素
解析にかけ、語彙を抽出する形態素解析段階と、抽出さ
れた語彙を、テロップが検出されたカットに対するイン
デクスとし、次に、テロップから得られる語彙に対し
て、時間軸上次に得られるテロップからの語彙と共有す
る上位概念の語彙が存在するかどうかを辞書を用いて調
べ、存在する場合には、両方の語彙が得られた区間を結
ぶ、テロップが提示されていない区間も含むマクロな区
間に対して上位概念の語彙をインデクスとして付与する
ことによって、映像の文脈を形成する映像文脈形成段階
と、利用者によって入力された入力文を形態素解析にか
け、語彙群を抽出する利用者入力文形態素解析段階と、
前記利用者入力文形態素解析段階で得られた語彙群を用
いて、映像とは独立に蓄積された新聞・雑誌を含む記事
の記事データベースの中から、利用者入力文と最も多く
の語彙を共有する記事を連想記事として検索し、次に、
該連想記事からも形態素解析によって語彙群を抽出する
連想記事検索段階と、前記利用者入力文形態素解析段階
で抽出された語彙群と前記連想記事検索段階で抽出され
た語彙群の和集合をとって、入力者側の文脈を形成する
入力者側文脈形成段階と、入力者側の文脈と語彙が一致
する、前記映像文脈形成段階で得られた映像の文脈を
映像区間を検索結果の映像として提示する文脈照合段
階を有する。 【0009】本発明は、映像内に付加されたテクスト情
報としては比較的一般的なテロップ情報を検索のための
インデクスとして利用し、意味的な記述による映像の検
索を実現するための方法であって、テロップ情報がその
特徴として映像の意味的な最小単位であるカットを単位
に付与されていることを利用する。 【0010】まず、映像のカットチェンジ点を参考文献
5,6の手法を用いて自動的に検出し、次に、参考文献
3,4の方法を利用して映像中からテロップを切り出し
てテクスト情報として認識し、次にテロップから認識さ
れたテクスト情報を形態素解析にかけ、概念(語彙、特
に名詞)を抽出してテロップが検出されたカットに対す
るインデクスとし、次に、テロップから得られる概念に
対して、時間軸上次に得られるテロップからの概念と共
有する上位概念が存在するかどうかを辞書(シソーラ
ス)を用いて調べ、存在する場合には、両方の概念が得
られたとき区間を結ぶマクロな区間(テロップが提示さ
れいない区間も含める)に対して上位概念をインデクス
として付与することによって、映像の文脈を形成する。 【0011】次に、利用者によって入力された検索要求
に相当する入力文を形態素解析にかけ概念群(語彙群)
を抽出し、次に、映像とは独立に蓄積した新聞・雑誌な
どの記事データベースの中から、入力文と最も多くの語
彙を共有する記事を連想記事として検索し、次に、連想
記事からも形態素解析によって概念群(語彙群)を抽出
し、次に、入力文から抽出された概念群に連想記事から
抽出された概念群を加えることにより入力者側の文脈を
形成する。 【0012】最後に、入力者側の文脈中の語彙と一致す
る文脈を持つ映像区間を次々と検索して提示することに
よって、入力者側の文脈と対応付けられた映像の文脈が
表す映像区間を、検索結果の映像として提示する。 【0013】テロップ情報は映像情報に対して、時間的
にも内容的にも同期したテクスト情報としては、字幕放
送やシナリオ情報に比較して一般的であり、テロップを
映像検索のためのインデクスとして利用することによっ
て、従来の方法と比較して検索の対象映像を一般化でき
る。 【0014】ただし、テロップ情報をインデクスとして
利用する上での欠点として、 ・必ずしもすべてのカットに対して付与されておらず、 ・テクスト情報としての情報量が字幕放送やシナリオ情
報に比較して極めて少ない、 という特徴がある。そのために本方法では、辞書(シソ
ーラス)を用いた映像文脈形成方法と、映像とは独立に
蓄積した記事情報を用いた連想的な入力者側文脈形成方
法とによって、テクスト情報の不足を補い、文脈という
概念による間接的な対応関係を利用した検索方法の実現
によって対処している。 【0015】したがって、本方法は、映像中の特定の区
間をターゲットサーチ的に検索する技術というよりは、
入力に対して文脈的に関連する映像区間を編集して提示
する技術であり、必ずしも直接的な対応関係のない区間
が提示される場合がある。しかしながら、ターゲットの
ような明確な意図を持たない利用者に対しては、むしろ
本方法のような緩やかな解釈を伴う間接的な対応関係が
有効な情報源となると考えられ、コンサルティング業務
の支援や思考の支援などへ適用可能である。 【0016】参考文献: [3]根本敦史、半谷精一郎、宮内一洋、テロップの認
識による資料映像の検索について、1994年信学春季
大会D−427(1994)。 【0017】[4]倉掛正治、桑野秀豪、新井啓之、小
高和己、認識技術を用いた映像中キーターゲットインデ
クシングの検討、信学技報 IE95-150, PRU95-237, pp.1
5-20 (1996) 。 【0018】[5]宮武 教、吉澤 聡、上田博唯、フ
レーム相関係数の変化率に着目したカットの自動検出方
法、1990信学春季大会D−299(1990)。 【0019】[6]大辻清太、外村佳伸、大庭有二、輝
度情報を使った動画像ブラウジング、信学技報IE90
−6(1990)。 【0020】 【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。 【0021】図1は本発明の実施形態で映像検索方法を
実施する装置の構成を示すブロック図である。 【0022】本装置は、検索対象である映像情報を蓄積
する映像情報記憶部1と、映像中のフレーム画像シーケ
ンスからカットチェンジ点を自動検出するカットチェン
ジ検出部2と、映像中からテロップを切り出してテクス
ト情報として認識するテロップ情報認識部3と、テロッ
プから認識されたテクスト情報から形態素解析により概
念を抽出する形態素解析部4と、辞書(シソーラス)6
と、テロップから得られる概念に対して、時間軸上次に
得られるテロップからの概念と共有する上位概念が存在
するかどうかを辞書(シソーラス)6を用いて調べ、存
在する場合には、両方の概念が得られたとき区間を結ぶ
マクロな区間(テロップが提示されていない区間も含め
る)に対して上位概念をインデクスとして付与すること
によって、映像の文脈を形成する映像文脈形成部5と、
利用者が検索要求する入力文として入力するための検索
要求入力部7と、新聞・雑誌の記事を蓄積する記事デー
タベース8と、形態素解析により入力文から概念群を抽
出する形態素解析部9と、記事データベース8の中か
ら、入力文と最も多くの語彙を共有する記事を連想記事
として検索する連想記事検索部10と、入力文から抽出
された概念群に連想記事から抽出された概念群を加える
ことにより入力者側の文脈を形成する入力者側文脈形成
部11と、入力者側の文脈中の語彙と一致する文脈を持
つ映像区間を次々と検索して提示することによって、入
力者側の文脈と対応付けられた映像の文脈が表す映像区
間を検索結果の映像として提示する文脈照合部12で構
成されている。 【0023】図2は図1の装置の処理例を示す図であ
る。 【0024】映像情報記録部1に蓄積された映像からカ
ットチェンジ検出部2によってカットチェンジ点を検出
し、映像を1〜10・・・のカットに分割する。 【0025】映像情報記憶部1において、1〜10・・
・のカットからなる映像シーケンスに対して“大仏
殿”、“二月堂”、“三月堂”、“猿沢池”、“興福
寺”、“五重塔”、“南円堂”などのような概念を含む
テロップが表示されているものとする。これらのテロッ
プ情報を、テロップ情報認識部3、形態素解析部4を用
いてテクスト情報として認識し、概念(“大仏殿”、
“二月堂”、“三月堂”、“猿沢池”他)を抽出する。 【0026】次に、映像情報記憶部1において、映像の
時間軸上のカット1から抽出された概念“大仏殿”とそ
の次に現れるカット3から抽出される概念“二月堂”と
の間に、共有する上位概念が存在するかどうかを辞書
(シソーラス)を用いて調べる。この例の場合には、
“東大寺”という概念を共有するので、両方の概念が得
られたカットを結ぶマクロな区間、この例の場合には、
カット1〜3に対して上位概念“東大寺”をインデクス
として付与する。映像文脈形成部5では、このような処
理をすべてのカットに対して施し、映像の文脈(元の映
像情報に対してマクロな区間と上位概念を抽出したも
の)を形成する。 【0027】図2の例では、利用者によって検索要求に
相当する入力文「奈良の大仏を見てから猿沢池に寄っ
て」が検索要求入力部7から入力されたものとする。形
態素解析部9によって入力文から概念群(“奈良”、
“大仏”、“猿沢池”)を抽出する。 【0028】次に、連想記事検索部10によって、記事
データベース8の中から入力文と最も多くの概念を共有
する記事を連想記事として検索し、検索された記事も形
態素解析処理を施して概念を抽出する。この例の場合、
入力文と2つの概念(“奈良”、“大仏”)を共有する
記事、「奈良の観光スポットと言えば東大寺、大仏殿前
の参道には土産物屋が並び、鹿せんべいも売られてい
る。」が検索されたものとする。さらにこの記事に形態
素解析処理を施して概念を抽出する。 【0029】次に、入力者文脈形成部11によって、入
力文と記事から抽出された概念群の和集合をとり、入力
者側の文脈、「“奈良”、“観光スポット”、“観
光”、“スポット”、“東大寺”、“大仏殿”、“大
仏”、“前”、“参道”、“土産物屋”、“土産物”、
“土産”、“鹿せんべい”、“鹿”、“せんべい”、
“猿沢池”」を形成する。 【0030】最後に、文脈照合部12によって、映像の
文脈と入力者側の文脈を照合し、入力者側の文脈と共通
の概念を持つ映像の文脈、この例の場合にはカット1〜
3およびカット5を検索結果の映像として提示する。 【0031】 【発明の効果】以上説明したように本発明は、以下のよ
うな効果がある。 【0032】(1)映像に付与されているテロップ情報
をインデクスとして利用することによって、映像に対す
るインデクシングを自動化することができ、また、テロ
ップはシナリオ情報や字幕放送に比較して一般的である
ので、従来の手法に比較して対象映像を一般化すること
ができる。 【0033】(2)テロップは、テクスト情報としての
情報量がシナリオ情報や字幕放送に比較して小さいが、
テロップからの概念を辞書(シソーラス)を用いて上位
へ展開して映像の文脈を形成していることと、入力文を
映像とは独立に蓄積した記事情報により連想的に展開し
て入力者側文脈を形成していることによって、入力文と
連想的に関連する映像を検出することが可能となり、テ
ロップの少ない情報量を補うことが可能となる。
【図面の簡単な説明】 【図1】本発明を実施する装置の構成例を示すブロック
図である。 【図2】図1の装置の処理例を示す図である。 【符号の説明】 1 映像情報記憶部 2 カットチェンジ検出部 3 テロップ情報認識部 4 形態素解析部 5 映像文脈形成部 6 辞書(シソーラス) 7 検索要求(入力文)入力部 8 記事データベース 9 形態素解析部 10 連想記事検索部 11 入力者側文脈形成部 12 文脈照合部
フロントページの続き (56)参考文献 特開 平7−306866(JP,A) 茂木祐治 外,ニュース映像中の文字 認識に基づく記事の索引付け,信学技報 (IE95−153,PRU95−240),1996 年 3月15日,第95巻,第582号,第33 〜40頁 熊谷篤 外,字幕の時間的・空間的特 徴を利用した動画像からの字幕領域の抽 出,1995年(第23回)画像電子学会年次 大会予稿,1995年 6月 6日,p.23 −24 鈴木信太朗 外,文字認識技術を応用 した放送の自動収録システム,テレビジ ョン学会技術報告(放送現業),1994年 10月27日,Vol.18,No.59,p. 13−18 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06T 7/40

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 映像中のフレーム画像シーケンスからカ
    ットチェンジ点を検出するカットチェンジ検出段階と、 映像中からテロップを切り出してテクスト情報として認
    識するテロップ情報認識段階と、 認識されたテクスト情報を形態素解析にかけ、語彙を抽
    出する形態素解析段階と、抽出された語彙を、テロップが検出されたカットに対す
    るインデクスとし、次に、テロップから得られる語彙に
    対して、時間軸上次に得られるテロップからの語彙と共
    有する上位概念の語彙が存在するかどうかを辞書を用い
    て調べ、存在する場合には、両方の語彙が得られた区間
    を結ぶ、テロップが提示されていない区間も含むマクロ
    な区間に対して上位概念の語彙を インデクスとして付与
    することによって、映像の文脈を形成する映像文脈形成
    段階と、 利用者によって入力された入力文を形態素解析にかけ、
    語彙群を抽出する利用者入力文形態素解析段階と、前記利用者入力文形態素解析段階で得られた語彙群を用
    いて 、映像とは独立に蓄積された新聞・雑誌を含む記事
    記事データベースの中から、利用者入力文と最も多く
    の語彙を共有する記事を連想記事として検索し、次に、
    該連想記事からも形態素解析によって語彙群を抽出する
    連想記事検索段階と、 前記利用者入力文形態素解析段階で抽出された語彙群と
    前記連想記事検索段階で抽出された語彙群の和集合をと
    って、入力者側の文脈を形成する入力者側文脈形成段階
    と、 入力者側の文脈と語彙が一致する、前記映像文脈形成段
    階で得られた映像の文脈を持つ映像区間を検索結果の映
    像として提示する文脈照合段階を有する映像検索方法。
JP19627096A 1996-07-25 1996-07-25 映像検索方法 Expired - Fee Related JP3504439B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19627096A JP3504439B2 (ja) 1996-07-25 1996-07-25 映像検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19627096A JP3504439B2 (ja) 1996-07-25 1996-07-25 映像検索方法

Publications (2)

Publication Number Publication Date
JPH1040260A JPH1040260A (ja) 1998-02-13
JP3504439B2 true JP3504439B2 (ja) 2004-03-08

Family

ID=16355019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19627096A Expired - Fee Related JP3504439B2 (ja) 1996-07-25 1996-07-25 映像検索方法

Country Status (1)

Country Link
JP (1) JP3504439B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3378797B2 (ja) * 1998-04-01 2003-02-17 日本電信電話株式会社 映像検索処理方法および映像検索装置
ATE240559T1 (de) 1998-09-03 2003-05-15 Ricoh Kk Speichermedien mit video- beziehungsweise audioindexinformation, verwaltungsverfahren und wiederauffindungsverfahren für video-, bzw audioinformation und videowiederauffindungssystem
JP4168490B2 (ja) 1998-09-03 2008-10-22 ソニー株式会社 動き判定装置、その方法および画像情報変換装置
CA2796218C (en) * 1998-11-30 2016-11-29 Gemstar Development Corporation Search engine for video and graphics
JP2000324416A (ja) * 1999-05-06 2000-11-24 Nippon Telegr & Teleph Corp <Ntt> テレビ用静止画表示方法、装置、および制御プログラムを記録した記録媒体
US6970513B1 (en) 2001-06-05 2005-11-29 At&T Corp. System for content adaptive video decoding
US6810086B1 (en) 2001-06-05 2004-10-26 At&T Corp. System and method of filtering noise
US6968006B1 (en) 2001-06-05 2005-11-22 At&T Corp. Method of content adaptive video decoding
US7773670B1 (en) 2001-06-05 2010-08-10 At+T Intellectual Property Ii, L.P. Method of content adaptive video encoding
KR100518781B1 (ko) * 2001-10-17 2005-10-06 한국과학기술원 하이퍼사각형 기반의 다차원 데이터 세그먼테이션 장치,클러스터링 장치 및 그 방법
JP4113059B2 (ja) 2003-07-28 2008-07-02 株式会社東芝 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム
MX2010002349A (es) * 2007-08-31 2010-07-30 Microsoft Corp Resolucion de correferencia en un sistema de procesamiento de lenguaje natural sensible a la ambiguedad.
JP2010198084A (ja) * 2009-02-23 2010-09-09 Fujifilm Corp 関連コンテンツ表示装置及びシステム
US11915614B2 (en) 2019-09-05 2024-02-27 Obrizum Group Ltd. Tracking concepts and presenting content in a learning system

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
熊谷篤 外,字幕の時間的・空間的特徴を利用した動画像からの字幕領域の抽出,1995年(第23回)画像電子学会年次大会予稿,1995年 6月 6日,p.23−24
茂木祐治 外,ニュース映像中の文字認識に基づく記事の索引付け,信学技報(IE95−153,PRU95−240),1996年 3月15日,第95巻,第582号,第33〜40頁
鈴木信太朗 外,文字認識技術を応用した放送の自動収録システム,テレビジョン学会技術報告(放送現業),1994年10月27日,Vol.18,No.59,p.13−18

Also Published As

Publication number Publication date
JPH1040260A (ja) 1998-02-13

Similar Documents

Publication Publication Date Title
US11978439B2 (en) Generating topic-specific language models
JP3504439B2 (ja) 映像検索方法
US8117206B2 (en) Method and system for indexing and searching timed media information based upon relevance intervals
US20100274667A1 (en) Multimedia access
US8965916B2 (en) Method and apparatus for providing media content
US8126897B2 (en) Unified inverted index for video passage retrieval
US7908141B2 (en) Extracting and utilizing metadata to improve accuracy in speech to text conversions
KR20010086393A (ko) 비디오 세그먼트를 다른 비디오 세그먼트 또는 정보원에링크시키는 방법 및 장치
JP5894149B2 (ja) Top−k処理を活用した意味の充実
US20100131464A1 (en) Method and apparatus for enabling simultaneous reproduction of a first media item and a second media item
KR100451004B1 (ko) 폐쇄자막 기반의 뉴스 비디오 데이터베이스 생성 장치 및방법과 그에 따른 내용기반 검색/탐색 방법
Lian Innovative Internet video consuming based on media analysis techniques
Ghosh et al. Multimodal indexing of multilingual news video
JP2008022292A (ja) 出演者情報検索システム、出演者情報取得装置、出演者情報検索装置、および、その方法ならびにプログラム
Kim et al. Summarization of news video and its description for content‐based access
Amir et al. Search the audio, browse the video—a generic paradigm for video collections
KR102428046B1 (ko) 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법
Nitta et al. Generating semantic descriptions of broadcasted sports videos based on structures of sports games and TV programs
Bechet et al. Detecting person presence in tv shows with linguistic and structural features
Ludwig et al. Named entity recognition for user-generated tags
Kim et al. Multimodal approach for summarizing and indexing news video
Cho et al. News video retrieval using automatic indexing of korean closed-caption
Jacob et al. An innovative Method of Accessing Digital Video Archives through Video Indexing
Yu et al. Content-based analysis of news video
Bhalerao et al. Multimedia Summarization and Retrieval of News Broadcast

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees