JP2006060796A - 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 - Google Patents

映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2006060796A
JP2006060796A JP2005211231A JP2005211231A JP2006060796A JP 2006060796 A JP2006060796 A JP 2006060796A JP 2005211231 A JP2005211231 A JP 2005211231A JP 2005211231 A JP2005211231 A JP 2005211231A JP 2006060796 A JP2006060796 A JP 2006060796A
Authority
JP
Japan
Prior art keywords
feature
target
video
unit
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005211231A
Other languages
English (en)
Other versions
JP4421527B2 (ja
Inventor
Shogo Kimura
昭悟 木村
Takahito Kawanishi
隆仁 川西
Kunio Kayano
邦夫 柏野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005211231A priority Critical patent/JP4421527B2/ja
Publication of JP2006060796A publication Critical patent/JP2006060796A/ja
Application granted granted Critical
Publication of JP4421527B2 publication Critical patent/JP4421527B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 索引の保持に必要な記憶容量を削減し、目的の画像又は映像と類似する映像区間を検索漏れを生じさせずに、高速に検出する映像検索方法及び装置を提供する。
【解決手段】 本発明の映像検索方法は、登録された動画像の蓄積映像から、検索対象の画像に類似した映像フレーム又はその一部分を検出し、蓄積映像の映像フレームから蓄積特徴を抽出する蓄積特徴抽出過程と、蓄積特徴を時間方向に連結した蓄積連結特徴を出力する蓄積特徴連結過程と、蓄積連結特徴に索引を付与する索引付与過程と、目的画像の目的特徴を抽出する目的特徴抽出過程と、目的特徴に類似する蓄積連結特徴を、索引で抽出する索引検索過程と、蓄積連結特徴に対応する蓄積特徴と、目的特徴との類似を示す部分類似値を計算する一次照合段階と、目的画像と蓄積映像中の映像フレーム又はその一部分との全体類似値を部分類似値から求める二次照合段階とからなる類似度計算過程を備える。
【選択図】 図2

Description

本発明は、蓄積された長時間の映像から、与えられた画像と類似した映像フレーム(画像)あるいはその一部分または与えられた映像と類似した映像区間あるいはその部分領域、及びその部分領域が含まれている位置を同定するのに適した映像検索装置、映像検索方法、映像検索プログラム及び記録媒体に関する。
デジタルカメラの普及や記録媒体の大容量化・低価格化、さらに大容量ネットワークの普及により、容易に大容量のデジタル映像を取得して保存する環境が整ってきている。
そのため、大量の映像から所望の映像を高速に探し出す高速映像検索技術が必要となってきており、特に映像における画像の部分検索は、検索したい画像や映像が蓄積されている映像フレームの一部分であるため、比較の処理が多くなり、さらに高速性が要求される。
この映像検索技術は、膨大な映像データベ一スの中から、高速に目的の画像あるいは目的の映像をその一部分として含む映像区間を検出する映像検索技術に用いられている。
例えば、長時間のテレビ映像の中から,特定人物の顔が撮影されている映像や特定の動作が行われている映像を検出し、ユーザに提示したりすることを可能とする技術に用いられる。
従来、映像検索方法に関しては、映像の各フレームから抽出した特徴を圧縮することにより高速に同一シーンの検出を行う手法等が知られている(たとえば、特許文献1参照)。
しかし、上述した映像の検索方法においては、探す対象となる映像のある一部分に目的の画像や映像と類似する映像が存在する場合に検出を行うことができないという欠点があった。
そのため、映像の部分領域ごとに照合を行う必要がある。
従来、上記問題点を解決するために、映像の各フレームを独立した画像ととらえ、目的の画像と類似する部分画像を含む画像を検索する部分画像検索手法を繰り返し用いることによって、類似部分映像を検出する方法が考えられる。(例えば、非特許文献1参照)
特許第3065314号公報(「高速信号探索方法、装置及びその記録媒体」) 「WALRUS:A similarity retrieval algorithm for image databases」(A.Natsev,IEEE Transactions on Knowledge and Data Engineering,Vol.16,No3,2004年3月
しかしながら、上記非特許文献1による方法では、検索高速化のために用いる索引について,その索引を付与すべき部分画像の数が膨大であるため、索引保持に必要となる記憶容量が膨大になり、かつ索引を用いても検索に必要な照合回数が高速化を達成するほどに減少させることができないため、十分な高速化が行えないという欠点があった。
本発明は、このような事情に鑑みてなされたもので、映像の時間的連続性を考慮し、蓄積された映像から抽出した特徴を時間軸方向に連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する映像区間を高速に検出する映像検索装置、映像検索方法、映像検索プログラム及び記録媒体を提供することを目的としている。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像から抽出した部分領域の特徴を時間軸方向に連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間を検索漏れを生じさせることなく高速に検出する映像検索装置、映像検索方法、映像検索プログラム及び記録媒体を提供することを目的としている。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像からある種の変動に対して頑健な特徴を抽出し、この特徴を時間軸方向に関連性を考慮して連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間の抽出精度を向上させ、かつ高速に検出する映像検索装置、映像検索方法、映像検索プログラム及び記録媒体を提供することを目的としている。
本発明の映像検索方法は、予め登録された動画像である蓄積映像から、検索対象となる静止画像である目的画像に類似した映像フレームあるいはその一部分を検出する映像検索方法において、蓄積映像のある映像フレームの特徴である蓄積特徴を抽出する蓄積特徴抽出過程と、前記蓄積特徴抽出過程で抽出される蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結過程と、前記蓄積連結特徴に各々索引を付与する索引付与過程と、目的画像の特徴である目的特徴を抽出する目的特徴抽出過程と、前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索過程と、前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合段階と、前記目的画像と前記蓄積映像中の映像フレームあるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合段階とからなる類似度計算過程とを備えることを特徴とする映像検索方法。
本発明の映像検索方法は、前記蓄積特徴にて所定の大きさの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程とをさらに有し、前記蓄積連結過程にて、前記蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、前記類似度計算過程が、前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、該距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程とからなる一次照合段階と、前記照合結果判定過程にて、目的画像と類似する映像フレームの一部分が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的画像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、前記特徴距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在するか否かを判定する照合結果再判定過程と前記照合結果再判定過程にて、目的画像と類似する映像フレームの一部分が存在すると判定された蓄積映像中の箇所を検索結果候補とする検索結果候補選択過程と、前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程とからなる二次照合段階とを備えることを特徴とする。
本発明の映像検索方法は、予め登録された動画像である蓄積映像から、検索対象となる動画像である目的映像に類似した映像区間あるいはその一部分を検出する映像検索方法であり、前記蓄積映像から蓄積特徴を導く蓄積特徴抽出過程と、前記蓄積特徴抽出過程で抽出される蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結過程と、前記蓄積連結特徴に各々索引を付与する索引付与過程と、目的映像の特徴である目的特徴を抽出する目的特徴抽出過程と、前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索過程と、前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合段階と、前記目的映像と前記蓄積映像の映像区間あるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合段階とからなる類似度計算過程とを備えることを特徴とする。
本発明の映像検索方法は、前記蓄積特徴にて所定の大ききの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程とをさらに有し、蓄積特徴連結過程にて、蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて、前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、前記類似度計算過程が、前記索引検索過程にて抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、該距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程とからなる一次照合段階と、該照合結果判定過程にて目的映像と類似する部分映像区間が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的映像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、前記特徴距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する否かを判定する照合結果再判定過程と、前記照合結果再判定過程にて、目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、検索結果候補とする検索結果候補選択過程と、前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程とからなる二次照合段階と を備えることを特徴とする。
また、本発明の映像検索方法は、上述したいずれかの映像検索方法において、見本となる特徴パターンである見本特徴を複数種類作成する見本特徴作成過程と、前記見本特徴間の距離を計算する見本特徴間距離計算過程と、前記蓄積特徴抽出過程において抽出された前記蓄積特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される蓄積量子化特徴を導く蓄積特徴量子化過程と、前記目的特徴抽出過程において抽出された前記目的特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される目的量子化特徴を導く目的特徴量子化過程とをさらに備え、前記索引付与過程が前記見本特徴間距離に基づき前記蓄積特徴あるいは前記蓄積部分領域特徴に索引を付与し、前記索引検索過程ならびに前記類似度計算過程において前記目的特徴と前記蓄積連結特徴との類似値を前記見本特徴間距離を用いて逐次計算する、あるいは前記索引検索過程ならびに前記特徴照合過程において前記目的部分領域特徴と前記蓄積連結特徴との距離を前記見本特徴間距離を用いて逐次計算することを特徴とする。
以上説明したように、本発明によれば、映像の時間的連続性を考慮し、蓄積された映像から抽出した蓄積特徴を時間軸方向に、順次連結統合することによって、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する映像区間を、一次照合及び二次照合の2段階で行うため、高速に検出することができるという効果が得られる。
すなわち、本発明は、上記2段階の照合処理において、目的画像と蓄積画像との類似度の判定を、一次照合にて類似する蓄積特徴が検出されない場合、蓄積画像に対してより精度の高い類似度の計算を行う二次照合を行わないため、不必要な処理を削減することができ、より類似判定の処理を高速に、かつ高い精度で行うことができる。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像から抽出した部分領域の特徴を時間軸方向に連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間を検索漏れを生じさせることなく高速に検出することができるという効果が得られる。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像からある種の変動に対して頑健な特徴を抽出し、この特徴を時間軸方向に関連性を考慮して連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間の抽出精度を向上させ、かつ高速に検出することができるという効果が得られる。
<第1の実施例>
以下、本発明の第1の実施例による映像検索装置を図面を参照して説明する。図1は上記第1の実施例の映像検索装置の一構成例を示すブロック図である。
この図において、本実施例の映像検索装置は、蓄積特徴抽出部1と、蓄積部分領域特徴抽出部2と、索引付与部3と、目的特徴抽出部4と、目的部分領域特徴抽出部5と、索引検索部6と、特徴照合部7と、照合結果判定部8と、特徴再照合部9と、照合結果再判定部10と、検索結果候補選択部llと、次目的部分領域特徴選定部12と、次検索候補特徴選定部13と、蓄積部分領域特徴連結部20とを有しており、目的画像、すなわち参照している検索したい画像と、データベース等に蓄積されている蓄積映像、すなわち検索される検索対象の映像を入力とし、上記目的画像と類似する画像が含まれている蓄積映像中の映像フレーム内の位置情報を出力する。
ここで、特徴照合部7,照合結果判定部8,特徴再照合部9,照合結果再判定部10,検索結果候補選択部11,次目的部分領域特徴選定部12及び次連結特徴選定部13は、類似度計算部100を構成している。
蓄積特徴抽出部1は、蓄積映像の各映像フレームから、映像フレームを表現する蓄積特徴を、映像フレーム全体、または所定の画素数からなるブロック単位に抽出する。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力された特徴に対し、予め定められた所定の大きさの注目窓を、予め定められた所定の間隔で設定し(所定の間隔でずらし)、各注目窓内の特徴である蓄積部分領域特徴を抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から順次出力される蓄積部分領域特徴を、時系列に、すなわち時間軸方向に各々、所定の時間区間単位に連結して、それぞれの区間を蓄積連結特徴として出力する。
索引付与部3は、上記蓄積部分領域特徴連結部20から出力される各蓄積連結特徴に対して、索引を付与する。
目的特徴抽出部4は、目的画像から画像を表現する目的特徴を抽出する。
目的部分領域特徴抽出部5は、上記目的特徴抽出部4が抽出した目的特徴に対して、予め定められた所定の大きさの注目窓を設定し、この注目窓を1ピクセルずつずらしながら、各注目窓内の特徴である目的部分領域特徴の抽出を行う。
索引検索部6は、上記索引付与部3から出力される索引を用いて、上記目的部分領域特徴抽出部5の抽出した目的部分領域特徴の集合から、類似する蓄積連結特徴の抽出を行う。
特徴照合部7は、上記索引検索部6が抽出した蓄積連結特徴と、目的部分領域特徴抽出部5の抽出した目的部分領域特徴との距離を計算する。
この距離は、ユークリッド距離,マンハッタン距離,内積,正規化相互相関などを用いることが出来る。
照合結果判定部8は、上記特徴照合部7の演算した距離に基づいて、目的画像と類似する映像フレームの一部が蓄積映像中の当該箇所に存在する可能性があるか否かの判定を行う。
特徴再照合部9は、上記照合結果判定部8が目的画像と類似する映像フレームの一部が存在する可能性があると判定した場合、判定された蓄積映像における箇所において、蓄積特徴抽出部1の抽出した蓄積特徴に対し、目的画像と同じ大きさの照合窓を設定して、目的特徴抽出部4から出力された目的特徴との特徴距離を計算する。この特徴距離も上記距離と同様に各種の定義を用いることができる。
照合結果再判定部10は、上記照合結果判定部8において用いられた距離に基づいて、目的画像と類似する映像フレームの一部分が、蓄積映像中の当該箇所に存在するか否かの判定を行う。
検索結果候補選択部11は、上記照合結果再判定部10において目的画像と類似する映像フレームの一部分が存在すると判定された蓄積映像中の箇所を、詳細な類似性の検討を行う検索結果候補とする。
次目的部分領域特徴選定部12は、上記目的部分領域特徴抽出部5において抽出された目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴の指定を行う。
次連結特徴選定部13は、上記索引検索部6から検索結果として出力された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴の指定を行う。
次に、図1及び図2を参照して、上述した映像検索装置の動作を説明する。図2は、図1の第1の実施例による映像検索装置の一動作例を具体的に示すフローチャートである。
蓄積特徴抽出部1は、初めに、蓄積映像を、図示しないデータベースから読み込む(ステップS1)。
次に、蓄積特徴抽出部1は、入力した蓄積映像の各映像フレームから、映像フレーム各々の特徴である蓄積特徴を抽出する(ステップS2)。
例えば、蓄積映像の各映像フレームにおけるRGB画素値をそのまま用いて、蓄積映像の映像フレームの大きさが横Dピクセル,縦Dピクセルであるとすると、D×D×3個の数値で構成される蓄積特徴(多次元ベクトルからなる特徴ベクトル)が蓄積映像の各映像フレームごとに抽出される。ここで、上記D×Dに乗ぜられている「3」はRGBの色数である。
また、他の実施例として、例えば、各映像フレームから横bピクセル,縦bピクセルの大きさの小領域(ブロック)を用い、縦及び横方向に順次1ピクセルずつ、この小領域をずらしながら、各小領域のRGB各々の平均値を計算することにより、各小領域の範囲内での蓄積特徴を抽出する。
さらに、他の実施例として、例えば、蓄積映像の各映像フレームから横bピクセル,縦bピクセルの大きさの小領域を、縦及び横方向に1ピクセルずつずらしながら、各小領域に含まれるピクセルのRGB各々に対して、2次元DCT(デジタルコサイン変換)を行い、その係数ベクトルを蓄積特徴とすることもできる。
この場合、蓄積特徴抽出部1は、蓄積映像の各映像フレームから抽出された特徴である蓄積特徴の集合(各映像フレーム毎)を出力することになる。
次に、蓄積部分領域特徴抽出部2は、蓄積特徴抽出部1から、蓄積特徴の集合を読み込み、蓄積映像のある映像フレームのある1つの箇所に、予め定められた所定の大きさの第1注目窓を設定する。
例えば、この第1注目窓は、大きさが横wピクセル,縦wピクセルであり、初期状態として蓄積映像における先頭の映像フレームの左上の角に配置される。
そして、蓄積部分領域特徴抽出部2は、設定された上記第1注目窓内に含まれる部分領域の画像の特徴である蓄積部分領域特徴を抽出する。
また、他の実施形態においては、例えば、蓄積特徴として小領域内のRGB画素値の平均を用いるとき、蓄積部分領域特徴として、上記第1注目窓内に、重複すること も隙間も存在しない状態に、上記小領域を配置して、この各小領域に対応する特徴を 順に並べて、特徴ベクトルを得るようにすることも可能である。
さらに、他の実施形態においては、例えば、蓄積特徴として小領域内の2次元DCT係数ベクトルを用いる場合、蓄積部分領域特徴として、上記第1注目窓内に、重複することも隙間も存在しない状態に、上記小領域を配置して、この各小領域に対応する特徴を抽出、もしくは、全ての次元の特徴ベクトルを1つにまとめて、多数次元の特徴ベクトルを1つ得ることもできる。
第1注目窓は、各蓄積映像の映像フレーム内において、予め定められた所定の間隔により、複数設定され、各注目窓内の部分領域から蓄積部分領域特徴を抽出する(ステップS3)。
すなわち、第1注目窓(横wピクセル×縦wピクセル)は、蓄積映像の映像フレーム内において、縦及び横方向に、上記所定の間隔(各注目窓の同一の辺同士の間隔であり、例えば左辺同士、上辺同士の間隔として、横方向にmピクセル,縦方向にmピクセル)で順次ずらして配置されている。各々が重なり合う状態となっており、連続する第1の窓同士は、図3に示すように、所定の間隔を除いて重なることとなる。
また、第1注目窓の配置問隔を、以下マージンと呼ぶことにする。
そして、蓄積部分領域特徴抽出部2は、上記第1注目窓毎に得られた蓄積部分領域特徴の集合を出力する。
次に、蓄積部分領域特徴連結部20は、蓄積部分領域特徴抽出部2から出力される蓄積部分領域特徴の集合を読み込み、この読み込んだ蓄積部分領域特徴の集合から、映像フレーム内の位置が同一であり、かつ時間軸方向に連続する部分領域特徴を、予め定められた基準に基づいて連結する。
すなわち、蓄積部分領域特徴連結部20は、例えば、連結させる上記部分領域特徴の数が予め基準として設定されており、その基準の示す連結数の分、例えばaフレーム分だけ時間軸方向に部分領域特徴の連結を行い、複数の部分領域特徴を1つのブロックとする。
また、蓄積部分領域特徴連結部20は、他の実施例として、例えば、連結を開始する部分領域特徴を基準として、時間軸方向に後続する部分領域特徴との距離を計算し、該距離の最大値が予め定めておいた連結閾値を超えるまで、部分領域特徴を連結するように構成してもよい。
そして、蓄積部分領域特徴連結部20は、連結した蓄積部分領域特徴のブロック毎に、連結された部分領域特徴のブロックを代表とする特徴である蓄積連結特徴を抽出する。
このとき、蓄積部分領域特徴連結部20は、例えば、上記ブロックにおいて、連結の先頭にあたる部分領域特徴を蓄積連結特徴とする。
また、蓄積部分領域特徴連結部20は、他の実施形態として、上記ブロックにおいて、連結された部分領域特徴における重心を蓄積連結特徴として出力するように構成されてもよい。
次に、蓄積部分領域特徴連結部20は、各ブロック単位に、蓄積連結特徴と、この連結特徴に対応するブロックの連結された各蓄積部分領域特徴との距離を計算し、各蓄積部分領域特徴に対応した該距離における最大値である連結最大差分値を保持する。
そして、蓄積部分領域特徴連結部20は、蓄積連結特徴と、該蓄積連結特徴に対応する連結最大差分値とを各ブロック毎に組みとし、この組の集合を出力する(ステップS4)。
次に、索引付与部3は、蓄積部分領域特徴連結部20の抽出した蓄積連結特徴の集合を読み込み、この読み込んだ各蓄積連結特徴に対して、検索を容易にするための索引を付与する。
例えば、「信号検出方法、信号検出装置、記録媒体及びプログラム」(特許第3574075号)記載の実施例のように、予め作成されたベクトル量子化符号帳を用いて、各蓄積連結特徴の特徴ベクトルをベクトル量子化し、ベクトル量子化の符号語を索引とする。
すなわち、上記方法について簡単に説明すると、はじめに、索引付与部3は、蓄積連結特徴の集合を読み込む。
次に、索引付与部3は、各蓄積連結特徴のクラスタリングを行う。このクラスタリングは、例えば、各蓄積連結特徴をベクトルと考えて、そのベクトルを、ベクトル量子化を用いて符号化することによって行う。
例えば、ベクトル量子化の符号語数がC個であれば、蓄積連結特徴はC個のクラスタのいずれかに分類されることになる。
ここで、ベクトル量子化は、例えば、自乗誤差を距離関数として用い、クラスタ重心との距離が他のどのクラスタ重心との距離よりも小さくなるクラスタに蓄積連結特徴を所属させ、クラスタに対応する符号語を出力することによって行われる。
このクラスタは、例えば、クラスタ作成のために予め容易された、蓄積連結特徴と同じ次元数の特徴である学習特徴を用いて予め作成しておく。
すなわち、クラスタは、それに所属する学習特徴とクラスタ重心との距離の総和が最小になるように、かつそのクラスタに所属する学習特徴について、所属するクラスタのクラスタ重心との距離が、他のどのクラスタ重心との距離よりも小さくなるように構成される。
そして、索引付与部3は、索引として、各蓄積連結特徴に対応する、ベクトル量子化の符号語を出力する(ステップS5)。
また、別の実施例として、例えば、R-Tree(「The R-Tree: an efficient and robust access method for points and rectangles」,(N.Beckman他1名,Proc. of ACM SIGMOD Conference,pp.322-331,1990))やSR-Tree(「SR-Tree: 高次元データに対する最近接探索のためのインデックス構造の提案」(片山紀生 他1名,電子情報通信学会論文誌D-I,Vol.J80-D-I,No.8,pp.703-717,1997年8月)など、多次元インデックスと総称される手法を用いて、特徴の存在する多次元空間内で特徴を包含する領域を階層的に作成し、最下層の領域と特徴とを対応付けることにより索引を付与することも可能である。
特徴を包含する領域は、例えば、R-Treeであれば、3次元空間における直方体に相当する超直方体、SR-Treeであれば、超直方体と、3次元空間における球に相当する超球との重なりとなる。
そして、索引付与部3は、上述のように求められた、各蓄積連結特徴に対する索引を出力する。
次に、目的特徴抽出部4は、目的画像を読み込むが(ステップS6)、この目的画像の大きさ(横qピクセル,縦qピクセル)は、例えば、マージンと第1注目窓の大ききとの和(合計)以上、すなわち、q≧w+m,q≧w+mに設定すると、蓄積映像中の各映像フレームについて、大きさq×qピクセルの窓を任意に配置しても必ず1つ以上の蓄積部分領域を含むため、検索漏れを生じることがない。
そして、目的特徴抽出部4は、目的画像から特徴の抽出を、上記蓄積特徴抽出部1と同様の手法で行い、目的画像から抽出された特徴である目的特徴の集合を出力する(ステップS7)。
次に、目的部分領域特徴抽出部5は、目的特徴抽出部4の抽出した目的特徴の集合を読み込み、この目的画像のある1つの箇所に、蓄積部分領域特徴抽出部2で用いた注目窓と同様の大きさ(横wピクセル,縦wピクセル)の注目窓、すなわち、第1注目窓を用い、この第1注目窓内に含まれる画像の特徴である目的部分領域特徴を抽出する。
また、目的部分領域特徴抽出部5は、上記蓄積部分領域特徴抽出部2と同様の抽出方法を用いて、画像の特徴を抽出して、抽出結果を目的部分領域特徴の集合として出力する(ステップS8)。
ここで、目的部分領域特徴抽出部5は、蓄積部分領域特徴抽出部2における特徴抽出の場合と異なり、上記第1注目窓を、目的画像内に重複することもなく、かつ隙間もない状態に設定し、それらを1ピクセルずつずらしながら、各位置において上記目的部分領域特徴の抽出を行う。
このとき、第1抽出窓は、例えば、少なくともマージンの大きさの分(横mピクセル,縦mピクセル)だけずらせば、検索漏れを生じさせることがない。
そして、目的部分領域特徴抽出部5は、上述した処理により抽出した、目的部分領域特徴の集合を出力する。
次に、索引検索部6は、索引付与部3から出力される索引と、目的部分領域特徴抽出部5から出力される目的部分領域特徴の集合とを読み込む。
そして、目的代表特徴抽出部15において、目的部分領域特徴から目的代表特徴を抽出する処理を行った場合、索引検索部6は、目的部分領域特徴の集合の代わりに、目的代表特徴抽出部15から出力される目的代表特徴の集合を読み込む。
目的代表特徴抽出部15は、後述する他の実施形態において詳細に説明する。
また、必要に応じて、索引検索部6は、目的部分領域間距離計算部16から出力される目的部分領域間距離を、さらに、読み込む構成もある。
また、検索閾値更新部14が検索閾値及び選択閾値を更新する処理を行った場合、索引検索部6は更新された選択閾値を読み込む。この検索閾値更新部14については後述する他の実施形態において、詳細に説明する。
そして、索引検索部6は、読み込んだ索引を用い、目的部分領域特徴の集合に類似する蓄積連結特徴を、検索候補特徴として抽出する(ステップS9)。
このとき、索引検索部6は、目的部分領域特徴の集合内におけるいずれかの目的部分領域特徴に対し、該蓄積連結特徴との距離dt、例えば自乗誤差が、予め定められた閾値である選択閾値θを下回るような(以下となるような)蓄積連結特徴を、索引により抽出する。
上記選択閾値θは後述するパラメータから自動的に決定される値であり、また、この選択閾値の決定方法は後述する。
また、別の実施例として、目的部分領域特徴の集合の代わりに、目的部分領域特徴から代表的な特徴を目的代表特徴として抽出し、この目的代表特徴の集合を用いて、集合内のいずれかの目的代表特徴との距離dtが選択閾値θを下回る蓄積連結特徴を、上記索引から抽出する構成とすることも可能である(後述)。
さらに、別の実施例として、目的部分領域間距離を用い、各目的代表特徴との距離dtを、該目的代表特徴に対応する目的部分領域間距離の最大値分だけ小さくし、この距離dtの値が選択閾値θを下回る蓄積連結特徴を索引から抽出する構成とすることも可能である(後述)。
ここで上述した、ある1つの目的部分領域特徴あるいは目的代表特徴との距離が選択閾値を下回る蓄積連結特徴を索引から抽出する抽出方法について説明する。
この抽出方法は、上記索引付与部3において用いられた索引の種類によって異なり、上記索引に対応する特許明細書記載の方法あるいは非特許文献記載の方法と同様にして実施することができる。
例えば、「信号検出方法、信号検出装置、記録媒体及びプログラム」(特許第3574075号)に記載の方法を用いて索引を付与した場合、以下のようにして所望の蓄積連結特徴を抽出することができる。
はじめに、索引検索部6は、目的部分領域特徴あるいは目的代表特徴と、索引付与部3で作成された索引(クラスタ)、及び選択閾値θを読み込む。
以下では、簡単のため、目的代表特徴ではなく、本実施例で採用した構成において目的部分領域特徴を読み込んだものとして説明する。
そして、索引検索部6は、読み込んだ目的部分領域特徴と、各クラスタ重心との距離を計算する。
続いて、索引検索部6は、計算された距離dtに基づいて、目的部分領域特徴との距離が選択閾値θを下回る蓄積連結特徴を含む可能性のあるクラスタを選択する。
上述したクラスタを選択する原理を以下に説明する。
図4は、点Q,C,Cの3点が乗るような平面であり、特徴ベクトルが配置される特徴空間を切り出した様子を示している。
ここで、点Qは目的部分領域特徴、点Cは部分領域特徴Qが所属しているクラスタのクラスタ重心、Cは他のクラスタのクラスタ重心を表しており、距離dQ1,dQ2,d12はそれぞれ、点Qと点Cとの距離、点Qと点Cとの距離、点Cと点Cとの距離を示している。
ここで、目的部分領域特徴の座標である点Qからの距離d選択閾値θ以内である蓄積連結特徴を抽出しなければならないとすると、点Qを中心とする半径θの超球(図4においては円)の内部にある蓄積連結特徴がそれに該当する。
そして、点Qを中心とする超球の半径が図4におけるdθより大きくなったとき、点Cに対応するクラスタに所属する蓄積連結特徴の中に、所望の蓄積連結特徴が含まれている可能性がある。
そこで、選択閾値θが図4におけるdθより大きくなったとき、そのクラスタを選択する。dθは、以下の(1)式及び(2)式を用いて求められる。
Figure 2006060796
上記(1)式より、
Figure 2006060796
が求められる。
さらに、蓄積連結特徴に対応する連結最大差分値を考慮して、最終的に、索引検索部6は、以下の(3)式が成り立つとき、点C2に対応するクラスタを選択し、そのクラスタに所属する蓄積連結特徴を全て抽出する。
そして、この手順を、目的部分領域特徴Qが所属するクラスタを除く全てのクラスタに対して行い、抽出された蓄積連結特徴の集合を、検索候補特徴として出力する。
Figure 2006060796
上記(3)式において、r2’は、点C2に対応するクラスタに所属する蓄積連結特徴の連結最大差分値について、そのクラスタ内最大値を取ったものである。
次に、特徴照合部7は、蓄積部分領域特徴連結部20から出力される連結最大差分値の集合と、目的部分領域特徴抽出部5から出力される目的部分領域特徴と、索引検索部6から出力される検索候補特徴としての蓄積連結特徴の集合とを読み込む。
そして、特徴照合部7は、次目的部分領域特徴選定部12により、次に照合すべき目的部分領域特徴が指定されている場合、該目的部分領域特徴を読み込む。この次目的部分領域特徴選定部12は、本実施形態において後述する。
また、特徴照合部7は、次連結特徴選定部13から、次に照合すべき検索候補特徴が指定されている場合、該検索候補特徴を読み込む。この次連結特徴選定部13は、本実施形態において後述する。
次に、特徴照合部7は、次目的部分領域特徴選定部12から読み込んだ目的部分領域特徴と、次連結特徴選定部13から読み込んだ検索候補特徴の集合との照合を行う。
このとき、特徴照合部7は、上記目的部分領域特徴と検索候補特徴との距離、例えば、自乗誤差の演算を行う。
ここで、特徴照合部7は、指定された目的部分領域特徴がなければ、初期目的部分領域特徴として、例えば、目的画像の左上角の位置に対応する目的部分領域特徴を指定し、上記検索候補特徴と照合処理を行う(ステップS10)。
また、特徴照合部7は、指定された検索候補特徴がなければ、初期の検索候補特徴として、例えば、任意に選択した検索候補特徴を指定し、上記目的部分領域特徴と照合する。
そして、特徴照合部7は、照合計算(検索候補特徴と目的部分領域特徴との間の距離の演算)を行う。そして、特徴照合部7は、照合に用いた検索候補特徴である蓄積連結特徴に対応する連結最大差分値を、連結最大差分値の集合から上記蓄積連結特徴に基づき抽出し、上記距離値から連結最大差分値を減算し、減算結果の距離値を補正距離値d(ω)として出力する。
次に、照合結果判定部8は、目的画像と類似する映像フレームの一部分が、現在の照合箇所に存在する可能性があるか否かの判定、すなわち、特徴照合部7から出力される補正距離値d(ω)を読み込み、この補正距離値d(ω)と、前記選択閾値θとの比較を行う。
そして、照合結果判定部8は、補正距離値d(ω)が選択閾値θ以下となったとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在する可能性があると判定し、蓄積連結特徴を照合箇所として出力し、一方、補正距離値d(ω)が選択閾値θ2を超えているとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在する可能性がないと判定し、処理をステップS15へ進める(ステップS11)。
このとき、照合結果判定部8は、蓄積連結特徴が複数の蓄積部分特徴から構成されているため、照合箇所として、時間的に連続した複数の箇所を出力する。
次に、特徴再照合部9は、蓄積特徴抽出部1から出力される蓄積特徴の集合と、目的特徴抽出部4から出力される目的特徴の集合と、照合結果判定部8から出力される照合箇所(時間的に連続した複数箇所)とを読み込む。
そして、特徴再照合部9は、読み込んだ蓄積特徴に、目的画像と同じ大きさ(縦×横)の注目窓である第2注目窓を設定する。
ここで、特徴再照合部9は、第2注目窓の配置箇所を、照合結果判定部8から出力された照合箇所に対応して決定する。
すなわち、特徴再照合部9は、図5の概念図に示すように、第2注目窓の配置箇所に対する蓄積部分領域の相対的な位置が、目的画像における目的部分領域の相対的な位置と同一になるように、つまり、照合箇所における蓄積部分領域と目的部分領域とが重なる位置に、上記第2注目窓を配置する。
次に、特徴再照合部9は、第2注目窓内における蓄積特徴と目的特徴との照合を行う。
ここで、特徴再照合部9は、例えば、第2注目窓内の蓄積特徴と目的特徴との距離値d、例えば、自乗誤差を計算する。
そして、特徴再照合部9は、照合計算結果である距離値dを出力する(ステップS12)。
このとき、特徴再照合部9は、上述した照合計算を照合結果判定部8の出力する照合箇所、すなわち複数の箇所全てに対して行い、各々の距離値dからなる集合を出力する。
次に、照合結果再判定部10は、目的画像と類似する、蓄積画像における映像フレームの一部分が現在の照合箇所に存在するか否かの判定を行い、すなわち、特徴再照合部9から出力された距離値dの集合を読み込み、この集合の距離値d各々と、予め定められた検索閾値θとの比較を行う。
このとき、照合結果再判定部10は、いずれかの距離値dが検索閾値θ以下であるとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在すると判定し、蓄積映像の映像フレームにおける該照合箇所を検出箇所として、この検出箇所の位置及び判定結果(存在したことを示す情報)を出力し、一方、距離値dが検索閾値θを超えたとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在しないと判定し、処理をステップS15へ進める(ステップS13)。
上記選択閾値θは、前記検索閾値θから決定され、以下に示す(4)式に示すように、選択閾値θを設定すると、検索漏れを生じることがない。
Figure 2006060796
上記(4)式において、Nは第1注目窓を重複も隙問もなく蓄積映像における映像フレーム中に配置したと仮定したとき、任意位置に配置された第2照合窓に含まれる第1照合窓の最小数であり、以下に示す(5)〜(7)式により与えられる。
Figure 2006060796
Figure 2006060796
Figure 2006060796
ここで、(6)式におけるNxは横方向の第1の照合窓の数であり、(7)式におけるNyは縦方向の第1の照合窓の数である。
(6)式,(7)式,(9)式,(10)式及び(11)式の右辺に現れる [x] は、ガウス記号を表しており、実数xを超えない最大の整数を表している。
次に、検索結果候補選択部11は、照合結果再判定部10から出力される検出箇所と、特徴再照合部9から出力される距離値dの集合を読み込む。
次に、検索結果候補選択部11は、上記検出箇所と、この検出箇所における距離値dとを、検索結果候補として登録する。
検索結果候補選択部11は、例えば、距離値の大小にかかわらず、読み込んだ検出箇所と距離値dとの組を全て登録する。
また、検索結果候補選択部11は、他の実施形態として、検索結果候補が予め定められた数量以下になるように登録する構成とすることも可能である。
すなわち、検索結果候補選択部11は、検索結果候補を該数量までは無条件に検出箇所と距離値dとの組を登録し、該数量を超過する場合、例えば、すでに読み込まれた検索結果候補の中における最大距離値dmaxと、以降読み込んだ距離値dとを比較し、読み込んだ距離値dが最大距離値dmaxを下回る場合、最大距離値dmaxに対応する候補を削除し、新たに読み込んだ検出箇所と距離値dの組とを候補として登録する。
このように、検索結果候補選択部11は、蓄積画像から上述した方法により検索結果候補を出力する(ステップS14)。
次に、次目的部分領域特徴選定部12は、目的部分領域特徴抽出部5から出力される目的部分領域特徴の集合を読み込み、必要に応じて、特徴照合部7から出力される補正距離値d(ω),検索閾値更新部14から出力される選択閾値θ,及び周辺距離下限値計算部17から出力される周辺距離下限値を読み込む。
上記検索閾値更新部14及び周辺距離下限値計算部17は、他の実施例において後述する。
そして、次目的部分領域特徴選定部12は、次に照合すべき目的部分領域特徴の選択、すなわち次に照合する目的部分領域特徴の有無の検出を行い、照合箇所がないことを検出すると処理をステップS16へ進め、一方、照合箇所があることを検出すると、次に照合する目的部分領域特徴を選択して、処理をステップS10へ進める(ステップS15)。
このとき、次目的部分領域特徴選定部12は、例えば、現在注目している蓄積連結特徴に対して、照合が終了していない目的部分領域特徴があるか否かを判定して、終了していない目的部分領域特徴があれば、この中から任意の目的部分領域特徴を1つ選択し、全ての目的部分領域特徴の照合が終了している場合、次の、蓄積連結特徴に注目を変更するため、処理をステップS16へ進める。
また、別の実施形態として、次目的部分領域特徴選定部12は、上記周辺距離下限値を読み込んだ場合、この距離下限値が、読み込んだ選択閾値θを上回る目的部分領域特徴との照合を省略し、この距離下限値が選択閾値θ以下の目的部分領域特徴から任意に1つ選択する構成とすることも可能である。
そして、次目的部分領域特徴選定部12は、終了していない目的部分領域特徴があれば、照合箇所が選択された目的部分領域特徴と、この目的部分特徴に対応する目的映像における映像フレーム内の位置を出力する。
次に、次検索候補特徴選定部13は、索引検索部6から出力される検索候補特徴の集合を読み込み、次に照合すべき検索候補特徴を選択、すなわち次に照合する検索候補特徴の有無の検出を行い、照合する検索候補特徴がないことを検出すると処理を終了させ、一方、照合する検索候補特徴があること(照合が終了していないこと)を検出すると、次に照合すべき検索候補特徴を選択して、処理をステップS10へ進める(ステップS16)。
このとき、次検索候補特徴選定部13は、例えば、照合する検索候補特徴があることを検出すると、照合が終了していない検索候補特徴から任意に1つ選択する。
これにより、次検索候補特徴選定部13は、選択された検索候補特徴を、特徴照合部7に対して出力する。
<第2の実施例>
この図において、本実施例の映像検索装置は、第1の実施例と同様に、蓄積特徴抽出部1と、蓄積部分領域特徴抽出部2と、索引付与部3と、目的特徴抽出部4と、目的部分領域特徴抽出部5と、索引検索部6と、特徴照合部7と、照合結果判定部8と、特徴再照合部9と、照合結果再判定部10と、検索結果候補選択部llと、次目的部分領域特徴選定部12と、次検索候補特徴選定部13と、蓄積部分領域特徴連結部20とを有しており、目的映像、すなわち参照している検索したい映像と、データベース等に蓄積されている蓄積映像、すなわち検索される検索対象の映像を入力とし、上記目的映像と類似する部分映像が含まれている蓄積映像中の位置情報を出力する。
蓄積特徴抽出部1は、蓄積映像の各映像フレームから、映像フレームを表現する蓄積特徴を、映像フレーム全体、または所定の画素数からなるブロック単位に抽出する。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力された特徴に対し、予め定められた所定の大きさの注目窓を、予め定められた所定の間隔で設定し(所定の間隔でずらし)、各注目窓内の特徴である蓄積部分領域特徴を抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から順次出力される蓄積部分領域特徴を、時系列に、すなわち時間軸方向に各々、所定の時間区間単位に連結して、それぞれの区間を蓄積連結特徴として出力する。
索引付与部3は、上記蓄積部分領域特徴連結部20から出力される各蓄積連結特徴を、各々ベクトル量子化し、ベクトル量子化の符号語を、標識のための索引としてそれぞれに対し付与する。
目的特徴抽出部4は、目的映像の各映像フレームから、映像フレームを表現する目的特徴を、映像フレーム全体、または所定の画素数からなるブロック単位に抽出する。
目的部分領域特徴抽出部5は、上記目的特徴抽出部4が抽出した各映像フレームの目的特徴に対して、予め定められた所定の大きさの注目窓を設定し、この注目窓を1ピクセルずつずらしながら、各注目窓内の特徴である目的部分領域特徴の抽出を行う。
索引検索部6は、上記索引付与部3から出力される索引を用いて、上記目的部分領域特徴抽出部5の抽出した目的部分領域特徴の集合から、類似する蓄積連結特徴の抽出を行う。
特徴照合部7は、第1の実施例と同様に、上記索引検索部6が抽出した蓄積連結特徴に対応する蓄積部分領域特徴と、目的部分領域特徴抽出部5の抽出した目的部分領域特徴との距離を計算する。
照合結果判定部8は、上記特徴照合部7の演算した距離に基づいて、目的映像と類似する部分映像が蓄積映像中の当該箇所に存在する可能性があるか否かの判定を行う。
特徴再照合部9は、上記照合結果判定部8が目的画像と類似する部分映像が存在する可能性があると判定した場合、判定された蓄積映像における箇所において、蓄積特徴抽出部1の抽出した蓄積特徴に対し、目的画像と同じ大きさの照合窓を設定して、目的特徴抽出部4から出力された目的特徴との特徴距離を計算する。この特徴距離も上記距離と同様に各種の定義を用いることができる。
照合結果再判定部10は、上記照合結果判定部8において用いられた距離に基づいて、目的映像と類似する部分映像が、蓄積映像中の当該箇所に存在するか否かの判定を行う。
検索結果候補選択部11は、上記照合結果再判定部10において目的映像と類似する部分映像が存在すると判定された蓄積映像中の箇所を、詳細な類似性の検討を行う検索結果候補とする。
次目的部分領域特徴選定部12は、上記目的部分領域特徴抽出部5において抽出された目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴の指定を行う。
次検索候補特徴選定部13は、上記索引検索部6から検索結果として出力された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴の指定を行う。
次に、図1及び図2を参照して、上述した映像検索装置の動作を説明する。図2は、図1の第2の実施例による映像検索装置の一動作例を具体的に示すフローチャートである。以下、ほぼ動作としては第1の実施例と同様であるため、異なる点を中心に説明を行う。
蓄積特徴抽出部1は、初めに、蓄積映像を、図示しないデータベースから読み込む(ステップS1)。
次に、蓄積特徴抽出部1は、入力した蓄積映像の各映像フレームから、第1の実施例と同様に、映像フレーム各々の特徴である蓄積特徴を抽出する(ステップS2)。
他の実施例として、例えば、蓄積映像から、所定の画素領域を、映像フレームの同一の位置において、時系列に連続する映像フレームから抽出、すなわち、例えば横bピクセル,縦bピクセル、時間方向bフレーム程度の大きさの立体小領域(所定のピクセル平面を所定の映像フレーム数分含む3次元の領域)を、1ピクセルづつ縦方向(y軸方向)及び横方向(x軸方向)、及びフレーム方向(時間方向)にずらしながら、各立体小領域に含まれる各ピクセルのRGB画素値各々に対して、3次元DCT(デジタルコサイン変換)を行い、その係数ベクトルを蓄積特徴とすることもできる。
このとき、蓄積映像の映像フレームの大きさがB×Bピクセルであり、蓄積映像が1秒あたりp枚の映像フレームで構成されているとすると、b×b×b次元の特徴ベクトルが、上記立体小領域を用いて1秒あたりに、(p×B×B)/(b×b×b)個、算出される。
この場合、蓄積特徴抽出部1は、蓄積映像の各映像フレームから抽出された特徴である蓄積特徴の集合(所定の時間毎)を出力することになる。
次に、蓄積部分領域特徴抽出部2は、蓄積特徴抽出部1から、蓄積特徴の集合を読み込み、蓄積映像のある1つの箇所に、予め定められた所定の大きさの第1注目窓を設定する。
例えば、この第1注目窓は、大きさが横wピクセル,縦wピクセル,時間方向w映像フレームであり、初期状態として蓄積映像における先頭の映像フレームの左上の角に配置される。
そして、蓄積部分領域特徴抽出部2は、設定された上記第1注目窓内に含まれる部分映像の特徴である蓄積部分領域特徴を抽出する。
例えば、この蓄積部分領域特徴各々は、RGB画素値をそのまま用いて、w×w×w×3次元の特徴ベクトルを1つ得ることになる。
また、蓄積部分領域特徴抽出部2は、他の実施形態において、例えば、蓄積部分領域特徴として、立体小領域内のRGB面素値の平均を演算し、得られた平均値を用い、上記第1注目窓内に、重複することも隙間もない状態に、上記立体小領域を配置して、この各立体小領域に対応する特徴を抽出して、特徴のベクトルを1つ得るように構成することも可能である。
さらに、蓄積部分領域特徴抽出部2は、他の実施形態において、例えば、蓄積部分領域特徴として、立体小領域内の2次元DCT係数ベクトルを用い、上記第1注目窓内に重複することも隙問も存在しない状態に、上記小領域を配置して、この各小領域に対応する特徴を抽出して、特徴ベクトルを得るように構成することもできる。
さらに、蓄積部分領域特徴抽出部2は、他の実施例として、例えば、特徴として立体小領域内の3次元DCT係数ベクトルを用いて、第1注目窓内に重複も隙間もなく立体小領域を配置し、各立体小領域に対応する蓄積部分領域特徴を抽出する、あるいは、それらをまとめて特徴ベクトルを1つ得るように構成しても良い。
第1注目窓は、各蓄積映像内において、予め定められた所定の間隔により、複数設定され、各注目窓内の部分映像から蓄積部分領域特徴を抽出する(ステップS3)。
すなわち、第1注目窓(横wピクセル×縦wピクセル×時間軸方向にw映像フレーム数)は、蓄積映像内において、縦及び横並びに時間方向に、上記所定の間隔(各注目窓の同一の辺同士の間隔であり、例えば左辺同士、上辺同士の間隔として、横方向にmピクセル,縦方向にmピクセル,時間軸方向にm映像フレーム)で順次ずらして配置されている。
また、第1注目窓の配置問隔を、第1の実施例と同様に、以下マージンと呼ぶことにする。
そして、蓄積部分領域特徴抽出部2は、上記第1注目窓毎に得られた蓄積部分領域特徴の集合を出力する。
次に、ステップS4及びS5は第1の実施例と同様のため説明を省略し、ステップS6からの説明を行う。
そして、目的特徴抽出部4は、目的映像を読み込むが(ステップS6)、この目的映像の大きさは、横qピクセル,縦qピクセル,時間方向q映像フレームであり、第1の実施例と同様に、例えば、マージンと第1注目窓の大ききとの和(合計)以上、すなわちq≧w+m,q≧w+m,q≧w+mに設定すると、大きさqピクセル×qピクセル×q映像フレームの窓を任意位置に配置しても必ず1つ以上の蓄積部分領域を含むため、検索漏れを生じることがない。
そして、目的特徴抽出部4は、目的画像から特徴の抽出を、上記蓄積特徴抽出部1と同様の手法で行い、目的映像から抽出された特徴である目的特徴の集合を出力する(ステップS7)。
次に、目的部分領域特徴抽出部5は、目的特徴抽出部4の抽出した目的特徴の集合を読み込み、この目的映像のある1つの箇所に、蓄積部分領域特徴抽出部2で用いた注目窓と同様の大きさ(縦wピクセル×横wピクセル×時間方向w映像フレーム)の注目窓、すなわち、第1注目窓を用い、この第1注目窓内に含まれる画像の特徴である目的部分領域特徴を抽出する。
また、目的部分領域特徴抽出部5は、上記蓄積部分領域特徴抽出部2と同様の抽出方法を用いて、目的映像の特徴を抽出して、抽出結果を目的部分領域特徴の集合として出力する(ステップS8)。
ここで、目的部分領域特徴抽出部5は、蓄積部分領域特徴抽出部2における特徴抽出の場合と異なり、上記第1注目窓を、目的映像内に重複することもなく、かつ隙間もない状態に設定し、目的映像に対し、マージンとして、縦及び横方向において1ピクセルずつ、また時間軸方向に対しては1映像フレーム単位にてずらしながら、各位置において上記目的部分領域特徴の抽出を行う。
このとき、第1抽出窓は、例えば、少なくともマージンの大きさの分だけずらせば、検索漏れを生じさせることがない。
そして、目的部分領域特徴抽出部5は、上述した処理により抽出した、目的部分領域特徴の集合を出力する。
次に、これ以降のステップS9〜ステップS16までの処理は第1の実施例と同様であり、説明を省略するが、(4)式におけるNは、以下の(8)式〜(11)式により求められる。
Figure 2006060796
Figure 2006060796
Figure 2006060796
Figure 2006060796
<第3の実施例>
図6は、請求項5に記載の方法を適用した第3の実施例による映像検索装置の構成例を示すブロック図である。
第2の実施例の部分画像検索装置は、請求項1〜4に記載の方法を適用した第1及び第2の実施例による部分画像検索装置に加え、さらに、図6に示すように、検索閾値更新部14を設け、任意の目的画像、すなわち見本となる検索したい画像または映像と、蓄積映像、すなわち検索される長時間の映像を入力とし、目的画像と類似する画像が含まれている映像フレームの一部分の位置(第1の実施例に対応)、または目的映像と類似する部分映像が含まれている蓄積映像内の箇所(第2の実施例に対応)を出力する。
上記検索閾値更新部14は、上記検索結果候補選択部11から出力された検索結果候補から、上記特徴再照合部9から出力された距離値に基づいて、所定の距離内にある候補を検出し、この検出した候補の距離値に基づいて新たに検索閾値θを設定する。
次に、上述した蓄積特徴抽出部1から検索閾値更新部14,蓄積部分領域特徴連結部20における部分画像の検出処理を、図7を用いて具体的に説明する。ここで、図7は、図6に示す部分画像検索装置の動作例を示すフローチャートである。
図7のフローチャートは、図2に示す第1または第2の実施例のフローチャートに対して、ステップS14の「検索結果の候補選択」の処理の次に、ステップS17の「検索閾値更新」の処理が追加されたのみで、他の処理については同様であるため、このステップS17の処理の説明のみを行う。
検索閾値更新部14は、検索結果候補選択部11から出力される検索結果候補を読み込み、この読み込んだ検索結果候補の中から、距離値が最大の検索結果候補を選び出し、選択した検索結果候補の距離値が検索閾値θ以下であるか否かの判定を行い、この距離値が探索結果閾値θ以下であることを検出した場合、検索閾値θをその距離値と同じ値に更新する。
そして、(4)式に基づいて検索閾値θから選択閾値θを計算し、更新した検索閾値θと共に出力する(ステップS14)。
これ以降は、この更新された検索閾値θ及び選択閾値θが照合結果の判定に用いられる。
<第4の実施例>
図8は、請求項10に記載の方法を適用した第4の実施例による映像検索装置の構成例を示すブロック図である。
この第4の実施例による映像検索装置は、第1〜第3の実施例の映像検索装置に対して、目的代表特徴抽出部15を加えたものであり、目的画像または目的映像、すなわち見本となる検索したい画像または映像と、蓄積映像、すなわち検索される映像とを入力し、目的画像と類似する画像が含まれている蓄積映像中の映像フレーム内の位置、または目的映像と類似する部分映像が含まれている蓄積映像内の箇所を検索し、検索結果を出力する。
この目的代表特徴抽出部15は、上記目的部分領域特徴抽出部5から出力された目的部分領域特徴の集合を分類し、各分類を代表する部分領域特徴を代表特徴として抽出して出力する。
次に、上述した蓄積特徴抽出部1から目的代表特徴抽出部15,蓄積部分領域特徴連結部20における部分画像の検出処理を、図9を用いて具体的に説明する。ここで、図9は、図8に示す映像検索装置の動作例を示すフローチャートである。
図9のフローチャートは、図7に示す第4の実施例のフローチャートに対して、ステップS8の「目的部分領域の抽出」の処理の次に、ステップS18の「目的代表特徴の抽出」の処理が追加されたのみで、他の処理については同様であるため、このステップS18の処理の説明のみを行う。
目的代表特徴抽出部15は、目的部分領域特徴抽出部5から出力される目的部分領域特徴の集合を読み込み、これら複数の目的部分領域特徴に対してクラスタリング処理を行う。
このとき、目的代表特徴抽出部15は、例えば、クラスタを1つだけ用意し(共通の特徴ベクトルを抽出する)、上記集合における全ての目的部分領域特徴をそのクラスタに所属させる(1つの目的代表特徴を出力することになる)。
さらに、目的代表特徴抽出部15は、別の実施例として、目的部分領域特徴に対応する目的画像中の位置を、読み込んだ全ての目的部分領域特徴について抽出し、その存在範囲を格子状に区切り、各格子をクラスタと対応させる構成とすることも可能である。
また、さらに、目的代表特徴抽出部15は、別の実施例として、同一クラスタ内の目的部分領域特徴同士の距離の最大値が、予め定められた閾値である分類閾値を上回らないように、クラスタを併合することも可能である。
このとき、目的代表特徴抽出部15は、クラスタの初期状態として、例えば、読み込んだ目的部分領域特徴の数だけ用意したクラスタに1つずつ目的部分領域を割り当てたものを用いる。
次に、目的代表特徴抽出部15は、上記各クラスタから、該クラスタを代表する部分領域特徴である代表特徴を抽出する。目的代表特徴抽出部15は、例えば、クラスタ内の任意に選択した1つの目的部分領域特徴を代表特徴とする。
また、目的代表特徴抽出部15は、別の実施例として、ある特定位置に対応する目的部分領域特徴を代表特徴とすることもできる。
この特定位置とは、例えば、目的画像の左上角の位置などである。
さらに、目的代表特徴抽出部15は、別の実施例として、クラスタ内の目的部分領域特徴の重心にある目的部分特徴を代表特徴とする構成とすることもできる。
そして、目的代表特徴抽出部15は、上述した第4の実施例における各実施例により求めた、代表特徴あるいはその集合を出力する。
次のステップS9において、索引検索部6は、上記目的代表特徴を用いて、蓄積画像の索引との照合処理を行う。
<第5の実施例>
図11は、請求項12に記載の方法を適用した第5の実施例による映像検索装置の構成例を示すブロック図である。
この第5の実施例による映像検索装置は、第1、第2、第3、第4の実施例の映像検索装置に対して、目的部分領域間距離計算部16と、周辺距離下限値計算部17とを加えたものであり、目的画像または目的映像、すなわち見本となる検索したい画像または映像と、蓄積映像、すなわち検索される映像とを入力し、目的画像と類似する画像が含まれた蓄積画像中の映像フレーム内における位置、または、目的映像と類似する部分映像が含まれている蓄積映像内における箇所を検索し、検索結果を出力する。
上記目的部分領域間距離計算部16は、上記目的部分領域特徴抽出部5から出力された目的部分領域特徴について、部分領域特徴同士の距離を計算する。
そして、目的代表特徴抽出部15が設けられている場合は、目的部分領域特徴と、それに対応する目的代表特徴との距離を計算する。
上記周辺距離下限値計算部17は、特徴照合部7から出力された距離値と、目的部分領域間距離計算部16から出力された距離値とを用い、特徴照合部7で照合を行った検索候補特徴と、上記目的部分領域特徴抽出部5から出力された各目的部分領域特徴との距離を演算して、この演算結果から下限値を抽出する。
次に、上述した蓄積特徴抽出部1から周辺距離下限値計算部17,蓄積部分領域特徴連結部20における部分画像の検出処理を、図11を用いて具体的に説明する。ここで、図11は、図10に示す部分画像検索装置の動作例を示すフローチャートである。
図11のフローチャートは、図9に示す第4の実施例のフローチャートに対して、ステップS18の「目的代表特徴の抽出」の処理の次に、ステップS19の「目的部分領域間距離の演算」の処理が追加され、また、ステップS15の「次の目的部分領域特徴の有無」の処理の直前に、ステップS20の「周辺距離下限値の演算」の処理が追加されたのみで、他の処理については同様であるため、このステップS19及びステップS20の処理の説明のみを行う。
目的部分領域間距離計算部16は、目的部分領域特徴抽出部5から出力される目的部分領域特徴の集合を読み込み、各目的部分領域特徴同士の距離を計算する。
そして、目的部分領域間距離計算部16は、例えば、全ての目的部分領域特徴の組に対して距離計算を行う。ここで、距離尺度としては、例えば、自乗誤差を用いる。
また、別の実施例として、目的代表特徴抽出部15が設けられている場合には、さらにこの目的代表特徴抽出部15から出力される目的代表特徴の集合を読み込み、各目的部分領域特徴と、それに対応する目的部分領域特徴との距離を計算することも可能である。
上述したように、目的部分領域間距離計算部16は、目的部分領域特徴同士の距離、あるいは目的部分領域特徴と目的代表特徴との距離を出力する。
上述した距離を用いて、ステップS9において、索引による検索が行われる。
次に、周辺距離下限値計算部17は、特徴照合部7から出力される距離値と、目的部分領域間距離計算部16から出力される部分領域間距離とを読み込む。
そして、周辺距離下限値計算部17は、読み込んだ距離値と部分領域問距離とから、蓄積部分領域特徴と各目的部分領域特徴との距離の下限値を計算する。
このとき、周辺距離下限値計算部17は、蓄積部分領域特徴f (W)と、目的部分領域特徴fQ2 (W)との距離の下限値bound(f (W),fQ2 (W))は、三角不等式に基づいて、以下の(12)式により求められる。
Figure 2006060796
上記(12)式において、d(f (W),fQ1 (W))は特徴照合部7(類似度計算部100の構成)から読み込んだ距離値であり、d(fQ1 (W),fQ2 (W))は読み込んだ目的部分領域間距離である。
上述したように、周辺距離下限値計算部17は、蓄積部分領域特徴と、目的部分領域特徴との距離の下限値である周辺距離下限値を出力する。
そして、次のステップS15において、次目的部分領域特徴選定部12は、上記周辺距離下限値を入力し、この距離下限値が、読み込んだ選択閾値θを上回る目的部分領域特徴との照合を省略し、この距離下限値が選択閾値θ以下の目的部分領域特徴から任意に1つ選択する。
<第6の実施例>
図12は、本発明の第6の実施例である映像検索装置の構成を示すブロック図である。
この図6に示す映像検索装置は、蓄積特徴抽出部1と、蓄積部分領域特徴抽出部2と、蓄積部分領域特徴連結部20と、索引付与部3と、索引格納部30と、目的特徴抽出部4と、目的部分領域特徴抽出部5と、索引検索部6と、類似度計算部200とから構成され、映像フレームより小さな検索したい画像、すなわち目的画像と、検索される対象である蓄積映像を入力し、目的画像と類似する部分画像が含まれている映像フレームの蓄積映像における位置を出力する。また、検索鍵として映像、すなわち目的映像を入力した場合には、目的映像に類似する映像の部分領域が含まれている蓄積映像内の区間を出力する。
また、上記類似度計算部200は、次連結特徴選定部13と、次目的部分領域特徴選定部12と、特徴照合部7と、検出結果判定部31と、特徴再照合部9と、検出結果再判定部32と、検出結果候補選択部33とから構成されている。
蓄積特徴抽出部1は、蓄積映像の各映像フレームから、映像フレームを表現する蓄積特徴(特徴ベクトル)を、映像フレーム全体、または所定の画素数からなるブロック単位に抽出する。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力される蓄積特徴に対し、予め設定された所定の大きさの注目窓を所定の間隔で複数設定し(所定の間隔でずらし)、各注目窓の範囲に含まれる蓄積特徴を、蓄積部分領域特徴として抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から出力される蓄積部分領域特徴を、それぞれに位置的に近いものを時間軸方向に順次連結し、各連結ブロック内の特徴である蓄積連結特徴を導く。
索引付与部3は、上記蓄積部分領域特徴連結部20から出力される各蓄積連結特徴を各々ベクトル量子化し、ベクトル量子化の符号語を、標識のための索引として、各蓄積連結特徴それぞれに対して付与する。
索引格納部30は、上記索引付与部3の出力する索引を格納する。
目的特徴抽出部4は、目的画像、または目的映像の各映像フレームから目的特徴(特徴ベクトル)を抽出する。
目的部分領域特徴抽出部5は、上記目的特徴抽出部4が抽出した目的特徴に所定の大きさの注目窓を設定し、この注目窓を所定のピクセル(画素)単位、例えば1ピクセルずつずらしながら、各注目窓に含まれる目的特徴を、目的部分領域特徴として抽出する。
索引検索部6は、上記索引付与部3から出力される索引を用いて、上記目的部分領域特徴抽出部5の抽出した目的部分領域特徴の集合に対して類似する蓄積連結特徴を、索引を用いて検出する。
また、索引検索部6は、上記索引により類似する蓄積連結特徴が検出された場合、この検出した蓄積連結特徴を類似度計算部200に送出し、一方、何も検出されなかった場合、この処理において映像検索処理を終了する。
類似度計算部200において、各構成により、目的部分領域特徴と索引検索部6で検出された類似する可能性のある蓄積連結特徴との距離を逐次計算し、部分領域における類似性が確認された場合に、蓄積特徴上の該箇所に目的画像と同じ大きさの照合窓を設定し、目的特徴と照合窓の類似度を所定の検索閾値から計算する。
そして、類似度計算部200は、索引検索部6により検出された全ての蓄積連結特徴について照合が終了した場合、その照合結果を出力し、映像検索処理を終了する。
次に、第6の実施例における映像検索装置における各構成の詳細な説明、すなわち各構成と類似度計算部200の各要素との動作の説明を行う。
蓄積特徴抽出部1は、与えられた蓄積映像を読み込んで入力し、蓄積映像から映像フレームごとに蓄積特徴を抽出する。
このとき、蓄積特徴抽出部1は、入力された蓄積映像の各フレームから、小領域(横bxピクセル、縦byピクセル)を縦横1ピクセルずつずらしながら取り出し、各小領域におけるRGB(Red,Green,Blueの3原色)各色の画素について平均値を計算する。ここで、蓄積特徴は小領域内のRGBそれぞれの平均画素値からなる3次元ベクトルからなる特徴ベクトルにより表現される。
また、蓄積特徴抽出部1における映像信号の特徴抽出方法には、上述した各小領域のRGB各々に対して公知のディジタル画像圧縮技術である2次元DFT(離散フーリエ変換)、2次元DCT(離散コサイン変換)、あるいは2次元DWT(離散ウェーブレット変換)を施し、その係数ベクトルを利用する方法もある。
さらに他の実施形態として、入力された蓄積映像から小領域(横bxピクセル、縦byピクセル、時間方向btフレーム)を縦横1ピクセルずつ、時間方向1フレームずつずらしながら取り出し、各小領域のRGB各々に対して公知のディジタル映像処理技術である3次元DCTを施し、その係数ベクトルを利用する方法もある。
なお、本実施例においては、上述の小領域をユニットとして特徴抽出を行ったが、小領域を画素(1ピクセル、すなわちbx=by=bt=1)とみなし、蓄積映像の各フレームにおけるRGB画素値をそのまま用いてもかまわない。
蓄積特徴抽出部1は、上述したように、各映像フレームにおいて抽出した蓄積特徴の集合を、蓄積部分領域特徴抽出部2に出力する。
そして、蓄積部分領域特徴抽出部2は、蓄積特徴抽出部1から入力される蓄積特徴の集合に対し、注目窓を所定の間隔にて複数設定し、注目窓内の特徴である蓄積部分領域特徴を抽出する。
上記注目窓は、例えば、横wxピクセル×縦wyピクセルとして設定され、図3に示されるように、蓄積映像の映像フレーム内において、縦及び横方向に上記所定の間隔(各注目窓の同一の辺同士の間隔であり、例えば左辺同士、上辺同士の間隔として、横方向にmピクセル、縦方向にmピクセル)で配置する。注目窓の配置間隔を本発明ではマージンと呼ぶことにする。
そして、蓄積部分領域特徴抽出部2は、この注目窓内に重複も隙間もなく小領域を配置して(各小領域が隣接するように配置し)、この小領域に対応する特徴を抽出する。
これにより、蓄積部分領域特徴抽出部2は、上記小領域特徴を順に並べて、ベクトルとした蓄積部分領域特徴を出力する。
他の実施形態として、蓄積部分領域特徴抽出部2は、蓄積特徴抽出部1が画素単位で特徴抽出を行った場合、注目窓内のRGB画素値をそのまま取り出し、このRGB画素値を蓄積部分領域特徴として出力してもよい。
そして、蓄積部分領域特徴抽出部2は、上述したように求めた蓄積部分領域特徴の集合を、蓄積部分領域特徴連結部20に対して出力する。
蓄積部分領域特徴連結部20は、蓄積部分領域特徴抽出部2から入力される蓄積部分領域特徴の集合について、時間軸方向に連続する蓄積部分領域特徴を所定の基準で連結し、各連結ブロック内の特徴である蓄積連結特徴を導く。
このとき、蓄積部分領域特徴連結部20は、例えば、連結させる蓄積部分領域特徴の数が予め基準として設定されており、その基準の示す連結数の分だけ、映像フレーム内の位置が同一であり、かつ時間軸方向に連続する蓄積部分領域特徴を集合させ、これら複数の蓄積部分領域特徴を一つのブロックとする。
また、他の実施形態として、例えば、蓄積部分領域特徴連結部20を、連結を開始する蓄積部分領域特徴と、映像フレーム内の位置が同一であり、かつ時間軸方向に連続する蓄積部分領域特徴との距離を計算し、これらの距離が所定の連結閾値を超えるまで、蓄積部分領域特徴を連結するように構成してもよい。ここで用いる距離の計算法は、後述の類似度計算部にて説明する。
さらに他の実施形態として、例えば、蓄積部分領域特徴連結部20を、連結を開始するある蓄積部分領域特徴について、時間軸に連続する次の映像フレーム上の、これと同一位置またはその近傍領域にある蓄積部分領域特徴のうち距離が最小となる蓄積部分領域特徴を連結するように構成してもよい。これを時間軸方向に再帰的に繰返すことで、蓄積映像のフレーム数だけ蓄積部分領域特徴を連結することができる。
このとき、距離が最小となる蓄積部分領域特徴と必ず連結する構成の他に、例えば、距離が所定の連結閾値を下回る場合にのみ連結する構成も可能である。
上記近傍領域は、例えば、蓄積部分領域から横aピクセル、縦aピクセル以内の範囲とする、アプリケーション毎に設定する範囲の領域を示す。
また、あるいはすでに連結されている、時間軸逆方向に連続する蓄積部分領域の移動量を平均し、その分近傍領域をシフトさせる構成も可能である。この移動量の計算法は、後述の類似度計算部200にて説明する。
次に、蓄積部分領域特徴連結部20は、連結した蓄積部分領域特徴の各ブロックから蓄積連結特徴を抽出する。このとき、蓄積部分領域特徴連結部20は、例えば、各ブロックにおいて、連結の先頭に位置する蓄積部分領域特徴をブロックの代表である蓄積連結特徴として抽出する。
他にも、上記蓄積部分領域特徴のブロックにおいて、連結された蓄積部分領域特徴に対応する蓄積部分領域の重心を蓄積連結特徴として出力するように構成してもよい。
そして、蓄積部分領域特徴連結部20は、ブロック内のすべての蓄積部分領域特徴と、それらを代表する蓄積連結特徴との距離を計算し、これらの距離の最大値である連結最大差分値を、ブロック毎に保持する。
蓄積部分領域特徴連結部20は、蓄積連結特徴ならびにこの蓄積連結特徴の保持する連結最大差分値をブロック毎に索引付与部3へ出力する。
索引付与部3は、蓄積部分領域特徴連結部20から出力された蓄積連結特徴に対し、以下に示すように、検索を容易にするための索引を付与する。
本実施例においては、特許文献(特許第3574075号「信号検出方法、信号検出装置、記録媒体及びプログラム」)に記載された手法を用い、予め作成されたベクトル量子化符号帳により蓄積連結特徴の特徴ベクトルをベクトル量子化し、得られた符号を索引とする。上記符号と、この符号に対応した見本特徴としての特徴ベクトルとの対応がベクトル量子化符号帳に記載されており、例えば、ベクトル量子化の符号語数(符号の数)がC個(C個のクラスタ)であれば、蓄積連結特徴は特徴ベクトルの距離がより近い、見本特徴の符号に振り分けられ、C個のクラスタのいずれかに分類されることになる。
ここで、ベクトル量子化は、例えば自乗誤差を距離関数として用い、蓄積連結特徴ベクトルとクラスタ重心との距離を算出し、距離値が最小となるクラスタに蓄積連結特徴を所属させ、このクラスタに対応する符号語を出力することによって行われる。
索引付与の方法に関する他の実施形態として、例えば、R*−Tree(“The R*-Tree: an efficient and robust access method for points and rectangles”, N. Beckman 他一名, Proc. of ACM SIGMOD Conference, pp.322-331, 1990)や、SR−Tree(”SR-Tree: 高次元データに対する最近接探索のためのインデックス構造の提案“, 片山紀生 他一名, 電子情報通信学会論文誌 D-I, Vol. J80-D-I, No.8, pp.703-717, 1997 Aug)などは、多次元インデックス手法と総称される手法である。
これらの手法は、特徴の存在する多次元空間内で特徴を包含する領域を階層的に作成し、作成されたなかで最下層の領域と特徴とを対応づけることにより索引を付与している。
この特徴を包含する上記領域は、R*−Treeであれば3次元空間における直方体に相当する超直方体であり、SR−Treeであれば超直方体と、3次元空間における球に相当する超球との重なりとなる。
上述したように、索引付与部3は、付与した索引を索引検索部6へ直接送信するか、または一旦索引格納部30へ登録するか、いずれかの処理を行う。
すなわち、映像検索装置が、目的画像または目的映像、及び蓄積映像を同時に読み込み、リアルタイムで検索を行うアプリケーションの場合、索引付与部3は索引を索引検索部6へ送出し、一方、それ以外の場合、索引格納部30へ蓄積映像ごとに索引の登録処理を行う。
また、目的特徴抽出部4は、目的画像、または目的映像を読み込む。このとき、読みこなれる目的画像または目的映像の映像フレームの大きさは、縦qピクセル、横qピクセルで、図3におけるマージンと注目窓サイズとの和(合計)以上、すなわちq≧w+m及びq≧w+mであれば、蓄積映像中の各映像フレームについて、大きさq×qピクセルの窓を任意の位置に配置しても必ず1つ以上の蓄積部分領域を含むので、検出漏れを生じることはない。
次に、目的特徴抽出部4は、すでに述べた蓄積特徴抽出部1と同様に、目的画像または目的映像に小領域を設定し、小領域を縦横1ピクセルずつ(時間方向にずらす必要がある場合には、時間方向に1フレームずつ)ずらしながら各小領域における特徴を抽出する。
あるいは、蓄積特徴抽出部1において他の特徴抽出手段を用いる場合には、目的特徴抽出部4は、これと同様の手法で特徴抽出を行う。
目的特徴抽出部4は、目的特徴(特徴ベクトル)の集合を目的部分領域特徴抽出部5へ送出する。
目的部分領域特徴抽出部5は、目的特徴抽出部4から入力される目的特徴に対し、蓄積部分領域特徴抽出部2にて用いた注目窓と同じ大きさの注目窓を複数設定し、注目窓内における(含まれる)特徴を、目的部分領域特徴として抽出する。
ここで、目的部分領域特徴抽出部5は、注目窓の設定方法として、蓄積部分領域特徴抽出部2と異なり、注目窓を目的画像内に重複することもなく、かつ隙間もない状態に設定し、それらを1ピクセルずらしながら、各位置において目的部分領域特徴の抽出を行う。
このとき、上記注目窓は、蓄積部分領域特徴抽出部2で用いたマージンの分、すなわち縦mxピクセル、横myピクセルだけずらせば、検索漏れを生じさせることがない。
そして、目的部分領域特徴抽出部5は、この注目窓内に重複も隙間もなく小領域を配置し、この小領域に対応する特徴を抽出する。
この目的部分領域特徴抽出部5における、小領域から特徴を抽出する処理は、蓄積部分領域特徴抽出部2と同様である。また、蓄積部分領域特徴抽出部2において他の特徴抽出手段を用いる場合には、目的部分領域特徴抽出部5においても、蓄積部分領域特徴抽出部2と同様の特徴抽出処理を行う。
そして、目的部分領域特徴抽出部5は、上述のように求めた目的部分領域特徴の集合Wを索引検索部6へ出力する。
次に、索引検索部6は、目的部分領域特徴抽出部5から入力される目的部分領域特徴の集合W、および索引付与部3から索引を読み込む。
また、索引検索部6は、目的画像または目的映像、及び蓄積映像を同時に入力してリアルタイムに類似を判定する場合以外、索引格納部30から順次索引を読み出して、目的部分領域特徴と比較を行う。
そして、索引検索部6は、読み込んだ上記索引を用い、目的部分領域特徴の集合に類似した蓄積連結特徴の検索を行う。
このとき、索引検索部6は、目的部分領域特徴の集合W内におけるいずれかの目的部分領域特徴に対し、距離値が、所定の閾値である選択閾値θ2を下回る蓄積連結特徴を索引から抽出する。
上記距離計算は、後述する類似度計算部200で行われる処理と同様である。すなわち、上記距離値は、例えば特徴ベクトル間の距離関数とし、自乗誤差により計算することができる。
また、上記選択閾値θ2は、類似度計算部200で与えられる検索閾値θから自動的に決定される値である。この選択閾値θ2の決定方法については後述する。
ここでの具体的な検索方法は、上記索引付与部3において付与された索引の種類によって異なり、それぞれの文献に記載されている手法を用いることで索引検索を行う。
例えば、テンプレートを用いた量子化によって索引を付与した場合、すなわち特許第3574075号に記載された手法により索引を付与した場合、以下のようにして所望の蓄積連結特徴である検索候補特徴を抽出することができる。
すなわち、索引検索部6は、目的部分領域特徴と、索引付与部3で作成された索引(クラスタを示す符号)と、選択閾値θ2とを読み込む。
次に、索引検索部6は、目的部分領域特徴と各クラスタ重心との距離を計算し、この計算結果の距離値が選択閾値θ2を下回るクラスタを選択することにより、このクラスタに所属する蓄積連結特徴をすべて抽出する。
上述した索引検索部6が行うクラスタ選択の原理は以下のように説明されるものである。
図4は、点Q、C、Cの3点が乗るような平面であり、特徴ベクトルが配置される特徴空間を切り出した様子を示している。
ここで、点Qは目的部分領域特徴、Cは目的部分領域特徴Qが所属しているクラスタのクラスタ重心、Cは他のクラスタのクラスタ重心を表しており、距離dQ1、dQ2、d12は、それぞれ、点Qと点Cとの距離、点Qと点Cとの距離、点Cと点Cとの距離を示している。
ここで、目的部分領域特徴の座標である点Qからの距離dが、選択閾値θ2以内である蓄積連結特徴を抽出しなければならないとすると、点Qを中心とする半径θ2の超球(図4においては円)の内部にある蓄積連結特徴がそれに該当することになる。
そして、点Qを中心とする超球の半径(すなわち選択閾値θ2)が、図4における距離dθより大きくなったとき、点Cに対応するクラスタに所属する蓄積連結特徴のみならず点Cに対応するクラスタの中にも、所望の蓄積連結特徴が含まれている可能性がある。
このため、選択閾値θ2が図4における距離dθより大きくなったとき、そのクラスタを選択する。dθは、以下に示す(13)式より導かれる(14)式から求められる。
Figure 2006060796
Figure 2006060796
さらに、蓄積連結特徴に対応する連結最大差分値を考慮して、索引検索部6は、以下に示す(15)式が成り立つとき、点C2に対応するクラスタを選択し、そのクラスタに属する蓄積連結特徴のすべてを抽出する。
Figure 2006060796
この(15)式において、r'は、点C2に対応するクラスタに所属する蓄積連結特徴の連結最大差分値について、そのクラスタ内最大値をとったものである。
そして、索引検索部6は、上述した手順を、目的部分領域特徴Qの所属するクラスタを除くすべてのクラスタに対して行い、抽出された目的部分領域特徴に類似する可能性のある蓄積連結特徴を類似度計算部200に対して出力する。ここで、目的部分領域特徴に類似する可能性のある蓄積連結特徴の集合をFとする。
一方、索引検索部6は、目的部分領域特徴に類似する可能性のある蓄積連結特徴が検出されなかった場合、映像検索装置における検索処理をここで終了する。
類似度計算部200において、次連結特徴選定部13は、目的部分領域特徴に類似する可能性のある蓄積連結特徴の集合Fを、索引検索部6から入力する。
そして、次連結特徴選定部13は蓄積連結特徴を順次取り出す。また、次目的部分領域特徴選定部12は取り出された上記目的部分領域特徴に対し、特徴照合部7にて距離計算を行う。
次に、検出結果判定部31がある蓄積連結特徴に類似する目的部分領域特徴を検出した場合、特徴再照合部9は、この蓄積連結特徴が帰属する蓄積映像の映像フレーム(蓄積特徴の集合)に、目的画像または目的映像のフレームサイズ(目的特徴の集合)と同じ大きさの照合窓を設定し、目的特徴と蓄積特徴上の照合窓との距離値を計算する。
そして、検出結果再判定部32は、目的特徴と上記照合窓内の特徴との類似性を判定し、検出結果候補選択部33は検出結果の出力数を制御する。
具体的な類似度計算部200の動作を、図2のフローチャートに従って、以下に説明する。
まず、次連結特徴選定部13は、目的部分領域特徴に類似する可能性のある蓄積連結特徴の集合Fから、蓄積連結特徴を一つ選択する(S101及びS102)。
次に、次目的部分領域特徴選定部12は、選択した蓄積連結特徴と照合を行う目的部分領域特徴を、指定された順に取り出す(S201及びS202)。
ここで、次目的部分領域特徴選定部12は、例えば、目的画像または目的映像の映像フレームの左上端または右下端より順次照合を行うように、目的部分領域特徴の設定を行う。
そして、類似度計算部200における特徴照合部7は、蓄積連結特徴と目的部分領域特徴との間の距離値の計算を行う(S301)。
ここで、特徴照合部7は、上記距離値を、例えば、自乗誤差として計算することができる。次に、特徴照合部7は、計算した距離値から、照合を行った蓄積連結特徴の連結最大差分値を減算した補正距離値d(ω)を求める。
次に、検出結果判定部31は、算出された上記補正距離値d(ω)を上記選択閾値θ2と比較し(S302)、補正距離値d(ω)が選択閾値θ2以下である場合、照合を行った蓄積連結特徴を含む領域に目的画像または目的映像に類似する部分映像が存在する可能性があることを検出し、この蓄積連結特徴が代表する時間軸に連続した蓄積部分領域特徴の集合を出力する(S303)。
一方、検出結果判定部31は、補正距離値d(ω)が選択閾値θ2を上回った場合、処理をステップS201に進め、上述した処理を再度実行する。
次に、特徴再照合部9は、目的画像または目的映像に類似する部分映像が存在する可能性があると判断された時間軸に連続した蓄積部分領域特徴の集合について、これらが帰属する蓄積特徴の集合を読み込み、目的特徴と同じ大きさの照合窓を設定する(S401)。
そして、特徴再照合部9は、目的特徴と、蓄積特徴における照合窓内の特徴との距離を算出する(S501)。
ここで、特徴再照合部9は、上記照合窓の設定を行う際、図5の概念図に示すように、照合窓の配置箇所に対する蓄積部分領域の相対的な位置が、目的画像または目的映像の映像フレームにおける目的部分領域の相対的な位置と同一になるように、つまり、照合窓における蓄積部分領域と、映像フレーム上の目的部分領域が重なる位置に照合窓を配置する。
そして、検出結果再判定部32は、目的特徴と、各蓄積特徴上の照合窓における領域の特徴との類似度として、これら特徴の距離値d、例えば蓄積特徴特と照合窓における領域の特徴との間の自乗誤差を、所定の検索閾値θと比較することで求める(S502)。
そして、検出結果再判定部32は、得られた距離値dが検索閾値θ以下である場合、目的画像または目的映像に類似する領域が、蓄積映像中のこの照合窓の位置に存在すると判定し、照合窓の位置及び類似度を出力する(S503)。
一方、検出結果再判定部32は、検索閾値θ以上であれば、処理をステップS201へ進め、上述した処理を再度実行する。
ここで、上記選択閾値θ2は、前記検索閾値θから自動的に決定される値であり、以下に示す(16)式を用いて設定すると検出漏れを生じることがない。
Figure 2006060796
上記(16)式において、「N」は、注目窓を重複も隙間もなく蓄積映像における映像フレーム中に配置したと仮定したとき、任意位置に配置された照合窓に含まれる注目窓の最小数であり、以下の(17)式,(18)式,(19)式により与えられる。
また、以下の(18)式におけるNxは、照合窓内の横方向の注目窓の数であり、(18)式におけるNyは照合窓内の縦方向の注目窓の数である。ただし、(18)式及び(19)式におけるceil(x)は、x以上の整数であり最小のものを表す。
Figure 2006060796
Figure 2006060796
Figure 2006060796
また、類似度計算部200における特徴照合部7を、距離値計算の途中で所定の閾値と随時比較し、閾値を超えたときその処理を終了するよう構成することも可能である。
すなわち、特徴照合部7が検索候補特徴と目的部分領域特徴とから、距離値を計算(S301)する過程において、特徴照合部7は、計算途中の補正距離値d(ω)が選択閾値θ2を超えたか否かを逐次的に評価し、補正距離値d(ω)が選択閾値θ2を超えたことを検出した時点にて、距離値の計算を打ち切るように構成しても良い。
また、特徴再照合部9が目的特徴と蓄積特徴上の照合窓との距離値を計算(S501)する過程においても、同様に、計算途中の距離値dを検索閾値θと比較して、θを超えた場合に、この距離値計算を打ち切るように、特徴再照合部9を構成しても良い。
この手法を用いることにより、類似度計算部200における計算量を削減し、検索処理の高速化を図ることができる。
次に、類似度計算部200における検出結果候補選択部33は、ステップS502にて検出された蓄積映像における箇所と、その類似度(または距離値)を検出結果候補として登録する。
ここで、最終的に最も類似する箇所または上位κ箇所を出力するように構成した場合、検出結果候補選択部33は、検出箇所をκ箇所まで無条件に登録する(S601及びS602)。
このとき、検出結果候補選択部33は、κ箇所を超過する場合、例えば、新たに検出された箇所における距離値を、すでに登録された検出結果候補の距離値の最大値と比較し、これを下回る場合に最大距離値に対応する検出結果候補を削除し、新たな検出箇所とその類似度を検出結果候補として登録する(S603)。
類似度計算部200の次目的部分領域特徴選定部12は、上記ステップS201において、照合に用いる目的部分領域特徴を逐次選択し、すべての目的部分領域特徴について検索が終了、つまり目的部分領域特徴の集合Wが空集合(0)であることを検出した場合(S211)、ステップS101に処理を戻す。
これにより、次連結特徴選定部13が次に照合を行う蓄積連結特徴を選択することで、類似度計算部200の各構成がステップS102以降の処理を行う。
最後に、類似度計算部200においてすべての蓄積連結特徴について照合が終了、すなわち、次連結特徴選定部13が蓄積連結特徴の集合Fが空集合であることを検出した場合(S111)、検出結果候補選択部33は、ステップS503において登録された検出結果を出力し、映像検索装置の検索処理が終了する。
<第7の実施例>
図14は、本発明の第7の実施例である映像検索装置の構成を示すブロック図である。
第7の実施例である映像検索装置は、第6の実施例に更に、見本特徴作成部34と、見本特徴格納部35と、見本特徴間距離計算部36と、見本特徴間距離格納部37と、蓄積特徴量子化部38と、目的特徴量子化部39とを具備しており、特徴の典型的なパターンである見本特徴を用いて蓄積特徴ならびに目的特徴の量子化を行う。
このように構成することで、蓄積映像と目的画像あるいは目的映像内の位置関係を保持しながら照合の際に必要な情報量を大幅に削減することができ、また、既知の値である見本特徴間距離を用いて照合を行うことにより、実際の距離計算を省略できるようにしたものであり、高速検索処理を可能とした。
見本特徴作成部34は、外部から入力される学習信号から、見本となる典型的な特徴パターンである見本特徴(特徴ベクトル)を複数作成し、見本特徴格納部35に記憶させる。
見本特徴間距離計算部36は、見本特徴作成部34から入力される各見本特徴間の距離を計算し、計算結果の見本特徴間距離を見本特徴間距離格納部37に記憶させる。
蓄積特徴量子化部38は、蓄積画像の特徴である蓄積特徴を、見本特徴格納部35に格納された見本特徴と比較することにより、相当する見本特徴の符号を割り当て、符号の集合である蓄積量子化特徴を求める。
目的特徴量子化部39は、上記蓄積特徴量子化部38と同様の方法により、すなわち、目的特徴と見本特徴格納部35に格納された見本特徴とを比較することにより、目的画像の特徴である目的特徴に相当する見本特徴の符号を割り当て、符号の集合である目的量子化特徴を求める。
これにより、第7の実施例における蓄積部分領域特徴抽出部2および目的部分領域特徴抽出部5は、それぞれ蓄積量子化特徴、目的量子化特徴から蓄積部分領域特徴、目的部分領域特徴を抽出することとなる。
索引付与部3は、蓄積部分領域特徴連結部20から入力される蓄積連結特徴に対し、見本特徴間距離格納部37に格納された見本特徴間距離を用いて索引を付与する。
索引検索部6ならびに類似度計算部200は、目的部分領域特徴と蓄積連結特徴との距離を、見本特徴間距離を用いて逐次計算し、類似することが確認された場合に、蓄積量子化特徴上の該箇所に目的量子化特徴と同じ大きさの照合窓を設定し、目的量子化特徴と照合窓の距離を計算する。
次に、第7の実施例である映像検索装置における各構成の詳細な説明、すなわち新たに付け加えた構成及び第6の実施形態と異なる動作の説明を行う。
まず、見本特徴作成部34は、後に説明する見本特徴を抽出するため、必要に応じて、外部から学習信号を読み込む。
上記学習信号としては、例えば、1000枚の画像群など、目的画像と蓄積画像との比較に対して、十分となる多数の(複数の)画像信号を用いる。しかしながら、下記に説明する確率分布を用いた見本特徴の作成手順のように、学習信号を用いない場合、上述した学習信号を読み込む必要はない。
次に、見本特徴作成部34は、学習信号から特徴の抽出を行う。このとき、見本特徴作成部34は、特徴の抽出方法として、すでに第6の実施例にて説明した蓄積特徴抽出部1の手順により特徴を抽出する。ここで、本発明においては、学習信号から抽出した特徴を、学習特徴と呼ぶこととする。また、上述した学習信号を用いない場合、この学習信号からの学習特徴の抽出処理を省略する。
そして、見本特徴作成部34は、画像の特徴の典型的なパターンである見本特徴を複数作成する。このとき、見本特徴作成部34は、見本特徴の作成において、多次元ガウス分布といった確率分布に基づいて、各見本特徴間のパターンの類似性を低くしてランダムに発生させることにより、複数の見本特徴の作成を行うことができる。
また、見本特徴作成部34は、上述した確率分布を利用した見本特徴の作成に対する他の実施形態として、確率分布を用いずに見本特徴を作成する方法を用い、例えば、学習信号より導かれた学習特徴を特徴ベクトルと考え、その特徴ベクトルをベクトル量子化して分類することで見本特徴の抽出を行う構成としても良い。
ここで、見本特徴作成部34は、学習信号の特徴ベクトルをベクトル量子化により分類する際、例えば、ベクトル量子化の符号語数がn個であれば、入力される学習特徴をn個の集合(以下、クラスタと呼ぶ)のいずれかに分類する。
そして、見本特徴作成部34は、各クラスタに所属する学習特徴の重心となる特徴を抽出して、抽出された学習特徴を見本特徴として出力する。
これにより、見本特徴作成部34は、抽出された見本特徴を見本特徴格納部35に記憶させるとともに、見本特徴間距離計算部36に対して、見本特徴のクラスタを出力する。
次に、見本特徴間距離計算部36は、見本特徴作成部34から入力されるすべての見本特徴において、全ての組合せの見本特徴間の距離、すなわち見本特徴間距離の計算を行う。
このとき、見本特徴間距離計算部36は、例えば、各見本特徴(特徴ベクトル)間の自乗誤差を計算し、計算結果を見本特徴間距離とすることができる。
そして、見本特徴間距離計算部36は、上述のように計算したすべての見本特徴の組合せ、すなわち見本特徴対毎の見本特徴間距離を見本特徴間距離格納部37に記憶する。
次に、蓄積特徴量子化部38は、見本特徴格納部35に記憶されている見本特徴のクラスタと、蓄積特徴抽出部1から送出された蓄積特徴のクラスタとを読み込み、クラスタ間において、各蓄積特徴と各見本特徴とを照合し、蓄積特徴毎に、見本特徴に対応した符号を一つ割り当てる。
このとき、蓄積特徴量子化部38は、符号を割り当てる処理の対象である一つの蓄積特徴に対し、すべての見本特徴との距離を計算し、例えば蓄積特徴と見本特徴との間の自乗誤差を計算し、この自乗誤差の計算結果により最も距離が近いと判断された見本特徴に対応した符号を、この蓄積特徴の符号とする。
ここで、蓄積特徴量子化部38は、例えば、見本特徴格納部35に記憶されている見本特徴の数がn個である場合、各見本特徴に1からnまでの番号を付与し、この番号を量子化の符号とする。
また、蓄積特徴量子化部38は、他の実施形態として、蓄積特徴と各見本特徴との距離(自乗誤差など)を計算し、最も距離が近い見本特徴との距離が、割り当てる程度に類似しているか否かの判定を行う閾値として設定された所定の割当閾値以下である場合、その見本特徴に対応した符号を、蓄積特徴に割り当て、上記割当閾値を超える場合、見本特徴格納部35に記憶されているいずれの見本特徴にも対応しない別の符号、例えば上記の符号を1〜nとして設定した例においては、n+1などの符号を割り当てるようにしても良い。
上述したように、蓄積特徴量子化部38は、蓄積特徴のベクトル量子化を蓄積映像の映像フレーム毎に行い、映像フレーム単位の蓄積量子化特徴とし、この蓄積量子化特徴を蓄積部分領域特徴抽出部2に対して出力する。
次に、蓄積部分領域特徴抽出部2は、蓄積特徴量子化部38から入力される蓄積量子化特徴に対し、注目窓を所定の間隔で複数設定し、注目窓内における符号の集合を蓄積部分領域特徴として抽出する。
つまり、蓄積部分領域特徴抽出部2は、すでに説明した第6の実施例と同様に注目窓を設定し、この設定された注目窓内に重複も隙間もなく小領域を配置し、この小領域に対応する符号を順に並べて特徴ベクトルとした蓄積部分領域特徴を抽出する。
次に、索引付与部3は、見本特徴格納部35から見本特徴のクラスタと、見本特徴間距離格納部37から見本特徴間距離を読み込む。
そして、索引付与部3は、読み込んだ上記見本特徴のクラスタと、見本特徴間距離とに基づいた、蓄積部分領域特徴連結部20から出力される蓄積連結特徴に対し、検索を容易にするための索引を付与する。
ここで、本実施例において、索引付与部3は、読み込んだ見本特徴のクラスタを用い、まず蓄積連結特徴を構成する各符号を、対応する見本特徴の特徴ベクトルに展開し、続いて第6の実施例と同様の手法(特許第3574075号)、すなわち、予め作成されたベクトル量子化符号帳により、蓄積連結特徴の特徴をベクトル量子化し、得られた符号を索引とする。
このとき、索引付与部3は、例えば、ベクトル量子化の符号語数がh個である場合、蓄積連結特徴をh個のクラスタのいずれかに分類することになる。
ここで、索引付与部3において、ベクトル量子化は、見本特徴間距離を用いて蓄積連結特徴ベクトルとクラスタ重心との距離を算出し、距離値が最小となるクラスタに蓄積連結特徴を所属させ、このクラスタに対応する符号語を出力することによって行われる。
また、索引付与部3における索引付与の方法に関する他の実施形態として、符号列を展開して作成した特徴ベクトルについて、第6の実施形態にて述べたR*−Tree及びSR−Treeといった多次元インデックス手法を用いても良い。
また、索引付与部3は、蓄積連結特徴を構成する符号列に対して、索引を付与することも可能である。
この場合、索引付与部3は、例えば、予めこれら蓄積連結特徴の基準となるテンプレート(特徴ベクトルのパターン)を複数作成しておき、このテンプレートと蓄積連結特徴とを比較し、蓄積連結特徴との距離(自乗距離など)が最も小さくなるテンプレートに対応する符号を、この蓄積連結特徴の索引としても良い。
さらに、他の実施形態として、索引付与部3は、M−Tree(“M-Tree: an efficient access method for similarity search in metric spaces”, P. Ciaccia 他二名, Proc. of VLDB Conference, pp.426-435, 1997)等に記載されているように、符号列の間に定義された任意の距離関数を用いて、蓄積連結特徴を構成する符号列に直接索引を付与することができる。
次に、目的特徴量子化部39は、上記蓄積特徴量子化部38と同様に、見本特徴格納部35に記憶されている見本特徴のクラスタ、及び目的特徴抽出部4から送出された目的特徴のクラスタを読み込む。
そして、目的特徴量子化部39は、蓄積特徴量子化部38と同様に、各目的特徴と読み込んだクラスタの各見本特徴との照合処理を行い、この照合結果により、目的特徴と照合すると判定された見本特徴に対応した符号を一つ割り当てる。
また、目的特徴量子化部39は、目的特徴の量子化を目的画像または目的映像の映像フレーム毎に行って目的量子化特徴とし、これを目的部分領域特徴抽出部5に対して出力する。
次に、目的部分領域特徴抽出部5は、目的特徴量子化部39から入力される目的量子化特徴に対し、すでに説明した蓄積部分領域特徴抽出部2で特徴抽出に用いた注目窓と同じ大きさの注目窓を、重複させて複数設定し、注目窓内における符号の集合を目的部分領域特徴として抽出する。
つまり、目的部分領域特徴抽出部5は、第6の実施例と同様にして設定された注目窓において、この注目窓内に重複も隙間もなく小領域を配置し、この小領域に対応する符号を順に並べて特徴ベクトルとした目的部分領域特徴が抽出される。
次に、索引検索部6は、目的部分領域特徴のクラスタに類似した蓄積連結特徴を、索引を用いて抽出する。
ここで、索引検索部6は、目的部分領域特徴のクラスタと、蓄積連結特徴との間の類似性を判定する特徴ベクトル間の距離の計算を行う。
すなわち、索引検索部6は、見本特徴間距離を用いて、蓄積連結特徴の特徴ベクトルと、目的部分領域特徴のクラスタ重心との距離を算出し、距離値が最小となるクラスタに蓄積連結特徴を所属させ、このクラスタに対応する符号語を出力することによって、類似性の判定を行う。ここで用いるクラスタ選択のアルゴリズムは、第6の実施例に記載されているため、詳細の説明を省略する。
第7の実施例において、類似度計算部200における距離計算は、索引検索部6と同様に見本特徴間距離を用いて処理されることになる。
すなわち、類似度計算部200における特徴照合部7は、ある蓄積連結特徴に類似する目的部分領域特徴が検出された場合、この蓄積連結特徴が帰属する蓄積量子化特徴(の集合)に、目的量子化特徴(目的画像または目的映像のフレームサイズ)と同じ大きさの照合窓を設定し、目的量子化特徴と蓄積量子化特徴における照合窓との類似度を計算する。
すなわち、特徴照合部7は、目的画像または目的映像に類似する部分映像が存在する可能性があると判断された、時間軸に連続した蓄積部分領域特徴の集合に対して、目的量子化特徴と同じ大きさの照合窓をそれぞれ設定し、目的量子化特徴と、蓄積量子化特徴上の照合窓における領域との類似度を求めることとなる。
<第8の実施例>
以下、本発明の第8の実施例による映像検索装置を図面を参照して説明する。図15は上記第8の実施例の映像検索装置の一構成例を示すブロック図である。
この図において、映像検索装置は、蓄積特徴抽出部1と、蓄積特徴連結部40と、索引付与部3と、索引格納部30と、目的特徴抽出部4と、索引検索部6と、一次照合部201及び二次照合部202からなる類似度計算部300とで構成されており、検索対象の目的画像が入力されることにより、既に登録されている蓄積映像の中から、上記目的画像と類似する映像フレームあるいはその一部分の探索を行い、探索結果として、上記目的画像と類似する画像が含まれている蓄積映像中の映像フレーム内の位置情報を出力する。
蓄積特徴抽出部1は、蓄積映像の各映像フレームから、映像フレームを表現する蓄積特徴(特徴ベクトル)を、映像フレーム全体、または所定の画素数からなるブロック単位に抽出する。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力される蓄積特徴に対し、予め設定された所定の大きさの注目窓を所定の間隔で複数設定し(所定の間隔でずらし)、各注目窓の範囲に含まれる蓄積特徴を、蓄積部分領域特徴として抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から出力される蓄積部分領域特徴を、それぞれに位置的に近いものを時間軸方向に順次連結し、各連結ブロック内の特徴である蓄積連結特徴を導く。
索引付与部3は、上記蓄積部分領域特徴連結部20から出力される各蓄積連結特徴を各々ベクトル量子化し、ベクトル量子化の符号語を、標識のための索引として、各蓄積連結特徴それぞれに対して付与する。
索引格納部30は、上記索引付与部3の出力する索引を格納する。
目的特徴抽出部4は、目的画像、または目的映像の各映像フレームから目的特徴(特徴ベクトル)を抽出する。
蓄積特徴連結部40は、蓄積特徴抽出部1で抽出された蓄積特徴を用い、この蓄積特徴を時間方向において、蓄積特徴における特徴ベクトルの距離の近い蓄積特徴を連結させた特徴である蓄積連結特徴を作成する。
索引検索部6は、上記索引付与部3から出力される索引を用いて、上記蓄積特徴連結部40の抽出した目的特徴の集合に対して類似する蓄積連結特徴を、索引を用いて検出する。
また、索引検索部6は、上記索引により類似する蓄積連結特徴が検出された場合、この検出した蓄積連結特徴を類似度計算部300に送出し、一方、何も検出されなかった場合、この処理において映像検索処理を終了する。
類似度計算部300において、各構成により、目的特徴と索引検索部6で検出された類似する可能性のある蓄積連結特徴との距離を逐次計算し、部分領域における類似性が確認された場合に、蓄積画像と目的画像との全体的な類似度を所定の検索閾値から計算する。
そして、類似度計算部300は、索引検索部6により検出された全ての蓄積連結特徴について照合が終了した場合、その照合結果を出力し、映像検索処理を終了する。
次に、第8の実施例における映像検索装置における各構成の詳細な説明を行う。
蓄積特徴抽出部1は、与えられた蓄積映像を読み込んで入力し、蓄積映像から映像フレームごとに蓄積特徴を抽出する。
このとき、蓄積特徴抽出部1は、入力された蓄積映像の各フレームから、小領域(横bxピクセル、縦byピクセル)を縦横1ピクセルずつずらしながら取り出し、各小領域におけるRGB(Red,Green,Blueの3原色)各色の画素について平均値を計算する。ここで、蓄積特徴は小領域内のRGBそれぞれの平均画素値からなる3次元ベクトルからなる特徴ベクトルにより表現される。
また、蓄積特徴抽出部1における映像信号の特徴抽出方法には、上述した各小領域のRGB各々に対して公知のディジタル画像圧縮技術である2次元DFT(離散フーリエ変換)、2次元DCT(離散コサイン変換)、あるいは2次元DWT(離散ウェーブレット変換)を施し、その係数ベクトルを利用する方法もある。
さらに他の実施形態として、入力された蓄積映像から小領域(横bxピクセル、縦byピクセル、時間方向btフレーム)を縦横1ピクセルずつ、時間方向1フレームずつずらしながら取り出し、各小領域のRGB各々に対して公知のディジタル映像処理技術である3次元DCTを施し、その係数ベクトルを利用する方法もある。
なお、本実施例においては、上述の小領域をユニットとして特徴抽出を行ったが、小領域を画素(1ピクセル、すなわちbx=by=bt=1)とみなし、蓄積映像の各フレームにおけるRGB画素値をそのまま用いてもかまわない。
蓄積特徴抽出部1は、上述したように、各映像フレームにおいて抽出した蓄積特徴の集合を、蓄積部分領域特徴抽出部2に出力する。
そして、蓄積部分領域特徴抽出部2は、蓄積特徴抽出部1から入力される蓄積特徴の集合に対し、注目窓を所定の間隔にて複数設定し、注目窓内の特徴である蓄積部分領域特徴を抽出する。
上記注目窓は、例えば、横wxピクセル×縦wyピクセルとして設定され、図3に示されるように、蓄積映像の映像フレーム内において、縦及び横方向に上記所定の間隔(各注目窓の同一の辺同士の間隔であり、例えば左辺同士、上辺同士の間隔として、横方向にmピクセル、縦方向にmピクセル)で配置する。注目窓の配置間隔を本発明ではマージンと呼ぶことにする。
蓄積特徴連結部40は、蓄積特徴抽出部1から入力される蓄積特徴の集合について、時間軸方向に連続する蓄積部分領域特徴を所定の基準で連結し、各連結ブロック内の特徴である蓄積連結特徴を導き、索引付与部3へ出力する。
また、蓄積特徴抽出部1は、データベース等に登録されている蓄積映像を読み込んで入力し、入力した蓄積映像から蓄積特徴を抽出し、各映像フレームにおいて抽出した蓄積特徴の集合を、蓄積特徴連結部40へ出力する。
ここで、蓄積特徴抽出部1は、他の実施形態として、例えば、以下に述べる蓄積特徴点抽出処理部1Aと蓄積局所特徴抽出処理部1Bとから構成しても良い。
上記蓄積特徴点抽出処理部1Aにおいては、蓄積映像の各フレーム(映像フレーム)から、ある種の変動に対して頑健な点である蓄積特徴点を抽出する。
例えば、スケール変化や見えの(見た目における構成の若干の)違いなどの幾何学変動に対して頑健な手法として、以下の文献1( “Distinctive image features from scale-invariant keypoints”, D.G.Lowe, International Journal of Computer Vision, Vol.60, No.2, pp.91-110, 2004)、又は文献2(”Scale & Affine invariant interest point detectors”, K.Mikolajczyk 他1名, International Journal of Computer Vision, Vol.60, No.1, pp.63-86, 2004)に記載の方法を用いることができる。
本実施例においては、上記いずれの手法を用いることも可能であるが、一例として、文献2に記載されている蓄積特徴点の抽出方法について簡単に説明する。
まず、蓄積特徴点抽出処理部1Aは、元の映像フレームから既知の方法によりスケールスペース画像を作成し、各スケールから蓄積特徴点の候補である候補点を抽出する。
ここで、スケールスペース画像とは、元画像を一定の比率βにより順次縮小した大きさの異なる(すなわち画素数の異なる)複数画像の集合を指している。
上記候補点の抽出には、例えば、以下の(20)式で定義される正規化Harris operator h(x,y,σ)を用いる。
Figure 2006060796
ただし、この(20)式において、La(ここで、a=x又はy)は、a方向(x方向またはy方向)の微分操作であり、σは定数である。
そして、蓄積特徴点抽出処理部1Aは、スケールスペース画像において、各スケールの画像におけるHarris operator h(x,y,σ)の極大点となる画素を、頑健な点である蓄積特徴点の抽出対象の候補である候補点として抽出する。
次に、蓄積特徴点抽出処理部1Aは、抽出された上記候補点(各スケールの画像に複数存在)について、候補点の抽出されたスケール及びその前後のスケールの画像を用いて、以下の(21)式で定義される正規化Laplacian operator LoG(x,y,z)を計算する。
ただし、以下の(21)式において、Laa(ここで、a=x又はy)はa方向(x方向またはy方向)の2回微分操作である。
Figure 2006060796
これにより、スケール方向の各スケールの画像において、評価対象の候補点のあるスケールの画像に対して、このスケールの画像の候補点と、前後のスケールの画像の画素とに対して正規化Laplacian operator を計算し、前後のスケールの画像の画素に対して、上記候補点でのLaplacian operatorの値が極大となっているとき、この候補点を蓄積特徴点として採用する。ここで、例えば、評価対象の候補点のあるスケールの画像に対して、前のスケールが大きく、後のスケールが小さいとする。
この各スケールの画像における正規化Laplacian operatorの比較を行う場合、評価対象の候補点がある画像のスケールに対し、前後のスケールの画像を対応させ、各スケールの画像の画素数を変化させずに、縮小または拡大を行うことでスケールを変化させ、評価対象の候補点と、最も近い位置にある、スケールを変化させた前後の画像の画素との正規化Laplacian operatorの比較を行う。
次に、蓄積局所特徴抽出処理部1Bにおいては、上記蓄積特徴点抽出処理部1Aにより抽出された蓄積特徴点を用い、この蓄積特徴点周辺の局所領域にて特徴を抽出し、これを蓄積特徴とする。
この局所領域は、座標(x、y)の画素に対して、下記(22)式におけるΣの上部に記載された定数h(x方向の画素数)及びh(y方向の画素数)で規定される領域を示している。
上記蓄積特徴としては、例えば、蓄積特徴点周辺のgradient(勾配)、蓄積特徴点周辺の局所領域で計算したgradientのヒストグラム、ガウシアンフィルタ係数の高次微分を係数とするフィルタの出力(Gaussian derivative)、あるいは以下の(22)式の特徴関数などを用いることができる。この(22)式において、D(x,y)は、映像フレームD上の座標(x、y)におけるピクセル値である。
Figure 2006060796
ここで、蓄積特徴連結部40は、第6の実施例における蓄積部分領域特徴連結部2とほぼ同様の機能を有しているが、蓄積部分領域特徴の代わりに、上記蓄積特徴抽出部1で抽出された蓄積特徴を用い、この蓄積特徴を時間方向において、蓄積特徴における特徴ベクトルの距離の近い蓄積特徴を連結させた特徴である蓄積連結特徴を作成する。
さらに、他の実施形態として、例えば、以下に示すように、蓄積特徴抽出部1における処理と、蓄積特徴連結部40との処理を、映像フレームごとに繰り返して実行し、逐次、特徴抽出と特徴連結との処理を行う方法もある。
すなわち、まず、蓄積特徴連結部40は、連結を開始するある蓄積特徴点がある場合、次に、時間軸に連続する次の映像フレーム上に、該蓄積特徴点p(D)=(x,y)を中心とする、以下の(23)式に示すガウス分布を設定する。
この(23)式において、αは連結する特徴点の座標位置の範囲を規定する定数であり、大きくすることにより連結する特徴点の座標位置の範囲を広げて連結し易くし、一方、小さくすることにより連結する特徴点の座標位置の範囲を狭めて連結を制限することとなる。
Figure 2006060796
そして、蓄積特徴点抽出処理部1Aは、この(23)式に示すガウス分布を、次の映像フレームにおける蓄積特徴点抽出処理におけるHarris operatorの重み付けに利用し、次の映像フレームの蓄積特徴点が現在の映像フレームの近傍領域の外で検出が行われにくくなる処理を加える。
すなわち、蓄積特徴点抽出処理部1Aは、重み付き正規化Harris operator h~(x,y,σ)を以下に示す(24)式のように定義し、すでに述べた(重みなし)正規化Harris operatorに代わって、重み付きHarris operatorに基づいて連結する特徴点の候補を抽出する。
Figure 2006060796
そして、上述したように、蓄積特徴点抽出処理部1Aが上記重み付き正規化Harris operatorを利用して、特徴点候補及び蓄積特徴点を抽出すると、蓄積特徴連結部40は、前の映像フレームにおける各蓄積特徴点について、該蓄積特徴点から最も近い場所にある、現在の映像フレームにおける蓄積特徴点と連結する。
このように、蓄積特徴抽出部1と蓄積特徴連結部40とが、上述した処理を時間軸方向に再帰的に繰返すことにより、蓄積映像のフレーム数だけ蓄積特徴を連結することができる。
このとき、最も近い場所にある蓄積特徴点と必ず連結する構成の他に、例えば、連結するか否かを判定するため、Harris operatorに対して連結閾値を設定し、前の映像フレームの蓄積特徴点と、現在の映像フレームの蓄積特徴点とのHarris operatorが上記所定の連結閾値を下回る場合にのみ連結する構成も可能である。
ここで、連結閾値は小さくすることにより、特徴点としての特徴をより強めることができ、一方、大きくするに従い曖昧な特徴をも許容することとなり、本実施形態を使用するアプリケーション毎に実験値として求めて設定される。
また、蓄積特徴連結部40の連結処理において、すでに時間軸方向に連結されている蓄積特徴において、対象となるフレームに対して、この時間軸方向に対して逆方向に連続する所定数(予測を精度の高いものとするため、直前を含めた近い過去の映像フレーム)の映像フレームにて連結された蓄積特徴点の座標点の移動量を平均し、この平均値を予測値として、予測値の分だけガウス分布の中心の蓄積特徴点の座標をシフトさせる構成も可能である。
すなわち、蓄積特徴連結部40は、過去の映像フレーム間における連結された蓄積特徴点の座標の移動量の平均値から、現在のフレームにおける連結するか否かの判定を行う対象の蓄積特徴の座標の線形予測をおこなっている。
索引付与部3は、第6の実施例における構成とほぼ同様であり、蓄積特徴連結部40の出力する蓄積連結特徴に対して索引を付与する。
すなわち、索引付与部3は、蓄積特徴連結部40から出力された蓄積連結特徴に対し、以下に示すように、検索を容易にするための索引を付与する。
本実施例においては、特許文献(特許第3574075号「信号検出方法、信号検出装置、記録媒体及びプログラム」)に記載された手法を用い、予め作成されたベクトル量子化符号帳により蓄積連結特徴の特徴ベクトルをベクトル量子化し、得られた符号を索引とする。上記符号と、この符号に対応した見本特徴としての特徴ベクトルとの対応がベクトル量子化符号帳に記載されており、例えば、ベクトル量子化の符号語数(符号の数)がC個(C個のクラスタ)であれば、蓄積連結特徴は特徴ベクトルの距離がより近い、見本特徴の符号に振り分けられ、C個のクラスタのいずれかに分類されることになる。
ここで、ベクトル量子化は、例えば自乗誤差を距離関数として用い、蓄積連結特徴ベクトルとクラスタ重心との距離を算出し、距離値が最小となるクラスタに蓄積連結特徴を所属させ、このクラスタに対応する符号語を出力することによって行われる。
索引付与の方法に関する他の実施形態として、例えば、R*−Tree(“The R*-Tree: an efficient and robust access method for points and rectangles”, N. Beckman 他一名, Proc. of ACM SIGMOD Conference, pp.322-331, 1990)や、SR−Tree(”SR-Tree: 高次元データに対する最近接探索のためのインデックス構造の提案“, 片山紀生 他一名, 電子情報通信学会論文誌 D-I, Vol. J80-D-I, No.8, pp.703-717, 1997 Aug)などは、多次元インデックス手法と総称される手法である。
これらの手法は、特徴の存在する多次元空間内で特徴を包含する領域を階層的に作成し、作成されたなかで最下層の領域と特徴とを対応づけることにより索引を付与している。
この特徴を包含する上記領域は、R*−Treeであれば3次元空間における直方体に相当する超直方体であり、SR−Treeであれば超直方体と、3次元空間における球に相当する超球との重なりとなる。
上述したように、索引付与部3は、付与した索引を索引検索部6へ直接送信するか、または一旦索引格納部30へ登録するか、いずれかの処理を行う。
すなわち、映像検索装置が、目的画像または目的映像、及び蓄積映像を同時に読み込み、リアルタイムで検索を行うアプリケーションの場合、索引付与部3は索引を索引検索部6へ送出し、一方、それ以外の場合、索引格納部30へ蓄積映像ごとに索引の登録処理を行う。
目的特徴抽出部4は、ユーザから与えられた目的画像を読み込んで入力し、読み込んだ目的画像から、第6の実施形態と同様に目的特徴を抽出する。
すなわち、目的特徴抽出部4は、例えば、すでに説明した蓄積特徴抽出部1と同様にして、特徴点抽出処理部4Aと局所特徴抽出処理部4Bとによって構成される処理により、目的画像より目的特徴を抽出する。
また、目的特徴抽出部4は、目的画像、または目的映像を読み込む。このとき、読みこまれる目的画像または目的映像の映像フレームの大きさは、縦qピクセル、横qピクセルで、図3におけるマージンと注目窓サイズとの和(合計)以上、すなわちq≧w+m及びq≧w+mであれば、蓄積映像中の各映像フレームについて、大きさq×qピクセルの窓を任意の位置に配置しても必ず1つ以上の蓄積部分領域を含むので、検出漏れを生じることはない。
次に、目的特徴抽出部4は、すでに述べた蓄積特徴抽出部1と同様に、目的画像または目的映像に小領域を設定し、小領域を縦横1ピクセルずつ(時間方向にずらす必要がある場合には、時間方向に1フレームずつ)ずらしながら各小領域における特徴を抽出する。
あるいは、蓄積特徴抽出部1において他の特徴抽出手段を用いる場合には、目的特徴抽出部4は、これと同様の手法で特徴抽出を行う。
目的特徴抽出部4は、目的特徴(特徴ベクトル)の集合を索引検索部6へ出力する。
そして、索引検索部6は、蓄積連結特徴に付与された索引を用い、蓄積連結特徴から上記目的特徴に類似する蓄積特徴である検索候補特徴を抽出する。
索引検索部6は、目的特徴抽出部4から入力される目的特徴の集合、および索引付与部3から索引を読み込む。
また、索引検索部6は、目的画像または目的映像、及び蓄積映像を同時に入力してリアルタイムに類似を判定する場合以外、索引格納部30から順次索引を読み出して、目的部分領域特徴と比較を行う。
そして、索引検索部6は、読み込んだ上記索引を用い、目的特徴の集合に類似した蓄積連結特徴の検索を行う。
このとき、索引検索部6は、目的特徴の集合内におけるいずれかの目的特徴に対し、距離値が、所定の閾値である選択閾値θ2を下回る蓄積連結特徴を索引から抽出する。
上記距離計算は、後述する類似度計算部300で行われる処理と同様である。すなわち、上記距離値は、例えば特徴ベクトル間の距離関数とし、自乗誤差により計算することができる。
ここでの具体的な検索方法は、上記索引付与部3において付与された索引の種類によって異なり、それぞれの文献に記載されている手法を用いることで索引検索を行う。
例えば、テンプレートを用いた量子化によって索引を付与した場合、すなわち特許第3574075号に記載された手法により索引を付与した場合、以下のようにして所望の蓄積連結特徴である検索候補特徴を抽出することができる。
すなわち、索引検索部6は、目的特徴と、索引付与部3で作成された索引(クラスタを示す符号)と、選択閾値θ2とを読み込む。
次に、索引検索部6は、目的部分領域特徴と各クラスタ重心との距離を計算し、この計算結果の距離値が選択閾値θ2を下回るクラスタを選択することにより、このクラスタに所属する蓄積連結特徴をすべて抽出する。
上述した索引検索部6が行うクラスタ選択の原理は以下のように説明されるものである。
図4は、点Q、C、Cの3点が乗るような平面であり、特徴ベクトルが配置される特徴空間を切り出した様子を示している。
ここで、点Qは目的特徴、Cは目的特徴Qが所属しているクラスタのクラスタ重心、Cは他のクラスタのクラスタ重心を表しており、距離dQ1、dQ2、d12は、それぞれ、点Qと点Cとの距離、点Qと点Cとの距離、点Cと点Cとの距離を示している。
ここで、目的特徴の座標である点Qからの距離dが、選択閾値θ2以内である蓄積連結特徴を抽出しなければならないとすると、点Qを中心とする半径θ2の超球(図4においては円)の内部にある蓄積連結特徴がそれに該当することになる。
そして、点Qを中心とする超球の半径(すなわち選択閾値θ2)が、図4における距離dθより大きくなったとき、点Cに対応するクラスタに所属する蓄積連結特徴のみならず点Cに対応するクラスタの中にも、所望の蓄積連結特徴が含まれている可能性がある。
このため、選択閾値θ2が図4における距離dθより大きくなったとき、そのクラスタを選択する。dθは、上述した(13)式より導かれる(14)式から求められる。
さらに、蓄積連結特徴に対応する連結最大差分値を考慮して、索引検索部6は、すでに述べた(15)式が成り立つとき、点C2に対応するクラスタを選択し、そのクラスタに属する蓄積連結特徴のすべてを抽出する。
上記(15)式において、r'は、点C2に対応するクラスタに所属する蓄積連結特徴の連結最大差分値について、そのクラスタ内最大値をとったものである。
そして、索引検索部6は、上述した手順を、目的特徴Qの所属するクラスタを除くすべてのクラスタに対して行い、抽出された目的特徴に類似する可能性のある蓄積連結特徴を類似度計算部300に対して出力する。ここで、目的特徴に類似する可能性のある蓄積連結特徴の集合をFとする。
一方、索引検索部6は、目的特徴に類似する可能性のある蓄積連結特徴が検出されなかった場合、映像検索装置における検索処理をここで終了する。
また、類似度検索部200は、上記索引検索部6から出力された検索候補特徴と、目的特徴との類似値である部分類似値を計算する一次照合部201と、該部分類似値を用いて蓄積画像と目的画像との類似値である全体類似値を計算する二次照合部202とから構成されている。
上記一次照合部201は、検索候補特徴と目的特徴との類似値である部分類似値を計算する。ここで、一次照合部201は、この部分類似値として、例えば、検索候補特徴と目的特徴との、すなわち検索候補特徴の特徴点と目的特徴の特徴点との自乗距離を計算して出力する。
そして、一次照合部201は、該部分類似値が前述の選択閾値θを下回る(未満)ことを検出すると、検索候補特徴と目的特徴との類似性があると判定する。
次に、一次照合部201は、スケールスペース画像毎に、各スケールの画像を、縮小する前の原画像の大きさに、画素数を変化させずに拡大し、原画像に拡大した各スケールの画像を重ね合わせる。
このとき、一次照合部201は、重ね合わせた各スケールの蓄積特徴点に対し、原画像における最も近くにある画素を蓄積特徴点とし、スケールの要素を持たない位置情報のみの蓄積特徴点とする。
二次照合部202は、蓄積画像Dと目的画像Qとの類似値、すなわち画像間の類似値として全体類似値の計算を行う。上記全体類似値S(D、Q)は、例えば、以下の(25)式に示すように定義する。この(25)式において、d(f,f)は上記一次照合部201が計算した部分類似値であり、γは定数である。
この定数γは、類似とするか否かを判定する基準を調整するものであり、小さくすることにより、より近い特徴を有する類似であるとする精度の高い類似を行うことができ、大きくすることにより、ある程度類似したものも類似しているとする精度の低い評価を行うこととなる。
Figure 2006060796
上記(25)式は、目的画像Qの各目的特徴fに対して最もd(f,f)が小さくなる蓄積特徴fを抽出し、それらを類似尺度に換算して加算することにより全体類似値を求めることを示している。
ただし、二次照合部202は、d(f,f)が選択閾値θを下回る蓄積特徴が検出されない(蓄積画像中に1つも存在しない)場合、その目的特徴に対する加算を行わない。
そして、二次照合部202は、最終的に、加算結果の全体類似値が検索閾値θ以上であることを検出した場合、目的画像に類似する部分領域が蓄積画像中に存在していると判定する。
蓄積画像中の上記部分領域は、例えば、各目的特徴とのd(f,f)が最も小さくなる蓄積特徴に対して、この蓄積特徴に対応する蓄積画像中の点を覆う最小の方形とする。
本実施例においては、第6及び第7の実施例とは異なり、選択閾値θと検索閾値θとは独立に決定される値である。
以下、図15及び図16を用いて、本第8の実施例により映像検索装置の動作を説明する。図16は、第8の実施例の映像検索装置の動作例を示すフローチャートである。
まず、蓄積特徴点抽出処理部1Aは、上記(23)式に示すガウス分布を、次の映像フレームにおける蓄積特徴点抽出処理におけるHarris operatorの重み付けに利用し、重み付き正規化Harris operator h~(x,y,σ)を(24)式ように定義し、重み付きHarris operatorに基づいて連結する特徴点の候補を抽出する(S702)。
次に、蓄積特徴点抽出処理部1Aは、抽出された上記候補点について、候補点の抽出されたスケール及びその前後のスケールの画像を用いて、上記(21)式で定義される正規化Laplacian operator LoG(x,y,z)を計算する。
そして、蓄積特徴点抽出処理部1Aは、スケール方向の各スケールの画像において、評価対象の候補点のあるスケールの画像に対して、このスケールの画像の候補点と、前後のスケールの画像の画素とに対して正規化Laplacian operator を計算し、前後のスケールの画像の画素に対して、上記候補点でのLaplacian operatorの値が極大となっているとき、この候補点を蓄積特徴点として採用する(S703)。
次に、蓄積局所特徴抽出処理部1Bは、上記蓄積特徴点抽出処理部1Aから入力される蓄積特徴点を用い、例えば、この蓄積特徴点周辺の局所領域で計算したgradientのヒストグラムを特徴として抽出し、これを蓄積特徴(蓄積局所特徴)とする(S704,S705)。
次に、蓄積特徴連結部40は、上記蓄積特徴抽出部1で抽出された蓄積特徴を用い、この蓄積特徴を時間方向において、蓄積特徴における特徴ベクトルの距離の近い蓄積特徴を連結させた特徴である蓄積連結特徴の作成を、映像フレームごとに繰り返して実行し、逐次、特徴抽出と特徴連結との処理を行い(S706)、処理結果として蓄積連結特徴を出力する(S707)。
そして、蓄積特徴連結部40は、入力された蓄積映像の全ての映像フレームに対する処理が終了したか否かを検出し、全ての映像フレームに対する処理が終了したことを検出した場合、処理をステップS709へ進め、全ての映像フレームに対する処理が終了していないことを検出した場合、処理を継続するために処理をステップS701へ戻す(S708)。
次に、索引付与部3は、蓄積特徴連結部40の出力する蓄積連結特徴に対して索引を付与し(S709)、索引格納部30または類似度計算部300へ出力する(S710)。
また、この時点において、目的特徴抽出部4は、ユーザから与えられた目的画像を読み込んで入力し、読み込んだ目的画像から、すでに説明した蓄積特徴抽出部1と同様にして、特徴点抽出処理部4Aと局所特徴抽出処理部4Bとによって構成される処理により、目的画像より目的特徴を抽出している。
次に、索引検索部6は、蓄積連結特徴に付与された索引を用い、蓄積連結特徴から上記目的特徴に類似する蓄積特徴である検索候補特徴を抽出する(S711)。
このとき、索引検索部6は、全ての蓄積連結特徴から目的特徴に類似する検索候補特徴が検出されない場合、処理をステップS716へ進め、検出された場合、処理をステップS731へ進める(S712)。
次に、一次照合部201は、検索候補特徴と目的特徴との類似値である部分類似値を計算する。
すなわち、一次照合部201は、この部分類似値として、例えば、検索候補特徴と目的特徴との、すなわち検索候補特徴の特徴点と目的特徴の特徴点との自乗距離を計算して、特徴点間距離として出力する(S713)。
そして、一次照合部201は、該部分類似値が前述の選択閾値θを下回る(未満)か否かの判定を行い、下回ることを検出すると、検索候補特徴と目的特徴との類似性があると判定し、処理をステップS715へ進め、一方、部分類似値が選択閾値θ以上であることを検出すると、検索候補特徴と目的特徴との類似性がないと判定して、処理をステップS716へ進める(S714)。
次に、一次照合部201は、スケールスペース画像毎に、各スケールの画像を、縮小する前の原画像の大きさに、画素数を変化させずに拡大し、原画像に拡大した各スケールの画像を重ね合わせ、スケールの要素を持たない位置情報のみの蓄積特徴点とする。
そして、二次照合部202は、蓄積画像Dと目的画像Qとの類似値、すなわち画像間の類似値として全体類似値の計算を、上記(25)式により行う(ステップS715)。
次に、二次照合部202は、(25)式により求められた全体類似値が検索閾値θ以上であるか否かの検出を行い、(25)式による加算値が検索閾値θ以上であることを検出した場合、目的画像に類似する部分領域が蓄積画像中に存在していると判定し、部分領域が存在していると判定した蓄積画像を出力し、一方、加算値が検索閾値θ未満であることを検出した場合、目的画像に類似する部分領域が蓄積画像中に存在していないことを通知する(S716)。
なお、図1,6,8,10,12,14.15における映像検索装置の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、部分画像の検索処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
本発明の第1または第2の実施例による部分画像検索装置の構成例を示すブロック図である。 図1の部分画像検索装置の動作例を示すフローチャートである。 蓄積画像において部分画像を設定する際に、配置のマージンについて説明する概念図である。 索引検索部6がクラスタを選択するときの原理を説明する概念図である。 蓄積画像における照合窓の設定を説明する概念図である。 本発明の第3の実施例による部分画像検索装置の構成例を示すブロック図である。 図6の部分画像検索装置の動作例を示すフローチャートである。 本発明の第4の実施例による部分画像検索装置の構成例を示すブロック図である。 図8の部分画像検索装置の動作例を示すフローチャートである。 本発明の第5の実施例による部分画像検索装置の構成例を示すブロック図である。 図10の部分画像検索装置の動作例を示すフローチャートである。 本発明の第6の実施例による部分画像検索装置の構成例を示すブロック図である。 図12の部分画像検索装置の動作例を示すフローチャートである。 本発明の第7の実施例による部分画像検索装置の構成例を示すブロック図である。 本発明の第8の実施例による部分画像検索装置の構成例を示すブロック図である。 図15の部分画像検索装置の動作例を示すフローチャートである。
符号の説明
1…蓄積特徴抽出部 2…蓄積部分領域特徴抽出部 3…索引付与部
4…目的特徴抽出部 5…目的部分領域特徴抽出部 6…索引検索部
7…特徴照合部 8…照合結果判定部 9…特徴再照合部
10…照合結果再判定部 11…検索結果候補選択部
12…次目的部分領域特徴選定部 13…次連結特徴選定部
14…検索閾値更新部 15…目的代表特徴抽出部
16…目的部分領域間距離計算部 17…周辺距離下限値計算部
20…蓄積部分領域特徴連結部 30…索引格納部
31…検出結果判定部 32…検出結果再判定部
33…検出結果候補選択部 34…見本特徴作成部
35…見本特徴格納部 36…見本特徴間距離計算部
37…見本特徴間距離格納部 38…蓄積特徴量子化部
39…目的特徴量子化部 40…蓄積特徴連結部
100,200,300…類似度計算部
201…一次照合部 202…二次照合部

Claims (19)

  1. 予め登録された動画像である蓄積映像から、検索対象となる静止画像である目的画像に類似した映像フレームあるいはその一部分を検出する映像検索方法において、
    蓄積映像のある映像フレームの特徴である蓄積特徴を抽出する蓄積特徴抽出過程と、
    前記蓄積特徴抽出過程で抽出される蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結過程と、
    前記蓄積連結特徴に各々索引を付与する索引付与過程と、
    目的画像の特徴である目的特徴を抽出する目的特徴抽出過程と、
    前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索過程と、
    前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合段階と、前記目的画像と前記蓄積映像中の映像フレームあるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合段階とからなる類似度計算過程と
    を備えることを特徴とする映像検索方法。
  2. 予め登録された動画像である蓄積映像から、検索対象となる動画像である目的映像に類似した映像区間あるいはその一部分を検出する映像検索方法であり、
    前記蓄積映像から蓄積特徴を導く蓄積特徴抽出過程と、
    前記蓄積特徴抽出過程で抽出される蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結過程と、
    前記蓄積連結特徴に各々索引を付与する索引付与過程と、
    目的映像の特徴である目的特徴を抽出する目的特徴抽出過程と、
    前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索過程と、
    前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合段階と、前記目的映像と前記蓄積映像の映像区間あるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合段階とからなる類似度計算過程と、
    を備えることを特徴とする映像検索方法。
  3. 前記蓄積特徴にて所定の大きさの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、
    前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程と
    をさらに有し、
    前記蓄積連結過程にて、前記蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
    前記類似度計算過程が、
    前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、
    該距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程と
    からなる一次照合段階と、
    前記照合結果判定過程にて、目的画像と類似する映像フレームの一部分が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的画像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、
    前記特徴距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在するか否かを判定する照合結果再判定過程と
    前記照合結果再判定過程にて、目的画像と類似する映像フレームの一部分が存在すると判定された蓄積映像中の箇所を検索結果候補とする検索結果候補選択過程と、
    前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、
    前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程と
    からなる二次照合段階と
    を備えることを特徴とする請求項1記載の映像検索方法。
  4. 前記蓄積特徴にて所定の大ききの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、
    前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程と
    をさらに有し、
    蓄積特徴連結過程にて、蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて、前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
    前記類似度計算過程が、
    前記索引検索過程にて抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、
    該距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程と
    からなる一次照合段階と、
    該照合結果判定過程にて目的映像と類似する部分映像区間が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的映像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、
    前記特徴距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する否かを判定する照合結果再判定過程と、
    前記照合結果再判定過程にて、目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、検索結果候補とする検索結果候補選択過程と、
    前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、
    前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程と
    からなる二次照合段階と
    を備えることを特徴とする請求項2記載の映像検索方法。
  5. 前記蓄積特徴連結過程において、前記蓄積特徴抽出過程にて抽出された蓄積特徴を、予め与えられた長さの分だけ時間軸方向に連結することを特徴とする請求項1から請求項4のいずれかに記載の映像検索方法。
  6. 前記蓄積特徴連結過程において、連結する対象となる前記蓄積特徴間の差分の最大値が予め定められた閾値である連結閾値を上回るまで時間軸方向に連結することを特徴とする請求項1から請求項4のいずれかに記載の映像検索方法。
  7. 前記照合結果再判定過程において、前記特徴再照合過程で導かれた距離と、前記距離に対応する閾値である検索閾値とを比較することにより、目的画像と類似する映像フレームの一部分または目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在するか否かが判定され、
    前記索引検索過程において、いずれかの前記目的特徴との距離が、前記検索閾値から決定される選択閾値を下回る蓄積連結特徴を前記索引により抽出し、
    前記照合結果判定過程において、前記距離と前記選択閾値とを比較することにより、目的画像と類似する映像フレームの一部分または目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定することを特徴とする請求項3から請求項6のいずれかに記載の映像検索方法。
  8. 前記二次照合過程において、目的画像と類似する映像フレームの一部分あるいは目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、前記特徴距離が小さい順に、予め定められた数量だけ選択して検索結果候補とし、
    該検索結果候補から、前記特徴距離に基づいて、ある候補を検出し、該候補の距離値を新たに検索閾値として設定する検索閾値更新過程と
    をさらに備えることを特徴とする請求項7に記載の映像検索方法。
  9. 前記索引検索過程において、前記目的特徴抽出過程にて導かれた全ての目的特徴を用いて、候補を抽出することを特徴とする請求項1から請求項8のいずれかに記載の映像検索方法。
  10. 前記目的部分領域特徴抽出過程で導かれた目的部分領域特徴を分類し、各分類を代表する部分領域特徴である代表特徴を抽出する目的代表特徴抽出過程と
    をさらに備え、
    前記索引検索過程において、前記目的部分領域特徴に替え、前記目的部分領域特徴抽出過程で導かれた各代表特徴を用いることを特徴とする請求項3から請求項8のいずれかに記載の映像検索方法。
  11. 前記次目的部分領域特徴選定過程において、蓄積部分領域特徴との距離が選択閾値を超えることが検出された、前記目的部分領域特徴抽出部にて抽出された目的部分領域特徴を、次に照合すべき部分領域特徴として指定せずに省略することを特徴とする、請求項3から請求項10のいずれかに記載の映像検索方法。
  12. 前記目的部分領域特徴の集合において、各目的部分領域特徴間の距離値を計算する目的部分領域特徴間計算過程と、
    前記特徴照合過程において計算されたある目的部分領域特徴と蓄積連結特徴との間の距離値と、前記目的部分領域特徴間の距離値とを用いて、該蓄積連結特徴と照合を行う残りの目的部分領域特徴について距離下限値を更新する周辺下限値計算過程と
    をさらに有し、
    前記次目的部分領域特徴選定過程に置いて、前記距離下限値と選択閾値とを比較し、距離下限値が選択閾値を下回る目的部分領域特徴を、次に照合すべき目的部分領域特徴として指定する
    ことを特徴とする請求項11に記載の映像検索方法。
  13. 見本となる特徴パターンである見本特徴を複数種類作成する見本特徴作成過程と、
    前記見本特徴間の距離を計算する見本特徴間距離計算過程と
    前記蓄積特徴抽出過程において抽出された前記蓄積特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される蓄積量子化特徴を導く蓄積特徴量子化過程と、
    前記目的特徴抽出過程において抽出された前記目的特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される目的量子化特徴を導く目的特徴量子化過程と
    をさらに備え、
    前記索引付与過程が前記見本特徴間距離に基づき前記蓄積特徴あるいは前記蓄積部分領域特徴に索引を付与し、
    前記索引検索過程ならびに前記類似度計算過程において前記目的特徴と前記蓄積連結特徴との類似値を前記見本特徴間距離を用いて逐次計算する、あるいは前記索引検索過程ならびに前記特徴照合過程において前記目的部分領域特徴と前記蓄積連結特徴との距離を前記見本特徴間距離を用いて逐次計算することを特徴とする請求項1から請求項12のいずれかに記載の映像検索方法。
  14. 予め登録された動画像である蓄積映像から、検索対象となる静止画像である目的画像に類似した映像フレームあるいはその一部分を検出する映像検索装置において、
    蓄積映像のある映像フレームの特徴である蓄積特徴を抽出する蓄積特徴抽出部と、
    前記蓄積特徴抽出部が抽出する蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結部
    前記蓄積連結特徴に各々索引を付与する索引付与部と、
    目的画像の特徴である目的特徴を抽出する目的特徴抽出部と、
    前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索部と、
    前記索引検索部により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合部と、前記目的画像と前記蓄積映像中の映像フレームあるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合部とからなる類似度計算部と
    を備えることを特徴とする映像検索装置。
  15. 予め登録された動画像である蓄積映像から、検索対象となる動画像である目的映像に類似した映像区間あるいはその一部分を検出する映像検索装置であり、
    前記蓄積映像から蓄積特徴を導く蓄積特徴抽出部と、
    前記蓄積特徴抽出部が抽出する蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結部と、
    前記蓄積連結特徴に各々索引を付与する索引付与部と、
    目的映像の特徴である目的特徴を抽出する目的特徴抽出部と、
    前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索部と、
    前記索引検索部により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合部と、前記目的映像と前記蓄積映像の映像区間あるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合部とからなる類似度計算部と、
    を備えることを特徴とする映像検索装置。
  16. 前記蓄積特徴にて所定の大きさの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出部と、
    前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出部と
    をさらに有し、
    前記蓄積連結部にて、前記蓄積部分領域特徴抽出部の抽出する蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索部にて前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
    前記類似度計算部が、
    前記索引検索部により抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合部と、
    該距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定部と
    からなる一次照合段階と、
    前記照合結果判定部にて目的画像と類似する映像フレームの一部分が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的画像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合部と、
    前記特徴距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在するか否かを判定する照合結果再判定部と
    前記照合結果再判定部にて、目的画像と類似する映像フレームの一部分が存在すると判定された蓄積映像中の箇所を検索結果候補とする検索結果候補選択部と、
    前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定部と、
    前記索引検索部にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定部と
    からなる二次照合部と
    を備えることを特徴とする請求項14記載の映像検索装置。
  17. 前記蓄積特徴にて所定の大ききの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出部と、
    前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出部と
    をさらに有し、
    蓄積特徴連結部にて、蓄積部分領域特徴抽出の抽出する蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索部にて、前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
    前記類似度計算部が、
    前記索引検索部にて抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合部と、
    該距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定部と
    からなる一次照合部と、
    該照合結果判定部にて目的映像と類似する部分映像区間が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的映像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合部と、
    前記特徴距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する否かを判定する照合結果再判定部と、
    前記照合結果再判定部にて、目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、検索結果候補とする検索結果候補選択部と、
    前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定部と、
    前記索引検索部にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定部と
    からなる二次照合部と
    を備えることを特徴とする請求項15に記載の映像検索装置。
  18. コンピュータに請求項1〜請求項13のいずれかに記載の映像検索方法を実行させるためのコンピュータが実行可能なプログラム。
  19. 請求項18に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005211231A 2004-07-21 2005-07-21 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 Expired - Fee Related JP4421527B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005211231A JP4421527B2 (ja) 2004-07-21 2005-07-21 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004212795 2004-07-21
JP2005211231A JP4421527B2 (ja) 2004-07-21 2005-07-21 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2006060796A true JP2006060796A (ja) 2006-03-02
JP4421527B2 JP4421527B2 (ja) 2010-02-24

Family

ID=36107856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005211231A Expired - Fee Related JP4421527B2 (ja) 2004-07-21 2005-07-21 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4421527B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146490A (ja) * 2006-12-12 2008-06-26 Yahoo Japan Corp 情報提供装置、情報提供方法、及びコンピュータプログラム
JP4467017B1 (ja) * 2009-07-01 2010-05-26 克己 井上 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。
US20110228163A1 (en) * 2010-03-17 2011-09-22 Panasonic Corporation Imaging apparatus, camera body and interchangeable lens
CN103257992A (zh) * 2013-01-29 2013-08-21 中国科学技术大学 一种相似视频检索的方法及系统
CN107943903A (zh) * 2017-11-17 2018-04-20 广州酷狗计算机科技有限公司 视频检索方法及装置、计算机设备、存储介质
CN109753584A (zh) * 2018-12-06 2019-05-14 国电南瑞南京控制系统有限公司 一种风电设备的视频分布式存储与检索方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146490A (ja) * 2006-12-12 2008-06-26 Yahoo Japan Corp 情報提供装置、情報提供方法、及びコンピュータプログラム
JP4467017B1 (ja) * 2009-07-01 2010-05-26 克己 井上 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。
JP2011015109A (ja) * 2009-07-01 2011-01-20 Katsumi Inoue 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。
US20110228163A1 (en) * 2010-03-17 2011-09-22 Panasonic Corporation Imaging apparatus, camera body and interchangeable lens
US8654228B2 (en) * 2010-03-17 2014-02-18 Panasonic Corporation Imaging apparatus, camera body and interchangeable lens
CN103257992A (zh) * 2013-01-29 2013-08-21 中国科学技术大学 一种相似视频检索的方法及系统
CN107943903A (zh) * 2017-11-17 2018-04-20 广州酷狗计算机科技有限公司 视频检索方法及装置、计算机设备、存储介质
CN109753584A (zh) * 2018-12-06 2019-05-14 国电南瑞南京控制系统有限公司 一种风电设备的视频分布式存储与检索方法

Also Published As

Publication number Publication date
JP4421527B2 (ja) 2010-02-24

Similar Documents

Publication Publication Date Title
JP4545641B2 (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
CN107256262B (zh) 一种基于物体检测的图像检索方法
WO2013129580A1 (ja) 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
KR101191223B1 (ko) 이미지 검색 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체
JP2000222581A (ja) 形状情報を用いるマルチメディアデ―タの検索方法及び装置
JP4421527B2 (ja) 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体
CN106156693A (zh) 用于面部识别的基于多模型表示的鲁棒错误纠正方法
CN110347868B (zh) 用于图像搜索的方法和系统
CN113821657A (zh) 基于人工智能的图像处理模型训练方法及图像处理方法
CN110751027A (zh) 一种基于深度多示例学习的行人重识别方法
US20070110308A1 (en) Method, medium, and system with category-based photo clustering using photographic region templates
Etezadifar et al. Scalable video summarization via sparse dictionary learning and selection simultaneously
Chehreghani Efficient computation of pairwise minimax distance measures
JP3621323B2 (ja) 映像登録・検索処理方法および映像検索装置
JP6017277B2 (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
CN105989063A (zh) 视频检索方法和装置
JP4957924B2 (ja) 文書画像特徴量生成装置、文書画像特徴量生成方法及び文書画像特徴量生成用プログラム
Alshammari et al. Approximate spectral clustering density-based similarity for noisy datasets
JP4343038B2 (ja) 部分画像検索システム及び方法並びにプログラム
Syam et al. An effective similarity measure via genetic algorithm for Content-Based Image Retrieval with extensive features
JP2017021606A (ja) 動画像検索方法、動画像検索装置及びそのプログラム
JP6336827B2 (ja) 画像検索装置、画像検索方法および検索システム
Burdescu et al. Multimedia data for efficient detection of visual objects
CN106778811B (zh) 一种图像字典生成方法、图像处理方法及装置
JP4425719B2 (ja) 部分画像検索方法、部分画像検索装置、部分画像検索プログラム、および、部分画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091202

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees