JP2006060796A - 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 - Google Patents
映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2006060796A JP2006060796A JP2005211231A JP2005211231A JP2006060796A JP 2006060796 A JP2006060796 A JP 2006060796A JP 2005211231 A JP2005211231 A JP 2005211231A JP 2005211231 A JP2005211231 A JP 2005211231A JP 2006060796 A JP2006060796 A JP 2006060796A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- target
- video
- unit
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明の映像検索方法は、登録された動画像の蓄積映像から、検索対象の画像に類似した映像フレーム又はその一部分を検出し、蓄積映像の映像フレームから蓄積特徴を抽出する蓄積特徴抽出過程と、蓄積特徴を時間方向に連結した蓄積連結特徴を出力する蓄積特徴連結過程と、蓄積連結特徴に索引を付与する索引付与過程と、目的画像の目的特徴を抽出する目的特徴抽出過程と、目的特徴に類似する蓄積連結特徴を、索引で抽出する索引検索過程と、蓄積連結特徴に対応する蓄積特徴と、目的特徴との類似を示す部分類似値を計算する一次照合段階と、目的画像と蓄積映像中の映像フレーム又はその一部分との全体類似値を部分類似値から求める二次照合段階とからなる類似度計算過程を備える。
【選択図】 図2
Description
そのため、大量の映像から所望の映像を高速に探し出す高速映像検索技術が必要となってきており、特に映像における画像の部分検索は、検索したい画像や映像が蓄積されている映像フレームの一部分であるため、比較の処理が多くなり、さらに高速性が要求される。
この映像検索技術は、膨大な映像データベ一スの中から、高速に目的の画像あるいは目的の映像をその一部分として含む映像区間を検出する映像検索技術に用いられている。
従来、映像検索方法に関しては、映像の各フレームから抽出した特徴を圧縮することにより高速に同一シーンの検出を行う手法等が知られている(たとえば、特許文献1参照)。
そのため、映像の部分領域ごとに照合を行う必要がある。
従来、上記問題点を解決するために、映像の各フレームを独立した画像ととらえ、目的の画像と類似する部分画像を含む画像を検索する部分画像検索手法を繰り返し用いることによって、類似部分映像を検出する方法が考えられる。(例えば、非特許文献1参照)
本発明は、このような事情に鑑みてなされたもので、映像の時間的連続性を考慮し、蓄積された映像から抽出した特徴を時間軸方向に連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する映像区間を高速に検出する映像検索装置、映像検索方法、映像検索プログラム及び記録媒体を提供することを目的としている。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像から抽出した部分領域の特徴を時間軸方向に連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間を検索漏れを生じさせることなく高速に検出する映像検索装置、映像検索方法、映像検索プログラム及び記録媒体を提供することを目的としている。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像からある種の変動に対して頑健な特徴を抽出し、この特徴を時間軸方向に関連性を考慮して連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間の抽出精度を向上させ、かつ高速に検出する映像検索装置、映像検索方法、映像検索プログラム及び記録媒体を提供することを目的としている。
本発明の映像検索方法は、前記蓄積特徴にて所定の大きさの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程とをさらに有し、前記蓄積連結過程にて、前記蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、前記類似度計算過程が、前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、該距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程とからなる一次照合段階と、前記照合結果判定過程にて、目的画像と類似する映像フレームの一部分が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的画像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、前記特徴距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在するか否かを判定する照合結果再判定過程と前記照合結果再判定過程にて、目的画像と類似する映像フレームの一部分が存在すると判定された蓄積映像中の箇所を検索結果候補とする検索結果候補選択過程と、前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程とからなる二次照合段階とを備えることを特徴とする。
本発明の映像検索方法は、前記蓄積特徴にて所定の大ききの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程とをさらに有し、蓄積特徴連結過程にて、蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて、前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、前記類似度計算過程が、前記索引検索過程にて抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、該距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程とからなる一次照合段階と、該照合結果判定過程にて目的映像と類似する部分映像区間が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的映像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、前記特徴距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する否かを判定する照合結果再判定過程と、前記照合結果再判定過程にて、目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、検索結果候補とする検索結果候補選択過程と、前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程とからなる二次照合段階と を備えることを特徴とする。
また、本発明の映像検索方法は、上述したいずれかの映像検索方法において、見本となる特徴パターンである見本特徴を複数種類作成する見本特徴作成過程と、前記見本特徴間の距離を計算する見本特徴間距離計算過程と、前記蓄積特徴抽出過程において抽出された前記蓄積特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される蓄積量子化特徴を導く蓄積特徴量子化過程と、前記目的特徴抽出過程において抽出された前記目的特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される目的量子化特徴を導く目的特徴量子化過程とをさらに備え、前記索引付与過程が前記見本特徴間距離に基づき前記蓄積特徴あるいは前記蓄積部分領域特徴に索引を付与し、前記索引検索過程ならびに前記類似度計算過程において前記目的特徴と前記蓄積連結特徴との類似値を前記見本特徴間距離を用いて逐次計算する、あるいは前記索引検索過程ならびに前記特徴照合過程において前記目的部分領域特徴と前記蓄積連結特徴との距離を前記見本特徴間距離を用いて逐次計算することを特徴とする。
すなわち、本発明は、上記2段階の照合処理において、目的画像と蓄積画像との類似度の判定を、一次照合にて類似する蓄積特徴が検出されない場合、蓄積画像に対してより精度の高い類似度の計算を行う二次照合を行わないため、不必要な処理を削減することができ、より類似判定の処理を高速に、かつ高い精度で行うことができる。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像から抽出した部分領域の特徴を時間軸方向に連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間を検索漏れを生じさせることなく高速に検出することができるという効果が得られる。
また、本発明は、映像の時間的連続性を考慮し、蓄積された映像からある種の変動に対して頑健な特徴を抽出し、この特徴を時間軸方向に関連性を考慮して連結統合することにより、索引の保持に必要な記憶容量を削減し、目的の画像もしくは映像と類似する部分映像区間の抽出精度を向上させ、かつ高速に検出することができるという効果が得られる。
以下、本発明の第1の実施例による映像検索装置を図面を参照して説明する。図1は上記第1の実施例の映像検索装置の一構成例を示すブロック図である。
この図において、本実施例の映像検索装置は、蓄積特徴抽出部1と、蓄積部分領域特徴抽出部2と、索引付与部3と、目的特徴抽出部4と、目的部分領域特徴抽出部5と、索引検索部6と、特徴照合部7と、照合結果判定部8と、特徴再照合部9と、照合結果再判定部10と、検索結果候補選択部llと、次目的部分領域特徴選定部12と、次検索候補特徴選定部13と、蓄積部分領域特徴連結部20とを有しており、目的画像、すなわち参照している検索したい画像と、データベース等に蓄積されている蓄積映像、すなわち検索される検索対象の映像を入力とし、上記目的画像と類似する画像が含まれている蓄積映像中の映像フレーム内の位置情報を出力する。
ここで、特徴照合部7,照合結果判定部8,特徴再照合部9,照合結果再判定部10,検索結果候補選択部11,次目的部分領域特徴選定部12及び次連結特徴選定部13は、類似度計算部100を構成している。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力された特徴に対し、予め定められた所定の大きさの注目窓を、予め定められた所定の間隔で設定し(所定の間隔でずらし)、各注目窓内の特徴である蓄積部分領域特徴を抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から順次出力される蓄積部分領域特徴を、時系列に、すなわち時間軸方向に各々、所定の時間区間単位に連結して、それぞれの区間を蓄積連結特徴として出力する。
索引付与部3は、上記蓄積部分領域特徴連結部20から出力される各蓄積連結特徴に対して、索引を付与する。
目的部分領域特徴抽出部5は、上記目的特徴抽出部4が抽出した目的特徴に対して、予め定められた所定の大きさの注目窓を設定し、この注目窓を1ピクセルずつずらしながら、各注目窓内の特徴である目的部分領域特徴の抽出を行う。
索引検索部6は、上記索引付与部3から出力される索引を用いて、上記目的部分領域特徴抽出部5の抽出した目的部分領域特徴の集合から、類似する蓄積連結特徴の抽出を行う。
この距離は、ユークリッド距離,マンハッタン距離,内積,正規化相互相関などを用いることが出来る。
照合結果判定部8は、上記特徴照合部7の演算した距離に基づいて、目的画像と類似する映像フレームの一部が蓄積映像中の当該箇所に存在する可能性があるか否かの判定を行う。
照合結果再判定部10は、上記照合結果判定部8において用いられた距離に基づいて、目的画像と類似する映像フレームの一部分が、蓄積映像中の当該箇所に存在するか否かの判定を行う。
次目的部分領域特徴選定部12は、上記目的部分領域特徴抽出部5において抽出された目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴の指定を行う。
次連結特徴選定部13は、上記索引検索部6から検索結果として出力された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴の指定を行う。
蓄積特徴抽出部1は、初めに、蓄積映像を、図示しないデータベースから読み込む(ステップS1)。
次に、蓄積特徴抽出部1は、入力した蓄積映像の各映像フレームから、映像フレーム各々の特徴である蓄積特徴を抽出する(ステップS2)。
この場合、蓄積特徴抽出部1は、蓄積映像の各映像フレームから抽出された特徴である蓄積特徴の集合(各映像フレーム毎)を出力することになる。
例えば、この第1注目窓は、大きさが横wxピクセル,縦wyピクセルであり、初期状態として蓄積映像における先頭の映像フレームの左上の角に配置される。
そして、蓄積部分領域特徴抽出部2は、設定された上記第1注目窓内に含まれる部分領域の画像の特徴である蓄積部分領域特徴を抽出する。
さらに、他の実施形態においては、例えば、蓄積特徴として小領域内の2次元DCT係数ベクトルを用いる場合、蓄積部分領域特徴として、上記第1注目窓内に、重複することも隙間も存在しない状態に、上記小領域を配置して、この各小領域に対応する特徴を抽出、もしくは、全ての次元の特徴ベクトルを1つにまとめて、多数次元の特徴ベクトルを1つ得ることもできる。
すなわち、第1注目窓(横wxピクセル×縦wyピクセル)は、蓄積映像の映像フレーム内において、縦及び横方向に、上記所定の間隔(各注目窓の同一の辺同士の間隔であり、例えば左辺同士、上辺同士の間隔として、横方向にmxピクセル,縦方向にmyピクセル)で順次ずらして配置されている。各々が重なり合う状態となっており、連続する第1の窓同士は、図3に示すように、所定の間隔を除いて重なることとなる。
そして、蓄積部分領域特徴抽出部2は、上記第1注目窓毎に得られた蓄積部分領域特徴の集合を出力する。
すなわち、蓄積部分領域特徴連結部20は、例えば、連結させる上記部分領域特徴の数が予め基準として設定されており、その基準の示す連結数の分、例えばatフレーム分だけ時間軸方向に部分領域特徴の連結を行い、複数の部分領域特徴を1つのブロックとする。
そして、蓄積部分領域特徴連結部20は、連結した蓄積部分領域特徴のブロック毎に、連結された部分領域特徴のブロックを代表とする特徴である蓄積連結特徴を抽出する。
また、蓄積部分領域特徴連結部20は、他の実施形態として、上記ブロックにおいて、連結された部分領域特徴における重心を蓄積連結特徴として出力するように構成されてもよい。
次に、蓄積部分領域特徴連結部20は、各ブロック単位に、蓄積連結特徴と、この連結特徴に対応するブロックの連結された各蓄積部分領域特徴との距離を計算し、各蓄積部分領域特徴に対応した該距離における最大値である連結最大差分値を保持する。
そして、蓄積部分領域特徴連結部20は、蓄積連結特徴と、該蓄積連結特徴に対応する連結最大差分値とを各ブロック毎に組みとし、この組の集合を出力する(ステップS4)。
例えば、「信号検出方法、信号検出装置、記録媒体及びプログラム」(特許第3574075号)記載の実施例のように、予め作成されたベクトル量子化符号帳を用いて、各蓄積連結特徴の特徴ベクトルをベクトル量子化し、ベクトル量子化の符号語を索引とする。
次に、索引付与部3は、各蓄積連結特徴のクラスタリングを行う。このクラスタリングは、例えば、各蓄積連結特徴をベクトルと考えて、そのベクトルを、ベクトル量子化を用いて符号化することによって行う。
例えば、ベクトル量子化の符号語数がC個であれば、蓄積連結特徴はC個のクラスタのいずれかに分類されることになる。
このクラスタは、例えば、クラスタ作成のために予め容易された、蓄積連結特徴と同じ次元数の特徴である学習特徴を用いて予め作成しておく。
すなわち、クラスタは、それに所属する学習特徴とクラスタ重心との距離の総和が最小になるように、かつそのクラスタに所属する学習特徴について、所属するクラスタのクラスタ重心との距離が、他のどのクラスタ重心との距離よりも小さくなるように構成される。
そして、索引付与部3は、索引として、各蓄積連結特徴に対応する、ベクトル量子化の符号語を出力する(ステップS5)。
特徴を包含する領域は、例えば、R*-Treeであれば、3次元空間における直方体に相当する超直方体、SR-Treeであれば、超直方体と、3次元空間における球に相当する超球との重なりとなる。
そして、索引付与部3は、上述のように求められた、各蓄積連結特徴に対する索引を出力する。
そして、目的特徴抽出部4は、目的画像から特徴の抽出を、上記蓄積特徴抽出部1と同様の手法で行い、目的画像から抽出された特徴である目的特徴の集合を出力する(ステップS7)。
また、目的部分領域特徴抽出部5は、上記蓄積部分領域特徴抽出部2と同様の抽出方法を用いて、画像の特徴を抽出して、抽出結果を目的部分領域特徴の集合として出力する(ステップS8)。
このとき、第1抽出窓は、例えば、少なくともマージンの大きさの分(横mxピクセル,縦myピクセル)だけずらせば、検索漏れを生じさせることがない。
そして、目的部分領域特徴抽出部5は、上述した処理により抽出した、目的部分領域特徴の集合を出力する。
そして、目的代表特徴抽出部15において、目的部分領域特徴から目的代表特徴を抽出する処理を行った場合、索引検索部6は、目的部分領域特徴の集合の代わりに、目的代表特徴抽出部15から出力される目的代表特徴の集合を読み込む。
目的代表特徴抽出部15は、後述する他の実施形態において詳細に説明する。
また、必要に応じて、索引検索部6は、目的部分領域間距離計算部16から出力される目的部分領域間距離を、さらに、読み込む構成もある。
また、検索閾値更新部14が検索閾値及び選択閾値を更新する処理を行った場合、索引検索部6は更新された選択閾値を読み込む。この検索閾値更新部14については後述する他の実施形態において、詳細に説明する。
このとき、索引検索部6は、目的部分領域特徴の集合内におけるいずれかの目的部分領域特徴に対し、該蓄積連結特徴との距離dt、例えば自乗誤差が、予め定められた閾値である選択閾値θ2を下回るような(以下となるような)蓄積連結特徴を、索引により抽出する。
上記選択閾値θ2は後述するパラメータから自動的に決定される値であり、また、この選択閾値の決定方法は後述する。
さらに、別の実施例として、目的部分領域間距離を用い、各目的代表特徴との距離dtを、該目的代表特徴に対応する目的部分領域間距離の最大値分だけ小さくし、この距離dtの値が選択閾値θ2を下回る蓄積連結特徴を索引から抽出する構成とすることも可能である(後述)。
この抽出方法は、上記索引付与部3において用いられた索引の種類によって異なり、上記索引に対応する特許明細書記載の方法あるいは非特許文献記載の方法と同様にして実施することができる。
例えば、「信号検出方法、信号検出装置、記録媒体及びプログラム」(特許第3574075号)に記載の方法を用いて索引を付与した場合、以下のようにして所望の蓄積連結特徴を抽出することができる。
以下では、簡単のため、目的代表特徴ではなく、本実施例で採用した構成において目的部分領域特徴を読み込んだものとして説明する。
そして、索引検索部6は、読み込んだ目的部分領域特徴と、各クラスタ重心との距離を計算する。
続いて、索引検索部6は、計算された距離dtに基づいて、目的部分領域特徴との距離が選択閾値θ2を下回る蓄積連結特徴を含む可能性のあるクラスタを選択する。
図4は、点Q,C1,C2の3点が乗るような平面であり、特徴ベクトルが配置される特徴空間を切り出した様子を示している。
ここで、点Qは目的部分領域特徴、点C1は部分領域特徴Qが所属しているクラスタのクラスタ重心、C2は他のクラスタのクラスタ重心を表しており、距離dQ1,dQ2,d12はそれぞれ、点Qと点C2との距離、点Qと点C2との距離、点C1と点C2との距離を示している。
そして、点Qを中心とする超球の半径が図4におけるdθより大きくなったとき、点C2に対応するクラスタに所属する蓄積連結特徴の中に、所望の蓄積連結特徴が含まれている可能性がある。
そこで、選択閾値θ2が図4におけるdθより大きくなったとき、そのクラスタを選択する。dθは、以下の(1)式及び(2)式を用いて求められる。
さらに、蓄積連結特徴に対応する連結最大差分値を考慮して、最終的に、索引検索部6は、以下の(3)式が成り立つとき、点C2に対応するクラスタを選択し、そのクラスタに所属する蓄積連結特徴を全て抽出する。
そして、この手順を、目的部分領域特徴Qが所属するクラスタを除く全てのクラスタに対して行い、抽出された蓄積連結特徴の集合を、検索候補特徴として出力する。
次に、特徴照合部7は、蓄積部分領域特徴連結部20から出力される連結最大差分値の集合と、目的部分領域特徴抽出部5から出力される目的部分領域特徴と、索引検索部6から出力される検索候補特徴としての蓄積連結特徴の集合とを読み込む。
そして、特徴照合部7は、次目的部分領域特徴選定部12により、次に照合すべき目的部分領域特徴が指定されている場合、該目的部分領域特徴を読み込む。この次目的部分領域特徴選定部12は、本実施形態において後述する。
次に、特徴照合部7は、次目的部分領域特徴選定部12から読み込んだ目的部分領域特徴と、次連結特徴選定部13から読み込んだ検索候補特徴の集合との照合を行う。
このとき、特徴照合部7は、上記目的部分領域特徴と検索候補特徴との距離、例えば、自乗誤差の演算を行う。
また、特徴照合部7は、指定された検索候補特徴がなければ、初期の検索候補特徴として、例えば、任意に選択した検索候補特徴を指定し、上記目的部分領域特徴と照合する。
そして、特徴照合部7は、照合計算(検索候補特徴と目的部分領域特徴との間の距離の演算)を行う。そして、特徴照合部7は、照合に用いた検索候補特徴である蓄積連結特徴に対応する連結最大差分値を、連結最大差分値の集合から上記蓄積連結特徴に基づき抽出し、上記距離値から連結最大差分値を減算し、減算結果の距離値を補正距離値d(ω)として出力する。
そして、照合結果判定部8は、補正距離値d(ω)が選択閾値θ2以下となったとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在する可能性があると判定し、蓄積連結特徴を照合箇所として出力し、一方、補正距離値d(ω)が選択閾値θ2を超えているとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在する可能性がないと判定し、処理をステップS15へ進める(ステップS11)。
このとき、照合結果判定部8は、蓄積連結特徴が複数の蓄積部分特徴から構成されているため、照合箇所として、時間的に連続した複数の箇所を出力する。
そして、特徴再照合部9は、読み込んだ蓄積特徴に、目的画像と同じ大きさ(縦×横)の注目窓である第2注目窓を設定する。
すなわち、特徴再照合部9は、図5の概念図に示すように、第2注目窓の配置箇所に対する蓄積部分領域の相対的な位置が、目的画像における目的部分領域の相対的な位置と同一になるように、つまり、照合箇所における蓄積部分領域と目的部分領域とが重なる位置に、上記第2注目窓を配置する。
ここで、特徴再照合部9は、例えば、第2注目窓内の蓄積特徴と目的特徴との距離値d、例えば、自乗誤差を計算する。
そして、特徴再照合部9は、照合計算結果である距離値dを出力する(ステップS12)。
このとき、特徴再照合部9は、上述した照合計算を照合結果判定部8の出力する照合箇所、すなわち複数の箇所全てに対して行い、各々の距離値dからなる集合を出力する。
このとき、照合結果再判定部10は、いずれかの距離値dが検索閾値θ以下であるとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在すると判定し、蓄積映像の映像フレームにおける該照合箇所を検出箇所として、この検出箇所の位置及び判定結果(存在したことを示す情報)を出力し、一方、距離値dが検索閾値θを超えたとき、目的画像と類似する映像フレームの一部分が現在の照合箇所に存在しないと判定し、処理をステップS15へ進める(ステップS13)。
(6)式,(7)式,(9)式,(10)式及び(11)式の右辺に現れる [x] は、ガウス記号を表しており、実数xを超えない最大の整数を表している。
次に、検索結果候補選択部11は、照合結果再判定部10から出力される検出箇所と、特徴再照合部9から出力される距離値dの集合を読み込む。
検索結果候補選択部11は、例えば、距離値の大小にかかわらず、読み込んだ検出箇所と距離値dとの組を全て登録する。
また、検索結果候補選択部11は、他の実施形態として、検索結果候補が予め定められた数量以下になるように登録する構成とすることも可能である。
このように、検索結果候補選択部11は、蓄積画像から上述した方法により検索結果候補を出力する(ステップS14)。
上記検索閾値更新部14及び周辺距離下限値計算部17は、他の実施例において後述する。
そして、次目的部分領域特徴選定部12は、次に照合すべき目的部分領域特徴の選択、すなわち次に照合する目的部分領域特徴の有無の検出を行い、照合箇所がないことを検出すると処理をステップS16へ進め、一方、照合箇所があることを検出すると、次に照合する目的部分領域特徴を選択して、処理をステップS10へ進める(ステップS15)。
また、別の実施形態として、次目的部分領域特徴選定部12は、上記周辺距離下限値を読み込んだ場合、この距離下限値が、読み込んだ選択閾値θ2を上回る目的部分領域特徴との照合を省略し、この距離下限値が選択閾値θ2以下の目的部分領域特徴から任意に1つ選択する構成とすることも可能である。
そして、次目的部分領域特徴選定部12は、終了していない目的部分領域特徴があれば、照合箇所が選択された目的部分領域特徴と、この目的部分特徴に対応する目的映像における映像フレーム内の位置を出力する。
このとき、次検索候補特徴選定部13は、例えば、照合する検索候補特徴があることを検出すると、照合が終了していない検索候補特徴から任意に1つ選択する。
これにより、次検索候補特徴選定部13は、選択された検索候補特徴を、特徴照合部7に対して出力する。
この図において、本実施例の映像検索装置は、第1の実施例と同様に、蓄積特徴抽出部1と、蓄積部分領域特徴抽出部2と、索引付与部3と、目的特徴抽出部4と、目的部分領域特徴抽出部5と、索引検索部6と、特徴照合部7と、照合結果判定部8と、特徴再照合部9と、照合結果再判定部10と、検索結果候補選択部llと、次目的部分領域特徴選定部12と、次検索候補特徴選定部13と、蓄積部分領域特徴連結部20とを有しており、目的映像、すなわち参照している検索したい映像と、データベース等に蓄積されている蓄積映像、すなわち検索される検索対象の映像を入力とし、上記目的映像と類似する部分映像が含まれている蓄積映像中の位置情報を出力する。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力された特徴に対し、予め定められた所定の大きさの注目窓を、予め定められた所定の間隔で設定し(所定の間隔でずらし)、各注目窓内の特徴である蓄積部分領域特徴を抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から順次出力される蓄積部分領域特徴を、時系列に、すなわち時間軸方向に各々、所定の時間区間単位に連結して、それぞれの区間を蓄積連結特徴として出力する。
索引付与部3は、上記蓄積部分領域特徴連結部20から出力される各蓄積連結特徴を、各々ベクトル量子化し、ベクトル量子化の符号語を、標識のための索引としてそれぞれに対し付与する。
目的部分領域特徴抽出部5は、上記目的特徴抽出部4が抽出した各映像フレームの目的特徴に対して、予め定められた所定の大きさの注目窓を設定し、この注目窓を1ピクセルずつずらしながら、各注目窓内の特徴である目的部分領域特徴の抽出を行う。
索引検索部6は、上記索引付与部3から出力される索引を用いて、上記目的部分領域特徴抽出部5の抽出した目的部分領域特徴の集合から、類似する蓄積連結特徴の抽出を行う。
照合結果判定部8は、上記特徴照合部7の演算した距離に基づいて、目的映像と類似する部分映像が蓄積映像中の当該箇所に存在する可能性があるか否かの判定を行う。
照合結果再判定部10は、上記照合結果判定部8において用いられた距離に基づいて、目的映像と類似する部分映像が、蓄積映像中の当該箇所に存在するか否かの判定を行う。
次目的部分領域特徴選定部12は、上記目的部分領域特徴抽出部5において抽出された目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴の指定を行う。
次検索候補特徴選定部13は、上記索引検索部6から検索結果として出力された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴の指定を行う。
蓄積特徴抽出部1は、初めに、蓄積映像を、図示しないデータベースから読み込む(ステップS1)。
次に、蓄積特徴抽出部1は、入力した蓄積映像の各映像フレームから、第1の実施例と同様に、映像フレーム各々の特徴である蓄積特徴を抽出する(ステップS2)。
この場合、蓄積特徴抽出部1は、蓄積映像の各映像フレームから抽出された特徴である蓄積特徴の集合(所定の時間毎)を出力することになる。
例えば、この第1注目窓は、大きさが横wxピクセル,縦wyピクセル,時間方向wt映像フレームであり、初期状態として蓄積映像における先頭の映像フレームの左上の角に配置される。
そして、蓄積部分領域特徴抽出部2は、設定された上記第1注目窓内に含まれる部分映像の特徴である蓄積部分領域特徴を抽出する。
例えば、この蓄積部分領域特徴各々は、RGB画素値をそのまま用いて、wx×wy×wt×3次元の特徴ベクトルを1つ得ることになる。
すなわち、第1注目窓(横wxピクセル×縦wyピクセル×時間軸方向にwt映像フレーム数)は、蓄積映像内において、縦及び横並びに時間方向に、上記所定の間隔(各注目窓の同一の辺同士の間隔であり、例えば左辺同士、上辺同士の間隔として、横方向にmxピクセル,縦方向にmyピクセル,時間軸方向にmt映像フレーム)で順次ずらして配置されている。
そして、蓄積部分領域特徴抽出部2は、上記第1注目窓毎に得られた蓄積部分領域特徴の集合を出力する。
そして、目的特徴抽出部4は、目的映像を読み込むが(ステップS6)、この目的映像の大きさは、横qxピクセル,縦qyピクセル,時間方向qt映像フレームであり、第1の実施例と同様に、例えば、マージンと第1注目窓の大ききとの和(合計)以上、すなわちqx≧wx+mx,qy≧wy+my,qt≧wt+mtに設定すると、大きさqxピクセル×qyピクセル×qt映像フレームの窓を任意位置に配置しても必ず1つ以上の蓄積部分領域を含むため、検索漏れを生じることがない。
そして、目的特徴抽出部4は、目的画像から特徴の抽出を、上記蓄積特徴抽出部1と同様の手法で行い、目的映像から抽出された特徴である目的特徴の集合を出力する(ステップS7)。
また、目的部分領域特徴抽出部5は、上記蓄積部分領域特徴抽出部2と同様の抽出方法を用いて、目的映像の特徴を抽出して、抽出結果を目的部分領域特徴の集合として出力する(ステップS8)。
このとき、第1抽出窓は、例えば、少なくともマージンの大きさの分だけずらせば、検索漏れを生じさせることがない。
そして、目的部分領域特徴抽出部5は、上述した処理により抽出した、目的部分領域特徴の集合を出力する。
図6は、請求項5に記載の方法を適用した第3の実施例による映像検索装置の構成例を示すブロック図である。
第2の実施例の部分画像検索装置は、請求項1〜4に記載の方法を適用した第1及び第2の実施例による部分画像検索装置に加え、さらに、図6に示すように、検索閾値更新部14を設け、任意の目的画像、すなわち見本となる検索したい画像または映像と、蓄積映像、すなわち検索される長時間の映像を入力とし、目的画像と類似する画像が含まれている映像フレームの一部分の位置(第1の実施例に対応)、または目的映像と類似する部分映像が含まれている蓄積映像内の箇所(第2の実施例に対応)を出力する。
次に、上述した蓄積特徴抽出部1から検索閾値更新部14,蓄積部分領域特徴連結部20における部分画像の検出処理を、図7を用いて具体的に説明する。ここで、図7は、図6に示す部分画像検索装置の動作例を示すフローチャートである。
検索閾値更新部14は、検索結果候補選択部11から出力される検索結果候補を読み込み、この読み込んだ検索結果候補の中から、距離値が最大の検索結果候補を選び出し、選択した検索結果候補の距離値が検索閾値θ以下であるか否かの判定を行い、この距離値が探索結果閾値θ以下であることを検出した場合、検索閾値θをその距離値と同じ値に更新する。
そして、(4)式に基づいて検索閾値θから選択閾値θ2を計算し、更新した検索閾値θと共に出力する(ステップS14)。
これ以降は、この更新された検索閾値θ及び選択閾値θ2が照合結果の判定に用いられる。
図8は、請求項10に記載の方法を適用した第4の実施例による映像検索装置の構成例を示すブロック図である。
この第4の実施例による映像検索装置は、第1〜第3の実施例の映像検索装置に対して、目的代表特徴抽出部15を加えたものであり、目的画像または目的映像、すなわち見本となる検索したい画像または映像と、蓄積映像、すなわち検索される映像とを入力し、目的画像と類似する画像が含まれている蓄積映像中の映像フレーム内の位置、または目的映像と類似する部分映像が含まれている蓄積映像内の箇所を検索し、検索結果を出力する。
この目的代表特徴抽出部15は、上記目的部分領域特徴抽出部5から出力された目的部分領域特徴の集合を分類し、各分類を代表する部分領域特徴を代表特徴として抽出して出力する。
図9のフローチャートは、図7に示す第4の実施例のフローチャートに対して、ステップS8の「目的部分領域の抽出」の処理の次に、ステップS18の「目的代表特徴の抽出」の処理が追加されたのみで、他の処理については同様であるため、このステップS18の処理の説明のみを行う。
このとき、目的代表特徴抽出部15は、例えば、クラスタを1つだけ用意し(共通の特徴ベクトルを抽出する)、上記集合における全ての目的部分領域特徴をそのクラスタに所属させる(1つの目的代表特徴を出力することになる)。
また、さらに、目的代表特徴抽出部15は、別の実施例として、同一クラスタ内の目的部分領域特徴同士の距離の最大値が、予め定められた閾値である分類閾値を上回らないように、クラスタを併合することも可能である。
次に、目的代表特徴抽出部15は、上記各クラスタから、該クラスタを代表する部分領域特徴である代表特徴を抽出する。目的代表特徴抽出部15は、例えば、クラスタ内の任意に選択した1つの目的部分領域特徴を代表特徴とする。
この特定位置とは、例えば、目的画像の左上角の位置などである。
さらに、目的代表特徴抽出部15は、別の実施例として、クラスタ内の目的部分領域特徴の重心にある目的部分特徴を代表特徴とする構成とすることもできる。
そして、目的代表特徴抽出部15は、上述した第4の実施例における各実施例により求めた、代表特徴あるいはその集合を出力する。
次のステップS9において、索引検索部6は、上記目的代表特徴を用いて、蓄積画像の索引との照合処理を行う。
図11は、請求項12に記載の方法を適用した第5の実施例による映像検索装置の構成例を示すブロック図である。
この第5の実施例による映像検索装置は、第1、第2、第3、第4の実施例の映像検索装置に対して、目的部分領域間距離計算部16と、周辺距離下限値計算部17とを加えたものであり、目的画像または目的映像、すなわち見本となる検索したい画像または映像と、蓄積映像、すなわち検索される映像とを入力し、目的画像と類似する画像が含まれた蓄積画像中の映像フレーム内における位置、または、目的映像と類似する部分映像が含まれている蓄積映像内における箇所を検索し、検索結果を出力する。
そして、目的代表特徴抽出部15が設けられている場合は、目的部分領域特徴と、それに対応する目的代表特徴との距離を計算する。
上記周辺距離下限値計算部17は、特徴照合部7から出力された距離値と、目的部分領域間距離計算部16から出力された距離値とを用い、特徴照合部7で照合を行った検索候補特徴と、上記目的部分領域特徴抽出部5から出力された各目的部分領域特徴との距離を演算して、この演算結果から下限値を抽出する。
図11のフローチャートは、図9に示す第4の実施例のフローチャートに対して、ステップS18の「目的代表特徴の抽出」の処理の次に、ステップS19の「目的部分領域間距離の演算」の処理が追加され、また、ステップS15の「次の目的部分領域特徴の有無」の処理の直前に、ステップS20の「周辺距離下限値の演算」の処理が追加されたのみで、他の処理については同様であるため、このステップS19及びステップS20の処理の説明のみを行う。
そして、目的部分領域間距離計算部16は、例えば、全ての目的部分領域特徴の組に対して距離計算を行う。ここで、距離尺度としては、例えば、自乗誤差を用いる。
また、別の実施例として、目的代表特徴抽出部15が設けられている場合には、さらにこの目的代表特徴抽出部15から出力される目的代表特徴の集合を読み込み、各目的部分領域特徴と、それに対応する目的部分領域特徴との距離を計算することも可能である。
上述したように、目的部分領域間距離計算部16は、目的部分領域特徴同士の距離、あるいは目的部分領域特徴と目的代表特徴との距離を出力する。
上述した距離を用いて、ステップS9において、索引による検索が行われる。
そして、周辺距離下限値計算部17は、読み込んだ距離値と部分領域問距離とから、蓄積部分領域特徴と各目的部分領域特徴との距離の下限値を計算する。
このとき、周辺距離下限値計算部17は、蓄積部分領域特徴fD (W)と、目的部分領域特徴fQ2 (W)との距離の下限値bound(fD (W),fQ2 (W))は、三角不等式に基づいて、以下の(12)式により求められる。
上述したように、周辺距離下限値計算部17は、蓄積部分領域特徴と、目的部分領域特徴との距離の下限値である周辺距離下限値を出力する。
そして、次のステップS15において、次目的部分領域特徴選定部12は、上記周辺距離下限値を入力し、この距離下限値が、読み込んだ選択閾値θ2を上回る目的部分領域特徴との照合を省略し、この距離下限値が選択閾値θ2以下の目的部分領域特徴から任意に1つ選択する。
図12は、本発明の第6の実施例である映像検索装置の構成を示すブロック図である。
この図6に示す映像検索装置は、蓄積特徴抽出部1と、蓄積部分領域特徴抽出部2と、蓄積部分領域特徴連結部20と、索引付与部3と、索引格納部30と、目的特徴抽出部4と、目的部分領域特徴抽出部5と、索引検索部6と、類似度計算部200とから構成され、映像フレームより小さな検索したい画像、すなわち目的画像と、検索される対象である蓄積映像を入力し、目的画像と類似する部分画像が含まれている映像フレームの蓄積映像における位置を出力する。また、検索鍵として映像、すなわち目的映像を入力した場合には、目的映像に類似する映像の部分領域が含まれている蓄積映像内の区間を出力する。
また、上記類似度計算部200は、次連結特徴選定部13と、次目的部分領域特徴選定部12と、特徴照合部7と、検出結果判定部31と、特徴再照合部9と、検出結果再判定部32と、検出結果候補選択部33とから構成されている。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力される蓄積特徴に対し、予め設定された所定の大きさの注目窓を所定の間隔で複数設定し(所定の間隔でずらし)、各注目窓の範囲に含まれる蓄積特徴を、蓄積部分領域特徴として抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から出力される蓄積部分領域特徴を、それぞれに位置的に近いものを時間軸方向に順次連結し、各連結ブロック内の特徴である蓄積連結特徴を導く。
索引格納部30は、上記索引付与部3の出力する索引を格納する。
目的特徴抽出部4は、目的画像、または目的映像の各映像フレームから目的特徴(特徴ベクトル)を抽出する。
目的部分領域特徴抽出部5は、上記目的特徴抽出部4が抽出した目的特徴に所定の大きさの注目窓を設定し、この注目窓を所定のピクセル(画素)単位、例えば1ピクセルずつずらしながら、各注目窓に含まれる目的特徴を、目的部分領域特徴として抽出する。
また、索引検索部6は、上記索引により類似する蓄積連結特徴が検出された場合、この検出した蓄積連結特徴を類似度計算部200に送出し、一方、何も検出されなかった場合、この処理において映像検索処理を終了する。
そして、類似度計算部200は、索引検索部6により検出された全ての蓄積連結特徴について照合が終了した場合、その照合結果を出力し、映像検索処理を終了する。
蓄積特徴抽出部1は、与えられた蓄積映像を読み込んで入力し、蓄積映像から映像フレームごとに蓄積特徴を抽出する。
このとき、蓄積特徴抽出部1は、入力された蓄積映像の各フレームから、小領域(横bxピクセル、縦byピクセル)を縦横1ピクセルずつずらしながら取り出し、各小領域におけるRGB(Red,Green,Blueの3原色)各色の画素について平均値を計算する。ここで、蓄積特徴は小領域内のRGBそれぞれの平均画素値からなる3次元ベクトルからなる特徴ベクトルにより表現される。
さらに他の実施形態として、入力された蓄積映像から小領域(横bxピクセル、縦byピクセル、時間方向btフレーム)を縦横1ピクセルずつ、時間方向1フレームずつずらしながら取り出し、各小領域のRGB各々に対して公知のディジタル映像処理技術である3次元DCTを施し、その係数ベクトルを利用する方法もある。
蓄積特徴抽出部1は、上述したように、各映像フレームにおいて抽出した蓄積特徴の集合を、蓄積部分領域特徴抽出部2に出力する。
そして、蓄積部分領域特徴抽出部2は、蓄積特徴抽出部1から入力される蓄積特徴の集合に対し、注目窓を所定の間隔にて複数設定し、注目窓内の特徴である蓄積部分領域特徴を抽出する。
そして、蓄積部分領域特徴抽出部2は、この注目窓内に重複も隙間もなく小領域を配置して(各小領域が隣接するように配置し)、この小領域に対応する特徴を抽出する。
これにより、蓄積部分領域特徴抽出部2は、上記小領域特徴を順に並べて、ベクトルとした蓄積部分領域特徴を出力する。
そして、蓄積部分領域特徴抽出部2は、上述したように求めた蓄積部分領域特徴の集合を、蓄積部分領域特徴連結部20に対して出力する。
このとき、蓄積部分領域特徴連結部20は、例えば、連結させる蓄積部分領域特徴の数が予め基準として設定されており、その基準の示す連結数の分だけ、映像フレーム内の位置が同一であり、かつ時間軸方向に連続する蓄積部分領域特徴を集合させ、これら複数の蓄積部分領域特徴を一つのブロックとする。
このとき、距離が最小となる蓄積部分領域特徴と必ず連結する構成の他に、例えば、距離が所定の連結閾値を下回る場合にのみ連結する構成も可能である。
上記近傍領域は、例えば、蓄積部分領域から横axピクセル、縦ayピクセル以内の範囲とする、アプリケーション毎に設定する範囲の領域を示す。
また、あるいはすでに連結されている、時間軸逆方向に連続する蓄積部分領域の移動量を平均し、その分近傍領域をシフトさせる構成も可能である。この移動量の計算法は、後述の類似度計算部200にて説明する。
他にも、上記蓄積部分領域特徴のブロックにおいて、連結された蓄積部分領域特徴に対応する蓄積部分領域の重心を蓄積連結特徴として出力するように構成してもよい。
そして、蓄積部分領域特徴連結部20は、ブロック内のすべての蓄積部分領域特徴と、それらを代表する蓄積連結特徴との距離を計算し、これらの距離の最大値である連結最大差分値を、ブロック毎に保持する。
蓄積部分領域特徴連結部20は、蓄積連結特徴ならびにこの蓄積連結特徴の保持する連結最大差分値をブロック毎に索引付与部3へ出力する。
本実施例においては、特許文献(特許第3574075号「信号検出方法、信号検出装置、記録媒体及びプログラム」)に記載された手法を用い、予め作成されたベクトル量子化符号帳により蓄積連結特徴の特徴ベクトルをベクトル量子化し、得られた符号を索引とする。上記符号と、この符号に対応した見本特徴としての特徴ベクトルとの対応がベクトル量子化符号帳に記載されており、例えば、ベクトル量子化の符号語数(符号の数)がC個(C個のクラスタ)であれば、蓄積連結特徴は特徴ベクトルの距離がより近い、見本特徴の符号に振り分けられ、C個のクラスタのいずれかに分類されることになる。
ここで、ベクトル量子化は、例えば自乗誤差を距離関数として用い、蓄積連結特徴ベクトルとクラスタ重心との距離を算出し、距離値が最小となるクラスタに蓄積連結特徴を所属させ、このクラスタに対応する符号語を出力することによって行われる。
これらの手法は、特徴の存在する多次元空間内で特徴を包含する領域を階層的に作成し、作成されたなかで最下層の領域と特徴とを対応づけることにより索引を付与している。
この特徴を包含する上記領域は、R*−Treeであれば3次元空間における直方体に相当する超直方体であり、SR−Treeであれば超直方体と、3次元空間における球に相当する超球との重なりとなる。
すなわち、映像検索装置が、目的画像または目的映像、及び蓄積映像を同時に読み込み、リアルタイムで検索を行うアプリケーションの場合、索引付与部3は索引を索引検索部6へ送出し、一方、それ以外の場合、索引格納部30へ蓄積映像ごとに索引の登録処理を行う。
あるいは、蓄積特徴抽出部1において他の特徴抽出手段を用いる場合には、目的特徴抽出部4は、これと同様の手法で特徴抽出を行う。
目的特徴抽出部4は、目的特徴(特徴ベクトル)の集合を目的部分領域特徴抽出部5へ送出する。
ここで、目的部分領域特徴抽出部5は、注目窓の設定方法として、蓄積部分領域特徴抽出部2と異なり、注目窓を目的画像内に重複することもなく、かつ隙間もない状態に設定し、それらを1ピクセルずらしながら、各位置において目的部分領域特徴の抽出を行う。
そして、目的部分領域特徴抽出部5は、この注目窓内に重複も隙間もなく小領域を配置し、この小領域に対応する特徴を抽出する。
この目的部分領域特徴抽出部5における、小領域から特徴を抽出する処理は、蓄積部分領域特徴抽出部2と同様である。また、蓄積部分領域特徴抽出部2において他の特徴抽出手段を用いる場合には、目的部分領域特徴抽出部5においても、蓄積部分領域特徴抽出部2と同様の特徴抽出処理を行う。
そして、目的部分領域特徴抽出部5は、上述のように求めた目的部分領域特徴の集合Wを索引検索部6へ出力する。
また、索引検索部6は、目的画像または目的映像、及び蓄積映像を同時に入力してリアルタイムに類似を判定する場合以外、索引格納部30から順次索引を読み出して、目的部分領域特徴と比較を行う。
そして、索引検索部6は、読み込んだ上記索引を用い、目的部分領域特徴の集合に類似した蓄積連結特徴の検索を行う。
上記距離計算は、後述する類似度計算部200で行われる処理と同様である。すなわち、上記距離値は、例えば特徴ベクトル間の距離関数とし、自乗誤差により計算することができる。
また、上記選択閾値θ2は、類似度計算部200で与えられる検索閾値θから自動的に決定される値である。この選択閾値θ2の決定方法については後述する。
例えば、テンプレートを用いた量子化によって索引を付与した場合、すなわち特許第3574075号に記載された手法により索引を付与した場合、以下のようにして所望の蓄積連結特徴である検索候補特徴を抽出することができる。
すなわち、索引検索部6は、目的部分領域特徴と、索引付与部3で作成された索引(クラスタを示す符号)と、選択閾値θ2とを読み込む。
次に、索引検索部6は、目的部分領域特徴と各クラスタ重心との距離を計算し、この計算結果の距離値が選択閾値θ2を下回るクラスタを選択することにより、このクラスタに所属する蓄積連結特徴をすべて抽出する。
図4は、点Q、C1、C2の3点が乗るような平面であり、特徴ベクトルが配置される特徴空間を切り出した様子を示している。
ここで、点Qは目的部分領域特徴、C1は目的部分領域特徴Qが所属しているクラスタのクラスタ重心、C2は他のクラスタのクラスタ重心を表しており、距離dQ1、dQ2、d12は、それぞれ、点Qと点C1との距離、点Qと点C2との距離、点C1と点C2との距離を示している。
ここで、目的部分領域特徴の座標である点Qからの距離dtが、選択閾値θ2以内である蓄積連結特徴を抽出しなければならないとすると、点Qを中心とする半径θ2の超球(図4においては円)の内部にある蓄積連結特徴がそれに該当することになる。
このため、選択閾値θ2が図4における距離dθより大きくなったとき、そのクラスタを選択する。dθは、以下に示す(13)式より導かれる(14)式から求められる。
そして、索引検索部6は、上述した手順を、目的部分領域特徴Qの所属するクラスタを除くすべてのクラスタに対して行い、抽出された目的部分領域特徴に類似する可能性のある蓄積連結特徴を類似度計算部200に対して出力する。ここで、目的部分領域特徴に類似する可能性のある蓄積連結特徴の集合をFとする。
一方、索引検索部6は、目的部分領域特徴に類似する可能性のある蓄積連結特徴が検出されなかった場合、映像検索装置における検索処理をここで終了する。
そして、次連結特徴選定部13は蓄積連結特徴を順次取り出す。また、次目的部分領域特徴選定部12は取り出された上記目的部分領域特徴に対し、特徴照合部7にて距離計算を行う。
次に、検出結果判定部31がある蓄積連結特徴に類似する目的部分領域特徴を検出した場合、特徴再照合部9は、この蓄積連結特徴が帰属する蓄積映像の映像フレーム(蓄積特徴の集合)に、目的画像または目的映像のフレームサイズ(目的特徴の集合)と同じ大きさの照合窓を設定し、目的特徴と蓄積特徴上の照合窓との距離値を計算する。
そして、検出結果再判定部32は、目的特徴と上記照合窓内の特徴との類似性を判定し、検出結果候補選択部33は検出結果の出力数を制御する。
まず、次連結特徴選定部13は、目的部分領域特徴に類似する可能性のある蓄積連結特徴の集合Fから、蓄積連結特徴を一つ選択する(S101及びS102)。
次に、次目的部分領域特徴選定部12は、選択した蓄積連結特徴と照合を行う目的部分領域特徴を、指定された順に取り出す(S201及びS202)。
ここで、次目的部分領域特徴選定部12は、例えば、目的画像または目的映像の映像フレームの左上端または右下端より順次照合を行うように、目的部分領域特徴の設定を行う。
ここで、特徴照合部7は、上記距離値を、例えば、自乗誤差として計算することができる。次に、特徴照合部7は、計算した距離値から、照合を行った蓄積連結特徴の連結最大差分値を減算した補正距離値d(ω)を求める。
次に、検出結果判定部31は、算出された上記補正距離値d(ω)を上記選択閾値θ2と比較し(S302)、補正距離値d(ω)が選択閾値θ2以下である場合、照合を行った蓄積連結特徴を含む領域に目的画像または目的映像に類似する部分映像が存在する可能性があることを検出し、この蓄積連結特徴が代表する時間軸に連続した蓄積部分領域特徴の集合を出力する(S303)。
一方、検出結果判定部31は、補正距離値d(ω)が選択閾値θ2を上回った場合、処理をステップS201に進め、上述した処理を再度実行する。
そして、特徴再照合部9は、目的特徴と、蓄積特徴における照合窓内の特徴との距離を算出する(S501)。
ここで、特徴再照合部9は、上記照合窓の設定を行う際、図5の概念図に示すように、照合窓の配置箇所に対する蓄積部分領域の相対的な位置が、目的画像または目的映像の映像フレームにおける目的部分領域の相対的な位置と同一になるように、つまり、照合窓における蓄積部分領域と、映像フレーム上の目的部分領域が重なる位置に照合窓を配置する。
そして、検出結果再判定部32は、得られた距離値dが検索閾値θ以下である場合、目的画像または目的映像に類似する領域が、蓄積映像中のこの照合窓の位置に存在すると判定し、照合窓の位置及び類似度を出力する(S503)。
一方、検出結果再判定部32は、検索閾値θ以上であれば、処理をステップS201へ進め、上述した処理を再度実行する。
ここで、上記選択閾値θ2は、前記検索閾値θから自動的に決定される値であり、以下に示す(16)式を用いて設定すると検出漏れを生じることがない。
また、以下の(18)式におけるNxは、照合窓内の横方向の注目窓の数であり、(18)式におけるNyは照合窓内の縦方向の注目窓の数である。ただし、(18)式及び(19)式におけるceil(x)は、x以上の整数であり最小のものを表す。
すなわち、特徴照合部7が検索候補特徴と目的部分領域特徴とから、距離値を計算(S301)する過程において、特徴照合部7は、計算途中の補正距離値d(ω)が選択閾値θ2を超えたか否かを逐次的に評価し、補正距離値d(ω)が選択閾値θ2を超えたことを検出した時点にて、距離値の計算を打ち切るように構成しても良い。
また、特徴再照合部9が目的特徴と蓄積特徴上の照合窓との距離値を計算(S501)する過程においても、同様に、計算途中の距離値dを検索閾値θと比較して、θを超えた場合に、この距離値計算を打ち切るように、特徴再照合部9を構成しても良い。
この手法を用いることにより、類似度計算部200における計算量を削減し、検索処理の高速化を図ることができる。
ここで、最終的に最も類似する箇所または上位κ箇所を出力するように構成した場合、検出結果候補選択部33は、検出箇所をκ箇所まで無条件に登録する(S601及びS602)。
このとき、検出結果候補選択部33は、κ箇所を超過する場合、例えば、新たに検出された箇所における距離値を、すでに登録された検出結果候補の距離値の最大値と比較し、これを下回る場合に最大距離値に対応する検出結果候補を削除し、新たな検出箇所とその類似度を検出結果候補として登録する(S603)。
これにより、次連結特徴選定部13が次に照合を行う蓄積連結特徴を選択することで、類似度計算部200の各構成がステップS102以降の処理を行う。
最後に、類似度計算部200においてすべての蓄積連結特徴について照合が終了、すなわち、次連結特徴選定部13が蓄積連結特徴の集合Fが空集合であることを検出した場合(S111)、検出結果候補選択部33は、ステップS503において登録された検出結果を出力し、映像検索装置の検索処理が終了する。
図14は、本発明の第7の実施例である映像検索装置の構成を示すブロック図である。
第7の実施例である映像検索装置は、第6の実施例に更に、見本特徴作成部34と、見本特徴格納部35と、見本特徴間距離計算部36と、見本特徴間距離格納部37と、蓄積特徴量子化部38と、目的特徴量子化部39とを具備しており、特徴の典型的なパターンである見本特徴を用いて蓄積特徴ならびに目的特徴の量子化を行う。
このように構成することで、蓄積映像と目的画像あるいは目的映像内の位置関係を保持しながら照合の際に必要な情報量を大幅に削減することができ、また、既知の値である見本特徴間距離を用いて照合を行うことにより、実際の距離計算を省略できるようにしたものであり、高速検索処理を可能とした。
見本特徴間距離計算部36は、見本特徴作成部34から入力される各見本特徴間の距離を計算し、計算結果の見本特徴間距離を見本特徴間距離格納部37に記憶させる。
蓄積特徴量子化部38は、蓄積画像の特徴である蓄積特徴を、見本特徴格納部35に格納された見本特徴と比較することにより、相当する見本特徴の符号を割り当て、符号の集合である蓄積量子化特徴を求める。
これにより、第7の実施例における蓄積部分領域特徴抽出部2および目的部分領域特徴抽出部5は、それぞれ蓄積量子化特徴、目的量子化特徴から蓄積部分領域特徴、目的部分領域特徴を抽出することとなる。
索引検索部6ならびに類似度計算部200は、目的部分領域特徴と蓄積連結特徴との距離を、見本特徴間距離を用いて逐次計算し、類似することが確認された場合に、蓄積量子化特徴上の該箇所に目的量子化特徴と同じ大きさの照合窓を設定し、目的量子化特徴と照合窓の距離を計算する。
まず、見本特徴作成部34は、後に説明する見本特徴を抽出するため、必要に応じて、外部から学習信号を読み込む。
上記学習信号としては、例えば、1000枚の画像群など、目的画像と蓄積画像との比較に対して、十分となる多数の(複数の)画像信号を用いる。しかしながら、下記に説明する確率分布を用いた見本特徴の作成手順のように、学習信号を用いない場合、上述した学習信号を読み込む必要はない。
そして、見本特徴作成部34は、画像の特徴の典型的なパターンである見本特徴を複数作成する。このとき、見本特徴作成部34は、見本特徴の作成において、多次元ガウス分布といった確率分布に基づいて、各見本特徴間のパターンの類似性を低くしてランダムに発生させることにより、複数の見本特徴の作成を行うことができる。
ここで、見本特徴作成部34は、学習信号の特徴ベクトルをベクトル量子化により分類する際、例えば、ベクトル量子化の符号語数がn個であれば、入力される学習特徴をn個の集合(以下、クラスタと呼ぶ)のいずれかに分類する。
そして、見本特徴作成部34は、各クラスタに所属する学習特徴の重心となる特徴を抽出して、抽出された学習特徴を見本特徴として出力する。
これにより、見本特徴作成部34は、抽出された見本特徴を見本特徴格納部35に記憶させるとともに、見本特徴間距離計算部36に対して、見本特徴のクラスタを出力する。
このとき、見本特徴間距離計算部36は、例えば、各見本特徴(特徴ベクトル)間の自乗誤差を計算し、計算結果を見本特徴間距離とすることができる。
そして、見本特徴間距離計算部36は、上述のように計算したすべての見本特徴の組合せ、すなわち見本特徴対毎の見本特徴間距離を見本特徴間距離格納部37に記憶する。
このとき、蓄積特徴量子化部38は、符号を割り当てる処理の対象である一つの蓄積特徴に対し、すべての見本特徴との距離を計算し、例えば蓄積特徴と見本特徴との間の自乗誤差を計算し、この自乗誤差の計算結果により最も距離が近いと判断された見本特徴に対応した符号を、この蓄積特徴の符号とする。
ここで、蓄積特徴量子化部38は、例えば、見本特徴格納部35に記憶されている見本特徴の数がn個である場合、各見本特徴に1からnまでの番号を付与し、この番号を量子化の符号とする。
上述したように、蓄積特徴量子化部38は、蓄積特徴のベクトル量子化を蓄積映像の映像フレーム毎に行い、映像フレーム単位の蓄積量子化特徴とし、この蓄積量子化特徴を蓄積部分領域特徴抽出部2に対して出力する。
つまり、蓄積部分領域特徴抽出部2は、すでに説明した第6の実施例と同様に注目窓を設定し、この設定された注目窓内に重複も隙間もなく小領域を配置し、この小領域に対応する符号を順に並べて特徴ベクトルとした蓄積部分領域特徴を抽出する。
そして、索引付与部3は、読み込んだ上記見本特徴のクラスタと、見本特徴間距離とに基づいた、蓄積部分領域特徴連結部20から出力される蓄積連結特徴に対し、検索を容易にするための索引を付与する。
ここで、本実施例において、索引付与部3は、読み込んだ見本特徴のクラスタを用い、まず蓄積連結特徴を構成する各符号を、対応する見本特徴の特徴ベクトルに展開し、続いて第6の実施例と同様の手法(特許第3574075号)、すなわち、予め作成されたベクトル量子化符号帳により、蓄積連結特徴の特徴をベクトル量子化し、得られた符号を索引とする。
このとき、索引付与部3は、例えば、ベクトル量子化の符号語数がh個である場合、蓄積連結特徴をh個のクラスタのいずれかに分類することになる。
また、索引付与部3における索引付与の方法に関する他の実施形態として、符号列を展開して作成した特徴ベクトルについて、第6の実施形態にて述べたR*−Tree及びSR−Treeといった多次元インデックス手法を用いても良い。
この場合、索引付与部3は、例えば、予めこれら蓄積連結特徴の基準となるテンプレート(特徴ベクトルのパターン)を複数作成しておき、このテンプレートと蓄積連結特徴とを比較し、蓄積連結特徴との距離(自乗距離など)が最も小さくなるテンプレートに対応する符号を、この蓄積連結特徴の索引としても良い。
さらに、他の実施形態として、索引付与部3は、M−Tree(“M-Tree: an efficient access method for similarity search in metric spaces”, P. Ciaccia 他二名, Proc. of VLDB Conference, pp.426-435, 1997)等に記載されているように、符号列の間に定義された任意の距離関数を用いて、蓄積連結特徴を構成する符号列に直接索引を付与することができる。
そして、目的特徴量子化部39は、蓄積特徴量子化部38と同様に、各目的特徴と読み込んだクラスタの各見本特徴との照合処理を行い、この照合結果により、目的特徴と照合すると判定された見本特徴に対応した符号を一つ割り当てる。
また、目的特徴量子化部39は、目的特徴の量子化を目的画像または目的映像の映像フレーム毎に行って目的量子化特徴とし、これを目的部分領域特徴抽出部5に対して出力する。
つまり、目的部分領域特徴抽出部5は、第6の実施例と同様にして設定された注目窓において、この注目窓内に重複も隙間もなく小領域を配置し、この小領域に対応する符号を順に並べて特徴ベクトルとした目的部分領域特徴が抽出される。
ここで、索引検索部6は、目的部分領域特徴のクラスタと、蓄積連結特徴との間の類似性を判定する特徴ベクトル間の距離の計算を行う。
すなわち、索引検索部6は、見本特徴間距離を用いて、蓄積連結特徴の特徴ベクトルと、目的部分領域特徴のクラスタ重心との距離を算出し、距離値が最小となるクラスタに蓄積連結特徴を所属させ、このクラスタに対応する符号語を出力することによって、類似性の判定を行う。ここで用いるクラスタ選択のアルゴリズムは、第6の実施例に記載されているため、詳細の説明を省略する。
すなわち、類似度計算部200における特徴照合部7は、ある蓄積連結特徴に類似する目的部分領域特徴が検出された場合、この蓄積連結特徴が帰属する蓄積量子化特徴(の集合)に、目的量子化特徴(目的画像または目的映像のフレームサイズ)と同じ大きさの照合窓を設定し、目的量子化特徴と蓄積量子化特徴における照合窓との類似度を計算する。
すなわち、特徴照合部7は、目的画像または目的映像に類似する部分映像が存在する可能性があると判断された、時間軸に連続した蓄積部分領域特徴の集合に対して、目的量子化特徴と同じ大きさの照合窓をそれぞれ設定し、目的量子化特徴と、蓄積量子化特徴上の照合窓における領域との類似度を求めることとなる。
以下、本発明の第8の実施例による映像検索装置を図面を参照して説明する。図15は上記第8の実施例の映像検索装置の一構成例を示すブロック図である。
この図において、映像検索装置は、蓄積特徴抽出部1と、蓄積特徴連結部40と、索引付与部3と、索引格納部30と、目的特徴抽出部4と、索引検索部6と、一次照合部201及び二次照合部202からなる類似度計算部300とで構成されており、検索対象の目的画像が入力されることにより、既に登録されている蓄積映像の中から、上記目的画像と類似する映像フレームあるいはその一部分の探索を行い、探索結果として、上記目的画像と類似する画像が含まれている蓄積映像中の映像フレーム内の位置情報を出力する。
蓄積部分領域特徴抽出部2は、上記蓄積特徴抽出部1から出力される蓄積特徴に対し、予め設定された所定の大きさの注目窓を所定の間隔で複数設定し(所定の間隔でずらし)、各注目窓の範囲に含まれる蓄積特徴を、蓄積部分領域特徴として抽出する。
蓄積部分領域特徴連結部20は、上記蓄積部分領域特徴抽出部2から出力される蓄積部分領域特徴を、それぞれに位置的に近いものを時間軸方向に順次連結し、各連結ブロック内の特徴である蓄積連結特徴を導く。
索引格納部30は、上記索引付与部3の出力する索引を格納する。
目的特徴抽出部4は、目的画像、または目的映像の各映像フレームから目的特徴(特徴ベクトル)を抽出する。
蓄積特徴連結部40は、蓄積特徴抽出部1で抽出された蓄積特徴を用い、この蓄積特徴を時間方向において、蓄積特徴における特徴ベクトルの距離の近い蓄積特徴を連結させた特徴である蓄積連結特徴を作成する。
また、索引検索部6は、上記索引により類似する蓄積連結特徴が検出された場合、この検出した蓄積連結特徴を類似度計算部300に送出し、一方、何も検出されなかった場合、この処理において映像検索処理を終了する。
そして、類似度計算部300は、索引検索部6により検出された全ての蓄積連結特徴について照合が終了した場合、その照合結果を出力し、映像検索処理を終了する。
蓄積特徴抽出部1は、与えられた蓄積映像を読み込んで入力し、蓄積映像から映像フレームごとに蓄積特徴を抽出する。
このとき、蓄積特徴抽出部1は、入力された蓄積映像の各フレームから、小領域(横bxピクセル、縦byピクセル)を縦横1ピクセルずつずらしながら取り出し、各小領域におけるRGB(Red,Green,Blueの3原色)各色の画素について平均値を計算する。ここで、蓄積特徴は小領域内のRGBそれぞれの平均画素値からなる3次元ベクトルからなる特徴ベクトルにより表現される。
さらに他の実施形態として、入力された蓄積映像から小領域(横bxピクセル、縦byピクセル、時間方向btフレーム)を縦横1ピクセルずつ、時間方向1フレームずつずらしながら取り出し、各小領域のRGB各々に対して公知のディジタル映像処理技術である3次元DCTを施し、その係数ベクトルを利用する方法もある。
蓄積特徴抽出部1は、上述したように、各映像フレームにおいて抽出した蓄積特徴の集合を、蓄積部分領域特徴抽出部2に出力する。
そして、蓄積部分領域特徴抽出部2は、蓄積特徴抽出部1から入力される蓄積特徴の集合に対し、注目窓を所定の間隔にて複数設定し、注目窓内の特徴である蓄積部分領域特徴を抽出する。
蓄積特徴連結部40は、蓄積特徴抽出部1から入力される蓄積特徴の集合について、時間軸方向に連続する蓄積部分領域特徴を所定の基準で連結し、各連結ブロック内の特徴である蓄積連結特徴を導き、索引付与部3へ出力する。
ここで、蓄積特徴抽出部1は、他の実施形態として、例えば、以下に述べる蓄積特徴点抽出処理部1Aと蓄積局所特徴抽出処理部1Bとから構成しても良い。
上記蓄積特徴点抽出処理部1Aにおいては、蓄積映像の各フレーム(映像フレーム)から、ある種の変動に対して頑健な点である蓄積特徴点を抽出する。
例えば、スケール変化や見えの(見た目における構成の若干の)違いなどの幾何学変動に対して頑健な手法として、以下の文献1( “Distinctive image features from scale-invariant keypoints”, D.G.Lowe, International Journal of Computer Vision, Vol.60, No.2, pp.91-110, 2004)、又は文献2(”Scale & Affine invariant interest point detectors”, K.Mikolajczyk 他1名, International Journal of Computer Vision, Vol.60, No.1, pp.63-86, 2004)に記載の方法を用いることができる。
まず、蓄積特徴点抽出処理部1Aは、元の映像フレームから既知の方法によりスケールスペース画像を作成し、各スケールから蓄積特徴点の候補である候補点を抽出する。
ここで、スケールスペース画像とは、元画像を一定の比率βにより順次縮小した大きさの異なる(すなわち画素数の異なる)複数画像の集合を指している。
上記候補点の抽出には、例えば、以下の(20)式で定義される正規化Harris operator h(x,y,σ)を用いる。
そして、蓄積特徴点抽出処理部1Aは、スケールスペース画像において、各スケールの画像におけるHarris operator h(x,y,σ)の極大点となる画素を、頑健な点である蓄積特徴点の抽出対象の候補である候補点として抽出する。
次に、蓄積特徴点抽出処理部1Aは、抽出された上記候補点(各スケールの画像に複数存在)について、候補点の抽出されたスケール及びその前後のスケールの画像を用いて、以下の(21)式で定義される正規化Laplacian operator LoG(x,y,z)を計算する。
ただし、以下の(21)式において、Laa(ここで、a=x又はy)はa方向(x方向またはy方向)の2回微分操作である。
この各スケールの画像における正規化Laplacian operatorの比較を行う場合、評価対象の候補点がある画像のスケールに対し、前後のスケールの画像を対応させ、各スケールの画像の画素数を変化させずに、縮小または拡大を行うことでスケールを変化させ、評価対象の候補点と、最も近い位置にある、スケールを変化させた前後の画像の画素との正規化Laplacian operatorの比較を行う。
この局所領域は、座標(x、y)の画素に対して、下記(22)式におけるΣの上部に記載された定数hx(x方向の画素数)及びhy(y方向の画素数)で規定される領域を示している。
上記蓄積特徴としては、例えば、蓄積特徴点周辺のgradient(勾配)、蓄積特徴点周辺の局所領域で計算したgradientのヒストグラム、ガウシアンフィルタ係数の高次微分を係数とするフィルタの出力(Gaussian derivative)、あるいは以下の(22)式の特徴関数などを用いることができる。この(22)式において、D(x,y)は、映像フレームD上の座標(x、y)におけるピクセル値である。
すなわち、まず、蓄積特徴連結部40は、連結を開始するある蓄積特徴点がある場合、次に、時間軸に連続する次の映像フレーム上に、該蓄積特徴点pj(D)=(xj,yj)を中心とする、以下の(23)式に示すガウス分布を設定する。
この(23)式において、αは連結する特徴点の座標位置の範囲を規定する定数であり、大きくすることにより連結する特徴点の座標位置の範囲を広げて連結し易くし、一方、小さくすることにより連結する特徴点の座標位置の範囲を狭めて連結を制限することとなる。
すなわち、蓄積特徴点抽出処理部1Aは、重み付き正規化Harris operator h~(x,y,σ)を以下に示す(24)式のように定義し、すでに述べた(重みなし)正規化Harris operatorに代わって、重み付きHarris operatorに基づいて連結する特徴点の候補を抽出する。
このように、蓄積特徴抽出部1と蓄積特徴連結部40とが、上述した処理を時間軸方向に再帰的に繰返すことにより、蓄積映像のフレーム数だけ蓄積特徴を連結することができる。
ここで、連結閾値は小さくすることにより、特徴点としての特徴をより強めることができ、一方、大きくするに従い曖昧な特徴をも許容することとなり、本実施形態を使用するアプリケーション毎に実験値として求めて設定される。
すなわち、蓄積特徴連結部40は、過去の映像フレーム間における連結された蓄積特徴点の座標の移動量の平均値から、現在のフレームにおける連結するか否かの判定を行う対象の蓄積特徴の座標の線形予測をおこなっている。
すなわち、索引付与部3は、蓄積特徴連結部40から出力された蓄積連結特徴に対し、以下に示すように、検索を容易にするための索引を付与する。
本実施例においては、特許文献(特許第3574075号「信号検出方法、信号検出装置、記録媒体及びプログラム」)に記載された手法を用い、予め作成されたベクトル量子化符号帳により蓄積連結特徴の特徴ベクトルをベクトル量子化し、得られた符号を索引とする。上記符号と、この符号に対応した見本特徴としての特徴ベクトルとの対応がベクトル量子化符号帳に記載されており、例えば、ベクトル量子化の符号語数(符号の数)がC個(C個のクラスタ)であれば、蓄積連結特徴は特徴ベクトルの距離がより近い、見本特徴の符号に振り分けられ、C個のクラスタのいずれかに分類されることになる。
ここで、ベクトル量子化は、例えば自乗誤差を距離関数として用い、蓄積連結特徴ベクトルとクラスタ重心との距離を算出し、距離値が最小となるクラスタに蓄積連結特徴を所属させ、このクラスタに対応する符号語を出力することによって行われる。
これらの手法は、特徴の存在する多次元空間内で特徴を包含する領域を階層的に作成し、作成されたなかで最下層の領域と特徴とを対応づけることにより索引を付与している。
この特徴を包含する上記領域は、R*−Treeであれば3次元空間における直方体に相当する超直方体であり、SR−Treeであれば超直方体と、3次元空間における球に相当する超球との重なりとなる。
すなわち、映像検索装置が、目的画像または目的映像、及び蓄積映像を同時に読み込み、リアルタイムで検索を行うアプリケーションの場合、索引付与部3は索引を索引検索部6へ送出し、一方、それ以外の場合、索引格納部30へ蓄積映像ごとに索引の登録処理を行う。
すなわち、目的特徴抽出部4は、例えば、すでに説明した蓄積特徴抽出部1と同様にして、特徴点抽出処理部4Aと局所特徴抽出処理部4Bとによって構成される処理により、目的画像より目的特徴を抽出する。
あるいは、蓄積特徴抽出部1において他の特徴抽出手段を用いる場合には、目的特徴抽出部4は、これと同様の手法で特徴抽出を行う。
目的特徴抽出部4は、目的特徴(特徴ベクトル)の集合を索引検索部6へ出力する。
索引検索部6は、目的特徴抽出部4から入力される目的特徴の集合、および索引付与部3から索引を読み込む。
また、索引検索部6は、目的画像または目的映像、及び蓄積映像を同時に入力してリアルタイムに類似を判定する場合以外、索引格納部30から順次索引を読み出して、目的部分領域特徴と比較を行う。
そして、索引検索部6は、読み込んだ上記索引を用い、目的特徴の集合に類似した蓄積連結特徴の検索を行う。
上記距離計算は、後述する類似度計算部300で行われる処理と同様である。すなわち、上記距離値は、例えば特徴ベクトル間の距離関数とし、自乗誤差により計算することができる。
例えば、テンプレートを用いた量子化によって索引を付与した場合、すなわち特許第3574075号に記載された手法により索引を付与した場合、以下のようにして所望の蓄積連結特徴である検索候補特徴を抽出することができる。
すなわち、索引検索部6は、目的特徴と、索引付与部3で作成された索引(クラスタを示す符号)と、選択閾値θ2とを読み込む。
次に、索引検索部6は、目的部分領域特徴と各クラスタ重心との距離を計算し、この計算結果の距離値が選択閾値θ2を下回るクラスタを選択することにより、このクラスタに所属する蓄積連結特徴をすべて抽出する。
図4は、点Q、C1、C2の3点が乗るような平面であり、特徴ベクトルが配置される特徴空間を切り出した様子を示している。
ここで、点Qは目的特徴、C1は目的特徴Qが所属しているクラスタのクラスタ重心、C2は他のクラスタのクラスタ重心を表しており、距離dQ1、dQ2、d12は、それぞれ、点Qと点C1との距離、点Qと点C2との距離、点C1と点C2との距離を示している。
ここで、目的特徴の座標である点Qからの距離dtが、選択閾値θ2以内である蓄積連結特徴を抽出しなければならないとすると、点Qを中心とする半径θ2の超球(図4においては円)の内部にある蓄積連結特徴がそれに該当することになる。
このため、選択閾値θ2が図4における距離dθより大きくなったとき、そのクラスタを選択する。dθは、上述した(13)式より導かれる(14)式から求められる。
さらに、蓄積連結特徴に対応する連結最大差分値を考慮して、索引検索部6は、すでに述べた(15)式が成り立つとき、点C2に対応するクラスタを選択し、そのクラスタに属する蓄積連結特徴のすべてを抽出する。
そして、索引検索部6は、上述した手順を、目的特徴Qの所属するクラスタを除くすべてのクラスタに対して行い、抽出された目的特徴に類似する可能性のある蓄積連結特徴を類似度計算部300に対して出力する。ここで、目的特徴に類似する可能性のある蓄積連結特徴の集合をFとする。
一方、索引検索部6は、目的特徴に類似する可能性のある蓄積連結特徴が検出されなかった場合、映像検索装置における検索処理をここで終了する。
上記一次照合部201は、検索候補特徴と目的特徴との類似値である部分類似値を計算する。ここで、一次照合部201は、この部分類似値として、例えば、検索候補特徴と目的特徴との、すなわち検索候補特徴の特徴点と目的特徴の特徴点との自乗距離を計算して出力する。
そして、一次照合部201は、該部分類似値が前述の選択閾値θ2を下回る(未満)ことを検出すると、検索候補特徴と目的特徴との類似性があると判定する。
このとき、一次照合部201は、重ね合わせた各スケールの蓄積特徴点に対し、原画像における最も近くにある画素を蓄積特徴点とし、スケールの要素を持たない位置情報のみの蓄積特徴点とする。
この定数γは、類似とするか否かを判定する基準を調整するものであり、小さくすることにより、より近い特徴を有する類似であるとする精度の高い類似を行うことができ、大きくすることにより、ある程度類似したものも類似しているとする精度の低い評価を行うこととなる。
ただし、二次照合部202は、d(fD,fQ)が選択閾値θ2を下回る蓄積特徴が検出されない(蓄積画像中に1つも存在しない)場合、その目的特徴に対する加算を行わない。
そして、二次照合部202は、最終的に、加算結果の全体類似値が検索閾値θ以上であることを検出した場合、目的画像に類似する部分領域が蓄積画像中に存在していると判定する。
蓄積画像中の上記部分領域は、例えば、各目的特徴とのd(fD,fQ)が最も小さくなる蓄積特徴に対して、この蓄積特徴に対応する蓄積画像中の点を覆う最小の方形とする。
本実施例においては、第6及び第7の実施例とは異なり、選択閾値θ2と検索閾値θとは独立に決定される値である。
まず、蓄積特徴点抽出処理部1Aは、上記(23)式に示すガウス分布を、次の映像フレームにおける蓄積特徴点抽出処理におけるHarris operatorの重み付けに利用し、重み付き正規化Harris operator h~(x,y,σ)を(24)式ように定義し、重み付きHarris operatorに基づいて連結する特徴点の候補を抽出する(S702)。
そして、蓄積特徴点抽出処理部1Aは、スケール方向の各スケールの画像において、評価対象の候補点のあるスケールの画像に対して、このスケールの画像の候補点と、前後のスケールの画像の画素とに対して正規化Laplacian operator を計算し、前後のスケールの画像の画素に対して、上記候補点でのLaplacian operatorの値が極大となっているとき、この候補点を蓄積特徴点として採用する(S703)。
次に、蓄積特徴連結部40は、上記蓄積特徴抽出部1で抽出された蓄積特徴を用い、この蓄積特徴を時間方向において、蓄積特徴における特徴ベクトルの距離の近い蓄積特徴を連結させた特徴である蓄積連結特徴の作成を、映像フレームごとに繰り返して実行し、逐次、特徴抽出と特徴連結との処理を行い(S706)、処理結果として蓄積連結特徴を出力する(S707)。
また、この時点において、目的特徴抽出部4は、ユーザから与えられた目的画像を読み込んで入力し、読み込んだ目的画像から、すでに説明した蓄積特徴抽出部1と同様にして、特徴点抽出処理部4Aと局所特徴抽出処理部4Bとによって構成される処理により、目的画像より目的特徴を抽出している。
このとき、索引検索部6は、全ての蓄積連結特徴から目的特徴に類似する検索候補特徴が検出されない場合、処理をステップS716へ進め、検出された場合、処理をステップS731へ進める(S712)。
すなわち、一次照合部201は、この部分類似値として、例えば、検索候補特徴と目的特徴との、すなわち検索候補特徴の特徴点と目的特徴の特徴点との自乗距離を計算して、特徴点間距離として出力する(S713)。
そして、二次照合部202は、蓄積画像Dと目的画像Qとの類似値、すなわち画像間の類似値として全体類似値の計算を、上記(25)式により行う(ステップS715)。
4…目的特徴抽出部 5…目的部分領域特徴抽出部 6…索引検索部
7…特徴照合部 8…照合結果判定部 9…特徴再照合部
10…照合結果再判定部 11…検索結果候補選択部
12…次目的部分領域特徴選定部 13…次連結特徴選定部
14…検索閾値更新部 15…目的代表特徴抽出部
16…目的部分領域間距離計算部 17…周辺距離下限値計算部
20…蓄積部分領域特徴連結部 30…索引格納部
31…検出結果判定部 32…検出結果再判定部
33…検出結果候補選択部 34…見本特徴作成部
35…見本特徴格納部 36…見本特徴間距離計算部
37…見本特徴間距離格納部 38…蓄積特徴量子化部
39…目的特徴量子化部 40…蓄積特徴連結部
100,200,300…類似度計算部
201…一次照合部 202…二次照合部
Claims (19)
- 予め登録された動画像である蓄積映像から、検索対象となる静止画像である目的画像に類似した映像フレームあるいはその一部分を検出する映像検索方法において、
蓄積映像のある映像フレームの特徴である蓄積特徴を抽出する蓄積特徴抽出過程と、
前記蓄積特徴抽出過程で抽出される蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結過程と、
前記蓄積連結特徴に各々索引を付与する索引付与過程と、
目的画像の特徴である目的特徴を抽出する目的特徴抽出過程と、
前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索過程と、
前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合段階と、前記目的画像と前記蓄積映像中の映像フレームあるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合段階とからなる類似度計算過程と
を備えることを特徴とする映像検索方法。 - 予め登録された動画像である蓄積映像から、検索対象となる動画像である目的映像に類似した映像区間あるいはその一部分を検出する映像検索方法であり、
前記蓄積映像から蓄積特徴を導く蓄積特徴抽出過程と、
前記蓄積特徴抽出過程で抽出される蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結過程と、
前記蓄積連結特徴に各々索引を付与する索引付与過程と、
目的映像の特徴である目的特徴を抽出する目的特徴抽出過程と、
前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索過程と、
前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合段階と、前記目的映像と前記蓄積映像の映像区間あるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合段階とからなる類似度計算過程と、
を備えることを特徴とする映像検索方法。 - 前記蓄積特徴にて所定の大きさの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、
前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程と
をさらに有し、
前記蓄積連結過程にて、前記蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
前記類似度計算過程が、
前記索引検索過程により抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、
該距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程と
からなる一次照合段階と、
前記照合結果判定過程にて、目的画像と類似する映像フレームの一部分が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的画像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、
前記特徴距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在するか否かを判定する照合結果再判定過程と
前記照合結果再判定過程にて、目的画像と類似する映像フレームの一部分が存在すると判定された蓄積映像中の箇所を検索結果候補とする検索結果候補選択過程と、
前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、
前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程と
からなる二次照合段階と
を備えることを特徴とする請求項1記載の映像検索方法。 - 前記蓄積特徴にて所定の大ききの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出過程と、
前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出過程と
をさらに有し、
蓄積特徴連結過程にて、蓄積部分領域特徴抽出過程で抽出される蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索過程にて、前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
前記類似度計算過程が、
前記索引検索過程にて抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合過程と、
該距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定過程と
からなる一次照合段階と、
該照合結果判定過程にて目的映像と類似する部分映像区間が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的映像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合過程と、
前記特徴距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する否かを判定する照合結果再判定過程と、
前記照合結果再判定過程にて、目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、検索結果候補とする検索結果候補選択過程と、
前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定過程と、
前記索引検索過程にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定過程と
からなる二次照合段階と
を備えることを特徴とする請求項2記載の映像検索方法。 - 前記蓄積特徴連結過程において、前記蓄積特徴抽出過程にて抽出された蓄積特徴を、予め与えられた長さの分だけ時間軸方向に連結することを特徴とする請求項1から請求項4のいずれかに記載の映像検索方法。
- 前記蓄積特徴連結過程において、連結する対象となる前記蓄積特徴間の差分の最大値が予め定められた閾値である連結閾値を上回るまで時間軸方向に連結することを特徴とする請求項1から請求項4のいずれかに記載の映像検索方法。
- 前記照合結果再判定過程において、前記特徴再照合過程で導かれた距離と、前記距離に対応する閾値である検索閾値とを比較することにより、目的画像と類似する映像フレームの一部分または目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在するか否かが判定され、
前記索引検索過程において、いずれかの前記目的特徴との距離が、前記検索閾値から決定される選択閾値を下回る蓄積連結特徴を前記索引により抽出し、
前記照合結果判定過程において、前記距離と前記選択閾値とを比較することにより、目的画像と類似する映像フレームの一部分または目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定することを特徴とする請求項3から請求項6のいずれかに記載の映像検索方法。 - 前記二次照合過程において、目的画像と類似する映像フレームの一部分あるいは目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、前記特徴距離が小さい順に、予め定められた数量だけ選択して検索結果候補とし、
該検索結果候補から、前記特徴距離に基づいて、ある候補を検出し、該候補の距離値を新たに検索閾値として設定する検索閾値更新過程と
をさらに備えることを特徴とする請求項7に記載の映像検索方法。 - 前記索引検索過程において、前記目的特徴抽出過程にて導かれた全ての目的特徴を用いて、候補を抽出することを特徴とする請求項1から請求項8のいずれかに記載の映像検索方法。
- 前記目的部分領域特徴抽出過程で導かれた目的部分領域特徴を分類し、各分類を代表する部分領域特徴である代表特徴を抽出する目的代表特徴抽出過程と
をさらに備え、
前記索引検索過程において、前記目的部分領域特徴に替え、前記目的部分領域特徴抽出過程で導かれた各代表特徴を用いることを特徴とする請求項3から請求項8のいずれかに記載の映像検索方法。 - 前記次目的部分領域特徴選定過程において、蓄積部分領域特徴との距離が選択閾値を超えることが検出された、前記目的部分領域特徴抽出部にて抽出された目的部分領域特徴を、次に照合すべき部分領域特徴として指定せずに省略することを特徴とする、請求項3から請求項10のいずれかに記載の映像検索方法。
- 前記目的部分領域特徴の集合において、各目的部分領域特徴間の距離値を計算する目的部分領域特徴間計算過程と、
前記特徴照合過程において計算されたある目的部分領域特徴と蓄積連結特徴との間の距離値と、前記目的部分領域特徴間の距離値とを用いて、該蓄積連結特徴と照合を行う残りの目的部分領域特徴について距離下限値を更新する周辺下限値計算過程と
をさらに有し、
前記次目的部分領域特徴選定過程に置いて、前記距離下限値と選択閾値とを比較し、距離下限値が選択閾値を下回る目的部分領域特徴を、次に照合すべき目的部分領域特徴として指定する
ことを特徴とする請求項11に記載の映像検索方法。 - 見本となる特徴パターンである見本特徴を複数種類作成する見本特徴作成過程と、
前記見本特徴間の距離を計算する見本特徴間距離計算過程と
前記蓄積特徴抽出過程において抽出された前記蓄積特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される蓄積量子化特徴を導く蓄積特徴量子化過程と、
前記目的特徴抽出過程において抽出された前記目的特徴について、前記見本特徴に対応する符号を割り当て、該符号より構成される目的量子化特徴を導く目的特徴量子化過程と
をさらに備え、
前記索引付与過程が前記見本特徴間距離に基づき前記蓄積特徴あるいは前記蓄積部分領域特徴に索引を付与し、
前記索引検索過程ならびに前記類似度計算過程において前記目的特徴と前記蓄積連結特徴との類似値を前記見本特徴間距離を用いて逐次計算する、あるいは前記索引検索過程ならびに前記特徴照合過程において前記目的部分領域特徴と前記蓄積連結特徴との距離を前記見本特徴間距離を用いて逐次計算することを特徴とする請求項1から請求項12のいずれかに記載の映像検索方法。 - 予め登録された動画像である蓄積映像から、検索対象となる静止画像である目的画像に類似した映像フレームあるいはその一部分を検出する映像検索装置において、
蓄積映像のある映像フレームの特徴である蓄積特徴を抽出する蓄積特徴抽出部と、
前記蓄積特徴抽出部が抽出する蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結部
前記蓄積連結特徴に各々索引を付与する索引付与部と、
目的画像の特徴である目的特徴を抽出する目的特徴抽出部と、
前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索部と、
前記索引検索部により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合部と、前記目的画像と前記蓄積映像中の映像フレームあるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合部とからなる類似度計算部と
を備えることを特徴とする映像検索装置。 - 予め登録された動画像である蓄積映像から、検索対象となる動画像である目的映像に類似した映像区間あるいはその一部分を検出する映像検索装置であり、
前記蓄積映像から蓄積特徴を導く蓄積特徴抽出部と、
前記蓄積特徴抽出部が抽出する蓄積特徴を時間軸方向に順次連結し、蓄積連結特徴として出力する蓄積特徴連結部と、
前記蓄積連結特徴に各々索引を付与する索引付与部と、
目的映像の特徴である目的特徴を抽出する目的特徴抽出部と、
前記目的特徴に類似する蓄積連結特徴を、前記索引を用いて抽出する索引検索部と、
前記索引検索部により抽出された蓄積連結特徴に対応する蓄積特徴と、前記目的特徴との類似値である部分類似値を計算する一次照合部と、前記目的映像と前記蓄積映像の映像区間あるいはその一部分との類似値である全体類似値とを前記部分類似値に基づいて計算する二次照合部とからなる類似度計算部と、
を備えることを特徴とする映像検索装置。 - 前記蓄積特徴にて所定の大きさの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出部と、
前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出部と
をさらに有し、
前記蓄積連結部にて、前記蓄積部分領域特徴抽出部の抽出する蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索部にて前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
前記類似度計算部が、
前記索引検索部により抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合部と、
該距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定部と
からなる一次照合段階と、
前記照合結果判定部にて目的画像と類似する映像フレームの一部分が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的画像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合部と、
前記特徴距離に基づいて、目的画像と類似する映像フレームの一部分が蓄積映像中の当該箇所に存在するか否かを判定する照合結果再判定部と
前記照合結果再判定部にて、目的画像と類似する映像フレームの一部分が存在すると判定された蓄積映像中の箇所を検索結果候補とする検索結果候補選択部と、
前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定部と、
前記索引検索部にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定部と
からなる二次照合部と
を備えることを特徴とする請求項14記載の映像検索装置。 - 前記蓄積特徴にて所定の大ききの注目窓を所定の間隔でずらしつつ、各位置における注目窓内の特徴を、蓄積部分領域特徴として抽出する蓄積部分領域特徴抽出部と、
前記目的特徴に所定の大きさの注目窓を設定し、該注目窓をずらしつつ、各位置における注目窓内の特徴を、目的部分領域特徴として抽出する目的部分領域特徴抽出部と
をさらに有し、
蓄積特徴連結部にて、蓄積部分領域特徴抽出の抽出する蓄積部分領域特徴を時間軸方向に、順次連結し、蓄積連結特徴として出力し、前記索引検索部にて、前記目的部分領域特徴の集合に類似する蓄積連結特徴を、前記索引を用いて抽出し、
前記類似度計算部が、
前記索引検索部にて抽出された蓄積連結特徴に対応する蓄積部分領域特徴と、前記目的部分領域特徴との距離を計算する特徴照合部と、
該距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する可能性があるか否かを判定する照合結果判定部と
からなる一次照合部と、
該照合結果判定部にて目的映像と類似する部分映像区間が存在する可能性があると判定された蓄積映像中の箇所において、前記蓄積特徴に対し、目的映像と同一の大きさの照合窓を設定し、前記目的特徴との特徴距離を計算する特徴再照合部と、
前記特徴距離に基づいて、目的映像と類似する部分映像区間が蓄積映像中の当該箇所に存在する否かを判定する照合結果再判定部と、
前記照合結果再判定部にて、目的映像と類似する部分映像区間が存在すると判定された蓄積映像中の箇所を、検索結果候補とする検索結果候補選択部と、
前記目的部分領域特徴の集合の中から、次に照合すべき目的部分領域特徴を指定する次目的部分領域特徴選定部と、
前記索引検索部にて抽出された蓄積連結特徴の集合の中から、次に照合すべき蓄積連結特徴を指定する次連結特徴選定部と
からなる二次照合部と
を備えることを特徴とする請求項15に記載の映像検索装置。 - コンピュータに請求項1〜請求項13のいずれかに記載の映像検索方法を実行させるためのコンピュータが実行可能なプログラム。
- 請求項18に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005211231A JP4421527B2 (ja) | 2004-07-21 | 2005-07-21 | 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004212795 | 2004-07-21 | ||
JP2005211231A JP4421527B2 (ja) | 2004-07-21 | 2005-07-21 | 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006060796A true JP2006060796A (ja) | 2006-03-02 |
JP4421527B2 JP4421527B2 (ja) | 2010-02-24 |
Family
ID=36107856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005211231A Expired - Fee Related JP4421527B2 (ja) | 2004-07-21 | 2005-07-21 | 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4421527B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146490A (ja) * | 2006-12-12 | 2008-06-26 | Yahoo Japan Corp | 情報提供装置、情報提供方法、及びコンピュータプログラム |
JP4467017B1 (ja) * | 2009-07-01 | 2010-05-26 | 克己 井上 | 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。 |
US20110228163A1 (en) * | 2010-03-17 | 2011-09-22 | Panasonic Corporation | Imaging apparatus, camera body and interchangeable lens |
CN103257992A (zh) * | 2013-01-29 | 2013-08-21 | 中国科学技术大学 | 一种相似视频检索的方法及系统 |
CN107943903A (zh) * | 2017-11-17 | 2018-04-20 | 广州酷狗计算机科技有限公司 | 视频检索方法及装置、计算机设备、存储介质 |
CN109753584A (zh) * | 2018-12-06 | 2019-05-14 | 国电南瑞南京控制系统有限公司 | 一种风电设备的视频分布式存储与检索方法 |
-
2005
- 2005-07-21 JP JP2005211231A patent/JP4421527B2/ja not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146490A (ja) * | 2006-12-12 | 2008-06-26 | Yahoo Japan Corp | 情報提供装置、情報提供方法、及びコンピュータプログラム |
JP4467017B1 (ja) * | 2009-07-01 | 2010-05-26 | 克己 井上 | 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。 |
JP2011015109A (ja) * | 2009-07-01 | 2011-01-20 | Katsumi Inoue | 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。 |
US20110228163A1 (en) * | 2010-03-17 | 2011-09-22 | Panasonic Corporation | Imaging apparatus, camera body and interchangeable lens |
US8654228B2 (en) * | 2010-03-17 | 2014-02-18 | Panasonic Corporation | Imaging apparatus, camera body and interchangeable lens |
CN103257992A (zh) * | 2013-01-29 | 2013-08-21 | 中国科学技术大学 | 一种相似视频检索的方法及系统 |
CN107943903A (zh) * | 2017-11-17 | 2018-04-20 | 广州酷狗计算机科技有限公司 | 视频检索方法及装置、计算机设备、存储介质 |
CN109753584A (zh) * | 2018-12-06 | 2019-05-14 | 国电南瑞南京控制系统有限公司 | 一种风电设备的视频分布式存储与检索方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4421527B2 (ja) | 2010-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4545641B2 (ja) | 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体 | |
CN107256262B (zh) | 一种基于物体检测的图像检索方法 | |
WO2013129580A1 (ja) | 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム | |
KR101191223B1 (ko) | 이미지 검색 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체 | |
JP2000222581A (ja) | 形状情報を用いるマルチメディアデ―タの検索方法及び装置 | |
JP4421527B2 (ja) | 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体 | |
CN106156693A (zh) | 用于面部识别的基于多模型表示的鲁棒错误纠正方法 | |
CN110347868B (zh) | 用于图像搜索的方法和系统 | |
CN113821657A (zh) | 基于人工智能的图像处理模型训练方法及图像处理方法 | |
CN110751027A (zh) | 一种基于深度多示例学习的行人重识别方法 | |
US20070110308A1 (en) | Method, medium, and system with category-based photo clustering using photographic region templates | |
Etezadifar et al. | Scalable video summarization via sparse dictionary learning and selection simultaneously | |
Chehreghani | Efficient computation of pairwise minimax distance measures | |
JP3621323B2 (ja) | 映像登録・検索処理方法および映像検索装置 | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
CN105989063A (zh) | 视频检索方法和装置 | |
JP4957924B2 (ja) | 文書画像特徴量生成装置、文書画像特徴量生成方法及び文書画像特徴量生成用プログラム | |
Alshammari et al. | Approximate spectral clustering density-based similarity for noisy datasets | |
JP4343038B2 (ja) | 部分画像検索システム及び方法並びにプログラム | |
Syam et al. | An effective similarity measure via genetic algorithm for Content-Based Image Retrieval with extensive features | |
JP2017021606A (ja) | 動画像検索方法、動画像検索装置及びそのプログラム | |
JP6336827B2 (ja) | 画像検索装置、画像検索方法および検索システム | |
Burdescu et al. | Multimedia data for efficient detection of visual objects | |
CN106778811B (zh) | 一种图像字典生成方法、图像处理方法及装置 | |
JP4425719B2 (ja) | 部分画像検索方法、部分画像検索装置、部分画像検索プログラム、および、部分画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091202 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131211 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |