JP2011237879A - 類似映像検索装置 - Google Patents

類似映像検索装置 Download PDF

Info

Publication number
JP2011237879A
JP2011237879A JP2010106561A JP2010106561A JP2011237879A JP 2011237879 A JP2011237879 A JP 2011237879A JP 2010106561 A JP2010106561 A JP 2010106561A JP 2010106561 A JP2010106561 A JP 2010106561A JP 2011237879 A JP2011237879 A JP 2011237879A
Authority
JP
Japan
Prior art keywords
video
frame
similar
search
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010106561A
Other languages
English (en)
Other versions
JP5567384B2 (ja
Inventor
Hiroki Watanabe
裕樹 渡邉
Tsuneya Kurihara
恒弥 栗原
Naoto Akira
直人 秋良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010106561A priority Critical patent/JP5567384B2/ja
Priority to US13/037,720 priority patent/US8594437B2/en
Publication of JP2011237879A publication Critical patent/JP2011237879A/ja
Application granted granted Critical
Publication of JP5567384B2 publication Critical patent/JP5567384B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Analysis (AREA)

Abstract

【課題】大規模な映像アーカイブから高速かつ高精度に類似映像を検出する。
【解決手段】予め、映像アーカイブ中の各映像から一定時間間隔でフレームを抽出し、抽出されたフレームから画像特徴量を抽出し、抽出された画像特徴量をクラスタリングしてクラスタリング済み特徴量データベース205を構築する。複数フレーム検索部209では、データベース205を用いて、クエリ映像109の先頭フレーム503と同様に、後続フレーム504についても類似フレーム検索を行う。検索結果統合部210は、複数の検索結果510〜513の中に連続系列が存在するかを調べ、一定以上の連続性が認められた区間をクエリ映像の類似映像として出力する。
【選択図】図5

Description

本発明は、大規模な映像アーカイブから、入力映像に類似する映像の一覧を検出するための映像検索技術に関するものである。
テレビ映像のデジタルアーカイブ化やインターネット上の動画配信サービスの普及により、大規模な映像データを高速に検索・分類する必要性が増加している。特に、膨大な映像コンテンツに対して人手でテキスト情報を付与することが困難なことから、画像特徴を用いた映像検索技術が求められている。大規模な映像アーカイブには、同一あるいは類似映像が多数含まれるため、それらを高速に、また、できる限りもれなく検出できることが望ましい。また、スローモーションや早送り映像など、再生速度の異なる映像が含まれる場合は、これらも類似映像として検出できることが望ましい。
画像特徴を用いた静止画像検索手法としては、画像自体の持つ色や形状などの情報を高次元ベクトル情報として抽出し、ベクトル間距離をもとに画像間の類似性を評価して検索する方法が提案されている。また、k-means法などによって特徴量データをクラスタリングして保存しておくことで、大規模画像データに対しても高速な類似検索を実現する方法が知られている。
一方で、画像特徴を用いた従来の類似映像検索手法としては、クエリ映像と類似映像候補のフレーム毎の特徴量比較による手法が知られている。従来法の一般的な処理手順は、(1)クエリ映像からフレームを切り出して画像特徴量を計算し、(2)クエリ映像の先頭フレーム特徴量と距離が近いフレームを特徴量データベースから探して候補とし、(3)クエリ映像の後続フレームの特徴量と候補の後続フレームの特徴量の距離を計算し、(4)一定フレーム数以上の特徴量距離の合計値が閾値以下の候補を類似映像として出力する、というものである。
例えば、特開2009−22018号公報では、入力映像をフレーム間の特徴量が互いに特定の範囲内の変動幅で収まる区間に分割し、区間の代表フレームから抽出した特徴量を特徴量テーブルに保存しておき、新しいフレームが入力されたとき、特徴量テーブルから類似するフレームを探し、条件を満たすものすべてを候補とする。後続フレームが入力されたとき、そのフレームの特徴量が、候補の後続フレームの特徴量と一致するかを逐次照合していき、閾値以上の長さの特徴量が一致した候補を、類似映像として出力する。
非特許文献1「Tiny LSH for Content-based Copied Video Detection」は、ハッシュテーブルを用いることで、特徴量テーブルからの候補選択を高速化する方法を開示している。本手法では、フレーム特徴量に対して、複数個のハッシュ関数を用いて複数のハッシュ値を計算する。ここでは、似た特徴量からは同じハッシュ値が生成されるハッシュ関数を使用する。このハッシュ値と特徴量テーブルへのポインタを組とするハッシュテーブルを作成する。新しいフレームが入力されたとき、同様にハッシュ値を計算しハッシュテーブルを探索することで、特徴量の似たフレームへのポインタを得ることができる。ハッシュ値の衝突が起きた場合はポインタが書き換えられるが、複数のハッシュ値のいずれかからのポインタが存在していれば、特徴量テーブルから類似フレームを見つけることができる。このような候補選択手法は、ハッシュテーブルを用いたアルゴリズムであるため、その計算量はデータ量に依存せず一定である。
また、特開2000−339474号公報は、異なるフレームレートを持つ動画像の特徴量を比較する場合に正確な類似度を算出する方法を開示している。本手法は、クエリ映像の時間位置情報と、データベースに含まれる被検索映像区間の時間位置情報とを参照して、特徴量比較を行うフレーム位置を修正する手段を用いている。既知の動画像の再生位置情報を用いて特徴量の比較位置を決めているため、フレームレートの異なる類似映像も検知することができる。
特開2009−22018号公報 特開2000−339474号公報
K. Yoshida and N. Murabayashi, "Tiny LSH for Content-based Copied Video Detection," Proc. of SAINT 2008, IEEE CS, 2008.
従来手法では、先頭フレームの検索結果を候補として特徴量比較を行うため、そもそも先頭フレームの検索結果に現れない類似映像は検出することができない。先頭フレームをずらしながら、すべての候補を調べる方法が考えられるが、そのような処理には計算コストがかかる。特に、大規模な映像アーカイブの場合は、候補選択のための特徴量テーブルの探索に膨大な時間がかかる。また、類似映像が多数含まれる場合は、候補の後続フレーム特徴量の読み出しコスト、比較コストが増加する。
候補選択については、非特許文献1のように、ハッシュテーブルを用いることで高速化することができる。しかし、多数の類似映像が存在する場合、ハッシュ値の衝突が大量に発生し、特徴量テーブルにおいてハッシュテーブルからのポインタがないフレームが存在してしまう可能性が高い。
後続フレームの特徴量の比較のコストは、ハッシュテーブルを用いた場合でも同様である。特徴量テーブルの全エントリがメインメモリに保存できないほどの大規模映像アーカイブにおいては、特徴量データをハードディスクなどの補助記憶装置に格納する必要があり、特徴量の読み出しコストも無視することができない。
また、大規模アーカイブにおいては、再生速度の異なる映像が含まれる場合もあり、用途によってはそのような映像も検出できることが望ましい。特許文献2の手法では、既知の再生位置情報をもとに特徴量の比較位置を修正しているが、演出などによって再生速度が変えられたシーンを検出することはできない。時間情報を用いずに、複数のパターンで比較位置を修正する方法も考えられるが、すべての候補に対して複数回の特徴量比較処理を行うことは現実的ではない。
本発明は、数万時間規模の映像データに対して、高速かつ検出漏れの少ない類似映像検索を行う手法を提供することを目的とする。
本発明では、複数フレームの検索とその検索結果の統合による類似映像検索手法を用いる。本手法では、候補の後続フレームの特徴量比較を行わない。その代わり、クエリ映像の先頭フレームと同様に、クエリ映像の後続フレームについても類似フレーム検索を行い、複数の検索結果の中に連続系列が存在するかを調べる。通常の特徴量テーブルの探索では登録数に応じて検索時間が増加するため、本発明では、クラスタリング済みの特徴量データベースを構築しておくことで、複数回の類似フレーム検索を高速に行うことを可能としている。
以上の検索方法を実現する装置は、映像を入力する入力部と、入力部に入力された映像アーカイブの全映像から特徴量データベースを構築するデータベース構築部と、入力部に入力されたクエリ映像に類似する映像アーカイブ中の映像を検索する類似映像検索部と、類似映像検索部によって検索された類似映像の情報を出力する出力部とを備え、データベース構築部は、映像アーカイブ中の各映像から一定時間間隔でフレームを抽出し、抽出されたフレームから画像特徴量を抽出し、抽出された画像特徴量をクラスタリングして特徴量データベースを構築し、類似映像検索部は、クエリ映像から一定時間間隔でフレームを抽出し、抽出されたフレームから画像特徴量を抽出し、抽出されたクエリ映像の各々のフレームに対して画像特徴量を用いて特徴量データベースから類似フレームを検索し、クエリ映像の各々のフレームに対する類似フレームの検索結果から連続系列を探索し一定以上の連続性が認められた区間を類似映像と判定する。
特徴量データベースは、クラスタのIDとその代表値を関連付けした第1のデータ及び各クラスタに属するフレームのIDとその画像特徴量を関連付けした第2のデータを含み、第2のデータは同一クラスタに属するデータが記憶装置の連続領域に格納されている。第1のデータは主記憶装置に格納され、第2のデータは補助記憶装置に格納される。
一つの映像から一定時間間隔で抽出されたフレームに連続する整数値のIDが付されている場合、類似映像の判定に当たっては、一例として、クエリ映像の先頭フレームの類似フレームとして検索されたフレームのIDを類似映像の候補として登録し、m番目の後続フレームの類似フレームとして検索されたフレームのIDから(m−1)を引いたIDを投票先として順次投票を行い、得票数が一定数以上となった候補を類似映像と判定する。また、投票先のIDに隣接する一定範囲内の整数値のIDに対して投票を行うようにすると、再生速度の異なる類似映像を検出することができる。更に、後続フレームに対して類似フレームとして検索されたフレームの投票先の候補が未登録の場合、当該フレームのIDを新たな候補として登録するようにすれば、クエリ映像の先頭フレームを使った検索結果に現れない類似画像も検索することができる。
本発明では先頭フレームの検索結果のみを候補としないため、画質劣化やフレームサンプリングの位置ずれなどにより、先頭フレームでの候補選択に失敗する類似映像についても検出することができる。また、クエリ映像と候補映像の各フレームの特徴量を比較するのではなく、複数フレームの検索結果から連続性有するフレーム列を検出するだけでよいため、再生速度の異なる映像も検出することができる。さらに、類似映像が大量に含まれる大規模映像アーカイブにおいては、多数の候補の後続フレーム特徴量を特徴量データベースから読み出す必要がないため、高速に動作する。
本発明による類似映像検索装置のハードウェア構成例を示す図である。 本発明による類似映像検索装置の処理を説明する機能ブロック図である。 特徴量データベースの構造体を示す図である。 類似映像情報の構造体を示す図である。 類似映像検索部のデータフローを示す図である。 検索結果統合部の動作例を説明するための概略図である。 検索結果統合部の処理手順例を示すフローチャートである。 候補テーブルの構造体を示す図である。 検索結果統合部の投票処理の手順を示すフローチャートである。 再生速度の異なる映像の検索を説明するための概略図である。 従来法の類似映像検索部のデータフローを表す図である。 本発明の補助記憶装置へのアクセス回数を説明するための概略図である。 従来法の補助記憶装置へのアクセス回数を説明するための概略図である。 本発明による類似映像情報の表示画面例を示す図である。 本発明による類似映像情報の表示画面例を示す図である。
以下、図面を参照して、本発明の好適な実施形態について詳細に説明する。
図1は、本発明による類似映像検索装置のハードウェア構成の一例を示す図である。本実施例の類似映像検索装置は、一般的な計算機上に実装可能である。
本実施例の類似映像検索装置は、CPU101、主記憶装置102、補助記憶装置103、映像入力部105、入力装置106、ディスプレイ107を備える。CPU101、主記憶装置102、補助記憶装置103は、データバス104によって相互に接続され、インタフェース(I/F)を介して映像入力部105、入力装置106、ディスプレイ107に接続される。CPU101は、主記憶装置102に記憶されたプログラムを実行することにより、各種処理を実行する。主記憶装置102は、CPU101から直接アクセスすることのできる記憶装置であり、一般的な計算機におけるメインメモリである。主記憶装置102には、実行プログラムや処理途中のデータが格納される。補助記憶装置103は、ハードディスクなどの大容量記憶装置である。補助記憶装置103には、映像アーカイブから抽出した特徴量データが格納される。映像入力部105は、映像アーカイブ108やクエリ映像109を計算機に取り込むための入力インタフェースである。入力装置106は、マウスやキーボードなど、ユーザの操作を計算機に伝えるための入力インタフェースである。ディスプレイ107は、液晶ディスプレイやCRTなどの表示装置であり、実行結果をユーザに伝える出力インタフェースである。
図2は、本発明による類似映像検索装置の処理を説明する機能ブロック図である。本発明の類似映像検索装置は、特徴量データベース構築部220と類似映像検索部230を備える。特徴量データベース構築部220及び類似映像検索部230は、主記憶装置102に記憶されたプログラムをCPU101で実行することによって実現される。
特徴量データベース構築部220では、検索対象の映像アーカイブ108中の全映像ファイルからクラスタリング済み特徴量データベース205を構築する。まず、フレーム抽出部202において、入力映像ファイルをデコードし、一定時間間隔でフレームを切り出す。特徴抽出部203では、フレームから既知の方法で画像特徴量を計算する。画像特徴量は、色特徴や形状特徴などを数値化したもので、固定長のベクトルデータで表される。設計仕様にもよるが、大規模な画像データベースに対して有意な画像検索結果を得るためには、通常、数十〜数百次元のベクトルデータが必要となる。データベース構築部204では、特徴量データのクラスタリングを行い、結果をクラスタリング済み特徴量データベース205として記憶装置に書き込む。
クラスタリング済み特徴量データベース205は、図3の構造体で表される。図3において、主記憶装置側には、クラスタ情報の構造体が格納される。クラスタ情報は、クラスタIDとその代表値から構成される。代表値は、例えばクラスタ要素の特徴量の平均値である。図3に示すように、補助記憶装置側には、フレームの特徴量情報が格納される。特徴量情報は、フレームIDと特徴量から構成される。フレームIDは、各フレームの固有番号を表す整数値である。時間的に連続するフレームには、連続したIDが付与される。特徴量は、固定長のベクトルデータである。特徴量情報は、クラスタ毎に、補助記憶装置の連続領域に格納される。クラスタリング済みの特徴量データベースに対する検索では、まず、クエリ画像の特徴量とクラスタの代表値との距離を計算し、距離の近いクラスタを選択する。次に、選択したクラスタに属する特徴量データを補助記憶装置から読み出し、特徴量距離の近い順に並び替えて出力する。このとき、データ読み出しの対象となる補助記憶装置の領域は、例えば、クラスタ要素数の最大値nとクラスタID:xから、xn〜(x+1)n−1のように算出することができる。
図2の説明に戻り、類似映像検索部230では、映像アーカイブ108に含まれるクエリ映像109の類似映像を検索し、類似映像情報211として出力する。まず、フレーム抽出部207では、クエリ映像109から一定間隔でフレームを抽出する。抽出間隔は、フレーム抽出部202で用いた抽出間隔と必ずしも同一である必要はない。次に、特徴抽出部208では、フレームから画像特徴量を抽出する。この特徴量は、特徴抽出部203と同一のアルゴリズムで計算される。複数フレーム検索部209及び検索結果統合部210では、フレーム抽出部207で抽出された複数フレームに対して類似画像検索を行い、その検索結果から連続系列を探索することで類似映像の判定を行う。これらの処理は、本発明を特徴付ける処理であるため、以下で詳しく述べる。なお、特徴量データベース構築部220のフレーム抽出部202と類似映像検索部230のフレーム抽出部207は、いずれか一方が他方を兼用してもよい。同様に、特徴量データベース構築部220の特徴抽出部203と類似映像検索部230の特徴抽出部208は、いずれか一方が他方を兼用してもよい。
最終的に、類似映像検索部230は類似映像情報211を出力する。出力される類似映像情報211は、図4に示す構造体である。類似映像情報の構造体は、開始フレームID、終了フレームID、及び信頼度から構成される。開始フレームID、終了フレームIDは、クエリ映像と類似する映像区間を表す。信頼度は、クエリ映像と検出された映像との類似性を表す値である。
次に、類似映像検索部230の動作について詳しく説明する。図5は、類似映像検索部230のデータフローを示す図である。フレーム抽出部207は、クエリ映像109から先頭フレーム503を抽出し、一定間隔毎に後続フレーム504を抽出する。図には先頭フレームと後続フレームを区別して表示しているが、本手法では、各フレームに対する処理に違いはない。特徴量抽出部208では、各フレームから画像特徴量506,507を抽出する。複数フレーム検索部209では、各フレームの特徴量を用いて、クラスタリング済み特徴量データベース205から、類似フレームIDを検索する。検索結果は、フレームIDのリストであり、装置側で設定する検索結果上限値N以下の要素数を持つ。例えば、数万時間のテレビ映像アーカイブに対しては、N=1000程度を想定している。この結果、各フレームに対する検索結果IDのリスト510〜513が得られる。検索結果統合部210では、複数の検索結果IDのリストから、連続するID列を探索する。一定長以上の連続性が認められれば、類似映像情報211として出力する。
図6は、検索結果統合部210の動作を表す概略図である。検索結果統合部210では、検索結果から連続するID列を探すために、図のような候補に対する投票方式を用いる。この例では、ID:101を候補として、2、3、4、5番目のフレーム検索結果に含まれるID:102、ID:103、ID:104、ID:105の検索結果IDから、それぞれ投票を行う。5フレームを処理した時点で、ID:101の得票数は5となるため、類似映像であると判定する。このとき、類似映像情報として、開始フレームID:101、終了フレームID:105、また得票数(ここでは5)を信頼度として出力する。
本手法を用いると、類似映像の判定基準の閾値を調整することで、特定フレームの検索に失敗する類似映像も検出することができる。例えば、ID:301を候補とした場合、3フレーム目の検索結果に近接フレームが含まれていない。しかし、最終的な得票数が閾値以上となれば、類似映像と判定される。また、本手法では、先頭フレームの検索結果に表れない候補も検出することができる。例えば、ID:722の近接フレームは、先頭フレーム目の検索結果には表れないが、後続フレームの検索結果に閾値以上の近接フレームが出現すれば、類似映像と判定される。
本発明の検索結果統合部210の動作について、図7のフローチャートを参照して説明する。まず、ステップ701で先頭フレームの検索結果510を読み込む。検索結果は、フレームIDのリストであり、検索結果の要素数は設計仕様にもよるが、1000程度を想定している。次に、ステップ702で、候補テーブルを作成する。候補テーブルは、図8で表される構造体である。ここでは、ステップ701で読み込まれたすべてのフレームIDを候補の先頭フレームIDとして書き込む。また、各候補の得票数に1を書き込む。ステップ703では、後続フレームの検索結果を読み込む。検索結果は、フレームIDのリストである。ステップ704では、後続フレームの検索結果をもとに、候補に対して投票処理を行う。投票処理については、図9を用いて後ほど詳しく述べる。ステップ705では、投票処理の回数を調べ、回数が一定数に達していれば、ステップ706に進み、そうでなければ次フレームの検索結果を用いて投票を行うためにステップ703に戻る。ステップ706では、候補テーブルの各候補の投票数を調べ、閾値以上の投票数を持つ候補を類似映像として出力する。ここで用いる閾値は、処理フレーム数以下の整数値であり、設計仕様によって異なる。閾値を処理フレーム数より小さくすることで、画質劣化やフレームサンプリングの位置ずれによって、特定フレームの画像検索結果に近接フレームが現れない候補も、類似映像として検出することができる。
図7におけるステップ704の投票処理の動作を、図9のフローチャートを参照して説明する。まずステップ901では、検索結果リストから最初の要素(検索結果ID)を読み込む。ステップ902では、現在のクエリフレームのIDと先頭フレームのIDとの差から、投票先の候補IDを算出する。例えば、5フレーム目の検索結果IDがID:305であれば、ID:301が投票先の候補となる。ステップ903では、候補テーブルにステップ902で算出した候補IDが存在するかを調べる。存在すれば、ステップ904で、その候補の投票数をインクリメントする。見つからなければ、ステップ905に進み、新規候補として候補テーブルに追加する。ステップ906では、検索結果リストのすべての要素を処理したかどうかを調べ、未処理の要素があればステップ901に戻り、なければ投票処理を終了させる。
以上の説明では、(検索結果ID)−{(クエリフレームのID)−(先頭フレームのID)}を、投票先の候補IDとして用いていた。そのため、再生速度の異なる映像や、フレームサンプル間隔の異なる映像の場合は、適切な候補に投票されない可能性がある。本手法では、投票先の候補IDに幅を持たせることで、この問題を解消することができる。図10は、その動作の一例を示した概略図である。この例では、候補ID:221に対して、2フレーム目の検索結果ID:223から投票を行っている。図10の下の表は、候補ID:221への投票を許可する結果フレームIDを、入力フレームID毎に示した対応表である。この例は、0.7倍速から1.5倍速までの類似映像を検出可能とした対応表である。候補IDのチェックは単純な整数比較のみで実行できる。ただし、あるフレームの検索結果から同じ候補に複数回投票されないように制限する必要がある。本手法では、フレーム抽出や特徴量抽出などの前処理をやり直すことなく、また、特別な時間情報を用いることなく、再生速度の異なる映像の検出が可能となる。
次に、従来法の類似映像検索のデータフローを図11に示す。本発明のデータフロー(図5)と比較すると、破線で囲まれた部分の処理が大きく異なる。従来法では、特徴抽出部208で計算された先頭フレーム特徴量506を用いて、特徴量テーブル1108から検索結果ID1110〜1112を取得し、これらを候補とする。特徴量比較部1113では、特徴量テーブル1108から、各候補の後続フレーム特徴量1114を読み出し、クエリ映像の後続フレーム特徴量507との距離を計算する。一定区間以上のフレーム特徴量の距離の合計が閾値以下の時、その候補を類似映像として出力する。
従来法では、フレーム検索部1109において、先頭フレームの検索結果から候補を選んでいるため、画質劣化やフレームサンプリングの位置ずれなどにより、先頭フレームの検索結果に類似映像の先頭フレームが含まれない場合、その類似映像を検出することができない。この問題を解決するために、後続フレームについても同様の処理を行い、候補を立てる方法が考えられる。しかし、多数の候補が存在する場合には、特徴量テーブルからの後続フレーム特徴量の読み込みやその比較などの処理コストが増大するため、大規模データの検索には適さない。
次に、本発明を用いた場合の、補助記憶装置へのアクセス回数を図12の概略図を用いて説明する。クラスタリング済みのデータベースの画像検索では、クエリ画像の特徴量とクラスタ代表値との距離を計算し、距離の近いクラスタを数個選び、そのクラスタに該当するデータを補助記憶装置から読み出す。この際、クラスタのデータは補助記憶装置の連続領域に格納されているため、1回の読み出しでまとめてデータを取得できる。そのため、1回の検索に必要な読み出し回数は、検索結果数の上限値をN、クラスタの平均要素数をMとすると、Ceil(N/M)となる。ここで、Ceil()は整数値への切り上げを行う演算子である。クエリ映像のフレーム数をLとすると、類似映像検索処理に必要な補助記憶装置へのアクセス回数の合計は、L×Ceil(N/M)となる。例えば、図12では、1フレーム目の検索結果を得るために、クラスタ1とクラスタ2が選ばれ、補助記憶装置の該当領域からデータを読み出している。後続フレームの検索についても同様である。
これに対して、従来法を用いた場合の補助記憶装置へのアクセス回数を、図13の概略図を用いて説明する。ここでは説明の簡略化のために、先頭フレームの検索におけるアクセス回数は無視している。従来法では、先頭フレームの検索結果から候補が決まると、各候補に対してその後続フレームの特徴量を補助記憶装置から読み出す。補助記憶装置にはフレームIDの順にデータが格納されていると仮定すると、連続領域をまとめて読み込む場合のアクセス回数は、候補数Nだけ必要になる。
数万時間の映像アーカイブを想定した例として、検索結果数の上限値(=候補数)N=1000、クラスタ平均要素数M=500、クエリ映像のフレーム数L=10の場合を考えると、本発明を用いた場合のアクセス数は10×Ceil(1000/500)=20回であり、従来法のN=1000回に比べて、補助記憶装置へのアクセス回数を大幅に削減される。
図14は、類似映像情報をユーザに伝えるためのディスプレイ表示画面例である。画面上部には、クエリ映像の各フレームのサムネイル画像とフレームIDを表示している。フレームIDの代わりに、フレームIDに対応する時間情報を表示させても良い。画面下には、検出された類似映像を同様に表示している。各検索結果に対して信頼度が表示されており、信頼度の高い順に表示の順番を並び替えている。また、投票処理において検索結果に現れなかったフレーム(この例ではID:303やID:721)については、例えば、サムネイル画像の輝度値を下げて表示している。これにより、ユーザは、検索結果として提示された映像の、どの部分が似ていないかを知ることができる。
図15は、ユーザが検索結果を確認しながら、システムに対して類似映像の判定基準を指示するための表示画面の例である。画面上部には、クエリ映像の各フレームのサムネイル画像を表示している。画面下部には、各フレームの検索結果のサムネイル画像が表示されており、連続性の確認された検索結果は強調表示されている。また、クエリ映像の各フレームの下に、そのフレームの検索結果からの投票数を表示している。
例えば、動画中で暗転した場面などで、画像特徴に乏しいフレームが検索クエリとなると、検索結果に候補の近接IDがほとんど含まれない場合がある。このとき、候補の得票率が全体的に下がり、類似映像の検出結果に悪影響を与えてしまう。そこで、ユーザは各フレームの検索結果のサムネイルや投票数を確認して、特徴の少ないフレームを使用しないようにシステムに対して伝える。例えば、図15では、3フレーム目に特徴の少ないフレームが出現している。ユーザは、3フレーム目のサムネイルの下のチェックボックスを外すことで、システムにそのフレームの検索結果を用いないように指示する。システム側は、そのフレームの検索結果からの投票を取り消す処理を行い、閾値を下げて再度判定処理を行い、検索結果画面に反映させる。
101 CPU
102 主記憶装置
103 補助記憶装置
104 データバス
105 映像入力部
106 入力装置
107 ディスプレイ
108 映像アーカイブ
109 クエリ映像
202 フレーム抽出部
203 特徴抽出部
204 データベース構築部
205 クラスタリング済み特徴量データベース
207 フレーム抽出部
208 特徴抽出部
209 複数フレーム検索部
210 検索結果統合部
211 類似映像情報
220 特徴量データベース構築部
230 類似映像検索部
1108 特徴量テーブル
1109 フレーム検索部
1113 特徴量比較部
1115 類似映像情報

Claims (5)

  1. 映像を入力する入力部と、
    前記入力部に入力された映像アーカイブの全映像から特徴量データベースを構築するデータベース構築部と、
    前記入力部に入力されたクエリ映像に類似する前記映像アーカイブ中の映像を検索する類似映像検索部と、
    前記類似映像検索部によって検索された類似映像の情報を出力する出力部とを備え、
    前記データベース構築部は、前記映像アーカイブ中の各映像から一定時間間隔でフレームを抽出し、抽出されたフレームから画像特徴量を抽出し、抽出された画像特徴量をクラスタリングして前記特徴量データベースを構築し、
    前記類似映像検索部は、前記クエリ映像から一定時間間隔でフレームを抽出し、抽出されたフレームから画像特徴量を抽出し、抽出されたクエリ映像の各々のフレームに対して画像特徴量を用いて前記特徴量データベースから類似フレームを検索し、前記クエリ映像の各々のフレームに対する類似フレームの検索結果から連続系列を探索し一定以上の連続性が認められた区間を類似映像と判定する、
    ことを特徴とする類似映像検索装置。
  2. 請求項1記載の類似映像検索装置において、前記特徴量データベースは、クラスタのIDとその代表値を関連付けした第1のデータ及び各クラスタに属するフレームのIDとその画像特徴量を関連付けした第2のデータを含み、前記第2のデータは同一クラスタに属するデータが記憶装置の連続領域に格納されていることを特徴とする類似映像検索装置。
  3. 請求項1又は2記載の類似映像検索装置において、一つの映像から前記一定時間間隔で抽出されたフレームに連続する整数値のIDが付されており、前記クエリ映像の先頭フレームの類似フレームとして検索されたフレームのIDを類似映像の候補として登録し、m番目の後続フレームの類似フレームとして検索されたフレームのIDから(m−1)を引いたIDを投票先として順次投票を行い、得票数が一定数以上となった候補を類似映像と判定することを特徴とする類似映像検索装置。
  4. 請求項3記載の類似映像検索装置において、前記後続フレームに対して類似フレームとして検索されたフレームの投票先の候補が未登録の場合、当該フレームのIDを新たな候補として登録することを特徴とする類似映像検索装置。
  5. 請求項3記載の類似映像検索装置において、前記投票先のIDに隣接する一定範囲内の整数値のIDに対して投票を行うことを特徴とする類似映像検索装置。
JP2010106561A 2010-05-06 2010-05-06 類似映像検索装置 Expired - Fee Related JP5567384B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010106561A JP5567384B2 (ja) 2010-05-06 2010-05-06 類似映像検索装置
US13/037,720 US8594437B2 (en) 2010-05-06 2011-03-01 Similar picture search apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010106561A JP5567384B2 (ja) 2010-05-06 2010-05-06 類似映像検索装置

Publications (2)

Publication Number Publication Date
JP2011237879A true JP2011237879A (ja) 2011-11-24
JP5567384B2 JP5567384B2 (ja) 2014-08-06

Family

ID=44901974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010106561A Expired - Fee Related JP5567384B2 (ja) 2010-05-06 2010-05-06 類似映像検索装置

Country Status (2)

Country Link
US (1) US8594437B2 (ja)
JP (1) JP5567384B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014215751A (ja) * 2013-04-24 2014-11-17 日本電信電話株式会社 部分映像検出装置、部分映像検出方法、及び部分映像検出プログラム
JP2017033169A (ja) * 2015-07-30 2017-02-09 日本電信電話株式会社 映像同定装置、方法、及びプログラム
WO2018088425A1 (ja) * 2016-11-10 2018-05-17 日本電信電話株式会社 画像評価装置、画像評価方法及び画像評価プログラム
JP2019179557A (ja) * 2015-06-12 2019-10-17 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー 自動コンテンツ認識のフィンガープリントマッチングにおけるチャンネル変更の検出
CN112633051A (zh) * 2020-09-11 2021-04-09 博云视觉(北京)科技有限公司 一种基于图像搜索的在线人脸聚类方法
JP2021168117A (ja) * 2020-04-09 2021-10-21 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 動画クリップの検索方法及び装置
KR102398498B1 (ko) * 2020-12-09 2022-05-17 주식회사 디알엠인사이드 스틸 이미지 기반 미디어 컨텐츠 모니터링 시스템 및 방법
WO2024039014A1 (ko) * 2022-08-19 2024-02-22 삼성전자주식회사 영상 정보를 제공하는 디스플레이 장치 및 그 제어 방법

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2953312B1 (fr) * 2009-12-02 2011-11-18 Sagem Comm Procede de generation d'un resultat d'une recherche effectuee au moyen d'un moteur de recherche
US10872082B1 (en) * 2011-10-24 2020-12-22 NetBase Solutions, Inc. Methods and apparatuses for clustered storage of information
US9529826B2 (en) * 2013-12-26 2016-12-27 Google Inc. Methods and systems for use of a database of three-dimensional (3D) object data models for search queries
CN107341151B (zh) * 2016-04-29 2020-11-06 成都理想境界科技有限公司 图像检索数据库生成方法、增强现实的方法及装置
CN106874936B (zh) * 2017-01-17 2023-07-11 腾讯科技(上海)有限公司 图像传播监测方法及装置
JP6811645B2 (ja) * 2017-02-28 2021-01-13 株式会社日立製作所 画像検索装置及び画像検索方法
CN109033261B (zh) * 2018-07-06 2021-06-22 北京旷视科技有限公司 图像处理方法、装置、处理设备及其存储介质
CN114639143B (zh) * 2022-03-07 2024-04-16 北京百度网讯科技有限公司 基于人工智能的人像归档方法、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125903A (ja) * 1999-10-22 2001-05-11 Real World Computing Partnership データ系列検索装置,方法および記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3780623B2 (ja) * 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
JP3451985B2 (ja) 1999-05-27 2003-09-29 日本電気株式会社 動画像類似度算出装置および方法
JP4333808B2 (ja) 2008-08-07 2009-09-16 株式会社日立製作所 映像の検索方法および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125903A (ja) * 1999-10-22 2001-05-11 Real World Computing Partnership データ系列検索装置,方法および記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200201545001; 粕谷英司、外2名: '低次DCT係数の時系列評価によるMPEG動画像からの高速目的部分検索' 1999年電子情報通信学会総合大会講演論文集 情報・システム 2, 19990308, pp.180, 社団法人電子情報通信学会 *
JPN6014003692; 粕谷英司、外2名: '低次DCT係数の時系列評価によるMPEG動画像からの高速目的部分検索' 1999年電子情報通信学会総合大会講演論文集 情報・システム 2, 19990308, pp.180, 社団法人電子情報通信学会 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014215751A (ja) * 2013-04-24 2014-11-17 日本電信電話株式会社 部分映像検出装置、部分映像検出方法、及び部分映像検出プログラム
JP7216756B2 (ja) 2015-06-12 2023-02-01 ロク インコーポレイテッド 自動コンテンツ認識のフィンガープリントマッチングにおけるチャンネル変更の検出
JP2019179557A (ja) * 2015-06-12 2019-10-17 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー 自動コンテンツ認識のフィンガープリントマッチングにおけるチャンネル変更の検出
JP2021106003A (ja) * 2015-06-12 2021-07-26 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー 自動コンテンツ認識のフィンガープリントマッチングにおけるチャンネル変更の検出
JP2017033169A (ja) * 2015-07-30 2017-02-09 日本電信電話株式会社 映像同定装置、方法、及びプログラム
WO2018088425A1 (ja) * 2016-11-10 2018-05-17 日本電信電話株式会社 画像評価装置、画像評価方法及び画像評価プログラム
JPWO2018088425A1 (ja) * 2016-11-10 2019-03-07 日本電信電話株式会社 画像評価装置、画像評価方法及び画像評価プログラム
US11710226B2 (en) 2016-11-10 2023-07-25 Nippon Telegraph And Telephone Corporation Image evaluation device, image evaluation method, and image evaluation program
US11042771B2 (en) 2016-11-10 2021-06-22 Nippon Telegraph And Telephone Corporation Image evaluation device, image evaluation method, and image evaluation program
JP2021168117A (ja) * 2020-04-09 2021-10-21 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 動画クリップの検索方法及び装置
JP7222008B2 (ja) 2020-04-09 2023-02-14 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 動画クリップの検索方法及び装置
US11625433B2 (en) 2020-04-09 2023-04-11 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for searching video segment, device, and medium
CN112633051A (zh) * 2020-09-11 2021-04-09 博云视觉(北京)科技有限公司 一种基于图像搜索的在线人脸聚类方法
WO2022124466A1 (ko) * 2020-12-09 2022-06-16 주식회사 디알엠인사이드 스틸 이미지 기반 미디어 컨텐츠 모니터링 시스템 및 방법
KR102398498B1 (ko) * 2020-12-09 2022-05-17 주식회사 디알엠인사이드 스틸 이미지 기반 미디어 컨텐츠 모니터링 시스템 및 방법
WO2024039014A1 (ko) * 2022-08-19 2024-02-22 삼성전자주식회사 영상 정보를 제공하는 디스플레이 장치 및 그 제어 방법

Also Published As

Publication number Publication date
US20110274360A1 (en) 2011-11-10
US8594437B2 (en) 2013-11-26
JP5567384B2 (ja) 2014-08-06

Similar Documents

Publication Publication Date Title
JP5567384B2 (ja) 類似映像検索装置
RU2686590C1 (ru) Способ и устройство для сравнения схожих элементов высокоразмерных признаков изображений
US10438050B2 (en) Image analysis device, image analysis system, and image analysis method
US8335786B2 (en) Multi-media content identification using multi-level content signature correlation and fast similarity search
US9665798B2 (en) Device and method for detecting specified objects in images using metadata
US8180781B2 (en) Information processing apparatus , method, and computer-readable recording medium for performing full text retrieval of documents
EP2657884B1 (en) Identifying multimedia objects based on multimedia fingerprint
US8244738B2 (en) Data display apparatus, method, and program
KR100706389B1 (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
JP7252914B2 (ja) 検索提案を提供する方法、装置、機器及び媒体
KR20010042672A (ko) 신호 처리 방법 및 영상 음성 처리 장치
CN106686460B (zh) 一种视频节目推荐方法及视频节目推荐装置
JP6185379B2 (ja) レコメンド装置およびレコメンド方法
CN111368867B (zh) 档案归类方法及系统、计算机可读存储介质
CN106599047A (zh) 一种信息的推送方法及装置
JP5226651B2 (ja) 類似画像検索装置,類似画像検索方法および類似画像検索プログラム
CN113395584B (zh) 一种视频数据处理方法、装置、设备以及介质
CN110569447B (zh) 一种网络资源的推荐方法、装置及存储介质
CN116883740A (zh) 相似图片识别方法、装置、电子设备和存储介质
JP4995770B2 (ja) 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム
US20210073262A1 (en) Media retrieval method and apparatus
Zhou et al. Efficient subsequence matching over large video databases
JP7416091B2 (ja) 映像検索システム、映像検索方法、及びコンピュータプログラム
JP2016014990A (ja) 動画像検索方法、動画像検索装置及びそのプログラム
CN114610960A (zh) 基于item2vec和向量聚类的实时推荐方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140425

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140619

R151 Written notification of patent or utility model registration

Ref document number: 5567384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees