JP6336827B2 - 画像検索装置、画像検索方法および検索システム - Google Patents

画像検索装置、画像検索方法および検索システム Download PDF

Info

Publication number
JP6336827B2
JP6336827B2 JP2014116355A JP2014116355A JP6336827B2 JP 6336827 B2 JP6336827 B2 JP 6336827B2 JP 2014116355 A JP2014116355 A JP 2014116355A JP 2014116355 A JP2014116355 A JP 2014116355A JP 6336827 B2 JP6336827 B2 JP 6336827B2
Authority
JP
Japan
Prior art keywords
image
region
image feature
feature amount
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014116355A
Other languages
English (en)
Other versions
JP2015230578A (ja
Inventor
廣池 敦
敦 廣池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2014116355A priority Critical patent/JP6336827B2/ja
Publication of JP2015230578A publication Critical patent/JP2015230578A/ja
Application granted granted Critical
Publication of JP6336827B2 publication Critical patent/JP6336827B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、画像を対象とした画像検索装置、画像検索方法および検索システムに関する。
近年、ネットワークのブロードバンド化、各種記憶装置の大規模化により、大規模な画像・映像を蓄積、管理し、それらを配信するサービスを実施することが可能となった。
このような大規模コンテンツを扱うシステムで重要となるのが検索技術である。検索技術として一般的なのは、画像・映像コンテンツや関連する付けられたテキスト情報に対する検索技術である。たとえば文書情報の検索技術では、1つ、ないしは、複数個のキーワードをクエリとして入力し、それが含まれるテキスト情報と関連づいた画像・映像を検索結果として返す形式が一般的である。また、画像自体に対しても、クエリとなる画像から画像の持つ特徴を数値化した画像特徴量という情報を抽出し、これをデータベース化することによって、キーワードを介さずに画像を検索する技術も存在する。
画像検索における画像特徴量の抽出では、検索対象となる事物が含まれる画像中の部分領域を検出する処理が重要となる場合が多い。例えば、類似画像検索を用いた顔検索では、顔領域を検出し、検出された顔領域から画像特徴量を抽出する必要がある。同様に、車両の類似検索では、画像中の車両が存在する領域を検出する必要がある。画像中から特定の物体が存在する領域を検出する方法としては、検出対象となる物体が撮像された画像の集合を学習データとして用いたAdaブースト法による学習によって、局所的な特徴の一致に基づく弱識別器をカスケード上に並べた識別器を構成する手法が提案されている。本手法は、特に、人物の顔領域検出の分野で、高い有効性を示している。
また、特許文献1では、キー画像中の、ユーザが指定した部分領域に基づいて、同じ大きさの部分領域に対して類似画像検索を行い、部分領域を含む画像とキー画像との類似度を比較して検索結果とするとこが開示されている。
特開2010−122931号公報
従来技術において、検索したい画像が画像中の一部分である場合、所定の検出処理が必要である。上述したような検出処理を行うためには、検索対象として想定される事物の画像を事前に登録し、想定される事物とその画像特徴量とを対応付けて学習させておく必要がある。しかし、検索システムを使用するユーザが、どのような事物に着目して検索を実施するかを事前に網羅的に想定することは、一般に困難である。また、例え、検索したい事物は想定できたとしても、手掛かりとなる情報、すなわち、検索クエリとなる情報が、隠蔽等により事物の部分のみしか知り得ない場合もある。このような場合、事前に検索対象となる画像を検出処理によってデータベース化することは出来ない。
これに対し、特許文献1の方式であれば、このような事前学習は不要となる。しかしながら特許文献1では部分領域をクエリとして画像を検索する方式を採用しているものの、部分領域で検索したのちに全体の画像同士の画像特徴量を比較する構成であり、検索の自由度が低い。
上記課題を解決するために、例えば請求の範囲に記載の構成を採用する。本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、画像検索装置であって、画像と、前記画像の一部分である第1領域に含まれる第1画像特徴量とを記憶する記憶部と、クエリ画像から、クエリ画像特徴量を抽出する抽出部と、前記クエリ画像特徴量に最も近い前記第1画像特徴量を検索し、一次検索結果として出力する検索部と、前記一次検索結果を含む前記第1領域の位置または大きさを変更した領域である第2領域を生成し、前記第2領域に含まれる第2画像特徴量を抽出する補正部と、前記第一次検索結果または前記第2画像特徴量のうち、前記クエリ画像特徴量に最も近い画像特徴量を二次検索結果と判定し、前記二次検索結果を含む領域を出力する出力部と、を有することを特徴とする。
または、画像検索方法であって、画像と、前記画像の一部分である第1領域に含まれる第1画像特徴量とを記憶装置に記憶する第1ステップと、クエリ画像から、クエリ画像特徴量を抽出する第2ステップと、前記クエリ画像特徴量に最も近い前記第1画像特徴量を検索し、一次検索結果として出力する第3ステップと、前記一次検索結果を含む前記第1領域の、位置または大きさを変更した領域である第2領域を生成し、前記第2領域に含まれる第2画像特徴量を抽出する第4ステップと、前記第一次検索結果または前記第2画像特徴量のうち、前記クエリ画像特徴量に最も近い画像特徴量を二次検索結果と判定し、前記二次検索結果を含む領域を出力する第5ステップと、を有することを特徴とする。
本発明によって、画像検索の自由度が向上する。
本発明の全体システム構成例である。 データベース登録処理の流れである。 走査処理の説明図である。 実施例1の画像に関するデータベース項目の一覧である。 実施例1の部分領域に関するデータベース項目の一覧である。 検索処理の流れである。 詳細化処理の前半部分のフローチャートである。 詳細化処理の後半部分のフローチャートである。 詳細化処理の説明図である。 部分領域の融合処理を説明するための図版である。 部分領域の融合処理を説明するための図版である。 融合処理の流れである。 微分フィルタの例である。 輝度勾配強度分布特徴量の説明図である。 実施例3の画像に関するデータベース項目の一覧である。 実施例3で用いるデータ構造の説明図である。 実施例4で用いるデータ構造の説明図である。 本発明のサーバ内の構成例である。
次に、本発明の実施の形態について、図面を参照して説明する。
本実施例は、複数のカメラ、端末計算機および検索システムを、ネットワークを介して接続した大規模監視システムについて説明する。本システムでは、カメラで撮影した画像を検索システム内に蓄積し、端末計算機からの検索要求に従い、検索システムがクエリとして入力された画像に類似する部分領域を検索して1次検索結果とし、1次検索結果として検索された部分領域の周辺領域を再度探索しなおした補正後部分領域とクエリとの類似度を比較し、部分領域または補正後部分領域からクエリに近いものを2次検索結果として端末計算機へ出力するシステムである。以下、詳細に説明する。
図1は、本実施例のシステム構成である。図1の100は、検索サービスを提供するための計算機システムである。検索サービスが提供する各種機能は、ネットワークシステム130を経由して、端末計算機120を用いるユーザに対して提供される。140はネットワークを介して計算機システム100や端末計算機120と接続されたカメラである。カメラ140で撮影した画像が検索システム100に蓄積され、検索対象となる。図1では省略しているが、端末計算機120やカメラ140は複数ネットワークに接続されている。計算機システム100内の構成については図18に示す。
図2は、画像登録処理部102および部分領域生成部104がデータベース103に画像を登録処理するまでの流れである。画像登録処理では、対象となる画像を取得(s210)しデータベース103に登録した後、後述する走査処理によって部分領域を生成し、各部分領域画像の画像特徴量を抽出する(s220)。抽出された各領域の画像特徴量をデータベースに保存し(s230)、処理を終了する。
本実施例では、画像特徴量として、輝度勾配ベクトルの分布を用いる。輝度勾配ベクトルは、白黒濃淡画像に対して、2次元の数値微分を適用することによって導出される。図13は、数値微分を行うためのフィルタの例である。輝度勾配ベクトルから、次式のようにベクトルの2乗ノルムpとベクトルの方向θを算出することが出来る。
p=f +f
θ=tan−1(f/f) (数1)
ベクトルの方向θを適切なレベルに離散化して扱い、2乗ノルムpを画像中で集計することによって、輝度勾配ベクトル方向の強度分布をヒストグラム状のデータとして表現することができる。図14は、本処理の内容を表現した模式図である。まず、1410に示すように画像から輝度勾配ベクトルを抽出し、集計処理によってヒストグラム状のデータ1420を算出する。なお、図14では、画像全体に対して集計を行っているが、例えば、画像を4×4のブロックに分割し、ブロックごとに集計を行うことによって、画像内の構図情報を反映した画像特徴量を構成することができる。
図3は、220の走査処理を説明するための図である。本発明では、部分領域とはm×n個の画素からなる画像上の領域や、その他円形状や多角形状の閉領域を言い、アスペクト比、大きさ、位置等によって表されるものとする(m、nはともに任意の自然数である)。元の画像が長方形であるため、部分領域はm×n画素からなる矩形である方が、画像処理の負荷を低減させる点からは好ましい。
本実施例では、部分領域が矩形の場合を用いて以下、説明する。先ず、アスペクト比に関しては、横長から縦長までのある一定範囲に関して、アスペクト比を適切な段階に量子化する(S310)。さらに、様々な大きさの変動に対応するために、元画像を順次1/2ずつ縮小していくことによって、多重解像度画像を構成する(S320)。次に、量子化されたあるアスペクト比の部分領域を、多重解像度画像中のある解像度の画像上で、任意の一定ステップで、横方向、縦方向に順次平行移動させる(S330)。このステップ幅は、必ずしも部分領域単位である必要はなく、1ステップ移動させた後の部分領域とその直前の部分領域とで重複する領域があってもかまわない。その後、元画像各部分領域の画像から画像特徴量を抽出する(s220)。画像特徴量は、色分布、輝度勾配ベクトルの分布等に基づいて算出する。抽出された画像特徴量は、必要なメタ情報とともに、データベース103に保存される(S230)。
図4と図5は、本実施例においてデータベース上に格納される項目を示したものである。図4は、画像に関する項目である。401は、S210で取得した画像データであり、402は、その画像から生成された部分領域の管理番号(部分領域データID)のリストである。
一方、図5は、生成された各部分領域に関する項目である。501は、その部分領域が属する画像管理番号(画像ID)である。502から506は、部分領域を定義するための情報である。502は、320の多重解像度化を行った場合に、その部分領域がどの解像度から生成されたものかを指し示す整数値である。503は、502で指定された解像度での、矩形の左上端点のx座標値、504は、y座標値である。505は、502で指定された解像度での、矩形の幅、506は、矩形の高さである。507は、当該部分領域の画像特徴量である。もちろん、部分領域が矩形ではない場合も、503−506の項に部分領域の幅や頂点座標の位置などが記録され、管理される。
なお、画像データ401は、必ずしも、データベース中にその実体が格納されている必要はない。例えば、画像データが他のファイルサーバ等で管理されている場合は、401には、その画像のURL等、画像を参照することを可能にする情報が格納されていればよい。
図6は、検索処理の流れである。検索処理では、端末計算機120からの検索要求を受け付けると、クエリ画像を取得し、クエリ特徴量抽出部106がクエリ画像の画像特徴量を抽出する(S1900)。次に類似部分領域検索部107が、クエリ画像特徴量とデータベース103上に格納された部分領域の画像特徴量507とを比較して類似画像検索を行うことによって、クエリ画像と類似性が高い画像特徴量を持つ部分領域を類似画像検索結果(1次検索結果)として取得する(S1910)。
次に、類似画像検索結果を構成する各部分領域について、画像取得部で元画像のデータを取得し(S1930)、事前処理部109で画像特徴量を抽出する前段階の事前処理を行う(S1940)。その後、詳細化処理部110が後述する詳細化処理(S1950〜S1970)を実施することによって、クエリ画像との類似性が高い補正後部分領域を抽出する。抽出された部分領域および補正後部分領域に関して、検索結果出力部111はクエリ画像との類似度でソートを行い(S1980)、類似度が高い順にソートされた部分領域および補正後部分領域のリストを検索結果(2次検索結果)として出力する。
図7と図8は、S1930から1970の事前処理および詳細化処理を説明するための図である。図7に示したのは、S1920において取得した類似画像検索結果から、処理の対象となる画像と部分領域の組み合わせを構成する処理である。S700に、本処理を説明するための記号を示す。A[]は、本処理の入力データで、類似検索結果の部分領域のIDを要素とする配列である。Lは、A[]の要素数、すなわち、類似検索結果の件数である。B[]は、本処理の出力データで、A[]の要素である部分領域を含む画像IDの配列である。Mは、B[]の要素数である。C[][]も、同様に、本処理の出力データで、B[]中の各画像が含む部分領域のIDを2重配列として管理したものである。N[]は、各画像に対応するC[][]の要素数である。例えば、N[0]は、0番目の画像中に含まれる、類似検索結果中の部分領域の数を表す。
以下、図7における元画像と部分領域との組合せ処理の流れを順次説明する。
先ず、B[]の要素数Mを0に初期化する(S701)。次に、A[]の要素にアクセスするための添え字iを0に初期化する(S702)。判定処理S703は、A[]の全要素(i=0からL)を処理したか否かを判定する処理である。iがLに満たない場合、A[i]が含まれる画像のID501を取得する(S704)。
S705からS708は、取得された画像のIDが、配列B[]の要素として含まれているか否かを判定する処理である。先ず、705で、B[]の要素にアクセスするための添え字jを0に初期化する。添え字jが1〜Mまでの範囲の判定処理S706を経た後、S707でB[j]が取得された画像IDと一致するか否かが判定される。一致しない場合は、添え字jがインクリメントされ(S708)、判定処理S706に戻る。S706でjがMに達した場合、すなわち、取得された画像のIDが、配列B[]の要素として含まれていない場合は、その画像は、M番目に出現した画像として処理される。具体的には、C[M][0]、すなわち、その画像に含まれる最初の部分領域のIDとしてA[i]が代入され、N[M]、すなわち、その画像に含まれる部分領域の数に1が代入される(S709)。C[M][0]、および、N[M]の値を更新した後、Mの値を1増加させる(S710)。
一方、取得された画像のIDと一致する配列B[j]が発見された場合は、C[j][N[j]]にA[i]を代入し(S711)、N[j]の値を1増加させる(S712)。iをインクリメントさせていくことによって(S713)、これらの処理を全結果について実施する。
図8は、図7の処理によって構成されたB[]およびC[][]を用いて行う処理の流れを示したものである。(S800)は、本処理を説明するための記号である。B[]は画像IDの配列、Mはその要素数、C[][]は、各画像に含まれる部分領域IDを管理する2重配列、N[]は、その要素数を管理する配列である。これらは、全て、図7の出力データと同一である。
以下、図8における処理の流れを順次説明する。先ず、B[]の要素にアクセスするための添え字iを0に初期化する(S801)。続くS802は、B[]内の全要素について処理したか否かを判定する判定ステップである。各B[i]について、図4の画像データ401を取得する(S803)。
次に、取得された画像データに対して、画像特徴量抽出処理に必要となる事前処理を行う(S804)。一般に、画像データはJPEG等の方式によって圧縮されて保存されている。本実施例で用いる画像特徴量を抽出するためには、画像データを復号し、メモリ上に展開に画素値の配列として展開する必要がある。また、多重解像度画像の生成、画像に対する微分処理等も行う必要がある。また、別の事前処理としては、元画像に対し図13に示すようなフィルタリングを行う処理があげられる。
事前処理部109がこれらの事前処理をS804(図6においてはS1940)で行った後、C[i][]の要素にアクセスするための添え字jを0に初期化する(S805)。S806は、C[i][]内の全要素について処理したか否か、つまり、類似画像検索結果で得られた全ての部分領域について詳細化処理を行ったか否かを判定する判定ステップである。S807で、部分C[i][j]を種とする詳細化処理を行い、jをインクリメントする(S808)。jがN[i]に達したらループを抜け(S806)、iをインクリメントし、判定ステップS802に戻る。
図9は、S807の詳細化処理を説明するための図である。詳細化処理部110は、処理をおこなう種画像となる部分領域(S1910で得られた部分領域)に対して、微少に縦横に並行移動した部分領域910、微少に拡大縮小を行った部分領域920、および、拡大縮小された部分領域を更に縦横に並行移動した部分領域を、補正後部分領域として生成する。部分領域を並行移動させる微小の範囲については後述する。この並行移動によって生成される部分領域の数は、上下、左右、斜めの移動で8パターンである。拡大縮小で生成される部分領域は2パターンで、拡大縮小それぞれの部分領域の並行移動で、それぞれについて8パターンの部分領域が生成される。従って、1つの種となる部分領域に対して、26パターンの新たな補正後部分領域が生成される。もちろん、補正後部分領域の形状も、部分領域の形状と同様に矩形に限定されないため、本実施例で用いた26パターンよりも多くの補正後部分領域を生成しても良い。詳細化処理においても、部分領域の登録処理同様に、画像が長方形であるため矩形領域とした方が処理負荷が小さくて済む。
こうして生成された各補正後部分領域に関して、詳細化処理部110において、その補正後部分領域の画像特徴量が抽出される(S1960)。各補正後部分領域の画像特徴量とS1900において取得されたクエリ画像の画像特徴量を比較することによって、クエリ画像との類似性が高い1ないしは複数個の補正後部分領域を、次の詳細化処理を行う種画像となる部分領域として選択する。この際に、種となった元の部分領域の方の類似性が高ければ、元の部分領域が種画像として再び選択される。詳細化処理S807では、このように、種となる部分領域を更新していく反復処理を行うことにより、クエリ画像との類似性がより高い部分領域を探索していく。
上記並行移動の繰り返し処理における各微小範囲(微少変動量)は、次式によって定義する。
=g/2
=g/2
=g/2 (数2)
ここで、qは、詳細化処理の繰り返しの回数、g、gは、S330においてグリッド状走査を行った際に用いた横方向、縦方向のステップ幅、d、dは、q回目の詳細化処理での横方向、縦方向の変動量である。一方、dは、q回目の詳細化処理での拡大率で、縮小する場合の縮小率は、1/dである。上式から明かなように、変動量d,dの大きさは、本処理の繰り返しの回数に応じて小さくなる。対象となる画像は離散的なデジタル画像であるから、本処理を十分に繰り返せば、微少変動によって新たな領域候補である補正後部分領域が生成されることはなくなる。詳細化処理S807は、少なくとも、新たな領域候補が生成されることがなくなれば終了となるが、計算の効率化のために繰り返し回数の上限を設定し、それに達したなら終了とするフローにしてもよい。
なお、本実施例では、類似検索処理S1910と詳細化処理S1960において、同一の画像特徴量を用いているが、本発明の技術的思想の範囲は、同一の画像特徴量を用いる場合に限定されない。検索対象の規模、対象画像の解像度等に応じて、類似検索処理S1910と詳細化処理S1960のどちらが計算コストを要するか変化させることができる。例えば、詳細化処理の計算コストが大きい場合は、詳細化処理では、類似検索処理よりも低い次元数の特徴量を用いることによって、処理全体の高速化を実現することも可能である。
以上を踏まえると、本実施例に記載の画像検索装置100は、画像と、画像の一部分である第1領域に含まれる第1画像特徴量とを記憶する記憶部103と、クエリ画像から、クエリ画像特徴量を抽出する抽出部106と、クエリ画像特徴量に最も近い第1画像特徴量を検索し、一次検索結果として出力する検索部107と、一次検索結果を含む第1領域の位置または大きさを変更した領域である第2領域を生成し、第2領域に含まれる第2画像特徴量を抽出する補正部113と、第一次検索結果または第2画像特徴量のうち、クエリ画像特徴量に最も近い画像特徴量を二次検索結果と判定し、二次検索結果を含む領域を出力する出力部111と、を有することを特徴とする。
または、本実施例に記載の画像検索方法は、画像と、画像の一部分である第1領域に含まれる第1画像特徴量とを記憶装置103に記憶する第1ステップ(S230)と、クエリ画像から、クエリ画像特徴量を抽出する第2ステップ(S1900)と、クエリ画像特徴量に最も近い第1画像特徴量を検索し、一次検索結果として出力する第3ステップ(S1920)と、一次検索結果を含む第1領域の、位置または大きさを変更した領域である第2領域を生成し、第2領域に含まれる第2画像特徴量を抽出する第4ステップ(S1960)と、第一次検索結果または第2画像特徴量のうち、クエリ画像特徴量に最も近い画像特徴量を二次検索結果と判定し、二次検索結果を含む領域を出力する第5ステップ(S1980)と、を有することを特徴とする。
本実施例のように、画像を部分領域に分割し、部分領域単位で類似画像検索をすることで、画像全体の類似度にとらわれない自由な検索を行うことができる。
さらに、補正部113により類似画像検索後の部分領域に対して詳細化処理を行うことで、画像登録段階では部分領域からはみ出ていた部分についても、適切なサイズで部分領域を切り出すことができ、より適切な検索結果を得ることができる。
また、このような検索システムを用いることで、画像中の目的となる部分領域以外の部分に影響されることなく、適切に監視対象を特定することのできる大規模監視システムを提供することができる。
本発明の第2の実施の形態は、実施例1の図6に示した事前処理S1940の効率化を図った変形例であり、その他の構成は実施例1と同様である。
図8のS807で示した、類似検索結果の部分領域を種画像とする詳細化処理において、実際に必要となる画像上の領域は、種となる部分領域の周辺のみである。一般的な画像処理アルゴリズムは対象となる画像の画素数に比例して計算量が増大する場合が多い。従って、種となる部分領域の周辺領域に限定した画像処理を行えば、計算量の削減が実現できる。ここでいう周辺領域とは、たとえば図10に示した1010の領域を言い、種となる部分領域は1011を言う。周辺領域とは、種画像を用いて詳細化処理を行いうる範囲を指しており、具体的には、詳細化処理で生成される26パターンの補正後矩形領域を全て包含する最小限の大きさの領域である。
また、多くの場合、単一の画像上に、複数個の種となる部分領域が存在する。図10に示したのは、同一画像上に2つの種となる部分領域が存在する場合の一例である。1010は、1つ目の部分領域1011の周辺部分領域、1020は、2つ目の部分領域1012の周辺部分領域、1030は、両周辺領域を包含する最小の部分領域である。この場合、計算量が画素数に比例するあるアルゴリズムを、1010、1020それぞれ別個に行っても、重複する領域は僅かである。これに対して、1030を対象にそのアルゴリズムを適用した場合、本来、処理する必要のない領域まで処理することとなり、効率が悪い。
一方、図11の例では、2つの種となる部分領域1111と1112の周辺部分領域1110と1120は、重複する面積が大きい。従って、1110、1120を別個に処理するよりも、両者を包含する部分領域1130に対して処理を行った方が効率的である。
上記の事実を定式化すれば、2つの周辺部分領域の面積の和が、両者を包含する最小の部分領域の面積より大きければ、両者を包含する部分領域に対してアルゴリズムを適用するように、領域の融合を行うべきである。3つ以上の種となる部分領域が存在する場合も同様で、個々の周辺部分領域の面積の総和が、それらを包含する最小の部分領域の面積よりも大きければ、それらの周辺部分領域を融合して扱った方が効率的である。
図12に、上記の融合処理の流れを示す。図7で示した処理によって、類似検索によって得られた種となる部分領域を、それらを含む元画像ごとに分配した後、データベース103に記憶された各部分領域に関するデータの属性502を参照することによって、更に、種となる部分領域を解像度ごとに分配する(S1210)。次に、各解像度ごとに、種となる部分領域の周辺部分領域に対して、上記の基準に基づく融合処理を実施する(S1220)。その後融合処理を行った結果に基づいて、事前処理を行う。具体的には、融合領域1130の面積が各部分領域を含む周辺領域1110,1120の合計面積より小さい場合には、実施例1で述べた事前処理(S1940)を融合領域単位で実行する。一方、融合領域1130の面積の方が大きい場合には、周辺領域1110や1120の単位で事前処理を実行する。
このように、事前処理を行う領域を、周辺領域または融合領域に限定することで、元画像全体に対して事前処理を行ってう場合に比べて事前処理を行う時間を削減することができ、より短時間で検索結果を出力することができる。
また、画像特徴量に加え、中間データをデータベース103に保存しておくことで、詳細化処理時に補正後部分領域の画像特徴量を求めるための画像処理時間が軽減され、より短時間で検索結果を出力することができる。
このような検索システムを搭載することで、検索時間が短くなり、リアルタイム性を向上させた大規模監視システムの提供が可能となる。
本発明の第3の実施の形態は、実施例1の図8に示した処理を効率化するために、画像特徴量抽出に必要な中間データをデータベース103上に保存する構成とした変形例であり、その他の部分は実施例1と同様の構成である。
図15は、本実施例において、画像に関わる情報としてデータベース103に格納される項目の一覧で、実施例1の説明における図4に対応するものである。画像データ1501は、図4の401に、部分領域IDのリスト1502は、図4の402に対応する。本実施例で新たに追加した項目は、輝度勾配情報画像1503であり、本実施例ではこれを中間データとして、画像データ等に加えデータベース103に格納する。
今、ベクトル方向離散化のレベル数をDとする。ある画素上の輝度勾配ベクトルから数1より2乗ノルムpと方向θを算出し、θがk番目の離散化の範囲に含まれる時、k番目の値がpで、その他の値が0であるD次元のベクトルを構成することができる。例えば、Dが8、kが4とすれば、そのベクトルは、(0 0 0 p 0 0 0 0)となる。1503の輝度勾配情報画像とは、このようなベクトルを画素値とする画像である。なお、輝度勾配情報画像は、解像度レベルごとに構成される。
輝度勾配情報画像に対して集計処理を行うことによって、画像特徴量を算出することができる。たとえば、図14のグラフ1420のように、縦軸をブロックの数、横軸を2乗ノルムpが入る位置(1からkまで)として集計し、このグラフに基づいて画像特徴量を算出しても良い。
このように、画像特徴量を算出する際に必要な中間データとなる輝度勾配情報画像等をデータベース103上に保存しておくことによって、画像データの読み込み、多重解像度化、微分処理、および、数1の演算を行わずに、特徴量抽出が可能となる。
画像の幅をW、画像の高さをHとすれば、輝度勾配情報画像は、D×W×Hの3重配列となる。ただし、定義より、画素値であるD次元のベクトルは、1要素のみが非0の値pを持ち、後は、0である。また、pが0、すなわち、輝度勾配が存在しない場合は、全ての値が0である。より一般には、集計処理にほとんど影響を与えないような小さなpの値は、特徴量抽出には不要であり、pが一定の閾値以下の場合は、p=0として処理しても良い。このような事情から、輝度勾配情報画像を保存する際には、D×W×Hの3重配列ではなく、2乗ノルムの値が存在する(p≠0である)配列上の位置(インデックス)と、2乗ノルムの値の組として管理した方が適切である。図16に、そのデータ構造を示した。1610がインデックスの配列、1620が2乗ノルムの値の配列であり、2乗ノルムの値が存在する配列上の位置のみ1610に記録され、二乗ノルムの値が存在しない配列の位置は1610には記録されない。また、1620には1610の位置に対応するpの値のみが記録される。インデックスの値は、0からD×W×H−1の範囲となる。
たとえば、定点監視カメラからの入力映像を処理する場合、画像で時間的変動がある部分のみを着目領域とする場合が多い。定点監視カメラ映像中の画像から変動が大きい画素を抽出することは、背景差分法により容易に実装することができる。時間的変動が一定の閾値以下の画素は保存対象に含めない、すなわち、2乗ノルムpの値が0の場合と同等と見なすことによって、1610および1620のデータ列として管理される輝度勾配情報画像のデータ量は、より少なくなり、上記方式の効果が大きくなる。
画像特徴量抽出をする際には、画像状のデータ構造、すなわち、3重配列の状態に戻す必要がある。実施例2で説明したように、詳細化処理では、画像中の必要な一部の周辺領域に対し事前処理を行えば十分である。
実際の処理では、先ず、インデックス1610を参照し、そのインデックスに対応する座標値が、処理の対象となる領域に含まれるか否かを判定し、処理対象領域に含まれる場合のみ、2乗ノルムの値1620を参照し、画像状のデータ構造を構成していく。なお、インデックスから画像上の座標値を取得することは容易である。インデックスの値をDで除算した後、Wで除算した剰余がx座標、切り捨て除算の結果がy座標となる。
なお、本実施例では、輝度勾配ベクトルの分布を画像特徴量として用いた場合について論じたが、ここで述べた方式は、画素値が次元Dのベクトルである画像一般に対して適用可能である。
本実施例のように、画像特徴量の抽出に必要な中間データをデータベース103に記憶しておくことで、画像データの読み込み、多重解像度化、微分処理等を行わずに、特徴量抽出が可能となるため、検索処理の速度が向上する。
このような検索システムを搭載することで、検索時間が短くなり、リアルタイム性を向上させた大規模監視システムの提供が可能となる。
本発明の第4の実施の形態は、実施例3のデータの扱い方を、更に効率化する構成を実装した変形例である。その他の構成は実施例1、3と同様である。実施例3では、インデックス1610を参照することによって、処理対象となる領域に含まれるか否かを判定する。これに対して、本実施例では、座標値が一定範囲に含まれるインデックスの位置を管理する情報、すなわち、インデックスのインデックス情報(以下、メタインデックスと呼ぶ)を別途格納する。これによって、詳細化処理の領域に含まれるインデックスを高速に取り出すことが可能となる。
以下、このメタインデックスの構成方法を説明する。先ず、画像上座標値を1次元上の位置と見なし、適切な大きさSのブロックに分割する。各ブロックに含まれる座標値は、通常は、y座標が等しく、x座標が連続的に変化するものとなる。ただし、画像の幅WとSとの関係から、折り返しが発生する場合がある。この場合、あるy座標値の画像右端に達した後、y座標値が1増加して、x座標値が左端、すなわち、0から増加することになる。各ブロックには、最大S×D個のインデックスが含まれる。メタインデックスは、ブロック内のインデックス数が0でないものに対して構成される。
図17は、本方式で用いるデータ構造を示したものである。インデックスの配列1710は、図16の1610に、値の配列1720は、図16の1620と同等である。一方、1701と1702は、メタインデックスに関わるデータである。1701は、ブロック化された座標値を示す整数値の配列である。ここでブロック化された座標値とは、各ブロック先頭の座標値を1次元上の位置と見なした値は、Sで除算したものである。今、着目する座標値を(x,y)とすれば、それを含むブロックのブロック化された座標値は、(y×W+x)/Sで算出される。一方、1702は、インデックスの配列1710の配列上の位置、すなわち、メタインデックスを要素とする配列である。
画像特徴量抽出をする際には、先ず、処理対象となる座標値とブロック化された座標値1701を照合することによって、処理対象となる座標値を含むブロックを見つける。次に、そのブロックに対応するメタインデックスの配列1702を参照し、含まれるインデックス1710の値から処理対象となる座標値か否かを判定し、処理対象であれば1720に格納された値を取得する。
このように、メタインデックス情報を用いることで、画像特徴量を抽出する補正後部分領域に関する情報のみを取り出しやすくなるため、さらに高速に検索処理を行うことができる。
このような検索システムを搭載することで、検索時間が短くなり、リアルタイム性を向上させた大規模監視システムの提供が可能となる。
100:計算機システム
102:画像登録部
103:記憶装置
104:部分領域生成部
106:クエリ特徴量抽出部
107:類似部分領域検索部
110:検索結果出力部
113:補正部
120:端末計算機
130:ネットワーク
140:カメラ
910、920:補正後部分領域
1011,1012,1111,1112:部分領域
1010,1020,1110,1120:周辺領域
1030,1130:融合領域。

Claims (7)

  1. 画像と、前記画像の一部分である第1領域に含まれる第1画像特徴量とを記憶する記憶部と、
    クエリ画像から、クエリ画像特徴量を抽出する抽出部と、
    前記クエリ画像特徴量に最も近い前記第1画像特徴量を検索し、一次検索結果として出力する検索部と、
    前記一次検索結果を含む前記第1領域の位置または大きさを変更した領域である第2領域を生成し、前記第2領域に含まれる第2画像特徴量を抽出する補正部と、
    記一次検索結果または前記第2画像特徴量のうち、前記クエリ画像特徴量に最も近い画像特徴量を二次検索結果と判定し、前記二次検索結果を含む領域を出力する出力部と、を有し、
    前記補正部は、
    前記第1画像特徴量を含む前記第1領域を取得する画像取得部と、前記第1領域を一部分とする前記画像に対し、画像特徴量を抽出するための事前処理を行う第1処理部と、
    前記第2領域を生成し、前記第2画像特徴量を抽出する第2処理部と、を有し、
    前記第1処理部は、第2領域それぞれの面積の総和と、第2領域を全て包含する最小限の大きさの領域である周辺領域の面積とを比較し、前記周辺領域の面積の方が小さい場合に、前記周辺領域に対して事前処理を行う、
    ことを特徴とする画像検索装置。
  2. 請求項の画像検索装置において、
    前記抽出部は、前記画像から前記第1画像特徴量を抽出し、
    前記記憶部は、前記第1画像特徴量を抽出する際に生成された中間データを、さらに記憶することを特徴とする画像検索装置。
  3. 請求項の画像検索装置において、
    前記中間データには、データの位置を管理するインデックス情報が付与されていることを特徴とする画像検索装置。
  4. 画像と、前記画像の一部分である第1領域に含まれる第1画像特徴量とを記憶装置に記憶する第1ステップと、
    クエリ画像から、クエリ画像特徴量を抽出する第2ステップと、
    前記クエリ画像特徴量に最も近い前記第1画像特徴量を検索し、一次検索結果として出力する第3ステップと、
    前記一次検索結果を含む前記第1領域の、位置または大きさを変更した領域である第2領域を生成し、前記第2領域に含まれる第2画像特徴量を抽出する第4ステップと、
    記一次検索結果または前記第2画像特徴量のうち、前記クエリ画像特徴量に最も近い画像特徴量を二次検索結果と判定し、前記二次検索結果を含む領域を出力する第5ステップと、を有し、
    前記第4ステップは、
    前記記憶装置から、前記第1画像特徴量を含む前記第1領域を取得する第5ステップと、
    前記第1領域を一部分とする前記画像に対し、画像特徴量を抽出するための事前処理を行う第6ステップと、
    前記第2領域を生成し、前記第2画像特徴量を抽出する第7ステップと、を含み、
    前記第6ステップは、第2領域それぞれの面積の総和と、第2領域を全て包含する最小限の大きさの領域である周辺領域の面積とを比較し、前記周辺領域の面積の方が小さい場合に、前記周辺領域に対して事前処理を行うステップである、
    ことを特徴とする画像検索方法。
  5. 請求項の画像検索方法において、
    前記画像から前記第1画像特徴量を抽出する第8ステップをさらに有し、
    前記第1ステップでは、前記第1画像特徴量を抽出する際に生成された中間データを、さらに前記記憶装置に記憶することを特徴とする画像検索方法。
  6. 請求項の画像検索方法において、
    前記中間データにはデータの位置を管理するインデックス情報が付与されていることを特徴とする画像検索方法。
  7. 情報処理端末と、情報処理サーバがネットワークを介して接続された画像検索システムであって、
    前記情報処理サーバは、
    画像と、前記画像の一部分である第1領域に含まれる第1画像特徴量とを記憶する記憶部と、
    クエリ画像から、クエリ画像特徴量を抽出する抽出部と、
    前記クエリ画像特徴量に最も近い前記第1画像特徴量を検索し、一次検索結果として出力する検索部と、
    前記一次検索結果を含む前記第1領域の位置または大きさを変更した領域である第2領域を生成し、前記第2領域に含まれる第2画像特徴量を抽出する補正部と、
    記一次検索結果または前記第2画像特徴量のうち、前記クエリ画像特徴量に最も近い画像特徴量を二次検索結果と判定し、前記二次検索結果を含む領域を前記情報処理端末に出力する出力部と、を有し、
    前記補正部は、
    前記第1画像特徴量を含む前記第1領域を取得する画像取得部と、前記第1領域を一部分とする前記画像に対し、画像特徴量を抽出するための事前処理を行う第1処理部と、前記第2領域を生成し、前記第2画像特徴量を抽出する第2処理部と、を有し、
    前記第1処理部は、第2領域それぞれの面積の総和と、第2領域を全て包含する最小限の大きさの領域である周辺領域の面積とを比較し、前記周辺領域の面積の方が小さい場合に、前記周辺領域に対して事前処理を行う、
    ことを特徴とする画像検索システム。
JP2014116355A 2014-06-05 2014-06-05 画像検索装置、画像検索方法および検索システム Active JP6336827B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014116355A JP6336827B2 (ja) 2014-06-05 2014-06-05 画像検索装置、画像検索方法および検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014116355A JP6336827B2 (ja) 2014-06-05 2014-06-05 画像検索装置、画像検索方法および検索システム

Publications (2)

Publication Number Publication Date
JP2015230578A JP2015230578A (ja) 2015-12-21
JP6336827B2 true JP6336827B2 (ja) 2018-06-06

Family

ID=54887320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014116355A Active JP6336827B2 (ja) 2014-06-05 2014-06-05 画像検索装置、画像検索方法および検索システム

Country Status (1)

Country Link
JP (1) JP6336827B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017168601A1 (ja) * 2016-03-30 2017-10-05 株式会社日立製作所 類似画像検索方法およびシステム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268536A (ja) * 1999-03-12 2000-09-29 Nippon Columbia Co Ltd 記録再生装置および記録媒体
JP2003139678A (ja) * 2001-10-30 2003-05-14 Matsushita Electric Ind Co Ltd 細胞画像分析装置、細胞画像分析方法および記録媒体
JP5713855B2 (ja) * 2011-09-22 2015-05-07 株式会社ソニー・コンピュータエンタテインメント 情報処理装置、情報処理方法、およびコンテンツファイルのデータ構造
JP5788299B2 (ja) * 2011-11-22 2015-09-30 日本電信電話株式会社 画像検索装置、画像検索方法およびプログラム
JP5862243B2 (ja) * 2011-11-30 2016-02-16 キヤノンマーケティングジャパン株式会社 情報処理装置、及びその制御方法、プログラム

Also Published As

Publication number Publication date
JP2015230578A (ja) 2015-12-21

Similar Documents

Publication Publication Date Title
Huang et al. Reconet: Recurrent correction network for fast and efficient multi-modality image fusion
JP4545641B2 (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
JP4618098B2 (ja) 画像処理システム
Esmaeili et al. Fast-at: Fast automatic thumbnail generation using deep neural networks
JP6393230B2 (ja) オブジェクト検出方法及び画像検索システム
JP6888484B2 (ja) 検索プログラム、検索方法、及び、検索プログラムが動作する情報処理装置
JP2015103088A (ja) 画像処理装置、画像処理方法、及びプログラム
Syam et al. An effective similarity measure via genetic algorithm for content based image retrieval with extensive features.
JP2019086979A (ja) 情報処理装置、情報処理方法及びプログラム
Palomares et al. Faldoi: A new minimization strategy for large displacement variational optical flow
Kanaparthi et al. Content based image retrieval on big image data using local and global features
JP4421527B2 (ja) 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体
CN117058554A (zh) 电力设备目标检测方法、模型训练方法和装置
Lin On improvement of the computation speed of Otsu’s image thresholding
JP6336827B2 (ja) 画像検索装置、画像検索方法および検索システム
JP6445738B2 (ja) 類似画像検索方法およびシステム
JP2016014990A (ja) 動画像検索方法、動画像検索装置及びそのプログラム
Chen et al. Robust Semi‐Supervised Manifold Learning Algorithm for Classification
KR20150124825A (ko) 화상분류 기반의 나이브 베이즈 분류기
JP2011141664A (ja) 文書比較装置、文書比較方法、及びプログラム
Zhuang et al. Pose prediction of textureless objects for robot bin picking with deep learning approach
Waykar et al. Multimodal features and probability extended nearest neighbor classification for content-based lecture video retrieval
JP2017021606A (ja) 動画像検索方法、動画像検索装置及びそのプログラム
Jiao Clustering and Graph Convolution of Sub-Regions for Unsupervised Image Segmentation
Bhairnallykar et al. Content based medical image retrieval with SVM classification and relevance feedback

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170110

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180410

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180507

R150 Certificate of patent or registration of utility model

Ref document number: 6336827

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150