JP2014041560A - 画像処理装置、画像処理方法 - Google Patents

画像処理装置、画像処理方法 Download PDF

Info

Publication number
JP2014041560A
JP2014041560A JP2012184572A JP2012184572A JP2014041560A JP 2014041560 A JP2014041560 A JP 2014041560A JP 2012184572 A JP2012184572 A JP 2012184572A JP 2012184572 A JP2012184572 A JP 2012184572A JP 2014041560 A JP2014041560 A JP 2014041560A
Authority
JP
Japan
Prior art keywords
image
recognition
query
similarity
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012184572A
Other languages
English (en)
Other versions
JP2014041560A5 (ja
JP5963609B2 (ja
Inventor
Hirotaka Shiiyama
弘隆 椎山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012184572A priority Critical patent/JP5963609B2/ja
Publication of JP2014041560A publication Critical patent/JP2014041560A/ja
Publication of JP2014041560A5 publication Critical patent/JP2014041560A5/ja
Application granted granted Critical
Publication of JP5963609B2 publication Critical patent/JP5963609B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 局所特徴量を用いた検索の対象となるオブジェクトを選ばない性質と、画像認識の誤りが比較的少ない性質とを併せ持った画像検索を実現する技術を提供すること。
【解決手段】 クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している画像を特定する。特定した画像と関連づけてデータベースが管理している認識尤度を、クエリ画像に対する該特定した画像の類似度とし、該特定した画像に関する情報と、該類似度と、を画像検索結果として出力する。
【選択図】 図2

Description

本発明は、局所特徴を用いたオブジェクト単位での画像検索のための画像処理技術に関するものである。
画像の局所的な特徴量(局所特徴量)を用いて類似画像を検索する方法が提案されている。この方法では、まず、画像から特徴的な点(局所特徴点)を抽出する(非特許文献1)。そして、該局所特徴点とその周辺の画素群とに基づいて、該局所特徴点に対応する特徴量(局所特徴量)を計算する(非特許文献2)。画像の検索は、局所特徴量同士のマッチングによって行う。
従来の検索結果の表示方法は、多くの場合、クエリ画像と検索先画像(サンプル画像)との間の類似度を局所特徴量のマッチングにより算出し、類似度順にサムネール画像を表示する。
他方、局所特徴量を用いて機械学習を行う画像認識技術も提案されている(非特許文献3)。これは、複数の学習画像を用意して機械学習することにより、共通に存在するオブジェクトを検出する技術であり、デジタルスチルカメラ等における顔検出技術等で実用化されている。上記、局所特徴量を用いた画像検索に比べ、機械学習による効果により、誤って認識される割合が比較的少ないという特性を持つ。しかしながら、画像認識技術は前述の様に、予め機械学習を行う必要があり、万物に対応する事は非現実的である。
画像認識技術と画像特徴量検索を併用して認識精度の向上を行う提案もなされている(特許文献1)。これは、再生した画像データから顔画像を検出し、検出した顔画像から個人識別情報を抽出することを、通常の顔画像、サングラスをかけた顔画像、帽子を被った顔画像の夫々について行う。そして、それらが同一人物のものであるとしてそれらを相互に関連付けて記憶する。その後、撮像した画像から顔を検出し、顔画像の特徴点付近に動きがあった場合、動きのあった位置と、動きの方向とに基づいて個人識別情報を切り替える。そして、帽子やサングラスの部分を含めて個人の識別を行う。したがって、個人の識別精度や、顔の追従精度を高めることができる。
C.Harris and M.J. Stephens,"A combined corner and edge detector," In Alvey Vision Conference,pages 147-152, 1988. David G. Lowe, "Distinctive Image Features from Scale-Invariant Keypoints," International Journal of Computer Vision, 60, 2 (2004), pp.91-110. 柳井, "一般物体認識の現状と今後," 情報処理学会論文誌:コンピュータビジョンとイメージメディア Nov.2007, Vol.48 No.SIG 16(CVIM 19)
特開2011-76439号公報
特許文献1では、顔検出結果とその近傍の画像特徴を含めて同一のものであると判断しており、検索処理ではないものの、顔検出結果とその他の部分の画像特徴量を合わせてマッチングをしている。しかし、顔は器官検出ベースの特徴点特徴量、顔の近傍の帽子などは形状と色特徴でそれぞれ異なる特徴であり、顔検出に用いる特徴量と画像特徴量検索に用いる画像特徴量の共通化の概念は無く、画像認識と画像特徴量比較が独立した処理となっている。
局所特徴量を用いた検索の対象となるオブジェクトを選ばない性質と、画像認識の対象画像オブジェクトが限られるが誤った検出が比較的少ないという性質を持ち合わせた、良好な検索結果をもたらす画像検索を実現できていない。画像から抽出した局所特徴量を画像認識に流用して効率化することも行っていない。
画像認識技術は、ある認識ターゲットに対して多量の学習データを用いて機械学習を行う事で、画像特徴の検索に比べ精度の高い検索が期待できる。しかし、学習画像はアピアランスの異なるものを与える事が通常であり、認識尤度は即、クエリ画像との類似性を示すものでは無いので、画像認識の結果を用いた検索だけでは不十分である。
更に、画像認識の対象は時間が経つとともに増加するので、過去に登録した画像に対して新しい画像認識結果を適応する場合には、通常、再登録処理を行う必要があり、又、当然画像データが参照できる環境で無ければならない。反対に、局所特徴量を用いた検索では、機械的に見て特徴量が類似している検索結果を出してしまうので、その検索結果を人間が見ると全く違うオブジェクトであることがある。
本発明は、上記の課題に鑑みてなされたものであり、局所特徴量を用いた検索の対象となるオブジェクトを選ばない性質と、画像認識の誤りが比較的少ない性質とを併せ持った画像検索を実現する技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の画像処理装置は、それぞれの画像について、該画像に対する画像認識処理によって得られた該画像中の1以上のオブジェクトのそれぞれの属性及び認識尤度を、該画像と関連付けて管理しているデータベースにアクセス可能な画像処理装置であって、クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している画像を特定する特定手段と、前記特定手段が特定した画像と関連づけて前記データベースが管理している認識尤度を、前記クエリ画像に対する該特定した画像の類似度とし、該特定した画像に関する情報と、該類似度と、を画像検索結果として出力する出力手段とを備えることを特徴とする。
本発明の構成によれば、局所特徴量を用いた検索の対象となるオブジェクトを選ばない性質と、画像認識の誤りが比較的少ない性質とを併せ持った画像検索を実現することができる。
画像処理装置のハードウェア構成例を示すブロック図。 画像処理装置の機能構成例を示すブロック図。 画像特徴抽出・認識処理部202(202’)の機能構成例を示すブロック図。 特徴点/局所特徴量算出部303が行う処理のフローチャート。 スケールスペースを説明する図。 画像登録処理のフローチャート。 DB204内のインデックススキーマを示す図。 登録画像及びクエリ画像を示す図。 DB204に登録される各インデックスを示す図。 画像検索処理のフローチャート。 画像検索処理のフローチャート。 画像検索処理のフローチャート。 DBインデックスを更新する処理のフローチャート。
以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載の構成の具体的な実施例の1つである。
<はじめに>
第1の実施形態の説明の前に、各実施形態で述べる概要を説明する。登録画像より特徴点を検出しその特徴点の局所特徴量を抽出し、更に画像認識処理し、画像中の認識対象のメタデータを抽出するとともに、これらを合わせて記憶する。予め、画像認識の準備として、認識対象を含んだ画像、含まない画像を学習用に準備し、機械学習を行っておく。
そして、画像認識処理を行った結果の認識対象のメタデータには少なくとも認識対象の属性を含む。更にメタデータには、認識対象の領域情報と、認識尤度の少なくともいずれか1つを記憶しておく。尚、局所特徴には特徴点の位置情報を含む事とする。検索時は、クエリ画像を登録時と同様、画像認識処理し画像中の認識対象のメタデータを抽出する。
画像認識処理で用いる局所特徴量を、画像検索処理で用いる局所特徴量と共通化することにより、局所特徴量の類似度の比較結果と画像認識の結果が大きく異ならないようにする。例えば、局所特徴量が輝度情報から得られるもので、画像認識が色情報を用いたものであると、それぞれでヒットする画像の見かけが大きく異なるものとなってしまう。
クエリ画像に対して画像認識処理を行い、認識対象のメタデータが得られた場合に、認識対象のメタデータ及び認識対象の領域の局所特徴量の少なくとも片方を用いてマッチングするが、認識対象が無かった場合に局所特徴のみを用いてマッチングする。これにより、画像認識の誤検出の少なさを生かしながらも、画像認識の対象が有限である影響を画像特徴量検索処理で緩和した画像検索処理が可能となる。
また、クエリ画像に対して画像認識処理を行って認識対象のメタデータが得られた場合に、同じ認識対象の属性を持つ画像に絞り込み、認識対象の領域中の局所特徴比較を行い、認識対象が無かった場合に局所特徴を用いて画像特徴量比較処理する方法も有る。
このメリットとしては、登録画像とクエリ画像の認識領域中の局所特徴量を比較することにより、認識尤度だけでは解決できなかったクエリとの類似性を反映しつつ、認識結果を絞り込みに使用した効率の良い検索処理を行う事が可能になる。
更に次のような方法もある。即ち、クエリ画像に対して画像認識処理を行い、認識対象のメタデータが得られた場合、認識対象の属性を用いてマッチングし、認識尤度を得て更に局所特徴を用いて画像特徴量比較を行って類似度を得て認識尤度と類似度の重み付け和で総合類似度を算出する。そして、認識対象が無かった場合に局所特徴を用いて画像特徴量検索処理する。これにより、処理コストは増えるものの、画像認識が失敗した時にも、検索漏れを減らす事が可能となる。
なお、クエリ画像で認識率の低い認識対象が検出された場合には、認識尤度への重みを低くし、認識率が高い認識対象の場合には高い値の重みとすると良好な結果が得られる。更に、類似度の重みが零の場合には局所特徴を用いた画像特徴比較処理を行わないと、無駄な処理を防ぐ事が出来る。
ところで、メタデータを用いてマッチングを行う際、認識メタデータの比較は同一属性であるかを判断し、尤度をその類似度へ換算する事が最も簡便な方法である。また、局所特徴を用いてマッチングを行う際、画像認識領域に含まれる局所特徴量のマッチングで求めた類似度を用いることで、真にクエリ画像の対応する領域との類似性で比較を行う事が可能となる。
もちろん、尤度と画像全体の特徴点に対する局所特徴量のマッチングで求めた類似度を統合した類似度を算出しても良い。このメリットは、画像認識で得た尤度を緩やかに検索結果に反映する事が可能となり、画像認識の失敗の影響を緩和し、よりロバストな検索が可能である事である。
ところで、画像認識処理と画像特徴検索処理において共通の局所特徴を用いる事により、画像認識の対象が増えた場合でも既に抽出した局所特徴を用いる事により、登録済みの画像を再解析を行う事無く画像認識を行う事が可能となる。その結果得たメタデータを追加記憶する事が可能となる。
これにより、画像認識対象が増えた場合に、過去に登録した画像を最初から解析する事無く、安価な処理コストで増えた画像認識対象を反映した画像検索用のDBを更新する事が可能となる。
[第1の実施形態]
先ず、本実施形態に係る画像処理装置のハードウェア構成例について、図1のブロック図を用いて説明する。なお、図1に示した構成はあくまでも一例であり、画像処理装置が行うものとして後述する各処理を実行可能な構成であれば、如何なる構成を採用しても良い。例えば、画像を撮像して本装置に入力するためのディジタルカメラを本装置に接続するようにしても良い。また、本装置で検索結果として得た情報を外部の機器に対して出力可能な構成を加えても良い。
CPU101は、RAM105やROM106に格納されているコンピュータプログラムやデータを用いて処理を実行することで、画像処理装置全体の動作制御を行うと共に、画像処理装置が行うものとして後述する各処理を実行する。
入力装置102は、アルファベットキー、ひらがなキー、カタカナキー、句点等の文字記号入力キー、カーソル移動を指示するカーソル移動キー等のような、各種の機能キーを有するキーボードや、マウス、スティックポインタなどにより構成されている。ユーザはこの入力装置102を操作することで各種の指示をCPU101に対して入力することができる。
出力装置103は、CRTや液晶画面等により構成されている表示装置であり、CPU101による処理結果を画像や文字などでもって表示することができる。
記憶装置104には、OS(オペレーティングシステム)や、後述するデータベース、画像処理装置が行うものとして後述する各処理をCPU101に実行させるためのコンピュータプログラムやデータが保存されている。また、既知の情報として後述する各情報も、この記憶装置104に保存されている。記憶装置104に保存されているコンピュータプログラムやデータは、CPU101による制御に従って適宜RAM105にロードされ、CPU101による処理対象となる。なお、この記憶装置104には、ハードディスク、CD-ROM、DVD-ROM、フラッシュメモリ等を用いることができる。
RAM105は、記憶装置104からロードされたコンピュータプログラムやデータを一時的に記憶するためのエリア、CPU101が各種の処理を実行する際に用いるワークエリア、等を有する。即ち、RAM105は、各種のエリアを適宜提供することができる。ROM106には、画像処理装置の設定データやブートプログラムなどが格納されている。上記の各部はバス(BUS)107に接続されている。
次に、本画像処理装置への画像登録処理と、登録した画像から目的の画像をクエリ画像に基づいて検索する画像検索処理と、について説明する。画像登録処理及び画像検索処理の為に使用する画像処理装置の機能の構成例について図2のブロック図を用いて説明する。
画像特徴抽出・認識処理部202は、記憶装置104からロードされた、若しくは外部機器から入力された登録画像201から特徴点(局所特徴点)とその特徴量(局所特徴量)を抽出し、抽出した特徴量を用いて登録画像201に対する画像認識処理を行う。そして画像特徴抽出・認識処理部202は、この画像認識処理の結果をメタデータとして出力する。このメタデータには、登録画像201中における特徴点の座標位置と該特徴点における特徴量、登録画像201中で認識できたオブジェクトの属性を示す属性情報、画像認識尤度、該オブジェクトの領域を示す領域情報、が含まれている。画像特徴抽出・認識処理部202の詳細については、図3を用いて後述する。
本実施形態では、局所特徴量を共通化する事により、局所特徴量の比較結果と画像認識の結果が大きく異ならないようにする。それぞれの結果が大きく異なってしまう例としては、局所特徴量が輝度情報から得られるもので、画像認識で色情報を用いると、これらをハイブリッドした場合にそれぞれでヒットする画像の見かけが大きく異なり不自然に結果となってしまう。
画像特徴・認識結果登録処理部203は、画像特徴抽出・認識処理部202が出力したメタデータを、このメタデータの生成元である登録画像201と関連付けてデータベース(DB)204に登録する。このように、画像処理装置200は、登録画像201が入力されるたびに、該登録画像201から上記のメタデータを生成し、該生成したメタデータを該登録画像201と関連付けてDB204に登録する、いわゆる画像登録処理を行う。
画像特徴抽出・認識処理部202’は、受け付ける画像が画像特徴抽出・認識処理部202と異なるだけで、画像特徴抽出・認識処理部202と同様の構成を有し且つ同様の動作を行うものである。画像特徴抽出・認識処理部202’は、記憶装置104からロードされた、若しくは外部機器から入力されたクエリ画像205から特徴点とその特徴量を抽出し、抽出した特徴量を用いて該クエリ画像205に対する画像認識処理を行う。そして画像特徴抽出・認識処理部202’は、この画像認識処理の結果をメタデータとして出力する。このメタデータには、クエリ画像205中における特徴点の座標位置と該特徴点における特徴量、クエリ画像205中で認識できたオブジェクトの属性を示す属性情報、画像認識尤度、該オブジェクトの領域を示す領域情報、が含まれている。画像特徴抽出・認識処理部202’の詳細については、図3を用いて後述する。
画像比較処理部206は、画像特徴抽出・認識処理部202’によってクエリ画像205から生成されたメタデータを用いてDB204から画像検索を行い、画像検索結果(検索処理結果)207を出力する。ここでいう検索は、局所特徴量同士を比較する検索ではなく、画像認識結果のメタデータが一致または類似するかどうか比較する検索である。画像比較処理部206の詳細については後述する。
DB204は、画像処理装置内に備えることに限るものではなく、画像処理装置がアクセス可能に該画像処理装置に直接的若しくは間接的に接続されていれば、その接続形態は特定の接続形態に限るものではない。
なお、図2に示した各部はハードウェアで構成しても良いが、本実施形態では、DB204を除く各部(認識辞書305は除く)はコンピュータプログラムで実装し、DB204及び認識辞書305は記憶装置104で実装する。また、以下の説明では、図2の各部を動作の主体として説明するが、実際には、CPU101が対応する機能部のコンピュータプログラムを実行することで対応する動作が実行される。
次に、画像特徴抽出・認識処理部202(202’)の機能構成例について、図3のブロック図を用いて説明する。
画像入力部302は、入力画像301(画像特徴抽出・認識処理部202の場合は登録画像201、画像特徴抽出・認識処理部202’の場合はクエリ画像205に相当する)を受けると、この入力画像301を特徴点/局所特徴量算出部303に転送する。
特徴点/局所特徴量算出部303は、画像入力部302から転送された入力画像301から、特徴点とその特徴量を算出する。特徴点/局所特徴量算出部303の動作の詳細については後述する。
画像認識処理部304は、認識辞書305を参照しながら、特徴点/局所特徴量算出部303が求めた特徴点とその特徴量を用いて、入力画像301に対する画像認識処理を行う。認識辞書305には複数の画像認識対象の情報が登録されている。そして画像認識処理部304は、画像認識処理の結果として上記のメタデータを局所特徴量及び画像認識結果306として出力する。
次に、特徴点/局所特徴量算出部303についてより詳細に説明する。従来技術として説明したように、画像の局所的な特徴量(局所特徴量)を用いたマッチングにより類似画像を検索する方法、画像特徴量検索が提案されている。
局所特徴量を利用する手法においては、局所特徴量を回転不変、拡大・縮小不変となる複数の要素で構成される情報として定義する。これにより、画像を回転させたり、拡大又は縮小させたりした場合であっても、検索を可能にする。
局所特徴量は一般的にベクトルとして表現される。ただし、局所特徴量が回転不変、拡大・縮小不変であることは理論上の話であり、実際のデジタル画像においては、線形補間をするので、画像の回転や拡大・縮小処理前の局所特徴量と処理後の対応する局所特徴量との間に若干の変動が生じる。
回転不変の局所特徴量を算出するために、たとえば非特許文献2では、局所特徴点周辺の局所領域の画素パターンから主方向を算出し、局所特徴量算出時に主方向を基準に局所領域を回転させて方向の正規化を行う。
また、拡大・縮小不変の局所特徴量を算出するために、異なるスケールの画像を内部で生成し、各スケールの画像からそれぞれ局所特徴点の抽出と局所特徴量の算出を行う。ここで、内部で生成した一連の異なるスケールの画像集合は一般的にスケールスペースと呼ばれ、図5にその概要を示す。各特徴点の特徴量は、方向の正規化の際の回転角度および特徴量を算出したスケールスペースも記憶する。
次に、特徴点/局所特徴量算出部303が行う処理について、同処理のフローチャートを示す図4を用いて説明する。ステップS401では、画像入力部302から転送された入力画像301を受け取り、ステップS402では、この入力画像301の輝度画像を生成する。
ステップS403では、ステップS402で生成した輝度画像の縮小画像を生成し、ステップS404では、この縮小画像から特徴点を抽出し、ステップS405では、この特徴点における特徴量を抽出する。
次に、画像比較処理部206の詳細について説明する。特徴点/局所特徴量の比較に基づく画像の照合方法にはいろいろあるが、ここでは以下の文献で説明がなされているRANSACを利用した方法を説明する。
M. A. Fischler and R. C. Bolles, “Random sample consensus: A paradigm formodel fitting with applications to image analysis and automated cartography,” Commun. ACM, no.24, vol.6, pp.381−395, June 1981.
クエリ画像の各特徴点に対し、DB204が管理しているそれぞれの登録画像の特徴点で、特徴間距離が最小となるものをペアで記述する。次に、クエリ画像から3個の特徴点をランダムに選択し、それぞれの特徴間距離が最小となる登録画像の特徴点群との間で、その座標の対応からアフィン変換行列を求める。このアフィン変換行列を用い、クエリ画像の残りの特徴点の座標を登録画像の座標に変換し、その近傍に上記特徴間距離が最小となるペアの特徴点が存在するかを確認し、存在すれば1票投票し、存在しなければ投票しない。最終的に、この投票数が所定の値に達した場合には、クエリ画像と登録画像は部分一致する領域が存在すると判断し、その投票数が多いほど一致する領域が大きいと考える。
他方、投票数が所定の値に達しない場合には、新たにクエリ画像から3個の特徴点をランダムに選択し、アフィン変換行列を求める処理から再度処理を行うが、この再処理は定められた反復カウント数以内で繰り返す。もし、反復カウント数に達しても投票数が所定の値を超えなければ、部分一致する領域が存在しないと判断して比較の処理を終了する。そして、部分一致する領域が存在する場合、上記求めたアフィン変換行列と特徴間距離が最小となるもののペアを用い、クエリ画像中の着目した特徴点と対応する特徴点を求めることが出来る。
更に、その特徴点を求める際の方向の正規化の際の回転角度からクエリ画像と登録画像の回転角度関係を求めることが出来る。また更に、その特徴点を求める際のスケールスペースを用いて、クエリ画像と登録画像の拡縮関係を知る事が出来る。
また、上記の通り、非特許文献3には、一般物体認識技術として次の様な技術が記されている。ある認識対象カテゴリに属する画像群から特徴量を算出したものを学習データとする。その分布モデルを学習データを用いて最尤推定で推定し、未知のデータに対して分布モデルを利用して事後確立を計算する。そして、事後確率最大化(Maximum A Posteriori, MAP)推定によってどのカテゴリに属すかを決定し、これを認識結果とする。その他、様々なモデルや機械学習方式を組み合わせた方法が数多く存在し、本実施形態で用いる画像認識処理は、局所特徴量を用いて行うものであればその機械学習方法を問わない。
次に、画像処理装置200が行う画像登録処理について、同処理のフローチャートを示す図6を用いて説明する。ステップS601では、画像入力部302は、記憶装置104からロードされた、若しくは外部機器から入力された登録画像201を取得する。ステップS602では、特徴点/局所特徴量算出部303は、ステップS601で取得した登録画像201から特徴点とその特徴量を抽出する。
ステップS603では、画像認識処理部304は、ステップS602で抽出した特徴量を用いて、登録画像201に対する画像認識処理を行う。画像認識処理には機械学習済みの検出器を用いる。画像認識対象が複数種ある場合には、それに合わせて検出器も複数種用意しておく必要がある。
各検出器については、事前に正解画像として認識したいカテゴリの様々なアピアランスの画像を用意し、また非正解画像としてカテゴリ外の画像を用意し、機械学習を行う。SIFTの様な回転/拡縮不変の局所特徴量を用いる事により、回転、拡大や縮小した認識対象のオブジェクトの有る画像を認識する事が可能である。
更に、その画像中のどこにオブジェクトが存在するかに関しては、オブジェクトが存在すると判断した画像に対し、マスク領域を設定して画像内をスキャンさせ、マスクサイズを小さくしていって検出器に入力し、その認識尤度を求める。そして、認識尤度が予め定めた閾値よりも高くなったマスク領域に、認識対象となるオブジェクトが存在すると推定する。
そしてステップS604では、画像特徴・認識結果登録処理部203は、ステップS603で行った画像認識処理の結果をメタデータとして、登録画像201と関連付けてDB204に登録する。
上記の画像登録処理によってDB204に登録された情報について、即ち、DB204内のインデックススキーマについて、図7を用いて説明する。図7(a)は、画像管理インデックスの構成例を示しており、これは登録画像ごとにDB204に登録されているものである。
「画像ID」のフィールドには、登録画像201に固有のIDが登録され、このIDは例えば登録画像201に固有の整数値である。後述する検索の結果は、画像IDと類似度とのセットで表される。
「画像データファイル名」のフィールドには、登録画像201が登録されている登録先(例えばDB204)における該登録画像201のパス名が登録される。もちろん、登録画像201の登録先はDB204に限るものではなく、他の装置であっても良い。
「認識結果」のフィールドには、登録画像201に対する画像認識処理により認識された各オブジェクトのID(認識ID)が登録される。認識IDは、図7(b)に示す認識結果管理インデックスへのリンク情報でもある。「認識結果」のフィールドは、即ち可変長のフィールドになる。
「画像特徴量」のフィールドには、登録画像201から抽出された特徴量のID(画像特徴ID)が登録される。画像特徴IDは、図7(c)に示す画像特徴インデックスへのリンク情報でもある。「画像特徴量」のフィールドは、即ち可変長のフィールドに成る。
次に、認識結果管理インデックスの構成例について、図7(b)を用いて説明する。認識結果管理インデックスは、認識されたオブジェクトごとにDB204に登録されるものである。
「認識ID」のフィールドには、登録画像201から認識されたオブジェクトに固有のIDが登録され、このIDは例えば、このオブジェクトに固有の整数値である。
「認識属性」のフィールドには、登録画像201から認識されたオブジェクトの属性を示す属性値が登録される。図7では、オブジェクトの属性が「人体」であれば属性値は「1」、オブジェクトの属性が「車」であれば属性値は「2」となっている。属性の種類や数はこれに限るものではなく、属性がN種類あれば、属性値は1〜Nの範囲を取る。
「認識尤度」のフィールドには、登録画像201から認識されたオブジェクトの認識尤度が登録され、例えば0〜100(%)の範囲の数値で表される。もちろん、認識尤度の表現方法はこれに限るものではない。
「認識領域」のフィールドには、ステップS603で行った画像認識処理で求めた認識尤度が予め定めた閾値よりも高くなったマスク領域(=認識領域)を示す領域情報が登録されている。ここではマスク領域の左上隅の頂点及び右下隅の頂点のそれぞれの座標位置が登録されている。もちろん、領域情報の表現方法はこれに限るものではない。
「認識領域中の画像特徴量」のフィールドには、「認識領域」のフィールドで定義している領域情報が示す領域(認識領域)内のそれぞれの特徴点の特徴量の画像特徴IDが登録されている。「認識領域中の画像特徴量」のフィールドに登録されている情報は第1の実施形態では用いず、第2の実施形態で用いるので、このフィールドに登録されている情報については第2の実施形態で詳しく説明する。
次に、画像特徴インデックスの構成例について、図7(c)を用いて説明する。画像特徴インデックスは、特徴点の特徴量ごとにDB204に登録されるもので、1つの特徴点に対する特徴量を1レコードで記憶する。
「画像特徴ID」のフィールドには、特徴量に固有のIDが登録される。「画像ID」のフィールドには、該特徴量が抽出された登録画像の画像IDが登録される。「特徴点座標」のフィールドには、登録画像上における該特徴点の座標位置が登録される。「局所特徴量」のフィールドには、ベクトル表現で表現される特徴量が登録される。
ここで、図8(a)〜(c)のそれぞれに示す登録画像(登録画像1〜3)を対象にして画像特徴抽出・認識処理部202及び画像特徴・認識結果登録処理部203を動作させた場合に、DB204に登録される各インデックスを図9(a)〜(c)に示す。
図8(a)に示した登録画像1(画像ID=1の登録画像)には、車のオブジェクト801〜803と、バイクのオブジェクト804が含まれている。ここで、本実施形態では、画像認識において、様々な種類の画像を学習し、これら3つの車の画像が認識されるものとし、バイクは画像認識対象とせず、認識されないものとする。図8(b)、(c)のそれぞれに示した登録画像2,3(それぞれ画像ID=2,3の登録画像)には、車のオブジェクト805,人のオブジェクト806が含まれている。
このとき、図9(a)に示す如く、DB204に登録される画像管理インデックスにおいて、「画像ID」のフィールドには、それぞれの登録画像の画像ID(1〜3)が登録されている。
画像ID=1が登録されている行(レコード)における「画像データファイル名」のフィールドには、画像ID=1の登録画像のパス名が登録されている。また、同行の「認識結果」のフィールドには、オブジェクト801〜803のそれぞれのID(認識ID)が登録されており、同行の「画像特徴量」のフィールドには、画像ID=1の登録画像から抽出された特徴量のIDが登録されている。なお、上記の取り、オブジェクト804については画像認識は行われないが、その特徴量のIDは「画像特徴量」のフィールドに登録されている。図9では、登録画像1から抽出した全特徴点に対する局所特徴量が800個検出されたとしているため、画像特徴IDを1〜800の間で付与する。
画像ID=2が登録されている行における「画像データファイル名」のフィールドには、画像ID=2の登録画像のパス名が登録されている。また、同行の「認識結果」のフィールドには、オブジェクト805のID(認識ID)が登録されており、同行の「画像特徴量」のフィールドには、画像ID=2の登録画像から抽出された特徴量のIDが登録されている。図9では、登録画像2から抽出した全特徴点に対する局所特徴量が200個検出されたとしているため、画像特徴IDを801〜1000の間で付与する。
画像ID=3が登録されている行における「画像データファイル名」のフィールドには、画像ID=3の登録画像のパス名が登録されている。また、同行の「認識結果」のフィールドには、オブジェクト806のID(認識ID)が登録されており、同行の「画像特徴量」のフィールドには、画像ID=3の登録画像から抽出された特徴量のIDが登録されている。図9では、登録画像3から抽出した全特徴点に対する局所特徴量が200個検出されたとしているため、画像特徴IDを1001〜1200の間で付与する。
また、図9(b)に示す如く、DB204に登録される認識結果管理インデックスにおいて、「認識ID」のフィールドには、オブジェクト801〜803、805〜806のそれぞれのID、即ち、1〜5が登録されている。図9(b)に示す如く、登録画像1から認識した結果が認識ID=1〜3のレコードに登録されており、登録画像2から認識した結果が認識ID=4のレコードに登録されており、登録画像3から認識した結果が認識ID=5のレコードに登録されている。
認識ID=1が登録されている行における「認識属性」のフィールドには、認識ID=1のオブジェクト、即ち車のオブジェクト801の属性を示す属性値が登録されている。また、同行の「画像ID」のフィールドには、このオブジェクト801の認識元である登録画像1のIDが登録されており、同行の「認識尤度」のフィールドには、登録画像1からオブジェクト801を画像認識した際の認識尤度が登録されている。また、同行の「認識領域」のフィールドには、オブジェクト801について画像認識処理で求めた認識尤度が予め定めた閾値よりも高くなったマスク領域を示す領域情報が登録されている。また、同行の「認識領域中の画像特徴量」のフィールドには、オブジェクト801について画像認識処理で求めた認識尤度が予め定めた閾値よりも高くなったマスク領域内のそれぞれの特徴点の特徴量の画像特徴IDが登録されている。認識ID=2〜5のそれぞれのレコードも同様の構成を有している。
今回、車を学習するに当たり、ピックアップトラックの画像を学習に多めに用いたので、ピックアップトラックのオブジェクト802に対する認識尤度が最も高く90%となっている。また、スポーツカーのオブジェクト801に対する認識尤度は85%、バスのオブジェクト803に対する認識尤度は80%となっている。他方、スポーツカーのオブジェクト805に対する認識尤度は87%、人体のオブジェクト806に対する認識尤度は90%の尤度となっている。
認識領域に関しては、各認識IDに対応するオブジェクト801〜803、オブジェクト805〜806のそれぞれについて、登録画像1〜3のうち該当する画像中の位置を記憶する。
また、図9(c)に示す如く、画像特徴ID=1〜1200のそれぞれに対し、画像特徴インデックスが生成される。画像特徴ID=1が登録されている行における「画像ID」のフィールドには、画像特徴ID=1の特徴量の抽出元である登録画像のIDが登録されている。同行の「特徴点座標」のフィールドには、画像特徴ID=1の特徴点の登録画像1上の座標位置が登録されている。同行の「局所特徴量」のフィールドには、画像特徴ID=1に対応する特徴量のベクトルが登録されている。画像特徴ID=2〜1200のそれぞれのレコードも同様の構成を有している。
ところで、「認識領域中の画像特徴量」のフィールドに関しては上記の通り、第2の実施形態で使用するものであるが、上記認識領域中に含まれる特徴点を画像特徴ID群で記憶する。
次に、図8(d)に示したクエリ画像に類似する画像をDB204から検索する画像検索処理について、同処理のフローチャートを示す図10を用いて説明する。なお、この処理を拡張すれば、入力されたクエリ画像中のオブジェクト毎に、該オブジェクトをクエリとして類似するオブジェクトを含む画像を検索することもできる。
ステップS1001では、画像入力部302は、記憶装置104からロードされた、若しくは外部機器から入力された図8(d)のクエリ画像を取得し、特徴点/局所特徴量算出部303に転送する。なお、画像入力部302は、取得したクエリ画像を出力装置103の画面に表示させた後、ユーザが入力装置102を用いて指定したオブジェクト領域内の画像を、改めてクエリ画像として特徴点/局所特徴量算出部303に転送するようにしても良い。
ステップS1002では、特徴点/局所特徴量算出部303は、ステップS1001で取得したクエリ画像から特徴点とその特徴量を抽出する。ステップS1003では、画像認識処理部304は、ステップS1002で抽出した特徴量を用いて、クエリ画像に対する画像認識処理を行う。
ステップS1004では、画像認識処理部304は、クエリ画像中のオブジェクトに対する画像認識処理が成功したか否か(例えば属性が特定可能なオブジェクトが1以上あったか否か)を判断する。この判断の結果、画像認識が成功したオブジェクトがあった場合には、処理はステップS1005に進み、無かった場合には、処理はステップS1006に進む。
ステップS1005では、画像比較処理部206は先ず、ステップS1003における画像認識処理で求めたオブジェクトの属性値と同じ属性値が登録されたレコードを、DB204内の認識結果管理インデックスから特定する。ここでは図8(d)に示す車が写っている画像をクエリ画像としている。そのため、この車が画像認識されてその結果、オブジェクトの属性値は「2」であるため、この場合、認識結果管理インデックスからは、属性値「2」が登録されているレコード、即ち、認識ID=1〜4のレコードが特定される。ここで、認識ID=1〜3は何れも登録画像1に対するものであるため、認識ID=1〜3のレコードに登録されている認識尤度のうち、最も大きい認識尤度を、登録画像1に対する認識尤度とする。従って、ここでは、クエリ画像に対する類似度が90%の検索結果画像が登録画像1、クエリ画像に対する類似度が87%である検索結果画像が登録画像2、として、検索結果を得る。
そして画像比較処理部206は、認識尤度の高い順、即ち、登録画像1、登録画像2、の順番で画像IDと類似度と、を出力する。この場合(画像ID、類似度)=(1,90)、(2,87)の順に出力する。なお、認識尤度が0から100%で表されない場合には、0から100%に成る様に換算して類似度とする。これにより、画像特徴の比較処理無く高速に検索可能である。
一方、クエリ画像として図8(e)の画像を用いた場合、ステップS1004では、画像認識処理部304は、クエリ画像中のオブジェクトに対する画像認識処理が成功していないと判断し、処理はステップS1006に進む。
ステップS1006では、画像比較処理部206は、図9(a)の画像管理インデックスに登録されている各画像IDのレコードを順次参照する。そして画像比較処理部206は、該参照したレコード中の各画像特徴IDの画像特徴インデックス中の「局所特徴量」のフィールドに登録されているベクトルと、クエリ画像から求めた特徴量と、を用いて上記のRANSACを用いたマッチングを行う。そして、クエリ画像から求めた特徴量と類似する順に、画像IDとその類似度と、を検索結果として出力する。
このような処理により、特徴量を用いた画像検索のオブジェクトを選ばない性質と、画像認識の対象オブジェクトを選ぶが誤った検出が比較的少ないという性質を組み合わせる事ができた。その効果として、画像認識可能なオブジェクトがクエリ画像の場合には、極めて高速かつ、ノイズの少ない良好な検索結果をもたらすことができた。
[第2の実施形態]
第1の実施形態では、クエリ画像が認識可能な場合には、上記のような処理を行うことで、高速に類似画像検索が可能である。しかし、第1の実施形態によれば、最も類似度が高いオブジェクトは画像認識尤度が最も高い、登録画像1中のオブジェクト802となる。これは、クエリ画像にアピアランスが似ているは登録画像2中のオブジェクト805と思う多くのユーザの期待とは異なる結果である。本実施形態では、このような課題を解決するものである。
本実施形態は、画像登録処理は第1の実施形態と同様であるが、画像検索処理において以下の点が第1の実施形態と異なる。以下に、第1の実施形態との差分のみについて説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。本実施形態に係る画像検索処理について、同処理のフローチャートを示す図11を用いて説明する。
ステップS1101では、画像入力部302は、記憶装置104からロードされた、若しくは外部機器から入力された図8(d)のクエリ画像を取得し、特徴点/局所特徴量算出部303に転送する。なお、画像入力部302は、取得したクエリ画像を出力装置103の画面に表示させた後、ユーザが入力装置102を用いて指定したオブジェクト領域内の画像を、改めてクエリ画像として特徴点/局所特徴量算出部303に転送するようにしても良い。
ステップS1102では、特徴点/局所特徴量算出部303は、ステップS1101で取得したクエリ画像から特徴点とその特徴量を抽出する。ステップS1103では、画像認識処理部304は、ステップS1102で抽出した特徴量を用いて、クエリ画像に対する画像認識処理を行う。
ステップS1104では、画像認識処理部304は、クエリ画像中のオブジェクトに対する画像認識処理が成功したか否か(例えば属性が特定可能なオブジェクトがあったか否か)を判断する。この判断の結果、画像認識が成功したオブジェクトがあった場合には、処理はステップS1105に進み、無かった場合には、処理はステップS1107に進む。
ステップS1105では画像比較処理部206は上記のステップS1005と同様にして、ステップS1103における画像認識処理で求めたオブジェクトの属性値と同じ属性値が登録されたレコードを、DB204内の認識結果管理インデックスから特定する。ここでは図8(d)に示す車が写っている画像をクエリ画像としている。そのため、この車が画像認識されてその結果、オブジェクトの属性値は「2」であるため、この場合、認識結果管理インデックスからは、属性値「2」が登録されているレコード、即ち、認識ID=1〜4のレコードが特定される。なお、認識ID=1〜4のレコードのうち、認識尤度が閾値以上のレコードのみを以降の対象としても良い。
ステップS1106で画像比較処理部206は、ステップS1105で特定した各レコードについて、次のような処理を行う。即ち、該レコード中の画像特徴IDに対応する画像特徴インデックス内の特徴量と、該レコード内の「認識領域」のフィールドで定義されている領域に対応するクエリ画像内の領域中の特徴量と、のマッチングを行って類似度を求める。これにより、局所特徴量を比較する画像およびその領域を絞り込む事が出来、比較処理のコストを大幅に低減可能である。マッチングに関しては、上記のRANSAC法を用いる事が可能である。
或いは、マッチングに関しては多次元の、SIFTで言えば128次元の局所特徴量をクラスタリングし、各クラスに属す特徴点個数のヒストグラムを作成し、ヒストグラムの正規化相関か或いはインターセクションを用いる事で、類似度の算出が可能である。
そして画像比較処理部206は、第1の実施形態と同様にして、より高い類似度を求めたレコード順に、該レコード内の画像IDと、この類似度と、を検索結果として出力する。
このように、登録画像とクエリ画像の認識領域中の局所特徴量を比較する事により、認識尤度だけでは解決できなかったクエリとの類似性を反映しつつ、認識結果を絞り込みに使用した効率の良い検索処理を行う事が可能になる。
一方、クエリ画像として図8(e)の画像を用いた場合、ステップS1004では、画像認識処理部304は、クエリ画像中のオブジェクトに対する画像認識処理が成功していないと判断し、処理はステップS1107に進む。
ステップS1107では、画像比較処理部206は、図9(a)の画像管理インデックスに登録されている各画像IDのレコードを順次参照する。そして画像比較処理部206は、該参照したレコード中の各画像特徴IDの画像特徴インデックス中の「局所特徴量」のフィールドに登録されているベクトルと、クエリ画像から求めた特徴量と、を用いて上記のRANSACを用いたマッチングを行う。そして、クエリ画像から求めた特徴量と類似する順に、画像IDとその類似度と、を検索結果として出力する。
[第3の実施形態]
本実施形態では、第1の実施形態及び第2の実施形態において、クエリ画像、登録画像のどちらか一方において画像認識がうまく機能せず、結果として検索漏れを起こすという課題を解決する。
本実施形態は、画像登録処理は第1の実施形態と同様であるが、画像検索処理において以下の点が第1の実施形態と異なる。以下に、第1の実施形態との差分のみについて説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。
本実施形態に係る画像検索処理について、同処理のフローチャートを示す図12を用いて説明する。なお、ステップS1201〜S1204,S1208はそれぞれ、図10のステップS1001〜S1004,S1006と同じ処理ステップであり、ステップS1005の代わりにステップS1205〜S1207を行う点が第1の実施形態と異なる。
ステップS1205では、画像比較処理部206は先ず、ステップS1203における画像認識処理で求めたオブジェクトの属性値と同じ属性値が登録されたレコードを、DB204内の認識結果管理インデックスから特定する。そして画像比較処理部206は、特定したレコードから認識尤度を読み出す。
ステップS1206では、画像比較処理部206は、ステップS1205で特定した各レコードについて次のような処理を行う。即ち、該レコード中の画像IDに対応する画像管理インデックスから「画像特徴量」のフィールド中の画像特徴IDを読み出し、該画像特徴IDに対応する特徴量を画像特徴インデックスから読み出し、クエリ画像中の特徴量とのマッチングを行う。このマッチングには、上記のRANSACを用い、これにより特徴量間の類似度を求める。
ステップS1207では、画像比較処理部206は、ステップS1205で特定した各レコードについて次のような処理を行う。即ち、該レコードについてステップS1205読み出した認識尤度LHと、該レコードについてステップS1206で求めた類似度Simと、をそれぞれに対する重みw1,w2を用いて重み付け加算を行うことで総合類似度を求める。この重み付け加算の式を以下に示す。
総合類似度 Sim total =w1 × LH + w2 × Sim, 但しw1 + w2 =1
そして、類似度の代わりに総合類似度を適用してステップS1005の処理を行うことで、画像認識で失敗した画像についても、局所特徴量比較で高いスコアを出した画像で有れば検索結果に反映する事が可能となる。
また、w1は認識対象毎に変えても良く、例えば、クエリで認識率の低い認識対象が検出された場合には低い値のw1を、認識率が高い認識対象の場合には高い値のw1を用いると良い。画像認識が可能なオブジェクトを持つ画像に対して、認識尤度が緩やかに効く様に画像認識尤度と類似度の重み付け和で総合評価を得る。
このように、本実施形態によれば、局所特徴量を用いた画像検索のオブジェクトを選ばない性質と、画像認識の対象画像オブジェクトを選ぶが誤った検出が比較的少ないという性質を見合わせた、良好な検索結果をもたらす画像検索を実現する。
また、上記処理により、第1の実施形態よりは処理コストが高くなるものの、より検索漏れの少なく且つ画像認識結果を緩やかに反映したロバストな検索が可能となる。
[第4の実施形態]
画像認識の対象は時間が経過すると共に増加するので、登録済みの画像に対しても新しい画像認識結果を適応する事が好ましい。もちろん、新たな画像認識対象で学習した検出器を用い、最初から画像を登録する方法も有るが、登録済みの画像数が膨大で有る場合、それは現実的で無い。また、DBと画像を別個に管理している場合には、登録画像の参照が困難な場合も有る。
そこで、本実施形態では、画像認識対象の増加を反映したDBインデックスの更新を登録済みの画像を再解析する事無く、DB内で閉じた処理で効率的に画像認識対象の増加を反映する方法について説明する。各登録画像について、DBインデックスを更新するために行う処理について、同処理のフローチャートを示す図13を用いて説明する。
ステップS1301で画像特徴・認識結果登録処理部203は、登録済みの登録画像のうちの1つに着目し、該着目した登録画像の画像管理インデックス中の画像特徴IDを用いて対応する画像特徴インデックスから、特徴点の座標位置やその特徴量を読み出す。
ステップS1302では、画像特徴・認識結果登録処理部203は、ステップS1301で読み出した情報を用いて、上記着目した登録画像に対する画像認識処理を行う。このとき画像認識に用いる検出器は、以前よりも新たなオブジェクトの認識が可能なようになっている。
ステップS1303では、画像特徴・認識結果登録処理部203は、上記着目した登録画像からこれまでに認識した何れのオブジェクトとも異なる位置から新たなオブジェクトを認識したか否かを判断する。この判断の結果、新たなオブジェクトを認識していない場合には、本処理を終了するが、新たなオブジェクトを認識した場合には、処理はステップS1304に進む。
ステップS1304では、画像特徴・認識結果登録処理部203は、上記着目した登録画像の画像管理インデックス中の「認識結果」のフィールドに、現在の最大認識IDに1を加えた認識IDを追加登録する。
また、画像特徴・認識結果登録処理部203は、認識結果管理インデックスに1つレコードを追加し、この追加したレコードに以下に列挙する情報を登録する。即ち、ステップS1304で追加登録した認識ID、新たなオブジェクトの属性値、上記着目した登録画像の画像ID、新たなオブジェクトの認識尤度、新たなオブジェクトの認識領域の座標、新たなオブジェクトの認識用特徴量の画像特徴ID、を登録する。このように、本実施形態によれば、DB内で閉じた処理で、安価な処理コストで新たに追加した画像認識対象を反映したDBに更新する事が可能となる。
[第5の実施形態]
上記の各実施形態では、特徴量としてSIFTを用いたが、画像認識と画像特徴量検索とで共有可能な局所特徴量であれば、その種類は問わない。また、画像認識においては、MAP推定を用いた機械学習により説明したが、当然、生成モデルに基づく方法としてEMアルゴリズムを利用し反復学習する方法や、判別モデルに基づく方法でSVMを用いても良い。また、登録画像の局所特徴量に対して複数の画像認識処理を行い更新する処理も可能である。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (9)

  1. それぞれの画像について、該画像に対する画像認識処理によって得られた該画像中の1以上のオブジェクトのそれぞれの属性及び認識尤度を、該画像と関連付けて管理しているデータベースにアクセス可能な画像処理装置であって、
    クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している画像を特定する特定手段と、
    前記特定手段が特定した画像と関連づけて前記データベースが管理している認識尤度を、前記クエリ画像に対する該特定した画像の類似度とし、該特定した画像に関する情報と、該類似度と、を画像検索結果として出力する出力手段と
    を備えることを特徴とする画像処理装置。
  2. 前記出力手段は、前記特定した画像に関する情報と、前記類似度と、のセットを、類似度が高い順で出力することを特徴とする請求項1に記載の画像処理装置。
  3. 前記出力手段は、
    前記クエリ画像に対する画像認識処理の結果、画像認識できたオブジェクトが1つも存在しなかった場合には、前記データベースが管理する画像のうち、前記クエリ画像に対する画像認識処理により得られた前記クエリ画像の特徴量と類似する特徴量を有する画像に関する情報を出力することを特徴とする請求項1又は2に記載の画像処理装置。
  4. それぞれの画像について、該画像に対する画像認識処理によって得られた該画像中の1以上のオブジェクトのそれぞれの属性及び領域を、該画像と関連付けて管理しているデータベースにアクセス可能な画像処理装置であって、
    クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している領域を特定する特定手段と、
    前記特定手段が特定した領域について画像認識処理で得られた特徴量と、前記クエリ画像において該領域に対応する領域について画像認識処理で得られた特徴量と、の類似度を求める手段と、
    前記特定手段が特定した領域と関連付けて前記データベースが管理している画像に関する情報と、前記類似度と、を画像検索結果として出力する出力手段と
    を備えることを特徴とする画像処理装置。
  5. それぞれの画像について、該画像に対する画像認識処理によって得られた該画像中の1以上のオブジェクトのそれぞれの属性及び認識尤度を、該画像と関連付けて管理しているデータベースにアクセス可能な画像処理装置であって、
    クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している画像を特定する特定手段と、
    前記クエリ画像に対する画像認識処理で得られる特徴量と、前記特定手段が特定した画像に対する画像認識処理で得られる特徴量と、の類似度を求める手段と、
    前記特定手段が特定した画像と関連づけて前記データベースが管理している認識尤度と、前記類似度と、の重み付け加算により得られる総合類似度を、前記クエリ画像に対する該特定した画像の類似度とし、該特定した画像に関する情報と、該類似度と、を画像検索結果として出力する出力手段と
    を備えることを特徴とする画像処理装置。
  6. それぞれの画像について、該画像に対する画像認識処理によって得られた該画像中の1以上のオブジェクトのそれぞれの属性及び認識尤度を、該画像と関連付けて管理しているデータベースにアクセス可能な画像処理装置が行う画像処理方法であって、
    前記画像処理装置の特定手段が、クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している画像を特定する特定工程と、
    前記画像処理装置の出力手段が、前記特定工程で特定した画像と関連づけて前記データベースが管理している認識尤度を、前記クエリ画像に対する該特定した画像の類似度とし、該特定した画像に関する情報と、該類似度と、を画像検索結果として出力する出力工程と
    を備えることを特徴とする画像処理方法。
  7. それぞれの画像について、該画像に対する画像認識処理によって得られた該画像中の1以上のオブジェクトのそれぞれの属性及び領域を、該画像と関連付けて管理しているデータベースにアクセス可能な画像処理装置が行う画像処理方法であって、
    前記画像処理装置の特定手段が、クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している領域を特定する特定工程と、
    前記画像処理装置の類似度を求める手段が、前記特定工程で特定した領域について画像認識処理で得られた特徴量と、前記クエリ画像において該領域に対応する領域について画像認識処理で得られた特徴量と、の類似度を求める工程と、
    前記画像処理装置の出力手段が、前記特定工程で特定した領域と関連付けて前記データベースが管理している画像に関する情報と、前記類似度と、を画像検索結果として出力する出力工程と
    を備えることを特徴とする画像処理方法。
  8. それぞれの画像について、該画像に対する画像認識処理によって得られた該画像中の1以上のオブジェクトのそれぞれの属性及び認識尤度を、該画像と関連付けて管理しているデータベースにアクセス可能な画像処理装置が行う画像処理方法であって、
    前記画像処理装置の特定手段が、クエリ画像に対して画像認識処理を行うことで該クエリ画像中のオブジェクトの属性を取得し、該取得した属性と関連付けて前記データベースが管理している画像を特定する特定工程と、
    前記画像処理装置の類似度を求める手段が、前記クエリ画像に対する画像認識処理で得られる特徴量と、前記特定工程で特定した画像に対する画像認識処理で得られる特徴量と、の類似度を求める工程と、
    前記画像処理装置の出力手段が、前記特定工程で特定した画像と関連づけて前記データベースが管理している認識尤度と、前記類似度と、の重み付け加算により得られる総合類似度を、前記クエリ画像に対する該特定した画像の類似度とし、該特定した画像に関する情報と、該類似度と、を画像検索結果として出力する出力工程と
    を備えることを特徴とする画像処理方法。
  9. コンピュータを、請求項1乃至5の何れか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。
JP2012184572A 2012-08-23 2012-08-23 画像処理装置、画像処理方法 Active JP5963609B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012184572A JP5963609B2 (ja) 2012-08-23 2012-08-23 画像処理装置、画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012184572A JP5963609B2 (ja) 2012-08-23 2012-08-23 画像処理装置、画像処理方法

Publications (3)

Publication Number Publication Date
JP2014041560A true JP2014041560A (ja) 2014-03-06
JP2014041560A5 JP2014041560A5 (ja) 2015-08-20
JP5963609B2 JP5963609B2 (ja) 2016-08-03

Family

ID=50393750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012184572A Active JP5963609B2 (ja) 2012-08-23 2012-08-23 画像処理装置、画像処理方法

Country Status (1)

Country Link
JP (1) JP5963609B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016018444A (ja) * 2014-07-09 2016-02-01 日本電信電話株式会社 画像検索装置、方法、及びプログラム
JP6012819B1 (ja) * 2015-07-03 2016-10-25 日本電信電話株式会社 類似画像取得装置、方法、及びプログラム
JP2018532198A (ja) * 2015-10-12 2018-11-01 コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブ 視覚データのストリーム中のコピーを検出するための方法およびデバイス
KR20190012791A (ko) * 2017-07-28 2019-02-11 한국지질자원연구원 이미지를 이용한 암석 및 지질구조 분류장치, 방법 및 시스템
JP2019537120A (ja) * 2016-10-16 2019-12-19 イーベイ インク.Ebay Inc. 画像解析および予測に基づく視覚検索
JPWO2018173948A1 (ja) * 2017-03-24 2020-01-16 株式会社日立国際電気 サービス提供システム
JP2020102245A (ja) * 2020-03-05 2020-07-02 日本電気株式会社 異常作業検出システムおよび異常作業検出方法
KR20200094624A (ko) * 2019-01-30 2020-08-07 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 이미지 기반의 데이터 처리 방법, 장치, 전자 기기 및 저장 매체
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
US11836777B2 (en) 2016-10-16 2023-12-05 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1139317A (ja) * 1997-07-15 1999-02-12 Omron Corp 画像検索装置および記録媒体
JPH11306322A (ja) * 1998-04-23 1999-11-05 Fujitsu Ltd 画像フィルタリングシステム
JP2003187229A (ja) * 2001-12-14 2003-07-04 Nec Corp 顔メタデータ生成方法および装置、並びに顔類似度算出方法および装置
WO2008016102A1 (fr) * 2006-08-03 2008-02-07 Nec Corporation dispositif de calcul de similarité et dispositif de recherche d'informations
JP2010026603A (ja) * 2008-07-15 2010-02-04 Canon Inc 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2010518507A (ja) * 2007-02-13 2010-05-27 オリンパス株式会社 特徴マッチング方法
JP2011002966A (ja) * 2009-06-17 2011-01-06 Canon Inc 画像検索装置及びその制御方法並びにプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1139317A (ja) * 1997-07-15 1999-02-12 Omron Corp 画像検索装置および記録媒体
JPH11306322A (ja) * 1998-04-23 1999-11-05 Fujitsu Ltd 画像フィルタリングシステム
JP2003187229A (ja) * 2001-12-14 2003-07-04 Nec Corp 顔メタデータ生成方法および装置、並びに顔類似度算出方法および装置
WO2008016102A1 (fr) * 2006-08-03 2008-02-07 Nec Corporation dispositif de calcul de similarité et dispositif de recherche d'informations
JP2010518507A (ja) * 2007-02-13 2010-05-27 オリンパス株式会社 特徴マッチング方法
JP2010026603A (ja) * 2008-07-15 2010-02-04 Canon Inc 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2011002966A (ja) * 2009-06-17 2011-01-06 Canon Inc 画像検索装置及びその制御方法並びにプログラム

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016018444A (ja) * 2014-07-09 2016-02-01 日本電信電話株式会社 画像検索装置、方法、及びプログラム
JP6012819B1 (ja) * 2015-07-03 2016-10-25 日本電信電話株式会社 類似画像取得装置、方法、及びプログラム
JP2017016501A (ja) * 2015-07-03 2017-01-19 日本電信電話株式会社 類似画像取得装置、方法、及びプログラム
JP2018532198A (ja) * 2015-10-12 2018-11-01 コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブ 視覚データのストリーム中のコピーを検出するための方法およびデバイス
US11604951B2 (en) 2016-10-16 2023-03-14 Ebay Inc. Image analysis and prediction based visual search
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
JP2019537120A (ja) * 2016-10-16 2019-12-19 イーベイ インク.Ebay Inc. 画像解析および予測に基づく視覚検索
US11914636B2 (en) 2016-10-16 2024-02-27 Ebay Inc. Image analysis and prediction based visual search
US11836777B2 (en) 2016-10-16 2023-12-05 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
US10860898B2 (en) 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US11804035B2 (en) 2016-10-16 2023-10-31 Ebay Inc. Intelligent online personal assistant with offline visual search database
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
JPWO2018173948A1 (ja) * 2017-03-24 2020-01-16 株式会社日立国際電気 サービス提供システム
JP7026105B2 (ja) 2017-03-24 2022-02-25 株式会社日立国際電気 サービス提供システム
KR101981669B1 (ko) * 2017-07-28 2019-05-24 한국지질자원연구원 이미지를 이용한 암석 및 지질구조 분류장치, 방법 및 시스템
KR20190012791A (ko) * 2017-07-28 2019-02-11 한국지질자원연구원 이미지를 이용한 암석 및 지질구조 분류장치, 방법 및 시스템
US11314800B2 (en) 2019-01-30 2022-04-26 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, apparatus, electronic device, and storage medium for image-based data processing
KR102279126B1 (ko) * 2019-01-30 2021-07-19 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 이미지 기반의 데이터 처리 방법, 장치, 전자 기기 및 저장 매체
KR20200094624A (ko) * 2019-01-30 2020-08-07 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 이미지 기반의 데이터 처리 방법, 장치, 전자 기기 및 저장 매체
JP2020102245A (ja) * 2020-03-05 2020-07-02 日本電気株式会社 異常作業検出システムおよび異常作業検出方法

Also Published As

Publication number Publication date
JP5963609B2 (ja) 2016-08-03

Similar Documents

Publication Publication Date Title
JP5963609B2 (ja) 画像処理装置、画像処理方法
US10977515B2 (en) Image retrieving apparatus, image retrieving method, and setting screen used therefor
US11501514B2 (en) Universal object recognition
US10140575B2 (en) Sports formation retrieval
JP6046948B2 (ja) 物体検知装置及びその制御方法、プログラム、並びに記憶媒体
US11341770B2 (en) Facial image identification system, identifier generation device, identification device, image identification system, and identification system
US10007678B2 (en) Image processing apparatus, image processing method, and recording medium
WO2016139964A1 (ja) 注目領域抽出装置および注目領域抽出方法
JP2015111339A (ja) 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム
TW201546636A (zh) 註解顯示器輔助裝置及輔助方法
JPWO2020050413A1 (ja) 認証用顔画像候補判定装置、認証用顔画像候補判定方法、プログラム、および記録媒体
JP6173754B2 (ja) 画像検索システム、画像検索装置および画像検索方法
JP5746550B2 (ja) 画像処理装置、画像処理方法
CN112991555B (zh) 数据展示方法、装置、设备以及存储介质
JP2011118790A (ja) 類似画像検索装置,類似画像検索方法および類似画像検索プログラム
Carvalho et al. Analysis of object description methods in a video object tracking environment
CN105190689A (zh) 包括基于毗连特征的对象检测和/或双边对称对象分段的图像处理
Lei et al. A new clothing image retrieval algorithm based on sketch component segmentation in mobile visual sensors
JP2018081452A (ja) 画像処理装置、画像処理方法
CN115082999A (zh) 合影图像人物分析方法、装置、计算机设备和存储介质
JP6341843B2 (ja) 画像検索装置、及び画像検索システム
Zhang et al. Effective image registration model using optimized KAZE algorithm
Grouver et al. A spatial density and phase angle based correlation for multi-type family photo identification
JP2020149337A (ja) 画像検索装置、画像検索方法およびコンピュータプログラム
WO2022079841A1 (ja) グループ特定装置、グループ特定方法、及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150703

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160628

R151 Written notification of patent or utility model registration

Ref document number: 5963609

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151