JP5094682B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents

画像処理装置、画像処理方法およびプログラム Download PDF

Info

Publication number
JP5094682B2
JP5094682B2 JP2008273188A JP2008273188A JP5094682B2 JP 5094682 B2 JP5094682 B2 JP 5094682B2 JP 2008273188 A JP2008273188 A JP 2008273188A JP 2008273188 A JP2008273188 A JP 2008273188A JP 5094682 B2 JP5094682 B2 JP 5094682B2
Authority
JP
Japan
Prior art keywords
image
feature points
feature
group
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008273188A
Other languages
English (en)
Other versions
JP2010102502A (ja
Inventor
英智 相馬
弘隆 椎山
昌弘 松下
浩一 馬養
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008273188A priority Critical patent/JP5094682B2/ja
Priority to US12/603,427 priority patent/US8385656B2/en
Publication of JP2010102502A publication Critical patent/JP2010102502A/ja
Application granted granted Critical
Publication of JP5094682B2 publication Critical patent/JP5094682B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像から局所的な特徴を抽出し画像同士を比較して類似度を計算する画像処理装置、画像処理方法およびプログラムに関するものである。
近年、類似画像を比較・検索するための技術が多く提案されている。例えば、画像を複数のブロックに分け、それぞれの画像特徴量(代表色)を用いてパターンマッチングを行うことで色の位置情報を利用して類似画像を比較・検索する方法がある(特許文献1)。しかし、特許文献1に開示された方法の場合、検索時に画像全体の画素値から特徴量を計算するため、例えば画像内の特定のオブジェクトが切り取られたり、その位置が変わったりした場合には比較・検索が困難になってしまうという問題があった。
そこで、画像全体の特徴量を使うのではなく、画像の局所的な特徴量(以下、局所特徴量と称す)を使って類似画像の比較や検索を行う方法が提案されている。これらの方法では、まず画像からエッジやコーナなどの特徴点を抽出する。次に、特徴点とその近傍の画像情報とから、その特徴点に関する局所特徴量を計算する。局所特徴量として扱う値には、輝度の変化情報や、形状パターンなど、様々なものがある。画像の検索は、局所特徴量同士の類似度計算(マッチング)を行うことで、比較を行うことで実現する。
局所特徴量を用いた画像の比較を行う場合には、まず、比較する2つの画像のそれぞれから画素値の変動が大きい点を特徴点として抽出し、その特徴点に関する局所特徴量を抽出する。そして、局所特徴量同士を比較することで、2つの画像間で対応する特徴点の組み合わせを決定し、特徴点の対応度合いを基に類似度の判定を行う。
ここで、画像が縮小された場合に、再び同じ箇所から抽出される特徴点の有無や位置、また、その特徴点に関する局所特徴量の値が変動することがある。そこで、縮小画像に対しても、認識・検索精度を保つために比較する画像の両方を所定の縮小率で段階的に縮小変換し、段階的な解像度を有する多重画像を作成し、この多重画像から特徴点および局所特徴量を抽出する。そして、このようにして得られた特徴点・局所特徴量をまとめて利用することで、拡大・縮小の耐性をもった比較や類似度の計算などを実現している。
特開平8−249349号公報 特開平9−44665号公報 C.Schmid and R.Mohr,"Localgray value invariants for image retrieval,"IEEE Trans.PAMI,Vol.19,No.5,pp530−535,1997.
局所特徴量を用いた画像の比較や検索を行う場合では、2つの画像の中で局所特徴量の類似する特徴点を探し、比較元の画像と比較先の画像との間で対応する点の組み合わせを順次決めていく。この際、対応する点は1:1の関係である。
対応する点の組み合わせ決定方法として、まず、比較元の画像の特徴点(以下、クエリ特徴点)に着目し、クエリ特徴点の局所特徴量に一番類似すると比較先の画像の特徴点(以降、候補点)の局所特徴量を選択する。そして、クエリ特徴点と候補点との局所特徴量の類似度があらかじめ定めたしきい値以上の場合に対応する点として決定する。この条件を満たさない場合には、着目点に対応する点が比較先には存在しないとして扱う。
しかし、局所特徴量だけに着目していると、複数の縮小画像にわたって組み合わせを決定するために、誤った対応(以下、誤対応と称す)を取ることが多い(後述、図7参照)。本来対応付けるべき特徴点が選ばれないと、他の対応する点の組み合わせにも影響し、算出される類似度の精度も低下する。
上記課題を解決するために本発明に係る画像処理装置は、原画像と原画像を縮小した縮小画像とを有する画像群から複数の特徴点と各特徴点の局所特徴量とを抽出する抽出手段と、前記各特徴点の局所特徴量の類似度に基づいて、第1の画像群の各特徴点と類似する局所特徴量を有する第2の画像群の特徴点を対応する特徴点とし、前記第1の画像群が有する第1の画像と前記第2の画像群が有する第2の画像とを比較して、当該対応する特徴点が頻出する前記第1の画像の縮小率と前記第2の画像の縮小率との比又は差を、前記第1の画像のオブジェクトと前記第2の画像のオブジェクトの大きさが近くなる場合の関係として判定する判定手段と、前記判定手段の判定した関係に近い第1の画像と第2の画像について、第1の画像の特徴点と類似する局所特徴量を有する第2の画像の特徴点を対応付け、当該対応付けた特徴点に基づいて前記第1の画像群と前記第2の画像群との類似度を算出する算出手段とを有することを特徴とする。
本発明によって、多重画像を用いて特徴点に関する局所特徴量を対応付ける際に誤対応を抑制することができる為、誤対応による類似度の精度の低下を抑制し、誤対応による付加を削減できる。
<第1の実施形態>
図1は本発明の一実施形態である画像処理装置の概略構成を示す図である。CPU101は画像処理装置における各種制御を実行する。その制御内容は、後述するROM102やRAM103のプログラムに記述されている。また、CPU自身の機能や、計算機プログラムの機構により、複数の計算機プログラムを並列に動作させることもできる。
ROM102は、CPU101が本発明を実現するための制御をするためのプログラムやデータが格納されている。
RAM103は、CPU101が処理するための制御プログラムを格納するとともに、CPU101が各種制御を実行する際の様々なデータの作業領域を提供する。
入力装置104は、種々の文字記号入力キー、及び、カーソル移動を指示するカーソル移動キー等のような各種の機能キーを備えた入力装置であり、ユーザによる各種入力操作環境を提供する。なお、マウスのようなポインティングデバイスを有してもよい。
バス105は各構成に接続されているアドレスバス、データバスなどである。
外部記憶装置106は、さまざまなデータ等を記憶するための外部記憶装置である。例えば、ハードディスクやフロッピーディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ、不揮発性のメモリカード等の記録媒体と、記憶媒体を駆動し、情報を記録するドライブなどを有する。保管されたプログラムやデータは入力装置等の指示や、各種計算機プログラムの指示により、必要な時にRAMに展開される。
表示器107は、液晶ディスプレイなどの表示手段を有し、各種入力操作の状態をユーザに対して表示する。
NCU108は、他のコンピュータ装置等と通信を行うための通信デバイスNCUであり、ネットワーク(LAN)等を介して、図にはないが遠隔地に存在する装置と通信し、本実施形態のプログラムやデータを共有することが可能になる。NCU108としては、USB、IEEE1394、P1284、SCSI、Ethernet(登録商標)等の有線通信や、Bluetooth、赤外線通信、IEEE802.11b等の無線通信等、通信可能に接続するものであればよい。
スキャナ109は、画像を読み取るためのイメージスキャナであり、セットされた紙原稿を1枚ずつ光学的に読み取り、イメージ信号をデジタル信号列に変換する。読み取られた画像データは、外部記憶装置やRAM等に格納することができる。
ROM102やRAM103などの記憶媒体には、本実施形態の処理をコンピュータに実現させる計算機プログラムやデータなどが格納されており、これらを、CPUが読み出し実行することによって本発明の機能を実現する。また、本発明に係わるプログラムやデータを格納した外部記録装置を本システムあるいは本装置に供給して、RAM103などの書き換え可能な記憶媒体上に前記の外部記憶装置から、そのプログラムがRAM上にコピーしてもよい。例えば、外部記憶装置としては、フロッピーディスク、CD−ROM、ハードディスク、メモリカード、光磁気ディスクなどが挙げられる。
また、画像データは、NCU108の通信デバイスによって接続されているネットワークスキャナ、コピー装置、デジタルスチルカメラフィルムスキャナ等の入力機器を介して入力されてもよい。また、デジタル画像データを保持する外部記憶装置から通信デバイスを介して入力されてもよい。また、スキャナ109で読み取った画像データは、外部記憶装置やRAM等ではなく、通信デバイスによって接続されたサーバやコピー機等の外部記憶装置等に格納してもよい。
図2は、本実施形態における画像処理装置(以降、画像比較装置200)の概略機能を示すブロック図ある。図2に示すように、画像比較装置200は、変換部(処理部)202、抽出部203、判定部204、算出部205を有する。
画像比較装置200において、変換部202が原画像(以降、入力画像と称す)201を読み込み、所定の縮小率で段階的に縮小処理することで、画像群(以降、多重画像と称す)を作成する。そして抽出部203で、変換部202の作成した多重画像から特徴点と各特徴点の局所特徴量とを抽出する。ここで、第1の原画像と第2の原画像を比較するために、変換部202で夫々の原画像から取得した、第1の画像群が有する複数の第1の画像の夫々と第2の画像群が有する複数の第2の画像の夫々とを比較する必要がある。その際に、判定部204は、夫々の画像が有するオブジェクトの大きさが近くなるような第1の画像と第2の画像との関係を判定する。そして算出部205は、判定部204の判定した関係と各特徴点の局所特徴量とに基づいて第1の画像群の特徴点と第2の画像群の特徴点とを対応付けて、この対応付けた特徴点から第1の原画像と第2の原画像との類似度を算出する。第1の画像群と第2の画像群との類似度としてもよい。算出部205が出力する比較結果206としては第1の原画像と第2の原画像との類似度や合致度などがある。
[画像の特徴点・局所特徴量の抽出処理]
図3は、画像の特徴点・局所特徴量抽出処理の手順を表すフローチャートである。ステップ301で処理を開始する。
ステップS302では、変換部202が原画像(画像データ)を読み込む。次に、ステップS303では、変換部202が画像データから輝度成分を抽出する処理を行い、抽出した輝度成分に基づき輝度成分画像を生成する。
次に、ステップS304では、ステップS303で作成した輝度成分画像を変換部202が縮小率pに従ってn回縮小し、n+1種の解像度の画像を有する多重画像を取得する。ただし、縮小率p及び縮小回数の枚数nは予め決められているものとするが、nは1以上の整数である必要がある。ただ好ましくは縮小変換を複数回施すことがよい。例えば、縮小して2×2画素になる回数を予め演算して決めておいてもよい。
図4は、変換部202が作成する多重画像を示す図である。図4は、縮小率pが2の−(1/4)乗、縮小画像の枚数nが8の場合である。図4において、画像401は変換部102が入力画像101から抽出した輝度成分画像である。画像402は輝度成分画像から縮小率pに従って4回縮小された縮小画像である。画像403は当該輝度成分画像から縮小率pに従って8回縮小された縮小画像である。SCも縮小回数を示しており、画像401はSC=0、画像403はSC=8となる。
図4に示す例では、画像402は変換部102からの輝度成分画像401が1/2に縮小された画像となり、画像403は輝度成分画像が1/4に縮小された画像となる。
なお、線形補間による画像の縮小変換を行っているが、画像を縮小変換する方法としては他にも、単純に画素を間引く方法や低域フィルタ適用後にサンプリングする方法などを用いてもよい。
次に、ステップS305では、抽出部203が特徴点を抽出する。具体的には、抽出部203が図4で示す各画像に、エッジやコーナなど画素値の変化の度合いが大きいほど大きい値を返すHarris作用素を作用させる。そして、Harris作用素を作用させて得られた出力画像の夫々について、着目する画素と着目する画素を囲む8画素(合計9画素)の画素値を比較する。そして、着目する画素の画素値が9画素の中で最大になり且つしきい値以上である画素を特徴点として抽出する。こうして、得られる特徴点は画素値の変化の度合いが周囲に比べて大きく、画像の特徴をよく表す点として扱うことができる。
次に、ステップS306では、ステップS305の特徴点の抽出で得られた特徴点の各々について、特徴点に関する局所特徴量を算出する。そして、S307で処理を終了する。
[局所特徴量]
局所特徴量としては、特徴点近傍の模様を数値化するLocal Jet及びそれらの導関数の組み合わせを用いる。
具体的には、たとえば以下の式1により局所特徴量を算出する。
Figure 0005094682
V(x,y)は画像の中で座標(x,y)にある特徴点に関する局所特徴量である。なお、ここで言う座標とはデジタル画像においては画素位置を示すこととする。デジタル画像における画素位置は離散的であるので(整数で表されるので)、計算結果としての実数座標から画素位置を特定しなければならない場合には、座標の整数化が必要となる。本実施形態では、座標が実数値で表されるときには、実数値を丸めて整数値にすることで画素位置を特定する。実数値を丸める方法には四捨五入、小数点以下切り上げ、小数点以下切捨てなどの方法があるが、本実施形態ではどの方法を選択しても良い。ただし、処理の途中で方法を変更しないこととする。
式(1)の右辺で用いている記号は、以下に示す式(2)〜(7)で定義される。ここで、式(2)右辺のG(x,y)はガウス関数、I(x,y)は画像の座標(x,y)における画素値であり、“*”は畳み込み演算を表す記号である。また、式(3)は式(2)で定義された変数Lのxに関する偏導関数、式(4)は当該変数Lのyに関する偏導関数である。式(5)は式(3)で定義された変数Lxのyに関する偏導関数、式(6)は式(3)で定義された変数Lxのxに関する偏導関数、式(7)は式(4)で定義されたLyのyに関する偏導関数である。
Figure 0005094682
ここで、G(x,y)はガウス関数であるので、通常は標準偏差σを変数として持つが、式(2)では省略している。本実施形態ではσ=arとして予め定められる。ここでaは定数であり、rは着目している特徴点を中心とする円形領域の半径を示し、着目している特徴点に関する局所特徴量を算出する際に参照する領域でもある。
尚、特徴点を含む画素と特徴点近傍の画素の特徴を示す局所特徴量を算出可能な方法であれば、上述の方法以外でもよい。上述の局所特徴量は5つの要素から成るが、要素の数は5つでなくてもよい。例えば、SIFT(要素数128)やPCA−SIFT(要素数20〜30程度)においても本発明は適用可能である。
図3で示される画像の特徴点・局所特徴量の抽出処理により、得られた特徴点・局所特徴量の例を示したものが図5である。図5中、画像510は入力された画像データであり、画像520は、画像501から抽出した特徴点を示したもので、点521及び点522が特徴点である。この点521及び522の特徴点は、それぞれに関して式(1)によって求めた局所特徴量に関連付けられている。Harris作用素を用いた場合には、輝度画像上で形状に特徴のある部分が特徴点として抽出されることになる。
また、本実施形態ではHarris作用素を用いて説明しているが、画像中の画素値の変動が大きい箇所を検出する処理であれば他の処理であっても適用できるので、本発明はHarris作用素に限定されない。
[誤対応]
局所特徴量を用いて画像同士の類似度を算出する際には、異なる画像において対応する特徴点の組み合わせを決定し対応点リストとする。但し、局所特徴量同士の類似度を算出し、類似度が最大となる特徴点の組み合わせをリストに登録する方式では誤対応が生じることが多い。
図7を用いて誤対応について説明する。図7では画像1(第1の原画像)と画像2(第2の原画像)を比較している。画像1(画像711)から抽出した輝度成分画像が画像712であり、画像712を所定の縮小率で縮小したものが画像713〜715である。同様に、画像2(画像721)から抽出した輝度成分画像が画像722であり、画像712を縮小した縮小率で画像722を縮小した処理画像が画像723〜725である。
次に、第1の画像群の有する画像712〜715(第1の画像)と第2の画像群の有する画像722〜725(第2の画像)とから特徴点を抽出する。そして各特徴点について局所特徴量を算出し、第1の画像群と第2の画像群の間で各特徴点の局所特徴量を比較し、対応点リストを作成したものとする。その結果、得られた組み合わせとして、組み合わせ731〜734が得られたとする。
組み合わせ731、732は、どちらも縮小画像713の特徴点と縮小画像723特徴点の組み合わせである。画像713のオブジェクトである車と画像723のオブジェクトである車とが画素単位で近い大きさになっているため、組み合わせ731、732の様に類似する局所特徴量を有する特徴点の組み合わせが集中する。これは、同一の画像を縮小した場合であっても、画像内の同箇所から算出される局所特徴量は縮小率ごとに異なるためである。
また、画像713と画像723に組み合わせが集中する場合、画像712と画像722、画像714と画像724や画像715と画像725においても組み合わせが集中している可能性が高い。
一方で、局所特徴量の類似度が高いものから順に組み合わせを決定すると組み合わせ733や734のような誤った対応も取得されることがある。組み合わせ733は画像1に写っている車の頂上と画像2に写っている木の頂上とが対応するとしている。尤もらしい対応の組み合わせ735が選ばれなかったのは、算出された局所特徴量同士について、局所特徴量空間での距離が最短ではないことに起因する。
この例のように特定の関係にある縮小画像同士(画像713と画像723)の間で多数の組み合わせが得られた場合には、特定の関係から外れる縮小画像(画像713と画像722)との組み合わせは適切でないもの(誤判定)が混入している可能性が高い。画像713と画像723で多数の組み合わせが得られた場合、画像712と画像722、画像714と画像724、画像715と画像725、の同じ関係にある画像からも尤もらしい対応点が得られる可能性が高い。縮小画像同士の関係は、縮小率の比又は縮小回数の差を用いて表す事ができる。但し、縮小回数の差は縮小率が一定である必要がある。
以下、夫々が近い大きさのオブジェクトを有するような第1の画像の縮小率と第2の画像の縮小率との関係を判定し、判定した縮小率と各特徴点の局所特徴量とに基づいて対応点リストを作成する処理を説明する。
但し、以下の処理では図7、図4の例のように所定の縮小率で縮小しているので、第1の画像と第2の画像との関係を縮小回数の差で表現する。
[対応点リスト]
図8は、本実施形態における対応点リストの算出手順を示すフローチャートである。ステップS801は開始点である。
ここで、第1の画像群が有する第1の画像の特徴点をQ、座標をQ(x’,y’)とし、その特徴点の局所特徴量をVqとする。また、第2の画像群が有する第2の画像の特徴点をS、座標をS(x,y)とし、その特徴点の局所特徴量をVsとする。
まず、ステップS802で、VqとVsとの特徴量間距離を全ての組み合わせについて計算し、VqとVsとが1対1で最も類似する特徴点の対応を決定する。
次に、ステップS803で、前記第1の画像のオブジェクトと前記第2の画像のオブジェクトとの大きさが近くなる第1の画像と第2の画像との関係を判定する。具体的には、ステップS802で決定した各Vqと各Vsの対応において、Vqを抽出した画像の縮小回数とVsを抽出した画像の縮小回数との差の中で最頻出のものを判定する。この縮小回数の差を尤もらしい縮小回数SCの差(以下、指標値ΔSと称す)として求める。この指標値ΔSは最頻出のもの以外に、平均値、中間値、最頻値および分散値などの統計的に求めた値を用いてもよい。
ステップS804では、この指標値ΔSを考慮してVqとVsの1対1の対応を決定し対応点リストとする。この時に、図7のような誤対応733を735のように尤もらしく対応付けるために、指標値ΔSとVqとVsを抽出した画像の縮小回数の差との差を、VqとVsとの特徴量空間における距離よりも重み高くする。または、指標値ΔSを満たす第1の画像と第2の画像の各特徴点について、各Vqと最も類似するVsを選択するようにして対応点リストとしてもよい。
そして、ステップS805で処理が完了する。
[類似度算出方法]
次に、本実施形態での類似度算出方法を説明する。幾何変換行列を用いた算出方法においては、まず、図8で説明した処理によってクエリ画像中の特徴点(クエリ特徴点)とこの特徴点に対応するサンプル画像中の特徴点(サンプル特徴点)との対応点リストを作成する。次に、対応点リストから対応点をランダムに数組選び当該対応点のサンプル画像中の特徴点の座標をクエリ画像中の特徴点の座標にうまく変換できる変換行列を見つける。
対応点のサンプル画像中の特徴点の座標をクエリ画像中の特徴点の座標に変換する変換行列を算出する。上記と同様、幾何変換行列を算出するたびにすべての対応点についてクエリ画像中の特徴点の座標が対応するクエリ画像中の特徴点の座標に変換されるか投票する。そして、すべての幾何変換行列の投票数を調べ、最も変換成績が良かった幾何変換行列の投票数を類似度として採用する。すなわち、局所特徴量が類似している対応点リストから選んだ、クエリ画像中の特徴点の位置とサンプル画像中の特徴点の位置とが幾何変換行列で表される所定の位置関係にあり、他の組み合わせについても尤もらしく変換できる場合は類似しているとして扱う。
図6は、本実施形態における算出部205が処理する類似度の算出手順を示すフローチャートである。ステップS601は開始点である。まず、ステップS602で、前述の図8の処理によって指標値ΔSに従った対応点リストを作成する。
ここで、対応点リストに登録されたk番目の対応点について、当該対応点の局所特徴量をそれぞれVq(k)とVs(k)と記載する。更にVq(k)とVs(k)に対応付けられている特徴点をそれぞれQk、Sk、座標をQk(x’k,y’k)、Sk(xk,yk)などと添え字を合わせて記載する。またステップS602で作成された対応点リストに登録された対応点の組数をm組とする。
ステップS603では、最終投票数を表す変数VoteMaxを0に初期化する。ステップS604で、類似度算出処理の反復カウント数を表す変数Countを0に初期化する。
ステップS605は終了判定であって、反復カウント数Countが予め定められた最大反復処理回数Rnを超えていないことを判定する。ここで、超えている場合はステップへ進み、最終投票数VoteMaxを出力して、さらに、ステップS620へ進み、この処理を終了する。また、ステップS605で、反復カウント数Countが最大反復処理回数Rnを超えていない場合はステップS606へ進み、投票数を表す変数Voteを0に初期化する。
ステップS607では、対応点リストからランダムに対応点の組み合わせを2組抽出する。これらの組み合わせに属する特徴点の座標をQ1(x’1,y’1)、S1(x1,y1)及びQ2(x’2,y’2)、S2(x2,y2)と記載する。
次に、ステップS608で、ステップS607において抽出したQ1(x’1,y’1)、S1(x1,y1)及びQ2(x’2,y’2)、S2(x2,y2)が式(8)に示す変換を満たしていると仮定し、式(8)中の変数a〜fを求める。ただし、ステップS608では、変数a〜dで構成される行列をMで示し、変数e〜fで構成される行列をTで示している。
Figure 0005094682
ここで、第1の実施形態では、簡略化のため、相似変換だけを考える。このとき、上記式(8)は以下の式(9)のように書き換えられる。
Figure 0005094682
このとき、変数a、b、e、fはx’1、y’1、x1、y1、x’2、y’2、x2、y2を使って式(10)から式(13)で表される。
Figure 0005094682
Figure 0005094682
Figure 0005094682
Figure 0005094682
次に、ステップS609で、ステップS607で当該対応点リストからランダムに抽出された2組の点以外の点を選択するために、対応点選択変数kを3に初期化する。
そして、ステップS610で、対応点選択変数kが対応点リストに登録されている対応点の組数mを超えていないかを判定する。ここで、超えている場合はステップS616へ処理を移すが、これについては後述する。ステップS610における判定で対応点選択変数kが対応点リストに登録されている対応点の組数mを超えていない場合はステップS611へ処理を移す。
このステップS611では、上述のステップS607で対応点リストから抽出した2組の点S1(x1,y1)及びS2(x2,y2)以外の点を対応点リストから抽出する。第1の実施形態では、抽出された点をSk(xk,yk)と記載する。
次に、ステップS612で、Sk(xk,yk)が式(9)を使って移される座標Sk’(x’k,y’k)を求める。
その後、ステップS613では、座標Sk’(x’k,y’k)と座標Qk(x’k,y’k)との幾何学的距離をユークリッド距離に従って計算し、当該ユークリッド距離がしきい値Td以下であるか否かを判定する。ユークリッド距離がしきい値Td以下の場合はステップS614へ進み、投票数Voteをインクリメントし、ステップS615へ処理を移す。また、ユークリッド距離がしきい値Tdより大きい場合は、何もせずにステップS615へ処理を移す。
ステップS615では、対応点選択変数kをインクリメントし、ステップS610に戻り、対応点選択変数kが対応点リストに登録されている対応点の組数mを超えるまで、上述の処理を繰り返す。
次に、ステップS610で、対応点選択変数kが当該対応点リストに登録されている対応点の組数mを超えた場合の処理であるステップS616を説明する。ステップS616では、投票数Voteの値と最終投票数VoteMaxの値とを比較し、投票数Voteの値が最終投票数VoteMaxの値よりも大きい場合にはステップS617へ処理を移す。
このステップS617では、最終投票数VoteMaxの値を投票数Voteの値で置き換えた後、ステップS618で反復カウント数Countをインクリメントし、上述のステップS605に処理を戻す。
また、ステップS616で、投票数Voteの値が最終投票数VoteMaxの値以下の場合にはステップS618へ処理を移し、反復カウント数Countをインクリメントし、上述のステップS605に処理を戻す。
以上の処理によって、尤もらしい関係にある第1の画像と第2の画像との関係を判定し、この関係に基づいて対応点リストを作成するため、誤対応を減らし、誤対応による類似度の精度の低下を抑制し、誤対応による付加を軽減できる。
他にも、ステップS614の投票の処理において、指標値ΔSに近い縮小回数の差を有する対応点に重みを付けて投票をするようにしてもよい。この場合、指標値ΔSに近いものほど、重みが大きくなるようにする。例えば、指標値ΔSを中心とした各縮小画像ステップの差の分布に応じて、重みが変化するようにするのが良い。その際、正規分布などのさまざまな分布や、マハラノビス距離に基づく重みづけなどを用いてもよい。図7を用いて具体的に説明する。指標値ΔS=0が算出された場合に、ΔS=0の関係にある画像713と画像723から抽出した特徴点の組み合わせ(731、732)の投票数に1を掛ける。一方で、ΔS=1の関係にある組み合わせ(733)の投票数には0.5を掛け、ΔS=2の関係にある組み合わせ(734)には0.25を掛けるなど低い重みを付けて処理をする。
また、本実施形態における類似度の算出方法の説明では、ステップS619で類似度として変換行列の最終投票数VoteMaxを出力する方法を説明したが、本発明はこれに限らず、他の要素を類似度として定義しても良い。例えば、ステップS604以降の処理を行わずに、ステップS603で作成された対応点リストに登録された対応点の組数mを類似度として出力するようにする。
また、本実施形態における類似度の算出方法の説明では、相似変換だけを考えて説明したが、アフィン変換などその他の幾何学変換についても、ステップS608でそれぞれに応じた変換行列を求めることにより、対応可能である。例えば、アフィン変換の場合には、まずステップS607で、選択する対応点の組の座標数を3とする。次に、ステップS608で、式(9)ではなく式(8)を使うこととし、ステップS607で選択した3組の対応点(合計6点)を使って変数a〜fを求めれば良い。
<第2の実施形態>
本実施形態は、第1の実施形態で示した画像比較の考え方を利用した画像検索を行う場合の例である。画像検索をするための処理は、大きく2つの処理に分けられる。1つは検索対象としたい画像を登録する処理で、もう一つが、登録された画像に対して、利用者などが検索条件として入力する画像(以降、クエリ画像)に類似する画像の検索を行い、検索結果を取得する処理である。クエリ画像に類似する画像とは、クエリ画像が有するオブジェクトに類似するオブジェクトを有する画像でもよい。この登録処理と検索処理はそれぞれ別の装置を用意して、システムとして実現してもよい。
[画像の登録処理]
図9は、本実施形態における画像処理装置(以降、画像検索装置1000)の構成例を示すブロック図である。なおここで、第1の実施形態と同一機能を有する構成や工程には同一符号を付すとともに、構成的、機能的にかわらないものについてはその説明を省略する。図9に示すように、画像検索装置1000は、変換部202、抽出部203、判定部204、算出部205および画像特徴データベース1001を有する。登録用に入力される入力画像201は図1のNCU108を介して通信可能に接続されたネットワークスキャナ、デジタルスチルカメラ、画像データを保持した外部記憶装置等、スキャナ109によって入力される。そして、読み込んだ画像はRAM103や外部記憶装置106などに一時的に保持される。
第1の実施形態でも判定部204及び算出部205は、第1の画像と第2の画像とを比較するため、一時的に保持するデータをRAM103や不図示のラッチなどの記憶領域に書き出すことは必要になる。本実施形態では、抽出部203が抽出した特徴点、局所特徴量および縮小回数差などの情報を関連付けて画像特徴データベース1001に記憶する。記憶する際には登録する画像を特定する画像IDを割当てて管理する。
予め第1の実施形態の比較処理を行う上で必要な情報を処理しておくことで、検索条件が与えられてからの検索時間が短縮できる。
[画像の検索処理]
検索を行う場合、まず検索条件としての入力画像201(以降、クエリ画像)が画像検索装置1000に与えられる。クエリ画像201は、図1のNCT108によって通信可能に接続されたネットワークスキャナ、デジタルスチルカメラ、外部記憶装置等や、スキャナ109から入力される。そして、クエリ画像に対しても、変換部202と抽出部203は登録処理と同様の処理によって特徴点、局所特徴量および縮小回数差などの情報を収集する。
次に、クエリ画像の情報と画像特徴データベース1001からサンプル画像の情報とを判定部204と算出部205で比較して類似度を判定する。サンプル画像は集合であり、各サンプル画像に対してクエリ画像との類似度が算出され、この類似度がしきい値以上の画像を検索結果1003として出力する。
図10は、本実施形態でクエリ画像を入力する画面(以降、ウィンドウと称す)の一例を示した図である。
図10において、タイトル1201は、このウィンドウのタイトル表示と全体の操作、例えば大きさの変更等を行う部分である。
ボタン1203は、検索で使用するクエリ画像の入力を指示するためのボタンで、このボタン1203を押下すると、クエリ画像を指定するためのウィンドウが開かれ、クエリ画像の入力処理が行われる。
領域1202は、入力された検索元のクエリ画像のサムネイル画像を表示する部分である。
ボタン1204は、1202のクエリ画像に類似した画像の検索を指示するためのボタンである。このボタンを押下すると、今表示されているクエリ画像に基づいて検索処理が行われる。ボタン1205は処理を終了するためのボタンである。
図11は、本発明の実施形態における検索結果一覧を表示する時の画面の一例を示した図であり、図10の1106検索結果を表示したものである。本例は、専用のアプリケーションでウィンドウシステムを利用した場合の画面の例であるが、Webブラウザ等によって同様の機能が提供されてもかまわない。
タイトルバー1301はこのウィンドウが検索結果であることを示す。領域1302は、検索の元となったクエリ画像のサムネイルを表示する部分である。領域1303は、検索結果を表示するための領域であり、検索結果として得られた画像IDに対応した画像のサムネイルや画像ファイル名などを一覧表示する。
サムネイルは、画像登録時に変換部202によって作成され、画像IDに関連付けられて図1の外部記憶装置106に記憶されている。検索結果数が多く、一つの画面で表示できない場合には、表示サイズに応じた数ずつ表示を行う。本例では、6件ずつ検索結果が表示されている。ボタン1304は、現在表示している検索結果の前の6件を表示するためのボタンであり、ボタン1305は、現在表示している検索結果の次の6件を表示するためのボタンである。また、本実施形態では、サムネイルと画像ファイル名を表示しているが、第1の実施形態の処理で求めた類似度や画像に付与されているメタデータ等を詳細情報として表示してもよい。他にも、領域1303に表示されているサムネイルの一つを選択すると、画像に付与されているメタデータ等を各画像に対する詳細情報を表示するウィンドウを新しく作成するようにしてもよい。
尚、本発明は複数の機器(例えば、ホストコンピュータ、インターフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、1つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用しても良い。
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成される。この場合、記録媒体から読み出されたプログラム自体が前述した実施形態の機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能を実現してもよい。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能を実現してもよい。
第1の実施形態の画像比較装置の構成の概略を示す図である 第1の実施形態の画像の比較処理の概略を示す図である 画像の局所特徴量の計算の処理フローを示す図である 画像の局所特徴量を計算する際の縮小画像の作成例の図である 画像の特徴点を示す概略図である 画像の類似度を算出する処理のフローチャートである 画像での特徴点の組み合わせと誤対応の概略図である 対応点リストを求める処理のフローチャートである 第2の実施形態の画像検索装置の概略を示す図である 第2の実施形態の検索指示画面の図である 第2の実施形態の検索結果画面の図である

Claims (7)

  1. 原画像と原画像を縮小した縮小画像とを有する画像群から複数の特徴点と各特徴点の局所特徴量とを抽出する抽出手段と、
    前記各特徴点の局所特徴量の類似度に基づいて、第1の画像群の各特徴点と類似する局所特徴量を有する第2の画像群の特徴点を対応する特徴点とし、前記第1の画像群が有する第1の画像と前記第2の画像群が有する第2の画像とを比較して、当該対応する特徴点が頻出する前記第1の画像の縮小率と前記第2の画像の縮小率との比又は差を、前記第1の画像のオブジェクトと前記第2の画像のオブジェクトの大きさが近くなる場合の関係として判定する判定手段と、
    前記判定手段の判定した関係に近い第1の画像と第2の画像について、第1の画像の特徴点と類似する局所特徴量を有する第2の画像の特徴点を対応付け、当該対応付けた特徴点に基づいて前記第1の画像群と前記第2の画像群との類似度を算出する算出手段とを有することを特徴とする画像処理装置。
  2. 前記算出手段が、前記判定手段の判定した関係に近い画像から抽出した特徴点の組み合わせに高い重みをつけて前記第1の画像群と前記第2の画像群との類似度を算出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記算出手段が、前記判定手段の判定した関係にある特徴点のみを対応付けることを特徴とする請求項に記載の画像処理装置。
  4. 前記抽出手段が夫々の特徴点の位置を抽出し、前記算出手段は各特徴点の位置関係に基づいて変換行列を生成し、当該変換行列の尤もらしさを前記類似度として算出することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  5. 前記第1の画像のオブジェクトに類似するオブジェクトを有する第2の画像に関する情報を検索結果として出力する出力手段を更に有することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  6. 原画像と原画像を縮小した縮小画像とを有する画像群から複数の特徴点と各特徴点の局所特徴量とを抽出する抽出工程と、
    前記各特徴点の局所特徴量の類似度に基づいて、第1の画像群の各特徴点と類似する局所特徴量を有する第2の画像群の特徴点を対応する特徴点とし、前記第1の画像群が有する第1の画像と前記第2の画像群が有する第2の画像とを比較して、当該対応する特徴点が頻出する前記第1の画像の縮小率と前記第2の画像の縮小率との比又は差を、前記第1の画像のオブジェクトと前記第2の画像のオブジェクトの大きさが近くなる場合の関係として判定する判定工程と、
    前記判定工程で判定した関係に近い第1の画像と第2の画像について、第1の画像の特徴点と類似する局所特徴量を有する第2の画像の特徴点を対応付け、当該対応付けた特徴点に基づいて前記第1の画像群と前記第2の画像群との類似度を算出する算出工程とを有することを特徴とする画像処理方法。
  7. コンピュータに、
    原画像と原画像を縮小した縮小画像とを有する画像群から複数の特徴点と各特徴点の局所特徴量とを抽出する抽出工程と、
    前記各特徴点の局所特徴量の類似度に基づいて、第1の画像群の各特徴点と類似する局所特徴量を有する第2の画像群の特徴点を対応する特徴点とし、前記第1の画像群が有する第1の画像と前記第2の画像群が有する第2の画像とを比較して、当該対応する特徴点が頻出する前記第1の画像の縮小率と前記第2の画像の縮小率との比又は差を、前記第1の画像のオブジェクトと前記第2の画像のオブジェクトの大きさが近くなる場合の関係として判定する判定工程と、
    前記判定工程で判定した関係に近い第1の画像と第2の画像について、第1の画像の特徴点と類似する局所特徴量を有する第2の画像の特徴点を対応付け、当該対応付けた特徴点に基づいて前記第1の画像群と前記第2の画像群との類似度を算出する算出工程とを実行させることを特徴とするプログラム。
JP2008273188A 2008-10-23 2008-10-23 画像処理装置、画像処理方法およびプログラム Expired - Fee Related JP5094682B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008273188A JP5094682B2 (ja) 2008-10-23 2008-10-23 画像処理装置、画像処理方法およびプログラム
US12/603,427 US8385656B2 (en) 2008-10-23 2009-10-21 Image processing apparatus, image processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008273188A JP5094682B2 (ja) 2008-10-23 2008-10-23 画像処理装置、画像処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010102502A JP2010102502A (ja) 2010-05-06
JP5094682B2 true JP5094682B2 (ja) 2012-12-12

Family

ID=42293099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008273188A Expired - Fee Related JP5094682B2 (ja) 2008-10-23 2008-10-23 画像処理装置、画像処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5094682B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2012102018A1 (ja) * 2011-01-25 2014-06-30 三菱電機株式会社 画像検索装置及び方法、画像処理装置及び方法
JP5893318B2 (ja) * 2011-09-28 2016-03-23 キヤノン株式会社 画像検索装置、画像検索方法及びプログラム
JP6061502B2 (ja) * 2012-06-04 2017-01-18 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP2014112347A (ja) * 2012-11-08 2014-06-19 Nec Corp 画像照合システム、画像照合方法、およびプログラム
JP6035173B2 (ja) * 2013-03-14 2016-11-30 株式会社デンソーアイティーラボラトリ 画像検索システム及び画像検索方法
JP6055435B2 (ja) * 2014-04-10 2016-12-27 日本電信電話株式会社 被写体認識装置、被写体認識方法及び被写体認識プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4605445B2 (ja) * 2004-08-24 2011-01-05 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP4561380B2 (ja) * 2005-01-24 2010-10-13 コニカミノルタホールディングス株式会社 検出装置、検出方法及び検出プログラム

Also Published As

Publication number Publication date
JP2010102502A (ja) 2010-05-06

Similar Documents

Publication Publication Date Title
JP5139716B2 (ja) 画像検索装置及び画像検索方法
JP4350414B2 (ja) 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP5181888B2 (ja) グラフィカルユーザインターフェースを生成する方法及びシステム
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP5094682B2 (ja) 画像処理装置、画像処理方法およびプログラム
US20070242882A1 (en) Image processing apparatus for identifying the position of a process target within an image
JP5321109B2 (ja) 情報処理装置及び情報処理プログラム
US8385656B2 (en) Image processing apparatus, image processing method and program
JP5147640B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2013127809A (ja) 画像処理装置、画像処理方法及びプログラム
JP3733310B2 (ja) 文書書式識別装置および識別方法
JP5197328B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP3718967B2 (ja) 画像特徴量抽出装置および方法並びに画像特徴量抽出プログラムを記録した記録媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP6931168B2 (ja) 情報処理装置、制御方法、プログラム
JP6947971B2 (ja) 情報処理装置、制御方法、プログラム
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
WO2019181441A1 (ja) 情報処理装置、制御方法、及びプログラム
JP4741363B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP6327918B2 (ja) 画像検索装置及びその制御方法
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP6795770B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP2005149302A (ja) 顔画像認識装置及び顔画像認識プログラム
US20060203258A1 (en) File management apparatus

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120918

R151 Written notification of patent or utility model registration

Ref document number: 5094682

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150928

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees