JP2018195270A - 局所特徴表現学習装置、及び方法 - Google Patents

局所特徴表現学習装置、及び方法 Download PDF

Info

Publication number
JP2018195270A
JP2018195270A JP2017101178A JP2017101178A JP2018195270A JP 2018195270 A JP2018195270 A JP 2018195270A JP 2017101178 A JP2017101178 A JP 2017101178A JP 2017101178 A JP2017101178 A JP 2017101178A JP 2018195270 A JP2018195270 A JP 2018195270A
Authority
JP
Japan
Prior art keywords
local feature
learning
unit
patch
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017101178A
Other languages
English (en)
Other versions
JP6758250B2 (ja
Inventor
周平 田良島
Shuhei Tarashima
周平 田良島
隆行 黒住
Takayuki Kurozumi
隆行 黒住
杵渕 哲也
Tetsuya Kinebuchi
哲也 杵渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017101178A priority Critical patent/JP6758250B2/ja
Publication of JP2018195270A publication Critical patent/JP2018195270A/ja
Application granted granted Critical
Publication of JP6758250B2 publication Critical patent/JP6758250B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】幾何的及び光学的な変形に頑健な局所特徴記述子を、パッチ単位のアノテーションを用いることなく学習することができる。
【解決手段】画像データセットに含まれる各画像から複数のパッチを抽出するパッチ抽出部と、画像データセットに含まれる任意の画像ペアの幾何的な同一性を判定し、同一であると判定された画像ペアから、幾何的な変形パラメータを用いて同一物理領域を捉えたパッチのペアを抽出する同一領域パッチペア抽出部と、複数のパッチからなるパッチの集合、及びパッチのペアを用いて、局所特徴表現の学習のための学習データを構築する学習データ構築部と、学習データを用いて局所特徴表現を学習する局所特徴表現学習部と、予め定められた基準を満たすまで、局所特徴表現学習部で学習された局所特徴表現を用いて、同一領域パッチペア抽出部から局所特徴表現学習部までの処理を繰り返し行わせる終了判定部と、を備える局所特徴表現学習装置。
【選択図】図1

Description

本発明は、局所特徴表現学習装置、及び方法に係り、特に、複数の画像を含む画像データセットから局所特徴表現を学習する局所特徴表現学習装置、及び方法に関する。
画像から抽出される任意の小領域(以下、「パッチ」という)を特徴表現する局所特徴表現技術は、画像や映の像検索やステレオマッチング、及び画像編集等、非常に多くの応用用途を持つパターン認識の基本技術である。局所特徴表現技術は、SIFT記述子やSURF記述子に代表される局所特徴表現アルゴリズムが人手で設計されているものと、膨大なデータセットから機械学習により特徴表現を獲得しているものの2種類に大別できる。
非特許文献1では、ラベルが付与された大規模パッチデータセットから、同一の物理領域を捉えた(ラベルが同一な)パッチペアのL2距離(ノルム)が小さくなり、かつ異なる物理領域を捉えた(ラベルが異なる)パッチペアのL2距離は十分大きくなるような特徴表現をニューラルネットワークで学習する方法が開示されている。
一方、非特許文献2では、同一ラベルに属する2つのパッチと、それとは異なるラベルのパッチから構成されるトリプレット(三つ組)を入力の最小単位として、同一ラベルのパッチ間のL2距離が、異なるラベルのパッチ間のL2距離よりも小さくなるような特徴表現をニューラルネットワークで学習する方法が開示されている。
一方、非特許文献3では、画像単位のラベルのみが割り当てられたデータセットを入力として、局所特徴表現を学習する方法が開示されている。具体的には、画像ペアを構成する各画像から抽出される局所特徴集合間で算出される類似度を定義し、同一ラベルの画像ペア間の類似度が、異なるラベルの画像間の類似度よりも高くなるようなニューラルネットワークを学習する方法が提案されている。
E. Simo-Serra et al., Discriminative Learning of Deep Convolutional Feature Point Descriptors, in ICCV, 2015.インターネット<URL:http://cvlabwww.epfl.ch/~trulls/pdf/iccv-2015-deepdesc.pdf> V. Balntas et al., Learning local feature descriptors with triplets and shallow convolutional neural networks, in BMVC, 2016. インターネット<URL:http://www.bmva.org/bmvc/2016/papers/paper119/paper119.pdf> Nenad Markus et al., Learning Local Descriptors by Optimizing the Keypoint-Correspondence Criterion, in ICPR, 2016.
しかしながら、非特許文献1及び非特許文献2のいずれの手法も、パッチレベルでの正解ラベルが割り当てられた学習データの存在を仮定しており、それらを直接適用するには、膨大な数のパッチを人手でラベリングしなくてはならないという問題がある。
また、非特許文献3では、画像単位の類似度を導入することで、パッチ単位のラベルを用いずに局所特徴表現の学習を実現しているが、一方でこの類似度は、局所特徴の総当り比較のみに基づいて定義されており、局所特徴の空間的な関係については何ら考慮されていない。局所特徴の空間的な関係性は、例えば幾何的及び光学的な要因で、同一物理領域から抽出されながらも見えが異なるパッチを発見する大きな手がかりである。これらを学習データとして用いることは、幾何的及び光学的な変形に頑健な局所特徴表現の獲得に不可欠であると考えられる。
以上から、幾何的及び光学的な変形に頑健な局所特徴表現を獲得する公知の技術には、学習のためのパッチのラベリングに膨大な人手のコストがかかるという問題がある。また、パッチ単位のアノテーションを必要としない公知の技術には、局所特徴間の空間関係性を考慮する機構が含まれておらず、学習データが潜在的に有する情報を十分に活用できていないという問題があった。
本発明は上記問題点を考慮してなされたものであり、幾何的及び光学的な変形に頑健な局所特徴記述子を、パッチ単位のアノテーションを用いることなく学習することができる、局所特徴表現学習装置、及び方法を提供することを目的とする。
上記目的を達成するために、本開示の第1の態様は、複数の画像を含む画像データセットから局所特徴表現を学習する局所特徴表現学習装置であって、入力される画像データセットに含まれる各画像から複数のパッチを抽出するパッチ抽出部と、前記画像データセットに含まれる任意の画像ペアの幾何的な同一性を判定し、同一であると判定された画像ペアから、幾何的な変形パラメータを用いて同一物理領域を捉えた前記パッチのペアを抽出する同一領域パッチペア抽出部と、前記パッチ抽出部で抽出された前記複数のパッチからなるパッチの集合、及び前記同一領域パッチペア抽出部で抽出された前記パッチのペアを用いて、局所特徴表現の学習のための学習データを構築する学習データ構築部と、前記学習データ構築部で構築された前記学習データを用いて局所特徴表現を学習する局所特徴表現学習部と、予め定められた基準を満たすまで、前記局所特徴表現学習部で学習された局所特徴表現を用いて、前記同一領域パッチペア抽出部から前記局所特徴表現学習部までの処理を繰り返し行わせる終了判定部と、を備える。
本開示の第2の態様は、第1の態様の局所特徴表現学習装置において、前記同一領域パッチペア抽出部は、前記パッチ抽出部で抽出された前記複数の各パッチの各々を前記局所特徴表現を用いて特徴表現する局所特徴記述部と、前記画像データセットに含まれる画像ペアについて、前記局所特徴記述部により表現された各パッチの局所特徴に基づいて、画像ペアの幾何的な同一性の判定、及び前記幾何的な変形パラメータの推定を行う変形推定部と、前記変形推定部で同一であると判定がなされた画像ペアについて、前記変形パラメータを用いて同一物理領域を捉えた前記パッチのペアを抽出する同一領域判定部と、を備える。
本開示の第3の態様は、第1の態様または第2の態様の局所特徴表現学習装置において、前記局所特徴表現学習部は、前記学習データを用いて、前記同一領域パッチペア抽出部で、同一物理領域を捉えていると判定された前記パッチのペアの類似度は高く、かつ異なる物理領域を捉えていると判定された前記パッチのペアの類似度は低くなるような特徴空間へ、パッチを写像するニューラルネットワークを学習する。
本開示の第4の態様は、第1の態様から第3の態様のいずれか1態様の局所特徴表現学習装置において、前記学習データ構築部は、同一物理領域を捉えていないと判定された前記パッチのペアを学習データとするにあたり、前記同一領域パッチペア抽出部における同一性の判定結果を用いる。
本開示の第5の態様は、第1の態様から第3の態様のいずれか1態様の局所特徴表現学習装置において、前記学習データ構築部は、同一物理領域を捉えていないと判定された前記パッチのペアを学習データとするにあたり、前記入力される画像データセットに付与されている画像単位のラベルの情報を用いる。
また、上記目的を達成するために、本開示の第6の態様は、複数の画像を含む画像データセットから局所特徴表現を学習する局所特徴表現学習装置における局所特徴表現学習方法であって、パッチ抽出部が、入力される画像データセットに含まれる各画像から複数のパッチを抽出するステップと、同一領域パッチペア抽出部が、前記画像データセットに含まれる任意の画像ペアの幾何的な同一性を判定し、同一であると判定された画像ペアから、幾何的な変形パラメータを用いて同一物理領域を捉えた前記パッチのペアを抽出するステップと、学習データ構築部が、前記パッチ抽出部で抽出された前記複数のパッチからなるパッチの集合、及び前記同一領域パッチペア抽出部で抽出された前記パッチのペアを用いて、局所特徴表現の学習のための学習データを構築するステップと、局所特徴表現学習部が、前記学習データ構築部で構築された前記学習データを用いて局所特徴表現を学習するステップと、終了判定部が、予め定められた基準を満たすまで、前記局所特徴表現学習部で学習された局所特徴表現を用いて、前記同一領域パッチペア抽出部から前記局所特徴表現学習部までの処理を繰り返し行わせるステップと、を含む。
本開示によれば、幾何的及び光学的な変形に頑健な局所特徴記述子を、パッチ単位のアノテーションを用いることなく学習することができる、という効果が得られる。
実施形態における画像特徴装置の一例を示す構成図である。 実施形態のパッチ抽出部におけるパッチの抽出方法の一例を説明するための図である。 実施形態のパッチ抽出部におけるパッチの抽出方法の他の例を説明するための図である。 実施形態の同一領域パッチペア抽出部の構成の一例を示す構成図である。 実施形態の同一領域パッチペア抽出部の局所特徴記述部、変形推定部、及び同一領域判定部の動作を説明するための図である。 Siameseネットワークの一例を示す図である。 Siameseネットワークの他の例を示す図である。 Tripletネットワークの一例を示す図である。 Siameseネットワークの一例の具体的な構成例を示す構成図である。 Tripletネットワークの一例の具体的な構成例を示す構成図である。 本実施形態の局所特徴表現学習装置における局所特徴表現学習処理ルーチンの一例を示すフローチャートである。
以下、図面を参照して本発明の実施形態を詳細に説明する。なお、本実施形態は本発明を限定するものではない。
<本開示の実施形態に係る概要>
本開示では、同一領域パッチペア抽出部において、画像データセット中の任意の画像ペアについて幾何的な同一性の判定を実施し、同一であると判定された画像間の変形パラメータを用いて、同一の物理領域(以下、単に「同一領域」という)を捉えていると考えられるパッチのペアを抽出する。さらに、局所特徴表現学習部では、同一領域パッチペア抽出部で抽出されたパッチペアが互いに類似する(あるいは距離が小さくなる)ような局所特徴表現(局所特徴記述子)をニューラルネットワークで学習する。更には、局所特徴表現学習部で学習された局所特徴記述子を用いて、同一領域パッチペア抽出部で抽出される同一領域パッチペアを更新し、得られた学習データで局所特徴表現学習部でニューラルネットワークも更新する、という繰り返し処理を、所定の条件が満たされるまで繰り返す。
本開示では、画像間の同一性の判定結果を用いて、(同一領域を捉えた)パッチペアを抽出することで、パッチ単位のアノテーションを用いずに局所特徴表現の学習が可能となり、非特許文献1及び非特許文献2のようにパッチ単位のアノテーションを事前に用意する必要がなくなる。また、単純な既知の局所特徴表現に基づくパッチ間の類似度の比較ではなく、画像間の同一性の判定の結果得られた変形パラメータを用いてパッチペアを抽出することで、既知の局所特徴表現では抽出できないようなパッチペア、例えば、同一領域を捉えているものの、一方の画像では幾何的及び光学的な変形の少なくとも一方の影響を強く受けているパッチペアを学習データに含めることが可能となり、例えば、非特許文献3で開示された技術と比較して、より上記の幾何的及び光学的な変形に頑健な局所特徴記述子を学習することができる。
<本開示の実施形態の局所特徴表現学習装置の構成>
本実施形態の局所特徴表現学習装置では、任意の画像を複数含む任意の画像データセットを入力として、局所特徴記述子を出力する。図1には、本実施形態の画像特徴装置の一例の構成図を示す。
図1に示した局所特徴表現学習装置20には、一例として複数の画像12に対して、複数のカテゴリ(図1では、カテゴリ1〜カテゴリ3を図示)のラベルが付与された(ラベリングされた)画像データセット10を入力とした場合を示している。
パッチ抽出部30には、画像データセット10が入力される、パッチ抽出部30は、画像データセット10に含まれる各画像12の各々から、局所特徴抽出の対象となるパッチの抽出を行う。なお、パッチ抽出部30におけるパッチの抽出方法は任意である。例えば図2に示すように、画像100をグリッド状に分割することにより複数のパッチ102を抽出することができる。また例えば、図3に示すように、非特許文献1及び非特許文献2に示すような公知の局所特徴検出器を用いて画像110から複数のパッチ112を抽出することができる。
パッチ抽出部30は、抽出したパッチの集合を出力する。
同一領域パッチペア抽出部32には、パッチ抽出部30からパッチの集合が入力される。同一領域パッチペア抽出部32は、入力されたパッチの集合から、同一ラベルの任意の画像ペアについて幾何的な同一性の判定を行い、その結果得られた変形パラメータを用いて同一領域を捉えたパッチペア(同一領域パッチペア)を抽出する。
本実施形態の同一領域パッチペア抽出部32は、一例として図4に示すように、局所特徴記述部40、変形推定部42、及び同一領域判定部44を備える。図4に示した同一領域パッチペア抽出部32は、画像間の幾何的な変形パラメータとしてホモグラフィを仮定した場合の、同一領域パッチペアを抽出する構成を示している。
局所特徴記述部40には、パッチ抽出部30からパッチの集合が入力される。局所特徴記述部40は、局所特徴記述子を用いて各パッチを特徴表現し、画像間で、得られた局所特徴の類似度及び距離の少なくとも一方に基づき、パッチの対応付けを行う。局所特徴記述子としては、例えば、当該局所特徴記述部40における直前の処理までに得られたものや、非特許文献1、参考文献1、及び参考文献2で得られているものを用いることができる。局所特徴記述部40は、局所特徴の対応を表す情報を出力する。
[参考文献1]D. G. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, in IJCV, 2004.
[参考文献2]K. Mikolajczyk et al., A Comparison of Affine Region Detectors, in IJCV, 2005.
変形推定部42には、局所特徴記述部40から局所特徴の対応を表す情報が入力される。局所特徴記述部40により得られた対応には、アウトライヤが含まれ得るため、RANSACを始めとするロバスト推定手法によりそれらを除去し、画像間の幾何的な変形を推定する。
例えば、図5に示した一例では、局所特徴記述部40は、(A)に示すように、画像130と画像132との間の幾何的な変形パラメータとして、ホモグラフィ変換行列H、具体的には、
を得る。変形推定部42は、得られた変形パラメータを出力する。
同一領域判定部44には、変形推定部42から変形パラメータが入力される。同一領域判定部44が、変形パラメータを用いて、一方の画像に含まれる各パッチの代表座標を他方の画像へ投影し、座標が最も近く、かつその距離が所定の閾値よりも小さいものがあった場合、それらパッチペアを同一領域パッチペア138と判定する。
変形推定部42により、局所特徴記述部40における、局所特徴の単純な比較では抽出できなかった、幾何的及び光学的な少なくとも一方の変形を強く受けたパッチペア、例えば、図5に示した一例では、(B)に示したパッチペア134、及びパッチペア136等が抽出できる。また、変形推定部42は、単純な見えは類似しているものの異なる物理領域から抽出されたパッチペア、すなわちアウトライヤを除去し、同一領域を捉えたパッチペアを抽出することができる。
なお、画像間の変形パラメータとしては、上記ホモグラフィ変換行列Hの他にもアフィン変換行列やthin plate spatial transformer、を用いてもよいし、各画像12を撮影したカメラの外部パラメータも既知の場合はカメラポーズ行列を用いてもよい。また、一方の画像のパッチに対応するものを他方の画像から抽出するにあたり、パッチ抽出部30で得られたパッチを用いず、一方の画像中のパッチそのものに変換行列を適用し、その領域を抽出することでパッチペアを抽出してもよい。
同一領域パッチペア抽出部32の同一領域判定部44は、抽出した同一領域パッチペア及びパッチ抽出部30から入力されたパッチの集合を出力する。
学習データ構築部34には、同一領域パッチペア抽出部32から出力された同一領域パッチペア及びパッチの集合が入力される。学習データ構築部34は、同一領域パッチペア及びパッチの集合を用いて、後段の局所特徴表現学習部36で実際に学習に用いるデータを構築する。なお、局所特徴表現学習部36で用いるニューラルネットワークの誤差関数の種類に応じて、データ構築が異なる。
局所特徴表現学習部36で用いるニューラルネットワークの誤差関数がパッチペアを入力とする場合には、同一領域パッチペアの集合をpositiveなペア、パッチペアのうち同一領域を捉えていないものをnegativeなペアとすればよい。positiveなペア及びnegativeなペアの双方とも、学習データ、及び同一領域パッチペア抽出部32から入力された全てのパッチペアを学習データとしてもよいし、あるいはその中から所定の数だけサンプリングして得られたパッチペアを学習データとしてもよい。また得られたパッチペアに、いわゆるdata augmentationと呼ばれる簡易な変形を施し、データの水増しを行ってもよい。
また、局所特徴表現学習部36で用いるニューラルネットワークがパッチのトリプレット(三つ組)を入力とする場合には、同一領域パッチペア集合をpositiveなパッチペアとし、positiveなパッチペアと、それらとは異なる物理領域から抽出されたパッチとからトリプレットを構成する。この場合も、トリプレットの数は学習データから得られる全てのトリプレットを学習データとしてもよいし、その中から所定の数だけサンプリングして得られたトリプレットを学習データとしてもよい。
なお、パッチのペア及びトリプレットを学習データとするいずれの場合においても、異なる物理領域から抽出されるnegativeなパッチペアを抽出する際には、各画像のラベル情報を参照できる場合にはそれを活用してもよい。同一領域パッチペア抽出部32で実施される幾何的な同一性の検証は、同一のラベルを持つ画像であっても同一であると判定されないことが発生し得る。その場合、negativeなパッチをランダムにサンプリングすることで抽出すると、極稀に、本来は同一領域から抽出されたパッチであるにもかかわらず、negativeであると判定されてしまうという問題があるが、画像のラベル情報を用いることでこれを回避することができる。入力される画像データセット10にラベルが付与されていない場合は、画像ペアの同一性は厳密には判定できないため、例えば対応点の数がごく少ない画像ペアからnegativeペアを抽出する等とすることができる。
学習データ構築部34からは、構築された学習データが出力される。
局所特徴表現学習部36には、学習データ構築部34から学習データが入力される。局所特徴表現学習部36は、入力された学習データを用いて、同一の物理領域から抽出されたパッチ間の類似度が高く(距離が小さく)、異なる物理領域から抽出されたパッチ間は類似度が低くなる(類似していない)ような特徴空間へ各パッチを写像する局所特徴記述子を学習する。ここで学習される局所特徴記述子は、パッチのペアないしはトリプレットを入力の最小単位として、学習データ構築部34で得られたpositiveなパッチ間は類似させ、negativeなパッチ間は類似させないようなニューラルネットワークを学習するものとする。
本実施形態では、上記を満たすニューラルネットワークであれば特に限定されず、任意のものを用いることができる。例えば、図6に示したSiameseネットワーク150、及び図7に示したSiameseネットワーク152、及び図8に示したTripletネットワーク156等を用いることができる。
図6及び図7に示したようなSiameseネットワーク150、152は、パッチペアを構成する各パッチを順伝播ネットワークに入力することで得られた中間表現間の距離ないしは類似度から誤差関数が定義されるようなニューラルネットワークである。一例として、図6に示すように、Siameseネットワーク150では、誤差関数(i)が定義され、Siameseネットワーク152では、誤差関数(ii)が定義される。
順伝播ネットワークの重みWはパッチペアで共有されていてもされていなくてもよい。また、距離または類似度についても、パラメータのないL2距離やコサイン類似度を用いても、メトリックそのものを学習するような層を順伝播ネットワークの上にスタックしてもよい。
誤差関数(i)としては、例えば、下記(1)式で表されるようなContrastive loss関数を用いることができる。
・・・(1)
また、誤差関数(ii)としては、例えば、下記(2)式で表されるようなBinary cross entropy関数を用いることができる。
・・・(2)
図9には、実際に用いるSiameseネットワークの具体例として、Siameseネットワーク150の一例の具体的な構成例を示す。なお、Siameseネットワークは、当該構成に限らず任意の順伝播ネットワークの形態を採用することができる。
なお、図9に示したSiameseネットワーク150は、フィルタサイズを(h×w×c)としている。また、Convは、畳み込み層を表し、MaxPoolingは、プーリング層を表し、ReLuは、活性化関数を表し、Flattenは、平坦化層を表し、さらにFCは、全接続層を表している。また、図9では、一例として、入力されるパッチのサイズが、(32×32×1)である場合について示している。
一方、図8に示したようなTripletネットワーク156は、トリプレットを構成する各パッチを順伝播ネットワークに入力することで得られた中間特徴表について、positiveなパッチ間の類似度が、negativeなパッチ間の類似度よりも高くなるような(距離の場合は、positiveなパッチ間の距離がnegativeなパッチ間の距離よりも小さくなるような)誤差関数が定義されるニューラルネットワークである。一例として、図8に示すように、Tripletネットワーク156では、誤差関数(iii)が定義される。
誤差関数(iii)としては、例えば、Ratio loss関数や、下記(3)式で表されるようなMargin ranking loss関数を用いることができる。
・・・(3)
図10には、実際に用いるTripletネットワーク156の一例の具体的な構成例を示す。なお、Tripletネットワーク156は、当該構成に限らず任意の順伝播ネットワークの形態を採用することができる。
なお、上述したニューラルネットワークの誤差関数を最小化する最適化手法は任意であり、例えばSGD、momentum SGD、RMSProp、参考文献3で開示されているAdaGrad、参考文献4で開示されているAdadelta、及び参考文献5で開示されているAdam等を用いることができる。学習率、weight decayの設定も任意である。ここで学習されたニューラルネットワークのうち、単一パッチの順伝播ネットワークから出力される任意の中間表現を局所特徴記述子として用いることができる。
[参考文献3]J. Duchi et al., Adaptive Subgradient Methods for Online Learning and Stochastic Optimization, in JMLR, 2011.
[参考文献4]M. D. Zeiler, ADADELTA: An Adaptive Learning Rate Method, in CoRR, 2012.
[参考文献5]D. P. Kingma et al., ADAM: A Method for Stochastic Optimization, in Proc. ICLR, 2015.
局所特徴表現学習部36は、学習した局所特徴記述子を出力する。
終了判定部38には、局所特徴表現学習部36から局所特徴記述子が入力される。同一領域パッチペア抽出部32から局所特徴表現学習部36による繰り返し処理を行う場合、終了判定部38は、当該局所特徴記述子を同一領域パッチペア抽出部32に出力する。この場合、同一領域パッチペア抽出部32は、終了判定部38から入力された局所特徴記述子を用いることで、より多くのパッチペアを抽出することができる。そのため、学習データ構築部34により、抽出されたパッチペアから再び構築された学習データを用いることで、局所特徴表現学習部36により、局所特徴記述子そのものも更新することができる。
終了判定部38では、上記の繰り返し処理について終了判定処理を行う。終了判定の基準は任意であり、例えば、上記の繰り返し処理の繰り返し回数を所定の回数で打ち切ったり、同一領域パッチペア抽出部32で得られたパッチペア集合と、直前に得られたパッチペア集合とが変わらなくなったことを基準としたりすればよい。
なお、本実施形態の局所特徴表現学習装置20は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、局所特徴表現学習プログラムや各種データを記憶したROMと(Read Only Memory)、を含むコンピュータで構成することができる。本実施形態のCPUが局所特徴表現学習プログラムを実行することにより、局所特徴表現学習装置20のパッチ抽出部30、同一領域パッチペア抽出部32、学習データ構築部34、局所特徴表現学習部36、及び終了判定部38の各々として機能する。
<本実施形態の局所特徴表現学習装置20の作用>
次に、本実施形態の局所特徴表現学習装置20の作用について説明する。
パッチ抽出部30に画像データセット10が入力されると、局所特徴表現学習装置20は、図11に一例を示す、局所特徴表現学習処理ルーチンを実行する。
図11に示したステップS100でパッチ抽出部30は、上述したように、画像データセット10に含まれる各画像12の各々から、局所特徴抽出の対象となるパッチの抽出を行い、抽出したパッチの集合を出力する。
次のステップS102で同一領域パッチペア抽出部32は、上述したように、入力されたパッチの集合から、同一ラベルの任意の画像ペアについて幾何的な同一性の判定を行い、その結果得られた変形パラメータとしてホモグラフィを用いて同一領域パッチペアを抽出して出力する。
次のステップS104で学習データ構築部34は、上述したように、入力された同一領域パッチペア及びパッチの集合を用いて、学習データ構築部34は、同一領域パッチペア及びパッチの集合を用いて、後段の局所特徴表現学習部36で用いるニューラルネットワークの誤差関数の種類に応じた学習データを構築して出力する。
次のステップS106で局所特徴表現学習部36は、上述したように、入力された学習データを用いて、同一の物理領域から抽出されたパッチ間の類似度が高く、異なる物理領域から抽出されたパッチ間は類似度が低いような特徴空間へ各パッチを写像する局所特徴記述子を学習し、学習した局所特徴記述子(局所特徴表現)を出力する。
次のステップS108で終了判定部38は、上述したように、予め定められた基準に基づいて、繰り返し処理を行うか否かを判定する。本実施形態では、一例として予め定められた基準を満たさない場合は繰り返し処理を行うため、ステップS108の判定が否定判定となり、ステップS102に戻り、上記各ステップの処理を繰り返す。この場合、終了判定部38は、入力された局所特徴記述子を同一領域パッチペア抽出部32に出力する。
一方、予め定められた基準を満たす場合、ステップS108の判定が肯定判定となり、本局所特徴表現学習処理ルーチンを終了する。この場合、終了判定部38は、入力された局所特徴記述子(局所特徴表現)を局所特徴表現学習装置20の外部に出力する。
以上説明したように、本実施形態の局所特徴表現学習装置20は、複数の画像12を含む画像データセット10から局所特徴表現を学習する局所特徴表現学習装置20であって、入力される画像データセット10に含まれる各画像12から複数のパッチを抽出するパッチ抽出部30と、画像データセット10に含まれる任意の画像ペアの幾何的な同一性を判定し、同一であると判定された画像ペアから、幾何的な変形パラメータを用いて同一物理領域を捉えたパッチのペアを抽出する同一領域パッチペア抽出部と、パッチ抽出部30で抽出された複数のパッチからなるパッチの集合、及び同一領域パッチペア抽出部32で抽出されたパッチのペアを用いて、局所特徴表現の学習のための学習データを構築する学習データ構築部と、学習データ構築部で構築された学習データを用いて局所特徴表現を学習する局所特徴表現学習部と、予め定められた基準を満たすまで、局所特徴表現学習部で学習された局所特徴表現を用いて、同一領域パッチペア抽出部から局所特徴表現学習部までの処理を繰り返し行わせる終了判定部と、を備える。
従って、本実施形態の局所特徴表現学習装置20によれば、幾何的及び光学的な変形に頑健な局所特徴記述子を、パッチ単位のアノテーションを用いることなく学習することができる。また、本実施形態の局所特徴表現学習装置20によれば、複数のパッチを人手でラベリングせずとも、自動でラベリングするため、人手による手間を省くことができる。
なお、上記実施形態では、局所特徴表現学習装置20に入力される画像データセット10が、一例として複数の画像12に対して、複数のカテゴリのラベルが付与された画像データセット10である場合について説明したが、画像データセット10はこれに限定されない。例えば、ラベルが付与されていない複数の画像12を含むものであってもよい。
なお、本実施形態は一例であり、具体的な構成は本実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれ、状況に応じて変更可能であることは言うまでもない。
20 局所特徴表現学習装置
30 パッチ抽出部
32 同一領域パッチペア抽出部
34 学習データ構築部
36 局所特徴表現学習部
38 終了判定部
40 局所特徴記述部
42 変形推定部
44 同一領域判定部

Claims (6)

  1. 複数の画像を含む画像データセットから局所特徴表現を学習する局所特徴表現学習装置であって、
    入力される画像データセットに含まれる各画像から複数のパッチを抽出するパッチ抽出部と、
    前記画像データセットに含まれる任意の画像ペアの幾何的な同一性を判定し、同一であると判定された画像ペアから、幾何的な変形パラメータを用いて同一物理領域を捉えた前記パッチのペアを抽出する同一領域パッチペア抽出部と、
    前記パッチ抽出部で抽出された前記複数のパッチからなるパッチの集合、及び前記同一領域パッチペア抽出部で抽出された前記パッチのペアを用いて、局所特徴表現の学習のための学習データを構築する学習データ構築部と、
    前記学習データ構築部で構築された前記学習データを用いて局所特徴表現を学習する局所特徴表現学習部と、
    予め定められた基準を満たすまで、前記局所特徴表現学習部で学習された局所特徴表現を用いて、前記同一領域パッチペア抽出部から前記局所特徴表現学習部までの処理を繰り返し行わせる終了判定部と、
    を備える局所特徴表現学習装置。
  2. 前記同一領域パッチペア抽出部は、
    前記パッチ抽出部で抽出された前記複数の各パッチの各々を前記局所特徴表現を用いて特徴表現する局所特徴記述部と、
    前記画像データセットに含まれる画像ペアについて、前記局所特徴記述部により表現された各パッチの局所特徴に基づいて、画像ペアの幾何的な同一性の判定、及び前記幾何的な変形パラメータの推定を行う変形推定部と、
    前記変形推定部で同一であると判定がなされた画像ペアについて、前記変形パラメータを用いて同一物理領域を捉えた前記パッチのペアを抽出する同一領域判定部と、
    を備える、請求項1に記載の局所特徴表現学習装置。
  3. 前記局所特徴表現学習部は、
    前記学習データを用いて、前記同一領域パッチペア抽出部で、同一物理領域を捉えていると判定された前記パッチのペアの類似度は高く、かつ異なる物理領域を捉えていると判定された前記パッチのペアの類似度は低くなるような特徴空間へ、パッチを写像するニューラルネットワークを学習する、
    請求項1または請求項2に記載の局所特徴表現学習装置。
  4. 前記学習データ構築部は、
    同一物理領域を捉えていないと判定された前記パッチのペアを学習データとするにあたり、前記同一領域パッチペア抽出部における同一性の判定結果を用いる、
    請求項1から請求項3のいずれか1項に記載の局所特徴表現学習装置。
  5. 前記学習データ構築部は、
    同一物理領域を捉えていないと判定された前記パッチのペアを学習データとするにあたり、前記入力される画像データセットに付与されている画像単位のラベルの情報を用いる、
    請求項1から請求項3のいずれか1項に記載の局所特徴表現学習装置。
  6. 複数の画像を含む画像データセットから局所特徴表現を学習する局所特徴表現学習装置における局所特徴表現学習方法であって、
    パッチ抽出部が、入力される画像データセットに含まれる各画像から複数のパッチを抽出するステップと、
    同一領域パッチペア抽出部が、前記画像データセットに含まれる任意の画像ペアの幾何的な同一性を判定し、同一であると判定された画像ペアから、幾何的な変形パラメータを用いて同一物理領域を捉えた前記パッチのペアを抽出するステップと、
    学習データ構築部が、前記パッチ抽出部で抽出された前記複数のパッチからなるパッチの集合、及び前記同一領域パッチペア抽出部で抽出された前記パッチのペアを用いて、局所特徴表現の学習のための学習データを構築するステップと、
    局所特徴表現学習部が、前記学習データ構築部で構築された前記学習データを用いて局所特徴表現を学習するステップと、
    終了判定部が、予め定められた基準を満たすまで、前記局所特徴表現学習部で学習された局所特徴表現を用いて、前記同一領域パッチペア抽出部から前記局所特徴表現学習部までの処理を繰り返し行わせるステップと、
    を含む局所特徴表現学習方法。
JP2017101178A 2017-05-22 2017-05-22 局所特徴表現学習装置、及び方法 Active JP6758250B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017101178A JP6758250B2 (ja) 2017-05-22 2017-05-22 局所特徴表現学習装置、及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017101178A JP6758250B2 (ja) 2017-05-22 2017-05-22 局所特徴表現学習装置、及び方法

Publications (2)

Publication Number Publication Date
JP2018195270A true JP2018195270A (ja) 2018-12-06
JP6758250B2 JP6758250B2 (ja) 2020-09-23

Family

ID=64570938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017101178A Active JP6758250B2 (ja) 2017-05-22 2017-05-22 局所特徴表現学習装置、及び方法

Country Status (1)

Country Link
JP (1) JP6758250B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733965A (zh) * 2021-02-03 2021-04-30 西安理工大学 一种基于小样本学习的无标签图像分类方法
JP2021120802A (ja) * 2020-01-30 2021-08-19 日本電気株式会社 適応的データ位置関係学習装置、適応的データ位置関係学習方法および適応的データ位置関係学習プログラム
JP2022537636A (ja) * 2019-05-09 2022-08-29 オートモビリア ツー リミテッド ライアビリティ カンパニー メディア処理および表示のための方法、システム、およびコンピュータ・ プログラム製品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012022716A (ja) * 2011-10-21 2012-02-02 Fujifilm Corp 立体画像処理装置、方法及びプログラム並びに立体撮像装置
US20150294189A1 (en) * 2012-07-23 2015-10-15 Selim BenHimane Method of providing image feature descriptors
WO2015170461A1 (ja) * 2014-05-07 2015-11-12 日本電気株式会社 画像処理装置、画像処理方法およびコンピュータ可読記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012022716A (ja) * 2011-10-21 2012-02-02 Fujifilm Corp 立体画像処理装置、方法及びプログラム並びに立体撮像装置
US20150294189A1 (en) * 2012-07-23 2015-10-15 Selim BenHimane Method of providing image feature descriptors
WO2015170461A1 (ja) * 2014-05-07 2015-11-12 日本電気株式会社 画像処理装置、画像処理方法およびコンピュータ可読記録媒体

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
EDGAR SIMO-SERRA, 外5名: ""Discriminative Learning of Deep Convolutional Feature Point Descriptors"", 2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV), JPN6020030331, 13 December 2015 (2015-12-13), US, pages 118 - 126, ISSN: 0004327499 *
KAREN SIMONYAN, 外2名: ""Learning Local Feature Descriptors Using Convex Optimisation"", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 第36巻, 第8号, JPN6020030332, 21 January 2014 (2014-01-21), US, pages 1573 - 1585, ISSN: 0004327500 *
MATTHEW BROWN, 外2名: ""Discriminative Learning of Local Image Descriptors"", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 第33巻, 第1号, JPN6020030333, 18 March 2010 (2010-03-18), US, pages 43 - 57, ISSN: 0004327501 *
安倍満, 外2名: ""対応点探索のための特徴量表現"", 電子情報通信学会技術研究報告, vol. 第115巻, 第388号, JPN6020030330, 14 December 2015 (2015-12-14), JP, pages 53 - 73, ISSN: 0004327498 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022537636A (ja) * 2019-05-09 2022-08-29 オートモビリア ツー リミテッド ライアビリティ カンパニー メディア処理および表示のための方法、システム、およびコンピュータ・ プログラム製品
JP2021120802A (ja) * 2020-01-30 2021-08-19 日本電気株式会社 適応的データ位置関係学習装置、適応的データ位置関係学習方法および適応的データ位置関係学習プログラム
JP7427979B2 (ja) 2020-01-30 2024-02-06 日本電気株式会社 適応的データ位置関係学習装置、適応的データ位置関係学習方法および適応的データ位置関係学習プログラム
CN112733965A (zh) * 2021-02-03 2021-04-30 西安理工大学 一种基于小样本学习的无标签图像分类方法
CN112733965B (zh) * 2021-02-03 2023-04-07 西安理工大学 一种基于小样本学习的无标签图像分类方法

Also Published As

Publication number Publication date
JP6758250B2 (ja) 2020-09-23

Similar Documents

Publication Publication Date Title
CN111126360B (zh) 基于无监督联合多损失模型的跨域行人重识别方法
Shen et al. Discovering visual patterns in art collections with spatially-consistent feature learning
Melekhov et al. Siamese network features for image matching
Qin et al. Query adaptive similarity for large scale object retrieval
Naikal et al. Informative feature selection for object recognition via sparse PCA
US8885923B2 (en) Feature point selecting system, feature point selecting method and feature point selecting program
CN108229347B (zh) 用于人识别的拟吉布斯结构采样的深层置换的方法和装置
CN107688829A (zh) 一种基于支持向量机的识别系统及识别方法
WO2020036124A1 (ja) 物体認識装置、物体認識学習装置、方法、及びプログラム
Chaudhury et al. Plant species identification from occluded leaf images
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
CN112115317A (zh) 一种针对深度哈希检索的有目标攻击方法及终端设备
CN112084849A (zh) 图像识别方法和装置
JP6758250B2 (ja) 局所特徴表現学習装置、及び方法
JP6107531B2 (ja) 特徴抽出プログラム及び情報処理装置
WO2023124278A1 (zh) 图像处理模型的训练方法、图像分类方法及装置
CN111241326A (zh) 基于注意力金字塔图网络的图像视觉关系指代定位方法
CN111125397A (zh) 一种基于卷积神经网络的布料图像检索方法
JP6793925B2 (ja) 検証装置、方法、及びプログラム
JP6460926B2 (ja) 撮影画像に写る物体を検索するシステム及び方法
CN106951509B (zh) 多标签核化典型相关分析检索方法
CN111523586A (zh) 一种基于噪声可知的全网络监督目标检测方法
CN111143544B (zh) 一种基于神经网络的柱形图信息提取方法及装置
JP7156643B2 (ja) 姿勢推定装置、学習装置、方法、及びプログラム
JP2014225168A (ja) 特徴点集合で表される画像間の類似度を算出するプログラム、装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200825

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200901

R150 Certificate of patent or registration of utility model

Ref document number: 6758250

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150