JP2018097795A - 法線推定装置、法線推定方法、及び法線推定プログラム - Google Patents

法線推定装置、法線推定方法、及び法線推定プログラム Download PDF

Info

Publication number
JP2018097795A
JP2018097795A JP2016244526A JP2016244526A JP2018097795A JP 2018097795 A JP2018097795 A JP 2018097795A JP 2016244526 A JP2016244526 A JP 2016244526A JP 2016244526 A JP2016244526 A JP 2016244526A JP 2018097795 A JP2018097795 A JP 2018097795A
Authority
JP
Japan
Prior art keywords
normal
image
unit
solution
transformation matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016244526A
Other languages
English (en)
Other versions
JP6663838B2 (ja
Inventor
周平 田良島
Shuhei Tarashima
周平 田良島
隆行 黒住
Takayuki Kurozumi
隆行 黒住
杵渕 哲也
Tetsuya Kinebuchi
哲也 杵渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016244526A priority Critical patent/JP6663838B2/ja
Publication of JP2018097795A publication Critical patent/JP2018097795A/ja
Application granted granted Critical
Publication of JP6663838B2 publication Critical patent/JP6663838B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】平面物体を表す入力画像における平面物体の法線を精度良く推定することができる法線推定装置、法線推定方法、及び法線推定プログラムを提供する。【解決手段】入力画像群中の画像ペアの各々について、画像ペアの対応点から画像ペアの座標系の射影変換行列を推定し、推定された画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と画像ペアの入力画像の各々から見たときの平面物体の法線とに分解したときの複数の解候補を算出し、予め定められた制約に基づいて、複数の解候補から、物理的に実現不可能な解を除去し、除去されなかった解候補を法線候補集合として入力し、他の画像ペアについて選択される前記解候補との誤差が最も小さくなるように、画像ペアの各々についての1つの前記解候補の組み合わせを選択し、選択された解候補の組み合わせを用いて、入力画像の各々から見たときの平面物体の法線を決定する。【選択図】図1

Description

本発明は、画像に写り込む平面物体の法線を推定する法線推定装置、法線推定方法、及び法線推定プログラムに関する。
同一の平面物体が写り込んだ2枚の画像から、平面物体の向き(法線)を推定する公知の方法は、まず2枚の画像から算出される射影変換行列をカメラ間の回転成分/並行移動成分及び平面物体の法線に分解し、得られた(最大8つの候補解)の中から条件を満たす解を選択する方法である。
入力画像に写り込む物体の姿勢を精度良く推定することは、CG(Computer Graphics)データを現実世界に重畳表示するAR(Augmented Reality)アプリケーションを高品質に実現するうえで必要不可欠である。入力画像に写り込む物体が、例えば看板、ポスター等の平面物体である場合、物体の姿勢を推定することは、平面を定義する法線を推定することに帰着する。
同一の平面物体が写り込んだ2枚の画像が与えられた場合に各々の画像に写り込む平面物体の法線を推定する公知の技術としては、非特許文献1〜3に開示された技術が知られている。これらの技術は何れも、各画像を撮影したカメラ座標系間の射影変換行列(ホモグラフィ)を、カメラ間の回転成分及び並行移動成分と、平面物体の法線とに分解するアルゴリズムであり、何らの制約を置かない場合、最大8つの解の候補が得られる。
このように、簡単な物理的制約を置くことで、解の候補を2つに絞り込むことまでは容易に実現可能であるものの、残った2つの解から実際の法線を一意に特定することは一般には難しい。例えば、カメラは平面物体の正面付近から撮影されるといった制約を置けば、カメラ座標平面の法線と平面物体の法線がなす角がより小さくなるような法線を選択する等することで、解を一意に特定することは可能である。
O. Faugeras et al., Motion and structure from motion in a piecewise planar environment, International Journal of Pattern Recognition and Artificial Intelligence, 1988. https://hal.inria.fr/inria‐00075698. Z. Zhang et al., 3D Reconstruction based on Homography Mapping, in ARPA, 1996. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.54.5975&rep=rep1&type=pdf. E. Malis et al., Deeper Understanding of the Homography Decomposition for Visionbased Control, INRIA Research Report, 2007. https://hal.inria.fr/inria‐00174036.
しかし、上記のような制約を置いたとき、当然ながら平面物体をより斜めから撮影した場合には法線を精度良く推定することはできない。すなわち、比較的強い制約(例えば、平面物体はおよそ正面近くからしか撮影されない等)を置くことで、残った2つの解の候補を1つに特定することは可能であるものの、そのような制約は技術の適用範囲を狭めてしまうという問題がある。
本発明は、以上のような事情に鑑みてなされたものであり、平面物体を表す入力画像における平面物体の法線を精度良く推定することができる法線推定装置、法線推定方法、及び法線推定プログラムを提供することを目的とする。
上記目的を達成するために、本発明の法線推定装置は、平面物体を表す複数の入力画像からなる入力画像群中の画像ペアの各々について、前記画像ペアの対応点から前記画像ペアの座標系の射影変換行列を推定する射影変換行列推定部と、前記画像ペアの各々について、前記射影変換行列推定部により推定された前記画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と前記画像ペアの入力画像の各々から見たときの前記平面物体の法線とに分解したときの複数の解候補を算出する法線候補推定部と、前記画像ペアの各々について、予め定められた制約に基づいて、前記法線候補推定部により算出された前記複数の解候補から、物理的に実現不可能な解を除去する不可能解除去部と、前記画像ペアの各々について前記不可能解除去部により除去されなかった前記解候補を法線候補集合として入力し、他の画像ペアについて選択される前記解候補との誤差が最も小さくなるように、前記画像ペアの各々についての1つの前記解候補の組み合わせを選択する法線選択部と、前記法線選択部により選択された前記解候補の組み合わせを用いて、前記入力画像の各々から見たときの前記平面物体の法線を決定する法線決定部と、を含む。
なお、前記入力画像群に含まれる前記入力画像の各々から局所特徴を抽出する局所特徴抽出部と、前記画像ペアの各々について、前記局所特徴抽出部により抽出された前記画像ペアの入力画像の各々の局所特徴を比較して、暫定的な対応点を決定する暫定対応点決定部と、前記画像ペアの各々について、前記暫定的な対応点の集合を幾何モデルにあてはめ、幾何変換パラメータを推定することにより、外れ値でないインライア対応点を求める幾何検証部と、前記画像ペアの各々について前記幾何検証部により求められた前記インライア対応点に基づいて、前記画像ペアをスコアリングする信頼度算出部と、を更に含み、
前記射影変換行列推定部は、前記信頼度算出部によりスコアリングされた信頼度が閾値より大きい前記画像ペアの各々について、前記インライア対応点に基づいて前記画像ペアの座標系の射影変換行列を推定する
ようにしても良い。
また、前記法線選択部は、他の画像ペアについて選択される前記解候補との誤差を表す、劣モジュラ性を満たす目的関数に基づいて、前記解候補の組み合わせを選択するようにしても良い。
また、前記入力画像群は、3以上の前記入力画像からなるようにしても良い。
上記目的を達成するために、本発明の法線推定方法は、射影変換行列推定部、法線候補推定部、不可能解除去部、法線選択部、及び法線決定部を有する法線推定装置における法線推定方法であって、前記射影変換行列推定部が、平面物体を表す入力画像からなる入力画像群中の画像ペアの各々について、前記画像ペアの対応点から前記画像ペアの座標系の射影変換行列を推定するステップと、前記法線候補推定部が、前記画像ペアの各々について、前記射影変換行列推定部により推定された前記画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と前記画像ペアの入力画像の各々から見たときの前記平面物体の法線とに分解したときの複数の解候補を算出するステップと、前記不可能解除去部が、前記画像ペアの各々について、予め定められた制約に基づいて、前記法線候補推定部により算出された前記複数の解候補から、物理的に実現不可能な解を除去するステップと、前記法線選択部が、前記画像ペアの各々について前記不可能解除去部により除去されなかった前記解候補を法線候補集合として入力し、他の画像ペアについて選択される前記解候補との誤差が最も小さくなるように、前記画像ペアの各々についての1つの前記解候補の組み合わせを選択するステップと、前記法線決定部が、前記法線選択部により選択された前記解候補の組み合わせを用いて、前記入力画像の各々から見たときの前記平面物体の法線を決定するステップと、を含む。
上記目的を達成するために、本発明の法線推定プログラムは、コンピュータを、上記法線推定装置の各部として機能させるためのプログラムである。
本発明によれば、平面物体を表す入力画像における平面物体の法線を精度良く推定することができることが可能となる。
第1実施形態に係る法線推定装置の機能的な構成を示すブロック図である。 第1実施形態に係る法線推定処理の流れを示すフローチャートである。 第2実施形態に係る法線推定装置の機能的な構成を示すブロック図である。 第2実施形態に係る法線推定処理の流れを示すフローチャートである。
以下、本発明の実施形態について図面を用いて説明する。
<第1実施形態>
図1は、第1実施形態に係る法線推定装置10の機能的な構成を示すブロック図である。図1に示すように、第1実施形態に係る法線推定装置10は、射影変換行列推定部12、法線候補推定部14、不可能解除去部16、解候補記憶部18、法線選択部20、及び法線決定部22を有している。
射影変換行列推定部12は、同一の平面物体が写り込んだN(≧3)枚の入力画像に写り込む平面物体の対応点(4点以上)のピクセル座標を、画像ペア毎に入力し、各画像ペアについて、射影変換行列を推定する。射影変換行列を推定する方法は任意の方法を用いることが可能で、例えば、最小二乗法、DLT(Direct Linear Transform)等を用いることができる。
法線候補推定部14は、得られた各画像ペアに対応する射影変換行列を、カメラ間の回転成分及び並行移動成分と、画像ペアの各入力画像から見たときの平面物体の法線とに分解し、解の候補を出力する。射影変換行列を分解する方法は任意であり、例えば、上記非特許文献1〜3に開示されている技術等を用いることができる。
ここで、上記非特許文献1に開示されている技術を用いたときの、画像ペアIとIとに対応する射影変換行列Hijの分解手法について説明する。
例えば、射影変換行列推定部12で算出された任意の画像ペアに対応する射影変換行列

を、回転行列

、並進ベクトル

、画像Iの座標系から見たときの平面物体の法線ベクトルnに分解する。
射影変換行列推定部12は、射影変換行列を推定する際、公知の方法を用いることができる。例えば、上記非特許文献1で開示されている技術を用いると、8通りの解候補{Rij,tij,n,n}が得られる。すなわち、下記(1)式にe=±1、e=±1を当てはめることにより4通りの解候補が得られ、また、下記(2)式にe=±1、e=±1を当てはめることにより4通りの解候補が得られる。なお、解候補{Rij,tij,n,n}は、回転行列、並進ベクトル、及び2つの法線ベクトルの組み合わせである。

…(1)

…(2)
なお、解候補は、例えば、上記非特許文献1で開示されているように、下記(3)式〜下記(14)式を用いて、SVD(singular value decomposition)による行列分解を行うことにより求められる。

…(3)

…(4)

…(5)

…(6)

…(7)

…(8)

…(9)

…(10)

…(11)

…(12)

…(13)

…(14)
不可能解除去部16は、得られた各画像ペアに対応する解候補として、法線候補推定部14により射影変換行列Hijを分解することで得られた解候補{Rij,tij,n,n}を入力し、予め定めた物理的な制約を置くことで、解候補のうち現実的には有り得ない解を除去する。
物理的に不可能な解を除去する方法としては、以下に示す2つの方法が挙げられる。一般的に、以下に示す2つの制約の双方を適用することで、解候補を2通りにまで絞り込むことができる。
<制約1>2つの画像が、平面物体から見て同じ側から撮影されたという制約(ただし、平面物体は透明ではない)を適用する。
すなわち、

を満たさなければ棄却する。
<制約2>2つの画像間の対応点は、どちらの画像からも見えるという制約を適用する。
すなわち、画像I中の対応点の同次座標をm(ベクトル)として、

を満たさなければ棄却する。
本実施形態では、対応点を、入力として与えられた対応点から選べば良い。なお、後述する第2実施形態では、対応点を、後述する幾何検証部46で得られたインライア対応点から選べば良い。
不可能解除去部16は、除去されずに残った解候補を解候補記憶部18に記憶させる。
法線選択部20は、解候補記憶部18に記憶されている解候補を入力し、解候補の集合から、他の画像ペアについて選択される解候補との誤差を表す目的関数f(X)が最適化されるように、画像ペアの各々について1つの候補を選択する。上述した事項は、解候補の各々にラベルを付与し、射影変換行列集合
に対応する画像ペアの各々についてのラベルからなるラベル集合

を変数とし、上記を表現した目的関数f(X)を最大化するような、画像ペアの各々についてのラベルの組み合わせXを求める問題として定義できる。なお、目的関数f(X)は、上述した事項を満たすものであれば任意の形態をとることが可能である。例えば、下記(16)式で定義することができる。
目的関数f(X)を最大化するような、画像ペアの各々についてのラベルの組み合わせXを求める最も簡単な方法は、ラベルXのあらゆるパターンに対応する目的関数f(x)の値を算出し、最も値が高くなるようなパターンを、目的関数f(X)を最大化するような組み合わせXとして出力する方法である。この方法では、

通り(zは解候補の数)の目的関数f(x)を計算する必要がある。例えば、下記(16)式及び下記(17)式のように目的関数を設定した場合、射影変換行列推定部12による射影変換行列の推定方法によっては目的関数が劣モジュラ性を満たす。そのため、例えば、下記(15)式に示すように、劣モジュラ性が成立するときの下記(16)式の解を高速に求めるアルゴリズムのような貪欲アルゴリズムを用いることで、高速に、画像ペアの各々についてのラベルの組み合わせXを求めることができる。

…(15)

…(16)

…(17)
上記目的関数f(X)を最適化することにより、互いの法線推定誤差が最も小さくなるように、画像ペアの各々について、解候補の中から解を選択することで、各画像ペアに対応する解候補を一意に絞り込む。
このように、法線選択部20によって、各画像ペアにから算出される射影変換行列に対応する平面物体の法線ベクトルは一意に決まる。
法線決定部22は、法線選択部20によって一意に決められた、各画像ペアから算出される射影変換行列に対応する平面物体の法線ベクトルを入力とし、各入力画像を撮影したカメラ座標系から見たときの平面物体の法線ベクトルを算出する。
各画像ペアから算出される射影変換行列に対応する平面物体の法線ベクトルから、各カメラ座標系から見たときの法線ベクトルを求める方法としては、任意の方法を用いることができる。例えば、ある入力画像を撮影したカメラ座標系から見たときの平面物体の法線ベクトルの平均を計算することにより、当該入力画像を撮影したカメラ座標系から見たときの平面物体の法線ベクトルを算出する。
また、法線決定部22は、算出した各入力画像を撮影したカメラ座標系から見たときの平面物体の法線ベクトルを、各入力画像を撮影したカメラ座標系から見たときの平面物体の法線ベクトル

として、出力する。
なお、本実施形態に係る法線推定装置10は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)、各種プログラムを記憶するROM(Read Only Memory)を備えたコンピュータ装置で構成される。また、法線推定装置10を構成するコンピュータは、ハードディスクドライブ、不揮発性メモリ等の記憶部を備えていても良い。本実施形態では、CPUがROM、ハードディスク等の記憶部に記憶されているプログラムを読み出して実行することにより、上記のハードウェア資源とプログラムとが協働し、上述した機能が実現される。
本実施形態に係る法線推定装置10による学習処理の流れを、図2に示すフローチャートを用いて説明する。本実施形態では、法線推定装置10に、法線推定処理の実行を開始するための予め定めた情報が入力されたタイミングで法線推定処理が開始されるが、法線推定処理が開始されるタイミングはこれに限らず、例えば、平面物体を表す入力画像からなる入力画像群中の画像ペアの各々における対応点が入力されたタイミングで法線推定処理が開始されても良い。
ステップS101では、射影変換行列推定部12が、平面物体を表す3枚以上の入力画像からなる入力画像群中の画像ペアの各々の対応点を入力する。
ステップS103では、射影変換行列推定部12が、入力した画像ペアの各々について、当該画像ペアの対応点から当該画像ペアの座標系の射影変換行列を推定する。
ステップS105では、法線候補推定部14が、入力した画像ペアの各々について、射影変換行列推定部12により推定された当該画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と当該画像ペアの入力画像の各々から見たときの平面物体の法線とに分解したときの、回転成分及び並行移動成分と画像ペアの入力画像の各々から見たときの平面物体の法線の組み合わせで表される複数の解候補を算出する。
ステップS107では、不可能解除去部16が、入力した画像ペアの各々について、例えば、上述した予め定められた2つの制約に基づいて、法線候補推定部14により算出された複数の解候補から、物理的に実現不可能な解を除去する。
ステップS109では、法線選択部20が、入力した画像ペアの各々について不可能解除去部により除去されなかった解候補を法線候補集合として入力し、他の画像ペアについて選択される解候補との誤差を表す目的関数を最適化するように、画像ペアの各々についての1つの解候補を選択する。
ステップS111では、法線決定部22が、選択された解候補に基づいて、入力画像の各々から見たときの平面物体の法線を算出し、算出された法線に関するデータを出力し、本法線推定処理のプログラムの実行を終了する。なお、本実施形態では、選択された法線を示すデータをディスプレイ等の表示手段に表示させたり、推定された法線を示すデータを記憶手段に記憶させたりすることにより、選択された法線に関するデータを出力する。
このように、本実施形態では、平面物体を表す入力画像からなる入力画像群中の画像ペアの各々について、画像ペアの対応点から画像ペアの座標系の射影変換行列を推定し、画像ペアの各々について、推定された画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と画像ペアの入力画像の各々から見たときの平面物体の法線とに分解したときの複数の解候補を算出する。また、画像ペアの各々について、予め定められた制約に基づいて、法線候補推定部により算出された複数の解候補から、物理的に実現不可能な解を除去し、画像ペアの各々について、除去されなかった解候補を法線候補集合として入力し、他の画像ペアについて選択される解候補との誤差が最も小さくなるように、画像ペアの各々についての1つの解候補の組み合わせを選択する。そして、選択された解候補の組み合わせを用いて、入力画像の各々から見たときの平面物体の法線を決定する。
すなわち、上述したように、画像に写り込む平面物体の法線を推定する上記非特許文献1〜3に開示されている技術では、同一の平面物体が写り込んだ2枚の画像を用いて平面物体の法線を推定している。一方、本実施形態では、同一の平面物体が写り込んだ3枚以上の画像を入力とし、3枚以上の画像の各々の画像ペアについて射影変換行列を推定し、公知の技術を用いて法線候補を算出する。また、得られた法線候補の集合について、互いの画像ペアにおける推定誤差が最も小さくなるような候補解を選択することによって、各画像ペアにおける法線の解を一意に決定し、その結果から、各画像から見たときの平面物体の法線を算出する。
これにより、法線の候補解を一意に絞り込むために何らの仮定を置く必要はないため、技術の適用領域を狭めることはない。すなわち、本実施形態によると、何らの制約を置くことなく精度良く各画像から見たときの平面物体の法線(すなわち向き)を推定することが可能になる。
<第2実施形態>
次に、第2実施形態に係る法線推定装置について説明する。
上述した第1実施形態では、各入力画像に写り込む平面物体の法線を推定するために各画像について4点以上の対応点の座標を手動で入力する必要がある。一方、本第2実施形態では、平面物体が写り込んだN枚の画像そのものを入力として、各画像に写り込む平面物体の法線を推定する。本第2実施形態によると、複数の画像を入力とする際のユーザの手間及びコストを削減することができ、本第2実施形態は、特に、多量の画像を入力とする場合に有用である。
図3は、第2実施形態に係る法線推定装置10Aの機能を示すブロック図である。図3に示すように、法線推定装置10Aは、第1実施形態に係る法線推定装置10の構成に加えて、局所特徴抽出部40、暫定対応付け決定部44、幾何検証部46、及び、信頼度推定部48を有している。
第2実施形態に係る法線推定装置10Aのその他の構成は、上記第1実施形態に係る法線推定装置10と同じであるため、上記第1実施形態に係る法線推定装置10と同じ構成については同一の符号を付し、説明を省略する。
局所特徴抽出部40は、入力された各画像から局所特徴量および各局所特徴に対応する属性情報を抽出する。抽出する局所特徴量は任意の公知の技術を用いることが可能であり、例えば、上記非特許文献1で開示されているSIFTを用いることができ、他にもSURF、BEIEF、BRISK、ORB、FREAK、AKAZE等を用いることができる。
また属性情報としては、上記非特許文献1で開示されている技術と同様に、位置(x,y)、スケール、回転量の4つを取得しても良いし、上記非特許文献2で開示されている技術を用いて位置(x,y)、スケール、回転(ロー、ピッチ、ヨー)の6つを取得しても良い。
局所特徴抽出部40は、求めた局所特徴及び属性情報を、解候補記憶部18に記憶させる。
暫定対応付け決定部44は、入力された各画像からなる画像ペアの各々について、解候補記憶部18から当該画像ペアに対応する局所特徴の情報を読み出し、局所特徴を比較することで、当該画像ペア間で局所特徴を暫定的に対応付ける。
比較の方法は任意であり、例えば局所特徴ベクトル間のL2ノルムを計算し、その値が最も小さい画像間局所特徴ペアを対応付けるなどすれば良い。
幾何検証部46は、入力された各画像からなる画像ペアの各々について、暫定対応付け決定部44により求められた当該画像ペア間の対応付け結果から、所定の幾何モデルのパラメータを推定し、その結果を用いて、当該画像ペア間の暫定対応付け結果から誤対応を除去する。
所定の幾何モデルは任意であり、例えばアフィン変換、ホモグラフィ変換等を用いることができる。また、上記非特許文献3で開示されている技術を用いて、局所特徴抽出部40により得られた属性情報を用いて投票空間を構築し、投票数の多いセル単位で幾何モデルのパラメータを推定し誤対応除去を実施しても良い。
信頼度推定部48は、画像ペアの各々について、幾何検証部46で得られた対応付け(インライア対応点)の結果を用いて、当該画像ペア間で幾何的な整合性がとれているか否かを評価する。
信頼度の算出方法は任意であり、例えば、上記非特許文献3に開示された技術のように、推定した幾何変換パラメータを用いて、画像ペアの何れか一方であるテスト画像を、他方の訓練画像上にマッピングし、当該マッピング領域内の局所特徴点数に応じて誤対応が生じる確率を算出するといった技術を用いることができる。
ここで、算出された信頼度が所定の閾値以下である画像ペアについては、画像間で局所特徴の対応付けに失敗していると判定し、以降の処理は行わないものとする。
すなわち、本実施形態では、射影変換行列推定部12は、信頼度推定部48により算出された子音ライドが、所定の閾値より大きい各画像ペアについて、幾何検証部46により得られたインライア対応点を用いて、所定の幾何モデルを仮定したときの画像ペア間の射影変換行列を推定する。また、法線候補推定部14、不可能解除去部16、及び法線選択部20の各処理においても、信頼度推定部48により算出された信頼度が、所定の閾値より大きい各画像ペアについて処理が行われる。
なお、本実施形態に係る法線推定装置10Aは、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)、各種プログラムを記憶するROM(Read Only Memory)を備えたコンピュータ装置で構成される。また、法線推定装置10Aを構成するコンピュータは、ハードディスクドライブ、不揮発性メモリ等の記憶部を備えていても良い。本実施形態では、CPUがROM、ハードディスク等の記憶部に記憶されているプログラムを読み出して実行することにより、上記のハードウェア資源とプログラムとが協働し、上述した機能が実現される。
次に、本実施形態に係る法線推定装置10Aによる法線推定処理の流れを、図4に示すフローチャートを用いて説明する。本実施形態では、法線推定装置10Aに、適用処理の実行を開始するための予め定めた情報が入力されたタイミングで法線推定処理が開始されるが、法線推定処理が開始されるタイミングはこれに限らず、例えば、平面物体を表す入力画像からなる入力画像群が入力されたタイミングで法線推定処理が開始されても良い。
ステップS201では、局所特徴抽出部40が、平面物体を表す3枚以上の入力画像からなる入力画像群を入力する。
ステップS203では、局所特徴抽出部40が、入力した入力画像群中の入力画像の各々の局所特徴を抽出する。
ステップS205では、暫定対応付け決定部44が、入力画像群中の画像ペアの各々について、当該画像ペアの入力画像の各々について抽出された局所特徴を比較して、暫定的な対応点を決定する。
ステップS207では、幾何検証部46が、入力した入力画像群中の画像ペアの各々について、暫定的な対応点の集合を幾何モデルにあてはめ、幾何変換パラメータを推定することにより、外れ値でないインライア対応点を求める。
ステップS209では、信頼度推定部48が、入力した入力画像群中の画像ペアの各々について、求められた当該画像ペアのインライア対応点に基づいて、当該画像ペアをスコアリングする。
ステップS211では、射影変換行列推定部12が、信頼度が閾値より大きい画像ペアの各々について、画像ペアの対応点から画像ペアの座標系の射影変換行列を推定する。
ステップS213では、法線候補推定部14が、信頼度が閾値より大きい画像ペアの各々について、射影変換行列推定部12により推定された画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と画像ペアの入力画像の各々から見たときの平面物体の法線とに分解したときの、回転成分及び並行移動成分と画像ペアの入力画像の各々から見たときの平面物体の法線の組み合わせで表される複数の解候補を算出する。
ステップS215では、不可能解除去部16が、信頼度が閾値より大きい画像ペアの各々について、例えば、上述した予め定められた2つの制約に基づいて、法線候補推定部14により算出された複数の解候補から、物理的に実現不可能な解を除去する。
ステップS217では、法線選択部20が、信頼度が閾値より大きい画像ペアの各々について不可能解除去部により除去されなかった解候補を法線候補集合として入力し、他の画像ペアについて選択される解候補との誤差を表す目的関数を最適化するように、画像ペアの各々についての1つの解候補の組み合わせを選択する。
ステップS219では、法線決定部22が、選択された解候補の組み合わせに基づいて、入力画像の各々から見たときの平面物体の法線を算出し、算出された法線に関するデータを出力し、本法線推定処理のプログラムの実行を終了する。なお、本実施形態では、選択された法線を示すデータをディスプレイ等の表示手段に表示させたり、推定された法線を示すデータを記憶手段に記憶させたりすることにより、選択された法線に関するデータを出力する。
このようにして、本実施形態では、入力画像群に含まれる入力画像の各々から局所特徴を抽出し、画像ペアの各々について、抽出された画像ペアの入力画像の各々の局所特徴を比較して、暫定的な対応点を決定し、画像ペアの各々について、暫定的な対応点の集合を幾何モデルにあてはめ、幾何変換パラメータを推定することにより、外れ値でないインライア対応点を求める。また、画像ペアの各々について、求められたインライア対応点に基づいて、画像ペアをスコアリングし、スコアリングされた信頼度が閾値より大きい画像ペアの各々について、インライア対応点に基づいて画像ペアの座標系の射影変換行列を推定する。
なお、本実施形態では、図1に示す機能の構成要素の動作をプログラムとして構築し、法線推定装置10、10Aとして利用されるコンピュータにインストールして実行させるが、これに限らず、ネットワークを介して流通させても良い。
また、構築されたプログラムをハードディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールしたり、配布したりしても良い。
10 法線推定装置
12 射影変換行列推定部
14 法線候補推定部
16 不可能解除去部
18 解候補記憶部
20 法線選択部
22 法線決定部
40 局所特徴抽出部
44 暫定対応付け決定部
46 幾何検証部
48 信頼度推定部

Claims (6)

  1. 平面物体を表す複数の入力画像からなる入力画像群中の画像ペアの各々について、前記画像ペアの対応点から前記画像ペアの座標系の射影変換行列を推定する射影変換行列推定部と、
    前記画像ペアの各々について、前記射影変換行列推定部により推定された前記画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と前記画像ペアの入力画像の各々から見たときの前記平面物体の法線とに分解したときの複数の解候補を算出する法線候補推定部と、
    前記画像ペアの各々について、予め定められた制約に基づいて、前記法線候補推定部により算出された前記複数の解候補から、物理的に実現不可能な解を除去する不可能解除去部と、
    前記画像ペアの各々について前記不可能解除去部により除去されなかった前記解候補を法線候補集合として入力し、他の画像ペアについて選択される前記解候補との誤差が最も小さくなるように、前記画像ペアの各々についての1つの前記解候補の組み合わせを選択する法線選択部と、
    前記法線選択部により選択された前記解候補の組み合わせを用いて、前記入力画像の各々から見たときの前記平面物体の法線を決定する法線決定部と、
    を含む法線推定装置。
  2. 前記入力画像群に含まれる前記入力画像の各々から局所特徴を抽出する局所特徴抽出部と、
    前記画像ペアの各々について、前記局所特徴抽出部により抽出された前記画像ペアの入力画像の各々の局所特徴を比較して、暫定的な対応点を決定する暫定対応点決定部と、
    前記画像ペアの各々について、前記暫定的な対応点の集合を幾何モデルにあてはめ、幾何変換パラメータを推定することにより、外れ値でないインライア対応点を求める幾何検証部と、
    前記画像ペアの各々について前記幾何検証部により求められた前記インライア対応点に基づいて、前記画像ペアをスコアリングする信頼度算出部と、を更に含み、
    前記射影変換行列推定部は、前記信頼度算出部によりスコアリングされた信頼度が閾値より大きい前記画像ペアの各々について、前記インライア対応点に基づいて前記画像ペアの座標系の射影変換行列を推定する
    請求項1記載の法線推定装置。
  3. 前記法線選択部は、他の画像ペアについて選択される前記解候補との誤差を表す、劣モジュラ性を満たす目的関数に基づいて、前記解候補の組み合わせを選択する
    請求項1又は2記載の法線推定装置。
  4. 前記入力画像群は、3以上の前記入力画像からなる
    請求項1〜3の何れか1項記載の法線推定装置。
  5. 射影変換行列推定部、法線候補推定部、不可能解除去部、法線選択部、及び法線決定部を有する法線推定装置における法線推定方法であって、
    前記射影変換行列推定部が、平面物体を表す入力画像からなる入力画像群中の画像ペアの各々について、前記画像ペアの対応点から前記画像ペアの座標系の射影変換行列を推定するステップと、
    前記法線候補推定部が、前記画像ペアの各々について、前記射影変換行列推定部により推定された前記画像ペアに対応する射影変換行列を、回転成分及び並行移動成分と前記画像ペアの入力画像の各々から見たときの前記平面物体の法線とに分解したときの複数の解候補を算出するステップと、
    前記不可能解除去部が、前記画像ペアの各々について、予め定められた制約に基づいて、前記法線候補推定部により算出された前記複数の解候補から、物理的に実現不可能な解を除去するステップと、
    前記法線選択部が、前記画像ペアの各々について前記不可能解除去部により除去されなかった前記解候補を法線候補集合として入力し、他の画像ペアについて選択される前記解候補との誤差が最も小さくなるように、前記画像ペアの各々についての1つの前記解候補の組み合わせを選択するステップと、
    前記法線決定部が、前記法線選択部により選択された前記解候補の組み合わせを用いて、前記入力画像の各々から見たときの前記平面物体の法線を決定するステップと、
    を含む法線推定方法。
  6. コンピュータを、請求項1〜4の何れか1項記載の法線推定装置の各部として機能させるための法線推定プログラム。
JP2016244526A 2016-12-16 2016-12-16 法線推定装置、法線推定方法、及び法線推定プログラム Active JP6663838B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016244526A JP6663838B2 (ja) 2016-12-16 2016-12-16 法線推定装置、法線推定方法、及び法線推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016244526A JP6663838B2 (ja) 2016-12-16 2016-12-16 法線推定装置、法線推定方法、及び法線推定プログラム

Publications (2)

Publication Number Publication Date
JP2018097795A true JP2018097795A (ja) 2018-06-21
JP6663838B2 JP6663838B2 (ja) 2020-03-13

Family

ID=62633089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016244526A Active JP6663838B2 (ja) 2016-12-16 2016-12-16 法線推定装置、法線推定方法、及び法線推定プログラム

Country Status (1)

Country Link
JP (1) JP6663838B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114529615A (zh) * 2022-04-21 2022-05-24 南京隼眼电子科技有限公司 雷达标定方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053754A (ja) * 2004-08-11 2006-02-23 Honda Motor Co Ltd 平面検出装置及び検出方法
WO2009147814A1 (ja) * 2008-06-02 2009-12-10 パナソニック株式会社 法線情報を生成する画像処理装置、方法、コンピュータプログラム、および、視点変換画像生成装置
JP2014526736A (ja) * 2011-09-12 2014-10-06 クアルコム,インコーポレイテッド 方位センサに基づくホモグラフィ分解の曖昧性の解決
JP2015201123A (ja) * 2014-04-10 2015-11-12 日本電信電話株式会社 被写体認識装置、被写体認識方法及び被写体認識プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053754A (ja) * 2004-08-11 2006-02-23 Honda Motor Co Ltd 平面検出装置及び検出方法
WO2009147814A1 (ja) * 2008-06-02 2009-12-10 パナソニック株式会社 法線情報を生成する画像処理装置、方法、コンピュータプログラム、および、視点変換画像生成装置
JP2014526736A (ja) * 2011-09-12 2014-10-06 クアルコム,インコーポレイテッド 方位センサに基づくホモグラフィ分解の曖昧性の解決
JP2015201123A (ja) * 2014-04-10 2015-11-12 日本電信電話株式会社 被写体認識装置、被写体認識方法及び被写体認識プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114529615A (zh) * 2022-04-21 2022-05-24 南京隼眼电子科技有限公司 雷达标定方法、装置及存储介质
CN114529615B (zh) * 2022-04-21 2022-07-08 南京隼眼电子科技有限公司 雷达标定方法、装置及存储介质

Also Published As

Publication number Publication date
JP6663838B2 (ja) 2020-03-13

Similar Documents

Publication Publication Date Title
US10452899B2 (en) Unsupervised deep representation learning for fine-grained body part recognition
David et al. SoftPOSIT: Simultaneous pose and correspondence determination
US20190295266A1 (en) Point cloud matching method
JP4829141B2 (ja) 視線検出装置及びその方法
JP4985516B2 (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US8885923B2 (en) Feature point selecting system, feature point selecting method and feature point selecting program
US11145080B2 (en) Method and apparatus for three-dimensional object pose estimation, device and storage medium
CN113196289A (zh) 人体动作识别方法、人体动作识别系统及设备
US10755139B2 (en) Random sample consensus for groups of data
JP2013508844A (ja) 画像のシーケンス内のオブジェクトのリアルタイム表現のハイブリッド型追跡のための方法、コンピュータプログラム、および装置
JP6597914B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6296205B2 (ja) 画像処理装置、画像処理方法およびそのプログラムを記憶する記憶媒体
EP3185212B1 (en) Dynamic particle filter parameterization
CN112102294A (zh) 生成对抗网络的训练方法及装置、图像配准方法及装置
US20230237777A1 (en) Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium
US8270770B1 (en) Region-based dense feature correspondence
JP5500245B2 (ja) トレーニング方法及び装置並びに画像における対象の姿勢視角を推定する方法及び装置
JP6713422B2 (ja) 学習装置、イベント検出装置、学習方法、イベント検出方法、プログラム
JP6663838B2 (ja) 法線推定装置、法線推定方法、及び法線推定プログラム
JP2019046278A (ja) 情報処理装置、制御方法、コンピュータプログラム、記憶媒体、及びモデル作成装置
Figueroa et al. A combined approach toward consistent reconstructions of indoor spaces based on 6D RGB-D odometry and KinectFusion
WO2017042852A1 (en) Object recognition appratus, object recognition method and storage medium
JP6641313B2 (ja) 領域抽出装置及びプログラム
Petrou et al. Super-resolution in practice: the complete pipeline from image capture to super-resolved subimage creation using a novel frame selection method
JP7272381B2 (ja) 学習処理装置及び学習処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200217

R150 Certificate of patent or registration of utility model

Ref document number: 6663838

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150