WO2023084601A1 - 算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体 - Google Patents

算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体 Download PDF

Info

Publication number
WO2023084601A1
WO2023084601A1 PCT/JP2021/041187 JP2021041187W WO2023084601A1 WO 2023084601 A1 WO2023084601 A1 WO 2023084601A1 JP 2021041187 W JP2021041187 W JP 2021041187W WO 2023084601 A1 WO2023084601 A1 WO 2023084601A1
Authority
WO
WIPO (PCT)
Prior art keywords
matrix
corresponding point
image
calculation
calculating
Prior art date
Application number
PCT/JP2021/041187
Other languages
English (en)
French (fr)
Inventor
学 中野
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to PCT/JP2021/041187 priority Critical patent/WO2023084601A1/ja
Publication of WO2023084601A1 publication Critical patent/WO2023084601A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

算出装置において算出部は、ラグランジュ乗数を用いずにE行列(Essential matrix)の局所解を表す、「所定の連立方程式」を解くことによって、E行列を算出する。この「所定の連立方程式」は、E行列の特徴を制約条件としたラグランジュ関数LであってN組の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表している。Nは、例えば、6以上の自然数である。各「対応点ペア」は、第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含む。

Description

算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体
 本開示は、算出装置、算出方法、及び非一時的なコンピュータ可読媒体に関する。
 複数台のカメラを用いて同一の物体(被写体)を撮影した複数の画像を含む画像列から、カメラパラメータとその物体の3次元情報とを復元する問題は、Structure-from-Motion(SfM)や多視点幾何学問題と呼ばれている。カメラパラメータは、「内部パラメータ」及び「外部パラメータ」の2種類を含む。内部パラメータは、焦点距離、レンズ歪、光学中心座標などのレンズ固有のパラメータであり、外部パラメータは、カメラ間の3次元的な回転行列及び並進ベクトルである。内部パラメータは、レンズが固定ならば事前に計測が可能であり、内部パラメータが既知のカメラは、校正済みカメラと呼ばれる。
 校正済みカメラによる2視点幾何において「カメラ間の相対的な外部パラメータ」は、3×3の基本行列(E行列:Essential matrix)として表現される。ここで「相対的」としているのは、絶対的な世界座標系の定義が不明な場合、1つ目のカメラの座標系を基準として2つ目のカメラの回転行列及び並進ベクトルを表現するためである。この相対的な並進ベクトルと回転行列とを乗算したものがE行列である。このE行列の特徴として、固有値の1つがゼロであり、2つの特異値が等しい、ことが知られている。
 E行列の算出方法として、D. Nisterの「5点法」が広く知られている。D. Nisterの「5点法」は、2枚の画像における2つの対応点を含む「対応点ペア」を、少なくとも5組用いる。各対応点ペアの2つの対応点は、同じ3次元座標がそれぞれのカメラで観測された2つの画像座標である。
 5点法では、最大で10個の実数解が算出されるため、一意に決めることが困難なことがある。解を一意に定めるためには、6組以上の対応点ペアを用いて、最小自乗解を算出すればよい。その方法の一つとして、8組以上の対応点ペアを用いて一意の解を算出するR. Hartleyの8点法も広く用いられている。特許文献1には、8点法を用いて2視点幾何を多視点カメラに適用し、物体の3次元形状の復元を行う方法が開示されている。また、特許文献2には、5点法を用いて2視点幾何を多視点カメラに適用し、物体の3次元形状の復元を行う方法が開示されている。ここで、「2視点幾何」とは、SfMの最小条件である2つの校正済みカメラを用いることに対応する。
国際公開第2012/014430号 国際公開第2019/058487号
 しかしながら、特許文献1及び特許文献2に開示の5点法及び8点法は、統計的に最適な一意のE行列を算出できない、可能性がある。
 本開示の目的は、統計的に最適な一意のE行列を算出できる、算出装置、算出方法、及び非一時的なコンピュータ可読媒体を提供することにある。
 第1の態様にかかる算出装置は、対応点ペアの2つの対応点間の幾何学的な制約であるエピポーラ制約を表すための基本行列(E行列)を算出する算出装置であって、
 複数の対応点ペアのそれぞれに含まれる各対応点の画像平面内座標を取得し、各対応点ペアが第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含む、取得部と、
 前記E行列の特徴を制約条件としたラグランジュ関数Lであって前記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表し、且つ、ラグランジュ乗数を用いずに前記E行列の局所解を表す、所定の連立方程式を解くことによって、前記E行列を算出する算出部と、
 を具備する。
 第2の態様にかかる算出方法は、算出装置によって実行される、対応点ペアの2つの対応点間の幾何学的な制約であるエピポーラ制約を表すための基本行列(E行列)を算出する算出方法であって、
 複数の対応点ペアのそれぞれに含まれる各対応点の画像平面内座標を取得することを含み、
 各対応点ペアが第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含み、
 前記算出方法は、前記E行列の特徴を制約条件としたラグランジュ関数Lであって前記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表し、且つ、ラグランジュ乗数を用いずに前記E行列の局所解を表す、所定の連立方程式を解くことによって、前記E行列を算出することを含む。
 第3の態様にかかるプログラムは、対応点ペアの2つの対応点間の幾何学的な制約であるエピポーラ制約を表すための基本行列(E行列)を算出する処理を、算出装置に実行させるプログラムであって、
 前記処理は、複数の対応点ペアのそれぞれに含まれる各対応点の画像平面内座標を取得することを含み、
 各対応点ペアが第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含み、
 前記処理は、前記E行列の特徴を制約条件としたラグランジュ関数Lであって前記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表し、且つ、ラグランジュ乗数を用いずに前記E行列の局所解を表す、所定の連立方程式を解くことによって、前記E行列を算出することを含む。
 本開示により、統計的に最適な一意のE行列を算出できる、算出装置、算出方法、及び非一時的なコンピュータ可読媒体を提供することができる。
第1実施形態における算出装置の一例を示すブロック図である。 2視点幾何の具体例の説明に供する図である。 第2実施形態における算出装置の一例を示すブロック図である。 第2実施形態における算出装置による処理動作の一例を示すフローチャートである。 第3実施形態における算出装置の一例を示すブロック図である。 第3実施形態における算出装置による処理動作の一例を示すフローチャートである。 第4実施形態におけるカメラパラメータ推定装置の一例を示すブロック図である。 算出装置のハードウェア構成例を示す図である。
 以下、図面を参照しつつ、実施形態について説明する。なお、実施形態において、同一又は同等の要素には、同一の符号を付し、重複する説明は省略される。
<第1実施形態>
 図1は、第1実施形態における算出装置の一例を示すブロック図である。図1に示す算出装置10は、「対応点ペア」の2つの対応点間の幾何学的な制約である「エピポーラ制約」を表すための「基本行列(E行列:Essential matrix)」を算出する。
 図1において算出装置10は、取得部11と、算出部12とを有している。
 取得部11は、N組の「対応点ペア」のそれぞれに含まれる各対応点の画像平面内座標を取得する。画像平面内座標は、「観察画像座標」と呼んでもよい。Nは、例えば、6以上の自然数である。各「対応点ペア」は、例えば、「第1画像」及び「第2画像」にそれぞれ含まれ且つ互いに対応する2つの対応点を含む。
 ここで、「2視点幾何」の具体例について説明する。図2は、2視点幾何の具体例の説明に供する図である。図2には、カメラ1のカメラ座標系及びカメラ2のカメラ座標系が示されている。図2において画像PC1は、カメラ1によって撮影された画像であり、画像PC2は、カメラ2によって撮影された画像である。すなわち、例えば、画像PC1は、上記の「第1画像」に対応し、画像PC2は、上記の「第2画像」に対応する。
 そして、図2において、世界座標系における或る3次元点Xが、カメラ1によって画像平面内座標mとして観測されている。この画像平面内座標mは、例えば、画像座標mと呼んでもよいし、観察画像座標mと呼んでもよい。また、図2において、その3次元点Xが、カメラ2によって画像平面内座標m’として観測されている。観察画像座標m及び画像平面内座標m’は、互いに対応する点であるので、それぞれ「対応点」である。そして、観察画像座標m及び画像平面内座標m’を纏めて「対応点ペア」と呼ぶことができる。
 本実施形態において世界座標系は明示的に与えられないため、3次元点Xの座標値は不明である。世界座標系は、任意に設定可能なため、カメラ1のカメラ座標系と一致しているものとする。すなわち、カメラ1の外部パラメータにおいて、位置(つまり、3次元並進ベクトル)は、[0,0,0]であり、回転行列は、3×3の単位行列である。そして、カメラ2の外部パラメータは、並進ベクトルt、回転行列Rで表される。なお、2つのカメラ1,2は校正済みであり、その内部パラメータは、既知である。
 取得部11が対応点(対応点の画像平面内座標)を取得する方法として、例えばSIFT(Scale Invariant Feature Transform)やSURF(Speeded Up Robust Features)といった広く知られている手法を利用してもよい。SIFTやSURFは誤った対応点を取得することがあるため、例えば広く知られている5点法とRANSAC(Random Sample Consensus)とを組み合わせて誤った対応点を除去する方法を用いてもよい。または、取得部11は、ユーザの手動による、対応点の指定や誤対応点の除去を受け付けることによって、対応点を取得してもよい。
 算出部12は、ラグランジュ乗数を用いずにE行列の局所解を表す、「所定の連立方程式」を解くことによって、E行列を算出する。この「所定の連立方程式」は、さらに、E行列の特徴を制約条件としたラグランジュ関数Lであって上記N組の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表してもよい。「エピポーラ誤差」は、例えば、E行列と対応点ペアとで構成されるエピポーラ制約(エピポーラ方程式)の代数学的誤差である。
 以上のように第1実施形態によれば、算出装置10において算出部12は、ラグランジュ乗数を用いずにE行列の局所解を表す、「所定の連立方程式」を解くことによって、E行列を算出する。この「所定の連立方程式」は、E行列の特徴を制約条件としたラグランジュ関数Lであって上記N組の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表してもよい。
 この算出装置10の構成により、統計的に最適な一意のE行列を算出できる。すなわち、算出装置10の構成により、E行列と対応点ペアとで構成されるエピポーラ制約(エピポーラ方程式)の代数学的誤差(つまり、「エピポーラ誤差」)の局所解を一意に算出できる。
 なお、上記の算出装置10は、対応点ペアの2つの対応点間の幾何学的な制約であるエピポーラ制約を表すための基本行列(E行列)を算出する算出方法であって、複数の対応点ペアのそれぞれに含まれる各対応点の画像平面内座標を取得することを含み、各対応点ペアが第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含み、その算出方法は、上記E行列の特徴を制約条件としたラグランジュ関数Lであって上記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表し、且つ、ラグランジュ乗数を用いずに上記E行列の局所解を表す、所定の連立方程式を解くことによって、上記E行列を算出することを含む、算出方法を実行している。
 <変形例>
 以上の説明では、「第1画像」と「第2画像」とが、ある時刻において同一物体を、異なる2つのカメラによって異なる視点から撮影した、2枚の静止画であるものとして説明を行ったが、本実施形態は、これに限定されない。例えば、「第1画像」と「第2画像」とは、時系列の連続した動画の2枚フレーム画像でもよい。このとき、「第1画像」を撮影するカメラと「第2画像」を撮影するカメラとは、同一であってもよいし、異なっていてもよい。要するに、「第1画像」と「第2画像」とは、内部パラメータが校正済みの1つ以上のカメラによって、同一の物体または同一のシーンが異なる視点から撮影された画像であればよい。
<第2実施形態>
 第2実施形態は、より具体的な実施形態に関する。
 <算出装置の構成例>
 図3は、第2実施形態における算出装置の一例を示すブロック図である。図3において算出装置20は、取得部11と、算出部21とを有している。算出部21は、初期値決定部21Aと、局所解算出部21Bとを有している。
 初期値決定部21Aは、取得部11からN組の「対応点ペア」を受け取る。そして、初期値決定部21Aは、受け取ったN組の「対応点ペア」を用いて、E行列の初期値を決定する。この初期値は、「対応点ペア」に対して5点法や8点法を適用することによって算出されてもよい。なお、初期値決定部21Aは、取得部11で取得された「対応点ペア」を用いずに、単にランダムな値を用いてE行列の初期値を決定してもよい。また、初期値決定部21Aは、「第1画像」と「第2画像」とが連続する動画の2フレームでありそれより前のフレームのE行列が既知である場合、その既知のE行列を初期値としてもよい。
 局所解算出部21Bは、上記のE行列の初期値を用いて、「所定の連立方程式」を満たすように、E行列の最適化を実行する。「所定の連立方程式を満たす最適化」としては、例えばガウスニュートン法といった様々な公知の方が用いられてもよい。ここで、「所定の連立方程式」は、上記E行列の特徴を制約条件としたラグランジュ関数Lであって上記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの「1次最適性条件」を表し、且つ、ラグランジュ乗数を用いずに上記E行列の局所解を表す非線形連立方程式である。本実施形態において「1次最適性条件」は、例えば、行列[Me]に対して左からE行列の転置行列を掛けることで得られる行列及び行列[Me]に対して右からE行列の転置行列を掛けることで得られる行列が対称行列となる「第1条件」、及び、E行列の特徴を表す「第2条件」を含む。上記の行列[Me]は、対応点ペアの第1画像平面内座標m及び第2画像平面内座標m’から算出される係数行列Mと上記E行列を変形したベクトルeとの、積であるベクトルを変形した行列である。すなわち、本実施形態において「1次最適性条件」は、例えば、3×3の行列表現に変形されると対称行列となり、ラグランジュ乗数を含まずにE行列の特徴を表現する、ことを特徴とする。E行列の特徴は、固有値の1つがゼロであり、2つの特異値が等しい、ことである。
 このように、E行列の初期値を用いてE行列の特徴を表す非線形方程式を最適化することで、E行列の1つの局所解を算出できる。すなわち、統計的に最適な解であるE行列の計算が実現可能である。
 <算出装置の動作例>
 以上の構成を有する算出装置20の処理動作の一例について説明する。図4は、第2実施形態における算出装置による処理動作の一例を示すフローチャートである。
 初期値決定部21Aは、E行列の初期値を決定する(ステップS101)。
 局所解算出部21Bは、E行列の初期値を用いて、「所定の連立方程式」を満たすE行列を1つ算出する(ステップS102)。
 ここで、局所解算出部21Bによる処理動作の具体例について説明する。以下では、図2を参照して図2に示した記号を用いて説明する。すなわち、世界座標系の原点は、カメラ1のカメラ座標系に一致させている。或る3次元点Xは、2つのカメラ画像においてそれぞれm、m’として観測されている。2つのカメラ1,2は、校正済みであり、これらの内部パラメータは、既知である。このため、m、m’は、いわゆる正規化画像座標である。さらに、m、m’は、3次元の斉次座標表現として、つまり、2次元の画像座標に1を要素に加えた3次元ベクトルとして表される。なお、以下の説明において、上付きTは、ベクトル又は行列の転置を表す。
 まず、解くべき問題の定義を行う。
 E行列は、カメラ1からカメラ2への相対的な並進ベクトルt=[tx,ty,tz]と、回転行列Rとを用いて、次の式(1)で表される。
Figure JPOXMLDOC01-appb-M000001
 そして、E行列は、1つの固有値がゼロであり、2つの特異値が等しい、という特徴を持つ。この特徴は、次の式(2)で表されることが知られている。
Figure JPOXMLDOC01-appb-M000002
 なお、tr()は、行列のトレースを表す。
 E行列及びi番目の対応点ペアは、次の式(3)で表されるエピポーラ方程式(エピポーラ制約)を満たすことが知られている。
Figure JPOXMLDOC01-appb-M000003
 式(2)、(3)が示すように、E行列には、符号の不定性がある。すなわち、符号を反転した(-E)を式(2)、(3)に代入しても、成立する。符号の不定性を持つE行列は、2組のtと2組のRの、計4組のt及びRで表されることが知られている。
 6組以上の対応点ペアが与えられたとき、一般に対応点ペアはノイズを含むため、式(3)は厳密にはゼロにならない。それゆえ、最適なE行列は、次の式(4)の最適化問題の解となる。
Figure JPOXMLDOC01-appb-M000004
 ここで、eは、E行列を9次元ベクトルへ変形した表現である。
Figure JPOXMLDOC01-appb-M000005
は、自明解E=0を避けるための制約条件である。また、Mは、対応点ペアm、m’から算出される9×9の係数行列であり、次の式で計算される。
Figure JPOXMLDOC01-appb-M000006
Figure JPOXMLDOC01-appb-M000007
は、クロネッカ積である。式(4)の目的関数eMeは、代数学的誤差(エピポーラ誤差)と呼ばれている。
 次に、上記の式(4)の局所解を計算する方法について説明する。
 式(4)に対するラグランジュ関数Lと、このラグランジュ関数LのE行列に対する導関数は、次の式(5)で表される。
Figure JPOXMLDOC01-appb-M000008
 ここで、λは、スカラーのラグランジュ乗数であり、Sは、9つのラグランジュ乗数を成分とする3×3の行列であり、1/2は、便宜上の数字である。
 次に、ラグランジュ関数LのE行列に対する導関数に対して、左右からEを掛けると、式(6)が得られる。
Figure JPOXMLDOC01-appb-M000009
 ここで、[Me]は、行列Mとベクトルeとの積である9次元ベクトルを3×3の行列に変形した表現である。
 式(6)より、E[Me]及び[Me]Eがいずれも対称行列となることが、それぞれの右辺から示されている。すなわち、A=E[Me]及びB=[Me]Eが対称行列となり、且つ、式(4)の制約条件を満たす、E行列(つまり、「1次最適性条件」を満たすE行列)を求めればよい。これは、次の式(7)で表される、E行列に関する連立方程式として表される。すなわち、この連立方程式は、複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数LのE行列に対する、導関数に基づいて導出されている。また、この連立方程式は、ラグランジュ乗数を用いずにE行列の局所解を表している。
Figure JPOXMLDOC01-appb-M000010
 ここで、Aij、Bijは、それぞれ、行列Aの(i,j)成分及び行列Bの(i,j)成分を表す。
 すなわち、ステップS102において、局所解算出部21Bは、E行列の初期値を用いて、式(7)の「所定の連立方程式」を満たす解(E行列)を1つ算出してもよい。
 以上のように第2実施形態によれば、算出装置20において算出部21は、行列[Me]に対して左からE行列の転置行列を掛けることで得られる行列と行列[Me]に対して右からE行列の転置行列を掛けることで得られる行列とが対称行列となる「第1条件」、及び、E行列の特徴を表す「第2条件」を含む「1次最適性条件」に基づいて得られる、所定の連立方程式を解くことによって、E行列を算出する。行列[Me]は、対応点ペアの第1画像平面内座標m及び第2画像平面内座標m’から算出される係数行列Mと前記E行列を変形したベクトルeとの積であるベクトルを変形した行列である。
 この算出装置20の構成により、統計的に最適なE行列を一意に算出可能である。その理由は、以下の通りである。例えば、式(7)は、ラグランジュ乗数を含まずにE行列のみで式(4)の1次最適性条件を表現した連立方程式である。そして、E行列の初期値を用いた最適化により算出した連立方程式の解は、式(4)の最適化問題の局所解となる。すなわち、6組以上の対応点ペアが与えられた場合に統計的に最適な解を一意に算出することが可能となる。
 <比較例>
 比較例として、5点法及び8点法に関して考察する。
 まず、5点法は、解が一意に定まらない。そのため、複数の対応点ペアから5組を選び、選んだ対応点ペアを用いてE行列を算出する、という操作を繰り返し行う必要がある。対応点は、一般に数百個から数千個は得られるため、すべての組み合わせを試すことは現実的ではない。さらに、このような方法を持ってしても、5点法はすべての対応点ペアを同時に用いて統計的に最適な解を一意に算出することはできない。ここで、「統計的に最適な解」とは、E行列と対応点ペアとで構成されるエピポーラ制約(エピポーラ方程式)の代数学的誤差(つまり、「エピポーラ誤差」)の局所解のことである。
 次に、5点法及び8点法では、対応点ペアの数が6組または7組の場合にE行列を算出できない。なぜならば、5点法は、5組のみを対象とした方法であり、8点法は、8組以上を対象とした方法のためである。
 次に、1つの平面で構成されたシーンに対しては、8点法によってはE行列を算出できない。なぜならば、8点法の算出に用いる9×9の係数行列がランク落ちするため、理論的に解が一意に定まらなくなるからである。そのため、8点法には、車載画像のように1つの平面(路面)が支配的なシーンに対しては、E行列の算出に失敗したり、E行列の推定精度が著しく低下するという課題がある。5点法は、1つの平面であってもE行列を算出可能であるが、上記の通り、解を一意に定めることができず、算出する解は統計的に最適ではない。
 次に、8点法で算出される一意の解は、統計的に最適ではない。8点法は、まず9×9の係数行列の最小固有値に対応する9次元の固有ベクトルを計算する。次に、固有ベクトルを3×3の行列に変形し、前述した2つの特徴(つまり、1つの固有値がゼロであり、2つの特異値が等しいこと)を満たすように、特異値分解を用いた補正を行う。この補正操作は、補正前後における3×3行列のフロベニウスノルムの差分が最小となることを目的としており、補正後のE行列は、統計的に最適ではない。
 このように、従来の5点法及び8点法によりE行列を算出する方法は、6組以上の対応点ペアが与えられた場合に統計的に最適な解を一意に算出することが困難である。
 <変形例>
 本実施形態は、上述した例に限定されるものではない。本実施形態は、上述した例に対して、いわゆる当業者が理解し得る多様な変更を適用することが可能である。例えば、本実施形態は、以下の変形例に示す形態によっても実施可能である。
 <1>上記の式(7)において自明解を避ける条件は、
Figure JPOXMLDOC01-appb-M000011
に限らない。また、式(7)のその他の式は、すべて任意の定数倍について不変である。そのため、E行列の1つの成分を1と正規化してもよい。
 <2>式(7)の連立方程式を解く際に、式(7)の勾配方向が式(4)のeMeを減少させることを条件づけてもよい。例えば、式(7)の勾配方向に対していわゆる直線探索法や信頼領域法を適用して、式(7)がゼロでかつ目的関数を減少させるように、解を探索してもよい。
<第3実施形態>
 第3実施形態では、所定の連立方程式を満たすE行列のすべての解を算出し、算出したすべての解の中から、複数の対応点ペアについてのエピポーラ誤差が最小となる実数のE行列を選択する。
 <算出装置の構成例>
 図5は、第3実施形態における算出装置の一例を示すブロック図である。図5において算出装置30は、取得部11と、算出部31とを有している。算出部31は、局所解算出部31Aと、最適解選択部31Bとを有している。
 局所解算出部31Aは、取得部11で取得されたN組の対応点ペアを用いて、「所定の連立方程式」を満たすE行列のすべての解を算出する。上記の式(7)は、E行列を未知数とする連立代数方程式である。このため、例えば、グレブナー基底や連続ホモトピー法を用いることによって、上記の式(7)におけるすべての解を計算可能である。
 最適解選択部31Bは、局所解算出部31Aで算出されたすべての解の中から、複数の対応点ペアについてのエピポーラ誤差が最小となる実数のE行列を1つ選択する。
 <算出装置の動作例>
 以上の構成を有する算出装置30の処理動作の一例について説明する。図6は、第3実施形態における算出装置による処理動作の一例を示すフローチャートである。
 局所解算出部31Aは、対応点ペアを用いて、「所定の連立方程式」を満たすE行列のすべての解を算出する(ステップS201)。
 最適解選択部31Bは、ステップS201で算出されたすべての解の中から、複数の対応点ペアについてのエピポーラ誤差が最小となる実数のE行列を選択する(ステップS202)。
 以上のように第3実施形態によれば、算出装置30において局所解算出部31Aは、「所定の連立方程式」を満たすE行列のすべての解を算出する。最適解選択部31Bは、すべての解の中から、複数の対応点ペアについてのエピポーラ誤差が最小となる実数のE行列を選択する。
 この算出装置30の構成により、6組以上の対応点ペアを用いて大域的に最適なE行列を一意に算出可能である。その理由は、以下の通りである。例えば、式(7)で表される連立代数方程式の解空間を計算代数幾何に基づいて解析すると、最大で440個の実数解を持つことが示される。解析には、例えばMacaulay2などの代数幾何学ソフトウェアを利用することができる。また、グレブナー基底や連続ホモトピー法は、連立方程式の解をすべて列挙できる、ことが知られている。最大で440個の実数解のうち、式(4)の目的関数が最小となるE行列を1つ選出すれば、そのE行列は大域的に最適な唯一の解である。
 <変形例>
 本実施形態は、上述した例に限定されるものではない。本実施形態は、上述した例に対して、いわゆる当業者が理解し得る多様な変更を適用することが可能である。例えば、本実施形態は、以下の変形例に示す形態によっても実施可能である。
 <1>局所解算出部31Aにおいて用いる式(7)の自明解を避ける条件は、
Figure JPOXMLDOC01-appb-M000012
に限らない。例えば、E行列の1つの成分を1とおいてもよい。その場合、符号の不定性が解消するため、実数解の個数は、最大で220個となる。
 <2>最適解選択部31Bにおいて大域的最適解を選出する基準となるエピポーラ方程式の誤差は、式(4)の目的関数(代数学的誤差)に限らない。例えば、エピポーラ線と対応点との距離に基づく幾何学的誤差や、幾何学的誤差の1次近似であるサンプソン誤差が用いられてもよい。これらは代数学的誤差よりも厳密な基準として知られており、より高精度なE行列を選出できる可能性がある。
<第4実施形態>
 第4実施形態は、主に、第1実施形態から第3実施形態のいずれかの算出装置を含むカメラパラメータ推定装置に関する。
 図7は、第4実施形態におけるカメラパラメータ推定装置の一例を示すブロック図である。図7に示すように、カメラパラメータ推定装置50は、画像供給装置40と接続されている。カメラパラメータ推定装置50は、画像供給装置40と無線で接続されていてもよいし有線で接続されていてもよい。
 画像供給装置40は、カメラで撮影(形成)された画像を取得して、取得した画像をカメラパラメータ推定装置50へ供給する。例えば、画像供給装置40は、ビデオカメラやデジタルカメラを撮影対象となる環境に設置した後に、撮影した画像を画像供給装置40の不図示の記憶装置(メモリ、ハードディスクなど)に保存し、通信部(不図示)を介してその画像をカメラパラメータ推定装置50に送信してもよい。
 図7においてカメラパラメータ推定装置50は、算出装置60と、分解部51と、パラメータ算出部52とを有している。
 算出装置60は、取得部11と、算出部61とを有している。算出装置60は、第1実施形態から第3実施形態における算出装置10,20,30のいずれに対応していてもよい。すなわち、算出部61は、算出部12,21,31のいずれに対応していてもよい。
 分解部51は、算出部61にて算出されたE行列を、並進ベクトルtと回転行列Rとに分解する。E行列の分解方法としては、R. HartleyによるE行列の特異値分解を用いる方法や、B. K. P. Hornによる直接解法といった様々な公知の方法を用いてもよい。いずれの方法を用いても、1つのE行列は、4組のR及びtへと分解されることが知られている。
 パラメータ算出部52は、取得部11からN組の対応点ペアを取得する。また、パラメータ算出部52は、分解部51から並進ベクトルt及び回転行列Rを取得する。そして、パラメータ算出部52は、並進ベクトルtと回転行列Rとを用いて各対応点の3次元座標を三角測量に基づいて計算する。そして、パラメータ算出部52は、並進ベクトルtと回転行列Rと3次元点を出力する。なお、三角測量の方法は広く知られているためここでは説明を省略する。また、4組のR及びtのうち3次元点が2つのカメラの前に復元される1組を選べばよいことも広く知られている。
 <他の実施形態>
 図8は、算出装置のハードウェア構成例を示す図である。図8において算出装置100は、プロセッサ101と、メモリ102とを有している。プロセッサ101は、例えば、マイクロプロセッサ、MPU(Micro Processing Unit)、又はCPU(Central Processing Unit)であってもよい。プロセッサ101は、複数のプロセッサを含んでもよい。メモリ102は、揮発性メモリ及び不揮発性メモリの組み合わせによって構成される。メモリ102は、プロセッサ101から離れて配置されたストレージを含んでもよい。この場合、プロセッサ101は、図示されていないI/Oインタフェースを介してメモリ102にアクセスしてもよい。
 第1実施形態から第3実施形態の算出装置10,20,30は、それぞれ、図8に示したハードウェア構成を有することができる。第1実施形態から第3実施形態の算出装置10,20,30の取得部11と、算出部12,21,31とは、プロセッサ101がメモリ102に記憶されたプログラムを読み込んで実行することにより実現されてもよい。プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、算出装置10,20,30に供給することができる。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)を含む。さらに、非一時的なコンピュータ可読媒体の例は、CD-ROM(Read Only Memory)、CD-R、CD-R/Wを含む。さらに、非一時的なコンピュータ可読媒体の例は、半導体メモリを含む。半導体メモリは、例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によって算出装置10,20,30に供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムを算出装置10,20,30に供給できる。
 なお、第4実施形態のカメラパラメータ推定装置50も、図8に示したハードウェア構成と同様に、プロセッサとメモリとを含むハードウェア構成を有していてもよい。この場合、カメラパラメータ推定装置50の取得部11と、算出部61と、分解部51と、パラメータ算出部52とは、プロセッサがメモリに記憶されたプログラムを読み込んで実行することにより実現されてもよい。
 以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 10 算出装置
 11 取得部
 12 算出部
 20 算出装置
 21 算出部
 21A 初期値決定部
 21B 局所解算出部
 30 算出装置
 31 算出部
 31A 局所解算出部
 31B 最適解選択部
 40 画像供給装置
 50 カメラパラメータ推定装置
 51 分解部
 52 パラメータ算出部
 60 算出装置
 61 算出部

Claims (8)

  1.  対応点ペアの2つの対応点間の幾何学的な制約であるエピポーラ制約を表すための基本行列(E行列)を算出する算出装置であって、
     複数の対応点ペアのそれぞれに含まれる各対応点の画像平面内座標を取得し、各対応点ペアが第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含む、取得手段と、
     前記E行列の特徴を制約条件としたラグランジュ関数Lであって前記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表し、且つ、ラグランジュ乗数を用いずに前記E行列の局所解を表す、所定の連立方程式を解くことによって、前記E行列を算出する算出手段と、
     を具備する算出装置。
  2.  前記算出手段は、行列[Me]に対して左から前記E行列の転置行列を掛けることで得られる行列及び前記行列[Me]に対して右から前記E行列の転置行列を掛けることで得られる行列が対称行列となる第1条件及び前記E行列の特徴を表す第2条件を含む前記1次最適性条件に基づいて得られる、前記所定の連立方程式を解くことによって、前記E行列を算出し、
     前記行列[Me]は、対応点ペアの第1画像平面内座標及び第2画像平面内座標から算出される係数行列Mと前記E行列を変形したベクトルeとの積であるベクトルを変形した行列である、
     請求項1記載の算出装置。
  3.  前記算出手段は、前記E行列の初期値を用いて前記所定の連立方程式を満たすE行列の解を算出する局所解算出手段を具備する、
     請求項1又は2に記載の算出装置。
  4.  前記算出手段は、
     前記所定の連立方程式を満たすE行列のすべての解を算出する局所解算出手段と、
     前記すべての解の中から、前記複数の対応点ペアについてのエピポーラ誤差が最小となる実数のE行列を選択する選択手段と、
     を具備する、
     請求項1又は2に記載の算出装置。
  5.  前記第1画像及び前記第2画像は、内部パラメータが校正済みの1つ以上のカメラによって、同一の物体または同一のシーンが異なる視点から撮影された画像である、
     請求項1から4のいずれか1項に記載の算出装置。
  6.  請求項1から5のいずれか1項に記載の算出装置と、
     前記算出されたE行列を、回転行列と並進ベクトルとに分解する分解手段と、
     前記回転行列及び前記並進ベクトルと、各対応点の画像平面内座標とに基づいて、各対応点の3次元座標を算出する3次元座標算出手段と、
     を具備するカメラパラメータ推定装置。
  7.  算出装置によって実行される、対応点ペアの2つの対応点間の幾何学的な制約であるエピポーラ制約を表すための基本行列(E行列)を算出する算出方法であって、
     複数の対応点ペアのそれぞれに含まれる各対応点の画像平面内座標を取得することを含み、
     各対応点ペアが第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含み、
     前記算出方法は、前記E行列の特徴を制約条件としたラグランジュ関数Lであって前記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表し、且つ、ラグランジュ乗数を用いずに前記E行列の局所解を表す、所定の連立方程式を解くことによって、前記E行列を算出することを含む、
     算出方法。
  8.  対応点ペアの2つの対応点間の幾何学的な制約であるエピポーラ制約を表すための基本行列(E行列)を算出する処理を、算出装置に実行させるプログラムが格納された非一時的なコンピュータ可読媒体であって、
     前記処理は、複数の対応点ペアのそれぞれに含まれる各対応点の画像平面内座標を取得することを含み、
     各対応点ペアが第1画像及び第2画像にそれぞれ含まれ且つ互いに対応する2つの対応点を含み、
     前記処理は、前記E行列の特徴を制約条件としたラグランジュ関数Lであって前記複数の対応点ペアについてのエピポーラ誤差に対するラグランジュ関数Lの1次最適性条件を表し、且つ、ラグランジュ乗数を用いずに前記E行列の局所解を表す、所定の連立方程式を解くことによって、前記E行列を算出することを含む、
     非一時的なコンピュータ可読媒体。
PCT/JP2021/041187 2021-11-09 2021-11-09 算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体 WO2023084601A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/041187 WO2023084601A1 (ja) 2021-11-09 2021-11-09 算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/041187 WO2023084601A1 (ja) 2021-11-09 2021-11-09 算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体

Publications (1)

Publication Number Publication Date
WO2023084601A1 true WO2023084601A1 (ja) 2023-05-19

Family

ID=86335314

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/041187 WO2023084601A1 (ja) 2021-11-09 2021-11-09 算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体

Country Status (1)

Country Link
WO (1) WO2023084601A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007502053A (ja) * 2003-08-07 2007-02-01 ソニー エレクトロニクス インク 動き推定方法及び装置
WO2016042779A1 (ja) * 2014-09-18 2016-03-24 日本電気株式会社 三角測量装置、三角測量方法およびそのプログラムを記録した記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007502053A (ja) * 2003-08-07 2007-02-01 ソニー エレクトロニクス インク 動き推定方法及び装置
WO2016042779A1 (ja) * 2014-09-18 2016-03-24 日本電気株式会社 三角測量装置、三角測量方法およびそのプログラムを記録した記録媒体

Similar Documents

Publication Publication Date Title
US8928736B2 (en) Three-dimensional modeling apparatus, three-dimensional modeling method and computer-readable recording medium storing three-dimensional modeling program
JP6489551B2 (ja) 画像のシーケンスにおいて前景を背景から分離する方法およびシステム
US20120177283A1 (en) Forming 3d models using two images
KR100855657B1 (ko) 단안 줌 카메라를 이용한 이동로봇의 자기위치 추정 시스템및 방법
US9338437B2 (en) Apparatus and method for reconstructing high density three-dimensional image
KR102483641B1 (ko) 양안 시차 영상의 처리 방법 및 장치
US10853960B2 (en) Stereo matching method and apparatus
JP2020523703A (ja) ダブル視野角画像較正および画像処理方法、装置、記憶媒体ならびに電子機器
CN103778598B (zh) 视差图改善方法和装置
CN111047634A (zh) 场景深度的确定方法、装置、设备及存储介质
WO2016208404A1 (ja) 情報処理装置および方法、並びにプログラム
JP5909176B2 (ja) 陰影情報導出装置、陰影情報導出方法及びプログラム
US9721348B2 (en) Apparatus and method for raw-cost calculation using adaptive window mask
EP3506206A1 (en) Method and apparatus for depth-map estimation
JP2009186287A (ja) 平面パラメータ推定装置、平面パラメータ推定方法及び平面パラメータ推定プログラム
US20200202563A1 (en) 3d image reconstruction processing apparatus, 3d image reconstruction processing method and computer-readable storage medium storing 3d image reconstruction processing program
JP5769248B2 (ja) ステレオマッチング処理装置、ステレオマッチング処理方法、及び、プログラム
WO2023084601A1 (ja) 算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体
CN108416811B (zh) 一种摄影机自标定方法及装置
KR20200057929A (ko) 캘리브레이트된 카메라들에 의해 캡쳐된 스테레오 영상들의 렉티피케이션 방법과 컴퓨터 프로그램
Nozick Camera array image rectification and calibration for stereoscopic and autostereoscopic displays
CN112258635B (zh) 基于改进双目匹配sad算法的三维重建方法及装置
CN108230377B (zh) 点云数据的拟合方法和系统
JP2017199285A (ja) 情報処理装置、情報処理方法、プログラム
KR101804157B1 (ko) 개선된 sgm 기반한 시차 맵 생성 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21963964

Country of ref document: EP

Kind code of ref document: A1